存储 频道

企业级重复数据删除方案建议书

第3章 IBM TS7650 ProtecTIER 重复数据删除解决方案介绍

  3.1 无中断的部署和运行

  IBM TS7650G ProtecTIER De-duplication Gateway 解决方案可为虚拟磁带库(VTL) 提供高性能的重复数据删除,这些虚拟磁带库特别适合企业组织,因为企业通过它们可以充分利用现有备份应用程序和流程。并且,事实上,根据企业策略集团公司(ESG) 的调查,企业级组织都倾向于采用 VTL 作为在数据保护基础设施中实施磁盘的手段。VTL 解决方案均无中断,因为这些解决方案为重复数据删除提供了目标端方法,意即在备份软件处理数据后进行重复数据删除操作,而非在受保护机器上进行重复数据删除操作。IBM 解决方案经过特别设计,可轻松集成到现有数据中心环境,无需更改现有备份策略、实践或程序。

  IBM 解决方案架构还设计有无中断特性,意味着解决方案运行不会因宕机或可用性问题导致生产活动中断。IBM TS7650G 采用在线重复数据删除方法,其中实时进行重复数据删除,这样,当数据写入磁盘时已经进行了重复数据删除操作,从而降低了宕机的风险。这与某些解决方案所采用的后处理重复数据删除方法恰恰相反,后者往往在执行重复数据删除操作之前将备份映像写入磁盘,所以更容易出现宕机。这也是在企业级环境中使用在线方法(如IBM 的解决方案)尤为重要的原因,因为企业级环境中可能难以容忍宕机。

  3.2 存储容量需求减少多达25 倍

  现有实施证据表明,IBM 的 HyperFactor 技术采用模式算法,可将备份环境中存储所需的空间容量降低达25 倍。重复数据删除所带来的容量扩展通常以一个比率来表示,基本上是额定数据与所用物理存储空间的比率。例如,10:1 的比率表示所管理的额定数据比存储所需的物理空间大10 倍。重复数据删除已经实现了18:1 甚至更大比率的容量节省-IBM 解决方案中该比率高达25:1。

  考虑不同重复数据删除解决方案需铭记的重要一点是,所报告的额定数据与所用存储空间之间的比率在不同解决方案中会大有不同,甚至会高达30:1 或者更多。似乎更高的比率表示解决方案更卓越,但事实并非如此。其中一个原因就是,得出的重复数据删除比率很大程度上取决于数据保留期限、数据更改速率以及备份实践等变量。例如,数据保留天数对比率有着直接影响。另一个原因是,更高比率并不代表解决方案更好,重复数据删除比率可以按不同方式计算。例如,如果计算忽略系统所需的磁盘开销,则将会人为地影响比率。因此,仅关注给定数据流的重复数据删除比率。这就是为什么比率为500:1 的解决方案不一定能够比比率为20:1 的解决方案提供更出色的重复数据删除操作。

  3.3 高度可扩展、高性能的解决方案

  IBM 解决方案所实现的容量节省可归功于持续的高性能,而更持续的高性能反过来则又归功于其粒度和可扩展性。

  粒度是指针对冗余所检查的数据块的大小。块越小,可以比较的块就越多。IBM TS7650G 解决方案以相当精细的粒度查找和消除数据——捕获与2K 大小匹配的少量数据,这样就能够在典型数据保护环境中实现高达 25 倍的重复数据删除。

  可扩展性与解决方案的可持续吞吐量有关。在IBM 解决方案中,集群拓扑结构支持超过900 MB 的可持续吞吐量(不考虑存储库大小)。最终可带来企业级性能,满足最苛刻的数据中心要求。IBM 解决方案最多可扩展至1 PB 的物理存储空间(超过25 PB 用户数据),从而可以轻松地扩展性能和容量。

  3.4 容量提高,数据完整性的风险降低

  业务需求和法规不断推动对基于磁盘的长期现场数据保留的需求,企业级的高效解决方案必须允许每个系统上管理数百TB的存储库。对小于20 TB 的支持将导致对管理越来越多孤岛存储空间的需求。这对IBM TS7650G 解决方案来说根本不是问题,因为我们的解决方案可为每个存储系统提供多达1 PB 的存储容量。

  在高容量环境中,一些重复数据删除解决方案会因其查找和处理数据冗余的方法带来数据完整性的风险。例如,采用哈希算法进行重复数据删除的解决方案会因哈希冲突带来数据丢失的风险。但这种风险出现的几率很低,可能会在非常大的环境中出现。当出现风险时,只有在数据需要检索/恢复时才会对它有所了解。因此,IBM 选择了一种模式识别算法来查找和处理数据冗余;在大型环境中,此类算法不会像哈希算法那样存在数据丢失的风险。

  3.5 多个配置选件,满足多种需求

  IBM 在多个配置中提供灵活的、基于磁盘的存储空间选件,可针对性能和高可用性进行优化,以满足特定磁盘存储空间需求。例如,在要求较高可用性和/或较高性能的环境中,可部署集群配置,以在节点故障的情况下提供硬件冗余,从而实现备份和恢复操作的连续性。除冗余外,集群配置使在线重复数据删除性能的吞吐量提高了一倍,同时保持通过两个集群节点中的任一节点可访问的一个储存库。

  3.6 IBM TS7650 Appliance 助您实现备份环境的快速部署

  为了帮助您实现备份环境的快速部署,IBM 推出了预配置的 IBM TS7650 Appliance,将IBM TS7650G 与IBM的存储完美的结合,并且通过不同的产品组合方案以满足您不同程度的需求。同时TS7650 Appliance 还包括了其他所有所需的部件——如机柜,线缆交换机等,您将不必再为重复数据删除网关的后端配置而操心。通过IBM TS7650 Appliance,您将会获得如下的高强性能:

  应用具有 HyperFactor™ 专利重复数据删除技术的IBM ProtecTIER software;
  IBM 的多核服务器为您提供企业级的高性能;
  IBM 存储控制器及光纤通道磁盘为您提供的高性能和高可靠性;
  IBM TS3000 系统控制台为您提供了 Call Home 和远程支持功能

0
相关文章