存储 频道

存储基础详解:重复数据删除非常好的实践

  联机重复数据删除VS.后处理重复数据删除

  另一个选择是考虑何时对数据进行重复删除。联机重复数据删除在数据被写入到目标存储时实时地删除冗余数据。纯软件产品往往使用联机处理,因为备份数据在进行重复数据删除前不会被写入磁盘。如源端重复数据删除,联机处理在生产环境中增加了CPU负载,但是限制了最终传输到备份存储上的数据总量。Asigra公司的云备份系统和慷孚系统公司的Simpana都是使用联机重复数据删除技术的软件产品。

  后处理重复数据删除在进行重复数据删除之前将数据写入到磁盘缓存中。没有必要在启动之前将完整备份写入磁盘;一旦数据开始接触磁盘,重复数据删除进程就开始了。重复数据删除进程和备份进程是分开执行的,因此你可以在备份窗口外进行重复数据删除而不会降低您的备份性能。后处理重复数据删除还可以让你更快的访问上次备份的数据。“因此,在恢复上,可能会起到重要作用,”Whitehouse说道。

  然而,全备份数据集是在冗余数据消除之前通过网络传输到重复数据删除磁盘分区或者目标存储的,因此你必须具备数据传输的带宽和容量来满足全备份数据集和重复数据删除过程。惠普公司的StorageWorks StoreOnce技术使用了后处理重复数据删除,而昆腾公司的DXi系列备份系统同时使用了联机和后处理技术。

  内容感知型或者应用感知型的重复数据删除产品使用德尔塔差分技术,可以比较当前的备份数据集与之前的数据集。“它们了解备份流的内容,而且当备份程序将数据发送到目标设备时,它们知道数据的格式,”Whitehouse说道,“它们可以对比当前备份的工作量和之前的备份工作量,以找出在块级别或者字节级别上的不同。”Whitehouse表示,基于德尔塔差分技术的产品是有效率的,但是它们可能必须逆向备份流来了解它是什么样的数据以及怎样进行德尔塔差分。Sepaton 公司的 DeltaStor 系统 和 Exagrid公司的DeltaZone架构是使用德尔塔差分技术的产品例子。

  全局重复数据删除

  如果你使用基于目标端的设备和多个使用基于源产品的客户端,全局重复数据删除技术可以跨多个设备删除冗余的备份数据。它允许你在多个位置添加可以相互通信的节点,来扩展性能和容量。若没有全局重复数据删除功能,每一个设备只会对其接收到的数据进行重复数据删除。一些全局系统可以配置在两个节点的集群中,例如飞康软件的FDS高可用集群。其他的系统使用网格架构可以扩展到几十个节点,如Exarid系统公司的DeltaZone和NEC公司的Hydrastor。

  你拥有的备份数据越多,全局重复数据删除技术越能提高你的重复数据删除比率并降低你的存储容量需求。全局重复数据删除还可以将负载均衡和高可用技术引进到你的备份策略中,而且让你有效地管理你的整个数据备份存储环境。有着大量备份数据或者多个备份地点的用户将会从这种技术中获得最大收益。大多数备份软件提供商会提供带有全局重复数据删除功能的产品,包括赛门铁克NetBackup和EMC Avamar,以及重复数据删除的设备,如IBM的ProtecTier和Sepaton的DeltaStor,都提供全局重复数据删除功能。

  如同所有的数据备份和存储产品,采用的技术只是在你评估潜在的重复数据删除系统时应该考虑的一个因素之一。事实上,根据Whitehouse,厂商采用的重复数据删除的技术类型,并不是许多管理员在对重复数据删除方案进行投资时查看的第一因素。价格,性能,以及易用性和集成度都在重复数据删除购买者的清单上,Whitehouse解释道。Whitehouse 和Byrne一致建议,首先找出你目前的备份产品是否具有重复数据删除功能。如果没有,分析你的长期需求并了解厂商的产品架构以决定它们是否适合你的负载量和扩展需求。

0
相关文章