【IT168 专稿】在过去的两年里,重复数据删除(Date Deduplication)以惊人的速度从一个偏僻的存储术语迅速成为了存储系统中广为人知的特性,几乎所有主流存储厂商都适时推出了自己的相关产品,到今天,重复数据删除技术已经成为备份产品所必备的标准配置之一。
步入2009年,我们看到已经完全占据备份市场的重复数据删除技术,开始在主存储领域蔓延,并获得新生。
早在今年4月在美国奥兰多召开的SNW大会上,致力于容量优化解决方案的厂商Hifn汉帆公司,就展出了该公司基于主存储系统的重复数据删除解决方案。跟随着SNW的脚步步入中国,中国用户也有幸近距离接触到Hifn独具特色、且极具经济效益的主存储重复数据删除。

记者有幸在媒体沟通会上与Hifn汉帆公司销售总监赵强先生交流有关主存储系统重复数据删除方案的特点和商机。
去重与压缩共同作用达到可观的压缩比

从原理上来说,主存储上重复数据删除工作原理与备份领域重复数据删除大同小异,都是根据特定的切割方式,将文件数据打碎成更小的数据块,并根据算法比对这些数据块。相同的数据块予以删除,只保留彼此不同的唯一的数据块。由于系统自动在这些唯一的数据块上保留了组成文件的指针信息,因此系统还能够根据这些指针信息,将这些唯一的小数据块组合还原成文件。
在以往,重复数据删除更多的应用于备份领域,由于备份策略的设定,系统经常会一遍一遍反复备份重复的数据,备份系统内往往存在较大的数据重复率,也因此在备份领域内应用重复数据删除具备更明显的容量压缩的效果。
对此汉帆公司销售总监赵强先生解释道:Hifn公司BitWackr解决方案除了在数据存储的过程中经过了去重,而且还增加了数据压缩的过程,经过去重和压缩两个过程的共同作用,所占用的存储空间就更小了。
根据赵强的介绍,Hifn专利的压缩算法已经有二十多年历史,各种工业设备上都得到了广泛的应用与验证,包括我们熟悉的磁带机。
根据多年的应用经验,将各个行业的数据汇总到一起,平均主存储上的数据压缩率能达到2-3:1的状况,加上数据去重的效果,一般主存上的重复数据删除大概能达到3-5:1的状态。针对一些在主存上应用CDP一类重复性较高的应用,数据删除比例还能达到更高的级别,平均能达到5-10:1的删除效率,对于主存储系统来说已经非常可观。
主存储重复数据删除的经济效益
对于用户来说,主存储系统的重复数据删除意义究竟在哪里呢?赵强以一张图解释了主存储系统重复数据删除的经济效益。
上图显示了重复数据删除比率提高对应的成本节约效益的曲线。随着比率的日益提高,对用户的成本节约效益的增长其实是走向了一个缓和的趋势。
根据赵强的介绍,当压缩比率在2:1的状态下,也就是说50%的压缩比,实际上我们节约了50%的存储空间需求,包括未来的管理和能耗方面的费用;而如果达到3:1,实际上节约的是70%左右的相关成本,这时候我们会觉得压缩比越高,对我们得成本节约的效益越来越显著。
但根据上图的显示,越往上,曲线则越平缓,实际上10:1和100:1,对于用户来说,实际上是节约90%的成本与节约99%成本之间的区别,其实并不占有关键的意义。
Hifn BitWackr解决方案使重复数据删除技术不再局限于备份领域,提供了对用户非常友好,简单易用的操作模式,并最小化对用户系统的影响。降低对磁盘容量的需求,减小采购量,延长存储设备的使用时间,实现按需采购,并加快投资回报。

全面完善的产品方案

根据赵强的介绍,目前Hifn的解决方案主要包括VMware、Linux以及window三个平台上的产品。其中VMware下的产品在09年年末的时候会有发布。Linux平台下的产品更多面向OEM客户,由合作伙伴组成最终产品推向客户。
Window平台下产品更为丰富,包括单机版本的产品、SAN Edition以及企业版BitWackr解决方案。
单机版通过与server厂商合作,安装到Server上,为中小企业提供单节点或多节点的数据优化。SAN Edition则提供了IP SAN、NAS等通用的存储环境下的数据优化。

BitWackr企业版会包括更完善的应用特性,包括远程复制、快照以及安全方面的特性,打包在一起。有分析认为,重复数据删除的另外一个显著的机会在远程复制,通过重复数据删除的方案,能显著减少用户在远程备份、容灾或者数据传输时,对带宽的需求量,Hifn在企业版本上增加了远程复制的功能,无疑也是看好这一点未来的发展前景。
Hifn企业版的另外一个特点是加密,对于企业版用户,Hifn将推荐同时安装一款Hifn安全网卡产品,打包组成安全远程复制的方案。加密的过程是在数据去重和压缩的同时进行,数据写入磁盘已经是加密后的密文,此时无论发生任何问题,例如硬盘失窃,也不会发生数据泄露。
携创新技术寻合作商机
尽管前面我们介绍了Hifn的全面的产品线,赵强则反复强调,Hifn提供的并不是一款产品,而是一种技术和解决方案,Hifn更倾向于提供相关的技术来为合作伙伴提供商机。
根据赵强的介绍,Hifn的解决方案使得重复数据删除不再局限于备份领域,只要最终设备供应商能创建出新的应用和商务模式,Hifn都可以提供相关的技术支持。Hifn对用户提供的就是一个简单的磁盘驱动的形式,任何应用都不会因为Hifn产品的加入有所改变。
Hifn则希望自己推出的产品能够与合作伙伴的产品结合到一起,会带来一个新的市场机会,衍生出新的应用与产品。
事实上,目前已经有多家厂商发布了主存储优化的产品和解决方案,这方面的先驱除了Hifn,还包括NetApp和EMC,此外还有众多的厂商对这一领域表示关注。
Hifn解决方案的独特之处在于,Hifn把目光集中到了硬件加速单元,而不是从整个系统入手,通过集成到硬件的解决方案,提供了界面透明、性能和可靠性主存储重复数据删除。与此同时,也为合作伙伴带来更多创新和合作的机会。Hifn相信和合作伙伴一起,必将迎来主存储容量优化的春天!