【IT168 专稿】重复数据删除技术目前已成为存储行业最为热门的技术,不仅众多厂商极力推荐其重复数据删除产品,广大用户也在热切的关注着重复数据删除技术。这种热闹局面主要是由当前经济大环境不景气的外部原因和企业自身数据飞速增长的内部原因共同形成的。然而,重复数据删除产品越来越受用户关注的同时,其功能作用也被一些厂商过分的放大,成为厂商推销其产品的卖点和噱头。所以,用户在选择重复数据删除产品时还需要谨慎起见。
用户该相信哪个“王婆”?
当前,重复数据删除市场上的吆喝声是越来越大,众厂商无不卖力的吆喝着自己重复数据删除产品的领先,有的吆喝自己算法优秀、有的吆喝自己处理方式先进、有的吆喝自己解决方案全面、有的甚至吆喝出重复数据删除比的承诺,一时间呈现出一幅“众王婆吆喝图”,好一幅热闹的景象。那么用户又该相信哪个“王婆”呢?
其实相信“王婆”,还不如相信自己的判断。重复数据删除技术优点很多,但是弱点也不少,好比公园里的开屏孔雀,正面华丽无比,背面却可能留着个秃尾巴。因此用户在选择重复数据删除产品时不仅要关注其好的方面,更需要透过厂商有点“变味”和“华丽”的宣传,寻找到产品的弱点。下面一些建议和问题将告诉你如何去选择一款适合你的重复数据删除产品,如果厂商能够很好的回答这些问题,那么你已经找到了一款很合适的重复数据删除产品,如果厂商不能够很好的回答这些问题,那么还请你慎重起见。
重复数据删除对你是否有意义?
用户首先需要问自己的就是是否真的需要重复数据删除技术。就目前的一些调查情况来看:一些类似医疗影像处理的数据并不适合进行重复数据删除,另外金融、电信等对数据可靠性要求比较高的行业对重复数据删除也需要谨慎对待。用户如果赶时髦、追潮流,不考虑自身企业的数据情况,购买重复数据删除产品只能取得适得其反的结果。
事实上,这种只保存数据单一实例的技术早已存在,只是在备份领域中才被突显出来,并定名为重复数据删除。正是由于企业在备份过程中存储了大量的重复数据、浪费了大量存储空间,最终才催化出重复数据删除技术。重复数据删除的宗旨就是为企业用户的备份解决方案服务,使得企业备份解决方案更加完善、高效。如果脱离这个宗旨,厂商一味强调重复数据删除的一些优点,却忽视企业在数据安全性和备份等方面可能做出的巨大牺牲,那么毫无疑问,这种本末倒置的作法最终受害的将是用户。
因此,用户在选购重复数据删除产品时需要思考重复数据删除是否对你有意义?你的企业是否真的需要重复数据删除?如果厂商不顾你的现实情况,不负责任的向你推销其重复数据删除产品,那么恭喜你,你遇到“骗子”了……
重复数据删除对现有备份环境是否造成影响?影响有多大?
企业用户备份做两次全备份时间间隔一般不长,通常只有不超过5%的数据是不同的,剩余大部分数据都是相同的,因此,重复数据删除绝对可以给企业备份系统带来很大的好处。从而衍生出这样一个问题:重复数据删除是否会对企业现有备份环境造成影响?可能会造成什么样的影响?这种影响有多大?
举个例子,如果你的备份环境已经有比较长的时间了,各项备份机制都趋于完善,这个时候你应该考虑加入重复数据删除解决方案。那么你要选择什么样的重复数据删除产品呢?是选择在线处理方式(In-line)的重复数据删除产品,还是选择后处理方式(Post-Processing)的重复数据删除产品呢?这里需要告诫你的是:In-line方式可能并不适合你当前的备份环境。因为In-line方式可能给你的备份环境带来很大的改变,不仅可能你的备份软件需要升级、备份设备需要更换,还可能出现备份机制、备份习惯的通通改变。更有可能出现,改变现有备份环境会使备份处理的速度变的很慢,甚至引发无法预计且不可恢复的数据丢失。所以如果用户不仔细考虑重复数据删除产品对现有备份环境的影响,则很可能将已有的备份环境做出巨大改变,而这种巨大的改变也犯了IT建设之大忌。
因此,用户在选购重复数据删除产品之前必须对所选产品对现有备份环境的影响进行评估,尽量选择那些对已有备份环境没有影响的产品。
除了考虑对备份环境的影响外,重复数据删除比、重复数据删除安全性和扩展性方面也是用户需要重点考虑的因素。
重复数据删除比 – 不以高低论英雄
重复数据删除比已经成为众多重复数据删除厂商宣传的噱头,也成为了最吸引用户眼球的一个概念。但是事实上,一味的强调重复数据删除比其实没有太多的实际意义,因为这一比率的高低与用户的备份数据类型、备份次数、备份系统环境等诸多因素息息相关。厂商所提出的重复数据删除比往往是在非常好的的备份环境下、针对最适合删除的备份数据类型,加之最合适的备份次数后得出的理想值,而用户在实际应用中恐怕很难遇到这么多种的‘非常好的’条件。就好像汽车厂商书面标称的油耗一样,试问又有几个车主能在驾驶过程中真正实现呢!
因此,重复数据删除比不过是一个数字,这个数字的高低代表不了什么,千万别被厂商的重复数据删除比可以达到XX:1的噱头所忽悠。一个具备重复数据删除能力的优秀备份环境,才是让重复数据删除比达到非常好的效果的必备条件之一。
单一不重复数据的安全性该如何保障?
当用户选择好重复数据删除产品进行重复数据删除操作后会猛然发现这么一个问题:进行完重复数据删除后,我的数据只剩下单一不重复数据,更为要命的是单一不重复数据是集中保存在一个存储区域中。单一不重复数据的安全性瞬间就成为用户最为棘手问题,用户会发现自己把宝都押在同一个地方,仿佛就是把所有鸡蛋都放在了同一个篮子里。这时候,VTL在重复数据删除解决方案中的重要性就显现出来了。用户可以在VTL中再拷贝一份单一不重复数据,还可以通过远程镜像技术将数据镜像到不同地域的不同存储设备上。另外,还可以通过这种高可用性(HA)架构来消除单点故障(SPOF),提高VTL系统自身的高可靠性,使整个备份系统更安全。就目前市场上来看,只有像飞康这样在VTL领域具有极强实力的厂商才能够提供这种重复数据删除解决方案在安全、可靠性方面得到了最大的保障。因此,当用户面对的是在VTL方面不够完善的重复数据删除解决方案就应该多加考虑了。
你想把自己所有鸡蛋都放在一个篮子里,然后终日过着如履薄冰、胆战心惊、诚惶诚恐的日子吗?如果不想,那么请你在选择重复数据删除解决方案时,仔细思考一下单一不重复数据安全的安全性问题!如果厂商解决方案不能够很好解决这个重要问题,毫无疑问的恭喜你,你可能又遇到一个“大忽悠”!
扩展性与成本 - 不可忽视的问题!
用户选择了重复数据删除技术并不意味着以后就万事大吉,数据量该增长还得增长,存储容量该增加还得增加,用户还得去面对存储解决方案可扩展性的问题。
从长远的角度来看,单台重复数据删除设备根本无法满足企业的需求,企业将来也必然会面对多台重复数据删除设备,这就凸现出下面的情况:企业考虑用多台重复数据删除设备来完成备份,那么每台重复数据删除设备能否识别自身已备份的数据在其他设备上是否也已经备份了?出现这种情况是否会影响到整个备份系统的重复数据删除比?是否会增加维护的难度?
因此企业将来面对的集群架构必须具有良好的扩展能力和集群式的重复数据删除技术。集群架构应该是通过统一性的添加VTL节点来扩展,还需要能够做到任意时间添加存储而不出现中断处理的情况。只有这样才能够具有最优的管理能力和扩展能力。如果厂商不能够提供很好的扩展方案,那么极易形成备份孤岛,那时,用户的设备采购成本、管理复杂性和管理成本都将加大的增加。
企业要做的就是不满足于现状问题的解决,而是做到深思熟虑、未雨绸缪!一个扩展性好、易管理的重复数据删除解决方案才是用户的首选!
回归本质 - 越俎代庖还是锦上添花?
从根本上来说,重复数据删除起源于备份,重复数据删除的最终目的就是最大的提升备份设备的利用率。重复数据删除这项技术并不是一把功能较多钥匙,它并不能解决企业备份的诸多问题:缩小甚至消除备份窗口、消除备份对生产主机的影响、复杂的磁带管理、异地灾备……
在当前的环境下,选择合适的、带有重复数据删除技术的VTL备份解决方案才是首先。在利用磁盘仿真技术提升了备份性能,缩小了备份窗口,同时具备强大的管理能力,还可以通过远程复制功能将数据备份到远程,进一步提升数据的安全性。在很好的完成日常备份工作之后,整合的集群式重复数据删除使系统的可靠性、成本效益得到更大提升。用户需要的是能够解决备份问题的高性能VTL解决方案,重复数据删除应该是VTL当中一个组成部分。
在当前的环境下,选择适合的、带有重复数据删除技术的VTL备份解决方案才是首先。优秀的VTL利用磁盘仿真技术提升了备份性能,缩小了备份窗口,同时具备强大的管理能力,还可以通过远程复制功能将数据备份到远程实现灾备,进一步提升了数据的安全性。在很好的解决了日常备份的难题之后,再利用整合的集群式重复数据删除使系统的可靠性、成本效益得到更大提升。用户在这个时候才可能鱼与熊掌兼得,既可以享有VTL带来的强大备份能力,还可以通过重复数据删除来锦上添花。VTL与重复数据删除互不影响,相辅相成,将备份的性能发挥到极致。
所以,用户选购重复数据删除产品时,应该以正确的心态去面对它,本文上面提到重复数据删除产品选购四大注意事项:重复数据删除是否对你有意义、重复数据删除对现有备份环境有多大影响、重复数据安全性如何保障、重复数据删除的扩展性和成本,正是从用户自身角度来看待重复数据删除产品。相信用户只要很好的遵循这四个角度去选购重复数据删除产品,一定能够选购到最适合自己的产品,也一定能够让用户的备份环境得到更好的优化。
最后,重复数据删除仅仅是一项让备份系统锦上添花的技术,而不是越俎代庖的工具,切记切记!