存储 频道

对话:绿色应成为用户采购重要指标

重复数据删除技术的具体应用

    问:重复数据删除在绿色存储方面扮演什么角色,用户在使用重复数据删除过程中有什么需要注意的么?

    颜军:重复数据删除最大的优势在于节约用户数据存储所需要的存储空间,因而能够节约数据存储所需要的能源损耗。我们知道绿色IT的概念中有很大一部分和节能有关,尽管虚拟带库与传统磁带库相比在性能、稳定性方面都有很多优势,但是一个突出的不足之处就是,虚拟带库是在线存储,磁盘在线需要一定的能耗,而磁带则是离线存储,本身不需要耗能。

    重复数据删除能够大大减少数据存储与备份所需要的空间,因而减少存储与备份的能耗。大家知道厂商宣称的重复数据删除比根据不同的数据能够达到1:30或者1:20,无论对存储空间的节约方面和能耗节省方面都是有着突出意义的。

    市面上的VTL产品比较多,虚拟带库和重复数据删除走向应用的时间本身不长,用户选择起来也比较眼花缭乱。用户在最初选择重复数据删除的时候可能会过分的片面强调删除比率。但我个人提一个实际的建议:删除比在实际应用中更多的取决于数据类型、备份模式等等因素,实际上重复删除比率根据不同的应用不同的数据类型在500:1以及20:1之间都有可能发生,完全取决于用户的数据重复率。那么具体在应用选择中我们需要考虑哪些方面呢?

    第一点,重复数据删除技术在具体的备份应用中,不应该对备份性能有任何影响。现在重复数据删除本身有不同的实现模式,一些重复数据删除的实现方式本身需要耗用大量的CPU资源,在整个备份进程中增加大量的处理进程,这样尽管用户获得了一定比率的重复删除比率,但在客观上降低了备份性能。实际上,VTL相比磁带库的突出优势就体现在降低备份窗口获得高性能备份与恢复,而如果采用的重复数据删除技术不合理,则有可能因为获得数据压缩比率而损失掉一定的备份性能。

    第二点,高端一些的用户需要注意,当采用重复数据删除等等一些VTL增值技术之后,还需要考虑与未来技术发展方向的兼容问题。例如,我们需要用VTL技术来建立一个灾备体系,需要使用异地复制技术,那么如果我们前期在使用重复数据删除技术的时候没有考虑未来需求的变化,则会制约系统的发展。

    此外还有面向磁带库的出库技术,尽管在数据量小的时候我们可以不考虑采用磁带作为离线介质,但是用户的数据量始终在增长,未来如果有这样的需求,则需要在构建系统的开始考虑到未来需求的发展。

    总结一下,以上的观点,对于备份性能的影响是第一位的,也就是说在使用重复数据删除技术获得压缩比的同时不能以牺牲备份性能为代价,其次,用户在使用重复数据删除的同时必须考虑未来技术发展方向的问题,必须与未来的需求以及发展相兼容。

0
相关文章