存储 频道

从存储开始 七招教你构建绿色数据中心

  重复数据删除:给数据瘦身

  由于磁盘技术近年来的快速发展,一些企业和用户越来越倾向于采用磁盘进行备份或者归档,由此带来的能耗问题也是突出的。传统的备份策略往往会在用户的磁盘空间里面产生大量的冗余数据,由此消耗了大量不必要的磁盘空间,带来一系列的能耗和冷却的问题。有什么办法能够消除掉这些多余的数据,从而避免不必要的能源消耗呢?

重复数据删除:给数据瘦身
重复数据删除技术会深入到组成文件的数据块,分析文件由哪些数据块组成,并删除相同的数据块,只保留单一的副本。就像不同的房子可能都是由相同的木材、砖头、水泥等组成,不同的文件经过拆分后,也会出现很多的重复数据块,删除这些重复的数据块,就能大幅度缩减缩需要的存储空间

  重复数据删除最大的优势在于节约用户数据存储所需要的存储空间,因而能够节约数据存储所需要的能源损耗。基于磁盘的备份归档方案与传统磁带库相比在性能、稳定性方面都有很多优势,但是一个突出的不足之处就是,磁盘介质是在线存储,需要一定的能耗,而磁带则是离线存储,本身不需要耗能。

  重复数据删除能够大大减少数据存储与备份所需要的空间,因而减少存储与备份的能耗。大家知道厂商宣称的重复数据删除比根据不同的数据能够达到1:30或者1:20,无论对存储空间的节约方面和能耗节省方面都是有着突出意义的。

  一般人往往容易混淆重复数据删除与数据压缩的概念,二者看起来的确有一些相似之处。但实际上,数据压缩技术通过对数据重新编码来降低其冗余度(redundancy);而重复数据删除技术则着眼于删除重复出现的数据块。前者属于文件级别,后者根据不同厂商的技术特点,既可以是文件级别的,也可以是数据块级别的。

重复数据删除:给数据瘦身

  尽管关于重复数据删除的实现方式,业内还存在“预处理模式”和“后处理模式”的纷争,不过重复数据删除在节约空间方面的显著效益已经使其成为企业采购备份设备时所必须考虑的因素之一。

  重复数据删除可以在数据写入到存储目标前进行操作,称为预处理(Preprocessing)或在线处理(Inline);也可以在数据存储到目标设备后进行操作,称为后处理(Postprocessing)。如果希望数据快速备份,更关注缩小备份窗口,那么,后处理方案比较合适;但如果你“有的是时间”,又需要节省备份磁盘,降低成本,则不妨考虑预处理方案。

0
相关文章