存储 频道

压缩、重复数据删除和加密的区别

【IT168 资讯】目前,硬盘统治着存储行业,传统的存储阵列不断受到其他基于磁盘系统的冲击,例如虚拟磁带库(VTL)、复制平台等。随着越来越多的公司数据被转移到磁盘中,存储管理员必须部署、配置和管理日益增加的容量,尽量将磁盘空间利用到极限,同时保护重要数据免遭盗窃或丢失。压缩、重复数据删除和加密在磁盘存储中应运而生,了解它们各自所扮演的角色是非常重要的。


  压缩

  事实上,压缩这个概念十年前就出现了,但是,像VTL的存储系统重新赋予了它新生。基本来说,压缩就是通过清除文件中的冗余数据来减小文件的大小。通过缩小文件的大小,就可以节省磁盘空间来存储更多的文件。例如,一个100K的文件通过删除其所占有的额外空间,或将长字符串用短字符来代替的方式,可以压缩到52KB。当文件被读取时,算法会对原始数据进行重组。图像文件也一样可以压缩。例如,.jpg图像文件格式就可以通过压缩来减少冗余像素数据。

  事实上,虽然所有的文件都能被压缩,但是一些无冗余数据的文件压缩的效果微乎其微,所以压缩比只是个指南——而不是个准则。例如,2:1的压缩比在理想情况下可以使400GB的文件只占用200GB的磁盘空间(或者200GB需要保存的文件只需100GB的磁盘空间)。在采用压缩算法之前,很难准确地判断一个文件到底能压缩到何种程度。


  重复数据删除

  一个典型的数据中心可能会存储很多相同文件的备份。文件重复数据删除(有时也叫数据缩减或共同性分解)是另一种旨在删减存储系统中的重复文件来节省存储空间的技术。由于只存储文件的单一实例,磁盘空间可以显著地降低。

  例如,假设同样一个10MB大小PPT文件分别存储在十个文件夹中,供每个销售人员或部分使用。这就需要占用100MB的磁盘空间来存储这个同样的10MB文件。文件的重复数据删除保证只有一个完整的备份被保存在磁盘中。随后重复的文件只保存一个指向以保存备份的指针,这样用户仍能在同样的位置上看到他们的文件。同样地,一个存储系统可能保留200封电子邮件,每封都有同样一个1MB附件。采用重复数据删除,需要存储每个1MB附件的200MB空间可以减小到1MB空间,只需保存一份。

  重复数据删除还可以提供更细粒状的控制,将文件的多余部分转移,甚至可能达到块级水平。这在内容寻址存储(CAS)系统比较常见,例如Avamar Technology公司的Axion产品。对一项重复数据删除产品进行评估时,一定要了解清楚该平台能提供的粒度。



  加密

  随着安全问题在政府法规和公司诉讼中日益突出,存储经理们开始承认安全在企业存储中的重要作用。加密技术是用来保护数据,防止未经授权的用户存取信息,即使文件被盗走。你可以在安全系统中看到加密技术的运用,例如Nexsan Technologies公司的Assureon CAS产品。

  加密是用数学算法通过一个独特的钥匙来对文件进行编码,从而使之无法被读取。在它使用同样的钥匙被解密前,没有其他人可以进入或使用加密的文件。当然如果密钥丢失或忘记,采用该密钥加密的数据就再无法读取。

0
相关文章