存储 频道

慧眼看清重复数据删除和单一实例存储3

【IT168 资讯】

  分清单一实例存储与重复数据删除

 单一实例存储的英文全称是Single Instance Storage (SIS),单一实例存储被启用后,就会作为一个后台的服务运行,把内容重复的文件合并到一个共用的存储空间。重复的文件被该文件的链接(指针)替代,对于用户和应用程序来讲就像原始文件一样。

 单一实例存储已经实施于大型企业环境,并极大的节约了重复文件占用的磁盘空间,从而最大限度地利用目前的存储资源。单一实例存储通过减少冗余数据释放更多的磁盘空间,识别相同的文件,仅仅在中心位置保存一个副本,并在SIS公共存储区域保存文件的指针而不是保存文件本身。简而言之,单一实例存储就是文件级的重复数据删除。

 那么单一实例存储是不是与重复数据删除完全相同呢?

 我们还是以上面的PowerPoint文档来举例说明,在发送1MB的PPT演示文档给20位员工时,如果我们采用了单一实例存储,系统会识别完全相同的文件,只存储一个PPT演示文档而用指针替换其他所有相同的副本,其总体占用的磁盘空间仍为1MB。从这点看,它与基于文件级的重复数据删除所达到的效果是一样的。

 但是,当我们对接收到的PPT演示文档进行修改编辑,如另存为不同文件名的PPT演示文档。此时的情况将完全不同,单一实例存储无法在字节级或数据块级对接收到的数据进行分析,所以一旦作了修改,即使是同样内容的文件,它也会将其作为新文件进行完整保存。就上例而言,如果所有20位员工对其收到的邮件附件都作了或多或少的修改,那么最终备份时的磁盘占用空间将爆增到20x1MB,与传统的备份环境无异。

 如果我们采用了基于字节级或数据块级的重复删除技术,由于它对接收的数据进行自然划分并进行全局粒度比较,从而最终仍会实现仅占用1MB左右存储空间的重复删除效果。

 从上面的叙述我们可以看出,单一实例存储与重复数据删除有相同的地方,但其本质上是不一样的,在处理的思路上是一致的,但实现的方法和手段上是不同的。尤其是基于块级和字节级的重复删除技术,其重复数据删除的效率远高于单一实例存储,不仅对重复存储的应用如备份有效,而且在客户第一次备份数据或存储数据时,就可以发挥其高效的重复数据删除特性,达到备份完的数据量小于原始数据量的效果。

 

0
相关文章