此类存储技术其实不难理解,它能够压缩大量的已有数据(压缩率达到1:10~1:20),通过这种压缩和智能识别重复数据的方法来释放大量的存储空间,从而大大降低基于磁盘备份的成本。
技术成熟度:数据重复删除技术是一项可以有效减少数据的关键技术,这项技术的应用能够确保昂贵的磁盘存储得到非常好的应用。正如现在光盘存储领域发生的蓝光与HD DVD之间的业内格式标准争夺战一样,重复数据删除领域内也分成两大主要阵营。一方主张要首先拥有“载体”;而另一方则主张在数据的根源上就对其中重复部分进行删除,基本上取代对备份软件的需要。
从目前应用来看,以“虚拟磁带库VTL”为载体的重复数据删除占用较大比重,此种方案具有较好的性能,同时降低了存储数据所需的磁盘空间容量;并且其中的大多数方案都会很容易与现有的架构融为一体,很少导致系统运转的中断。

应用环境:此类技术运行的原理采用反向标准,其着眼于前面的模块,将其与已进入备份存储库的数据对比,然后根据是否匹配决定是否保留他。
总的说来,重复数据删除技术可解决如今大型企业降低当备份恢复应用由主存储向二级存储转移时,产生的数据量暴增的程度。这不仅局限于数据中心内,所有那些也同样面临数据增长失控危机的异地分站点也同样适用。因此可广泛适用于需要进行存储数据升级的应用环境。
相关产品应用:前面已提到,目前此技术主要以VTL为载体,因此在产品的应用方面还是以虚拟磁带库为主,再配以相应的重复冗余系统,以实现相应的备份与冗余管理。
虚拟磁带库,其实早在十多年前就已出现,但却一直未得到广泛的应用。最近一两年里,由于磁盘系统在可靠性和性价比等方面的优势突现,才使得其有了应用的环境,各类新的存储技术应用到产品中,使得虚拟磁带库重新得到用户及厂商的注意。
市场反映:重复数据删除技术系统具有100MBps的吞吐,尽管可将它们集中到一个管理控制台下,但在企业用户的应用反馈中,仍然被指无法适应速度的需要。因为与磁带库和能达到500GBps的虚拟磁带库相比,这一性能表现属于中等偏下水平。因此市场反映主要还是以观望为主。
不过,Avamar、Asigra、赛门铁克、Atempo和Time Spring等厂商为了进一步提高此类技术的市场竞争力,也在积极研讨通过在数据的根源上就对其中重复部分进行删除,基本上取代对备份软件的需要,来优化此类技术。
目前应用问题:目前此技术的应用瓶颈,主要集中在其存储性能的体现上和数据安全的保护上。
重复数据删除技术还是通过软件方式来保持数据,如果软件损坏,存储的数据就会随它一起丢失。
将数据高压缩和删除后,使得剩余的单独数据更加重要,如果安全措施不到位受到网络攻击,损失同样较重。
当在其它正备份在被写入的情况下执行剔除冗余,也容易造成数据丢失。