单一实例存储
SIS是一种在特定的存储系统数据范围内查找完全一致的文件,找到之后将所有冗余的副本删除而只保留指针指向唯一被保留的那份文件的技术。这种技术的一个例子是MicrosoftExchange,如果有同一份附件被发送给了30个收件人,那么这份附件将只被保存一份,收件人的收件箱中所表现的只是一个指针。这对最终用户是透明的,就像30个收件人每人的收件箱内都有一份附件一样。这个例子中,数据缩减比率就是30:1。这种数据缩减方法在一个众多用户共享大量相同文件的存储环境中,非常有效。
数据归档
数据归档经常被高估为一种数据缩减方法。但是实际上,它只不过是在迁移数据而已。数据归档工具可以将很少被使用的或者将来不会再被使用的数据移动到另外的存储介质或者位置上,从而可以降低对主存储的日常数据管理复杂度。
然而,虽然数据归档可以降低生产系统中的数据量,但是它并没有降低整个存储系统中的数据量。这是因为数据在从主系统被移动到磁带或者其他存储介质时,并没有执行任何数据缩减处理。但似乎,如果将数据归档与SIS、重复数据删除、压缩等技术相结合之后,那么此时才真正可以实现数据缩减。
数据删除
在重复数据删除、压缩以及SIS都不能够满足要求的环境下,那么数据删除就是唯一一个可供选择的方法了。然而,数据删除时所有存储从业者或者商业经理所最不愿意做的了。原因是因为业界有众多的法规来控制数据删除,比如freedomofinformation,e-discovery等,我们需要遵从法规。在删除数据之前,有一些需要看考虑的事项:
针对在何种服务器上存储何种类型的数据,制定一个清晰的策略。文件服务器经常被用来存储用户数据,而且很多公司并不会花费时间和精力来看一看到底服务器硬盘上都存储着些什么。用户将一些音乐、照片或者电影文件放在服务器上的现象屡见不鲜。
制定一个邮件保留策略,然后贯彻执行这个策略。实现这个策略的一种方式是部署一套邮件归档工具,比如Symantec的EnterpriseVault。Symantec的EnterpriseVault可以让你将邮件和消息进行归档,而且可以从归档的数据中进行查询,而且还可以设定一个保留时间,超过保留时间的归档数据可以被自动删掉。这套工具还可以支持一般文件系统以及MicrosoftSharePoint对应的数据。同时,也有其他一些邮件归档工具,比如Informatica Corp公司的产品就是专门为那些后台使用数据库的应用程序(比如CRM和ERP)所设计的。
要注意到PST(personalemailarchivefiles)文件,尤其是当要执行邮件删除策略时。很多用户发现,当邮件被自动归档或者删除之前,他们可以将邮件信息存储在PST文件中。这种行为会破坏数据缩减的比率,尤其是当用户将这些PST文件存储在对应的文件服务器中的时候。PST文件的存在也是对邮件删除策略的一种破坏,因为邮件原本应该已经被删除,而当前却仍在系统中保留了原邮件中的信息,而且还可以被访问。
综上所述,可用于数据缩减的技术依然有限。在某些环境中,比如数据本身的格式决定了去重比率不高时,或者数据存储在不支持下一代压缩技术的设备(FC、ISCSI)上时,此时,直接将文件删除可能是实现数据缩减目标的唯一可行的办法了。删除文件并不是意见毫无意义的事情,但是你需要谨慎决定,同时遵循法规。删除文件同样需要一个清晰的策略以及需要鉴定的执行这些策略。施加和贯彻这个策略的本质,就像如果没有警察的强制管理,汽车时速限制就像一纸空文一样。