待解的难题
当企业开始进行数据净化时,无疑还将面临更大的挑战,比如如何制定更合理有效的留存政策,如何将无用的数据真正净化干净等。不过,企业至少应该明白,净化数据比将数据存档到廉价的磁盘上的可靠性更高,且成本更低。
无疑,制定数据留存政策对于企业来说是非常棘手的任务,并且这项工作还会变得越来越困难。Zimmer就表示: “很多时候,我们不知道很多不同种类的数据应该保留多久。”Gartner为此提供了一份参考,在其最新的分析报告中指出,在制定数据留存规则时,减少数据量的关键在于“内容评估”的过程,而此过程包括内容的使用模式、内容的自然属性以及业务目的等因素。
减少数据量最简单的方法就是删除自己不需要的数据,但这说起来容易,做起来却很难。实际上,除了电子邮件以外,大部分数据信息都不可能被轻易删除。“更何况,绝大部分的早期系统都没有提供数据净化的功能,而新的软件也很少提供这种功能。并且,删除这些数据也是十分复杂的过程。”Merryman表示。
但是,如果企业抛开软件系统来看待这些数据的话,就会不知道该怎么办才好,并且企业也不希望将这些数据脱离软件。“不过,却很少有企业会为了数据留存方面的需求而调整自己的基础架构。”Merryman说。在纽约的一家银行里,有很多数据文件连扩展名都已经不知道是什么了,这些数据也不可能再通过现有的软件进行访问,却还一直保留着。
此外,在数据净化的过程中的确还存在着一大隐患,就是不能保证可以删除某种数据集中的所有实例。“你可能会认为删除了自己过去所有的电子邮件就大功告成了,但是你却不知道,它们很可能还保存在企业的磁带上,事实上这些数据仍然存在。”ESG的Babineau说: “因此,很多企业认为,既然不能保证将所有的备份都删除,那就不去删除了,因为即使删除了这些数据,它们也很可能还在某个没人知道的地方保留着。”
以现在企业的数据留存状态来看,净化数据令很多人望而却步,但是Merryman却并没有被困难吓倒,从制定净化策略开始,西卡罗莱纳大学开始了他们精简数据的进程。“不要在一开始就试图在很老的应用上净化数据。”Merryman建议说: “如果你面对的是高风险、高数据量的软件,那么你将会面临更大的危险; 如果你的目标是所有的应用程序,那你很可能永远也完成不了数据净化的任务。”
此外,Merryman还提醒,不要忘了还有业务逻辑。“在层叠的存储环境中,在业务过程中净化数据比将数据存档到廉价的磁盘上的可靠性更高。”Merryman说,“永久保存和管理那些没有经过筛选和净化的数据需要极高的成本。”
不过,现实情况是,大部分使用层叠存储结构的企业认为能够先存储数据,然后再进行净化。Merryman则表示: “这恰恰是数据净化的问题所在,就好像清理很久没去过的地下室一样,总是有点晚了。”因此,Merryman提出了这样的疑问,既然企业在保存数据上投了资,那么当企业不需要某些数据时,为什么不在销毁数据上也适当投资呢?