在线存储的寿命
那么在线存储的寿命又如何呢?在线存储主要使用硬盘,这些硬盘可随时打开,以供即时访问。而且其上的数据可经常进行完整性检查,也容易进行复制,但是斯坦福大学图书馆领导“Lots of Copies Keep Stuff Safe(多备份资源保存)”(LOCKSS)项目的科学家David S.H.Rosenthal则抱怨说,在线存储也很容易瞬间遭到破坏,其用于存档的长期可靠性目前还看不到。

▲
Rosenthal经过调查发现,在线存储一个PB的数据,那么这些数据在1个世纪后依然能够使用的几率大约只有50%。在对各种存储农庄所发表的维护数据的措施进行了分析之后,他发现,要想实现上述PB/1世纪的目标,在线存储的可靠性就必须提高109倍(即10亿倍)。
但即便我们老老实实地实现了在线存储可靠性10亿倍的提高,他指出,我们也没有任何现实的手段可以在短期内对这样的系统进行测试,也只能是打开系统,默默等待100年,才能看到结果。
既然数字化存储的寿命是如此之低,而又有如此之多的信息产生自数字化,“因此从现在开始的50年内,我们将会面对一个数字化的黑暗时代,未来的学者们将不再能够懂得我们现在的文化,”美国电影艺术与科学学院(即奥斯卡的颁奖单位)的科学与技术委员会理事Andy Maltz说。
数据保护的标准
既然已经意识到了存储技术所存在的问题,因此各种组织纷纷开始寻找解决之道,主要的目的是要减少各种存储格式过时的危险。
要想防止过时,通常需要制定所谓元数据目录——也就是说关于某个文件的信息也要以一个文件来存储。使用这种方法,未来的使用者们可能就不会像科学家们在1999年那样陷入困境:当时的科学家发现,1975年录制的含有NASA火星探测数据的磁带已基本无法使用了。只是在找到了一些打印资料后,科学家们才可能对其中大约三分之一的数据进行分析。
除了制定标准以外,还存在一个更加棘手的管理问题。“大多数组织都无法准确告诉你,他们的电子内容需要保存多长时间,而只有5%到10%的机构正在用充分详细的元数据对电子内容进行标记”,芝加哥市专门从事记录保管的Imerge咨询公司的合伙人兼SNIA(网络存储工业协会)发言人Donald Post说。“而80%的组织称,他们保存数据的办法就是复制。95%的组织认为,只要执行例行的备份就是很充分的数据保护了。”
Post称,企业的IT经理们没有推动这一问题的商业解决方案的动力,因此厂商们也不急于提供任何这方面的产品,但他预计,这种状况会在未来3年内发生改变,因为厂商们将会意识到,推出数字化保护产品具有潜在的商业价值。