存储 频道

HDS文件服务平台:发挥数据价值

【IT168 资讯】在大学的教科书上,数据类型分为三种:结构化、半结构化以及非结构化数据,我们可以将我们所接触到的所有文件都按照这三种分类加以区分:关系型数据库中的数据是结构化的,电影、音乐等多媒体文件是非机构化的,电子邮件、网页等数据是半结构化的,凡此种种,数不胜数。

在很多年前,计算机上的文件还只有文本文档和表格时,所有的数据都是结构化的,而随着多媒体计算机--就是那种可以发出声音,播放音乐或是加了硬解压卡能够播放VCD的计算机的出现,慢慢的,计算机从单纯的运算工具,变成了具有娱乐功能的电子产品,而在又经过了数年之后,现在的计算机已经深入到了我们身边的各式各样的办公、生活、计算以及娱乐等领域,但是,此时人们发现了一个很严峻的问题:在整个文件系统中,非机构化数据和半结构化数据占据了80%的存储空间,只有区区20%的空间,留给了早已经不是"数据主流形式"的结构化数据。

可惜的是,非机构化数据和半结构化数据的搜索、归档与利用与结构化数据相比,不知道复杂了多少倍--Google曾经打算用图片的主要颜色来帮助用户在自己的文件系统内搜索图片文件,从而解决对于非机构化数据来说最大的难题:搜索,但是,很可惜,Google失败了,工程师们发现,要想解决非结构化数据和半结构化数据的存储、搜索、归档和利用问题,显然是非常困难的。

日立数据系统公司(HDS)全球解决方案服务副总裁Hicham Abdesssamad认为,解决文件存储平台的应用难题,完善企业数据归档的最重要的出发点是:One Platform for all data(为所有数据提供统一平台),作为曾经在业界多家知名公司担任过服务部门重要职务,拥有超过13年的IT行业从业经验的年轻副总裁,Hicham觉得,HDS公司今年3月份推出的集成文件服务平台,能够从存储、安全、数据保护与搜索等多方面,解决企业面临大量的结构化数据和非结构化、半结构化文件所带来的问题,因为HDS在做的,正是One Platform for all data。

5月14日,我们在北京见到了Hicham Abdesssamad,就HDS推出的集成文件服务平台,以及这个平台下所包含的各个功能套件,如Hitachi Data Discovery Suite(日立数据发现软件套件)、Hitachi Essential NAS平台、Hitachi High-performance NAS 平台、Hitachi Content Archive 平台进行了一次有关"文件管理"的对话。


认清问题:"过去"的文件服务器

"现在我们的非结构化数据是2272PB,但是到2010年,预计会达到20000PB。" Hicham用一个颇有些"可怕"的数字来警示我们非结构化数据可能会给我们带来的"大麻烦"。他表示,目前的情况是,只有4%的非结构化数据已经在内容管理系统的掌握之下,而剩下的96%仍然没有被有效的管理起来,而且,就像Hicham所言,这些数据仍然在以10倍于结构化数据的速度在递增,但问题是,这些数据都不能随便的销毁或是删除--不仅仅是因为法规遵从的压力,更大的原因在于,这些数据中存储着企业发展的重要信息。用Hicham的话说就是"Content is King"。

他表示,对于企业来说,必须要明白,任何一个文件都有可能包含着具有价值的信息,即内容为王,内容的价值体现在多个方面,而如何了解文件的内容,建立好的文件服务平台是最基本的要求,比如说,只有在了解数据所在的文件属性、内容属性以及诸多信息才能够对数据进行有效的分类,从而加以利用,但是,现在的情况却并不乐观,有很多的企业的文件服务平台都处在"过去时"。

"根据IDC的调查《The Hidden Costs of Information Work》显示,如果一个企业的人均年薪为6万美元,那么以目前平均的每年浪费在的搜索文件和电子发现上的时间,每人价值5251美元,如果这个企业有1000人,那么一年下来企业将会浪费价值500万美元的工作时间。"Hicham表示,现在的文件服务平台以及内容管理和归档方式,造成了极大的浪费,从文件存储或者说文件服务器的角度来看,目前NAS是应用最多的文件存储方式,但是,Hicham认为,"过去时"的NAS存在很多问题,首先,现在的NAS文件服务业务模式,在随着文件的不断增长的同时,成本在不断上升,而且,在多个远程办公室之间进行复制、传输以及删除等远程异地管理时,仍然难以做到完全的高效和高可靠性,尤其是往往不能有效的对数据进行分类的归档,因此,也很难基于内容的价值对文件进行分层存储,以达到最高的经济型。

与此同时,目前的归档系统不仅种类繁多,如磁带、光盘库、NAS和普通的RAID阵列以及CAS归档系统,而且最重要的是,这些数据都处在信息孤岛上面,无论是电子邮件、文档管理、Web应用程序,都处在各自为政的情况之下,从而导致了目前的许多归档系统与文件服务平台存在四个较大的问题:


1、 各级内容归档系统之间,以及与整体系统之间脱节,形成信息孤岛
2、 扩展性较差,容量、分层存储等难以实现
3、 难以支持跨设备甚至是跨平台、跨应用之间的数据搜索
4、 缺少强大的数据保护和数据认证能力


作为HDS全球解决方案服务副总裁,Hicham觉得,用户现在有必要改变一下他们的系统了了,在面临非结构化数据的强大压力的同时,用户必须将文件服务平台与文件归档系统进行有机的整合,从而完成对未来的文件爆发式成长的最好应对准备。

0
相关文章