对象存储成新宠
IDC在《2010数字宇宙研究》报告中指出:在2010年,数字宇宙(指代由全球所有消费者和企业所创建的数据,包括视频、音频和文件等)将增加1.2 ZB,或者120万PB。到2020年,数字宇宙将是2009年的44倍。同样出人意料的是,由于文件的平均体积越来越小,对象数目(即数据中包含的文件数量)的增长速度将超过数据总量——即使很多大型视频和音频文件被创建,由此设备和感应器等还创建了大量的小型文件。
“对象存储”就是为了解决文件数量的增加而产生的,但又不仅于此。它可以简化程序。其中,“面向对象”是指基本的存储单元是对象而不是块。对象存储设备相对于块设备有更高的“智能”,上层通过对象ID来访问对象,而不了解对象的具体空间分布情况说到这里,就明白了一点——对象是智能化、封装得更好的块,是“文件”或其他应用级逻辑结构的组成部分。
当然,用一个对象存储一个文件也是有可能的,这是上层的事情,至于上层究竟是个文件系统(如EXOFS)还是让应用直接访问对象存储设备就无关紧要了。而对象存储设备本身也有可能是个分布式的系统——这就是分布式对象存储系统了,强调的依然是这个封装的概念。
对象本身是平等的,也就是说,对象分布在一个平坦的空间中,而非文件系统那样的树状逻辑结构(Namespace)之中,这也就给了我们很大的灵活性——如果需要,可以利用对象构建一个文件系统,因为对象本身包含了元数据信息了,甚至包含了更多的属性,因此,文件系统本身的设计就相对简单了;如果不需要,可以直接用平坦的空间,对于海量文件系统来说,似乎没有这个必要;也可以用一部分对象构建一个树状文件系统,甚至可以为同一个对象存储系统组织成不同的树状文件系统结构。
对于大多数集群NAS厂商来说,更倾向于用一个文件作为一个对象,并且把大量的元数据附加到文件上,从而为文件添加一种标识信息,减少了在存储系统中需要统一存放和管理的元数据量,便于进一步扩展。众所周知,集群存储想进一步扩展的情况下,元数据节点往往会成为性能瓶颈。
由于非结构化数据飞速增长带来的文件管理上的瓶颈,厂商开始在对象存储领域寻求解决方案。例如NetApp今年4月份收购了对象存储领域的领先厂商Bycast, Bycast公司的StorageGRID主要应用于非常大型的、基于对象的、固定内容、容量在PB级的归档数据库,还可以被归档服务供应商用作云服务,可以跨不同地区和不同种类的硬件环境工作。NetApp希望在其Data ONTAP O/S上增加一个对象接口将StorageGRID整合到Data ONTAP之中。
戴尔此前收购的集群NAS厂商Exanet同样在对象存储领域有较强的实力,整合Exanet后推出的DX对象存储系统可用于访问、存储和分发几十亿个文件或其它数字内容,从存档到云计算。戴尔DX对象存储解决方案采用精简,自助管理,对等扩展体系结构,并且经济高效。