存储 频道

对象存储随非结构化数据增长日渐流行

  对象之争

  Caringo的CTO和创始人之一,Paul Carpentier作为FilePool的创始人发明了CAS,FilePool在2001年出售给EMC之后变成了EMC的Centera。Carpentier可能是最直言不讳的用基于对象的系统来整个替换掉文件系统的支持者。“这个讨论十分热烈,”Carpentier说“个人来说,我认为我们已经把分层结构延续得太久了。”Carpentier说文件系统设计的初衷是允许少数用户同时访问共享的少量对象。但是现在,他说,存在着“广泛分布的用例(对非结构化的数据)和这些系统运行机制之间的不匹配──90%到95%的参考信息不需要带有并发锁机制的文件系统。”Carpentier还说在到达PB级别的时候,管理文件系统就显得过于细致而不切实际了。“一些产品产生虚拟层级来表示全局命名空间,但是下面可能存在20个需要单独管理的文件系统,迟早Web 2.0业务模型会变得不可能实现”他说。还有,在大尺度上“备份已经不在有效了──你需要实时复制(Replication)。”

  对象接口可以用文件系统无法达成的方式来对存储在下面层级磁盘硬件上的数据进行重复数据删除,Cleversafe 的 CEO Chris Gladwin说。“对于对象来说,没有大小限制,或者驱动器大小的概念──只有一个命名空间,它理论上可以包含地球上所有的驱动器。”

  一个EMC和NetApp用户说他同意这种观点。“我感到我们现在的文件系统不太好──在大型机时代,你可以给文件附带属性以便管理他们,”一个由于公司规定而要求不公开其公司名称的资深存储专业人士Tom Becchetti说,“在文件系统中,如果你需要用与其它文件不同的方式来管理一些文件,现在你要在不同的服务器中来实现。”

  这和服务器虚拟化中正在进行的整合背道而驰,而Becchetti说基于对象的存储“可能成为虚拟(服务器)世界成长的关键,这里一个对象不是文件而是一个VMDK(虚拟机磁盘文件)。这意味着我可以在比当前的文件系统中更多的物理服务器之间共享一个VMDK,而且通过基于策略的管理来在更大的尺度上对其进行保护,例如我可以说VMDK名字带有P的应该用这种方式来保护,而任何名字中带有D的则不是。”然而,就算在一些要求最为严格的环境中,用户也会说文件系统可以完成任务。Eugene Hacopians是California Institute of Technology (Caltech)的高级系统工程师,那里是NASA的喷气推进实验室的学术老家,在最近的一次Wikibon.org电话会议上,他说他的存储环境中有2PB的数据,包括数十亿个5KB到25KB大小的文件,仍然主要运行在来自Nexsan技术等公司的传统存储系统上。但是这更多的是由于时机、项目生命周期以及预算的原因而不是出于技术上的偏向。“我们留意过(基于对象的存储)而且也正在为较新的项目考虑它”Hacopians说“当你正在实施一个项目的过程中的时候,想要转为一个新技术并被迫破费会很困难。”

0
相关文章