存储 频道

从戴尔DX对象存储看归档设备的发展

  【IT168 技术】大约2个月之前,戴尔公司宣布了一系列新的存储产品。一方面扩大了与长期伙伴EMC的OEM合作关系,转售EMC Data Domain重复数据删除系统和Celerra统一存储阵列;另一方面,戴尔还宣布对采用了赛门铁克和CommVault软件的PowerVault DL2100磁盘备份系统进行升级,同时推出了可以处理块存储和文件存储的PowerVault NX3100 NAS解决方案,并公布了一款新的基于目标(对象)的DX存储系统。

  在上述新品中,包含有2类不同的重复数据删除解决方案,其中Dell|EMC Data Domain系列是基于硬件的,而PowerVault DL2100的源端Dedupe功能则是通过与其捆绑的Symantec Backup Exec 2010或者CommVault Simpana 8数据保护软件来实现的。我们觉得后者主要是通过戴尔MD1000系列(或者相同级别)直连存储在价格上的优势来吸引备份用户,并利用与EqualLogic或者Dell|EMC这些主存储快照功能的无缝集成,进一步完善戴尔的磁盘备份产品线。

  至于另外2款已经上市的产品,都属于既支持NAS文件访问又支持SAN块访问方式的“统一存储”。直接转销EMC的产品在技术方面其实没有什么差别,更多反映的是商业合作模式的发展;而PowerVault NX3100也是在Dell原有NAS产品线基础上推出的新型号,并不怎么让人觉得新鲜。

  这次真正吸引我们的,是戴尔“自主开发”的DX对象(Object,或称为目标)存储系统。目前它已经在国外正式发布,不过中文网站上暂时还看不到相关的内容和资料。

  戴尔DX对象存储系统

  来自非结构化数据的挑战

  在上个月的存储时间栏目中,我们谈到了非结构化数据的增长对存储厂商产品策略带来的影响。可以说这些需求直接为NAS类存储销量带来了持续的增长,并催生了支持更高容量和性能的向外扩展型NAS高端产品的出现,包括惠普的StorageWorks X9000系列和IBM SONAS等。

  IDC在《2010数字宇宙研究》报告中指出:在2010年,数字宇宙(指代由全球所有消费者和企业所创建的数据,包括视频、音频和文件等)将增加1.2 ZB,或者120万PB。到2020年,数字宇宙将是2009年的44倍。同样出人意料的是,由于文件的平均体积越来越小,对象数目(即数据中包含的文件数量)的增长速度将超过数据总量——即使很多大型视频和音频文件被创建,由此设备和感应器等还创建了大量的小型文件。

  从某种意义上来说,“对象存储”就是为了解决文件数量的增加而产生的,但又不仅于此。本文并不是要向大家详细讲解对象存储的概念,但我们希望能够通过戴尔DX来介绍对象存储的一些特点,并且比较它和传统文件存储方式之间的区别。

  对象存储:一种新的长期文件存储方式

  其实“对象存储”已经不是一个新概念了,只是在最近被提到的频率有所增加。

  “Long-Term File Storage”这个名词让我想起了上周IBM介绍的“基于LTO-5磁带技术的Long Term File System”,二者同样是针对长期数据保存。LTO-5的介质分区功能通过在磁带设备上增加一个“索引”,而IBM Long Term File System进一步使用户能够像磁盘那样的方式来访问磁带。比如说可以精确定位一盘磁带上需要读取的部分数据,而不用再像以前那样从头搜索整盘磁带以确定数据开始的位置。

  LTO-5因此宣称能够在磁带上实现“近线存储”应用,然而我们不要忘了磁带的随机访问需要经过倒带的时间过程,而且在一盘磁带的寿命中倒带次数是有限的,这使得它仍然只适合顺序类的访问。真正对访问时间要求较高的近线存储还是应该使用随机性能更好的磁盘设备来完成。

对象存储:一种新的长期文件存储方式

  “文件”和“对象”之间的差别

  上图是举例来比较与“对象”和“文件”相联系的元数据(metadata)量之间的差异。也就是说对象存储通过把大部分的元数据附加到文件上,从而为文件添加一种标识信息,减少了在存储系统中需要统一存放和管理的元数据量,便于进一步扩展。

  在NAS产品中,我们知道惠普的StorageWorks X9000系列和IBM SONAS分别能够支持最大16GB和14.4GB的全局命名空间,这里的限制就是庞大的数据量和文件个数对NAS文件系统元数据索引处理能力的要求所致。在一些特定应用环境下,平均每块硬盘上存储的文件数量可能高达几千万,这时基于对象(目标)的存储设备就更为合适了。

  对象存储与传统NAS共存

  对象存储的市场定位

  数据使用的频率也是选择对象或者传统文件存储要考虑的一个因素。如上图,在新产生的数据中大约30%属于“热数据”,它们对磁盘性能、数据保护、可用性和安全性的要求相对较高,传统的块存储(SAN)和文件存储(NAS)是针对这些数据的。而另外70%的属于“冷数据”,也就是说在创建之后很少或者从来不被访问,它们更多需要的是可管理性(信息生命周期,ILM)、可访问性、可扩展性、储存和成本。后面这部分就是适合对象存储来处理的,当然对象存储本身也属于存档(归档)类应用的范畴。

  戴尔DX对象存储系统

  戴尔DX对象存储系统可用于访问、存储和分发几十亿个文件或其它数字内容,从存档到云计算。戴尔DX对象存储解决方案采用精简,自助管理,对等扩展体系结构,并且经济高效。

  戴尔DX对象存储平台具有以下特点:

  • 通过在近线存储环境中利用元数据和高性价比的磁盘存储,快速确定和检索信息。

  • 自动管理数据从创建到删除的整个过程,目标为将数据管理量减少50%。该平台旨在通过高性价比、且基于策略的保留技术和可选一次写入多次读取技术(data immutability),满足数据的管理和监管需求。

  • 提供多个容量扩展选项,可以扩展到几十亿个文件和PB级存储。为了降低设置和管理的复杂性,DX对象存储解决方案可自我修复,使用基于向导的安装,不需要LUN或RAID组。

  • 通过可扩展存储投资无缝透明地采用新技术,避免叉车式升级的高昂成本和复杂性。DX 对象存储解决方案构建于灵活的对等扩展体系结构之上,采用了基于行业标准的硬件和集成软件,提供了一个端到端的解决方案。

  DX对象存储的合作伙伴生态系统

  戴尔DX对象存储面向的是需要相对低成本的归档(存档)类应用。谈到这里,我们首先会想到EMC的Centera系列CAS(内容寻址存储)产品。那么有着和EMC良好合作关系的Dell为什么不选择直接OEM销售Centera,而是要自己开发DX对象存储呢?(有行业人士表示CAS厂商Caringo也参与了该系统的开发工作)

DX对象存储的合作伙伴生态系统

  这是因为对象存储在具体到各个行业的应用中需要与独立软件供应商(ISV)进行合作,而不是单纯的卖硬件那样简单,其核心功能在于自身的软件。戴尔正在建立一个生态系统,围绕其对象平台开发纵向和横向的解决方案。作为该项工作一部分,戴尔推出了一个可供合作伙伴使用的解决方案开发工具套件(SDK)。该解决方案采用了开放的HTTP接口,能够简化并最大程度地减少集成工作。

DX对象存储的合作伙伴生态系统

  戴尔DX对象存储目前使用标准的HTTP接口提供客户端访问,未来可支持CIFS/NFS和XAM

  在今年上半年,戴尔将首次发布用于医疗、文件和电子邮件存档,电子发现以及内容管理的DX对象存储解决方案。同时,戴尔还计划与更多的ISV长期合作,提供种类日益增多的解决方案。

  看到戴尔开发DX对象存储的策略,我们就不难理解NetApp为什么也要收购目标存储软件开发商Bycast了。

  EMC的Atmos其实也是一种对象存储,不过它更多针对的是“云计算”方面的应用。Dell和EMC在Atmos的销售上也有一些合作,只是还没有达到将其纳入自己产品线的规模。

  戴尔DX对象存储的硬件组成

  戴尔DX对象存储在硬件上由两部分组成:

  1.上图中位于顶部的2U系统被称为DX Cluster Services Node (集群服务节点DX6000),相当于元数据服务器,支持6块3.5英寸硬盘(由PERC H700 6Gb/s SAS阵列卡提供RAID 5保护),标配4个千兆以太网接口;

  2.下面两个2U单元就是DX Storage Node (存储节点DX6012S),每个节点支持12块3.5英寸SATA 7200rpm硬盘(由用户定义的对象复制策略,不需要RAID保护),最大原始容量24TB,标配2个千兆以太网接口,可以根据容量的需求进行扩展。

  对于归档类用途的存储设备,性能上的要求通常相对不高,此次Dell也没有公布DX对象存储的任何性能数据。

  接下来的问题是:戴尔DX对象存储何时在国内上市?未来其他厂商在对象存储领域将还会有什么新的动作?让我们拭目以待!

0
相关文章