中国云存储深入调查(二):产品服务篇
●常规的云存储的结构
云存储的概念始于Amazon提供的一项服务,同时还伴随着其云计算产品。在Amazon的S3的服务背后,它还管理着多个商品硬件设备,并捆绑着相应的软件,用于创建一个存储池。新兴的网络公司已经接受了这种产品,并提出了云存储这个术语及其相应的概念。
云存储是一种架构,而不是一种服务。你是否拥有或租赁了这种架构是一个次要问题。从根本上来看,通过添加标准硬件和共享标准网络的访问,云存储很容易扩展云容量和性能。事实证明,管理数百台服务器,使得其感觉上去就像是一个单一的、大型的存储池设备是一项相当具有挑战性的工作。早期的供应商承担了这一重任,并通过在线出租的形式来赢利。其它供应商(如Google)雇用了大量的工程师在其防火墙内部来实施这种管理,并且定制存储节点以在其上运行应用程序。由于摩尔定律(Moore’s Law)压低了磁盘和CPU的商品价格,云存储渐渐成为了数据中心中一项具有高度突破性的技术。
这十年来,集群NAS系统已经出现了好转。本文综述了构建一个云存储或大规模可扩展的NAS系统的各种不同架构方法,对于那些寻求构建私有云存储以满足其消费的企业IT管理者或是对于那些寻求构建公共云存储产品从而以服务的形式来提供存储的服务提供商来说,这些方法与他们息息相关。架构方法分为两类:一种是通过服务来架构;另一种是通过软件或硬件设备来架构。
传统的系统利用紧耦合对称架构,这种架构的设计旨在解决HPC(高性能计算、超级运算)问题,现在其正在向外扩展成为云存储从而满足快速呈现的市场需求。下一代架构已经采用了松弛耦合非对称架构,集中元数据和控制操作,这种架构并不非常适合高性能HPC,但是这种设计旨在解决云部署的大容量存储需求。各种架构的摘要信息如下:
紧耦合对称(TCS)架构:
构建TCS系统是为了解决单一文件性能所面临的挑战,这种挑战限制了传统NAS系统的发展。HPC系统所具有的优势迅速压倒了存储,因为它们需要的单一文件I/O操作要比单一设备的I/O操作多得多。业内对此的回应是创建利用TCS架构的产品,很多节点同时伴随着分布式锁管理(锁定文件不同部分的写操作)和缓存一致性功能。这种解决方案对于单文件吞吐量问题很有效,几个不同行业的很多HPC客户已经采用了这种解决方案。这种解决方案很先进,需要一定程度的技术经验才能安装和使用。
松弛耦合非对称(LCA)架构:
LCA系统采用不同的方法来向外扩展。它不是通过执行某个策略来使每个节点知道每个行动所执行的操作,而是利用一个数据路径之外的中央元数据控制服务器。集中控制提供了很多好处,允许进行新层次的扩展:
存储节点可以将重点放在提供读写服务的要求上,而不需要来自网络节点的确认信息。
节点可以利用不同的商品硬件CPU和存储配置,而且仍然在云存储中发挥作用。
用户可以通过利用硬件性能或虚拟化实例来调整云存储。
消除节点之间共享的大量状态开销也可以消除用户计算机互联的需要,如光纤通道或infiniband,从而进一步降低成本。
异构硬件的混合和匹配使用户能够在需要的时候在当前经济规模的基础上扩大存储,同时还能提供永久的数据可用性。
拥有集中元数据意味着,存储节点可以旋转地进行深层次应用程序归档,而且在控制节点上,元数据经常都是可用的。
●云存储选择
虽然在可扩展的NAS平台上有很多选择,但是通常来说,他们表现为一种服务、一种硬件设备或一种软件解决方案,每一种选择都有它们自身的优势和劣势(PCPOP企业频道推荐《七点建议帮助企业一起成功部署云存储》):

云存储系统的结构模型
服务模式
最普遍的情况下, 当你考虑云存储的时候,你就会想到其所提供的服务产品。这种模式很容易开始,其可扩展性几乎是瞬间的。根据定义,你拥有一份异地数据的备份。然而,带宽是有限的,因此要考虑你的恢复模型。你必须要满足你网络之外的数据的需求。
HW模式
这种部署位于防火墙背后,并且其提供的吞吐量要比公共的内部网络好。购买整合的硬件存储解决方案非常方便,而且,如果厂商在安装/管理上做的好的话,其往往伴随有机架和堆栈模型。但是,这样你就会放弃某些摩尔定律的优势,因为你会受到硬件设备的限制。
SW模式
SW模式具有HW模式所具有的优势。另外,它还具有HW所没有的价格竞争优势。然而,其安装/管理过程序要谨慎关注,因为安装某些SW的确非常困难,或者可能需要其他条件来限制人们选择HW,而选择SW。
伴随着大规模的数字化数据时代的到来,在这个时代里,企业使用YouTube来分发培训录像,在这里,没有必要将这些数字“资料”放的到处都是。像以上这些企业正致力于内容的创建和分布,基因组研究、医学影像等的要求会更加严格准确。LCS架构的云存储非常适合这种类型的工作负载,而且还提供了巨大的成本、性能和管理优势。
●主流厂商的云存储产品
目前,诸多厂商都已推出了云存储产品,比较有名的就是EMC的Atmos的云存储基础架构解决方案,Atmos是一种基于策略的管理系统,让服务提供了可以建立不同类别云存储的能力,比如说,其可以为非付费用户创建文件的两个副本,并存储在全球不同的地点,并为付费用户创建5~10份备份进行存储,并提供了其在全球各地访问文件的更高的可靠性和更快的访问。在软件系统中,Atmos包括数据服务,如复制、数据压缩、重复数据删除,通过廉价的标准x86服务器从而获得数百TB的硬盘存储空间。EMC承诺说其拥有自动配置新的存储空间并自适应硬件故障的能力。也允许用户使用Web服务协议进行管理和读取。目前Atmos有三个版本,系统容量分别为120TB、240TB和360TB,它们全部都基于x86服务器并支持千兆或10GbE以太网连接。
IBM方面
XIV是IBM提供的新一代存储产品。它采用网格技术,极大的提高了数据的可靠性、容量的可扩展性、系统的可管理性。XIV是在传统的存储设备以上的升级。它具有海量存储设备+大容量文件系统+高吞吐量互联网数据访问接口+管理系统的设计特征。XIV由于其独特的设计,使之天生就具备海量的存储能力与强大的可扩展性,能够满足各种Web2.0应用的需求,是一个理想的实现云存储的产品。

“XIV产品具备IBM信息管理、保护、归档等重要职能,是IBM信息基础构架和存储关键的组成部分,也是IBM能够重新定义存储的理念的一个产品。”IBM系统与科技事业部大中华区产品部总经理侯淼说。
XIV结构把中端和高端存储的特点结合在一起。当用户有了新的业务,或者数据快速增长,并能够预计未来业务有高速度增长,数据类型复杂,这种情况下,XIV都是用户目前合理的选择。
XIV存储系统内置的虚拟化技术大幅度简化了管理及配置任务,瘦供给功能改善了IT操作,快照功能几乎可达到无限次,并可瞬间克隆数据卷,显著提升测试及访问数据库操作的速度。它的宗旨是通过消除热点与系统资源的全部占用,提供高度一致的性能。IBM?XIV存储系统能够帮助用户部署可靠、多用途、可用的信息基础结构,同时可提升存储管理、配置,以及改进的资产利用率。
惠普方面
ExDS9100(StorageWorks 9100 ExtremeDataStorage)是针对文件内容的海量可扩展存储系统,该系统结合了惠普PolyServe软件、BladeSystem底盘以及刀片服务器以提高性能,还使用了被称为“块”的存储。这些块在同一个容器中包含了82个1TB的SAS驱动器。

ExDS9100专为简化PB级数据管理而设计,为Web2.0及数字媒体公司提供的全新商业服务,包括图片共享、流媒体、视频自选节目及社交网络,所带来大量的以文档为基础数据完全满足即时存储与管理的需要。同时可满足石油及天然气生产、安全监控及基因研究等大型企业的类似需求。
ExDS9100是一个统一的系统,配备以下三种主要配件:
Performanceblock:高能效的HPBladeSystem机箱配备刀片服务器,可满足海量高性能运行的需求。解决方案的基本配备包括四块刀片,可扩展至16块刀片配置,每个单元拥有高达12.8个核心,性能可以达到每秒3.2GB。
Capacityblock:基本配置提供三个高可用性的存储块,及高达246TB的存储容量。最高配置能支持达10个存储块,提供820TB的存储容量。
Software:该系统采用HP的文件集群技术,满足Web2.0及数码环境的严格要求。为降低系统的复杂性及成本,应用程式可直接在服务器模组上运行,删除不必要的软件层。透过单一的图像管理界面,用户能够轻松管理更多的存储产品和设备。
EMC方面
Atmos是一个软硬件结合套件,代号分别为Maui和Hulk。EMC云基础设施部高级副总裁Mike Feinberg表示,最初设计它的目的是帮助用户管理在几十个或几百个不同地理位置的千兆兆字节级的数据。EMC称Atmos具有自动架构、自主修复和云存储的功能,主要面向媒体和娱乐公司、电信公司和Web 2.0网站与互联网服务提供商,旨在帮助它们建立外部云存储服务或是在内部建立基于云存储概念的内部存储云,存储容量可以扩展到PB级,支持数十亿的文件和对象,并提供在全球各地访问的能力。

EMC为Atmos提供了三个不同的配置,全部都基于x86服务器并支持千兆或10Gb以太网,容量分别为120TB、240TB和360TB,Martin表示“我们在一个3U的机架中运行15个1TB的驱动器,你可以拆卸任何部分。”EMC公司云基础设施部门的产品管理总监Jon Martin表示Atmos与现有的存储系统软件“根本上不同的”,其大多数的管理和核心功能都内建在存储系统之中。
Atmos主要提供了一种云存储服务,在不同地点分别存储文件副本,比如它可以免费为用户创建文件的两个副本,并存储在全球不同的数据中心,为付费用户提供5至10个备份,以便为全球各地用户提供较快的访问速度和较高的安全性稳定性。在其软件部分,Atoms包括各类数据服务,如复制、数据压缩、重复数据删除,通过廉价的标准x86服务器从而获得数百TB的硬盘存储空间。EMC表示Atoms拥有自动配置新的存储空间和自动调整硬件故障的能力,并允许用户使用Web服务协议对各类数据进行管理和读取。