【IT168 专稿】 企业数据量的不断激增给数据管理带来了极大的难题,传统的存储产品和技术越来越难满足业务对存储系统性能的需求,寻找一种创新的数据管理方式势在必行。云计算的概念由此产生,其具有的高性能、可伸缩性以及可靠性等优势给黑暗的企业IT部门带来一线曙光。随着各软硬件供应商都共同朝着云这一方向发力,云不再是高高在上,而是渐行渐近。众多备受海量数据管理难题的企业也开始蠢蠢欲动。
一般而言,敢第一个吃螃蟹的人,其收益是巨大的,但其在面临选择的风险也随之成正比。虽然现在诸多企业都对云摩拳擦掌、蠢蠢欲动,但如何去实现云却是摸石头过河。如何选择适合云的硬件,尤其是存储企业重要数据信息的存储产品时却面临难题。现在市场上有诸多的存储产品,有适合传统数据中心的,也有面向云的,更有甚者宣称是既可面向传统也可面向云的,鱼龙混杂,目不暇接。那么企业在向云端迈进时,究竟该如何选择存储系统呢?
要正确选择一款适合云的存储系统,就必须了解云的特性和目前、未来企业业务的需求。云之所以受到诸多企业的关注,其最大的吸引力在于其具有的动态可伸缩性、高性能以及一旦有新的需求产生可大幅缩短IT部署时间等。根据这些特点,作为IT基础设置之一的存储系统除了提供与之相符的性能之外,还必须具备高可用以及易于管理等特点。
云的出现是为了解决海量数据不断增加引发的存储、管理以及提供业务所需的性能等难题,那么作为面向云的存储系统首先要解决的就是性能问题,其必须提供足够的性能以满足当前的业务需求,在企业业务需求不断增加的情况下,其性能也可按需升级。另外性能优化也是必须的,例如,众所周知,数据有“冷”“热”之分,如果所有数据都存储在一个磁盘阵列中,必然会影响系统对“热”数据的读取速度,进而影响存储系统性能。其通常做法是将“冷”“热”数据分层存储,将“冷”数据存储在较为廉价的大容量磁盘中,而将“热”数据存储在近线SAS盘或SSD中,这样就可提升频繁读取数据的访问速度,同时也可降低企业的总体成本。
其次,除了提供满足新业务的性能之外,存储系统还必须提供随着数据量不断增加所需的存储空间。现在业内人士几乎都有一个共识,企业数据量的增长情况是不可控的,也是无法准确预测的,谁也无法预计下一年会产生多少数据,这就需要存储系统能够提供一个广阔的容量增长空间。但在初始采购阶段,企业不太可能一下子就购买上限容量,这就需要存储系统必须内建自动精简配置与热插拔等技术,目前市场上大部分的中高端存储系统几乎都支持这些功能。
除了可扩展容量之外,其对异构平台的支持也非常重要。这一点除了保护企业的投资和扩容之外,还会给企业带来一些其他的利益点。企业的数据都是非常重要的,除了存储这些数据之外,企业可会采取其他的一些措施来保证数据的不丢失、不损坏,例如备份、容灾。而企业在部署备份、容灾解决方案时,通常会采用虚拟带库、磁带库或者就有存储系统,那么新购存储系统对旧有存储系统以及其他硬件的兼容支持就显得异常重要。
除了提供弹性的性能及容量之外,存储系统还必须具备高可靠和易于管理等特性。高可靠用于最大限度地保证业务连续性,防止因为硬件故障而导致的业务中断。易于使用则辅助IT管理人员对整个IT基础设施进行管理,诸如自动侦测、自动错误修正等技术都可大幅降低IT系统管理难度,降低企业的人力投入成本。
利用上述所分析的因素,就可筛选出一些适合向云过渡的存储系统,诸如EMC的VMAX、惠普公司的3PAR、IBM公司的XIV、HDS公司的USP以及戴尔公司的Compellent等等都可提供企业向云进军所需的性能与要求,虽然不同公司的产品使用的架构与技术有所差别,但其都能满足用户的需求。
惠普3PAR存储系统
说起3PAR存储系统,在存储业内,可谓是众所周知。惠普在收购3PAR之后,通过与惠普已有的产品线结合,是惠普融合存储战略之中的重要一环。除了之前已有的3PAR F系列和T系列存储系统之外,今天9月,惠普发布了收购3PAR之后的首个新品——惠普P10000 3PAR存储阵列,也可称之为3PAR V系列存储系统。从惠普公司一贯的命名习惯来看,P10000位于惠普产品线的最顶端,之下有惠普EVA家族的继承者HP P6000 EVA和HP X9000,从这也可看出惠普对3PAR存储的定位和期望。
如之前的F系列、T系列一样,新发布的3PAR V系列包括两个型号,即V400和V800。V系列存储系统均采用双分类处理器架构,采用的均是新一代的64位ASIC处理芯片和四核2.83GHz处理芯片。其中V400最大可支持4个控制器引擎,V800最大可支持8个控制器引擎,即最高可扩展16颗HP 3PAR Gen4 ASIC处理芯片和16个四核2.83GHz处理芯片。据中国惠普存储产品部产品总监孙钢介绍,与上一代产品相比,采用2个Gen4 ASIC芯片作为引擎的3PAR V系列存储系统在密度上提升了50%,性能提升了1.5倍,而带宽则从上一代的44 GB提升到了现在的92 GB,整整提升了2.6倍。
如上图所示,3PAR V系列存储系统将控制器缓存和数据缓存分离,以达到快速处理数据的目的。其中V400的总缓存最高可达192GB,V800则达到了768GB;V400最大可支持960块硬盘,而V800则是其两倍,达到了恐怖的1920块。并对目前市面上主流的磁盘提供支持,包括SSD、FC以及大容量的SATA、SAS硬盘,并且,各类硬盘均可在同一磁盘柜中混插,以支持动态数据的自动分层存储,达到优化存储性能的目的。
在主机端口方面,3PAR V系列存储系统最高可支持192个主机端口,其中V400最高可支持96个主机端口,除了对目前主流的8Gb/s的FC端口和10Gb/s的iSCSI端口提供支持之外,还对未来同一通信的最有力竞争者FCoE提供支持。
第四代ASIC芯片、大容量高速缓存以及数量众多的主机端口为3PAR存储系统的高性能提供了物质条件,除了这些业界顶端的硬件作为保障之外,存储系统的架构和软件是实现存储性能的最为重要的一环。3PAR存储系统采用双分类处理器架构,为了更好地理解这个架构,孙钢曾打了一个很浅显的比方,采用双分类处理器架构的两个ASIC芯片,使整个存储系统看起来像两个磁盘阵列共同独立存在一样,但却可以对数据进行自由访问。
强大的硬件和独特的架构有了,但这还不够,3PAR存储系统中内建了诸多的包括InForm操作系统、Peer Motion、精简套件、优化套件、虚拟复制、远程复制、GeoCluster、Cluster Extension、Serviceguard以及恢复管理器等诸多功能强大的软件以确保3PAR存储系统的可用性和可靠性,以及对其他异构平台的支持。
日立数据系统(HDS)VSP存储系统
VSP(Virtual Storage Platform,VSP)是日立数据系统公司(HDS)推出的最新一代虚拟化存储平台,与上一代的USP-V系列产品相比,VSP更加强调了对虚拟化技术的重视。并且VSP引起为傲的“3D”扩展强调动态的纵向扩展、横向扩展和纵深扩展,给饱受数据巨量增加的企业带来了莫大的吸引力。
长于高端,一直是HDS存储系统的特点,VSP上几代的诸如USP-V存储系统均是从大型机存储不断发展而来。但随着大型机逐渐湮没于历史的尘埃之中,X86架构一统江湖,上几代的USP就开始提供对X86服务器的支持。作为USP家族的继承者,VSP第一次大量使用了Intel的X86架构。
从目前HDS所发布的关于VSP存储系统的资料来看,并没有提供清晰的处理器资料。但可以肯定的是,VSP仍沿用了USP中原有的共用一个连续横跨式体系结构连接的全局高速缓存的多控制器基本架构,但处理器芯片使用的是Intel的X86处理器。
在配备两个控制器机箱的情况下,新一代的VSP存储系统支持2-24个FED刀片(即16到192个主机端口)和8-16个BED刀片(即32到128个SAS接口),并支持64到1024GB的内存。如果在单控制器机箱的情况下,其最大支持数据正好减半。VSP抛弃了上几代产品的全光纤阵列,取而代之的是6Gb/s的SAS 2.0接口,与FC磁盘相比,其大大降低了企业的总体投入成本。VSP还提供对SSD的支持,并在同一盘柜中支持3.5英寸硬盘与2.5英寸硬盘的混插使用。
VSP系列存储系统对异构存储平台的支持几乎到了无以复加的地步,其不仅提供对其他厂商存储系统的管理支持,甚至利用HDT(Hitachi Dynamic Tiering)功能不但可对单个Lun的不同RAID和不同磁盘进行分层,还可对其他异构存储系统中的盘阵在虚拟化后进行分层。这无疑可大大提升企业整个IT基础设施的利用率,有效地对IT投资进行保护。
除了以上所提到的存储性能之外,利用HDS的VSP存储平台进行备份、容灾也非常的简单,利用VSP存储系统中内建的HAM(High Availability Manager)功能,可实现自动化的同步容灾切换,大大简化了企业的数据管理难度。
IBM XIV存储系统
IBM XIV存储系统是IBM并购以色列公司XIV技术之后,经过整合并于2008年推出的面向中高端市场的存储系统。截止到2011年,IBM公司已经发布了第五代XIV架构。其通过完全网格化的体系架构以满足高并发与高可扩展性需求,并摒弃了传统的RAID模式而采用内建的类RAID1的模式对数据进行保护,采用条带化IO来消除系统热点,以满足云环境下的混合工作负载需求。
XIV内部采用一种独特的全网格架构,整个XIV存储系统由多个网格单元组成,每个网格单元都是基于X86的标准化架构,包括了前端端口、计算单元、缓存、后端磁盘组成了一个紧耦合的网格节点。这些节点通过内部的以太网交换机实现冗余连接。所有节点在一起形成一个网格体系结构的工作模式,因此,该系统可以提供本身具有的并行方式,其强大计算能力能够适用于很多的并行分布式计算环境。
通过这种独特的网格架构,每一个节点都是一个离散的计算单元,并且拥有自身所需的一切硬件基础。这个架构的最大优点在于可实现业务负载均衡,并且当需要对存储系统进行扩容时,其可通过添加硬件的方式就能简单完成。而且其最大的优点在于,在容量扩展的同时,其带宽和计算能力也随之线性增长。在这一点上,传统的存储系统是很难实现的。
在数据保护方面,传统的存储系统均是采用RAID1、RAID5以及RAID6等模式来对数据进行保护。XIV存储系统采用类RAID1的模式对数据进行保护,并通过内部算法,将文件分割成1M大小,分散存储在XIV内部任意网格位置,并在另一网格内存放同样的内容。
这样做的好处在于,当存储系统内的任意硬盘出现故障之后,利用存储在其他网格上的副本可马上对故障磁盘的数据进行恢复。因为故障磁盘上的副本数据都是随机存储的,所以在恢复过程中,多块硬盘一起参与数据恢复,相比于传统的RAID保护模式,其速度必然大幅提升。因为副本数据都是随机分布存储在XIV的各个网格之中,所以即使在两块硬盘同时故障的情况,也可对故障磁盘数据进行快速恢复。
在易用性方面,XIV在设计之初就考虑到了用户的易用性, XIV采用了一个简单易用的图形用户界面,可大大提高存储部署的速度和效率,用户不需要单独的控制台就可以完成XIV的部署配置,且管理GUI包含了预先设定的配置模型,帮助用户实现快速配置及调优,如创建卷、FlashCopy映射或设置RAID配置。
所以,不管从性能方面、数据保护方面、可扩展方面或者易用性方面衡量,IBM的XIV存储系统都具有巨大的优势。这也是IBM公司在云存储领域主打的王牌。当然,因为篇幅的原因,上述虽然只是简要分析了惠普、HDS和IBM公司的适合私有云的存储系统。实际上,云计算从概念走向落地的过程中,不仅仅是这几家公司在努力,几乎所有的IT厂商(包括软、硬件供应商)都在朝着云这同一目标发力。除了上面介绍的3PAR、VSP和XIV之外,实际上适合云的存储系统还有EMC公司的VMAX、Dell公司的Compellent存储系统等,包括NetApp公司、DDN公司都有与之适应的产品,只是局限于篇幅,在此不再详细述说。
并且,在上述所提到的存储产品中,每个产品都有自己独特的架构与优势,并且同类产品也无法用一个统一的、标准的评判,至于用户该如何选择,也没有一个可信服的说法。仁者见仁,智者见智,只有与企业自身的实际环境相结合,并考量IT管理人员的专业长处与供应商的服务覆盖范围,才能选择与企业最契合的产品。