存储 频道

存储那点事:Scale Out存储器介绍

  采用Scale out MPP体系架构的HP P4000系列存储器介绍

  HP StorageWorks P4000系列存储器的历史

  除了上文中介绍了Dell收购的EqualLogic公司以后一跃从一个专业的服务器厂商变成了专业的服务器和专业的存储器厂商,可谓春风得意。当然别的服务器厂商也看着有些眼红,结构当年在iSCSI细分存储器市场排名第二的厂商叫Lefthand(取名“左手”,莫非因为美国很多是左撇子?)就被HP公司用4亿美金收购的(比EquaLlogic便宜了不少),当时着实让我吃惊不小,我原来以为应该是其他服务器公司(比如IBM,IBM没有自己生产的中端存储,其中端主打产品DS4000、DS5000是OEM LSI公司的产品,而N系列的NAS是OEM Netapp公司的产品),没有想到是HP,因为HP在中低端模块化存储器产品线已经有了EVA存储器和MSA系列存储器(收购Compaq后得来),干嘛还要花大价钱收购Lefthand呢?

  HP公司花了好几年把这款存储器整合进其庞大的Storageworks产品线中,取名为P4000系列。我们以HP P4000为例来看看这种MPP架构的存储器的一些和传统模块化阵列如HP的EVA存储器不一样的特点:

  •Storage Clustering

  −Scale performance, capacity, redundancy non-disruptively without taking applications off line

  •Network RAID

  −Achieve higher levels of data availability beyond standard hardware RAID

  •Thin Provisioning

  −Increase capacity utilization and reduce storage costs with thin provisioning integrated throughout the architecture

  •Snapshot

  −Simplify, consolidate, and increase reliability of backups

  •Remote Copy

  −Implement a consolidated DR strategy for remote and branch offices with Remote Copies

  需要指出的是thin provision(容量精简配置)、snapshot(快照)和remote copy(远程复制)属于存储控制器中针对数据保护的经典软件功能,本文中就不多介绍了。

  HP StorageWorks P4000存储器介绍

  前文笔者多次提过,存储器也是计算机,存储器是一台专门为存储服务优化的计算机设备。但是在HP P4000的设计中要改一下口号“存储器就是计算机”,因为诸位看官怎么看一个P4000的节点都不像传统意义上的存储器,明明就是一台标准的HP Proliant服务器,和其他普通的X86服务器没有任何区别(包括CPU、网卡、磁盘、内存等标准部件,据说连显示器接口都在,HP P4000单节点图如下图所示)。这就是HP P4000的设计理念,把一系列软件灌进x86服务器里面,就变成了P4000存储器,正所谓“存储器明明就是台计算机”….

 MPP体系架构的HP P4000系列存储器介绍

  HP P4000单节点

  而且据说即使你不买服务器,利用HP提供的存储软件装在服务器上,也能立刻变成一台存储服务器,我的乖乖….这个也忒彻底了….

  关于HP P4000存储器storage cluster的功能介绍。这是P4000存储器的设计灵魂所在,即扩展时只需要再扩展存储节点(X86服务器),系统管理员不用知道如何分布存储,P4000存储器内部的SAN/iQ管理软件会自动完成数据底层的重新条带化工作,做到容量和性能的同时扩展。这个思路和Dell的EqualLogic存储器的设计思路是类似的,看来基于scale out架构设计的存储器都有这么一手,底层虚拟化自动打散。

  网络RAID技术探讨

  而另外一个最让笔者吃惊的技术就是P4000 network RAID技术。笔者更加愿意把这种技术称为storage cluster,其原理在于一个主机同时连接到两个存储器,当一个存储器失效、掉电down机后,另外一台存储器可以无缝地接替失效存储器的工作,整个过程对于主机和应用系统完全透明,不需要任何人工干预。

  Storage cluster可以说是存储保护的最高境界之一,以前只有购买IBM公司大机的Hyperswap功能才能做到(传说中的IBM大机 Mainframe,多贵啊)。在开放系统平台,这个功能也仅仅能够在企业级大存储器平台上有可能实现,如H系(HDS和HP公司)的USP/XP系列存储器的HAM storage cluster功能,或者EMC最新发布的VPLEX,且这些存储软件功能都只是在实验阶段或者预发布状态。

  然而HP P4000这么款便宜的存储器就能很轻松实现这个功能,我第一次在现场看到演示时也大为吃惊,研究过后才发现其奥秘所在:传统的storage cluster技术多用于SAN环境,SAN是一个两层协议,以WWN号寻址为基础,在SAN层面很难实现透明切换,需要通过很多复杂的手段去“欺骗”主机 和文件系统;而P4000的network RAID功能是基于iscsi协议,底层是TCP/IP,基于TCP/IP的丰富的功能,底层两个阵列间透明的切换就变得轻而易举,轻松实现了…

  笔者发现这个奥秘后不禁长叹:一个好的网络基础架构真的很重要啊,难怪那么多SAN网络的厂商都消失了(McData、CNT、InRange等),而SAN市场的巨无霸Brocade也收购了Foundry,看来IP协议也将慢慢统一存储市场….

  HP StorageWorks P4000系列评点

  前文说过,HP StorageWorks P4000设计的概念是“存储器就是计算机”,即在新购X86服务器装个软件就成了,甚至连服务器都不用买(IBM XIV的设计思想也和P4000类似),直接灌入软件即可,这种设计思路有以下优势:

  1 成本优势:最大优点就是成本优势。通用服务器的备品备件都很便宜(相对存储器的备品备件),而是市场上都可以找到,完全是标准化设计;

  2 升级优势:PC服务器升级速度往往比存储器升级速度要快很多,而如果采用P4000这种架构,存储器的升级也很容易实现;

  3 管理优势:P4000存储器底层采用了存储虚拟化和智能调优技术。注:几乎所有的scale out MPP体系架构的存储器,都会采用基于磁盘底层lun打散虚拟化的技术(Dell EqualLogic、HP P4000和后面要谈到的IBM XIV、国内的龙存科技的产品,思路差不多,实现方式上稍微有些不同)。笔者认为这很大程度上体现了作为新一代存储器天然优势,在设计之初就采用了底层虚拟化的概念,完全没有历史包袱,而很多著名的、历史悠久的存储器往往因为要实现和上一代的兼容、或者支持mainframe等历史原因,并没有采用native的底层打散的技术,而是在做好lun以后再在控制器层做一层虚拟化;

  4 负载均衡:scale out MPP架构可以扩展到多个节点(传统的模块化阵列仅两个控制器),因此这种架构的存储器可以实现多个节点的负载均衡,自动化管理;

  当然,如果要仔细挑刺,笔者认为HP StorageWorks P4000设计上还是有些遗憾,主要问题在于:

  1 最重要的一点就是其每个节点作为存储节点来讲实在是太不专业了(IBM XIV也是如此),每个最小配置的节点就是一台PC服务器而没有针对数据存储的特点做相应的优化,用普通的内存来充当cache。因此其实P4000最小配置的每个节点实际上是相当于只有一个控制器(一个单点故障),而且普通内存不带电保护明显不利于写IO加速。这一点Dell EqualLogic做得要专业得多,最小配置的每个节点有两个控制器,并配置镜像的带电缓存。

  2 了解了这点后,再回过头来看HP P4000的network RAID功能就不那么神秘了,P4000的network RAID功能实在是不得不做的功能,通过普通网络作为心跳把两个P4000的PC服务器组成一个cluster,提供高可靠性。

0
相关文章