【IT168 专稿】我们知道,在过去2年里IBM通过收购、研发等方式,已经在存储产品线上投入了20亿美元的资本。近日IBM举办了系列的大型发布,一次性集中发布了30多款存储系统产品及其倡导的“企业信息基础架构”的理念。这次发布可说是向公众为过去两年的系列研发和收购交上了一份答卷,证明了两年来IBM在存储领域系列收购和研发的价值和成果,也昭示IBM在存储市场的决心。
我们在上次专访中了解到IBM收购Diligent公司后发布的系列磁带备份与重复数据删除解决方案,实际上,IBM收购的公司都非常有趣,时隔仅仅3天,IBM再次举办专访,介绍了收购XIV公司后所得到的系列技术和产品。根据IBM系统与科技事业部大中华区产品部总经理侯淼的介绍,XIV的存储架构将重新定义存储系统。

事实上,目前尽管存储系统厂商提供了花样繁多眼花缭乱的功能和卖点,但在实际应用中,随着数据量的爆炸式增长,传统存储系统最基本的性能和扩展性一直都存在瓶颈。总的来说,XIV所采用的架构的确非常特别,和传统的存储系统有很大的不同。它不再通过传统存储“Scale-up”的方式来扩展存储系统,而是通过横向的“Scale-out”的方式来获得更高的存储容量和性能。
追求稳定的“性能一致性”
根据侯淼的介绍:XIV最根本的特征有两点,第一是XIV基于网格架构。第二是即插即用的设计,就像一个电源一样,可以即插即用,插在墙上就用。第二点相对而言比较好理解,而第一点所谓基于网格的存储,是指当数据量在增长的时候,当整个存储需求提高的时候,能够保证有一个一致的性能表现和功能实现。
侯淼给我们打了个比方,像交通管理,最大的目标不是在于交通堵不堵,而在于你是不是有一个一致性的从A点到B点的时间。假如今天我上班,从我家到公司,需要30分钟,我期望每天都是30分钟,最害怕的是有时候你是20分钟到达公司,有时候需要一个小时甚至两个小时到达公司,所以你没有办法去计划。同样,这跟数据流量和存储是息息相关的,这是很明确的,从存储设计来讲的话,怎么能够保证一致的性能是非常关键的。
根据侯淼的介绍,XIV在保证性能一致性上,以及高可靠性、节能节电、省空间等方面都有着较好的设计理念。此外在易于管理降低整体系统成本上都有着较明显的优势。
“Scale up”VS. “Scale out”
XIV在被IBM收购以前是以色列的一家独立公司,该公司于2002年由原EMC的CTO Moshe Yanai创立,而Moshe Yanai本人则是EMC高端系统Symmetrix DMX的设计者。我们多次提到了,XIV采用了一种有趣的“Scale out”的存储架构,那么什么叫“scale out”呢?
最为低端的磁盘阵列有单控制器的配置,稍微复杂一点的存储系统一般都是双控制器配置,而后端的磁盘数量还可以不断扩展。但总体来说,我们都是在一个固定的存储系统架构上去升级扩展,当扩展到一定程度,就很难继续扩展下去,尤其是前端控制器的数量。也因此导致了当后端磁盘不断增多,而前端控制器无法扩展的情况下产生的性能瓶颈。

XIV采用了大规模并行的网格概念。在XIV存储系统里面,没有任何集中的模块,是一个一个粒度很细的网格组成的。每个网格我们叫数据模块,每个独立的数据模块包括紧耦合的CPU处理能力,缓存能力加上磁盘存储能力。它是把原来在用户传统的集中式存储架构中松耦合的内存、CPU和磁盘紧耦合在一块,做成一个一个小的网格单元,通过网格单元高速互联、堆叠,形成群集计算或者群集存储相应能力。整个存储系统内部是由很多这样的网格堆积而成的,用高速互联的方式、交换的方式联系在一起。
用户数据分布上采用的是粒度很细的数据分布的方式。将来用户整个前端的应用服务器的数据其进来之后,通过大规模并行的方式,把所有的数据通过均衡的方式会分散到后端所有的网格结构之上,同时也会分散到所有的物理驱动器之上,所以通过这种粒度很细的数据分布,再通过大规模并行的方式进行处理。
“实际上就相当于打个不恰当的比方就是群众的力量,通过大规模并行的方式,可以让后端所有的网格单元,让后端所有磁盘驱动器并发响应前端应用的需求,实现性能、可靠性方面的改进。”IBM系统与科技事业部中国区XIV技术专家王晓东先生介绍道:“这里面任何一个网格不比另外一个网格更高贵,更重要,大家是完全对等的这样结构。通过细粒度的数据分布,通过大规模的并行实现系统的高速的吞吐。”
“恒定均衡”体现中庸和谐之美
谈到XIV的特点,王晓东认为XIV整个系统体现了“中庸和谐”的设计思想。“XIV通过后端大规模并发的设计满足前端并发所有I/O的存储能力,整个系统我们叫自动的性能优化,也就是在这个系统里面,用户不需要买任何所谓的存储优化软件,不需要任何的后端磁盘均衡的软件,系统已经自动通过算法的方式帮你实现了,整个系统是一个非常恒定均衡的方式。其实它最核心的地方在于软件算法的部分,能够把大规模的网格的力量通过算法的方式给它利用起来,所以恒定均衡概念是XIV的最主要的特点。”
“在这种架构里是不需要有特殊的架构不需要有QoS。传统的存储系统里,用户必须要去买存储优化的软件,包括QoS是它的一部分,XIV先天设计,整个系统是恒定均衡的方式。”王晓东介绍道。此外,由于采用细粒度的数据分布,XIV从架构上就支持目前业界炙手可热的自动精简配置技术。

在数据保护方面,XIV也采用了和传统RAID完全不同的方式。XIV将用户整个Volume自动分成很细的粒度,分散到后端所有的磁盘单元之上。它的数据在内部是冗余保护的,任何一个所谓最细的粒度,最小的数据单元在内部都会分布有两份拷贝,这两份拷贝会分布到不同网格单元、不同的磁盘之上。
根据王晓东的介绍,在单盘故障的情况下,假设系统里采用1TB的SATA磁盘驱动器出现故障的时候,整个系统恢复1TB数据只需要将近30分钟的时间,这30分钟的时间是指整个数据系统完全充满的情况下,如果用户数据没有充满的话,整个1TB单盘驱动器出现故障恢复的时间只需要15分钟甚至更短。
扩展性方面则更加是XIV的优势,XIV按照网格单元的方式进行扩展,所谓在扩磁盘的同时,增加了CPU,增加了内存。所以整个系统的扩展是性能和扩展性、容量完全是线性增长的概念,在增加容量的同时,势必会增加处理能力,增加性能,增加缓存的能力,整个的扩展在将来一个机柜、两个机柜、三个机柜、四个机柜的时候达到线性扩展的概念。
此外,XIV是绿色IT非常好的体现,王晓东介绍:由于内部采用的是最节能的SATA的磁盘驱动器,通过大规模并发的方式,虽然单磁盘驱动器的性能没有FC驱动器快,但通过并发的方式,可以实现整个系统性能的提升同时在能耗和占地方面有很大的节省,相对于传统高端的FC驱动器来讲,能耗或占地可能只相当于几分之一的概念。
适用于成长性较高的客户
根据侯淼的介绍,IBM目前来说将XIV定义在高端。谈到DS8000与XIV的产品关系方面,侯淼认为:从长远来讲,XIV既代表了一个潮流的方向,在这个时间只是一个新的产品,相当长的时间里8000还会是一个高端主流的产品之一。
侯淼认为,有三种情况下推荐使用8000。第一种,客户的应用包括数据自己能够掌握,也能够去预测未来的成长的速度,而且能掌握这个成长的速度,例如金融、电信等等一些传统的业务,包括ERP、数据库等等传统应用。对于这些应用,每年的数据增长跟它整个的业务发展包括生意规模是可以预测到的。
第二种是很多用户的存储系统跟服务器已经有了比较好的结合,而且比较成熟地使用了很久的时间,包括性能调优,包括适配器的使用,包括像数据库的使用和应用的配合。第三种情况是客户有比较完善的容灾系统,包括两地三中心等等。在这三种情况下,DS8000应该是一个非常好的选择,因为8000有最快的IOPS的控制能力,也有最完善的软件系统帮助客户做数据的保护,包括高可靠的处理。
侯淼同时也介绍了推荐XIV的几种情况:第一种,客户有一些新的业务,业务增长的速度可能是非常快的,客户在设计新业务的时候,感觉到未来业务增长速度会在高速下增长,并且有可能带来存储架构的改变。因为现在所有厂家中端和高端的存储没有办法物理去扩展,比如用了DS4800,当你扩展的能力超过了DS4800,必须重新购买新的8000,而且把数据能够移植过去,如果客户在未来几年看到数据成长确实高速成长的话,XIV是很好的选择,因为它是非常高程度的模块化。

另外一个方面,现在的客户看存储系统,都是有层次的,包括有中端、有低端,有TIER 1有TIER2,这种层次的设计一个理念背后在于,它的能够预测自己数据的成长。但是在高速数据成长的业务的条件下,一个XIV的产品就是一个很好的选择,因为它把TIER1和TIER2完全综合在一起,也把中端和高端综合在一起。
第三种情况,客户的业务类型,存储系统是非常混合的,混合负载,包括有Video,包括有声音,也包括有文字,像现在的因特网一样,已经是一个非常复杂的负载了。这种情况下,客户自己也很难控制未来它到底有多大的数据量,像一个图片,高清晰度和清晰度不高差别是很大的,同样高清晰度的视频和不太高清晰度的视频差别也是很大的,这时候XIV就是一个很好的设计。
最后一点,客户在混合的负载情况下,同时在数据量成长非常快的情况下,怎么能保持一致的性能,这点也是我们去推荐一个XIV产品的关键的考核点,它数据量很大的时候,它的应用有很多,怎么保证它所服务的对象提供一个高质量的数据响应服务,这点XIV就是一个非常好的选择。
针对Web2.0市场?
根据侯淼的介绍,IBM已经在中国推出了正式的产品。早在被IBM收购以前,XIV实际上在市场上已经是存在了一段时间的产品。本次IBM推出的已经是XIV的第二代产品。内部180块1TB的磁盘,采用了类似于镜像的数据保护模式,拥有80TB的可用容量。支持前端通过FC或者iSCSI的方式连接存储系统。
侯淼强调:该系统属于SAN-based Storage System(基于SAN的存储系统),因为它是通过FC或者iSCSI的方式访问存储系统,不是NAS的概念,内存将高达120GB。整个服务和支持是通过IBM全球的服务系统给用户提供。
XIV在2007年底被IBM收购,截止到推出产品的时间,仅仅只用了8个月的时间,IBM已经从自身的角度发布了第一款产品,可见IBM对本次收购的重视程度。对于XIV来说,尽管该产品在市场上存在已久,但借助IBM收购,才得以让其独特的技术和架构得到更有力的推广和发展。
XIV利用了虚拟化的网格技术,重新定位了磁盘存储系统。而XIV的种种技术特性,使其能更好的适用于数据量快速增长,对IOPS和对带宽需求无法预期,处于一种混合工作负荷的环境下的业务需求,这些特点也使得该产品能够更好的应对Web2.0公司的业务增长。但该产品180TB的起始容量有可能成为这些Web 2.0公司的购买带来成本上的门槛。
而前不久EMC也在其中端和高端产品线上提供了对固态硬盘(SSD)的支持,当然EMC所作的仍然是在传统存储系统的架构基础之上的“Scale up”的改进,同时IBM也强调本次一起发布的DS5000系统在未来也将提供对SSD的支持。
可以看到无论是“Scale up”还是“Scale out”都是厂商力图去突破存储系统现有系统瓶颈的不同方向,至于各自的发展前景如何,我们将期待XIV的市场表现给我们一个满意的答案。