“Scale up”VS. “Scale out”
XIV在被IBM收购以前是以色列的一家独立公司,该公司于2002年由原EMC的CTO Moshe Yanai创立,而Moshe Yanai本人则是EMC高端系统Symmetrix DMX的设计者。我们多次提到了,XIV采用了一种有趣的“Scale out”的存储架构,那么什么叫“scale out”呢?
最为低端的磁盘阵列有单控制器的配置,稍微复杂一点的存储系统一般都是双控制器配置,而后端的磁盘数量还可以不断扩展。但总体来说,我们都是在一个固定的存储系统架构上去升级扩展,当扩展到一定程度,就很难继续扩展下去,尤其是前端控制器的数量。也因此导致了当后端磁盘不断增多,而前端控制器无法扩展的情况下产生的性能瓶颈。

XIV采用了大规模并行的网格概念。在XIV存储系统里面,没有任何集中的模块,是一个一个粒度很细的网格组成的。每个网格我们叫数据模块,每个独立的数据模块包括紧耦合的CPU处理能力,缓存能力加上磁盘存储能力。它是把原来在用户传统的集中式存储架构中松耦合的内存、CPU和磁盘紧耦合在一块,做成一个一个小的网格单元,通过网格单元高速互联、堆叠,形成群集计算或者群集存储相应能力。整个存储系统内部是由很多这样的网格堆积而成的,用高速互联的方式、交换的方式联系在一起。
用户数据分布上采用的是粒度很细的数据分布的方式。将来用户整个前端的应用服务器的数据其进来之后,通过大规模并行的方式,把所有的数据通过均衡的方式会分散到后端所有的网格结构之上,同时也会分散到所有的物理驱动器之上,所以通过这种粒度很细的数据分布,再通过大规模并行的方式进行处理。
“实际上就相当于打个不恰当的比方就是群众的力量,通过大规模并行的方式,可以让后端所有的网格单元,让后端所有磁盘驱动器并发响应前端应用的需求,实现性能、可靠性方面的改进。”IBM系统与科技事业部中国区XIV技术专家王晓东先生介绍道:“这里面任何一个网格不比另外一个网格更高贵,更重要,大家是完全对等的这样结构。通过细粒度的数据分布,通过大规模的并行实现系统的高速的吞吐。”