【IT168 专稿】在前面的文章“零距离接触IBM新一代网格存储系统XIV”中,我们已经详细介绍了XIV存储系统的概况,本文将进一步详细介绍XIV的物理逻辑结构和设计理念。
在IBM XIV存储系统的架构中集成了多种功能,XIV可以有计划、有规律的分发数据,保证这些数据穿插在系统内部,实现对关键内部资源的使用。XIV存储系统的这种独特的数据分配方法与传统的存储系统数据分配方法有着根本的区别,因此系统本身的物理和逻辑实现原理都具备更高的可用性、更高的性能和管理的好处。
从最小的处理单元“数据模块”说起
为了更好的描述XIV存储系统的基本概念和系统架构,我们根据一个示意图来讲解XIV的体系结构特征。
XIV存储系统的主要部分的被称为modules(模块)。模块提供处理单元、缓存、主机接口和基于标准的英特尔和Linux系统。它们通过一个内部的以太网交换机实现冗余连接。所有模块在一起形成一个网格体系结构的工作模式,因此,该系统可以提供本身具有的并行方式,其强大计算能力能够适用于很多的并行分布式计算环境,如图 。
XIV体系结构概览:接口模块
在概念层面上,数据模块的功能是系统构建数据块的基本元素,提供物理容量空间、处理电源和缓存,除了先进的系统管理服务之外,还包括系统的内部操作环境。各数据模块间是均等的,他们共享和管理系统的软件,共享服务,如图2-2 XIV存储系统的内部体系架构所示。
接口模块
从根本上说,接口模块其实和数据模块的结构基本相同,但是承担的功能不同,此外采用的磁盘,缓存和处理资源不一定与数据模块一致,接口模块的设计包括光纤通道和iSCSI接口的主机系统的连接以及远程镜像。前面图2-2说明说明了接口模块拓扑中的位置。
在接口模块上,系统服务和软件的功能与管理外部I/O接口是相关联的。
以太网交换机
XIV存储系统包含一个冗余的交换以太网络结构,负责进行数据和元数据之间的通信模块。包括两个接口模块之间的数据交换;接口模块和数据模块之间的数据交换;以及两个数据模块之间的数据交换。如上图2-2体系架构概况。
重要的是要认识到,数据模块和接口模块不是以同样的方式连接到以太网交换机。
与传统存储架构进行对比
并行的概念贯穿与XIV存储系统各个方面,这种架构提供了一个平衡的手段,采用分布式的冗余数据和分布的计算资源池(或网格)。为了更深层次的解释这种并行的原理,我们先了解一下传统存储体系架构的特点。
从理论上说,虽然传统的存储架构和XIV的网格架构都能够完成相同任务,但是二者间却有着根本不同的拓扑结构定义。
我们首先搞清楚计算资源的概念,计算资源是我们界定为一个独立的实体的标准,它包含了所有必要的组成部分,如处理能力、存储、传输和接收数据。
传统存储架构的特点是:一般是具备单一的强大功能、综合的、完整的并有个性化的,稍昂贵的计算资源。但是整体架构不易于采用新的或外部的技术,同时当整个系统扩展到一定程度之后,他们需要仔细的匹配计算的当前系统资源,不能非常容易的实现整个系统的整体扩展。
我们需要注意的是:一些存储群集的拓扑结构,实际上也没有组成一个单一的整体系统,而是各自独立的单片系统。因此它也不同于XIV的网格体系结构,XIV的网格体系能够从整体上为一些特定的工作任务制定一些独立的计算资源。
网格体系架构利用“横向”的分布式方式,通过复杂的算法,把相关,相同(或非常相似)的计算资源捆绑在一起。能够把一个特定的工作任务是进行战略性的分离。通过许多计算资源在这些任务形成一个产品之前对其执行并行的运算操作。系统的整体性能会通过增加更多的模块(如执行类似的工作任务)使总的工作量分布在更多个模块上。
网格存储架构的优势
传统的存储子系统通常利用专有的、定制设计的硬件组件(而不是普遍提供的硬件组件)和互连接口,是专门设计集成在一起的,以实现目标设计的性能和可靠性目标。传统存储系统采用的复杂高性能冗余单片系统体系架构,往往存在一个或多个以下特点:
开放性问题:组件的更换常常导致系统故障或者硬件的升级,这些组件通常是由制造商指定的一些固件,专门用于此系统。所以这个系统不能轻易的利用市场上新的硬件设计或部件。
性能问题:即使在一个N+1方式的群集系统中,如果集群发生失效,那么不仅可能对链路产生重大影响,而且也会影响生产主机和应用程序的性能。
升级和扩展性问题:传统存储系统升级的过程中系统资源的使用有可能影响性能和可用性。升级一般需要非常小心,并且要注意潜在的时间消耗和管理成本,甚至在某些情况下可能需要某种程度的系统中断。
此外,传统存储系统的升级很有可能导致一个不平衡的资源调配,例如,一个磁盘子系统可能升级驱动器的数量,而处理器却不能,从而导致整体系统的性能潜力受到限制。系统整体不能充分利用升级带来的资源优化。
XIV则能很好的规避这些传统存储架构带来的问题:
成比例扩展:在XIV存储系统里,每个模块都是一个离散的计算资源,包含自己的容量单元,和网格拓扑计算结构所需要的一切相关硬件基础。所有的模块都通过一个可扩展的网络进行连接。这种网格体系架构的突出特点就是在你增加或者删减模块的时候,都可以按照比例的增加或者减少缓存、处理能力、磁盘和带宽,以维持资源最优。
线性缓存增长:总系统缓存大小和缓存带宽随着磁盘容量的增加而呈线增加,因为每个模块是一个独立的计算资源,都拥有自己独立的缓存。请注意,缓存带宽的衡量包括两方面,一个是主机到缓存的吞吐量,另一个是缓存到磁盘的吞吐量,要尽量使缓存、处理器、和磁盘之间的带宽维持平衡。
按照比例的接口扩展:接口模块包含iSCSI和光纤通道主机接口,通过这些接口不仅可以访问一个模块中的数据,还可以访问整个系统。在系统中按比例的添加接口模块,其访问内部资源的带宽也将同步增长。
持续交换能力:随着系统的增长其内部交换能力也是按比例增加的,无论系统内部使用多少个模块,都要防止瓶颈的出现。这种能力可以确保内部吞吐量可以按比例的增长。
嵌入式处理能力:由于每个模块都有自己的处理单元、缓存和磁盘组件,所以该系统有能力处理密集型任务,如缓存预读取、高速缓存更新、快照管理和数据分发,不管系统容量如何,始终保持该系统的运算能力。