存储 频道

IBM网格存储系统XIV设计理念和逻辑架构

  【IT168 资讯】前面我们已经介绍了IBM新一代网格存储系统XIV的概况与物理架构,本文将重点介绍该产品的设计理念和逻辑架构。

  根据前文的介绍,XIV接口模块和数据模块协同工作在一个分布式计算体系内。这些模块通过内部冗余地以太网网络进行互相沟通,软件服务和分布式计算的算法全面管理的所有的操作环境。

图2-4 IBM XIV可升级的网格架构,是一个概念性的描述XIV网格存储系统架构,因此,并不能准确反映出模块、硬件模块等等的真实数量。

  依靠其分布式的拓扑结构、英特尔标准技术和Linux操作系统的块结构,XIV网格架构存储系统有其独特的算法特点:

  1. 安全性:在现有资源或者模块的失效的情况下,XIV存储系统可以将这种彼此间的影响降至最低。

  2. 负载均衡:所有模块能够平等地参与处理总的工作量。这种架构设计的原理是真正能做到不受访问模式的限制的。系统架构可实现出色的负载平衡,即使某些应用程序非常频繁的访问某些卷,或某些卷上的的分区。

  3. 开放:每个都由标准的“ready to use”组件组成。

  4. 易于采用新技术:由于组件不是专为某些子系统服务,所以对于一些新硬件技术的发展所需要的资源和所需的时间要求都可以减至最低。这一优点,再加上高效率的计算资源整合网格架构,使子系统能够以更快的速度采用最新的硬件技术,而不需要部署一个全新的子系统。

  5. 升级和可扩展性:计算资源可以动态改变,“Scaled out”任意的添加新的模块,以适应新的容量和性能要求,也可以任意的添加模块组。

平衡中庸的逻辑架构

  除了硬件的并行性,XIV存储系统也采用先进的并申请了专利数据分配算法,以实现非常好的的并行。

  伪随机算法:传播数据通过伪随机算法的方式。保证随机散布的数据在所有可用的磁盘硬件资源保持冗余。

图2-5提供了一个概念性的代表性伪随机分布的XIV数据存储系统。

  模块化软件设计:XIV存储系统内部的操作环境具备一套软件功能,他们分布在硬件模块中。并且这些软件可以存放在一个或多个模块中,可以根据要求重新分配模块,从而确保在硬件发生改变的时候保持系统的弹性。

  全存储虚拟化:尽管虚拟化的概念对我们来说并不陌生,但是XIV存储系统内部的数据分布式存储法则还是一个比较新鲜的定义,它已将本身这种这个特点完全的统一到体系架构中,从而代替由主机或者存储组成的存储区域网水平。

  XIV存储子系统的虚拟化在整个架构中非常重要,传统子系统依靠存储管理员仔细计划之间的关系逻辑结构,如存储池和卷,和物质资源,如驱动器和阵列,以战略平衡的工作量,满足需求的能力,消除热点,并提供足够的性能。因此,每当有一个新的需求要求,或改变现有资源的需要,存储管理员负责资源的重新规划和调整,这可以说是一个容易出错和耗费时间的过程。

  后一种情况中,存储的虚拟化发生在分离的存储子系统间,在主机和存储之间采用不同的虚拟化层次。XIV存储系统是唯一的在存储子系统本身实施一个创新的全面存储虚拟化。这种方法允许子系统的逻辑结构发生改变的时候对外是动态透明的,同时保持卓越的负载平衡和资源利用的最低水平的硬件粒度。

IBM XIV存储系统虚拟化的益处

  IBM的XIV虚拟化存储系统实施全面的存储虚拟化,使用XIV存储系统能够消除许多潜在的后台和业务的缺点,同时最大限度的提高整体子系统的潜力。XIV存储系统的虚拟化提供了以下好处:

  轻松卷管理: 逻辑卷安置通过分配算法,使存储管理员减少规划布局和维护量。数据分布算法管理中的所有数据的系统不服从集体逻辑卷定义。

  任何互动,无论是主机或子系统驱动的,具有特定的逻辑卷系统本身就包含所有资源;它利用现有的子系统所有的存储容量,所有内部带宽,所有的处理能力。

  逻辑卷是不完全相关的一个子集,物理资源,而且也不是永久的静态逻辑卷之间的关系和具体

  物质资源: 逻辑卷可以动态调整大小;逻辑卷可以稀疏配置的;一致的性能和可扩展性。
硬件资源总是公平利用,因为所有逻辑卷总是跨所有的物理资源,因此能够充分获得子系统性能潜力。

  当有新硬件的增加的时候,虚拟化的算法会自动重新分配逻辑卷的数据和工作负载,从而维持系统平衡,同时对主机的访问保持透明度。倒过来,这种负载的平衡和对主机的透明度可以很好的应用在逐步淘汰旧的或有缺陷的硬件资源上。

  没有任何的“隐藏”容量、“孤立空间”或访问不到的资源,使某些映射数据的访问受到限制。

  最大化数据的可用性和数据完整性,完全虚拟化的计划旨在使IBM XIV存储子系统方便的进行管理和保持数据通过冗余硬件进行保护:

  在出现硬件故障或当硬件需要逐步淘汰时,数据自动、高效、迅速重建所有驱动器和模块系统,从而维护主机访问的透明度,平衡所有冗余数据的访问,同时几乎消除任何性能损失与常规磁盘阵列重建活动。

  当有新硬件加入该系统,数据是跨越所有资源进行透明的分配,以恢复平衡的系统。

  灵活的快照:XIV彻底的存储虚拟化架构上集成着许多不同的快照,但只有更新数据时才会消耗物理容量,因为只有当源发生改变的时候,快照才会使用物理空间。

  当主卷需要升级的时候,该系统的虚拟化逻辑结构使它能有效地保持和原来的时间点最相近的快照点,只需重新更新到一个新的磁盘上的物理位置。这个过程中,这被称为重定向写,它凭借虚拟映射的最新数据保持主机的透明访问,使性能的影响最小化,任何相关的快照

逻辑卷与存储池

  XIV存储系统的逻辑结构是位于储存虚拟化和分发数据设计之下的一个合成体。逻辑结构子系统能够确保在各个模块与个别物理磁盘间有最优的、最细致的映射关系,从而保证更理想的分布数据使用更多的资源。

  分区:XIV最根本的逻辑卷单位被称为分区。所有分区为1 MB的( 1024KB)大小;每个分区包含任何一个数据的主拷贝或副拷贝;每个分区映射到一个单一的物理磁盘: 此映射是动态管理系统通过专有的伪随机分配算法,以维护数据冗余和平衡。

  分区和磁盘之间的专属映射关系对于管理员来说是透明的,不需要管理进行控制。 第二分区始终放在一个不包含主分区的物理磁盘。此外,第二分区也不在包含其相应的主分区的模块中。

  XIV存储系统提供的逻辑卷和主机之间的关系和传统磁盘存储系统是一样的,不过,这两种逻辑卷的尺寸和映射到物理磁盘的方式是有着根本的不同的:

  正如以前所讨论的,每个逻辑卷由1 MB(1024KB)的数据分区组成。 一个逻辑卷的物理空间通常为17GB(十进制)大小。因此,虽然有可能提出一个指定逻辑卷主机的块大小这不是一个17 GB的倍数,那么物理空间是分配给该卷将永远是一个最低17 GB的大小,并且按数量递增,以满足该区块所指定存储能力。请注意,最初的实际分配制度建立后,其空间大小是可减少的。

  存储系统的物理空间上,最大可支持180个驱动器,每个驱动器采用1TB的容量,承载着每个17 GB的大小的卷,其中卷的最大数量为4,605个。再次,每个系统最多可以拥有4,605个活跃的快照用于指定卷或快照本身,因为卷和快照共享同一地址空间。

  逻辑卷在一个虚拟的存储池中进行管理。存储池不属于系统业务环境内在的逻辑层次,因为这个概念的存储池是管理性质的。

XIV恒定均衡逻辑结构的优势

  快照:快照是卷的一个时间点副本。快照管理着几乎所有的应用于卷之间的对应关系。不同于卷,快照依赖其源卷。因为它们不是独立的实体,一个特定的快照不是全部的分区,但分区对于一个快照是唯一的。

  逻辑卷在物理磁盘上的规划:XIV存储系统对磁盘和模块上逻辑卷的分发非常简便,它通过一个动态关系来管理主要数据的副本、二级数据的副本和物理磁盘。这种虚拟化的资源是通过XIV存储系统伪随机算法来完成的。

  分区表:映射物理磁盘上逻辑分区之间的数量和位置的关系通过分区表来完成。分区表之间的关系保持的分区中所包括的逻辑卷及其在磁盘上的物理位置。

  卷规划:在较高的水平,数据分发规则通常是是镜像和条带化。这种通过RAID1+0(10)或者RAID0+1实现的方式对高水平应用来说无疑是诱人的。而低级别的虚拟化却不用使用传统RAID算法架构。传统的RAID方式不能在逻辑卷的层次实现充满活力的、智能的和自动管理数据布局,也不能跨越驱动器在一个RAID子系统中进行管理,显然其重建时间是难以接受的。

  正如以前所讨论的XIV存储系统架构分成逻辑卷为多个1 MB大小的分区。这些粒度和映射策略的逻辑设计,使该系统实现了以下功能和优点:

  分区分布在所有磁盘,如何使用是通过一种伪随机分布函数算法实现。

  分配算法寻求维护系统的平衡,它平等地统计每个逻辑卷获得各物理磁盘上的所有空间,审核总工作量的条件和相关量访问模式。从本质上讲,虽然不是真正的随机性质,但分配算法结合的系统架构排除了发生在传统存储中经常讨论的的“热点”问题。

  XIV存储系统包含180个磁盘,并分配给每个卷至少有17 GB的容量空间,均匀分布在所有磁盘上。 每个逻辑分区相邻的卷分布在不同的磁盘。伪随机分布式算法确保逻辑上相邻的分区不是来自于相邻的条带化的物理磁盘。

0
相关文章