存储 频道

XIV网格存储系统方案建议书

第3章 IBM XIV网格存储系统方案介绍

  不同于传统的集中式存储架构模式,IBM XIV 网格存储系统由众多的网格单元构成,每一网格均由标准的Intel/Linux组件构成。所有网格通过千兆以太网络方式实现完全互连(any to any)。这一革命性的架构提供了卓越的性能,可扩展性,可用性和可靠性。虽然是基于Tier-2的SATA磁盘组件,但XIV应用其专利技术,包括其独特的并行结构,Cache缓存算法等弥补了SATA磁盘的不足,使存储系统的整体水平超越了传统的Tier-1光纤存储系统。

IBM XIV 存储系统网格架构示意图

  Tier-1存储性能的获得是通过大规模并行的方式,所有驱动器并发工作
  复杂的缓冲架构及算法大大改进性能
  一致均衡的I/O操作确保低的磁盘故障率
  分钟级的故障快速重建保障系统获得前所未有的可靠性,系统暴露于双重故障下的风险几率几乎为零

  IBM XIV磁盘存储系统为基于网格架构的下一代企业级存储系统,是目前网格存储(Grid Storage)技术的先行者。

  3.1 IBM XIV产品特性

  技术要点

  创新的非分层企业级存储架构,旨在降低分层存储管理与信息生命周期管理的复杂性。
  近乎即时且能高效利用空间的快照可提供数据的时间点副本,而时间点副本占用的存储容量仅取决有更改的内容,而且能够保持极高的性能。
  系统虚拟化可通过在系统资源范围内自动分配数据,无需手动调节即可避免热点,从而可极大地简化 IT 运行并优化性能。
  以少有的自修复功能保证高度可靠性,使系统能够在 30分钟或更少时间内重建 1 TB 的磁盘驱动器,而对性能几乎无任何影响。
  系统通过大规模并行、极高的磁盘利用率与独特的缓存算法提供优化、一致的性能。
  直观的用户界面与系统虚拟化大大地简化了存储配置与管理。
  内置自动精简配置允许用户仅安装实际写入数据所需的容量,并随着时间的推移以最少的管理工作量慢慢增加,从而帮助您降低直接和间接成本。
  通过大容量 SATA 驱动器和优化的磁盘容量使用率,实现更绿色的能耗,以及优异的每 TB 能耗效率,而不会牺牲性能。

  3.1.1 全新的性能水平

  XIV 网格架构存储系统提供了一种全新的性能水平,远超出当前市场上的一级存储系统。这一性能的取得取决于网格架构的几个革命性的设计理念:

  系统级别的超级条带化 :系统中的每个卷都会分成多个1MB的条带。这些条带会使用复杂的伪随机算法分布到系统中所有的磁盘之上,这一革命性的方式可以确保:

  不论何种访问模式,所有磁盘和数据模块(Data Module)均匀使用,尽管应用程序对某些卷的访问会多于其它卷,或者对卷中某些部分的访问会多于其它部分,细粒度的条带化回保障磁盘和数据模块的负载最终会完美的均衡到系统的所有组件上。
  系统所使用的伪随机分布式算法可以确保即使是卷添加,删除或更改大小时, 或有模块增加或删除时系统均衡仍然得到一致的保持。

  Cache缓存和磁盘集成于同一模块 (网格)之中 :XIV 有别于传统的中端甚至某些高端存储系统,其设计思想是将读写缓存和磁盘嵌入同一硬件模块---网格之中。这一独特的设计带来以下优点:

  分布式Cache实现。Cache缓存以分布式的方式实现于系统之中,因此所有Cache缓存单元可以并发完成主机I/O及后端磁盘I/O,这确保了Cache永远不会成为瓶颈。
  缓存到磁盘的高带宽。缓存到磁盘的带宽是数据模块(网格)的内部总线带宽,两条PCI-X总线为此提供了每秒数GB 的带宽,可以充分满足系统进取的预取算法(Aggressive Pre-Fetching)的需要。
  强大的Cache管理能力。这一独特的设计使得系统可以在每次磁盘读操作时读取大块数据到缓存之中,同时按照小的Cache Slot来基于最近最少使用算法(LRU)管理Cache资源。这一切是通过分布式网格结构的巨大处理能力和缓存到磁盘的高带宽来实现的。

  强大的CPU处理能力 :每个数据模块(网格)之中都有多核CPU,整个系统的CPU总量多达数十个。这些CPU提供了强大的处理能力,帮助完成复杂的Cache算法,支持小的Cache Slot,提供高性能的快照等等。CPU 的强大处理能力通过高的Cache命中率和低的快照开销确保了系统的整体高性能。

  磁盘重建期间依然性能卓著:XIV 存储系统的数据保护机制为独特的分布式数据重建机制,系统中所有磁盘均会参与数据重建。这一架构的结果是数据重建过程的开销最小化,重建期间系统整体性能水准基本保持完整。
IBM XIV系统的高性能来源于 :所有系统资源的均衡使用、创新的Cache 架构 、大规模CPU 并行处理能力。

  3.1.2 前所未有的可靠性

  XIV 存储系统通过其网格架构及独特的RAID-X 保护机制提供了前所未有的系统可靠性。这些特性使得系统几乎不受任何单点故障的影响,并大大降低了双重故障的风险。

  真正的无单点故障

  XIV 系统中的冗于架构保障任何单点故障对主机 I/O 均无影响。所有的磁盘,数据模块,交换机或UPS 均为冗于方式配置,并通过 Active-Active 的 N+1 方式提供保护。每一组件均可热插拔,这意味着整个系统无须停机便可实现更替。

  30分钟重建1TB磁盘驱动器

  XIV 系统的设计目标之一便是要最小化双重磁盘故障风险。利用其创新的RAID-X 设计,每一磁盘均会分成很多小的条带,每一条带又会镜像到不同的磁盘之上。这一架构的优越之处在于当磁盘出现故障时,系统中所有的磁盘均会参与重建。在系统利用率达到近 100%的情形下(充满数据),当一块 1TB 的磁盘驱动器故障时,系统暴露于双重磁盘故障的风险仅为 30 分钟的重建时间。如此短的重建时间极大(成数量级的)的降低了可能因双重故障而带来的数据丢失风险,特别是在同传统存储系统对比时这一优点更加明显。

  仅重建实际数据

  标准的存储系统是在块级完成磁盘重建,无论是否有有效数据完全重建整个磁盘。XIV 存储系统仅重建分配给卷的空间,甚至即使在一个卷的内部也仅重建真正写入的数据部分。因此,单个驱动器故障时的重建时间实际上可能大大小于30分钟,因为并非所有的空间都会分配出去并有数据写入

  模块故障时自恢复

  XIV 存储系统拥有自恢复机制。在数据模块发生故障时,系统会启动重建机制重建冗于状态。 故障的模块可以在系统恢复冗于状态后予以更换,保护系统免受维护人员操作错误的风险。

  3.1.3 多方面可扩展性

  在每一维度上的可扩展性:XIV 存储系统可完全扩展到多机架结构,支持高达PB 级的海量存储。其可扩展性涵盖多个方面,决非仅只止于容量一域。

  系统存储容量可扩展至PB 级别。
  系统Cache缓存容量的大小可随磁盘容量的扩展而线性增长。每一数据模块都包含有自己的Cache 缓存。Cache 带宽,无论是对主机的带宽还是对磁盘的带宽都会随 Cache 的增加而线性增长。因此系统的整体性能水平会随系统规模的增加而线性增加。
  主机接口数量以及主机和数据模块之间的带宽也会随着系统容量的增加成比例增长。这意味着系统能够支持的应用和整体吞吐量也会成比例增长。
  数据模块间有多路千兆网络以全交换的方式互连,因此无论模块数量多少都不会成为瓶颈。这确保系统的吞吐量会随容量的增长而成比例增长。
  处理能力内嵌于每一网格之中,因此诸如快照,数据缓冲,自恢复,性能等不会因系统规模的增大而减弱。
  系统之中没有热点。卷总是条带化的分布到所有的磁盘和数据模块上,同时利用所有的磁盘及Cache资源。

  平滑的可升级性

  XIV 存储系统可以从最小配置扩展到最大的配置。
  数据仍然自动均衡分布到新增及原由旧的模块上。
  标准组件的使用可保证硬件模块的升级能及时使用到最新的技术
  旧的硬件模块可以方便的退出客户使用环境,数据可自动迁移到新的硬件模块上。
  所有硬件的升级操作可在不中断业务的情形下完成。

  XIV 存储系统可以从几十TB 扩展到PB 级。它可以在容量、 Cache 缓存大小、处理能力和内部互连带宽等方面同时扩展。这使得所有系统功能 (快照、缓冲、性能)会随容量的扩展而线性扩充。

  3.1.4 丰富的复制功能

  丰富的存储复制功能集合

  每卷支持多达16,000 份快照。
  卷快照,卷拷贝,从快照恢复卷均为瞬时操作。完成时间小于秒级。
  快照可以更改为可写模,但仍然保持差分(仅占用变化的数据空间)。
  支持所有快照功能,包括差分快照和物理全拷贝。
  支持一致组Consistent Group,多个卷可以在同一时间点完成快照,保障数据一致性。
  部署灵活,可灵活的将快照映射到主机,拷贝快照到卷,复制快照等等。
  支持远程同步数据复制。

  高性能快照:XIV 存储系统将其创新的复制算法和其大规模 CPU 处理能力及 Cache 缓存能力结合,保障快照对性能的影响最小化。

  传统的 copy-on-write 技术为更高效的 redirect-on-write 技术取代。消除了不必要的内部拷贝动作。
  Redirect-on-write 操作总是在同一模块内部完成。磁盘之间的数据拷贝通过高速 PCI-X 总线完成。这相对于传统的在模块或控制器之间的拷贝而言极大的提升了性能。
  快照的写操作开销不依赖于快照的数量和卷的大小。
  对快照和卷的读操作零开销

  XIV 独特的高性能快照及无限数量快照的能力为未来复制功能的应用打开了大门。

  3.1.5 易于管理

  虚拟化降低IT 管理复杂性

  XIV 是全虚拟化的存储系统,客户无须关心逻辑卷如何在物理磁盘上分布。
  物理资源的分配是自动完成的,保障最优的资源利用率。
  新硬件的添加对用户完全透明,客户直接看到可用存储空间的增加。

  强大的管理工具

  GUI。简单直观的图形用户界面帮助所有的管理任务轻松快速的完成。只需要最少的培训和背景知识。
  CLI。系统提供的强大的命令行工具,可通过复杂的脚本完成高层次的系统管理任务并同主机和应用完成集成。

  XIV 的虚拟化及其简化特性,结合其强大的图形用户界面管理能力,极大的减少了管理存储资源所需 的时间和精力。

  3.1.6 能耗和场地节省

  随着信息的爆炸性增长,存储系统的能耗,散热及场地开销在系统整体拥有成本中开始占有越来越大的比重,在很多情形下甚至开始成为系统规划中的制约性因素。XIV 存储系统采用最节能的 SATA 磁盘驱动器及独特的网格结构在不损失性能及可靠性的前提下大大降低的系统在能耗,散热及空间占用等方面的开销。相对于同等级别的光纤存储系统,XIV的能耗只有其三分之一甚至更低。

  180TB裸容量/79TB净容量的能耗仅为7.5KW。
  在两块地砖大小的位置上提供79TB 的可用容量。

  XIV的低能耗和场地空间节省主要来自于以下因素:

  采用了低能耗高密度的 SATA 磁盘驱动器。整体系统的能耗开销取决于其最基本的组件。SATA 驱动器的低能耗及其高密度相对传统的 FC 驱动器而言在对系统的整体能耗方面有数倍甚至数十倍的效率提升。 XIV 的大规模并行架构弥补了SATA驱动器在性能和可靠性方面的不足,因此而使得SATA 驱动器的优势得到了充分发挥。
  提高存储空间的利用效率,降低无效的空间浪费。存储空间的低效率使用实际上同样对应无效的能耗和场地空间的浪费。 XIV 对细供(Thin-Provisioning)及差分快照的支持等大大降低了传统存储架构中的无效空间浪费,而 XIV 的虚拟化存储架构更消除了传统存储架构管理中可能带来的孤儿空间(Orphaned Space)的开销。这同样从整体上降低了能耗和空间的成本。 

  3.2 IBM XIV网格存储系统的绝对优势

  “XIV 网格存储”的诞生无疑是存储历史上的又一次变革!它超越了传统存储不断向上扩展的技术发展方向,以创新方法,开创了平行化向外扩展的新格局和简化管理的新模式。XIV实现了100%虚拟化网格架构、100%均衡负载、100%自动化管理、100%自动恢复/自愈。IBM XIV 为存储技术的发展制定了新标准,重新定义了磁盘存储系统。

  变革性定义一——存储动态响应能力: 100%虚拟化网格架构、接近 100% 自动化管理
  基于网格的全虚拟化是 XIV 的独特设计,这种系统自管理结构,大大简化了海量存储环境下的管理复杂性。物理驱动器位置与数据放置对用户不可见,让系统能以非常好的的方式自动配置用户的卷。突破性的自动化管理,较高提升了业务响应能力,

  变革性定义二——存储高性能: 摒弃系统热点,100% 均衡负载的高性能表现
  IBM XIV 网格存储,通过大规模并行架构、对所有系统组件(包括磁盘、CPU 和交换机)的非常好的利用与独特的缓存算法,提供优化、恒定的超凡性能。

  变革性定义三——告别业务中断,100% 的系统自动恢复/自愈
  可靠性是所有企业存储系统的关键特性。XIV 存储系统通过其网格架构及独特的自恢复自愈保护机制提供了前所未有的系统可靠性。这些特性使得系统几乎不受任何单点故障的影响,并大大降低了双重故障的风险。

  变革性定义四——存储成本观念: 摒弃高端存储=高价格=高复杂性的定式,打造更高效的高端存储
  单层 SATA 解决方案极大降低海量存储环境下整体拥有成本而不带来任何可靠性、性能、功能的损失,极大降低能耗开销。

0
相关文章