存储 频道

简单叙述RAID重建

  【IT168 技术】RAID重建有很多值得学习的地方,这里我们主要介绍RAID重建,包括介绍RAID重建故障等方面。Panasas公司是一家致力于高性能集群存储解决方案的开发商。去年秋天,该公司发布了新的"分层校验"架构。该公司和一些分析师认为这款产品将极大地提高数据可靠性。

  除了为那些有大型数据存储需求的企业提供更为可靠的解决方案外,分层校验可能还将预示着基于"传统"(或者说单向奇偶校验RAID)、甚至是基于RAID 6(也即双重校验RAID)的解决方案的终结。

  传统RAID和新的RAID

  计算机研究专家,Panasas公司的合伙创始人兼首席技术官Garth Gibson从八十年代晚期就引领着RAID技术的研究。他认为,分层校验代表着旧的、非Panasas类型的RAID将过时。这是因为最初的RAID技术主要是为了解决整体磁盘数据丢失的情况,而非一个或多个磁盘上的介质故障(也被叫做不可恢复读错误或介质错误)。(具体可见"Gibson探讨如何从存储错误中学习教训")。

  Gibson解释道,"RAID的策略是将数据放在多个故障区域的条带内,并利用故障区域之间廉价的错误纠正码来恢复由于普通的存储故障所导致的数据丢失,特别是整体磁盘的灾难性数据丢失。

  "在那个时候,一个故障区域就是一个物理磁盘,而我们每次是将一个数据逻辑地分布在固定数目的磁盘上。从那以后,我们认识到简单地将存储中所有同一类型文件的数据一次性分布在固定数目的磁盘上虽然是正确的,但是过于专门化了。"

  旧的RAID同时也未能解决介质故障的问题,而后者发生的机率是和磁盘密度的增长同步增加的。现在的磁盘密度已经是20年前的250倍,而RAID的出现也是在20年前,对于那些依赖高性能计算、存储安全和TB级数据恢复的企业以及机构来说,这种情况是个大问题。根据Panasas的研究,介质故障发生的概率大约是磁盘故障发生概率的30倍,而一个介质故障就能导致RAID重建失败。Gibson说,即使是像RAID 6这样的强大的解决方案也不能应付这种问题。

  "RAID 6是能够很好的解决其中一些问题,但是它也使校验码的数量增加一倍,如果你要对特定类型的工作负荷进行小更新,你的工作量也被增加一倍了",他说,"而且 RAID 6也不像你所希望的那样强大,实际上,如果有两个故障磁盘,你还是得处理这些介质故障,因为RAID 6实际上所作的就是处理一个磁盘故障和一个介质故障"。

  换句话说,RAID 6只是处理故障的症状,而不是根本原因--而且还要承担昂贵的费用并损失很多性能。另一方面,Gibson说,分层校验"是一整套解决方案.......提高了对介质故障和隐性硬件故障的抵御能力,减少了商业的商品阵列所可能进行的冗长重建的次数。"

  那么也就是说这位RAID之父已经放弃了RAID了吗?既是也不是。Gibson说,分层校验可以利用RAID(特别是Panasas的对象 RAID),它实际上是一种"全新和改善了的RAID",是一个成熟的RAID。分层校验能够满足如今的企业和机构对大型存储可靠性的需求。

  什么是"分层校验"?

  分层存储包括三个独立的层面,或者说解决方案--水平奇偶校验,垂直奇偶校验和网络奇偶校验--能够在磁盘故障发生前就检测到并纠正问题。水平奇偶校验使用Panasas的基于对象的RAID技术,对整个存储阵列提供磁盘故障保护。它同时也提供可扩展的RAID恢复,并行重建以及每个文件的故障隔离。

  垂直奇偶校验,这是来自Panasas公司的一项新技术,也被看作是单个驱动器中的RAID。它在出现可能影响RAID重建故障之前探测和修复磁盘的介质错误,这项新技术修复了导致RAID重建操作失败的根源。网络奇偶校验,这种校验方法提供了业界第一个具有保持端到端数据完整性能力的校验方法,检测来自企业或机构存储系统外部的错误。

  销售分层校验的产品名称是Panasas ActiveScale。根据Panasas的说法,当联合使用时(虽然分层校验是捆绑式销售,但是用户可以根据自己的需要关闭或激活各个分层),分层校验能够提供相当于传统RAID 5 1000倍的保护能力--而且不损害主要性能。

0
相关文章