【IT168 评论】自从David Patterson、Garth Gibson和Randy Katz在20多年前第一次提出数字存储可靠性和性能概念的时候,RAID技术就已经存在了,而且它还将再发展数十年的时间。这项技术最大的问题是如何跟上每年以大约40%的速度递增的磁盘增长速度。
Panasas Inc.的首席技术官、联合创始人Gibson在企业存储论坛上表示:"这个问题的核心在于读取整块硬盘所花的时间越来越长,每年大约会比上一年增加20%。磁盘数据读取速度的增长速度比磁盘容量增长速度要慢得多,因此每年读取比上一年容量更大的磁盘时所花的时间就会更多。"
Permabit Technology的创始人、首席执行官Jered Floyd声称,RAID厂商和大多数存储厂商并不打算解决高容量磁盘的故障率问题。
Floyd说:"使用任何低于RAID 6的大容量磁盘几乎肯定会出现数据丢失的问题,如果因为误码率问题而导致磁盘故障,那么甚至连RAID 6也会出现数据丢失问题。"
Floyd说,厂商们必须采用更高级的消除编码技术,才能超越RAID 6。他特别推荐那种能够保护磁盘不出现故障以及在更大系统中利用数据分布来解决单一整套磁盘重装难题的解决方案。
Gibson指出,由于磁盘容量变大了,RAID系统就要花更长的时间来恢复出现故障的磁盘。传统的RAID系统需要从头到尾读取所有的剩余磁盘,然后再从头到尾将丢失的数据都写到网络备份磁盘。
因此RAID系统就需要花更长的时间来恢复整盘保护,这样出现其他故障的概率就会上升,数据丢失的概率也就随之上升了。
更智能的RAID控制器
然而,某些业内权威人士提出,磁盘密度以每年增长一倍的速度递增,因此而引发的不可靠性正是许多问题出现的原因,而且磁盘重装过程中出现两个故障的概率也大幅上升。
Nexsan Technologies的首席技术官Gary Watson表示,许多故障信息与实际的技术进步是背道而驰的。
Watson说:"首先,磁盘性能在不断持续提高,虽然它没有跟上磁盘容量的增长速度,但是两者之间的差距也并不是特别大。"
他说,RAID控制器正在从共享网络如FC-AL和SCSI等转向更现代化的网管结构如SAS。
Watson补充说:"另外,重装计算的硬件级支持意味着一代一代的RAID控制器的重装性能将完全紧跟磁盘容量增长的速度。"
LSI的DAS RAID架构与战略规划总监Luca Bert说,RAID控制器的部分问题是,大多数硬盘的利用率都是不足的,但是控制器并不知道系统现在正在使用什么和没有使用什么。
Bert说:"更好地了解这方面的信息就可以让系统只重装使用过的区域。"
Luca说:"其中一种解决方案是使用自动精简配置,这种技术可以让系统只在它需要的受限数据集上工作,因此如果控制器知道那个数据集被提供的话,它就可以只重装那一部分。"
Luca提到的另一个解决方案是当某个区停止使用的时候,让每一个文件系统告诉RAID控制器,这样系统就不用重装那个区。
Luca说,IT人员可以利用RAID level 1或者10(而不是level 5或者6)将重装的时间和传输的数据量降到最低水平。
Luca还指出,如果使用了高级数据布局算法,那么一个阵列就可以被分配到更多的设备,从而将需要重装的组件数量降到最低。