存储 频道

各级RAID的比较- RAID 5:使用分布式校验的独立访问

 RAID 5:使用分布式校验的独立访问
 
RAID 5是一个独立访问的R A I D阵列,校验数据被分布在阵列中的所有磁盘。换而言之,即没有一个专有校验磁盘,因而,没有像RAID 4一样的写瓶颈。尽管写操作在读、修改和写周期中仍然引起延迟,但在阵列中不存在像RAID 4 那样的单个驱动器的瓶颈。
 
1. RAID 5的并行性增加
 
当RAID 5阵列的磁盘数量增加时,交叉操作量的潜能也增长,这和RAID 4形成了一个鲜明的对比,因为RAID 4 在校验磁盘上存在写操作瓶颈。实际上,RAID 5 比RAID 4支持更多的磁盘,可以拥有更高的容量和更多的磁盘臂,因而也具有更高的性能。然而,需要注意的是:当磁盘阵列中的磁盘数量增加时,由于在失败磁盘修理好之前,第二块磁盘失败的概率很高,所以数据丢失平均时间(M T D L)更短。
 
同时,性能优势也与数据在成员磁盘上的分布、应用的访问模式密切相关,D E C将R A I D子系统用于几个常见应用的结果表明,所有I / O操作的5 5 %指向阵列中2 0 %的磁盘。
 
2. RAID 5的X O R磁盘
 
在RAID 5中,校验数据的分布能很好地与集成在磁盘驱动器中的X O R技术匹配。由于校验数据分布在阵列中的不同磁盘上,所以,对于数据和校验数据,它们的写操作可能同时发生在完全不同的磁盘上。
 
本章前面讨论了磁盘中的原有数据和新数据是如何进行X O R操作,然后如何由控制器发送到校验磁盘并开始计算新的校验数据值的。假想有一个8个成员的RAID 5阵列,每一个分块更新都涉及读、写及在8个磁盘中的2个上计算校验数据,容易想象得出,同时发生操作的组合数是多少,这些操作分别在各自的磁盘上进行,而不必争用单个磁盘。当然,不能保证不发生竞争。但一般而言,对于一个确定的应用,如事务处理,通过交叉操作使负载得以分散将使性能大大地改善。此外,磁盘X O R校验计算的总线带宽需要占3 3 %~5 0 %,它使RAID 5阵列拥有更好的吞吐量。
 
3.     RAID 5的数据映射
 
RAID 5的数据映射包含校验数据的位置,显示在图6 - 3 1中。由于没有校验数据分布的规范和标准,所以在RAID 5中,各个厂商实现的校验数据分布方案不尽相同。在图6 - 3 1中,第一个分条的校验数据在第一个磁盘上,第二个分条的校验数据在第二个磁盘上,以此类推。由于在阵列中只有5个磁盘,所以第6个分条的校验数据将返回,存放在第一个驱动器。
 
RAID 5是市场上最常见的一种R A I D实现,尽管校验数据在多个磁盘上的分布呈现出一定的复杂性,但由分条数来计算它的位置还是相当简单的。换而言之,虚拟磁盘的数据映射决定了分条,而分块决定了校验数据位置。
 
4. RAID 5的应用
 
一般情况下,对于RAID 5阵列来说,最优应用负载是事务处理负载,这时,多个I / O请求能够在R A I D子系统中交叉执行。然而,对于写操作比例很大的应用,不建议使用RAID 5。回写缓存可以缓解由于大量写传输所引起的许多问题。
0
相关文章