认识物理I/O构件- 存储设备和子系统(2)
1) 可靠性:M T B F和M T T R
即使磁盘技术发展的空间变得越来越小,磁盘的可靠性仍在变得越来越好。磁盘可靠性的指标之一是所谓的平均故障间隔时间(M T B F)值。一般情况下,M T B F值并不表示一个特定设备可能持续运行的时间,而是给出一个设备可能失败的统计近似值。
很明显,假如一个产品开发的时间相对较短,那么就没有办法测试该产品的寿命期望值。例如,假如开发并批量生产某产品仅花1 8个月的时间,而该产品的寿命期望值是6年,要想测试它的寿命则是不可能的,因为到公司测试这个产品6年时间结束时,也许它已经被封存4年了,这就是统计估计必要性的原因所在。
但是,顾客需要一个确定产品可靠性的方法,制造商也需要一种办法与顾客沟通,以达成信任。因此,出现了M T B F的计算。事实上,没有计算M T B F的标准,公司可以自由地选择任何合理的方法来计算。下面三种方法是常用的基本技术:
•在多个设备上运行同样的测试,时间为几个月。除以这段时间内在所有设备上运行的小时数,再除以失败的次数。
•在延长时间内继续运行测试(这段延长时间称作继续可靠性测试),按前面的技术计算出M T B F。
•用在某个时期内出售的设备数乘以那段时间的小时数,取这个乘积,再除以失败的驱动器个数,获得M T B F值。
遗憾的是,这些方法中没有一个是很精确的,因为测试环境并不是真实的(即是实验室环境,而不是办公室环境),或者搜集的数据是不确定的(有多少售出的驱动器正在使用,发生故障返回的有多少)。
平均修复时间(M T T R)也是一个可靠性的计算方法,公司用它来表示他们产品的模块性,也表示这些模块的更换快慢。对于某些设备,M T T R数不再有意义,因为更换一个设备比修复一个设备更划算。而在如R A I D这样的设备中,由于使用冗余设备,某个单个驱动器的损坏并不影响对数据的访问,因而,M T T R数的意义也显得不大。
0
相关文章