【IT168 专稿】众所周知,Google为了应付搜索引擎业务增长带来庞大的访问量压力,拥有一个高效的结构独特的信息基础架构,在整个Google信息基础架构中,磁盘当然是重要且不可缺少的一部分。这些磁盘的工作状态如何直接影响了整个系统在庞大的访问量压力下的服务性能。为此,Google收集了10万块磁盘在实际系统环境下的工作信息,并且对磁盘工作状态做了如下总结,其中很多观点似乎与我们的想象以及厂商的宣传有一些出入。
Google的使用报告认为,PATA和SATA磁盘驱动器是相同的驱动器,没有什么区别。更讽刺的是,Google认为采用廉价的磁盘存储数据,要比企业级用户使用的那些高成本的、具有相对较高的MTBF(平均无故障时间)的FC和SCSI磁盘更安全。
Google得出的让人惊讶的调查结果主要来自于以下5个方面:
• 制造商给出的MTBF规格的有效性
• 通过SMART统计出的有效率
• 工作量对磁盘寿命的影响
• 使用年限对磁盘故障的影响
• 温度对磁盘故障的影响
供应商的MTBF和磁盘AFR(平均故障率)
MTBF(平均无故障时间)是一个统计学的测量方法。当供应商承诺其产品的MTBF为300,000小时,对于一般使用PATA和SATA磁盘驱动器的用户,当他们使用大量的磁盘驱动器时,将有一半在第一个300,000小时的运转中出现故障。因此,MTBF并不能验证单个特别的磁盘驱动器来的可靠性。
非常理想的情况下,如果你有600,000块磁盘,MTBF规格是300,000小时,你的预期将是每小时坏一块磁盘驱动器。一年下来就将有8,760块磁盘损坏或者维持一个1.46%的AFR。Google的情况是这样吗?肯定不是。
在这张图上,我们看到在某一段时间,显示的AFR结果还有一些可以讨论的地方,磁盘也没有详细的划分故障细节,所以下面我们将从其他方面加以说明。