存储 频道

企业采购硬盘 需考虑哪些事项

  【IT168 技术】企业IT部门在进行采购硬盘研究的时候,必然会考虑硬盘其本身的品质,其中最重要的一点则是硬盘的耐用性。而传统的机械硬盘的内置马达让其故障率居高不下,而SSD的耐用性如何呢?

  固态硬盘耐用性是指经受长期重复数据写入的能力。固态硬盘的耐用性是有限的,因为NAND闪存的耐用性是有限。NAND闪存耐用性用写入/擦除次数(P/E cycle)来衡量。一个写入/擦除周期是指写入数据到闪存然后在写入新的数据前擦除。

  面向企业级的固态硬盘需要多少的耐用性呢?据Seagate/EMC与Microsoft的统计数据表明,每天写入数据量< 50GB, 或者说数据更新率<0.5/天(那时候的硬盘容量差不多是100GB左右)。

  实际使用数据 vs 固态硬盘的耐用性

  根据实际的应用需求来选择合适的耐用性级别,从而达到降低成本的目的。研究数据表明,2PB的耐用性就能很好满足企业IT的需要。

  NAND 闪存存储单元是一个可以存储电荷的浮栅场效应管,编程(写)操作将电子聚集到浮栅,擦除操作则将电子拉离浮栅。一个写入/擦除(p/e)周期就是 电子束 的一次 往返移动,电子通过量子遂穿效应穿过隧道氧化层,耐用性之所以有限正是因为电子的往返移动会逐渐对隧道氧化层造成损伤。

  耐用性限制的基本表现形式

  坏块

  擦除操作的耗时会随着擦写次数的增加而变长, 从而导致擦除失效和坏块的替换

  失效区块数超过固态硬盘备用区块数的临界点就是最基本的耐用性限制

  写数据差错

  原始比特差错率(RBER)随着擦写次数增加而逐渐增加

  RBER vs. UBER (无法校正的比特差错率)

  UBER达到规定上限的临界点时,则构成了另外一个耐用性限制

  数据维持能力

  一定数目的P/E周期后,RBER一定会随着时间推移而增加

  ECC能校正比特跳变差错, 但校正能力是有限的

  选择一个合适的数据维持时间以及UBER,从而以此来确定一个安全的可擦写次数,这就是另外一个耐用性限制

  缺陷

  所有的集成电路都有缺陷,大多数NAND闪存的缺陷诱发的失效都是由P/E操作造成, 因为P/E过程中的高电压容易造成缺陷短路。

  缺陷造成的失效率达到可接受的临界点是另一个耐用性限制

  所有的NAND闪存都有损耗极限,耐用性挑战就是把这个极限往右移直至超过期望的寿命期。另外,使用过程中由于写操作缺陷导致随机故障的产生,耐用性挑战就是把这类故障率尽可能降低.当上述可能得以实现的时候,固态硬盘对企业级应用的承诺就能很好的实现了。

  假设主机要重写新的数据到到一个区块(block)中,但NAND闪存不能直接覆盖数据,而是需要把数据写到一个擦除过的区块(block)中然后擦除原来的区块(block),结果: 主机要求写2个页(page)数据但物理上写了64个页,这就是所说的写入放大,这里为32。固态硬盘的耐用性是NAND耐用性除以写入放大因子(WAF),因此低的WAF至关重要。

  写入负载同样也会影响耐用性,写入负载影响写入放大因子(WAF)因而影响耐用性,写入的数据越大,其放大因子越低,使得固态硬盘的耐用性越高。而增加随机写数据块的大小也会减小WAF从而提高耐用性。类似,增加数据的随机性会增加WAF从而降低耐用性;增加随机数据的LBA覆盖范围 ,会降低脏数据整 理(garbage collection)的效率 ,从而增加WAF,降低耐用性。优化负载,使WAF最小化,是提高固态硬盘耐用性最根本的方法。

  厂商耐用性指标

  耐用性指标对消费级和企业级有不同的需求规范。使用条件包括两个方面: 具体的I/O工作负载和温度。耐用性限制包括了所有我们所讨论的:

  数据保持时间

  功能故障率需求(缺陷&短路)

  无法校正的比特差错率 (写入比特差错)

  耐用性验证测试(EVT): 基本方法

  EVT是一种加速性的、全寿命期测试,而传统机械硬盘的可靠性测试(RDT)则不是。对于高耐用性固态硬盘的耐用性则可以使用推断法来进行评估。

  当我们了解了SSD固态硬盘的工作原理和测试方法之后,那么我们该如何选择固态硬盘呢?首先,我们要明白,耐用性越高,那么所花费的成本就越高,价格也就越昂贵。消费者必须清晰地了解自己的需求,到底需要多少耐用性?尽管大量的调研数据表明,英特尔目前生产的固态硬盘完全能够满足每天50GB的写入量,但是一种称之为“耐用性恐惧症”的心理期望却迫使客户期望10,000-100,000PE的耐用性能力。

0
相关文章