存储 频道

存储分析:RAID技术走向何方?

  放弃RAID技术:Erasure codes分布式数据存储技术

  Erasure codes的设计是将数据分割成多个等长的不能直接读取的数据块,并且在每个数据块上附加元数据信息。一份完整的数据通过全部数据块中的部分子集就可以复原,也就是说只要有部分数据块存在,数据就不会丢失。这些数据块可以分布在不同的存储位置,可以是一个数据中心内部,可以跨越城市、跨越一个地区,或者在世界上任何其他地方。

  Erasure codes天生具有数据安全性机制,因为每个独立数据块所包含的信息量都不足以揭示原始数据集的全貌。必须有足够数量的数据块集合(可能来自于不同的存储节点)才能恢复完整的数据,这个数量由附加在每个数据块上的元数据信息量决定。附加的元数据信息越多,意味着恢复时需要的数据块就越少。

  Erasure codes在面对自然灾难以及技术错误时具有很强的生存适应能力,因为只要有部分数据块存在,就能复原完整的原始数据。实际上,如果使用Erasure codes技术保护数据,即使客户端、服务器、存储单元,磁盘驱动器或者网络这一些列环节中同时发生多个故障,我们仍然可以实时访问数据。

  Erasure codes也被叫做正向纠错(FEC,forward error correction),与RAID的存储机制完全不同。Erasure codes可以消除上文中我们提到过的所有RAID的不足。这是一项新技术,到目前为止,只有三个厂商推出了基于Erasure codes技术的产品:Cleversafe公司的dsNet;EMC公司的ATMOS;以及NEC公司的Hydrastor。

  Erasure codes似乎更适合大规模数据存储环境,而不是小规模存储。它特别适合于云存储或者分布式存储,因为它根本不需要数据复制,并可以在广域的多个地理位置分散存储数据。

  RAID技术的演变

  众所周知传统的RAID技术存在很多的问题,而且随着磁盘容量的不断提高,这些问题带来的负面影响越来越大。我们在这里介绍的诸多RAID替代技术可以解决其中的一部分问题,而更多新的解决方案还在开发过程中。对于这些非传统的技术,我们需要找一个合适的、特殊的环境进行研究、测试和试用,还要有耐心 ,要敢于承担风险。

0
相关文章