RAID的掘墓人:Erasure code
Erasure code是设计用来将数据分割成不可识别的数据块,使用额外的信息追加到每个数据块中,允许从一些数据块的子集就可以复原完整的数据集,数据块可以分布在一个数据中心、城市、地区或全球任何地方的不同存储位置。
Erasure code有内置的数据安全性,因为每个独立的数据块不包含足以泄露原始数据集的信息,要完全挽回完整的数据集,需要用到不同存储节点上的大量数据块子集,究竟需要多少数据块取决于当初加入到每个数据块的额外信息决定的,额外信息越多意味着恢复整个数据集需要的数据块越少。
Erasure code在面对自然灾难或技术故障时具有很好的恢复能力,因为只需要数据块的一个子集就可以恢复原始数据,实际上,使用Erasure code时,允许同时发生多种故障,包括托管设备,服务器,存储元件,HDD或网络,数据始终保持是可访问的。
也称为前向纠错(FEC),Erasure code存储与RAID完全不同,它消除了所有RAID问题,它是一种全新的技术,截至目前只有三个厂家提供了基于Erasure code的产品:Cleversafe的dsNet,EMC的Atmos和NEC的HYDRAstor。
Erasure code更适合用于大数据集,特别适合云计算和分布式存储,因为它不用复制数据集就可以跨多个地理位置分布数据。
RAID的进化
传统的RAID问题都是众所周知的了,随着硬盘容量的增长,这些问题越来越严重,本文列举的很多RAID替代产品都解决了部分RAID问题,而革命性的新技术只有一种。就当前的情况而言,选择符合自身环境和应用需要的RAID比较现实,但不要停留在理论层面上进行选择,而是要进行测试和试点,在我们承担传统RAID面临的风险时,期待更多革命性的产品出现吧!