【IT168 技术】RAID经过长时间的发展,很多用户应该都见过RAID数据灾难了,这里我发表一下个人理解,和大家讨论讨论。对于IT管理员而言,遭遇RAID数据灾难总是最为头痛的,因为相关恢复技术涉及到的知识面太广,普通管理员甚至服务器厂商的工程师都无法解决。既然RAID数据灾难不应当由管理员来进行处理,那么管理员在此时又应该如何处理呢?我们采访了的资深数据恢复工程师,他将告诉您如何才能确保较高的恢复成功率。
不要强行上线:危险的操作方法
在服务器的某一个硬盘出现故障时,一般服务器都会有一个Offline指示灯提示,此时要求用户更换一个完好的相同硬盘,并且重新校验算法。按理说这是非常正常的操作过程,但是殊不知很多RAID灾难就是由此而引起的。
以一个硬盘数量比较多的RAID5磁盘阵列为例,很可能同时采购的多个硬盘中,有几个已经出现了不稳定现象。而服务器的Offline提示可能并不是最准确的,经常会误报(也有硬盘不稳定的因素)或是遗漏其它也同样存在隐患的硬盘。在看似平常的强制上线过程中,硬盘需要进行大量的读写操作,此时就是一场严峻的考验:运气好的话自然平稳度过,而运气不好就会导致其它硬盘突然掉线,此时就令问题更加棘手了。
当然,出现一个硬盘掉线提示,或是在RAID容错范围以内的掉线提示,强制上线还是必须执行的操作。但是在进行这一步前,强烈建议大家检测一下每一个硬盘的稳定性情况,这样才更加保险。大家可不要忽视这样一个小细节,往往这一步能够让RAID服务器没免于瘫痪。
保护第一现场:什么都不做才最安全
对于厂商而言,所有的质保承诺仅仅局限于硬件设备,也就是说磁盘阵列故障后所引发的数据危机与之毫无关系,负责为用户更换或者维修已经算是“克尽职守”。但是用户所需要的并不是找回硬盘或是重建RAID,而是更价值不菲的数据。如果寻找整机厂商,此时无异于“自讨苦吃”,因为所谓的售后服务根本没有从用户的本源需求出发,尽快确保硬件设备完好反而牺牲了数据。当然,知名品牌的服务器厂商或是代理商会主动选择为大客户的RAID数据恢复服务费“埋单”,但是这也仅仅是个别情况。
据数据恢复中心的主管工程师介绍,因为寻找服务商的售后服务工程师修复而导致最终数据彻底破坏的案例几乎每个星期都会发生。毕竟售后服务工程师基本都偏向于硬件,而RAID数据恢复则是以软件类操作为主。
此外,即便是简单的检验性操作,也有可能为后期的数据恢复带来不便。以普通RAID5恢复为例,当硬盘损坏超过容错能力时,必须将损坏硬盘的镜像完全提取才能进行最终的恢复。而如果频繁对硬盘上电,很容易造成磁头进一步疲劳损伤,甚至划伤盘片。正确的处理方法应当是立即咨询专业数据恢复服务商。
选择专业数据恢复服务商:切莫迷失方向
根据数据恢复中心的统计,很多数据恢复失败的案例都是因为用户寻求了并不正确的解决途径。服务器用户所依靠的售后服务也往往不够专业,RAID 磁盘列阵出现问题之后轻易选择重建,数据丢失情况更是雪上加霜。在选择数据恢复服务商时,根据规模以及业界口碑来判断是一条可行的捷径。而在这一方面,服务网点遍及全国的数据恢复中心有着深厚的积累,能够帮助广大遭遇RAID数据灾难的用户及时度过难关。