存储 频道

IBM DS4000数据恢复实战记录

  【IT168 应用】

  客户名称:某电气(中国)投资有限公司

  设备名称:IBM DS4000 磁盘阵列柜(6块300G光纤硬盘)

  操作系统:IBM AIX系统

  故障现象:应用系统瘫痪,RAID管理软件中显示RAID信息错误

  恢复方案:

  方案一:

  1、6块盘全盘镜像

  2、确定磁盘阵列级别,顺序,块大小,是否有不新鲜的盘。

  3、确定每个Lun的大小和起始位置。

  4、重新配置RAID5并划分Lun。

  5、如果配置后数据丢失,再从镜像文件对应写回原盘。

  方案二:

  修复RAID信息

  恢复过程:

  1、为了保证数据的绝对安全,我们对6块硬盘全盘镜像,用时17小时。

  2、分析硬盘数据及RAID信息,确定原阵列容量为1394.4G,为五个硬盘容量之和,结论:原配置为6块盘的RAID5,根据6块盘的冗余数据分布情况可知,ID顺序与实际顺序一致,左同步,块大小为128K,没有提前掉线的盘即盘全都是新鲜的,为IBM工程师重新配置RAID提供准确参数。

  3、如何正确划分Lun是分析的难点,也是数据恢复成败的关键。根据我们对AIX底层的了解,每个Lun的起始位置应该在1号盘(9号槽的盘),所以重点分析1号盘,由于每个Lun的标志为“_LVM”,再根据客户提供的参考信息,分析结果如下:

  4、有了上面2、3的分析结果,我们可以正确配置RAID,并准确划分Len,虽然IBM工程师已经修改了DS4000的读写允可标志,配置时不会对硬盘数据区域进行写操作,但系统级的恢复难度较大,比如重新配置卷组,加载文件系统等。如果我们能修复RAID信息,有可能把盘插回原位后,盘会自动上线。因此我们试着分析RAID信息,由于Lun的划分是从0扇开始的,RAID信息一定存储在盘的后面区域,我们对每个盘最后500M数据进行了分析,发现阵列柜为每块硬盘在最后留出500M用于保存RAID信息,对比分析六个盘的RAID信息,发现4号盘(12号槽的盘)的RAID信息与众不同,我们尝试性将其修改。

  5、大家怀着不安的心情,把盘按原位插回,希望能自动上线,当把盘全部插回后,管理软件报告RAID全部自动上线,并且各个Lun的大小和前面分析的完全一样,虽然还没看到数据,但大家都兴奋无比。最后进行了一个卷组下线和再上线的操作,看到数据了,大家悬着的心终于放下了。

  6、客户验证数据,数据恢复成功。

0
相关文章