存储 频道

征文专稿:4小时AIX起死回生记

找寻原因,文件系统故障
    在IBM碰了钉子后,我决定自己想办法解决这个问题。

    首先只能重启这台小型机。这里要特别提醒大家:如果大家的服务器出现故障,而且还在厂家的服务期之内,最好不要重启机器,这样可能会丢失一些信息,把故障原因隐藏起来。

    重启之后,液晶显示屏显示很多数字信息,都是正常启动信息。最后,机器显示“0555”,检查文件系统错误,然后就停在这里不动了。呵呵,估计文件系统损坏就是这台机器不能正常启动的原因了。怀疑之前有人非法操作,破坏了文件系统。一般来说,非法关机或者强行杀掉文件系统进程最容易产生这样的错误。

    虽然我不熟悉AIX,但根据我对Solaris和Linux的经验,决定先采用光盘引导。插入AIX5.2的引导盘,机器还真引导起来了,只是引导起来的机器无法使用。任何和硬盘打交道的操作都不能使用,比如touch,makdir这些命令全部无效,只能使用ls,date这些与硬件无关的命令,这样可不能算是可用的机器啊。

    察看启动日志和系统错误日志也都没有任何特别的提示。看来日志也不能帮我了。接着使用系统的自带的fsck修复文件系统,结果却提示我无法找到系统分区表,使用AIX自带的SMIT工具想查找问题原因,结果smit也无法启动,返回的错误代码显示无法在tmp分区下创建文件,看来在系统里面想要恢复是不太容易了。这时候时间已经过去2个多小时,要是不能尽快解决问题,就会影响公司方案开发进度。

    现在剩下的道路就是重装操作系统,因为文件系统是建立在操作系统之上的,重装操作系统自然会重配文件系统,那么这个问题就迎刃而解了。但是重装操作系统过于耗时,况且系统里面还有我们很多数据呢,相信天无绝人之路,于是开始上网苦搜信息。

0
相关文章