存储 频道

征文:四大要点管理维护双机热备系统

四、保护磁盘阵列的数据安全

    企业运行的重要数据平时都保存在磁盘阵列上,因此对磁盘阵列的日常运行维护就显得十分重要。需要做以下及几个方面的工作:

    及时检查运行日志文件 

    磁盘阵列的日志文件详细记录了磁盘阵列内部运行情况,包括发生的每个事件序列号、严重级别、相关的服务器IP地址、有关设备的具体位置及事件发生的时间等内容,这些信息对于诊断和排除磁盘阵列故障十分有用。做好日志文件的日常管理工作,往往能起到防患与未然的作用。

    采用RAID数据冗余技术,即使有一个物理磁盘损坏,也不会影响系统正常运行和数据的I/O,用户也仍能够正常访问服务器,这时故障不易被察觉,但阵列实际上已处于安全临界状态,下一步就会面临着突然宕机和存储数据随时丢失的危险,日志文件及时将这一情况记录在册,损坏的磁盘记录为下线(off line),其所在阵列记录为临界状态(critical),通过检查日志就能够及时发现阵列运行中存在的这个错误和隐患,迅速排除故障,保证阵列始终处于安全运行状态。

    定期检查数据一致性

    数据冗余是磁盘阵列主要技术之一,磁盘阵列通过数据冗余达到容错目的,但是由于各种原因,难免会遇到冗余数据与主数据块(Primary Data)不一致的情况,结果造成数据失效甚至宕机等现象。一致性检查能及时发现和纠正潜在的错误数据,保证阵列中数据的完整性。通过对RAID互为镜像的磁盘数据一致性检查,或者主数据块进行重新校验,将产生的校验数据与冗余数据比较,都能发现不一致的错误数据。一致性检查一般间隔时间以每周1~2次为宜。

    建立热备用磁盘

    热备用磁盘也是RAID技术的又一项技术,当磁盘阵列中一个正在使用的物理磁盘发生故障后,一个待机的磁盘会立刻上线,代替此故障盘,阵列控制器根据逻辑驱动器上的冗余数据,通过校验算法把原来存储在故障盘上的数据重建到热备用磁盘上。

    成为热备用磁盘必须有三个条件:一是有不小于故障盘的容量;二是平时不得存储任何数据,也就是闲置不用;三是阵列控制器自动重建数据功能有效。在一个阵列中,只能有一个热备用磁盘。热备用磁盘增加了一次数据逃生的机会,系统管理员要及时更换发生故障的磁盘,并指定新的热备用磁盘。

    定时备份重要数据

    配备了磁盘阵列并不意味着可以高枕无忧了,对于重要业务数据一定要备份。数据备份的介质可以是磁带、可读写光盘,也可以还是磁盘。备份方式可以是通过操作系统本地备份或通过网络系统远程备份,目前可以采用DAS、NAS或SAN方式来进行数据备份。

    在本方案中,对于7133磁盘阵列运行维护时,主要是通过它前面面板本身自带的指示灯来判断有无异常情况,也可以通过AIX的如diag、errpt和smit ssaraid等命令来运行和管理磁盘阵列。

0
相关文章