存储 频道

征文:四大要点管理维护双机热备系统

IBM HACMP双机热备方案说明

    HACMP 是 High Availability Cluster Multi-Processing 的缩写。HACMP 是 IBM 公司在 P 系列 AIX 操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。HACMP是利用网络来侦测主机及网卡的状况,搭配AIX所提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络任何一个环节发生故障时,都可自动切换到另一套备用元件上重新工作;若是主机故障还切换至备份机上继续应用系统的运行。

图1


 
图2

    如上图,两台主机A和B分别都安装AIX 5.2系统,HACMP软件和Oracle 9i数据库,数据和应用系统安装在7133磁盘阵列上。作为双机系统的两台服务器A和B同时运行 HACMP 软件,一台P630作为主机A运行oracle 9i和应用系统,另一台P630作为备份机B处于备份状态(此时没有运行数据库和应用系统)。

    在整个运行过程中,通过 串口的SCSI“心跳线”相互监测对方的运行情况 (包括系统的软硬件运行、网络通讯和应用运行情况等)一旦发现对方主机A运行不正常时,备份机B就会立即在自己的机器上启动应用,把主机A的应用及其资源(包括用到的IP地址和磁盘空间等)接管过来,使主机A上的应用在备份机B继续运行。

    主机和备份机的确定取决于哪台机器先启动了HACMP服务,先启动的就是主机,另外一台就是备份机。应用和资源的接管过程由 HACMP 软件自动完成,无需人工干预;当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机 (备份机)上运行。

    双机系统的维护与管理更为复杂一点,在双机热备系统的维护与管理中,个人认为以下四大环节是必须注意的:

0
相关文章