存储 频道

征文:四大要点管理维护双机热备系统

    【IT168 专稿】本人在省信息中心负责电子政务技术支持与运行管理,为了保证政务外网WEB系统、公务员考试网上申报、在线访谈等一些关键业务的稳定运行,我们采用了多台双机热备系统。

    理解双机热备,必须要认清这样几点:

    1. 对于一台服务器而言,坏的可能总是存在的。故障的原因多种多样,包括硬件、软件、人为故障等,任何一个环节都有可能发生。
    2. 服务中断不仅可能发生在管理员在的时候,也可能发生在机房空无一人的时候,而一台跑着应用系统的数据库服务器,并不是很容易就能恢复的。
    3. 数据备份当然是重要的数据保护措施,但只是事后的解决方法,无法预防应用停止。
    4. RAID只能解决硬盘的问题,解决不了服务器的问题。

    当然如果系统中没重要应用,我们没必要考虑双机热备。或者我们可以容忍应用系统停止运行一天,双机系统也并非十分重要。但是,如果应用停上一个小时就会带来严重的问题,那么就无疑应该考虑一下双机系统,而如果业务系统停上十分钟都难以承受,这时候双机热备方案就是必须的了。

    双机系统实际上是服务器应用的冗余备份,但是因为通常采用外置磁盘阵列存储数据,因而企业可以更方便集中的对数据进行管理和备份,从而进一步提高整个系统的效率和可用性。当一台服务器上的应用发生故障时,系统可以方便无缝的切换到另外一台服务器,承担起原有该服务器所承担的大部分应用,从而保证业务的不停顿运行。最重要的是,整个切换过程是自动进行的,前端几乎很难察觉到后台的服务器系统的故障。

    双机热备系统本身已经是较为稳定的系统,这表现在双机热备系统已经具备了一定的抗风险能力,但是双机热备系统也意味着更复杂的管理、维护和升级工作。因此,在这里,我们通过两台IBM P630小型机和7133磁盘阵列实现双机热备为例,来说明通过HACMP 5.1来实现AIX 5.2的Oracle 9i数据库主从热备系统的运行维护和升级管理工作。

0
相关文章