如何选择方案
我们的企业生产数据管理系统采用集中+分布的体系架构,服务器涉及几十台Windows服务器和十几台Sun Solaris数据库服务器,存储采用SAN架构方式,网络使用企业内部网,其应用主要是专用的应用软件,运行在Windows平台上,后台数据管理是Oracle数据库。应急恢复与生产数据备份的目标是实现应用系统的7×24小时稳定运行、生产数据在任何情况下都不能丢失,系统出现故障时能够以本地和远程异地两种方式快速恢复。根据服务器上运行的软件,我们分为以下两种情况进行讨论。
1. 应用服务器的应急恢复
应用服务器要实现7×24小时稳定运行,当应用服务器(包括操作系统和应用环境)受病毒攻击或其他因素干扰而无法运行或出现主机瘫痪等灾难时,能够在本地和远程异地启动应急服务器系统接管灾难服务器。经过充分的调研,我们发现,“网络盘存储镜像”是目前市场上比较先进的应急和备份技术,能够有效地满足其系统应用服务器应急恢复的要求。其工作原理是在主应用服务器和应急应用服务器的存储盘之间通过网络进行实时增量镜像复制,并进行多版本快照保存,但当某个油田应用服务器发生灾难时,通过网络恢复在本地或异地的应急服务器上保存的某个版本的镜像备份,实现本地或远程应用服务器的接管。由于“网络盘存储镜像”通常都保存多版本快照,因此,可以有效地防止病毒。
2. 数据库服务器的备份与恢复
对数据库服务器的备份与恢复,目前市场上的商业产品通常有两种技术实现方式:一种方式是使用数据库准同步技术,在逻辑层实现生产数据库和备份数据库之间的准同步而达到备份的目的;另一种方式是通过网络盘存储镜像技术,在生产数据库和备份数据库之间实现物理层的复制与恢复。当本地生产数据服务器发生故障时,由本地或总部异地的数据库备份系统替代原主服务器快速恢复生产数据应用。对于这两种方式,我们进行了实际测试和性能对比,以及用户的可操作和维护性,最终我们选择使用数据库准同步技术实现数据库服务器的备份与恢复。