容灾三要素和具体实施细节
真正的容灾系统必须满足三个要素:首先是系统中的部件、数据都具有冗余性,即一个系统发生故障,另一个系统能够保持数据传送的顺畅;其次,具有长距离性, 因为灾害总是在一定范围内发生,因而充分的长距离才能够保证数据不会被一个灾害全部破坏;第三,容灾系统要追求快速的数据恢复,也称为容灾的“3R” (Redundance、Remote、Replication)。
容灾作为一种新的概念,目前已经被国内大多数行业所接受,特别是在金融、电信等信息密集型企业,实施容灾级别的数据保护工作已经被提上了日程。但是,容灾 的实现仍然面临着多方面的难题。其中,除了投入过高这一普遍因素外,对容灾如何确切理解、在具体实施过程中存在的技术问题等,都成为企业建立容灾系统的障 碍。
实现容灾功能包括两个环节:远程数据复制、远程动态监测和应用切换。远程数据复制的实现方法有三种:利用数据库厂家的软件产品完成远程复制,利用主机 进行远程数据镜像,和利用存储设备厂家的软件产品完成远程复制。前两种方法的存储镜像是通过主机完成的,将极大地影响主机性能。第三种方法,利用存储设备 厂家提供的智能磁盘控制技术,可以实现主数据中心和备份中心的操作系统、文件系统、数据库的实时拷贝维护。
由于利用存储设备厂家的软件产品完成远程复制, 主、备中心磁盘阵列是通过阵列上的微处理器完成数据实时同步功能,不占用主机CPU、内存和I/O资源,所以几乎不影响主机性能。在容灾系统的数据复制环 节,海阔也推荐采用这种基于存储设备的数据复制方法。
目前,能够提供基于存储设备的数据复制的产品有:EMC公司的Symmetrix的SRDF;EMC公司的CLARiiON的MirrorView和IBM公司的ESS和PPRC等。
为实现故障情况下的切换功能,数据复制的同时,还需要类似主机集群的软件,对应用进行动态监测。主、备中心的应用主机均要安装这种远程动态监测软件,主机 间除了网络连接,还需要专线做心跳监测。远程动态监测软件通过心跳线实时监测其它主机和应用的状态,当主机/应用发生故障时,远程动态监测软件会马上监测 到,将故障情况向管理员报警,然后根据策略自动或手工快速地将应用切换到远程的主机。目前,能够提供实现应用切换功能的厂商包括EMC、Veritas、 Legato、IBM、ROSE等公司。