存储 频道

武汉公积金中心0丢失2小时容灾恢复方案

  业务连续:数据零丢失 2小时容灾恢复

  为了给用户提供更有保障的服务,武汉公积金中心在二期工程中对业务连续性提出了“数据零丢失、容灾恢复时间在2小时以内”,即RTO为2小时,RPO为零的目标。

  实施过业务连续性的人都知道,容灾恢复时间2小时以内,并不是一个轻松能实现的目标。我们知道,技术层面只解决了IT层面的容灾切换(包括IP网络,主机,SAN网,存储等),真正要保证业务的连续性需要从业务层面入手。EMC的咨询服务就是从业务层面入手,帮助用户解决了人员,流程,步骤和演练这些涉及业务连续性最关键环节的难题。

  一旦发生灾难,如何有序的开展业务恢复,是一个系统性的工程,既是一个技术解决的过程,更是一个指挥协调的过程。EMC依据武汉公积金管理中心的现有组织架构建立一套班子:容灾领导小组负责业务连续性切换决策和宣布;容灾工作小组具体负责恢复指挥;容灾恢复小组和容灾业务小组分别对IT的基础架构进行恢复和业务层面的验证;容灾监控小组负责日常监控;容灾评估小组负责事件的评估。各小组依照容灾切换流程,各司其职、通力协作、熟练操作、相互配合,才能顺利实现业务连续性的目标。

  有了岗位职责定义和流程,接着就需要解决怎么做的问题。容灾切换步骤/计划就是按照业务数据的访问路径,从IP网络、WAS中间件、CICS中间件、DB2数据库、MCP综合前置,SAN网、存储和RecoverPoint入手,每层逐一将切换的步骤具体落实到纸面上并保证这些切换步骤是成熟的且可执行的。

  将业务从生产中心切换到容灾中心,切换过程需要按照数据访问的路径一层一层地进行。正常工作状态下,容灾中心只接受生产中心传输过来的数据,容灾中心存储是锁住的。切换时,要让容灾中心不再接受生产中心的数据,把容灾中心的逻辑卷变成可用,然后把容灾中心的逻辑卷挂到容灾中心的主机上,接着从这些逻辑卷启动容灾中心数据库,进而启动容灾中心应用程序,最后需要确认网络连接状态,查看客户端能否正常访问业务,对数据完整性查询验证。以上所有步骤都完成后,才能恢复办理业务。撰写容灾切换步骤的目的就是在发生灾难时,容灾切换可以在可控的范围内按计划逐步展开。

  解决了谁来做,做什么,怎么做的问题后,就需要真实的进行容灾演练。EMC与客户和集成商一起就设定的容灾场景,进行有针对性的容灾切换和回切真实演练,达到在真实环境验证容灾计划是否可行以及优化容灾计划的目的。

  武汉公积金中心根据EMC提供的业务连续性咨询服务BCP(Business Continuity Plan),建立了一整套容灾系统相应的配套流程和组织架构,建立了有效的灾难应对和指挥控制能力,将定期举行容灾演练,保证容灾中心“养兵千日,用兵一时”。

  武汉住房公积金管理中心有关人士表示,通过实施EMC解决方案,武汉住房公积金管理中心取得了三个方面的效果:

  ? 采用了EMC企业闪存驱动器,明显提高了武汉公积金中心的业务系统运行速度,特别是综合业务查询系统的速度,加快了公积金客户的业务办理,提升了公积金社会形象;

  ? 采用RecoverPoint容灾方案与CLARiiON CX4集成,不仅能实现远程数据容灾的功能,还能实现CRR持续数据保护,数据能恢复到故障前任意时间点,除了防止物理故障外,还能保护人为或逻辑错误,极大的提高了数据恢复的能力。同时,还能随时满足武汉公积金管理中心任意时间点的数据开发测试,以及查询审计等业务需求,提高新业务开发部署的速度,提高业务部门的满意度;

  ? EMC业务连续性咨询服务BCP(Business Continuity Plan)建立了一整套容灾系统相应的配套流程和组织架构,帮助武汉公积金管理中心建立了有效的灾难应对和指挥控制能力,实现业务连续性的战略目标。

0
相关文章