存储 频道

系统带业务切换 且看华为容灾之道

  【IT168专稿】古人云:“人无远虑,必有近忧”。今天,这句话用在企业信息化建设方面,依然是至理箴言。据权威研究机构IDC统计,在经历大型灾难而导致系统停运的企业中,有55%的企业面临倒闭,剩下的45%中,由于数据丢失,有29%也在两年之内倒闭,生存下来的仅占16%,而常见的误删除、误修改、恶意篡改等人为故障,对数据的威胁则更加严重。灾难发生的概率虽然很低,但是一次就足以致命。从“9.11”事件、东南亚海啸,再到“5.12汶川大地震”,世事无常,这些天灾人祸都在提醒人们数据备份容灾体系建设的必要性。

  随着信息化的快速发展,以政府、金融、电力、制造业等为主的各行业逐步建立大型数据中心来完成数据集中处理。然而,数据的集中也意味着风险的加剧,对数据中心的可靠性也提出了更高的要求。企业数据中心必须能做到7×24小时不间断的服务能力,为避免数据中心遭受灾难时造成的巨大损失,容灾备份系统的建设势在必行。

  对于业务分布全球150个国家、拥有15万员工的华为来说,容灾不仅仅是公司业务持续运行的基础性保障。对内,它支撑了企业的长期发展。而对外,容灾还支撑了企业的社会责任以及客户与行业的认证要求。,经过多年的经验积累,华为在2014年春节期间成功实施了异地数据中心带业务容灾演练,将IT系统从深圳总部数据中心整体切换到了南京异地容灾中心。在此次容灾演练中,两地数据中心相距1300多公里,涉及切换的系统超过500个,这项看上去“不可能完成的任务”究竟是如何完成的呢?

  100%切换回切成功率 关键系统2小时内完成切换

  据华为企业业务BG规划咨询部部长傅依林介绍,本次带业务容灾演练是通过数据中心管理系统,将500多个IT系统从深圳总部数据中心整体切换到了南京异地容灾中心。在正常提供全球业务服务一天后,又成功回切至深圳总部数据中心。其实早在2001年,华为就已开始摸索并开展数据中心容灾建设。2001年,华为在北京建立ERP等关键系统的数据容灾。2008年,实现了国内外研究所重要研发数据异地容灾。在此之后,华为结合业界非常好的实践,进一步展开系统性容灾的规划和设计。2010年,南京容灾中心正式启用,这座2000多平米高密度、高功效的现代化数据中心采用整合容灾为异地主备架构,并且根据分层分级的设计实现了IT系统容灾对业务支撑的全覆盖。深圳总部数据中心为主,南京容灾中心为备,这一主一备的模式便构成了华为现阶段完整的容灾管理体系。

系统带业务切换 且看华为容灾之道
▲华为数据中心

  虽然在本次带业务容灾演练之前,华为曾从单系统到一个流程,再到数据中心集成功能进行了循序渐进的演练,但傅依林还是感慨道:“这次演练的难度是前所未有的大。” 首先是超远的距离,深圳和南京之间距离1300多公里;第二,复杂环境:涉及切换的系统超过500个。而各系统之间又有着复杂的基层关系;第三,则是数据量大的问题。

  我们都知道,异地容灾演练最大的技术难点是广域网延时。华为IT系统的集成度非常高,SOA、集成(EIP)等技术使用非常广泛,没有一个系统是孤立存在的,各系统之间互相调用,比如ERP,集成关系有2000多条。但一些原本在局域网中跑得很好的系统,到了广域网就会因延时没法运行,或者非常慢。单个系统的带业务演练已无法满足华为的要求,必须做集成演练,进行多个系统的整体切换。为此,华为数据中心采用了先进的分布式云数据中心架构,而在日常运营和管理上,也将容灾环境当成生产环境来运营,以保证两个中心的数据同步。最终,华为整个容灾演练的切换过程非常顺利,从开始到结束基本均按计划进行。

100%回切成功率 关键系统2小时完成切换
▲演练实施过程示意图

  图中绿色阶段用户是不受影响的,红色阶段是业务中断时间。据悉,本次带业务容灾演练切换和回切的成功率达到了100%,并且实现了快速切换和回切,关键系统2小时完成切换,而其余所有系统也在4小时内全部完成。

5
相关文章