存储 频道

光大信用卡"双活"容灾 保障业务不停机

  【IT168 资讯】“容灾备份”对商业银行来说,已经是老生常谈的话题,尽管是老生常谈,却一直是银行信息化的短板。构建成本高、有容灾无演练、事故后无法正常切换等等问题,一直是容灾实际应用中的困扰。“双活”数据中心是容灾备份领域最近广受关注的热点话题,业内人士认为这种容灾模式对传统容灾中的一些常见问题提出了较好的解决方案。

  不过“双活”容灾说起来容易,做起来难,具体实施过程中也仍然存在很多特有的问题。近日,光大银行信用卡中心技术部总经理李铁成向我们分享了光大信用卡前置系统“双活”容灾方案,介绍光大银行构建“双活”容灾系统中的经验。

  硬件可靠是容灾基础

  李铁成介绍,一套标准的信用卡系统通常分为前置系统和后台核心系统。前置系统用于接收刷卡终端传回的交易信息,并将交易信息转发至后端的核心系统,核心系统接收到交易信息后,不管交易是否成功,都会反馈回终端,这样我们就完成了一笔刷卡的交易。

光大信用卡
▲光大银行信用卡中心技术部总经理李铁成

  不过李铁成强调,除了交易信息的转接,前置系统还承担有代授权的功能,也就是说,当后台主机系统出现故障或停机时,前置系统会代替主机来完成授权交易。所以前置系统在信用卡交易系统中非常重要,不仅仅是一个转接交易信息的传送系统,在必要时候还需要代替后台系统来做授权,完成整个刷卡交易。

  光大银行采用了惠普Nonstop服务器构建信用卡前置平台,惠普Nonstop服务器是针对关键业务应用的可靠性高、扩展能力极强的服务器平台,尽管在中国用户并不太多,但全球金融业已经有丰富的应用经验,全球三分之二以上的信用卡交易由惠普服务器平台来完成,全球证券交易中心系统绝大多数都构筑在惠普的关键业务服务器上。

光大信用卡
▲光大银行信用卡前置系统拓扑,惠普NonStop服务器提供容错级别系统可用性

  据介绍,惠普Nonstop服务器提供业界优异容错技术,完全支持业务不停顿运行,硬件、,操作系统及系统软件均无单点故障,所有系统维护,、部件更换(包括CPU),、系统升级和扩充都可在线进行无需停机。此外,Nonstop拥有极强的扩展性,支持在线扩展,采用大规模并行处理(MPP),非共享体系结构(Share Nothing),单一系统从2个CPU插槽可扩展到4080个CPU插槽,采用网络技术取代总线技术,系统及I/O带宽可以随着CPU数量的增加而扩展。同时,Nonstop还支持高并发,分布式关系型数据库,可同时处理大量的OLTP和数据库批量作业,具备自动的负载均衡能力,即并行混合负载支持能力,性能超群的容错数据库. 采用标准的SQL标准令, 容量可达数百TB。同时提供 开放、,标准的开发环境,采用业界标准的POSIX开放界面,所有容错功能对应用开发透明。

光大信用卡
▲光大银行前置平台特性之二:大规模扩展及并行处理能力

  “惠普NonStop明确是4个9的可用性承诺,惠普NonStop在光大双活机制的配合下可以真正实现永不停机的设计,两台机器完全可以随时地互相替代。这样我们授权的业务是不间断的。自从系统上线到现在就没有中断过整个的业务。”李铁成谈到。

  “硬件系统的可靠性是构建‘双活’容灾系统的基础,如果单点的硬件系统故障率增加,那么两地同时出故障的可能性也大大增加。”

  应用分析是方案关键

  基于惠普NonStop服务器,光大信用卡构建了一套“双活”的容灾方案。所谓“双活”容灾方案,是指灾备数据中心和生产中心一起,承担部分工作负载。传统容灾系统通常是一个生产中心,一个容灾中心的模式,“双活”容灾系统中的两个数据中心却都处于运行状态,且互为备份。

  “双活”数据中心最大的特点是:一、充分利用资源,避免了一个数据中心常年处于闲置状态而造成浪费。通过资源整合,“双活”数据中心的服务能力是双倍的。二、没有容灾的切换过程,如果断了一个数据中心,另外一个数据中心还在运行,这个过程对用户来说是不可感知的。而传统容灾的模式下,如果生产数据中心瘫痪,需要半个小时、甚至两个小时、甚至更长时间才能启动灾备中心,在启动灾备中心的时间里,用户交易会严重受损。

  李铁成认为“双活”容灾方案相比传统容灾优势多多,而光大信用卡采用的应用级的异步复制“双活”容灾相比常见的数据库或者操作系统级的“双活”方案又具备了更多的技术优势。

  据介绍,光大信用卡的异步“双活”有两大优势:首先是容灾中心距离远,因为异步复制没有系统延时的要求,因而两个“双活”数据中心没有系统级“双活“方案30KM的距离限制,能够支持到1000KM的距离。举例来说,光大信用卡前置系统的两个数据中心就分别位于北京和上海。

  第二,避免数据库逻辑错误。同步复制的“双活”容灾方案中,后台数据只有一份,这样避免不了数据库的逻辑错误。如果发生人为的误操作,如误删数据库等等,系统会同步到远程数据库,造成巨大的损失。应用级“双活”在两地数据库保留了两份一模一样的数据库,同时光大银行对自身的信用卡业务进行了详尽的分析,只选择必要同步的应用数据同步到远程,这样一方面避免了数据库逻辑错误,同时减少了网络传输的数据量。

  不过李铁成同时也谈到了这种应用级“双活”的局限性:“一定要对自身业务做全面的分析,要清楚需要同步哪些数据才能支持双活,而且同步的数据量不宜太大。”李铁成表示:“传输的数据量太大对带宽和数据传输的压力也是很大的。如果做一笔交易,传输数据量太大,瞬间的中断同样会造成一定的损失,所以重点在于如何分析应用。”

  “这就是应用级双活和系统级双活的差别所在,系统级的双活通过软件测试一下就可以知道有没有问题,应用级双活却更为复杂,同步之后会有很多其他的问题,比如同步的过程中会发现数据有交叉,这种交叉和错误就是业务的错误,需要分析怎么样避免,并通过软件实现纠错。”

2
相关文章