【IT168 特别报道】2006年4月20日上午10时56分,银联通信网络和主机出现故障,造成银行卡跨行交易不能正常进行。经银联全力以赴抢修,到当天下午5时10分左右,全国大部分的成员机构和商户基本恢复正常。
6个多小时的业务中断造成了大量跨行交易不能正常进行。后虽经查明故障的原因是由于银联新近准备上线的某外围设备的隐性缺陷诱发了跨行交易系统主机的缺陷,使主机发生故障,但此次事故也暴露了中国银联在容灾准备方面的不足。
当前,在全球化经济特征日益明显的今天,容灾对企业的重要性已无需多言,没有一家企业能够承受宕机带来的业务中断,无论是计划的宕机(升级、维护和修复)还是突发的宕机(由于人为错误、处理故障、电源故障、甚至灾难事件)。
而且,即使一些企业制订了在24到48小时内恢复核心应用的业务连续性计划,但一旦真正遇到意外,企业要实现全面恢复则需要数天或者数星期的时间。这样的恢复速度往往会让企业丢掉大量的客户和商业机会。因而,对于企业来说,建立安全、可靠的容灾系统迫在眉睫。
谁在关心容灾?
据Gartner的一项统计,在企业高层到技术人员的不同层面中,CEO和CIO对容灾的关注度最高,都为21.3%,接下来是COO和CEO,分别为13.2%和9.6%。由此可见,企业管理层对容灾的重视远大于基层的技术人员。
究其原因,是数据已经成为企业越来越重要的资产。许多企业都致力于最大限度地降低宕机风险和避免业务中断的潜在影响,从而影响:
生产力——由于系统闲置,企业的员工和业务运营都会造成收入损失。
客户满意度——如果企业不能及时响应客户需求,只需点击一下鼠标,他们就会转向另一家供应商。
业务合作伙伴和供应商关系——经常性宕机会引发对企业业务的可靠性的质疑,从而驱使重要的合作伙伴和供应商与其它企业开展业务。

IBM系统存储部大中华区存储解决方案总监张英伟
国外一家机构通过对数百起宕机事件的研究表明,一个典型的计算基础设施宕机的损失约为每小时42000美元。按照这样的比例,1%的可用性改进都可能导致通过降低风险和提高生产力创造数百万美元的收入。
因而,容灾投入在整个企业预算中超过10%以上的企业的比例,从2003年的仅有7%,到2006年超过了25%。以上数据表明,企业对容灾的重视愈发关切。