存储 频道

灾难故障频发 您的业务连续性有保障吗?

        【IT168 资讯】越来越多的人已经深刻理解到了科技所带来的力量与魅力,尤其是IT科技。IT技术让我们的生活发生了天翻地覆的变化,让人与人之间的沟通更紧密,如通讯方式更加灵活;让工作更加便利,如CRM等等系统;让我们的生活更加丰富,如网银、SNS以及网上购物等等。一旦这个世界没有了IT,毫不夸张地说,也许我们一下子就会退回“石器时代”。

  退回“石器时代”不太可能,但IT系统崩溃却是我们必须正视的一个难题。尽管IT技术越来越发达,但IT系统本身也会遭遇诸多意外。也许IT系统可以重建,但如果没有完善的措施,IT系统最重要的资产——数据也许就永远离你而去,而这些数据也许是决定你生死存亡的关键因素。这并非危言耸听!

  IT系统并非没有天敌

  看似强大的IT技术也需要各种保障措施,横亘在IT系统面前的最大难题就是当其完全崩溃之后,如何迅速重建,并顺利恢复数据。这也是诸多IT解决方案供应商口中不断重复的词“业务连续性”。

  从广义上讲,业务连续性管理是一整套复杂的管理体系架构,并不只局限于IT系统的恢复和重建。但在目前IT技术普及的情况下,业务连续性管理通常立基于IT系统架构。可以说,IT系统的成败将直接决定企业组织业务连续性的成败,而在IT系统中,数据保护则是其中的关键。在这里,可能会有网友有疑问:“数据保护真的就那么重要吗?”下面我们来看几个案例。

  可能大多数人还记得美国的“911”恐怖袭击事件,在这之中,有两个对比反差较大的案例,一个是德意志银行,一个是纽约银行。德意志银行从93年开始进行风险分析,并建立了一整套的业务连续性计划,尽管遭受了此次灾难,但其在短时间内就迅速恢复了业务,极大地提高了员工和客户对于德意志银行的信心,而这种无形的口碑效应几乎是无法用短期的经济利益来衡量的。

  当然,有“幸运儿”就会有“倒霉鬼”,纽约银行就是其中一个。尽管其也有业务连续性管理,但备用数据数据中心位于灾场附近,事件发生后,通讯线路全部中断,并造成连锁反映,IT系统迟迟无法重建,业务也就无法恢复,一些分支机构被迫关闭。据灾后纽约银行发布的报告显示,其第三季度的利润下降了33%,这还是直接的经济损失,同样损失的还有用户口碑。

  也许有人会说,这种事几乎很难遇到,但事实真的如此吗?最近几年发生的较大的影响业务连续性的事件就有2008年的汶川大地震、中国南方雪灾导致断电、2010年的青海玉树地震、2011年的东日本大地震以及同年的泰国洪水。这些自然灾害都可能导致IT系统崩溃、业务停顿,业务连续性并不是我们想象的那么遥远,也许下一个遭受其害的就是你。

  软硬件故障和人为误操作也是IT系统天敌

  相对于看似并不常见的自然灾害和恐怖袭击,IT系统还有另外一个天敌,那就是软、硬件故障、人为误操作,以及现在越来越被重视的IT架构设计。

  硬件故障,大多数人都可以理解,即使是现在看来已经完全有成熟技术的磁盘,其年故障率也在3%到5%之间,不要小看这个数字,在一些大规模数据中心当中(如阿里巴巴、百度、腾讯),一个月坏几十块硬盘完全属于正常情况,这是无法避免的。同样,软件也是一样,谁能保证永远不出错呢?全球先进大软件供应商微软还在不停地为其软件升级和打补丁呢?

  这方面同样也有现实的例子,关注IT技术的网友可能依稀还记得去年某银行发生的宕机事件,导致用户信用卡无法使用,历经数个小时的抢修才恢复过来。这段时间内所造成的经济损失并没有具体的数字,但这个拥有多个选择机会的世界,其间接损失的还有信誉和用户口碑。

  关于IT架构设计方面最近的例子无非就是“艺龙宕机事件”,这是一个硬件故障引发的系统宕机,尽管其有备份和容灾解决方案,但这所有的行为都依赖于某个硬件,而恰恰就是这个硬件故障。与其说是硬件方面的原因,不如说是架构设计方面的缺陷。

  同样,人为误操作也是引发业务停顿或影响用户体验的原因之一。这个原因也许是最常见的。这也许可以理解为什么在存储行业有这么一句话:“如果它没有问题,就不要去动它。”

  数据爆炸迫使你去做出改变

  但是不去“动它”就真的能解决问题吗?在这个数据爆炸时代,不管你是否有意愿去改变,其总是迫使你去改变。

  数据爆炸时代,数据量究竟有多大?IDC给出的预测称,到2020年,全球数据量将达到40 ZB。这个可能有点空泛,看看EMC所给出的数字,在2010年,EMC PB俱乐部里面具有1PB以上存储容量的客户已经超过1000家,这还仅仅是只购买了EMC存储容量的用户。EMC预计到2020年,用户存储容量达到1PB以上的将超过十万家,而拥有EB级数据的用户也不在少数。数据的增长量远远超过了大多数人的预计。

  海量数据带来的问题是什么?绝不仅仅是存储本身,处于数据价值和法规性要求,这些数据通常还要保留一定的年限,比如一些数据通常要求保留数个月甚至数年。而这些数据通常不会都存储在生产系统里面,而是需要转存到备份系统甚至归档系统。问题来了,在这个以7*24小时无中断服务越来越深得人心的前提下,在海量数据背景下,你如何去保证充足的备份带宽与备份时间?

  并且,在大多数企业数据中心内,其架构是复杂的,异构平台与第三方厂商设备并存的情况是很常见的,你所设计的新的系统或架构如何去包容已有投资?这都是作为一个IT管理者所必须要考虑的问题。

0
相关文章