【IT168 专稿】某个地方有新的台风正在酝酿,也许正好朝着你的方向而来;或者,电台新闻报道巨大的暴风雨将会在下周发生。作为IT人员的你会有什么反应?如果以上两种场景都还不足以使你胆战心惊,那就再想像一件更容易理解的事情,比如你所在的地区上游已经爆发了洪水,而且你知道所有的水都向一个方向涌来——直接顺流而下到你所在的城市。总而言之,一场自然灾害即将在你身边发生。
现在我们假设,这个时候,不论什么原因,你并没有为灾难做好充分的准备。毕竟,这些事情从来没有在你身上发生过,只是现在才将要或者至少是很有可能发生。那么,你该怎么来保护数据,并避免系统宕机呢?
幸运的是,有一些技巧能够帮助你暂时度过这一关,直到你部署好长期的灾难恢复(DR)计划以便能够幸免于任何类型的灾难。
离线复制
对于灾难恢复方案来说,磁带备份好像都是必须的。但是对于快速恢复来说并不能只依赖于这些磁带,在一个大型自然灾难过后,它们也许无法马上被访问到。
Gartner的分析师Donna Scott就指出,你不能指望使用磁带来恢复,因为这需要太长的时间;而相比较来说,在两台设备之间复制数据是更加行之有效的方法。
这也正是在飓风Katrina暴露出其灾难恢复计划的弱点之后,美国一家法律公司Chaffe McCall LLP所做出的一项决定。该公司的高级网络经理James Zeller表示,他们曾经几个星期无法访问位于新奥尔良的总部办公室,用了大约一星期的时间才通过位于Baton Rouge的另外一个远程办公室恢复了关键功能。
然而,那个远程办公室缺乏合适的硬件来支持完整的恢复。备份磁带必须用手搬运到比较高的地方来避免丢失数据。在暴风雨过后一些服务器也被从新奥尔良搬运到Baton Rouge 办公室。
为了在另外的类似暴风雨事件中避免如此超重的搬迁,该公司添加了XOsoft公司(刚被CA收购)的WANSyncHA软件,这种基于软件的复制方法能够使得一个办公室成为另一个办公室的容错备援。这样,就使得该公司在面对自然灾难的时候能够保持运行不中断,也不需要花费巨资来进行硬件复制。
据Zeller介绍,目前他们已经用XOsoft的软件将其SQL、Exchange以及文件服务器备份到Baton Rouge办公室的可靠设备上。
一个良好的后备电源供应方案也是灾难恢复(DR)预先准备的一个重要方面。台风等自然灾害经常会损坏电源供电线路,而重建这些线路往往需要一段时间。一些公司倾向于依靠电池来对付这样的意外事故。
在面临麻烦的时候,升级电池好像是比较聪明的举动,购买一两块电池可能并不会给预算造成多大压力。但是当破坏比较严重的时候,依靠这点电池显然不是很充分的方案。
拿新奥尔良大学(UNO)大学为例来说明。在Katrina到来之前,他们完全关闭了其数据中心。负责该大学计算和通讯的高级主管Jim Burgard表示,他们关闭所有的一切,是因为在没有人监控的情况下,他们不想依赖于UPS不间断电源系统。
事实也证明,其他一些大学遭受到了重大的损坏,因为当UPS电池用尽以后,电源开启、关闭很多次,对系统的伤害可想而知。
今年夏天,UNO升级了其UPS,并添加了一个燃气的发电机,这样他们就有了一个备用的电源供应方案,即使市电供应中断,仍然能够运行其服务器、SAN和AC。
一些分析师也指出,要在公共电力发生中断的时候保持运行,就必须具有自己的发电装置,并一定要确保备有足够的汽油或柴油,否则在你需要的时候还是不能解决实际问题。 离线托管
然而,根据不同的企业规模大小以及运行的资源多少,有的时候建设另外一个复制备份场所以及备份电源也是不小的预算。这种类型的灾难恢复方案多少显得有些昂贵,也只有一些效益很好的或资金充裕的大型企业可以承受。对于大多数的企业来说,也许主机托管能够提供帮助。
不可否认,专业主机托管公司的灾难恢复计划方案比大多数公司自己的方案要好,他们一般都拥有你希望的备份电源,具有很多个镜像场所来容灾,而且具有抵抗一切意外的软硬件设施。
可以说,寻找一家在方案部署、人员以及技术方面有帮助的正确的托管厂商,是避免你的业务遭受灾难破坏的一种很好途径,这也是降低灾难恢复成本的首要一步。
有的主机托管中心也为企业客户提供了范围广泛的托管选择,从热备份的镜像数据中心,到遭遇灾难时候的服务器托管。如果你觉得前者费用太高承担不起,那可以选择后者,这起码可以提供最关键系统的保护。
不过,Gartner的分析师Scott 警告企业,别等到灾难来临的时候才去找托管服务商。他认为企业需要把这些资源包含在测试、恢复以及整个计划部署当中,而不是在灾难发生的时候才求救于别人。他建议企业雇用一个兼职的顾问,让他参与公司每周的例会,并专注于灾难恢复计划的日常测试。 人是第一位的
尽管在发生意外灾难事件时技术很重要,但一个又一个的专家强调指出,人还是第一重要的因素。
举例来说,即使在另一个场所有适当的复制副本,Chaffe McCall还是意识到需要更多的工作来确保安全,尤其是在员工通讯领域。Zeller表示,他们采取了措施来确保员工之间的很好通讯,为灾后通讯安置了一个紧急的Web站点,改变为基于Web的邮件系统,以与Exchange服务器分离开来。
当然,人员方面的成本通常也没有组建全面灾难恢复方案的相关技术那么昂贵,例如测试对灾难恢复来说是无价的。来自EMA的分析师Mike Karp表示,要确保你的员工知道该做什么,那就意味着现在就在测试你的突发事件时的系统。
另一个来自系统集成商的顾问Chip Nickolett也表示赞同,他表示,当灾难逼近时,第一个需要考虑的应该是让员工安全地逃离危险所需要的时间。对于现实的恢复场景中,他建议公司要尽可能地做更多的工作,让系统处于一致、可知的状态,做备份,搬移出危险地带,这样有望将损失减少到最小。
关于采用什么类型的设备进行备份,Karp建议非磁性的介质,如DVD等具有与生俱来的耐久力。他说:“当暴风雨即将来临的时候,将最重要的数据备份到一些DVD盘片上,然后将它们装入你的公文包往门外跑。”呵呵,保险方便的方案。