存储 频道

如何能避免灾难恢复计划失效

【IT168 资讯】如果你无法确定也没什么,因为很多人都无法确定。有人说,不但制定灾难恢复计划是很难的,就连确定那些计划是否真的有用也是比较难的。

  明尼苏达州埃迪纳Fidelity Bank的助理网络管理员Rick Erickson说:“这没有什么取巧的,你必须制定好计划,然后一遍一遍地尝试。” 他的团队已经花了2年的时间来制定灾难恢复计划,并且近一年来,每隔几个月都要进行一次灾难恢复测试。

  每一次测试都会有新的收获。他说:“你可以发现许多问题,从确定你所使用的线缆和防火墙的配置是正确的,到确定你的地址是正确的,一切都必须得到确认。”

  总部设在迈阿密的法律事务所Greenberg Traurig的股东和律师Luis Salazar说:“我认为要想预见到每一种情况是不可能的,但是如果你制定好计划并去执行它,你会发现许多潜在的问题。”

  Salazar并非只是站在企业客户顾问的角度上来谈制订数据管理和业务持续性计划的。在2005年发生威尔玛飓风时,他自己的办公室被完全摧毁了。幸好他比较机警,他才得以在最近的一个WiFi热点迅速继续开展工作,那时他连办公室或者书桌都没有。

  那么那些机敏的用户需要做些什么才能确保他们的灾难恢复计划能够发挥实效呢? 以下是我们采访Erickson、Salazar和其他人得出的一些观点:

  • 设定恢复优先权。对于大部分专家来说,这是首要任务。 内华达州克拉克县的高级系统程序员Richard Taylor说:“第一个困难是决定储存什么/复制什么/保护什么以及扩展什么的问题。如果你认为ILM/档案管理/HSM很难获得一致的话,那就等到你设法让许多相互竞争的业务部都得出它们之中只有2个业务部拥有很好的备份系统时再说。”

  而且,来自各级管理层尤其是最高管理层的信息输入将有助于制定正确的列表。例如,银行或许会认为财务报告比供货商或者员工的信息更重要。 一家零售商或许需要将客户清单、交易情况和存货清单的资料都保存起来。

  • 放开你的设备,让它们与你的要求匹配。Salazar说,一旦制定关键IT资源的清单,并且确定了其中最重要的项目,决定由哪些系统来包含那些应用软件就非常重要了。

  有时,测试会让你发现对新技术的需求。 比如,Fidelity Bank的Erickson的团队发现他们使用的应用软件中有一两款软件的恢复能力较差,除非它们保存了虚拟服务器的离线副本。(银行使用为人的虚拟化软件。) 一旦虚拟服务器在远程灾难恢复站点被复制,在更新特定数据时就会相对更快一点。

  • 明确时间计划。制定你的恢复时间目标和恢复点目标。 例如,Erickson的团队假定大部分的银行交易必须在24小时内完成。他们的灾难恢复系统要求借贷、运作和出纳等系统必须能够在意外中止后一天之内恢复运作。 对于相对次要点的应用软件如内部报告功能,也必须在2到3天以内恢复。

  • 在需要时请求帮助。Fidelity Bank并不只单纯依赖内部建议。 为了确保万全,Erickson和他的团队会与厂商们就灾难恢复进行沟通。然后他们会聘请外部顾问来进行考核。

  • 将所有的变化都记录在案。Storage Switzerland顾问公司的George Crump说:“大部分灾难恢复失败都是由结构和环境变化引起存储器基础结构变化而造成的。”

  StorageIO顾问公司的分析师Greg Schulz说:“将灾难恢复计划的更新作为你的日常变化监控管理工作的一部分内容,如果你不对变化监控进行管理,那么就将那部分工作添加到你的灾难恢复计划中,因为它们是有关联的。请定期审计备份和复制,以确保那些数据的正确性。”

  • 测试测试再测试。然后,就是测试了。 Schulz说:“定期审计测试计划、程序和文档,利用那些对流程并不熟悉的人来协助决定什么是已知的以及什么是假定成立的和什么是已经备案的。 灾难恢复中的经验还是可以在一段时间内管用的。”

  Schulz说,正确使用测试是非常重要的。 “一项成功的测试中,重点不应该有很多,相反,重点应该集中在发现并解决问题上面。我想,没有人希望测试失败吧。 然而,如果你找不到问题的话,它们就会变得更难解决。”

  • 不要将IT考虑在内。如果你的IT员工不在,你的系统是否能够恢复呢? 在IT专业人士不在的情况下,非技术员工如何应付那些困难是很重要的。

  • 正确选择你的网点。映射的灾难恢复站点应该离主站点很远,这样它们才可能在灾难来临时幸存下来。 例如,Fidelity Bank选择了14英里外的某个地点,然后用Silver Peak的数据压缩技术来确保数据传输的速度。Salazar说,他的公司使用了一个Citrix VPN来连接迈阿密总部和灾难恢复站点。 因为如果飓风袭击了佛罗里达州,气象学的知识指出它可能不会深入到乔治亚州。

  上述列表很难做到完整。有人说灾难恢复实际上是一项生产性工作。 当时通过采取正确的措施和执行详细化测试,是可以获得成功的。
0
相关文章