存储 频道

制定数据中心灾难恢复计划之后,应该做什么?

  【IT168评论】如今,多数企业在建设IT业务系统的时候都会特别关注灾难恢复(DR)计划的构建,但是部分企业IT部门也会经常忘记,即便是最详细的灾难恢复计划,也需要进行实际评估,以确保一切正常工作。如果没有灾难恢复测试策略,任何计划的有效性都难以得到保证。

  一个组织需要制定一个完备的计划,即当一场灾难——不同类型、范围和影响程度的灾难——发生时,应该采取什么步骤进行应对。通常,一个组织会花相当多的精力进行业务影响分析和风险评估,然后再创建相应的计划。

  但基本上来讲,一个未经测试的计划只是一组概念性的步骤。当然,有些事情会起作用,但是随着环境的变化和业务需求的发展,并不能真正百分之百保证未经测试的计划会起作用。

  所以,你需要对这个计划展开测试,你必须向自己和上级证明你的计划是可行的。DR计划的要点是预先降低和灾难相关的风险,并且测试该计划以降低该计划失效的可能性。

  希望以下四个步骤,可以为您建立正确的灾难恢复测试策略提供参考。

  确定该计划的哪些部分需要测试

  你的DR测试可能包括任何内容,从单个系统到多层应用程序,再到整个环境。根据你的组织中各部分内容的关键程度的不同,你首先应定义好需要测试什么。在考虑这个问题的时候,一定要包含依赖。例如,如果交易依赖于活动目录和DNS记录,请注意这一点。

  确定测试频率

  DR计划的测试频率一直是个问题。在灾难恢复测试策略中,测试的频率应该基于计划的更改频率。完全没有变化的工作负载可能每年只需要进行一次DR测试。当系统、应用程序和平台发生变化时,DR计划将得到更新,这意味着需要对其进行测试。这个决定不一定是最终的,根据相关工作负载的紧急状态,可以每季度或每半年对DR计划的测试需求进行评审。

  选择测试方法

  执行DR测试有四种普遍接受的方法。在考虑哪一个更适合你时,请记住,其目标始终是验证灾难恢复计划在实际执行中是否有效。这四种常见的方法是:

  简单的计划复审——这是听起来最基本的。DR团队仔细检查灾难恢复计划,找出任何过时、缺失等不合理的部分。

  桌面排练——DR团队全面浏览整个计划,可以想象它正在执行阶段,团队需要讨论每一个步骤并找出任何潜在的问题。通常,这是通过使用恢复场景来完成的,以确保该计划在特定的灾难环境下有效。

  DR场景模拟——基本上来说,这是DR计划在非生产DR环境中的实际执行。它通常仅限于特定的工作负载、系统、应用程序等,并不包括整个环境。

  完整的DR模拟——与前面的方法相同,不过在这个方法中,您需要在一个完全中断运行的场景中恢复所有内容。

  更新DR计划

  你的测试可能会发现灾难恢复计划是正确的、不需要调整,或者更有可能的是,它发现了一些需要处理或更新的缺陷、错误和遗漏。因此在多数情况下,完成测试后你还需要一些时间来更新DR计划,并做出一些必要的更改,以确保成功地进行恢复。

  测试可能是你的整个DR计划中最重要的部分。没有它,你真的无法确定这个计划是否会奏效。因此,如果你的DR计划中目前还没有包含灾难恢复测试策略,最好加上。这样一来,你就能够在遇到灾难时更好地完成恢复计划。

  原文作者:Nick Cavalancia

0
相关文章