【IT168 专稿】在数据丢失的灾难发生之前就有所准备能较高提升灾难恢复的速度。当灾难来临之时,你是否已经为此做好了万全的准备?
企业资料库每年都以四倍的速度膨胀,对于计算机的依赖以及与存储系统部件相关的商业风险以指数级数增长。数据损坏、病毒、硬盘错误、电源问题、意外或恶意删除数据,盗窃和自然灾害都是有效的灾难恢复策略中需要注意的问题。
通常情况下,当计算机宕机时,首要的任务是让IT人员恢复系统,重新进行配置,在最短的时间内恢复处理关键业务的应用程序,与此同时,机构中的其他的部门只能等待他们的数据被恢复回来。
一个开展灾难恢复策略的最好切入点之一是公司的日常业务。关键业务的恢复涉及的不仅是雇员制定灾难突发事件应对计划,还包括全部过程的责任分担。
全部灾难风险的估价受到货币、消费者和法规政策的影响,同时还要考虑到各部门间的相互依赖。灾难恢复策略同样应该考虑可恢复性和数据的更新度以便能够保证在预定的恢复时间内完成完全的可调节的恢复操作。
CPU的性能和数据集合的大小在过去的20年中每18个月都会增加一倍。然而,网络拓扑和基本输入/输出技术已经跟不上其发展的速度。在上一个十年间,全部的网络性能每18个月提高到了1.5倍,而输入/输出总线性能则提高到了1.3倍。
与此同时,数据和CPU性能提高超过网络性能的10倍,是输入/输出总线性能的30多倍。提高数据速率和减少需要移动数据的体积以及最小化数据服务器资源是在我们这个全天候的数据存取世界中建造灾难恢复解决方案的首要任务。
预防是一种策略
灾备过程不仅仅意味着灾难发生后的及时恢复,平时业务运营过程中,对灾难的预先估计和充分准备是非常重要的。
对你的体系结构中的每一种操作系统和应用程序部件来说,你应该考虑以下的方面。这些问题应该在各自的生产环境下通过IT部门的支持得到处理。
可能出现的故障是什么?
哪些是重要数据?
多长时间做一次备份?
何时应该做完全备份而不是增量备份或者差异备份?
用户在工作时是否应该做即时备份,还是脱机备份?
备份是手动的还是通过自动的调度程序?
如何检测备份已经成功完成?
你如何确定备份数据的可用性?
在重新使用媒介之前你多久保存一次备份数据?
从上一次备份恢复需要多长时间?
你的备份媒介保存在什么地方?
合适的人员是否能够存取备份数据以备恢复之用?
如果IT系统管理员没有空,是否有其他途径能获得系统密码以及开始备份,如果需要,进行数据恢复?
你是否有考虑了以上提及的所有建议的灾难恢复策略?这里推荐有效的备份策略只有在充分了解公司的数据管理目标和需要之后才能有所改善,并有力地为日常业务的开展指明方向。下面列举一些在制定灾难恢复偶然事件的策略通常需要考虑的问题。
以适当的资源和人力开发你的备份和恢复程序。
测试你的程序以保证能够及时恢复数据。
保证有一名专人负责数据的备份和恢复。
备份你的整个系统分区,为不可预知的可怕的磁盘损坏提前做好准备,提供简洁的操作恢复整个分区。
对于Windows 2000的用户,备份你的本地目录服务数据库来防止用户帐户和安全信息的丢失。
保存系统日志,以便能够更快速更小范围的恢复文件。
定时执行恢复检验以保证文件被正确地备份了。通常恢复检验将发现隐藏的硬件异常状况。
运行预警机制以防止其他系统管理员把你或别人的数据恢复到错误的服务器上。
仅仅是IT部门的事情?
灾难恢复并不仅仅是系统恢复,更多层面,还包括业务恢复的意义。灾难预防也不仅仅是公司技术部门需要考虑的事情,涉及到更多的似乎微不足道的层面,以下措施能够有效的帮助你减少系统灾难的几率,或者灾难发生时,以下的一些小问题就能够给你帮个大忙:
保留你主要系统部件的详细说明,比如CPU、内存、影像模式设置、驱动、SCSI设置、网卡设置、磁带驱动等等。你可能还会需要输入/输出、DMA,IRQ和SCSI的更详细设置。这些信息将在系统出现严重硬件问题时,你不得不重装系统时给你帮助。
确保下面的东西准备到位:操作系统的分发介质、补丁程序、微软的补丁包、OEM厂商提供的特殊驱动等。总是保存当前每一个相应的系统环境安装的补丁包的信息。
保存每一个系统设置的更新档案,包括网络设置(TCP/IP设置)、机器名称、域信息、账户信息、磁盘设置、磁盘分区布局、分区大小、分区文件系统格式、操作系统安装的补丁包信息。
结论
灾难恢复策略通常不能由IT部门人员独自完成,而且也不应该只面向特定的计算机或数据中心。通常来说,有效的灾难恢复策略是一个长期的项目,需要有标准的操作程序、日志、数据流图、问题隔离处理以及可靠的周期性磁带备份调度。整个公司内的灾难恢复策略的规划将快速隔离应用程序错误,减少操作上的错误,减少支持人员和必要条件,使系统和应用程序的维护更加简单易行。