【IT168 专稿】业务连续性是我们今天所广泛探讨的话题,一般而言,业务连续性的实现对大型企业来说相对较为容易。因为这些企业有自己的IT员工和丰厚的资金保证,可以花费数以百万计的美金来建立备用的数据中心,把所有信息在远程的灾备中心进行异地保存,同时还应用了许多其他灾难恢复技术。
以911事件为例,有多家金融服务机构就位于世贸大厦中或者周边地区,著名的双子大厦倒塌后,这些金融服务机构却没有丢失任何一笔交易数据,并在灾难之后数小时内就完全恢复运营。这是为什么呢?因为这些机构在远程的数据中心有运行着OpenVMS操作系统的昂贵服务器,随时可以进行业务切换。只要系统瘫痪了,强大的网络就可以转换到备份的站点上。
然而并不是所有的企业都有如此庞大的财力和人力来构建标准的容灾中心,同样是处于911事件中的另外一家律师事务所,采用常规的磁带备份方式来备份业务数据和客户资料。911事件发生后,他们的资料随着大厦一同化为灰烬,以至于该事务所的业务在相当长一段时间内不能恢复正常。
由于容灾中心的运转过程太过复杂,维护它有效运营的成本也太过沉重,对于大多数企业来说,业务连续性似乎成为了一个奢侈的目标。那么如果我们无法建立容灾中心,传统的备份就不能实现业务连续性目标了吗?
徒劳无功的备份与恢复
如果数据无法恢复,那么备份就是浪费时间和金钱。然而根据业务分析公司 Enterprise Strategy Group调研数据分析,全球大约有40%的数据恢复失败了,失败的原因并不在于备份软件或者磁带上,而是由于备份任务本身的复杂性决定的。
如果我们研究备份的过程和原理,我们会发现,整个备份操作将贯穿应用程序、服务器、存储设备和网络层,且备份本身是一个很容易受到影响的过程,除非在整个备份的过程中,一切都正常运转,否则很有可能这次备份将成为一次失败的操作。一旦备份失败,我们也很难找到失败的根源,因为有些备份解决方案供应商估计他们花了90%以上的时间在与软件无关的问题之上。
备份的目的就在于:要完全精确地保证正确的数据在正确的时点得到恢复。为了达到备份的目的,备份的时候:
1. 所有访问业务数据库的应用程序和服务都必须停止。
2. 要找到最后一次完全备份的数据,装载恢复。
3. 然后所有的相关的增量备份拷贝也要找到,按照正确的顺序装载恢复。
4. 最后,必须正确使用数据库日志(假设日志可用)。
要实现上述的这些步骤,Windows文件系统和文件必须在一个合适的时间得到保存,这一般是部署一个开放式文件管理器的必要条件。备份软件要做的就是读取很多的文件系统元数据,来判断哪些文件有所变化,然后就把整个文件系统以及/或者数据库进行拷贝,或者仅仅对有变化的一部分文件进行拷贝。
这个过程取决于系统的大小,可能会花上数个小时,且整个备份过程占用了大量的运算资源和带宽,对应用程序的运营影响极大,为尽量避免对业务程序的影响,大部分公司选择做备份不超过一天一次,一般会选择在业务运营量最小的午夜至第二天凌晨的时段内进行。
RPO和RTO是我们在衡量备份和业务连续性的时候,经常会用到的两个概念。恢复点目标(RPO)是在发生灾祸的情况下公司可接受的数据丢失量的衡量标准。受到目前备份和恢复技术上的限制,很多企业设定的RPO是24小时——在预定的增量备份过程发生之间。换言之,即使企业通过备份系统完全恢复数据,也损失了24小时的业务数据量。
恢复时间目标(RTO)是指灾难发生后,业务恢复运营所用的时间,一般的企业从数小时到数天都是比较实际的RTO。然而这也是由于目前备份技术和操作上的限制造成的,而不是业务需求。
真正的业务连续运营要求完全为零的RPO和RTO,虽然我们不可能完全达到,但至少可以无限接近。
| 第1页: 徒劳无功的备份与恢复 | 第2页: 改善传统备份的性能 |
| 第3页: 业务连续性不再遥不可及 | 第4页: 不仅仅是持续数据保护 |