【IT168 专稿】随着时间的推移,9.11事件的阴影在人们心目中已经逐步淡去,但是现实生活中并不仅仅只有恐怖袭击会给我们的业务系统带来灾难。一次意外的断电、一次小型的火灾、关键系统的硬件损坏,还有管理人员漫不经心的一次误操作,都有可能给我们的业务系统带来致命的打击。
我们是否能预防所有的灾难?灾难发生后,我们需要承受多少的损失?传统的容灾方案是否能保障我们的信息系统连续运营?
灾难备份的概念
灾难恢复是指利用技术、管理手段以及相关资源确保既定的关键数据、关键数据处理系统和关键业务在灾难发生后可以恢复的过程。实施灾难备份的目标就是一旦灾难发生,灾难备份中心能在确定的时间内接替生产中心的运营,恢复既定范围内的业务运作,保障企业业务连续。
目前的容灾系统,其基本原理都如上图所显示。在存储系统方面,最为关键的部分就是在两地间建立主机无关的实时数据镜像机制。一般采用数据复制的机制,包括同步和异步复制。
为了不让那些费尽九牛二虎之力复制到远端的数据变成无用的0/1,磁盘阵列的容灾功能绝不仅仅是数据拷贝那么简单,而是要通过种种手段来保证被复制的数据经过长途跋涉之后,仍然是完全可靠和可用的。这在专业术语上,叫做保证数据一致性。
建立一个有效的数据容灾方案不仅复杂,投入成本也是巨大的,甚至有时候所建设的容灾方案所组成的设备完全处于等待状态,假如灾难不发生,所有的设备、人力、物力、财力还有上百次的灾备演习都将无情的变为无用功。即使如此,这样的投入对于将要发生的灾难来说也是值得的。
企业不惜花费巨大的代价保障灾难发生后的业务连续性,然而灾难发生的时候,保证业务系统在短时间内快速恢复运营,并且零数据丢失,仅仅依靠以前的技术是无法实现的。
CDP,传统容灾的颠覆
在2005年2月由SNIA(全球网络存储工业协会)成立了CDP特别关注小组。该小组确定描述数据保护技术、实践与功能的标准术语,并促进这些标准化术语的使用,希望以此统一CDP市场。
CDP(Continuous Data Protection),持续数据保护,它的关键词是持续。就给定的数据集而言,CDP提供恢复点的连续体,能够存取任何时间点上的数据,而不仅仅针对那些由快照流程预先确定的特殊时刻。CDP允许应用恢复到特定的时间点之前,而不是恢复到预先确定的时间点上。恢复点在时间发生后选定并动态重建。它提供了粒度无限的恢复点(RPO),有些情况下可以提供接近即时的恢复时间(RTO)。
这一个技术的出台,颠覆了传统的容灾的概念。容灾和备份都属于数据保护领域,然而容灾是解决业务的连续性的问题,所实现的是在数据和系统遭到破坏的时候,能够在最短时间把业务在远程或者同程进行恢复。备份解决的是历史数据的恢复的问题,是通过一个恢复的流程和数据恢复的程序来将以前、历史数据的相关的版本进行恢复。它不太考虑业务连续性的问题。备份和容灾联合起来,则覆盖了数据保护和业务连续这样的问题。
CDP技术则在技术上把备份技术和容灾做了一个结合。它是一种精细化多点跟踪技术。通过实时连续的复制,将系统和数据进行实时的捕捉。
CDP技术侧重点不仅仅是在于备份,更重要的一点是瞬间恢复,CDP的无缝恢复技术能够实现一定业务连续性指标,这是传统的备份技术所不具备的。现在的容灾体系当中,RPO和RTO成为了最重要的两项指标。RPO是指的是在故障发生之后,希望数据保存的时间点指标,RPO越小表明数据丢失越小。CDP技术能够确定RPO指标,可以按照用户的要求,恢复到指定的时间点。能够为各个类型的企业,提供不同类型的数据的保护机制和系统保护机制。
CDP解决方案
从操作方式来看,CDP解决方案的设计方法可以分为基于块的、基于文件的、或者是基于应用的。
基于块的解决方案位于物理储存或逻辑卷管理层之上。当数据块被写入主存储器时,写入的数据副本就被CDP系统捕获并存储到一个独立地点中;与此类似的是,基于文件的CDP解决方案设计正好位于文件系统之上,它可以捕获文件系统数据和元数据事件;基于应用的CDP解决方案设计则直接位于受保护的特定应用之中。这类应用提供深层的集成,并且作为应用自身的内置功能,也可以是利用特殊的应用API在发生变化时赋予其连续访问应用内部状态的权限。
基于块和文件的CDP解决方案可以利用一种相同的通用方法来支持多种不同的应用。基于应用的CDP则只为某种应用提供CDP能力,但通常的表现形式是一种更为深入的集成方式。
主机代理程序
为了在数据发生变化时进行访问,一些CDP解决方案要求在需要受保护的主机上安装一种特殊的“代理程序”软件。另一些CDP解决方案则使用已经内置到受保护主机或网络中的数据传输协议(如NFS、CIFS、FC或iSCSI)来实现这一功能。
恢复的精细程度
不同的CDP解决方案提供多种不同精细程度的恢复能力。恢复精细程度可以分为如下几种(按由低到高的顺序排列):卷组、单个卷或文件系统、单个文件夹或文件组、单个文件或应用对象(如电子邮件或日历项目)。
恢复时间应用集成
一些CDP解决方案为某些应用提供一种集成的恢复方法。也就是说,在进行恢复时,CDP解决方案能够了解(并且能够识别)到该应用的先前历史中最优化或最重要的恢复点。这类应用集成可以是完全自动的,也可以是可扩展的。
内置应用集成是一种全自动的方法。例如,一个对数据库非常了解的CDP解决方案可能会自动探测并记录最近连贯事件的信息,如检查点或执行交易等。
CDP解决方案还可以提供一种机制,通过一些外部的输入信息或流程来指定重要的应用恢复点。这类集成是可扩充的。例如,可以利用用户界面活动(或命令行工具)等方式来指定当前是一个重要的时间点,如病毒扫瞄结束,或者是公司财务季度结束等。
需要注意的是,基于应用的CDP解决方案通常可以自动了解重要应用的恢复点。然而,基于文件和块的CDP解决方案还可以通过一种自动或可扩展的方式来提供深层的应用集成。
针对数据库的连续保护支持
许多CDP解决方案都支持一些常见数据库环境(如Oracle或Microsoft SQL)的连续保护。在这里,支持的意思是该解决方案经过了厂商的全面测试和认证,而且还会向用户提供已经准备好的文档内容。
库架构:
许多CDP解决方案的架构都是将其作为一种CDP存储库(也就是说,将所有数据中的变化存储在独立的地点),而且这种存储库是局域网、广域网或存储区域网上明确的专用节点。其他的CDP解决方案则依靠受保护的主机,并将数据直接写入独立的CDP存储器上。
复制库:
一些CDP解决方案还提供将CDP库复制到另外一个远程库的能力。这样就可以提供更高的灵活性,防止主CDP库可能出现损坏或丢失对恢复能力产生影响。
产品概览及发展趋势
关于CDP的产品可谓五花八门,异彩纷呈,有知名的软件厂商也有因CDP软件的发展而让人知晓的公司。其中有微软的DPM(Data Protection Manager),赛门铁克的Backup Exec 10d,NetApp的Chronospan,IBM的Tivoli CDP for Files、Revivio的CPS等等。
这些CDP厂商最为纯正的是一些不出名的小软件公司,但是对于这样的安全性要求极高的数据保护系统,用户怎么能够放心使用呢?于是在IT这个圈内,大的著名厂商开始以OEM的方式,取得了专注于CDP软件厂商的产品,以自己的品牌销售,譬如IBM和EMC。这也给我们一个启示,在当前数据安全、法规遵从日益严格的条件下,CDP的发展是一个必然的趋势,而CDP厂商的并购似乎显得也是一个必然的现象。无论是哪种趋势,对于数据容灾来看,CDP是一个很好的选择