【IT168 专稿】某电子交易企业最近经历了一次意外停机,这次意外停机给该企业带来了无法估量的损失。停机事故本身是由于机房的一次意外事故造成服务器紧急关闭,停机事件发生后,企业花费了长达数小时的时间来维修和恢复数据,在此期间业务完全无法运行,然而对该企业来说,真正惨重的损失还有更多。。。。
该企业每日交易额巨大,且数据成几何级数增长,所以该企业一直采用D2D2T(磁盘到磁盘进行一级备份,再从磁盘备份到磁带)的分级备份来保存业务交易数据。因为数据备份占用大量存储网络带宽,影响到企业前端业务系统的运营,所以该企业一直采取一种粗放的备份策略,即周期性备份。选择每天业务交易量最小的时间段(夜间12点至凌晨)进行自动备份操作,在目前的备份和恢复的技术条件下,这种备份策略在一定程度上能够有效的解决企业备份需求,因此也被大多数企业所广泛采用。
然而该电子交易企业的意外停机事件发生在下午三时,从下午三时起,该企业不仅因为硬件维修和数据恢复,导致数小时内无法恢复正常运营,而且由于企业最后一次备份的时间点是在夜间12点,因此当业务系统恢复正常运营后,企业经营者却发现他们损失了从前一天晚上夜间12点到第二天下午3点的所有交易数据。
该企业发生的事故并非个案,实际上反映了目前备份和恢复技术的一项重大瓶颈。企业完成一次备份所需的时间叫备份窗口。这个备份窗口由需要备份数据的总量和处理数据的网络构架的速度来决定。在备份窗口期间后台备份操作不可避免的会影响到前端应用,因此大多数企业选择在晚间,所有业务停顿或处于低谷的时间进行备份。而如果故障发生在中午或者下午,我们也只能恢复到上一个恢复点,很显然从上一个备份时间点到故障发生的时间之间的数据无法恢复。同时恢复的速度和周期也往往让企业经营者焦虑不堪。
这样的备份和恢复能力,远远满足不了用户越来越高的安全和服务要求,因此尽可能缩短并消除备份窗口,并提高恢复速度成为目前备份的主要课题之一。
可持续数据保护(CDP)
现在已经出现了连续数据复制保护以及多点影像保护技术,这就是CDP(Continuous Data Protection,持续数据保护)技术,这一技术的出现,真正使得数据的点备份变成了连续跟踪数据变化的多点精细跟踪技术,使得传统意义的备份系统暗然失色,而快速的恢复以及从任意备份点的恢复成为现实。
试想一下,当系统完全损坏的时候,几分钟内系统通过远程引导和恢复,这在传统的恢复技术中是无法实现的,而CDP技术的出现,却使得数据复制和备份具有了高性能的RPO(灾难时的数据保存点)和RTO(灾难后的业务恢复点)的能力,克服了渐进式的灾难。
CDP是一种连续时间点的数据保护技术,其根本作用是能在故障瞬间完成任何时间点的故障恢复,达到业务的连续应用,从而从根本上解决传统备份恢复能力低和非精细时间策略(一般为按一个周期备份)的先天缺点。这种技术的诞生必将推动备份领域和灾难恢复领域的一次技术更新,在未来的时间内,人们将看到这种技术带来的深远影响,以及技术更新带来的快速、可靠的恢复效率。
CDP其原理是记录存储数据的修改。本质上是在数据改变时,将信息写入日志或建立变更索引,并打上时间戳。当需要还原数据时,就可以恢复或还原到任何想复原的那个时间点上。
CDP VS. 快照
CDP的概念一经问世,立刻在存储业内引起极大的反响和轰动,成为吸引眼球的热点。在对CDP解决方案的报道迅速升温后,最终用户也受到CDP即时数据恢复和零数据损失的优点所吸引,迫切期待CDP的产品走向市场。但是早在CDP出现以前,众多厂商已经开始使用数据快照技术来缩短备份窗口,有业内人士质疑:CDP和快照技术有本质上的区别吗?为什么有了快照技术,我们还要如此不遗余力的推广CDP呢?
快照是对出现在特定时刻的数据的复制。换句话说,快照是一个数据集的静态映像,这个数据集可以快速镜像某一特定时刻的ORACLE数据库或者家用文件系统。对用户而言,使用快照对数据进行快速clone,并进行备份,同样也可在一定程度上消除备份窗口的影响。从表面上看,这两种数据的保护方法有很多共同之处。但是如果仔细对比以后,会发现其实这两种技术存在很大的区别。
快照功能都可以归入两个大类:全复制或者差别复制。全复制快照复制整个数据集。全复制快照常常通过称为镜像分离的流程来实现,3TB数据库的全复制快照同样会占用的3TB磁盘空间。差别复制快照仅处理上次快照之后出现的增量。这类快照占用较少的磁盘空间,但是需要更多的系统资源(它记录的只是数据在硬盘上的存放形式,如果需要使用,还需要对这些杂乱的数据进行恢复)。
而CDP提供了一个数据恢复点的连续体,能够存取在连续时间点上的数据,而不是针对那些由快照流程预先确定的某一时刻的静态数据。CDP允许应用恢复到特定的事件之前,而不是恢复到预先确定的快照时间点上。恢复点在每一事件发生后会重新建立新的恢复点。
CDP提供无限的恢复点(RPO),有些情况下可以提供接近即时的恢复时间(RTO)。这是因为,一般情况下一旦出现新的操作,CDP软件就会自动纪录一个恢复点,这些恢复点的划分可以一直细化到单个的写操作。CDP去除了备份窗口。与大多数快照不同的是,CDP无需应用交互或干预。由于CDP恢复具有动态和非破坏性的特点,所以用户能够在不损坏内容完成的前提下审核备份。
两者不同的地方在于:首先,进行CDP的时候不必停下手头的操作;其次,CDP并不需要像快照那样存储修改后的全部数据,因此不需要那么大的存储空间;最后,CDP可以还原到过去的任意时间点,快照却只能还原到某个特定时间点。CDP映像不须预先在应用和数据存储的单个固定时间点上,可以随意建立(往往这些映像是基于软件策略自动实现的),因此允许在很大的范围内执行备份操作。
无缝实时的数据恢复
就恢复而言,CDP系统分成两类。第一类提供虚拟化恢复,这意味着接近即时的恢复。虚拟化的恢复允许在应用数据后,即在客户系统重新上线和运行后,处理此次恢复的数据移动任务。从恢复时间目标的角度看,没有比提供虚拟化恢复的CDP产品速度更快的产品了。
另一类是大家熟知的定向恢复,也叫做向后或向前滚动恢复。这种恢复方法利用写操作的改写或重新运行记录及时将应用数据送回来。这种恢复的恢复时间取决于恢复操作要回溯的时间有多长,但是一般情况下,与快照恢复时间相同或比其快。快照恢复时间取决于快照利用差别复制的能力。
CDP提供微粒度数据集,能以比快照高得多的灵活性重新确定数据的用途。CDP是动态建立数据图像的,数据图像可以反复重建,不受总线数据影响进行审计、保存和归档,还可以用做单个解决方案,向多个重新确定用途的活动提供数据。
CDP已经走出了纸上谈兵阶段,很多主流数据中心都已经定期使用CDP。因为CDP拥有所有快照固有的优点,又比快照具有更细的粒度,恢复时间也短得多。
光明的发展前景
CDP目前尚未发展成熟,但它终将达到每个企业都会考虑到适用的程度,只要价格合适的话,那么企业甚至个人都将考虑到这个问题。
CDP产品可以是软件,也可以是软硬结合,甚至可以是D2D2T的解决方案,但磁带显然会进一步边缘化。磁带厂商必须更紧密地与磁盘厂商合作,或者发展自己的磁盘备份产品,否则市场空间便会受到压缩。
2005年的CDP市场十分有趣,大型厂商开发的产品都面向中低端,通常只能备份文件而不是应用,并且多数都还实现不了真正的“持续保护”;而那些新创公司由于目标明确,并且先行一步,推出的反倒是能够备份应用、功能齐全企业级CDP产品。然而,客户在选择企业级产品的时候,更信任大型厂商,这迫使新兴公司选择以OEM为主的发展道路,先后获得EMC和HP的OEM合同的Mendocino就是其中的典型。
经过2005年的热身,CDP将在近年进入一个全新的领域,预计会有一些NetBackup级别的备份产品提供较为完善的持续保护能力。