【IT168 专稿】许多读者对经常听到的数据容灾这种说法不理解,把数据容灾与数据备份等同起来,其实这是错误的。为此,笔者在本文中要向大家解释数据容灾与数据备份的区别,同时还将介绍几种典型的数据容灾等级和关键技术。首先来看一下数据容灾与数据备份的联系。
一、数据容灾与数据备份的联系
企业关键数据丢失会中断企业正常商务运行,造成巨大经济损失。要保护数据,企业需要备份容灾系统。但是很多企业在搭建了备份系统之后就认为高枕无忧了,其实还需要搭建容灾系统。数据容灾与数据备份的联系主要体现在以下几个方面:
1. 数据备份是数据容灾的基础
数据备份是数据高可用的最后一道防线,其目的是为了系统数据崩溃时能够快速的恢复数据。虽然它也算一种容灾方案,但这种容灾能力非常有限,因为传统的备份主要是采用数据内置或外置的磁带机进行冷备份,备份磁带同时也在机房中统一管理,一旦整个机房出现了灾难,如火灾、盗窃和地震等灾难时,这些备份磁带也随之销毁,所存储的磁带备份也起不到任何容灾功能。
2.容灾不是简单备份
真正的数据容灾就是要避免传统冷备份所具有先天不足,它能在灾难发生时,全面、及时地恢复整个系统。容灾按其容灾能力的高低可分为多个层次,例如国际标准SHARE 78 定义的容灾系统有七个层次:从最简单的仅在本地进行磁带备份,到将备份的磁带存储在异地,再到建立应用系统实时切换的异地备份系统,恢复时间也可以从几天到小时级到分钟级、秒级或0数据丢失等。
无论是采用哪种容灾方案,数据备份还是最基础的,没有备份的数据,任何容灾方案都没有现实意义。但光有备份是不够的,容灾也必不可少。容灾对于IT而言,就是提供一个能防止各种灾难的计算机信息系统。从技术上看,衡量容灾系统有两个主要指标:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了当灾难发生时允许丢失的数据量;而RTO则代表了系统恢复的时间。
3. 容灾不仅是技术
容灾是一个工程,而不仅仅是技术。目前很多客户还停留在对容灾技术的关注上,而对容灾的流程、规范及其具体措施还不太清楚。也从不对容灾方案的可行性进行评估,认为只要建立了容灾方案即可高枕无忧,其实这具有很大风险的。特别是在一些中小企业中,认为自己的企业为了数据备份和容灾,整年花费了大量的人力和财力,而结果几年下来根本就没有发生任何大的灾难,于是放松了警惕。可一旦发生了灾难时,后悔晚矣!这一点国外的跨国公司就做得非常好,尽管几年下来的确未出现大的灾难,备份了那么磁带,几乎没有派上任何用场,但仍一如既往、非常认真地做好每一步,并且基本上每月都有对现行容灾方案的可行性进行评估,进行实地演练。
二、数据容灾等级
设计一个容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等。根据这些因素和不同的应用场合,常见的容灾备份等级有以下四个:
第0级:本地备份、本地保存的冷备份
这一级容灾备份,实际上就是上面所指的数据备份。它的容灾恢复能力最弱,它只在本地进行数据备份,并且被备份的数据磁带只在本地保存,没有送往异地。
在这种容灾方案中,最常用的设备就是磁带机,当然根据实际需要可以是手工加载磁带机,也可以是自动加载磁带机。前者主要适用于存储数据容量较小的中小型企业,主要产品有IBM的TotalStorage Ultrium 外置式磁带机 3580(如图1所示),单盒磁盘窝囊可达200GB,压缩后可存储400GB数据,可满足绝大多数中小企业,乃至大型企业数据备份需求。HP的磁带机产品线更是非常全面,手工加载的磁带机目前主要有HP Surestore DAT 24、HP Surestore DAT 40、HP StorageWorks DAT 72(如图2所示),它们单盘磁带所能存储的容量分别是24GB、40GB和72GB,不同用户可灵活选择,另外HP还有一个LTO-Ultrium磁带机系列磁带机(如图3所示)和DLT/SDLT系列磁带机(如图4所示)。
#$[*192924.JPG*#图1(点击看大图)*#0*#0*#center*]$#
#$[*192929.JPG*#图2(点击看大图)*#0*#0*#center*]$#
#$[*192932.JPG*#图3(点击看大图)*#0*#0*#center*]$#
#$[*192935.JPG*#图4(点击看大图)*#0*#0*#center*]$#
自动加载磁带机中IBM主要有 TotalStorage企业磁带机 3592(如图5所示),HP有StorageWorks DAT 40x6T(如图6所示)等。
#$[*192948.JPG*#图5(点击看大图)*#0*#0*#center*]$#
#$[*192951.JPG*#图6(点击看大图)*#0*#0*#center*]$#
注:以上只是拿IBM和HP这两个著名品牌的产品作代表进行说明,其实还有许多其它品牌的磁带机产品可选择,如日立、索尼、富士通等。除了选择磁带机外,还可选择磁带库、光盘塔、光盘库等存储设备进行本地备份存储。
第1级:本地备份、异地保存的冷备份
在本地将关键数据备份,然后送到异地保存,如交由银行保管。灾难发生后,按预定数据恢复程序恢复系统和数据。这种容灾方案也是采用磁带机等存储设备进行本地备份,这些磁带设备的选择可参见前面介绍。同样还可以选择磁带库、光盘库等存储设备。
我们常常见到一些公司为了避免备份磁带因机房安全问题而出现磁带被除数盗、被毁,通常是把备份磁带,特别是月以上的备份磁带放入专门的保险柜,甚至租用银行的专门保险箱来存放这些备份磁带。但这还不能说是万元一失,原因就是,一般来说这些保管磁带的地点与所在公司在同一城市中,万一出现了地震、战争之类的自然灾难,这些备份磁盘还是难逃厄运。
第2级:热备份站点备份
在异地建立一个热备份点,通过网络进行数据备份。也就是通过网络以同步或异步方式,把主站点的数据备份到备份站点。备份站点一般只备份数据,不承担业务,拓扑结构(如图7所示)。当出现灾难时,备份站点接替主站点的业务,从而维护业务运行的连续性。
#$[*192966.jpg*#拓扑结构(点击看大图)*#0*#0*#center*]$#
这种异地远程数据容灾方案的容灾地点通常要选择在距离本地不小于20公里的范围,采用与本地磁盘阵列相同的配置,通过光纤以双冗余方式接入到SAN网络中,实现本地关键应用数据的实时同步复制。在本地数据及整个应用系统出现灾难时,系统至少在异地保存有一份可用的关键业务的镜像数据。该数据是本地生产数据的完全实时拷贝。对于企业网来说,建立的数据容灾系统由主数据中心和备份数据中心组成。
其中,主数据中心采用高可靠性集群解决方案设计,备份数据中心与主数据中心通过光纤相连接。主数据中心系统配置主机包括两台或多台服务器以及其他相关服务器,通过安装HA软件组成多机高可靠性环境。数据存储在主数据中心存储磁盘阵列中。同时,在异地备份数据中心配置相同结构的存储磁盘阵列和一台或多台备份服务器。通过专用的灾难恢复软件可以自动实现主数据中心存储数据与备份数据中心数据的实时完全备份。在主数据中心,按照用户要求,还可以配置磁带备份服务器,用来安装备份软件和磁带库。备份服务器直接连接到存储阵列和磁带库,控制系统的日常数据的磁带备份。其中,光传输设备作为两个数据中心之间的传输设备,两个数据中心利用光传输设备通过光纤组成光自愈环,可提供总共高达80G(保护)和160G(非保护)的通信带宽。
第3级:活动互援备份
这种异地容灾方案与前面介绍的热备份站点备份方案差不多,不同的只是(图7所示)的主、从系统不再是固定的,而是互为对方的备份系统。这两个数据中心系统分别在相隔较远的地方建立,它们都处于工作状态,并进行相互数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。通常在这两个系统中的光纤设备连接中还提供冗余通道,以备工作通道出现故障时及时接替工作,当然采取这种容灾方式的主要是资金实力较为雄厚的大型企业和电信级企业。
这种级别的备份根据实际要求和投入资金的多少,又可分为两种:
①两个数据中心之间只限于关键数据的相互备份;
②两个数据中心之间互为镜像,即零数据丢失等。零数据丢失是目前要求最高的一种容灾备份方式,它要求不管什么灾难发生,系统都能保证数据的安全。所以,它需要配置复杂的管理软件和专用的硬件设备,需要投资相对而言是最大的,但恢复速度也是最快的。
以上两种热备份方式就不再是传统的磁带冷备份方式了,而是通SAN之类先进的通道技术,把服务器数据同步,或异步存储(镜像方式)在远程专用存储设备(也可以是磁带设备)上。
在以上两种热备份容灾方案中,主要的设备包括磁盘阵列、光纤交换机或磁盘机等。(如图8所示)的是HP的一款低档磁盘阵列HP StorageWorks MSA1000,(如图9所示)为一款高档虚拟磁盘阵列HP StorageWorks Virtual Array 7410产品图。
#$[*193018.JPG*#图8(点击看大图)*#0*#0*#center*]$#
#$[*193025.JPG*#图9(点击看大图)*#0*#0*#center*]$#
(如图10所示)的IBM的一款企业级光纤交换机——TotalStorage® SAN 交换机 F32产品图,它可提供32个光纤交换端口;而(如图11所示)是一款中档光纤交换机——TotalStorage® SAN 交换机 F16产品图,它可提供16个光纤交换端口。
三、异地容灾技术
在建立容灾备份系统时会涉及到多种技术,如:SAN或NAS技术、远程镜像技术、虚拟存储、基于IP的SAN的互连技术、快照技术等。
1. 远程镜像技术
远程镜像技术是在主数据中心和备援中心之间的数据备份时用到。镜像是在两个或多个磁盘或磁盘子系统上产生同一个数据的镜像视图的信息存储过程,一个叫主镜像系统,另一个叫从镜像系统(参见图7)。按主从镜像存储系统所处的位置可分为本地镜像和远程镜像。
远程镜像又叫远程复制,是容灾备份的核心技术,同时也是保持远程数据同步和实现灾难恢复的基础。远程镜像按请求镜像的主机是否需要远程镜像站点的确认信息,又可分为同步远程镜像和异步远程镜像。
同步远程镜像(同步复制技术)是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的I/O事务均需等待远程复制的完成确认信息,方予以释放。同步镜像使远程拷贝总能与本地机要求复制的内容相匹配。当主站点出现故障时,用户的应用程序切换到备份的替代站点后,被镜像的远程副本可以保证业务继续执行而没有数据的丢失。但它存在往返传播造成延时较长的缺点,只限于在相对较近的距离上应用。
异步远程镜像(异步复制技术)保证在更新远程存储视图前完成向本地存储系统的基本I/O操作,而由本地存储系统提供给请求镜像主机的I/O操作完成确认信息。远程的数据复制是以后台同步的方式进行的,这使本地系统性能受到的影响很小,传输距离长(可达1000公里以上),对网络带宽要求小。但是,许多远程的从属存储子系统的写没有得到确认,当某种因素造成数据传输失败,可能出现数据一致性问题。为了解决这个问题,目前大多采用延迟复制的技术,即在确保本地数据完好无损后进行远程数据更新。
2.快照技术
远程镜像技术往往同快照技术结合起来实现远程备份,即通过镜像把数据备份到远程存储系统中,再用快照技术把远程存储系统中的信息备份到远程的磁带库、光盘库中。
快照是通过软件对要备份的磁盘子系统的数据快速扫描,建立一个要备份数据的快照逻辑单元号LUN和快照cache,在快速扫描时,把备份过程中即将要修改的数据块同时快速拷贝到快照cache中。快照LUN是一组指针,它指向快照cache和磁盘子系统中不变的数据块(在备份过程中)。在正常业务进行的同时,利用快照LUN实现对原数据的一个完全的备份。它可使用户在正常业务不受影响的情况下,实时提取当前在线业务数据。其“备份窗口”接近于零,可大大增加系统业务的连续性,为实现系统真正的7×24运转提供了保证。
快照是通过内存作为缓冲区(快照cache),由快照软件提供系统磁盘存储的即时数据映像,它存在缓冲区调度的问题。
3.互连技术
早期的主数据中心和备援数据中心之间的数据备份,主要是基于SAN的远程复制(镜像),即通过光纤通道FC,把两个SAN连接起来,进行远程镜像(复制)。当灾难发生时,由备援数据中心替代主数据中心保证系统工作的连续性。这种远程容灾备份方式存在一些缺陷,如:实现成本高、设备的互操作性差、跨越的地理距离短(10公里)等,这些因素阻碍了它的进一步推广和应用。
目前,出现了多种基于IP的SAN的远程数据容灾备份技术。它们是利用基于IP的SAN的互连协议,将主数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备援中心SAN中。当备援中心存储的数据量过大时,可利用快照技术将其备份到磁带库或光盘库中。这种基于IP的SAN的远程容灾备份,可以跨越LAN、MAN和WAN,成本低、可扩展性好,具有广阔的发展前景。基于IP的互连协议包括:FCIP、iFCP、Infiniband、iSCSI等。
4. 虚拟存储
在有些容灾方案产品中,还采取了虚拟存储技术,如西瑞异地容灾方案。虚拟化存储技术在系统弹性和可扩展性上开创了新的局面。它将几个IDE或SCSI驱动器等不同的存储设备串联为一个存储池。存储集群的整个存储容量可以分为多个逻辑卷,并作为虚拟分区进行管理。存储由此成为一种功能而非物理属性,而这正是基于服务器的存储结构存在的主要限制。
虚拟存储系统还提供了动态改变逻辑卷大小的功能。事实上,存储卷的容量可以在线随意增加或减少。可以通过在系统中增加或减少物理磁盘的数量来改变集群中逻辑卷的大小。这一功能允许卷的容量随用户的即时要求动态改变。另外,存储卷能够很容易的改变容量,移动和替换。安装系统时,只需为每个逻辑卷分配最小的容量,并在磁盘上留出剩余的空间。随着业务的发展,可以用剩余空间根据需要扩展逻辑卷。你也可以将数据在线从旧驱动器转移到新的驱动器上,而不中断服务的运行。
存储虚拟化的一个关键优势是它允许异质系统和应用程序共享存储设备,而不管它们位于何处。公司将不再需要在每个分部的服务器上都连接一台磁带设备。
四、编后语
本文介绍了企业容灾方案的一些基础知识,其中包括了它与我们常说的数据备份的区别与联系,数据容灾的几种等级,其实就是几种不同的容灾方式,最后介绍了数据容灾的几个关键技术。大家从本文可以对数据容灾方案有一个基本了解,我们将在下一篇文章中详细介绍几个异地容灾方案,通过这些方案我们可以清楚地了解到如何为自己的企业部署容灾方案。