【IT168 应用】使用传统的备份软件就能实现对虚拟服务器的备份。不过这种方式有一些弊端。通过下面的文章您可以学到更多的有关于虚拟服务器备份的技巧。
越来越多的企业开始使用虚拟化技术,系统管理员们需要在原来的物理服务器上创建更多的虚拟服务器。每个虚拟服务器共享物理服务器的资源,例如:处理器、内存和硬盘等。使用虚拟服务器可以充分的利用物理机的硬件资源。
随着虚拟服务器数目的不断增加,数据保护也变的越来越重要。防止数据丢失的主要方法就是对虚拟服务器备份。这篇文章给我们讲解了如果使用传统的数据备份技术和特定的虚拟化工具来对虚拟服务器进行备份,而且对部署中出现的问题也给出了解决办法。
虚拟服务器是一个运行在物理服务器之上的完全独立的逻辑环境。每一个虚拟服务器都是以独立的物理服务器运行。用户根本感觉不到物理服务器跟虚拟服务器的区别。数据中心中为数不多的几个物理服务器运行着上千个虚拟服务器,这给存储或者备份工作带来了很大的不便。虚拟服务器上数据丢失跟物理服务器上数据丢失一样严重,所以对虚拟服务器的备份同样需要重视。
使用常用的数据备份软件就可以完成虚拟服务器的备份。首先在每个虚拟服务器上安装并配置数据备份软件,然后对包括磁带库、虚拟磁带库以及硬盘库在内的目标端设备进行备份,整个过程跟传统的数据备份一样。
企业策略集团(ESG)专家Lauren Whitehouse说:“这是管理员使用最多的方式,因为他们对这种方式已经非常熟悉。这样可以保证整个备份过程的连续性,使数据恢复简单化,而且可以对特定的应用程序进行备份。”
如果使用基于代理的备份软件,可以跟平时一样很方便的将单独的文件恢复到虚拟服务器中。如果对整个虚拟服务器系统进行备份,那恢复时需要对整个系统进行恢复,然后将它挂载在一个路径下,通常不是生产环境,然后用户再恢复系统中的文件。
不过,采用传统的数据备份方式对虚拟服务器进行备份也有许多的弊端。资源竞争是最明显的问题。备份任务会占用大量的CPU资源,这样其他虚拟机的备份任务就会受到影响。StorageIO集团高级分析师Greg Schulz称:“不要使CPU的使用率达到100%。留一些系统资源给其他的备份任务,这样才能在一个物理服务器上运行多个数据备份任务。”
虚拟环境下数据备份成本更高
给所有虚拟服务器都安装数据备份软件会大幅提高成本。传统的备份软件备份时需要复制程序而没有必要复制整个虚拟服务器的状态。如果只是想保留一个应用程序,例如:数据库,这种方式是可以接受的,但是如果虚拟服务器出现了问题,这时就得先恢复虚拟服务器,然后才能恢复数据。
重复数据删除和虚拟服务器
当用户在备份虚拟服务器时,采用重复数据删除技术可以减少OS文件、补丁和应用程序的副本。可见,重复数据删除技术意义重大。但重复数据删除也会大大增加虚拟服务器的负载。因此专家建议可以单独增加一台重复数据删除的硬件设备来达到重复数据删除的目的。
专门用于虚拟化方面的工具,例如VMware的Consolidated Backup
(VCB) 和Microsoft的Virtual Machine Manager (VMM)可以直接跟它们相对应的虚拟化平台(VMware的Virtual Machine Disk Format (VMDK) 和 Microsoft的Virtual Hard Drive (VHD))交互。这些工具可以记录整个虚拟服务器的状态而且不会影响虚拟服务器正常运行。在很短的时间内就可以完成整个恢复过程,并且可以直接对完整的快照进行恢复,这样存储管理员就可以随时对虚拟服务器进行备份。
精确度恢复是虚拟服务器文件备份的劣势。采用传统的数据备份方法恢复某个特定的程序或者文件是很简单的事情。而使用VMDK 或者 VHD时却不得不恢复整个快照里面的数据。ESG 公司称:“现在一些快照厂家可以在文件级别上实现数据备份,而且可以对单独的文件进行恢复,但不是所有厂家的产品都有这个功能。”
如何实施虚拟服务器的备份
虚拟服务器中文件如何存储也是一个难题。虚拟快照通常是一个新的文件,因为它是全备份,不用考虑上次快照跟这次快照的不同。每次快照都会使用全备份窗口并且使用相同的磁盘/磁带空间。重复数据删除,也称为单实例存储,可以减少备份所需的存储空间。但是重复数据删除并不会缩短备份的时间,因为数据备份完成之后才会进行重复数据删除。因此专家建议对应用程序或者原设备进行重复数据删除的同时降低数据备份的时间。
虚拟服务器的备份跟备份目标并没有特别的关系。传统的数据备份方法可以将数据备份到磁带,虚拟磁带库或者其他的硬盘中。有些对性能要求苛刻的用户通常是先把数据备份到硬盘上,然后再存储到磁带上,VCB 和VMM都是采用这种方式。虚拟服务器备份的介质跟传统数据备份的一样。不过,数据保存时间要仔细确认,没有必要对所有快照都保存很长的时间。关于这点可以向当地的专家或者法律律师进行咨询。
在固定的时间内对虚拟服务器的备份设置进行检查,可以保证所有的数据都可以备份到,并且可以正常的对数据进行恢复。一些公司经常进行数据恢复,这个过程可以视为“测试”。每次对某个文件或者程序进行恢复时,备份也会相应的得到验证。还有一些厂家使用备机来进行测试,这样不会影响正常的业务。
盘点提供虚拟服务器备份的厂商
Young America公司会生成大量的客户数据,大约20TB的生产数据,10TB的开发数据和测试数据都存储在EMC公司的产品中。虚拟化软件采用的是VMware公司的产品。虚拟化已经给公司带来了很多好处。Young America公司的网络工程师Dan Thompson说:“首先是资源得到了充分利用,第二是备份和恢复变得简单易行。
Thompson采用VCB和EMC的Legato软件对虚拟服务器进行备份,虚拟服务器的备份跟其他的备份进程一样,每天晚上运行,都是根据需求执行。整个的备份过程大约需要6到7个小时,一共有160台服务器,其中一半是虚拟服务器,因此很难计算每台虚拟服务器备份任务需要占用多长时间。
除了对现有虚拟服务器进行备份外,Thompson还利用虚拟快照来克隆新的虚拟服务器。他说:“你可以使用VCB保存一个虚拟服务器的副本,然后将它恢复成另外一个虚拟服务器,这个新的虚拟服务器跟原来的完全相同。”
EMC的Clariion磁盘库支持虚拟磁带库。备份应用程序将数据备份到CDL和真实的磁带(IBM)中,需要注意的是LTO-3磁带驱动将被LTO-4取代。虽然Thompson从来没有遇到过恢复失败的情况,但他几乎每个月甚至相隔更短的时间都会对恢复进行测试。
Thompson表示,随着一些问题被解决,虚拟化产品已经非常稳定。“过去由于VMware驱动和工具功能有限,导致在执行VCB时,虚拟服务器经常被锁住。技术改进之后,这个问题已经不存在了。" 由此也可以看出在虚拟化环境中,软件维护和版本控制也是非常重要的。
除了高效之外,灵活性也是虚拟化的一个巨大优势。Kroll Factual
Data公司采用了Microsoft的Virtual Server 2005 R2来整合数据中心中的服务器。信息服务部门技术架构主管Christopher M. Steffen称:“我们正在把一个收购公司的技术和架构融入到我们的数据中心中,虚拟化是唯一一个可以在短时间内完成整合的方法。”
一旦存储虚拟化方案确定,整个架构都会被整合到虚拟服务器环境中,届时可以支持600个负责生产的虚拟服务器(占整个生产服务器的80%到85%)。此外,还有400个虚拟服务器用于灾难恢复,400个用于开发。Steffen说:"使用Windows Server的任何平台都可以使用虚拟化,这样可以高效利用硬件资源。”到目前为止,Kroll Factual Data在IBM FAST存储服务器上运行着大约60TB的数据。
Steffen用VMM单元来管理和备份微软虚拟服务器。VMM不仅可以配置和优化虚拟环境,而且可以为VHD文件创建备份快照。Steffen也通过VMM来创建标准服务器的镜像来加速新虚拟服务器的部署,这样每种环境中的软件和驱动的版本就可以保持一致。他表示:“通常安装一个操作系统需要二到四个小时,现在只需要把已经创建好的镜像文件拷贝过去,然后做些简单的修改就可以,这个过程只需要10到15分钟。”
大部分的虚拟服务器备份任务都可以通过VMM完成,但也有一些未包含在虚拟化之内的紧急备份任务需要手工执行。VHD文件的大小和从主机端到备份目标端的带宽决定了数据备份所需要的时间。备份通常都是先将数据传递到硬盘上,随后另外的进程会把这些数据复制到磁带上。
可以将灾难恢复地点设置成有电源和网络的任意地点,这一点对Steffen来说非常重要。“虚拟化让灾难恢复更容易管理。VMM使管理配置和迁移更新变得更简单,还具有负载均衡功能,这可以优化位于同一台物理服务器上的多台虚拟服务器。
虚拟服务器的前景
存储空间会继续增加,所以虚拟服务器肯定会有更多的数据需要备份。这促使更多新技术开始使用在虚拟服务器备份上,例如重复数据删除技术。在执行重复数据删除时,虚拟服务器的性能如何才能不受影响是现在的关键问题。
StorageIO集团的 Schulz.表示:“在虚拟服务器上运行重复数据删除会对CPU产生过大的负载。”这时增加一台外部的重复数据删除设备可能会解决这个问题。物理服务器的硬件配置也会影响虚拟服务器的性能,例如:Intel的 vPro处理器技术和Q35 Express Chipset等。
传统的备份需要特定的备份软件来做恢复,而且安全性可能会出现问题,通过快照进行系统恢复比通过备份文件恢复要方便的多。加密是虚拟化备份环境中另外一个单元,不过到目前为止,还没有很多用户使用这个功能。
这类软件前途并不明朗。专家称:虚拟化厂家可能会将备份功能转加于第三方开发者。ESG宣称:“虚拟化厂家可能会为备份厂家提供API。”备份产品厂家可能会通过这些API开发新的软件或者在原有的备份软件中添加新的功能,这样备份软件的功能就会更加强大。
软件不可忽视
备份软件技术在整个数据存储备份过程中具有相当的重要性,因为它不仅关系到是否支持磁带的各种先进功能,而且在很大程度上决定着备份的效率。操作系统所附带的备份功能,诸如Unix的tar/cpio、WindowsNT的WindowsBackup、Netware的Sbackup等仅能提供一些基本的备份功能,缺乏专业备份软件的高速度与高性能。大家知道,磁带机对数据传输速度有一定要求,若数据传输率偏低,磁带机就无法连续运转,而专业备份软件因能通过优化数据传输率即可以自动以较高的传输率进行数据传输,这不仅能缩短备份时间,提高数据存储备份速度,而且对磁带机设备本身也有好处。
备份软件也满足了以数据为中心的网络存储的要求。如果是以前的小数据量和DAS的情况,网管人员也许可以安排小段的固定时间进行备份,但对于SAN环境下以TB级计的企业级备份系统而言,自动的备份与恢复策略、远程的管理监控是不可少的。更何况,系统的存储设备“混杂”的现实情况要求最起码可以实现基于主机的虚拟存储管理。所以说,优秀备份软件还会包括加速备份、自动操作、灾难恢复等特殊功能,这对于安全有效的数据备份是非常重要的。
以下是存储软件的一些增强技术。用户在选择方案时,有必要就这些增强技术咨询备份软件厂商。
逐个文件的备份 它是最流行的一种备份方法。它通过操作系统打开文件、读取文件,写入磁带,然后关闭文件。因为通过操作系统,占用较多的系统资源。而且对于大量小文件的备份情况下,性能很差。虽然如此,它仍是一种最经济的备份的方法。
映像备份 备份时不以文件为单位,而是直接针对磁盘或驱动器,直接按扇区或簇读取,拍取快照(Snap)。由于跳过了操作系统,具有较高的备份性能。但由于备份需锁定该磁盘,导致了别的应用暂时不便访问该磁盘。
集中管理和控制 针对网络上的多个备份设备,可以从一台机器上直接管理和控制全网。这对于大型网络的备份是非常有必要的。
推技术 推技术是一种代理程序,它安装在需要备份的客户机上,按照备份服务器的要求,代理程序产生需要备份文件的列表,将这些文件进行打包压缩,送到备份服务器上。它代理了一部分备份服务器的工作,提高了网络备份的效率。
RAIT(Redundant Array of Inexpensive Tape)RAIT是相对硬盘的RAID而来,它主要是将多个相同的磁带驱动器做成一个阵列,一方面可以提高备份的性能,另一方面又可以提高磁带的容错性。但这一组(假如为四盘)必须以组为单位存放,单独的一盘或两盘无法使用。
并行流技术 并行流技术指在同一个备份服务器上连接了多个备份设备,同时也提交多个备份任务,它们分别针对不同的磁带设备,以达到并行操作。但它不象RAIT技术那样具备容错的功能。
目前比较流行的专业备份软件的一些具体性能、技术特点见本文附的相关资料。
一个有启发意义的方案
前面我们分别对磁带系统与软件系统的选择作了一些原则上的介绍,但这些仅是一个完整解决方案的部分。完整的解决方案通常还包括网络的连接、主机系统的配置等等,而且这些都非常影响备份系统的性能。
方案的确定往往是用户与厂商技术人员互动的结果,作为用户则始终要从自己的应用出发,并对自己的备份策略心中有数。前面我们说到了根据备份策略来确定备份硬件及软件的选择要点,这里我们给出衡量解决方案的一些基本原则。
稳定性 备份软件一定要与操作系统100%的兼容。当事故发生时,能够快速有效地恢复数据。
全面性 选用的备份系统,要支持各种操作系统、数据库和典型应用。
自动化 备份方案应能提供定时的自动备份,并利用磁带库等技术进行自动换带。在自动备份过程中,还要有日志记录、自动报警功能。
高性能 在设计备份时,尽量考虑到提高数据备份的速度,利用多个磁带机并行操作的方法。
操作简单 数据备份需要一个直观的、操作简单的图形化用户界面,使备份工作得以轻松地设置和完成。
作为一个例子,这里介绍一个业界知名公司推出的“分层存储备份”技术方案。该方案的启发意义在于把磁盘、光存储、磁带三大技术统一了起来,更有利于我们理解磁带的独特地位,也说明了它们并不相悖。另外,该解决方案真正体现了“以数据为中心”的现代存储精髓。
该方案根据存储设备中数据对主机的响应程度,定义磁盘为“在线存储设备”,光存储是“近线存储设备”,磁带则为“离线存储设备”。
据统计,许多企业的磁盘中只有20%的数据是激活的,80%数据并不总是被使用,有一些甚至一个月或更长时间才用一次。而在80%不常用的数据中又有70%是一年以上时间不需调用的。在这种情况下,多层次化存储管理可以在数据的高效使用、储存成本间作出最好的平衡。该解决方案结构如图所示。
它基于定义的标准,自动地将文件迁移到下一级存储器上,用户存取时,自动回迁,整个过程是应用透明的。
HP OpenView Omniback II 4.0
HP OpenView Omniback II专门用于支持存储需求的增长。同时,Omniback还具有全面的调度与自动化功能,利用这些功能,您可以在同样的资源条件下保护更多的数据。
广泛的备份技术
HP OpenView Omniback II采用了大量的技术来保证您的数据具有持续可用性(即使在备份过程中)。从在线到开放文件备份,从在线增量备份(Oracle)到集群备份、无服务器备份,直到零停机时间、零影响备份,Omniback均提供了能够满足您的应用需求的解决方案。
实现可扩展性与灵活性
HP OpenView Omniback II为各种各样的服务器环境与存储系统配置提供了完整的、集成的数据保护功能。Omniback软件均能通过一个统一的界面自动实施并监控备份与恢复流程。
与OpenView管理集成
Omniback支持各种类型的备份客户机(磁盘代理)与备份设备服务器(介质代理),能够提取应用数据并将其放入备份驱动器与磁带库中予以保护。附加的数据库与应用代理可支持一些特殊的备份方法,如在线、开放文件、无服务器或零停机时间备份,以便您选择适合自己应用需求的具体保护方法。
提高员工效率
由于HP OpenView Omniback II提供了全面自动化功能,IT人员的日常工作负担将得以减轻。集中备份管理功能降低了调度、监控并确认备份成功所需的时间,同时确保了备份策略在整个企业范围内的统一执行。
利用Omniback,用户将通过适用于多种平台的统一GUI进行灵活的备份。Omniback支持E-mail、SNMP陷阱、事件日志、网络广播或寻呼机上的基于事件的定时通知功能。高级的Web报告功能允许从任何可接入Web的地点轻松浏览备份作业的状态。
IBM Tivoli: 提高 存储资源利用
Tivoli软件在存储管理领域的主要目标是为客户在混合平台环境下(从大型主机到掌上电脑)进行全面存储管理和SAN管理提供卓越的集成解决方案,使企业能够放心地部署、访问、共享和保护SAN、WAN及LAN环境下的关键业务信息。日前,Tivoli软件存储管理产品总监Paul Ellis阐述了Tivoli存储管理的产品策略。Ellis讲到,从备份和恢复软件来说,IBM Tivoli Storage Manager(TSM)正在保护着全球超过100万的系统和应用,TSM作为功能全面的存储管理软件可以处理分布式环境中复杂存储管理所带来的挑战,可以支持多达39种以上的操作系统以及250多种存储设备。
TSM的完全增量备份策略通过只备份新的文档和被修改的文件节省了时间和磁盘空间,支持利用磁带或光驱进行快速的客户端数据恢复功能和Lan-free数据传输,同时允许多个客户端同时在同一台Tivoli存储管理服务器上进行数据的读写传输,并支持灵活的差分传输技术,允许数据的传输按照字节级、数据块级或文件级进行。非常值得关注的是,TSM的最新版本5.1版在增强了很多功能,比如增加了Server-free、在线镜像备份功能以及对更多平台和硬件的支持,还提供了易于使用和安装的向导。
在存储资源管理(SRM)方面,像Tivoli Storage Network Manager是业界首个基于ANSI标准的SAN管理解决方案,能够在发现、监视和管理SAN组件的同时,还能够自动化地分配附属存储资源,而SANergy则使用户能够通过实施SAN透明地共享公用存储设备、卷和文件的存取,将LAN解放出来,从而可以使Unix、Windows和Macintosh系统在卷、文件和字节级上跨平台共享存储资源,减少管理成本。
VERITAS NetBackup备份软件
VERITAS的NetBackup产品家族包括VERITAS NetBackup DataCenter、NetBackup BusinessServer和Backup Exec等产品。NetBackup的特点如下。
结构 VERITAS NetBackup采用少有的四级层次结构,集中管理,灵活适应多种应用结构。
设置 Net-Backup的安装和实现相当简单。管理员可以用美观的图形界面来定义备份的策略。
并行处理 Netbackup可以实现多磁带机并行操作,因此可以有效地增加带宽。
使用简便 Netbackup在管理方面提供了多项选择,如命令行、Motif、Java方式以及NT Explore风格的接口。
监控能力 Netbackup提供强大的监控能力。备份进度显示条监视备份进度,磁带卷、驱动器和磁带库情况显示可以报告磁带利用情况和驱动器配置等。