存储 频道

中国人民银行用EMC Avamar清算重复数据

  【IT168 专稿】中国人民银行郑州中心支行(简称郑州中支)是中国人民银行在河南省内设派出机构,行使总行赋予的只能,根据总行授权,维护辖区内金融稳定,承办有关业务。

  在IT方面,郑州中支有十多个应用系统为工作提供技术保障,包括账户系统、财务系统、报表系统、办公自动化系统、会计核算系统、事后监督系统、国库会计核算系统、同城清算系统、公文传输系统、总行邮件系统、事后影像系统、综合管理平台系统等等。

保护一字万金的数据

  每一个系统都流动着非常重要的数据,用“一字万金”形容毫不为过。因此,数据备份是一件极其重要的工作。尤其是从容灾的角度考虑,需要建立高效、高可靠的异地数据备份系统。根据每个应用系统的不同要求,有的需要每天备份,保留最近7天的数据;有的需要每天备份,保留一年的数据;有的需要分别保留最近12个月、最近4周和最近7天的数据。

  各个应用系统的技术环境也各不相同,操作系统有AIX、HP-UX、SCO Unix、Windows Server 2000、Windows Server2003,数据库有DB2、Domino、Informix、Sybase、SQL Server,等等。

  随着人民银行业务信息系统的不断升级和完善,数据保护问题面临着越来越大的挑战。各业务系统的数据采用分散的模式各自独立保存,其数据备份方式一般采用磁盘、磁带、光盘、移动介质等方式,且大多在本地保存,很难满足数据异地备份需要。

  2008年下半年,郑州中支决定建设独立的、覆盖重要业务系统的异地数据备份系统,通过现有网络每天提供迅速、可靠的完整备份和恢复,将数据异地保存。数据压缩-网络传输-异地备份郑州中支的数据总量相对较大,保存期复杂,因此,如果采用传统的备份方式,无论数据总量和备份窗口都很成问题。在郑州中支的技术方案选型过程中,EMC公司基于重复数据删除技术的磁盘备份技术方案很快进入郑州中支的视野。

  中国人民银行郑州中心支行科技处张豫晋处长介绍说,“我们一开始就打算重复数据删除技术。我们综合考虑了郑州中心支行的应用环境,结合总行的经验,如果不采用重复数据删除技术,我们的问题基本解决不了。而重复数据删除技术之中,我们认为,EMC Avamar源端重复数据删除技术最适合我们。”

  EMC公司的Avamar重复数据删除技术是一种独特的全局重复数据删除技术。它从备份的源头上确定冗余数据段,在网络传输之前将数据大幅度压缩,压缩率最高可达300倍以上。这样,用户就可以利用现有的网络带宽进行异地备份和灾难恢复。Avamar还可以对数据进行加密,以提高安全性;同时集中管理各个分支机构的数据备份。Avamar 可把数据备份到磁盘,也可以集成现有的磁带、传统备份软件及磁带环境。

部署简单 数据减少300倍

  EMC Avamar重复数据删除解决方案的部署很简单,地市中心支行不需要部署硬件,只要在业务系统服务器上安装备份代理即可;在中心支行部署两个EMCAvamar节点(2x2TB,共4TB空间),完成双节点的冗余、互备、复制和负载均衡。而且,安装备份代理没有数量限制,只要备份服务器节点的容量不超出,就可以无限扩展。郑州中支的分支机构众多,应用服务器的数量比较大,本次总共安装了近100个备份代理。因此,EMC Avamar重复数据删除解决方案非常适合郑州中支的需求。如下图所示:

 

  EMC Avamar的备份代理软件负责在源端进行重复数据删除工作,而且它能够感知应用,达到非常高的重复数据删除效率。在郑州中支的应用环境中,经过初步测算,郑州中支所有设备(包括地市中支)初次完全备份下来的重复数据删除率大概为3:1,之后的备份由于有基础数据,重复数据删除率大大提高,可以达到300:1的水平。

  这样,不仅节省了大量的备份空间,而且节省了广域网带宽,使异地备份和恢复成为可能。同时,删除重复数据之后采用磁盘备份方案,跟传统的备份介质和备份方案相比,在数据可靠性、数据可用性、数据备份和恢复速度方面都有数量级的提高。系统的可管理性也提高了,系统管理员可以在一个统一的平台上,方便地看到每一个应用系统、每一个支行、每一个时间点的备份数据,也可以集中地管理和执行每个应用系统的备份策略。这些在以前几乎都是不可能实现的。

EMC Avamar全局重复数据删除技术工作原理

  所谓全局,是指在源端和目标端的整个环境中都实现数据的非重复。首先,Avamar通过Avamar Agent在源端对数据解构,实现数据的非重复。然后,将数据加密并通过网络传输出去。最后,在目标端Avamar确保和协调各站点和节点上的数据非重复。

  假设您有一个2MB大小的PPT演示文件。(1) 首先,Avamar软件将PPT文件分解成几个子文件,即长度可变的数据段A、B、C和 D。(2) 在企业中还存在一个重复的PPT演示文件。在这情况下,Avamar能识别出数据段A、B、C和D已经备份到Avamar中央节点中,因此将只保存一个唯一的身份识别指针,而这是一个非常小的文件,仅仅20字节。(3) 随后,假设有人更改了PPT演示文件的一部分。那么在下一个备份操作 中,只有那些与更改有关的、新的而且唯一的子文件(长度可变的数据段)才会被发送给Avamar节点。

  上表中比较了传统的备份和Avamar备份。从中可以看到,Avamar可以减少3.8MB的 数据备份量。备份方案相比,在数据可靠性、数据可用性、数据备份和恢复速度方面都有数量级的提高。系统的可管理性也提高了,系统管理员可以在一个统一的平台上,方便地看到每一个应用系统、每一个支行、每一个时间点的备份数据,也可以集中地管理和执行每个应用系统的备份策略。这些在以前几乎都是不可能实现的。

0
相关文章