【IT168 资讯】从硬件故障、数据损坏甚至数据复制时的恶意攻击中恢复是有可能的。但是,如果是像火灾、洪灾、龙卷风、地震或者是恐怖袭击这一类的灾难呢?2005年,Katrina飓风揭露了本地数据的脆弱性和异地发送数据的重要性。远程数据复制通过广域网(WAN)在远程服务器或存储平台之间复制数据。虽然远程数据复制已经存在很多年了,但是技术的进步最终使其成为了主流。Arun Taneja说:“今天,我可以为我环境中可能存在的任何应用程序添加复制功能,而且不需要花费大量的资金。”Arun Taneja是一家位于美国Hopkinton, Mass.的Taneja集团的创建者兼咨询分析师。让我们来看一下远程复制的原理和所涉及的陷阱,并且调查其对存储组织的影响。
使远程复制功能生效
远程复制有三种基本的方式:基于主机、基于阵列和基于Fabric。基于主机的远程复制架构采用在服务器或专用设备上运行软件的方式,通过WAN将数据传输到一个目标系统。如Kashya的KBX5000 数据保护平台,它直接连接到存储区域网络(SAN)。分析师指出,虽然基于主机的远程复制通常比较便宜,但是可能无法提供其它两种方式具有的某些性能。
通过使用应用程序软件自带的阵列还可以在相互兼容的存储阵列中进行远程复制。这种基于阵列的方式通常不够灵活,因为复制都是基于同一阵列的(如Symmetrix到Symmetrix)。但是随着复制软件容差性的增强,这种情况有所改变。例如,EMC的Clariion AX150结合它最新推出的SAN Copy软件,能够在Clariion、Symmetrix、IBM、Sun和Hitachi Data Systems (HDS)的存储阵列之间创建远程实时(PIT)拷贝。
就在最近,远程数据复制出现在了光纤网络中,通常是作为一种软件运行在SAN的交换器上。Topio的Topio数据保护套件(TDPS)就是一种基于Fabric的远程复制。Kashya 和 FalconStor也提供了类似的产品。光纤网络中出现的这种复制主要是因为交换机支持大量的设备,而且对性能没有明显的影响。Taneja说:“显然,这增加了智能交换机的压力,但是很多情况下,其实并没有使用智能交换机。”
远程复制技术的发展绝大部分归根于低成本磁盘、低成本带宽以及带宽优化技术的出现三者之间的融合。重复数据删除(又称智能压缩或者分解共同性),随同压缩、delta /differential算法和改进的数据流方法一起,是导致带宽优化的因素之一。Greg Schulz是一家位于Stillwater, Minn.的StorageIO集团的创建者兼高级分析师。他说:“数据流的优化——创建更大的数据包也是因素之一,从而在传输数据时,传输效率更高。”
同步和异步
远程数据复制可以通过同步和异步的方式完成。这两种方法都有独特的优点和限制。在数据传输开始之前,数据先从源磁盘发送到目的磁盘,在这个过程中,同步数据复制实时发生,远程磁盘必须时刻和本地磁盘保持连接。这能确保同步复制,然而公认的潜在问题限制了同步的距离,只允许在高校附近楼层或大厦之间进行同步。WAN中断也会引起同步复制机制的混乱。
对于异步数据复制来说,在接收到响应之前,数据只是从磁盘传输到本地服务器上。然后,在时间和带宽允许的情况下,本地磁盘通过WAN将数据传输到远程磁盘。在很多情况下,复制得到的远程磁盘的内容可能会滞后本地磁盘数据,甚至可能滞后好几个小时。然而,异步机制在远距离(在这种情况下,潜在问题不再是一个影响因素)和廉价的低带宽WAN连接的情况下能够很好的发挥作用。异步数据复制还能够容忍WAN中断,在WAN服务恢复之前能够保留一个本地数据拷贝。
另外,还可以同时采用这两种技术。例如,同步复制可能在本地备份中担任角色,而异步复制可能将数据复制到一个远程灾难点。而且,要记住,远程复制并不是唯一的数据保护的方法,这一点很重要。Heidi Biggar 是一家位于美国Milford, Mass. 的企业策略集团公司的分析师。他说:“这两种技术都能复制病毒和其它形式的破坏程序,因此,针对某些类型的快照,终端用户可能希望拥有两个副本,这就是连续数据保护(CDP)技术或者是一种类似于CDP的技术。”
复制管理和工具
远程数据复制工具正在不断的发展,功能集也在逐步的扩展,以便于能与其它的网络管理工具一起使用。这种趋势很明显:简化工具,通过提高与其它备份和恢复产品的整合水平来自动管理进程。寻找存储器、网络和应用程序的逐步融合。分析人士期待通过一个独立的管理界面使用户最终能自己管理远程复制产品,这个管理界面还要包括磁盘到磁盘(D2D)技术、CDP技术和其它技术。Biggar说:“最近,CommVault、Symantec和EMC对于他们的以恢复技术为中心的整合平台计划直言不讳。”
远程复制的障碍
尽管远程复制毫无疑问比以前要更经济、更健壮,但是,在部署的过程中,仍然存在一些严重的问题需要用户努力解决的。首先要考虑成本问题。尽管硬件和带宽比过去几年相对要便宜,但是除了反复的带宽成本之外,组织还必须承担第二站点的建设成本。问题在于,数据容量不断的呈螺旋形上升,因此,即便伴随有带宽优化的好处,通常还需要在更短的时间内传输更多地数据。Schulz说:“省下的成本马上又会被消费掉。”
很多企业应用程序,如果数据库和客户关系管理软件(CRM)等通常需要进行多卷操作。结果,管理员必须复制每个相关的卷,以确保为应用程序提供一个完整的环境。这种情况不仅需要更多的存储空间,花费更多的时间和带宽来完成一个完整的复制,而且还要求管理员跟踪复制在各个卷之间的一致性。像Kashya's KBX5000这样的复制工具是用来帮助确保应用程序数据的一致性的。
如今有这么多的产品,包括远程复制软件,所以管理员必须经常在多个复制平台之间玩转。因为网上出现了越来越多的存储平台,这对于最资深的IT人员来说都可以称得上是一种管理噩梦。分析人员还指出,基于光纤的复制产品能消除那些不断发展的充斥着各个角落的复制小程序。
多个管理Applet对远程复制性能还会产生负面影响,并且同步复制会阻塞WAN带宽的有效性。这个问题总是引起所有复制任务滞后,对于任务关键的复制任务来说,这是一个严重的问题。选择那些可以根据任务优先规则自动降低带宽利用率的远程复制产品。例如,公司的主要数据库处于优先位置,并且占用大部分可用的带宽,而其它数据复制可能只占用一小部分带宽,直到高优先级的任务完成。
最后,分析师还强调带宽优化的重要性,鼓励选择那些包含强大功能的远程复制产品,像delta differential或者是重复数据删除功能。例如,仅传输一个块中被修改过的字节比传输整个块要有效率的多,或者仅传输整个块,而不是重传整个文件。Taneja说:“目前,并不是行业中的每个复制产品都具备成熟的水平,IT用户需要不断寻找高效率的产品。”