【IT168 专稿】
随着企业数据爆炸性的增长,以及对重要数据提出的众多严苛要求,企业现有的备份架构不可避免的面临了巨大的挑战和外部压力,利用最新的备份技术升级现有备份架构成为众多企业必然的选择。那么,如果企业能够在选择新的备份技术时就充分考虑到当前备份架构所面临的挑战和压力因素,相信可以让他们少走许多弯路,直接找出真正符合当前需求同时又充分考虑未来发展的备份解决方案,使企业受益无穷。
让我们先来归纳一下,下面列出的问题,可说是当前大多数企业的备份架构都会遇到的问题,也是企业在选择备份解决方案时应该重点考虑的问题:
首先,只要你的企业还在茁壮成长,就必然会面对如何管理和储存持续激增的数据的问题,你需要的备份方案必须具备充分的可扩展能力,以充分适应数据的爆炸性增长。
第二,如今几乎所有的大型企业都要求必须保持24X7小时业务持续运行,但是,不断收缩的备份窗口成为阻隔这一需求的最大障碍。花费整整一周时间才能做一次全备份;一次增量备份耗时一个晚上,这种情况对于用户来说再常见不过。完成定期备份所需的时间越来越长和备份窗口越来越大的问题同时侵袭着企业IT管理人员的极限。
第三,备份的管理成本不断上升。当企业有几十甚至几百TB的数据需要从主存储备份到备份设备时的性能影响也绝对是一个非常大的难题。
第四,数据在法规遵从以及司法取证方面的要求也越来越高,越来越多的国家有越来越多的法律法规都要求数据必须保证安全、不可改写并且能够即时访问。这也为数据备份方案提出了新的要求。
最后,如果你是一个具备多个分支机构或多个数据站点的大型企业,对数据进行全球化管理的备份能力,也是要考虑其中的。
一个标准的备份基础架构应该具备充分的开放性,可以适用于各种环境,包括NAS、SAN及DAS、数据中心及远程办公机构、各种操作系统、各类恢复点目标(RPOs)和恢复时间目标(RTOs)。只有充分顾及到备份数据的RTO和RPO的备份解决方案才是用户真正需要的解决方案,才是可以纳入考虑的方案。
如何选择备份解决方案
在选择备份解决方案时,你应该认识到,IT环境中不同的应用程序和数据的备份需求也是不同的。要针对不同的数据分类,从操作恢复(operational recovery)和灾难恢复两个角度去考虑以下这些问题:
发生故障时,最多可以容忍丢失多少数据?
这个问题有利于帮助用户定义保护的频率。从故障发生到恢复运行时最大的数据丢失可容忍程度,通常被称为RPO,如果丢失1小时数据,RPO=1小时。
发生故障后,希望数据在多长时间内得到恢复?
这个时间是指从发生故障到数据再次可用所需要的时间,即恢复时间,表现了用户需要的恢复紧迫性,通常被称为RTO。如果业务停止了1小时,RTO=1小时
需要多大的备份窗口?可以有多长时间用在执行备份上?
这一问题可以帮你定义在备份性能或备份技术方面的需求。
你的预算是多少?
为了解决备份问题,是否可以修改你现有的备份架构或备份程序?
你是否计划继续用磁带进行在线和远程的数据归档?
随着数据保护技术的发展,也许有可能在一个单一站点整合磁带的使用,或使当前的磁带投资进一步扩大利用。
回答完上述这些问题,将对你找到最适合的备份技术非常有帮助。下面,我们再回顾一下目前市场中存在的几种备份技术。
备份到磁带
磁带备份的方式可说是当前最为广泛应用的备份解决方案,但它在保证RPO/RTO的连续性方面相对比较低能。但数据的磁带拷贝还是可以用于多种用途的,如操作恢复、灾难恢复,以及归档存储。
磁带备份的优点在于它成本低、方便携带,更重要的是它可以离线、无动力驱动的进行保管。这种方式已经延用了很长时间,它与备份软件已经紧密的结合在一起,而如今在用的大多数备份软件也是专为磁带备份而设计的。然而,依赖于单一的磁带备份的方式已经无法应对今日多样化的需求,而且还会为企业的关键业务数据和应用带来更多风险。由于从磁带恢复数据所需的时间太长,使磁带备份在应对操作恢复和灾难恢复时面临了巨大的挑战。由于磁带上的数据只能按顺序读取,极大的影响了恢复速度。另一个关键问题就是性能:当你有几十或是几百TB的数据需要执行备份时,数据从主存储传输到备份设备时产生性能瓶颈是不可避免的问题,而要保证磁带备份在恢复时的有效性,进行频繁的、数据全部时间点拷贝是必须的。尽管磁带是目前人们广为认可的备份方式,但不可否认的是,随着新技术的出现,磁带的地位的确是在发生改变。也许有一天,磁带只能用于归档和远程的数据存储了,但是,鉴于磁带的自身优点,以及以往企业在磁带方面的大量投入,我们有理由相信,磁带在未来的备份工作中还是有发挥余热的机会的。
备份到磁盘
这里提到的磁盘备份,其实就是将数据备份到常规的以低成本SATA盘为主的磁盘子系统。这种备份通常被人们视作第一代基于磁盘的备份技术,也已经存在多年了。但随着企业数据的不断增长,不断累加的磁盘成本对企业来说也是一种重负。因此,在高额的购置及管理成本压力下,磁盘通常只是被用作保存最近期的备份副本而已,长期归档数据还是不敢劳其大驾。
相较于磁带备份,磁盘备份在性能方面的提升不可不提。通过RAID技术,磁盘在恢复时间和防御磁盘故障方面的性能有了很大改善;同时,不用磁带的数据多路技术,磁盘也可以提供并行的备份数据流,从而实现了更高的数据批量吞吐能力;另外,磁盘上的数据可以随意的读取,极大的加快了恢复单个文件、目录或卷的速度。但是,由于缺少提升存储效率方面的技术(如重复数据删除技术),大量的数据致使磁盘的购置成本高居不下。这在很大程度上制约了这种备份技术的普及。
备份到虚拟磁带库
在RTO需求日益迫切之际,一种更为高级的备份方式:磁盘到磁盘(D2D)的备份方式出现了。D2D备份的首选是虚拟磁带库(VTL),它可以提供很多高级的D2D备份功能。由于VTL本身具备备份程序,而且对备份管理员的知识和现有的备份软件完全没有任何影响,因此VTL可以非常轻松的与用户现有备份环境相整合。有些VTL还能提供从VTL到物理磁带的 数据降阶,以使其可以完成异地的磁带搬运,从而满足灾难恢复或长期归档的需求。对于企业来说,非常好的的VTL应该具备下面这些功能特性,而且越全面越好:
- 具备充分的开放性,可以适应于各种环境、连通性
- 可以保护用户现有在备份软件和磁带系统方面的投资
- 不用改变现有备份环境即可使之得到改善
- 无需复杂的磁盘管理,极具灵活性
- 可以制定不同的备份策略,充分结合磁盘和磁带应用
- 具备先进技术,降低磁盘总成本。
在满足备份窗口方面,VTL基本上应该可以提供当前或是超过系统生命计划 (通常是3到5年)所要求的聚合写性能;在经济高效方面,VTL应该可以利用标准的压缩技术、重复数据删除技术,或是两种技术结合应用,在不消耗系统性能的情况下,使存储容量的利用更为高效;在轻松管理方面,VTL应该能够与大多数主流的备份应用软件相兼容,而且可以由备份管理员进行管理。
是否会对当前的磁带备份架构的产生影响也是需要你重点考虑的问题。最理想的VTL系统,应该即可以优化磁带产出性能,也不用增加物理磁带方面的投入。更为重要的是,这种VTL解决方案可以提供无缝的恢复,能够轻松的‘回读’远程的磁带匣。
容量效率
从前面介绍的‘第一代磁盘备份技术’我们可以发现,如果不能解决提升容量方面的效率,还是会在很大程度上影响VTL的应用。作为新一代的备份技术,VTL可以通过多种高级功能使你的备份在空间或容量方面的效能有很大提升,其中最主要的当属压缩技术和重复数据删除技术。
压缩技术
数据压缩就是通过删除文件内的多余数据来减少文件大小,以达到节省大量空间和远程传输的带宽占用的目的。压缩分为软件压缩和硬件压缩两种方式,软件压缩的优势在于压缩速度快,而且不占用系统资源,但成本较高。而硬件压缩的优势正好相反。目前市场中的有些VTL产品可以同时提供硬件和软件压缩两方式,两种方式相得益彰,使用户从更获得更大利益。
重复数据删除技术
重复数据删除可说是目前VTL市场中最为热门的话题了,众多VTL厂商都争相推出了自己具备这一技术的VTL产品。重复数据删除技术可以利用对原始数据的分解与特征值演算,去除数据中的冗余部分,让有限的存储空间发挥数倍甚至数十倍的存储效率,大幅提高磁盘有效的存储容量利用。而对VTL来说,由于可容纳的数据量增多,用户原来每隔几天或每周就要执行一次的出库到磁带的操作,可以改为间隔1个月甚至是半年之久。由于保留在硬盘上的数据量增多,也提高了数据恢复和检索的速度。很多时候,重复数据删除可以与压缩协同工作,使用户的资源节省更多。需要提示的一点是,用户不能参照厂商所声称的重复数据删除比率来计划VTL的容量,因为不同的备份数据类型、备份策略等都会直接影响到重复数据删除比率。