【IT168 应用】这几年用户面临几大数据保护挑战。第一个挑战是如何降低存储成本。这个存储成本并不是指生产数据的在线成本,而是指用于数据备份的这个成本。因为数据越来越多,意味着数据备份所需要的空间也越来越多。那么如何降低存储成本,除了从硬件的角度去降低,还有别的方式吗?
第二个挑战是怎样减少备份时间和网络负载。网络存储越来越多,按照传统方式,备份的时间很长,时间一长就会对网络产生巨大的压力。
第三个挑战是如何在完善灾难恢复战略的同时可以降低成本。也就是我们既要有完善的灾难恢复计划,又要在计划实施的前提下尽量降低成本。
第四个挑战是怎样集中保护远程办公室数据,简化管理。远程办公室的数据保护很容易,关键是要花费多少成本去保护并使远程数据办公室的管理更加简化。因此磁盘和重复数据删除技术应该在所有备份重新设计的议程之内,硬件厂商也应给予其不断的考虑。
NetBackup 重复数据删除技术简介
它有三种方法,我们分别称为:好方法、更好的方法、最好的方法。这三种方法根据不同的用户环境进行不同的使用。
第一种方法是好方法,它适合大多数用户的普通使用。它是利用 NBU 重复数据删除技术执行硬件设备端重复数据删除。也就是说我们使用一些特殊的存储硬件,这些硬件本身带有重复数据删除的功能,用这些硬件去替代没有重复数据删除的硬件像资料库和普通的磁盘等等。
这种方法在硬件设备处进行重复数据删除,并由NetBackup通过 OpenStorage(OST) API 集中进行管理。OST API在这个过程中起到了什么作用?事实上它的作用很大,因为重复数据删除技术需要更好的管理,重复数据删除所能容纳的容量并不代表硬件的标称值。比如一个硬件设备的标称值是1TB,但是它里面存放的数据经过重复数据删除后有可能是3个TB或5个TB,甚至10个TB。这样的话,没有OST API这个接口管理就会很麻烦。比如我现在已经放了5个TB数据了,但从硬件设备来看只能放1个TB的数据,系统就会认为这个设备已经满了,将阻止备份程序继续把数据写进去。但事实上因为硬件有重复数据删除技术,它仍然有大量的空间可以存储数据。在这里 OpenStorage(OST) API 的集中管理就显得尤为重要。
第一种方法的优势有哪些?首先它可以轻松设置,且不改变备份环境,只要把硬件换成支持重复数据删除的就行;其次他可以集中管理策略和控制备份;第三它可以通过 OST API 提高性能。看下图:
▲
从图中我们看到重复数据删除是工作在硬件上的,这会带来一些劣势。首先是备份数据到达硬件设备前体现的都是完整备份工作量,举例来说就是你客户端有1TB的数据,这1TB的数据必须是完整地传到介质服务器上然后再完整地传到重复数据删除硬件设备上,在传输过程中是不能节省的,也就是无法实现基础架构节约。其次是带有重复数据删除硬件的成本比单纯的硬盘高。