存储 频道

专家谈重复数据删除不同阶段的恢复时间

  网络带宽

  什么时候和在哪里进行重复数据删除会严重影响备份所需的时间。

  在备份环境中,重复数据删除往往会减少10倍到20倍甚至更多的备份工作规模。如果在靠近资源的地方进行重复数据删除,那么重复数据删除的好处可减少一定量的数据,而以前这些数据必须通过LAN/WAN才能实现从备份资源到主站点的传输,例如让更小的更廉价的重复数据删除设备与远程办公室或分支机构(ROBO)的本地备份目标一样进行工作。这个因素能够帮助大大降低带宽和时间需求。这一过程中你会面临的取舍是:备份的同时进行重复数据删除会增加时间的需求,而必须在网络中传输数量明显更少的数据的话又可能会节约大量的时间。网络带宽在这一比较过程中是一个关键的变量。

  备份提取性能

  备份提取性能是一个很重要的因素,但不是唯一的因素。但是,你往往需要将这过程的周期最短化,在这一过程中使用的应用的性能可能会因备份操作而降低,但是你需要弄清楚重复数据删除设备的备份提取性能以及网络向设备交付数据的最大数据量。只有这样你才会理解这是否与在线处理和后期处理过程中的重复数据删除设备的备份提取性能有关。

  图:应该使用一整套的指标来评估在线处理和后期处理的重复数据删除方法,来准确地预测从远程灾难恢复站点恢复数据所需的时间。

  同时进行的重复数据删除操作

  对于在线重复数据删除设备来说,可能出现的状况是,由于重复数据删除与提取备份数据同时进行,会导致提取速度变慢。如果在物理定律下这可能能够实现,但是你同样可能预见到后期处理重复数据删除设备的性能会同样出现下降,因为后期处理重复数据删除设备往往在进行备份工作的同时对另一个对象进行重复数据删除。

  尽管这不是对比的唯一点,但是为了在同一个水平上对在线处理和后期处理进行比较,你需要理解后期处理设备的重复数据删除的性能如何,而不能停止于对备份提取性能的了解,并且你还需要理解同时进行备份提取的时候如何进行转换。在线处理厂商会公开公布重复数据删除性能与备份提取性能的特点,然而后期处理厂商通常仅仅报告备份提取的性能,而不公开重复数据删除的性能。如果要想知道本地备份什么时候完成你不需要知道两种数据点,但是,一旦不能将备份数据传输到远程灾难恢复站点以及你不知道在该远程站点的TTR是多少的话,你就需要弄清楚这两个的性能了,除非这些数据已完成提取和重复数据删除。

  更多网络带宽问题

  如果在灾难恢复站点你将数据保存在磁盘上,那么重复数据删除性能可能会对TTR产生另一种影响,这种影响可能不是快速并且明显的。需要对受到毁灭性的灾难影响的多个系统进行全面的恢复,诸如此类的特定的恢复操作可能需要人们将大量的数据传输出去,并且这那样的情况下你往往不能使用广域网来完成任务。大多数的厂商支持将数据倾倒到“运送”设备(一个设备、磁带等),以便可将数据更快地运送到恢复站点(假设与灾难恢复站点不同)。通常处于主站点的数据可能遭到了破坏,但是该站点本身没有遭到破坏,并且主站点往往是首选的恢复站点。如果数据以重复数据删除的格式被存储在灾难恢复站点的磁盘上,你往往想知道,如果要想将数据以其原本的格式传输到这些设备中会需要多少时间。

  在关于在线处理和后期处理设备的不同读取性能的调查中我们发现,如果不将数据以最初的格式存储在磁盘高速缓存器的话,在线设备往往比后期处理设备的速度更快(大约3倍到4倍)。能够以400MBps的速度从在线重复数据删除设备中读取数据,与能够以100MBps的速度从后期处理设备中读取数据的差距可能会造成下载数据时的几个小时的差距,这取决于数据的数量。这一不同可能会对TTR产生巨大的影响。

0
相关文章