【IT168 评论】如今对于很多企业来说,需要备份的数据量正在急剧增加,那些负责管理备份的工作人员可能会突然发现,自己要负责管理多个PB的数据。这种不受控制的增长会使备份管理员被迫不断追赶数据的脚步,并可能给IT预算带来很大的压力。
幸运的是,IT专业人员可以通过采用一些经过经过验证的优秀的实践方法来处理备份数据。对于那些有PB级海量数据需要备份的管理员而言,建议通过以下三个步骤来控制这些数据。
步骤1:验证数据保护要求
评估大型企业的数据保护工作,这一过程并不容易,首先需要确定当前正在备份哪些资源以及谁拥有这些受保护的资源。
无论在何种程度上,备份管理员都必须与相关人员会面,以确定每个工作负载的保护需求。这个过程背后的目标不仅仅是找出可能已经存在的服务级别协议(service-level agreement, sla)——尽管这也很重要。更大的目标应该是确定每个工作负载的备份保留需求和预期的未来数据增长,这两者对于长期容量规划工作都是必不可少的。
简单地说,如果不知道具体的数据保护需求和预期的数据增长,几乎不可能控制一个庞大而臃肿的备份数据集。
步骤2:检查当前备份体系结构
评估企业当前数据保护工作的第二个重要步骤是花一些时间检查现有备份工作,以此发现任何潜在的低效之处。常见的情况是发现重复的备份工作——这将极大地带来备份数据的增长。备份管理员甚至可能会发现,通过每天对受保护的资源执行完全备份(而非增量备份),配置错误的备份工作正在快速增加备份数据所占用的空间。
在此过程中,确保以符合任何现有SLA的方式创建备份是非常重要的,这也是使用重复数据删除来减小备份数据大小的好时机。
步骤3:开发数据生命周期管理策略
一旦备份管理员确定了数据保护需求,他们就可以开始为备份数据创建数据生命周期管理策略。这些策略确保将工作备份集保持在可管理的大小,同时还确保将备份数据保留一段时间。
数据生命周期管理策略通常会将老化的数据从主备份目标转移到存档中。此存档可以存在于本地或云中。但是,如果企业决定将一些现有存档数据迁移到云,那么备份管理员就需要与云服务提供商合作,以确定迁移如此大的数据集合的非常好的方式。
数据生命周期管理策略不仅仅是将数据迁移到归档,备份数据最终会达到其有效寿命的终点。一个好的数据生命周期管理系统应该能够根据组织的数据保留策略自动清除过期的数据。
处理多PB的备份数据并非易事。然而,通过采用系统化的、有效的方法,备份管理员可以更好地组织数据并缩小备份所需的空间。
原文作者:Brien Posey