存储 频道

忽视它后果自负!分析磁带迁移注意事项

  磁带

  确定需要的磁带驱动器数量非常困难,你需要多少新磁带驱动器才能满足用户需求?你需要多少旧磁带驱动器才能满足用户需求?你需要多少新磁带驱动器满足更多数据的迁移?它们会随时发生变化吗?如果某个作业要等待检索归档数据,对中心有多大的影响?很明显,要回答这些问题非常困难,如果你的数据足够准确,其中部分问题的答案可能是标准的,但是,诸如某个作业等待造成的影响这种问题是无法标准化的,从旧磁带往新磁带读取数据要花多长时间完全不可预测。

  以LTO-4 800GB,速度120MB/s为例,假定你开始从驱动器读取数据,采用的策略就是读取磁带盒上的所有数据,读取整个驱动器将要2个小时的时间,因此磁带驱动器将要被使用2小时。当然,这是一个和HSM软件有关的策略问题。这仅仅是规划迁移时需要考虑的一个方面。

  根据归档数据使用模型(例如,数据是作为计算作业的输入吗?如气候模型),归档支持多少时区,以及用户日常工作时间的不同,归档负载通常是变化的,因此难以作出准确的判断,你必须多准备一点磁带驱动器,因为驱动器通常比预计的使用时间要长。

  这通常是一个预算平衡问题,旧磁带驱动器的成本通常很低,新驱动器的成本通常更高,但是,你等待迁移的时间越长,磁带驱动器和磁带的成本越低,但更多时间是花在获取旧驱动器上的数据上,因此,很难确定最优的成本模型。

  光纤通道交换机端口

  如果你有更多的磁带驱动器和更多的存储,你将需要更多的交换机端口,你可能有足够的剩余端口添加新硬件,如果新的存储或磁带驱动器需要下一代光纤通道,你可能需要升级你的交换机。

  RAID存储

  大多数归档系统必须读取旧磁带上的数据,写入磁盘,再从磁盘读取写入到新的磁带,如果归档软件要求你使用磁盘作为迁移过程的一部分,你需要增加存储空间和带宽来支持迁移,究竟需要增加多少取决于你有多少剩余带宽和存储空间。例如,端到端读取一个LTO-4磁带,并输出到LTO-5需要使用大量的空间和带宽,如果你想一次性完整写入,你必须读取1.5TB空间,持续140MB/s的带宽写入磁带,如果数据可压缩,最大可达240MB/s。这可能要占你RAID控制器很大一部分带宽,假设是8Gb光纤通道,都要占30%。

  服务器

  需要将数据读取到磁盘的归档系统(与之相反的是磁带-磁带迁移的归档系统)将需要更多的CPU时间片读取数据,确认检验和写入检验和,它们也需要更多的内存带宽和PCIe总线带宽将数据移出系统,服务器和存储,以及磁带带宽增长相称是最困难的问题。

  软件因素

  很明显,每个归档软件厂商都有一套工具为迁移数据提供支持,这些工具通常有许多可调整的参数,允许管理员控制迁移速度和对系统产生的影响。一般来说,他们会根据工作负载,而不是读取磁带需要的时间进行适当调整,调整的所有问题必须提前考虑到。

  用户

  用户通常对资源的可用性抱有较高的期望,一般都会写入SLA(服务水平协议),如果你正在迁移磁带,你必须确定会给用户带来多大影响,并保证不会违背SLA,通常,这需要在迁移时间和响应时间之间进行权衡。

0
相关文章