存储 频道

磁带驱动器的回顾与展望

  【IT168 资讯】过去30年来,同磁盘存储技术相比,磁带技术的变化不大,但在大多数环境下(尤其在企业环境下)磁带仍然是可靠性的保证。即使你拥有离站远程镜像,大多数情况下,仍然使用磁带。在磁带仍然普及的情况下,我们将谈谈有关磁带硬件方面的事宜。 

  磁带技术的发展步伐不及磁盘技术快,在对磁带技术的评估中,大家仍然可以了解到不少东西,本文将作具体介绍。

  磁带驱动器

  大多数企业环境中使用顺序格式把数据写入磁带驱动器,然而,还存在另外一种更高存储密度类型的磁带:螺旋磁带。在该磁带驱动器上,有更多的磁头接触螺旋磁带。在线性磁带中,顺着驱动器,沿着长度方向写入数据。在螺旋磁带中,数据则沿着磁带在水平方向写入,因而磁头接触范围更多。下面给出了对这两种类型的磁带的比较:

  如果出错检测缓冲区满了,螺旋磁带上的一个很小的缺陷就可以破坏数据的正确性。磁带上有纠错空间,如果该空间满了,磁带将变得不可读。

  假如磁带头在磁带上紧密接触,螺旋磁带头不比线性磁带头耐磨。

  由于接触多意味着磨损多,线性磁带在存储介质和磁头的寿命方面,都比螺旋磁带更长寿。

  由于存储介质的磨损,高端的线性磁带通常比高端的螺旋磁带的寿命更长。

  线性磁带厂家和型号包括:IBM 3590B/E, STK 9840/9940, Quantum SuperDLT, 老的DLT 7000/8000和LTO.

  螺旋磁带的厂家包括:Sony,它生产AIT-1和AIT-2,以及DTF磁带。其他的螺旋磁带的型号包括8mm Mammoth和Mammoth-2 4mm(DAT).

  压缩

  同磁盘和RAID一样,几乎所有的磁带能够自动压缩数据流的输入,当选购磁带驱动器时,这是个重要的考虑,因为不同的驱动器有不同的压缩算法。IBM的企业磁带驱动器和StorageTek 比诸如DLT和Mammoth这样的低端驱动器具有更高的压缩率。驱动器厂家通常提供的是期望压缩率,而这些是平均值,而且你使用磁带的实际用途各不相同。如果存储介质的成本是驱动器成本的函数,压缩就是重要的。请看下面的例子:

  驱动器 1

  驱动器成本:$35,000

  存储介质成本: $75

  压缩率: 5:1

  驱动器容量: 250 GB

  驱动器 2

  驱动器成本:$5,000

  存储介质成本:$75

  压缩率: 2 to 1

  驱动器容量:250 GB

  假如你有400TB的原始数据需要备份,所以你打算购买一个新的磁带系统。驱动器1需要327 片存储介质,成本为$24,525,系统总成本为$59,525。驱动器2需要820片存储介质,成本为$61,500,系统总成本为$66,500。 

  很明显,在考虑磁带系统的总成本时需要考虑压缩比。但是,对于每种驱动器进行压缩的程度有所不同。检查磁带上的数据是否可压缩,一个快速的方法是使用带-9选项的gzip程序:

  # gzip -9 filename

  你将得用统计学上有意义的一组数据样本,来测试考察中的每种磁带驱动器,并以此判定驱动器的性能。

  了解你的应用程序环境,对开发一个好的体系结构是重要的。在磁带加载,准备,定位和回转时,磁带驱动器和相应的库具有不同的特性。在一些情况下,如备份这样的应用程序中这并不重要,而在大多数情况下,你所做的是加载磁带,并顺序写入大量数据。

  另外一方面,在层次化的存储管理中,应用程序磁带加载,定位和回转时间成为一个关键问题,尤其是读回数据。 随着存储密度的增加,在备份的时长有限制的情况下,分层存储管理(HSM)应用程序变得越来越流行。事实上,StorageTek专门为带有小文件的分层存储管理(HSM)应用程序开发了T9840A和B型驱动器,其加载时间为4秒,首个数据字节读出的平均时间为8秒。典型的其他产品的首个数据字节读出的平均时间则是T9840A和B的6倍到15倍。

  但是,如果文件大,加载和定位时间同传输时间相比,就显得重要了。如果你有一个200亿字节的文件,压缩后传输率为30 兆字节/秒,传输时间为682 秒。 60秒的加载和定位时间仅占总时间的7.5%。在设计一个系统时,把加载和定位时间保持为写数据所用时间的10%,这是一条好规则。

  当然,对于HSM应用程序,读出数据则与写入数据大不相同,因为大多数应用程序可以整合文件,以便确保写入大容量的数据。对于HSM应用程序来说,用磁带读数据时,检索文件的速度,检索文件的大小,检索速度的要求,这些指标都需要了解。一家存储口令信息的信用卡公司同检索基因用于比对的遗传学研究网站其检索速度要求大不相同。

  趋势

  磁带会消亡吗?有不少大的存储厂家在3年前,2年前,去年,甚至来年,都宣称磁带要消亡。但是磁带比磁盘存储具有一些重要优点,所以磁带还会存在一段时间。下面列举出一些理由:

  磁带不需要电源。大多数现代的磁盘驱动器为了可靠性,需要消耗电源,例如Seagate 120GB ATA驱动器,功耗为13瓦。如果你有400千兆字节的辅存,消耗的电源将变得很昂贵。

  更低的误码率。ATA驱动器(FC和SCSI驱动器更好些)的位误码率为 10 的14次方分之一,企业磁带的位误码率为10的18次方分之一,其他磁带(AIT和DLT) 的位误码率为10的17次方分之一。磁带比ATA和SCSI磁盘驱动器的可靠性要高两到四个数量级。

  磁带比磁盘具有更高的抗震性,摔下后仍然完好。我们都曾经或者自己不小心摔过磁带或者看到别人把磁带摔到地上,磁带却平安无事。

  至少今后若干年内,磁带和磁带驱动器将继续作为存储结构的关键部件而存在。这个趋势将持续下去,因为从总体成本上看,一旦比较了旋转存储器对电源的需求和磁带驱动器对数据压缩的支持这些情况,磁带远比磁盘存储器廉价。市场上即便是低端的磁带,也担保具有30年的寿命。(当然,拥有30年历史的磁带是可能的,但是到时你如何读出其中的数据倒是一个问题?) 磁带,同一切存储介质一样,依赖于如下的外部因素:

  是什么接口?试着找找1990年的SCSI-1接口,而20年前的IPI-3 接口就更罕见了。

  磁带驱动器能够读磁带上的数据吗?30年前的少数的7轨道磁带成了古董,能够找到读出该磁带的人更是不可能。

  磁带的数据格式是什么?例如,一些厂家以tar格式写入,但是到2033年会有tar格式或者存在象Veritas Netbackup 这样的应用程序吗?至少可能还会有Tar格式。

  读出的数据是什么?存在能处理它的程序吗? PDF格式目前很流行,目前的应用程序可以读出该格式,但从磁带上读读10年前的MS Word 2.0文档,并把它读入MS Word 2002试试看?

  总之,在作最初决策时,就要做好变迁的准备,这点是本质的。一切都不会是永远的,尤其是你的数据。

0
相关文章