存储 频道

三级分层存储将在未来大放光芒(下)

  【IT168 评论】在上篇文章中,我们介绍了三级分层存储的必要性、分层模型以及服务器及SSD的选择方法,下面我们将进一步介绍如何对层2和层3进行选择,以及采用这种选择的原因及带给企业的好处。

  驱动器选择:3.5英寸机械硬盘

  和Pulsar 系列产品一样,企业硬盘驱动器市场上也有SAS和SATA两种选择。此外,还可根据规格尺寸(2.5英寸 或 3.5英寸)、容量和磁盘转速来划分硬盘驱动器。出于方便的考虑,我们来看一下最先应用于传统的希捷3.5”企业驱动器系统时,这三项参数以及它们与各分层的结合情况。

  希捷存储栈的底层用的是Constellation系列,该系列包括Constellation ES和Constellation ES.2。两种型号的转速均为7200 RPM,且都有加密版本。Constellation ES的容量有500 GB, 1 TB和2 TB,并且可以选择16, 32和64 MB三种高速缓存。用户可以选择购买3 Gb/s SATA, 6 Gb/s SATA或6 Gb/s SAS三种接口。Constellation ES.2有6Gb/s SAS 或 SATA两种,并且以最高3 TB的容量配以 64 MB高速缓存为亮点。但Constellation ES 和 Constellation ES.2都标榜有120万小时的MTBF评级(0.73%的年故障率),这也说明,尽管Constellation ES的容量较低,但传输速度能保持在147 MB/s,而Constellation ES.2最多也只有155 MB/s。这是源于两种型号面密度的不同(数据存储在磁盘上的密集程度):Constellation ES的324 Gb/in2 VS Constellation ES.2的444 Gb/in2。

  很明显,Constellation家族的性能和容量刚好契合Tier 2。

驱动器选择:3.5英寸机械硬盘

  Constellation家族里还有一款每分转速为7200 RPM的2.5英寸产品,有1 TB, 500 GB和 250 GB三种容量。跟Pulsar SSDs,Savvio 15K和 10K高性能驱动器一样,这个小巧驱动器也能放入2.5-inch的分层存储设备中,这一优点让Tier 2多了一个高容量又划算的选择。

  说到Cheetah NS, 这个形状系数3.5英寸转速1万的驱动器时,如何给它归类就没那么好预测了。关于这个驱动器,先撇开规格不说,你首先注意到的可能是它的托盘大小和一个2.5”驱动器是一样的。它的小直径让它有了具备更高转速的可能。NS 10K 的类型有300, 450和 600 GB三种。无加密功能,但用户可以在4 Gb/s光纤通道和6 Gb/s SAS两种接口之间进行选择。

驱动器选择:3.5英寸机械硬盘

  可以预见到,Cheetah 15K也具备了上述功能,直径尺寸依然很小,但它的转速达到了15 000 RPM—目前为止最高的转速。容量跨度从73.4 到600 GB不等,每种都带有16 MB高速缓存。4 Gb/s光纤通道或6 Gb/s SAS有更高存储容量的型号。

驱动器选择:3.5英寸机械硬盘

  SSD普及之前,最高层存储都选择像Cheetah 15K这样的驱动器。而现在,你可以考虑更多的因素并评估过IOPS性能和额定功率后再做选择。

  HDD 驱动器选择:2.5英寸机械硬盘

  近几年,2.5英寸驱动器(15mm高)越来越受企业存储的青睐,部分原因是它们具有较高的存储密度和能效。尽管单个2.5英寸驱动器的容量可能比3.5英寸的要低,但因为它身材小巧,所以相同的存储空间中能配置更多驱动器。就像IBM在其存储著作中所指出的,2.5英寸驱动器能“在在同样大小的空间里几乎多装90%的驱动器”并“减少40%的存储空间需求量”。因此,一样大小的存储空间中,可以存储更多的数据,并实现更高的总体性能。

  希捷的2.5英寸企业级HDD 最早用的是Constellation 和Constellation.2,其中Constellation.2尤其代表了最新一代的近线磁盘存储技术。6 Gb/s SAS和SATA的容量都达到了1 TB,都可以选择6Gb/s SAS和SATA两种接口,并且驱动器转速都是7200 RPM。该系列有具备加密功能的型号以及140万小时的更高的MTBF。(0.62%的年故障率,超过了它的同门3.5英寸)

HDD 驱动器选择:2.5英寸机械硬盘

  2.5英寸HDD圈的核心是我们的Savvio 10K系列产品,它提供了性能和容量的非常好的结合,该系列产品中个个都具备了200万小时的MTBF(0.44%的年故障率)以及10 000 RPM的转速。最新的Savvio 10K.5的容量达到了300到900 GB,这要归功于它506 Gb/in2 的面密度。 This also enables a 168 MB/s sustained transfer rate across the drives’ 6 Gb/s SAS interface. 这一特点也让该驱动器的6 Gb/s SAS 接口具备了168 MB/s的持续传输率。

  不过,希捷公司小型硬盘驱动器的制胜法宝还是Savvio 15K.3。这款驱动器有146 GB 和300 GB两种型号,使用15 000 RPM转速以及6 Gb/s SAS接口,持续传输率刚勉强达到200 MB/s。

HDD 驱动器选择:2.5英寸机械硬盘

  现在,Tier 1存储实际上是由Savvio系列产品来定义的。它的存储密度最大,同时还使用一款高速又便宜的SAS 接口。想要什么样的性能可以根据预算来平衡,因为15K 驱动器具备了所有最好的优点,除了在Tier 0级移至SSD之外。这一概念总体适用于分层式存储。抛开价格谈性能是不现实的,因为分层式存储的终极目标始终是:只要条件具备,就将使用率更低的数据存入成本更低的存储媒介。

  节能

  随着电力成本的上涨,各方对提高能效所施加压力的增加,人们越来越关注存储驱动器的耗电量。如果单拿一个来看,一个5W和8W 600 GB驱动器的区别可能只是这两个数字的区别,但如果是1000个驱动器在随着时针运转,这3W的区别就是每年几千美元的能耗差距了。

  人们普遍认为SSD比硬盘驱动器更节能,如果是从每秒I/O操作数这个指标来看的话,这种想法当然没错。 但不是所有的应用程序都把IOPS 视作主要的衡量标准。400 GB Pulsar XT.2是现在非常先进的型号,它的平均耗电是6.67W,而2.5” 500 GB Constellation.2是5.48W,也就是说每个驱动器容量高100GB的情况下还能节电近2W。是的,这两种驱动器的性能和价格悬殊很大,但当预算和密度的优先级比性能更高的时候,比如以一般的Tier 2存储为例,Constellation.2在绿色节能方面就是非常好的选择。

  为了研发让企业级驱动器能效实现最大化的技术,希捷公司已经花了几年的时间。几年前,Barracuda ES和Cheetah 15K 3.5英寸驱动器最先拥有了被称为PowerTrim的功能,当驱动器的某些区块没有存取操作的时候,PowerTrim可降低这些区块的耗电量。希捷公司现在已经采用了T10/T13委员会公布的标准,他们对该标准进行修订后将其命名为PowerChoice,首先由Savvio 10K.4, Constellation和Constellation ES系列使用。

  PowerChoice 理论上是非常适用于二级存储的,因为驱动器的闲置时间最低从1秒起长短不等的时候,PowerChoice就派上用场了。如下图所示,一小时的休止状态将启动Standy_Z 模式,将耗电量降到仅为1.29W,用电因此会节省54%。这将触发大约8秒的起转时间,但是我们需要强调的是,这是近线数据,如果需要等待8秒以上的话,最好是像5年前的航班记录这样的数据。

分层存储带来的节能效益

  这四种闲置模式会在驱动器内触发不同的程序。比如,模式A和B将保持磁盘以全速转动,但A可以减少驱动器处理器的能耗,而B则会将磁头移到驱动器斜面上。模式C 会降低RPM 率,而D会让系统彻底停下来。请注意,管理员可以根据用户需求定制这些驱动器的计时和电力过度状态,从而将驱动器调整到最适合用户系统环境的状态,实现系统性能的最优化。

  耗电量会直接影响总体运营成本,是评价一项完整分层式存储技术的关键指标。

  ILM和成本回收

  企业或组织一旦确定了自身的存储需求,并决定了使用哪种方法对不同的数据组进行分层以实现非常好的性能和利润后,接下来的任务就是如何让数据在各层之间自动传输的问题了。下图来自SNIA(全球网络存储工业协会)数据管理论坛,它对数据如何在不同层间流动给出了一个初步的想法,但很显然,数据流的控制应该是自动化的。 因为这样的管理极其繁琐,所以除了那些非常小的公司之外,如果其他公司想用人工管理是很不现实的。

ILM和成本回收

  存储分层是信息生命周期管理(ILM)实践中的一个分支。而分层式存储则指如何排列数据,ILM是说明了信息如何从最初生成发展到最终处置的一组操作和规定。SNIA对ILM的具体定义是:“信息生命周期管理包括策略,处理,实践和工具,最终处置信息的过程中会得到一些数据,信息生命周期管理能将这些数据的商业价值和最适合的价格最优惠的IT系统结合起来。把管理政策、服务质量和应用程序、元数据、信息及数据联系起来,在此基础上,实现信息和业务流程的完美联合。”

ILM和成本回收

  有一种简化理解ILM的方法——将重心放在日期和频率上。“ “飞机在X点起飞后,将该记录从Tier 0 移动到Tier 1,” 或者“如果某项数据每周的访问次数低于X次,就将它从Tier 1 移动到Tier 2”。有时,这就是一个完整的分层存储技术实现稳固投资回报率(ROI)时需要做的全部工作。戴尔公司谈论它的Compellent Fluid Data产品时指出,按照下面的原则,可以优化数据迁移:

  • 减少驱动器数量和降低供电/冷却成本的时候避免使用手动数据分级和迁移。

  • 如果Tier 1存储器中有经过性能优化的RAID,如RAID 10,就把活跃的数据块写入该Tier 1存储器

  • 把不活跃的数据块自动移动到较低级的存储器中,且该存储器中要有保护功能强大的更贵的RAID 5或6

  • 将SSD, FC, SAS和 SATA驱动器混在同一个系统中使用,而且同一个磁盘柜里SAS驱动器要有多种转速。

  • 优化写入性能和数据读取能力,以应对SSD中的关键应用程序

  • 为任何一层增加容量的时候以及接到请求需要自动重新分布数据的时候不出现停机或系统崩溃

  正如戴尔在下图中所示,数据不会总是从热移动到冷,注意到这一点很重要。很多情况下,数据可能需要从慢存储层迁移到快存储层,这也是为什么存储架构必须要可靠和高效的部分原因所在。

ILM和成本回收

  进一步调查研究ILM是很有必要的,因为如果没有合适的ILM,也就是说它没有得到你的IT团队和管理层认可的话,就不会实现存储投资的非常好的回报,你的数据也可能存在更大的风险。

  企业存储的重要性不只是ILM。随着虚拟系统——从存储器到服务器到云再到客户端——在复杂性和普及度上的持续增长,分层也开始逐步应用于这些领域。分层化存储在业界普及的这一天肯定很快就会到来,如果现在还没有的话。这也是为什么在构建分层存储系统时,每一层都要用最好的驱动器会那么重要了。找到你的企业需要的存储层,拟定一个高效可扩展的数据移动技术方案,并在这些存储层中使用正确的驱动器,这样就能形成稳定投资回报率了。

0
相关文章