存储 频道

自动分层存储渐流行

  【IT168 评论】自动分层存储(ATS)不仅降低了存储容量成本和管理成本,同时还维持了适当的性能水平。

  分层存储知易行难

  自动分层存储(Automated Tiered Storage,ATS)属于分层存储,而分层存储其实由来已久。它作为信息生命周期管理(ILM)的基本内容之一,早已为众多存储管理员所熟知。但是,就像美国俄亥俄州索赔法院的高级IT经理Michael Glenn所头疼的那样,不是不明白实施分层存储的重要性,而是头疼该如何实施。

  据Glenn介绍,俄亥俄州法庭的IT系统里共存储着1.4TB的法庭记录文档。其中,仅有6%的文档会被经常查阅,而剩下的94%则静静“沉睡”在昂贵的光纤盘上。Glenn有心将这“沉睡的大多数”迁移到成本较为低廉的SATA盘上,但他为难的是如何分辨哪些数据是属于“94%”的范畴。最终,他选择了Novell Open Enterprise Server 2系统带有的自动分层存储软件DST。DST根据文档最后一次被访问的日期来鉴定该文档是否属于可迁移的非活动数据,从而实现了数据的自动鉴别和迁移。Glenn表示,这一选择,不仅为他们节约了近14万美元的光纤盘和电力支出,也将其每日数据备份时间从14小时缩短到了47分钟。

  美国Attorney General公司的IT主管Sandee Sprang也是早期ATS技术受益者之一。五年前,该公司率先采用美国康贝(Compellent)公司的ATS产品Data Progression,花了4个小时来制定迁移策略后,Sprang每周的存储管理工作从24小时降低到2小时。

  可以看出,分层存储发展至自动分层存储,主要摈弃了甄别数据和迁移数据的人工操作。而且,ATS这种数据迁移操作是双向而非单向的迁移。也就是说,它不仅能把非活动数据迁移到二、三级存储,也能将非活动数据随时迁移回一级存储,这也是ATS与传统分层存储的重要差别之一。例如,在传统的分层存储里,你去年的账单信息一旦被迁移到归档存储后,想即时查询一年前的信息就很难,你要向银行申请特批。而ATS技术可以让二、三级存储里的历史数据也实时在线,这样银行的系统就可以轻松为你提供所有的历史信息。ESG中国区总经理王丛认为,ATS技术意味着存储产品从存储资深内部调整转向了对业务应用支持的功能完善。业界亦有观点认为,ATS、无限快照数据保护、高级精简部署等一批新型存储技术代表着“第三代存储”的兴起。所谓“第三代存储”指的是面向应用的随需存储,用户可以根据业务的实际需要提供存储资源的按需分配。

  不过,直到去年以前,ATS技术还只是由少数几家存储厂商提供,而且还不能部署在非常高端的、事务密集型的环境,只能用于单一厂商的存储阵列或文件系统,或支持仅仅一个有限的存储协议或拓扑。但对于需求简单的企业来说,早期的ATS技术已经能给他们带来足够多的惊喜。

  SSD推波助澜

  如果分类的话,ATS技术分为数据块级的自动分层存储和文件级的自动分层存储。文件级的自动分层存储主要用于NAS设备上,主要由赛龙(Isilon)等厂商提供。例如,前文中俄亥俄州法庭所使用的DST就是文件级的自动分层存储。而数据块级的自动分层存储则主要用于块设备上。目前,有康贝、3PAR、EMC、IBM等大批厂商提供该技术。我们通常理解的ATS技术,其实是数据块级的自动分层存储,也是本文所指的ATS。

  虽然,ATS给人感觉仿佛是这两年来才频频露面,但康贝、BlueArc和3PAR等存储厂商其实早几年前就推出了ATS 产品。例如,康贝五年前发布了Data Progression,康贝也认为自己是第一家提供真正意义上的ATS解决方案的厂商。近段时间,我们之所以越来越多地关注ATS,是因为EMC、IBM、戴尔这些大型的存储厂商也纷纷开始发布自己的ATS技术。

  ATS为何突然受到几乎各大存储厂商的青睐?这跟SSD(固态硬盘)的日益火爆有着直接关系。

  Gartner曾表示,基于闪存的SSD将成为2010年最重要的一项技术,并预测到2013年全球SSD销量可达530万块,销售额为19亿美元。事实上,随着SSD技术的不断进步,以及价格容量比的不断走低,SSD越来越吸引企业用户的注意力。企业级SATA盘的IOPS(每秒输入/输出操作数)为75左右,延迟为4ms,光纤盘的IOPS也只有200,而最新企业级SSD的IOPS,号称已经过万,延迟小于1ms。显而易见,SSD在性能上具有绝对优势。

  SSD另一个显著优势则体现在节能方面。目前,典型的SSD工作状态下的功耗是2W左右,待机功耗小于0.1W。以配备100块FC硬盘的阵列为例,其功耗范围为3000W~3500W,如果该阵列全部用SSD替换,不仅硬盘本身的功耗能降低1500W,阵列的风扇、电源转换损耗等也会随之下降,最终使得整体功耗至少下降2000W。

  不过,企业级SSD的价格还是很贵,单价从数千美元到数十万美元不等,并且SSD盘的容量也比较小。短期内,SSD还是不可能完全取代传统硬盘。然而,将高性能、高价格的SSD与高容量、低价格的传统硬盘结合起来,就能实现高性能和低成本的结合,这也符合分层存储的基本理念。因此,EMC公司于2008年初即宣布其Symmetrix系统支持STEC公司的SSD,成为第一家广泛支持存储阵列中使用SSD的厂商。继EMC之后,IBM、戴尔等越来越多的存储厂商陆续宣布对SSD的支持。

SSD推波助澜

  在厂商们的设计里,SSD做为“0”级存储,存放I/O请求最频繁或称为“热”的数据,而第1~3层则由高容量的光纤盘或SATA盘组成,用于存放较少使用或称为“冷”的数据存储(如附图所示)。可以看出,这种分层结构必然催生迁移冷热数据,以及对SSD的管理等需求。因此,EMC于2009年、2010年分别推出FAST(全自动存储分层)技术及FAST 2(第二代FAST技术),IBM也在2010年推出适用于其高端存储阵列DS8700的自动分层存储产品Easy Tier,而日立数据亦将ATS作为该公司“2010年十大存储投资”之一。

  ATS的差异

  如今,可供用户选择的ATS技术已经比较丰富(参见附表)。表面上看,它们都是自动实现对热点数据的甄别和迁移,但彼此之间其实还是存在较大的差别。

ATS的差异

  第一大区别体现在热点数据的甄别方式上。一种是基于策略的方式,以EMC的FAST 2为代表;一种是支持全自动方式,用户不需要制定任何策略,IBM的Easy Tier、康贝的Data Progression,以及戴尔EqualLogic 5.0固件中带有的ATS技术都属于此类。

  所谓基于策略的方式,意味着存储管理员需要事先对数据进行分析,鉴别哪些可能是热点数据,然后制定相应策略,ATS软件根据制定好的策略再实施冷热数据的迁移。可以看出,该方式有个难以回避的问题:即企业的热点数据大部分都不是有规可循,而是动态变化、充满随机性的。因此根据经验制定的策略难以覆盖这种随机的热点数据。同时,该方式也需要存储管理员定期修改策略。不过,EMC公司中国区行业方案技术部经理杨捷说:“基于策略的方式具有可控、易管理、易更改的优点,而且对于不少企业用户来说,所需制定的策略并不多,也好制定。” EMC的FAST 2的默认设置其实是全自动方式,但EMC支持并建议用户选择基于策略的方式。

  事实上,这涉及到一个需不需要对ATS增加人工管控的问题。3PAR公司中国区资深系统工程师亢海峰解释说,尽管实施自动分层存储对用户而言是透明的,但它实际上是需要消耗存储控制器的计算资源,所以有些情况下,用户需要抑制或者说管控这种迁移。因此,3PAR的AO(Adaptive Optimization,自适应优化)支持策略优先权机制。3PAR还为AO引入服务质量(QoS)梯度,用户可以选择“性能优先/成本优先/平衡”三种模式,从而实现服务级别和成本目标。而IBM将Easy Tier用在其最高端的、配备Power 6处理器的存储阵列DS8700上,看来也是考虑到ATS对计算资源的消耗问题。此外,亢海峰表示,支撑自动分层优化的存储硬件架构设计至关重要,区别于传统存储,3PAR采用集群存储的架构,每个节点上还有专用的ASIC芯片来处理相应的数据移动,从而充分保证了在分层存储情况下的系统性能。

  另一大区别体现在被迁移数据的粒度方面。目前,大多数厂商的ATS技术都能实现子卷级(Sub-LUN Level)数据迁移。是否为子卷级的数据迁移,是评价ATS技术的一个很重要的参数,因为它关系到ATS技术的实际运行效果。例如,ATS技术一般被认为适宜用于Oracle等数据库系统。数据库里有很多表,表里面有很多索引,而索引一定是最热的,是我们要找的热点数据。但这些数据库很可能建在一个卷上面,如果是基于卷级,而非基于子卷级的数据迁移,就没办法将这些索引迁移出来,ATS技术的可用武之地就大打折扣。戴尔曾经做过测试,子卷级的ATS技术对系统性能的改善程度大概是卷级ATS技术的两倍。

  不过,哪怕都是基于子卷级的数据迁移,其粒度也是不同的。EMC、IBM表示最小粒度是1GB,而3PAR、康贝、戴尔则宣称能实现MB级的颗粒度。颗粒度越细,就越能避免冷热数据一起迁移的情况。但是,IBM公司科技与系统事业部中国区产品经理庞文峥曾指出,颗粒度也并非越细越好,过细可能导致迁移过度频繁,而过于频繁的迁移,对内部磁盘系统也是一个很大的压力。

  部署ATS重在应用分析

  每一项新产品和新技术面世,用户关心的话题莫过于:用在哪里?怎么用?效果如何?

  先来看效果,EMC公司最近对使用SSD的Symmetrix阵列与标准的纯HDD高性能存储阵列做了对比。标准配置由244个300GB容量、15000转的光纤盘构建而成。基于SSD的系统只用了136个同样的300GB光纤盘,但是添加了32个1TB的标准SATA盘来扩增容量,以及8个73GB的SSD来存储对速度最敏感的数据。结果,使用SSD的阵列在硬盘数量减少26%的情况下,提供的IOPS高出60%,系统所需的耗电量比纯HDD系统少21%,成本低17%。

  事实上,各ATS厂商给出的测试数据均很令人振奋。因此,凡是希望通过分层存储降低存储成本的企业用户,都可以尝试ATS。具体说来,亢海峰认为企业可先在邮件服务器系统中部署ATS。因为多数邮件在一周之后的访问频率会很低,完全可以借助ATS技术将这些历史邮件保存在SATA盘上,从而降低存储成本。

  而戴尔大客户部高级市场经理彭宇恒则表示,虚拟化的数据中心牵涉到虚拟资源的自由调度,因此会越来越多地用到ATS技术。例如,在桌面虚拟化环境中,往往会出现如此情形:每个工作日早上九点,刚上班的员工都会打开电脑,向服务器“索取”操作系统,因此服务器会有一波I/O访问高峰,ATS技术就可以将这些访问热点迁移到SSD上。实际上,EqualLogic PS 6000XVS和PS 6010XVS均按照虚拟化环境的要求进行设计,主要是为了解决配置虚拟化桌面基础设施中遇到的各种难题。

  当落实到ATS的实际部署上,杨捷说,最重要的是要和用户一起,分析关键应用和关键数据究竟是哪些,从而计算出这个分层系统上采用了多少SSD盘、多少FC盘,以及多少个SATA盘才是最合理的搭配。不过,庞文峥介绍说,IBM为Easy Tier匹配了一个监控工具。该工具能告诉用户,现有存储阵列中的固态盘数量是否不够?如果再增加固态盘的话,你的性能又能提高多少?从而帮助用户避免过度投资或投资不足,在性能与成本之间找到非常好的平衡点。

  更值得用户注意的是,戴尔亚太存储技术总监许良谋在一次媒体采访中指出:当数据发生层次化迁移后,I/O链路、I/O端口的配置和安全策略都需要随之发生变化。对于自动分层存储层,不能只考虑磁盘介质,后续还有很多问题,所以一定要从整体的存储环境、用户需求来考虑。

  此外,各家的ATS技术只适用于各家的存储阵列(参见附表),并且多数只能用厂商指定的SSD。 对此,一些国内用户表示,他们希望ATS技术能跨不同系统类型,跨不同厂商的存储产品。也希望能自由选择SSD品牌及型号。亢海峰则表示,由于牵涉到元数据标准等多个问题,用户的这一要求短期内还是比较难实现。

部署ATS重在应用分析

  “ATS技术意味着存储产品从存储资深内部调整转向了对业务应用支持的功能完善。”

  ESG中国区总经理 王丛

部署ATS重在应用分析

  “ATS需要消耗存储控制器的计算资源,有些情况下,用户需要抑制或者说管控这种迁移。”

  3PAR公司中国区资深系统工程师 亢海峰

部署ATS重在应用分析

  “部署ATS最重要的是要和用户一起,分析关键应用和关键数据究竟是哪些。”

  EMC公司中国区行业方案技术部经理 杨捷

  “颗粒度也并非越细越好,过细可能导致迁移过度频繁,而过于频繁的迁移,对内部磁盘系统也是一个很大的压力。”

  IBM公司科技与系统事业部中国区产品经理 庞文峥

部署ATS重在应用分析

  “虚拟化的数据中心牵涉到虚拟资源的自由调度,因此会越来越多地用到ATS技术。”

  戴尔大客户部高级市场经理 彭宇恒

  编看编想

  ATS会过时吗?

  和其他的电子器件一样,SSD总有一天会变得很便宜,那么自动分层存储技术是否会没有存在的必要了呢?笔者认为,不会。理由主要有以下两点:

  首先,对企业用户而言,管理爆炸性增长的结构化及非结构化数据是一个日益逼近的重大挑战。数据压缩、重复数据删除、自动分层存储等这些有助于降低企业存储成本的技术,在海量数据时代只会越来越受企业的青睐。

  其次,随着数据中心虚拟化的程度逐渐加深,大量虚拟资源和实际的物理资源交织在一起。依靠人工方式,要高效管理这样一个动态环境几乎是不可能的。因此,凡是利于减轻管理成本的自动化管理工具都会有市场。

  如今的ATS技术,还只限于某些厂商的某些存储阵列。而且在许多用户看来,理想的ATS应该能跨不同系统类型、跨不同厂商的产品,甚至在云中对数据进行移动和分层。所以,对于ATS技术而言,一切还只是刚刚拉开序幕。

0
相关文章