存储 频道

好钢用在刀刃,IBM推Easy Tier分层存储

  【IT168 专稿】在高端存储市场,IBM DS8000系列一直占有稳定的市场份额,和EMC高端系统DMX系列和V-MAX系列,以及HDS USP V一起三分天下。DS8000系列的老一代产品DS8100和DS8300在中国存储市场也一直保持了较高的市场占有率。IBM于2009年年末推出了新一代高端系统DS8700,显示IBM持续保持高端存储市场优势的决心,2010年,IBM进一步在DS8700系统里面融入了Easy Tier功能。

  据IBM科技与系统事业部中国区产品线经理庞文峥先生介绍,更新前,R5.0版本的DS8700相比原有DS8300性能提高了2.6倍,在R5.1版更新中,采用了Easy Tier后,DS8700只用了10%的固态硬盘(SSD)就达到了4倍性能提升。

  SSD企业级应用呼唤自动分层存储

  随着固态盘(SSD)技术不断进步,价格持续走低,SSD越来越多进入到企业级存储应用环境。与传统磁盘相比,固态硬盘(SSD)没有机械旋转部件,因而寻道时间更快,IOPS达到2500以上,延迟小于1ms,在性能上具有绝对优势。同时SSD消除了传统磁盘的机械磁头,因此更加绿色节能。

SSD企业级应用呼唤自动分层存储
IBM科技与系统事业部中国区产品线经理庞文峥先生,介绍IBM Easy Tier智能分层存储

  但与此同时,SSD硬盘的市场售价在传统FC磁盘的10倍左右,如此高昂的价格也让很多向往SSD极致性能的用户对此望而却步,而购买SSD的用户也多半和FC磁盘以及SATA磁盘一起混合使用,SSD、FC和SATA并存是普遍存在的情况。如何能够更加经济有效的利用SSD硬盘,使用户在SSD方面的投资发挥最大作用,成为一些存储系统厂商着力研究的课题。

  子卷级自动分层存储正是在这种背景下应运而生,如今,EMC、Commpellent、3PAR及Dell等厂商也有类似解决方案,IBM DS8700 R5.1版本的重要更新Easy Tier也是子卷级自动分层解决方案。

  尽管分层存储概念说了好几年了,真正实现起来却不那么容易,早先的分层存储方案碰到的最大的麻烦就是如何实现数据分层?早先的自动分层存储无法感知一个数据卷中读写的热点,只能通过经验丰富的系统管理员,通过应用程序的性能表现判断这个卷的数据访问压力是大还是小,迁移的时候也只能一整个卷一起迁移,而且只能手动操作。这种非自动化、不够精细的分层存储方案在实际使用过程中带来一些弊端:

  首选,一个卷中的数据往往有过热的地方,也有访问频次很低,较“冷”的数据,当某个卷的数据看起来访问性能不够高的时候,一下子迁移一整个卷,显然用户没有足够的SSD盘来提高整个数据卷的性能。其次,以前的自动分层存储往往需要手动进行迁移,操作中存在人为操作失误的风险。

  IBM EasyTier解决方案能够把一个大的逻辑卷划分成为很多小的子卷(系统默认大小为1GB),并判断这些小的子卷,哪些访问频次过高,属于“热点子卷”,需要迁移到FC、SSD等性能更好的磁盘上去。哪些子卷的访问频次不那么高,可以保留在现有的磁盘上,或者迁移到性能一般的磁盘上去,例如SATA磁盘。而且这种迁移完全是自动化基于策略的,用户完全不需要任何手工干预。

  性能管理工具与智能分层存储相得益彰

  根据庞文铮的介绍,IBM同时还推出了一套性能管理工具,与Easy Tier解决方案配合使用,能够帮助用户更有效的实现自动分层存储,提高SSD的应用效能。

自动分层存储与性能管理工具相得益彰
通过性能管理工具和Easy Tier配合使用,能够最大化提高SSD的应用效率,优化整体性能

  以往的存储系统里同样会有一些性能管理工具,但这些性能管理工具多数是监控历史和现在的性能情况,无法对将来的优化进行分析和预估。与Easy Tier配套的性能工具可以自动计算当前数据的访问压力,数据总量有多少,其中热点数据有多少?这些热点数据中,哪些正在做迁移?迁移需要花多长时间?甚至迁移后,性能可以提高多少,也能有一个系统的预估值。

自动分层存储与性能管理工具相得益彰
Easy Tier配套性能管理工具的界面,不仅仅对当前性能状况有所反应,还能对性能优化方案提出建议,并预估性能优化

  而底下的推荐工具,不仅仅能清晰直观的显示出,采用固态硬盘后,性能能够提高多少,还可以提供一个建议值,如果继续增加固态硬盘,性能能够提高多少。这样,用户是否应该追加采购,怎样在需要的性能和价格之间找一个合适的平衡点,就有了一个一目了然的性能预估报表。

  Easy Tier能够分析中系统中的热点数据,只把最热的数据保存到固态硬盘上,其他的数据放在普通的硬盘上就能够达到足够的性能。配合IBM推出的性能管理工具,两者相得益彰,能够帮助用户在有限的投资情况下,得到最高的性能。

  根据庞文铮介绍,Easy Tier功能本身并不收费,完全随机自带,用户只要使用SSD就能使用这一功能,而且由于整个配置过程完全自动,自动根据工作负载实时调整,用户不需要进行任何手动操作,配置手册也仅仅只有10页,极其容易掌握。

  追求更智能、更优化的智能分层存储

  实际上,IBM并不是业界第一家提出基于子卷甚至基于数据块的自动分层存储解决方案的厂商,之前EMC已经提出了FAST1.0和FAST2.0两个版本,FAST 1.0版本还只能移动整卷的数据,FAST 2.0就已经提供了子卷级的自动分层存储,可以说FAST也是以完全自动的分层存储性能优化为最终目的。

  不过EMC的FAST自动分层存储解决方案和IBM Easy Tier在具体实现上其实还有一些微妙的差别。EMC强调的是策略驱动,根据用户历史数据分析来手工制定热点数据的迁移策略,当然,系统内部也有内置的建议策略可供参考。IBM则完全通过系统的算法来自动实现优化。两种方式各有优劣。

  IBM认为通过策略实现热点数据迁移的方式,需要以往的历史数据用于制定策略。并且实际应用环境中,数据的访问状况是实时变化的,往往不能够即时在策略中体现并随之调整。因此,基于系统内部算法的自动调整更加灵活,性能优化的效果也更好。

  不过基于系统内部算法的自动调整也会带来一些问题:

  首先,系统内置的算法是否得当,将严重影响自动自动分层存储的系统优化效果。庞文铮表示,IBM Easy Tier有一套完整的数学模型和算法。系统内部维护一张较为复杂的数据管理表,记录该位置上数据的访问频次、迁移策略等等信息,同时,整个策略同时也有一些自我学习的过程,根据系统运行的历史积累一些数据,作为系统制定迁移策略的依据。

  其次,通过系统算法来自动判别迁移数据,本身对系统的处理能力有极高的要求,要求强大的计算能力。也因此,IBM Easy Tier只在应用Power6处理器的最新一代高端系统DS8700上才能使用,老版的DS8300和DS8100暂时还不支持,暂时也看不到部署到中端DS5000系列上的计划。而EMC FAST则已经在其CLARiiON系列中端系统上部署。  

  目前来看,智能分层存储方面走在前面的当属Compellent和3PAR。Compellent实现了更细粒度的数据块级别的自动分层存储。能够将磁盘打碎成无数个小的区块,每个小的区块上存有一部分元数据来保存这个区块的读写记录和压力,一旦这个区块的读写压力超过某一设定值,保存在该区块的数据会被自动迁移到性能更好的磁盘上去。整个系统的迁移平滑无缝,不需要人工干预。

  Compellent尽管在技术实现上较为领先,但考虑到公司规模和市场份额的限制,对智能分层存储的推动力仍然有限。如今,IBM、EMC等大型存储系统厂商已经加入到了智能分层存储的战局中,将标志智能分层存储真正走向存储的主流应用。可预见的未来,我们相信智能分层存储方案还将进一步完善和优化,甚至某一天,就成为存储系统的必备功能之一,而用户再也不必关心后台如何实现的智能分层。

0
相关文章