第三驾马车:基于策略的自动分层存储
在IT168早先的文章2010趋势:SSD推进自动分层存储新发展就已经预测过,随着SSD在企业级应用逐步破冰,用户开始关注自动的基于策略的分层存储解决方案。2010年自动分层存储的新标识将包括两点:首先是针对SSD硬盘和传统硬盘的统一管理,其次是完全自动化的基于策略的数据迁移。
实际上,自动分层存储已经是较早提出的技术,分层存储的基本理念是,根据不同的数据价值以及访问频次,将不同的数据保存在不同性能的存储介质上,从而总体控制存储容量成本的同时维持适当的性能水平。由于SSD介质性能高价格昂贵,因此自动分层存储与SSD搭配使用,能起到突出的降低成本,简单管理的效果。
尽管自动分层存储“看起来很美”,但用户在使用中的一个麻烦就是,如何实现数据分层?目前大多数自动分层存储解决方案都是基于手动迁移,操作比较麻烦而且无法根据业务符合的变化灵活调整。而且进行数据迁移的时候,往往需要迁移一整个LUN的数据。
Craig介绍说,新的自动分层存储技术允许一个数据卷可以跨越不同的磁盘介质,例如一个卷可以跨越SATA、SAS、SSD等不同的介质,3PAR的自动分层存储管理软件可以监控到这个卷里面的访问频次不同的“热区”和“冷区”,将访问频次较高的“热区”移动到SSD介质上,访问频次较低的“冷区”,自动迁移到性能较低的磁盘介质上。这样不但实现了完全的基于策略的自动数据迁移,而且每次迁移,不用再迁移一整个卷的数据,只需要将一个数据卷中较热部分的数据迁移到SSD硬盘区,因而充分提高了SSD硬盘的应用效率。
跨域不同磁盘介质的卷
实际上,3PAR在磁盘Chunklet组成的虚拟盘的基础上进一步划分了Region,每个Region为128MB大小。根据Craig的介绍,Region的概念早在2005年左右已经引入,但是2005年,3PAR只能够做到感知一整个卷的磁盘类型和RAID类型,而到2010年,最新推出的管理方案已经能够感知磁盘区中,每个Region的磁盘类型和RAID类型。
不同的应用卷跨越不同的磁盘介质,而且根据卷中不同区域的访问频次不同,在不同的磁盘介质中自动迁移,而不需要进行整卷迁移
此外,系统将以IOPS/min为单位自动监控每个Region上的访问频次,当某一个Region的访问频次超过设定值的时候,该Region上的数据将被自动迁移到更高性能的磁盘上去,例如SSD。
上图反映了虚拟盘上不同Region的不同访问热点,每个Region都可根据硬盘类型和RAID类型来定义,以IO率密度作为数据迁移的主要因素,定义了每个Region每分钟每GB的IO量,识别繁忙与非活跃区域,并完成自动迁移,以前的方式则只能做到定义每个卷的RAID和磁盘类型,无法形成细粒度的分层存储解决方案
有关自动分层存储EMC、Commpellent等厂商已经有相关的解决方案推出,EMC FAST技术认可度高版本已经推出,在第一阶段面向EMC Symmetrix V-Max、EMC CLARiiON CX4和EMC Celerra NS。目前FAST只能在不同存储层级之间移动整卷数据,预期FAST 2.0版本将提供文件系统级和次级LUN级别,甚至数据块级别。
Commpellent的自动分层存储则提出较早,并实现了更细粒度的数据块级别的自动分层存储。Craig认为3PAR目前的自动分层存储在思路上和Commpellent较为类似,但Commpellent更偏重于中低端市场,3PAR则首次将自动分层存储引入了高端阵列。