存储 频道

分层存储架构的原理与实施选择

  【IT168 技术】分层存储是将不同类别的数据分配到不同类型的存储介质上,目的是提高存储效率,减少总使用成本(TCO)。存储分类基本上是根据应用程序的服务层面的要求,包括可用性、性能、保存要求、使用频率以及其他因素等。由于大量的日益增长的电子存储数据、非常好的实践政策、自动持续性分配软件、特定数据匹配以及设备特点等因素,分层存储可以非常复杂。

  分层存储架构原理

  分层存储可以采取多种形式,而且经常是存储架构增长的自然结果。通过将高速缓存分配给不同数据,以及/或通过使用不同特点的物理上分开的存储阵列,分层存储可以在一个阵列内建立(使用不同容量的或不同性能的磁盘驱动器)。

  分层存储号称可以节省多达50%的存储使用成本,使得它成为无差别容量配置的一种有吸引力的方案。分层存储的主要商业驱动因素和终端用户的考虑包括如下:

  ● "SAN(存储局域网)的异构"导致了互不兼容的存储孤岛,没有很好的方法能够在服务器和磁盘阵列之间共享数据;

  ● 兼并和收购带来了异构的SAN架构,进一步增加了复杂性;

  ● 昂贵的一级(Tier-1)架构在一些时候显得成本太高,使得许多公司发展"避免一级架构"策略;

  ● 迁移和配置复杂性要求应用程序关闭,以便迁移数据或配置新的容量,由此引起的每迁移阵列成本经常超过50000美元。

  Wikibon.org进行的终端用户研究显示在硬件和软件上每花一美元,还要花50美分在数据迁移和阵列使用期间的配置上面。通过分层存储,这一数字可以降低到每一美元硬件软件花低于10美分在迁移和配置上。

  在主机领域,自动分层存储已经实现多年,为什么IT界对它这个目标如此健忘呢?答案,当然是,在于主机外的存储异构性。由于存储硬件、应用、技术以及架构的分化,因此虽然几位厂商有努力实现自动化,但是还是面对很大的挑战。结果,作为一种积极策略,分层存储的市场渗透率只有10%到15%,虽然根据有些人的定义,实际上每个公司都有一定形式的分层存储。

  一种可能的策略是将磁盘存储迁移到一个单一架构(例如,所有都到一级存储),但是这种方法成本非常高,而且绝大多数用户不能这么做。数据格式仅仅是其中一项挑战(例如,块 vs 文件),甚至还不是最难的问题。真正阻碍分层管理的采用的问题是如何建立一个有效而且"自动的"基于政策的跨IT环境的分类系统,并使这个系统受各个应用和用户组的数据访问需求所驱动。

  为支持这个,一些公司降低需要管理的分层数,明确沟通这些方针,并且同时对前段服务器资源和后端存储资产进行虚拟化,从而简化了策略。虚拟化的一个关键好处是应用程序能够保持其所看到的存储资源,但是这种观感其实可以在任何时候由任何地点映射过来的--并且是动态的。数据可以进行无缝的迁移,而应用不会发觉这种变化。但是,虚拟化也带来其本身的一系列问题,包括其实施复杂性,以及许多应用的性能问题(下面讨论)。

  对于不考虑虚拟化的用户,其解决分层存储的方法是专注于同质数据--例如电子邮件系统和软件开发数据--的大型数据池、以及围绕这些迅速增长的数据池建立分层存储岛。这种方法也能节省大量成本,而且其实施比起虚拟化要容易得多;但是,持续管理费用的增长可能非常快。平衡的方法就是需要用人力手动地为这些数据池构建桥梁,而且由于应用程序需要知道变化,因此这些应用程序需要被中断。

  虚拟化开始以自动运行的方式来构建这些桥梁,而且看起来可能是将来许多大型企业的非常好的解决方案。但是,作为一种方案,几个厂商提供的"内置"分层技术可以让更高容量、更低成本的设备在同一个阵列中作为一种更高成本、更高性能、更低容量的驱动器而存在。虽然这是分层的一个最简单的形式,用户有时还是不情愿采用这种方法,特别是当它需要给更昂贵的一级存储平台增加容量时。

  重要的是,虽然大部分的分层存储讨论集中在高成本、高性能的一级存储,以及成本更低的二级存储这个中间解决方案,但是世界上的超过一半的数据是存在于三级系统,要么是非常低成本的磁盘,要么是磁带技术。这对用户来说是个很大的问题,在分层存储策略如记录管理和保留政策中--越来越进入存储管理者的日常工作流程的策略--必须考虑进去。做什么

  许多有兴趣解决SAN问题--如速度慢、存储增长超过控制、难以承受的迁移成本--的公司开始转向分层存储并采取以下措施:

  ● 明确定义恢复点目标(RPO)和恢复时间目标(RTO),并将这个作为数据放置的依据(相对于业务范围导向且没有明确目标的一级服务);

  ● 同业务部门沟通这些要求,允许IT部门根据这些政策方针来进行存储分配;

  ● 简化层级,要求最严格的应用程序放在一级(根据服务层次),其他的缺省地放在二级,并且根据记录管理和保留政策--按照法律规定和公司要求--迁移到三级存储;

  ● 虚拟化前端和后端资源,在存储阵列外提供一个服务层,并逐渐倚重低成本阵列来降低硬件成本和减少昂贵的存储软件许可证支出。虚拟化所有可能二级存储,并尽量虚拟化一级存储;

  ● 存储管理软件和流程,减少现有的存储管理软件套件,如果可能,减少到一个套件;而且

  ● 按应用程序分组,仔细测试虚拟化的可靠性和性能,在合理的时间范围内进行部署;

  在建立了一个单一的SAN环境之后尽可能快地实施分层存储策略。

  自然,这些策略还在发展中,而且还有一定的风险,即虚拟化复杂性,性能问题,可用行问题(例如,将一个一级存储阵列放在一个中等虚拟化设备的后面)。而且虽然这些方法看起来能够明显简化IT环境并减少硬件、软件和迁移成本,但是它们非常依赖于厂商(们)所提供的虚拟化技术。用户在管理这些风险的时候需要有极其谨慎的心态,实行保守计划,采取兆级管理策略--这些兆级管理策略不单单依赖于厂商提供的产品,而是将组织作为一个整体来抓住其流程。虽然有这些问题和潜在的锁定风险,50%的期望成本节约还是使得分层管理成为一个有吸引力的目标。

0
相关文章