存储 频道

分层存储架构的原理与实施选择

  【IT168 应用】分层存储是将不同类别的数据分配到不同类型的存储介质上,目的是提高存储效率,减少总使用成本(TCO)。存储分类基本上是根据应用程序的服务层面的要求,包括可用性、性能、保存要求、使用频率以及其他因素等。由于大量的日益增长的电子存储数据、非常好的实践政策、自动持续性分配软件、特定数据匹配以及设备特点等因素,分层存储可以非常复杂。

  分层存储可以采取多种形式,而且经常是存储架构增长的自然结果。通过将高速缓存分配给不同数据,以及/或通过使用不同特点的物理上分开的存储阵列,分层存储可以在一个阵列内建立(使用不同容量的或不同性能的磁盘驱动器)。

  分层存储号称可以节省多达50%的存储使用成本,使得它成为无差别容量配置的一种有吸引力的方案。分层存储的主要商业驱动因素和终端用户的考虑包括如下:

  ● "SAN(存储局域网)的异构"导致了互不兼容的存储孤岛,没有很好的方法能够在服务器和磁盘阵列之间共享数据;

  ● 兼并和收购带来了异构的SAN架构,进一步增加了复杂性;

  ● 昂贵的一级(Tier-1)架构在一些时候显得成本太高,使得许多公司发展"避免一级架构"策略;

  ● 迁移和配置复杂性要求应用程序关闭,以便迁移数据或配置新的容量,由此引起的每迁移阵列成本经常超过50000美元。

  Wikibon.org进行的终端用户研究显示在硬件和软件上每花一美元,还要花50美分在数据迁移和阵列使用期间的配置上面。通过分层存储,这一数字可以降低到每一美元硬件软件花低于10美分在迁移和配置上。

  在主机领域,自动分层存储已经实现多年,为什么IT界对它这个目标如此健忘呢?答案,当然是,在于主机外的存储异构性。由于存储硬件、应用、技术以及架构的分化,因此虽然几位厂商有努力实现自动化,但是还是面对很大的挑战。结果,作为一种积极策略,分层存储的市场渗透率只有10%到15%,虽然根据有些人的定义,实际上每个公司都有一定形式的分层存储。

  一种可能的策略是将磁盘存储迁移到一个单一架构(例如,所有都到一级存储),但是这种方法成本非常高,而且绝大多数用户不能这么做。数据格式仅仅是其中一项挑战(例如,块 vs 文件),甚至还不是最难的问题。真正阻碍分层管理的采用的问题是如何建立一个有效而且"自动的"基于政策的跨IT环境的分类系统,并使这个系统受各个应用和用户组的数据访问需求所驱动。

  为支持这个,一些公司降低需要管理的分层数,明确沟通这些方针,并且同时对前段服务器资源和后端存储资产进行虚拟化,从而简化了策略。虚拟化的一个关键好处是应用程序能够保持其所看到的存储资源,但是这种观感其实可以在任何时候由任何地点映射过来的--并且是动态的。数据可以进行无缝的迁移,而应用不会发觉这种变化。但是,虚拟化也带来其本身的一系列问题,包括其实施复杂性,以及许多应用的性能问题(下面讨论)。

  对于不考虑虚拟化的用户,其解决分层存储的方法是专注于同质数据--例如电子邮件系统和软件开发数据--的大型数据池、以及围绕这些迅速增长的数据池建立分层存储岛。这种方法也能节省大量成本,而且其实施比起虚拟化要容易得多;但是,持续管理费用的增长可能非常快。平衡的方法就是需要用人力手动地为这些数据池构建桥梁,而且由于应用程序需要知道变化,因此这些应用程序需要被中断。

  虚拟化开始以自动运行的方式来构建这些桥梁,而且看起来可能是将来许多大型企业的非常好的解决方案。但是,作为一种方案,几个厂商提供的"内置"分层技术可以让更高容量、更低成本的设备在同一个阵列中作为一种更高成本、更高性能、更低容量的驱动器而存在。虽然这是分层的一个最简单的形式,用户有时还是不情愿采用这种方法,特别是当它需要给更昂贵的一级存储平台增加容量时。

  重要的是,虽然大部分的分层存储讨论集中在高成本、高性能的一级存储,以及成本更低的二级存储这个中间解决方案,但是世界上的超过一半的数据是存在于三级系统,要么是非常低成本的磁盘,要么是磁带技术。这对用户来说是个很大的问题,在分层存储策略如记录管理和保留政策中--越来越进入存储管理者的日常工作流程的策略--必须考虑进去。

0
相关文章