分层存储架构的原理与实施选择-存储专区

分层存储架构的原理与实施选择

作者：转载自网络编辑：李隽 2010-05-20 09:08 来源：CSDN

　　【IT168 应用】分层存储是将不同类别的数据分配到不同类型的存储介质上，目的是提高存储效率，减少总使用成本(TCO)。存储分类基本上是根据应用程序的服务层面的要求，包括可用性、性能、保存要求、使用频率以及其他因素等。由于大量的日益增长的电子存储数据、非常好的实践政策、自动持续性分配软件、特定数据匹配以及设备特点等因素，分层存储可以非常复杂。

　　分层存储可以采取多种形式，而且经常是存储架构增长的自然结果。通过将高速缓存分配给不同数据，以及/或通过使用不同特点的物理上分开的存储阵列，分层存储可以在一个阵列内建立(使用不同容量的或不同性能的磁盘驱动器)。

　　分层存储号称可以节省多达50%的存储使用成本，使得它成为无差别容量配置的一种有吸引力的方案。分层存储的主要商业驱动因素和终端用户的考虑包括如下：

　　● "SAN(存储局域网)的异构"导致了互不兼容的存储孤岛，没有很好的方法能够在服务器和磁盘阵列之间共享数据;

　　● 兼并和收购带来了异构的SAN架构，进一步增加了复杂性;

　　● 昂贵的一级(Tier-1)架构在一些时候显得成本太高，使得许多公司发展"避免一级架构"策略;

　　● 迁移和配置复杂性要求应用程序关闭，以便迁移数据或配置新的容量，由此引起的每迁移阵列成本经常超过50000美元。

　　Wikibon.org进行的终端用户研究显示在硬件和软件上每花一美元，还要花50美分在数据迁移和阵列使用期间的配置上面。通过分层存储，这一数字可以降低到每一美元硬件软件花低于10美分在迁移和配置上。

　　在主机领域，自动分层存储已经实现多年，为什么IT界对它这个目标如此健忘呢?答案，当然是，在于主机外的存储异构性。由于存储硬件、应用、技术以及架构的分化，因此虽然几位厂商有努力实现自动化，但是还是面对很大的挑战。结果，作为一种积极策略，分层存储的市场渗透率只有10%到15%，虽然根据有些人的定义，实际上每个公司都有一定形式的分层存储。

　　一种可能的策略是将磁盘存储迁移到一个单一架构(例如，所有都到一级存储)，但是这种方法成本非常高，而且绝大多数用户不能这么做。数据格式仅仅是其中一项挑战(例如，块 vs 文件)，甚至还不是最难的问题。真正阻碍分层管理的采用的问题是如何建立一个有效而且"自动的"基于政策的跨IT环境的分类系统，并使这个系统受各个应用和用户组的数据访问需求所驱动。

　　为支持这个，一些公司降低需要管理的分层数，明确沟通这些方针，并且同时对前段服务器资源和后端存储资产进行虚拟化，从而简化了策略。虚拟化的一个关键好处是应用程序能够保持其所看到的存储资源，但是这种观感其实可以在任何时候由任何地点映射过来的--并且是动态的。数据可以进行无缝的迁移，而应用不会发觉这种变化。但是，虚拟化也带来其本身的一系列问题，包括其实施复杂性，以及许多应用的性能问题(下面讨论)。

　　对于不考虑虚拟化的用户，其解决分层存储的方法是专注于同质数据--例如电子邮件系统和软件开发数据--的大型数据池、以及围绕这些迅速增长的数据池建立分层存储岛。这种方法也能节省大量成本，而且其实施比起虚拟化要容易得多;但是，持续管理费用的增长可能非常快。平衡的方法就是需要用人力手动地为这些数据池构建桥梁，而且由于应用程序需要知道变化，因此这些应用程序需要被中断。

　　虚拟化开始以自动运行的方式来构建这些桥梁，而且看起来可能是将来许多大型企业的非常好的解决方案。但是，作为一种方案，几个厂商提供的"内置"分层技术可以让更高容量、更低成本的设备在同一个阵列中作为一种更高成本、更高性能、更低容量的驱动器而存在。虽然这是分层的一个最简单的形式，用户有时还是不情愿采用这种方法，特别是当它需要给更昂贵的一级存储平台增加容量时。

　　重要的是，虽然大部分的分层存储讨论集中在高成本、高性能的一级存储，以及成本更低的二级存储这个中间解决方案，但是世界上的超过一半的数据是存在于三级系统，要么是非常低成本的磁盘，要么是磁带技术。这对用户来说是个很大的问题，在分层存储策略如记录管理和保留政策中--越来越进入存储管理者的日常工作流程的策略--必须考虑进去。

第1页：分层存储架构的原理第2页：做什么第3页：技术问题/选择

关注我们