存储 频道

还原虚拟中的现实

  【IT168 评论】存储虚拟化并不神秘,它有自己的技术体系。在SAN架构之下,就有四种虚拟化的方法。除此之外,文件虚拟化也将成为今后的技术热点。

  ■ 瓦力 编译

  在短短的几年内,存储虚拟化(又叫块虚拟化)已经在大企业中证明了自身的价值,走过了从价格不菲的小众化解决方案到价位合理的大众化解决方案这条老路子。作为所有中端存储阵列(最低档的除外)的一项标准功能,存储虚拟化为中小型企业缓解了一系列众多的存储管理难题。与此同时,优异供应商提供的专业解决方案为管理大型存储区域网(SAN)的大企业带来了最大的投资回报,大型SAN对数据可用性的要求很高。

  存储虚拟化在主机和物理存储设备之间创建了一个抽象层,隐藏了各个存储设备的独特性。存储虚拟化在SAN中实施后,为所有块级存储提供了单一管理点。简单来说,存储虚拟化把来自多个异构网络存储设备的物理存储资源汇集起来,作为一套虚拟存储卷呈现,供主机使用。

  除了创建由来自不同阵列的物理磁盘组成的存储池外,存储虚拟化还以始终如一的方式提供了众多服务。这些服务涵盖基本的卷管理(包括逻辑单元号屏蔽、串联、卷分组和分段处理),到自动精简配置、自动卷扩展和自动数据迁移,再到数据保护和灾难恢复功能(包括快照和镜像)。简而言之,虚拟化解决方案可以用作集中控制点,用于执行存储管理策略、达到更高的服务级别协议(SLA)。

  块级虚拟化带来的一项最重要的服务也许就是非破坏性数据迁移。对大企业来说,移动数据是几乎从不间断的事。随着旧设备退出使用、新设备投入使用,存储虚拟化能够在不中断的情况下,把数级数据从一个设备迁移到另一个设备上。存储管理员可以随意进行日常维护或者更换老化的阵列,而不会干扰应用和用户,生产系统可以继续正常运行。

  SAN的四种架构方法

  在虚拟化的SAN架构中,有四种方法可以提供存储虚拟化服务: 带内设备、带外设备、名为分离路径虚拟化的混合方法,以及基于控制器的虚拟化。不管用哪种架构,所有存储虚拟化解决方案都必须做三件基本的工作: 维持虚拟磁盘和物理存储的映射图以及其他配置元数据; 执行命令,以便执行配置变更和存储管理任务; 当然还要在主机和存储之间传输数据。处理I/O架构中以下三种不同的路径或数据流: 元数据路径、控制路径和数据路径的方式,这四种架构各不一样。这种差异给性能和扩展性带来了影响。

  带内设备全在一个设备中处理元数据、控制路径和数据路径等信息。换句话说,元数据管理和控制功能共享数据路径。这给繁忙的SAN带来了潜在瓶颈,因为所有的主机请求必须通过单一控制点来传输。带内设备厂商已为各自的产品添加了先进的集群和缓存功能,从而解决了这个问题。许多这些厂商提到,部署的大企业SAN系统可以展示其解决方案具有的扩展性和高性能。采用带内方法的典型产品包括DataCore的SANsymphony、飞康的IPStor和IBM的SAN卷控制器。

  优劣点评: 在一个设备中实施虚拟化,具有存储的便利,同时也存在读取瓶颈。

  技术指数: (3.5颗星)

  带外设备把元数据管理和控制操作从数据路径中抽离出来,把这些操作卸载到单独的计算引擎上。问题在于,每个主机上必须安装软件代理。代理的任务就是从数据流中挑出元数据和控制请求,然后把它们转发到带外设备进行处理; 这样主机就能解放出来,完全专注于传输进出存储设备的数据。LSI Logic是带外设备的惟一供应商,它的StorageAge产品经改动后,既可供带外使用,也可供分离路径使用。

  优劣点评: 可专注对外设备传输数据,但必须在外设中设置好代理软件。

  技术指数: (3颗星)

  分离路径系统充分利用了智能交换机的端口级处理功能,把元数据和控制信息从数据路径分离出来。不像带外设备是在主机端分离路径,分离路径系统是在智能设备端分离网络中的数据路径和控制路径。分离路径系统把元数据和控制信息转发到带外计算引擎进行处理,并且把数据路径信息传送到存储设备。因而,分离路径系统不需要主机端代理。

  分离路径虚拟化软件通常会在智能交换机或专门定制的设备中运行。分离路径虚拟化控制器的供应商包括EMC(Invista)、Incipient和LSI Logic(StoreAge存储虚拟化管理器)。

  优劣点评: 利用网络分发数据,比带外设备设置简单,但增加了数据处理量。

  技术指数: (4颗星)

  阵列控制器是虚拟化服务部署在上面的一种最常见层。然而,虚拟化控制器通常只对存储系统内部的物理磁盘进行虚拟化。这种情况在发生变化。这种旧方法的新版本是,为控制器赋予虚拟化智能,那样就能对内外存储设备进行虚拟化了。与带内设备方法一样,控制器处理数据路径、控制数据和元数据路径所有三种路径。日立公司的通用存储平台(Universal Storage Platform)就是这种基于控制器的新型虚拟化产品的一个主要代表。

  优劣点评: 在服务器常见层进行数据处理,正在向带内设备靠拢。

  技术指数: (3.5颗星)

  慢热文件虚拟化

  正如块虚拟化简化了SAN管理一样,文件虚拟化也消除了与企业级网络附加存储(NAS)系统有关的大部分复杂性和局限性。业界都认识到: 非结构化数据的数量在急剧增长,IT人员很少了解或很难控制这些数据。而文件虚拟化提供了解决之道。

  文件虚拟化可以把物理文件服务器和NAS设备的底层细节抽出来,创建跨物理设备的统一命名空间。命名空间只是个花哨的术语,其实指目录和文件的层次结构和相应的元数据。通常对NTFS等标准文件系统而言,命名空间与单一计算机或文件系统相关联。文件虚拟化通过把多个文件系统和设备都绑定到单一命名空间下,提供了目录和文件的单一视图,为管理员提供了管理这些数据的单一控制点。

  文件虚拟化的许多优点听上去很耳熟。与存储虚拟化一样,文件虚拟化也能够在不破坏文件的情况下,把文件数据从一个设备转移及迁移到另一个设备上。存储管理员可以对NAS设备进行日常维护、停用旧设备,而不会干扰用户和应用。

  如果结合集群技术,文件虚拟化还能显著提升扩展性和性能。一个NAS集群提供的数据吞吐率(MBps)和每秒输入输出操作(IOPS)比单单一个NAS设备高出好几个数量级。地震处理、视频渲染和科研模拟等高性能计算应用都高度依赖文件虚拟化技术来提供灵活扩展的数据访问。

  如何将文件虚拟化

  文件虚拟化还处于初期阶段。与往常一样,不同厂商采用的方法适合不同的使用模式,没有哪种方法能做到一应俱全。大体上说,如今文件虚拟化在市场上有三种不同方法: 平台集成的命名空间、集群存储衍生命名空间和常驻网络的虚拟化命名空间。

  平台集成的命名空间是主机文件系统的扩展。它们提供了针对特定平台的一种方法,以便跨特定服务器平台上的众多机器把文件关系抽出来。这种类型的命名空间非常适合多站点协作,但往往缺少丰富的文件控制措施,当然也受制于某个文件系统或操作系统。这类产品包括: 博科StorageX、NFS v4和微软分布式文件系统(DFS)。

  集群存储系统结合了集群和先进的文件系统技术,创建可以通过模块进行扩展的系统,可满足数量越来越多的NFS和CIFS请求。这种集群系统的自然产物是跨集群所有元件的统一、共享的命名空间。集群存储系统最适合高性能应用,可以把多个文件服务器整合成单一的高可用性系统。这方面的厂商包括Exanet、Isilon、Network Appliance(Data ONTAP GX)和惠普(PolyServe)。

  常驻网络的虚拟化命名空间由安装在网络上的设备(通常名为网络文件管理器)来创建,该设备位于客户端和NAS设备之间。这种设备实际上充当文件级协议的路由器或交换机,提供了跨后端文件服务器的虚拟化命名空间,可以在客户端和存储设备之间传送所有的NFS和CIFS流量。网络文件管理设备既可以带内部署(F5 Networks),也可以带外部署(EMC Rainfinity)。常驻网络的虚拟化命名空间最适合分层存储部署环境及要求非破坏性数据迁移的其他场景。

  借助文件和块存储虚拟化,IT人员也许最有希望缓解数据海啸带来的麻烦。IT人员通过对块存储和文件存储环境进行虚拟化,就能获得更大的管理经济效益,并针对异构存储系统实施集中式策略和控制。采用这些解决方案面临漫长而艰难的道路,但这些技术现在终于迎头赶上,可以满足现在的需要。用户会发现,最新一批的文件和块虚拟化解决方案完全值得等待。

0
相关文章