存储 频道

专家:该如何选择正确的高性能文件系统

  【IT168 导购】目前,高性能的文件系统有很多种,例如:Sun 的QFS 、IBM的GPFS ,昆腾的StorNext ,Red Hat 的GFS和Panasas。因此,如果要问那个是最好的?答案取决于你咨询的对象以及需求的产品。

  Panasas 公司的首席营销官Len Rosenthal 说:“通常,我们要与NetApp的 OnTap或者On Tap GX, EMC公司, IBM的GPFS ,惠普的Polyserve以及Sun的开源研究项目即所谓的Lustre进行竞争”,“ 虽然我们已经取代了运行Sun QFS的系统,但是从来没有与他们展开真正的销售竞争。”

  Rosenthal说昆腾的StorNext以及惠普的Polyserve只能处理最多16个集群NFS服务器,所以在规模性的NAS需求中并不具有挑战性。同样,他说, IBM 的GPFS和Sun的Rosenthal,与Panasas 的PanFS类似,是两个并行文件系统,主要用于大学和政府研究机构的便条存储,因为他们并不具备足够高的I/O速率或者足够多的数据管理工具,如快照。

  上述言论来自Panasas。那么,我们来看看他的竞争对手对于这些言论又是怎么说的呢?

  Todd Neville,IBM公司(纳斯达克股票代码: IBM公司)GPFS供应经理说,GPFS能够实现多样安装,包括HPC、零售、媒体和娱乐、金融服务、生命科学、医疗保健、Web 2.0以及电信业和制造业。Neville也对I / O速率要求不屑一顾。

  昆腾公司软件业务主管Greg Nuss的回答更加强势,他指出Panasas公司对于StorNext能力的有关评论是完全错误的。

  “StorNext集群中的每个节点都可以作为一个单独的NFS服务器,在后端呈现出共同的文件系统命名空间,”他说。 “现在,我们的特定节点每个支持1000个节点,支持SAN连接以及LAN到群集的连接节点。我们实际安装了300-40个节点,通常不会在市场中运行Panasas,因为StorNext通常不是部署在向外扩展的NAS构架中,而是工作在高性能的工作流程和档案配置。 ”

  同时,惠普公司也对Panasas的言论表示不快。该公司表示,惠普可扩展NAS并没有NAS文件服务的服务器节点数量限制,客户可以放心的在集群中采用。

  “所列举的16个服务器节点限制仅仅是一个测试限制,”HP StorageWorks营销总监 Ian Duncan说。“惠普有很多用户使用集群超过16个服务器节点的NAS文件服务。”

  Duncan说Panasas 、Sun 的QFS 、IBM的GPFS和昆腾的StorNext并不是真正的对称文件系统,而是基于主服务器的集群文件系统。无论是数据业务,锁定运行抑或两者-在传统的单节点系统中都是比较容易配置的。然而,Duncan认为他们的性能和可用性会受到主机服务器内在条件的制约。

  “随着服务器的增加,主服务器的负荷也在增加,一旦主服务器失败,就会削弱性能使更多的节点遭受损失,”Duncan说。“相比之下, 4400可扩展NAS文件服务利用惠普集群文件系统(CFS),利用多个相互独立的服务器能够提供更好的可扩展性和可用性,在任何人为或者性能受限的失误情况下绝缘集群。 ”

  为了更加方便理解,我们来仔细分析下其中的一些文件系统。

  Panasas PanFS

  Panasas PanFS的并行文件系统是为I/O和带宽高性能对象文件系统而设计的应用扩展,不同与CIFS或NFS,Panasas也支持,PanFS使用并行的DirectFLOW协议,也是未来pNFS (并行NFS)标准的基础,是即将发布的NFS的4.1版本主要改善部分。Panasas并行存储的主要优势据说是其卓越的应用性能。

  NFS服务器要求所有I / O请求通过一个单一的NAS阵列,PanFS能够使得并行数据直接从客户端或服务器节点传输到存储系统。通过Panasas,NAS从采用数据路径并不再担心I / O瓶颈。例如:Panasas并行存储安装在新墨西哥州洛斯阿拉莫斯国家实验室中世界上性能最高的计算机系统上,在共享文件中的速率接近100 Gb / s。

  “由于这个架构, Panasas并行存储系统能够达到支持数以千计的用户/服务器的规模,在超过100GB / s的带宽上形成数以万计的容量,”Rosenthal说。“其他主要功能包括基于软件的磁盘阵列(RAID)架构,能够使重建的平行RAID比大多数存储系统速度提升 5倍至10倍。”

  PanFS还包括Panasas分层校验技术,自动检测并纠正不可恢复的介质故障,这在重建过程中非常重要。最后,在对这个文件系统通过多次仿真与建模应用进行优化。

  需要注意的是,Panasas系统是为文件存储而设计的,并不是模块存储。因此,并不适合应用在例如ERP、顺序登陆或者CRM等导向性的应用当中。相反,它比较适合应用在具有大量用户或者服务器节点需求的大型文件共享接入系统当中。

  HP 文件服务器

  惠普服务器在通过平行处理后表现的非常优越,应用市场瞄准需要与传统NAS产品相比具有更多的无缝申请需求以及无服务器中断的简易在线存储容量增长的中型企业用户。惠普 StorageWorks 4400可升级NAS文件服务器包括具备双阵列控制器以及4.8 TB存储容量的HP StorageWorks 4400 企业虚拟阵列、三个文件服务节点、管理和复制软件、以及支持Windows 或者Linux的程序。由于具备3个文件服务节点和双阵列控制器,4400可升级NAS文件服务器并不存在单点失误。

  那么缺点呢?

  “4400可升级NAS文件服务器并不适合吞吐量超过6 GB/S的高性能计算应用,”Duncan说。

  昆腾StorNext

  当然,StorNext是所有选择Apple产品人的选择。未来,在媒体充裕的环境下苹果、Windows抑或其他的系统肯定会相互影响,StorNext也会大量应用在类似环境中。例如,StorNext通常被用在要求视频产品中重复应用,因为其具备处理大容量以及高清内容帧速的能力。那么在线环境下它的表现又是什么样的呢?

  “StorNext和其他共享文件系统最大的区别是StorNext采用了分层归档以及充足的磁带支持,所以整合的非常精密,以及主要的OS平台支持,”Nuss说。“其他没有任何一个文件系统能够在单集群的环境下支持Linux、Unix、Apple 和Windows等多项系统。”

  StorNext文件系统的于众不同之处在于通过完整归档能力共享文件系统。可以是系统在SAN或者LAN环境下快速处理或者分配类似图像、媒体、内容、分析数据以及其他类型的高速共享数据库文件,Nuss介绍道。根据文件大小以及文件系统中文件的数量而言,StorNext无论在高性能数据速率或者大容量系统中都非常出色。

  IBM GPFS

  IBM普通并行文件系统(GPFS)面市的时间并不是很旧。

  “GPFS是支持AIX 和 Linux的高性能、共享磁盘的集群文件系统,”Iluminata公司分析师John Webster说。

  GPFS最初的设计目的是针对高性能计算(HPC),现在已经被发现到类似关系数据库、CRM、Web 2.0、媒体应用、工程学、财政应用、数据归档等需要具备高性能、误差允许以及大容量的系统环境当中。

  “GPFS是基于SAN模型的,所有服务器都能够了解存储情况,”Neville说。“为了帮助非SAN数据接入,GPFS提供啦一款仿真SAN的软件,允许数据通过普通网络接入,例如:以太网。”

  在每个文件系统中数据是呈条状分布的,使得每个磁盘的带宽可以在服务器单个文件或者生成的多个文件集合性能中使用。这种性能可以被传递到所有构成集群的节点之上。GPFS还是一款可配置服务,所以不存在单点错误。这款文件服务器的主要特点之一是GPFS能够提供类似在集群以及数据在不同存储层移动(包括磁带)的基于政策信息的生命周期管理(ILM)工具的数据共享能力。

  此外,GPFS还能够被应用在数据通过NFS、CIFS、FTP或者HTTP等集群的所有节点同时工作的文件服务NAS集群核心。根据需求,更多的节点或者存储设备都够被添加或者从集群中去除。IBM Scale Out 文件服务器 (SoFS)基于GPFS,也具备附件功能。

  “由于文件中心数据以及存储依然在快速增长,人们希望NAS的发展能够跟的上HPC、Web服务其他类似基于低功耗成分的标准的工业应用发展趋势,这也是GPFS的核心竞争力所在,”Neville说。

  更多

  尽管上述的大多数厂商都在宣称自己的多方面全球性优势,但是他们中的大多数也很乐于承认自己在某些方面存在的一些薄弱环节。底线就在站点测试以及通过试用期的自由使用,判断在你需要环境下的不同文件系统工作状态。

  这篇文章仅仅是基于表面的东西做啦介绍,未来我会在整理一篇涵盖更多NetApp, Sun以及一些类似CIFS和NFS的传统文件系统协议数据的文章。毕竟,并不是所有的人都需要超高性能。

0
相关文章