存储 频道

帮你Hold住"大数据" 文件系统选型指南

  IBM SONAS:通用并行文件系统GPFS

  GPFS是IBM公司推出的并行分布式集群文件系统,自1995年投入商用至今已经有10多年的历史。GPFS是一个共享磁盘的文件系统,集群内的所有节点可以并行地访问所有共享磁盘,并通过分布式的令牌管理机制和条带化技术来管理和优化节点的访问。GPFS的应用范围非常广泛,从多节点文件共享服务到大型的高性能计算集群,我们都可以看到GPFS的优秀表现。GPFS也应用在众多的企业应用里面,比如HACMP、Oracle RAC、SAP。 GPFS在这些应用里面都表现出了出色的性能和高可用性。

IBM SONAS:通用并行文件系统GPFS

  不过,GPFS作为一款软件产品还是要配合硬件来工作。2010年初,IBM推出了其基于通用并行文件系统(GPFS)的SONAS(Scale Out Network Attached Storage),迄今为止已在某些特定市场大获成功。GPFS主要面向HPC研究环境,为大型Linux计算集群提供高度并行的存储吞吐量。SONAS是一个交钥匙的软件和硬件解决方案,在更为广泛的市场上超越了HPC。IBM利用XIV存储阵列里高度可视化的图形用户界面(GUI)改善了SONAS的可管理性。

  而随着高性能计算、大数据和数据仓库的互相融合,IBM也将GPFS更新至3.5版本,除了客户元数据和更高的性能外,这个3.5版本的发布还增加了大数据和异步复制功能。

  新的3.5版本包括了Active File Management(主动文件管理),一种异步版本的GPFS多集群同步复制功能,可以让中央GPFS站点镜像到其他远程站点,让远程站点的用户可以本地访问镜像数据而不用通过广域网。这种链接是双重的,因此任何一方的更新都会导致另一方的更新。GPFS 3.5还可以运行在无共享Hadoop类型集群上,兼容POSIX(可移植操作系统接口)。

  凭借其高容量的可扩展性和高吞吐性能,SONAS在本文的横评中获得了高度评价。同时它还拥有一系列独特的功能,如在一个跨地域的命名空间内提供全局协作,并在同一个命名空间内支持磁带层。但是,它在存储效率和弹性方面的表现还是取决于其后端的不同存储阵列,并缺乏重复数据删除和压缩技术。

8
相关文章