存储 频道

帮你Hold住"大数据" 文件系统选型指南

  EMC Isilon: OneFS分布式文件系统

  2000 年,目睹传统存储体系结构所面临的挑战和基于文件的数据的增长速度后,Isilon 创始人开始开发变革性的全新存储体系结构——OneFS 操作系统。EMC公司于2010年年底收购了Isilon。从那时起,EMC就使得Isilon业务不断增长,从2亿美元增至5亿美元,据Garter估计,并突破了Isilon的传统业务领域,如媒体/娱乐和生命科学等,进入到企业级数据中心,以应对新的挑战,如大型主目录和VMware虚拟服务器。EMC Isilon的NL系列实际上已经越来越多地用于备份和归档。Isilon是基于full-stack管理卷的横向扩展架构文件系统,并提供了内置的数据保护,高达四个节点的奇偶校验以容忍集群内多个节点故障。

EMC Isilon: OneFS分布式文件系统
EMC Isilon

  Isilon采用的OS操作和文件系统便是OneFS,而Isilon存储的根本区别在于,它使用智能软件以扩展跨大量商用硬件的数据,使得性能和容量呈爆炸性增长。随着时间的推移,传统的三层存储模型(文件系统、卷管理器和数据保护)不断演进,以满足小规模存储体系结构的需求,但也带来了极大的复杂性,同时不太适合 PB 级别的系统。OneFS 取代了所有这些内容,提供了具有内置可扩展数据保护功能的统一群集文件系统,同时无需进行卷管理。OneFS 是横向扩展基础架构的基本构造块,可实现极大规模和巨大效率。

  值得一提的是,OneFS 的设计目的是不仅在机器方面,而且还在人员方面扩展,使管理大规模系统所需的人数,仅占传统存储系统管理所需人员的一部分。OneFS 消除了复杂性,并整合了自我修复和自我管理功能,从而大幅减轻存储管理负担。OneFS 还在极深的操作系统级别纳入并行度,使得几乎每项关键系统服务均跨多个硬件单位分布。随着基础架构的扩展,可使 OneFS 几乎扩展到每个维度,从而确保当前正常运转的设备将随着数据集的增长继续发挥作用。

  OneFS 是完全对称的文件系统,不存在单点故障——利用群集不仅可扩展性能和容量,而且还可实现任意互联的故障切换和远超出 RAID 能力的多级冗余。磁盘子系统的发展趋势是缓慢提高性能, 同时快速增加存储密度。OneFS 通过扩展冗余量以及故障修复速度,从而对这一现实作出了回应。这样有利于 OneFS 增至多 PB 规模,同时提供比小型、传统存储系统更高的可靠性。

  OneFS 将三层传统存储体系结构(文件系统、卷管理器和数据保护)整合到一个统一的软件层,创建了在 Isilon 存储群集上运行的单个智能分布式文件系统。

EMC Isilon: OneFS分布式文件系统
▲OneFS 将文件系统、卷管理器和数据保护整合为单个分布式系统。

  OneFS不仅是操作系统,而且是在 Isilon 横向扩展 NAS 群集中驱动和存储数据的底层文件系统。

  Isilon节点

  OneFS 专门用于 Isilon 横向扩展 NAS 节点。单个 Isilon 群集由多个“节点” 组成,这些节点构成了可机架安装的企业应用装置,其中包含:内存、CPU、网络、非易失性随机存取存储器 (NVRAM)、低延迟 InfiniBand 互连、磁盘控制器和存储介质。因而,分布式群集中的每个节点都具有计算或处理功能,以及存储或容量功能。

  Isilon 群集起初最少为三个节点,并可扩展到 144 个节点。有许多不同类型的节点,所有这些节点均可整合到单个群集中,其中不同的节点提供了不同的容量对吞吐量比或每秒输入/输出操作数 (IOPS)。

  OneFS 在单个系统中可以包含的节点数量方面没有任何内置限制。每个添加到群集的节点增加了聚合磁盘、缓存、CPU 和网络容量。OneFS 充分利用了每个硬件构造块,从而使整体性能超越了部件性能之和。RAM 组合为单个的一致性缓存,允许群集任何部分的 I/O 从任何地方缓存的数据中受益。NVRAM 被组合在一起,以便在出现电源故障的情况下进行安全的高吞吐量写入。随着群集增长,磁盘轴和 CPU 将被组合以增加吞吐量、容量和 IOPS,以访问一个文件或多个文件。群集的存储容量范围为最少 18 TB 到最多 20 PB 之间。随着磁盘驱动器变得更加密集,最大容量将持续增加。

  依照功能,现有的可用 Isilon 节点被分为若干类别:

  ·S 系列:IOPS 密集型应用程序

  ·X 系列:以高并发度和由吞吐量驱动的工作流

  ·NL 系列:以近磁带值提供近主流的可访问性

  ·性能加速器:独立扩展,提供最高性能

  ·备份加速器:高速和可扩展备份和恢复解决方案

  OneFS文件系统结构

  OneFS文件系统基于 Unix 文件系统 (UFS),因此是非常快速的分布式文件系统。每个群集均创建单独的命名空间和文件系统。这意味着,文件系统跨群集中的所有节点分布,同时可以通过连接到群集中任何节点的客户端访问。这里没有分区,也无需卷创建。OneFS 通过共享和文件权限,以及提供目录级配额管理的 Isilon SmartQuotasTM 服务,从而提供软件中的相同功能,而不是限制访问物理卷级别的可用空间和非授权文件。

  由于所有信息都在跨内部网络的节点共享,因此数据可写入任何节点或从中读取,从而在多个用户同时读取和写入相同数据集时优化性能。

  在最新版的OneFS 文件系统中,EMC添加了很多企业所关注的功能,如文件级写克隆、身份验证区域、用于阵列集成的VMware vStorage API(VAAI)和对VMware vStorage API的存储感知(VASA)支持,以及增强的WORM功能。但是这些新功能必须在现场实现。

  在后文所提到的产品评估中,Isilon在容量、性能、可管理性和灵活性方面都遥遥领先。但是其在效率方面仍相对滞后,因为其缺乏重复数据删除和压缩,尤其是在特别重要备份的使用情况下。

  OneFS适用范围:OneFS适用于企业环境中基于文件和非结构化的“大数据”应用程序,包括大规模主目录、文件共享、归档、虚拟化和业务分析。为此,OneFS 广泛用于当今的各类数据密集型行业,包括能源、金融服务、互联网和托管服务、商业智能、工程设计、制造、媒体和娱乐、生物信息、科学研究和其他高性能计算环境。

8
相关文章