SoNAS七剑横扫海量文件数据
谈到SoNAS的海量文件存储管理方面的特点,金微总结有七大优势:包括为云存储环境设计的高并发的硬件体系结构;整体系统的超高性能,实测吞吐率最高66GB/s;高达14.4PB裸容量的海量存储空间;基于Scale out架构的极强扩展能力;全局命名空间实现的全面虚拟化管理;基于策略的信息生命周期管理功能;以及继承于GPFS 13年发展历史带来的丰富案例和稳定成熟的可靠性。

IBM总结SoNAS集群存储七大优势
从体系架构上说,GPFS从软件转化成硬件SoNAS集群存储解决方案后,所有数据的交换核心是Infinband交换机,内部包括三个类型的处理节点,包括Interface Node、Storage Node和Management Node,在Storage Node下面带有磁盘阵列柜,并通过磁盘阵列柜的阵列内RAID保护实现冗余机制,保护数据安全。
Interface Node、Storage node及Management Node本身都基于X86服务器架构,Interface Node互为集群,可从2个扩展至30个(最少2个,因为要互为集群)。Interface node接到数据读取的请求后,通过Infinband交换机发送给Storage Node,Storage Node下方则管理磁盘阵列柜。

IBM SoNAS系统结构示意
整体系统构成一个高并发的结构,并可灵活调配资源。如果文件访问要求压力很大,可获得更多的Interface node资源;如果需要存取的数据量非常大,可以在内部获得更多的Storage Node,能够根据容量和工作负荷要求可以按需调整并灵活扩展。
每个磁盘阵列柜包括大约60块高密度磁盘,目前支持SAS和SATA磁盘,未来还将提供SSD硬盘支持。磁盘阵列柜带RAID功能,数据在磁盘阵列柜层面得到冗余和保护。最大整体系统支持到7200块盘,11000TB总容量。
内部的数据交换通过Infinband交换机实现,可支持36或者96端口。对外则通过IP网络通信,向Windows、Unix或者Linux提供基于文件或者http方式的存储、访问以及共享。支持千兆和万兆以太网端口。
此外,SoNAS通过Tivoli Storage Manager(TSM)提供了快照功能、分层存储和HSM以及异地复制功能。
首先,基于GPFS文件系统的全局命名空间能够大大的简化用户对PB级海量文件存储管理。对于用户来说,当非结构化数据量及其庞大,不得不购买过多的NAS存储时,往往会面临管理复杂的问题。全局命名空间允许所有的文件在一个大的树状目录下进行统一的管理和保存,用户查找和访问文件都变得清晰方便,而不必理会在物理底层,这些文件究竟保存在哪个存储节点上。

SoNAS全局命名空间文件管理功能示意
SoNAS通过定期扫描完成文件自动分层存储,系统发出扫描的指令来查看文件属性,根据文件属性判断该保存的物理位置,是否需要迁移等等。此外,扫描的同时也会检查件是否完好,有没有被破坏的地方,是否需要修复等等。在实际的扫描过程中,只要没有工作负荷的节点都将参与文件扫描,汇总扫描的结果给管理节点,并在扫描结束后自动进行数据迁移,数据迁移通过后台的Infiniband交换机完成,对前端业务没有任何影响。

通过高速扫描文件状态与属性实现信息生命周期管理策略

远程数据复制功能示意
此外,SoNAS还能实现三地数据复制功能。对于存在分支机构的客户来说,往往会存在2-3个异地的数据中心,通过SoNAS系统可以方便的建立起远程的保护和访问。SoNAS系统在远程传送和读取的时候,和传统NAS的远程镜像稍有不同,首先在本地查询检索,如果本地能得到满足,则直接从本地读取。只有本地无法找到的数据才会从远程调取,从而减少从远程调取数据的网络压力。