存储 频道

初志集群存储助力油田勘探开发研究院

  CZSS集群存储方案优势

  CZSS集群存储方案在满足油田勘探研究院地震勘探高性能计算应用方面,具有突出的技术和综合成本优势。下面我们从共享性能、可靠性、扩充性、易管理性、总体拥有成本等多方面对CZSS集群存储和FC SAN+共享文件系统、集群NAS等方案进行详细比较分析。

   对FC SAN+共享文件系统的比较优势

  共享性能

  首先,CZSS集群存储系统是基于分布式文件系统的存储,支持多客户端的并发访问;而FC SAN自身只提供了块级的访问接口,并不能支持文件共享,所以SAN方案必须采用在客户端另行安装共享文件系统的方式;

  其次,在性能上,CZSS采用数据分布式存储,无论是一个文件还是一个目录,数据都会按照一定的算法分布到存储服务器集群内的机器上,不存在计算和通道瓶颈,在被N个客户端访问时的IO性能,可以接近达到一个客户端访问的N倍,而且存储服务器数量越多,IO性能也呈现线性增长态势;而FC SAN的文件分布在一个LUN内,一个LUN所能够提供的处理能力和IO能力都是有限的,因此多个作业并发访问时,响应速度和IO会出现不升反降的趋势。分别如图4.1、图4.2所示。

CZSS集群存储方案优势
图4.1:CZSS集群存储文件共享IO方式

CZSS集群存储方案优势
图4.2 FC SAN共享文件示意图

  由图可见,在FC SAN中,虽然SAN设备本身拥有较高的通道能力(如4Gb),但是在共享环境下,存储所能够提供的IO性能受制于控制器的处理效率,整体性能的瓶颈无法从根本上得到解决。而CZSS集群存储系统完全是分布式的访问方式,访问压力平均分配到每个存储服务器上,因此系统所提供的数据IO性能几乎就是每台存储服务器性能相加的总和。

  可靠性

  CZSS集群存储系统采用全局数据冗余设计,保证每个数据块都能分布在不同的存储服务器上,这样带来的好处是:

  1、数据重构速度极快;克服了传统RAID重构速度慢的隐患;

  2、允许多块硬盘失效,甚至整台存储服务器失效,系统都能保证数据的完整性。

  反观 FC SAN设备,虽然在单台设备的可靠性设计上采用了硬件冗余、RAID保护等方式,但有却出现了两个问题:首先,随着磁盘容量越来越大,硬盘数量越来越多,RAID的重建时间也越来越长,一次RAID重建往往花费十个小时以上,而在此期间,一旦RAID组内又有一块硬盘损坏,就会造成用户数据丢失,这在实际应用中并不少见。其次,如果单台SAN设备失效,也会造成数据丢失。

  扩充性

  CZSS集群存储系统具有十分灵活的在线扩展能力。对于新加入的存储服务器,只要运行CZFS的负载均衡软件,就可以自动地将数据向新设备迁移以实现全局数据平均分布和服务平衡分担,整个过程无需人工干预。用户完全可以按需购买相应的容量,而且随着存储规模的扩充,存储容量越大,系统性能越高。

  而SAN方案会出现相反的情况,除了极少数SAN设备支持在线扩展Raid阵列外,其余产品扩容需要停机,重新规划空间分配;而且容量规模的扩充并不能带来性能的提升。

  总体拥有成本

  CZSS集群存储系统采用通用的TCP/IP协议和通用的硬件,网络维护人员都能轻松的承担维护任务;而且CZSS集群存储系统具有故障自恢复功能,能够以接近零维护的长期稳定运行,极大的降低了维护管理成本。系统故障时数据重构速度极快,且几乎不影响性能,这也降低了宕机成本。

  而SAN厂家普遍采用复杂的光纤协议,使用维护非常复杂;厂家专用设备和磁盘,价格十分昂贵,维修成本很高,而且各厂家之间的兼容性也较差,导致将来的升级维护成为难题。系统重构需要中断业务,需要较高的宕机成本。

  对集群NAS的比较优势

  架构对比

  集群NAS和CZSS集群存储系统的架构对比如图4.3所示。

CZSS集群存储方案优势
图4.3 集群NAS与CZSS集群存储系统架构对比

  IO带宽

  CZSS的所有存储服务器能够以同时提供并发访问,计算节点到存储服务器之间使用的是高效率的CZFS协议,在实际使用中能够充分的利用网络资源,将物理的通道带宽发挥到极致,提供给处理作业最大的IO性能支持。

  集群NAS设备是由多个NAS设备提供给计算作业的是效率极其低下的NFS协议。在常用的千兆以太网环境里面,NFS协议只能够利用50%左右的带宽。而且随着作业数量的增加,NFS服务器很容易出现崩溃等故障,导致作业被中断,造成人力、物力的损失。

   扩充性

  CZSS集群存储系统具有十分灵活的扩充能力。对于新加入的存储服务器,LeoFS的负载均衡软件,可以自动地将数据向新设备迁移以实现全局数据平均分布和服务平衡分担,整个过程无需人工干预。用户完全可以按需购买。而且随着规模的扩充,存储容量越大,系统性能越高。

  而SAN设备则完全是另外一种情形,除了极少数SAN设备支持在线扩展Raid阵列外,其余产品扩容需要停机,重新规划空间分配;而且容量规模的扩充并不能带来性能的提升。

  文件规模

  CZSS系统单目录下文件数量可达千万,系统总文件数量上百亿;

  集群NAS系统单目录下文件数量为十万数量级,系统总文件数量为百万数量级,超过数量文件将会导致目录无法打开。

   可靠性

  可靠性对比同FC SAN。

  总体拥有成本

  CZSS独具的接近零维护功能、系统自动恢复、极低的宕机成本,使得总体拥有成本优势明显。

0
相关文章