存储 频道

初志集群存储助力油田勘探开发研究院

  【IT168 方案】近年来,油田稳产高产的技术难度越来越大,迫切需要进行更大范围精度的石油地震勘探,随着油田探区油气勘探程度的优化,复杂地质构造与地震岩性成像已成为现实需要解决问题。石油勘探工作是在复杂构造地区将地表图层数据采集并数字化,供软件分析成像,以满足油田复杂地质构造与地震成像的要求。这就需要用海量存储系统对采集的地震资料数据进行存储,并提供给高性能计算平台进行处理分析。

  在油田勘探高性能计算领域,随着地震数据采集技术的不断进步,数据量也在急剧上升,迫使资料处理环境从以服务器为中心转变成了以存储为中心。

  特别是近年来,基于PC Cluster技术的计算机集群逐渐取代了大型机,数据的读取和操作方式也发生了改变,尤其是同一份数据需要满足多个计算服务器的并发访问,对存储系统提出了前所未有的挑战。传统的SAN存储方案,其设计的本质思想面向传统的大型机,在面对大量作业并发进行数据读写时性能往往表现不如人意。而NAS产品固有的性能瓶颈也阻碍了其在地震资料处理中的应用。

  为了寻求新的计算环境下最合适的存储解决方案,油田勘探开发研究院组织了国内外所有知名品牌存储厂商,包括FC SAN厂商、SAN文件系统厂商、NAS厂商、以及集群存储厂商,针对实际应用环境进行技术交流、设计、测试,以甄选出最优秀的解决方案。

  在本方案中,我们推荐使用SAS磁盘柜作为存储介质。利用SAS磁盘柜结合CZSS集群存储系统来搭建具有线性提升性能,空间无限扩展的,高性能集群存储系统。

  CZSS是一款针对海量数据存储应用而设计的存储系统,基于开放架构设计,采用通用智能存储服务器作为基本的构建单元,为应用提供全局统一的系统映像和完全POSIX 兼容的API 接口。

  CZSS大规模集群存储系统采用了自主研发的全系统规模数据高可用技术,彻底消除存储系统中的单点故障,结合特有的自动故障探测和快速故障恢复技术,确保用户的应用持续稳定地运行;CZSS 存储系统能够为用户提供PB级的存储容量,并根据用户应用发展的趋势,适时按需进行在线动态扩展;世界领先的元数据服务器集群技术消除了现有存储系统中所存在的单目录下文件数量、小文件处理速度等种种限制,提供了近乎无限的文件存储数量和极高的文件检索速度,是业界唯一一款能够高效支持千万级大目录的存储系统。

  本方案建议书供油田勘探开发研究院的技术专家参考。在本方案设计中,我们本着在满足需求的基本要求下,采用优化设计,使存储设备方案具备高可靠性、高性能、可扩展性、可管理性,并提供更快的I/O速度,让用户能够以最低的总体拥有成本(TCO)打造最适合业务的存储平台。

   用户现状分析

  油田勘探开发研究院地震勘探处理系统由698 台刀片式服务器和42台I/O服务器、高速 10 千兆位以太网和一个 SAN磁盘存储阵列、一套SAN文件系统组成。通过地震数据处理软件,能够实现高分辨率地震数据处理和地震叠前时间/深度偏移处理。如图2.1所示。

初志集群存储助力油田勘探开发研究院
图2.1 现有环境示意图

  这套系统在过去几年为提高油田地震数据处理的效率做出了巨大贡献。但是随着数据量和处理任务越来越大,SAN存储系统逐渐表现出不能适应当前应用需求的缺陷:

  共享性能不足:虽然该方案中使用了多IO服务器提供数据的并发访问,但是当大量地震资料处理作业在并发访问作业时,最后的瓶颈往往会是SAN控制器上;特别是作业数量达到一定程序,整套系统的IO性能反而急剧下降;

  可靠性隐患:FC SAN设备的Raid只能在一台存储设备内实现,一旦该台存储设备出现失效,或者在Raid重建期间发生第二块硬盘损坏,就会造成数据的丢失,带来巨大损失;

  总体拥有成本高:FC SAN和SAN FS都是依靠大量专用而又昂贵的硬件组成,具有构建时间长、购置费用高、维护支出高、服务费用高等缺点,导致整套系统的总体拥有成本居高不下;

  数据恢复时间过长:一块硬盘损坏,设备Raid数据重建,5TB的数据不停机重建需要耗时8小时以上,该期间设备IO性能会损失50%以上。

  项目建设目标

  本项目建设目标是要采用当今主流的网络存储技术, 为油田勘探开发研究院提供一个可满足地震处理中IO密集型应用的,高性能共享、高可靠、安装简单、可平滑扩容的数据存储平台,提高地震资料处理的效率,适应业务快速增长的需求。初期规模为200TB的共享存储平台,整套系统存在以下几个关键需求:

  高性能需求:计算节点对存储系统性能要求比较高,为避免作业数量达到一定程度,整套系统的IO性能急剧下降的现象,存储系统需要提供极高的读写聚合带宽。

  低故障率需求:整套系统必须具备较强的硬件容错能力,避免Raid重建过程中I/O性能大量损失和数据丢失,保证业务稳定运行。

  数据全局共享需求:计算节点之间必须能够共享全局命名空间。

  易管理需求:整个系统的日常管理、运行维护必须十分简单。。

  低成本(CTO)需求:在满足需求的前提下降低总拥有成本。

  系统设计原则

  为达到油田勘探开发研究院建设的目标要求,我们认为在集群存储系统设计中,必须坚持以下原则:

  系统高可靠性和可用性:存储系统是整个地震资料处理系统的核心,因此确保存储系统的可靠性和数据的可用性至关重要。存储系统务必要保证全局没有单一故障点,硬件故障时还能提供7x24小时在线数据读写服务,不影响业务运行;局部硬件失效不影响数据的完整性;故障恢复不影响业务运行。

  高共享性能:地震资料分析最大的特点就是大量作业并发的进行数据读写。系统设计应该从实际应用出发,提供更高的数据并发访问性能支持,以更高的性能支持更多的并发作业,提高地震资料处理效率。

  灵活性及可扩展性:根据未来业务的增长和变化,系统可以平滑地扩充和升级,最大程度的减少对网络架构和现有设备的调整,对前端业务的影响可以降到最低。

  管理简单:采用标准的TCP/IP架构,具有智能化故障高速修复功能。管理必须能够集中化、自动化、智能化,确保管理工作量不会随着容量的增长而增加。

  较低的总体拥有成本(TCO): TCO是指资产购进成本及在其整个生命服务周期中产生的成本之和。存储系统的总体拥有成本由设备购置成本、实施成本、维护成本、管理成本、升级成本、宕机成本等因素构成。CZSS集群存储的方案,着力于从上述多个方面帮助用户降低成本,从而达到有效的降低TCO。

0
相关文章