存储 频道

基于对象并行集群存储获青睐

  【IT168 评论】“如果在你的计算集群系统背后,没有可以良好扩展的存储集群的话,那么,你的计算能力将因为无法获得数据而白白浪费。”一位做计算集群多年的工程师这样对我们说到。也许在几年以前,当我们的企业部署计算集群的时候,还没有面临存储带来的巨大压力,但是今天,他们已经意识到,让计算集群能够良好运转的,不仅有软件、工程师以及电力和散热,更重要的是,其背后强大的“数据供给”――存储集群。

  近日,Panasas公司总裁兼CEO Victor Perez先生来到北京接受了我们的专访,刚刚开始,Victor Perez先生就向我们介绍了“Panasas到底是一家什么公司?”,他分列开Panasas的每一个字母,“Panasas的每一个字母都有其完整的单词,这些字母组成Panasas,其含义也组成了Panasas”,他表示,Panasas是一个结合了软件、网络、存储为一体的,提供Linux集群存储产品的厂商。

  随着众多行业的自身发展,其企业的应用要求更强的计算和分析海量数据的能力,从而完成企业业务的需求,目前来看,Cluster集群以其巨大的可扩展性和计算能力,对不断提升的对高性能计算的要求有着天然的“吸引力”。而在基于包括Windows、Unix、Linux众多系统的集群中,Linux集群因其开放性、较低的价格、良好的性能以及并不输于Unix集群的稳定性,成为了很多企业建立集群时的首选。

  Linux集群在如石油勘探、气象、地震海啸预警等方面大展拳脚的同时,存储却成为了限制Linux集群的发展羁绊。我们知道集群中节点众多,其每个节点及整体的计算量都非常大,所以才能完成企业大规模的高性能计算任务,但是这些计算能力都是要以存储系统能够提供充足的数据为前提的。Victor Perez先生谈到,以现在中国的很多油田为例,他们为了完成计算任务,不断的加入新的节点,虽然提高了整个网络内的集群的计算节点,结果却带来了很大的存储问题,存储系统的I/O带宽难以为继,很多计算节点因为无法获得数据而被迫停止运算或降低运算效率。

  存储集群的领导者

  作为专业的存储厂商,Panasas建立的初衷就是为了解决集群系统的存储问题而成立的,而目前Panasas主要的经历也就是在发展速度迅速的Linux集群存储上。他谈到,Panasas公司在发展战略上一直致力于为Linux集群提供基于通用以太网的并行存储解决方案,解决随着服务器节点的不断上升,而带来的存储I/O性能受限等问题。目前该公司的产品较多地应用在“Las Alamos”等美国国家实验室和大学等研究机构,而在中国,Panasas已经成功的进入了石油行业。

  谈到集群存储,很多用户可能提一个头疼的就是存储池的问题,Victor Perez先生认为目前的存储行业,提供的存储设备可以分为三个层次,第一个层次是以SAN、NAS、DAS为主的低端网络存储;第二个层次则是一些初级的存储集群,这些存储集群是利用一个软件来管理不同的存储池,整个存储集群中,仍会形成两个甚至三个截然不同的存储池。甚至可能NAS 池和 SAN 池分别部署在由不同供应商提供的不同存储平台上,而且各自都有自己独特的管理工具。结果,不仅增加了系统的复杂程度和系统管理员的负担,而且增加了费用。第三种,则是以Panasas、Lustre、GPFS为代表的能够建立单一卷的高端存储集群。他表示,作为能够并行管理多个存储池并让用户在应用中只需面对一个单一的卷的存储集群,目前Panasas的存储集群是业内的领先者。

  谈到存储集群,不得不提到目前Linux集群的存储问题,我们知道一个Linux集群有着成百上千的计算节点,这些计算节点通过或独立运算或通过分布式软件进行分布式计算,而在计算过程中获得数据,就成了目前用户集群系统面临的最大问题。如果还是采用传统的连接和存储方式已经不能满足系统的需求。

0
相关文章