【IT168 专稿】全球数据的海量增长,尤其是非结构化数据的疯狂增长,给传统的IT基础架构带来了严峻的挑战,IT技术正在不断地进行变革以希望解决海量数据增长所带来的挑战,并涌现出了一大批的新兴技术,作为存放企业重要数据的存储系统也不例外,而在这之中,Isilon无疑是存储行业解决海量数据存储问题的一颗新星,亦是一大利器。
Isilon的诞生:只为大数据
据EMC Isilon大中国区技术经理杨峰先生介绍,Isilon最初于2001年在美国西雅图成立,其创始人曾经在RealNetworks公司工作(编者注:其公司最具影响力的产品即大名鼎鼎的RealPlayer播放器),Isilon创建之初是想专注于媒体对存储的需求,因地制宜地提供存储解决方案。
EMC Isilon大中国区技术经理杨峰(左)与IT168记者合影
在Isilon成立之初,著名的风投公司红杉就对其进行了投资。红杉在美国硅谷在IT行业有诸多的投资,诸如思科、NetApp等等,并且其大多选择硅谷的IT公司进行投资。为何会选择这家位于西雅图的、专注于媒体行业的存储公司呢?杨峰经理认为,Isilon这种scale-out分布式集群处理方式是一种对存储超前理解的方式,红杉极为看好这一模式的未来发展,并认为这种技术代表了一种新的发展方向。
事实证明,红杉的嗅觉是及其敏锐的,其成为全球知名的风投公司也绝不仅仅是因为运气。Isilon之后的不断发展逐渐使其从媒体领域开始朝其他饱受海量数据问题困扰,尤其是非结构化数据问题困扰的其他行业发展。自Isilon公司2007年进入中国以来,先后进入了能源、生命科学以及央视为代表的媒体行业,中途被EMC公司收购,作为EMC大数据管理解决方案的一大利器。
据EMC Isilon大中国区技术经理杨峰先生透露,目前EMC Isilon在中国大陆大概有将近100位以上的客户,自从被EMC收购之后,其在中国市场的增长速度非常快, Isilon在2009年的用户增长情况大概在20%-30%左右,但到2010年和2011年,其每年都是以翻倍的速度在增加。其中排除了全球IT投资持续增长的原因之外,其与EMC的强强联合也是密不可分的。
${PageNumber}杨峰谈Isilon大数据管理:架构是关键
不管是红杉对Isilon的投资,还是EMC对Isilon进行收购,其中很重要的一点就是,Isilon存储系统的架构。据IDC的分析报告来看,Isilon在存储行业开启了全新的scale-out横向扩展架构。
杨峰认为,这种scale-out横向扩展架构跟服务器行业的发展几乎有着相同的地方,服务器的发展经历经过了大型机、小型机,最后发展到现在占据市场主导的X86集群,其发展规律是从scale-up逐渐过渡到scale-out;而存储行业亦遵循这一规律,从高端的、昂贵的存储发展到类似于Isilon这种单一节点较为便宜的分布式存储。EMC之所以收购Isilon,很大程度上是看重这种技术的未来发展方向,这种开放性的架构将很好地融合应运时代发展而诞生的新兴技术,而这一架构也代表着存储行业发展的普遍规律。
“Isilon的这种架构就像是房屋建筑的结构,结构打好之后,可以用砖头去垒墙壁,也可以用混凝土,混凝土肯定比砖头快,新的技术发展也会代替混凝土,是有可能的。”杨峰在谈到Isilon的这种Scale-out横向扩展架构时,打了一个比较易于让人理解的比喻。
说到具备横向扩展能力的Scale-out架构时,很多人都不会陌生,因为现在很多厂商几乎都宣称自己的产品具备Scale-out横向扩展能力,并且在标准化硬件X86芯片的影响之下,存储行业也许将逐步走向服务器行业的老路,即标准化的硬件使得产品同质化严重,产品的核心竞争力也许会从硬件的比拼逐步转移到软件所能提供的功能。那么EMC Isilon将如何应对这种情况呢?
“Isilon至少领先了竞争对手三代到五代的时间。”杨峰在谈到这个问题时说,在2008年的时候,Isilon的操作系统已经发展到第五代,硬件架构也发展到了第三代;而直到2009年的时候,其他厂商才注意到集群存储所蕴含的巨大潜力。所以不管是从软件的发展还是技术成熟度方面,其他厂商的集群存储都无法与Isilon比肩。杨峰在谈到Isilon产品的核心竞争力时表示。并且记者从EMC存储技术论坛方面得到的消息,今年EMC也宣布升级了Isilon产品最新的操作系统——OneFS,一个将操作系统和文件系统集一身的管理系统。
基于这种可横向扩展的Scale-out架构,EMC Isilon将很多新兴的技术添加到了Isilon产品之上,如在早些时候,Isilon产品使用的是10Gb的SDR技术,在两三年之前,Isilon将其更新为能够提供20Gb带宽的DDR技术,而现在Isilon所使用的是能够提供40Gb带宽的QDR技术。Isilon的这种架构并不妨碍新兴技术在其中的应用,同样对于内存或是CPU来说,只需跟随行业潮流,不断更新硬件即可。新技术的应用、优化将帮助Isilon提升整体的性能。
${PageNumber}Isilon之性能:快才是王道
尽管大数据一直是这几年来的热门话题,但业内并没有关于大数据的标准定义,各个厂商都对大数据有着自己的理解。目前业内对于大数据较主流的认识是IDC提出的“4V”原则,即即容量、类型、速度和价值(volume、variety、velocity和value)。而对于使用Isilon产品的用户而言,其采购Isilon产品本身就是为了关键业务,所以价值毋庸置疑。
杨峰认为:“Isilon对于大数据的处理,更多的是体现在如何对大量数据提供更好的分析的平台、存储的平台,能够加速对数据更好的利用。”在这方面,Isilon产品有着诸多的技术都是围绕与此,如Isilon的Scale-out横向扩展架构、Globle cache、自动分层存储以及SSD支持等等。
Globle cache技术使得Isilon集群存储中的内存可以全局共享,使得在某个单一节点上添加内存就可使整个集群的内存容量得以提升。而其他较为传统的集群存储则很难做到这一点,通常其某个节点故障,其他节点就必须接管这一节点上的内存数据。同时Globle cache技术可将集群内所有的节点的内存进行统一使用,其容量将会非常巨大。
而关于自动分层存储技术以及SSD支持所带来的优势,现在业内谈得较多,相信大家也比较熟悉,这儿就不用细说。但这儿值得注意的是,在Isilon产品中,其自动分层存储技术是基于文件级的自动分层,与其他厂商的产品有很大的不同。据杨峰经理介绍,Isilon最大的特点就是文件级的技术,Isilon本身就属于单一文件系统,没有卷,所以对于它来说,所有的子层次就是目录或者文件,Isilon所有的软件功能都是基于文件或者目录这个层次来实现的,这是Isilon产品最具亮点的特色之一。
当然,作为一款针对大数据的解决方案,Isilon的特点不仅仅只有这些,EMC还在不断根据用户需求融入更多、更强大的功能,例如在最新的OneFS操作系统之中,EMC对代码进行了重写,极大地提高了Isilon的性能;同时还增强了对iSISC的支持,即对结构化数据的支持。另外还加强了身份权限管理方面的功能,让企业数据更加安全。
${PageNumber}联合GreenPlum:让大数据不再是困扰
在大数据解决方案方面,EMC Isilon可谓是大数据管理的一大“利器”。现在用户对大数据不仅仅是需要管理,同时还需要对其进行分析,并得出结果。而关于这一方面,EMC对应的则是Greenplum。那么Isilon与GreenPlum是否有可能整合成一个整体的大数据解决方案呢?
据杨峰经理透露,目前已经有Isilon与GreenPlum相结合的整体解决方案。在这个解决方案之中,应用层和算法层采用的是GreenPlum部门的技术,而在HDFS层(Hadoop FS,即文件系统)则采用Isilon技术。尽管这是一个类似于整体解决方案的产品,但这两个部门的产品仍可分开使用。
“Greenplum可以在自己的DCA上,来安装存储,实现HDFS的功能,它可以自己来实现自己的一套Hadoop的架构运算。如果Isilon单独出来,它可以很好的提供同时对标准的协议,包括NFS、HDFS等等标准协议的支持,用户如果自己开发出来基于Hadoop的应用就可以直接跑在Isilon上,这是一个既合作又各自独立的架构。”杨峰经理进一步解释说。
尽管Isilon现在已经遥遥领先于集群存储市场,但发展对于每一款产品来说,都是一个永恒的主题,Isilon也不例外。那么Isilon未来将如何发展呢?杨峰经理说,目Isilon将按照目前的路子按部就班地走下去,将添加更多的技术和功能进去,但关于未来即将升级的功能或技术,杨峰并没有透露太多。
但杨峰却给了我们另外一个信息,就是EMC在EMC World提出的概念,例如数据就是计算,离数据越近就越有价值,因为Isilon已经全部采用X86架构,那么随着X86处理器计算能力的不断提升,其完全有可能将应用置于节点内部运行。当然杨峰经理强调,目前这还只是一个概念,还没有应用到产品上去。