存储 频道

IBM院士许育诚:技术革新 再创存储未来

  【IT168 专稿】IBM再造存储,立足大数据,再度激起业界对于存储的热情。再次掀起对软件定义存储的思考。今天,IBM主办的“ROCK EDGE CHINA 2014——为大数据时代再造存储摇滚盛典”在北京的万达索菲特酒店拉开帷幕。

  有没有人想过,5年之后,或者10年之后,我们的存储技术会是怎么样的?在本次IBM摇滚盛典上,IBM院士、存储首席技术官许育诚(Vincent Hsu)博士便为大家带来了题为“技术革新 再创存储未来”的主题演讲,与大家分享了当前IBM存储在创新研究方面的计划。

  ▲IBM院士、存储首席技术官许育诚(Vincent Hsu)博士

  IBM研究室的前瞻性可谓有目共睹。在过去的100年,IBM在业界最有特点的地方就是IBM有一个非常非常强的基础研究的团队,IBM CEO经常跟员工说,我们每一年投资10亿美金做基础科学的研究。今天许博士跟大家介绍的就是从原子级别的存储,到优异数据的研究。

  首先谈一下挑战,在存储方面有哪些挑战,对于将来大数据的时代。将来的数据会呈几何式的成长,像企业数据的成长,社交媒体,今天所有的机构都非常注重大数据,大数据实际上今天才刚刚开始而已。

  如果要做一个完整的背景的分析,可以看到数据跟数据之间做着相加相乘的效果,从原始数据到最后背景分析的数据会增加1000倍。要实现智慧地球的愿景,最重要的是大数据中涵盖了云计算,涵盖了社交,涵盖了物联网。刚刚赖总讨论了海量数据,大数据时代对石油的重要性。

  接下来,许育诚跟大家分享了IBM宇宙量数据的情况。极致大数据的计划,它是平方千米阵列。它是用横跨大概3000公里的范围之内,利用极致大数据收取天象的信息,进行天文学的研究,做几个研究。第一个是研究银河系跟星象的转移,第二是研究黑色物质的分布。最终他希望能够找到在大爆炸以前,在130亿年前,大爆炸之前世界是长的什么样。

  从星体范围的天空源来看,能够把这些光聚集起来,经过联系,最终的目的是希望能够重构天空的景象,在130亿年前天空的景象。我们看一下它的数据量是多少,每一秒钟的数据是10个PB,一天要加330个磁盘,一年要加12万个磁盘,一天14个ExaByte字节,到底数据有多少,等于每一天要加1500万个iPods,它是每天互联网数据流通量的2倍。

  目前为止世界上没有单一的技术可以解决这个问题,即使存储也存不下去,更不要说你能够分析这些数据了。IBM跟ASTRON合作,做宇宙探讨的起源,当然IBM知道这样的技术发展,将来对商业化或是对石油勘探,对地震的分析都是非常有用的。我们计算机的系统跟存储的系统在未来会有更大的价值,初始投资3290万欧元,为期四年的计划。它每年所做的原数据都是今天互联网的2倍以上,目前为止在世界上没有任何的技术是可以做这样极致大数据的挑战。

  我们通常讲大数据的思维,决策的时间从每年的每月到每秒、每毫秒、每微秒,这个计划是超过其他大数据的计划。第一,数据量非常非常大,在收集数据的同时必须要做数据的处理,不能把所有的数据全部收集以后再做分析,那样就太慢了。IBM在做这样极致的大数据计划,有许多挑战。

  第一,我们收集到这么多的数据,怎么样从原数据里面去找寻有用的数据,分别出哪些数据是有用的,哪些数据是没有用的。

  第二,即使筛选下来的数据本身,也是宇宙量的数据机也是海量的数据。我刚才讲过了,即使是你只存千分之一,你每天都要再加上330个磁盘才有办法解决这个问题。即使是筛选过的数据也要做有效的管理,更重要的是我们存储了这么多的数据以后,怎么样从这些数据中得到我们希望的信息。这不是说只是单纯的读到一些数据,不是单纯的存这些天象的数据,怎么样从这些数据中得到一些信息,不是一般的计算机技术可以得到的。

  至于软件定义环境,要求跟以前传统式的是不一样了,每秒钟1300万条的信息,超过10亿条的记录,它的要求是超过10倍的存储速度。刚才赖总讲了弹性存储,有几个特点:

  1.它不再局限于某一种访问的模式,有一个弹性存储的软件,可以横跨不同的应用,所以数据就不用搬来搬去了。

  2.弹性存储的特性能够非常智能的调配,比如什么时候放磁盘,什么时候放Flash什么时候放到磁带上去面,它都可以非常智能的调配。最重要的是它在做这样调配的时候,对于应用是透明性的。它在做调配数据的放置,所有的数据都是在线的,不需要离线以后再做数据的放置。

  3.当你的数据中心,比如说客户有5个数据中心,你怎么样把数据做分布、做整合。现在一般的做法,比如说银行,银行通常每天晚上把数据收回来,弹性存储可以直接做数据分布和整合。第四,弹性存储不是自觉于Cloud外面,是和Cloud紧紧结合的。把数据放在闪存,放在磁盘上面去,同样也可以放到云上面去,包括公有云和私有云。

  弹性存储是软件的,你可以跟IBM软件结合放在你的服务器上,用你的现有的存储或者是内存,帮助客户实现数据的分析。上个月我们把弹性存储又放在了云上面去。

  弹性存储有许多的功能可以在任何的数据上面进行自由的伸缩,自动的数据管理,可以针对闪存和Cloud有开放性的架构。去年美国花旗银行也是用我们的技术,在风险分析上面增加的100倍的效果。

  今天跟大家报告的有关的IBM研究室前瞻性的这些计划,有的东西还不能买,但我想跟大家有一个沟通,IBM研究的方向在哪里,我们解决的问题在哪里。希望不久的将来,这些极致的大数据计划都能够实现。

0
相关文章