商讯信箱
用户名: @
密  码:   注册|忘记密码
登录
个人用户经销商
信箱 E杂志
您的位置:首页 > 存储频道 > 正文

英特尔杜江凌:亿万级计算时代应用展望

作者:杜江凌  2008-01-13

     今天非常高兴有机会来这里第一次参加我们2008年的中国IT技术精英大会。这段时间又开始过年了,首先我借这个机会跟大家拜一个早年,祝大家春节愉快,万事如意。

     刚才王总讲到了,我们的IT产品已经从技术为主到现在的应用来拉动技术,现实也的确是这样。大家都知道摩尔定律,所谓摩尔定律它是在过去的30多年当中一直是促进我们CPU发展的一个动力,也是促进我们这个半导体工业发展的一个很重要的动力。

     根据一些公布的数字,到2011年,晶体管的数目已经达到了320亿,我同时也查阅了一下资料,在1996年的时候是一千万个晶体管,增长了无数倍。一方面晶体管的数目在不断的增加,另一方面计算机的CPU的架构这么多年实际上是没有太大的变化,实际上限制了计算机性能的发展。举例来说就像只增加住房的面积却不改变住房的格局,假设我们住的两室一厅,只会卧室越来越大,客厅越来越大,但我们一直还是住的两室一厅。

    我们的CPU基本上就是这么一个状态,因此我们很难充分利用摩尔定律不断给我们提供的这么多的晶体管。于是从前年开始各家公司如,IBM、索尼、等等一些友商都开始向多核,也就是说多个计算单元在一个CPU芯片里面,一个硅片里面的技术的发展。就像给了我们更多的住房面积,你就可以根据更多的面积来设计更多的房间。这样你就可以干很多事儿,不光是一个起居室,一个卧室了。而是一个具备了灵活性的发展。

    再回顾一下我们计算机发展,我是在1980年左右在国内上大学,那个时候我们都用的是IBM PC,最早是64K的内存,硬盘容量也不大,一个IBM PC放在我们中心实验室里面,很沉的,我们进去还要登记,非常珍贵的仪器,设备。那会儿都是输入一个DOS(英文),然后你就可以编写程序,界面全都是数字化的界面。后来到了90年代初,那会儿我去了新加坡大学做研究,那时候我第一次见到了Windows的界面,很不好用的界面,不是很灵活,但是已经是图像的界面,这是1992年、93年,那会儿是什么CPU呢?286,386。1997年我在英特尔的时候,在美国开始做把多媒体功能集成到我们的PC上面,后来发展成为奔腾系列,所以这又是一个飞跃。那么再往下,我们从去年开始我们的英特尔中国研究中心的团队跟美国一起开始研发所谓的多核的芯片。

     我们去年有一款实验的芯片出来就是80核,它所能够达到的计算能力就是一个相当可观水平,相当于是我们在1998年做的一个由一千多个CPU组成的一个数据中心,他所占用的提及却只有指甲盖大的。所以这个发展是现在这种发展的趋势。所以大家就要问这样一个问题,像这么大一个计算能力的芯片,它能够给我们干一些什么事情,它怎么改变我们人的生活呢?

    下面我就给大家举一类型的例子,由于有了这样的亿万级个人计算的能力,给我们带来的应用就是所谓说的RMS三剑客,三个杀手级的应用,R就是识别,M就是挖掘,S就是合成,这三个是什么意思呢?我先给大家举一个比喻,后面我再用技术的词语来描述。这个就像我们谈恋爱找对象,首先找对象之前你脑子里要有一个你想象的一个理想对象的形象,这是所谓的建模,这是识别的过程。你要先要想一想应该长得什么样,气质、长相等等,所以这是一个建模的过程。这相当于是你有这么一个形象,然后拿着一个照片,觉得这个东西我能够识别,如果有这样的话我肯定能认识,这是识别。那么有了这张照片以后下一步干什么?找,这是很费劲的一件事儿,这是我们所谓说的挖掘,要能够把这个对象挖掘出来,从茫茫人海当中找出你的理想的梦中人,一旦找到了,第三件事儿是什么?就是约会,这是正式开始了你的合成过程。最后是有情人终成眷属,能够达到这样的目的。这是我们所说的三个过程,RMS。

    下面给大家每一个结论进一步来讲一下,识别实际上它回答的一个问题就是说是什么,实际上有两部分,一部分你先要有一个模型,你要知道你要找的东西是什么,你要看什么东西,最后你根据这个模型在实际当中找出你的对象跟它对比,实际找的对象跟这个模型对上了,你这个识别也就算完成了。这是所谓的识别。我们计算机实际上一直在这件事情上想进行发展,原来是非常艰难的一件事情,大家知道比较多的几个例子,像语音识别,像脸部识别等等,这些都是在过去做的比较多的,但是还很难有突破性的发展,我觉得还是应用还没有找得太对,比如说语音识别,英特尔原来做过,IBM也一直在做,都能够达到99.9以上的程度,但是还是在有些应用上面是很难把它变成产品。

    因为这些应用稍微差一点就不行。所以应用是很关键的,找对这样的应用,现在有一个应用找得很对,就是WII,这个WII它最重要的一点就是有了一个识别人动作的这样一个能力,任天堂出了这个WII在短短两三年之内彻底改变了,或者说还游戏之本性,从我们现在搞的游戏除了这种年轻人手指头非常快,眼睛非常快的人玩的游戏,那么小孩儿、老年人都是没有办法参与的,家长又不希望孩子多玩游戏,所以游戏这个行业实际上被搞得一个很尴尬的一个境地。但是这个WII的出现彻底改变了这种,它还游戏之本性,又把游戏变成了一个娱乐的这样的一个东西,变成了娱乐的东西。

    怎么做到的呢?它就是使得这样的一个通过对于你手柄的这样一个遥控器红外线的识别,计算机对它的一个识别,它能够使得你一个真的人,在计算机以外的真人能够和计算机里的游戏进行互动,达到了这样一个效果。我玩过高尔夫球,很有意思,你在外边一挥,你挥中了以后手的摇柄还有一种振动,玩上两个小时没有问题,这是一种识别给我们带来的应用。但是这个东西现在还是非常的不够复杂的这样一个识别的过程。大家可以想象,它就是靠着一个红外,你这样一打,然后里面识别这个红外,它实际上做了一些假想知道你在干什么。实际上你可以去模拟,现在有很多WII的高手,他们不是那么卖命的在那儿玩了,他就是坐在那儿,拨动遥控器,他就知道手的位置怎么一动就知道这个球打出去了,坐那儿就可以玩了,不需要一个真正的在实际当中挥动,当然我们这些诚实的人们我们不会干这种事儿,我们还是很认真的在打,但是确实是有这样一个问题。当这个识别技术遇到了我们万亿计算会发生什么现象呢?

     我们英特尔现在在我们实验室里有这样的研究,就是真正的对于人体运动的识别,就是说你在一个房间里面,在房间一圈弄上四五个摄像机,那么当你做这个动作挥动的时候,它是实时的把你整个的动作彻底的运动轨迹所有运动的东西全部给你记录下来,这个识别就是一个人真正动作的识别。有了这个识别以后就可以通过计算机做一个非常好的一个模型的预测和跟踪。真正能够反映出打球时候的动作,大家可以想想这样的话高尔夫球在家里面打起来就非常爽了,我平时在家里面就可以非常真实的能够反映出来这样的一个事情。所以这个识别随着它的复杂度能够提高,可以给人们带来很多生活上面的新的享受。

    下面我再说第二个挖掘,挖掘实际上我们大家对这个有一个非常熟悉的例子,那就是搜索,搜索实际上是最简单的一个挖掘。我就是找文字,找文字的匹配这是非常简单的一个挖掘。但是大家知道随着多媒体的出现,那么这样的挖掘就会变得不是简单的针对文字,我能够对音乐进行挖掘,我唱一段歌,我就能够在网上找到音乐它整个的歌曲,大家不一定记住这个歌的名字。再一个就是说视频的搜索,这就更困难了。

    也是我们英特尔中国研究中心做的这样一个研究工作,就是所谓的视频检索,视频检索它能够做到一个什么目的呢?就是说在前面讲的识别的基础上,比如说对足球里面的射门进球,他对这个东西能够识别,他知道什么时候进球了,通过检索以后能够在网上,或者说在你整个的世界杯的基金里面也好,能够迅速找到你所有的进球,最后给你编成一个15分钟或者是30分钟的进球即景,能够欣赏你想要看到的最佳射门进球即景,不用你在这儿整个看完90分钟的东西,或者能够找出你最想看到精彩电视的即景,比如说电视剧哪一个精彩的人物,都能够通过这样的识别,视频的识别就非常快的能够找到你非常想看的一些即景。这个东西是需要非常大的计算量,我们现在用的就是模拟,模拟用30核和32核能够进行这样的搜索,视频检索,能够达到把一个小时的视频检索里面的进球即景放在一个五分钟的里面,能够达到这样的一个效果。在五分钟的时间之内能够实现这样一个搜索,所以这个还是有很大的潜力。

     第三,就是合成,这个合成实际上它要解决的一个问题,就是说会怎么样,就是说我搜到了这个东西拿它干什么,我能够对搜索的结果怎么能够把它用起来,或者说我能不能复制一个,我想我已经识别到的东西,这也是有很多的应用。大家都知道现在的图像,是用图像在Internet上面模拟3D的这些人越来越多,那么这些人的模拟,现在还都是比较假的,比如说我人在动,那么他的影子随着我人一转身,或者往前一走,他的影子能不能跟着动呢?动不了,实际上合成就给你这样一个能力,因为它建了物理模型,能够使你人在走动过程当中,随着环境灯光的变化,使得你的影子实时的进行计算,这样的游戏出来就是非常的逼真。

    这里面是斯坦福大学的一个教授,大家可以看到,这是模拟合成的三种事件动态的东西,这个是海浪,海浪在打击岸,打击航标灯塔的时候,整个浪的变化,完全是用计算机模拟出来的动态。第二个是两种不同的火焰,一种是非常亮的火焰,另外一个是烟雾比较多的火焰,它整个的动态的这种变化。第三,是一个非常轻的光滑的绸缎,当从一个桌子上面一撒手掉下来的时候它整个纹路的变化,一直到最后落到地下,这都是用整个计算机模拟出来的,让你看上去就像视频那么真,这也是需要大量的这种计算,在这个后面来支撑这样的一个效果。

     我把这三个东西综合起来给大家再举一个例子,就是最近我跟清华大学的一个教授,做生物工程的一个教授,我们最近有一个交谈,就说到了人体的基因,大家知道人体基因实际上对于人你的本质上的一些遗传的因素,它是探索这个秘密最重要的一个源泉,现在对于基因的分析是非常非常的贵,主要是提取这个基因,把基因的数据往外提取的时候是一个生物过程,这个生物过程现在还是比较慢,每一个小时才能提取多少基因的数据,前端是一个生物的过程,最后出来的就是数字了,代表了一个基因组,原来很慢,最近有一个世界联合国基金的一个项目,在这个上面有了突破性的基站。现在这个基金的吞吐量就是能够从一个生物过程把基因提取出来的速度已经大大的加快了。加快了以后它的价格也一下子下降下来了,从原来可能要是百万这样的钱,才能够提取出所有人基因的因素,到现在35万美元就能够把所有的数据全部提取出来。这个趋势还在不断的往前发展,非常的迅速。有人预测在未来的几年里,有可能一下降到这个提取基因的速度,一下能够把成本降低到一万美元,甚至更便宜,上千美元。

    在生物界大家突然意识到了这么一个问题,如果这件事突然变得这么容易了,基因的数据出来这么容易了,我们怎么办?下面的一个问题就是基因组,第一,能不能够识别,基因数据出来的时候是什么概念呢?就像一本书被你打碎了,都剩下一个一个的字母了,突然出来了,交到你面前,上百个基因单元给了你,全部都是书里的一个字,你能不能在最短的时间内把这本书还原出去,就是这个识别过程。识别出来了以后,然后你要对这个基因近来分析,找,这个基因对应某一种疾病,它的这种可能性。这个东西如果一对一的找还可以,我有一个好的标本,我这是不好的标本,这还可以,我一个一个字母对这还能对得上。但是生物专家们告诉我们说,我们的人相当复杂,没有这么简单一个基因对一个毛病,如果说你的胃痛邮毛病了,有可能是两个基因的作用,所以你要对一个基因组,进行上亿的数据的比对,找到一样的,或者是找到不一样的,这个预算量大家想一想是多么的恐怖,这才是第二点,进行分析。再往后的话,就是我要对这个人看病要能够治,这就是更加复杂的过程。所有这些产生了一个需求,摆在我们这些生物学家和现在开始我们做计算的人考虑的一个问题。

    由于时间的关系我只给大家做这样一个美好的展望,一旦我们今后计算的能够达到我们说干刚才所说的事情,我们每个人可以在家里面放一个基因的识别监测器,自己没事儿在自己耳朵上弄点血下来,可以监测一下看看自己的基因是什么情况,在吃药的时候就不像我们现在这么盲目的,医生只告诉我说这个药只分两类,一类是大人吃几片,小孩儿吃几片,多么粗的分类。以后的吃药就会精确到你这个人,根据你有没有这个基因,根据你这个药对基因有没有用的药,吃多少,那对我们人的健康是有多么大的一个好处。

    这个计算跟应用,这一对因素它们在互相促进,有很多很多新的应用,随着我们计算能力的增加在未来会出现。所以我希望能够跟我们大家一起来共同创新,为改变人们的生活与工作做出更大的贡献,谢谢大家!

1
【内容导航】
第1页: 第1页
©版权所有。未经许可,不得转载。
[责任编辑:洪钊峰]