存储 频道

粱建球:IBM工作负载优化分三步走

  【IT168 资讯】日前IBM启动智慧地球战略的新一轮攻势,重点强调三个方面:包括为工作负载而优化、创新的云架构和绿色节能。IBM系统与科技部大中华区资深架构师梁建球参加了发布会,并就智慧地球三大要素中的工作负载优化进行了深入阐释。

  梁建球:现在有三个特征来定义一个智慧系统。第一,以前没有用这么大力度谈的特征,就是为工作负载而优化。什么是工作负载呢?工作负载就是应用,每一个应用程序。应用程序的特点是不一样的,为什么不一样呢?因为这些应用程序都是用来支持不同的业务,有可能是我们银行的业务,它的特点是连线交易,非常快的响应时间,同时要有非常高的可用性。可能是一些公司里面的商业支持的业务,跑企业的计划、ERP这样的一些应用。

粱建球:IBM工作负载优化分三步走
IBM系统与科技部大中华区资深架构师梁建球

  也有可能是刚才谈到的高性能的运算,我们需要非常多的计算系统放在一起提供非常高的运算能力。我们还常常见到,在互联网平台上,基于Web2.0社区、博客、网络游戏的应用,因为在不同的业务上产生的不同的应用程序,所以特点不一样,工作负载特点是不一样的,有不同的领域。我们IBM根据这些不同的负载领域有不同的系统平台,包括大型主机支持银行关键连线交易的应用,也有Power、Uinx的系统支持不同的商业应用。

  还有专门的HPC高性能计算的系统,还有很多的机器比如x86、刀片这样的机器支持Web2.0的工作负载。我们谈到为工作负载而优化系统,从最低的层面有不同的平台供大家选择。我们深信不可能有一种东西可以解决所有问题,一定是有更合适的技术解决不同的问题。强调工作负载优化,在不同的平台根据里面的应用,不同的特点,进行了这些平台本身的特性增加,这在下面会谈到这些方面。

  第二,很多时候我们碰到一些工作负载是要解决一个具体业务问题。我们可以通过把不同的系统加上软件整合在一起,在工厂里进行预安装、预调优的组合,这是第二个层面为工作负载优化的做法。

  第三,针对这些非常具体、非常特别的工作负载。举一个例子,针对美国的核衰变的预测工作负载,作出了Roadrunner走鹃的系统,这是一个混合的系统,把不同的处理器组合在一起,把某一些工作拆分成不同的部分,适合于在不同的引擎上跑。这种做法是更加客户化,更加特别来做,能够适合更大的效率。我们组合、生产、研发根据不同工作负载的系统。

  举一个例子,今天开始看到非常多的发布都是围绕工作负载优化的,其中Uinx服务器、POWER7里面有这样一个特点,今年POWER7的服务器一个芯片里面有8个处理核,每个处理核有4个线程,有很大的并行度执行多个同时并发的任务,不是所有的应用都需要很大的并行度,有些应用比如说数据库或者商业分析,是需要每一个处理核的性能提到最高。在POWER7芯片里就有两种模式,一种模式叫做MaxCore,我全部8个处理核同时开动,所有的每个核4个线程总共32个线程同时开动,支持最大的并行度,这非常适合今天智慧的地球有很多同时输入的数据。还有一种选择,把CPU的模式从MaxCore转到TurboCore,把8个处理核里面的4个关掉,剩下的4个把CPU的时钟提高,把所有的缓存都提供给剩下的4个CPU使用,这4个CPU可以达到最高的单个CPU处理能力,非常适合做一些商业智能、数据库的应用。根据工作负载同样能够把POWER7的服务器调整工作负载。

  这里做一个形象的比喻,有一个四驱的SUV,根据路况,有一个办法利用控制杆转成两轮驱动,平地可以达到更高的汽车的驱动能力,更高的速度,这是非常相似的东西。我想跟大家分享的是,这样的技术是以前从来没有的,我们的竞争对手还没有达到这样的能力。我也可以预期,这种能力在往后的发布里会越来越先进。

  在这个IT的系统里除了服务器还有存储,存储上IBM也有很多根据工作负载的特性,比如DS8000, DS8000是用于一些大规模的,可以连接单个应用,支持单个应用或者少量的几个应用,通常是在支持大规模的连线交易或者批处理的时候使用。我们现在到今天为止,存储的性能是由几个方面决定的:缓存的机制、数据的分布方法、硬件模块。影响整个系统的方面主要是由缓存的机制和数据分布决定的,我们在DS8000里就有三种缓存的算法,分别针对连线交易、批处理和随机的读写,相当于家里有电饭煲煮不同的东西有不同的模式,可以煮出不同的东西,这是DS8000针对工作负载的特性。

  今天发布了一个可以有多种存储的,包括高速的缓存还有固态硬盘,这是比传统的硬盘快很多的媒介,还有光纤的硬盘和SATA的硬盘,存储不一样,应对的工作负载不一样。ACT可以随时观察应用的表现,智能的决定数据放在哪里,实现整体非常高的性能。这是DS8000的做法。另外一种是XIV,这种磁盘阵列应用在连接多个应用系统,数量非常多,每个应用系统同时去使用这个磁盘,他们各自的应用特性都不一样,这时候XIV做了一个动作,不管你是哪种,我把所有的数据都放在这个硬盘里,保证整个磁盘对每个应用都提供均衡的性能的体现。这种做法是不需要任何人工干预的,磁盘阵列存储一级也有根据工作而优化的特性。

  x86的领域里,在硬件里面是差异化最小的,但是由于IBM有这样的一个根据工作负载而优化的指导方针,我们从这方面对x86的硬件进行深入的开发,也能开发出根据工作负载而优化的特性,使我们的产品在市场上有它独特的优势。这就举到一个例子,我们在3月份发布的eX5的服务器可以做到这样的事情,两个机架式的服务器或者刀片服务器合并在一起,变成一台高端的服务器。也可以有一些内存的模块,也可以很方便的合并到这个服务器里面,能够整体提高这个服务器的内存的容量。

  这时候我们就看到,我们要去处理的工作负载有些是需要大量内存,如果需要服务器做虚拟就需要很多内存,需要非常厉害的处理能力,也有一些数据库的应用,需要很多处理能力和内存。这样的话我们就可以灵活的把这些节点组合在一起,我们的一次性的投资可以满足不同的需求,可以在不同的项目里面、不同的时间里把这些模块灵活得组合。这使我想起小时候看的一个动画片叫做《百兽王》,有5个机器的狮子,每个人平时都去维护世界和平,除恶扬善,碰到坏人5个机器人组合成一个机器人,把最大的坏蛋干掉,现在eX5也有这样的能力,为工作负载优化。

  谈一下高性能计算。在去年世界超级计算机展览会上有一款产品吸引业界和众多媒体的关注,就是基于最新的POWER7处理器做的最新的高性能计算机,代号叫做IH,今天还没有正式的发布,这个机器将会10倍于现在看到的最快的计算机,这不是IBM自己研发的,是美国的国防部和美国科学基金研发委员会投资于这个项目的开发,他们相信IBM有这个能力开发真正高端的超级计算机。里面融合了水冷的技术、Cell多处理器的技术。这一个高性能运算的系统今天还没有发布,到明年才会发布,世界上各个比较大的超级计算的用户已经给IBM下了订单,排队等这个机器出来。刚才何总谈到,我们国家要做气象预测升级的部门,也在跟IBM密切的探讨,怎样去使用这样的系统。

  这里给我们一个启示,为什么美国的国防部和中国的一些大型气象预测部门要跟IBM去看这个没有发布的系统呢。其实我这里做一个比喻,图中左边是香港飞虎队的配置,里面配有不同的枪械,包括机关枪、冲锋枪、手枪、炸弹,很多东西集中在一个队员上面,这个队员是经过非常精良的培训,可以应付很多复杂特殊的环境。右边是仪仗队,他们也有枪,不是高强度,高密度非常好的配置的军队。我们预测在飞虎队一个人就可以干掉普通的仪仗队,甚至可以干掉一个连。在我们的现实里面,高性能计算也是这样,使用POWER7 IH的节点,由于提供最高的密度,非常好的互联性和特别的冷却技术,跟传统的计算节点比较,做同样的事情能节省一半的能耗,空间只是传统节点的1/12,有一些技能是为了告诉我们被优化了。

  刚才谈到了一些基于本身不同平台的技术,再谈一个硬件和软件组合的技术。(图)这叫做IBM智慧分析系统,里面是由硬件系统,包括Power服务器和DS5000的存储,上面整合了数据库软件,也整合了在这个数据库软件上做商业分析包括Congnos这样的软件,这不是简单的组合,里面除了把它东西都放在一起以外,我们还进行了调优,系统设计里面包括虚拟化设置,也包括Power高可用性的设置。软件方面也经过了参数的调优,最大的优势就是可以很快的帮客户部署这个系统,客户可以很快从现有的数据里发现具有商业价值的分析。在我们的客户里可以把一个原先需要6个月部署的时间减少到12天,最重要的是可以往后进行模拟化的部署,可以不断的扩充,这个现在业界是少有,没有其他的厂家可以做。关于应用,在银行里存在多种商业诈骗的犯罪,这种诈骗犯罪影响非常大,包括苏格兰皇家银行等他们的损失都是以千万美元或者上亿美元来计算。这些损失完全可以通过商业智能堵截的,国外的大银行里使用了IBM商业智能的方案,在投产的第一天就堵截了一个50万美元的诈骗交易,而且这个银行预测每个月在这方面可以挽回的损失大约有100万美元。

  刚才提到系统的性能今天不再是系统CPU有多快,带宽有多高,而是多快可以回答一个业务的问题。我们从另外一个角度看什么是智慧?这个智慧就是你能有多快把有价值的东西投入生产,产生一个回报。所以我们看这是为什么我们觉得针对工作负载而优化的组合是非常智慧的系统。

  现在讲一个短小的故事关于云计算,基本上现在云计算铺天盖地,每一个人对云计算都有不同的理解。我想通过这个故事讲一下,云计算是一个什么样的东西,到底可以帮助我们做什么。这个故事里的主角是电信的运营商,传统的赚钱方式是通过带宽,很多企业都觉得它的传统业务不足以支撑它的增长,所以他们基于这个带宽的优势建立了IDC机房这样的增值业务。在不同的业务里客户群不一样,带宽里有一些个人的用户和企业的用户,在IDC和增值业务里大多数都是小的用户,他们本身就追求最低成本,这样使电信运营商有一些发展的瓶颈,带宽的发展很快竞争也很激烈。

  在IDC和增值业务上,本身能够提供给客户的增值性不是很高,本身的利润也不是很高。电信运营商就很苦恼,同时听到很多云的东西,全国都在号召大家做云的研究,这个电信运营商就跟我们IBM讨论,用云怎样解决商业发展的问题。后来得出一个结论,我们可以尝试把原来附加值低的业务比如说IDC机房租用和增值业务做成云的系统业务,通过IDC的技术提供基础价值外包给企业用户,这样有了新增长点。

  我们经过讨论以后,决定做基础设施云来提供企业的外包是最有利的。因为可以对客户有很多吸引点,这些吸引点除了传统谈到的企业级数据中心管理、高可用性、灾备以外,还有一些新的特点,比如说服务的快速交互、灵活的资源协议还有一些新的特点都是很吸引这些中小企业,甚至大企业的客户。如果企业的客户把它的基础架构放在我们这个电信的运营商里面跑,自然就可以增加带宽的使用,也可以通过这样的方式慢慢的拓展一些应用方面的业务。

  IBM帮助这个电信运营商提供一种云,这种云是基于Power的服务器,是UNIX服务器提供给企业客户,我们的电信运营商发现这种云对企业客户非常有吸引力。第一,如果企业客户自己建基础设施,通常会走很多的流程,需要很长的时间,有时候等这个系统建设出来商机已经没有了。如果使用电信运营商提供的所谓Power服务器服务,可能在数天之内就完成了。第二,以前企业的业务有一些突发的增长,这个企业总是到外面采购新的服务器回来做升级,等这个业务的峰值过去,新投入增加就不需要了。如果使用云的服务,这个企业可以签订一个协议,这个月初的时候用一两个CPU,到月末结帐的时候用4个CPU。

  这个事情的确是在IBM的技术里可以实现,包括我们的虚拟化微分区的技术,共享处理器的资源。也通过最新的系统软件VMControl可以做动态的调拨,很快的交付,实现的云的优势吸引企业的客户。这时候系统软件VMControl还可以把众多的物理机器变成一个系统资源池最终用户用到的是虚拟服务器,部署在物理服务器上,用户看不到,但是电信运营商可以由这样的做法,在使用旧的设备,这个设备是跟IBM租的租赁期是3年,3年之后又可以租新的机器,把新机器加入到旧机器里面,动态的把旧的服务器里的资源迁移到新的服务器里面,旧服务器就可以还给IBM。电信运营商觉得这是非常灵活的商业模式,他非常有信心把这个基础设施的云提供给用户。

  这不是我们编出来的故事,这个事情正在我们的一个电信运营商发生,这给IBM整个团队带来了非常大的兴奋,我们在谈云的时候不再谈技术、不再谈概念,真的跟客户一起把一些技术转变成了新的生意,把技术转变成生产力,这种感觉非常真切。大家在听不同人讲云是什么样子,我们已经做出来了一些业务的创新,这是我们非常兴奋的经验。

  总结一下,云本身不是一种新的系统,云本身不是一种新的应用,云本身是把IT的资源交付给最终用户的方式,云这种方式把以前所有东西需要自己建的,变成了是一种可以租用很快交付的形式。以前我们没有云的时候,要租一个地方,自己找地,打地基、盖房子,装修,有云之后找一个酒店,可能需要四星级、三星级,离市区近一点的地方都可以挑。需要它的时候就可以用,云是交付的方式,至于云交付什么,是交付不同的IT资源去解决不同的工作负载的需求。我们这里看到,工作负载是没有变的,不是因为有云就有工作负载改变,有没有云我们都有连线交易,都有高性能计算也有商业智能分析,还有新的应用比如说Web2.0,不是某一种云就可以解决所有的应用,解决这些工作负载的还是不同的根据工作负载优化的系统,只是用一种云的交互方式更好的支持工作负载。市场上大多数所谓云的供应商都说它的技术围绕着Web2.0来做,技术比较局限。现在IBM可以通过多种为工作负载优化的平台,通过云的交付方式支持不同的所谓智慧地球的工作负载。

  谈一下绿色。为什么绿色很重要?它有一个很重要的特点,由于智慧地球的应用导致我们对工作负载有一个爆炸性的增长,对性能有更高的要求,如果只把眼睛放在性能上不全面,因为要得到这个性能要看代价是什么,所以绿色非常重要。我们一定希望得到性能的同时可以控制能源成本和冷却的成本。在这里我们提一下IBM整个绿色是非常全面的做法,包括把自己的硬件本身做的比别人要更加节能,像我们的Unix服务器更加节能的,我们的存储比竞争厂商更加节能。在产品本身节能以外,我们用虚拟化的方式提高使用率,用智能控制电源使用来提升节电的能力,用绿色诊断的技术帮助客户发现节能不同的潜力,最后通过创新性的冷却把冷却方面的能耗降到最低,这是IBM全方位的绿色解决方针。

  今天我们发布的是POWER7,明天是POWER7的增强型或者POWER8,肯定比上一代更加绿色。POWER7是今年最新发布的一个Unix服务器,是现在世界上最绿色的Uinx服务器,我们比较一个终端的750机器可以比竞争对手最高端的机器性能提升28%,但是使用的能源可以减少83%,这是有实际数据支持的。这样一种绿色、智慧的系统令到我们的客户就不需要特别高的智慧,因为做这个决定很容易。我们有一个客户在今年到我们那里采购了7台POWER7的750,这是南方知名的运动品牌服装,要部署SAP的系统,他们做了很详细的容量规划,看到原来要完成自己的工作负载,用POWER750一台就相当于竞争友商很多台的高端服务器,性能一样,但是能耗比他们低很多,客户觉得做这个决定不是很困难,这是很真实的例子,就在这个季度发生。

  刚才谈到什么是工作负载优化,什么是云,为什么智慧的系统用云的方式交互,为什么智慧的系统有绿色的特征,以上是我做了一些稍微深入的分析,我的演讲结束。

0
相关文章