存储 频道

AMD Opteron-引领64位高端工作站

    【IT168 报道】2004新的一年,今年HPC高端市场竞争将更加激烈,随着AMD Opteron 价格的降低,整体应用成本更加低廉,应用更加的广泛,逐渐成为Intel Xeon 强有力的竞争者。AMD Opteron处理器的发布已经有了一段时间,它的发布在工作站市场上引起不小的震动,这不仅因为它是AMD第一款真正能够在高端市场上打败Xeon处理器的产品,还因为它是第一款64位x86处理器。作为64位处理器,它能够达到至少1024GB的内存编址空间以及256TB的虚拟内存编址空间。

                         #$[*164671.jpg*#a*#0*#0*#center*]$#

    随着工作站应用程序逐渐的复杂,使用4GB内存成为现今一种普遍配置,但是受到当前32位处理器的4GB内存限制,很明显我们需要一个比现有32bit构架更好的解决方案。今天,我们都还不能在虚拟内存存储一个4GB的文件。因为系统核心(kernel)和用户进程要分享这微不足道的4GB虚拟内存,应用程序可能会被限制在3GB或者更少的内存中。一个庞大的256TB虚拟内存毫无疑问将会使得高端机械计算机辅助设计(MCAD)、图形处理和其他浮点密集型业务实施起来更加容易。
    Opteron的主要卖点就是它本身是一款64bit处理器的同时,仍然能够高速运行纯32位x86应用程序,而Intel的Itanium处理器仅能运行专门为它进行编译的应用程序。作为一款经过巨大改进的带有64位扩展的Athlon处理器,其兼容性就像现在用的工作站一样,多各种板卡,兼容性较好,而Intel的Itanium构架只能使用其指定的有限的几种产品。在易用性来说,Intel的Itanium构架只能使用有限的unix ,linux系统,而为了运用好这套平台,我们不得不聘请更好的技术人员,否则不能为我们一般使用者所使用,这样大大增加了使用成本,然而支持AMD64构架的系统层出不穷,其中操作系统巨鳄,Microsoft已经发布支持AMD64构架的系统的beta版本(而for Itanium版本也是才有测试版)。而且无论是AMD,Nvidia,VIA等支持AMD64的芯片组的驱动都已经发布了,其中包括支持Microsoft windows 64bit for AMD,Linux等系统。而且随着Microsoft windows和Linux两大阵营对AMD64的支持,相信工作站级的64bit应用很快就能成为现实。

    所以人们对于AMD极度灵活的Opteron芯片投以巨大的关注就不足为怪了。Opteron被设计为适用于高产量的1-8way高端市场,这块市场占了整个高端应用市场的99%。还有一些系统设计厂商也准备把Opteron处理器推向更大的系统中。 对于像AMD这样的处理器厂商,焦点是要与占据了90%服务器处理器市场的Intel Xeon处理器争夺巨量销售额。而作为国内图形工作站的生产设计厂商, AMD的晨星计划(AMD64bit应用推广计划)重要合作伙伴,我们也先后推出一系列基于AMD64位应用的图形工作站,主要有O2 Workstation 氮3200,氮3100,氯2000,氢1200。这次根据大家的实际应用,我们做了如下的测试,希望能成为您购买工作站产品时的一个良好的参考资料,这次的测试主要是围绕着单P43.0,双XOEN3.06,Athlon64FX51,Oopteron246在图形工作站应用上的性能对比。相应的我们双Opteron图形工作站采用的是氮3200,与其对比的是目前热卖的氟4201双Xeon工作站,而单路的测试我们这是选用单Opteron图形工作站氯2000,来挑战单路P4 氯2100。

    首先我们来看一下四款处理器的技术规格:

                          #$[*164785.jpg*#(点击放大)*#0*#0*#center*]$#

    说道这里,不得不跟大家介绍一下,Intel架构和AMD 64bit架构的不同。
大家观察一下下面的两张图片:

#$[*164694.jpg*#Intel架构和AMD 64bit架构(点击放大)*#0*#0*#center*]$#

    由图片可以发现两种构架的本质的区别,先看右图,这个图片是intel一直以来的x86双cpu平台的总体构架,可以发现,当双CPU工作的时候,两颗cpu争用系统总线,不管是i/o请求还是Memony请求,都需要通过总线来传达给cpu,导致所有的请求都要来抢占总线的带宽,进一步降低了系统总线利用率。而AMD 则采用创新的技术,完全改变了这个瓶颈,由左图可以看到,由于集成内存控制器,大大降低了快速内存存取的延迟,使内存访问cpu更加迅速,而cpu分别和内存,pci-x,cpu之间采用单独的通道技术,即HyperTranspot技术,是每条通道带宽达到了突破性的6.4GB/s。这是一次电脑业的革命!

    工作站平台简介:

                              #$[*164788.jpg*#(点击放大)*#0*#0*#center*]$#

    测试软件简介

   由于目前普通用户都在使用32bit系统,所以为了更加贴近用户实际应用环境,我们测试软件基础平台都是在Microsoft Windows 2000 英文版下进行的,这就使得AMD 64bit平台难以发挥最大威力,使用的是工作站平台广泛使用的sp2补丁,测试系统的Windows桌面都设置成32bit真彩色,1280*1024分辨率,60MHz的刷新率。
    所用的测试软件如下:

    CPU-Z1.20
    Linpack
    Spec Viewperf7.1.1
    Spec 3DS MAX R3.1
    Spec Maya5 1.3
    Sisoftware sandra2004
    CINEBENCH2003

    所有的测试都是建立在公开公平的情况下进行的测试,如有疑问可以到我们交流论坛里讨论。

    测试:

  1.首先CPU性能测试:

    Linpack

    Linpack性能是目前用于科学计算的高性能计算机最主要的性能指标之一, 它是指一台计算机求解双精度线性方程组时所能达到的最好性能。而我们所用的测试软件,是Linpack for windows的精简版,它是经过从c/c++编译的,适用于X86 WINDOWS平台的CPU性能测试软件。其测试原理并没有改变。

                    #$[*164701.jpg*#测试结果(点击放大)*#0*#0*#center*]$#

    由测试结果来看:Opteron得益于他的1MB L2 cache使得在整个测试过程中,一直持续一个比较平稳的水平,而且在测试的一开始就能很快达到性能巅峰水平,然后再随着矩阵的增大,缓慢的回落,FX51由于时钟频率比Opteron246高,所以氯2000比氮3200平台反映出来的情况更好一些;而Intel 阵营正好相反P4和Xeon由于L2 cache 只有512KB,再加上共享总线的构架,使得其不能很快的达到巅峰的水平,而是缓慢的攀升,当矩阵尺寸过大时,很快的下滑到相当低的水平,单CPU性能一直不是很理想。造成上面这种现象的主要原因是两种平台构架有很大的不同。下图是两种双处理器平台的工作示意图:

#$[*164706.jpg*#两种双处理器平台的工作示意图(点击放大)*#0*#0*#center*]$#

    首先由单处理器的测试结果对比不难发现,氯2000平台的AMD Athlon FX 51由于集成内存控制器等先进的系统构架,使得其性能大大超过,氯2100平台的单P4。

    而多处理器的情况,由其系统构架的不同,氮3200更体现出Opteron架构的优势,导致两种平台对数据处理的方式也十分的不同,前阶段可以说是半斤对八两,后面Xeon平台下降的十分厉害。

    总体看来,基于AMD平台的氯2000和氮3200,由于其先进的系统构架,使其在计算过程中能保持稳定的性能,而技高一筹。

    Sisoftware 2004

                      #$[*164709.jpg*#(点击放大)*#0*#0*#center*]$#

    由结果来看,基于AMD 64bit平台的氯2000和氮3200无论整数还是浮点运算均站绝大优势,主要是因为,其800MHz的前端总线,由单CPU平台的测试结果看,由于都是800MHz FSB,所以两款CPU 性能在伯仲之间,而到了双CPU平台时,由于氮3200的Opteron采用的是800MHz的FSB,使其性能大幅度领先氟4201双xeon 平台。

                      #$[*164712.jpg*#(点击放大)*#0*#0*#center*]$#

    再看,这四个平台的多媒体测试,由于该软件的多媒体测试是基于Intel SSE2指令集作优化的,所以AMD 64bit平台均弱于Intel平台,由此可见,软件优化的作用十分明显。

  2 .内存篇:

    Sisoftware 2004

                     #$[*164781.jpg*#(点击放大)*#0*#0*#center*]$#

    由结果看,这次AMD64平台打了一个很好的翻身仗,其无论是氯2000还是氮3200平台都远远超过氯2100和氟4201 平台,这得益于前两个平台的优秀的系统架构,由上面系统结构图可以看出,由于在Opteron系统中,每颗Opteron处理器可以拥有自己的本地内存,他们共同组成一个节点。各个节点内的处理器通过内置的内存控制器与节点内的内存交换数据。这样,随处理器数目增多,Opteron系统分值会大幅度攀升。而对于氮3200采用的双Opteron246的系统,每颗CPU内均使用DDR400内存组成双通道,那么整个系统的内存峰值带宽将为12.8GB/s,随着节点数目的增多,带宽还将进一步增长。比起氟4201双Xeon系统共享式内存结构内存带宽固定不变的情况,在多处理器的情况下存在较大的带宽优势。而且大家也看到了,氯2000单P4平台由于使用的也是双通道DDR400所以其内存带宽超过双xoen 的双通道DDR266。

    说道这里不得不提一下,Opteron先进的内存构架,该构架支持先进的NUMA特性(NUMA是一项新的内存管理特性,这项特性能使AMD 64位平台更加有效地管理系统内存资源。当系统具备多个内存控制器和使用了多个memory bank(内存组)的时候,性能的提升最为明显,正如我们所测试的采用双Opteron处理器的氮3200一样。这项来自微软的特性是一项很了不起的成果,在目前,受益最多的还是AMD64平台。)虽然这一构架在Microsoft Windows 新的操作系统中才支持,但由于前面我们所讲到的其构架的先进性,使得其CPU节点越多,其内存带宽越大,所以氮3200能达到这么惊人的性能数据就不奇怪了。

  3.文件系统:

    Sisoftware 2004

                     #$[*164732.jpg*#(点击放大)*#0*#0*#center*]$#

    文件系统的测试主要考量的是平台IDE控制器的设计功力,因为都采用的是相同的硬盘,所以转速,大小,分区格式都相同,采用5次测量的平均数据作为最终结果,保证公平性的原则。由结果可知,一直为人诟病的Nvidia,AMD磁盘性能低下的毛病,得到了很好的改观,测试结果,Opteron平台完全超过Intel平台。

  4.图形计算性能测试篇:

    测试软件:

    Spec Viewperf 7.1.1
    Spec 3DS MAX R3.1
    Spec Maya5 1.3v
    Cinebench2003

    终于到大家期待的图形工作站性能测试了,测试专业图新工作站软件当然非Spec Viewperf 7.1.1莫属了,该软件是著名的OpenGL测试专用软件,偏向应用型。7.1.1在原有的基础上,把所有的测试包都得到升级,进一步提高了模型的复杂度。

               #$[*164743.jpg*#(点击放大)*#0*#0*#center*]$#

    3dmax-02的测试以3dsmax3.1为引擎,测试了平均顶点为150万的三个三维模型,并且加上了各种各样的光源的场景测试三维实时渲染的效能。其中氮3200 和氯2000对于竞争对手优势明显。

              #$[*164754.jpg*#(点击放大)*#0*#0*#center*]$#

    drv-09中的模型是由不列颠石油公司提供给SPECopc的一个石油平台模型,目前这个石油平台的真实原型位于挪威西南海岸(北海),供GYDA钻探石油之用。该模型的规模相当庞大:在shaded模式下有42,821基本图元,共计367,178个顶点;框线模式下就更加夸张了,有94,275个基本图元,共计1,599,755个顶点。大量的顶点传输会对内存总线、AGP总线、CPU外部总线相当大的压力。这次氮3200 和氯2000平台还是优胜对手。

               #$[*164760.jpg*#(点击放大)*#0*#0*#center*]$#

    dx-08的原型是IBM的可视化分析软件--Data Explorer,是UNIX上的应用程序。在1999年5月4日,IBM开放了该软件的源代码,并把它更名为Open Visualization Data Explorer,简称OpenDX。采用的OpenGL接口是采用DX 2.1编译的,模拟的是流体受压缩的情况,包含了3000个三角形网面,每个网面由100个顶点构成,这样规模的场景在DX的应用中属于中等规模。其中AMD平台以绝对优势胜出。

             #$[*164764.jpg*#(点击放大)*#0*#0*#center*]$#

    Light-06的原型是Autodesk的Lightscape光线渲染软件,该渲染器的radiosity、Raytrace可以很好地解决反射、折射、漫反射等复杂的效果,获得非常逼真的光影效果。这次氯2000战胜氯2100,而双Opteron的氮3200则输于氟4201平台。

             #$[*164772.jpg*#(点击放大)*#0*#0*#center*]$#

    Proe-02的架构是Pro/ ENGINEER 2001,以灯光、骨架和隐面消除这三种模式为核心测试了两个三维模型的绘制能力。同上面的测试结果相同,氯2000又一次战胜了氯2100,而双Opteron氮3200略逊于采用双Xeon的氟4201。

            #$[*164774.jpg*#(点击放大)*#0*#0*#center*]$#

    Ugs-03以Unigraphics V17为基础,测试了一个顶点数高达210万的机械模型的渲染性能。最后一项测试,AMD64以微弱的比分的胜。

    总的看来,AMD64 平台在这次实际应用的测试中表现出色。特别是3dmax-02,drv-09,dx-08三项测试,AMD64位平台以一定的领先优势胜出。而后三项,两个平台各有胜负。

    Spec 3DS MAX R3.1

    接下来我们采用的是Spec 3DS MAX R3.1基准测试中的架构场景,在这个测试中一个移动的摄像机在复杂的建筑物中移动,随着移动不同的对象都在随之放大或者缩小。这个场景包括了600000个多边形、7个光源并且启用了光线跟踪和雾化效果。由SPEC和德国的CAT Production动画公司一起开发,测试包括4个场景和35个子任务,其中25个子任务用来衡量图形性能,另外10个子任务用来衡量CPU的性能,不同的场景包含了粒子、玻璃墙等3DS Max动画中常用的特效。SPECapc V1.0 for 3ds max 3.1给出的成绩是以一个参考系统(PIII 700MHz、440BX、SDRAM 512MB PC100 ECC、Diamond FireGL1、9GB Quantum Viking Ultra2 SCSI)为标准的,系统将参考系统的成绩定为1,其测试成绩表示它的速度是参考系统的x倍。

                     #$[*164776.jpg*#(点击放大)*#0*#0*#center*]$#

    由测试成绩可以看出在除了Graphic一项,AMD 64位平台略逊一筹外,其他两项测试,AMD 64位平台均已较大优势胜出。

    Spec Maya5 1.3v

    该测试包分为四个场景,来自nVIDIA的werewolf、squid和为了测试实际动画效果的insect、hand。werewolf和squid着重考察显卡的Wireframe加速能力以及贴图水准,前者使用了69274个顶点,后者稍少,也达到25150的规模,而insect以及hand侧重显卡的动画能力测试,分别包含147831以及229681个顶点,测试包含顶点移动以及需要处理器积极参与重力计算而得到合适结果的运算消耗。尤其是insect场景包含的定点数本来就很多,进行重力计算的时候又比较依赖处理器,因此得分普遍不高,hand场景除了前期的旋转外,后期主要考察实际建模过程,相当消耗资源。同样该测试包也是以一个参考系统(PIII 700MHz、440BX、SDRAM 512MB PC100 ECC、Diamond FireGL1、9GB Quantum Viking Ultra2 SCSI)为标准的,系统将参考系统的成绩定为1,其测试成绩表示它的速度是参考系统的x倍。由于测试项目繁多,我们就不在这里例举出来,Maya5的整个测试过程中,AMD64平台表现的十分均匀,而Intel平台侧起落比较大。

    CINEBENCH2003

    CineBench 2003是Maxon的最新推出的针对专业OpenGL设计的测试软件,并且可以支持Intel的超线程技术、支持多达16路的CPU并行设备。是一款非常好的高端工作站的测试软件,其虽然粗糙,平淡的测试画面,却包含着大量的多边形,能使在强的工作站也爬不起来。当然在测试的项目上主要针对当前显卡和系统的测试项目包括有Cinema 4D Shading测试/OpenGL硬件光源测试/OpenGL 软件光源测试等等。可以看出基于AMD64平台的氯2000和氮3200大幅度领先INTEL平台的氯2100,氟4201,成为当之无愧的王者。

                       #$[*164779.jpg*#(点击方大)*#0*#0*#center*]$#

    结论:

    通过这次的测试,我们对AMD64平台的性能大大改观,内建内存控制器,基于时钟速度的增加,它使Opteron的性能显著的上了一个台阶。总的来说,一个单Athlon FX 51 (Opteron 148)氯2000完全击败Pentium 4 3.0Ghz氯2100,如果是双处理器系统,采用双Opteron 246的氮3200也以超越双xeon3.06氟4201平台,相信在xeon 800MHz 3G还没出来的时候,双Opteron绝对可以打造一个最快的高端工作站系统。

    当然AMD仍然需要不断推动完善它目前的平台,在测试尾声的时候我们收到了Microsoft Windows XP 64和Windows2003 64的测试版,发现虽然其性能得到巨大的提升,但该操作系统还不完善,许多DCC应用软件还不能正常地运行。

    思考与结果:

    好长一段时间,在中高端图形工作站领域,Intel一家独大的局面,没有竞争者,就没有技术性能的提高,市场和用户们都需要一个强有力的挑战者,来加快这个领域的发展。而AMD就是这样的一个公司,无论是在家用还是高端领域,一直不懈的努力这,这次终于拿出令人惊异的产品。感谢AMD 公司带来如此好的产品。我们结合在工作站行业内的经验推出了多款工作站整机产品。

0
相关文章