存储 频道

AMD Opteron-引领64位高端工作站

    测试软件简介

   由于目前普通用户都在使用32bit系统,所以为了更加贴近用户实际应用环境,我们测试软件基础平台都是在Microsoft Windows 2000 英文版下进行的,这就使得AMD 64bit平台难以发挥最大威力,使用的是工作站平台广泛使用的sp2补丁,测试系统的Windows桌面都设置成32bit真彩色,1280*1024分辨率,60MHz的刷新率。
    所用的测试软件如下:

    CPU-Z1.20
    Linpack
    Spec Viewperf7.1.1
    Spec 3DS MAX R3.1
    Spec Maya5 1.3
    Sisoftware sandra2004
    CINEBENCH2003

    所有的测试都是建立在公开公平的情况下进行的测试,如有疑问可以到我们交流论坛里讨论。

    测试:

  1.首先CPU性能测试:

    Linpack

    Linpack性能是目前用于科学计算的高性能计算机最主要的性能指标之一, 它是指一台计算机求解双精度线性方程组时所能达到的最好性能。而我们所用的测试软件,是Linpack for windows的精简版,它是经过从c/c++编译的,适用于X86 WINDOWS平台的CPU性能测试软件。其测试原理并没有改变。

                    #$[*164701.jpg*#测试结果(点击放大)*#0*#0*#center*]$#

    由测试结果来看:Opteron得益于他的1MB L2 cache使得在整个测试过程中,一直持续一个比较平稳的水平,而且在测试的一开始就能很快达到性能巅峰水平,然后再随着矩阵的增大,缓慢的回落,FX51由于时钟频率比Opteron246高,所以氯2000比氮3200平台反映出来的情况更好一些;而Intel 阵营正好相反P4和Xeon由于L2 cache 只有512KB,再加上共享总线的构架,使得其不能很快的达到巅峰的水平,而是缓慢的攀升,当矩阵尺寸过大时,很快的下滑到相当低的水平,单CPU性能一直不是很理想。造成上面这种现象的主要原因是两种平台构架有很大的不同。下图是两种双处理器平台的工作示意图:

#$[*164706.jpg*#两种双处理器平台的工作示意图(点击放大)*#0*#0*#center*]$#

    首先由单处理器的测试结果对比不难发现,氯2000平台的AMD Athlon FX 51由于集成内存控制器等先进的系统构架,使得其性能大大超过,氯2100平台的单P4。

    而多处理器的情况,由其系统构架的不同,氮3200更体现出Opteron架构的优势,导致两种平台对数据处理的方式也十分的不同,前阶段可以说是半斤对八两,后面Xeon平台下降的十分厉害。

    总体看来,基于AMD平台的氯2000和氮3200,由于其先进的系统构架,使其在计算过程中能保持稳定的性能,而技高一筹。

    Sisoftware 2004

                      #$[*164709.jpg*#(点击放大)*#0*#0*#center*]$#

    由结果来看,基于AMD 64bit平台的氯2000和氮3200无论整数还是浮点运算均站绝大优势,主要是因为,其800MHz的前端总线,由单CPU平台的测试结果看,由于都是800MHz FSB,所以两款CPU 性能在伯仲之间,而到了双CPU平台时,由于氮3200的Opteron采用的是800MHz的FSB,使其性能大幅度领先氟4201双xeon 平台。

                      #$[*164712.jpg*#(点击放大)*#0*#0*#center*]$#

    再看,这四个平台的多媒体测试,由于该软件的多媒体测试是基于Intel SSE2指令集作优化的,所以AMD 64bit平台均弱于Intel平台,由此可见,软件优化的作用十分明显。

  2 .内存篇:

    Sisoftware 2004

                     #$[*164781.jpg*#(点击放大)*#0*#0*#center*]$#

    由结果看,这次AMD64平台打了一个很好的翻身仗,其无论是氯2000还是氮3200平台都远远超过氯2100和氟4201 平台,这得益于前两个平台的优秀的系统架构,由上面系统结构图可以看出,由于在Opteron系统中,每颗Opteron处理器可以拥有自己的本地内存,他们共同组成一个节点。各个节点内的处理器通过内置的内存控制器与节点内的内存交换数据。这样,随处理器数目增多,Opteron系统分值会大幅度攀升。而对于氮3200采用的双Opteron246的系统,每颗CPU内均使用DDR400内存组成双通道,那么整个系统的内存峰值带宽将为12.8GB/s,随着节点数目的增多,带宽还将进一步增长。比起氟4201双Xeon系统共享式内存结构内存带宽固定不变的情况,在多处理器的情况下存在较大的带宽优势。而且大家也看到了,氯2000单P4平台由于使用的也是双通道DDR400所以其内存带宽超过双xoen 的双通道DDR266。

    说道这里不得不提一下,Opteron先进的内存构架,该构架支持先进的NUMA特性(NUMA是一项新的内存管理特性,这项特性能使AMD 64位平台更加有效地管理系统内存资源。当系统具备多个内存控制器和使用了多个memory bank(内存组)的时候,性能的提升最为明显,正如我们所测试的采用双Opteron处理器的氮3200一样。这项来自微软的特性是一项很了不起的成果,在目前,受益最多的还是AMD64平台。)虽然这一构架在Microsoft Windows 新的操作系统中才支持,但由于前面我们所讲到的其构架的先进性,使得其CPU节点越多,其内存带宽越大,所以氮3200能达到这么惊人的性能数据就不奇怪了。

  3.文件系统:

    Sisoftware 2004

                     #$[*164732.jpg*#(点击放大)*#0*#0*#center*]$#

    文件系统的测试主要考量的是平台IDE控制器的设计功力,因为都采用的是相同的硬盘,所以转速,大小,分区格式都相同,采用5次测量的平均数据作为最终结果,保证公平性的原则。由结果可知,一直为人诟病的Nvidia,AMD磁盘性能低下的毛病,得到了很好的改观,测试结果,Opteron平台完全超过Intel平台。

  4.图形计算性能测试篇:

    测试软件:

    Spec Viewperf 7.1.1
    Spec 3DS MAX R3.1
    Spec Maya5 1.3v
    Cinebench2003

    终于到大家期待的图形工作站性能测试了,测试专业图新工作站软件当然非Spec Viewperf 7.1.1莫属了,该软件是著名的OpenGL测试专用软件,偏向应用型。7.1.1在原有的基础上,把所有的测试包都得到升级,进一步提高了模型的复杂度。

               #$[*164743.jpg*#(点击放大)*#0*#0*#center*]$#

    3dmax-02的测试以3dsmax3.1为引擎,测试了平均顶点为150万的三个三维模型,并且加上了各种各样的光源的场景测试三维实时渲染的效能。其中氮3200 和氯2000对于竞争对手优势明显。

              #$[*164754.jpg*#(点击放大)*#0*#0*#center*]$#

    drv-09中的模型是由不列颠石油公司提供给SPECopc的一个石油平台模型,目前这个石油平台的真实原型位于挪威西南海岸(北海),供GYDA钻探石油之用。该模型的规模相当庞大:在shaded模式下有42,821基本图元,共计367,178个顶点;框线模式下就更加夸张了,有94,275个基本图元,共计1,599,755个顶点。大量的顶点传输会对内存总线、AGP总线、CPU外部总线相当大的压力。这次氮3200 和氯2000平台还是优胜对手。

               #$[*164760.jpg*#(点击放大)*#0*#0*#center*]$#

    dx-08的原型是IBM的可视化分析软件--Data Explorer,是UNIX上的应用程序。在1999年5月4日,IBM开放了该软件的源代码,并把它更名为Open Visualization Data Explorer,简称OpenDX。采用的OpenGL接口是采用DX 2.1编译的,模拟的是流体受压缩的情况,包含了3000个三角形网面,每个网面由100个顶点构成,这样规模的场景在DX的应用中属于中等规模。其中AMD平台以绝对优势胜出。

             #$[*164764.jpg*#(点击放大)*#0*#0*#center*]$#

    Light-06的原型是Autodesk的Lightscape光线渲染软件,该渲染器的radiosity、Raytrace可以很好地解决反射、折射、漫反射等复杂的效果,获得非常逼真的光影效果。这次氯2000战胜氯2100,而双Opteron的氮3200则输于氟4201平台。

             #$[*164772.jpg*#(点击放大)*#0*#0*#center*]$#

    Proe-02的架构是Pro/ ENGINEER 2001,以灯光、骨架和隐面消除这三种模式为核心测试了两个三维模型的绘制能力。同上面的测试结果相同,氯2000又一次战胜了氯2100,而双Opteron氮3200略逊于采用双Xeon的氟4201。

            #$[*164774.jpg*#(点击放大)*#0*#0*#center*]$#

    Ugs-03以Unigraphics V17为基础,测试了一个顶点数高达210万的机械模型的渲染性能。最后一项测试,AMD64以微弱的比分的胜。

    总的看来,AMD64 平台在这次实际应用的测试中表现出色。特别是3dmax-02,drv-09,dx-08三项测试,AMD64位平台以一定的领先优势胜出。而后三项,两个平台各有胜负。

    Spec 3DS MAX R3.1

    接下来我们采用的是Spec 3DS MAX R3.1基准测试中的架构场景,在这个测试中一个移动的摄像机在复杂的建筑物中移动,随着移动不同的对象都在随之放大或者缩小。这个场景包括了600000个多边形、7个光源并且启用了光线跟踪和雾化效果。由SPEC和德国的CAT Production动画公司一起开发,测试包括4个场景和35个子任务,其中25个子任务用来衡量图形性能,另外10个子任务用来衡量CPU的性能,不同的场景包含了粒子、玻璃墙等3DS Max动画中常用的特效。SPECapc V1.0 for 3ds max 3.1给出的成绩是以一个参考系统(PIII 700MHz、440BX、SDRAM 512MB PC100 ECC、Diamond FireGL1、9GB Quantum Viking Ultra2 SCSI)为标准的,系统将参考系统的成绩定为1,其测试成绩表示它的速度是参考系统的x倍。

                     #$[*164776.jpg*#(点击放大)*#0*#0*#center*]$#

    由测试成绩可以看出在除了Graphic一项,AMD 64位平台略逊一筹外,其他两项测试,AMD 64位平台均已较大优势胜出。

    Spec Maya5 1.3v

    该测试包分为四个场景,来自nVIDIA的werewolf、squid和为了测试实际动画效果的insect、hand。werewolf和squid着重考察显卡的Wireframe加速能力以及贴图水准,前者使用了69274个顶点,后者稍少,也达到25150的规模,而insect以及hand侧重显卡的动画能力测试,分别包含147831以及229681个顶点,测试包含顶点移动以及需要处理器积极参与重力计算而得到合适结果的运算消耗。尤其是insect场景包含的定点数本来就很多,进行重力计算的时候又比较依赖处理器,因此得分普遍不高,hand场景除了前期的旋转外,后期主要考察实际建模过程,相当消耗资源。同样该测试包也是以一个参考系统(PIII 700MHz、440BX、SDRAM 512MB PC100 ECC、Diamond FireGL1、9GB Quantum Viking Ultra2 SCSI)为标准的,系统将参考系统的成绩定为1,其测试成绩表示它的速度是参考系统的x倍。由于测试项目繁多,我们就不在这里例举出来,Maya5的整个测试过程中,AMD64平台表现的十分均匀,而Intel平台侧起落比较大。

    CINEBENCH2003

    CineBench 2003是Maxon的最新推出的针对专业OpenGL设计的测试软件,并且可以支持Intel的超线程技术、支持多达16路的CPU并行设备。是一款非常好的高端工作站的测试软件,其虽然粗糙,平淡的测试画面,却包含着大量的多边形,能使在强的工作站也爬不起来。当然在测试的项目上主要针对当前显卡和系统的测试项目包括有Cinema 4D Shading测试/OpenGL硬件光源测试/OpenGL 软件光源测试等等。可以看出基于AMD64平台的氯2000和氮3200大幅度领先INTEL平台的氯2100,氟4201,成为当之无愧的王者。

                       #$[*164779.jpg*#(点击方大)*#0*#0*#center*]$#

0
相关文章