史上最强整合核心?

  • 来源:微型计算机
  • 关键字:史上,整合,核心
  • 发布时间:2011-01-24 16:51
  在2010年11月下刊,我们曾经抢先对Intel下一代平台:Sandy Bridge进行了全国首发测试,相信它那强大的处理器性能已经给大家留下了深刻印象。不过更让人着迷的是Sandy Bridge那传说般的整合GPU核心:“史上最强大的整合图形核心”、“可在较低分辨率下流畅运行所有3D游戏”、“部分超越低端独立显卡”。Sandy Bridge还未上市时,多条有关其整合GPU核心的流言就在坊间广泛流传。显然,如果事实果真如此,目前在市场上热卖的AMD 8系列整合芯片组、GeForce GT 220/RadeonHD 5450低端显卡都将受到严重冲击。低端显示芯片市场将被重新洗牌,Intel在图形芯片市场的占有率也将获得大幅提升。那么Sandy Bridge是否具备如此强大的能力?

  当多款Intel H67主板到达《微型计算机》评测室后,我们再次率先对其整合GPU核心进行了全面的性能测试。接下来,就让我们通过实际的测试数据来回答这个疑问。全面解析 看清Sandy Bridge整合GPU四大升级助进化与之前I n t e l 只在Clarkdale处理器中整合图形核心的做法相比,采用SandyBridge架构设计的处理器,不论是高端的Core i7,还是中端的Core i5、主流的Corei3,都将整合图形核心。而且有所不同的是,Intel还通过在以下四方面的努力进一步提升了整合图形核心的性能:

  1.Sandy Bridge集成的GPU图形核心主要由新的EU可编程着色硬件组成。与IntelHD Graphics显示核心(主要集成在Core i3/i5内)使用的EU相比,Sandy Bridge里的EU拥有更大的寄存器文件,并采用第二代并行分支,提升了执行并行任务与复杂着色指令的能力。同时,超越数学运算交由EU内的硬件负责,其直接好处是大大提升了正弦(sine)、余弦(cosine)等函数的运算速度。此外,EU内部采用类似CISC的架构设计,DirectX 10 API指令与其内部指令一一对应,可有效提高工作效率,在每个时钟周期,EU可完成更多的指令。经过以上改进,新型EU的指令吞吐量比在Clarkdale里使用的EU提升了两倍。

  2.由于Sandy Bridge处理器的缓存采用环形总线设计,因此Sandy Bridge的图形核心还将获得另外一个好处。可以通过“接入点”共享三级缓存。显卡驱动会控制访问三级缓存的权限,甚至可以设置GPU使用多少缓存。将图形数据放在缓存里,图形核心就不用绕道去拜访遥远而缓慢的内存了,这对提升性能、降低功耗都大有裨益。

  3.改善了封装与工艺制程。在Clarkdale处理器中采用的是CPU+GPU的双内核封装,而且只有CPU核心采用了32nm工艺制造,图形核心仍采用相对落后的45nm。而在Sandy Bridge核心处理器中,则将CPU、GPU封装在同一内核中,并全部采用32nm工艺制造。这样,在Clarkdale处理器中存在的成本高、通信延迟高等弊端均得以解决,同时还可明显降低图形核心部分的功耗。

  两大版本分市场

  我们知道,以前Clarkdale处理器中的整合图形核心只是通过频率的不同来划分档次,如性能最好的Core i5661处理器的图形核心频率为900MHz,性能定位主流的Core i5 660/Core i3 530的图形核心频率为733MHz,而定位最低的Pentium G6950则只有533MHz的运行频率。

  而在Sandy Bridge处理器中,除了频率的区别外,各款处理器内部的EU单元数量也将有所不同。Sandy Bridge处理器的整合GPU核心将分为HD Graphics 3000、HDGraphics 2000两种版本。其中HD Graphics 3000拥有完整的12个EU单元,将主要集成在Core i7 2920XM/2820QM/2720QM,以及Core i5 2540M/2520M等移动版处理器中。而HD Graphics 2000则只有6个EU单元,将主要集成在普通的台式机处理器中。因此这不仅意味着在Sandy Bridge平台中,两种版本的整合GPU将在性能上存在巨大差别,也意味着Sandy Bridge台式机处理器的EU单元数量反而不及上代产品Clarkdale(12个),只能通过前面提到过的四大升级来获得更高的性能。

  H系列芯片组是首选

  在Sandy Bridge平台上,Intel同样将可变显示传输接口、显示输出控制器集成在了H系列芯片组上,因此仍只有H系列芯片组可以使用内置GPU核心,它也是打造新一代Intel整合平台的首选。工作时,集成GPU核心将通过可变显示传输接口将图像信号传送给H系列芯片组,再通过显示输出控制器将图像输出到显示器上,不会占用DMI数据传输总线。

  如表1所示,与P系列芯片组相比,H系列芯片组最大的不同在于无法将处理器的PCI-E x16总线拆分为x8+x8,因此无法组建CrossFireX、SLI等显卡并联系统。目前,H系列芯片组主要由H67、H61两款构成。其中H67芯片组拥有14个USB 2.0接口、6个SATA接口,其中2个可以支持SATA 6Gb/s,其他4个则仍为SATA 3Gb/s规格,并可组建RAID 0/1/5/10四种磁盘阵列。而最低端的H61芯片组则主要用于接替G41,因此在功能上有大幅削减,不支持RAID、SATA 6Gb/s,只有4个SATA 2.0接口,USB 2.0接口数量也被降低到10个。不过从我们的测试结果来看,如表2所示。SATA 6Gb/s接口的引入对于普通机械硬盘来说并无太大用处,唯一明显的提升就是作用不大的突发传输速度。因此H61更值得那些注重实用性与成本的理性用户选择。

  一决胜负 Sandy Bridge整合GPU性能详测

  搭建我们的测试平台

  此次参与我们测试的是一款Sandy Bridge 3GHz工程版处理器,采用4核心、8线程设计,拥有6MB三级缓存,其技术规格与Core i7 2600S比较接近。根据Intel控制面板侦测,其集成的是HD Graphics 2000 GPU,拥有6个EU执行单元,默认工作频率为850MHz,当运行3D程序时,会自动启动睿频技术,将频率提升到1100MHz。

  同时,为了更好地反映出集成GPU核心的性能,我们特采用多款产品与其进行对比测试。其中AMD 890GX是目前市面上最强的整合主板,集成Radeon HD 4290图形核心,默认频率达700MHz,并配备128MB DDR2本地显存。Cor e i 5 6 61内置的GPU由于频率高达900MHz,则是Intel上一代产品中,3D性能最强的产品。而GeForce 8400 GS则是在2008年较为经典的一款低端高清独立显卡,拥有16个CUDA核心,配备256MB 64bitDDR2显存。

  Radeon HD 4350是AMD在2009年力推的一款高清显卡,拥有80个流处理器,同样配备256MB 64bit DDR2显存。当今的低端主力:Radeon HD 5450与其在技术规格上十分类似,只不过核心频率由Radeon HD 4350的600MHz提升到650MHz,并将生产工艺由55nm升级为40nm。

  GeForce GT 220则是在今年非常流行的一款低端显卡。它拥有48个CUDA核心,显存则根据价格、定位有64bit/128bit、256MB/512MB等多种配置。我们测试中的产品采用128bit、512MB的显存配置,是399元GeForce GT 220的典型。

  需要注意的是,测试中,所有独立显卡的测试均在Sandy Bridge平台上进行,集成GPU的性能测试则在各自的整合平台上进行。

  3D基准性能测试

  下面,我们首先通过《3DMark Vantage》、《鹰击长空》、《孤岛危机》、《孤岛惊魂2》、《冲突世界》这五款自带3D性能测试的软件,对各款GPU进行了测试。从测试来看,在《3DMark Vantage》中,HD Graphics 2000拥有不错的表现,其性能不仅超过AMD 890GX、Intel HDGraphics等整合核心,也超过了Radeon HD 4350,仅次于GeForce GT 220。

  不过在各游戏自带的基准测试程序中,HD Graphics2 0 0 0 的表现就有些力不从心了。与上一代产品HDGraphics相比,它仅仅是互有胜负,唯一较大的领先是在《冲突世界》中,其平均帧速领先了近17.9%。但由于这款即时战略游戏非常依赖处理器的性能,因此我们认为处理器才是拉大这一差距的“幕后黑手”。而与AMD 890GX相比,HD Graphics 2000则在四款游戏测试中全面落败,其实际游戏性能只有AMD 890GX的82%~90%。与RadeonHD 4350、GeForce GT 220独立显卡的差距则更是巨大,它唯一能够超越的独立显卡只有古老的GeForce 8400GS,但这是目前每款整合图形核心都能做到的。

  总体来看,与之前的产品类似,Intel的整合GPU在《3DMark Vantage》这些专业测试软件中,仍能取得不错的表现,但在实际游戏中的表现则比较普通。

  游戏性能实际测试

  接下来,我们通过对5款热门游戏的实际运行、体验,并借助Fraps软件对各GPU的真实游戏性能进行了测试。测试结果与前面的程序测试没有太大变化。HDGraphics 2000与HD Graphics的测试成绩仍是互有胜负,HD Graphics 2000并没有表现出明显的优势,总体来说二者水平相当,而且这还是HD Graphics 2000在强大的处理器性能配合下,才得以实现的。值得注意的是,在《战地:叛逆连队2》、《荣誉勋章2010》两款游戏中,HDGraphics 2000以小幅优势领先于AMD 890GX。然而在这两款游戏中,二者即便在1024×768、最低画质的设置下,也无法获得可保证基本流畅运行的24fps平均帧速。

  显然,集成GPU与独立显卡仍存在不小的差距。而在《星际争霸2》与《使命召唤7:黑色行动》中,HD Graphics2000与AMD 890GX相比则有不小的落后,其性能只有AMD 890GX的56%~74%。这显示出HD Graphics2000很可能在驱动优化上还有所不足,以致于在不同游戏运行中的表现参差不齐。

  整合GPU功耗测试

  不过,在性能测试中表现一般的HD Graphics 2000,在功耗测试中却有较好表现,特别是在Furmark GPU满载功耗测试中。尽管它在运行侧重于3D性能的软件时,会将频率提升到1100MHz,高于HD Graphics的900MHz,但在功耗测试中,其系统功耗却明显低于Core i5 661平台。我们认为这一方面要归功于图形核心在生产工艺上的进步,另一方面则要归功于EU执行单元数量的减少。而AMD 890GX则由于处理器功耗较大、制程落后,在系统总功耗上表现较差。

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: