Sandy Bridge正式版处理器深度测试
- 来源:微型计算机 smarty:if $article.tag?>
- 关键字:Sandy Bridge,处理器 smarty:/if?>
- 发布时间:2011-02-15 15:27
相信各位《微型计算机》的读者已通过本刊在2010年11月下、2011年1月下的工程版产品测试,抢先了解到Intel第二代智能酷睿处理器Sandy Bridge的初步性能,成为DIY玩家中的“资讯先锋”。不过,Intel已在2011年1月5日正式发布Sandy Bridge平台,Sandy Bridge平台中的各款正式版处理器、主板产品纷纷出炉,那么正式版产品的性能相对上一代产品有多大提升?正式版产品能否实现视频编码硬件加速这一新奇功能?传说中强大的HDGraphics 3000图形性能能否超越独立显卡?面对这一长串的疑问,显然我们有必要对Sandy Bridge平台再做一次全新的认识。接下来,就请跟随《微型计算机》评测室的脚步,进入Sandy Bridge的全新世界。
钟摆战略不空谈 六大改变创新核
想必熟悉硬件的读者知道,Intel的芯片技术发展模式被称为Tick-Tock。Tick-Tock的原意主要是表现吊钟钟摆摆动的声音:“嘀嗒”,一次嘀嗒代表着一秒。而在Intel的处理器发展战略上,每一次嘀嗒代表着处理器两年里的工艺架构进步。其中在两年中的第一年:Tick嘀年中,Intel将推出工艺提升、晶体管变小、架构微调的处理器产品。而在第二年:Tock嗒年里,Intel不仅将继续延用上一年带来的最新工艺技术,还将推出对处理器微架构进行大幅更新的产品。
因此,在Tick嘀年里的技术更新主要是对工艺进行提升,对处理器来说只是小幅改动,不会给性能带来多少提升。而在Tock嗒年中的产品由于架构大幅变动,因此不仅会给处理器的性能、功能带来明显变化,也会决定着处理器在随后的两年中能否在市场上站稳脚步,所以Tock嗒年的发展结果对于处理器厂商来说是至关重要的。长期以来,Intel都遵循这样的模式进行发展,如在2007年推出采用45nm工艺的Penryn处理器,2008年便带来全新的Nehalem架构。2009年他们率先发布了采用32nm工艺的Westmere核心处理器,而在2010年公开的Sandy Bridge处理器就是属于Tock嗒年的全新产品。因此踩着“嗒”字步的Sandy Bridge显然不会是一个“空谈者”,在Intel工程师的努力下,经过以下六方面的努力,它为我们带来了一颗全新的核心。
全面集成GPU
采用Sandy Br idge 架构设计的处理器,不论是Core i7、Core i5、Core i3,都集成了GPU。同时,相对于Clarkdale处理器,Sandy Bridge处理器在生产工艺上有所进步。现在的Clarkdale虽然也集成了图形核心,但采用的是CPU+GPU的双内核封装,而且只有CPU核心采用了32nm工艺制造,图形核心仍采用相对落后的45nm。而在Sandy Bridge核心处理器中,则将CPU、GPU封装在同一内核中,并全部采用32nm工艺制造。这样,在Clarkdale中存在的成本高、通信延迟高等弊端均得以解决。
GPU性能提升大
不过,Sandby Bridge不仅仅是只集成了GPU这样简单,Intel工程师还通过改良设计,为集成GPU提供了更强的性能。Sandy Bridge里的执行单元EU采用第二代并行分支,提升了执行并行任务与复杂着色指令的能力。同时,数学运算交由EU内的硬件负责,其直接好处是大大提升了正弦(sine)、余弦(cosine)等函数的运算速度。此外,EU内部采用类似CISC的架构设计,DirectX 10.1 API指令与其内部指令一一对应,可有效提高工作效率。经过以上改进,Sandy Bridge的EU指令吞吐量比在Clarkdale里使用的EU提升了两倍。
需要注意的是,各款Sandy Bridge处理器内部的EU单元数量也将有所不同。Sandy Bridge处理器的整合GPU核心将分为HD Graphics 3000、HD Graphics2000两种版本。其中HD Graphics 3000拥有12个EU单元,在台式机处理器中将仅集成在Core i7 2600K与Corei5 2500K等K系列处理器中。而HD Graphics 2000则只有6个EU单元,将集成在大部分普通的台式机处理器中。数量上的巨大差异,意味着两种版本的整合GPU将在性能上存在巨大差别。
丰富的GPU功能
在这两种新款GPU上,不仅具备传统的Intel ClearVideo HD高清播放功能,可对MPEG2、VC-1、H.264进行硬件解码外,Intel还为它们增加了InTru 3D、QuickSync Video两大功能。其中InTru 3D为GPU提供了蓝光3D MVC硬件解码功能,并在H67主板上配备了HDMI1.4接口,令Sandy Bridge平台不仅可轻松地播放蓝光3D片源,还可连接各种3D电视。而Quick Sync Video功能则通过GPU内部集成的MFX并行引擎,为GPU提供了H.264、MPEG2的硬件编码功能。与硬件解码类似,使用该引擎进行编码工作时,将显著降低处理器占用率,并大幅提高编码速度。
环形总线显威力同时,为进一步提高处理器核心、图形核心的工作效率,Intel在SandyBridge处理器中创新性地引入了三级缓存环形总线设计。
三级缓存被划分成多个区块,并分别对应GPU,以及每一个CPU核心。因此每个核心都可以随时访问全部三级缓存,Sandy Bridge的集成GPU可以通过“接入点”共享三级缓存。将图形数据放在缓存里,GPU就不用绕道去拜访遥远而缓慢的内存了,这对提升性能、降低功耗都大有裨益。
AVX指令集整装待发
除了在GPU上进行大幅改进外,Sandy Bridge处理器还通过引入微指令缓存、整合物理寄存器堆、改良分支预测单元、AES-NI指令集(可大幅提升处理器的加密解密运算能力)来提升处理器的浮点运算性能。不过相对于上一代处理器来说,它最大的改进举措是提供了对AVX高级矢量扩展指令集的支持。该指令集将计算位宽由128位升级至256位,一次计算就可以处理更多数据,理论上最高可以将每秒浮点操作数提高一倍。另外,AVX还使用了新的256位函数,在操作和排列中效率更高,存取数据速度更快。不过要使用AVX指令集,需要CPU在硬件上做出改变。为此Intel为Sandy Bridge核心增加了多个256位端口,用于处理AVX指令,浮点寄存器也彻底更改为256位,保证AVX指令的全速运行。
不过目前暂时没有软件与操作系统可以支持AVX指令集,只有等到Windows SP1发布以后,我们才能逐渐体验到AVX的强大威力。此外,Sandy Bridge还对整数执行单元进行了小幅升级,其运算性能也得到了一定提升,如ADC指令吞吐量翻番、乘法运算加速25%。
替代超频的睿频 2.0
从Sandy Bridge开始,它将引入新一代睿频 2.0自动超频技术。从以往的单纯对处理器超频,到现在的智能对处理器、GPU进行同步超频。GPU将在占用率较高的游戏或图形程序中自动提高频率,增强性能。当然,如果软件需要更多CPU资源,那么CPU就会加速、GPU同时减速。
从下表来看,每款Sandy Bridge正式版处理器都将具备这个特性,其GPU默认频率后都跟有一个动态频率参数。与工程版处理器相比,在正式版处理器中,每一款处理器都可正常地开启睿频功能。以Core i7 2600K为例,一旦运行Super pi这样的单核心运算程序,处理器核心就会由默认的3.4GHz上升到3.7GHz或3.8GHz。
不过尽管睿频技术得到较大发展,但让人遗憾的是,普通Sandy Bridge处理器的手动超频能力将大幅下降。这主要是由于在Sandy Bridge处理器平台上,Intel将彻底放弃外置CK505时钟发生器的设计,而把所有的时钟控制单元全部集成到处理器核心内部,并将每条总线的速度与内部时钟发生器进行绑定,基础频率均为100MHz。这造成用户在对处理器外频进行超频时,也在对DMI总线、GPU、PCI-E显卡总线进行超频,将极大增加外频超频的难度。因此要想对Sandy Bridge处理器进行进一步的性能提升,你只能选择为数不多、未锁倍频的K版产品。
对于属于Tock嗒时代的Sandy Bridge平台,我们最想了解的就是经过架构上的变化后,它能带来多大的性能提升,在使用体验上能带来怎样的不同。因此在测试中,我们不仅对三款Sandy Bridge新产品进行了详细测试,还对上一代Core i3/i5/i7等产品进行了对比测试。而在游戏性能测试中,我们分为了两部分进行测试,不仅测试了各Sandy Bridge处理器搭配独立显卡的性能,还对其集成GPU进行了测试,并与Radeon HD 4350独立显卡,AMD 890GX/880G等主流整合芯片组进行了对比。
处理器性能提升大
从《SiSoftware Sandra》、《CINEBENCH R11.5》等理论性测试软件来看,Sandy Bridge处理器的运算性能的确较上一代Lynnfield、Clarkdale处理器有较大提升,如在运算性能测试中,Core i7 2600K领先Core i7870近29%。而在《SiSoftware处理器多媒体运算性能》、《CINEBENCH R11.5》中,各款Sandy Bridge处理器也超过了与其对应的上一代产品。在加密解密性能测试中,结果则更为夸张,即便目前顶级的Core i7 870,其吞吐量也只有Core i5 2500K的38%。究其原因在于新一代Sandy Bridge处理器拥有上一代处理器所没有的AESNI指令集,可以大幅提升处理器的加密、解密性能。不过需要提醒的是,在Sandy Bridge处理器中,也只有Corei7、Core i5两个系列的产品支持该指令集,像Core i3这样的低端处理器还是缺少这一能力,因此可以看到Core i32100的成绩与上一代产品相比,并无明显不同。
内存延迟明显降低
通过接下来的内存性能测试,我们也不难明白为什么Sandy Bridge处理器的运算性能得以提升。可以看到各款Sandy Bridge处理器的内存带宽均超过了上一代产品,而两者的内存工作频率、延迟设置均完全一致,这显示出Sandy Bridge处理器中的内存控制器具备更高的工作效率。而在内存延迟测试中,则充分体现出Sandy Bridge核心采用一体式设计的好处。所有Sandy Bridge处理器的内存延迟均与单核封装的Lynnfield处理器均相差无几,远远低于将内存控制器、集成图形核心分离、单独封装的Core i3 530处理器。
硬件转码终实现
得益于处理器性能、内存性能的提升,在《3ds Max2009》图形渲染测试、《Excel 2010》期权定价方程式运算测试、《Photoshop Elements 9.0》幻灯片制作等应用软件体验中,各款Sandy Bridge处理器的表现也超过了与其对应的上一代产品。不过变化最令人吃惊的还是在《Media Converter 7》、《MediaEspresso 6》这两款转码软件的测试里,即便Core i3 2100的消耗时间也只有Core i7 870的19%。Sandy Bridge的硬件转码功能终于在正式版处理器中发挥出了巨大威力。
不过要想实现这一硬件转码功能却并不容易,由于该功能隶属于集成GPU功能的一种,因此要使用该功能,用户必须使用H67主板,并安装Intel显卡驱动。否则在普通的P67主板上,仍只有依靠传统的处理器或显卡进行转码,其成绩则比较普通。如Core i3 2100在P67主板上,采用处理器转码的话,其《Media Converter 7》转码时间将达到155秒,是其硬件转码消耗时间的4倍。
目前只有如《Media Converter 7》之类的少数软件支持硬件解码功能,一些网站测试采用的《暴风转码》、H.264 Encoder暂无法发挥它的威力。此外测试中,我们还发现Core i3 530在使用H55主板,并采用为SandyBridge设计的显卡驱动后,在转码中也能获得性能提升。如在《MediaEspresso 6》中,它也可以勾选“启用硬件编码”选项。其转码时间尽管长于Sandy Bridge处理器,但却明显低于Core i5、Core i7两款更高端的产品。这显示出,硬件编码也有在上一代处理器中发挥威力的可能。
游戏性能大升级
如前面所说,由于每一款Sandy Bridge处理器都集成了GPU,因此在游戏性能测试中,我们将分两部分进行,首先是测试它们在搭配Radeon HD 6870这样的高性能独立显卡时的游戏性能。其次采用H67主板,测试各处理器的集成GPU性能。
独立显卡性能测试
独立显卡下的游戏性能测试结果,完全在我们的意料之中。由于具备更强的处理器性能,因此无论是在《3DMark 11》,还是在《孤岛危机》、《地铁2033》中,各款Sandy Bridge处理器均以小幅优势领先于各自对应的上一代产品。不过由于游戏的运行表现更依赖于显卡性能,因此各处理器之间的差距并不大。
集成GPU性能测试
在2011年1月下,我们曾率先对工程版处理器的HDGraphics 2000 GPU进行过测试,其性能表现并不令人满意。不过在此次测试中亮相的HD Graphics 3000却带给了我们一个莫大的惊喜。其《3DMark Vantage》Entry性能突破了11000分;不论是Radeon HD 4350独立显卡,还是AMD 890GX,其《荣誉勋章2010》的运行速度只有HD Graphics 3000的40%~60%。同时在《星际争霸2》中,HD Graphics 3000也拥有了与AMD 890GX相匹敌的性能。唯一的遗憾是由于驱动优化不足,在《使命召唤:黑色行动》中,其性能与AMD 890GX仍有小幅差距。总体来看,凭借12个EU,HD Graphics 3000毫无疑问是目前性能最强的集成GPU核心。而正式版HD Graphics2000的表现则与前次测试差不多,同AMD 880G相比,互有胜负,处于大致相当的水准。
不过更令人惊喜的是,在Sandy Bridge正式版处理器中,集成GPU的功耗得到了大幅下降。在Furmark图形核心负载测试中,即便最高端的Core i7 2600K+HD Graphics3000这样的组合,其最大功耗也只有Core i3 530的80%,更远远低于890GX、880G这些产品。显然,Sandy Bridge处理器的出现为打造超低功耗HTPC创造了条件。
系统性能测试
更强的处理器与内存性能、更强的游戏性能,因此没有任何意外,Sandy Bridge处理器在《PCMarkVantage》、《Performance Test》这两款传统的整机性能测试中完全胜出,各处理器相对于上一代产品的领先幅度在12%~20%左右。
系统功耗测试
由于32nm制程的全面采用,因此在采用Radeon HD6870独立显卡下的系统功耗测试中,Sandy Bridge平台也有不错的表现。它们不仅在待机状态下有一定优势,在处理器、显卡均处于全负荷运行的满载状态下,优势更加明显。采用Core i7 2600K的系统功耗甚至低于Core i5750,与Core i7 870相比,更有65W的节约幅度。原因很简单,毕竟Core i5 750、Core i7 870都是采用45nm工艺生产的处理器,与采用第二代32nm工艺生产的SandyBridge相比,显然无法相提并论。
超频潜力较大
因为Sandy Bridge是由GPU+CPU这两部分构成的综合体,因此很多人在Sandy Bridge发布前都在设想CPU与GPU同时超频的美梦。然而由于H67主板不支持K版处理器倍频超频、P67主板无法使用显示核心,所以“双超”的愿望无法在Sandy Bridge上得以实现。接下来我们采用Core i7 2600K处理器,并分别使用H67、P67主板对SandyBridge处理器GPU与CPU超频能力进行了“浅尝”。
对GPU的超频能力十分简单,只要在H67主板BIOS里调节GPU的倍频即可。Sandy Bridge集成GPU的频率与处理器频率类似,也是由基础频率100MHz×倍频而得。稍需注意的是,在BIOS中显示的GPU倍频需要将其除以2后才是它的真实倍频。如GPU倍频显示的为“27”,那么这意味着该GPU的最高Turbo Boost工作频率为100MHz×(27/2)=1350MHz。最终在将GPU工作电压只要在BIOS中简单地调节GPU倍频,即可对GPU进行轻松超频。
加压到1.4V后,我们成功地将GPU的Turbo Boost工作频率提升到100MHz×(37/2)=1850MHz。其《3DMarkVantage》Entry性能提升到了E14409。
而在P67主板上对K版处理器的超频,我们则是通过一款名为“Intel Extreme Tuing Utility”的超频工具来完成。该工具利用更加简介、方便的操作界面,令用户在操作系统下即可实现处理器超频。对K版处理器超频时,最重要的就是调节倍频。不过与以往倍频处理器超频不同的是,在软件中,你无法拉动或增大处理器的默认设定倍频,只能调节处理器的最大Turbo Boost倍频。如只想在单核任务下达到4.7GHz,那么只用将“1 Active Core”项目拉到“47×”即可,以此类推,你可分别实现双、三、四核状态下的超频频率。如果想实现与以前类似、无论运行什么程序都保持恒定超频频率的超频状态,那么你应将从“1 Active Core”到“4 Active Core”的四个倍频调节项目都调节到一个相同的超频倍频。最后,我们在将处理器电压提升到1.496V、四个倍频全部设定在47×的状态,成功将处理器稳定超频到了4.7GHz,其CINEBENCHR11.5处理器渲染性能达到8.8pts。
Mission Accomplish Sandy Bridge将改变数字生活
综合以上测试,毫无疑问,踩着Tock嗒脚步、采用全新架构设计的Sandy Bridge表现令人满意,它为我们带来了以往不曾有的三大崭新体验:GPU硬件编码的引入将处理器的编码时间缩短了四倍;HD Graphics 3000的诞生则让集成GPU的性能达到了前所未有的高度,让它对低端独立显卡造成了极大威胁;而睿频2.0技术的引入则让Sandy Bridge较上一代处理器获得10%~20%的性能提升。总的来说,相对于上一代产品,Sandy Bridge实现了性能、功耗、功能的三大突破,如果其市场零售价相对于其千颗批发价不会高出太多,那么,它将成为今年装机、升级用户的首选。对于一款Tock嗒时代的处理器来说,它已经圆满地完成了任务。
稍感遗憾的是,目前的Sandy Bridge处理器只有两款K版处理器集成了HD Graphics 3000 GPU,究其原因,我们认为这是Intel为了防止Sandy Bridge对正在销售的上一代产品造成太大冲击。我们估计在今年晚期,Intel才会推出集成HD Graphics 3000的更多产品。因此可以预计,随着时间的推移,未来将会有更多性能更强、规格更好的Sandy Bridge处理器面市,让我们耐心期待吧。
……
钟摆战略不空谈 六大改变创新核
想必熟悉硬件的读者知道,Intel的芯片技术发展模式被称为Tick-Tock。Tick-Tock的原意主要是表现吊钟钟摆摆动的声音:“嘀嗒”,一次嘀嗒代表着一秒。而在Intel的处理器发展战略上,每一次嘀嗒代表着处理器两年里的工艺架构进步。其中在两年中的第一年:Tick嘀年中,Intel将推出工艺提升、晶体管变小、架构微调的处理器产品。而在第二年:Tock嗒年里,Intel不仅将继续延用上一年带来的最新工艺技术,还将推出对处理器微架构进行大幅更新的产品。
因此,在Tick嘀年里的技术更新主要是对工艺进行提升,对处理器来说只是小幅改动,不会给性能带来多少提升。而在Tock嗒年中的产品由于架构大幅变动,因此不仅会给处理器的性能、功能带来明显变化,也会决定着处理器在随后的两年中能否在市场上站稳脚步,所以Tock嗒年的发展结果对于处理器厂商来说是至关重要的。长期以来,Intel都遵循这样的模式进行发展,如在2007年推出采用45nm工艺的Penryn处理器,2008年便带来全新的Nehalem架构。2009年他们率先发布了采用32nm工艺的Westmere核心处理器,而在2010年公开的Sandy Bridge处理器就是属于Tock嗒年的全新产品。因此踩着“嗒”字步的Sandy Bridge显然不会是一个“空谈者”,在Intel工程师的努力下,经过以下六方面的努力,它为我们带来了一颗全新的核心。
全面集成GPU
采用Sandy Br idge 架构设计的处理器,不论是Core i7、Core i5、Core i3,都集成了GPU。同时,相对于Clarkdale处理器,Sandy Bridge处理器在生产工艺上有所进步。现在的Clarkdale虽然也集成了图形核心,但采用的是CPU+GPU的双内核封装,而且只有CPU核心采用了32nm工艺制造,图形核心仍采用相对落后的45nm。而在Sandy Bridge核心处理器中,则将CPU、GPU封装在同一内核中,并全部采用32nm工艺制造。这样,在Clarkdale中存在的成本高、通信延迟高等弊端均得以解决。
GPU性能提升大
不过,Sandby Bridge不仅仅是只集成了GPU这样简单,Intel工程师还通过改良设计,为集成GPU提供了更强的性能。Sandy Bridge里的执行单元EU采用第二代并行分支,提升了执行并行任务与复杂着色指令的能力。同时,数学运算交由EU内的硬件负责,其直接好处是大大提升了正弦(sine)、余弦(cosine)等函数的运算速度。此外,EU内部采用类似CISC的架构设计,DirectX 10.1 API指令与其内部指令一一对应,可有效提高工作效率。经过以上改进,Sandy Bridge的EU指令吞吐量比在Clarkdale里使用的EU提升了两倍。
需要注意的是,各款Sandy Bridge处理器内部的EU单元数量也将有所不同。Sandy Bridge处理器的整合GPU核心将分为HD Graphics 3000、HD Graphics2000两种版本。其中HD Graphics 3000拥有12个EU单元,在台式机处理器中将仅集成在Core i7 2600K与Corei5 2500K等K系列处理器中。而HD Graphics 2000则只有6个EU单元,将集成在大部分普通的台式机处理器中。数量上的巨大差异,意味着两种版本的整合GPU将在性能上存在巨大差别。
丰富的GPU功能
在这两种新款GPU上,不仅具备传统的Intel ClearVideo HD高清播放功能,可对MPEG2、VC-1、H.264进行硬件解码外,Intel还为它们增加了InTru 3D、QuickSync Video两大功能。其中InTru 3D为GPU提供了蓝光3D MVC硬件解码功能,并在H67主板上配备了HDMI1.4接口,令Sandy Bridge平台不仅可轻松地播放蓝光3D片源,还可连接各种3D电视。而Quick Sync Video功能则通过GPU内部集成的MFX并行引擎,为GPU提供了H.264、MPEG2的硬件编码功能。与硬件解码类似,使用该引擎进行编码工作时,将显著降低处理器占用率,并大幅提高编码速度。
环形总线显威力同时,为进一步提高处理器核心、图形核心的工作效率,Intel在SandyBridge处理器中创新性地引入了三级缓存环形总线设计。
三级缓存被划分成多个区块,并分别对应GPU,以及每一个CPU核心。因此每个核心都可以随时访问全部三级缓存,Sandy Bridge的集成GPU可以通过“接入点”共享三级缓存。将图形数据放在缓存里,GPU就不用绕道去拜访遥远而缓慢的内存了,这对提升性能、降低功耗都大有裨益。
AVX指令集整装待发
除了在GPU上进行大幅改进外,Sandy Bridge处理器还通过引入微指令缓存、整合物理寄存器堆、改良分支预测单元、AES-NI指令集(可大幅提升处理器的加密解密运算能力)来提升处理器的浮点运算性能。不过相对于上一代处理器来说,它最大的改进举措是提供了对AVX高级矢量扩展指令集的支持。该指令集将计算位宽由128位升级至256位,一次计算就可以处理更多数据,理论上最高可以将每秒浮点操作数提高一倍。另外,AVX还使用了新的256位函数,在操作和排列中效率更高,存取数据速度更快。不过要使用AVX指令集,需要CPU在硬件上做出改变。为此Intel为Sandy Bridge核心增加了多个256位端口,用于处理AVX指令,浮点寄存器也彻底更改为256位,保证AVX指令的全速运行。
不过目前暂时没有软件与操作系统可以支持AVX指令集,只有等到Windows SP1发布以后,我们才能逐渐体验到AVX的强大威力。此外,Sandy Bridge还对整数执行单元进行了小幅升级,其运算性能也得到了一定提升,如ADC指令吞吐量翻番、乘法运算加速25%。
替代超频的睿频 2.0
从Sandy Bridge开始,它将引入新一代睿频 2.0自动超频技术。从以往的单纯对处理器超频,到现在的智能对处理器、GPU进行同步超频。GPU将在占用率较高的游戏或图形程序中自动提高频率,增强性能。当然,如果软件需要更多CPU资源,那么CPU就会加速、GPU同时减速。
从下表来看,每款Sandy Bridge正式版处理器都将具备这个特性,其GPU默认频率后都跟有一个动态频率参数。与工程版处理器相比,在正式版处理器中,每一款处理器都可正常地开启睿频功能。以Core i7 2600K为例,一旦运行Super pi这样的单核心运算程序,处理器核心就会由默认的3.4GHz上升到3.7GHz或3.8GHz。
不过尽管睿频技术得到较大发展,但让人遗憾的是,普通Sandy Bridge处理器的手动超频能力将大幅下降。这主要是由于在Sandy Bridge处理器平台上,Intel将彻底放弃外置CK505时钟发生器的设计,而把所有的时钟控制单元全部集成到处理器核心内部,并将每条总线的速度与内部时钟发生器进行绑定,基础频率均为100MHz。这造成用户在对处理器外频进行超频时,也在对DMI总线、GPU、PCI-E显卡总线进行超频,将极大增加外频超频的难度。因此要想对Sandy Bridge处理器进行进一步的性能提升,你只能选择为数不多、未锁倍频的K版产品。
对于属于Tock嗒时代的Sandy Bridge平台,我们最想了解的就是经过架构上的变化后,它能带来多大的性能提升,在使用体验上能带来怎样的不同。因此在测试中,我们不仅对三款Sandy Bridge新产品进行了详细测试,还对上一代Core i3/i5/i7等产品进行了对比测试。而在游戏性能测试中,我们分为了两部分进行测试,不仅测试了各Sandy Bridge处理器搭配独立显卡的性能,还对其集成GPU进行了测试,并与Radeon HD 4350独立显卡,AMD 890GX/880G等主流整合芯片组进行了对比。
处理器性能提升大
从《SiSoftware Sandra》、《CINEBENCH R11.5》等理论性测试软件来看,Sandy Bridge处理器的运算性能的确较上一代Lynnfield、Clarkdale处理器有较大提升,如在运算性能测试中,Core i7 2600K领先Core i7870近29%。而在《SiSoftware处理器多媒体运算性能》、《CINEBENCH R11.5》中,各款Sandy Bridge处理器也超过了与其对应的上一代产品。在加密解密性能测试中,结果则更为夸张,即便目前顶级的Core i7 870,其吞吐量也只有Core i5 2500K的38%。究其原因在于新一代Sandy Bridge处理器拥有上一代处理器所没有的AESNI指令集,可以大幅提升处理器的加密、解密性能。不过需要提醒的是,在Sandy Bridge处理器中,也只有Corei7、Core i5两个系列的产品支持该指令集,像Core i3这样的低端处理器还是缺少这一能力,因此可以看到Core i32100的成绩与上一代产品相比,并无明显不同。
内存延迟明显降低
通过接下来的内存性能测试,我们也不难明白为什么Sandy Bridge处理器的运算性能得以提升。可以看到各款Sandy Bridge处理器的内存带宽均超过了上一代产品,而两者的内存工作频率、延迟设置均完全一致,这显示出Sandy Bridge处理器中的内存控制器具备更高的工作效率。而在内存延迟测试中,则充分体现出Sandy Bridge核心采用一体式设计的好处。所有Sandy Bridge处理器的内存延迟均与单核封装的Lynnfield处理器均相差无几,远远低于将内存控制器、集成图形核心分离、单独封装的Core i3 530处理器。
硬件转码终实现
得益于处理器性能、内存性能的提升,在《3ds Max2009》图形渲染测试、《Excel 2010》期权定价方程式运算测试、《Photoshop Elements 9.0》幻灯片制作等应用软件体验中,各款Sandy Bridge处理器的表现也超过了与其对应的上一代产品。不过变化最令人吃惊的还是在《Media Converter 7》、《MediaEspresso 6》这两款转码软件的测试里,即便Core i3 2100的消耗时间也只有Core i7 870的19%。Sandy Bridge的硬件转码功能终于在正式版处理器中发挥出了巨大威力。
不过要想实现这一硬件转码功能却并不容易,由于该功能隶属于集成GPU功能的一种,因此要使用该功能,用户必须使用H67主板,并安装Intel显卡驱动。否则在普通的P67主板上,仍只有依靠传统的处理器或显卡进行转码,其成绩则比较普通。如Core i3 2100在P67主板上,采用处理器转码的话,其《Media Converter 7》转码时间将达到155秒,是其硬件转码消耗时间的4倍。
目前只有如《Media Converter 7》之类的少数软件支持硬件解码功能,一些网站测试采用的《暴风转码》、H.264 Encoder暂无法发挥它的威力。此外测试中,我们还发现Core i3 530在使用H55主板,并采用为SandyBridge设计的显卡驱动后,在转码中也能获得性能提升。如在《MediaEspresso 6》中,它也可以勾选“启用硬件编码”选项。其转码时间尽管长于Sandy Bridge处理器,但却明显低于Core i5、Core i7两款更高端的产品。这显示出,硬件编码也有在上一代处理器中发挥威力的可能。
游戏性能大升级
如前面所说,由于每一款Sandy Bridge处理器都集成了GPU,因此在游戏性能测试中,我们将分两部分进行,首先是测试它们在搭配Radeon HD 6870这样的高性能独立显卡时的游戏性能。其次采用H67主板,测试各处理器的集成GPU性能。
独立显卡性能测试
独立显卡下的游戏性能测试结果,完全在我们的意料之中。由于具备更强的处理器性能,因此无论是在《3DMark 11》,还是在《孤岛危机》、《地铁2033》中,各款Sandy Bridge处理器均以小幅优势领先于各自对应的上一代产品。不过由于游戏的运行表现更依赖于显卡性能,因此各处理器之间的差距并不大。
集成GPU性能测试
在2011年1月下,我们曾率先对工程版处理器的HDGraphics 2000 GPU进行过测试,其性能表现并不令人满意。不过在此次测试中亮相的HD Graphics 3000却带给了我们一个莫大的惊喜。其《3DMark Vantage》Entry性能突破了11000分;不论是Radeon HD 4350独立显卡,还是AMD 890GX,其《荣誉勋章2010》的运行速度只有HD Graphics 3000的40%~60%。同时在《星际争霸2》中,HD Graphics 3000也拥有了与AMD 890GX相匹敌的性能。唯一的遗憾是由于驱动优化不足,在《使命召唤:黑色行动》中,其性能与AMD 890GX仍有小幅差距。总体来看,凭借12个EU,HD Graphics 3000毫无疑问是目前性能最强的集成GPU核心。而正式版HD Graphics2000的表现则与前次测试差不多,同AMD 880G相比,互有胜负,处于大致相当的水准。
不过更令人惊喜的是,在Sandy Bridge正式版处理器中,集成GPU的功耗得到了大幅下降。在Furmark图形核心负载测试中,即便最高端的Core i7 2600K+HD Graphics3000这样的组合,其最大功耗也只有Core i3 530的80%,更远远低于890GX、880G这些产品。显然,Sandy Bridge处理器的出现为打造超低功耗HTPC创造了条件。
系统性能测试
更强的处理器与内存性能、更强的游戏性能,因此没有任何意外,Sandy Bridge处理器在《PCMarkVantage》、《Performance Test》这两款传统的整机性能测试中完全胜出,各处理器相对于上一代产品的领先幅度在12%~20%左右。
系统功耗测试
由于32nm制程的全面采用,因此在采用Radeon HD6870独立显卡下的系统功耗测试中,Sandy Bridge平台也有不错的表现。它们不仅在待机状态下有一定优势,在处理器、显卡均处于全负荷运行的满载状态下,优势更加明显。采用Core i7 2600K的系统功耗甚至低于Core i5750,与Core i7 870相比,更有65W的节约幅度。原因很简单,毕竟Core i5 750、Core i7 870都是采用45nm工艺生产的处理器,与采用第二代32nm工艺生产的SandyBridge相比,显然无法相提并论。
超频潜力较大
因为Sandy Bridge是由GPU+CPU这两部分构成的综合体,因此很多人在Sandy Bridge发布前都在设想CPU与GPU同时超频的美梦。然而由于H67主板不支持K版处理器倍频超频、P67主板无法使用显示核心,所以“双超”的愿望无法在Sandy Bridge上得以实现。接下来我们采用Core i7 2600K处理器,并分别使用H67、P67主板对SandyBridge处理器GPU与CPU超频能力进行了“浅尝”。
对GPU的超频能力十分简单,只要在H67主板BIOS里调节GPU的倍频即可。Sandy Bridge集成GPU的频率与处理器频率类似,也是由基础频率100MHz×倍频而得。稍需注意的是,在BIOS中显示的GPU倍频需要将其除以2后才是它的真实倍频。如GPU倍频显示的为“27”,那么这意味着该GPU的最高Turbo Boost工作频率为100MHz×(27/2)=1350MHz。最终在将GPU工作电压只要在BIOS中简单地调节GPU倍频,即可对GPU进行轻松超频。
加压到1.4V后,我们成功地将GPU的Turbo Boost工作频率提升到100MHz×(37/2)=1850MHz。其《3DMarkVantage》Entry性能提升到了E14409。
而在P67主板上对K版处理器的超频,我们则是通过一款名为“Intel Extreme Tuing Utility”的超频工具来完成。该工具利用更加简介、方便的操作界面,令用户在操作系统下即可实现处理器超频。对K版处理器超频时,最重要的就是调节倍频。不过与以往倍频处理器超频不同的是,在软件中,你无法拉动或增大处理器的默认设定倍频,只能调节处理器的最大Turbo Boost倍频。如只想在单核任务下达到4.7GHz,那么只用将“1 Active Core”项目拉到“47×”即可,以此类推,你可分别实现双、三、四核状态下的超频频率。如果想实现与以前类似、无论运行什么程序都保持恒定超频频率的超频状态,那么你应将从“1 Active Core”到“4 Active Core”的四个倍频调节项目都调节到一个相同的超频倍频。最后,我们在将处理器电压提升到1.496V、四个倍频全部设定在47×的状态,成功将处理器稳定超频到了4.7GHz,其CINEBENCHR11.5处理器渲染性能达到8.8pts。
Mission Accomplish Sandy Bridge将改变数字生活
综合以上测试,毫无疑问,踩着Tock嗒脚步、采用全新架构设计的Sandy Bridge表现令人满意,它为我们带来了以往不曾有的三大崭新体验:GPU硬件编码的引入将处理器的编码时间缩短了四倍;HD Graphics 3000的诞生则让集成GPU的性能达到了前所未有的高度,让它对低端独立显卡造成了极大威胁;而睿频2.0技术的引入则让Sandy Bridge较上一代处理器获得10%~20%的性能提升。总的来说,相对于上一代产品,Sandy Bridge实现了性能、功耗、功能的三大突破,如果其市场零售价相对于其千颗批发价不会高出太多,那么,它将成为今年装机、升级用户的首选。对于一款Tock嗒时代的处理器来说,它已经圆满地完成了任务。
稍感遗憾的是,目前的Sandy Bridge处理器只有两款K版处理器集成了HD Graphics 3000 GPU,究其原因,我们认为这是Intel为了防止Sandy Bridge对正在销售的上一代产品造成太大冲击。我们估计在今年晚期,Intel才会推出集成HD Graphics 3000的更多产品。因此可以预计,随着时间的推移,未来将会有更多性能更强、规格更好的Sandy Bridge处理器面市,让我们耐心期待吧。
关注读览天下微信,
100万篇深度好文,
等你来看……