新一代显卡互联系统效率探秘
- 来源:微型计算机 smarty:if $article.tag?>
- 关键字:效率 smarty:/if?>
- 发布时间:2011-03-17 08:42
过去,一提到多卡互联,大家总会想到效率不高和兼容性差。尽管从理论上说,多张显卡互联可以同时处理大量数据,能够成倍提升显卡的性能。但这是在软件优化和驱动配合都相当到位的情况下。但现实情况是,在统一渲染架构(DirectX 10时代)出现之前,多卡互联技术由于驱动、游戏和显卡架构优化不够等多种原因,实际效率并不高。
多卡互联性能的充分提升,是在统一渲染架构出现之后。因为DirectX 9等API使用的分离式顶点和像素渲染架构,本身结构比较复杂,整体表现难以确定,因此分离式架构下多卡互联性能往往不够令人满意。而在G80等核心为代表的统一渲染架构出现后,随着PCI-E总线带宽从1.0版本升级到2.0版本,以及显卡本身架构的优化调整,再加上统一渲染架构本身在架构上的优势,多卡互联性能开始大幅度提升。从此开始,NVIDIA和AMD的产品都开始拥有更好的多卡互联性能。
从近期来看,AMD和NVIDIA对各自的新一代DirectX 11显卡的多卡互联效率都作了较大的改进。特别是Radeon HD 6800系列显卡,它在CrossFireX计算性能上大幅度提高。当然,NVIDIA也对新一代DirectX 11显卡的互联效率作出了优化,像GeForce GTX 460这样的经典产品都拥有不错的互联效率—那么现在新一代DirectX 11显卡的互联效率究竟如何?值不值得组建多卡互联系统?用什么显卡组建互联系统最超值?成本高不高?现在都有哪些互联方式?我们的文章将告诉你答案。
显卡互联技术解析
目前主流的多卡互联技术是NVIDIA的SLI和AMD的CrossFireX。NVIDIA为SLI技术准备了两种渲染方法,分别是分割帧渲染(Scissor Frame Rendering,SFR)和交替帧渲染(Alternate Frame Rendering,AFR)。SFR是将3D画面通过一定的算法,将画面中需要计算的内容分为两部分或者多部分,并将每一部分交由并联系统中的各显卡单独计算(比如双卡SLI时,画面分为上下两部分,主卡渲染上部,副卡渲染下部),最终再将它们的计算结果汇总成一个画面;AFR则是将画面显示的每一帧分别交给互联系统中的各显卡单独计算,比如第一帧给主卡计算、第二帧给副卡计算,第三帧又给主卡计算……这样交替计算下来,也能获得不错的性能。目前支持SLI技术的游戏中,绝大部分都采用了交替帧渲染技术来完成计算,这种算法优化简单,操作方便。但由于两张显卡计算时间和数据量都不同,在优化不好的情况下有可能造成用户感觉画面有跳跃感,不够流畅。而分割帧渲染需要游戏本身对SLI有很好的优化,实现技术难度较高,因此很少有游戏采用。
除此之外,SLI技术还支持更强大的抗锯齿计算。比如在双卡SLI时,主卡执行4AA抗锯齿操作,副卡也执行4AA抗锯齿操作。只要对主卡和副卡在抗锯齿采样上的计算方法进行一定调整,就能最终让主卡和副卡分别以4AA的计算压力,在最终画面上显示8AA的抗锯齿效果。另外,近年来随着软件算法和显卡驱动优化的不断进步,除了传统的双路SLI技术外,三路、四路SLI技术也在进一步地发展,并取得了不错的效果。
CrossFireX在技术本质上和SLI基本相同,只不过除了分割帧渲染(AMD称之为SplitFrame Rendering)和交替帧渲染外(AMD称之为Al t e r n a t e Fr ameRendering),CrossFireX还能支持一种特殊的棋盘式帧渲染技术。这种技术能够将一帧画面分割为很多均匀的小格子,就像国际象棋棋盘那样,再将这些小格子平均分配给显卡互联系统中的显卡计算。从理论上来说,这种棋盘式分割渲染效率和数据均分效果都很出色,不过依旧是游戏支持和驱动支持相当困难,最终得到的应用也并不多。另外,在抗锯齿方面,CrossFireX也有类似SLI的抗锯齿提升方式,用双显卡较低倍数的抗锯齿计算合成为高级别抗锯齿画面。从整体技术层次来说,CrossFireX和SLI也在伯仲之间。
支持多卡互联的主板和显卡
目前市场上大部分显卡芯片本身都可以支持多卡互联技术,但显卡厂商在生产、设计显卡时,往往为了节约成本而省掉一部分电路,去掉SLI或者CrossFireX接口。这类被省掉SLI或者CrossFireX接口的显卡往往属于中低端显卡,显卡互联系统的效率并不高。
真正适合组建SLI和CrossFireX系统的目前看来是千元级以及稍高的显卡。这一级别的显卡本身性能很强,功耗又不高,在组建多卡系统后性能增长幅度也很不错。
甚至一些千元级别显卡在互联后能够比肩三千元级别的顶级显卡,性价比表现出色。比如Radeon HD 6850双卡CrossFireX系统性能就可以和最新的Radeon HD 6970相提并论,价格却更为便宜。另外,顶级或者次顶级显卡也是一些发烧友组建互联系统的好选择。这些显卡性能彪悍,组建后将拥有极为抢眼的3D性能表现。不过这类顶级显卡往往对电源要求较高,玩家一定要准备一个强悍的电源才能满足系统的需求。在支持SLI和CrossFireX的主板方面上,目前呈现比较尴尬的一边倒情况。AMD的CrossFireX目前基本上属于免费开放,因此无论是AMD自家的芯片组还是英特尔的芯片组,只要拥有物理双PCI-E x16插槽(插槽本身速度可以是PCI-E x16+x16、PCI-E x8+x8甚至PCI-E x16+x4),理论上都能组建CrossFireX系统。甚至一些主板利用北桥或者CPU提供的双PCI-E x8总线,再加上南桥或者芯片组提供的PCI-E x4总线,并联组成三路CrossFireX系统,能够满足三块AMD显卡并行计算的需求。
但SLI方面,由于NVIDIA迄今为止尚未完全开放SLI技术,因此除了已经基本退市的nForce 4 SLI、nForce 780i等主板外,只有一些顶级的X58或者P55主板在向NVIDIA支付了一定的专利使用费后,才能获得NVIDIA的SLI认证。这类主板目前数量不算多,而且价格相对较昂贵。因此相比CrossFireX的遍地开花来说,能够支持SLI技术的主板还达不到普及的程度。
显卡互联如何设置?
组建显卡互联系统并没有普通用户想像中那样复杂,下面我们将通过几个简单的步骤来看看究竟如何组建互联系统。
搭建显卡互联平台,首先按照上文所说,确定你的主板和显卡都支持显卡互联功能。将一块显卡插入右数第一根PCI-E x16显卡插槽,另一块显卡则根据主板说明书的提示插入相应的PCI-E x16显卡插槽(一般是右数第三根或者第二根PCI-E x16插槽)一般用于组建显卡互联系统的显卡多为中高端甚至顶级产品,它们需要额外供电,因此在安装过程中必须确保两块显卡都插入了外接电源。另外,连接显示设备的线缆必须和右数第一根PCI-E x16显卡插槽上的显卡(即我们常说的“主卡”)连接,以确保正确的输出。
Step 2
系统组建并安装完相应的驱动程序以后,就可以在桌面进行显卡互联的设置了。对CrossFireX系统来说,在桌面点击右键,选择“催化剂控制中心”,然后选择“显卡”→“ATI CrossFire ”;勾选“Enable CrossFireX”的提示框,点击“应用”,数秒钟后再点击“确定”即可开启CrossFireX。设置完成之后,你可以打开GPU-Z软件,找到“CrossFire”选项,如果显示为“Enabled(2GPUs)”则表示设置成功,如果显示为“Disabled”则表示设置失败。
对SLI系统来说,在桌面点击右键,选择“NVIDIA控制面板”,然后选择“设置SLI 和PhysX配置”→“达到最佳3D性能”,点击应用即可开启SLI。而后打开GPU-Z软件,找到“NVIDIA SLI ”选项,显示为“Enabled(2 GPUs)”表示设置成功,显示为“Disabled”表示设置失败。
显卡互联:实战三大互联模式
在了解完显卡互联的基本原理、显卡和主板的搭配以及如何设置显卡互联系统以后,我们不妨在英特尔Core i7965 Extreme平台下,来看看新一代DirectX 11显卡的互联效率。正如上文所说,组建显卡互联最好是采用千元左右的产品,因此我们会选择Radeon HD 6850 和GeForceGTX 460测试。作为对比,我们还将引入Radeon HD6970、Radeon HD 5870、GeForce GTX 580/570(所有参测显卡都基于公版频率)进行测试。
我们选取了大量有代表性的游戏来验证显卡互联系统的效率,3DMark Vantage、《孤岛惊魂2》和《孤岛危机》这三款主流的Di rectX 10/10.1的游戏和软件主要考察互联系统的Di rectX 10/10.1性能;而3DMark 11、《尘埃2》和《异形大战铁血战士》等DirectX 11游戏和基准测试软件主要考察互联系统的DirectX 11性能。
同时针对DirectX 11 API引入的曲面细分功能,我们还将利用Unigine Heaven Benchmark来考察互联系统的效率。Unigine Heaven Benchmark分为两个等级,高等级的设置为“DirectX 11+Shader(High)+Tessellation(Extreme)”,表示互联系统运行在最高画质、极致Tessellation等级的DirectX 11模式下,这是考验互联系统在极致Tessellation画面下的性能。这主要是在考验显卡的理论极限Tessellation性能,目前已发布的DirectX11游戏尚未应用如此“变态”的Tessellation设计;普通等级设置为“DirectX 11+Shader(High)+Tessellation(normal)”,表示显卡运行在最高画质、正常Tessellation等级的DirectX 11模式下,这更符合当前DirectX 11游戏对Tessellation的应用。此外,我们也将根据游戏对硬件的要求,开启不同档次的抗锯齿等级,以考验互联系统在抗锯齿模式下的性能。
虽然显卡互联的原理我们已经清楚了,但显卡互联的技术在进步,可以支持的互联方式也开始增多。接下来,我们将就大家关注最多的三种互联模式进行测试,来验证这三者模式是否可行。如果可行,它们的效率又如何?
设想模式一
A+B,A和B是型号完全相同的两款产品,这也是最原始和常见的互联方式。在SLI平台方面,我们将组建GeForce GTX 460 1GB SLI系统;在CrossFireX平台方面,我们将组建Radeon HD 6850 CrossFireX。
设想模式二
A+B,A和B是同系列的不同型号产品,例如A和B同为Radeon HD 6000系列,A是Radeon HD 6870,B是Radeon HD 6850。之所以采用这种互联方式是因为AMD称在Radeon HD 5000/6000系列显卡上,同系列的同档次产品可以组建CrossFireX系统。因此我们将通过不同组合方式来来验证这种互联模式的可行性和效率,分为Radeon HD 6870+RadeonHD 6850、Radeon HD 6970+Radeon HD 6850、Radeon HD 6850+Radeon HD 5770和Radeon HD5870+Radeon HD 5850测试。作为对比,我们将引入GeForce GTX 460+ GeForce GTX 460SE和GeForceGTX 580+ GeForce GTX 570测试。
设想模式三
之所以这样测试是因为NVIDIA允许任意型号的两块NVIDIA显卡组建混交系统(PhysX+3D模式),即在驱动面板中单独指定一款显卡专门负责PhysX的运算,另一款显卡负责3D渲染。这样的好处是可以提升在PhysX游戏中的性能,不足之处是在非PhysX游戏中没有太大性能提升,甚至没有性能提升。作为对比,我们加入GeForceGTX 460+ Radeon HD 6850和Radeon HD 6850+Radeon HD 6870进行测试。
测试结果分析
●设想模式一
案例一:GeForce GTX 460 1GB SLI=成功
案例二:Radeon HD 6850 CrossFireX=成功
毫无疑问,GeForce GTX 460 1GB SLI和RadeonHD 6850 CrossFireX这两种互联模式是可以实现的。而且从测试结果来,它们的互联效率都非常高。以GeForceGTX 460 1GB SLI为例,它的互联系统效率可以用“恐怖”来形容,其在《地铁2033》中实现了对单卡100%的性能提升,平均30fps以上的帧率足以应付这款时下号称硬件杀手的DirectX 11游戏。此外,GeForce GTX 4601GB SLI在《孤岛危机》、3DMark Vantage和《尘埃2》的测试中,较单卡的性能提升幅度也在90%以上。在其他游戏中,它也保持了75%左右的性能提升幅度,整体提升幅度令人满意。对比NVIDIA这一代和上一代顶级产品GeForce GTX 580和GeForce GTX 480,GeForceGTX 460 1GB SLI的表现也非常给力。相比GeForceGTX 580,GeForce GTX 460 1GB SLI除了在少数几个游戏测试中小幅落后以外,在其余游戏中都胜出;相比GeForce GTX 480,GeForce GTX 460 1GB SLI则实现了全面的超越。
值得一提的是,GeForce GTX 460 1GB SLI在《失落的星球2》、《孤岛惊魂2》、3DMark Vantage Extreme和《尘埃2》的测试中,开启AA时的性能都超过了NOAA状态。这说明GeForce GTX 460 1GB SLI对抗锯齿优化也非常得力,得益于NVIDIA对这一代DirectX 11显卡的图形架构的ROP单元经过全新设计,L2缓存被独立出来,实现了全局共享。由此带来的则是AA性能大幅提升。特别是在8AA模式下,其性能有明显提升。不过需要注意的是,3DMark 11对NVIDIA显卡的互联系统支持仍然不佳,在3DMark 11 v1.01版本下,GeForce GTX460 1GB SLI较单卡仍然没有任何性能提升。
当然,Radeon HD 6850 CrossFireX也不落下风。其相对于单卡,整体性能提升幅度在80%左右,例如在3DMark Vantage、《孤岛危机》、Unigine HeavenBenchmark、《异形大战铁血战士》和《地铁2033》的测试中。而且和GeForce GTX 460 1GB SLI在3DMark 11中表现不佳相比,Radeon HD 6850 CrossFireX在该项测试中,较单卡实现了89%的性能提升。这也说明,在当前的驱动程序下,AMD显卡互联系统对3DMark 11支持得更好。
和AMD目前最顶级的单核心旗舰Ra deon HD6970/5870相比,Radeon HD 6850 CrossFireX亦实现了全面的超越,整体领先幅度在20%以上,例如在《尘埃2》和3DMark 11中,Radeon HD 6850 CrossFireX分别领先领先Radeon HD 6970 34%和24%。RadeonHD 6850 CrossFireX的另一个优势还在于较低的功耗,其待机系统功耗和满载系统功耗相比单卡只分别提升了12%和29%。即使是满载系统功耗,Radeon HD 6850CrossFireX也只有345W,用户甚至不需要升级电源就可以应付双卡互联后带来的功耗提升。
●设想模式二
案例一:Radeon HD 6870+Radeon HD 6850=成功
案例二:Radeon HD 6970+Radeon HD 6850=失败
案例三:Radeon HD 6850+Radeon HD 5770=失败
案例四:Radeon HD 5870+Radeon HD 5850=成功
案例五:GeForce GTX 460+ GeForce GTX 460SE=失败
案例六:GeForce GTX 580+ GeForce GTX 570=失败
在设想模式二中,我们尝试了多种互联模式,最终只有Radeon HD 6870+Radeon HD 6850和Radeon HD5870+Radeon HD 5850这两种互联模式成功了。由此我们对AMD混交系统作出如下总结:AMD混交系统只支持Radeon HD 5000及以上系列,且两款显卡必须是同系列、同核心的产品。例如Radeon HD 6870和Radeon HD6850都同属Radeon HD 6000系列,都是Barts核心。尽管两者的流处理算术逻辑单元数量有差异,但它们满足同系列、同核心的条件因此可以组建混交系统。Radeon HD5870和Radeon HD 5850也属于上述类型。
而Radeon HD 6970和Radeon HD 6850虽然同属Radeon HD 6000系列,但Radeon HD 6970采用Cayman核心,而Radeon HD 6850则使用Barts核心,因此无法组建混交系统。至于Radeon HD 6850和RadeonHD 5770,它们既不是同系列,更没有采用相同的核心,自然无法组建成功。而GeForce GTX 460、 GeForce GTX460SE和GeForce GTX 580、GeForce GTX 570虽然都满足同系列、同核心的条件,但NVIDIA目前并不支持这种形式的混交系统,因此无法组建。
至于AMD混交系统的性能,从Radeon HD 6870和Radeon HD 6850组建的系统效率来看,其在大部分游戏中都小幅领先Radeon HD 6850 CrossFireX,幅度在10%以内。总体而言,这种混交系统的提升效率不算特别高,以Radeon HD 6870和Radeon HD 6850组建的混交系统为例,其性能介于Radeon HD 6850 CrossFireX和Radeon HD 6870 CrossFireX之间。经过反复测试,我们还发现这样的问题,如果将Radeon HD 6850作为主卡、Radeon HD 6870作为副卡的话,系统会不稳定,运行游戏会花屏和死机。这说明在这种混交系统下,必须将性能更好的产品作为主卡,性能稍差的产品作为副卡,否则会引起系统的不稳定。
●设想模式三
案例一:GeForce GTX 460+GeForce GTX 260=成功
案例二:GeForce GTX 460+ Radeon HD 6850=失败
案例三:Radeon HD 6850+ Radeon HD 6870=失败
在设想模式三下,GeForce GTX 460+GeForceGTX 260成功组建起了另类的混交系统。正如我们上文分析的那样,这种互联系统在PhysX游戏中有不错的提升:相比GeForce GTX 460,GeForce GTX 460和GeForce GTX 260组建的互联系统在PhysX游戏中有15%左右的性能提升幅度。但在普通3D游戏中,这种互联系统几乎没有带来任何的性能提升。
需要说明的是,对AMD显卡而言,也能够组建类似的混交互联系统(一块AMD显卡+一块NVIDIA显卡)。具体做法是让NVIDIA显卡负责PhysX运算,AMD显卡负责3D渲染。依旧是只能提升在PhysX游戏中的性能。但要实现这种模式需要特别的破解补丁和配合相应的驱动程序,存在兼容性问题,并不被NVIDIA官方认可,因此本次测试不予考虑此方法,GeForce GTX 460+ Radeon HD6850组建失败。
显卡互联系统:值得拥有相比过去显卡互联系统不算特别高的效率,如今以GeForce GTX 460和Radeon HD 6850为代表的新一代中高端DirectX 11显卡为我们展示了它们强劲的互联性能。他们各自组成的双卡互联系统在游戏中已经获得了平均80%左右的性能提升,甚至在部分游戏中实现了100%的理论双卡互联性能提升幅度:这是非常可观的性能提升。因此对那些打算提升系统图形性能的用户而言,组建显卡互联系统确实是一个不错的选择。在此,我们就本文的测试结果对大家提出一些建议。
如果你是一个硬件玩家或者游戏玩家打算提升系统的图形性能,而且手中没有现成可用的显卡的话,那么可以考虑组建同型号的双卡互联系统。首先应当考虑GeForce GTX 460和Radeon HD 6850这类千元出头的高端产品。用这类产品组建双卡互联系统后,性能的提升幅度非常令人满意,性能甚至超过了目前NVIDIA和AMD最顶级的单核心显卡,但价格却更低,功耗也不高。以GeForce GTX 460 1GB为例,它的单卡价格在1400元左右,两块在2800左右,而GeForce GTX 580的价格却接近4000元。而且从测试来看,互联系统没有碰到兼容性问题,用户大可放心。如果你是发烧玩家,还可以购买更高端的产品组建双卡互联系统,不过这对电源提出了更高的要求。
如果你已经购买了一块中高端Radeon HD 5000/6000系列或者GeForce GTX 400系列显卡,并且打算升级的话,大可以再购买一块相同型号的显卡组建CrossFireX或者SLI系统。而不必将已有的显卡出售,重新再购买一款更高级别的显卡。这对升级用户来说,是非常方便和可行的。而且如果你购买的是中高端AMD RadeonHD 5000/6000系列显卡,还可以考虑购买一款性能更好、和已有显卡同属一个系列且采用同核心的产品,用于组建类似Radeon HD6850/6870这样的混交系统。
如果你曾购买了GeForce 8系列以上的显卡,并且打算近期升级NVIDIA最新的产品的话,不妨将已有的GeForce显卡和新购买的NVIDIA显卡组建成混交系统。因为这可以提升在PhysX游戏中的性能,让老显卡继续发光发热。最后,SLI和CrossFireX系统都非常依赖显卡驱动和游戏的优化,因此用户需要经常升级驱动或更新显卡的多卡并联配置文件,以提升性能。
……
多卡互联性能的充分提升,是在统一渲染架构出现之后。因为DirectX 9等API使用的分离式顶点和像素渲染架构,本身结构比较复杂,整体表现难以确定,因此分离式架构下多卡互联性能往往不够令人满意。而在G80等核心为代表的统一渲染架构出现后,随着PCI-E总线带宽从1.0版本升级到2.0版本,以及显卡本身架构的优化调整,再加上统一渲染架构本身在架构上的优势,多卡互联性能开始大幅度提升。从此开始,NVIDIA和AMD的产品都开始拥有更好的多卡互联性能。
从近期来看,AMD和NVIDIA对各自的新一代DirectX 11显卡的多卡互联效率都作了较大的改进。特别是Radeon HD 6800系列显卡,它在CrossFireX计算性能上大幅度提高。当然,NVIDIA也对新一代DirectX 11显卡的互联效率作出了优化,像GeForce GTX 460这样的经典产品都拥有不错的互联效率—那么现在新一代DirectX 11显卡的互联效率究竟如何?值不值得组建多卡互联系统?用什么显卡组建互联系统最超值?成本高不高?现在都有哪些互联方式?我们的文章将告诉你答案。
显卡互联技术解析
目前主流的多卡互联技术是NVIDIA的SLI和AMD的CrossFireX。NVIDIA为SLI技术准备了两种渲染方法,分别是分割帧渲染(Scissor Frame Rendering,SFR)和交替帧渲染(Alternate Frame Rendering,AFR)。SFR是将3D画面通过一定的算法,将画面中需要计算的内容分为两部分或者多部分,并将每一部分交由并联系统中的各显卡单独计算(比如双卡SLI时,画面分为上下两部分,主卡渲染上部,副卡渲染下部),最终再将它们的计算结果汇总成一个画面;AFR则是将画面显示的每一帧分别交给互联系统中的各显卡单独计算,比如第一帧给主卡计算、第二帧给副卡计算,第三帧又给主卡计算……这样交替计算下来,也能获得不错的性能。目前支持SLI技术的游戏中,绝大部分都采用了交替帧渲染技术来完成计算,这种算法优化简单,操作方便。但由于两张显卡计算时间和数据量都不同,在优化不好的情况下有可能造成用户感觉画面有跳跃感,不够流畅。而分割帧渲染需要游戏本身对SLI有很好的优化,实现技术难度较高,因此很少有游戏采用。
除此之外,SLI技术还支持更强大的抗锯齿计算。比如在双卡SLI时,主卡执行4AA抗锯齿操作,副卡也执行4AA抗锯齿操作。只要对主卡和副卡在抗锯齿采样上的计算方法进行一定调整,就能最终让主卡和副卡分别以4AA的计算压力,在最终画面上显示8AA的抗锯齿效果。另外,近年来随着软件算法和显卡驱动优化的不断进步,除了传统的双路SLI技术外,三路、四路SLI技术也在进一步地发展,并取得了不错的效果。
CrossFireX在技术本质上和SLI基本相同,只不过除了分割帧渲染(AMD称之为SplitFrame Rendering)和交替帧渲染外(AMD称之为Al t e r n a t e Fr ameRendering),CrossFireX还能支持一种特殊的棋盘式帧渲染技术。这种技术能够将一帧画面分割为很多均匀的小格子,就像国际象棋棋盘那样,再将这些小格子平均分配给显卡互联系统中的显卡计算。从理论上来说,这种棋盘式分割渲染效率和数据均分效果都很出色,不过依旧是游戏支持和驱动支持相当困难,最终得到的应用也并不多。另外,在抗锯齿方面,CrossFireX也有类似SLI的抗锯齿提升方式,用双显卡较低倍数的抗锯齿计算合成为高级别抗锯齿画面。从整体技术层次来说,CrossFireX和SLI也在伯仲之间。
支持多卡互联的主板和显卡
目前市场上大部分显卡芯片本身都可以支持多卡互联技术,但显卡厂商在生产、设计显卡时,往往为了节约成本而省掉一部分电路,去掉SLI或者CrossFireX接口。这类被省掉SLI或者CrossFireX接口的显卡往往属于中低端显卡,显卡互联系统的效率并不高。
真正适合组建SLI和CrossFireX系统的目前看来是千元级以及稍高的显卡。这一级别的显卡本身性能很强,功耗又不高,在组建多卡系统后性能增长幅度也很不错。
甚至一些千元级别显卡在互联后能够比肩三千元级别的顶级显卡,性价比表现出色。比如Radeon HD 6850双卡CrossFireX系统性能就可以和最新的Radeon HD 6970相提并论,价格却更为便宜。另外,顶级或者次顶级显卡也是一些发烧友组建互联系统的好选择。这些显卡性能彪悍,组建后将拥有极为抢眼的3D性能表现。不过这类顶级显卡往往对电源要求较高,玩家一定要准备一个强悍的电源才能满足系统的需求。在支持SLI和CrossFireX的主板方面上,目前呈现比较尴尬的一边倒情况。AMD的CrossFireX目前基本上属于免费开放,因此无论是AMD自家的芯片组还是英特尔的芯片组,只要拥有物理双PCI-E x16插槽(插槽本身速度可以是PCI-E x16+x16、PCI-E x8+x8甚至PCI-E x16+x4),理论上都能组建CrossFireX系统。甚至一些主板利用北桥或者CPU提供的双PCI-E x8总线,再加上南桥或者芯片组提供的PCI-E x4总线,并联组成三路CrossFireX系统,能够满足三块AMD显卡并行计算的需求。
但SLI方面,由于NVIDIA迄今为止尚未完全开放SLI技术,因此除了已经基本退市的nForce 4 SLI、nForce 780i等主板外,只有一些顶级的X58或者P55主板在向NVIDIA支付了一定的专利使用费后,才能获得NVIDIA的SLI认证。这类主板目前数量不算多,而且价格相对较昂贵。因此相比CrossFireX的遍地开花来说,能够支持SLI技术的主板还达不到普及的程度。
显卡互联如何设置?
组建显卡互联系统并没有普通用户想像中那样复杂,下面我们将通过几个简单的步骤来看看究竟如何组建互联系统。
搭建显卡互联平台,首先按照上文所说,确定你的主板和显卡都支持显卡互联功能。将一块显卡插入右数第一根PCI-E x16显卡插槽,另一块显卡则根据主板说明书的提示插入相应的PCI-E x16显卡插槽(一般是右数第三根或者第二根PCI-E x16插槽)一般用于组建显卡互联系统的显卡多为中高端甚至顶级产品,它们需要额外供电,因此在安装过程中必须确保两块显卡都插入了外接电源。另外,连接显示设备的线缆必须和右数第一根PCI-E x16显卡插槽上的显卡(即我们常说的“主卡”)连接,以确保正确的输出。
Step 2
系统组建并安装完相应的驱动程序以后,就可以在桌面进行显卡互联的设置了。对CrossFireX系统来说,在桌面点击右键,选择“催化剂控制中心”,然后选择“显卡”→“ATI CrossFire ”;勾选“Enable CrossFireX”的提示框,点击“应用”,数秒钟后再点击“确定”即可开启CrossFireX。设置完成之后,你可以打开GPU-Z软件,找到“CrossFire”选项,如果显示为“Enabled(2GPUs)”则表示设置成功,如果显示为“Disabled”则表示设置失败。
对SLI系统来说,在桌面点击右键,选择“NVIDIA控制面板”,然后选择“设置SLI 和PhysX配置”→“达到最佳3D性能”,点击应用即可开启SLI。而后打开GPU-Z软件,找到“NVIDIA SLI ”选项,显示为“Enabled(2 GPUs)”表示设置成功,显示为“Disabled”表示设置失败。
显卡互联:实战三大互联模式
在了解完显卡互联的基本原理、显卡和主板的搭配以及如何设置显卡互联系统以后,我们不妨在英特尔Core i7965 Extreme平台下,来看看新一代DirectX 11显卡的互联效率。正如上文所说,组建显卡互联最好是采用千元左右的产品,因此我们会选择Radeon HD 6850 和GeForceGTX 460测试。作为对比,我们还将引入Radeon HD6970、Radeon HD 5870、GeForce GTX 580/570(所有参测显卡都基于公版频率)进行测试。
我们选取了大量有代表性的游戏来验证显卡互联系统的效率,3DMark Vantage、《孤岛惊魂2》和《孤岛危机》这三款主流的Di rectX 10/10.1的游戏和软件主要考察互联系统的Di rectX 10/10.1性能;而3DMark 11、《尘埃2》和《异形大战铁血战士》等DirectX 11游戏和基准测试软件主要考察互联系统的DirectX 11性能。
同时针对DirectX 11 API引入的曲面细分功能,我们还将利用Unigine Heaven Benchmark来考察互联系统的效率。Unigine Heaven Benchmark分为两个等级,高等级的设置为“DirectX 11+Shader(High)+Tessellation(Extreme)”,表示互联系统运行在最高画质、极致Tessellation等级的DirectX 11模式下,这是考验互联系统在极致Tessellation画面下的性能。这主要是在考验显卡的理论极限Tessellation性能,目前已发布的DirectX11游戏尚未应用如此“变态”的Tessellation设计;普通等级设置为“DirectX 11+Shader(High)+Tessellation(normal)”,表示显卡运行在最高画质、正常Tessellation等级的DirectX 11模式下,这更符合当前DirectX 11游戏对Tessellation的应用。此外,我们也将根据游戏对硬件的要求,开启不同档次的抗锯齿等级,以考验互联系统在抗锯齿模式下的性能。
虽然显卡互联的原理我们已经清楚了,但显卡互联的技术在进步,可以支持的互联方式也开始增多。接下来,我们将就大家关注最多的三种互联模式进行测试,来验证这三者模式是否可行。如果可行,它们的效率又如何?
设想模式一
A+B,A和B是型号完全相同的两款产品,这也是最原始和常见的互联方式。在SLI平台方面,我们将组建GeForce GTX 460 1GB SLI系统;在CrossFireX平台方面,我们将组建Radeon HD 6850 CrossFireX。
设想模式二
A+B,A和B是同系列的不同型号产品,例如A和B同为Radeon HD 6000系列,A是Radeon HD 6870,B是Radeon HD 6850。之所以采用这种互联方式是因为AMD称在Radeon HD 5000/6000系列显卡上,同系列的同档次产品可以组建CrossFireX系统。因此我们将通过不同组合方式来来验证这种互联模式的可行性和效率,分为Radeon HD 6870+RadeonHD 6850、Radeon HD 6970+Radeon HD 6850、Radeon HD 6850+Radeon HD 5770和Radeon HD5870+Radeon HD 5850测试。作为对比,我们将引入GeForce GTX 460+ GeForce GTX 460SE和GeForceGTX 580+ GeForce GTX 570测试。
设想模式三
之所以这样测试是因为NVIDIA允许任意型号的两块NVIDIA显卡组建混交系统(PhysX+3D模式),即在驱动面板中单独指定一款显卡专门负责PhysX的运算,另一款显卡负责3D渲染。这样的好处是可以提升在PhysX游戏中的性能,不足之处是在非PhysX游戏中没有太大性能提升,甚至没有性能提升。作为对比,我们加入GeForceGTX 460+ Radeon HD 6850和Radeon HD 6850+Radeon HD 6870进行测试。
测试结果分析
●设想模式一
案例一:GeForce GTX 460 1GB SLI=成功
案例二:Radeon HD 6850 CrossFireX=成功
毫无疑问,GeForce GTX 460 1GB SLI和RadeonHD 6850 CrossFireX这两种互联模式是可以实现的。而且从测试结果来,它们的互联效率都非常高。以GeForceGTX 460 1GB SLI为例,它的互联系统效率可以用“恐怖”来形容,其在《地铁2033》中实现了对单卡100%的性能提升,平均30fps以上的帧率足以应付这款时下号称硬件杀手的DirectX 11游戏。此外,GeForce GTX 4601GB SLI在《孤岛危机》、3DMark Vantage和《尘埃2》的测试中,较单卡的性能提升幅度也在90%以上。在其他游戏中,它也保持了75%左右的性能提升幅度,整体提升幅度令人满意。对比NVIDIA这一代和上一代顶级产品GeForce GTX 580和GeForce GTX 480,GeForceGTX 460 1GB SLI的表现也非常给力。相比GeForceGTX 580,GeForce GTX 460 1GB SLI除了在少数几个游戏测试中小幅落后以外,在其余游戏中都胜出;相比GeForce GTX 480,GeForce GTX 460 1GB SLI则实现了全面的超越。
值得一提的是,GeForce GTX 460 1GB SLI在《失落的星球2》、《孤岛惊魂2》、3DMark Vantage Extreme和《尘埃2》的测试中,开启AA时的性能都超过了NOAA状态。这说明GeForce GTX 460 1GB SLI对抗锯齿优化也非常得力,得益于NVIDIA对这一代DirectX 11显卡的图形架构的ROP单元经过全新设计,L2缓存被独立出来,实现了全局共享。由此带来的则是AA性能大幅提升。特别是在8AA模式下,其性能有明显提升。不过需要注意的是,3DMark 11对NVIDIA显卡的互联系统支持仍然不佳,在3DMark 11 v1.01版本下,GeForce GTX460 1GB SLI较单卡仍然没有任何性能提升。
当然,Radeon HD 6850 CrossFireX也不落下风。其相对于单卡,整体性能提升幅度在80%左右,例如在3DMark Vantage、《孤岛危机》、Unigine HeavenBenchmark、《异形大战铁血战士》和《地铁2033》的测试中。而且和GeForce GTX 460 1GB SLI在3DMark 11中表现不佳相比,Radeon HD 6850 CrossFireX在该项测试中,较单卡实现了89%的性能提升。这也说明,在当前的驱动程序下,AMD显卡互联系统对3DMark 11支持得更好。
和AMD目前最顶级的单核心旗舰Ra deon HD6970/5870相比,Radeon HD 6850 CrossFireX亦实现了全面的超越,整体领先幅度在20%以上,例如在《尘埃2》和3DMark 11中,Radeon HD 6850 CrossFireX分别领先领先Radeon HD 6970 34%和24%。RadeonHD 6850 CrossFireX的另一个优势还在于较低的功耗,其待机系统功耗和满载系统功耗相比单卡只分别提升了12%和29%。即使是满载系统功耗,Radeon HD 6850CrossFireX也只有345W,用户甚至不需要升级电源就可以应付双卡互联后带来的功耗提升。
●设想模式二
案例一:Radeon HD 6870+Radeon HD 6850=成功
案例二:Radeon HD 6970+Radeon HD 6850=失败
案例三:Radeon HD 6850+Radeon HD 5770=失败
案例四:Radeon HD 5870+Radeon HD 5850=成功
案例五:GeForce GTX 460+ GeForce GTX 460SE=失败
案例六:GeForce GTX 580+ GeForce GTX 570=失败
在设想模式二中,我们尝试了多种互联模式,最终只有Radeon HD 6870+Radeon HD 6850和Radeon HD5870+Radeon HD 5850这两种互联模式成功了。由此我们对AMD混交系统作出如下总结:AMD混交系统只支持Radeon HD 5000及以上系列,且两款显卡必须是同系列、同核心的产品。例如Radeon HD 6870和Radeon HD6850都同属Radeon HD 6000系列,都是Barts核心。尽管两者的流处理算术逻辑单元数量有差异,但它们满足同系列、同核心的条件因此可以组建混交系统。Radeon HD5870和Radeon HD 5850也属于上述类型。
而Radeon HD 6970和Radeon HD 6850虽然同属Radeon HD 6000系列,但Radeon HD 6970采用Cayman核心,而Radeon HD 6850则使用Barts核心,因此无法组建混交系统。至于Radeon HD 6850和RadeonHD 5770,它们既不是同系列,更没有采用相同的核心,自然无法组建成功。而GeForce GTX 460、 GeForce GTX460SE和GeForce GTX 580、GeForce GTX 570虽然都满足同系列、同核心的条件,但NVIDIA目前并不支持这种形式的混交系统,因此无法组建。
至于AMD混交系统的性能,从Radeon HD 6870和Radeon HD 6850组建的系统效率来看,其在大部分游戏中都小幅领先Radeon HD 6850 CrossFireX,幅度在10%以内。总体而言,这种混交系统的提升效率不算特别高,以Radeon HD 6870和Radeon HD 6850组建的混交系统为例,其性能介于Radeon HD 6850 CrossFireX和Radeon HD 6870 CrossFireX之间。经过反复测试,我们还发现这样的问题,如果将Radeon HD 6850作为主卡、Radeon HD 6870作为副卡的话,系统会不稳定,运行游戏会花屏和死机。这说明在这种混交系统下,必须将性能更好的产品作为主卡,性能稍差的产品作为副卡,否则会引起系统的不稳定。
●设想模式三
案例一:GeForce GTX 460+GeForce GTX 260=成功
案例二:GeForce GTX 460+ Radeon HD 6850=失败
案例三:Radeon HD 6850+ Radeon HD 6870=失败
在设想模式三下,GeForce GTX 460+GeForceGTX 260成功组建起了另类的混交系统。正如我们上文分析的那样,这种互联系统在PhysX游戏中有不错的提升:相比GeForce GTX 460,GeForce GTX 460和GeForce GTX 260组建的互联系统在PhysX游戏中有15%左右的性能提升幅度。但在普通3D游戏中,这种互联系统几乎没有带来任何的性能提升。
需要说明的是,对AMD显卡而言,也能够组建类似的混交互联系统(一块AMD显卡+一块NVIDIA显卡)。具体做法是让NVIDIA显卡负责PhysX运算,AMD显卡负责3D渲染。依旧是只能提升在PhysX游戏中的性能。但要实现这种模式需要特别的破解补丁和配合相应的驱动程序,存在兼容性问题,并不被NVIDIA官方认可,因此本次测试不予考虑此方法,GeForce GTX 460+ Radeon HD6850组建失败。
显卡互联系统:值得拥有相比过去显卡互联系统不算特别高的效率,如今以GeForce GTX 460和Radeon HD 6850为代表的新一代中高端DirectX 11显卡为我们展示了它们强劲的互联性能。他们各自组成的双卡互联系统在游戏中已经获得了平均80%左右的性能提升,甚至在部分游戏中实现了100%的理论双卡互联性能提升幅度:这是非常可观的性能提升。因此对那些打算提升系统图形性能的用户而言,组建显卡互联系统确实是一个不错的选择。在此,我们就本文的测试结果对大家提出一些建议。
如果你是一个硬件玩家或者游戏玩家打算提升系统的图形性能,而且手中没有现成可用的显卡的话,那么可以考虑组建同型号的双卡互联系统。首先应当考虑GeForce GTX 460和Radeon HD 6850这类千元出头的高端产品。用这类产品组建双卡互联系统后,性能的提升幅度非常令人满意,性能甚至超过了目前NVIDIA和AMD最顶级的单核心显卡,但价格却更低,功耗也不高。以GeForce GTX 460 1GB为例,它的单卡价格在1400元左右,两块在2800左右,而GeForce GTX 580的价格却接近4000元。而且从测试来看,互联系统没有碰到兼容性问题,用户大可放心。如果你是发烧玩家,还可以购买更高端的产品组建双卡互联系统,不过这对电源提出了更高的要求。
如果你已经购买了一块中高端Radeon HD 5000/6000系列或者GeForce GTX 400系列显卡,并且打算升级的话,大可以再购买一块相同型号的显卡组建CrossFireX或者SLI系统。而不必将已有的显卡出售,重新再购买一款更高级别的显卡。这对升级用户来说,是非常方便和可行的。而且如果你购买的是中高端AMD RadeonHD 5000/6000系列显卡,还可以考虑购买一款性能更好、和已有显卡同属一个系列且采用同核心的产品,用于组建类似Radeon HD6850/6870这样的混交系统。
如果你曾购买了GeForce 8系列以上的显卡,并且打算近期升级NVIDIA最新的产品的话,不妨将已有的GeForce显卡和新购买的NVIDIA显卡组建成混交系统。因为这可以提升在PhysX游戏中的性能,让老显卡继续发光发热。最后,SLI和CrossFireX系统都非常依赖显卡驱动和游戏的优化,因此用户需要经常升级驱动或更新显卡的多卡并联配置文件,以提升性能。
关注读览天下微信,
100万篇深度好文,
等你来看……