NVIDIA GeForce GTX 590显卡评测
- 来源:微型计算机 smarty:if $article.tag?>
- 关键字:NVIDIA GeForce GTX 590,显卡,评测 smarty:/if?>
- 发布时间:2011-05-27 15:18
是的,它来了。就在AMD发布卡皇Radeon HD6990不久,NVIDIA迅速跟进。在时隔两年多以后,它终于发布了阔别已久、被无数玩家给予厚望的顶级双核心显卡—GeForce GTX 590。这是一场象征最高荣誉的卡皇的争夺战,大战一触即发!
GTX 590为顶级显卡市场注入新活力和本刊上期深入评测过的Radeon HD 6990一样,GeForce GTX 590也是NVIDIA用于占据顶级市场的终极产品。它的目的依旧是彰显品牌形象,其对应的产品是AMD新发布的Radeon HD 6990。
NVIDIA是一家进取心很强的公司,我们看到在它的发展历史中,无论是显卡还是主板芯片组,NVIDIA都力求完美,做到最好。但在顶级的显卡产品上,NVIDIA已经太久没有胜出AMD了,NVIDIA在相当长的一段时间内和显卡霸主失之交臂。回顾历史可以发现,发布了G80后的NVIDIA,凭借先进的核心设计和超大的GPU规模,一直占据GPU性能王座。随后GeForce GTX 285发布后,NVIDIA在高端显卡上达到了一个顶峰,并发布了显卡之王GeForce GTX 295,综合性能超过刚刚获得显卡王座的Radeon HD 4870 X2,再次勇夺第一。
但随后GF100核心的GeForce GTX 480又由于功耗高、发热大,而被迫取消了双核心计划。NVIDIA在顶级双核心产品上的挫折给了AMD最好的机会,AMD的RadeonHD 5970几乎成为寿命最长的卡皇产品,长期占据卡皇地位,着实让AMD扬眉吐气了一把,新的GeForce GTX480/580也无法完全撼动Radeon HD 5970的地位。
从技术角度来说,NVIDIA的Fermi架构相当先进,在很多方面都超出Radeon HD 6990以及相应的RV870核心。反映到具体市场上,NVIDIA在高端单核心产品上也确实倚仗了Fermi架构的先进性,推出了诸如GeForceGTX 460/560Ti等经典产品。但在中低端产品上,AMD并不甘示弱,凭借成功的错位竞争策略,给NVIDIA带来了很大的威胁。
对NVIDIA来说,长期失去顶级产品绝对性能的领先地位也是无法忍受的,这次GeForce GTX 590的发布,给NVIDIA带来了契机,并正面挑战AMD的对应产品,形成顶级市场两强相争的对阵架势。因此不管从哪方面来看,GeForce GTX 590对NVIDIA来说意义都非常重大。
GeForce GTX 590规格解读
最终,这一切造就了双核怪兽GeForce GTX 590。
和传言NVIDIA将使用两颗GF114核心打造双核显卡不同的是,GeForce GTX 590采用了两颗完整版本的GF110核心,并开放了全部的流处理器和显存控制器。
GeForce GTX 590总共拥有1024(512×2)个CUDA核心(CUDA Core)、8(4×2)个GPC(Graphics ProcessingClusters)阵列、128(64×2)个纹理单元以及96(48×2)个ROP(光栅处理单元)。GeForce GTX 590为每个核心搭配了1536MB/GDDR5/384-bit显存,共3072MB显存,官方默认核心频率、流处理器和显存频率分别为607MHz、1215MHz和3416MHz。它的TDP为365W,官方推荐使用700W以上的电源,配备2个8pin接口。
有意思的是,在GeForce GTX 590发布前,有传言称它将采用两颗GF114核心(GeForce GTX 560)打造,以控制功耗。这个和之前NVIDIA双核心显卡GeForceGTX 295由两颗GeForce GTX 275核心组成(理论上应该是用两颗GeForce GTX 285核心组成)有异曲同工之妙。但最终产品发布以后大家发现,GeForce GTX 590并没有采用这种更中庸的设计,而是直接由两颗GeForceGTX 580核心组成。这显示出NVIDIA对Fermi架构的掌控已经很成熟了,可以较好地控制GeForce GTX 590的功耗。
沿用成熟的Fermi架构GeForce GTX 590仍然采用的是Fermi架构,代号为GF110,并全面继承了GeForce GTX 580以及最早的GeForce GTX 480的所有特色。在此,我们不对Fermi架构进行过多分析,我们只将重要的部分简单总结出来,更多的内容请参考本刊2010年4月下和12月上分别对GeForceGTX 480和GeForce GTX 580的详尽评测(以下对Fermi架构的分析也适用于GeForce GTX 480/580)。
强大的多形体引擎
Fermi的多形体引擎是目前GPU设计中最强大、能够执行最为复杂的曲面细分单元。它的每个SM都配备了一个多形体引擎,总计拥有16个多形体引擎。
改进的CUDA核心
Fermi的CUDA核心拥有完全流水线化的整数算术逻辑单元和浮点算术逻辑单元,完整支持IEEE754-2008浮点标准。另外,Fermi架构能够对32个位置一组的并行线程进行自由调度,这样设计会极大提升显卡的内部效率,让实测性能大大接近理论性能值。
出众的缓存设计
Fermi的核心中首次引入了自由读写的高速缓存,可以用于存储通用计算中产生的临时数据。
Fermi为每个SM配备的64kB的片上缓存可以被共享为16kB的一级高速缓存搭配48kB的共享缓存,或者反过来成为48kB的一级高速缓存搭配16kB的共享缓存。另外,Fermi拥有一个容量达768kB的二级高速缓存,可以为所有的载入、存储以及数据请求提供服务。
灵活自由的缓存设计大大提高了Fermi在图形计算、通用计算中的效能。
效率更高的ROP单元
Fermi架构中引入了新设计的ROP单元,大幅度增强了抗锯齿效能。另外,Fermi特别提升了原子指令的性能,相同地址的原子操作速度达到了GT200的20倍以上。特别重要的一点是,Fermi架构可以支持32倍的CSAA抗锯齿,这是目前效果最好的抗锯齿之一。GeForce GTX 590除了上述重要的3D技术改进之外,还有一些其他的功能设计,但由于和GF110、GF100完全相同,因此我们不再赘述。总体而言,GeForce GTX 590和GeForce GTX 580以及GeForce GTX 480一样,是一款集大成的产品,不仅在传统游戏性能方面有突出的表现,在高性能计算方面相对过去的产品更是有革命性的提升。
另外,和所有的双芯显卡一样,GeForce GTX 590也采用了一颗并联芯片完成两个核心之间的信息传递和交替运作。这颗芯片我们已经相当熟悉了,从GeForce 9800GX2开始,NVIDIA就采用它作为双卡互联的桥梁,甚至在主板上也常常看到它的身影。没错,就是NF200。
NF200能够实现双卡各自PCI-E x16的连接速度,然后以PCI-E x16的速度进行外部连接。可以预见的是,在PCI-E3.0到来之前,NF200还将继续存在下去。
散热设计、功耗控制和噪音从NVIDIA公版GeForce GTX 560460等产品上,我们已经看到了NVIDIA在逐步放弃侧吹式散热器和涡轮风扇。这次在GeForce GTX 590上,NVIDIA并未使用之前双芯卡常用的“夹心饼干”式设计,而是采用了和第二版GeForce GTX 295相同的单PCB、中置式风扇设计。
另外它也没有采用涡轮散热器,而是采用了传统类型的风扇。这种风扇在设计恰当的情况下也能很好地将冷却风流吹至四周,实际使用中的噪音也小一些。
在散热结构方面,GeForce GTX 590和第二版GeForce GTX 295有所不同。在GeForce GTX 590中NVIDIA采用了均热板设计,而GeForce GTX 295依旧是传统的热管。均热板相比热管,能更有效地将热量吸收和发散,然后传导至鳍片上,散热效率和效果都更出色。
另外,GeForce GTX 590为了加强整个PCB,还特别设计了金属骨架和半背板。从显卡结构来看,PCB大部分重量都转移到金属骨架上,避免了PCB形变等情况的发生。而显卡背部的半背板可以对PCB起到很好的保护,使显卡更为耐久。在风道方面,GeForce GTX 590由于采用中置式风扇设计,因此不能完全将热量排出机箱外,因此用户需要加强机箱风道确保不会有太多热量集聚在机箱内部。
公版GeForce GTX 590的功耗控制从以下几个方面着手:首先,芯片本身的频率和电压大幅度降低。GeForceGTX 590的核心电压不足1V,只有0.9370V~0.95V左右,比GeForce GTX 580的0.979V大幅度降低,其核心频率也从GeForce GTX 580的772MHz降低到了607MHz。根据NVIDIA公布的数据,在降低了频率和电压后,单核心的热设计功耗被控制在180W附近,相比GeForce GTX 580的244W下降了大约25%~26%。
其次,NVIDIA也依旧加入了功耗控制设计,来保证GeForce GTX 590在运行时不会由于功耗突增而烧毁显卡或出现其他高温故障。
在加入了这些方面的设计后,GeForce GTX 590的工作噪音表现令人相当满意。相比其竞争对手RadeonHD 6990,GeForce GTX 590在工作时噪音并不大。据NVIDIA称,虽然GeForce GTX 590的TDP比较高,但凭借高效的散热设计和出色的功耗控制,这款显卡依旧表现出了相当令人满意的使用体验。
用实力来说话:卡皇之间的强强对话
仅从规格来看,GeForce GTX 590和与之定位相同的Radeon HD 6990可谓是各有千秋。我们知道,AMD近年来一直奉行的是小核心策略,特别是其Radeon HD6900系列进一步优化了图形架构,提升了单个晶体管的使用效率。与之对应的则是NVIDIA的大核心策略—GeForce GTX 590达到了空前的1024个流处理器和60亿个晶体管,那么它的单个流处理器和晶体管的执行效率又如何呢?谁才能在这场万众瞩目的卡皇争夺战中获得最终的胜利呢?在英特尔最新的Core i7 2600K平台下,我们将为你带来最全面和详尽的GeForce GTX 590测试。
在本部分,你将了解到GeForce GTX 590的游戏性能、曲面细分性能、PhysX物理加速性能、3D Vision游戏应用和功耗散热表现,以及它和Radeon HD 6990的性能对比。另一方面,现在3D立体的各种应用越来越成熟了。对GeForce GTX 590这样的顶级产品来说,它卓越的性能可以使得它在3D Vision模式下的各种应用中更加游刃有余。为此,我们将在3D Vision模式下对它的游戏性能进行测试和体验。
GeForce GTX 590 Vs. Radeon HD 6990和Radeon HD 6990相比,GeForce GTX 590在频率、纹理单元和显存容量的规格参数上都处于比较明显的劣势,但GeForce GTX 590的优势在于拥有专为DirectX11 API优化和执行效率更高的图形架构,而且在显存位宽和显存带宽上更有优势。因此GeForce GTX 590在总共9个游戏和基准测试软件的测试项目中,有7个测试项目都保持了对Radeon HD 6990的领先,整体领先幅度在10%左右。例如在《失落的星球2》和《尘埃2》(均运行在1920×1080+最高画质下),GeForce GTX 590的领先幅度分别为22%和7%左右。
究其原因,GeForce GTX 590采用的是Fermi 2.0架构,在第一代Fermi架构上进行了优化。因此我们看到它在新一代DirectX 11游戏中,特别是最新发布的一些DirectX 11游戏(例如《失落的星球2》)中有较为明显的优势。另一方面我们应该理性对待这种领先优势,虽然GeForce GTX 590架构更出色,但它相对于同级别的Radeon HD 6990很难有超过30%以上的领先优势。一则Radeon HD 6990也是同时代、同档次的产品,虽然架构并不领先,但通过对架构的优化,提升了单个晶体管的使用效率,即它的单个晶体管的使用效率较高,这也是AMD一直引以为傲的小核心策略带来的优势。而且Radeon HD6990在频率和显存容量上的优势比较明显,可以一定程度弥补架构上的劣势。二则GeForce GTX 590为了控制功耗和发热量,在性能和功耗上做出了平衡,相对于GeForceGTX 580大幅调低了频率,一定程度上影响了性能。而反观Radeon HD 6990,虽然也存在这种平衡功耗和性能的情况,但它的频率相对Radeon HD 6970下降并不多,甚至可以通过双BIOS的方式达到和Radeon HD 6970几乎等同的频率,对提升性能帮助很大。
所以我们看到,GeForce GTX 590在大部分游戏中只能领先Radeon HD 6990 10%左右,领先幅度并不高。只是在个别新发布的DirectX 11游戏中有超过20%的优势,但这同时也证明了GeForce GTX 590架构的先进性和预判性。可以预见的是,随着DirectX 11新游戏的发布,GeForce GTX 590在这类采用新设计的游戏中,会有更大的优势和更好的表现。
GeForce GTX 590 Vs. GeForce GTX 580
GeForce GTX 590对决GeForce GTX 580是
GeForce GTX 590的另一大看点。对于那些购买了
GeForce GTX 580这样的顶级单核心产品的用户来说,是否有必要再购买它的双核心版本GeForce GTX 590?
GeForce GTX 590相比GeForce GTX 580能否有明显的性能提升?效率几何?
我们不妨从基准测试软件(3DMark Vantage、3DMark 11和Unigine Heaven Benchmark 2.5)和实际游戏测试两方面来看。基准测试软件表明,GeForce GTX590得益于流处理器、显存容量和纹理单元等规格参数的全面提升,在上述三项测试中分别领先GeForce GTX580 50%、37%和55%,接近双核心显卡的理论提升幅度。在实际游戏中,GeForce GTX 590在1920×1080+最高画质下平均领先GeForceGTX 580 20%左右,例如在《孤岛惊魂2》和《尘埃2》中,GeForce GTX 590分别领先11%和23%。在开启全屏抗锯齿后,GeForce GTX590平均领先幅度在35%左右,例如在《孤岛惊魂2》、《尘埃2》和《战地:叛逆联队2》,GeForce GTX 590分别领先28%、47%和36%,这主要得益于GeForce GTX590 ROP数量和数据吞吐量的大幅提升。
总体而言,GeForce GTX 590相比GeForce GTX580的提升幅度是比较有限的,整体领先幅度不超过50%,甚至在一些游戏中几乎没有提升(《黑手党2》)。这个提升幅度和Radeon HD 6990较Radeon HD 6970以及过去的顶级双核心显卡的提升幅度是差不多的。究其原因,对GeForce GTX 580这样的顶级单核心产品而言,它的性能已经足够强大,即使是在此基础上对其规格作100%的性能提升也很难大幅提升性能。与之对应的是,千元级左右的中高端产品,由于性能还有很大的提升空间,因此组建双卡互联系统反而可以取得非常明显的性能提升,例如GeForce GTX 460 SLI。
PhysX:流畅体验真实的物理效果PhysX作为NVIDIA显卡独有的卖点,已经成为不少玩家在购买显卡时重点考虑的一个因素。GeForce GTX590作为NVIDIA的旗舰产品,它的PhysX性能自然成为不少玩家关注的焦点。以《黑手党2》这款目前人气很高的PhysX游戏为例,GeForce GTX 590在开启和关闭PhysX情况下,分别可以获得45fps和59.5fps的帧率,非常流畅。不过对比GeForce GTX 580的测试结果可以发现,这款游戏没有对GeForce GTX 590进行优化,GeForce GTX 590和GeForce GTX 580在该游戏中的性能表现是一样的。
相对于同档次的Radeon HD 6990,GeForce GTX590在开启PhysX的状态下的领先幅度为161%,优势非常明显。在PhysX状态下,GeForce GTX 590可以流畅地体验到诸如枪弹射击、碎块滑落等真实的物理效果,这是Radeon HD 6990无法实现的。
曲面细分表现:极致的性能
之所以说NVIDIA GeForce GTX 400/500系列显卡采用的图形架构是革命性的一个重要原因在于,它们的图形架构专门设计了用于处理曲面细分计算的多形体引擎,这也一直是NVIDIA宣称其旗下的DirectX 11产品是真DirectX 11显卡的根本原因。因此我们看到NVIDIADirectX 11显卡的曲面细分性能确实比AMD同级别显卡更优秀,自然大家也对GeForce GTX 590的曲面细分性能充满了好奇和期待。
Radeon HD 6990通过对核心规格的堆积和优化,也大幅提升了曲面细分性能,能够在Unigine HeavenBenchmark 2.5(1920×1080 Shader(High)Tessellation(Extreme))下获得54.5fps的帧率—这是一个相当不错的表现。不过GeForce GTX 590还是技高一筹,在相同设置下领先Radeon HD 6990 21%,这体现出GeForceGTX 590对DirectX 11的核心技术的支持已经到了一个相当高的程度。
顶级的3D Vsion体验:立体的游戏世界本刊曾进行过不少基于3D Vsion的测试,但基于顶级的双核心显卡还是第一次,相信大家都想知道顶级的GeForce GTX 590究竟能在3D Vsion下获得怎样的游戏体验吧。那么接下来,我们将在华硕VG236H-A显示器下,以1920×1080分辨率+最高画质和1920×1080分辨率+最高画质+抗锯齿模式对GeForce GTX 590进行测试和体验。
我们知道,在3D Vsion模式下,同一帧游戏画面将被渲染两次,对显卡的性能提出了更高的要求。测试结果也表明,即使是GeForce GTX 590,在3D Vsion下的性能损失也是比较严重的。以《孤岛惊魂2》和《尘埃2》为例,GeForce GTX 590的性能下降幅度分别为62%和58%,性能损失幅度和我们之前的测试基本一致。不过好在GeForce GTX 590的规格参数强大,基本都可以在1920×1080分辨率+最高画质+抗锯齿模式下获得40fps左右的游戏帧数,在保证出色的3D游戏效果的同时,还能获得不错的游戏速度。
在3D Vision模式下,我们的游戏体验别有一番风味,在一些FPS游戏中,当你手握枪械在森林中小心翼翼前进时,周围的景物以及人与人之间的立体感分明,非常真实,仿佛你真的置身于森林中。
之前,我们曾利用GeForce GTX 470显卡在1680×1050分辨率进行过3D Vsion的测试,并取得不错的体验。而如今借助GeForce GTX 590,我们则能够在1920×1080分辨率+最高画质+抗锯齿模式下获得流畅的使用体验,这是其他型号的NVIDIA显卡无法实现的。
功耗和散热表现:有惊喜双核心显卡由于核心规格较高,一直受到功耗和发热量的困扰。尤其是GeForce GTX 590,它的晶体管数量堪称目前的显卡之最,那么它的功耗表现怎样呢?测试表明,该显卡所在的待机系统功耗和满载系统功耗分别为119W和405W,该显卡的待机温度和满载温度分别为42℃和86℃。值得一提的是,和其他双核心产品在满载状态下噪音很高相比,GeForce GTX 590的静音效果很不错,让人吃惊,远远将同档次的产品甩在身后。
前文曾经提到,GeForce GTX 590和GeForceGTX 580一样,都通过专门的控制IC限制了显卡的最大功耗,防止显卡在极端环境下造成损害。因此,我们运行Furmark拷机程序得到的405W的满载系统功耗,并不能将GeForce GTX 590的真实功耗体现出来。但坦白地说,在平时运行游戏等非专门的拷机应用中,GeForceGTX 590一般是无法达到理论最大功耗值的,Furmark拷机程序只能起到一个参考作用,更多的还是应该以实际游戏测试为主。
另一方面,我们在使用最新版本的Furmark 1.9程序进行测试时发现,GeForce GTX 590不仅有功耗限制,还和Furmark存在不兼容的情况。具体表现为,在进行拷机时,GeForce GTX 590只有一个核心处于高速运行状态,另一个核心则处于闲置状态,显然这无法让它处于高速状态。因此我们进入“NVIDIA控制面板”→“管理3D设置”→“多GPU渲染模式”,将“由NVIDIA推荐”改成“强制使用交替帧渲染 1”,问题得以解决。
总体而言,GeForce GTX 590的功耗散热表现令人满意,主要有以下3个原因:一,它的核心电压和频率相比GeForce GTX 580更低;二,该显卡改进了散热设计;三,引入控制IC,对最大功耗进行限制。
卡皇宝座易主:GeForce GTX 590“称帝”
大量实测表明,GeForce GTX 590用它出色的游戏性能和全能的表现宣告新卡皇的强势回归。NVIDIA在苦心经营两年并对Fermi架构进行大量优化的前提下,终于凭借GeForce GTX 590重夺卡皇的宝座。
GeForce GTX 590的诞生同时也宣告了NVIDIA对Fermi架构的控制已经达到了成熟的地步,遥想当初GeForce GTX 480发布时甚至因为功耗和设计的问题,无法设计成全规格的Fermi(512个流处理器)。在第二代Fermi上,NVIDIA发布了全规格的GeForce GTX580,并在GeForce GTX 480基础上进行优化。而今天,我们更一同见证了具备双核心的GeForce GTX 590站在了性能之巅。诚然,GeForce GTX 590的销量会非常有限,更多的是彰显研发实力和品牌形象,但其头上的光环必将照亮NVIDIA旗下的其他产品,吸引更多的用户和玩家的关注。
在性能方面,GeForce GTX 590已经是独步天下,虽然它相对于Radeon HD 6990并没有革命性的性能提升,但在卡皇的争夺战中,哪怕5%的性能优势都足以让一款产品脱颖而出。因为关注这个价位的玩家,几乎只需要考虑它的性能,这直接决定着他们的购买意向。另一方面,可能普通用户会认为GeForce GTX 590(6999元)的售价比RadeonHD 6990高出1000元~2000元,但正如上文所说,关注GeForce GTX 590级别的多是那些不差钱的用户,对他们来说,性能才是最重要的—一款当下最强性能的产品才能满足他们对性能的渴望,成为向周围朋友炫耀的资本。更为重要的是,GeForce GTX 590一改过去顶级产品噪音明显的弊病,将噪音控制在一个令人接受的程度内,这对那些苛求静音效果的发烧友来说,无疑更具购买价值。
……
GTX 590为顶级显卡市场注入新活力和本刊上期深入评测过的Radeon HD 6990一样,GeForce GTX 590也是NVIDIA用于占据顶级市场的终极产品。它的目的依旧是彰显品牌形象,其对应的产品是AMD新发布的Radeon HD 6990。
NVIDIA是一家进取心很强的公司,我们看到在它的发展历史中,无论是显卡还是主板芯片组,NVIDIA都力求完美,做到最好。但在顶级的显卡产品上,NVIDIA已经太久没有胜出AMD了,NVIDIA在相当长的一段时间内和显卡霸主失之交臂。回顾历史可以发现,发布了G80后的NVIDIA,凭借先进的核心设计和超大的GPU规模,一直占据GPU性能王座。随后GeForce GTX 285发布后,NVIDIA在高端显卡上达到了一个顶峰,并发布了显卡之王GeForce GTX 295,综合性能超过刚刚获得显卡王座的Radeon HD 4870 X2,再次勇夺第一。
但随后GF100核心的GeForce GTX 480又由于功耗高、发热大,而被迫取消了双核心计划。NVIDIA在顶级双核心产品上的挫折给了AMD最好的机会,AMD的RadeonHD 5970几乎成为寿命最长的卡皇产品,长期占据卡皇地位,着实让AMD扬眉吐气了一把,新的GeForce GTX480/580也无法完全撼动Radeon HD 5970的地位。
从技术角度来说,NVIDIA的Fermi架构相当先进,在很多方面都超出Radeon HD 6990以及相应的RV870核心。反映到具体市场上,NVIDIA在高端单核心产品上也确实倚仗了Fermi架构的先进性,推出了诸如GeForceGTX 460/560Ti等经典产品。但在中低端产品上,AMD并不甘示弱,凭借成功的错位竞争策略,给NVIDIA带来了很大的威胁。
对NVIDIA来说,长期失去顶级产品绝对性能的领先地位也是无法忍受的,这次GeForce GTX 590的发布,给NVIDIA带来了契机,并正面挑战AMD的对应产品,形成顶级市场两强相争的对阵架势。因此不管从哪方面来看,GeForce GTX 590对NVIDIA来说意义都非常重大。
GeForce GTX 590规格解读
最终,这一切造就了双核怪兽GeForce GTX 590。
和传言NVIDIA将使用两颗GF114核心打造双核显卡不同的是,GeForce GTX 590采用了两颗完整版本的GF110核心,并开放了全部的流处理器和显存控制器。
GeForce GTX 590总共拥有1024(512×2)个CUDA核心(CUDA Core)、8(4×2)个GPC(Graphics ProcessingClusters)阵列、128(64×2)个纹理单元以及96(48×2)个ROP(光栅处理单元)。GeForce GTX 590为每个核心搭配了1536MB/GDDR5/384-bit显存,共3072MB显存,官方默认核心频率、流处理器和显存频率分别为607MHz、1215MHz和3416MHz。它的TDP为365W,官方推荐使用700W以上的电源,配备2个8pin接口。
有意思的是,在GeForce GTX 590发布前,有传言称它将采用两颗GF114核心(GeForce GTX 560)打造,以控制功耗。这个和之前NVIDIA双核心显卡GeForceGTX 295由两颗GeForce GTX 275核心组成(理论上应该是用两颗GeForce GTX 285核心组成)有异曲同工之妙。但最终产品发布以后大家发现,GeForce GTX 590并没有采用这种更中庸的设计,而是直接由两颗GeForceGTX 580核心组成。这显示出NVIDIA对Fermi架构的掌控已经很成熟了,可以较好地控制GeForce GTX 590的功耗。
沿用成熟的Fermi架构GeForce GTX 590仍然采用的是Fermi架构,代号为GF110,并全面继承了GeForce GTX 580以及最早的GeForce GTX 480的所有特色。在此,我们不对Fermi架构进行过多分析,我们只将重要的部分简单总结出来,更多的内容请参考本刊2010年4月下和12月上分别对GeForceGTX 480和GeForce GTX 580的详尽评测(以下对Fermi架构的分析也适用于GeForce GTX 480/580)。
强大的多形体引擎
Fermi的多形体引擎是目前GPU设计中最强大、能够执行最为复杂的曲面细分单元。它的每个SM都配备了一个多形体引擎,总计拥有16个多形体引擎。
改进的CUDA核心
Fermi的CUDA核心拥有完全流水线化的整数算术逻辑单元和浮点算术逻辑单元,完整支持IEEE754-2008浮点标准。另外,Fermi架构能够对32个位置一组的并行线程进行自由调度,这样设计会极大提升显卡的内部效率,让实测性能大大接近理论性能值。
出众的缓存设计
Fermi的核心中首次引入了自由读写的高速缓存,可以用于存储通用计算中产生的临时数据。
Fermi为每个SM配备的64kB的片上缓存可以被共享为16kB的一级高速缓存搭配48kB的共享缓存,或者反过来成为48kB的一级高速缓存搭配16kB的共享缓存。另外,Fermi拥有一个容量达768kB的二级高速缓存,可以为所有的载入、存储以及数据请求提供服务。
灵活自由的缓存设计大大提高了Fermi在图形计算、通用计算中的效能。
效率更高的ROP单元
Fermi架构中引入了新设计的ROP单元,大幅度增强了抗锯齿效能。另外,Fermi特别提升了原子指令的性能,相同地址的原子操作速度达到了GT200的20倍以上。特别重要的一点是,Fermi架构可以支持32倍的CSAA抗锯齿,这是目前效果最好的抗锯齿之一。GeForce GTX 590除了上述重要的3D技术改进之外,还有一些其他的功能设计,但由于和GF110、GF100完全相同,因此我们不再赘述。总体而言,GeForce GTX 590和GeForce GTX 580以及GeForce GTX 480一样,是一款集大成的产品,不仅在传统游戏性能方面有突出的表现,在高性能计算方面相对过去的产品更是有革命性的提升。
另外,和所有的双芯显卡一样,GeForce GTX 590也采用了一颗并联芯片完成两个核心之间的信息传递和交替运作。这颗芯片我们已经相当熟悉了,从GeForce 9800GX2开始,NVIDIA就采用它作为双卡互联的桥梁,甚至在主板上也常常看到它的身影。没错,就是NF200。
NF200能够实现双卡各自PCI-E x16的连接速度,然后以PCI-E x16的速度进行外部连接。可以预见的是,在PCI-E3.0到来之前,NF200还将继续存在下去。
散热设计、功耗控制和噪音从NVIDIA公版GeForce GTX 560460等产品上,我们已经看到了NVIDIA在逐步放弃侧吹式散热器和涡轮风扇。这次在GeForce GTX 590上,NVIDIA并未使用之前双芯卡常用的“夹心饼干”式设计,而是采用了和第二版GeForce GTX 295相同的单PCB、中置式风扇设计。
另外它也没有采用涡轮散热器,而是采用了传统类型的风扇。这种风扇在设计恰当的情况下也能很好地将冷却风流吹至四周,实际使用中的噪音也小一些。
在散热结构方面,GeForce GTX 590和第二版GeForce GTX 295有所不同。在GeForce GTX 590中NVIDIA采用了均热板设计,而GeForce GTX 295依旧是传统的热管。均热板相比热管,能更有效地将热量吸收和发散,然后传导至鳍片上,散热效率和效果都更出色。
另外,GeForce GTX 590为了加强整个PCB,还特别设计了金属骨架和半背板。从显卡结构来看,PCB大部分重量都转移到金属骨架上,避免了PCB形变等情况的发生。而显卡背部的半背板可以对PCB起到很好的保护,使显卡更为耐久。在风道方面,GeForce GTX 590由于采用中置式风扇设计,因此不能完全将热量排出机箱外,因此用户需要加强机箱风道确保不会有太多热量集聚在机箱内部。
公版GeForce GTX 590的功耗控制从以下几个方面着手:首先,芯片本身的频率和电压大幅度降低。GeForceGTX 590的核心电压不足1V,只有0.9370V~0.95V左右,比GeForce GTX 580的0.979V大幅度降低,其核心频率也从GeForce GTX 580的772MHz降低到了607MHz。根据NVIDIA公布的数据,在降低了频率和电压后,单核心的热设计功耗被控制在180W附近,相比GeForce GTX 580的244W下降了大约25%~26%。
其次,NVIDIA也依旧加入了功耗控制设计,来保证GeForce GTX 590在运行时不会由于功耗突增而烧毁显卡或出现其他高温故障。
在加入了这些方面的设计后,GeForce GTX 590的工作噪音表现令人相当满意。相比其竞争对手RadeonHD 6990,GeForce GTX 590在工作时噪音并不大。据NVIDIA称,虽然GeForce GTX 590的TDP比较高,但凭借高效的散热设计和出色的功耗控制,这款显卡依旧表现出了相当令人满意的使用体验。
用实力来说话:卡皇之间的强强对话
仅从规格来看,GeForce GTX 590和与之定位相同的Radeon HD 6990可谓是各有千秋。我们知道,AMD近年来一直奉行的是小核心策略,特别是其Radeon HD6900系列进一步优化了图形架构,提升了单个晶体管的使用效率。与之对应的则是NVIDIA的大核心策略—GeForce GTX 590达到了空前的1024个流处理器和60亿个晶体管,那么它的单个流处理器和晶体管的执行效率又如何呢?谁才能在这场万众瞩目的卡皇争夺战中获得最终的胜利呢?在英特尔最新的Core i7 2600K平台下,我们将为你带来最全面和详尽的GeForce GTX 590测试。
在本部分,你将了解到GeForce GTX 590的游戏性能、曲面细分性能、PhysX物理加速性能、3D Vision游戏应用和功耗散热表现,以及它和Radeon HD 6990的性能对比。另一方面,现在3D立体的各种应用越来越成熟了。对GeForce GTX 590这样的顶级产品来说,它卓越的性能可以使得它在3D Vision模式下的各种应用中更加游刃有余。为此,我们将在3D Vision模式下对它的游戏性能进行测试和体验。
GeForce GTX 590 Vs. Radeon HD 6990和Radeon HD 6990相比,GeForce GTX 590在频率、纹理单元和显存容量的规格参数上都处于比较明显的劣势,但GeForce GTX 590的优势在于拥有专为DirectX11 API优化和执行效率更高的图形架构,而且在显存位宽和显存带宽上更有优势。因此GeForce GTX 590在总共9个游戏和基准测试软件的测试项目中,有7个测试项目都保持了对Radeon HD 6990的领先,整体领先幅度在10%左右。例如在《失落的星球2》和《尘埃2》(均运行在1920×1080+最高画质下),GeForce GTX 590的领先幅度分别为22%和7%左右。
究其原因,GeForce GTX 590采用的是Fermi 2.0架构,在第一代Fermi架构上进行了优化。因此我们看到它在新一代DirectX 11游戏中,特别是最新发布的一些DirectX 11游戏(例如《失落的星球2》)中有较为明显的优势。另一方面我们应该理性对待这种领先优势,虽然GeForce GTX 590架构更出色,但它相对于同级别的Radeon HD 6990很难有超过30%以上的领先优势。一则Radeon HD 6990也是同时代、同档次的产品,虽然架构并不领先,但通过对架构的优化,提升了单个晶体管的使用效率,即它的单个晶体管的使用效率较高,这也是AMD一直引以为傲的小核心策略带来的优势。而且Radeon HD6990在频率和显存容量上的优势比较明显,可以一定程度弥补架构上的劣势。二则GeForce GTX 590为了控制功耗和发热量,在性能和功耗上做出了平衡,相对于GeForceGTX 580大幅调低了频率,一定程度上影响了性能。而反观Radeon HD 6990,虽然也存在这种平衡功耗和性能的情况,但它的频率相对Radeon HD 6970下降并不多,甚至可以通过双BIOS的方式达到和Radeon HD 6970几乎等同的频率,对提升性能帮助很大。
所以我们看到,GeForce GTX 590在大部分游戏中只能领先Radeon HD 6990 10%左右,领先幅度并不高。只是在个别新发布的DirectX 11游戏中有超过20%的优势,但这同时也证明了GeForce GTX 590架构的先进性和预判性。可以预见的是,随着DirectX 11新游戏的发布,GeForce GTX 590在这类采用新设计的游戏中,会有更大的优势和更好的表现。
GeForce GTX 590 Vs. GeForce GTX 580
GeForce GTX 590对决GeForce GTX 580是
GeForce GTX 590的另一大看点。对于那些购买了
GeForce GTX 580这样的顶级单核心产品的用户来说,是否有必要再购买它的双核心版本GeForce GTX 590?
GeForce GTX 590相比GeForce GTX 580能否有明显的性能提升?效率几何?
我们不妨从基准测试软件(3DMark Vantage、3DMark 11和Unigine Heaven Benchmark 2.5)和实际游戏测试两方面来看。基准测试软件表明,GeForce GTX590得益于流处理器、显存容量和纹理单元等规格参数的全面提升,在上述三项测试中分别领先GeForce GTX580 50%、37%和55%,接近双核心显卡的理论提升幅度。在实际游戏中,GeForce GTX 590在1920×1080+最高画质下平均领先GeForceGTX 580 20%左右,例如在《孤岛惊魂2》和《尘埃2》中,GeForce GTX 590分别领先11%和23%。在开启全屏抗锯齿后,GeForce GTX590平均领先幅度在35%左右,例如在《孤岛惊魂2》、《尘埃2》和《战地:叛逆联队2》,GeForce GTX 590分别领先28%、47%和36%,这主要得益于GeForce GTX590 ROP数量和数据吞吐量的大幅提升。
总体而言,GeForce GTX 590相比GeForce GTX580的提升幅度是比较有限的,整体领先幅度不超过50%,甚至在一些游戏中几乎没有提升(《黑手党2》)。这个提升幅度和Radeon HD 6990较Radeon HD 6970以及过去的顶级双核心显卡的提升幅度是差不多的。究其原因,对GeForce GTX 580这样的顶级单核心产品而言,它的性能已经足够强大,即使是在此基础上对其规格作100%的性能提升也很难大幅提升性能。与之对应的是,千元级左右的中高端产品,由于性能还有很大的提升空间,因此组建双卡互联系统反而可以取得非常明显的性能提升,例如GeForce GTX 460 SLI。
PhysX:流畅体验真实的物理效果PhysX作为NVIDIA显卡独有的卖点,已经成为不少玩家在购买显卡时重点考虑的一个因素。GeForce GTX590作为NVIDIA的旗舰产品,它的PhysX性能自然成为不少玩家关注的焦点。以《黑手党2》这款目前人气很高的PhysX游戏为例,GeForce GTX 590在开启和关闭PhysX情况下,分别可以获得45fps和59.5fps的帧率,非常流畅。不过对比GeForce GTX 580的测试结果可以发现,这款游戏没有对GeForce GTX 590进行优化,GeForce GTX 590和GeForce GTX 580在该游戏中的性能表现是一样的。
相对于同档次的Radeon HD 6990,GeForce GTX590在开启PhysX的状态下的领先幅度为161%,优势非常明显。在PhysX状态下,GeForce GTX 590可以流畅地体验到诸如枪弹射击、碎块滑落等真实的物理效果,这是Radeon HD 6990无法实现的。
曲面细分表现:极致的性能
之所以说NVIDIA GeForce GTX 400/500系列显卡采用的图形架构是革命性的一个重要原因在于,它们的图形架构专门设计了用于处理曲面细分计算的多形体引擎,这也一直是NVIDIA宣称其旗下的DirectX 11产品是真DirectX 11显卡的根本原因。因此我们看到NVIDIADirectX 11显卡的曲面细分性能确实比AMD同级别显卡更优秀,自然大家也对GeForce GTX 590的曲面细分性能充满了好奇和期待。
Radeon HD 6990通过对核心规格的堆积和优化,也大幅提升了曲面细分性能,能够在Unigine HeavenBenchmark 2.5(1920×1080 Shader(High)Tessellation(Extreme))下获得54.5fps的帧率—这是一个相当不错的表现。不过GeForce GTX 590还是技高一筹,在相同设置下领先Radeon HD 6990 21%,这体现出GeForceGTX 590对DirectX 11的核心技术的支持已经到了一个相当高的程度。
顶级的3D Vsion体验:立体的游戏世界本刊曾进行过不少基于3D Vsion的测试,但基于顶级的双核心显卡还是第一次,相信大家都想知道顶级的GeForce GTX 590究竟能在3D Vsion下获得怎样的游戏体验吧。那么接下来,我们将在华硕VG236H-A显示器下,以1920×1080分辨率+最高画质和1920×1080分辨率+最高画质+抗锯齿模式对GeForce GTX 590进行测试和体验。
我们知道,在3D Vsion模式下,同一帧游戏画面将被渲染两次,对显卡的性能提出了更高的要求。测试结果也表明,即使是GeForce GTX 590,在3D Vsion下的性能损失也是比较严重的。以《孤岛惊魂2》和《尘埃2》为例,GeForce GTX 590的性能下降幅度分别为62%和58%,性能损失幅度和我们之前的测试基本一致。不过好在GeForce GTX 590的规格参数强大,基本都可以在1920×1080分辨率+最高画质+抗锯齿模式下获得40fps左右的游戏帧数,在保证出色的3D游戏效果的同时,还能获得不错的游戏速度。
在3D Vision模式下,我们的游戏体验别有一番风味,在一些FPS游戏中,当你手握枪械在森林中小心翼翼前进时,周围的景物以及人与人之间的立体感分明,非常真实,仿佛你真的置身于森林中。
之前,我们曾利用GeForce GTX 470显卡在1680×1050分辨率进行过3D Vsion的测试,并取得不错的体验。而如今借助GeForce GTX 590,我们则能够在1920×1080分辨率+最高画质+抗锯齿模式下获得流畅的使用体验,这是其他型号的NVIDIA显卡无法实现的。
功耗和散热表现:有惊喜双核心显卡由于核心规格较高,一直受到功耗和发热量的困扰。尤其是GeForce GTX 590,它的晶体管数量堪称目前的显卡之最,那么它的功耗表现怎样呢?测试表明,该显卡所在的待机系统功耗和满载系统功耗分别为119W和405W,该显卡的待机温度和满载温度分别为42℃和86℃。值得一提的是,和其他双核心产品在满载状态下噪音很高相比,GeForce GTX 590的静音效果很不错,让人吃惊,远远将同档次的产品甩在身后。
前文曾经提到,GeForce GTX 590和GeForceGTX 580一样,都通过专门的控制IC限制了显卡的最大功耗,防止显卡在极端环境下造成损害。因此,我们运行Furmark拷机程序得到的405W的满载系统功耗,并不能将GeForce GTX 590的真实功耗体现出来。但坦白地说,在平时运行游戏等非专门的拷机应用中,GeForceGTX 590一般是无法达到理论最大功耗值的,Furmark拷机程序只能起到一个参考作用,更多的还是应该以实际游戏测试为主。
另一方面,我们在使用最新版本的Furmark 1.9程序进行测试时发现,GeForce GTX 590不仅有功耗限制,还和Furmark存在不兼容的情况。具体表现为,在进行拷机时,GeForce GTX 590只有一个核心处于高速运行状态,另一个核心则处于闲置状态,显然这无法让它处于高速状态。因此我们进入“NVIDIA控制面板”→“管理3D设置”→“多GPU渲染模式”,将“由NVIDIA推荐”改成“强制使用交替帧渲染 1”,问题得以解决。
总体而言,GeForce GTX 590的功耗散热表现令人满意,主要有以下3个原因:一,它的核心电压和频率相比GeForce GTX 580更低;二,该显卡改进了散热设计;三,引入控制IC,对最大功耗进行限制。
卡皇宝座易主:GeForce GTX 590“称帝”
大量实测表明,GeForce GTX 590用它出色的游戏性能和全能的表现宣告新卡皇的强势回归。NVIDIA在苦心经营两年并对Fermi架构进行大量优化的前提下,终于凭借GeForce GTX 590重夺卡皇的宝座。
GeForce GTX 590的诞生同时也宣告了NVIDIA对Fermi架构的控制已经达到了成熟的地步,遥想当初GeForce GTX 480发布时甚至因为功耗和设计的问题,无法设计成全规格的Fermi(512个流处理器)。在第二代Fermi上,NVIDIA发布了全规格的GeForce GTX580,并在GeForce GTX 480基础上进行优化。而今天,我们更一同见证了具备双核心的GeForce GTX 590站在了性能之巅。诚然,GeForce GTX 590的销量会非常有限,更多的是彰显研发实力和品牌形象,但其头上的光环必将照亮NVIDIA旗下的其他产品,吸引更多的用户和玩家的关注。
在性能方面,GeForce GTX 590已经是独步天下,虽然它相对于Radeon HD 6990并没有革命性的性能提升,但在卡皇的争夺战中,哪怕5%的性能优势都足以让一款产品脱颖而出。因为关注这个价位的玩家,几乎只需要考虑它的性能,这直接决定着他们的购买意向。另一方面,可能普通用户会认为GeForce GTX 590(6999元)的售价比RadeonHD 6990高出1000元~2000元,但正如上文所说,关注GeForce GTX 590级别的多是那些不差钱的用户,对他们来说,性能才是最重要的—一款当下最强性能的产品才能满足他们对性能的渴望,成为向周围朋友炫耀的资本。更为重要的是,GeForce GTX 590一改过去顶级产品噪音明显的弊病,将噪音控制在一个令人接受的程度内,这对那些苛求静音效果的发烧友来说,无疑更具购买价值。
关注读览天下微信,
100万篇深度好文,
等你来看……