终极杀器 NVIDIA GeForce GTX TITAN X深度评测

来源:微型计算机
关键字:图形计算,纹理,虚拟现实
发布时间:2015-04-13 15:55

　　在去年评测GTX 980的时候，我们就已经大胆预测过它绝不会是Maxwell架构真正的扛鼎之作。按照NVIDIA的习惯，GM204核心之上一定还有一款规格更夸张的GM200核心。只是处于各种未知原因，这颗核心没有第一时间出现在我们的视野里，让GTX 980客串了相当长时间的旗舰。现在搭载GM200的GTX TITAN X终于登场，作为Maxwell时代真正的王者，它究竟能为我们展现出怎样的与众不同？

　　很早之前就听到风声，说GM200将是代工厂台积电28nm工艺下的极限产品。当获知GM200核心面积达到601mm2时，我们不得不感慨NVIDIA的努力，这样规格的芯片应该基本上达到了当前工艺的极限，真不知NVIDIA会如何保障良品率。不可否认的是，大面积Die带来的规格优势确实相当诱人。80亿只晶体管最终赋予了GTX TITAN X高达3072个CUDA核心的强悍计算规模，这在GTX 980的基础上增长了50%！伴随CUDA核心的增长，外围的纹理单元、ROP单元以及显存位宽也一并增长，以满足整体计算效率的同步提高。对比GTX 980，我们发现这些外围模块的规格增长也都是50%，一点没有缩水。除了核心频率比GTX 980稍低，GTX TITAN X基本上就是1.5个GTX 980。至于上一代GTXTITAN BE，由于两者架构不同，没有办法直接对比，就CUDA单元数量来说，GTXTITAN X相比GTX TITAN BE的提升并不很多，但单个CUDA的效率不可同日而语。具体性能差距，有待后面的实际测试来见分晓。

　　另外，在本次GTX TITAN X发布时，NVIDIA再次强调了看重玩家实际使用感受的设计思路。所以我们在公版GTXTITAN X上，就看到了模压电感和极化电容等用料，以及0 噪音温控散热技术。以往，很多玩家使用高端显卡玩游戏时经常会遇到高频啸叫的问题，这是由于数字元件在高频工作下容易产生共振，导致刺耳噪音。GTX TITAN X选择使用模压电感和极化电容，一方面能依靠封装类型和设计优势，最大程度地避免这类共振，消除显卡持续高负载工作时的啸叫，提升玩家长时间游戏时的使用体验；同时，它们又能提供比普通电感、电容更强的供电能力，提高能耗比的同时，也能赋予GTX TITAN X更多冗余电量，以满足超频玩家的需求。即使不超频，也能让显示核心长时间稳定在较高的Boost频率上，提高整体性能表现。

　　至于0噪音温控散热，原理则和GTX 960上的一样，通过核心负载情况来调节核心频率，同时根据核心温度的变化来管理风扇转速。在低负载时，核心频率降低、发热减少，直至被动散热即可满足需求的时候，风扇就会完全停转，带给玩家真正的0噪音体验。

　　4K、VXGI、VR SLI

　　为4K而生的游戏硬件

　　硬件规格的大幅度提升，为GTX TITAN X带来了极强的图形计算性能，远远超过GTX 980等性能级显卡。在以往的测试中，GTX 980就已经展现出1080p下无人能挡的霸气，此时再强调GTX TITAN X在1080p下的游戏性能显然有些大材小用。所以我们看到NVIDIA为它搭配了12GB显存，让它成为第一块针对4K游戏优化的显卡。第一次从硬件上做好了满足4K超高清纹理贴图的准备。在这里不得不跟各位读者介绍一下当前4K游戏的一个普遍情况，因为硬件规格(主要指计算能力和显存容量)不达标，游戏开发商不得不降低4K分辨率下的纹理贴图精度，将纹理质量定格在1080p的水平。这样一来可以降低游戏开发难度，二来能够避免因显存容量不够或者计算性能不足导致的游戏帧率骤降的问题。NVIDIA则希望这种权宜之计，将随着GTX TITAN X的面世逐渐成为历史……

　　逐步成熟的VXGI

　　要想通过实时图形处理让图像达到以假乱真的效果，如何营造逼真的光线就是开发者面临的最大难题之一。在GTX 980发布的时候，NVIDIA就已经为我们详细展示了基于Maxwell架构的一个重要特性—VXGI全局光照技术。它一改此前实时图形渲染时，一贯采用的点光源直接照明模型，模拟出场景光照效果的直接光照和反射等间接光。以往这样的计算代价是非常高昂的，需要专业的图形计算服务器进行长时间渲染。而VXGI通过锥形发散模型，在尽量模拟真实的情况下降低了计算量，让游戏中实时计算漫反射、镜面光照、点光源等效果成为了可能。当时NVIDIA就展示了一张由VXGI技术渲染的阿波罗登月照片来和真实的历史照片对比，几乎可以达到以假乱真的水平。更重要的是，这项技术应用起来非常简单，能在提供更高逼真光线的同时，大幅度降低游戏开发难度和制作周期。但这项技术什么时候能融入到游戏中，当时并没有准确的消息。而现在随着GTX TITAN X的发布，VXGI也迈出了向游戏引擎部署的步伐，定制版的“虚幻4”引擎已经开始植入该项技术。预计年内，购入了GTX TITAN X、GTX 980等显卡的玩家，就能在一些新游戏中体验到该项新技术带来的逼真视觉效果。

　　加倍的虚拟现实体验—VR SLI

　　虚拟现实也是自Maxwell架构发布开始，一直被NVIDIA挂在嘴边的技术，每一个体验过VR Demo的人无不为之倾倒。但问题是想要虚拟现实游戏体验足够出色，就需要解决画面延迟和流畅度的问题。延迟高、流畅度低将难以提升游戏的代入感，甚至还会引起玩家出现恶心、呕吐症状。在GTX TITAN X上，NVIDIA除了再次强调特地为降低延迟而引入的“异步时间规整”技术外，还为我们带来了VR SLI技术。前者能借助更好的头部追踪算法，确保玩家察觉不到头部轻微晃动与画面渲染之间产生的延迟。后者则能够充分利用两颗GPU，让它们分别渲染虚拟现实头戴显示器中的两块屏幕，带来精度更高、帧率更流畅的画面。

　　问鼎没有悬念

　　从GTX TITAN X的CUDA数量、显存位宽、光栅和纹理等单元齐步并进的增长来推测，GTX TITAN X超越当前所有单卡成为新一代的单芯卡皇根本不存在悬念。测试的目的一是满足我们的好奇心，看看它在1080p下的表现究竟能有多惊艳；二是看看它是否真的能如NVIDIA希望的那样在4K分辨率上展现出王者风范。

　　没有悬念，在3DMark系列的基准测试中，GTX TITAN X以大幅度的领先优势，力压所有其他单芯型号，成为了新一代的单芯卡皇。从GPU得分看，GTX 980的性能仅约它的73%左右。相比上一代旗舰GTX TITAN BE，它更是有超过55%的明显提升。另外值得注意的是，它在Unigine Valley的测试中，已经展现出极高的游戏实战能力，其平均帧数达到91.5帧，仅比双芯旗舰R9 295X2的96.2帧低了不到5帧，约5%，比3DMark中的差距更低。而这种特性也进一步延续到了随后的实际游戏体验中。

　　实际上无论是NVIDIA的SLI多卡系统还是AMD的CrossFireX多卡系统，对软件优化的依赖程度都相当高，不少游戏中难以发挥出2颗核心应有的实力。在我们测试的6款游戏中，只有《地铁：最后的曙光》中GTX TITAN X不敌双芯的R9 295X2。其它游戏中，GTX TITAN X的表现都一反理论测试中的略微落后，变成了明显领先。双芯的R9 295X2尚且不是对手，其它单芯显卡更是没有悬念。包括上代旗舰GTX TITAN BE和对手的单芯旗舰R9 290X在内，基本都在游戏中落后GTX TITAN X 50%以上，差距相当明显。尤其值得一提的是《Far Cry 4》，在测试GTX 980时，我们就通过NVIDIA显卡独享的“NVIDIA”特效设置，抢先体验了精细的毛发渲染等次世代视觉效果。但“NVIDIA”设置对显卡要求极高，即使1080p分辨率下，GTX 980也只能勉强流畅，玩家必须在极致游戏性和最极致画质之间做出选择。现在GTX TITAN X借助强悍的规格优势，终于在“NVIDIA”设置下也能保证游戏最低帧不跌破60fps，全程“NVIDIA”设置流畅通关，也只有它才能这么任性。

　　4K仍需努力

　　坦白说，当前基本上没有真正能用到4K超高纹理的游戏。在NVIDIA的演示中，不少即将发售的新游戏用到了这种超高清纹理设计，显存占用量会轻松超过8GB。但在我们的测试中，用软件检测到当前游戏即使开启4K分辨率显存占用量也很少超过6GB，4GB显存的显卡可能难以驾驭，但对有12GB显存的GTX TITAN X来说，其显存使用率并不高。整体来说，GTX TITAN X无疑是当前4K分辨率下游戏表现最出色的显卡，多数时候都超过了双芯的R9 295X2。类似《古墓丽影9》这种中高硬件要求的游戏，GTX TITAN X也能在4K分辨率加顶级画质的设定下流畅运行，这意味着面对大多数游戏，它都能在4K超高清分辨率下提供出色的帧率。只是面对《Far Cry 4》、《Crysis 3》等对显卡要求极为变态的游戏时，它没办法在开启4K分辨率的时候，还能兼顾其他顶级特效。你需要适当降低特效，才能获得流畅的游戏体验。很显然，GTX TITAN X是当前最适合用来体验4K游戏的显卡，但绝非我们想象中那样，能霸气地流畅运行所有游戏。

　　来之不易的功耗表现？

　　Maxwell架构从GTX 750的GM108开始，就展现出了让人折服的能耗比优势，并一直延续到了GTX TITAN X上。在我们的测试中，它的游戏性能在大多数情况下都超过了GTX TITAN BE的1.5倍，但功耗却还比后者略低。更出彩的是，相比对手的单芯旗舰R9 290X，GTX TITAN X的性能接近翻倍，功耗依旧低10%。同样是28nm工艺，Maxwell究竟是如何实现能耗比跨越的？GTC大会上的讲解终于让我们了解到了一些关键因素—NVIDIA的设计思路从通用重返游戏市场。我们看到GTX TITAN X的单精度浮点运算性能达到7TFLOPS，但双精度浮点性能只有0.2TFLOPS，相差30多倍。GK104(GTX 770)核心双/单精度运算能力对比为1/24，基于GK110的GTX TITAN更是高达1/3。实际上GK110核心晶体管从GK104的35亿暴增到71亿，除了大量增加了CUDA单元，最大的消耗就是暴增的双精度浮点运算单元，也因此让双精度运算能力达到1.3TFLOPS的高度。这对有通用运算需求的专业用户大有裨益，但代价也非常明显，功耗、发热量明显增加的同时却不能带来更好的游戏性能。很显然，这对游戏玩家来说是不必要的支出，去掉这些对游戏性能没有太大裨益的双精度设计，玩家们应该高兴，我们能用同样的能耗，获得超过50%的游戏流畅度增幅；或者同样流畅地运行游戏，却只需要约原来65%的功耗。

　　MC点评：

　　坦白说，我们觉得当前的所有的GTX TITAN X评测都不够尽兴。在真正的VXGI游戏和虚拟现实游戏来到我们身边之前，我们还不能完全体验到Maxwell架构带给我们的真正乐趣。我们一直很期待Demo中展示的逼真光照和V R效果能快速普及到实际游戏中，届时GTX TITAN X才有展现“人无我有、人有我精”的最佳舞台。

　　就当前我们能够测试的内容来说，GT X TITAN X成为新一代单芯卡皇显然没有悬念。只是NVIDIA希望从GTX TITAN X开始，逐步实现超高清纹理的“真4K”游戏之旅看来还很漫长。在当前纹理质量难以真正达到4K水平的前提下，有些游戏已经榨干了显卡的计算资源。此时再将纹理质量提高到4K水平无疑会进一步降低游戏帧率，哪怕12GB的显存余量充裕，也难以保证良好的游戏体验。只是相对其它显存容量局限的产品来说，基于GTX TITAN X的多卡SLI系统终于有实力在顶级画质下挑战当下的4K游戏，而不再畏惧爆显存的危机了。

　　文/《微型计算机》评测室

……

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容