Are you ready? 2016新年显卡性能需求初探

  • 来源:微型计算机
  • 关键字:显卡,性能
  • 发布时间:2016-04-28 11:03

  2016年无疑是值得玩家们期待的一年,我们不仅等到了DirectX图形API的全新升级,还有幸迎来了图形处理行业从传统的3D向VR转变的关键时期。这一次转变带来的体验升级,可能比2D到3D视觉转换带给我们的震撼更大。正如其名,VR图形技术实现了视觉上的“虚拟现实”,配合上配套的体感设备,将为我们带来真正的沉浸式游戏体验。只待制作精良的VR游戏上市,就将掀起新的流行浪潮。而在这之前,玩家们是不是也得着手准备一套性能足够畅玩DX12新游戏,甚至是VR游戏的平台呢?

  那么即将到来的VR游戏对硬件的要求究竟如何?

  我们又需要什么样的硬件平台才能畅玩新游戏呢?

  这就是本文探究的目的,希望借助测试工具和多平台实际游戏测试成绩,带给玩家们更多的攒机或升级参考。

  2016年新游戏都有哪些特征?

  在探究我们需要什么样的硬件前,我们必须要了解接下来将要发布的游戏究竟有些什么特征,才能具有针对性地展开性能需求探究。

  VR眼镜

  VR是未来游戏的趋势,其一大特征就是不再需要传统的显示器,而是通过虚拟现实眼镜来打造视觉上的沉浸感。严格来说,VR分为视觉和体感两大体验板块,但体感设备的开发自成体系,不需要PC或者主机的刻意辅助。玩家只需要关心其功能特性和参数数据,按需购买整套设备即可。所以对PC玩家来说,需要关心的只有VR视觉体验的部分了。

  虚拟现实是如何实现的?其实说简单点就是立体显示。和最早的3D电影一样,是让左右眼分别看到不同的画面,以模拟人眼实际观看实物时的视觉效果。但和电影只固定一个镜头方向不同,VR需要模拟的是360度全景视角,眼镜能捕捉你头部的转动,为每一个视角准备相应的立体图像。正因为模拟360度全景成像,所以VR能带来更真实的场景代入感。但也因为此,给我们的PC或主机带来了更繁重的图形渲染压力。因为我们的硬件不得不在每次头部转动时,实时渲染数倍,甚至几十倍于单一视角的帧画面。以满足转头这个“动画”过程足够流畅,延迟够低,不让用户产品眩晕等不适,让体验逼近真实。要想在固定视角的显示器上,实现“电影级”特效的流畅度尚且不容易,更何况随时在变换视角的VR眼镜?所以对PC平台的硬件来说,任务依旧还是以图形渲染为重点。而且同画面精度的情况下,对显卡性能的要求是当前的数倍。

  受限于当前技术和硬件发展状况,当前VR眼镜的单个显示画框肯定达不到当前游戏显示器普遍追求的2560×1440甚至是4K水平。在NVIDIA和AMD展示过的体验设备中,我们看到的分辨率通常是单眼960×1080,两眼合起来1920×1080的水平。而且单个镜片的大小通常不超过6英寸,可视角度都在100度左右。最大的区别可能主要来自延迟和刷新率,这两个参数直接影响流畅度,跟实际游戏体验息息相关。同时,这两个参数也是系统对图形处理性能要求高低的重要参考指标。通常要求延迟越低、刷新率越高时,对显卡的性能要求也就越高。当前实际上市的一线VR眼镜产品主要来自Oculus、HTC和索尼等,其中索尼的PlayStation VR又主要针对自家的PS4主机,所以对PC玩家来说,Oculus和HTC的产品更值得关注。

  Oculus是最早进入VR领域的厂商,我们已经在NVIDIA的多次技术展示中,看到过其早期的Oculus产品。现在经过几代发展,已经拥有了Oculus CV1、Oculus Rift DK1/DK2以及Oculus合作版的Gear VR等等。即将大规模上市的则是最新的Oculus Rift DK2,相比同类,它在分辨率等规格上并不占优,单眼仅960×1080。但据称其画面延迟优化得非常出色,低至2-3ms,相比延迟多在10几甚至几十毫秒的同类产品,这个成绩相当优秀,能有效提高体验质量,减少眩晕等不适症状。更重要的是,Oculus Rift DK2是款PC和主机通吃的产品,再加上FacebOOk的强力支持和开发层面的优势,其内容和体验性都值得期待。

  另一个代表则是当前相当火热的HTC Vive,有些玩家误认为标配体感运动套件是Vive热门且高价的原因。其实不然,Lighthouse房间追踪系统才是它在当前市场独树一帜的资本。Lighthouse使用激光技术为基础,能让用户在15英尺见方的空间内自由移动,并完美复制用户的动作到游戏中,能更好地实现从视觉到感觉上的各种虚拟现实。更重要的是,这个技术的支持者正是Steam平台,基于VaLve开发的Steam VR技术。这意味着HTCVive先天享有Steam平台的拥有众多游戏玩家和开发者资源,想不火热都难。另外,和市面上同类产品相比,HTC Vive的硬件规格也相对出色,单眼分辨率达到1200×1080,视野更宽敞。不过理论上分辨率越高,相应的它对显卡的性能要求也越高。

  DirectX 12

  坦白说,在VR的光环面前,可能很多玩家会觉得DirectX 12都会相形见绌。其实不然,可以说正是DirectX 12的到来,助力了VR的发展,或者说赋予了VR在图形上更逼真的效果。如我们之前所说,VR在同等画质和分辨率条件下,渲染压力是单一显示器的数倍。在之前的DirectX 11时代,游戏开发商为了画质,已经把对显卡的性能压榨到极致,即使是当前的旗舰显卡也没办法在4K等超高分辨率下流畅地运行游戏。在传统单一视角的显示器上尚且如此,那面对VR就更甚。所以我们看到当前VR眼镜设计商并没有为VR眼镜设计非常高的分辨率,而是基本停留在1080p水平,即使规格相对出众的HTC Vive的双眼合并分辨率也仅2400×1080,只比显示器常见的1080p分辨率略高。这显然有为显卡减压的考虑,但这还不够,还需要底层开发效率的提升来配合。事实上,基于DirectX11 API开发游戏时,硬件利用效率不高的问题,一直被不少开发者诟病。针对此,游戏开发业界也—直在想办法优化游戏软件,甚至是显卡厂商AMD都曾为此推出过对显卡底层利用率更高的Mantle API。都是希望提高游戏软件对硬件调用的效率,提高显卡计算性能的利用率,达到最大化硬件利用率,提高游戏流畅度的目的。如果说在传统单一显示器上,这种诉求还相对不那么紧迫的话,在游戏产业整体向VR过渡的时候,这样的需求就变得非常紧迫70好在DirectX 12如期而至,它借鉴了AMD Mantle API更亲近硬件底层的设计思路,能更充分地发挥出硬件平台的整体性能,在同样硬件平台下上,提供出更好的游戏画面和游戏流畅度,这非常契合未来VR渲染的发展需求。那么微软都赋予了DirectX 12什么关键特性,让它完成使命?在我们看来主要有两大特性和原生多GPU支持这一大辅助功能。

  关键特性1:多核心CPU高效率用

  DX12拥有更加出色的底层硬件直接调用效率,能充分发挥硬件的并发处理能力。更重要的是,这不仅仅针对显示核心,还包括在图形运算中,辅助显示核心的CPU效率优化。众所周知,在当前的图形渲染环境中,GPU依旧需要等待CPU为它处理图形接口方面的工作,包括渲染数据的调度和某些起始指令等等。在以往,API和处理器之间的协调并不顺畅,只有1到2个核心来处理相关工作。在图形运算量还未达到一定程度的时候,还不至于成为瓶颈。但在GPU经历了多次革新后的当下,来自处理器的瓶颈开始显现。所以微软希望通过多线程指令缓冲记录技术,赋予DX12更好地调用更多CPU核心同时工作的能力。这一来消除了显卡的外在瓶颈,二也是这意味着以后的游戏不再特别依赖CPU的单核心性能,而是核心越多的CPU产品,越能在未来的DX12游戏中充分发挥出并行处理优势,提高整体处理性能,消除显卡计算瓶颈。

  关键特性2:ACE异步着色技术

  允许异步着色是DX12的一个重要特性,它将复杂的串行负载分解为多个可以并行执行的简单负载,使得工作的并行度更高,减少GPU内处理单元的闲置率。借此能在同硬件平台下,挖掘出更强的硬件性能,为玩家提供更高级的画面特效。而且这种任务分拆机制,还非常适合虚拟现实渲染时的多重渲染应用环境。在以往的DX11上,同一个指令中可能会包含多个不同渲染任务,每个任务都可以能会用到使用GPU内不同模块的计算资源。但限于只有一条指令,多个渲染任务不得不串行计算,都得等待前续任务结束后才会被执行。与每个任务对应的计算资源也只有在自己的串行周期才会运作起来,其他时候只能闲置。但在具有ACE的硬件上,它们将在同一时间内被送往GPU中的不同功能模块,完成并行处理。实现单一指令多任务同时处理的效果,很显然比以往的显卡架构效率高出不少。

  按理说,对DX12和VR游戏有如此大帮助的技术,理应被纳入DX12硬件的标配。但遗憾的是,当前并非所有显示核心都能支持ACE。NVIDIA方面,包括旗舰GTX TITAN X在内,都没有与之匹配的硬件单元,而是依靠软件模拟实现对该功能的支持。类比于高清视频的硬件解码和软件解码,前者只需要处理器处于10%左右的低负载就能流畅播放高码率视频;而后者哪怕是顶级处理器满载,也未必能满足基本的流畅。也即是说不具备硬件ACE设计的显卡显然不会获得理想的DX12提速效果。与之相比,AMD未雨绸缪,早在HD 7000时代,就已经开始尝试在显卡中加入ACE硬件加速单元。只不过当时受限于各种因素,ACE硬件单元只在最顶级的HD 7970/7950上加入了2组,中低端则没有相应的配置。而后升级到R9 200时代后,AMD意识到ACE对未来显卡发展的重要性,进一步提高7AC E硬件单元的配比,在顶级的R9 290系列上设计了多达8组的ACE硬件模块。接下来R9 300系列传承了这种设计,待到进一步升级到当前的R9 Fury系列时,AMD更是进一步优化了单个ACE硬件单元的性能,在保持8组硬件ACE单元规模的同时,让显卡的整体并发处理能力进一步提高。总体来说,当前市面上只有包含HD7900、R9 290/390和R9 Fury系列在内的一些型号支持硬件ACE计算。至于ACE在实际DX12游戏中的表现究竟如何,是否能入理论分析一般明显提升显卡的计算效率,则还需要通过实际的游戏对比测试来检验。

  我们需要什么样的显卡才能畅玩新游戏?

  看完以上介绍,相信玩家们难免开始期待VR设备和DirectX 12游戏的到来,期待两者的结合能为我们带来更出色的游戏体验,甚至有了针对性的攒机或升级计划。那么问题来了:

  1、VR究竟需要多高的硬件性能,在双眼1920×1080-2400×1080这个分辨率区间内,它的性能需求究竟是当前同等分辨率显示的多少倍?

  2、DirectX 12究竟能在同环境下,将硬件利用率提高多少,新API对画质又有何帮助?

  3、当前的显卡在DirectX 12环境下,究竟能有怎样的性能发挥,能否良好支持未来的游戏(包括VR游戏)。

  针对这三个问题,我们觉得有必要针对目前市场上热卖的中、高、入门级个不同档次的显卡做比较全面的对比测试探究。

  DirectX 12有无硬件ACE起决定性作用!

  《奇点灰烬》是最早爆出基于DX12开发的游戏,其开发引擎Nitrous有微软加入设计,所以对DX12特性支持程度非常高。其初期爆出的Beta测试版本就已经能较好地利用硬件ACE提高游戏帧率,让AMD的R9系列显卡因此获益,获得了出色表现。但不少人质疑初期Beta版Benchmark有针对性优化,并不能代表实际游戏情况。现在我们终于迎来了不止是Benchmark,而是可以实际游戏的预览版本。再次测试发现,拥有硬件ACE设计的AMD显卡,依旧表现出了绝对优势。在DX12环境下,R9Fury X从1080p画质开始就一路领先GTX 980Ti,而且随着分辨了提升,领先幅度越来越大。在4K分辨率下,R9 Fury X的平均帧,已经高出了GTX 980T i近26%,差距相当明显。与之类似的情况在另外两组显卡中继续上演,同档次AMD显卡在任何分辨率下的表现都明显优于NVIDIA产品,而且领先幅度基本都超过了15%,个别情况甚至超过了25%。这是开发商Oxide有意优化了AMD显卡吗?

  请玩家们注意观察我们特意在同条件下加入的DX11模式成绩,你会发现同条件下,同档次的NVIDIA显卡在DX11中的表现竟然都比DX12模式更好,而且成绩很多时候都会超过AMD显卡,只有在4K这种超高分辨率下,AMD的R9 FuryX才有一些反击的实力。但从DX11切换到DX12之后,AMD显卡立即能借助ACE硬件单元等架构优势,获得约20%左右的大幅度性能提升。但NVIDIA显卡的成绩则基本上不升反降,一升一降之间,成就了A卡的大优势全面领先。很显然,这并非开发商的刻意优化,而是DX12特性使然,是AMD显卡架构更契合DX12设计需求而获得的优势。非要说优化,应该是微软在优化AMD,而非单单一个开发商。这意味着所有基于DX12开发游戏的开发商,在使用到ACE等高级特性时,都会在潜移默化中对拥有硬件ACE单元的AMD显卡架构更友好。

  倘若一款游戏还不能证明我们的推断,那么这三组显卡在最新的《杀手6》中的性能对比则再次验证了我们的观点。《杀手6》的开发商是Io Interactive,已经和《奇点灰烬》的开发商Oxide毫无关系。但在《杀手6》中的DX12模式下,三组显卡中的AMD显卡再次获得了压倒性的优势,全面超过同档次的NVIDIA产品。仔细对比,三组显卡在该游戏中DX11和DX12两种模式间转换时,出现了和《奇点灰烬》雷同的情况,AMD显卡获得了比较明显的性能提升,而NVIDIA显卡则不升反降。其中值得注意的是,虽说AMD的R9 380在同条件下DX11和DX12模式中都胜过了对位的GTX 960,但它也遇到了DX12模式相比DX11性能不升反降的情况。为何会如此?我们猜测这还是应该和ACE工作原理相关。在DX12下,游戏的渲染机制默认是支持ACE的,需要显卡在运算时,有效地拆分单一指令中的多项任务。尤其是游戏的图像复杂程度越高、渲染压力越大,对此要求就越高。相比《奇点灰烬》,《杀手6》的游戏渲染压力更高一些,对有充足ACE硬件单元的R9 Fury X和R9 390来说(它们都有8组硬件ACE),同一时间渲染压力越大,越能显示DX12的调度优势。而R9 380由于核心设计较早,ACE单元效率本就不及新产品,而且数量也只有2个,所以在高负载时,系统还是只有通过部分硬件ACE,部分软件模拟ACE的方式实现。而软件模拟ACE会带来额外开销,不仅无助于性能提升,反而可能因此影响整体计算能力。这就导致R9 380表现不如预期,也是NVIDIA显卡在DX12模式中普遍性能下降的原因。当然,问题也可能来自游戏开发商对硬件ACE的优化力度不到位,在硬件ACE单元较少的时候,难以发挥出理想效果。不过从整体来看,硬件ACE的效果是毋庸置疑的,帮助AMD显卡力王狂澜。未来的DX12环境游戏中,AMD产品的整体表现显然比DX11更值得期待。

  当然,因为开发商水平的不同,对API的认知和使用策略会有所差异。所以也绝非所有DX12游戏都能高效率运作,尤其是之前基于DX11 API研发,后期通过补丁方式支持DX12的游戏,甚至会出现性能负优化的情况。比如玩家们非常熟悉的《古墓丽影》系列最新作《古墓丽影:崛起》,发布时仅支持DX11,但在今年3月发布最新补丁后,宣称提供了对DX12的支持,所以我们还额外增加了对《古墓丽影:崛起》的性能测试。

  坦白说,《古墓丽影:崛起》的剧情和人物塑造是非常成功的,获得了不少玩家好评。就单纯的游戏性角度说,我们觉得它并不是十分必要更新到DX12,DX11提供的画质已经非常出色。但开发商可能想借DX12的火热,继续促进游戏的销售。只不过这种匆匆忙忙的升级在我们的测试中展现出来的结果并不好,非但没有明显的画质提升,还造成了优化游戏流畅度的负优化。

  首先还是来说说NVIDIA的显卡的表现,原本就没有硬件ACE的它们,在从DX11切换到DX12的时候,性能不升反降已经在我们的意料之内。但出乎意料的是,这次的性能降幅实在太大,一度让我们怀疑测试方式或者软件兼容性出现了问题。在反复尝试结果依旧后,我们接受了这个糟糕的结果。以GTX980Ti为例,1080p分辨率下能在顶级画质的《古墓丽影:崛起》@DX11中获得超过100帧的平均帧率,但在切换到DX12之后,它的平均帧率竟然跌到了60帧以内,降幅高达43%以上。随着分辨率的提高,同比DX11到DX12的降幅有所收窄,但也都超过了35%,属于非常惊人的负优化。要知道在之前的显卡硬件升级中,同定位显卡换代产品相对老显卡的提升也就40%~50%这个区间。好在接下来的GTX970和GTX 960测试时,并没有出现如此大降幅,平均负优化程度在10%左右。

  与之前测试中AMD能获得DX12增益不同,在《古墓丽影:崛起》中,AMD显卡从DX11到DX12的切换中,性能也出现了不升反降的情况。顶级组方面,R9 Fury X相比GTX 980Ti的大幅下滑来说相对好了不少,平均帧降幅在10%左右。在DX11模式下流畅度还是N卡更好,A卡依旧在DX12下表现相对出色。中端组的GTX 970和R9 390的情况有所不同,相比顶级卡它们在DX12下的帧率降幅并不大,而且无论DX11还是DX12,R9 390的表现都相对更好一些。再向下,GTX960和R9 380的表现在这游戏中更加接近,基本处于伯仲之间,A卡稍好。不过这个档次的显卡只能在1080p分辨下提供高特效的流畅画面,再提高分辨了就只有降低特效以满足流畅了。

  我们不敢肯定所有以升级方式支持DX12的游戏都会出现这种有悖初衷的情况,倘若都如此,还是建议大家老老实实使用DX11模式吧,1080p分辨率下,GTX 960和R9 380就足以畅玩,没必要为了针对此种升级方式

  VR初体验:初代VR游戏拦不住当前的高端卡

  在此之前,我们没有一款量化测试的工具,也没有谁做过比较可靠的性能模拟VR游戏。只能推断当前游戏测试中表现较好的高端显卡,应该也能在VR中有出色表现。现在基于Steam平台的SteamVRPerformance Test测试软件正式上线,我们总算有了一款可以量化性能的工具。鉴于Steam平台和HTC Vive的紧密合作,相信这个测试针对当前的VR硬件应该具有较强的实际指导意义。当然,除了这个简单的Benchmark,我们还打算根据理论分析一下未来高画质VR游戏的性能需求。

  在测试之中,我们就发现了一个问题,这款测试软件内置的VR图形渲染API应该依旧基于DX11编写。因为这个软件并没有内置的混合GPU模式,而《奇点灰烬》等原生基于DX12开发的游戏就会有,这就是我们此前说过的DX12对VR的一大辅助。因为VR的现实基于两块单独的镜片,显示的也是不同的画面。此时各用一块显卡渲染一个镜片的内容就像的相得益彰,既能满足高帧数的需求,又能避免以往多卡模式下需要调和两块显卡达到协调显示同一画面的麻烦。也以为此,AMD和NVIDIA都有特意推出为VR准备的多GPU并联模式,不过就灵活性来说,自然是DX12原生的多GPU更灵活,还不挑显卡,A卡和N卡都可以自由组合。好了话收回了,既然这个测试程序基于DX11编写,那么AMD的硬件ACE应该发挥不出应有性能。

  测试结果有些出乎我们的预料,AMD显卡在同定位产品并非完全落败于NVIDIA。高端组上,GTX980Ti获得了9.7分的综合评分,而R9 Fury X的9.6分仅落后了0.1。而中端的R9 390却以7.5分的综合性能,明显强过GTX 970的7分。入门的R9 380和GTX 960的表现都不算好,但R9 380的5.5分也还是明显优于GTX 960的5_2分。

  这里需要注意的是,这个测试程序的测试环境和HTC Vive的硬件设置值一致的,总分辨率应该是2400×1080。在综合评分中超过9分的GTX 980Ti和R9 Fury X都能提供整体超过90帧的流畅画面(最低帧90以上),这意味着转头延迟的能被有效控制在个位数的毫秒水平,基本是完美的VR体验。前面我们已经说过,在初代VR眼镜中,Vive已经是高硬件水平,所以初代VR游戏的开发不会超过这个设定。那么接下来最先和我们见面的VR游戏应该难不倒当前的高端显卡。至于R9 390和GTX 970,在对画面精细程度要求不高的情况下,也应该能满足体验VR游戏的需求,再往下的显卡则显然很难满足VR对图形渲染流畅的高要求了。

  MC点评:

  测试到此,相信玩家们应该对今年下半年,即将上市的一干DX12或VR游戏有了一定认知,对攒机或升级的选择应该更加清晰明了了。那些已经购入顶级显卡的玩家大可泰然处之,安心等待新游戏的上市,至少近期上市的新游戏对你的硬件还构不成威胁。等到新游戏开发到更高性能需求的时候,相信新一代旗舰显卡已经上市,到时再考虑换卡的问题也不迟。但对当前拥有的是GTX 970性能水平显卡的玩家来说,可能会比较纠结。NVIDIA显卡玩家面对DX12游戏,你很可能品尝到性能负优化的滋味。1080p分辨率应该还能应对,但想搭配超高清的显示器,显然压力不小。另外,要是此后上市的VR游戏基于DXl2开发,那么GTX 970在VR游戏中的表现很可能比我们测试和预测的更糟糕,升级显卡几乎势在必行。与之相比,同档次的R9 390显卡用户可能会好一些,至少DXl2带来的是正向优化。只是想要体验不仅真实、还要足够精细的VR游戏的话,组建CrossFireX应该是个更好的选择,单卡的体验可能不能满足你的高需求。至于当前显卡性能还达不到GTX 970或R9 390水平的用户,我们觉得是时候升级了。为了更契合DXl2的需求,我们觉得首选具备硬件ACE单元的显卡为佳。在新产品上市之前,目前只有AMD的R9系列的部分产品值得入手,首推的自然是最新的R9 Fury系列,实在是预算有限,一张高性价比的R9390也是不错的选择。至于接下来两家可能会在下半年发布的新显卡,我们觉得应该都会具备硬件ACE设计,否则在未来的游戏战争中无疑会非常吃亏。

  文/王锴

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: