AMD下代显卡核心技术前瞻

来源:微型计算机
关键字:AMD,NVIDIA,显卡
发布时间:2014-06-17 12:40

　　近段时间NVIDIA在显卡市场可谓动作频频，抢先发布了新一代Maxwell架构，带来了能耗比超高的GTX 750系列显卡；后又陆续曝光了NVLINK、3D memory等下代顶级显卡独有的新技术。AMD显然也不会闲着，和NVIDIA从主流市场着手布局下代显卡的风格不同，AMD选择要玩就玩大的。前不久，AMD毫无征兆地就抛出了下代顶级显卡的主要技术规格，更让人兴奋的是，AMD承诺让玩家们在年内就看到它的身影…”

　　按照AMD此前的规划，R9290X相对HD 7970只是一个过渡升级产品。半导体工艺都为28nm，架构改动极小，仅从HD 7970的GCN-I.O升级到GCN-I.-I，DirectX支持能力也只从1 1.1版本小幅提高到1-1.2版本。抛开TrueAudio等一系列外围功能的演进，就显卡的计算能力来说R9 290X的架构变化并不大。只是R9 290X流处理器数量的增多最终确实带来了比HD 7970高出40%左右的游戏能力，这样的表现在玩家们看来可能不惊艳，但就升级换代任务来说，R9 290X已经圆满完成了。

　　而现在是时候对“过渡”说再见了，AMD下代旗舰很有可能在今年底就亚式与玩家们见面。据悉这次AMD依1日会坚持“岛屿群”的核心命名风格，下代产品都将隶属于“Pirate lslands”（海盗岛）家族。相对上一次架构和工艺都不变的升级，这次AMD至少承诺了架构换代，GCN将从现在的1．x版本正式升级到GCN2.0版本。至于工艺水平，到目前为止AMD和NVIDIA都没有宣布有关启用20nm工艺的消息。倒是NVIDIA方面，原本最应该用来实验新工艺水平的Maxwell新架构主流显卡GTX 750Ti/750系列依1日采用了28nm，这让大家遐想不断，难道坊间传闻NVIDIA会跳过20nm直奔16nm而去的消息是真的？就当前透露的AMD海盗岛发布日期来说，我们觉得AMD没法直接跳过20nm，也不太可能再使用28nm…--为何这么说？先看看“海盗岛”的规格再说。

　　首批曝光的AMD海盗岛主要有三颗核心，Bermuda XTX(百慕大)、Fiji XTX(斐济)和Treasu relsland XTX(宝藏岛)，应该分别对应R9 390X、R9 380X和R9 370X三个型号，用以取代现在的R9 290X、R9 280X和R9 270X。据悉，其中基于Bermuda XTX核心的R9390X将率先在今年1 1月左右发布，它将代表A M D下代显卡的最高技术水平和性能水平。从曝光的规格来看，R9 390X相对当前旗舰R9290X的提升显著，无论流处理单元还是ROP光栅单元的规模增长都超过了50%，其核心频率也将继续维持在约1000MHz的水平。假设AMD主体架构不变，在现有GCN架构的基础上还有所增强，那么其理论计算性能也将获得超过50%的增幅。为了满足计算性能爆炸式增长对数据带宽的需求，AMD再次启动了512bit的显存位宽设计，并且打算将显存频率拔高到7GHz的高度，换算下来显存带宽将达到惊人的448GB/s。

　　往下是R9 380X，应该是用于取代R9 280X显卡，核心为F…XTX。流处理器单元为3072个，纹理单元1 92个，ROP单元72个。从这个规格看，它其实已经超过了当莳的顶级型号R9 290X。再加上预计的斐济核心依1日会保持900MHz以上的核心频率和频率6GHz左右、位宽384bit的显存规格，这将赋予它超越当前顶级单心显卡的计算能力。不过R9 380X的上市日期会更晚，预计要到201 5年的时候才能与玩家见面。

　　还有就是R9 370X，核心为Treasure lsland XTX，拥有1536个流处理器单元，96个纹理单元，48个ROP单元，核心频率900MHz左右，显存频率5GHz左右，位宽256bit。

　　追求更高的计算性能一直是半

　　导体芯片的设计初衷，所以AM D让新一代显卡的计算单元暴增无可厚非。而协调存储、计算能力让它们基本平衡，也—直是让半导体芯片发挥出最佳性能的主要设计原则。因此，A M D为计算性能暴涨的“百慕大”配备夸张的高频率5- 2bit显存系统原本也无可厚非。只是这有可能会让一些玩家觉得这次的“海盗岛”和AMD继Radeon HD 2900XTX之后启用的‘卅＼核心”策略有些相悖。

　　了解显卡技术的玩家都知道，无论AMD还是NVIDIA的显示芯片，其主要代工厂都是TSMC(台积电)。而近年来显示芯片的半导体工艺提速已经不如以前那么快，物理极限的逼近让工艺捉升变得更加困难，良率也难以保证。实际上从201 1年底，TSMC(台积电)开始用28nm工艺为AMD代工Radeon HD 7970显示核心至今，TSMC的显卡芯片量产工艺依1日1亭留在28nm水平。在此期间，AMD的显示核心已经由Tahiti(HD7970)升级到了现在的Hawaii(R9290X)。值得注意的是，这两代显卡的基础架构都是GCN（前者为GCNI.O，后者为GCN-I_1）J所以基本上R9 290X相对HD 7970的改变就是增加更多晶体管，更多的计算单元和更大的显存控制器位宽。在工艺保持28nm不变的前提下，我们看到R9 290X的核心达到438mm2，比HD 7970的365mm2高出20%。分析晶体管数量，R9 290X拥有62亿，HD 7970仅43亿，前者比后者高出44%左右，远远超过芯片面积的提升比例。也就是说TSMC的28nm工艺虽未换代，但新设计加上工艺改良还是让芯片的晶体管密度获得了较大提升。这也最终让R9 290X能比HD 7970多出768个流处理器（提升幅度37 5%）和128bit显存位宽（提升幅度33.3%）。

　　然而从现在曝光的R9 390X看，其流处理器个数在R9 290X基础上提升1 408个，提升幅度50%，远高于R9 290X相对HD 7970的提升。其它诸如纹理单元、光栅单元也一并大幅增长。更重要的是，据悉以“百慕大”核心为代表的下代AMD显卡架构是大幅改良的GCN，改进幅度比HD 7970到R9 290X更大，预计会称为GCN2.0架构。但依1日基于GCN则基本意味着运算单元的框架设计不会有颠覆性改变，因此大致可以从R9 290X的规格推算出R9 390X的晶体管数量会增加50%甚至更多。也就是说“百慕大”核心的晶体管数量极有可能是1 00亿水平。就算制造工艺还能提供晶体管提升44%，芯片面积只提升20%的优秀水平，那R9 390X也很有可能会是个庞然大物，甚至可能达到600mm2或更高。

　　实际上，TSMC能在初代28nm工艺的基础上，将其逐渐完善，并在制造R9 290X时提供远超初代芯片密度的水平已经难能可贵。而这也基本意味着TSMC的28nm工艺已经成熟，很难再有进一步提升，顶多是让晶圆的瑕疵更少，良率更高。很显然，这样的工艺根本不可能用于海盗岛家族的制造，芯片大小和发热量将难以控制。要想保持晶体管密度的增长，只能依靠线密度更小酌新工艺，也许20nm会是AMD的最终选择。

　　据了解，其实台积电已经在201 3年7月的时候就已经使用了20nm工艺帮客户小批量试产芯片。到2013年底的时候，已经基本具备了量产能力。只是初期工艺都只面对一些晶体管数量相对较少，核心较小的产品，难以保证在面对如GPU这样对性能要求极高的大芯片时，还能保证足够的量产良率和半导体质量。当然，TSMC也不会闲着，其20nm晶圆厂从去年至今一直都处于安装新设备、更新工艺水平的升级中。计划2014年第一季度就能每月生产5万片晶圆，其中2万片可以在以后升级到16nm工艺。能向下代工艺过渡，也就意味着工艺成熟度接近极限，也即是说至少今年2季度起，TSMG的20nm工艺已经能够胜任高性能芯片的生产需求，只是说要想大规模量产估计还需要时间。而这也有可能是AM D计划在今年内只推出顶级R9 390X的一个重要原因，很可能代工厂TSMC的产能和良率难以满足“海盗岛”家族的全线来袭。

　　还有就是有关DirectX特性的问题，新一代显示核心都会搭配改良的DirectX技术，几乎成为业界不成文的规矩。这一次，不同于上两次DirectX技术的小修小补，从吲rectX1-I到DirectX l -1.1、DirectX -11.2的变化，而是又到了大幅更新换代的时节。微软已经在今年的GDC大会上正式发布了新一代的DirectX 12，在此之后才会发布的“海盗岛”没有理由不支持新一代API。实际上根据微软的介绍，DirectX12很特别，是个不太挑硬件的全新API。此前NVIDIA就确认除了新发布的基于Maxwell架构的GTX750系列显卡外，包括上代的开普勒甚至更上一代的费米架构都能提供对DirectX12的支持。也就是说从4、5年前的GeForce 200起，之后的显卡均能支持该特效。而AMD方面，也是从第一代G C N架构开始，就能提供对DirectX12的支持。当然，相比NVIDIA，AMD这次显得更加轻车熟路，因为DirectX12的最大特色——底层API优化可以说正是借鉴7AMD的Mantle API设计思路。

　　新的DirectX 12赋予了游戏开发者追踪GPU流水线、控制资源状态辖换、控制资源重命名的控制权，并通过减少API和驱动跟踪、显存控制权等手段提高底层执行效率，防止帧速陡降或者短暂挂起等问题。这种优化底部硬件与软件调度层的方式，和Mantle API极为类似。当然AMD无疑对自己的产品更加了解，优化程度更高但很难适用于其他GPU产品。而微软的优化显然要考虑到更广泛的兼容性，很难针对某一架构优化到最佳状态。但AMD新架构显卡显然能借此在更多不支持Mantle API的游戏中获得更好的表现。另外，DirectX 12针对多核CPU深度优化，基本能为多核处理器带来线性性能增长，这能有效改善游戏对处理器的利用效率，有助于新卡皇的性能发挥不再受制于处理器性能瓶颈。

　　虽说已经初步曝光了“海盗岛”中高端显示核心的主要规格，但难保AMD不会最终改变计划。就算规格参数完全按照当前曝光的设计，我们也只能从当前已知的GCN -1.1架构来大概推测R9 390X能获得比R9 290X高出约40-50%的性能。然而当前并没有更多关于GCN2.0架构的详细信息曝光，我们难以获得G CN2.0架构的准确特性，也就无法获知计算单元数量相等的情况下，GCN2.0相对GCN-I.1的性能增幅；也不可能知遒更多类似TrueAudio、曲面细分单元比等更详细的特性增删或者提升幅度。唯一可以肯定的是，AMD显然不会让新架构的效率比老产品更低，而且AMD特地准备的超高显存带宽也正是为了消除数据传输瓶颈，让核心的计算性能更好地发挥。倘若一切顺利，我们应该能看到新旗舰有超过老旗舰50%的性能水平，而新显卡的次旗舰，即R9 380X都能获得超越当前旗舰的实力。现在AMD已经布局完毕，很显然，NVIDIA也不会毫无准备。不知道已经在主流级市场试水成功的Maxwell新架构是否会有新的动作，NVIDIA难道不想将Maxwell出色的能耗比带入到顶级显卡领域？无论如何，今年下半年将上演的新一轮显卡王座之争都值得玩家们期待！

……

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容