AMD下代显卡核心技术前瞻
- 来源:微型计算机 smarty:if $article.tag?>
- 关键字:AMD,NVIDIA,显卡 smarty:/if?>
- 发布时间:2014-06-17 12:40
近段时间NVIDIA在显卡市场可谓动作频频,抢先发布了新一代Maxwell架构,带来了能耗比超高的GTX 750系列显卡;后又陆续曝光了NVLINK、3D memory等下代顶级显卡独有的新技术。AMD显然也不会闲着,和NVIDIA从主流市场着手布局下代显卡的风格不同,AMD选择要玩就玩大的。前不久,AMD毫无征兆地就抛出了下代顶级显卡的主要技术规格,更让人兴奋的是,AMD承诺让玩家们在年内就看到它的身影…”
按照AMD此前的规划,R9290X相对HD 7970只是一个过渡升级产品。半导体工艺都为28nm,架构改动极小,仅从HD 7970的GCN-I.O升级到GCN-I.-I,DirectX支持能力也只从1 1.1版本小幅提高到1-1.2版本。抛开TrueAudio等一系列外围功能的演进,就显卡的计算能力来说R9 290X的架构变化并不大。只是R9 290X流处理器数量的增多最终确实带来了比HD 7970高出40%左右的游戏能力,这样的表现在玩家们看来可能不惊艳,但就升级换代任务来说,R9 290X已经圆满完成了。
而现在是时候对“过渡”说再见了,AMD下代旗舰很有可能在今年底就亚式与玩家们见面。据悉这次AMD依1日会坚持“岛屿群”的核心命名风格,下代产品都将隶属于“Pirate lslands”(海盗岛)家族。相对上一次架构和工艺都不变的升级,这次AMD至少承诺了架构换代,GCN将从现在的1.x版本正式升级到GCN2.0版本。至于工艺水平,到目前为止AMD和NVIDIA都没有宣布有关启用20nm工艺的消息。倒是NVIDIA方面,原本最应该用来实验新工艺水平的Maxwell新架构主流显卡GTX 750Ti/750系列依1日采用了28nm,这让大家遐想不断,难道坊间传闻NVIDIA会跳过20nm直奔16nm而去的消息是真的?就当前透露的AMD海盗岛发布日期来说,我们觉得AMD没法直接跳过20nm,也不太可能再使用28nm…--为何这么说?先看看“海盗岛”的规格再说。
首批曝光的AMD海盗岛主要有三颗核心,Bermuda XTX(百慕大)、Fiji XTX(斐济)和Treasu relsland XTX(宝藏岛),应该分别对应R9 390X、R9 380X和R9 370X三个型号,用以取代现在的R9 290X、R9 280X和R9 270X。据悉,其中基于Bermuda XTX核心的R9390X将率先在今年1 1月左右发布,它将代表A M D下代显卡的最高技术水平和性能水平。从曝光的规格来看,R9 390X相对当前旗舰R9290X的提升显著,无论流处理单元还是ROP光栅单元的规模增长都超过了50%,其核心频率也将继续维持在约1000MHz的水平。假设AMD主体架构不变,在现有GCN架构的基础上还有所增强,那么其理论计算性能也将获得超过50%的增幅。为了满足计算性能爆炸式增长对数据带宽的需求,AMD再次启动了512bit的显存位宽设计,并且打算将显存频率拔高到7GHz的高度,换算下来显存带宽将达到惊人的448GB/s。
往下是R9 380X,应该是用于取代R9 280X显卡,核心为F…XTX。流处理器单元为3072个,纹理单元1 92个,ROP单元72个。从这个规格看,它其实已经超过了当莳的顶级型号R9 290X。再加上预计的斐济核心依1日会保持900MHz以上的核心频率和频率6GHz左右、位宽384bit的显存规格,这将赋予它超越当前顶级单心显卡的计算能力。不过R9 380X的上市日期会更晚,预计要到201 5年的时候才能与玩家见面。
还有就是R9 370X,核心为Treasure lsland XTX,拥有1536个流处理器单元,96个纹理单元,48个ROP单元,核心频率900MHz左右,显存频率5GHz左右,位宽256bit。
追求更高的计算性能一直是半
导体芯片的设计初衷,所以AM D让新一代显卡的计算单元暴增无可厚非。而协调存储、计算能力让它们基本平衡,也—直是让半导体芯片发挥出最佳性能的主要设计原则。因此,A M D为计算性能暴涨的“百慕大”配备夸张的高频率5- 2bit显存系统原本也无可厚非。只是这有可能会让一些玩家觉得这次的“海盗岛”和AMD继Radeon HD 2900XTX之后启用的‘卅\核心”策略有些相悖。
了解显卡技术的玩家都知道,无论AMD还是NVIDIA的显示芯片,其主要代工厂都是TSMC(台积电)。而近年来显示芯片的半导体工艺提速已经不如以前那么快,物理极限的逼近让工艺捉升变得更加困难,良率也难以保证。实际上从201 1年底,TSMC(台积电)开始用28nm工艺为AMD代工Radeon HD 7970显示核心至今,TSMC的显卡芯片量产工艺依1日1亭留在28nm水平。在此期间,AMD的显示核心已经由Tahiti(HD7970)升级到了现在的Hawaii(R9290X)。值得注意的是,这两代显卡的基础架构都是GCN(前者为GCNI.O,后者为GCN-I_1)J所以基本上R9 290X相对HD 7970的改变就是增加更多晶体管,更多的计算单元和更大的显存控制器位宽。在工艺保持28nm不变的前提下,我们看到R9 290X的核心达到438mm2,比HD 7970的365mm2高出20%。分析晶体管数量,R9 290X拥有62亿,HD 7970仅43亿,前者比后者高出44%左右,远远超过芯片面积的提升比例。也就是说TSMC的28nm工艺虽未换代,但新设计加上工艺改良还是让芯片的晶体管密度获得了较大提升。这也最终让R9 290X能比HD 7970多出768个流处理器(提升幅度37 5%)和128bit显存位宽(提升幅度33.3%)。
然而从现在曝光的R9 390X看,其流处理器个数在R9 290X基础上提升1 408个,提升幅度50%,远高于R9 290X相对HD 7970的提升。其它诸如纹理单元、光栅单元也一并大幅增长。更重要的是,据悉以“百慕大”核心为代表的下代AMD显卡架构是大幅改良的GCN,改进幅度比HD 7970到R9 290X更大,预计会称为GCN2.0架构。但依1日基于GCN则基本意味着运算单元的框架设计不会有颠覆性改变,因此大致可以从R9 290X的规格推算出R9 390X的晶体管数量会增加50%甚至更多。也就是说“百慕大”核心的晶体管数量极有可能是1 00亿水平。就算制造工艺还能提供晶体管提升44%,芯片面积只提升20%的优秀水平,那R9 390X也很有可能会是个庞然大物,甚至可能达到600mm2或更高。
实际上,TSMC能在初代28nm工艺的基础上,将其逐渐完善,并在制造R9 290X时提供远超初代芯片密度的水平已经难能可贵。而这也基本意味着TSMC的28nm工艺已经成熟,很难再有进一步提升,顶多是让晶圆的瑕疵更少,良率更高。很显然,这样的工艺根本不可能用于海盗岛家族的制造,芯片大小和发热量将难以控制。要想保持晶体管密度的增长,只能依靠线密度更小酌新工艺,也许20nm会是AMD的最终选择。
据了解,其实台积电已经在201 3年7月的时候就已经使用了20nm工艺帮客户小批量试产芯片。到2013年底的时候,已经基本具备了量产能力。只是初期工艺都只面对一些晶体管数量相对较少,核心较小的产品,难以保证在面对如GPU这样对性能要求极高的大芯片时,还能保证足够的量产良率和半导体质量。当然,TSMC也不会闲着,其20nm晶圆厂从去年至今一直都处于安装新设备、更新工艺水平的升级中。计划2014年第一季度就能每月生产5万片晶圆,其中2万片可以在以后升级到16nm工艺。能向下代工艺过渡,也就意味着工艺成熟度接近极限,也即是说至少今年2季度起,TSMG的20nm工艺已经能够胜任高性能芯片的生产需求,只是说要想大规模量产估计还需要时间。而这也有可能是AM D计划在今年内只推出顶级R9 390X的一个重要原因,很可能代工厂TSMC的产能和良率难以满足“海盗岛”家族的全线来袭。
还有就是有关DirectX特性的问题,新一代显示核心都会搭配改良的DirectX技术,几乎成为业界不成文的规矩。这一次,不同于上两次DirectX技术的小修小补,从吲rectX1-I到DirectX l -1.1、DirectX -11.2的变化,而是又到了大幅更新换代的时节。微软已经在今年的GDC大会上正式发布了新一代的DirectX 12,在此之后才会发布的“海盗岛”没有理由不支持新一代API。实际上根据微软的介绍,DirectX12很特别,是个不太挑硬件的全新API。此前NVIDIA就确认除了新发布的基于Maxwell架构的GTX750系列显卡外,包括上代的开普勒甚至更上一代的费米架构都能提供对DirectX12的支持。也就是说从4、5年前的GeForce 200起,之后的显卡均能支持该特效。而AMD方面,也是从第一代G C N架构开始,就能提供对DirectX12的支持。当然,相比NVIDIA,AMD这次显得更加轻车熟路,因为DirectX12的最大特色——底层API优化可以说正是借鉴7AMD的Mantle API设计思路。
新的DirectX 12赋予了游戏开发者追踪GPU流水线、控制资源状态辖换、控制资源重命名的控制权,并通过减少API和驱动跟踪、显存控制权等手段提高底层执行效率,防止帧速陡降或者短暂挂起等问题。这种优化底部硬件与软件调度层的方式,和Mantle API极为类似。当然AMD无疑对自己的产品更加了解,优化程度更高但很难适用于其他GPU产品。而微软的优化显然要考虑到更广泛的兼容性,很难针对某一架构优化到最佳状态。但AMD新架构显卡显然能借此在更多不支持Mantle API的游戏中获得更好的表现。另外,DirectX 12针对多核CPU深度优化,基本能为多核处理器带来线性性能增长,这能有效改善游戏对处理器的利用效率,有助于新卡皇的性能发挥不再受制于处理器性能瓶颈。
虽说已经初步曝光了“海盗岛”中高端显示核心的主要规格,但难保AMD不会最终改变计划。就算规格参数完全按照当前曝光的设计,我们也只能从当前已知的GCN -1.1架构来大概推测R9 390X能获得比R9 290X高出约40-50%的性能。然而当前并没有更多关于GCN2.0架构的详细信息曝光,我们难以获得G CN2.0架构的准确特性,也就无法获知计算单元数量相等的情况下,GCN2.0相对GCN-I.1的性能增幅;也不可能知遒更多类似TrueAudio、曲面细分单元比等更详细的特性增删或者提升幅度。唯一可以肯定的是,AMD显然不会让新架构的效率比老产品更低,而且AMD特地准备的超高显存带宽也正是为了消除数据传输瓶颈,让核心的计算性能更好地发挥。倘若一切顺利,我们应该能看到新旗舰有超过老旗舰50%的性能水平,而新显卡的次旗舰,即R9 380X都能获得超越当前旗舰的实力。现在AMD已经布局完毕,很显然,NVIDIA也不会毫无准备。不知道已经在主流级市场试水成功的Maxwell新架构是否会有新的动作,NVIDIA难道不想将Maxwell出色的能耗比带入到顶级显卡领域?无论如何,今年下半年将上演的新一轮显卡王座之争都值得玩家们期待!