夏威夷来了!

  • 来源:微型计算机
  • 关键字:AMD,夏威夷
  • 发布时间:2013-11-07 09:34

  AMD在2011年末发布了GCN架构后,就一直在GCN架构下布局新品并进行相关的市场操作。转眼间已经过去了一年多接近两年时间,GCN架构还活跃在显卡舞台上。在这段时间内,由于晶体管工艺发展速度减缓,20nm工艺迟迟无法投入大规模商业化,因此无论是AMD还是NVIDIA都没有彻底革新架构,而是基于目前的28nm架构进行改进并推出新品。但就在此时传出了AMD即将发布新的Radeon R9、R7 200系列新品——该系列显卡究竟有何特点?这是AMD从里(架构)到外(命名)的—次显卡革命吗?

  AMD在合并了ATI后,CPU业务和GPU业务独立并行开展了很长一段时间。随后AMD推出了APU,并彻底改革了旗下CPU和APU的命名。比如CPU就直接命名为AMD FX系列,APU则是AMD A系列,然后再在下一层级分出不同的产品型号来——比如APU分出了A8、A6、A4等不同档次。这样的产品分类方法可以很清晰地为消费者展示不同产品的性能,便于更好地进行产品档次的划分。在APU和CPU的名称更改后,一些行业人士就分析认为AMD会继续将全新的产品命名方式更替到Radeon系列显卡上,甚至直接命名为AMD R糸列显卡。在新的Radeon R系列显卡公布后,大家看到AMD并没有这样做,它依1日保留了Radeon这一金字招牌。

  早在Radeon HD 2000系列发布的时候,AMD为了强调显卡在高清视频上的优势,在Radeon后面加上了“HD”这样的代号,而且一用就是六代,直到上代RadeonHD 7000系列。相比NVIDIA近年来多变的命名方式而言,AMD显卡的名称和型号的传承比较有序,改动不大。

  在APU和CPU都使用了更为简单的型号,特别是当Athlon开始减少新品、Phenom很久不出新品以后,很多人都以为Radeon也“离死不远—了。实际上考虑到AMD在CPU市场的相对弱势和在GPU市场的相对强势,保留一个经典的、有意义、被消费者熟知的产品商标也是很正确的做法。况且如果直接叫AMD R系列,很容易和CPU以及APU混淆。在这样的情况下,Radeon R系列的命名就横空出世了。

  AMD官方对Radeon显卡命名的原则和APU基本一样。Radeon显卡的名称按照下列公式进行:

  商标(Radeon)+代号(R)+产品定位(从9到7甚至更低)+三位数字(第一位表示产品代次、第二位和第三位表示版本细分)

  比如Radeon R9 280X是表示AMD Radeon R显卡面向顶级玩家的9系列,是第二代产品,具体型号为80,X是更为强调性能的Extreme的缩写。此外,三位型号数字在同一代显卡中,数字越小,性能越低。比如Radeon R7 260X,就是面向中端用户的7系列,同为第二代产品,型号为60X。60X是小于80X的,因此1生能更低。

  AMD在更新了显卡命名方式后,相比之前的“商标名称+H D+凹位数字型号”的方式,更为鲜明地突出了产品面向的用户群体,比如R9、R7的划分,这对玩家的选购有一定帮助。而其他的命名改革方面,相比之前的四位数模式,则没有太大实际意义上的进步。相比AMD的老竞争对手NVIDIA长期以来反复更改、较为混乱的命名方式而言,AMD显卡命名方式一贯都更为简单清晰,继承性也非常优秀。NVIDIA这边,GTX、GTS、GT、G等复杂型号先不说,光是显卡后缀比如SE、Ti、标准版等,就对消费者的选购产生了很大的困惑。在看了AMD的命名方式后,lIVIDIA会不会有所反思呢?

  本次AMD发布了代号为Tah…的Radeon R9 280X、代号为Curacao的Radeon R9 270X(实际上和Radeon HD 7870的Pitcairn是完全相同的核心)和代号为Bonaire的Radeon R7 260X(实际上是以前只出现在OEM市场的Radeon HD 7790)三款显卡。截至发稿时,代号为Hawaii的Radeon R9 290X、RadeonR9 290尚在最后酝酿中。而AMD还会有一款代号为Oland Pro的Radeon R7 240,面向入门级市场,目前还没有太多明确的消息。

  茌AMD这次新发布的显卡中,只有Radeon R9 290X和RadeonR9 290采用的是代号为Hawaii的全新核心。Radeon R7 260X也应该算是新核心,因为毕竟这款核心之前没有在非OEM市场上销售过。而按照一些玩家的说法,RadeonR9 280X和Radeon R9 270X就属于“马甲卡”了。因此接下来,本文将重点对以Radeon R9 290X为代表的Hawaii产品进行解读,来看看AMD这款新的大杀器究竟有何特点?

  AMD从Radeon HD 2000系列之后,就很少涉足400平方毫米以上的大芯片了。大芯片的制造不但需要强大的设计能力,也需要在大体积芯片制造上有丰富的经验和积累。AMD非常接近400平方毫米芯片面积的产品是在RadeonHD 6970上,这颗芯片面积大约为389平方毫米,随后的Radeon HD7970又缩减至352平方毫米。这次在Hawaii上,AMD终于突破了400平方毫米的底线,制造了一颗436平方毫米的芯片。

  AMD从Radeon HD 3800系列开始的小核心战略,其目的主要是将产品重点放在销量最大、影响消费者最多的“甜点”级别的产品上,不再考虑研发和生产高性能大规模的棱心。当时AMD做出这样决策的原因主要是上代大核心的Radeon HD 2900XT市场表现一般,再加上研发和财务状况都不是很好,如果一味和对手拼大核心,在产品发展和换代速度上很难有太好的表现,毕竟大核心的制造难度是很大的。于是,随后的AMD着力于小核心策略,顶级性能就留给由两颗小核心带来的双芯产品完成。

  小核心策略在初期使用时,的确获得了不错的效果,无论是AMD的Radeon HD 3800系列还是随后大获全胜的Radeon HD 4800系列都取得了不错的市场表现。并且由于小核心策略的存在,AMD可以更快速地研发产品。所以在DirectX 11新品首发上,AMD的Radeon HD 5800系列领先“顽固”坚持在大核心上的NVIDIA长达半年多。这使得AMD充分看到了小核心的优势。

  但小核心的一些劣势在长期的发展中也暴露了出来。目前决定图形芯片性能的重要因素还是晶体管的数量,小核心就意味着无法使用更多的晶体管达到更高的性能。虽然合理地掌握边际效应(这个效应描述的是芯片在现有的工艺条件下,只要超过某个极限值后,增加晶体管带来的性能增加就会变得不太明显,唯有更换更新的架构来解决)的“边际”,能够以巧取胜——AM D的小核心在恰当调配频率、规模和功耗的情况下,可以在性能上逼近规模更大、晶体管数量更多的大核心。可一旦火候把握不好,很容易出现绝对性能和对手差距变大的问题。即使后期再使用双芯卡做补救——小核心策略的基础在于财方的大核心很难制造高性能的双芯产品,但并不意味着对方不会通过精简庞大的架构来获得一个性能也同样优秀的Sweet spot(或者干脆降低电压频率和功耗“硬上”大核心双芯)。因此,在Radeon HD5870、HD 6970时代,NVIDIA可以凭借GeForce GTX 580轻松夺取性能王冠,双芯卡皇HD 6990也有同为双芯的GTX 590的压制(虽然GTX 590功耗和性能表现都不算最好)。这种劣势在本代Radeon HD 7970上就表现得更为明显了,G K104这样的中端核心压制住了AMD的产品后,大核心G Kl-IO竟然卖出了999美元的天价!这是AMD小核心策略发展到后期后,NVIDIA的针对性竞争手段。

  此外,在小核心限制了晶体管的使用后,很多创新架构往往会束手束脚。由于小核心策略常常需要先发制人,AMD没有太多时间沉浸到架构研究中,因此从Radeon HD 3800到HD 6800,AMD甚至都没有彻底更改过显卡架构。在这段时间中,NVIDIA将自身架构中的GPC、SM等部件全部更新了一遍,在GPU通用计算市场也彻底站稳了脚跟。而这个时候,AMD的Tahiti才刚刚开始组建“真正意义上”的GPGPU粱构。即使就在上一代产品中,AMD如果能将Tah…的芯片面积放大到450平方毫米左右的话,那么G KllO就不会天价登场,轻松占据卡皇王座。

  世界上没有两全其美的事情,小核心在市场上的优势,又是以部分隐含的、长期的劣势换来的。AMD现在开始挑战400平方毫米以上的大核心产品,是亡羊补牢,还是为时已晚,我们拭目以待。

  截至本文结束时,AMD尚未彻底公开Hawaii的所有信息。根据部分泄露的资料以及AMD官方消息来看,Hawaii核心拥有281 6个流处理单元(一共44组CU核心,每个CU核心有64个流处理单元),基准核心频率为800MHz,Boost频率为1GHz,实际运行时GPU频率会自动根据负载在800MHz-1GHz之间跳动。显存方面,Hawaii配备了4GB GDDR5显存,显存位宽达到了512bit,显存频率却下降到了5.OGbps,显存总带宽达到了320G B/s,超越了GTX Titan的288G B/s。这也是时隔五代后,AMD再次启用512bit显存位宽(上一次是在表现不佳的Radeon HD2900XT上)。随着显存位宽增加的还有后端ROP单元,AMD史无前例地给出了64个ROP单元,比GTX Titan的48个还要多1 6个。供电方面需要一个6pin接口和一个8pin接口。API支持方面支持最新的DirectXl-1.2、OpenGL 4.3和AMD自家的Mantle API。

  其他一些信息方面,根据AMD的官方数据,Hawaii的几何性能是Tah…的1.9倍,从之前的21亿基元/秒提升到4亿基元,秒;单精度计算能力从Ta hiti的4.3TFlops提升到5.6TFlops,是之前产品的1.3倍;纹理填充能力从-134.4G/s提升至-176G/s,也提升了1.3倍(这两个1.3倍基本和芯片规模的提升幅度相仿);核心面积从之前的352平方毫米提升了-1.24倍至438平方毫米。每平方毫米的峰值计算能力从Tah…的12.2GFlops/平方毫米提升至12.8G Flops/平方毫米,大约为1.05倍。

  从这些信息来看,AMD在Hawaii上并没有取得突破性的进展。比较典型的数据是每平方毫米峰值计算能力,它只提升至原来的1.05倍。这样的提升幅度足够应付目前市场情况,但也意味着AMD对GCN架构没有继续做大的改进。在性能方面,由于架构没什么大的改进,通过规模的增加就可以大致估计出来了。Hawaii的性能大概是之前Tah iti性能的130%左右,考虑到ROP单元的增多,可能在抗锯齿方面Hawaii会有相当优秀的表现。

  目前Tah…的1生能(RadeonHD 7970GHz)相比GTX Titan大约是后者的70%-75%,如果Hawaii的性能能达到Tah…的130%的话,和GTX Titan基奉旗鼓相当还是很容易的。目前在部分曝料的成绩中,Hawaii的性能至少能超越GTX 780,部分能达到GTX Titan的水平而部分无法彻底超越。看来NVIDIA需要准备一些新东西来巩固自己的王座了,是提升GTX Titan的频率,还是干脆使用完整版本、2880个流处理器的GKI-IO呢?

  AMD给用户的印象往往是硬件设计很不错,但是软件总是有点小缺憾。比如对游戏的支持、对开发人员的支持。不过从今年开始,AMD大幅度加强了对游戏的支持力度,有越来越多的游戏加入到AMD“Gaming Evolved”计划中来,特别是一些游戏大作开始捆绑和推荐AMD显卡。那么除了游戏外,A M D还给开发人员带来了什么福利呢?在Hawaii发布之前,AMD在GPU14大会上宣布了名为“Mantle”的新技术。“Mantle”翻译过来就是“地幔”,这是AMD为自家关乎底层硬件的API起的名称。AMD希望借助于Mantle,提升游戏等应用对GPU硬件的利用程度,从而提升游戏在自家GPU上的表现。

  根据AMD的说法,Mantle可以帮助AMD的GPU减少很多无谓的损失和浪费。AMD认为目前的API比如DirectX和OpenGL.由于其通用性和兼容性,对AMD GPU的一些特性支持不是很到位,这样相当于会损失部分GPU性能。而Mantle则是AMD自家开发的API,直接挂接底层硬件,能够最充分地发挥AMD GPU的硬件性能。根据AMD示意图,以GCN显卡为例,GCN硬件之上直接就是Mantle驱动,再向上是Mantle API,然后就是应用程序了。AMD宣称Mantle可以大幅度减少由CPU导致的GPU性能损失,带来最高9倍的性能增幅。 AM D目前公布的Mantle的内容不是很多,单就目前的资料来看,AMD Mantle更像是一个API的雏形,至少是可以直接沟通应用程序和硬件的层。而这项工作之前是由微软的DirectX来完成的,AMD做出这样一个全新的“类API”来,可以获得两种优势:一种是相对于NVIDIA产品,AMD的产品特色更丰富,并且借助于Mantle的支持,使用A M D显卡的玩家能够获得不一样的游戏体验;另一种则是相对于DirectX,拥有了Mantle的AMD在劝说游戏厂商开发新特效、使用AMD显卡时,在技术层面更为有优势,毕竟AMD能拿出一整套解决方案来。

  当然,AM D这样做也存在一些隐患。Mantle的排他性注定了这项技术一出生就会引发巨大争议,厂商是否愿意免费采用并为AMD优化呢?(最近的消息是AMD付出了800万美元给《战地4》开放商,促使后者采用Mantle技术)而且根据AMD的描述,Mantle奉身对底层硬件的支持以及“类API”的特性,是否会引发微软的抵触?要知道目前掌握DirectX定义全力的微软,它有任何风吹草动的行为都会直接影响到未来几代GPU的发展。微软如果对Mantle不满的话,引发对AMD的不满也有一定的可能。毕竟DirectX是微软掌控图形业界发展的核心技术,不容他人染指。

  此外,AMD Mantle究竟是怎样的技术,目前还没有太多资料。对Mantle的本质,有两种看法。一方认为Mantle就像AMD宣称的那样,是AMD对自家GPU底层性能的优化API;另一方认为AMD的Mantle很可能是AMD开发的各种特色技术的合集,其中包含了对GPU性能的优化。究竟如何,目前还没有确定消息,只有等AMD进一步解释说明后才能清楚了。

  在Hawaii上,AMD还创新地加入了TrueAudio音频模块。一般来说,目前PG中的音频部分都是由CPU来计算的。特别是在游戏中,CPU的负载会很重,一些比较复杂的音频计算往往会考虑到CPU负载等问题会被省掉,因此PC中目前的游戏音效表现一直都很一般。TrueAudio技术实际上是AMD在GPU中集成了一个模块,被称为TrueAudio,它是~个专门来处理声音、改善音效的数字信号处理器。AMD的TrueAudio来源是专业应用处理器厂商Cadence收购的Tensilica研发的HiFi EP DSP.AMD大概会在GPU中使用1-10个TrueAudio单元。有了这个单元专门处理音效的话,CPU大概可以节省约1 0%的性能给其他应用。

  在软件支持方面,AMD专门提供了一整套TrueAudio API,也拉拢了一些开发商给予支持。从目前的情况来看,TrueAudio的效果还是值得赞扬的。在GP U-14的技术大会上展示的DEMO中,AMD将22.2声道压缩到7.-1声道,效果非常不错。

  有关Hawaii以及Radeon R9、R7 200系列显卡的一些基本信息、所采用的技术,本文就暂时介绍到这里。在下期,本刊将带来Radeon R9、R7 200系列显卡的深度评测,以及Hawaii的深度架构分析,届时AMD新产品的性能将一目了然,敬请期待。

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: