板卡上的元器件逐个数,显卡的核心

  GPU作为显卡的“心脏”,在显卡中扮演了很重要的角色,如同电脑里的CPU一样,GPU决定了显卡的档次和大部分性能,那它究竟是如何构成的?

  GPU是不是只负责图形处理?想要弄明白这GPU究竟为“何物”的朋友就接着往下看吧!

  GPU是英文Graphic Processing Unit(图形处理器)的缩写,大家会发现它与中央处理器CPU仅有一字之差。

  如果从字面意思理解,中央处理器就好比中央政府,主管电脑中的大大小小事务;而GPU则是一个地方政府,专门负责与图形渲染相关的事情。换言之,大家在显示器上看到的各种画面,包括酷炫的Windows玻璃效果,漂亮的风景照以及美轮美奂的3D游戏场景,其实都是通过GPU计算而来的。和CPU一样,GPU也会按照性能的好坏分成三六九等,而且每隔一年到一年半的时间就会升级换代——从这个意义上来讲,GPU也是主机内部更新速度很快的硬件之一。

  若论晶体管数量,CPU并不是老大?

  大家知道GPU与CPU都是半导体工业的宠儿,往往集业界各种先进的技术于一身。最新的AMD RadeonHD 5000系列使用40nm的生产工艺,仅次于Intel最近才推出的32nm生产工艺。和我们在前面提及过的CPU生产工艺一样,更先进的生产技术代表着更低的功耗、更小的芯片面积以及更高的性能(包括频率、晶体管数量等等)。所谓不比不知道,一比吓一跳。

  Cpress核心(Radeon HD5870)集成了21.5亿个晶体管,同时期最强的Core i7 975Extreme处理器内部才集成有7.31亿个晶体管,GPU内部的复杂程度可见一斑。

  细心的朋友们会发现,示意图中GPU的晶圆上有很多对称的设计—这是因为在GPU内部,往往需要设计大容量的缓存单元,而那些规整的区域就是高速缓存;GPU内部还包含有很多同时运作的流处理器,以及其它一些运算和功能单元,这些单元在功能和晶体管布局上都是非常相似的,所以我们才会在晶圆上看到很多形状非常类似的“片区”。除了晶体管数量的多寡,芯片的封装面积也是影响成本的另一大因素。在晶圆横截面相同的情况下,单颗芯片所需要的面积越小,那么同样一片晶圆就可以切割出更多的芯片。

  并行计算能力,CPU不是对手!

  如果从更深层次的角度上来解析GPU与CPU,就可以发现二者执行工作的效率不尽相同,而且侧重点也有很大的差异。首先CPU负责的是各种各样、“长短”不一的应用任务,所以在指令集以及执行效率方面需要高度的灵活性;而GPU的工作特点则是,同时处理多个并发的任务,负载很重,但每个任务却相对简单和单一。

  以Radeon HD 5870为例,其核心代号为RV870,内部拥有1600个着色器和80个纹理单元,庞大的硬件规格能让其在一秒钟内执行2.72TFLOPs的指令处理任务(理论值),而在一年前的Radeon HD 4870处理器仅能够执行1.2TFLOPs。GPU在计算能力方面的优势不仅让它在图形渲染方面游刃有余,同时也为其开发了很多新的应用渠道。比方说现在我国计算能力最强的天河一号超巨型计算机,就是使用若干片Radeon HD 4870X2所搭建而成的。多卡互联:你不是一个人在战斗

  尽管现在单颗GPU的运算能力已经非常强了,但对于很多极限玩家而言仍然不够用。例如在一些大型3D游戏中,我们将画面调节到1920×1080甚至更高的分辨率,开启高倍抗锯齿功能之后,即便是顶级显卡也不一定能够独力承担下来。

  俗话讲“一个好汉两个帮”,当一个GPU顶不住的时候,还可以为它找到志同道合的伙伴来帮忙。NVIDIA的多路显卡技术叫做SLI,而AMD的多路显卡互联技术叫做CrossFire。目前二者的驱动程序最多可以支持4个GPU核心参与运算,但具体到主板端,支持NVIDIA SLI技术的主板可以使用3块显卡(3×1模式),或者使用两块双“芯”显卡组成Quad SLI(2×2模式),但是不能支持4×1模式;AMD的CrossFire组件方式更加灵活,可以是4×1模式,也可以是2×2模式。一般来讲双路SLI和CrossFire并不能达到,两倍于单卡的效果,而是要乘以一个系数,如1.8倍或者1.6倍;多卡互联的情况也是类似的,随着显卡数量的增加,性能的增加并不与成本的增加值成比例。

  并不安于现状的GPU

  上面我们说到,GPU除了能用作图形渲染任务之外,还有余力去做一些其它用途。套用《蜘蛛侠》里的一句话:“能力越大,责任也就越大”,GPU并不满足于现状,于是便打起了从CPU、声卡哪里分得更多“蛋糕”的主意。

  说起这段故事,还得追溯到NVIDIA GeForce 8800GTX年代,那时候NVIDIA发布了一个名为“CUDA”的程序开发包。简单来讲,就是利用CUDA这个平台,让更多以前需要CPU来处理的任务,包办给GPU去运算。随着开发进程的加速,支持CUDA的应用越来越多,软件也逐渐丰富起来,其中对于PC用户来讲最主要的两个用途就是压缩文件和CUDA解码高清视频的应用。CUDA发布后,AMD方面也发布了Stream通用加速技术,究其原理与CUDA非常相似,但二者之间没有办法融会贯通。为了解决两者通用的问题,2009年初,不少IT巨头牵线组成了OpenCL通用计算联盟,共同致力于推动CPU、GPU、DSP(数码设备的专用处理器)以及其它一些专用设备的通用化进程。

  除此之外,GPU也在扮演一些其它的角色,例如在搭配了HDMI接口之后,GPU甚至能够对高清视频中所包含的声音信号进行处理,而这在以前是音效芯片的专利,现在GPU的用途正在进一步扩大。
……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: