AMD双管齐下竞逐未来计算高点

  2006年,AMD不惜工本,耗资54 亿美元收购了ATi。在之后的几年内,针对这一并购的讨论一直没有停息。在10 月22 日的AMD创新技术大会上,这一并购的成效得到了集中的展示。此次大会上,AMD 不但正式发布了AMD第二代DirectX 11 显卡Radeon HD 6800 系列,还对外曝光了AMD 代号为“Bulldozer”和“Bobcat”的下一代处理器核心架构。更重要的是,AMD 还首次在华展示了其APU(加速处理单元)产品的晶圆和技术指标。“Fusion‘融聚’战略,将成为AMD的战略主轴。Fusion 融聚概念,将成为未来计算创新的基石。”AMD全球副总裁、大中华区总经理王正福的话昭示着CPU与GPU的融合走上了快车道。

  新显卡执行效率大幅提升

  “Barts 核心的每平方毫米性能比上一代产品提高了35%。”AMD 全球图形首席技术官Eric Demers谈到AMD新一代显卡Radeon HD 6800系列时充满自信。

  从指标来看,AMD Radeon HD 6870与上一代产品Radeon HD 5850相比,尺寸、晶体管数量和流处理器数量不但没有增加,反而减少了。但是,其几何输出能力却大幅度提升,浮点运算能力也达到了每秒2万亿次。这种改变得益于更加优秀的架构。记者了解到,在HD6000 系列产品中,AMD 将HD5000系列中的一组前端超线程发送器增加到两组,使得核心效率大幅度提升。

  除了运算性能得到提升之外,AMD 还在新一代显卡中应用了很多创新技术。前代产品中,能够让用户组建多屏显示系统的宽域(Eyefinity)技术得到了用户的好评。在新一代产品中,AMD 再一次增强了宽域技术。第二代宽域技术允许用户更加灵活地配置自己的多屏幕显示系统,以取得更优秀的视觉效果。

  针对今年开始热起来的3D 显示,AMD也提供了很好的支持。与一些公司采用的专属方案不同,AMD提出了“开放式的3D立体方案”的说法。借助通用的软硬件接口,用户可以自由采用来自不同厂商的3D立体转换软件、视频和蓝光3D 播放软件、3D 显示设备、3D立体眼镜和发射器,这有望大幅度减少搭建3D系统的成本。

  另外,针对DX11 中最为重要的曲面细分等技术性能,AMD 新一代显卡也获得了极大的提升。

  双车道提升计算效率

  “传统的支持多线程的方法有SMT 和CMP,这两种方法都有各自的缺点。”AMD全球服务器CTO Don Newell 用交通来比喻处理器中的不同线程。他认为,SMT方式将两个不同线程施加到单核心上,就像是将两个车道的车并入同一个车道,会造成拥堵;而CMP为每个线程提供专用核心,则像是为两路车各提供一条道路,每条道路上都存在空置浪费现象。

  为了解决这种现象,AMD 在下一代x86处理器中做出了调整。在AMD 下一代高性能处理器核心架构Bulldozer 中,AMD 将两个专用的整数内核与一个共享的浮点计算单元结合在一起。这样一来,不同线程一方面都有自己的“车道”,同时共享了浮点调度单元和二级缓存,实现了能效比的提升。

  以一组Bulldozer 模块为基础,加入共享的三级缓存和系统总线、内存控制器和北桥控制器,就可以形成多核芯片。这也加快了芯片的开发速度。Don Newell 表示,Bulldozer 将是AMD 下一代高性能处理器的核心技术,它具有非常高的性价比和非常低的功耗,具有竞争优势。

  另一方面,针对发展越来越快的移动市场,AMD同样提供了自己的方案。Bobcat就是AMD 针对移动市场开发的处理器方案。Bobcat模块具有独立的整数调度和浮点调度器,其核心功耗低于一瓦。DonNewell 表示,Bobcat 会被用在AMD 的融聚产品———APU Ontario 和Zacate 中。

  Ontario整体功耗仅9瓦

  CPU 和GPU 之争由来已久,而APU 的出现也许将为两者提供一种融洽的未来。在这次大会上,AMD 首次在北京展示了其最新的Fusion 产品的晶圆,APU 正式投入使用已经指日可待。据悉,首款基于Fusion 的APU 产品(加速处理单元)将会在今年年底批量供货,基于此的系统预计于明年年初上市。

  AMD 提出的APU 概念是指将CPU 和GPU真正地融合在一起,完全置于一颗芯片当中,从而为用户同时提供高计算性能以及更强的视觉体验。AMD公布,其代号为Ontario 的APU功耗已经降到了只有9瓦,而另一款APU Zacate 的功耗为18 瓦。两者都采用了Bobcat处理器核心,并内置了支持DX11 的高性能显示核心。两者之中,Ontario 所面向的是轻便型笔记本市场;Zacate面向的是超轻薄笔记本、主流笔记本、一体机等市场。

  另外,AMD 还在现场展示了其高端APU———Llano 的晶圆,并现场演示了Llano 的运行Demo。在同时执行处理器及高清影片播放应用时,微软的nBodyDirectCompute 应用测试显示Llano 可达到30 GFLOPS 的运算性能。这个演示预览了Llano 的强大运算能力,以至于现场观众都情不自禁地鼓起掌来。
……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: