Moorestown超低功耗平台揭秘

  • 来源:微型计算机
  • 关键字:电脑,英特尔
  • 发布时间:2010-10-13 14:59
  在x86的世界里,英特尔一直很成功。它拥有最高的处理器和显卡市占率,掌握着最尖端的芯片加工工艺,创造了高效率的处理器架构……现在,这个无往不利的巨头将触手伸向了之前少有联系的超低功耗市场:手机、平板式设备、超低功耗笔记本电脑等,推出了今天的主角:Moorestown平台。这一次,英特尔会成功吗?

  英特尔的移动通讯野心文/图 江苏无锡汽车工程学校 潘 巍Moorestown超低功耗平台揭秘Moorestown平台是什么?

  答案很简单,Moorestown是一个专门为超低功耗设备设计的、集成了处理器、显卡、芯片组、I/O控制芯片等诸多芯片于一体的超mini系统。简而言之,就是把一整套兼顾性能和功耗控制的解决方案全部都集成到几片芯片中。

  高集成度设计的好处很明显,功耗的大幅度下降(甚至不到1W)、制造流程更为模块化(少了很多零件处理、加工过程都被晶体管生产代替了)、故障率降低(整合后的芯片故障率比散装元件系统更低)、体积更小(适合安装在手机等小设备中)。不过这种整合型系统虽然表面上看起来只有寥寥数个芯片,但由于芯片内部集成了众多功能,因此实际上设计也相当复杂。

  Moorestown平台主要部分是封装在一块PCB基板上的两颗芯片。它们分别是Atom Z6XX系列处理器以及PCH MP20平台控制器集线器。其中At om Z6XX系列处理器集成了CPU、显卡、内存控制器等设备,它的研发代号为Lincroft;PCH MP20(Platform Controller Hub MP20)平台总线控制器功能类似北桥,研发代号为La ngwel l;除了这两颗核心芯片外,还有代号为Br ier town的、处理有关电源管理、信号处理等的混合信号处理芯片MSIC(mi xe dSignal IC);最后则是与Wi-Fi、3G、WiMAX有关的无线网络芯片。虽然整个系统只有两颗核心芯片(AtomZ6XX和PCH芯片虽然封装在一个PCB基板上,但依旧可算作两颗芯片),两颗功能性芯片(MSIC和通讯芯片),但从英特尔的资料来看,它们基本上可以提供与传统电脑相似的功能,甚至可以流畅播放1080p高清视频、运行《DOOM 3》游戏等,应用范围会非常广阔。

  彪悍的Atom Z6XX系列处理器

  Atom Z6XX系列处理器可谓目前最小巧、最节能的X86处理器。它兼具高性能和低能耗特性,扩展了传统能耗管理状态,并且将类似桌面大型处理器的睿频技术也一并引入,着实让人惊叹。

  Atom Z6XX的核心架构

  Atom Z6XX系列处理器采用英特尔成熟的High-K 45nm工艺制造,集成了14亿个晶体管,是一款典型的SOC(System on Chip,片上系统)芯片。虽然它功能众多,但英特尔依旧将其命名为Atom Z6XX处理器,中文名称依然为凌动。

  A t om Z 6 X X的封装尺寸为13.8mm×13.8mm×1.1mm(长宽高),面积不足209mm2。在这个狭小的空间内,英特尔置入了一个传统的Atom CPU内核、由PowerVR SGX图形处理器衍生出的GMA 600集成显卡、专用的视频编解码模块和显示控制器、内存控制器。英特尔在设计Atom Z6XX片上系统芯片时,充分做到现有资源的利用,而不是全新设计内置内存控制器的CPU。因此Atom Z6XX看起来更像直接将超低功耗的显卡、CPU、北桥等部件封装在一起,因此每个部分的设计相对独立,我们也将单独介绍。

  单核心超线程的Atom CPU核心

  Atom Z6XX内集成的Atom内核和目前的Atom CPU没有本质不同。这款CPU依旧属于单核心设计,采用了顺序执行方式,一级缓存分为24KB数据缓存和32KB指令缓存,二级缓存为512KB。由于是单核心处理器,英特尔还特别加入了超线程技术来增强多任务性能。虽然超线程技术实测并未带来多么强悍的多线程性能增幅,但对于这类超低功耗产品来说,超线程技术这种只需要占用相当少量晶体管,就能获得小幅性能增幅的功能,还是非常有意义的。

  虽然AtomZ6XX专门面向超低功耗平台设计,但集成的CPU核心频率着实不低。Atom Z6XX针对智能手机的型号频率会达到1.2~1.5GHz,而用于平板电脑和超便携电脑等设备的型号频率会提高到1.8~1.9GHz。另外,这款处理器在待机状态下会自动降频至600MHz,并关闭大量功能最大限度节能(本文后部分会有详细介绍)。在CPU满载的情况下,它又可通过BPT(BurstPerformance Technology,性能爆发技术)技术来提高频率。BPT技术可以根据目前核心功耗、温度表现来短时间自动提升CPU频率,颇为类似桌面/移动处理器使用的睿频技术。

  不过睿频技术的频率升降只与当前系统负载有关,而BPT技术可以与操作系统共同控制功耗,让软件来确定CPU应该在何种频率范围内升降(比如某软件可以直接确定CPU只能运行在最高频率1GHz),保证能源利用的高效化。

  更强悍的PowerVR SGX535图形核心

  虽然PowerVR在桌面平台上难以和NVIDIA与AMD竞争,但在转向超便携、超低功耗平台后,PowerVR却有着不错的表现。PowerVR旗下产品在极低的功耗下提供了相对优秀的性能,功能支持方面也非常出色,诸如1080p硬解码、OpenGL 2.0、OpenGL VG 1.0以及DirectX 9.0L等诸多规格都做到了完美支持。这样的全功能和全系列API支持在超便携设备上是非常少见的,因此PowerVR芯片也被大名鼎鼎的Apple选中,作为旗下iPhone手机的图形芯片。

  英特尔已经不是第一次和PowerVR打交道了。上代超便携平台“Menlow”使用的独立外置显卡芯片就是PowerVR SGX 535,被英特尔命名为GMA 500。PowerVR SGX535采用65nm制造,核心频率仅仅设定在了200MHz。它采用先进的完全可编程设计,虽然结构方面更偏向传统的图形核心,但也借鉴了通用流处理器的设计优势—内部设计了16个Core,每个Core内含4个通用渲染管线,总计有64个图形渲染管线,硬件规格相当出色。实际性能方面,这颗PowerVR SGX 535可以达到7M/s的三角形生成率和250M/s的像素填充率,实际测试中的性能和GeForce 2GTS基本相当。

  本次Atom Z6XX系列处理器的显示芯片依旧是PowerVR SGX 535,但它的工艺制程、频率已经有了较大提升。在采用英特尔先进的45nm工艺制造后,这款图形处理芯片的功耗进一步降低。因此英特尔将PowerVR SGX 535的频率大幅度提升到了400MHz,使得图形性能有明显增长。在英特尔的实际现场演示中,在800×480分辨率下,使用Moorestown平台的机器可以流畅运行《DOOM 3》,图形性能之强可见一斑。由于性能相对上代产品大幅度提升,因此英特尔也干脆将核心命名更改为GMA 600,用于区别上代产品。

  性能优秀的编解码核心

  不过,强悍的3D性能仅仅是用户要求的一个方面,通常超便携设备最好能够具备对1080p影片的硬解码能力,这样不但能为用户使用提供方便,还能大大扩展平台的使用范围。比如高清播放机甚至高清机顶盒等产品,都可以成为Moorestown超低功耗平台的目标客户。

  除了解码功能外,编码功能也是非常重要的。除了常见的手机拍摄视频等功能需要编码芯片的参与外,其它一些摄像设备如监视器摄像头、视频采集装置的信号也需要编码存放。传统的台式机自然可以依靠强大的处理器或者显卡编码计算,但在Atom Z6XX这种超低功耗SOC系统上,利用CPU内核编码计算显然不够明智,而集成显卡又不能完成编码工作,因此英特尔购买了和PowerVR同厂商的Imagination的视频解码芯片PowerVR VXD和视频编码芯片PowerVR VXE。

  PowerVR VXD支持MPEG2、MPEG4、VC1、WMV9、H.264、DivXcode c s编码影片的解码播放,同样也支持1080P影片的硬解码(目前只能支持码率20Mb p s以下的影片)。需要特别说明的是,在硬解码播放状态下,Moorestown平台的整机功耗也只有1.1W,这个数据相当惊人,也充分说明了PowerVR VXD核心卓越的性能功耗比。另外,编码功能由PowerVR VXE支持,这颗芯片能够完成对720p@30fps影片的实时视频编码计算,虽然不能达到1080p那样的全高清效果,但在这类设备上720p清晰度的编码也相当可观了。

  灵活的内存控制器和显示单元

  前文我们也说过,Atom Z6XX的CPU内核和内存控制器是分开设计的,二者之间依旧采用了类似传统前端总线的架构。英特尔这样设计很大程度上可以最大限度利用现有的产品规格,降低研发难度。从另一个角度来说,对Atom这类处理核心,其性能瓶颈往往是CPU内核本身,与内存带宽关系不大。

  有鉴于此,Atom Z6XX的内存控制器带宽为32bit内存位宽(传统桌面CPU都为64bit),其中面向智能手机的型号内建超低功耗的 LPDDR1内存控制器,支持DDR 400内存,最大支持1GB容量;面向平板电脑、超低功耗笔记本电脑等平台的型号则支持DDR2 800内存,支持最大2GB容量。

  在输出设置方面,Atom Z6XX内建了支持最大1366×768分辨率的LVDS(LVDS是低压差分信号传输,是一种手机等小型设备常见的视频数据传输接口,台式机的DVI接口则属于TMDS最小化传输差分信号,两者原理不同)信号输出,在PCHM20芯片的支持下,可以完美输出1080p HDMI信号。

  功能丰富的PCH MP20P C H 的全称是P l a t f o r mController Hub(平台控制中心),这颗芯片的最大特点是内置了一颗超低功耗的32bit RISC处理器来辅助Atom Z6XX处理信息和交换数据。

  在功能方面,PCH MP20拥有一个图形控制中心,能够同时控制500W像素和VGA规格的摄像头,这样的功能主要用于手机或者平板电脑实现诸如3G视频通话、高清视频拍摄等。PCH MP20内建了音频解码芯片、密码处理核心(实现一些安全管理功能),以及固态硬盘控制器(可支持80MB/s的数据传输速度)。在I/O接口方面,PCH MP20支持内建USB 2.0控制器、HDMI 1080p输出等,功能相当完善。

  不用的全部关闭!强悍的功耗控制

  既然是面对超便携和超低功耗平台设计的产品,其功耗控制能力自然是重中之重。英特尔将他们在Mo or e s t own平台上使用的一系列硬件节能技术称为SIT(Sma r t Idle Tech nolog y,智能闲置技术),软件方面则称为OSPM(OSPower Management,操作系统电源管理)。

  极致节能—SIT技术简介

  如果对CPU的工作状态不加以控制,那么CPU将在整个运行时间内一直处于高频运转状态。虽然目前的变频技术可以解决一部分问题,但往往依旧不能彻底关闭那些不工作的核心区域,它们依旧在浪费能源。

  当然,有问题就有解决办法。其中最好的节能方法莫过于把CPU分为N个模块,每个模块都装一个开关,再加上一个探测器。当探测器探测到该模块无所事事时,就切断电源。Atom Z6XX的节能方案就采用了如此方式。

  首先,英特尔将整个Atom Z6XX系列处理器分为独立的19个功能区域。这19个功能区域的频率可以独立控制,并且通过Power Gating(电源门控)技术分别开启和关闭。电源门控技术表面上看起来就是关闭晶体管或者功能区域而已,但实际上这项技术并不是想象的那样简单。

  实际上,对大量晶体管构成的模块来说,在关闭和运行状态之间切换是需要等待时间的,这段等待时间中的晶体管完全不会做任何事情,只是徒耗能源而已。同时,为了满足电源门控技术的要求,设计者还必须额外添加耗能的部件来控制各个模块。这些新增加的模块和切换模块时的能耗如果比关闭模块时的能耗要更高或者基本持平,电源门控技术就没有意义,反之,如果采用电源门控后能降低大量的能量消耗,则此技术就非常有帮助。

  为了让电源门控技术运行更有效率,目前的移动处理器都引入了CPU的工作状态模式。目前我们能看到的模式分为C0 HFM(满载运行状态)、C0 LFM(低功耗运行状态)、C1/C2(休眠运行)、C4(深度休眠)、C6(基本关闭)五个状态。这五个状态分别决定了在哪种情况下哪些部件会被关闭、哪些部件可以降低电压运行。比如在C4状态下,CPU核心电压降低、CPU停止工作、缓存仅维持必要刷新等。

  在Atom Z6XX上,英特尔将C0~C6的五种状态命名为S0状态。在CPU运行在S0状态时,系统的CPU运行在C-sate技术控制下,可以变频节能,其余的如编解码核心、显示控制核心、I /O总线、集成显卡等都处于电源门控技术监视下,随时等待关闭。S0状态是Atom Z6XX运行的基本状态,也可以认为是用户一般应用中的CPU工作状态。

  除了S0外,英特尔还给出了两种特别为超低功耗移动设备设计的工作状态:S0i1和S0i3。S0i1状态属于用户使用完设备后,设备侦测到闲置并进入超深度休眠待机状态下的功耗设定。在这种状态下,CPU核心进入C6状态(几乎被关闭),其他如编解码核心、显示控制核心、I/O总线、集成显卡等都被电源门控技术关闭,开启的只有电源管理模块和唤醒模块,另外还保留了一部分SRAM缓存存储当前工作信息。相比S0i1,S0i3更为节能。在设备长期待机,被锁定关闭后,S0i3会彻底关闭系统除了SRAM缓存外的所有模块,几乎进入“假断电”状态,能耗极低。

  S0i1和S0i3状态虽然节能,但是否唤醒速度很慢呢?完全不必担心,英特尔给出的数据是,启动S0i1状态启动只需600微秒、唤醒退出S0i1状态只需1.2毫秒;S0i3状态启动只需400微秒,唤醒退出S0i3状态只需3.1毫秒,如此短的时间用户几乎没有感觉。另外,由于有了这样严格的功耗控制技术,S0i3状态下的系统功耗仅为100微瓦,只有上代Menlow平台的1/50,S0i1状态下的待机功耗也不高,被控制在8毫瓦。

  方便节能—OSPM技术除了系统设定的节能状态外,操作系统软件节能也被引入了Atom Z6XX中,这就是O S PM技术。在这项技术下,系统可以通过软件控制At omZ6XX或者PCH MP20的各个部分,如CPU、显卡、编/解码器、内存控制器、闪存管理器、音频、数据接口等各个部件在软件中的应用情况,将那些软件操作中完全不会涉及到的部分关闭以节约能耗。另外,在用户模式下,OSPM也可以根据用户设定模式来关闭某部件节能。

  令人惊讶的功耗表现经过先进制程、新设计的核心以及各种节能技术的辅助,整个Moorestown平台在节能技术方面获得了长足进展。根据英特尔官方数据,Moorestown平台的待机功耗在21~23毫瓦,待机状态下功耗只有上代Menlow平台的1/50、音频状态功耗只有是上代产品的1/20、720p影片播放状态则是上代产品的1/3等。

  在使用1500mAh的电池时,Moorestown平台待机可以超过10天、听音乐可以超过48小时、高清可以连续播放5小时、连续上网时间超过5小时、连续通话时间则超过6小时。虽然这些数据看起来并不令人惊诧,但不要忘了,这是一个能看1080p高清、能上网、能玩《DOOM 3》、《魔兽世界》等游戏的手机带来的效果,想想市售的手机跑游戏时的表现,就不能不惊叹了!

  结语:x86进军智能手机平台,是福还是祸?

  相信对大多数人来说,Moorestown平台最有吸引力的地方莫过于能够支持智能手机这样的移动设备。长期以来,智能手机平台一直是ARM的天下,Moorestown平台的出现打破了这一垄断局面,为整个智能手机市场注入了新鲜血液。不过Moorestown平台面对的敌人还很强大,自己的问题也有不少。NVIDIA就很尖锐地讽刺了Moorestown平台,他认为“减肥了的大象依旧是大象”。一些业内专家也表示,稍微启动一些功能,Moorestown平台的功耗还是比较大的。

  诚然,X86这种指令集架构的产品似乎并不适合超低功耗便携设备,但我们也不能就此认为英特尔的努力没有意义,让手持设备具有更出色的娱乐能力,仅凭这一点就让人向往。更何况,强大的高清播放性能和3D性能、CPU表现也足够令人满意、还有比上代大幅度改善的功耗状态,Moorestown平台已经跨出了一只脚,踏在了智能手机和超便携设备的领地上,而一些厂商也宣布将推出基于Moorestown平台的产品。我们期望英特尔能继续努力,不断提供更优秀的产品,让我们真正能使用到性能卓越、功耗优秀的智能手机和超便携设备!
……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: