深度剖析NVIDIA Optimus技术

  众所周知,在CPU性能足够、其它配置都属主流的情况下,显卡是影响电脑性能的决定性因素。笔记本电脑集成显卡这几年来虽然在性能上取得了巨大的突破,已能流畅地解码部分1080P全高清视频,并可玩一些低需求的3D游戏,但性能相比独立GPU还是有很大的差距。要想在笔记本电脑,特别是超轻薄笔记本电脑上应用高性能的独立GPU,在能效和性能方面获得两全,必需在功耗和散热设计上下更多功夫,这成为一个让厂商绞尽脑汁的问题。

  双手互搏,笔记本电脑双显卡技术的发展现状

  笔记本电脑已取代台式机成为全球电脑销售的主流,为更好的满足不同消费者对笔记本电脑的需求,各种更具特色功能的产品应运而生。面对轻薄型笔记本电脑孱弱的性能,连轻薄时尚笔记本电脑的领军人物索尼亦忍耐不住,于2006年推出了采用双显卡技术解决方案的VAIO SZ系列笔记本电脑。其原理是利用Intel的笔记本电脑芯片组945GM既集成了显示核心,又可支持独立的AGP/PCI-E接口的特性,让笔记本电脑能同时拥有Intel 945GM北桥芯片内置的GMA950显示核心和独立的NVIDIA GeForce Go 7400显卡。这样用户便可根据自身的使用需要,在移动或节能使用VAIO SZ时,将笔记本电脑上的Stamina(耐力模式=长效电力)/Speed(速度模式=加强绘图效能)键拨至Stamina端,根据系统弹出提示框进入Stamina模式而重新启动系统,从而让笔记本电脑使用集成显卡,并拥有更长的电池使用时间,以保证商务人士在旅行中也能顺利完成工作。而当需要影音娱乐、3D游戏,或使用外接电源适配器供电时,则可将Stamina/Speed键切换到Speed端,重启系统后就能获得更佳的3D性能。

  双显卡在VAIO SZ系列笔记本电脑上的应用,开创了笔记本电脑新时代,让用户可以在两个显卡之间自由切换,同时兼顾游戏性能和电池工作时间。当然,该技术并非十全十美,最大的缺撼是该功能属于“冷切换”,更换显卡必须重新启动系统,比较繁琐。

  进入2008年后,在GPU厂商的帮助下,众多笔记本电脑厂商看到了该功能巨大的商机,纷纷开始引入毋须重启系统就能实现切换的“热切换”双显卡技术。如明基Joybook S42笔记本电脑同时内置9600M GT独立显卡(高性能)和GMA X4500集成显卡(低功耗),只需通过改变电源管理模式可以做到双显卡随时无缝切换,来适应用户在不同环境中的应用需求,让用户可以更方便地按需选择高性能的独立显卡和长电池续航时间的集成显卡。联想IdeaPadV350也是这样的产品,Intel GM45芯片组板载X4500MHD集成显示核心,并内置一块ATI Mobility Radeon HD3450独立显卡,通过系统选项可以进行自由切换—鼠标右击任务栏电池图标选择“可切换显卡”选项,选择“省电模式”是使用X4500集成显卡,选择“提高性能”是使用独立显卡。

  随着热切换技术的不断成熟,目前类似的双显卡热切换技术已被索尼、惠普、联想、戴尔、明基、宏碁、华硕、苹果等笔记本厂商广泛关注与应用,成为市场上注重能效比的笔记本电脑主流解决方案。当然,从应用角度来看,这样的热切换技术还是不够便利,因为它不能实现“智能自动切换,无需人工干预”,也不能实现异构SLI以有效提升笔记本电脑性能,以及在选择独立显卡时仍难以做到能耗和性能兼顾。

  “智”“勇”双全,NVIDIA Optimus自由切换技术谈到双显卡技术就不得不提双显卡及多显卡技术的另一分支,以NVIDIASLI、Hybrid SLI技术及AMD的CrossFire、Hybrid CrossFireX技术为代表的技术。这类技术的出发点是好的,但从实际的市场反应来看却并不成功。SLI和CrossFire技术可为高端桌面平台提供更出色的性能解决方案,但曲高和寡。要想将这类技术现阶段用于主流笔记本电脑平台并不现实。

  为此很多用户都将目光放在了Hybrid SLI技术、Hybrid CrossFireX技术上。这种混合显卡技术如能在笔记本电脑上的应用,能让笔记本电脑可获得更高的性能。例如由ATI Mobility Radeon HD3470独显和Mobility RadeonHD3200集显组成的混合交火系统,在3DMark 06测试中,HD3200得分为1400分,HD3470得分为1900分,而混合交火后的得分可达2400分。但从目前的状况来看,由于混合显卡只支持入门级独立显卡,并且在笔记本电脑平台上的功耗控制水平还需进一步提升,而高端高性能笔记本电脑平台从功耗控制设计考虑又更情愿一步到位采用中高端独显,让其可应用范畴变窄。事实上两种Hybrid技术无论是NVIDIA的还是AMD的都很好,关键在于Intel只用自己的GPU,迫使NVIDIA和AMD不得不另寻他路,以避开Intel授权和限制,单独和品牌机厂商签署授权。

  于是在CES 2010之前,NVIDIA披露了凌驾于Hybr id SLI之上的笔记本显卡技术“Opt imu s”,让用户看到了混合显卡技术应用的新曙光。按照NVIDIA的说法:“Optimus技术适用于搭载NVIDIA GPU的笔记本,它对用户是无缝和透明的。它的目的是优化移动体验,让用户获得笔记本独立显卡的高性能,同时仍保持出色的电池续航时间。”“考虑到Int el即将正式发布32nm Arrandale移动处理器,而且突破性地自带了图形核心,因此Optimus极有可能是NVIDIA对此的一种优化技术,能让笔记本用户同时利用处理器集成显卡和NVIDIA独立显卡,从而维持自己在移动领域的市场地位。”

  Optimu s自由切换技术有何特质呢?NVIDIA是这样描绘它的:Optimus技术可自动优化计算体验以保持无限延长的工作时间,原理如同混合动力汽车自动将对车体对汽油能源的消耗无缝衔接转化至对电力能源的消耗。它能够智能地优化用户的笔记本PC,提供用户所需要的出色图形性能,其无需手动调节设置即可享受超长电池续航时间和华丽的视觉体验;无论是欣赏高清影片、网络冲浪或是激战于3D游戏中,这项技术都可智能地提供超持久电池续航时间或出色的性能。

  相比仍需手动切换的“热切换”,采用Optimus技术的笔记本电脑,可实现双显卡的智能化切换,也就是自动切换毋须人工干预。其原理和英特尔的多核处理器类似,从其拓扑结构分析,Optimus技术将集成显卡当作了一个“显示器控制器”和“路由器(显示器驱动插入器)”,在包含轻负载的任何状况下,集显这个“显示控制器”或附加在其上的“路由器”都是开启着的,这让整个系统能够实现没有黑屏的无缝转换。

  在进行Off ice、Web等任务时,独立显卡的GPU将完全关闭,集成显卡负责处理一切事物,并输出到显示器上。当系统开始运行大型3D游戏、高清视频、Flash视频、支持GPU加速和CUDA的软件时,Optimus驱动会查询自己的软件档案列表,一旦发现是高要求应用程序,Optimus的智能路由功能便会立刻启用NVIDIA独显,让其负责需求较高的图形渲染工作,并可将渲染工作内容通过异步拷贝引擎(异步拷贝引擎可将显存中的数据复制到内存中,由于其所占带宽较小,不会影响3D引擎的渲染过程而造成暂时的性能下降)回馈给集显,由集显继续完成需担当的常规显示任务。在独显运行游戏、播放高清以及GPU计算应用程序时,集显并不会关闭,分工协作只负责2D显示。并且,通过NVIDIA会提供的NVGPU State Viewer软件,用户可在屏幕上直观的看到目前究竟是独显还是集显在运行。使用Optimus技术的笔记本电脑,电池续航时间可比原本的独立显卡本提升一倍。这样NVIDIA Optimus技术就能够智能地优化用户的笔记本电脑,提供用户所需要的出色图形性能。由于该功能只在运行大型3D程序或全高清影音程序时启用,使得运用该功能的笔记本电脑可获得较长的电池续航时间。

  怎样才能确保Optimus智能切换时不会误开启独立GPU,而造成功耗剧增续航时间缩短呢?正常情况下,通过智能识别指定的类,Optimus的路由层可以帮助确定何时使用独立显卡来提高渲染性能。其默认使用开启独立GPU的程序包含:

  ①DXCalls(DX调用),任何的3D游戏引擎或DirectX的应用程序都将触发该功能。

  ②DXVA Calls,当在播放支持DXVA功能的视频时,Optimus会自动启动独立显卡。这是因为MPEG2格式视频需要很强大的计算机处理能力来将其数据流解码成原始的、未压缩的视频流。即使是现在的最快的CPU在解码全尺寸的HDTV时也会出现能力不足,而微软公司提供了一系列的MPEG2解码所使用的规范DXVA(DirectX Video Acceleation,包含DXVA 1.0和DXVA 2.0版本,DXVA 1.0规范里定义了MPEG2和WMV硬件解码能力,DXVA 2.0里增加了H.264和VC-1硬件解码能力)给显卡芯片得制造商,以更好的让显卡进行视频数据的解码运算,及各种后期处理运算,比如图像缩放、色彩空间转换、反交错等的处理。对于CPU及集成GPU较弱的笔记本系统来说,让独立显卡来完成解码是最佳选择,而Optimus正可适应这种趋势。并且,根据优先权限理解,DXVA这种规范及相关解码器在集成显卡能完整支持该格式的高清信号播放时,会选择能胜任这种解码的集成显卡完成任务。而当认为集显性能不具备这个能力时(如支持不够稳定或者性能低下、容易导致系统崩溃或错误),Optimus会自动启用独显完成任务。

  ③CUDA Ca l l s,当系统采用CUDA应用程序时将自动触发该功能。CUDA是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员现在可以使用C语言来为CUDA架构编写程序,所编写出的程序于是就可以在支持CUDA的平台上以超高性能运行。并且,从NVIDIA的专家的谈话中,我们可以看出NVIDIA开放的态度:“NVIDIA将积极支持DirectCompute、Open CL等行业标准。同时,我们也支持那些允许NVIDIA像推出CUDA C和PhysX一样及时创新的标准。我们希望卓越的功能能够尽快进入到游戏和计算中。无论是Direct Compute、OpenCL、Bullet,还是PhysX,无所谓,我们都很高兴,我们不倾向于任何一种。当然,在无标准可循时,我们可以使用PhysX和CUDA。”这会在一定程度上决定其使用方便性。

  除此而外,值得关注的是,Optimus也支持Adobe Flash 10.1(特别是高清和高品质的内容),全新的Mercury播放引擎已成为Adobe播放器的一个重要组成部分,网页内含这种添加了附加效果及多层或超高清内容。在流畅并实时的剪辑体验程序时,Optimus将自动识别Adobe Flash 10.1内容,并使用独立显卡,以获得对应的播放效果,而不再把时间浪费在等待解码和输出进度条缓慢蠕动上。

  那么,怎样的配置才支持Opt imus技术呢?据NVIDIA介绍,处理器方面,Intel最新的酷睿i处理器(酷睿i3/i5/i7)和Atom N4XX系列均可支持,老款Penryn核心GM45/GS45/PM45芯片组的酷睿2处理器也可以使用,Merom核心的处理器则不可以。NVIDIA显卡方面,GeForce 300M、GeForce 200M以及下一代翼扬皆支持Optimus技术,由于涉及到硬件,因此其它显卡无法通过软件升级实现Optimus自动切换技术。

  软件方面,用户笔记本电脑需预装Windows 7或Vista操作系统,并正确安装NVIDIA独立显卡驱动与Intel集显驱动。最关键的一点是,Optimus之所以能自动识别系统负载,在于其内置了一个数据库,该数据库记录了大量的常用软件及游戏资料,当其中某个软件启动时,Optimus无需侦测负载即可知道该用哪个显卡。而当用户连接到互联网时,这个数据库还可在后台自动更新。

  超越平台,图形之外的功能成关键所在

  2010年1月8日,在美国的拉斯维加斯CES2010大展上,英特尔CEO欧德宁向全世界发布了一系列处理器产品。其中,用于笔记本电脑的集成图形芯片技术的产品—“Arrandale”处理器最为引人注目。该芯片中集成两个处理器内核和一个图形芯片,实现了把CPU(中央处理器)和GPU(图形处理器)融合于一体。欧德宁热情洋溢地表示,这样的封装将有助于改善图形性能并减少功耗,未来将会在笔记本电脑、上网本和智能手机等设备中广泛使用。

  这无疑于是对其它笔记本电脑芯片组、GPU、CPU厂商的新一轮折磨。在全球处理器、芯片组市场上,Intel一枝独秀。如何应对处理器在集成GPU后,Intel更为庞大的产业版图,成为其它厂商需要从技术上审慎考虑的问题。

  凭借CPU集成GPU,Intel信心爆棚。在2008年4月的英特尔信息技术峰会上,英特尔公司副总裁基辛格曾宣称独立显卡将在两三年内消失,这被NVIDIA的CEO黄仁勋视为一个笑话,黄认为“即使英特尔能够在2010年将图形计算能力提高10倍,仍然无法与目前英伟达的产品相匹敌。”

  而Intel高级副总裁Dadi Perlmutter近日在接受采访时甚至表示:“我认为谁的图形性能更好并不会带来明显差别,超越图形之外的功能才是关键所在。”他认为绝大多数人根本不需要高性能的显卡,集显将成主流,在主流图形处理器中集成更多功能、延长电池续航时间才更重要。虽然为数众多的DIYer难以认同英特尔高管的“强词夺理”,但也很难对这种说法加以辩驳。

  而随着NVIDIA“Optimus”的横空出世,业界看到了具备Intel高管终极梦想的兼具图形(性能)和延长电池续航时间的解决方案。值得关注的是,该技术将不仅用于主流笔记本电脑平台,还将被应用到上网本平台。在2010年3月,NVIDIA发布了面向上网本和入门级台式机的新一代翼扬图形解决方案,从上一代的集成显卡芯片组变成了一颗独立的GPU。由于不需要再顾及芯片组功能,只需要专心做好GPU工作,新翼扬对内核进行了重新设计,并使用了40nm工艺制造(第一代翼扬为55nm),支持Di rectX 10.1,支持最大512MB DDR3独立显存,芯片封装尺英寸从35mm×35mm下降到23mm×23mm。针对12英寸上网本和桌面系统的型号提供16个流处理器(CUDA核心),针对10英寸上网本的型号则为8个,8SP已能提供全高清蓝光解码能力,16SP版本则可轻松支持包括《魔兽世界》、《孢子》等在内的主流3D游戏。支持NVIDIA的Optimus显卡自动切换技术,由Intel集成显卡核心负责画面输出,普通办公应用时翼扬将被完全关闭节能,进行视频解码、游戏等图形应用时则自动开启翼扬工作。由于Optimus技术的加入,续航时间保持在同一水准,续航能力将达到和Intel集显平台同样的10小时。

  此外,由于Optimus所使用独立显示芯片以及内建的显示芯片都是走相同的路径传送到显示器,因此不论是内建或是外接显示芯片处理过的数据,经过IGP后就通通视为相同的东西,而不会有内接外接的差别,所以其对Intel今年主推的WiDi(无线显示技术)同样有良好的兼容性。NVIDIA预计,到今年夏天将有超过50款笔记本应用Optimus技术。

  总结:Optimus的未来之路

  整体来看,Optimus技术是一项值得关注的应用前景较广的创新性技术,它可完全自动地发挥作用,无需手动更改设置值,用户即可体验更长的电池续航时间以及流畅的视觉效果。Optimus能够在后台运行,对用户运行的程序没有任何干扰,可无缝地计算出最大限度优化笔记本计算体验的方式。实现性能提升的同时,让用户能够无间断、无忧地畅享应用程序与游戏所带来的快乐。目前已有多家笔记本电脑厂商宣布推出支持Optimus的笔记本电脑产品,该技术成为新一代双显卡解决方案似乎已成大势所趋。

  超轻薄笔记本电脑及上网本一直是便携用户、商务人士、时尚用户的首选,通过双显卡技术的应用,让选择轻薄型笔记本电脑的用户毋须再考虑是否另配一台性能强悍的电脑来玩游戏和看高清。并且,随着以Optimus技术为代表的新一代双显卡技术的出现,不仅让用户使用更方便,也可让日渐流行的上网本告别低性能时代,在拥有超长续航时间的同时,兼具接近主流笔记本电脑的3D性能。此外,由于笔记本电脑商无需在主板上为显卡切换增加硬件切换器,也可让该技术的市场吸引力大增。当然,也不排除其它厂商可能随之推出相关技术。

  作为处理器领域的霸主和集显领域的王者,I nt e l的一举一动都将影响其它厂商的动向。I nt el早已下定决心在桌面和移动处理器中全面集成图形处理器,就连英特尔准备应用到上网本的下一代Atom处理器“Pine Trail”亦是如此。这让未来双显卡成为主流配置成为可能,也让独立显卡厂商在这方面如何顺应趋势,推出能与主流集显处理器良好配合的双显卡搭配技术成必然。随着集显性能的不断提高,它作为接近“免费”的方案在笔记本电脑上的应用势不可挡。而对于中高端笔记本电脑独立GPU来说,实现智能降频降核技术以兼顾功耗和性能是必然的趋势。

  MC特约评论员 孙悦秋(P2MM)

  不用操心的节能很多人也许觉得Optimus技术的意义不大,不过我并不这样认为。显卡的切换技术虽然出现了好几年,但在以前的手动年代却需要你不断地在集显和独显之间转换——很多时候你自己甚至都会忘记当前是独显还是集显,而在更远的时代,这种切换还不得不通过重启电脑来实现。

  Optimus的出现对大多数用户,包括我自己,来说都是一种解脱—一种真正不需要你操心的解脱。无需 考虑状态,无需考虑是否需要节能,你要做的只是干自己想干的事情,而不必担心是否转换到高性能模式,或者电池使用时间是否够用。个人认为,Optimus算得上一项创新技术,即使很多人不以为然,我仍然坚持这个观点。或许,当Optimus真正普及的时候,你就能明白其意义所在了。
……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: