挤牙膏还是强力改进? Intel第七代Core架构全解析
- 来源:微型计算机 smarty:if $article.tag?>
- 关键字:Intel,Core,AMD,Kaby Lake smarty:/if?>
- 发布时间:2016-11-15 11:45
现在,挑战即将来临,AMD准备祭出的Zen架构貌似具有巨幅的性能提升,加上AMD原本具有的图形性能优势,Intel不可避免感受到新一轮大战来临的气息。同时,无论是苹果还是联想、HP、戴尔这些PC厂商,它们的产品线都到了更新换代的关口—是继续吃老本还是拿出令人精神一振的新设计,大家都拭目以待。Intel第七代Core架构“Kaby Lake”也因此备受瞩目,它也是我们接下来要分析的对象。
PC市场已经沉寂太久了,在智能手机取代PC成为第一信息终端之后,PC就回归到商务职能。一方面业界自我安慰是消费转型,却忘记了产品形态僵化、缺乏创新是主音。PC厂商作为下游业者,对此显然较缺乏控制力,而作为号角的Intel,必须在硬件更新换代上承担起责任—在AMD跟不上步伐之后,Intel可以躺在酷睿架构上睡大觉了,每一轮挤牙膏式的更新令消费者兴趣缺缺,加上PC厂商那副傻大笨粗或者全然克隆Mac的枯竭设计思路,确实也难以引发业界热情。
Kaby Lake的14纳米+工艺
我们知道,Intel的Tick-Tock工艺、架构两步走策略已经实施很多年了,过去一直顺风顺水,按照第一年更新架构,次年就同架构升级制造工艺,接下来一年再更新架构,如此交替稳步进行。这种方式很稳妥,保证了工艺良率,产品性能也能够持续地提升—虽然没有竞争压力的时候,这种性能提升幅度太小了一些。
14纳米+工艺:更好的晶体管性能但是到了14纳米阶段,Tick-Tock模式就出现问题了,本来在今年,Intel就应该切换到10纳米阶段,这个过程显然不太顺利。Intel仍然需要依靠成熟的14纳米工艺来解决问题,为此,Intel将产品线更新换代分为工艺、架构、优化三步走的方案,也就是更新周期从过去的24个月延长到36个月,这当然不是什么好消息,意味着性能提升的脚步不可避免变得更慢。而Intel也必须在优化工作上下更多的工夫。
在CPU架构部分,Kaby Lake继承了目前的Sk y L ake核心、也就是第六代Core架构,所以光从IC设计角度来看,Kaby lake的CPU性能实际上是止步不前的。唯一不同之处在于,Intel对14纳米工艺进行改良升级、号称14纳米+ ,新工艺拥有更好的晶体管性能。这主要得益于14纳米+工艺加高了晶体管的翼剖面、以及更宽的栅间距,同时它还提升了晶体管内部的互联性能—借助这些芯片内部的工艺改进,Kaby Lake的晶体管性能比前代产品提升了将近12%,这给它带来了更出色的能效表现。
我们来看看Intel给出的对比表,如果我们以2010年的第一代Core架构为参照物,当时能耗最低的移动处理器功耗为18瓦,到了第四代架构时,功耗降低到11.5瓦,能效提升高3.5倍;而到第六代Core,能耗进一步降低到4.5瓦,能效提高了整整八倍!那到了现在的kaby lake,虽然最低能耗保持在4. 5瓦,但性能提升显著,能效比的提升幅度达到了10倍!也就是相对于现在的第六代Core,Kaby lake的能源效率提升了20%。
增强的Speed Shift技术:加快响应速度
在第六代Core架构中,Intel就引入了一项名为“Speed Shift”的电源管理技术,它的主要改进系统的突发响应时间。我们知道,Intel过去一直采用SpeedStep移动电源管理技术,配合操作系统,可以根据工作负载的不同、动态地调节处理器的工作频率和能耗,从而达到节能的目的。但这项技术的缺点是必须经过操作系统,频率的切换速度较慢、最快也得30毫秒,所以在SpeedStep状态下,虽然系统实现了节能、延长电池续航力的目的,但却让人感觉到系统的响应速度明显要慢于全频状态。Speed Shift技术很好地解决了这个问题,它绕过了操作系统、让处理器能够直接与电源控制单元沟通,并将所有电源状态都开放给操作系统,三者配合之下,Speed Shift平台最快可以在1毫秒的时间内完成状态切换。
不过,第六代Core架构的Speed Shift只针对原先的节能机制,Intel还有一项睿频(turbo boost)技术,它的逻辑刚好与SpeedStep相反—睿频可以在C P U面对高负载应用下将运行频率提高数百个MHz,达到加速运行的目的。不过第六代Core的睿频切换延迟需要接近100毫秒,而现在Kaby Lake平台也对此作出改进,新一代SpeedShift技术可以让睿频状态的加速延迟降低到5毫秒。
要说明的是,是否开启Speed Shift,CPU的性能基准都是一样的,它的功能在于能够大大提高不同负载的切换速度,从而将性能效率提升最多20%。为了便于理解,Intel举了个一个赛车的例子,同样两辆赛车,没有Speed Shift技术的在遇到弯道时要减速通过后才能加速,而加装Speed Shift技术后可以不减速甚至加速通过弯道—这就意味着,用户在面对高负载应用时,新一代Kaby Lake平台会拥有更高的处理速度。
更高频率带来显著性能提升
而体现在最终产品上,就是Kaby Lake可以在同等功耗时工作在更高的频率上,比如同样为15W功耗,Kaby Lake核心的Core i7 7500U的频率为2.7GHz,睿频最高到3.5GHz;而现有的Core i7 6500U频率只有2.5GHz,睿频最高只有3.1GHz,两代产品的差距还是比较明显的。在体现商用性能的Sysmark 2014评测软件中,7500U的性能比6500U高出12%左右;而在体现Web性能的WebXPRT 2015的评测软件中,7500u的性能提升达到19%。不过最大幅度的提升还是WinRAR压缩解压应用,7500U的优势扩大到28%,这主要得益于睿频时额外增加的400MHz频率提升。
Kaby Lake的GPU部分
kaby Lake的GPU核心同样继承上一代产品,在Intel的体系中仍属于第九代架构,它的图形核心依然由EU单元构成,内部设计没有什么变动。根据处理器版本不同,Kaby Lake的GPU也分为GT2、GT4等多种配置,性能最高的GT4包括72个EU执行单元,GT2为24个执行单元,数量与第六代Core相同,不同的地方在于Intel提升了eDRAM四级缓存的配置—比如最高性能版本可以集成多达256MB的eDRAM四级缓存,而现有第六代核心最高只能到128MB,我们会在后面的产品系列对此加以进一步的介绍。
在没有明显改动EU单元内部设计、提高EU数量的情况下,指望KabyLake的图形性能有大幅度提升是不现实的,这对于用户来说多少会有些遗憾,虽说我们不应对核显要求太高,现行的性能也能满足应用需要,真正需要高性能的用户又会去选择独立显卡,用户对此不会太苛求。但Intel的问题在于,如果AMD的Zen架构能够按期在2017年发布,那么就会对KabyLake带来明显的压力—Zen架构有望在处理器性能方面赶上Intel,而图形性能是AMD的强项,它的APU虽然CPU性能孱弱,但图形性能每一次都表现抢眼。所以对Intel来说,Kaby Lake一如既往的图形性能会有一些麻烦,至少用户对它们会很不感冒。
值得庆幸的是,Kaby Lake在视频性能方面获得大幅度的增强,Intel为它加入了增强的视频引擎,它包括MFX(Multi-Format Codex,多媒体解码器)和VQE(Video Quality Engine,视频质量引擎)两个部分。
MFX单元与VQE引擎
MFX是一个增强的解码器单元,它增加了10bit HEVC和8/10bit VP9格式的编码器和解码器—其中,HEVC是一套先进的视频格式标准,它可以让1080P视频内容的压缩效率提高50%左右,这就意味着同等带宽下、可以获得更高质量的视频。这项优势让它被认为是H.264、MPEG-4的最佳代替者,能够满足4K、8K视频时代的内容压缩要求。不过,HEVC也因此具备更高的算法复杂度,对硬件要求要比H.264高得多,之前Intel的核显只提供到8bit的HEVC硬加密能力,面对10bit HEVC内容时仍只能依靠CPU低效地完成。而在Kaby Lake架构中,我们看到这个可喜的变化,新加入的MFX单元将让观看4K HEVC高清内容变得轻松自如。
VP9则是Google开发的视频格式,它是一套开放的压缩标准,它可以提供比H.264更好的图像质量、同时码率却只有它的一半左右。Google在Youtube网站上率先采用VP9标准,VP9也获得不少流媒体网站的支持。很遗憾,国内用户因为网络限制的原因无法访问Youtube。但对国外用户来说,VP9硬件编解码能力能够给他们带来很大的便利—Intel第六代核心并没有支持VP9编解码功能,用户访问Youtube和其他采用VP9格式的视频网站时,还必须依靠CPU进行软解,播放高清资源时会给系统带来较大的负担。而这次Kaby Lake纳入了VP9的编解码功能,其中支持8bit的硬编码和8bit/10bit的解码,这让KabyLake平台在在线视频应用中具有显著的性能提升。
除了这两项重要改进外,Kaby Lake的MFX单元还改善了无线显示时的画面质量,也提升了现行H.264/MPEG-4 AVC编解码的性能。
VQE引擎则在第四代Core架构时开始引入,现在它有了新功能:它具有更宽的色域,并且在高动态范围和标准动态范围下都能获得应用。为了实现这一点,Intel对VQE引擎作了进一步改进,包括反交错、降低噪音、色彩增强、色彩校正等等。同时,新一代VQE还拥有更好的能效表现:在实现宽色域和HDR支持时,它只需要消耗40-50毫瓦的能源,近乎可以忽略不计,这让它在播放4K内容时,能够提供更好的画面观赏效果,同时又不需要担心设备发热会显著上升。
实际性能增强
Kaby Lake的上述改进,让它得以胜任4K时代的现实需求。Intel现行的第六代Core架构,只是支持传统的H.264/MPEG-4 AVC格式编解码和VP8格式的编解码,它们最高只能在1080P视频内容中进行硬件加速支持,任何超过1080P清晰度的高清视频,都只能依靠CPU进行软解。KabyLake对视频引擎的增强,很好地解决了这个问题,面对4K视频都可以进行硬件加速,显著降低了平台负担、具备更高的实用价值。
我们用数据来更直观地看出这一点。Kaby Lake平台,可以支持最多8组4Kp/30(4K逐行、30帧速率)的超高清视频同时播放;或者是流畅地播放4Kp/60(4K逐行、60帧速率)的高质量视频,此时视频的流速达到120Mbps,这意味着KabyLake的媒体引擎要在一秒内完成120Mbit数据的实时解码,运算力相当强大。而它的能源效率也非常可观:功耗只有4.5W的Y系列处理器,就可以完成HEVC格式的4Kp/30视频的实时编码,也就是像Macbook这样的超轻薄小本,都可以很好完成这类繁重的视频创建任务。
那么对终端用户来说,换用新平台和沿用现行的第六代平台,又能带来多少实际的好处呢?首先一个最明显的好处就是降低了能耗。Intel采用《钢铁之泪(Tears of Steel)》的开源电影短片来展示两代平台的差异,视频基于10bitHEVC格式、4K清晰度,在现行的Core i7-6500U平台中,视频播放是依靠GPU和CPU一起混合解码的,此时CPU占用率要达到50%左右,而CPU/GPU的整体能耗达到10.2瓦。另一套Kaby Lake架构的对比平台则采用对应的Core i7-7500U处理器,由于它可以完全由CPU进行硬解码,CPU/GPU的功耗只有惊人的0.5瓦—这也意味着足足具有20倍的能源效率提升,而播放本地4K视频时的电池续航时间也因此可以提升2.6倍之多!
如果应用的对象换为在线视频、结果会如何呢?对比的上述两个平台都用Chrome浏览器来播放Youtube上的4K VP9格式视频,其中Corei7-6500U在CPU/GPU部分用了5.8瓦能源,而Core i7-7500U只用了0.8瓦,能耗降低了7倍!换算过来,在播放Youtube的4K视频时,Kaby Lake平台可以获得1.75倍的额外电池续航时间。我们知道,目前基于Core i7-6500U的笔记本电脑,在播放这类4K视频时一般具有4小时左右的续航力,那么按此推算、Core i7-7500U平台就能达到7小时左右—也就意味着全天候的4K播放能力。不仅如此,Kaby Lake提供的性能冗余也让它为未来做好了准备,比如它可以胜任360度的4K内容、也就是沉浸式的4KVR应用,而当前的第六代Core平台无法满足这一点。
Kaby Lake的产品线分布与前次升级一样,Kaby Lake拥有一个完备的产品线,包括S系列、H系列、U系列和Y系列,跨越从高性能桌面、工作站到超轻薄笔记本的广阔市场,具体到产品型号上还是划分为i7、i5、i3三个不同等级。
针对桌面和工作站:S系列S系列面向的是高性能市场,它包含许多不同的型号,主要以锁频与否、功耗和GPU配置作为区分。其中性能最高的是K开头的型号,它拥有四个处理器核心,搭载GT2级别的常规图形核心,最大的特点是不锁倍频、允许大家自由超频,它的功耗也达到91瓦。很明显,这个型号是为旗舰级桌面准备的,游戏玩家们都是搭配怪兽级显卡,所以处理器的图形核心安置个基本的GT2就可以了。这个系列的发布时间会在2017年初。
面向主流桌面的四核处理器则锁了倍频,功耗在35瓦到65瓦之间,它搭载了性能更高的GT4图形核心,内部集成了64MB的四级缓存,它的发布时间会比不锁频的K系列稍迟一些。
而针对服务器和工作站的Xeon系列四核处理器,没有整合图形核心有80瓦、54瓦和25瓦三种不同的能耗配置,主要面向需要与GPU加速卡配合的高性能计算平台。而带GT2图形核心的有25-80瓦能耗配置,它们主要面向Web服务器、文件服务器、FTP服务器这类常规的商业云环境。
S系列的芯片平台采用“处理器+PCH”的组合方案,PCH也就是我们过去常说的南桥芯片、负责对外I/O功能。处理器部分,S系列支持双通道DDR3L-1600和DDR4-2400两种方案,OEM厂商可以自行决定要采用哪种内存。此外,它还包括一条PCI Express3.0 X16规格的图形总线、用于外接显卡,接口的带宽达到32GB/s。另外,它还支持三路数字显示接口输出,以及一个eDP嵌入式接口。
PCH方面,Kaby Lake可以兼容第六代Core的100系列芯片组,不过它配套的应该是改进后的200系列产品,除了USB 3.1支持、HDA高清音频、SATA硬盘总线外,200系列芯片将原本的20路PCI Express 3.0总线提升到24路,总计提供48GB/s的双向带宽,可以支持Intel的Optane硬盘—它实际上是Intel的3D XPoint闪存技术的正式名称,介于传统内存、固态硬盘之间,可以提供极高的性能和极低的延迟,过去我们曾对这项技术作过专门的介绍。
针对高性能笔记本电脑:H系列
H系列是Kaby Lake的移动高性能版,它采用BGA1440封装、TDP功耗在35·45瓦范围内。H系列都拥有四个CPU核心,35瓦功耗版搭载标准版的GT2图形核心,面向主流高性能市场。不过,Intel还为顶级玩家准备了45瓦功耗的顶级型号,它将搭载GT4图形核心,并内建了128MB的eDRAML4高速缓存—不过它还不是最快的,Kaby Lake H家族还包含一款高达256MBL4缓存的顶级型号,没有例外的话,它也将成为KabyLake家族中图形性能最出色的处理器。
H系列同样采用处理器+PCH的解决方案,功能强大、但需要较大尺寸的主板才能容纳。
针对超极本:15/28瓦的U系列
U系列是Kaby Lake的移动低功耗版本,主要针对的就是超极本市场。U系列采用BGA1356封装,功耗最低的版本TDP为15瓦,最高的型号是28瓦。U系列都包括两个CPU核心,图形部分有GT2、GT3两个版本,这两者的区别主要就是内建的eDRAM四级缓存—GT2版本并不包含、只能共享内存作为显存,而GT3内建了64MB的eDRAM,性能会更出色一些。
与前两个系列相比,U系列很重要的一个特点就是内建了SOC功能,也就是将PCH芯片与Kaby Lake CPU芯片集成在一起,这样就在一个处理器封装模块上同时实现包括CPU、图形核心、芯片组等所有的功能,主板的设计尺寸因此可以被大幅度缩小。我们可以见到,当前搭载第六代Core架构U系列处理器的超极本都可以做到惊人的轻薄尺度,原因也是处理器封装里包括PCH芯片。
内存支持方面。U系列也是双通道DDR3L和DDR4,不过它在I/O方面的功能久相对弱一些,比如只支持两路数字显示输出和一个嵌入式eDP显示接口,更遗憾的是居然只能支持到USB3.0、无法支持更快的USB3.1,这未免有些落伍。此外,对于SSD它也准备了SATA和PCI Express两种接口,可以很好地满足现实需要。
针对平板电脑:4.5瓦的Y系列Y系列其实就是之前的CoreM产品,面向的是平板电脑以及追求极致轻薄的超便携机型,这也是当今PC市场的主要关注热点。Y系列采用BGA1515封装,它的主要诉求就是低至4.5瓦的超低功耗水平,这让它可以保持无风扇运行。Y系列都整合了GT2图形核心、不带eDRAM高速缓存。由于Y系列面向尺寸更小的计算市场,处理器封装也采用SOC设计、同样集成了PCH芯片。
Y系列的I/O功能与U系列完全相同,它也没法原生支持USB 3.1。如苹果想在新一代Macbook中加入这个功能,就只能依靠第三方的解决方案。
需要换Kaby Lake平台么?
如果你再用的已经是六代平台或者四五代平台,纯粹因为性能的关系升级到七代平台,我们认为你或多或少都会觉得失望,Kaby Lake平台的性能固然得到提升,视频方面的能力也非常强大,但它更多是一种渐进式的改进。
Intel也深知这一点,它采用五年前的PC平台作为参照物加以说明—对比五年前的平台,KabyLake在商务应用中可以获得1.7倍的性能提升,比如将Word转换为pdf时速度更快,winrar压缩解压的速度也快得多;此外,Kaby Lake可以很好地胜任4K视频创次建和播放的需要,这对于视频工作站来说意义重大。通俗一点说,我们认为五年下前的PC也能够完成大多数日常任务,但如果升级到Kaby lake平台的话,大家可以直观地感受到运行速度更快、CPU占用率更低、平台的发热量更小、风扇更加安静。假如你要在电脑中运行多个虚拟机,那么就会恨不得榨取每一分的性能,Kaby Lake平台在这些方面就有明显优势:毕竟它的工作频率更高、发热量还更小。因此,从这些人性化体验的角度来看,我们认为升级到新一代平台还是有着明显的好处。
到现在为止,Intel都没有在PC市场上感受到竞争压力,它最大的对手其实是自己的前几代产品,挤牙膏式的缓慢升级,让前几代产品,也能够满足工作的需要,在各大企业纷纷缩减开支的今天,一套商用PC平台的生命力往往在6~7年,新平台不会对这类客户带来多少吸引力。
Intel还需要面对的一个潜在问题,就是AMD的Zen架构能具有什么样的表现,假如Zen在处理器性能和效率上赶上Intel的步伐,那么Intel将重新经历久违的市场竞争—毕竟AMD在图形领域具有不对称的优势,它所欠缺的其实就是一个强有力的CPU平台。我相信消费者乐见于此,没有竞争,市场只会一潭死水、厂商缺乏前进的动力,我们也无法看到IT技术所应有的高速演进。
文/张健浪