挤牙膏还是强力改进？ Intel第七代Core架构全解析

来源:微型计算机
关键字:Intel,Core,AMD,Kaby Lake
发布时间:2016-11-15 11:45

　　现在，挑战即将来临，AMD准备祭出的Zen架构貌似具有巨幅的性能提升，加上AMD原本具有的图形性能优势，Intel不可避免感受到新一轮大战来临的气息。同时，无论是苹果还是联想、HP、戴尔这些PC厂商，它们的产品线都到了更新换代的关口—是继续吃老本还是拿出令人精神一振的新设计，大家都拭目以待。Intel第七代Core架构“Kaby Lake”也因此备受瞩目，它也是我们接下来要分析的对象。

　　PC市场已经沉寂太久了，在智能手机取代PC成为第一信息终端之后，PC就回归到商务职能。一方面业界自我安慰是消费转型，却忘记了产品形态僵化、缺乏创新是主音。PC厂商作为下游业者，对此显然较缺乏控制力，而作为号角的Intel，必须在硬件更新换代上承担起责任—在AMD跟不上步伐之后，Intel可以躺在酷睿架构上睡大觉了，每一轮挤牙膏式的更新令消费者兴趣缺缺，加上PC厂商那副傻大笨粗或者全然克隆Mac的枯竭设计思路，确实也难以引发业界热情。

　　Kaby Lake的14纳米+工艺

　　我们知道，Intel的Tick-Tock工艺、架构两步走策略已经实施很多年了，过去一直顺风顺水，按照第一年更新架构，次年就同架构升级制造工艺，接下来一年再更新架构，如此交替稳步进行。这种方式很稳妥，保证了工艺良率，产品性能也能够持续地提升—虽然没有竞争压力的时候，这种性能提升幅度太小了一些。

　　14纳米+工艺：更好的晶体管性能但是到了14纳米阶段，Tick-Tock模式就出现问题了，本来在今年，Intel就应该切换到10纳米阶段，这个过程显然不太顺利。Intel仍然需要依靠成熟的14纳米工艺来解决问题，为此，Intel将产品线更新换代分为工艺、架构、优化三步走的方案，也就是更新周期从过去的24个月延长到36个月，这当然不是什么好消息，意味着性能提升的脚步不可避免变得更慢。而Intel也必须在优化工作上下更多的工夫。

　　在CPU架构部分，Kaby Lake继承了目前的Sk y L ake核心、也就是第六代Core架构，所以光从IC设计角度来看，Kaby lake的CPU性能实际上是止步不前的。唯一不同之处在于，Intel对14纳米工艺进行改良升级、号称14纳米+ ，新工艺拥有更好的晶体管性能。这主要得益于14纳米+工艺加高了晶体管的翼剖面、以及更宽的栅间距，同时它还提升了晶体管内部的互联性能—借助这些芯片内部的工艺改进，Kaby Lake的晶体管性能比前代产品提升了将近12%，这给它带来了更出色的能效表现。

　　我们来看看Intel给出的对比表，如果我们以2010年的第一代Core架构为参照物，当时能耗最低的移动处理器功耗为18瓦，到了第四代架构时，功耗降低到11.5瓦，能效提升高3.5倍；而到第六代Core，能耗进一步降低到4.5瓦，能效提高了整整八倍！那到了现在的kaby lake，虽然最低能耗保持在4. 5瓦，但性能提升显著，能效比的提升幅度达到了10倍！也就是相对于现在的第六代Core，Kaby lake的能源效率提升了20%。

　　增强的Speed Shift技术：加快响应速度

　　在第六代Core架构中，Intel就引入了一项名为“Speed Shift”的电源管理技术，它的主要改进系统的突发响应时间。我们知道，Intel过去一直采用SpeedStep移动电源管理技术，配合操作系统，可以根据工作负载的不同、动态地调节处理器的工作频率和能耗，从而达到节能的目的。但这项技术的缺点是必须经过操作系统，频率的切换速度较慢、最快也得30毫秒，所以在SpeedStep状态下，虽然系统实现了节能、延长电池续航力的目的，但却让人感觉到系统的响应速度明显要慢于全频状态。Speed Shift技术很好地解决了这个问题，它绕过了操作系统、让处理器能够直接与电源控制单元沟通，并将所有电源状态都开放给操作系统，三者配合之下，Speed Shift平台最快可以在1毫秒的时间内完成状态切换。

　　不过，第六代Core架构的Speed Shift只针对原先的节能机制，Intel还有一项睿频（turbo boost）技术，它的逻辑刚好与SpeedStep相反—睿频可以在C P U面对高负载应用下将运行频率提高数百个MHz，达到加速运行的目的。不过第六代Core的睿频切换延迟需要接近100毫秒，而现在Kaby Lake平台也对此作出改进，新一代SpeedShift技术可以让睿频状态的加速延迟降低到5毫秒。

　　要说明的是，是否开启Speed Shift，CPU的性能基准都是一样的，它的功能在于能够大大提高不同负载的切换速度，从而将性能效率提升最多20％。为了便于理解，Intel举了个一个赛车的例子，同样两辆赛车，没有Speed Shift技术的在遇到弯道时要减速通过后才能加速，而加装Speed Shift技术后可以不减速甚至加速通过弯道—这就意味着，用户在面对高负载应用时，新一代Kaby Lake平台会拥有更高的处理速度。

　　更高频率带来显著性能提升

　　而体现在最终产品上，就是Kaby Lake可以在同等功耗时工作在更高的频率上，比如同样为15W功耗，Kaby Lake核心的Core i7 7500U的频率为2.7GHz，睿频最高到3.5GHz；而现有的Core i7 6500U频率只有2.5GHz，睿频最高只有3.1GHz，两代产品的差距还是比较明显的。在体现商用性能的Sysmark 2014评测软件中，7500U的性能比6500U高出12%左右；而在体现Web性能的WebXPRT 2015的评测软件中，7500u的性能提升达到19%。不过最大幅度的提升还是WinRAR压缩解压应用，7500U的优势扩大到28%，这主要得益于睿频时额外增加的400MHz频率提升。

　　Kaby Lake的GPU部分

　　kaby Lake的GPU核心同样继承上一代产品，在Intel的体系中仍属于第九代架构，它的图形核心依然由EU单元构成，内部设计没有什么变动。根据处理器版本不同，Kaby Lake的GPU也分为GT2、GT4等多种配置，性能最高的GT4包括72个EU执行单元，GT2为24个执行单元，数量与第六代Core相同，不同的地方在于Intel提升了eDRAM四级缓存的配置—比如最高性能版本可以集成多达256MB的eDRAM四级缓存，而现有第六代核心最高只能到128MB，我们会在后面的产品系列对此加以进一步的介绍。

　　在没有明显改动EU单元内部设计、提高EU数量的情况下，指望KabyLake的图形性能有大幅度提升是不现实的，这对于用户来说多少会有些遗憾，虽说我们不应对核显要求太高，现行的性能也能满足应用需要，真正需要高性能的用户又会去选择独立显卡，用户对此不会太苛求。但Intel的问题在于，如果AMD的Zen架构能够按期在2017年发布，那么就会对KabyLake带来明显的压力—Zen架构有望在处理器性能方面赶上Intel，而图形性能是AMD的强项，它的APU虽然CPU性能孱弱，但图形性能每一次都表现抢眼。所以对Intel来说，Kaby Lake一如既往的图形性能会有一些麻烦，至少用户对它们会很不感冒。

　　值得庆幸的是，Kaby Lake在视频性能方面获得大幅度的增强，Intel为它加入了增强的视频引擎，它包括MFX（Multi-Format Codex，多媒体解码器）和VQE（Video Quality Engine，视频质量引擎）两个部分。

　　MFX单元与VQE引擎

　　MFX是一个增强的解码器单元，它增加了10bit HEVC和8/10bit VP9格式的编码器和解码器—其中，HEVC是一套先进的视频格式标准，它可以让1080P视频内容的压缩效率提高50%左右，这就意味着同等带宽下、可以获得更高质量的视频。这项优势让它被认为是H.264、MPEG-4的最佳代替者，能够满足4K、8K视频时代的内容压缩要求。不过，HEVC也因此具备更高的算法复杂度，对硬件要求要比H.264高得多，之前Intel的核显只提供到8bit的HEVC硬加密能力，面对10bit HEVC内容时仍只能依靠CPU低效地完成。而在Kaby Lake架构中，我们看到这个可喜的变化，新加入的MFX单元将让观看4K HEVC高清内容变得轻松自如。

　　VP9则是Google开发的视频格式，它是一套开放的压缩标准，它可以提供比H.264更好的图像质量、同时码率却只有它的一半左右。Google在Youtube网站上率先采用VP9标准，VP9也获得不少流媒体网站的支持。很遗憾，国内用户因为网络限制的原因无法访问Youtube。但对国外用户来说，VP9硬件编解码能力能够给他们带来很大的便利—Intel第六代核心并没有支持VP9编解码功能，用户访问Youtube和其他采用VP9格式的视频网站时，还必须依靠CPU进行软解，播放高清资源时会给系统带来较大的负担。而这次Kaby Lake纳入了VP9的编解码功能，其中支持8bit的硬编码和8bit/10bit的解码，这让KabyLake平台在在线视频应用中具有显著的性能提升。

　　除了这两项重要改进外，Kaby Lake的MFX单元还改善了无线显示时的画面质量，也提升了现行H.264/MPEG-4 AVC编解码的性能。

　　VQE引擎则在第四代Core架构时开始引入，现在它有了新功能：它具有更宽的色域，并且在高动态范围和标准动态范围下都能获得应用。为了实现这一点，Intel对VQE引擎作了进一步改进，包括反交错、降低噪音、色彩增强、色彩校正等等。同时，新一代VQE还拥有更好的能效表现：在实现宽色域和HDR支持时，它只需要消耗40-50毫瓦的能源，近乎可以忽略不计，这让它在播放4K内容时，能够提供更好的画面观赏效果，同时又不需要担心设备发热会显著上升。

　　实际性能增强

　　Kaby Lake的上述改进，让它得以胜任4K时代的现实需求。Intel现行的第六代Core架构，只是支持传统的H.264/MPEG-4 AVC格式编解码和VP8格式的编解码，它们最高只能在1080P视频内容中进行硬件加速支持，任何超过1080P清晰度的高清视频，都只能依靠CPU进行软解。KabyLake对视频引擎的增强，很好地解决了这个问题，面对4K视频都可以进行硬件加速，显著降低了平台负担、具备更高的实用价值。

　　我们用数据来更直观地看出这一点。Kaby Lake平台，可以支持最多8组4Kp/30（4K逐行、30帧速率）的超高清视频同时播放；或者是流畅地播放4Kp/60（4K逐行、60帧速率）的高质量视频，此时视频的流速达到120Mbps，这意味着KabyLake的媒体引擎要在一秒内完成120Mbit数据的实时解码，运算力相当强大。而它的能源效率也非常可观：功耗只有4.5W的Y系列处理器，就可以完成HEVC格式的4Kp/30视频的实时编码，也就是像Macbook这样的超轻薄小本，都可以很好完成这类繁重的视频创建任务。

　　那么对终端用户来说，换用新平台和沿用现行的第六代平台，又能带来多少实际的好处呢？首先一个最明显的好处就是降低了能耗。Intel采用《钢铁之泪（Tears of Steel）》的开源电影短片来展示两代平台的差异，视频基于10bitHEVC格式、4K清晰度，在现行的Core i7-6500U平台中，视频播放是依靠GPU和CPU一起混合解码的，此时CPU占用率要达到50%左右，而CPU/GPU的整体能耗达到10.2瓦。另一套Kaby Lake架构的对比平台则采用对应的Core i7-7500U处理器，由于它可以完全由CPU进行硬解码，CPU/GPU的功耗只有惊人的0.5瓦—这也意味着足足具有20倍的能源效率提升，而播放本地4K视频时的电池续航时间也因此可以提升2.6倍之多！

　　如果应用的对象换为在线视频、结果会如何呢？对比的上述两个平台都用Chrome浏览器来播放Youtube上的4K VP9格式视频，其中Corei7-6500U在CPU/GPU部分用了5.8瓦能源，而Core i7-7500U只用了0.8瓦，能耗降低了7倍！换算过来，在播放Youtube的4K视频时，Kaby Lake平台可以获得1.75倍的额外电池续航时间。我们知道，目前基于Core i7-6500U的笔记本电脑，在播放这类4K视频时一般具有4小时左右的续航力，那么按此推算、Core i7-7500U平台就能达到7小时左右—也就意味着全天候的4K播放能力。不仅如此，Kaby Lake提供的性能冗余也让它为未来做好了准备，比如它可以胜任360度的4K内容、也就是沉浸式的4KVR应用，而当前的第六代Core平台无法满足这一点。

　　Kaby Lake的产品线分布与前次升级一样，Kaby Lake拥有一个完备的产品线，包括S系列、H系列、U系列和Y系列，跨越从高性能桌面、工作站到超轻薄笔记本的广阔市场，具体到产品型号上还是划分为i7、i5、i3三个不同等级。

　　针对桌面和工作站：S系列S系列面向的是高性能市场，它包含许多不同的型号，主要以锁频与否、功耗和GPU配置作为区分。其中性能最高的是K开头的型号，它拥有四个处理器核心，搭载GT2级别的常规图形核心，最大的特点是不锁倍频、允许大家自由超频，它的功耗也达到91瓦。很明显，这个型号是为旗舰级桌面准备的，游戏玩家们都是搭配怪兽级显卡，所以处理器的图形核心安置个基本的GT2就可以了。这个系列的发布时间会在2017年初。

　　面向主流桌面的四核处理器则锁了倍频，功耗在35瓦到65瓦之间，它搭载了性能更高的GT4图形核心，内部集成了64MB的四级缓存，它的发布时间会比不锁频的K系列稍迟一些。

　　而针对服务器和工作站的Xeon系列四核处理器，没有整合图形核心有80瓦、54瓦和25瓦三种不同的能耗配置，主要面向需要与GPU加速卡配合的高性能计算平台。而带GT2图形核心的有25-80瓦能耗配置，它们主要面向Web服务器、文件服务器、FTP服务器这类常规的商业云环境。

　　S系列的芯片平台采用“处理器+PCH”的组合方案，PCH也就是我们过去常说的南桥芯片、负责对外I/O功能。处理器部分，S系列支持双通道DDR3L-1600和DDR4-2400两种方案，OEM厂商可以自行决定要采用哪种内存。此外，它还包括一条PCI Express3.0 X16规格的图形总线、用于外接显卡，接口的带宽达到32GB/s。另外，它还支持三路数字显示接口输出，以及一个eDP嵌入式接口。

　　PCH方面，Kaby Lake可以兼容第六代Core的100系列芯片组，不过它配套的应该是改进后的200系列产品，除了USB 3.1支持、HDA高清音频、SATA硬盘总线外，200系列芯片将原本的20路PCI Express 3.0总线提升到24路，总计提供48GB/s的双向带宽，可以支持Intel的Optane硬盘—它实际上是Intel的3D XPoint闪存技术的正式名称，介于传统内存、固态硬盘之间，可以提供极高的性能和极低的延迟，过去我们曾对这项技术作过专门的介绍。

　　针对高性能笔记本电脑：H系列

　　H系列是Kaby Lake的移动高性能版，它采用BGA1440封装、TDP功耗在35·45瓦范围内。H系列都拥有四个CPU核心，35瓦功耗版搭载标准版的GT2图形核心，面向主流高性能市场。不过，Intel还为顶级玩家准备了45瓦功耗的顶级型号，它将搭载GT4图形核心，并内建了128MB的eDRAML4高速缓存—不过它还不是最快的，Kaby Lake H家族还包含一款高达256MBL4缓存的顶级型号，没有例外的话，它也将成为KabyLake家族中图形性能最出色的处理器。

　　H系列同样采用处理器+PCH的解决方案，功能强大、但需要较大尺寸的主板才能容纳。

　　针对超极本：15/28瓦的U系列

　　U系列是Kaby Lake的移动低功耗版本，主要针对的就是超极本市场。U系列采用BGA1356封装，功耗最低的版本TDP为15瓦，最高的型号是28瓦。U系列都包括两个CPU核心，图形部分有GT2、GT3两个版本，这两者的区别主要就是内建的eDRAM四级缓存—GT2版本并不包含、只能共享内存作为显存，而GT3内建了64MB的eDRAM，性能会更出色一些。

　　与前两个系列相比，U系列很重要的一个特点就是内建了SOC功能，也就是将PCH芯片与Kaby Lake CPU芯片集成在一起，这样就在一个处理器封装模块上同时实现包括CPU、图形核心、芯片组等所有的功能，主板的设计尺寸因此可以被大幅度缩小。我们可以见到，当前搭载第六代Core架构U系列处理器的超极本都可以做到惊人的轻薄尺度，原因也是处理器封装里包括PCH芯片。

　　内存支持方面。U系列也是双通道DDR3L和DDR4，不过它在I/O方面的功能久相对弱一些，比如只支持两路数字显示输出和一个嵌入式eDP显示接口，更遗憾的是居然只能支持到USB3.0、无法支持更快的USB3.1，这未免有些落伍。此外，对于SSD它也准备了SATA和PCI Express两种接口，可以很好地满足现实需要。

　　针对平板电脑：4.5瓦的Y系列Y系列其实就是之前的CoreM产品，面向的是平板电脑以及追求极致轻薄的超便携机型，这也是当今PC市场的主要关注热点。Y系列采用BGA1515封装，它的主要诉求就是低至4.5瓦的超低功耗水平，这让它可以保持无风扇运行。Y系列都整合了GT2图形核心、不带eDRAM高速缓存。由于Y系列面向尺寸更小的计算市场，处理器封装也采用SOC设计、同样集成了PCH芯片。

　　Y系列的I/O功能与U系列完全相同，它也没法原生支持USB 3.1。如苹果想在新一代Macbook中加入这个功能，就只能依靠第三方的解决方案。

　　需要换Kaby Lake平台么？

　　如果你再用的已经是六代平台或者四五代平台，纯粹因为性能的关系升级到七代平台，我们认为你或多或少都会觉得失望，Kaby Lake平台的性能固然得到提升，视频方面的能力也非常强大，但它更多是一种渐进式的改进。

　　Intel也深知这一点，它采用五年前的PC平台作为参照物加以说明—对比五年前的平台，KabyLake在商务应用中可以获得1.7倍的性能提升，比如将Word转换为pdf时速度更快，winrar压缩解压的速度也快得多；此外，Kaby Lake可以很好地胜任4K视频创次建和播放的需要，这对于视频工作站来说意义重大。通俗一点说，我们认为五年下前的PC也能够完成大多数日常任务，但如果升级到Kaby lake平台的话，大家可以直观地感受到运行速度更快、CPU占用率更低、平台的发热量更小、风扇更加安静。假如你要在电脑中运行多个虚拟机，那么就会恨不得榨取每一分的性能，Kaby Lake平台在这些方面就有明显优势：毕竟它的工作频率更高、发热量还更小。因此，从这些人性化体验的角度来看，我们认为升级到新一代平台还是有着明显的好处。

　　到现在为止，Intel都没有在PC市场上感受到竞争压力，它最大的对手其实是自己的前几代产品，挤牙膏式的缓慢升级，让前几代产品，也能够满足工作的需要，在各大企业纷纷缩减开支的今天，一套商用PC平台的生命力往往在6～7年，新平台不会对这类客户带来多少吸引力。

　　Intel还需要面对的一个潜在问题，就是AMD的Zen架构能具有什么样的表现，假如Zen在处理器性能和效率上赶上Intel的步伐，那么Intel将重新经历久违的市场竞争—毕竟AMD在图形领域具有不对称的优势，它所欠缺的其实就是一个强有力的CPU平台。我相信消费者乐见于此，没有竞争，市场只会一潭死水、厂商缺乏前进的动力，我们也无法看到IT技术所应有的高速演进。

　　文/张健浪

……

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容