多核心、APU、国产x86 2016年处理器重点技术及产品回顾

来源:微型计算机
关键字:处理器,技术,产品
发布时间:2017-04-14 11:28

　　事物在发展过程中，都有不同的阶段，而对于处理器这条产品线来说，2016年就是那进入爆发一刻的前夜—就AMD而言，2016是新一代ZEN架构处理器加速冲刺的一年，ZEN处理器的各种研发、流片工作已经全部完成，ZEN将在2017年展现出它的全部威力。同样，在2016年英特尔也加紧推出了其采用14nm+工艺的Kaby Lake移动版处理器，并将在2017年带来性能更加强大的台式机版产品。因此简单来看，2016年就是处理器通向那性能大爆发的前夜，只不过在这一夜却并不那样平静，处理器厂商依然给消费者带来了众多惊喜。

　　AMD：大力推广多核心运算

　　随着编程语言、编程技巧的提高，各类游戏、应用软件对多核心处理器的支持也越来越好。因此传统处理器厂商AMD在2016年的一个重点就是加大力度普及多核处理器。首先在今年第二季度，AMD在倍受玩家关注的千元级处理器市场推出了最新的8核心处理器：FX-8370。经过工艺上的改良，FX-8370处理器的最大加速频率达到4.3GHz之高。同时它还配备了名为“幽灵”的四热管大型散热器，可借助“幽灵”散热器稳定超频到4.8GHz，算术性能达到可观的99.47GOPS，其性能在中高端处理器中非常突出。当然，AMD也没有忘记主流市场的消费者。在2016年发布的新速龙8 45就是其中值得一提的产品，它采用了更先进的CARRIZO核心，核心面积相比上代产品缩小了2 3%，功耗降低了4 0%。同时它仍采用了四核心设计，并拥有3.8GHz的加速频率，价格却不到40 0元，这让它在市场上得到了主流消费者与网吧业主的青睐。

　　AMD：不断提升能耗比的APU

　　依靠工艺的进步，AMD的APU在2016年也保持了高速更新，首先最值得关注的就是A10-7860K处理器。虽然这款产品采用的也是Kaveri Refresh核心，但A10-7860K的TDP热设计功耗却从A10-7850K的95W大幅降低到45～65W（动态调整），而它的处理器加速频率仍保持在4.0GHz，GPU频率还从720MHz提高到757MHz，使得这款APU具备更高的能耗比。同时AMD还在2 016 年推出了一款旗舰级A PU产品—A10 -78 9 0 KAPU。得益于工艺上的优化，这款APU的处理器与图形核心工作频率都有不小的提升。其加速频率达到4.3GHz，拥有多达512个流处理单元的GPU核心工作频率则进一步增加到866MHz。从实际使用来看，A10-7890K APU已具备在全高清分辨率、中等画质设定下流畅运行《坦克世界》、《使命召唤：黑色行动3》的能力，令它成为高配整合电脑中的首选核心。

　　AMD：率先在整机产品采用新一代APU

　　在2016年，AMD还发布了基于Bristol Ridge架构的新一代APU。Bristol Ridge和Kaveri APU关系不大，反而可看做是之前移动版APU：Carrzio架构的进化版本。它的CPU部分采用了改进版本的“挖掘机v2”，GPU部分改进至GCN 1.3（或者称为GCN 3.0）。Bristol Ridge的主要特色在于它具备更高的同频性能，并大幅提升了显示核心的工作频率，旗舰产品A12-9800的GPU加速频率达到1108MHz之高。当前，Bristol Ridge APU主要用在惠普、联想等厂商的整机产品上，预计2017年会出现在零售端市场上。

　　总体来看，独显平台方面，AMD提供了完整的多核心处理器解决方案—从不到400元的四核心处理器再到700多元的FX-8300八核心处理器，乃至上千元的高频八核心产品；而在APU方面，同样从几百元到最高千元出头的多款APU也让用户能以很低的成本就拥有四核心处理器，以及可流畅运行主流游戏大作的GPU核心。这些产品都遵循了AMD长久以来“相同价格、性能更强”、“相同性能、价格更低”的产品设计策略，而这正是AMD面对强敌能不断发展、生存的主要武器。显然，如再借助内部设计与性能上取得大幅进步，即将上市的ZEN架构处理器Summit Ridge，AMD处理器在2017年的表现将更值得期待。

　　英特尔：整合更多核心主攻高端与服务器

　　在主流消费级市场，英特尔今年仍以去年发布的第六代酷睿处理器为核心，如Core i7 6700K、至强E3-1230V5仍是今年的明星产品。因为主流领域的市场需求得到满足，所以在今年英特尔的更新重点放在了消费级高端与服务器领域，其所依赖的就是Broadwell-E/Broadwell-EP核心。

　　由于本次从Haswell-E/Haswell-EP进化至Broadwell-E/Broadwell-EP属于英特尔架构改进中的“核心不变、工艺改进”的步骤，也就是传说中的“Tick”步骤，因此整体核心只是微调。如乱序调度器窗口更大（从60提升至64）、允许更多的指令被重新排队，相应地提高了IPC，其IPC性能略微提升了5%。架构方面的总体改进并不大，包括core和uncore的前端、指令解码、缓存、各种功能单元、总线、接口等，都基本维持了和Haswell-EP一样的设计。尤其是从Ivy Bridge-EP就开始使用、在Haswell-EP上大幅度改善调整的环形总线，在Broadwell-E/Broadwell-EP上得到了全盘继承。相比之前的Haswell-EP上最多挂载18个处理器核心，Broadwell-E/Broadwell-EP上最高可挂载24个处理器核心，其双向、分组环形总线的设计和缓冲器方案，使得英特尔能够在更多核心的情况下，实现核心资源的有效调配和控制。因此Broadwell-E、Broadwell-EP处理器的一个主要更新就是推出了核心数更多的产品。

　　消费级产品方面，英特尔推出了最高拥有10核心的Core i7 6950X；服务器领域上，英特尔更带来了拥有22核心的至强E5-2699V4处理器，以及拥有24核心的至强E7-8890V4。而这只是开始，在2017年英特尔还将很快推出多达32核心、64线程，基于Skylake-EP核心的至强E5-2699V5。究其原因，还是在于现在支持多核心运算的软件越来越多，不论是家用运用环境还是服务器应用环境，都可以通过增加处理器核心数量在体验上获得一定的改善，因此核心数量的增加还将持续进行下去。

　　英特尔：全面应用14nm频率获得小幅提升

　　另一方面，英特尔处理器在今年的最大改变就是全面采用了14nm，包括采用Broadwell-E/Broadwell-EP核心的高端处理器与服务器产品。它们不仅更节能、可以容纳更多的元件、生产成本更低，也带来了处理器工作频率的提升。如在Broadwell-E处理器核心上，它还带来了一个新特性—支持Intel Boost Max Technology（IBMT）3.0技术，与睿频2.0技术配合（而非取代），使得处理器最大睿频达到了4GHz。而它的TDP依旧与Haswell-E一样为140W，在其核心、线程数进一步增加的同时，TDP依旧不变，足见14nm工艺确实不容小觑。

　　而在服务器处理器方面，尽管至强E5 V4版本的核心数已达到最高22颗，但英特尔仍为它设计了较高的工作频率。其最新推出的E5-2699A V4处理器的基准频率达到2.4GHz，睿频加速最高频率甚至可到3.6GHz，而TDP却仍仅有145W。因此在今年架构没有大幅改变的情况下，通过核心数量的增加与频率的提升，英特尔高端处理器与服务器产品在性能上仍获得了明显的进步。

　　英特尔：“挤牙膏”的代表—Kaby Lake开始崭露头角

　　主流市场方面，尽管英特尔在今年剩下的一点时间里，很可能不会发布采用Kaby Lake核心的第七代台式机酷睿处理器，但其笔记本版本产品已经上市，一些渠道也泄露了相关性能，Kaby Lake的具体特性也已基本展现出来。总体来说，Kaby Lake只是Skylake的加强版而已，主要改进了14nm生产工艺。优化后的14nm工艺使用了更高的鳍片与更宽的栅极间距，可减小驱动电流，降低漏电概率；而更宽的栅极间距则可以降低晶体管密度，允许每个晶体管产生的热量有更多的空间扩散，这有助于降低内核温度并提升频率，这也就是说Kaby Lake可以使用更高的工作频率，具备更好的超频能力。如其旗舰版Core i7 7700K的默认频率就达到4.2GHz，而Core i7 6700K的默认频率为4.0GHz。此外根据泄露出的评测数据来看，Kaby Lake的风冷超频频率可以稳定在5.0GHz。因此Kaby Lake处理器的改进实质还是提升能耗比—在同样功耗下，工作在更高的频率上。同时Kaby Lake配套的核芯显卡对4K视频的回放进行了改良，增加了H.265 Main.10、VP9 8/10-bit格式的硬件解码与编码，不仅可流畅播放更多格式的4K视频，也可大幅降低4K视频播放或编码时的功耗。

　　综合来看，在处理器领域英特尔近几年来执行的“Tick-Tock”战略并不是让用户很满意，尤其是在主流消费级产品领域—“挤牙膏”几乎成了每一代英特尔新处理器的特征。那么什么时候才能再出现从奔腾4到酷睿那样翻天覆地的变化呢？这或许还得看竞争对手能给英特尔带来多大的压力，我们期待在预计2018年发布的10nm Cannon Lake上能看到这样的奇迹。

　　兆芯：大有潜力的国产x86处理器

　　在以往每年的年终特刊处理器盘点中，我们一般只会总结AMD与英特尔两家，且与消费级应用紧密相关的x86处理器。而在今年总结文章的最后，我们认为兆芯这一主攻消费级应用、在2016年行业市场上有所斩获的国产x86处理器，也是值得一提的。从技术层面来说，兆芯与AMD、英特尔尚有差距，其主力产品有开先ZX-C四核和ZX-C+四核两类处理器，两者均基于28nm工艺制造，主频最高2.0GHz，兼容x86指令集，支持CPU虚拟化技术。规格上来看，它们并不出众，但它们的优势在于有针对中国政府、军队的安全性设计。特别是ZX-C+四核处理器支持SM3和SM4高速国密算法指令。对于一般消费者来说，他们是用不到SM3、SM4国密算法的，该算法主要嵌入到商业、电信、金融应用中，并在这些应用建立通讯信道的时候，启用这两种加密算法。最简单的例子，我们的银行卡、手机卡、社保卡、身份证都有使用国密算法用来保护信息、通讯指令。而在计算机应用中，国密算法则是主要保护那些按保密法规定、涉及机密的文件、党政机关文件，以及来自电子政务网的文件传输都会采用类似加密。传输的时候软件自己就会进行加密，再到另一端进行解密。但是如果处理器不支持SM3、SM4算法指令集，那么它们就会用软件加速进行加密、解密，速度会很慢。而兆芯的ZX-C+处理器由于在硬件设计上先天就支持SM3和SM4高速国密算法指令，因此其加密、解密速度会明显快于普通x86处理器。

　　同时根据MC评测室的多次测试来看，即便是“低配”开先ZX-C四核处理器也可以轻松完成Word文档编辑、多网页浏览、1080p高码率高清视频播放、图片编辑等办公应用，与AMD、英特尔的产品在进行这些应用时也没有明显差别。甚至在搭配低端独立显卡的时候，ZX-C处理器也可在高画质设定下流畅运行《英雄联盟》、《穿越火线》等主流网络游戏。也正是基于其的确具备可用性，兆芯ZX-C处理器已被联想、同方、仪电等国内整机厂商采用。基于兆芯ZX-C处理器的联想开天M6100台式机、开天A610K一体机、昭阳CF03笔记本等产品也通过了国家强制性3C认证、能效一级认证以及中国节能认证、绿色环境标志认证，并正式入围政府采购的节能产品目录和绿色环境标志产品目录。同时，采用兆芯国产x86通用处理器的整机也先后在上海市所属的近400家单位正式应用。

　　因此我们认为，如果兆芯处理器未来的生产工艺能按时顺利升级到16nm，并完成主板北桥芯片组与CPU的整合，实现架构上的飞跃，那么兆芯处理器不仅将进入更多的政府单位，甚至有可能进入消费级市场，让普通PC也用上我们的国产处理器。

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容