高通年度大招来了! 解析骁龙835
- 来源:微型计算机 smarty:if $article.tag?>
- 关键字:高通,骁龙 smarty:/if?>
- 发布时间:2017-03-29 11:14
高通骁龙处理器在2016年可谓风光无限,骁龙820和骁龙821两款处理器几乎横扫了所有的顶级安卓手机。本着“宜将剩勇追穷寇”的精神,在CES 2017上,高通又发布了全新旗舰—骁龙835处理器。这一次,高通又会在骁龙835上带来如何强悍的性能和特别的设计呢?
在CES 2017上,高通公布了型号为骁龙835的全新SoC。作为率先使用三星10nm LPE FinFET工艺制造的处理器,骁龙835将替代骁龙820/821两款产品,成为新一代的顶级处理器。骁龙835的芯片封装尺寸比骁龙820缩小了35%(有助于改善了电子产品的内部空间),包含超过30亿个晶体管,在性能和功耗上都有不小的进步。终端手机厂商有望借助骁龙835推出拥有更强性能、更出色设计以及更轻薄的手机新品。接下来,MC就详细为大家解读骁龙835的各个方面。
三星10nm LPE FinFET工艺为基
对于SoC而言,更新的工艺可算是最重要的部分。原因很简单,新工艺的晶体管体积更小,单位面积上可以容纳的晶体管数量更多,驱动电压也更低。如果说晶体管体积和密度对应的是设计人员能够在芯片内部塞入更多晶体管、实现更多的功能或更强的性能的话,那么更低的驱动电压就可以进一步降低新产品的功耗。再加上新材料和工艺设计上的改进,进一步降低漏电,新品就能实现相比老产品更低的功耗和更高的性能功耗比。
三星推出的最新工艺是10nm LPE FinFET,从命名就可以看出,新工艺的最小线宽可达10nm,并且采用了FinFET技术,大幅度降低了漏电等问题。为了克服缩放限制,新工艺还采用了三重曝光、应力优化等技术以及改善性设计。根据三星的数据,相比之前的14nmLPE,新工艺在芯片面积上缩小了大约30%、性能方面提高了27%(或者降低40%的功耗)。除了10nmLPE外,三星还将继续研发工艺技术,使用更低K(介质常数)的材料,并在2017年推出新的10nm LPP FinFET,进一步降低功耗和提升性能功耗比。
从晶体管间距来看,三星的10nm工艺使用了全新的Mask和全新的库文件,其晶体管间距要比英特尔的14nm更小一些,显著小于之前三星、GF以及TSMC的14nm、16nm工艺。从制造角度来说,所谓10nm、14nm、16nm的意义并不显著,因为这些数值更多是商业上的宣传,性能方面最好只和自家产品相比而不要跨品牌(除非技术源自一家)。比如TSMC、三星的16nm FinFET和14nm LPE,在晶体管尺寸上其实和英特尔的22nm差距不大;三星10nm LPE又和英特尔14nm在晶体管尺寸上相距不远。当然,涉及到芯片制造这样的复杂环节,各家所用不同的材料和工艺控制都可能实现完全不同的结果,具体问题还需具体分析。
首个半定制化产品
之前骁龙820采用的是Kyro架构的自研处理器,在性能和功耗上表现都不错。但是在骁龙835上高通一反常态,并没有继续使用自家的Kryo架构,转而使用了一种全新的商业模式打造了新的处理器架构Kyro 280,这种商业模式被称为“Built on ARMCortex Technology”,简称为BoC。
之前ARM提供了两种技术授权模式供企业选择,其中一种是购买处理器授权,比如Cortex-A57和Coretx-A53的处理器授权,然后不加以改动使用在自己的产品中。如骁龙810、麒麟960以及联发科旗下绝大多数处理器,都直接购买处理器授权然后研发生产。另一种则不太多见,是购买架构许可,比如骁龙820的Kyro架构,是由高通向ARM购买了相关架构内容,包括ARMv8这样的64位处理器指令集,然后自行研发处理器架构。现在,ARM有了第三种方式,客户可以向ARM购买某类处理器的授权,但是对这些处理器拥有一定的修改能力,借此生产自己的半定制化核心,使得最终产品的性能和功耗与自己所需的目标更为紧密地结合一致,或者与专有知识产权比如总线、GPU等更好地结合。当然,这种授权的可更改内容是有限的,仅包括部分内容,而诸如处理器解码器宽度、执行流水线等内容都不建议或者不允许客户修改。因此,大量的修改内容就只涉及处理器的前段内容包括分支预测、指令获取等。
骁龙835使用了四个定制的大核心和四个定制的小核心,组成了典型的big.LITTLE配置。但高通并没有说明Kyro 280是基于哪些核心架构定制的,不过可选的大核心无非就是Cortex-A73和A72,小核心只能是Cortex-A53。和预计的一样,高通完全没有给出任何有关Kyro 280究竟修改了公版核心哪些内容的信息,甚至是否使用ARM CCI-500缓存相关性互联总线还是自己内部设计总线也不得而知。不过只能修改处理器前端部分的话,高通可能会增大指令窗口、增加可以乱序执行的指令数量。
频率方面,虽然是定制化版本并采用了10nm工艺,但是高通看起来并没有“飚频率”的想法。Kyro 280的大核心最高只运行在2.45GHz,小核心最高只能运行在1.9GHz,高通宣称在应用载入、网页浏览、VR、3D游戏等复杂应用时等会调用大核,另外80%的时间都是小核心。根据之前的经验,ARM在使用14nm/16nm工艺节点时,Cortex-A73最高可运行在2.6GHz~2.8GHz,在新的10nm下频率突破3GHz并不是不可能的事。出现目前的情况有如下几种解释:
●高通Kyro基于Cortex-A72而不是Cortex-A73,相比之下,双发射、较短流水线的Cortex-A73相比三发射、较深流水线的Cortex-A72在能耗比上表现要更出色一些,高通这样做可能是为了控制功耗;
●高通对半定制产品做出的更改限制了最高频率,比如增加指令窗口大小的设计;
●高通可能进一步平衡了CPU和GPU之间的能耗情况,将更多“热预算值”留给了GPU部分;
●高通可能考虑电池性能和能耗比等因素,认为目前的性能已经足够了。
在这种较低频率的设定下,在2017年年中或者什么时候高通很可能忽然推出一个频率更高的“骁龙840”来。反正迄今为止骁龙835并没有太过强势的竞争对手出现,放缓一点反倒对高通在市场上的操作更有好处。
在缓存方面,Kyro 280的大核心部分使用了2MB缓存,小核心则使用了1MB缓存,缓存的大小要比骁龙820大一倍。根据高通的说法,较大的缓存能降低数据存取内存的频率,同时提高性能并降低功耗。当然更换了处理器架构从而搭配更大缓存也是很可能的。另外,骁龙835的内存控制器由高通自行设计,没有使用公版方案。
为什么高通在骁龙835上选择了半定制架构而不是之前自研的Kyro?自研产品往往能更好地和自家其他架构相结合,并能更好地控制性能和功耗。对于这个问题,高通宣称他们只是在所有可选项之间反复衡量后,选择了最合适的技术。其中性能和功耗是最明显的标准,其他因素比如成本、可用性和市场营销等也会影响这个决定。很官方、很表面的回复,可参考的东西不多。
继续加强的GPU
骁龙835的GPU采用了Adreno 540,相比之前骁龙820上的Adreno 530,两者基本架构一样,因此产品型号也没有发生大的变化。高通宣称新一代产品专注于优化瓶颈,比如通过检查像素深度来剔除无效像素从而减少需要处理的像素工作量。当然高通还在ALU、寄存器等方面做了一些改进,不过没有更多细节可供披露。
Adreno 540相对于之前的设计,纹理滤波的效率更高、耗费更少了,比如每周期可以执行16个三线性过滤。相比之下,ARM-G71每周期只处理一个双线性过滤,或者每两个时钟周期处理一个三线性过滤。因此ARM-G71MP16最多每周期处理16个双线性过滤,但只能处理8个三线性过滤,只有Adreno 540的一半。
性能方面,高通宣称Adreno 540相比Adreno 530在3D渲染性能方面提高了25%,目前尚不清楚是由于GPU架构改善还是频率提升才带来这么大的提升。考虑到架构基本相同,频率提升也在意料之中。在API支持上,Adreno540支持所有最新的图形API,包括OpenGL ES 3.2、DirectX 12、Vulkan,此外还包括OpenCL 2.0以及Renderscript。
应用新技术的DSP、ISP在骁龙835中,高通应用了全新的Hexagon 690 DSP,不过遗憾的是高通没有透露更多信息。另外,在骁龙835中还有两个额外的DSP处理器(这一点和骁龙820一样)。其中一个在X16LTE的调制解调器中执行信号处理,暂且不表。另一个比较有趣,高通称其为All-Ways Aware Hub,顾名思义,这款DSP是一直活动的,它位于单独的电源区域中,并连接到一系列不同的传感器上,通过支持GoogleAwarenessAPI能够实现诸如计步、LTE、Wi-Fi或者蓝牙LE之类的定位。
在ISP方面,骁龙835拥有名为Spectra 180的双14位ISP,支持高达3200万像素的单镜头或者两个1600万像素的双镜头。目前双镜头是旗舰手机最重要的功能之一。新的ISP增强了对混合自动对焦系统的支持,并且能够根据照明条件来选择合适的对焦方法。它还支持双光电二极管相位检测自动对焦(2PDAF),这种技术通过将每个像素(通常是较大的1.4μm像素)拆分成两个光电二极管,其中一个用于图像捕获,另一个用于相位检测。通过使用每个像素进行相位检测来加强自动对焦性能,甚至暗光条件下可达PDAF的两倍。除了2PDAF外,Spectra180还支持反差式对焦、激光对焦、红外对焦、PDAF相位对焦、2PD对焦等,并根据情况不同自动选择。另外,Spectra 180还能够支持HDR,它设计了一个固定的功能模块来执行硬件加速的ZigzagHDR(zzHDR)—这是一种HDR成像技术,它通过Z字形检测对角线数据来获取曝光值。zzHDR能够用于实时预览HDR图像,记录HDR视频或者捕获HDR照片,除了照片分辨率略有牺牲外,不会损失任何快门速度。
持续改善的续航
除了前文所述的使用了新工艺、big.LITTLE技术外,高通还采用了其他一些技术来加强续航设计。包括名为Symphony System Manager的频率和电压控制模块,能够精确控制GPU和其他部分的频率和电压,实现对电池能源利用的最大化。
高通宣称新的骁龙835相比骁龙820功耗降低了25%,比之前大受好评的骁龙801降低了高达50%(不过并没有说明测试情况)。在具有QHD显示器和3000mAh电池的手机中,骁龙835能够提供3小时以上的连续4K视频编码播放和2个小时的VR游戏时间。此外,骁龙835还支持更快速的QC4.0充电技术,兼容USBType-C和USB PD标准,更新了高通INOV电源管理算法,能够进一步降低电池循环损耗。相比QC3.0,QC4.0的充电速度能够快20%。
强大的无线连接能力
骁龙835集成了一个X16的LTE调制解调器,能够使用3×20MHz的载波聚合和256-QAM以及4×4MIMO和2×2MIMO实现下行链路高达1Gbps的速度。上行方面,2×20MHz以及64-QAM的设计能够最高达到150Gbps,也就是X13标准。
由于通讯标准提高,骁龙835的手机如果支持所有的通讯接口的话,需要布置四个蜂窝移动网络天线和Wi-Fi、蓝牙、NFC等,加起来一共需要7到10个天线。由于手机中空间极为有限,厂商可能使用较小的天线用于较高频率的通讯,将4×4MIMO限制在1.8GHz和2.6GHz之间的中高频段,较低频段使用2×2MIMO。不过即使到2017年,支持千兆网络的运行商依旧很有限,因此骁龙835的4天线设计有可能被用来加强信号。
骁龙835可以与W CN3990芯片配套,提供2×2 MU-MIMO,蓝牙5.0以及FM收音、802.11ac Wi-Fi功能。这是首个蓝牙5.0的解决方案,能够提供高达2Mbps带宽,是之前蓝牙4.2的两倍。在功耗方面,相比骁龙820,骁龙835的Wi-Fi功耗降低了60%,LTE/LAA/Wi-Fi可以共享天线设计,因此手机中天线可以减少3个。此外,Wi-Fi方面如果有额外配套芯片支持的话,能够实现高达4.6Gbps的802.11ad Wi-Fi。
支持更多高级功能的摄像
从目前移动产品的发展趋势来看,从软件到屏幕尺寸和分辨率、再到材料和设计,下一个爆发点应该是相机或者摄像头。在2016年,苹果在双摄像头上的努力让人们看到了一种新的市场刺激方法,随后几个旗舰手机都纷纷采用双摄像头设计,并且今年这样的设计还将持续增多。
之前在ISP部分,我们曾提到骁龙835增强了对双摄像头技术的支持。实际上,Spectra 180还专门为双摄像头的不同使用场景做出了优化,它能够支持不同放大倍率的两个镜头,比如iPhone 7使用的广角镜头和56mm镜头,LG G5使用的广角和鱼眼镜头,Spectra 180支持平滑缩放功能使得用户可以在两个镜头之间任意切换。除此之外,OEM厂商还可以使用高通的Clear Sight算法来整合两个不同摄像头传感器的输出图形。比如第一个传感器可以使用传统的RGB拜耳式滤色器阵列来获取颜色数据,第二个黑白传感器可以用于收集亮度信息而不是更多的光信号。这种技术可以使得图片获得比只使用传统单个RGB传感器更高的亮度,并降低噪点、加强对比度,最终起到提高画质的作用。
在图片的后期处理上,骁龙835继续支持谷歌Halide语言,并配合Hexagon 690 DSP对图像进行硬件加速处理。谷歌在骁龙820中就利用它实现了手机的HDR+功能,提高了图像的质量,骁龙835也可以这样做。并且骁龙835的DSP支持实时面部检测和识别,大量美图类软件可以利用其实现自动美容算法或提高对焦性能。当然,这些高级的成像功能需要大量的硬件和软件开发才能实现,高通正在考虑推出骁龙相机模块。它包含了已经预制完成的硬件/软件模块,方便厂商直接应用到手机上。目前高通已经推出了三个模块,包括支持PDAF的单个相机模组(使用索尼IMX298摄像头)、支持Clear Sight的双摄像头以及支持光学变焦的双摄像头。
除了摄像功能外,骁龙835也在视频功能上做出了很大优化。骁龙835的VPU和DPU目前已经可以解码和显示4K超高清(HDR10)功能。DPU能够输出具有10位彩色的2160p到支持HDR的显示器上—不过目前尚未有任何支持这种色彩显示的移动设备面板出现。另外,目前桌面的G-Sync和FreeSync等帧同步技术大行其道,骁龙835的DPU也带来了Q-Sync,基本技术原理都差不多,GPU输出画面的帧率和显示器刷新率一致,能够带来更平滑的游戏体验。
视频解码能力方面,骁龙835支持对2160p@60fps、1440p@120fps或1080p@240fps的H.264(AVC)和H.265(HEVC)视频的解码。视频编码最高为2160p@30fps、1440p@60fps、1080p@120fps或720p@240fps。视频稳定功能方面,骁龙835和骁龙820都使用了EIS 3.0视频稳定技术,但前者加入了新的轨迹平滑算法。
不容错过的VR和机器学习
目前最受人关注的无疑是VR,骁龙835对这方面的支持自然也不能落下。骁龙835的市场目标是头戴式显示器或者谷歌Daydream这样的设备。一般来说,VR需要更高图像分辨率,同时需要对音频定位、手势识别和空间跟踪等技术提供很好的支持。这为设备带来了巨大的计算负荷,设计人员需要在每个板载处理器之间保证良好的性能和紧密协调性。此外,VR设备的延迟也是非常重要的一环,较高的延迟和卡顿会让玩家变得头晕甚至无法继续使用。高通宣称骁龙835的延迟大约为15ms,相比骁龙820的18ms略有降低。
在头部追踪方面,骁龙835使用的视觉惯性测量系统通过Hexagon 690 DPS处理来自摄像机的流失视频数据(大约30fps),前文提到的All-Ways AwareDSP以800MHz~1000MHz的速度捕捉加速度计和陀螺仪的数据,然后这些数据会形成确定的拥有六个自由度的定位信息。高通表示,DPS在这方面的应用效率比CPU高出4倍。
除了VR、AR外,机器学习也是目前的热点产业。高通发布了骁龙神经处理引擎SDK,这个SDK能够利用骁龙835的异构计算能力来加强机器学习。此外,骁龙835还可以支持客户创建神经网络层和实现对TensorFlow的支持,后者是一个使用数据流图执行机器学习的开源库。高通宣称骁龙835的Hexagon 690是第一款支持TensorFlow和Halide框架的移动DSP。
在安全方面,骁龙835加入了Heaven安全平台,提供了对眼球、面部、指纹、虹膜、声纹等几乎全部生物识别技术的支持,还加强了移动支付的安全性,使得用户的资金和数据更有保障。
写在最后
看了这么多,可以说骁龙835的确是目前移动计算市场上最出色、最全面的移动处理器之一。骁龙835拥有全新的半定制架构的CPU、加强的GPU。在人们一般不太关注的地方,比如DSP和ISP上,骁龙835也有了很大的进步。其Hexagon DSP能够带来强大的计算能力和大量新功能。此外,ISP部分的加强也让2017年的旗舰手机在摄影方面能够给用户更棒的使用体验。当然,强悍的通讯能力也是高通那句“买基带送处理器”玩笑话的来源,高达1Gbps的下载数据流以及对几乎所有无线通讯协议的支持,使得骁龙835成为手机、平板等产品最好的选择。
当然,我们还需要特别提及,由于骁龙835拥有更强的性能和更为先进的技术,使得大量设备有望使用骁龙835来驱动,这其中不仅包括手机、平板等,还有网络摄像机、VR/AR设备以及最新推出的支持Windows10的超便携电脑—这种设备除了可以运行支持通用Windows平台的应用程序外,还可以运行x86(32位)的Win32应用程序。这或许会直接挑战英特尔在入门级市场的地位。总的来看,在2017年的舞台上,骁龙835带来了太多的可能性,我们会在更多不同领域的产品上,看到它的身影。
文/徐少卿