入门级手机迎来AI曙光 从ARM发布的全新产品说起

  • 来源:微型计算机
  • 关键字:手机,AI,ARM,新品
  • 发布时间:2018-06-14 10:05

  AI技术已经不是什么新鲜玩意了。在华为、苹果、三星、高通等厂商的最新产品中,AI技术都以各种各样的形式加入其中,并为新一代智能手机提供了更为强大的功能和性能体验。不过目前的AI都面向顶级产品,对终端用户或者入门级用户而言,AI技术依旧是可望而不可及的。那么,AI和相关技术何时会入驻入门级手机产品呢?ARM近期发布的新品,让人看到了希望。

  ARM新品机器学习成亮点

  ARM去年发布了大量针

  对中高端市场的产品,其中既包括了Cortex-A73、Mali-G72这样针对高端市场的产品,也包括Cortex-A55这类追求极致能耗比的小核心。其中最引人瞩目的就是配合全新的DynamIQ,Cortex-A73、Cortex-A55以及Mali-G72在相关技术上的优化,ARM将在移动设备上全面加强AI计算和机器学习性能。面对高端市场的产品已经准备完毕,接下来就是面向终端和入门级产品了。这次,ARM拿出的是什么呢?

  加强机器学习 Mali-G52和Mali-G31

  目前ARM将GPU产品从高端到低端划分为高性能、主流和入门三个档次,上一代对应的产品分别是Mali-G71、Mali-G51和Mali-470,本代产品则是Mali-G72、Mali-G52和Mali-G31。不过在中档或者入门级SoC上,厂商宁可用较少核心数量的Mali-G71,也不会考虑Mali-G51等产品,因此在手机市场上我们几乎看不到不到采用主流和入门级架构图形的SoC产品出现。对此情况,ARM解释称他们面对的市场要更大一些,比如DTV等市场往往会选用Mali-G51等产品,这些产品并不是面向消费者的,因此不为人所知也是有可能的。除了这样的原因外,另一个原因其实也不难猜想,那就是诸如Mali-G51这样的产品性能比较弱,满足不了目前消费者的娱乐需求,因此更多厂商不得不采用高端的Mali-G71等产品,不过在Mali-G52上可能有所改观。

  根据ARM的数据,Mali-G52相对于前代产品最核心的改变在于其图形引擎中的单元数量翻倍。之前的Mali-G71、Mali-G51采用的架构被称为Bifrost,其中每个EU也就是图形单元中包含了4组FMA和ADD/SF流水线并组成了一个波前阵面,这在ARM的术语中被称为Quad,也就是“四倍”的意思。随着技术和应用的发展以及移动处理器在AR、高画质移动游戏等应用上需求的加强,Quad架构逐渐无法满足需求,效率还有进一步提升的空间。因此在Mali-G52上ARM将执行引擎中的流水线数量翻倍,单个EU中拥有8组FMA和ADD/SF流水线。新的EU单元核心面积并没有大幅度变化,只是前代的1.22倍,但是性能却得到了显著提升。

  另外Mali-G52的单个图形核心允许使用双EU或者三EU设计,这意味着在性能要求较高的场合用户可以在单个图形核心中并行使用多个EU单元来实现性能提升。比如单个Mali-G52默认状态下配置2个EU,拥有16组流水线,也可以使用3个EU的配置,这样就拥有24组流水线,比前代只允许12个流水线的配置方案性能密度更高。

  在像素和纹理方面,Mali-G52部分继承了Mali-G51的设计,也就是采用了双像素方案,每周期可以处理两个像素或者两个纹理像素。相比前代产品,Mali-G52的每核心纹理和每核心像素搭配都是固定的2个,而不是前代的1个或者2个可选。出现这样的做法,主要是考虑到前代的可选配置实际上带来了产品上的混乱,以及性能搭配上的不平衡等。实际计算来看,Mali-G52包含2或者3个EU单元,每核心的FLOPS为32或者48,如果计算额外的ADD/SF的话,那么则是48或者72。以常规算法来看的话,Mali-G52的浮点和像素计算能力的比例为32∶2或者48∶2,相比Mali-G51的12∶1,新的比例更符合现代移动SoC的实际计算需求,计算能力得到了更好的平衡。

  除了图形计算之外,在机器学习相关能力方面,ARM表示,在面向主流用户的设备中,目前考虑设置有关机器学习的专门模块还不太实际,这是综合考虑成本和性能等因素得出的结论。因此,机器学习的相关任务可以由整个SoC系统的每个组件组合发挥最佳性能来实现,包括之前提到的DynamIQ等。在Mali-G52上,ARM主要提升了计算8bit数据时的能力,这个性能达到了前代Mali-G51的3.6倍。从实际计算角度来看,机器学习本身在很多场合并不要求太高的计算精度,比如16bit浮点、32bit浮点等高精度计算对机器学习并没有太多益处,因此支持低精度甚至低精度整数计算来加强机器学习计算效能就显得很重要了。Mali-G52不但通过翻倍流水线提高了计算能力,还加入了8bit数据格式的支持,机器学习计算效能大幅度提升就顺理成章了。

  Mali-G31是ARM面向入门级用户的产品,其设计目标是用于取代Mali-400,而后者目前依旧被大量使用在各种对性能要求较低的车载设备、电视盒子等产品中。Mali-400的问题在于不支持新的OpenGL ES 3.0和Vulkan,因此对一些新的应用程序和算法支持不好。Mali-G31出现的目的就是用于解决这样的问题,它的架构实际上也和之前介绍的Mali-G52没有关系,采用了传统的ARMQuad架构,每个图形单元内拥有4个流水线和1个像素模块。当然,Mali-G31也支持每个图形单元配备2x4的流水线和2个像素模块。根据官方数据,Mali-G31相比Mali-G51MP2,面积减少20%,UI性能提高12%,而后者一般和内核填充效率息息相关。当然,由于定位过于低端,性能也较差,因此Mali-G31和机器学习等应用几乎没有任何关系。

  支持更多功能 视频处理器Mali-V52和Mali-D51

  除了GPU核心外,ARM发布的产品中还包括视频处理器和显示处理器。其中视频处理器主要用于支持视频编解码,本次发布的型号为Mali-V52,属于Mali-V61的后续产品,支持效率更高的4K@60Hz编解码,同时通过架构改进带来了能耗比和面积上的改善。Mali-V52相比Mali-V61,解码性能提高了2倍、芯片面积缩小了38%、HEVC编码改进了启发式模式因此处理可变块大小文件时质量提高了20%。

  另一款产品是Mali-D51,用于视频输出模块,替代之前的Mali-DP650。新的Mali-D51大量技术源于高端的Mali-D71,相比Mali-DP650,每平方毫米性能上提高2倍,支持多达8个组成层,系统功耗降低了30%,内存延迟降低了50%,和Assertive Display 5技术结合时支持HDR,基本上可以满足绝大部分用户对显示方面的需求。

  入门移动产品迎来AI曙光从ARM本次发布的产品来看,AI技术下探至千元级、入门级手机是完全可以期待的,这将带来AI技术的普及化,也可能是智能手机被发明后最大的产业变革。目前国内和欧美发达国家的智能手机普及率非常高,市场已经基本进入饱和发展阶段,消费者也对所谓的性能升级、屏幕大战等感到疲惫。在这种情况下,整个业界如果希望产业继续高速发展的话,那么一定需要要找到一个全新的切入点,引领新的技术革命,带来完全不一样的使用体验,才能够重新激活市场需求。

  AI恰好是这样一个热点。从现有的技术应用情况来看,AI能带来相当多的全新应用体验,包括摄像增强、语音识别、智能语音助手、手机习惯学习、场景学习、照片学习等,这些新的应用体验再结合AR、VR等新的技术,又可以诞生出更多的应用场景,甚至可以进一步延伸到诸如教育、医疗、商务等领域。举例来说,目前的智能语音助手借助AI技术,在语音识别成功率和含义学习方面,已经有了长足的进步,进而带来的实时语音翻译、会议现场语音记录,关键信息识别和保存等,已经产生了一个全新的市场,这些未必不是移动设备尤其是智能手机未来的发展方向。在图像识别方面,对照片后期处理包括降噪、HDR、多帧合成、以及视频拍摄的防抖、图像颜色信息处理等,AI都还大有施展空间,拍照效果更好的手机,是不是又将是消费者升级换代的理由呢?

  从产品端来看,目前AI在移动设备上主要还是应用在高端设备上,中低端市场的产品在AI方面尚未开始布局。在硬件方面,除了ARM自己外,华为、高通都在努力推广相关AI加速硬件,希望将AI进一步拓展到更多市场层级。本次ARM通过发布新品,推出了全新的核心,加强了入门级和中低端档次的移动设备在机器学习方面的能力,显然是从架构层面打响了AI全面铺开的第一枪,这将有力促进AI的进一步发展和普及。即使以目前的核心架构和硬件能力无法完成更富有实用意义的机器学习计算,部分初级应用在入门级设备上实现也将成为必然,这将推动AI产业在移动设备上更进一步、更为快速的普及和发展。

  文、图/李实

关注读览天下微信, 100万篇深度好文, 等你来看……