GMIC全球移动互联网大会 2017人工智能未来趋势深度报告

  前不久,在GMIC全球移动互联网大会上,天风证券海外首席分析师何翩翩(美国麻省理工学院电机工程学士、人工智能硕士、MBA三学位获得者)分享了关于人工智能未来发展趋势的报告。

  报告称,在过去5-10年里,人工智能开始得以商业化和普及,主要鉴于计算能力的快速增加:摩尔定律的突破,让硬件价格加速下降;云计算及并行计算的普及;以及GPU的使用让多维计算能力提升,这些都大大促进了AI的商业化。

  何翩翩表示,随着硬件越来越便宜,云计算的应用成本越来越低。2006年以前,很少会使用到GPU做人工智能的训练,GPU的出现也使人工智能得以普及。十年前,如果一个电脑里有4个GPU其实就已经很好了。晚上的时候把数据模型发出去训练,早上会有结果。现今,谷歌云计算上面使用了超过1200个GPU。同样的数据模型在谷歌的云计算上运行其速度可以想象。可十年前后这个差别是极其之大的。

  目前,国内外人工智能的讨论范畴一直都围绕着五个点:强度、能力、广度、监督和自主性。通俗地讲可以概括为:机器训练智能化的程度;用来解决什么问题;特定性向通用性的延伸;监督和无监督;人工智能是助手还是主角。

  语音识别接口

  人工智能最终的目的是希望可以模仿人类大脑的操作方式。其中,智能助手应用的关键在于语境意识,以及如何在语境中灵活地展现功能。以Siri,谷歌,百度度秘为例,当有人问“史帝夫·乔布斯是谁?”时,三个系统基本上可以给出一致的答案。但若问“乔布斯是哪一年出生的?”Siri会说“我不懂”或帮你找到网页,而百度很可能给你另外一个人的信息,只有谷歌会说他是1955年出生的。谷歌通过积累超过十年的自然语义联结处理技术,能够解决用户发出的连续性提问中的上下文指代关系。这个问题目前在Siri和度秘中都没有办法很好解决。据悉,每天谷歌接收到的搜索请求有50%来自手机,在美国有20%的搜索是通过语音指令完成的。

  智能回复和机器翻译

  2016年9月,谷歌正式推出的聊天软件Allo使用了智能回复来通过对用户的对话记录生成智能回复选项,Allo的智能回复有严格的要求,要求将延时控制在200毫秒以下。2017年,谷歌又发布了神经机器翻译系统,实现了机器翻译技术迄今为止的最大进步。

  以“小偷偷偷偷东西”为例做英文翻译,第一个“小偷是名词”,第二个“偷偷”是形容词,第三个“偷”是动词,谷歌会翻译的很通顺,而度秘和Siri很可能就把“偷偷”给省略掉了,直接翻译为“小偷偷东西”。虽然这句话只有七个字,但不同的组合却可以产生很多不同的意思。在谷歌的语言模型里,在翻译的同时还会配上语法。

  完全无人驾驶

  在AI引领下,智能驾驶对交通运输和汽车制造业带来革新颠覆。智能驾驶作为人工智能落地最快、产业空间最大的应用方向之一,行业当下处于优势资源聚拢整合的阶段,整车厂商以及新兴科技巨头纷纷加大布局。

  现今,无人驾驶分为两大阵营,一个是以谷歌、百度等科技公司为代表的超级式阵营,一个是传统汽车厂商和Mobileye合作的递进式阵营。其中,超级阵营强调通过采集某一区域的高精度3D地图信息配合激光雷达在某一区域实现无人驾驶;递进式阵营强调“万无一失”的复杂传感器组合识别周围环境,低精度导航地图,在任何区域实现无人驾驶。但两大阵营都怀抱终极愿景:在任何区域达到完全无人驾驶。

  无人驾驶的配件包括长短距离的雷达、摄像头以及高精密的GPS。目前,GPS系统多多少少都会有几米的差距,单位差距缩小到几厘米是有可能的。Mobileye跟特斯拉合作的是第三代的芯片,这个芯片并不是特斯拉所标榜的自动驾驶,而只是一个ADAS系统。这个系统可以进行变道提醒和防追尾提醒,比如司机要改变行车道,它会给提醒,或者是后面的车跟得很近,也会给你提醒。

  如果要达到无人驾驶,必须要有其他的传感器、硬件的配合。谷歌使用的激光雷达的系统,但这个系统很贵。虽然谷歌无人驾驶的项目已经做了很多调整和改变,但业内比较担心其数据收集多元性的问题。谷歌的无人驾驶只能在美国的四个州收集数据,但这四个州车辆比较少,所以收集的数据也比较单一。

  很多人都有一个问题,传统的汽车产业有没有可能像特斯拉一样,自己研究自己的无人驾驶技术,并超越之前的合作方案。打个比喻,如果特斯拉是无人驾驶里的苹果,Mobileye就是无人驾驶里的安卓。它们采取的是完全开源的一个情况。今天,Mobileye跟宝马和英特尔合作其实是完全开源的,各个汽车企业得到这个算法之后,就可以自己在上面去做。未来,汽车企业也会跟Mobileye有一个非常紧密的合作。甚至会在Mobileye的平台上搭建他们的系统。

  可以说,越级式阵营依靠强大的技术背景和巨额的研发投入成为行业翘楚,递进式阵营伴随智能驾驶完善的方向前进,拥有更为清晰的商业化道路。预计,智能驾驶会在2020年迎来黄金十年,同时带动产业链衍生市场的大规模催化扩张。

  未来谁是AI芯片的主流

  GPU在过去一年里很火,未来谁会是人工智能芯片的主流?其实真正能够颠覆GPU使用是量子。但是量子计算在5年之内绝对不会有突破性的发展和商业化的发展。不少人在想,TPU是否可以取代GPU?其实它们各自都有各自的定位,TPU的出现,其实是谷歌自己觉得在价格方面,或者是在某一些应用中,不一定需要用到GPU,所以他们发明了这个东西。以AlphaGo为例,下棋的时候有361种下棋的方式,但不可以把整个数都进行计算。所以,需要TPU减去一部分的数据。TPU和GPU最大的区别,就是在浮点上的精准度。TPU可以应用到减数据这个方面。

  当减完数据之后剩下50条,这50条里的每一个节点,就代表每一步棋。一般来说,一条数据里有150到180个节点,每一个节点都需要计算一个分数,累计下来就是赢率。到底哪一条数据可以达到最大的获胜机会,这些必须用到GPU去操作。所以,不可以说TPU会取代GPU,它们都有着各自的功能。

  MIT人工智能五大趋势预测

  首先,最先出现的两个趋势应该是正向强化学习和对抗性神经网络。AlphaGo可说是深度强化学习技术的一个里程碑。GAN很有可能会在无监督学习还没能普及之前让计算机变得更加智能的关键所在。

  其次是语言学习。语音识别和语音接口,在技术和应用场景方面已经算是AI里面较为成熟的,计算机通过语言与我们交流和互动,理解语言的上下文含义,将使AI系统获得全方位的实用性提升,这也是AI步入夏天的第一步。

  第四个趋势是,2017年中国开始成为人工智能主要参与者。BAT的布局,加上国内投资者对于AI创业公司的投资热情高涨。政府方面也在积极推动政策扶持,预计在2018年前投资约150亿美元。但我们也发现关于AI的夸张报道铺天盖地,而AI的炒作也达到了令业界人士不安的程度。我们认为这样对AI可能会造成揠苗助长的负面效果,继而导致创业公司因估值过高而步向失败以及投资枯竭的情况。

  第五个趋势就是面对炒作我们应该深呼吸一口气,头脑时刻保持清醒,理智的去看待AI行业的下一步发展,踏踏实实的去做好AI应用的研发工作。

  本报记者 张欢

关注读览天下微信, 100万篇深度好文, 等你来看……