聪明的手机能做什么事? 6大品牌AI语音助手深度体验

  • 来源:微型计算机
  • 关键字:手机,AI语音助手
  • 发布时间:2018-10-09 10:47

  提到手机上的AI人工智能,往往绕不开语音助手这一功能。对普通用户来说,语音助手比其他AI功能更直观独立一些,还可以像一个益友与之对话,执行用户的语音指令,对用户嘘寒问暖,将冷冰冰的前沿科技变成“暖男”。所以在当前的智能手机上,AI语音助手已经被视为一个加分项。这其中,苹果的Siri、三星的Bixby、小米的小爱同学、华为的小E、vivo的Jovi和OPPO的小欧都已经广为人知。不过,你一定没见过这6个“小机灵”齐聚一堂的情景吧?让我们一起来看看它们聚在一起会发生哪些有趣的故事。

  测试平台及唤醒姿势

  在不少用户的心中,对语音助手的印象还停留在网络上各种调戏Siri的段子里。的确,早期的语音助手由于没有AI芯片的助力,智慧程度较低。不过自从苹果A11、高通骁龙835/845、麒麟970等AI芯片被运用在智能手机上后,语音助手的能力得到了大幅度的提升,可以深入系统底层调用各种App,可以学习用户的使用习惯变得更加简便,可以理解不同用户的说话习惯并联系情境加深理解……当然,这些最新的特性,需要在这些AI旗舰手机和最新的固件上才能得以展现,所以我们挑选了下面6款机型,并更新了最新的推送固件。

  iPhone X—Siri

  系统版本:iOS 11.4

  唤醒姿势:长按电源键、语音指令“嘿Si ri ”,支持熄屏唤醒

  作为出现时间相对较早的语音助手,Siri经常被形容为“地主家的傻儿子”,但是在iOS 11中,苹果大大提高了这个人工智能助手的“智力”。不仅声音变得更像人了,也开始慢慢有了“情景意识”,答非所问的概率得到了很大程度的改善。同时,Siri能够调用的第三方应用也逐渐增多,甚至可以记录下用户的使用习惯,在所有登陆同一Apple ID的设备上同步共享。在iOS 11.4和iOS 12beta固件中,Siri还陆续增加了隔空播放命令(识别AirPlay命令)和快捷方式两大功能。

  三星Galaxy S8—Bixby

  系统版本:G9500ZCU2CRF2(Android 8.0)

  唤醒姿势:独立“Bixby”按钮、语音指令“Hi Bixby”,支持熄屏唤醒

  随着Galaxy新品的发布,Bixby也升级到2.0版本,并适配三星Galaxy S8。三星Bixby 2.0此次推出的中文版本,支持三星自主研发的双引擎自然语音理解模块,能理解复杂的指令,对于那些信息不全的词汇也可以识别。Bixby包含了语音、视觉、主页、提醒四大功能,提供人工智能多模交互体验。在应用覆盖方面,Bixby 2.0目前支持超过20个第三方中文应用,比如QQ/微博/支付宝等主流应用,都能通过BixBy进行各种语音操作。

  小米8—小爱同学

  系统版本:MIUI 10 8.5.30(Android 8.1)

  唤醒姿势:长按电源键0.5s、语音指令“小爱同学”,支持熄屏唤醒

  从MIUI 9.5开始,过去只“居住”在小米AI音箱中的小爱同学就在手机中和大家见面了。得益于骁龙845的AI特性以及MIUI 10的优化,小米8上的小爱同学更加聪明。在通过电源键或语音指令唤醒后,小爱同学可以帮助用户设定日程闹钟、掌握天气路况、录入语音备忘,同时还支持语音驾车模式,全程以语音实现收发信息、接打电话、点歌导航的操作。如果你觉得这还不够强大,甚至可以在“小爱训练计划”中根据自己的喜好,通过录屏、教学的方式设置小爱同学要执行的回答和操作。

  华为Mate RS保时捷设计—小E

  系统版本:EMUI 8.1.0(Android 8.1)

  唤醒姿势:语音指令“你好,小E”或其他指定词,支持熄屏唤醒

  过去EMUI版本上的小E助手,虽然能够在一定程度上帮助用户,但只能识别指定的语音指令。EMUI 8对小E助手进行了全新升级,不必拘泥于以往命令式的下发,并可以识别用户的复杂问题,比如当你说感觉手机有点卡,小E助手就会辨别你的意图并清理后台应用,释放内存空间。从功能上看,华为将小E划分为3类用途:对手机进行快捷设置;搜索本地或在线内容;调用第三方程序实现打车、付款、扫码、订机票等生活辅助功能。在设置中,用户可以将5个生活服务设为常驻服务,实现更加便捷的操作。

  vivo NEX—Jovi

  系统版本:FuntouchOS4.0(Android 8.1)

  唤醒姿势:长按智慧按键、语音指令“小V小V”或“Hi,Jovi”,支持熄屏唤醒

  升级版的Jovi语音助手深度覆盖了系统基础功能和常用的第三方应用,并搭载了深度自然语言理解技术,能够准确地从自然语言中提取有用信息,理解复杂逻辑关系。同时,用户可以对Jovi进行命令教学,如果你不想手把手教它,你可以在Jovi广场直接学习其他用户分享的命令。值得一提的是,Jovi和OPPO的小欧都集成了语音翻译功能,可以进行实时翻译,出国旅行十分实用。

  OPPO FindX—小欧

  系统版本:Color OS V5.1(Android 8.1)

  唤醒姿势:语音指令“小欧小欧”,支持熄屏唤醒(可直接通过声纹直接解锁屏幕,但安全性较低)

  OPPO Find X中搭载的“小欧小欧”语音助手,支持全局一句唤醒,在任何情景下说出指令,语音助手就会直接做出响应。在交互设计方面,有别于传统MIC方案,Find X采用了智能MIC方案,具备声纹识别功能,在识别到唤醒词后可以直接解锁屏幕。同时,小欧还支持多层级跨应用的操作,用户可以对指令进行自定义,比如一条指令就可以开启蓝牙、播放音乐等多重操作。基于小欧助手,Find X还加入了与之匹配的智能驾驶模式,通过语音指令完全解放双手,完成导航、收发信息、播放音乐等操作。

  设备控制和基础功能调用

  在最初的设定中,AI语音助手就像一个管家一样,帮助主人更简便地使用手机。所以,控制手机基础功能是每个AI语音助手必备的能力。这里面分为两部分,一是在设置中帮助用户对手机进行各种设定,二是调用手机最基础的通信、导航等内置应用。最初,语音助手能够听懂的指令并不多,发展到现在已经可以摄取指令中的关键词,根据语境来理解用户的自然语言,或是通过与用户的逐渐深入的对话中理解用户的意图。现在,我们就来看看6大语音助手的表现。

  电话和短信功能

  测试指令:“打电话给老婆”

  “发短信告诉妈妈今天不回家吃饭”

  作为智能手机,最基本的功能当然是通话和短信。在双手忙碌着其他事情的时候,通过语音助手来快速接打电话、发送短信显然非常方便。这其中,6个语音助手都能完全听懂用户的拨打、接听、发送短信至XXXX的简单指令,比如“帮我打给电话给老婆”、“接听来电”或是“发短信告诉妈妈今天不回家吃饭”。我们发现,针对这一基础功能,语音助手已经脱离了过去只能识别固定指令的初级状态,即便通讯录中存在多个同名的联系人,语音助手也会机智地反馈给用户,并给用户多个的选择:“你想打电话给老婆的哪个号码”。奇怪的是,在升级到最新的MIUI 10后,小爱同学偶尔会无法找到通讯录中对应联系人,在小米社区中也有不少米粉反映这一问题,相信在后续的OTA升级中将得到解决。

  屏幕亮度、手电筒等基础设置

  测试指令:“把屏幕亮度调到最亮”

  “我觉得屏幕太亮了”

  “打开手电筒”、“关闭手电筒”

  每一部智能手机都囊括了多种功能,而这些功能除了通过App实现外,还可以通过多层级的设置选项操控。在iOS和Android系统中,常用的设置选项都被放置在下拉工具栏里,而通过语音助手,我们能不能控制这些设置选项呢?我们挑选了日常生活中常常用到的屏幕亮度调节和手电筒开关进行了一番测试,测试指令分别为“将屏幕亮度调到最高”、稍显生活化的“我觉得屏幕太亮了”以及“打开手电筒”、“关闭手电筒”。根据测试结果来看, 大多数款手机都能够快速地识别用户的标准指令,对生活化的“我觉得屏幕太亮了”也能够理解。其中,Siri可以以每档25%力度进行调整屏幕亮度,但无法打开手电筒(闪光灯);小爱同学同样每次加减25%;小欧在处理调整屏幕亮度的指令时偶尔有出工不出力的问题,界面显示已调整屏幕亮度,但实际亮度并没有变化。三星Bixby无法理解用户“觉得屏幕太亮了”的潜台词,或是联网搜索结果,或是直接关闭屏幕。华为小E能够实现前三个指令的操作,以每档10%自动调整屏幕亮度,但暂时还不支持“关掉手电筒”的指令。

  导航(驾车和公交路线)

  测试指令:“导航到恒大名都”

  “我想坐公交车去恒大名都”

  “导航先去恒大名都,再去观音桥”

  在导航这一环节,我们将其分为三个场景:准备驾车出行前的路线规划、准备乘公共交通出行的路线规划以及多目的地的驾车路线规划。对于单目的地的路线规划,6个语音助手都驾轻就熟,其中大多数手机调用的是系统内置的地图软件且无法更改,而小爱同学、OPPO小欧在初次使用时会弹窗供用户选择需要的地图软件。在询问“我想坐公交车去恒大名都”时,Siri的默认地图可能搜索到多个对应关键词的目的地,所以需要用户再次确认想要去的位置,随后才会进行乘车路线的规划。当进行有途经地点的导航时,调用默认地图的Siri无法进行这一操作,使用百度地图的多个Android语音助手里,也只有Jovi能够直接理解了用户“先去某地,再去某地”的意愿,使用了地图中的增加途经点功能进行正确导航。

  稍复杂的组合指令

  测试指令:“把屏幕自动锁定时间调整为1分钟”

  “打开相册(图库)里最新一张图片”

  除了上述的普通场景外,我们使用智能手机的日常中肯定还遇到一些不常用的系统功能,比如觉得屏幕锁屏时间太短,需要进入设置的多层菜单中才能调整自动锁屏时间;又或者,我们回放一下将刚刚拍摄的图片。这样的多层级操作,语音助手能不能挑战成功呢?经过多次的测试,大多数语音助手对前两个操作都无法做出反应,很显然,调整屏幕自动锁定时间这一操作的步骤比此前的指令复杂了许多,目前大多数语音助手的“智力”还无法理解如此多步骤的指令,或是理解了却不能组合实现,只有三星Bixby可以进行屏幕锁定时间设定的操作。而面对“打开相册里的最新一张图片”这一指令,多数语音助手仅能够识别到“打开相册”这一步,也仅有三星Bixby可以全屏显示相册中的最后一张照片。可以看出,针对更为复杂的多层次指令,三星Bixby显得更为聪明一些,能够理解到一句话中的多步操作指令。

  第三方应用程序调用

  早在iOS 10系统上,苹果就将Siri向开发者开放了,允许第三方应用程序通过API整合Siri语音助手体验,这些支持Siri的第三方应用,在设置中可以看到一项“Siri与搜索”的开关选项。相对封闭的iOS系统都能做到这一点,出生时间稍晚一些的Android语音助手表现又是如何呢?

  播放指定的歌曲

  测试指令:“(用酷狗音乐)播放歌曲《小幸运》”

  对于这样意图直接的指令,语音助手显然理解起来并不困难。在Siri这里,由于iOS比较封闭的原因,它只会调用默认的系统音乐软件,或是在指令中明确说出需要调用的第三方音乐播放软件,我在《网易云音乐》、《QQ音乐》和《酷狗音乐》中测试,Sir i仅能够打开该应用首页,无法直接播放指定歌曲。在Android智能手机上,语音助手都能够直接播放歌曲,无需点击屏幕进行选择。同时,Android阵营的语音助手均能够调用常见的几个音乐播放软件进行播放,对第三方App的兼容性更好一些。

  微信发红包

  测试指令:“在微信里给老婆发100元红包”

  本来,我们以为这个指令对于语音助手来说不算难事,就像是微信发消息一样简单。但实际测试的结果和预想的有点不一样。Siri在听到这一指令后直接给老婆发了一句“发10 0 元红包”,老婆看到后就真的发了10 0元红包给我,让我获得了一笔意外之财。华为小E也显然无法明白发红包的意思,面对我的要求总是答非所问地回答 “红包多多,快到我碗里吧”。小米小爱、OPPO小欧、vivo Jovi和三星Bixby可以自动进行搜索联系人—发送红包—输入金额的多步操作,用户只需要输入支付密码即可。而且,Jovi还支持在QQ中进行发送红包的操作。显然,部分厂商对语音助手调用付款功能还是持谨慎态度,毕竟这涉及到用户的个人财产安全,如果语音助手在付款方面获得了较大权限,以后的支付生活中不仅需要剁手还需要堵嘴了。

  发送指定内容的朋友圈、微博

  测试指令:“把最新一张照片发送到朋友圈(微博),内容为今天不上班”

  在常用的社交软件中发送文字内容是大家常用的场景,对于智能助手而言,发微信应该是极其简单的,那发微信朋友圈、发微博又是怎样的情况呢?测试中,Siri对这样复杂的指令无法识别,在经过多次的测试中,都无法发文字或图片到微博和朋友圈里。小米小爱和vivo Jovi能够按照指令将图片、文字发送到朋友圈,但在微博里,它只能够打开应用,无法直接发送文字和图片。华为小E无法发朋友圈,但可以直接发文字到微博中。只有三星Bixby获取了相对较高的权限,在微信和微博中中它可以全自动地完成单文字或单图片的分享,甚至可以完成文字+图片的分享,比如用户的“把最新一张照片发送到朋友圈(微博),内容为今天不上班”。整个过程将由语音助手自动完成,只需要用户最后说出“发送”指令即可完成,交互的程度更加深入一些。

  查看淘宝的订单

  测试指令:“打开淘宝的订单”

  淘宝是许多人网购的第一选择,所以针对这一App的语音控制,智能助手大都表现得很不错。Siri和OPPO小欧可以帮助用户打开淘宝,但无法搜索商品、打开我的订单。而三星Bixby、华为小E、小米小爱同学和vivo Jovi都可以完成打开淘宝、在淘宝里搜索商品、查看我的淘宝订单的操作,让剁了手的购物狂也能疯狂地买买买。

  日常聊天风格

  在Siri刚刚面世的那段时间里,网络上有不少调戏Siri的段子,有笑点但更多的是槽点,面对稍微“刁钻”点的问题,它不是答非所问,就是搜索网络的内容来应付。现在,这样的现象是否在语音智能助手上得到改善,它们能不能和用户进行一些非功能性的互动呢?我们特意准备了一组问答式的聊天来试探一番。

  “今天几号了?”

  “你今年多大?”

  “你父亲是谁?”

  “你刚刚说你多大来着?”

  “你有没有谈过恋爱?”

  “吃鸡!”

  “666”

  “今天很无聊,给我讲个笑话好吗?”

  ……

  可以看出,只有在面对用户的语音指令时,语音助手会根据一定的逻辑辅助用户,直至帮助用户达成目的,而在整个聊天测试环节中,对于非功能性的互动,6个语音助手均不会记录前后对话。比如,使用语音助手进行导航时,如果它搜索到多个雷同的位置,会询问用户想要去哪个地点,待用户回答后继续导航操作,这里就带有一定的前后逻辑联系;而在非功能性的互动中,即便你连续问了多次“你今年多大”这样白痴的问题,语音助手大多只会一成不变地回答,而不会说“你已经问过很多次了”。

  而在面对系统没有预设答案的的关键词,或是语音助手没有正确地获取用户的发音时,它们的反应也大同小异。三星Bixby、vivo Jovi和OPPO小欧全程都是搜索网络上的内容显示给用户看。而Siri、小米小爱则偶尔会展示出调皮的一面,与用户打起太极,避重就轻地回答,甚至略带有话痨的性子。

  我们特意在对话中放置了“吃鸡”这个网络热词,语音助手的反应又是如何呢?Siri在听到“吃鸡”后首先搜索了一下本地应用,告诉我找不到“吃鸡”这个应用,需要去下载,显然它理解了这一热词的含义;

  OPPO小欧和华为调皮地以百度百科的“大吉大利,今晚吃鸡”作为回应;小米小爱和vivo Jovi发现我没有安装“吃鸡”应用,赶紧去应用市场搜索并推荐我安装;三星Bixby虽然理解了“吃鸡”的意思,但除了“祝你成功吃鸡”外并无其他表示。

  智慧进阶1—学习能力

  在使用Siri进行导航的时候,我们注意到一个现象,第一次搜索某个目的地时,Siri会将所有符合的地点列出给用户选择;再次搜索这个目的地,Siri会在列出选择后补充询问用户:是否去上次选择的地点。可见,Siri具备了一定意义上的自主学习能力,但似乎限于记住用户的选择而已。在最新放出的iOS 12 beta版本中,Siri新增了快捷方式功能,用户可以为一组快捷动作设定多个命令,然后以自定义的短语激活它。而在OPPO小欧、vivo Jovi和小米小爱中,我们也发现了类似的学习能力。这其中,OPPO小欧以快捷指令为主,和iOS 12中的Siri相似,用户可以在设置中将多个语音指令合成为一个简短固定的命令,当用户说出这一“暗号”时,语音助手会按照既定规则连续执行多项操作。特别是用户经常遇到的固定场景中,比如临睡前说一声“晚安”,小欧就会查询明天的天气情况、查看明天的日程、设定闹钟并开启飞行模式。在我们的测试中,一个快捷指令里可以添加数十条以上语音指令,功能可以说十分强大。

  而在vivo Jovi和小米小爱中,AI赋予了它们能够通过用户录屏同步模仿的能力,vivo Jovi把它称为教学命令,小米小爱则称为录屏教学。这个功能和过去部分智能机中自带的远程录屏教学功能相似,语音助手就像一个初次使用智能手机的老年人,通过观看用户的动作同步还原。用户可以为这一系列录入的动作设定一个词或一个短句作为“暗号”,下次使用时直接对语音助手说出“暗号”即可。当然,语音助手的模仿能力超强,可以说是过目不忘,一教就会。不过也存在着这样一个问题,比如录屏“导航去恒大名都,再去观音桥”的动作后,小米小爱同学今后就可以实现多途经点的导航,但如果将地点替换成其他地方就无法举一反三了。所以,录屏教学的学习方式更适合使用频率高、步骤繁琐的操作。

  智慧进阶2—驾驶模式和其他功能

  在前面我们提到,OPPO小欧具备了智能驾驶功能,这一功能可以视作是语音助手在用户使用频率较高的驾车场景下,提供的普遍适用的全套解决方法。

  同样的功能,我们在Siri的CarPlay以及小米小爱、vivo Jovi的驾驶(驾车)模式中也能找到。过去的智能手机中,我们也偶尔见过内置了“驾驶模式”的功能,但仅仅是将常用应用以大图标、大字体的形势,对主界面进行重新排列设计,除了通过蓝牙解决接打电话外,其他功能依然需要使用手指进行触控操作。然而新修改的《机动车驾驶证申领和使用规定》对安全驾驶提出了进一步的要求,安全驾驶当中,机动车驾驶人的双手应该稳握方向盘,手动挡需换挡时才会单手瞬间或很短时间内离开方向盘,而另一只手还需稳握方向盘。这就要求今后要么开车不用手机,要么用手机完全不用双手。语音助手能不能帮助我们解决这一问题呢?

  驾车途中,我们使用手机的情况无非是以下几种:1.接打电话;2.阅读和回复短信、微信、QQ消息等;3.路线导航;4.音乐播放。首先在接打电话方面,OPPO小欧和vivo Jovi都提供了来电过滤功能,对于“黑名单”中的来电自动拒接,而白名单来电会自动语音播报来电人信息,并通过语音命令“接听电话”、“挂断电话”进行选择性操作。而路线导航、音乐播放这两项功能和此前普通模式下并无不同,语音操作起来完全没有问题。由于机动车驾驶人需要注意力集中,两者都提供了屏蔽通知提醒功能,驾驶时将不会再有悬浮预览和除了闹钟、导航、来电播报外的声音提醒。值得注意的是,OPPO小欧针对驾驶免打扰的设置更加详尽:考虑到特殊情况,即便是在黑名单中的来电,在3分钟内重复来电将会正常响铃;提供了拒接来电自动短信回复功能,回复内容可以预先设定;可以屏蔽来自QQ、微信的语音和视频来电。小米小爱的驾车模式相对简化一些,没有提供来电过滤和屏蔽通知的功能,但语音播报、语音回复短信、导航和音乐播放都能够实现。

  OPPO小欧、vivo Jovi并没有针对驾驶人车型做出限制,只要连接车载蓝牙系统就能自动启动,而Siri的CarPlay不仅对使用国家和地区有限制,还需要配备兼容立体声系统的特定汽车,目前仅有400多款车型可供选择。在这样相对严苛的要求下,CarPlay也提供了区别于一般驾驶模式的体验,最明显的一点就是它将离开手机屏幕的狭小空间,利用车载主屏幕进行显示,甚至可以通过部分车型方向盘上的语音控制按钮来激活Siri。在驾驶途中,CarPlay的界面并非完全镜像i OS系统,,仅保留了电话、信息、音乐。地图导航和其它类型的音频应用,同时还有包括《考拉FM》、《酷狗音乐》、《网易云音乐》在内的少量第三方App(在App Store中搜索CarPlay就可找到支持CarPlay的应用)。

  华为小E同样提供了相对简单一些的驾驶模式,包括了来电/短信播报、地图导航、音乐/电台应用,点击屏幕下方的的麦克风图标后,同样可以通过简短的语音指令实现路线导航、拨打电话和播放指定音乐的操作。除此之外,华为小E还贴心地提供了“找手机”功能,像我这样的大马虎常常就会出现短暂的“失忆”,一时记不起刚刚把手机放在哪个角落,这时候只要通过“你好小E”唤醒手机后,顺便问一句“你在哪儿”,小E就会以欢快的铃声回应你。

  写在最后

  在整个体验过程中,6款语音助手都给我留下了深刻印象。发展时间最长的Siri,其声线已经慢慢化去了明显的冰冷感,比较接近人声,声音更加好听了,不过对于系统权限的调用依然比较保守,缺乏一定的实用性;三星Bixby可以说是“智商”较高的语音助手,多步骤的操作天生就会,但缺乏更进一步的AI学习和驾驶模式;华为小E的驾驶模式虽然相对简单一些,却提供了“找手机”功能作为弥补;小米小爱、OPPO小欧和vivo Jovi表现得十分全面,基本覆盖了语音助手的使用场景,无论是系统权限的调用、多步骤动作的操作,还是更进一步的学习能力都很出色,特别符合国内用户的使用习惯。

  文、图/谢慧华

关注读览天下微信, 100万篇深度好文, 等你来看……