谁能拿到百万奖金?7款语音助手竞答大对决

  • 来源:微型计算机
  • 关键字:语音助手,竞答
  • 发布时间:2018-05-09 10:45

  想必大家都有看过幸运52和非常6+1等问答节目吧,节目中的参赛选手仅需回答数个问题就能实现自己的诸多愿望,这让众人羡煞不已。不过以前的节目可望不可及,而现在层出不穷的直播类知识竞答却可以让每个用户切身参与其中,你仅需答对12道题,就有机会获得百万奖金,面对如此高额的奖金,你准备好了吗?

  准没准备好是一回事,实际参与竞答又是另一回事,无论是当下正流行的《冲顶大会》、《百万英雄》和《芝士超人》或是其他平台,参赛的规则大同小异:一共12道题,每道题仅有10秒的回答时间,只要12道题全部回答正确,就能和其他网友共分最后的奖金,每场的奖金少则十数万,多则上百万。

  可以想到的是,虽然12道题看着不多,但以概率学的角度来说的话,全对的概率是3的12次方分之一,也就是1/531441的概率可以全对。当然其中有些题很常见,答案也显而易见,但也有不少难题需要平时的积累储备,不太容易答对。

  所以为了能提高答题的正确率,大家集思广益,又是背诵题库又是集体作答,好不热闹。不过我们今天要介绍的方法则更为简单粗暴—直接通过语音助手来帮我们回答这些问题。我们收集了市面上较为主流的几款语音助手:Siri、Bixby、Google、微软小娜、简单搜索、360语音助手和搜狗搜索,之所以选择这几款语音助手是因为其较为常见且均支持语音输入,这在答题过程中极为关键,短短10秒钟的时间内要识别问题并得出答案,这对语音助手的识别速度和准确度要求都相当之高,那么在这七款语音助手中,哪一款的表现会更出色呢?

  在实际测试中我们遇到了一点小麻烦—如果直接让主持人念题目的话,第一是太慢,每次主持人念完题目后只剩不到3秒钟的答题时间,几乎来不及反应。第二是主持人念题目时有背景音干扰,导致语音助手无法准确识别题目。

  为了解决这一问题,我们不直接识别主持人的声音,而是在题目出现时就自己快速读出题干供语音助手识别,而且为了保证所有语音助手听到的内容一样,我们事先将题干内容进行录音,然后逐个播放给语音助手听。值得一提的是,我们进行测试的机型分别为iPhone X、三星S8、360 N6 Pro以及荣耀V10(题图仅为展示处理),其中Siri、Bixby和360语音助手均需要特定机型,而不限机型的google、微软小娜、简单搜索和搜狗搜索均安装在荣耀V10中进行测试。当然,为保证环境的一致性,我们还将四款手机连接至同一Wi- Fi下,然后记录识别所需的时间和正确率(在第一屏能看到答案即视为正确)。

  智能语音助手一览

  Siri

  Siri作为一款很早就内置在苹果iOS系统中的人工智能助理软件,其使用了自然语言处理技术,用户可以使用自然的对话与手机进行交互,完成搜索数据、查询天气、设置手机日历、设置闹铃等许多服务。

  Bixby

  不同于很早就出现的Siri,Bixby在去年上市的三星S8和Note8上才姗姗来迟。前身是Viv Labs的Bixby拥有理解语境的能力,能够更准确地了解用户想要做什么,并且还能在信息不完全或者语句顺序不对的情况下,理解和执行用户的语音命令。

  360语音助手

  在全新的360OS 3.0系统中,语音助手功能终于登场。其依托360搜索庞大的数据支持和科大讯飞的语音识别技术,可以实现智能问答、便捷查询、微信直达以及清理手机等功能,基本上涵盖了手机绝大部分操作。

  Google搜索

  作为Google公司最重要也是最普及的一项功能,Google搜索是多个国家和地区使用率最高的互联网搜索引擎,它能抓取数十亿的互联网网页,因此用户能通过搜索关键词等操作较为轻松地获取想要搜寻的信息。虽然Google在国内有些水土不服,但我们还是将其纳入进来,与其他智能助手做个对照。

  微软小娜(Cortana)

  原本只出现在Windows Phone系统上的Cortana在2015年底正式登陆iOS和Android系统,它的功能从设置备忘录到记录兴趣信息,以及从Bing搜索引擎上抓取信息从而回答问题。这样看来,Cortana似乎是个答题小能手。

  简单搜索

  这款最近大火的搜索软件可不是个新鲜玩意,简单搜索是百度去年上线的一款拥有高效便捷体验的搜索软件,它拥有语音搜索、图像识别、语音直达、多轮对话、语音播报等多种新一代搜索功能。那么面对复杂的考题时,它的表现对得起名声吗?

  搜狗搜索

  作为搜狐公司推出的第三代互动中文搜索引擎,搜狗搜索已经成长为中国领先的搜索引擎。其核心战略是“自然交互+知识计算”,搜索系统在理解了用户的搜索需求后,可利用海量网络信息及大规模知识库,直接在搜索结果页为用户呈现精准答案,这对问答领域来说无疑是个大杀器。

  结果统计

  在经过了12道题的测试后,我们将所有语音助手的答题时间和准确率进行统计并绘制成表格,结果如下图所示。我们能从表格中精确地看出每款语音助手在每道题中的响应时间以及分别答对了哪些题目。(为了数据的准确性,我们将答题过程录屏并逐帧比对,所以时间以帧为单位)

  Siri席卷重来

  也许有的读者注意到了,在前面共同测试的12道题中,其余6款语音助手无论好坏都有成绩,唯有Siri没有。似乎SirI的每一次识别都失败了,这是为什么呢?

  其实问题出现在Siri的语音识别上。前文我们提到过,在多个语音助手进行测试时为了保证测试一致性,我们将朗读出来的题目保存为音频文件,然后逐个播放给语音助手听。就是在这一环节中Siri遇到了问题—无法识别数码设备播放出的声音,所以Siri几乎全程都没有响应,自然也没有识别时间和识别准确率了。于是我们重新人工读出了题目供Siri识别,12道题的结果如左图所示。

  从重新测试的结果来看,Siri的识别准确率只能说一般,“祖师爷”听成“祖师耶”,“雾都”听成“误读”等情况还是不少的,但从整个测试结果来看,Siri也能保持7道题左右的正确率,对于大部分答题人来说也是个不小的助力了。

  写在最后

  经过一番鏖战,我们终于得出了结果:从反应速度上来看,Google、360语音助手和简单搜索位列三甲,特别是Google搜索,平均下来每道题仅需5秒左右的回答时间,就算再加上念出题干和选择答案的两三秒,也能在10秒钟的时间里轻松完成,当然缺点你们也懂的。360语音助手也值得一谈,与其他手机不同的是,360语音助手是以问答的形式来回答用户提出的需求,有很多道题的答案均直接出现在对话框中,用户不必在繁杂的页面上寻找,很有效地提升了答题效率。

  准确率方面,搜狗搜索以答对11道题的绝佳战绩位列榜首,这应该与搜狗所主张的“自然交互+知识计算”核心战略有关。从测试中我们可以看到,至少在面对问答搜索领域时,搜狗可以直接在搜索结果页呈现出精确答案,不过其美中不足的是答题整体耗时太长,从上表中也可以看出,搜狗搜索几乎是所有助手中耗时最长的。

  所以要说将速度和正确率结合得最好的话,那么百度出品的简单搜索应当是最佳选择,第一是它的识别速度排名前列,保证了你的作答时间。第二是其题目正确率排名第二,让答题更游刃有余。第三是软件适配性高,不像Siri、Bixby和360语音助手这样需要特定机型支持,简单搜索几乎身边所有安卓手机都能下载安装。

  事实上,考验语音助手的同时也是在考验智能语音技术,而智能语音技术乃至人工智能助手早已不是一个新鲜事物了,就算在问答领域也是如此。2011年,IBM研制的超级机器人“沃森”在连续三天的比赛中战胜了“Jeopardy!”问答节目中最优秀的两名人类选手,这档节目甚至涵盖了历史、语言、文学、艺术、科技、流行文化、体育、地理、文字游戏等多方面内容;2017年,搜狗研制的智能问答机器人“汪仔”在国内问答节目“一站到底”中也大放异彩,战胜了多名参赛选手。

  其实由于智能语音技术的研发周期长,投入大、行业入门壁垒高,导致今日全球范围内的语音助手并不多见,我们平常在消费者领域中最常见的也几乎都是这几个智能助手。虽然当前形态的语音助手远称不上成熟,但却是未来人工智能技术在我们日常生活中最成熟、最广泛的应用方式,而随着科技的逐渐进步,相信未来的我们人人都能拥有一个堪比“贾维斯”的万能管家。

  《冲顶大会》、《芝士超人》和《百万英雄》等直播类知识竞答节目的火热,无形中也让身为“合法外挂”的语音助手火了一把。看了我们的测评,想必大家也知道就问答领域究竟哪些语音助手更适合“参赛”了吧。事不宜迟,赶紧拿起你的趁手“外挂”去勇夺百万奖金吧!

  文、图/陈思霖

关注读览天下微信, 100万篇深度好文, 等你来看……