科大讯飞的人工智能之路
- 来源:互联网经济 smarty:if $article.tag?>
- 关键字:科大讯飞,人工智能 smarty:/if?>
- 发布时间:2017-01-11 10:59
科大讯飞作为中国在人工智能方面的领头羊企业,主要发展语音识别技术,当前人工智能已经成为风口,科大讯飞专注技术实力的开发,正蓄势待飞。
站上人工智能产业的制高点
今年,李世石与Alpha Go的人机围棋大战吸睛无数,人工智能的话题始料未及地席卷了世界每处。今年也恰逢人工智能学科诞生一甲子,历经波折的人工智能发展终于掀起全球热潮,各国政府纷纷提出人工智能发展研究相关计划,苹果、谷歌等国际IT产业巨头也相继推出一系列人工智能应用,希望在新一轮人工智能技术竞争中取得先机。
科大讯飞作为亚太地区最大的智能语音和人工智能上市公司,也是中国智能语音与人工智能产业的领导者,在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先成果。目前,科大讯飞已经占有中文语音技术市场70%以上的市场份额。
在人工智能技术钻研与产业布局上,科大讯飞也较早提出了明确的思路与方向。2014年,“讯飞超脑”计划应运而生,目标是让机器实现从“能听会说”到“能理解会思考”;2015年,科大讯飞发布的具有里程碑意义的人机交互界面AIUI现在聚合了超过18万的开发伙伴和8亿的终端用户,以科大讯飞为中心的人工智能产业生态已经逐步构建。科大讯飞力求在人工智能时代真正到来时全面开花,抢占人工智能产业高点。
科大讯飞是如何发展的?
科大讯飞是一家典型的创业公司,身上还有一个特殊的标签:中国在校大学生创业的第一家上市公司。
1999年,还在中国科学技术大学就读的刘庆峰面对当时中文语音市场由国际巨头把持的现状,怀揣“中文语音技术必须由中国人做到全球最好,中文语音产业必须掌握在自己手上”的信念,毅然创立了科大讯飞。
从6个人的团队到后来18个人创业,一度并没有人相信这个“草台班子”能够与国际巨头抗衡。初期的科大讯飞遭逢创业的种种艰难,直至5年后,公司才终于实现盈亏平衡。在盈利的博弈与权衡中,语音技术与产业当时被牢牢确立为公司的发展目标和方向。巨大的压力之下,磨砺出的是坚持创新和坚忍不拔的宝贵品质,这也成为科大讯飞一贯坚守和传承的核心精神。
创立近10年后,科大讯飞迎来了一个发展拐点—上市。2008年的中国风云变幻,科大讯飞上市犹如浪潮中的一簇小水花,却激起了自身的滔天巨浪。技术仍然是核心,产品和市场意识逐渐走上舞台。刘庆峰带领团队进一步梳理了公司的愿景和使命,立志要让事业影响中国未来,影响到每一个普通人的生活中。
功夫不负有心人。凭借核心技术的绝对优势,科大讯飞在历次的国内外语音合成评测中,各项关键指标均名列第一,2008年至今连续在国际语种识别评测大赛中名列前茅,2003年和2011年两次荣获“国家科技进步奖”,2005年和2011年两次获得中国信息产业自主创新最高荣誉“信息产业重大技术发明奖”。
2010年,科大讯飞发布了语音云平台和输入法,云平台面向所有创业者免费开放,为海量用户提供服务。数据的抓取、资源的整合,显示的是科大讯飞决策未来的战略决心。在此基础上,随着人工智能时代的来临,科大讯飞连续发力:2014年发布“讯飞超脑”计划,核心就是让机器从“能听会说”到“能理解会思考”;2015年发布对人工智能产业具有里程碑意义的人机交互界面—AIUI。在教育、家居、客服、车载、医疗等细分领域,科大讯飞依托人工智能技术达成广泛合作,推出品类丰富的产品体系覆盖市场。
2016年5月,Research Markets最新发布的报告称在全球语音市场,谷歌、微软、苹果和科大讯飞获得了迅速增长,全球市场份额分别为20.7%、13.4%、12.9%和6.7%,科大讯飞已经代表中国民族创新企业站上了国际舞台,在全球竞争中占据一席之地。
“讯飞超脑”布局
美国、欧盟等发达国家分别提出了“Brain Initiative”和“Human Brain Project”等人脑研究计划,投入巨资并将其提升到与“人类基因图谱”重大工程并重的高度。苹果、谷歌等国际IT产业巨头亦相继推出了Siri、Google Now语音搜索等一系列人工智能应用。全球政府、企业都已将目光投向人工智能行业,各显神通。
人工智能的突破与“认知革命”紧密相关。七万年前,人类发生了“认知革命”,核心是智人拥有丰富的语言,可以更好地描述自然世界、执行更加复杂的计划,关键是可以描述梦中和想象的东西,从而产生虚构、宗教和各种概念。正因如此,目前很多正在做人工智能研究的专家,包括Michael Jordan和Yann Lecun等都已经意识到,自然语言理解对于人工智能来说是一个突破口。
科大讯飞目前正在执行的“讯飞超脑计划”,就是希望实现包括感知智能和认知智能在内的全面突破,也是在人工智能领域的核心布局内容。在感知智能领域,语音识别、手写识别方面每年保证30%-50%的错误率的下降;在识别普通话的基础之上,进一步识别方言;不仅能够理解人类和机器的对话,还能理解人和人之间的对话;不仅能够识别联机手写的字符,还能识别离线手写的字符。在认知智能上的研究目标,关键是让机器能理解会思考,这必须要突破语言理解、知识表示、联想推理、自主学习等多个方面。
目前,科大讯飞的“讯飞超脑”已取得了阶段性的进展。作为计划的重要组成部分,科大讯飞正牵头进行科技部863重大专项—“类人答题机器人项目”,未来要让机器人参加高考并考上一本,甚至是清华、北大、科大这样水平的高校。而在口语翻译和评测方面,目前科大讯飞口语翻译技术已达到英语六级水平,在国际机器翻译评测(IWSLT2014,NIST2015)等大赛中夺得冠军,口语作文评测机器已可替代老师进行自动评测,在广东高考英语口语作文考试中得以全面应用。在主观题阅卷上,科大讯飞将业界独家的人工智能核心技术应用于考试以及传统线下作业的自动批阅,不论是手写识别的还是选择题涂抹,都可以先通过OCR转变成计算机可以理解的文本和图像,再让计算机自动对答案的正确程度进行评判,这其实是感知智能和认知智能的结合。现在安徽省合肥市和安庆市的会考中,英文和中文的考试已经全部使用了整套感知智能和认知智能技术进行自动评分,取得了非常好的效果,以后此技术将会被全面推广到包括文科和理科的所有课程。
在产品应用之外,基于多年积累,目前科大讯飞在各项大赛中都取得了优异的成果。以今年为例,在年初举行的国际语音合成大赛上,科大讯飞通过承建的语音及语言信息处理国家工程实验室报送的参赛系统,不仅继续在自然度、相似度、可懂度等传统指标上保持国际领先,还在语篇段落表现测试中所有7项测试指标位列第一。这是科大讯飞自2006年首次参赛以来,第十一次参与该项赛事,持续巩固了在智能语音技术的全球领先地位。
随后,在今年的全球人工智能比赛Winograd Schema Challenge中,科大讯飞再次荣获第一。Winograd Schema Challenge作为意图取代图灵测试(Turing test)的人工智能测试项目,着重考察认知、推理和常识判断能力。
此外在美国当地时间9月13日,科大讯飞领衔的中国技术团队又在国际多通道语音分离和识别大赛(CHiME)中包揽了赛事全部三个项目的冠军。据介绍,CHiME比赛重点解决的是真实、复杂场景下的语音识别,因此是语音识别领域最高难度的比赛之一。参赛的各个语音系统需要克服高噪声、混响等干扰,在咖啡厅、公交车、街道等日常生活场景中,准确地识别和处理英文语音。
以各项赛事成绩名列前茅的技术为保障,“讯飞超脑计划”的目标就是让各类智能终端实现从“能听会说”到“能理解会思考”的演进,进而实现全球第一个中文认知智能计算引擎,在语音合成、识别和人工智能等各项领域引领智能应用潮流的发展。
风雨过后见彩虹
虽然人工智能现在已经大热,但对于这个行业将来在技术和产品等方面的具体发展前景,学界与业界也有诸多讨论。
在科大讯飞轮值总裁、讯飞研究院院长胡郁看来,大家普遍更为关心的是人工智能的突破问题。目前,深度神经网络与大数据两个关键要素的结合是当前人工智能研究的一条主流路径,这条路径中还有一个非常重要的内容,就是基于互联网和移动互联网的“研究-工程-产品-用户”大闭环优化,用简单的四个字概括就是“大、智、移、云”,它推动了工业界人工智能技术直接迈过了可用性门槛。
现在工业界所依赖的大闭环优化、深度学习和大数据,跟脑科学的研究思路结合也是完全有可能的。因为现在人工智能网络借助于新的学习机理甚至拓扑结构上的改进,将可以进一步成为人工智能发展强有力的推动力。涟漪效应、深度学习和大数据的结合成为目前推动人工智能向前发展的最有效的路径。
技术的突破从源头上推动了人工智能产业的发展,而人工智能产业的发展又带来了崭新的问题:人工智能是否会威胁人类,抢人类的饭碗?胡郁认为,现在的人工智能跟我们的意识其实没有任何的关系,所以机器的发展将来不会残害人类或者替代人类,反而会让我们的生活更加轻松和便捷。此前科大讯飞董事长刘庆峰曾在今年参与G20峰会下的B20会议接受《人民日报》采访时表示,人工智能将会使社会的生产效率大幅度提升,社会财富创造的数量和质量呈指数级别增长;同时人工智能也将替代掉大部分的现有劳动力,颠覆现在的很多产业。这既是我们今天面临的巨大机遇,也是巨大挑战。
总体来看,未来十年将会是人工智能发展的关键阶段,在这一行业中,中国现在少有的兼具核心技术能力和产业基础条件:在国家层面,2014年科技部“863 计划”启动“基于大数据的类人智能关键技术与系统”项目;在企业层面,以科大讯飞为代表的中国自主创新企业已经找到人工智能发展的必由之路—从语音和语音为入口介入认知智能。因此未来中国在人工智能行业和人工智能产业上必将大有可为。
且行且珍惜
一项技术从产生到发展到产业化再到消亡需要经历很多过程,很多技术就在经历了这样的过程后慢慢消失了,而有些又被新的技术代替了。人工智能作为一个宽泛的概念,包含了语音、图像、语义理解等许多方面,因此在他的发展道路上必然会出现很多的困境和曲折。
首先就是产业化的问题。技术向产品的转化是技术持续发展的不竭动力。而就产品而言,实用性是消费者追求和喜爱的第一要义。如果现在的人工智能像此前的技术浪潮一样仅仅止步于概念上的联网,或者只是停留在实验室和研发中心中,那么缺乏了产业化和商品化的技术就会像是无本之木、无源之水,最终还会走向末路和枯竭。此前科大讯飞董事长刘庆峰在今年全国两会中提出要将人工智能确立为国家战略,从国家的层面发展人工智能产业正是充分考虑到了人工智能发展的产业化问题,希望在国家的扶持下形成兼顾竞争力和消费者口碑的人工智能产品。目前人工智能正处在商业模式构建和产业雏形生成的阶段,以科大讯飞为主体的“中国声谷”产业园区也在安徽省和合肥市的大力支持下逐步成长,逐步向产业特色鲜明、产业集群优势突出、产业规模和影响力处于国际前列的阶段稳步迈进。
其次,就是入口的问题。人工智能作为具有一定前瞻性的技术,在发展的过程中需要寻求一个合适的切入口融入大众的生活。未来是一个万物互联的时代,面对各式各样连入互联网的智能硬件和其他设备,用户都需要有更方便的手段进行操控。而这一切都将是语音大显身手的时刻。正如前文所述,目前科大讯飞通过多年的技术积累,借助远场识别、麦克风阵列、自然语言理解等技术,在多项智能语音和语言理解测试中荣获桂冠。目前的技术已经具有了实用的能力和推广的可能性,因此在未来借助语音的入口,实现人工智能的突破和跨越是非常有希望和前景的。
紧接着产业化和产品而来的就是盈利的问题。就人工智能产业来说,目前还处在初始投入阶段,离盈利还有一定距离。但是只要占据了市场和用户占有率,盈利其实也就近在眼前。以个人用户和随身可穿戴设备为例,借助认知计算引擎和语音识别功能,目前所有的移动互联网模式,都可以在语音交互的过程中得以实现。人们通过在随身设备上实现基于语音交互的各项功能,可以获得所需要的各项功能,而企业在这一交互过程中则可以获得海量的后台大数据,还可以实时推送相关信息;而以商业用户为例,为了获取需要的技术保障和增值服务,用户将会选择付费的相关服务,这其中的市场规模都可以说是难以估量的。
最后,就是许多企业都会遇到的资本问题。其实并不是所有的企业和行业都适合资本的进入和并购的展开,此前刘庆峰曾提出,在人工智能行业,以科大讯飞为代表的中国企业真正的竞争对手是国际上的人工智能巨头,因此应当学习华为的作风,将工作和精力的重心放在技术研发和创新上。
数百年前的万户,不会想到现在NASA已经成功将人类送出地球,远航太空;百年前的莱特兄弟,不会想到如今的客机已经可以运载相比当年几何倍数的乘客跨越五大洲四大洋。无论愿不愿意、无论是否承认,科技进步的速度,总是超乎最前卫的理想主义者的想象。随着技术的发展,人工智能未来将在智能硬件、车联网、机器人、自动客服、教育等方面发挥越来越显著的作用。而科大讯飞作为亚太地区最大的智能语音和人工智能领导者,以多年潜心耕耘智能语音和人工智能技术的底蕴,必将坚守“用人工智能建设美好世界”的口号,和大家共同见证人工智能时代的真正到来。
文/卫萌 淦凌云