百度的技术突破与应用
- 来源:中国计算机报 smarty:if $article.tag?>
- 关键字:百度,人工智能,互联网 smarty:/if?>
- 发布时间:2015-01-06 09:01
人工智能技术是当前互联网领域技术发展的最前沿,被认为是互联网产业的下一个“引爆点”。百度作为国际上最早将深度学习上升为战略技术方向的四家公司之一,很早就在人工智能领域加大投资,展开布局。从2013年成立深度学习研究院,到2014年成立百度研究院,并将世界三大人工智能专家之一、前“谷歌大脑”之父吴恩达招致麾下,出任百度首席科学家,统率北京与硅谷两地团队共同展开前瞻性研究,打造世界顶级人工智能研究团队。过去两年内,百度在人工智能领域展开多项研究,取得了包括语音识别、图像识别等在内的显著成果,并积极探索无人驾驶等前沿技术领域,持续引发业界关注。
在人工智能领域,存在着这样一个正循环:通过人工智能技术不断优化产品,让优秀产品吸引更多用户,更多用户产生更多数据,而更多的数据可以使人工智能的性能得到提升,从而让产品更优秀。然而在过去数年里,人工智能算法遭遇瓶颈,更多的数据并没有让人工智能性能得到明显提升,而百度应用深度学习技术和算法,推动了这个正循环运转加速,并通过不断实践和创新实现人工智能技术的突破。
2014年4月,在第四届百度技术开放日上,百度推出大数据引擎,包含开放云、数据工厂、百度大脑三大组件。而百度大脑则是基于大规模机器学习、深度学习技术,通过计算机模拟人脑神经网络,通过多层的学习模型和海量的训练数据来完成数据智能,让用户能够与机器进行自然的交互(如通过声音、图像和OCR等方式),让机器更好地理解用户的需求,完成信息与需求的精准匹配。百度大脑的深度神经网络拥有200亿个参数,其参数复杂度几乎超过现存的任何多媒体领域用到的数学模型,能够处理的特征向量数目上千亿。另外,通过自主研发的GPU并行计算平台,提升DNN训练效果,突破深度学习算法并行化难题。
百度在人工智能领域的实践最初来自于搜索引擎所遇到的挑战。数据显示,过去一年在百度上寻找服务的请求增加了133%,随着用户需求更趋于复杂化和个性化,从最初的获取信息,到现阶段希望能够通过搜索引擎直接获取答案、连接服务,需要利用人工智能技术实现人和服务的精准匹配。另外,用户也更趋向于基于自然的交互方式。据统计,现阶段在百度的搜索请求中10%是以语音的形式来表达的,而未来5年使用语音和图像来表达需求的比例将超过50%。基于如此真实强大的需求,为了不断提升用户体验,百度首先在图像识别和语音识别这两项前沿技术领域实现突破,并取得了一系列领先成果。
2012年11月,百度上线了基于DNN的汉语语音搜索系统,成为最早采用DNN技术进行商业语音服务的公司之一。目前,百度已经积累了数万小时的声学训练语料和海量文本语料,线上语言模型总量超过100G,支持小时级别的海量语言模型更新。语音识别DNN网络深达九层,基于听觉感知的深度学习声学建模技术可以实现更高的精准度和识别率。在安静情况下,百度的普通话识别率已达到95%以上,处于国际领先水平。百度语音对内支持了手机百度、百度输入法、百度地图、百度导航等一系列产品,同时基于开放平台,提供多个垂直领域的识别和解析服务,合作伙伴超30个,覆盖汽车、医疗、手机、电商、家电和车载等十几个方向。
在图像识别领域,百度在2012年底将深度学习技术成功应用于OCR识别和人脸识别,并推出相应的PC和移动搜索产品;2013年,深度学习模型被成功应用于一般图片的识别和理解。目前百度的人脸识别准确率超过98%,处于国际领先水平,图像识别技术已经用于手机百度、百度识图等多个APP中。从百度的经验来看,深度学习应用于图像识别不但大大提升了准确性,而且避免了人工特征抽取的时间消耗,从而大大提高了在线计算效率。目前利用CNN(卷积神经网络)和RNN(递归神经网络)技术,百度成功地实现将图像内容生成自然语言的描述性句子或段落,从而在高层语义层面建立了图像和自然语言之间的桥梁,也就是“机器读图”,而这可以说是人工智能领域的一次技术飞跃。
在大数据领域,百度基于海量的搜索数据和外部行业数据,以大规模机器学习技术为基础,能够实现简单的推理决策。现在已经成功地实现大数据预测和智能分析等技术,包括经济指数预测、景点和城市预测、疾病预测、高考预测等多个应用。2014年7月份,百度在世界杯预测方面战胜了谷歌、微软、高盛、雅虎等世界著名高科技企业,同时利用其先进的技术和资源,于2014年9月推出百度预测开放平台,对外提供平台化预测服务,辅助企业利用大数据进行商业决策。
除此之外,基于深厚的技术积累,百度也积极在更多前沿领域展开探索。比如今年在百度世界大会上发布的智能可穿戴设备BaiduEye,就是基于自然的人机交互技术,通过对佩戴者的视觉信息进行图像分析,结合百度强大的大数据分析能力和人工智能技术,为用户提供所见事物背后的信息与相关服务,帮助人们更好地了解周围世界、获取信息、连接服务。在世界顶级互联网公司角逐的无人驾驶领域,百度也积极布局。2014年9月15日,百度与宝马正式签署合作协议,共同致力于在中国推进高度自动化驾驶技术的研究。双方计划未来将联手攻克高度自动化驾驶在中国道路环境下面临的技术挑战,通过智能技术加强道路行驶安全性,减少交通事故与人员伤亡。
在2014年11月的世界互联网大会上,百度公司创始人、董事长兼CEO李彦宏表示百度正在持续投入大笔资金用于人工智能的研究,“我们需要有这种信心,甚至对我来讲是一种信仰:就是对于技术的投资会获得回报,而且不仅仅是给百度带来回报,更会给整个社会带来非常大的回报”。作为一家有着深厚技术基因的公司,百度一直在引领着互联网的创新,正如美国知名高科技网站Xconomay所评论的,百度正在成长为全球人工智能领域的领袖型企业之一。而未来我们可以期待百度加速实现人工智能领域的正循环,推动互联网的发展,进而通过技术改变世界。
本报记者 涂兰敬