深度学习将为人工智能带来新机会

  最近,有新的人工智能技术出现,我们把它称为深度学习,深度学习不仅会为互联网IT公司带来巨大价值,人类也将因此迎来巨大变革。

  人工智能的迅速发展

  现在,三个领域正在发生重大的创新,一个是图像,第二个是语音,第三个是行为。

  图像

  新的人工智能技术的出现,使计算机学习了更多人类的神经系统,更好地解决了譬如图形识别的问题。若想真正把深度学习做好,就必须要了解人脑在做什么,人脑当中发生了什么。然后我们使用这些计算的结果和海量数据,从而获得更好的计算机视觉,做更好的辨识。

  为什么人工智能在最近几年才获得比较快速的发展?

  我们以如何构建火箭为例,火箭构建中很重要两件事情,一个是发动机,另外一个是燃料,两者比例配合得当才能够确保火箭准确地发射到轨道当中。这给我们深度学习也带来了一些启示。巨大的神经网络每天都在发生着巨大的活动,我们在深度学习的过程当中就像发射火箭那样,人们的活动多数都是围绕着其手机和电脑来开展的。我们如何利用这种新的情况呢,或者新的环境更好地帮助我们了解巨大的神经网络呢?

  当今社会越来越多地进行数据化或者数字化。在很多年前,当深度学习这个概念刚刚开始的时候,更多的是使用CPU技术,构建小的神经元网络只有100万或1000万的连接,我所说的是计算机连接的数目。之后我们取得了一些进展,其中在2008年,GPU技术的发展,让我们看到它的连接数目也发生了巨大的增长。GPU是手机上、平板上的硬件,作用是帮助做计算,有些人就意识到了硬件对加速深度学习的重要性———我们借助GPU可以构造越来越大的神经元网络。在往后,我们看到了更多大规模的发展,像谷歌的深度学习项目,使我们更多地了解相关的知识,我们有了更多的云,更多的CPU来推动相关的发展。现在我们看到的,我认为这也是下一阶段的趋势,就是我们要从云技术或者说仅仅利用纯技术跳到HPC,(High,Performance,Computing,高性能计算)。HPC和云,这可能是两个比较分离的社区,研究云和研究HPC的人也是两类人。随着云技术的发展,你可以同时使用上千台计算机,不用担心这么多计算机会发生崩溃。而HPC技术比较小数目,但却是更贵、更高性能的硬件,而我们也认为这对于我们构造更好比例的“火箭引擎”也是更佳的一个解决方案。

  和其他公司相比,例如谷歌、脸书,他们的“火箭燃料”(数据)比我们多。但是我们在发动机上的投资比他们多,这给我们带来了巨大的好处。我们在发动机和燃料的比例方面要做得好才能确保这是一个好的火箭,我们正在发动机方面进行大量的投资,所以我们才在人脸识别领域和其他领域比其他国际上领先的大公司要做得好,我们在人脸识别只有0.3多的错误率。

  语音识别

  我们过去是用键盘来敲字,这是比较浪费时间的,现在大家用语音进行沟通,所以语音识别是一个非常重要的发展方向。

  而大家现在普遍反映在手机上进行语音通信时,如果手机离得较远,效果不是很好,要比较近时语音识别才做得比较好。我们在相关的IT技术方面也做了一些探索,从传统领域来看,这是语音识别所做的事情,基本上所有做语音识别的公司都是使用非常复杂的管道———改善语音系统,突出声音特征,做一些不同的模块组合起来识别这个人到底讲了什么。

  现在,我们把所有这些东西用先进的人工智能技术替代掉,用先进的深度学习技术进行替代,这就是百度的深度语音,也是我们的火箭发动机。百度还将用1万的数据集进行人工智能处理,这就是我们的火箭燃料。这些研究结果是不可想象的。

  人们之前从来不会想到能利用这么多的数据,我们使用神经元系统以及数据燃料可以极大地提高语音识别的准确性。在百度,我们已经看到了使用语音识别的用户越来越多了,然而在这个领域,我们还有很多需要提高的。很多人低估了语音识别95%的准确率和99%的准确率的差别。如果我们能够做到95%,也就是今天的状况———你说话要非常清楚,而且要离话筒非常近,必须这样才能识别出来。如果我们将来能做到99%的准确率,我们甚至可以把所有手机的接口做重新的设计和修改,使我们更加习惯于语音通话指令的发送方式,从而推动这个领域的革新,到那时你手里的东西也将不是传统上的手机了。

  在手机之外,我认为语音识别还会推动物联网的革命,从汽车界面到家用设备再到可穿戴设备将会发生很多的改变。遥控电视、遥控空调等是不够的,在未来几年,我们将能够和电视通话,和更多的家电通话,这将是未来面临的发展,我们将有很多的路由器内置到这些机器当中。

  行为

  我们看到很多技术公司现在都能够获取到一些大数据来了解人们在互联网的环境中究竟是什么样的行为,这是技术的发展。我们可以从这些数据中挖掘更多的价值。正如很多人都知道的,百度的广告在人工智能方面也下了很大的工夫,我们搜集了很多关于人的行为的数据,而这些深度学习可以使我们了解人们的行为———他们倾向于做什么事情,他们喜欢做什么事情。因为我们的数据中心还有很多其它数据搜集起来,使我们了解不仅仅是人的行为,还有机器的行为,从而使我们更好地管理数据中心,提高安全性。美国、中国和欧洲现在越来越多地使用深度学习来了解人的行为、机器的行为,在IT世界当中以及IT世界之外挖掘更多的机会,这也推动了我们未来的成功。

  趋势、机会和挑战

  人工智能的循环发展是非常迅速的,15年前,我们提出AI人工智能的良性循环。那时我们认为如果构造优秀的产品就可以吸引更多的用户,有了更多的用户就可以获得更加大量的数据。事实证明,现实就是这样。

  而我们以前想过但还未发生的事情就是把更多的数据通过人工智能被更好地利用,推动更多的优秀产品被生产出来,这是我们在最近几年才做的事情。如今现实情况是我们的火箭引擎已经不够大了,而燃料却越来越大,所以不能深度地利用这些数据。而深度学习之所以能给我们带来更多的价值是因为我们现在可以从越来越多的数据当中受益,开发越来越多的潜能。深度学习确实会改变我们的生活,改变传统的人工智能,使我们最终可以把“发动机”和“燃料”的连接做得更好,把产品、大量用户和海量数据之间的连接做得更加通畅。

  虽然之前我们主要关注了图像、语音和行为,但是对于人工智能的机会来说远不止这三个方面,譬如自然语言的处理方面以及在生物技术方面的人工智能,这些创新都在发生的过程当中,人工智能也可以更多地被应用到机器人的开发。

  百年前的工业革命在当时推动了一些新技术的发展,未来的工业革命将把人们从日常重复繁重的工作当中解放出来,把人性解放出来,把人的思想解放出来,使人们不再成为思想的奴隶。我很期待未来的发展,当人力、大脑和思想被解放后,我们能做的事情将更多。

  (本文系根据吴恩达博士在“2015深圳IT领袖峰会”上的演讲整理而成)

  百度首席科学家 吴恩达

关注读览天下微信, 100万篇深度好文, 等你来看……