人工智能、机器学习与深度学习:究竟什么是深度学习?
- 来源:计算机世界 smarty:if $article.tag?>
- 关键字:人工智能,机器学习,深度学习 smarty:/if?>
- 发布时间:2017-09-22 10:15
到2035年,人工智能(AI)将为英国经济增长贡献6540亿英镑,但随着它成为主流,对其进行描述的术语却越来越混乱。
人工智能的流行语——机器学习和深度学习,常常互换使用,尽管每个术语都有不同的含义。
斯坦福大学计算机科学家John McCarthy因提出“人工智能”这一术语而受人尊敬。他在1956年召开的一次专题会议上将其定义为:“制造智能机器的科学和工程,特别是智能计算机程序。”
“智能”一词的模糊性使人工智能涵盖了一系列应用,但大多数研究人员同意它一般是指能够复制人类的思维。
机器学习是人工智能的一个子集,它赋予计算机一定的独立思考能力。这之所以能够实现,是因为给它大量的数据,由算法处理这些数据,然后从中学习,以便作出预测和决定,这个过程并没有专门的编程。机器能够高效地从现有例子中进行学习,以解决新问题。
而深度学习是一种受人类大脑神经元之间的联系而启发出来的机器学习方式。研究人员对这种生物连接进行了人工模拟,称之为人工神经网络(通常称为神经网络)。
实际中的深度学习
在人类神经网络中,数十亿个相互连接的神经元通过发送电信号来通信,发展成为思维和行动。在人工神经网络中,节点扮演神经元的角色,并通过组合分析,在有组织的结构中进行协作,解决问题。
例如,深度学习软件可以用来理解由重叠的东西组成的复杂照片,譬如一个装满了衣服的洗衣篮。
节点被安排在不同的层中,每一节点查看图片的每个元素,并对具体的元素进行计算,以便完全理解它。这些计算得出的信号被传递给其他节点。
然后,对层中的所有信号进行组合评估,最终预测图片中到底是什么。
深度学习相对于其他机器学习技术的优势在于,其他技术需要分析一系列预定义的特征,把分析结果作为预测的基础,而深度学习自己可以识别每一个特征。
例如,如果一个系统想在一张照片中识别出人脸,就不需要先把个人特征(例如鼻子和眼球)输入到该系统中。相反,可以把一幅完整的图像输入给它,它能够扫描,理解不同的特征,然后对图像内容进行独立的预测。
深度学习可以用来预测地震和控制自动驾驶汽车等。它可以对黑白视频进行着色处理,翻译手机拍摄的文本,模仿人的声音,创作音乐,编写计算机代码,在棋盘游戏中击败人类,例如,谷歌的DeepMind去年击败韩国围棋冠军李世石而一战成名。
它还有其他无数潜在的应用,从安全系统到情感分析,直至优化制造,等等。深度学习尤其擅长理解图像和音频,并且可以自动完成许多常见的专业任务,例如分析X射线或者扫描法律文件等。
深度学习的历史
软件公司Cloudera的数据科学主任Sean Owen说:“深度学习并不是一种新概念。它是另一种概念的重生,现在人们终于使这一概念发挥作用了。”
深度学习的起源可以追溯到20世纪50年代,开始时是试图模仿生物大脑中神经元的互联,这被称之为“感知”。机器学习算法是由美国心理学家Frank Rosenblatt在1957年开发的,受到了美国海军研究办公室的资助。
他的发明被《纽约时报》戏剧性地描述为“一台电子计算机的雏形,海军希望它能行走、说话、看、写、复制自己,并能意识到它自己的存在。”
由于技术过于复杂,它很快就不再被人青睐了,但1986年一篇题为“反向传播错误的学习表征”论文的发表,为神经网络的学习提供了更为有效的方法。
在90年代,人们关注的焦点转移到了一种叫做“支持向量机”的机器学习,它提供了相对简单的高性能算法。
只是在过去十年,研究人员才真正学会利用云计算强大的计算能力,发挥规模优势使深度学习开始工作。
2011年,深度学习先驱Andrew Ng创立了“谷歌大脑”。这名斯坦福大学教授已经帮助开发了自主直升机和多用途家庭机器人,而真正使他成为人工智能象征的是谷歌庞大的神经网络研究项目。
他的创作登上了《纽约时报》的头条——一组16,000个模拟人脑的计算机处理器扫描了YouTube视频中的1千万张图像,目的是找到其中的猫,并独立地发现了哪些东西是“猫”。
“谷歌大脑”开发的神经网络后来被再次使用Android手机将其用在语音识别软件中——尽管没有那么的大张旗鼓。
“谷歌大脑”使得主流媒体非常关注深度学习,证明人类大脑可以为机器学习提供模型,而当时许多工程师都喜欢把简单的自动化伪装成智能。
谷歌的前高级工程师Owen说:“深度学习之所以能够加速发展并不是因为这些研究突破,而是因为软件可以让您做这些事情。
例如,大约两年前谷歌发布了名为TensorFlow的深度学习包,诸如此类的事情真正推动了深度学习在主流应用上的跨越式发展。
这正是过去五年来爆炸式发展的原因。是把这些想法转换成自由软件。”
深度学习往往需要特殊的硬件,但这也变得更加可行了。更具挑战性的是使用各种工具和技术所需要的知识和经验。
深度学习在很大程度上仍然是未知领域,即使是经验丰富的机器学习科学家涉足这一领域后,也必须在工作中学习。这导致了世界上最大的科技公司之间爆发了人才大战。
深度学习的局限
各种各样的媒体纷纷报道人工智能,而最近关于DeepMind Health访问了NHS患者记录的争议也引起了人们对隐私问题的关注。深度学习带来了特殊的挑战,因为它的模型越来越复杂,结果变得越来越难以解释。
“它们是非常复杂的模型,有大量的数字,并且不清楚其含义,所以很难理解为什么一个结果会与某一输入相关联。
如果我们想要清楚地知道这些,以便发现模型的逻辑不是我们想要的,那这就可能成为一个问题。我认为问题在于这些工具可能会让我们很容易找出数据中隐藏的倾向性,通过建立预测模型来进一步强化这些偏见,据此提出未来的行动。”
麻省理工学院的一个研究小组可能已经找到了解决办法。通过分析网络中不同神经元的活动,他们可以理解某一个神经元负责做出哪些决定。这一发现可以提供一种方法来找出算法偏差,并解释来自深度学习算法的具体操作。
虽然深度学习是尝试从统计上模拟神经元怎样工作的,而Owen要强调的是,它仍然不能重现与人脑相同的思维和学习。
“我的确提醒过人们,我们怎样才能让机器思考。这需要各种强大的技术的交融,但更多的是统计模型,在理解人脑方面并没有真正的根本性突破。”
深度学习的发展也不会使其他机器学习算法过时。深度学习需要大量的数据集和强大的计算能力才能有效地发挥作用,在很多情况下,足以支持向量机等简单的算法。
深度学习的未来
深度学习既可以使用普通的有监督学习技术,也可以使用更复杂和更前沿的无监督学习技术。
在有监督学习中,同时提供输入和输出变量,并进行分类。当增加更多的输入数据时,算法只需按照既定过程来生成新结果。这用在很多当前的应用程序中,例如进行Amazon推荐。
在无监督学习中,输出数据是未知的,因此系统不能根据某个实例而得出自己的结论。它只能使用输入数据来解决问题。它通过从数据中提取信息来发现相关性,理解底层结构,以便得出自己的结论。这类似于在课堂上以自学方式替代教师教学,这种模型被应用于有监督学习中。
无监督学习的一个例子是,一个系统能独立地对图片中的动物进行分类,而并没有告诉它这些动物是什么。它将通过一个描述过程来完成这一工作,这涉及到根据差异和相似性把数据分类。因此,它根据在像素中找到的显著特征和相关性,把狗和猫区分开来。
深度学习可以把智能手机照片转换成模仿大师风格和绘画技巧的图画,这种技术使得俄罗斯移动应用程序Prisma成为俄罗斯最受欢迎的应用程序。
如此强大的技术也可能会产生不太好的后果。例如,它可以用来生成看起来非常逼真的假视频。
去年,来自斯坦福大学和德国埃朗根纽伦堡大学的研究人员公布了名为Face2Face的一个项目,表明有可能操纵媒体,制造假信息。
该项目采用深度学习算法和商业网络摄像头实时重现在YouTube视频中说话的人的面部表情。让政治家说真话真的很难。
企业中的深度学习
对于企业来说,如果能看到深度学习带来的商业利益,就不会再担心深度学习了。很多企业已经在众多的应用中研究深度学习,例如在线旅行社Expedia。
当预订网站的顾客查看酒店列表时,他们首先注意的是房间照片。首先展示最吸引人的照片会提高酒店被选中的概率,但该公司总共拥有295,000多家酒店的1千多万张照片。人工处理这些照片将是一个没完没了的任务。
相反,数据科学团队使用深度学习来自动对照片进行排序。采用了由亚马逊开发的一款名为“Human Turk”的众包产品,从10万张酒店照片中找出排名前10的照片。对每张照片进行两次评定,并按旅行者的类型分类。
然后在这一数据集上训练模型,使其能够独立的对照片进行分类。Expedia估计,它能够在一天内评定一千万张照片。
科技公司正在试验各种各样的深度学习应用程序。特斯拉使用它来帮助其自主车辆学会识别道路上的危险因素,DeepMind通过分析眼睛的数字扫描图像来检测威胁视力的疾病,脸书提供给用户的内容是专门针对用户兴趣而定制的。
数字优先的企业仍然是深度学习的领先者,而这项技术变得越来越成熟,越来越便宜,也更容易使用。深度学习将给各行各业的企业带来变革。
原文网址:
http://www.computerworlduk.com/data/what-is-difference-between-machine-learning-deep-learning-3661252/
作者/Tom Macaulay 编译/杨勇