过去,我们总以为人工智能是在复制人的思维方式。但实际上,完全不是这样。
机器和人类的最大区别是什么?是机器不会疲倦。
它其实就是传说中的那个——中国最牛的虚拟人物——别人家的孩子,一个勤奋的、听话的、完美的小孩。你在打游戏的时候,他在学习,你在休息的时候,他还在学习。
2016年3月,AlphaGo在和李世石下围棋的时候,五局只输了一局。它输了的那天,李世石在接受采访和吃饭睡觉,而AlphaGo在干什么?它又独自下了100万盘棋。
这又一次完美地诠释了这个时代最悲情、最无奈的那句话:比你聪明的人,还比你勤奋。
这是机器思维和人类思维的一个重大区别。
人因为能力有限,思维方式尽量简化。我们从上学第一天起,接受的所有教育都是尽量用一个字词、一段篇章、一个公式来描述这个世界。所以,就有那个重要的“奥卡姆剃刀原理”——如无必要,勿增实体。这样可以更方便地理解和传递知识。
但是机器不需要这个“奥卡姆剃刀原理”。它的能力足够强,它不需要把世界简化之后再去理解。人工智能其实是让世界恢复了原本的复杂性。
第四范式的老板戴文渊跟我讲:人的思维习惯是怎么简单怎么来,机器的思维习惯是怎么复杂怎么来。
在机器的思维里,没有什么牛顿三大定律和爱因斯坦相对论的区别。那都是对世界简化理解的产物。人工智能会把这个世界按照不同的速度,分成几千种,然后总结出3000万个定律。
在机器的思维里,也没有什么“朝阳区群众”的概念,那就是上千万的具体的人,然后可以根据无数的维度、特征把他们区分开来。我们通常只会说男女两性,但是机器会根据性偏好总结出56种以上的性别。我们通常会说“70后”“80后”“90后”,但是机器一使劲儿,完全可以做到把年龄的划分精确到每一秒。
一家店怎么可能是人工智能运行的结果?运用机器思维的亚马逊公司拥有3亿用户,那就运行3亿个店给你,每个人看到的亚马逊是不一样的。
老天爷,我们在和一个什么样的物种打交道?我们原来文明的所有的基础对它来说都不存在,它用最复杂的方式——它一出手我们就没法儿理解的方式,在构建它自己的逻辑。
人工智能为什么在2016年爆发?就是因为驾驭这个复杂的因素出现了。业界公认2016年人工智能爆发的三大原因是:算法的进步、硬件的进步和大数据的进步。
算法,说了你也不懂,当然,我也不懂。看懂这些词儿算你有本事:计算、连接、评估、纠错、疯狂培训、非线性、分布式、自适应、自组织。
硬件其实指的就是GPU。啥是GPU,你也别为难我这个文科生了。总之一句话,它就是人工智能运行的硬件基础。文科生还是看得懂数字的,GPU硬件的领军公司英伟达,去年一年的股价,从30美元涨到100美元,一年涨了三倍多。顺便告诉大家,这家公司的老板黄仁勋,是华人。
第三个词,大数据。这是重点。
来看一个例子。怎样让电脑认出一只猫?
第一代人工智能的方法是,给出无数条件,然后试图得出结论。也就是告诉电脑一大堆“如果,那么”。如果它有花纹、有爪、有胡子,等等,它就是一只猫。
可是深度学习不这么干。他输入100万张甚至更多猫的图片,告诉机器:这里面有猫,你去认吧;你自己去定规则,自己去找规律。数据每大一个数量级,就越逼近于正确。
用深度学习下围棋,其实它并不知道什么叫布局定式、什么叫飞、什么叫断,在机器的眼里只有图,只有一张图往下一张图演化时胜负的概率。数据量越大,它的水平就越高。
就像有人问美国联邦最高法院的大法官波特·斯图尔特:“你们法官断案子,总说什么是色情作品。那请问,什么是色情呢?”斯图尔特说:“我说不出什么是色情,但是我看了之后,就能知道。”这就是典型的人工智能逻辑。它不关心人类对一件事情的定义,但是它可以输出你要的结果。
这里面最重要的是什么?是数据。
医疗用的人工智能,需要大量的医疗数据。越多的数据灌进去,诊断就越准确。
自动驾驶汽车的人工智能,需要的就是大量的路况数据。数据越多,驾驶技术就越好。
读懂人的表情,没有问题,24小时跟踪一张张脸的变化,标定每一个细小变化的表情意义。
强悍的硬件带来的计算能力,强悍的算法在飞速更替,再加上强悍的数据,造就了这一波人工智能的浪潮。
看见了吗?人工智能和人完全不是一回事,它用完全不同的思路,但是达到了同样的结果。所以人工智能不是在模仿人,而是抄了一条它自己熟悉的近道,然后赶上了人而已。
(马骋摘自中信出版社《时间的朋友》)
罗振宇
……