从机器到人工智能
- 来源:中国计算机报 smarty:if $article.tag?>
- 关键字:人工智能,工作 smarty:/if?>
- 发布时间:2016-09-27 11:51
弗雷斯特研究公司(Forrester)近日发布的报告显示,未来5年人工智能或将取代传统客户服务、物流运输、公共交通等领域的人的工作职位,约占目前总工作岗位的6%。到2021年,人工智能将取代更多工种使其自动化,目前可以看到的受冲击最大的是交通物流和客服领域。
之前《经济学人》的一项针对702个工种的调查显示,美国47%的人的工作在未来都有可能被自动化,其中电话营销员、会计审计、零售人员等职位在未来几乎会被自动化的人工智能所取代。
虽然很多工作人工智能机器会代替人,但是人则有更重要的事情做。小i机器人创始人、董事长兼CEO袁辉近日在出席活动中表示,人工智能是把人从重复、基本的标准劳动中释放出来,人工智能不是去消灭人,而是释放人,让人去做更有意义的事情。
云知声创始人、CTO梁家恩也表达了类似的观点。他认为,一、人工智能的产业化趋势不以人的意志为转移,而且已经到来了;二、人类不能低估当前所面临的诸多问题,人工智能只能解决可以抽象出来的、适合机器去做的一部分问题,而且在机器能够替代人类解决更多问题的时候,人类会有更多的创造力和能力被激发出来,也有更多需求爆发出来。
美国著名作家凯文·凯利(Kevin Kelly)近日表示,机器人会使得人类的一些工作消失,但是机器人时代的来临又会给人类创造新的工作机会。100多年前,70%的美国人都是农民,现在只有0.5%的美国人是农民,有很多农民失去工作,但是这些农民又获得了新的工作。现在和过去一样,尽管有的工作会因为机器人时代的到来而失去,但是机器人产业的兴起又会创造新的工作机会。
弗雷斯特研究公司的报告认为,到2021年,人工智能将能够更好地理解人类的语言,并从人类身上不断进行学习,并依此来处理更为复杂的问题。此后的3到5年,人工智能则可能会渗透到人们生活的方方面面。
弗雷斯特研究公司认为,到2021年,人工智能开发人员和商业公司可以在即将面世的人工智能平台上创造人工智能的工具或者使用人工智能工具提升商业竞争力。目前,脸书和谷歌都在着手开发这样的人工智能平台。脸书的人工智能平台已经开始部分上线,其信使(Messenger)服务正在不断添加开发者工具,帮助公司用户通过人工智能机器人与用户进行互动。脸书的信使服务目前已经拥有3.3万个机器人,来帮助用户自动化以往占用大量人工的后台流程和服务。
斯坦福大学近日发布的《2030年的人工智能与生活》报告,更加系统地介绍了目前人工智能对人类社会的影响。
报告认为,尽管人工智能很有可能会对典型北美城市的就业和工作场所产生深远影响,但对当前的影响目前还难以做出评估是积极的还是消极的。
报告认为,人工智能进入工作场所将是一个持续的、长期的、渐进的过程,其影响的范围也将逐步扩大,从少量替代、逐渐增加到完全替代。比如说,尽管大部分律师的工作目前还没被自动化,但人工智能在法律信息提取和主题建模方面的应用已经成熟,可以替代一些第一年工作的律师新人的工作。在不远的将来,包括从放射科医生到卡车司机到园丁等许多类型的工作都可能会受到影响。
人工智能也将创造工作,特别是在某些行业中,通过使某些特定任务更重要,以及通过产生新的交互模型可以创造新类型的工作。人工智能界有一个活跃的研究社区在研究创造新市场和使已有市场更高效地运作。
机器学习是人工智能的关键
人工智能在很多人的心目中总不是一个真实的存在,只有在科幻小说或者电影中才会出现。但事实是,长期以来人工智能已经存在于人们的现实世界当中,而且随处可见。
为什么说人工智能随处可见呢?实际上,现在人们已经用到的很多应用就是基于人工智能技术,比如给照片打上标记,还有探测一些普通的欺诈行为,还会有更加复杂的基于人工智能的应用,比如说精准医疗,这些都是人工智能的。
英特尔销售与市场事业部副总裁夏乐蓓近日在媒体会上表示,人工智能将极大地改变商业运转和人们的生活方式。“刚才说过了人工智能,我们接下来往内再多说一层——机器学习。机器学习是人工智能这个大范围领域里面很小,但是发展速度非常快的一个具体的分支,它是非常尖端核心的计算能力,可以让机器在无需具体程序指导的情况下开展学习。”夏乐蓓表示,“在机器学习方面,英特尔也有非常多的技术可以加以应用,可以通过这些让机器从过往处理过、接收过的数据当中汲取经验,使得它慢慢可以达到像人一样智能的水平,所以它是人工智能当中一个新生的但是发展速度很快的领域,也是英特尔在技术上有很多投入的领域。英特尔在这方面有很多库,还有参考架构,这些库和参考架构可以帮助我们的客户充分挖掘和利用机器学习的力量。”
机器学习再进一步是深度学习,它是机器学习的又一个具体的分支,深度学习使用神经网络来理解更加复杂的非结构化数据,并在诸如图像识别、语音识别、自然语言处理及其他复杂任务方面取得了突破性发展。深度学习模拟大脑中的神经元和神经键,通过迭代和神经网络中复杂通道的形成来学习。目前,深度学习已经在有些领域实现了一些实质性的突破,如社交媒体上的面部识别和标记功能、智能手机上的语音识别、半自主车辆控制等应用。
“英特尔在看待这些发展的时候是从产业全局的视角,我们不是只看一个具体微观的领域,我们也不是只看深度学习或者机器学习的某一个部分,我们关注的是整个人工智能发展的全局。而且除了这种整体性、全面性之外,我们还能够提供从客户端通过网络直到云端的产品。”夏乐蓓表示,“我们所说的人工智能并不是存在于科幻小说或是未来才会发生的事情,它现在已经实实在在存在于现实的世界当中,因为我们的硬件水平更高,我们有了更加智能的算法,并且我们有了海量的数据。”
要实现快速学习和反应,机器学习需要强大的计算能力来运行复杂的数学算法并处理大量的数据。要减少机器建立模型的时间,同时还要提高模型数据评分的速度,需要向分布式计算模式的转换,并使用强大、多节点集群的基础架构。“英特尔提供了可在高性能计算、数据分析和机器学习工作负载上使用的一致性编程模型和通用架构。”夏乐蓓表示。
打通人工智能上下游
“我们收购了阿尔特拉(Altera),将它的解决方案融入到英特尔的产品线当中,通过更好地融合FPGA(Field-Programmable Gate Array,现场可编程门阵列)的技术,我们能够实现在人工智能方面更强大的能力,比如能够更节电,而且性能也得到了提升。”夏乐蓓表示,“英特尔在人工智能领域中的发展策略是经过仔细考虑制定的,同时也得到了非常好的执行。当然最核心的内容是英特尔自身的能力、产品、路线图。另一个重要的因素是,我们通过收购来进一步强化自己的能力。”
除了收购阿尔特拉,英特尔最近还收购了一家叫做涅瓦那系统(Nervana Systems)的公司。涅瓦那系统是深度学习领域中名副其实的行业领先者。收购它将强化英特尔在深度学习领域中的能力。“我们将涅瓦那系统所带来的技术与英特尔自己的库,以及我们现在所执行和制定的标准非常好地整合到一起去,使得英特尔具有更加强大的能力,在深度学习领域中向前推进。”夏乐蓓表示,“收购之后,我们得到了涅瓦那系统的重要的引擎和它的专业技能,同时这些技术反过来对我们的至强系列产品也产生了正面的影响,整个至强系列产品不管是在性能,还是在总体拥有成本上都得到了进一步的优化。”
从计算机时代跨入机器人时代
从计算机的角度来讲,过去一直是CT(Computer Time,计算机时代),现在已经半只脚踏进了RT(Robot Time,机器人时代)。“我们在计算机上加了一些什么让计算机有了这样的能力呢?”英特尔中国研究院院长宋继强博士在近日举办的媒体会上表示,“一是增加了感知的功能。现在感知技术是很多设备必须拥有的技术,传感器也非常便宜并且有效。二是在计算的基础上计算机有了认知的能力,认知能力来自人工智能的技术,包括怎么识别东西,怎么去理解用户的意图,怎么样分析,怎么样决策。三是对一个自主机器来讲,它要可以移动,拥有对现实世界进行反馈的行动能力,这些是传统机器人技术的优势,那时候叫机电一体化,现在和计算机技术深度整合以后,可以做出更为智能的机器人。同时我们要注意,这里面用户是非常重要的一环,我们说机器人和用户通过感知、认知、行动这三个步骤串联起来以后,用户就会对机器人的行为进行反馈,机器人又进一步感知、认知、行动,整个就构成了一个良性的循环。”
宋继强认为,智能机器的发展过程不是一蹴而就的,而是经历了多个阶段。总的来看有三个阶段。
第一阶段,互联。这些机器从原来的固定的形态、固定的系统、固定的软件的无法连接网络的嵌入式设备逐步发展,先是把它联上网络,联网之后它就可以获取更多信息从而实现交互,机器不再是一个单独的个体。
第二阶段,智能。通过智能软件让机器拥有了初步的感知和处理信息的能力,机器可以与人做一些高级的交互,比如机器可以识别人脸,能够知道这个人跟它在说些什么,它也能做出相应的反馈,同时也可以做到一些个性化的设置,这个时代基本上是通过智能手机技术发展起来。
第三阶段,自主。在这个阶段,机器可以理解人的一些行为,知道人现在是什么情绪,并且做出一些合理的推理和规划,最后做相应的处理和反馈,这时候的机器行为必须是可以预测而且可靠的。
从智能到自主发展的阶段,宋继强认为从计算角度来看人工智能可能会有以下几个挑战。
第一个,有非常多的传感器的数据会进到这个人工智能系统当中,人们希望机器能够实时给出反馈,所以这是第一个挑战。
第二个,现在人工智能技术非常依赖计算和大数据,到底能不能把它放在设备端,还是要把它放在云端,目前是存在争论的。
传感器很重要
“首先,为什么说传感器数据越来越多。对于一个自主的机器来讲,它要去感知世界,要去和人交互,它至少要能够采集到这么多数据,而且这么多数据不可能都由一个传感器获得,它会由多种不同的传感器获得。并且传感器不仅要采集物理信号数据,还要做一些处理,知道它的含义。”宋继强表示,“我们可以看到英特尔有一个最新的技术就是拥有感知功能的传感器,目前有三个型号。SR300,它可以在大约1米左右的距离,精准地监测人的手势、脸部的细微动作。R200,它可以监测0.5米到4米的距离。如果这个机器要运动,它就需要建立环境模型,ZR300则可以满足需求。ZR300拥有运动传感器,它还可以实时同步视觉场景和运动轨迹,并把它们关联起来。”
机器看一个事物需要很多不同的传感器,因为不同传感器产生的数据是不一样的。对于一个机器来说,如果在环境里要能够自主移动,首先它要能够建立环境三维立体地图,如果不能够快速准确地建立起环境三维立体地图,并且迅速识别其中的物体的动作,比如人做了一些什么手势,猫做了什么动作,如果做不到这些的话,机器在这个环境运行就会出现问题。所以,传感器对于机器来说是至关重要的。
“我们现在用基于红外的投射光去检测在物理上的形变,然后再分析物体离机器有多远。但是这个技术有几个问题,比如物体距离超出范围是没有信号反馈的,就会出现白区。比如桌面是大理石材质,镜面反射很好,红外光反射不回来。比如中国人头发是黑色的,可以吸收更多红外光,所以黑色的地方也不会有信号回来。也就是说靠单一传感器,我们没有办法让机器人自己去把运动导航这个事做好,我们需要加入很多其他的传感器。”宋继强解释道,“比如加入激光雷达、超声波、运动传感器和编码器,通过这些传感器组合成一个合成的传感器,把这些信息互相补充结合。比如距离过远,红外传感器看不到东西的时候,还有另外一个激光雷达把这个数据送回来;比如这儿是一块玻璃,红外光穿过去不知道深度的时候,可以通过超声波把数据送回来。靠这种多传感器数据融合的方式,可以拿到一个完整的数据,增加机器人的可靠性,这也是为什么人工智能会需要这么多种信息源输入的原因。”
对于机器人交互来说,数据也非常重要。比如人们想让机器与人进行交互,深度摄像头和彩色摄像头可以分别给机器提供重要信息。比如让一个机器人在家里照顾老人,这个老人早上没有起床,机器人需要侦测到这个情况,老人在不在床上,需要让机器人过去查看。这时候深度摄像头和彩色摄像头都不管用,因为深度摄像头靠的是物体之间的距离差,人在被子里的话是无法识别的。彩色摄像头靠颜色的特征去查找,如果这个老人大部分身体被被子盖住只露了头,彩色摄像头这时候也是检测不到的,这时候就需要加上其他的传感器,机器人才可以正确找到老人。5G通信中经常用到的毫米波就是一个好办法。毫米波有很好的穿透纤维的特性,它可以很容易地穿透被子、衣服,看看人在不在里面。
这个例子充分说明了,如果让机器人与人获得更好的交互体验,光有摄像头是远远不够的,还要有其他的传感器进行配合。但是这又会带来新的问题,对于机器人来讲传感器越多,产生的数据也越多,如何高效处理这些数据是个大问题。举例来说,有个在太空中处理一些异常事物的机器人叫“螳螂机器人”,它有4000个传感器,其中有很多视觉传感器,它们产生的数据流非常多,这么多数据流同时进来并要快速做出反馈,对于机器人来说是一个很大的挑战。
除了极端的太空机器人,就是一般的自主机器人也需要处理很多东西,包括视觉信号、声音信号,还有环境里采集来的很多其他类型的信号,各种多维度、实时进来的结构化、非结构化的数据。“对于这样的情况机器要多快才行?我们做过一些实验,比如对检测人脸的表情,有7种最基本的表情要检测出来,至少要达到100帧/秒的速度,才能保证机器人能够快速识别出来,并且处理器还要有足够的能力去运行机器人其他的功能。”宋继强表示,“这样就必须要有一个强大的实时处理器,因为人脸的表情要送到云端进行识别再反馈回来,这样的话速度就太慢了,严重影响用户体验。”
根据需求确定在哪里进行计算
如果机器人要在一个环境里进行漫游,它就需要知道在这儿会碰到什么东西,在那儿会碰到什么东西,如何躲避这些障碍物。“我们通过深度学习网络技术构造了一个框架,这个框架可以同时做两件事情,一是检测有什么障碍物;二是判断出这个物体的位置和姿态,这样既可以帮助机器人定位自己的位置,又可以知道怎样绕过或者操作这个物体。”宋继强解释道,“这个速度我们希望能达到实时或者接近实时,因为机器人运动的扫描速度虽然不需要30帧/秒这么高,但是至少也要能达到20帧/秒以上,这样才能够保证它的运动是平滑流畅的。”
怎么样让这些计算部署在不同的场所里呢?将计算放在哪端更合适呢?“我们现在看到很多不同的说法,有的说一定要在前端计算,因为我的网络不好,不能依赖这个网络。也有说我觉得网络非常好,5G可以达到延时在10毫秒以下,所以可以将大部分计算放在云端。”宋继强认为,“到底怎么样规划这件事情呢?我们觉得不必太执着于一定要在云端还是在前端,根据应用的需求来确定就好了。”
宋继强举了一个例子,“比如我的前端设备有好几种,有机器人、无人车、手表、监控摄像头等,同时我有后台远在数据中心的云,也有部署在环境基础设施里的边界云,整个过程应该是以一种互相合作的方式把这个任务完成。”
对于前端来讲,前端的设备是离物理世界最近的,所以它要负责感知功能,还要负责感知之后的数据分析处理,也就是说机器要初步知道它感知的是什么东西。它会结合边界云的信息,利用5G网络延时非常低的特性,提高机器认知的效率,及时作出正确的判断。
比如说无人车,无人车在开出去的时候,如果光靠它自己的传感器,它很有可能会产生一些失误。但是如果它结合环境里给它的一些信息,比如有环境里的摄像头、红绿灯给它的信息、斑马线给它的信息,这时候它做决策的视角就会广阔得多,不会再局限于无人车视角里看到的东西,所以这个阶段非常适合做快速的决策。
“从这个简单的例子我们可以发现,5G网络其实是一个联通云端和各种智能设备非常重要的途径。英特尔目前已经构造了这样的良性循环网络,从云端到最终的客户端设备都有不同级别的硬件去支持他们做智能化的演进。”宋继强表示。
在云端最上面,英特尔有至强融核这种高性能技术,它结合了涅瓦那系统的技术。在中间层,既可以放在云端又可以放客户端的有至强+FPGA。在前端有酷睿,它带有图形加速功能,可以做深度学习、做智能加速,同时还有更加小型的产品。比如在旧金山英特尔信息技术峰会上(IDF)上刚刚发布的欧几里德(Euclid),欧几里德把凌动(Atom)级别的处理器和实时感应摄像头完全整合在一个名片盒大小的模板里面,非常适合无人机、小型机器人直接使用,同时它还可以处理计算量不大的人工智能计算。值得一提的是,居里(Curie)这个小小的模块,它自带了108个神经原分类器,可以直接把运动中的场景和动作进行分类,比如骑自行车、滑板等都可以直接进行识别并分类。
■本报记者 张楠
