夯实计算基础 方能行稳致远

  回顾我国传统计算发展历程,可以分两个阶段。一是在电子管、晶体管中小规模集成电路时代。我国元器件与国际相比有差距,但是还不太大,是量上的差别。当时完全是基于国产的器件研制计算机的硬件系统,同时自行研制软件系统。当时我国发展计算机的原则是:借助外援而不依靠外援,坚持独立自主引进技术,不单纯购买机器,有步骤地发展我国计算机事业。

  当集成电路进入超大规模时代,我国在微处理器技术方面出现了质的差距。为满足发展需求,1981 年以后国家允许进口配套的器材来组装系统或者直接引进计算机系统来解决应用需求,这样基于引进的微处理器设计系统或者集成引进系统来做开发应用,就成为主要路径。由于系统硬件退出了核心技术,系统软件也就失去了发展动力,大部分学校也把人才培养转向了计算机应用专业。特别是出现了软硬联盟、抱团竞争的计算生态垄断以后,我国几次努力都未能改变传统基础计算平台发展的被动局面。

  回顾这段历史,我想有几点启示。第一,使能技术、基础平台,决定了自主发展的基础能力。第二,模型和算法创新,能够牵引体系结构的变革。第三,规模应用是整个生态发展进步的动力,技术的转轨可以来创新发展的机遇。

  智能计算带来创新发展的机遇

  大家都把这一次人工智能的兴起归结为深度学习+大规模计算+大数据(算法、算力、数据)。2006 年被视为深度学习元年,虽然神经网络概念较早就提出来了。深度学习之所以成功的重要背景是,计算能力达到了可实用要求,互联网的发展又带来了大量可用的数据。这一次人工智能的兴起有一个重要特点。前两次更多是由学术主导,学术界呼吁政府和投资人投资。而本次主要是商业主导,政府和投资人主动向热点领域投入。可以说,这一次的兴起是人工智能技术真正与产业结合,飞入寻常百姓家。

  人工智能或说智能计算也存在生态问题。智能计算分为两个相对独立的阶段,一是训练学习阶段,二是推理应用阶段。智能计算平台可以分为两大类,一个是云侧平台,解决模型的训练(学习)及海量智能信息服务(推理)问题,一个端侧平台,百花齐放,主要解决推理应用。

  智能计算模式相对比较少,精度要求相对低。深度学习算法集中在一些相对固定的操作模式,如向量、矩阵运算,在训练阶段,单精度(32 位)或者半精度(16 位)就可以了,在推理阶段,甚至可以到低值、二值。此外,智能计算可并行度高,目前神经网络同一层的计算可以完全并行,而且很多是规则的大数据流并行。

  智能计算对体系结构的要求

  智能计算也对体系结构提出了新的要求。比如,在云侧的模型训练需要高效能大规模并行计算能力的支撑。特别是学习模型参数多、数据规模大、计算量大的时候。

  在云侧,如果用推理应用就需要高吞吐率、低延迟的服务计算模式支撑,满足海量并发推理任务的服务质量要求,对海量在线用户的快速实时响应。

  端侧的推理应用需要小型化、高能效、低时延、传感-计算-通信融合的体系架构支撑。无人机/无人车/机器人等诸多设备,对时延要求非常苛刻。

  当前智能计算技术发展态势主要有如下特征。

  一、大家都在积极探索高效智能处理芯片体系结构及实现技术。

  总体上来讲,专用的 ASIC 芯片具有一定优势。测试表明,专用 ASIC 的能效比(性能/瓦)明显优于 CPU 和 GPU。同时,ASIC 芯片发展前景也比较好,预计 2025 年市场规模将超过 CPU 和 GPU 的总和。

  二、努力探索新型体系结构。此外,还有探索高效好用的智能計算的软件生态,比如智能计算软件框架,包括高效语言编译、基础算法库等,努力打造软硬一体的智能生态计算。

  在云侧,计算机产业几大优势企业正在竞争主导地位,比如谷歌的定制专用智能芯片 TPU,英特尔和微软试图采用 CPU+FPGA 争夺市场,华为发布专用智能芯片昇腾 910。

  在端侧,各大公司纷纷推出 ASIC 芯片架构,ARM、英特尔、苹果、高通等企业在芯片上做出了很大的努力,中国企业的典型代表有华为、寒武纪。

  同时,各公司纷纷开源智能计算软件框架,当前的态势是群雄竞争,谷歌领跑。我前面讲过,传统计算已经形成了软硬件抱团竞争的垄断态势,但是智能计算当前的态势是,软硬件还相对独立,尚未形成软硬一体抱团竞争的垄断局面。

  我国人工智能发展面临大好机遇

  我国应用需求旺盛,应用成果多。2018 年,中国人工智能企业数量在全球排名第二,是全球人工智能投融资规模最大的国家之一。同时,我们也拥有一支实力强的科技队伍。AI Index 2018 显示,我国在人工智能领域发表论文的数量已经超过美国。人工智能领域的专利申请排名前十的国家,中国也是排在第一。

  在基础领域,我们也取得了可喜的成果。现在围绕智能芯片的研发,2018 年,中国有 7 家企业进入全球排名的前 24 名。智能计算软件框架,中国企业也有领头,比如百度的 PaddlePaddle、腾讯的 Angel、阿里的 X-DeepLearning 等。我们有很好的起点。但是我们也面临着严峻的挑战。一是原始创新能力不足。我们的研究跟踪多、创新少,量有优势、质上明显不够。二是短板明显。智能芯片产品主要面向推理,云侧训练芯片竞争能力弱,高性能 GPU、FPGA 仍依靠引进。三是从事技术平台和处理器芯片的企业数量比较少。无论是在计算基础平台还是处理器芯片研制上,我们的企业占的比例都较少。四是应用开发主要基于国外智能计算软件框架之上。五是我国自主智能计算软件框架的影响力与国际相比存在较大差距。聚集在上面的第三方应用少,以自用为主。从 Github 活跃度上可以看到,百度 PaddlePaddle、腾讯 Angel、阿里 X-DeepLearning 与谷歌 TensorFlow 等差距较大。

  除了以上几点,最大的挑战是,虽然我国软硬件研发能力已有质的提升,但研发产品的竞争力仍然不强。如果我们不抓住机遇,夯实基础,下大力气去打造有竞争力的抱团竞争的智能计算生态,仍然只是注重近期效益,发展应用,我们就有可能重蹈传统计算产业的覆辙。一旦在人工智能领域、智能计算领域也形成若干个这样的垄断生态,那我们又要变得被动。

  如何应对目前的艰难局面

  对于如何应对,我觉得有如下几点思考。

  一、学术界要面向智能计算挑战问题,加大国内外合作,持之以恒,以基础理论、计算模型和算法上的创新突破,牵引体系结构的创新。

  二、产业界要推进产业联盟,发挥既有骨干企业优势,构建上下游协同的产业链,集中力量打造我国有竞争力的智能计算生态。关键是集聚应用、滚动发展、形成规模,规模越大,生态会越稳定。

  三、管理部门要综合施策。一是激励骨干企业加大对基础平台的投入;二是引导学术界、企业、应用部门基于自主计算生态做研究和开发;三是成立智能产业发展大基金,市场和政府协同,以目标为导向,推动产学研联合,特别是要关注当前的一些小微创新。

  四、教育部门要合理部署多层次人工智能领域人才培养,在人工智能领域,从当前来看,虽然大家都很重视,但无论是人才总数还是基础人才数量,我国和国际都存在很大差距。

  (本文根据卢锡城院士在第三届世界智能大会上的演讲整理而成,未经本人确认。)

关注读览天下微信, 100万篇深度好文, 等你来看……