基于跨学科融合的AI for Science多元化投入机制研究

  • 来源:互联网周刊
  • 关键字:跨学科融合,AI for Science,人工智能驱动的科学研究
  • 发布时间:2024-10-15 20:49

  文/陆会会 赵志华 彭亚新 上海大学

  摘要:当前,人工智能领域的科技研发与应用,取得了诸多骄人的成果。尤其是生成式人工智能工具的广泛应用,使人工智能驱动的科学研究(AI for Science)范式成为现阶段引领人工智能研究的一种全新科学范式——“第五范式”。对此,科技部和国家自然科学基金委员会正式启动了“人工智能驱动的科学研究”专项部署工作,基于跨学科融合的AI for Science的研究纷纷呈现。本文从此角度切入,对AI for Science理论做了简要概述,分析了跨学科融合的AI for Science多元化投入的现状,并针对其中存在的问题,研究了跨学科融合的AI for Science多元化投入机制。以期通过本文的分析与研究,能够为这种全新范式的成熟与应用提供参考与借鉴。

  关键词:跨学科融合;AI for Science;人工智能驱动的科学研究

  引言

  新时代背景下,AI for Science在数字化和自动化研究领域方面取得了斐然的成绩,如对高维数据的探究、对复杂系统的解析以及深度学习技术等方面,都要远超人类水平,在物理学和生命科学领域所发现的知识也逐步转化为多项应用成果。可以说,基于跨学科融合的AI for Science不仅极大地推动了科研创新,更在引领技术进步的基础上形成了通用性新范式模式。然而,对于AI for Science所进行的多元化投入方面,却仍面临多样化的挑战,若应对不善会使AI for Science的发展出现滞后性[1]。因此,对于“基于跨学科融合的AI for Science多元化投入机制”的研究具有极大的应用价值与现实意义。

  1. AI for Science 理论概述

  AI for Science即人工智能驱动的科学研究,被称为科学发现的“第五范式”。其作为人工智能发展的前沿领域,包含合成数据、科学模型、科学研究闭环三项要素。与传统的人工智能研究模式不同,AI for Science更趋向于跨学科领域的研究与应用,为跨学科的融合进行人工智能的赋能。

  2. 跨学科融合AI for Science多元化投入现状

  2.1 资金分配不足

  现阶段,虽然我国致力于人工智能领域的科学研究与发展,但在各项科研资金的投入方面,仍然较为倾向于传统科研领域。

  一方面,基础研究资金极为有限。在进行AI for Science项目时,通常需要数量庞大的算力与数据等作为支撑,这些无论是从获取还是维护角度,所需的资金数额都是巨大的。现阶段,在科研资金的分配上,更倾向于已经投入应用且有不错前景的科学领域。作为新兴的跨学科融合领域,AI for Science在现有科研资金的分配上并不占据优势。

  另一方面,AI for Science所涉及的跨学科融合,需要跨学科团队之间进行协作[2],由此也需要为跨学科团队之间的沟通交流与协作投入更多的资金。例如,建立跨学科的联合实验室、组织各学科交流与研讨的会议活动等,都需要大量资金支持。此外,AI for Science作为新兴科研范式,其项目科研周期相对较长,科研成果的未知性较大,且未必会在短期内得到收益,也导致此方面的资金分配不足。

  2.2 人才短缺及跨学科能力培养欠缺

  首先,复合型人才短缺。对于AI for Science领域而言,所需要的人才不仅要精通人工智能技术,还要兼备较为深厚的科学背景与底蕴,在对AI for Science未能达到研究深度的阶段,这类人才极为紧缺。这就需要专业人才的多学科涉猎与深度学习,而这无疑需要花费相对较长的培养时间。中国劳动和社会保障科学研究院发布的《中国人工智能人才发展报告(2022)》指出,我国人工智能人才存量数约为94.88万人,其中本科占68.2%,硕士占9.3%,博士仅占0.1%。可见,高学历复合型人才更为稀少[3]。

  其次,培养模式差异。据新京报报道,当前,我国已有498所高校开设了“人工智能”本科专业,209所高校成功备案或申报“智能科学与技术”本科专业,在一定程度上表明了AI专业呈现出的大爆发趋势[4]。通过对我国高校进行调研后发现,现阶段我国高校所采用的人才培养模式主要有三种,分别为“原有专业+人工智能专业培养”“新增人工智能专业培养”“重组原有专业+人工智能学院培养”。但在人才培养过程中发现,这些培养方式不仅缺少科研的领军人才,更缺少针对人才培养的课程建设经验。部分高校教师表示,人工智能技术专业需要大量的实践教学,但大多数高校所能给予的数据算力不足以支撑大规模的教学与训练需求,导致相应的跨学科复合型人才缺乏。

  2.3 数据共享缺乏安全性

  在跨学科AI for Science项目中,往往会涉及多种形式的数据隐私保护情况。例如,生物医学、健康科学等学科领域,在进行人工智能融合研究时,会面对用户的个人身份或健康状况等隐私信息,若对此类数据信息进行共享,则很有可能会导致个人隐私泄露。因此,在保护个人隐私安全性的同时实现数据共享,将成为跨学科融合中的一大难题。跨学科融合的AI for Science作为全新的研究范式,所产生的各类科研数据不仅具有创新性,更具有巨大的商业价值,因而此类科研数据大多涉及知识产权问题。如何在确保知识产权的基础上,使所共享的数据信息仍具有创新性和商业价值,也成为跨学科融合的重要问题。

  2.4 技术成熟度偏低

  现阶段,AI for Science技术尚处于发展阶段,虽然发展速度不断加快,但技术的成熟度仍然偏低。

  一方面,AI for Science不再是单一学科研究领域的问题,而是多学科、跨学科相融合的全新研究领域,因而对复合型人才及交叉领域人才有极大的需求量。加之AI for Science在算力与数据等方面存在挑战,如数据的精准性、数据模型构建的可解释性、计算资源等方面,都缺少极为成熟的技术作为支撑。

  另一方面,针对AI for Science所实施的体系化布局尚不完善,虽然在一些基础科学领域中人工智能应用愈发广泛,但在数据的生成、标注、选择等方面,仍有待精化,由此也导致跨学科的AI for Science技术存在成熟度偏低的问题。除此之外,人工智能的可解释性也是众多科技人才不断探索并力求提高技术成熟度的目标之一。

  3. 跨学科融合的AI for Science多元化投入机制完善措施

  3.1 建立专项基金,优化资金分配

  针对AI for Science多元化投入资金分配不足的现状,可通过建立专项基金与优化资金分配来予以改善。2023年3月,为贯彻落实《新一代人工智能发展规划》,科技部会同国家自然科学基金委员会,启动了“人工智能驱动的科学研究”专项部署工作。其中明确指出,“将推进面向重大科学问题的人工智能模型和算法创新,发展一批针对典型科研领域的‘人工智能驱动的科学研究’专用平台,加快推动国家新一代人工智能公共版图开放创新平台建设,支持高性能计算中心与智算中心异构融合发展”[5]。基于此现状,AI for Science多元化投入资金问题,可借鉴一些省(自治区、直辖市)的AI for Science领域发展措施,建立专项基金。例如,2021年,上海市科学技术委员会首次推出“基础研究特区”制度,分别在复旦大学、上海交通大学、中国科学院上海分院设立“特区”,并以5年为一个周期,每年为这些“特区”投入2000万元,致力于交叉融合领域的科学探索[6]。除此之外,仍须实施多项步骤予以完善,如依照国家的战略发展方向和前沿科技研发趋势,明确AI for Science专项基金的研究领域及目标。在此基础上,制定与之配套的资金管理与分配机制,以此确保AI for Science专项基金能够应用于相关跨学科领域技术的研发[7]。同时,聘用人工智能领域专家建立专项基金专家委员会,对专项基金的应用进行公开与透明的评审与监督。这种专项基金将使AI for Science项目专款专用,形成更为公平、公正化的项目评估与资金分配体系。

  3.2 跨学科教育+产学研合作

  为改善跨学科融合的AI for Science投入问题,可通过加强高校跨学科教育及培养,并采用产、学、研合作模式予以解决。对此,高校除设立人工智能技术专业外,还应针对AI for Science的实践应用特征,开设多样化的跨学科课程,使人工智能与多种科学领域进行交互、交叉与融合。针对高校人才培养方向的不同,可在结合自身学科优势的基础上,构建与AI for Science相匹配的人工智能课程体系。针对AI for Science跨学科领域的关键性核心技术,实施有针对性的高端人才培养计划。在此基础上,还应加强高校人工智能方面的基础设施建设与交叉微专业构建,以此提升并优化高校在人工智能方面的算力资源,并分配好智能算力和通用算力之间的配比。

  在产学研合作方面,要强化政府职能部门、高校、企业之间的沟通与交流[8]。一方面,建立针对人工智能人才培养目标的引导机制与互动机制。高校和企业进行人工智能技术专业课程的协同开发,并在合作企业内设立实训基地。高校与企业通过工学交替、定向培养等方式,为企业产业链的细分环节输送专业性人工智能技术人才。另一方面,应由政府职能部门牵头,建设一批适用于高校与企业的人工智能产教融合创新实验室,将企业较为成熟的人才培养模式纳入高校跨学科教育和产学研合作模式,为完善AI for Science的多元化投入机制奠定人才基础。

  3.3 构建数据共享平台,加强数据保护

  跨学科融合AI for Science的数据共享安全问题,是全社会乃至全世界共同面临的问题。为此,需要政府职能部门与科研机构共同构建可供数据共享的平台。

  一方面,加强数据安全和对个人隐私的保护。通过制定数据使用规范,利用数据加密技术、匿名处理技术等,保障共享数据的安全性,并确保个人隐私不会因数据共享而泄露。

  另一方面,要促进共享数据的开放程度与利用率。例如,对于达到准入标准而进入共享平台的用户,可通过分享数据信息来增加信用等级,当信用等级提升后,可查阅和应用开放程度更低、保密等级更高的数据信息,在增加共享数据信息利用率的同时,也能形成数据共享的良性循环。

  3.4 加强技术研发,构建转化平台

  一方面,加强技术研发。这是为AI for Science提供可解释性的重要途径之一。针对现阶段跨学科AI技术研发的不成熟性,可从系统工程角度入手,对跨学科资源加以整合与优化,使之形成可协同、可创新的“学科生态系统”。例如,2023年10月第六期CCF秀湖会议,就针对AI for Science提出了跨学科交流平台的构建意向,并提出要通过量子计算模拟器的开发,解决传统计算平台不足以支撑大规模算力的问题,如构建“量子计算云平台”等,解决当前GPU算力受限问题[9]。

  另一方面,搭建针对跨学科的技术转化平台。该平台通过对AI+Science的整合,为科学研究提供多种形式的功能,如数据处理、模型训练、学科融合前景、技术完善与应用等,以此促进科学发现与技术创新[10]。

  结语

  AI for Science正处于快速发展阶段,也正在致力于打破学科壁垒,形成一种全新的科学研究范式。未来,AI for Science将通过某一模型解决不同科学领域中的众多难题,也能通过一种更为普及化的科学探究范式,使人们都可以参与科学发展研究。对于现阶段跨学科融合的AI for Science在多元化投入机制中存在的问题,也必将随着AI for Science的深度研发而寻求到更科学的解决对策。

  参考文献:

  [1]刘梦迪,李伦.划分科学研究范式的另一种视角——从AI for Science谈起[EB/OL].(2024-07-01)[2024-08-08].https://doi.org/10.16192/j.cnki.1003-2053. 20240628.004.

  [2]高杲.AIforScience人工智能的风终于吹到了科学界[N].四川日报,2024-05-28(9).

  [3]张晓静.加强人才培养,推动AI产业发展[EB/OL].(2023-05-15)[2024-08-08].http://digitalpaper.stdaily.com/http_www.kjrb.com/kjrb/html/2023-05/15/content_553196.htm.

  [4]丛林.高校开设人工智能专业不宜大干快上|新京报快评[EB/OL].(2024-06-27)[2024-08-08].https://www.163.com/dy/article/J5NNNIV10512D1R0.html.

  [5]宋晨.科技部启动“人工智能驱动的科学研究”专项部署工作[EB/OL].(2023-03-27)[2024-08-08].https://cj.sina.com.cn/articles/view/1699432410/654b47da0200132t6.

  [6]吴振东.复旦大学:在创新的源头“种好自己的树”[EB/OL].(2024-08-23)[2024-08-28].http://www.news.cn/local/20240823/1286eb19b0f746ce8798a205021e5ff3/c.html.

  [7]李建会,杨宁.AI for Science:科学研究范式的新革命[J].广东社会科学,2023(6):81-92,289-290.

  [8]周江林.AI4S对我国高校基础研究的影响机理及实践边界[J].教育发展研究,2023,43(21):31-38.

  [9]范昕茹.探索AI for Science“复旦范式”[N].IT时报,2023-07-07(3).

  [10]杨小康,许岩岩,陈露,等.AI for Science:智能化科学设施变革基础研究[J].中国科学院院刊,2024,39(1):59-69.

  作者简介:陆会会,硕士研究生,研究实习员,luhuihui@shu.edu.cn,研究方向:管理学;赵志华,硕士研究生,讲师,研究方向:美术史;彭亚新,博士研究生,教授,研究方向:人工智能驱动的科学研究(AI for Science)。

关注读览天下微信, 100万篇深度好文, 等你来看……