机器人与专家之争:谈机器人评标的发展

  • 来源:中国招标
  • 关键字:机器人,专家,发展
  • 发布时间:2025-04-18 15:50

  文/刘闻博 包苏日古格

  近年来,作为前沿技术的人工智能(Artificial Intelligence,AI)持续向公共资源交易领域渗透,在招标、投标、开标、评标、定标各个阶段均发挥着作用。越来越多的地区正在试点机器人评标。机器人评标在为公共资源交易领域引入智能新活力的同时,也挑战了招采人的传统思维,并引发了诸多争议。有观点认为,机器人评标能够破解招投标中的腐败难题,并增强评标的公平性;也有观点认为,机器人评标诱发了数据安全、伦理风险等一系列问题。机器人评标能完全取代专家吗?未来的机器人评标可能会走向何方?

  机器人评标的前沿发展:从人形到人脑

  早期的评标机器人仅能起到驻守现场、视频监控、录音留痕等辅助作用,彼时的评标机器人只具有人的外形,却不具备人的智慧,无法独立完成评标工作。随着AI技术的不断进步,评标机器人的技术重心开始从外形转移到思维上。然而,让机器人充当评标专家,面临着理解、知识、规则、算力、运维、安全等重重挑战。第一,机器人需要能够阅读复杂的招标文件和投标文件,并能够充分理解其内容;第二,机器人需要掌握能够打出技术分、商务分的行业知识;第三,我国各个地区的招投标规则之间存在一定差异,机器人需要同时了解不同地区的规则;第四,机器人学习招标文件、阅读投标文件、进行综合评标,需要大量算力支持;第五,由于技术、行业知识和法律法规的不断更新,需要有技术人员对评标机器人进行定期维护和更新,而智能评标机器人的运维成本远远超过普通的电子招投标系统;第六,技术人员需要使用历史投标文件对评标机器人的算法进行训练,而投标文件又属于商业机密,这导致了数据安全问题的出现。

  综上所述,许多地方公共资源交易中心对机器人评标技术望而却步。自然语言处理技术的爆发为解决以上问题提供了契机。大模型的兴起和大规模应用,大幅提升了机器人的阅读理解能力,通过在评标机器人中植入大模型,机器人可以充分理解招标文件和投标文件内容,进而为独立完成评标任务打下了坚实的基础,这是机器人评标发展过程中最关键的一环,这一过程又被称为“评标机器人基座模型植入”。随后,技术人员使用行业知识、法律法规等文本数据对“评标机器人基座模型”进行调参。调参前的评标机器人像一个小学生,虽然能够看懂招标文件和投标文件,却难以进行分析;调参后的评标机器人则具备了专业技能,既能够理解招投标文件,又能够分析招投标文件并作出决策。

  基座模型的植入和调参,需要大量的算力成本。为评标机器人植入基座模型,需要得到大模型开发公司的商用授权许可;基座模型的调参成本,则随着行业、法律知识的增加而不断上升。一方面,蒸馏算法的不断进步为评标机器人的算力问题提供了可能的解决方案——这种在DeepSeek(杭州深度求索人工智能基础技术研究有限公司推出的AI模型)中得到充分应用的新兴技术,已经在最新的评标机器人开发中得到了应用,并大幅降低了评标算力成本。另一方面,在公共资源交易中心的地区联盟化趋势中,评标机器人的运维成本也得以不断降低——联盟中的交易中心可以共享评标机器人中的核心算法,并形成训练网络。此外,通过在评标机器人训练过程中引入联邦学习技术,数据得以实现“可用不可见、可进不可出”,这使得评标机器人可以在保障数据安全的前提下运行。

  从技术层面来看,可以说机器人评标的前景一片光明。2024年以来,我国许多龙头企业都已经上架了机器人评标产品。与此同时,国外机器人评标技术的发展也如火如荼,以RUDY、Bidhive、Arphie为代表的机器人评标产品,已经得到了广泛商用。

  机器人评标的优势与劣势

  机器人评标的优势

  从近期的地方实践来看,与专家评标相比,机器人评标在评标公平性、评标效率、评标成本等方面具有一定优势。

  由于机器人评标的结果是由算法而不是人的主观意志驱动,因此,使用机器人代替专家评标能在一定程度上增强评标的公平性,并降低公共资源交易过程中的廉政风险。评标是一个典型的委托代理过程,业主单位与评标专家之间具有典型的委托-代理关系。由于利益冲突和信息不对称的存在,凡委托代理关系就一定会存在违约风险,评标领域也因此成为腐败的重灾区。不少意志力薄弱的评标专家与“黄牛”相互勾结,在评标过程中给出偏向性分数,以此谋取私利。诸多重大案件中都暴露出评标专家违规违法问题。以2024年初的“科学城案”为例,用于拉拢评标专家的贿金竟高达3000余万元。如果使用机器人评标代替专家评标,则可以规避评标过程中由专家引起的廉政风险。

  机器人评标的另一项优势是远超人力的评审效率。近年来,许多地方出现了“爆炸式投标”现象,实践中甚至有项目出现投标供应商超过10 000家的情形。冗长的投标文件使得评标专家十分头疼,评标时难免会“囫囵吞枣”,机器人评标则有利于解决这种困境。在大模型的加持下,具有智能大脑的评标机器人阅读投标文件的速度远超人眼、人脑,可以在短时间内迅速读取和理解海量投标文件内包含的全部内容,并分析出其中的关键信息。随后,评标机器人既可以将这些关键信息整理后反馈给评标委员会,也可以根据算法内的行业知识自主给出推荐供应商名单。

  使用机器人代替专家评标还可以起到降低评标成本的作用。尽管评标机器人在建设初期需要一定的启动成本,但由于算法水平的不断进步,特别是蒸馏算法的进一步推广,评标所需的算力需求正在不断降低。使用机器人评标代替专家评标,业主单位不再需要支付专家评标费,由此节省的成本远远超过评标机器人后期运行维护的费用。展望未来,如果有一天评标机器人能够完全代替评标专家,行业部门甚至不需要再投入资源维护专家库,将进一步减少运营管理成本。

  机器人评标的劣势

  虽然机器人评标具有诸多优势,但也应该看到,机器人评标存在问责不清晰、信任水平低、算法“战争”等问题。由于这些问题的存在,现阶段全面推广机器人评标仍然存在一定难度。

  从问责的视角来看,短期内人工评标仍然具有不可替代性。尽管评标机器人的技术性困境正在得到逐步缓解,但其问责性困境始终难以缓解。根据AI的相关理论,在复杂的现实模型中,任何算法都会存在经验风险和置信风险。换言之,不存在一个永远不会出错的评标机器人,技术的不断进步只能不断地降低评标机器人的错误风险,却不能完全消除这一风险。从目前的实践来看,当评标机器人出错时,往往由评标机器人的开发者来承担责任,但这种被动担责实际上缺乏合理性。专家评标则不会出现这种问题。当下的电子招投标系统具有全过程留痕的特性,由专家引发的错误完全可以追溯。此外,目前许多供应商对机器人评标的结果仍然抱有怀疑态度,对评标专家则更为信赖。评标专家的筛选经历了职称关、考试关、考核关,只有能够充分履行评标职责的人才能成为评标专家,大多数招采人已经习惯了专家评标模式,而对机器人评标则既不习惯也不信赖。在最近的调研中,笔者了解到,大多数供应商并不相信评标机器人能够完全取代专家独立评标。其中部分人士认为,机器人评标的结果可能会被其操作者随意更改。

  目前,AI在投标阶段的应用远远超过评标阶段,AI投标助手已经可以对标书进行不断优化,从而提升中标概率。由于投标助手和评标机器人所使用的训练数据类似,因此,投标助手很容易就可以分析出评标机器人所青睐的投标文件类型。随后,根据针对评标机器人的算法分析结果,投标助手可以为供应商的投标文件进行定制化修改。这可能引发的后果是,只有投标助手美化过的投标文件才能中标,且供应商使用的投标AI系统越高级,对评标机器人的分析就越精准,供应商中标的可能性就越高。如果评标机器人在大范围内得到推广使用,这种现象可能会进一步发展为一场评标机器人与AI投标助手之间的AI“战争”,即评标机器人不断分析投标文件中的AI痕迹,而投标助手不断分析评标机器人中的评分算法。近来,这种AI“战争”已经在评标机器人开发者与投标助手开发者之间初现端倪,双方企业在算法、数据、人才等方面频频“交火”。如果AI投标助手成为胜者,那么,难以承担高额算力和AI技术需求的中小企业将更难以成为供应商。此外,评标机器人和AI投标助手之间的“战争”,还会导致大量算力的浪费。

  机器人评标的趋势展望

  目前,评标机器人全面代替评标专家还不太现实。笔者认为,未来的评标机器人可能会经历3个时期的发展,分别承担评标助手、评标专家和评标委员会的角色。

  评标机器人可以作为评标助手,在评标中充当辅助性角色。在该阶段,评标工作实际上仍然由评标专家完成,评标机器人则负责帮助评标专家快速定位投标文件中的关键文本信息。评标机器人可以对繁杂的投标文件进行精简,以图表的形式快速呈现给评标专家,同时为评标专家提供信息查询、知识咨询、分数检查等服务。同时,评标机器人也可以对评标专家的异常行为进行监控,在担任评标助手的同时,起到“评标警察”的作用。在该阶段,作为评标助手的评标机器人仅起到辅助决策作用,真正的评标结果还是由评标专家独立给出。评标机器人一边充当助手,一边积累数据和经验,从而实现算法的不断迭代。

  经过一段时间的发展后,评标机器人可以在一定程度上取代评标专家的角色。此时,评标助手经历中所积累的数据,使得其算法得到了进一步优化,算法出错的可能性进一步降低。在该阶段,评标专家的职责变为抽检评标机器人的评标结果,同时对具有争议性的或是受到质疑的评标结果进行裁决。同一个评标机器人可以同时引入多个不同来源的评标算法,当不同的算法评分结果之间存在较大差异时,则由评标专家代为决断。在该阶段,评标专家的数量可以大幅度缩减,绝大多数的项目也可以由评标机器人进行独立评审。

  在遥远的未来,AI技术高度发达,评标机器人的“独立人格”进一步成型,可以完全取代评标专家,届时传统的真人评标可能也不复存在。此时,评标委员会由多个具有不同“人格”的评标机器人组成,这些评标机器人具备经济、工程、法律等不同方面的行业知识。在该阶段,评标委员会负责人由一个具有高度智能的高级评标机器人担任,这个高级评标机器人负责汇总其他评标机器人的评分结果,不同评标机器人之间的算法人格完全独立,整个评标过程全部由AI系统自动完成。那时,评标专家可能像如今的打字员、电话接线员一样,成为历史发展进程中的过往角色。

  (作者单位:刘闻博,中国人民大学公共管理学院;包苏日古格,鄂尔多斯市公共资源交易中心)

  责编:辛美玉

关注读览天下微信, 100万篇深度好文, 等你来看……