具身智能机器人还需突破哪些关键技术?

  • 来源:中国报道
  • 关键字:智能,机器人,技术
  • 发布时间:2025-03-29 19:30

  人轻而易举完成的动作,对于机器人来说并不容易,这通常涉及精确的环境感知、决策制定以及运动控制等多项技术。

  文 | 《中国报道》记者 刘雪云

  平稳行走、连续奔跑、抓取物品……国家地方共建具身智能机器人创新中心(以下简称“国创中心”)展示大厅内,全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”正自主完成一系列动作。

  “人轻而易举完成的动作,对于机器人来说并不容易,这通常涉及精确的环境感知、决策制定以及运动控制等多项技术。”国创中心品牌公关负责人魏嘉星对《中国报道》记者表示。

  近年来,人工智能的迅猛发展推动了大模型与机器人技术的深度融合,显著提升了机器人的自主决策能力和环境交互水平。从能够负重登山、执行垃圾清运任务的“机器狗”,到进入汽车制造企业完成零部件安装和高精度操作的人形机器人,具身智能机器人已然进入大众视野。

  行业关键共性技术取得显著进展

  回顾机器人的发展历程,机器人经历了从“机械自动化”到“环境感知”再到“认知决策”的智能化演进。

  早在20世纪50年代,第一代工业机器人已经实现了依靠预编程就能完成任务指令。20世纪90年代,麻省理工学院(MIT)的Genghis六足仿生机器人可以依靠传感器反馈实现自适应行走。进入21世纪后,强化学习正式用于机器人控制。深度学习、大语言模型与多模态融合,机器人具备了“理解指令—规划任务—执行动作”的能力,并进一步向通用场景迈进。

  “能够像人类一样与物理世界产生交互的智能体”是受访专家们对于具身智能机器人达成的普遍共识,其中人形机器人被认为是具身智能的最佳载体。

  传统工业机器人作为智能化水平较低的机器人早已在制造业领域广泛应用,其本质是“固定程序”与“机械臂本体”的组合,而具身智能机器人则在于其“多模态感知”与“大脑决策”的进一步迭代。

  形象来说,假设需要机器人将两种水果放入对应颜色的盘子中,传统机器人会严格按照预设路径执行任务,一旦水果位置被移动,它就无法感知变化,仍按照预设指令完成任务,最终导致任务失败。而具身智能机器人则能够实时观察周围的环境,随即调整自己的行为,重新规划路径并完成任务。

  2024年世界机器人大会上发布的《具身智能产业发展报告(2024年)》中提到,具身智能的技术体系可分为“感知—决策—行动—反馈”4个模块,而其核心三要素包括本体、环境和智能。

  魏嘉星指出,具身智能机器人由“大脑”(智能)、“小脑”(具身操作+具身运控)和“硬件身体”三部分构成,围绕这三部分展开的技术攻关被认为是当前行业的关键共性技术,这些技术的突破是推动具身智能产业发展的关键动力。

  “从当前‘大脑’‘小脑’和‘身体’三大技术的发展水平来看,‘大脑’的进展是显著的。”巨深智能科技董事长、科大讯飞前高级副总裁杜兰向《中国报道》记者分析道,从2022年ChatGPT的横空出世到如今的DeepSeek,大语言模型的飞速发展为具身智能注入了全新动力,推动着机器人从传统的规则控制模式向自主学习模式转变。

  杜兰进一步指出,大模型对世界理解不断加深的同时,也间接推动了“小脑”技术的进化,也就是机器人运动控制系统的进步。当前,通过引入机器学习技术后,运动控制系统能实时分析环境并自动调整参数。现在的机器人已经能够更加精准地感知、采集和理解周围的环境信息,实时构建更高精度的空间模型。

  聪明的大脑还要搭配发达的四肢。基于中国工业制造和产业链优势,在核心零部件以及材料方面的本体技术更是发展迅速。北京工业大学教授、北京智同精密传动科技有限责任公司首席科学家张跃明告诉《中国报道》记者:“减速机是连接机器人动力源和执行机构的中间装置,相当于人体的‘关节’,主要用于帮助机器人完成高精度的控制动作。以RV减速机为例,原先这部分基本被日本垄断,但如今我们已经能够基本实现国产化。不管是内部齿轮的精度和组合的创新设计,还是耐用性上都有了提升。”

  受访专家们纷纷表示,整体来看,中国的具身智能机器人无论是在技术还是产业方面都正走在世界前列。

  “大小脑”智能化水平不足是主要瓶颈

  仅仅3年时间,ChatGPT已迭代至4.0版本;而DeepSeek上线一个月便成为全球用户增速最快的AI应用。尽管AI技术突飞猛进,但具身智能机器人并未迎来属于它的“iPhone”时刻。

  “即便现在将最聪明的大模型装入机器人的大脑,它仍难以适应复杂多变的环境,无法立即解决现实中的实际问题。”杜兰说,具身智能机器人“大小脑”智能化水平不足是当前技术发展进程中面临的主要瓶颈。

  “近年来,大模型虽进展迅速,但其本质仍是‘语言’层面的智能,与‘世界的语言’有本质区别。具身智能机器人需要的是世界模型,其不仅包含语言知识,还须具备空间感知能力、交互能力以及在复杂环境中的推理能力。”快思慢想研究院院长、原商汤智能产业研究院创始院长田丰告诉《中国报道》记者,任何一方面能力出现短板都会限制具身智能机器人的发展。

  人类对于机器人的期待从不止于能跑、能跳、炒菜做饭等,问题并非出在能不能上,而在好不好上。干活不够迅速、不够敏捷、不够灵活才是普遍问题。

  “人能够自如控制身体,得益于四肢和躯干的标准化结构。然而,具身智能机器人形态多样,包括两足人形、四足、六足以及轮式机器人,本质上它们属于非标准化结构,这就对机器人的运动控制系统提出了更高要求。”田丰指出,这需要机器人在物理世界中进行大量测试,尤其是在工业、农业、服务业等实际场景中的不断验证。高质量数据与专业场景的匮乏是具身智能机器人不够聪明的核心痛点。

  未形成标准化模块则是具身智能机器人在硬件层面的一大技术难题。田丰告诉记者,具身智能机器人领域还未实现硬件的标准化和通用化。就硬件设计来看,仍缺乏统一的模块体系,不同厂家的产品之间未能形成类似手机或PC的标准化生态,尽管已有部分模块化尝试,但这些模块多为非标准化设计。

  如今,中央厨房机器人、工业重型机器人和家庭机器人等不同类型的机器人,其硬件模块之间仍无法通用。此外,行业内也尚未找到最优的硬件架构标准。

  张跃明认为,以人形机器人为代表的具身智能机器人本体制造上也存在刚性过大、能量利用率低等问题,与人类运动相比有较大差距。此外,由于应用场景有限、需求不明确,人形机器人模型数量少,结构创新也明显不足。

  “实际上,具身智能还没有迈过通用智能的门槛,具身智能机器人也面临同样的问题。未来,在标准化基础上允许微创新,同时确保整体设计的通用性和泛化性,将是机器人硬件发展的重要方向。”田丰补充道。

  机器人“修炼秘籍”:高质量数据集

  位于国创中心三层和四层的采集场内,一位工程师正通过操作机械臂在虚拟环境中模拟机器人抓取物品的动作,以此来捕捉机器人每个关节用力时传感器的角度、速度、角速度等动作数据。另一位工程师则正通过远程遥控设备指导机器人进行真机训练,完成相应动作的学习和数据抓取。

  “这里就像一个‘学校’,具身智能机器人在不同场景中‘上课’,通过学习告诉机器人怎样做是对的,怎么做会更好,在实践中锻炼机器人的各项技能。”魏嘉星说。

  魏嘉星认为,机器人想要变得智能,离不开持续学习与训练。在人类为主体的结构性社会中,存在众多场景和角色,要求机器人至少掌握一定比例的特定技能,并具备一定的泛化能力才能全面胜任各种任务。

  自动驾驶技术的快速发展,也正是得益于车厂、自动驾驶公司以及实际道路上海量的测试数据积累。工业机器人也已广泛应用于工厂,如机械臂、四足机器人等,它们在专业场景中积累了丰富的数据,为智能化奠定了基础。

  获取高质量和多样化的智能体与复杂物理空间进行交互的数据集,尤其是真实物理世界数据,对提升具身智能机器人的泛化能力和通用性,实现机器人在全场景下的灵活应对至关重要。

  据介绍,国创中心数据采集场为机器人搭建了工业、家庭、高危巡检、办公及零售等多种应用场景。这些场景伴随着多样化的任务需求,例如打扫卫生(如扫地、洗碗、倒茶)和物料分拣等。此外,采集场内还采用了包括单臂机器人、双臂机器人、人形机器人等多种形态的机器人本体进行数据采集,以满足不同机器人在不同场景下的特定任务要求。

  当前,国创中心数据采集涵盖6类本体七大典型场景,日产数据已达10TB。“国创中心不仅自主进行数据采集,还引领整个行业制定相关标准,明确哪些数据是高质量、可用且适合行业发展的。搭建起生态,让大家真正把数据用起来。此外,我们在不断攻克关键共性技术问题的同时,也在不断深入研究各个细分领域进行场景落地的探索示范。”魏嘉星说。

  据了解,去年年底,全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World 发布。参与这一数据集项目的香港大学助理教授李弘扬在接受媒体采访时提到,“我们还希望通过数据集推动硬件形态逐步收敛,并将其应用于灵巧手、视触觉系统以及轮式机器人上”。

  李弘扬认为,具身智能的终极发展方向在材料科学。这不仅关乎视触觉等传感器在稳定性和可靠性的提升,还涉及下一代硬件的研发与设计阶段,要求对各类传感器形态进行前瞻性的考量与规划。硬件的创新将带来全新的应用场景,这些场景能够进一步赋能机器人技术发展。

  近期,中国科学技术大学研发了一款类似章鱼触手的新型螺旋软体机器人,该机器人依据多种生物柔性肢体(如章鱼触手)的原理设计而成,具备小到足以抓取蚂蚁、大到提起水桶的多功能性。在多尺度、多材质、多维度和协作交互等拓展应用场景中,这些创新的柔性机械构造以及先进的驱动技术,极大地增强了机器人在应对复杂作业场景时的灵活表现与安全性能。

  “只有软硬件协同进化,具身智能行业才能真正取得突破性进展。”李弘扬说。

关注读览天下微信, 100万篇深度好文, 等你来看……