昨天,宇树科技创始人王兴兴在西门子RXD大会上给出明确时间表:六个月内实现机器人任意动作生成与自主出招对打。这不仅是格斗观赏性的提升,更是具身智能从 “预设动作库” 迈向 “自主运动智能” 的关键一跃,也是人形机器人 “动作革命” 正在加速的具体表现。
01 六个月后,机器人能摆脱“预设动作”的束缚吗?
当前人形机器人的动作局限,早已成为行业共识。王兴兴直言,宇树机器人现阶段的格斗对战,仅依赖二十几个提前采集的固定动作组合,招式重复、缺乏灵活度,既无挑战性也无观赏性。而他口中的“六个月目标”,正是要打破这一局限:先采集数百个基础动作供AI训练,最终实现动作的自由、丝滑组合,让机器人能灵活完成出拳、变向、闪避等连贯动作,做到每日对战招式不重样。
这并非宇树一家的探索,而是行业共同的发力方向。英伟达同期推出的Kimodo动作扩散模型,可依托700小时动捕数据生成高质量机器人动作,支持文本与运动学约束控制;Figure的Helix 02则通过三层系统架构,让机器人直接理解“走到洗碗机旁开门”这类复杂连续指令。
不难发现,行业正从“教机器人做动作”,转向“赋予机器人自主组合动作的能力”,而王兴兴强调的“动作丰富度决定智能化水平”,正是这一趋势的核心共识。
02 动作自由之后,具身智能就能顺利落地吗?
动作突破只是第一步,落地难题仍横亘在前。就在王兴兴与西门子全球CEO博乐仁对谈当天,会场展示的工业协同方案,已给出了初步落地探索:基于西门子SIMOVE Fleet Manager智能调度平台,宇树人形机器人与AGV实现统一调度、协同作业,解决了机器人进厂后的路径规划、避障与联动等基础问题。但王兴兴并未回避短板:人形机器人的移动和基础动作已基本攻克,抓取、操作尤其是触觉相关技术,才是制约其大规模落地的关键瓶颈。
这一痛点在行业内普遍存在。王兴兴解释,机器人对训练过的物品,抓取成功率可接近100%,但物品稍有变化,成功率便会急剧下滑。Meta CTO Andrew Bosworth也曾直言,现有数据无法复现人类抓取时对摩擦力、材质形变的直觉判断;小米重构CyberOne仿生手,将触觉传感器覆盖面积提升至8200mm²,本质也是为了补齐触觉感知的短板——动作自由解决了“能做”的问题,而触觉与抓取技术,才决定了机器人“能做好”实操任务。
03 仿真与现实,哪条路能破解落地瓶颈?
面对触觉与抓取的技术难题,行业尚未形成统一的最优解。王兴兴透露,宇树机器人的走路、跑步及各类功夫动作,基本依靠纯仿真环境完成训练,但在抓取、装配等实操任务上,全球仿真技术仍不够成熟,大多需依赖真人采集数据。而现实采集面临诸多困境:实景搭建成本高、无法复刻上千种复杂场景,难以积累海量训练数据。
对此,王兴兴认为仿真与现实场景训练两条路线都值得推进,其中触觉仿真更是核心攻关方向。这一观点与行业主流认知不谋而合:优必选Walker S2通过分层强化学习复现拟人步态,特斯拉Optimus 3依托Dojo超算让机器人通过观察自主学习新技能。
但西门子大中华区总裁肖松给出了更理性的判断:人形机器人执行搬运、拧螺丝等简单工厂任务,可能1-2年内实现,但要高可靠融入核心生产体系、承担复杂精密工作,仍需5-10年的技术积累与生态共建——毕竟工业级场景,需要近乎100%的成功率、极高的精度与绝对的安全可靠。
04 动作革命,能改写具身智能的商业化进程吗?
王兴兴始终坚信,只有机器人能做出丰富动作,再结合大语言模型等AI技术,让系统调用这些组合动作,机器人才能真正落地执行实操任务。六个月后的动作自由,无疑会为具身智能的商业化按下加速键,但这绝非终点。
从动作自由到触觉感知突破,从单机器人协同到全场景适配,从仿真技术成熟到训练数据积累,具身智能的落地之路,仍需跨越硬件、算法、数据与生态的多重关卡。这场以“动作”为起点的革命,不仅会改变机器人的呈现方式,更将重新定义具身智能如何真正走进工厂、融入家庭——而动作自由,正是这场革命的第一个关键里程碑。
原文标题 : 王兴兴:人形机器人动作自由,才是具身智能的真正入场券!