在人形机器人的进化史上,一个长期以来,被所有工程师,都视为“禁忌”与“失败”的终极噩梦——摔倒——正被来自迪士尼研究院(Disney Research)的一群科学家,以一种,充满了“反向智慧”与“艺术想象力”的方式,重新地,加以定义。
这,并非又一次,在如何,“避免摔倒”上的渐进式改良。
它,是一次深刻的、系统性的、旨在,从根本上,颠覆我们,对“机器人摔倒”这一行为所有负面认知的范式革命。

其核心,是一个,看似荒诞、实则,充满了深刻工程学智慧的全新思路:
与其,想尽一切办法,去避免那,不可避免的摔倒;
不如,将“摔倒”本身,变成一门,可以被学习、可以被控制、甚至,可以被“风格化”的“艺术”。
这场,充满了“黑色幽默”色彩的革命,其最终的目标,是让机器人,不仅能够,摔得“软”——从而,最大限度地,去减少,那可能,对其自身昂贵的硬件,所造成的冲击与损伤;
更能,摔得“帅”——在最终倒地之后,摆出一个,由用户,所预先指定的、充满了艺术感的、优雅的“结束姿势”。
想象一下,一个,正在舞台上,进行表演的机器人,因为,一次意外的失误,而失去了平衡。它,没有,像过去那样,僵硬地、直挺挺地,轰然倒地。恰恰相反,它,顺势,完成了一个,流畅的翻滚,并最终,以一个,帅气的、类似于“思想者”的卧倒姿-势,结束了这次“意外”。
这,简直是,将一个,潜在的“Bug”,玩成了一次,令人惊叹的“绝活”。
那么,迪士尼的科学家们,究竟,是如何,教会机器人,这项,近乎于“摔跤神功”的“绝技”的呢?
其技术的灵魂,在于一个,被精心设计过的强化学习(Reinforcement Learning)框架。
简单来说,就是,让AI在一个,由NVIDIA的Isaac Sim所构建的、高保真的物理仿真环境中,去进行,成千上万次的、永无休止的“摔跤”练习。
而其,学习的“教练”,则是一个极其复杂、也极其“严厉”的“奖励函数”。
这个“教练”,会同时地,去关注两个,有时,甚至,会相互冲突的核心目标:
-
目标一:冲击的最小化。
-
机器人身体的、任何一个部分,与地面,所发生的每一次碰撞,只要,其产生的接触力,过大,AI,就会被,无情地,“扣分”。
-
更精妙的是,研究人员,还为其,引入了一套“身体部位敏感度权重”。例如,他们,可以,将最脆弱、也最昂贵的“头部”,其敏感度的权重,设定为4.0;而将,相对皮实的“腿部”,设定为1.0。
-
这样一来,AI,在训练中,便会,下意识地,去学习到,那个,至关重要的保命原则:“摔哪都行,就是别摔到头!”
-
-
目标二:姿态的风格化。
-
在每一次“摔跤”的最后,AI,都需要,让自己的身体姿态,尽可能地,去接近,那个,由用户,所指定的“目标结束姿-势”。
-
无论是,躺着、趴着,还是,侧卧着,只要你,敢于想象,AI,就敢于,去学习。
-

而为了,解决,在训练中,所必需的、海量的、多样化的“摔倒姿势”数据的来源问题,研究团队,更是,想出了一个,天才般的办法:
让物理引擎,自己,“摔”出大数据!
他们,在机器人的关节限制范围内,随机地,生成了数以万计的、不同的身体姿-态。然后,将这些,姿态各异的机器人,从一个很低的高度,进行“自由落体”。
在仿真环境中,任其,自由地,翻滚、碰撞,直到,它,最终,静止下来。
而这个,最终的、物理上,绝对稳定的静止姿态,便会被,自动地,记录下来,并被,作为一个,合格的“目标结束姿势”,加入到训练的数据集之中。

爱力方的分析认为,迪士尼研究院的这次,堪称“脑洞大开”的“摔跤”研究,其意义,已远超一次,充满了趣味性的技术展示。
它,更深刻地,向整个机器人行业,揭示了一种,全新的、也可能,更具“实用价值”的“安全哲学”。
-
它,正在将,机器人的安全,从过去那种,依赖于“完美避障”的、被动的“理想主义”,拉回到一种,更接受“失败是必然的”、并试图,去主动地,控制“失败后果”的、主动的“现实主义”。
-
它,也正在,为机器人的“快速恢复”,提供一种,全新的解决方案。
-
一个能够控制自己摔倒姿势的机器人,可以选择,一个最容易让自己重新站起来的姿势倒下,从而极大地缩短其,因意外而造成的“宕机”时间。
-

最终,当机器人真的能够,将“摔倒”也同样,视为其运动能力的一部分时,我们或许才算真正地,拥有了一个,能够在我们这个充满了“意外”与“不确定性”的真实世界中,去从容地、鲁棒地、乃至,优雅地生存下去的“新物种”。
而当,下一次,一个机器人再次地摔倒在我们面前时,我们所看到的,或许将不再是笨拙和狼狈。
而将是,一场充满了力量与美的、可被精确控制的“表演”。