为什么“教”机器人,不能像教人一样手把手?现在可以了

为什么“教”机器人,不能像教人一样手把手?现在可以了

爱力方

爱力方

2025年11月24日 17:06
本文共计2214个字,预计阅读时长8分钟。
来源/互联网 责编/爱力方

具身智能的这条漫漫征途上,一个长期以来,被视为“圣杯”级的、却又看似无解的核心难题,正被一支由两位斯坦-福华人博士所率领的名为Sunday Robotics的年轻团队,以一种极具想象力、也极具“普惠”色彩的方式,悍然攻破。

这个难题是:如何,为机器人,去采集到足够多的、高质量的、多样化的、能够反映真实世界复杂性的“人类演示数据”,同时,又彻底地,摆脱对昂贵的、专业的、只能在实验室中使用的遥操作设备的依赖?

近日,在经历了长达18个月的“隐身模式”之后,Sunday Robotics正式地揭开了其首款家务机器人Memo的神秘面纱。

而比Memo机器人本身,那憨态可掬的“乐高”式外观,更令人震撼的,是其背后,那一整套的、旨在将“数据采集”这件“苦差事”,变为一种“众包游戏”的、全新的数据飞轮

这场“数据革命”的核心,是一副看起来平平无奇、其成本仅为400美元的“技能捕捉手套”。

这副手套,其内部,拥有与Memo机器人自己的机械手,完全相同的几何结构和传感器套件。

这意味着,任何一个普通人,在自己真实的家庭环境中,只需戴上这副手套,去像往常一样,完成那些最琐碎的日常家务——无论是收拾餐桌、清洗碗碟,还是折叠衣物、冲泡咖啡——其手部的每一个动作、每一次用力的细微变化,都将被精准地,记录下来。

而这些,由成千上万的、分布在全球各地的“记忆开发者”(Memory Developers),在最真实的、非结构化的家庭场景中,所贡献出的宝贵数据,将成为训练Memo机器人“大脑”的、最核心、也最高质量的“养料”。

Sunday Robotics,已经向全球各地,寄送出了超过2000副这样的手套。

其后台,目前,已经收集了将近1000万条包含了行走、导航、以及完成长时域复杂任务的完整轨迹数据。

当然,人手与机械手之间,存在着天然的差异——不同的身高、不同的臂展、不同的关节灵活度。

为了解决这个“跨物种”模仿的难题,团队,专门开发了一套“技能转换”技术。

这套系统,能够对采集到的运动学数据和视觉数据,进行精细化的、自动的调整和校准。根据官方披露的数据,其从“人类演示”到“机器人可执行动作”的转换成功率,高达90%

如果说,“技能捕捉手套”,完美地,解决了数据“从哪里来”的问题。

那么,由该团队,专门为Memo机器人,所打造的ACT-1基础模型,则 brilliantly( brilliantly)地,回答了数据“到哪里去”的问题。

ACT-1,是业内首个将长时程的、精细化的操作(Manipulation),与基于地图的、大范围的导航(Navigation),进行了端到端(End-to-End)统一建模的基础模型。

它,仅需输入原始的、来自摄像头的像素信息,或其他的传感器观测值,就能直接地,输出机器人全身所有关节的、统一的动作指令。

在一个典型的“从餐桌到洗碗机”的演示中,Memo,能够:

  • 自主地,在房间内,行走近40米的距离。

  • 独立地,与21件不同的物体(如盘子、杯子、刀叉),进行33种不同的、精细化的操作。

  • 其全程,总共包含了68次与物理世界的、需要精准力控的交互。

而比其在家中的表现,更令人印象深刻的,是其强大的泛化能力

研究团队,特意地,在多个,机器人从未“见过”的、临时的Airbnb房源中,对Memo,进行了测试。

即便,是面对一个完全陌生的、全新的房间布局,Memo,依然能够,顺利地,完成其被指定的家务任务。

其背后的“秘诀”,在于ACT-1独特的、对3D环境地图的理解机制。

在训练阶段,模型并非是去死记硬背,某个特定房屋的布局。

它学会了如何去“阅读”和“理解”一张通用的3D环境地图。当它,进入一个新环境时,只要为其提供一张由手机LiDAR等设备,快速扫描生成的3D地图,Memo便能自主地,在其“脑中”,规划出最优的行动路线,并准确地,找到厨房、餐厅、洗碗机等关键的功能区域。

AIbase的分析认为,Sunday Robotics,这家由斯坦福华人博士赵子豪(Tony Zhao)迟宬(Cheng Chi)所领衔的、仅有约30人的年轻团队,其所开创的,不仅仅是一款更聪明的家务机器人。

它,更像是一次深刻的、关于“如何,以一种更民主、更高效、更具扩展性的方式,去构建具身智能”的、方法论层面的革命。

  • 赵子豪,本科毕业于加州大学伯克利分校,师从具身智能领域的先驱Sergey Levine;后在斯坦福大学,师从Chelsea Finn攻读博士。他,是ALOHA、ACT、Mobile ALOHA等一系列顶级具身智能研究的核心作者。

  • 迟宬,则在斯坦福大学,师从机器人界的大佬宋舒然。他,是被业界广泛采用的Diffusion Policy的第一作者,也是Open X-Embodiment、DROID等核心具身智能数据集的重要贡献者。


当“数据”,已成为公认的、驱动具身智能进化的唯一“燃料”时,Sunday Robotics,通过其400美元的“技能捕捉手套”,巧妙地,将全球数以万计的普通家庭,都转化为了其永不枯竭的“数据油田”。

这,或许才是这家年轻的公司,最深、也最宽的护城河。

而其官网上,那句简单、却充满了诗意的Slogan——“Mundane made magic”(让平凡,化为神奇)——也精准地,捕捉到了其产品的终极愿景:

将人类,从那些永无止境的、重复性的家务劳动中,解放出来。

把那个,本应属于我们自己的、宝贵的“Sunday”(星期天),重新地,还给我们。

声明:本文来自互联网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯