解锁机器人“双手协作”的巨型弹药库!全球最大双机械臂数据集开源发布

解锁机器人“双手协作”的巨型弹药库!全球最大双机械臂数据集开源发布

爱力方

爱力方

2025年12月02日 11:54
本文共计1889个字,预计阅读时长7分钟。
来源/互联网 责编/爱力方

具身智能的这条、充满了“巴别塔”式困境的漫漫长路上——即,每一种不同的机器人,都说着一种自己独有的、无法与其他机器人通用的“动作语言”——一场旨在建立一种“通用机器人语”的、史无前例的“标准化运动”,正由中国的顶尖科研与产业力量,联手发动。

近日,由北京智源人工智能研究院(BAAI)牵头,联合了包括蚂蚁天玑实验室、银河通用、乐聚、清华、北大、斯坦福、伯克利在内的、一个堪称“全明星阵容”的产学研联盟,共同打造并宣布全面开源RoboCOIN

b48f77f8992eac757fa7b8fa6a07062a.png

这,并非又一个简单的、针对某个特定任务的机器人数据集。

它,是全球首个,在“本体多样性、标注精细度和使用便捷性”这三个核心维度上,都达到了前所未有高度的、高质量的双臂机器人真机操作数据集。

RoboCOIN的诞生,其核心,是为了攻克那个,长期以来,一直制约着“通用机器人”发展的、最根本的、也是最致命的瓶颈:

高质量、多机型、大规模的、真实世界双臂协同操作数据的极度稀缺。

而RoboCOIN,正是以一种近乎于“暴力美学”的、系统性的方式,来正面地,回应这个挑战。

  • 硬件平台的“多样性”:一口气囊括15种异构机器人。

    • 该数据集,史无前例地,同时覆盖了双机械臂机器人、半人形机器人和全尺寸人形机器人这三大主流类别。

    • 其中,既有配备了简单并行夹爪的Agilex Cobot Magic,也有搭载了复杂多指灵巧手的Unitree G1。这种硬件上的“多样性”,确保了,基于该数据集训练出的AI模型,将具备一种前所未有的、跨机器人本体的“泛化能力”。

  • 任务场景的“全面性”:覆盖421项细分任务与16个真实场景。

    • 其累计采集的,超过18万条的人类遥操作演示轨迹,覆盖了从住宅(厨房、客厅)、商业(餐厅、收费站),到工业(工厂、仓库)的、几乎所有典型应用场景。

    • 任务的设计,也极其精细,涵盖了从简单的“将毛巾放入篮子”,到复杂的“传递碗具并同时关闭抽屉”,再到需要精细力控的“抓取一颗葡萄并将其放入盘子”等,各种不同难度、不同协作程度的任务。

4a3df7037993aa095d00b27695878db3.png

然而,比其数据规模,更具革命性的,是其三级金字塔式的标注体系

传统的机器人数据集,往往只提供原始的、未经解释的动作轨迹数据。机器人,只能去进行机械的、像素级的模仿,而无法,真正地,“理解”一个任务背后的内在逻辑。

41ddf5b513d39c7a5ee26b2111b1b0ab.png

而RoboCOIN,则为每一条数据,都构建了一套,从宏观到微观的、完整的“语义上下文”:

  • 顶层(轨迹级标注):让机器人,“理解”任务的全局目标。

    • 例如,“在一个白色的桌子上,有一个篮子和一个粉色的桃子。你的任务是,将桃子,放入篮子。”

  • 中间层(段级标注):让机器人,“学会”任务的逻辑步骤。

    • 将上述任务,拆解为一系列,可被执行的子任务序列,例如,“左手,移动并靠近桃子”→“左手,抓起桃子”→“将桃-子,传递给右手”→“右手,将桃子,放入篮子”。

  • 底层(帧级标注):让机器人,“掌握”每一个动作的精细细节。

    • 在毫秒级的、每一帧的颗粒度上,标注出机械臂的运动方向、速度、加速度,以及夹爪的开合状态等,最底层的运动学信息。

这套“从战略到战术,再到执行”的三级标注体系,第一次,让机器人,在学习一个任务时,不仅能够“知其然”(模仿动作),更能够“知其所以然”(理解逻辑)。

103605ea99f0cd35ed00e7b870ffc1cd.png

在Realman和Unitree这两个不同形态的机器人平台上,进行的严格的实证测试,也无可辩驳地,验证了RoboCOIN的卓越价值。

在将这套三级标注体系,整合进π₀和GR00T-N1.5这两个主流的视觉语言动作模型之后:

  • 对于简单的任务(“将毛巾放入篮子”),其成功率,从80%,提升至了90%

  • 而对于更为复杂的、高难度的任务(“将桃子放入抽屉,并随手关上抽屉”),其成功率,更是从区区的20%,飙升至了70%——实现了高达50个百分点的巨大性能提升。

f1c4fa882f43f12707e96eff643fc83b.png

RTML对数据质量与模型性能的影响

爱力方的分析认为,RoboCOIN的开源发布,其意义,已远超一次单纯的、高质量的学术资源的共享。

它,更像是一次深刻的“行业基础设施共建”。

它,通过提供一套统一的、高质量的、并且“开箱即用”的“教科书”(RoboCOIN数据集)和“学习工具”(CoRobot数据处理框架),极大地,降低了全球所有开发者,进行“通用机器人”研究的门槛。

当15种,形态各异、语言不通的机器人,开始,共同地,学习同一本“教科书”,并开始,逐渐地,掌握一种通用的、可被迁移的“动作语言”时:

一个真正属于“通用具身智能”的、百花齐放的“寒武纪”大爆发,或许,才算真正地,拉开了序幕。

论文地址:arxiv.org/abs/2511.17441

项目地址:flagopen.github.io/RoboCOIN/

声明:本文来自互联网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯