乐聚牵头打造具身智能开源数据集社区

2026年03月27日 10:31
本文共计2108个字,预计阅读时长8分钟。
来源/具身研习社 责编/爱力方

作者:彭堃方    编辑:Sandra    出品:AI物燥

近两个月,具身赛道在“数据”领域的竞争达到了一个高峰。

从各家厂商鱼贯而出地推新UMI、Ego等各类数采设备到不少企业都喊出年采数据量达到“百万小时”规模的口号,甚至有跨界大厂喊出“千万小时”级数采目标。可以说,赛道内的多数企业均把数据看作是具身竞争的焦点、能力的区隔甚至是梯队的划分。

但产业发展的核心矛盾已悄然转变,在全球科技竞争的叙事框架下,具身智能不再是单一企业的技术单点突破,而是全产业链的系统协同能力。在这场产业跃迁中,打破数据孤岛、构建共建共享的生态体系,正是产业迈向成熟的核心命题。

乐聚机器人率先跳出“竞争”框架,担起产业奠基石的角色,培育“数据生态”。

长期以来,具身智能数据高度分散、难以复用,各机构重复投入却难以形成规模效应。随着产业逐渐走向应用阶段,这一问题开始从隐性成本转变为显性瓶颈。

而近期,乐聚牵头建设了国内首个具身智能开源数据集社区,这一国家级平台或将影响整个行业的技术边界。它将协同数据行业多方力量,建设强有力的数据基础设施,聚沙成塔,突围数据规模与质量的天花板。

在这样的背景下,乐聚机器人不仅破解了行业数据瓶颈,更标志着乐聚机器人牵头建设的具身智能开源数据集社区为具身数据开出一剂良方。

3592f79ed85439e267fc661fe13479dd.png

具身智能面临的数据问题,本质上是一种结构性困境。

首先,多源数据中,金字塔尖的真实世界数据不可或缺,但获取成本极高。工业操作、服务场景、人机协作等任务往往需要真机长期采集,不仅耗费资金和时间,还难以规模复制;其次,数据高度异构。不同机器人平台、传感器体系、任务定义之间缺乏统一标准,导致数据难以复用,也难以形成通用训练语料;更关键的是,行业长期以封闭模式运行,企业出于竞争考虑倾向于自建数据体系,但单个主体的数据规模又不足以支撑通用能力突破,最终形成“重复造轮子”的低效局面。

d96e6028610b5aa59730aae99c07ce7a.png

当产业从概念验证迈向应用落地,这些问题不再是内部成本,而成为全行业的显性瓶颈。因此具身智能要试图走向规模化,打破量级桎梏,必须从孤立的数据生产转向协同的数据积累。

于是,开放原子具身智能开源数据集社区应运而生。它并不是一个简单的数据仓库,而是一个覆盖数据生产、使用与转化的协作体系。其建设目标集中在三个层面:

一是构建高质量数据与工具链。社区基于真实工业场景建设开放数据平台,并提供从数据处理、模型训练到仿真测试和真机部署的一站式工具链。这意味着开发者无需从零搭建完整流程,即可开展算法研究与应用开发,从而显著降低技术进入门槛,并有望形成行业统一的数据基准。

二是建立开放共治的生态网络。社区并非单一机构的项目,而是产学研用多方协作的网络。在共建方中,除了牵头的乐聚机器人,还包括人形机器人企业宇树科技、头部厂商蚂蚁灵波、数据基础设施企业库帕思、具身重镇上海交大、哈工大、同济大学以及行业生态企业具识智能、具脑磐石、无问智行等。

在这里,科研机构提供理论与算法创新,高校贡献实验平台与人才储备,龙头企业提供真实场景与数据治理能力,行业企业推动细分技术突破,开发者社区则加速创新扩散。这种结构使数据从静态资源转变为可持续演进的公共资产。

三是推动技术向真实世界迁移。具身智能长期面临“实验室成功但产业落地困难”的鸿沟。该社区通过赛事、产学研合作和创新团队孵化,将算法研究直接连接应用需求,加速技术在真实场景中的验证与迭代,推动从概念验证走向规模应用。

乐聚机器人基于数据驱动,已实现国内首次可规模化部署工业技能交付,25年已形成塑料箱拆垛、纸箱拆垛、SMT料盘出库三大可落地解决方案。

“独行快,众行远”,一个“数据共同体”的诞生,在这个数据藩篱高筑的当下弥足珍贵。

74eca5195e7bbe64e29434030bd707a6.png

通过开放原子具身智能开源数据集社区可见,其并不是做一个空中楼阁难以落地的社区,而是通过精准回应产业需求,让开源价值有可感知、可落地的实体化载体。

通过建设开放数据平台,社区打造覆盖全流程的一站式工具链,有望成为行业基准数据底座,降低研发成本。

同时还构建开放共治社区生态,联动库帕斯、北数所等平台,聚合清华、哈工大等高校,百度、宇树等企业,覆盖中兴、兆丰、海晨物流等落地场景,实现多方共建共享,加速具身智能生态协同脚步。并通过赛事、产学研合作、孵化团队,加速技术迭代,推动具身智能从实验室走向规模化应用。

作为社区牵头人,乐聚机器人走上台前,很大程度上源于其长期积累的数据生产与应用能力。

8ff1a742e46a2d1843f166f12fe852f6.jpg

当企业开始投入建设公共数据基础设施,其角色也随之变化,它就不再仅是竞争者,而是生态构建者。通过数据这一杠杆,乐聚正在推动具身智能从“单点突破”走向“协同进化”,为行业打开更高的能力上限。

回望技术史,每一次通用技术的跃迁,都伴随着公共底座的出现。今天的具身智能,正站在类似的临界点上。单个企业的数据竞赛或许能带来短期优势,但只有当数据从藩篱中释放为社会资源,产业才能真正突破规模与效率的天花板。

从这个意义上看,乐聚牵头建设开源数据集社区的价值,不仅在于解决当下的数据瓶颈,更在于尝试为行业铺设一条长期主义的基础设施路径。当越来越多主体开始参与这样的共建,具身智能真正的爆发才算到来。

来源:乐聚挑了个大梁,建了个具身智能开源数据集社区 | 具身研习社

声明:本文来自具身研习社,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/