新燃料:一份六万分钟的数据日志,试图回答人形机器人的“缩放法则”

新燃料:一份六万分钟的数据日志,试图回答人形机器人的“缩放法则”

爱力方

爱力方

2025年11月25日 11:39
本文共计1700个字,预计阅读时长6分钟。
来源/互联网 责编/爱力方

一道鸿沟,横亘在虚拟世界的人工智能与物理世界的机器人之间。

在这道鸿沟的一侧,是模型在模拟环境中近乎完美的表现。在另一侧,是其进入现实后,面对最微小的物理不确定性时,也可能出现的系统性失灵。

这一“物理鸿沟”的根源,指向一个行业长久以来的核心制约:高质量、大规模、标准化的真实世界操作数据,极度稀缺。

近日,一个名为“LET数据集”的项目正式发布,并开源了其首批超过六万分钟的数据。

这并非简单地为行业增加了一个数据源。它是一次直接的回应,试图为整个具身智能领域注入关键的“新燃料”,并验证那个在人工智能领域广为人知的“缩放定律”(Scaling Law)——即模型性能随着数据量、模型规模和计算力的增加而显著提升——是否同样适用于物理世界。

昂贵的现实

真机数据为何如此珍贵且稀缺?其背后是技术与成本构筑的双重高墙。

传统模式下,一台双足机器人每小时仅能采集三到四条有效数据,单条成本接近二十元人民币。即便采用更先进的采集设备,一个百台规模的机器人集群,日数据产出也仅在八到十万条。

不仅如此,行业的数据生态长期处于“碎片化”状态。不同机构、企业的数据在格式、质量标准、采集场景上彼此割裂。

数据,这本应驱动进步的统一货币,反而成了阻碍协同的壁垒。

当仿真数据无法完全弥合与真实世界的物理差距时,整个行业都面临着一个困境:没有足够的“燃料”,再强大的模型引擎也无法启动。

一份标准化日志

正是在此背景下,LET数据集的开源具有了破局的意义。

该项目由乐聚智能与国家地方共建人形机器人创新中心等机构联合主导。其从源头便锚定了“标准共建”的核心定位,试图建立一套从数据采集、处理到标注的全流程标准化体系。

数据集的规模超过六万分钟,全部基于乐聚的“夸父”全尺寸人形机器人真机采集。该机器人具备四十多个自由度,高度模拟人体结构,并配有头部立体相机与腕部RGB-D相机。这确保了数据源本身的高保真度与低偏差。

尤为关键的是其数据质量。

项目引入了视觉伺服闭环数据、高效组帧技术以及自动化评测体系,将数据一致性提升至90%以上,时间戳误差被控制在10毫秒以内。

这意味着数据日志中包含了真实的物理约束、环境噪声与机械延迟。基于其训练的模型,将具备远超仿真模型的鲁棒性与跨场景迁移能力。这有望极大缩短算法从实验室到真实场景的部署周期。

在数据维度上,LET数据集构建了一个深度融合的多模态体系。它囊括了来自头部与双腕视角的清晰视频流、RGB图像、深度图、关节状态及末端执行器状态等关键信息。

所有信息都通过系统的多模态对齐标注与多维度语义标签,全方位还原了细腻的操作细节。——这是一种为“视觉-语言-动作”一体化大模型训练提供高一致性、高完整度数据基础的设计——

通往垂直场景的地图

数据集的内容,精准对接了行业“垂直场景先行”的落地趋势。

它全面覆盖了工业、商业零售与日常生活三大核心领域,并细化到六个真实的作业场景:汽车工厂、3C电子工厂、物流仓储、酒店服务、快消零售及生活服务。

其中包含了三十一项关键任务与一百一十七种原子技能。从基础的抓取放置,到复杂的多臂协作与工具使用,其丰富的数据类型能够直接帮助开发者快速适配垂直行业的需求。

为降低使用门槛,该数据集还配套提供了一套涵盖数据转换、模型训练、仿真测试与真机部署的全流程工具链。这使得开发者与企业能够实现“开箱即用”,更高效地将数据资产转化为实际的生产力。

路德维希·维트겐슈타인曾言:“我的语言的极限,意味着我的世界的极限。”

对于机器人而言,它的数据的极限,便意味着它的物理世界的极限。

LET数据集的开源,其意义远不止于技术层面。它以一种高标准共建的姿态,正在推动国家及行业标准的研制与实施,为构建一个开放、协同的人形机器人产业生态奠定基础。

它的出现,预示着一个由数据共享驱动技术迭代,由技术迭代反馈应用优化,再由应用优化丰富数据资源的良性循环,正在开启。

这束由六万分钟真实数据点燃的星火,或许将加速中国人形机器人从技术突破走向规模化量产的进程,最终照亮具身智能全面融入人类生产与生活的图景。

官方申请

官方邮箱wangsong@lejurobot.com直接申请获取

公开平台

Openloong开源社区

声明:本文来自互联网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯