近日,简智机器人正式推出行业首个面向具身世界模型的全模态数据集——Gen Ego Data。该数据集以Ego-centric(以人为中心)为核心设计理念,聚焦下一阶段具身智能与世界模型范式。从第一视角出发、全视野、高质量、多模态、多样记录人真实、自然的交互,其核心目标不是让模型模仿关节角度,而是真正学会“感知—动作—结果”的因果关系与物理规律。

01.
行业领先优势
Gen Ego Data 助力具身世界模型加速进步
1. 行业最广视野、高质量的第一视角全身覆盖:6 RGB摄像头,水平FOV 270° 垂直150°,无遗漏、无遮挡、无畸变,人手的细微动作(抓取、伸展、弯曲),还是人体的完整姿态(站立、行走、交互),都能被精准捕捉。
2. 高质量的全局环境感知:6视角可以有效解决遮挡不可见、不确定问题,为模型提供更多上下文,且交叉验证,可以快速剔除异常标注结果,提升数据质量。
3. 行业最全模态覆盖:第一视角、头部姿态、2D/3D手部姿态、上半身23个自由度支持,帧级别Cot语义标注。
4. 高精度手部关节与2/3D 姿态标注 + 亚毫秒级头手协同
同步采集语音、图像等全模态数据,完整还原 “意图 — 环境 — 行为” 全链路,让模型交互更贴合人类逻辑;
通过6视角实现最小二乘的三角化,双手22个自由度纯视觉精度达1-2cm;自遮挡、近距离交互场景下仍保持稳定,通过 “对齐 2D 3D 动作空间” 让模型习得通用操作方法,构建精准的 “手部动作 - 物理反馈” 映射关系;
而通过红外、视觉、端测定位,结合手部设备,同步实现头手协同,精度达到2mm、无线延迟小于1ms。
5. 行业首个上半身关节检测
完整捕捉上半身关节运动轨迹,填补全身动作采集空白,为世界模型构建完整人体动作动力学模型提供关键支撑;
后续将拓展至全身覆盖。
6. 行业最大规模数据基座:海量多样性的自然人类行为,推进Scale-up实现:
无感的佩戴、让人可以不受干扰进行劳动,记录行为最为自然、真实;
通过3000个家庭众包采集,单个技能、场景时长不超过百小时,助力模型提炼通用物理规律,避免过拟合,提升陌生场景泛化能力;
已在商超、家庭、工厂、户外等超过20种场景,覆盖超过200种以上人类技能;
日生产10w clips数量数据。
7. 完整CoT语义标签标注:
实现帧级动作分割与视觉、运动、语义的精准对齐,让模型理解动作意图,掌握 “动作 — 结果” 的因果闭环。
同时简智看到这种“以人为真值”的数据,保留了独立于机器人本体差异的可扩展性优势,让数据能够适配不同类型、不同规格的具身设备,可以持续积累价值。
02.
DAS Ego 成为物理AI的数据入口
什么样的数据获取产品能真正规模化、高质量的数据获取?至少要满足5个条件:
高质量、稳定、鲁棒的图像、多模态数据获取能力;
简单、易用、无感的使用体验,获取人最自然的操作;
不同类型人群、不会造成数据质量差别;
众包、规模化到生活家庭中,实现最真实、多样的数据;
快速的数据流转能力,才能形成真正意义数据飞轮。
因此Gen DAS Ego 要实现的,不止可用更要好用。
从感知、成像到佩戴体验,均围绕 “让人类在真实场景中无感、自然地完成操作” 这一目标设计。
设备搭载 6 颗 200W 高清摄像头 + 内置 IMU,实现水平 270°+ 垂直 150°的超广视野,能够精准捕捉人手、全身及头部运动轨迹。同时,团队对核心视觉模组进行深度调优,确保设备在弱光、光线频繁变化等复杂真实环境下,依然拥有稳定、清晰的成像表现,从源头保证数据质量。
在此基础上,通过6个视角可以实现最小二乘三角化算法,检测精度、稳定性相比单颗高数倍,至行业领先的厘米级。
为适配长期、大规模、全场景采集需求,Gen DAS Ego 采用350g 轻量化无感设计,搭配磁吸式热插拔电池,换电不断电,可支持 24 小时不间断作业;最大程度还原人类在真实环境中的自然行为,避免采集动作变形、刻意化,保证数据的原生性与真实性。
同时稳固自适配结构,面对不同头维人群保证外参恒定,实现数据采集标准化;
支持语音交互,真正解放双手,像AI助手一样让数据获取简单、易用。
03.
以数据为桥,助力具身智能通用化落地
具身智能的核心,是让机器人真正理解并复刻人类与物理世界的自然交互能力,而高质量数据是连接人类行为与机器人智能的关键桥梁。Gen Ego Data 的发布,是简智在具身智能数据生态布局上的重要一步。
未来,简智机器人将持续深耕以人为唯一真值的数据理念,不断丰富 Gen Ego Data 的场景与任务覆盖,构建持续生长、动态更新的高质量数据体系;同时依托 Gen DAS 系列硬件技术优势,为行业伙伴提供更稳定、更高效、更贴合真实需求的数据服务,与行业同仁一起推动具身智能技术快速落地、稳步前行。
数据集下载地址:
https://huggingface.co/datasets/genrobot2025/Gen-EgoData
(说明:当前发布为初版数据,包含头部视角信息以及轨迹。手部关节数据、上半身动作数据将于后续版本陆续更新。)