在通往通用人工智能(AGI)的物理世界版图上,小米公司,刚刚落下了一枚极具战略意义的棋子。
今日,小米正式发布并宣布全面开源其自研的具身大模型——MiMo-Embodied。
这并非又一次单纯的模型参数竞赛。
这是一个明确的信号,标志着小米正在试图打破长期横亘在“自动驾驶”(汽车)与“具身智能”(机器人)这两个万亿级赛道之间的隐形壁垒,通过一套统一的认知架构,实现从“垂直领域专用”向**“跨域能力协同”**的关键跃迁。
长期以来,行业内存在一个棘手的问题:室内的机器人擅长交互与操作,室外的汽车擅长感知与决策,两者的智能能否互通?
MiMo-Embodied的出现,正是为了回答这个问题。
它不仅仅是一个模型,更是一个“通用任务建模器”。其核心技术亮点,集中体现在对“跨域”的深度整合上:
-
全场景的任务覆盖: 它同步支持具身智能的三大核心任务(可供性推理、任务规划、空间理解)以及自动驾驶的三大关键任务(环境感知、状态预测、驾驶规划)。这意味着,同一个模型,既能理解“如何打开家里的冰箱”,也能判断“路口的车辆是否会变道”。
-
知识的迁移与协同: 模型验证了一种全新的思路——室内交互的常识,可以辅助道路决策;而道路驾驶的动态博弈能力,也能反哺室内的复杂操作。
-
可靠性的工程化增强: 采用了“具身/自驾能力学习 + CoT(思维链)推理增强 + RL(强化学习)精细强化”的多阶段训练策略,显著提升了模型在真实物理环境中部署的鲁棒性。
数据,是检验模型能力的唯一标准。
在涵盖感知、决策与规划的29项核心基准测试中,MiMo-Embodied确立了开源基座模型性能的新标杆:
-
在具身智能领域: 它在17个基准测试上取得了SOTA(State-of-the-Art,当前最佳)成绩,重新定义了任务规划与空间理解的能力边界。
-
在自动驾驶领域: 它在12个基准测试上表现卓越,实现了全链路的性能突破。
这表明,MiMo-Embodied不仅在“通才”能力上表现出色,在各个“专才”领域,也足以与现有的闭源及专用模型一较高下。
爱力方的分析认为,小米此次选择全面开源这一高性能模型,其战略意图十分清晰。
作为全球少有的、同时拥有“智能汽车”、“智能手机”和“智能家居(机器人)”庞大硬件生态的企业,小米最核心的护城河,在于其“人车家全生态”的互联互通。
而MiMo-Embodied,正是连接这个庞大物理生态的“统一智能底座”。
通过开源,小米不仅向开发者贡献了顶级的工具,更是在邀请全球的智慧,共同参与到其“人车家”智能生态的构建之中。
当家里的机器人和路上的汽车,开始使用同一种逻辑去“观察”和“思考”世界时,物理世界的智能化,或许将迎来一个由小米定义的、全新的“统一时刻”。
开源地址:https://huggingface.co/XiaomiMiMo/MiMo-Embodied-7B