具身智能赛道再迎资本重磅加注。
机器人大讲堂获悉,近日自变量机器人完成10亿元A++轮融资。本轮融资由字节跳动、红杉中国、深创投、北京信息产业发展基金、南山战新投、锡创投等顶级投资机构及多元地方平台联合投资。据悉,这也是深创投AI基金成立以来的第一笔投资。
值得注意的是,在2025年,自变量更是以每轮数亿元的规模连续完成四轮融资。在截至目前的多轮融资中,已成为国内唯一一个同时获得字节、阿里和美团这三大互联网大厂投资的具身智能企业。
跨领域资本的协同下注,既凸显了资本市场对具身基础模型重要性的集体共识,同时也印证了对自变量技术领先性与发展潜力的深度认可。
为何资本纷纷青睐自变量?
答案在于其全球领先的自研“机器人大脑”技术实力与日益清晰的商业化前景。在人工智能从数字世界迈向物理实体的关键阶段,自变量机器人凭借核心自研能力,正逐步撬动一个全新的产业生态。
聚焦自研:打造全球顶尖的“机器人大脑”
“通用具身大模型是独立于数字世界的基础模型,就像大语言模型在数字世界具有重要地位一样,具身大模型在物理世界也将起到关键作用。”在一次演讲中,自变量创始人王潜谈到。
实际上,在具身智能领域,“大脑”(大模型)的智能化水平直接决定机器人的能力上限与应用范围,这也是自变量构建竞争壁垒的核心所在。公司始终坚持自研端到端具身智能基础模型,相关能力已进入全球第一梯队。
1. 开源与商业模型双线突破
自变量在开源模型方面的表现尤为亮眼,成为其技术实力的有力证明。
其自研具身基础模型WALL-OSS的成功源于扎实的技术创新。是一个基于大规模真实数据训练的开源具身基础模型。为解决具身模型训练中“数据稀缺、场景单一”的痛点,WALL-OSS依托数万小时多元数据训练,有效缓解了行业普遍存在的数据稀缺与场景单一难题。
在技术架构上,模型采用“共享注意力+专家分流”设计,成功解决了VLM向VLA迁移过程中的“灾难性遗忘”与“模态解耦”挑战;
训练方法上,首创“先离散、后连续、再联合”的三阶段范式,使模型兼具认知理解与精准动作生成能力。同时,模型内化的思维链机制使其能够自主拆解任务、逐步推理,在长序列和复杂场景中实现稳定执行。
在商业应用层面,自变量的「WALL-A」系列VLA操作大模型同样表现出色。
作为国内最早实现端到端具身智能大模型的公司,自变量通过该模型构建起统一的认知与行动框架,使其能够在同一表示空间中同步处理感知、推理与行动任务,直接完成跨模态的因果推理与行动决策,从而推动机器人像人类一样思考与工作。
该模型在多项性能指标上已达到世界领先水平,并首创了VLA与世界模型深度融合的系统范式。凭借原生多模态输入输出架构,WALL-A率先实现了具身多模态思维链。它借助世界模型机制进行时空状态预测,协同视觉因果推理以理解环境反馈,并通过可学习记忆机制,从数据中内化物理常识,进一步强化其智能决策与执行能力。
模型的进化,让自变量的机器人在真实场景中体现了极强的适应力。
作为全球首个基于物理世界基础模型的成功跨越室外与室内场景的移动操作范例,机器人在外卖配送与纸箱回收中,面对强风干扰或视线遮挡,依靠基础模型的泛化能力与世界模型的因果推演,它不仅能像人类一样脑补被遮挡物体的全貌,还能在遭遇卡顿时通过强化学习策略自主纠错,无需人工干预即可完成闭环。
这种适应力同样体现在复杂且高难度的物流场景中。
面对杂乱堆叠的包裹,机器人凭借基础模型的零样本泛化能力,准确识别各种异形件,并借助强化学习迅速适应作业节奏。尤其值得关注的是,基础模型的进化进一步释放了高自由度灵巧手的潜能——机器人已自主掌握手内重定向等类人技能,不仅能熟练使用工具,更可完成如发牌这类对指尖力控精度要求极高的精细操作,成功突破了具身智能在“最后一厘米”操作上的关键瓶颈。2.端到端统一架构的差异化优势
自变量机器人始终坚持自研的端到端VLA技术路径,是其在竞争中脱颖而出的根本。
这一路径的差异化优势在于,它摒弃了传统机器人技术中感知、规划、控制等模块割裂的“流水线”模式,通过一个统一模型实现信息融合与决策生成。
基于海量真实世界数据训练,WALL-A模型已初步展现出类似大语言模型(LLM)的“智能涌现”特性。例如,它能理解手写涂鸦与文字的含义对应,具备空间推理能力,可看着二维图片用积木搭出三维形状。在面对复杂环境时,它能整合实时视觉观察、空间记忆与常识知识,构建连贯的推理链条,实现自主探索与灵活决策。
正是这种统一架构,使得机器人能够应对开放世界中前所未有的物体与场景,理解并输出正确响应。它支持超过百类高精度、高复杂度操作任务,将长程任务合理拆解并连贯稳定执行,真正实现了在随机环境中的自主感知、决策与操作,为机器人的大规模、泛在化应用奠定了技术基石。
清晰的战略定位:“软硬一体”全栈自研
在具身智能这一前沿赛道,宇树、智元等企业已建立起一定的先发优势。然而,自变量凭借清晰的差异化定位,正走出一条独特而坚实的发展路径——即“软硬一体”的全栈自研模式。
这一战略源于创始人王潜对行业的前瞻判断:“具身智能的发展短期靠模型算法,中期靠数据积累,长期则取决于产品能力。”因此,公司并未局限于单一环节,既不做纯粹的大模型,也不只做硬件,而是坚持软硬件双轨自研。
其自研大模型能够精准匹配自研硬件,核心零部件也与算法深度适配,不仅显著降低了整机成本,更形成了“研发 → 落地 → 优化”的闭环迭代,构建起持续的技术与成本优势。
量子2 号的五指灵巧手
在技术路线上,行业常见三种选择:侧重“大脑”的语言与规划能力,专注“小脑”的运动控制,或是如自变量所采用的“大小脑统一的端到端”路径。传统分层架构虽利于单点优化,却在复杂动态环境中容易出现协作断层;而端到端模型让机器人从感知直接输出动作,响应更快、适应更强——这也与国际头部公司的演进方向相一致。
更为关键的是,自变量紧扣具身智能的本质追求:通用性与泛化性。区别于只能在固定环境中执行预设任务的传统自动化设备,具身智能的核心价值,在于让机器人能在开放场景中自主应对多样任务——例如在家庭环境中整理不同形状的餐具,或处理突然滑落的物品。其自研的「WALL-A」模型所展现的零样本泛化能力,正是朝着这一目标迈出的关键一步。
▍融资背后的战略意义
当前,在人口结构变化、劳动力成本上升及产业智能化转型的多重驱动下,具身智能机器人正日益成为新质生产力的关键载体。
本轮十亿元级融资及互联网巨头的多轮入局,不仅是对自变量自研能力与技术价值的高度认可,更是市场对具身智能步入规模化落地关键阶段的鲜明回应。
对自变量而言,本轮融资具有双重战略意义:一方面,将持续投入端到端具身基础模型的研发,巩固技术护城河;另一方面,将加快推进以开源模型为核心的生态建设计划——通过开放协作,联动算法、数据、硬件与场景等多方伙伴,构建从技术共建、产业协同到应用落地的开放生态。公司还将借助开发者社区,推动行业标准形成与人才体系的构建。
自变量的融资进展与技术突破,进一步印证了具身智能从“实验室概念”向“产业化落地”的整体转向。2024年以来,赛道融资持续活跃,巨头与初创公司同步发力——而像自变量这样具备“明确自研、技术扎实、软硬一体、路径清晰”特质的企业,有望成为推动行业从单点创新迈向规模商业化的重要引擎。
展望未来,具身智能将在物流、制造、商业服务、家庭乃至医疗康复等多元场景中发挥重要作用。自变量在“机器人大脑”领域的突破,正是实现上述场景智能化升级的核心基础。通过全栈自研与全面开源模型权重、代码与工具链,降低行业整体研发门槛,推动生态共荣。
自变量,正站在这一浪潮的前沿。