作者:李文泉 出品:机器人产业应用
当业界还在为大模型万卡集群和千亿Token语料的成本咋舌时,一个更令人瞠目的价格正在隐秘市场形成——为让机器人学会“整理客厅”,科技巨头们心甘情愿地支付近亿元。
这背后是技术泡沫,还是触及了更本质的产业瓶颈?其实今天的天价订单,是AI从虚拟认知迈向物理行动的转折点上,为陈旧的数据基础设施支付的“赎金”,也是为开启新范式购买的“门票”。一场旨在彻底改写行业“数据生产函数”的工业革命,已然拉开序幕。
核心要点
·黑箱解构:昂贵的真相
·破局之道:三大流派突围
·秩序重构:从售卖到服务
01
昂贵的真相——解构“数据生产函数”的四大黑箱

要理解天价,必须先看清钱究竟烧在了哪里。传统模式下,生产高质量行动数据的函数主要由四个核心因素影响:专用硬件资本 、稀缺人力工程 、 漫长试错周期以及高昂损耗风险。这个其中的每一个核心因素,都构成了一个深不可测的成本黑箱。
· 黑箱一:专用硬件资本。依赖机器人本体进行数据采集,是此前的主流路径。昂贵的机器人不仅是采集工具,更是损耗品。连续高负荷运行下的折旧、维护,以及不可避免的碰撞损坏,构成了无法绕开的刚性资本开支。
· 黑箱二:稀缺人力工程。这远非传统的“数据标注”。它需要工程师设计任务流程,专家进行真人演示,标注员理解物理意图并多维度标记(轨迹、力、视觉关系)。这是一个高度非标、严重依赖专业经验的“手艺活”,无法通过简单的人海战术规模化。
· 黑箱三:漫长试错周期。从场景搭建、硬件调试、采集实施,到数据清洗、标注、训练验证,一个闭环走完动辄以月计。时间,在激烈的产品化竞赛中,是比金钱更昂贵的成本。
· 黑箱四:高昂损耗风险。最致命的莫过于,历经千辛万苦采集的数据,可能因任务设计不佳、场景泛化能力不足或标注质量问题,最终无法有效提升模型性能。这意味着前期所有投入近乎沉没。
在这个“数据手工业”时代,这几个核心移速(专用硬件、高端人力)既昂贵又难以分割和复制,导致产出效率极低而成本高企。天价订单,正是核心影响因素落后面对指数级增长的数据需求时,所产生的必然结果。
02
破局之战——三大玩家如何做出优化
市场不会长期容忍如此低效的“生产函数”。一批创新者正从不同维度发起“降维打击”,他们的目标不是优化旧函数,而是用新技术公式,彻底重构它。其竞争本质,在于攻击函数中不同的核心变量。
2.1
简智机器人:
“消除资本变量”的激进革命

· 优化点: 泛化人力 × 高效工具 | 硬件资本 → 0 。如果最贵的机器人硬件可以不用,那么最大的成本壁垒就将消失,这便是简智机器人的选择。
· 破局之道:简智的破局始于一套名为Gen DAS 的无感可穿戴采集设备。它仅重470克,通过超过3万个触觉检测点和毫米级轨迹追踪,精准记录人手的自然动作与细微触感。但真正的颠覆在于后端。简智构建了行业首个Gen ADP(AI Data Pipeline)智能数据产线,将数据视为标准产品进行规模化“制造”,同时,其Gen Matrix 数据智能平台负责高精度轨迹还原、智能原子化标注与切片。

这一路径的降本逻辑是革命性的。首先,它直接将机器人本体的采购、折旧与损耗成本归零,将固定支出转化为可按需调度的泛化人力成本。更重要的是,通过开源超万小时的RealOmni 数据集,简智意图将整个行业的数据获取边际成本拉至近乎零,从根本上瓦解了数据垄断可能形成的高门槛。
不过这种模式牺牲了机器人本体与环境的真实物理交互数据(如精确的力反馈),这对于需要精密操控的技能学习是否构成瓶颈,这还需要进一步探索。
2.2
它石智航:
“指数级放大效率”的引擎革命

· 优化点: 人力 × α,其中α为由“数据引擎”带来的效率指数,将单个人力单位的产出价值最大化
· 破局之道:它石首创了 “以人为中心(Human-Centric)”的数据采集范式,自研了轻便可穿戴套件 TARS SenseHub(包括“眼睛”TARS-Vision和“双手”TARS-Glove)。真正的效率放大器是其 TARS Datacore 具身数据引擎。这是一个云端大模型,能对海量原始视频进行全流程自动化标注。能从数据中提取出动作与环境之间的因果关系。这使原始数据被转化为机器人能理解的、富含物理逻辑的“教科书”。
大幅降低“单位高质量数据”的生产成本与时间。其降本体现在“效”而非单纯的“量”。通过标准化、自动化的数据生产管线,单名采集员在5小时内即可生成1.8TB的高质量数据。更重要的是,经此流程产出的数据具有极高的训练效能。
多角度来看,极致的标准化可能会削弱数据的多样性和创造性,同时在生态共建中,更要注重设计激励机制,平衡各方利益,避免陷入“公地悲剧”
2.3
博登智能:
“优化系统关系”的平台革命

· 优化点: 人力&周期,极大优化二者的关系系数。通过自研的AI数据中台,优化数据处理。
· 破局之道:不直接颠覆采集端,而是聚焦于成本函数中另一个黑洞——数据处理。通过自研的AI数据中台(BASE数据标注平台),深度融合智能体、多模态大模型以及内嵌的200+预标注模型,构建了覆盖文本、语音、图像、视频的多模态数据处理能力。用预标注、自动质检等工具将人力从重复劳动中解放,专注于关键决策,从而极大压缩数据处理周期,提升工程效率。
通过规模化、自动化、流程化,降低数据加工环节的确定性的单位成本。其服务自动驾驶等高端场景所积累的复杂流程管理能力和合规体系,构成了服务机器人公司的强大壁垒。
但当采集端因其他革命性方案变得廉价且高效时,中台的价值会产生一定的动摇。面对更具挑战性的物理交互数据,其工具链也需范式级升级。

03
秩序震荡——开源、合规与价值转移
新生产函数的出现,必然冲击旧的产业秩序,引发连锁反应。
商业逻辑的重构正在发生
简智、它石等公司的开源策略,本质是从“售卖数据成品”转向“售卖标准与生态位”。它们试图通过开源建立事实标准,吸引开发者,最终在工具链、云平台或定制化服务上盈利。这使得传统依靠数据差价的“数据贩子”模式难以为继。
买方的决策公式也随之更新
决策权重正从单纯的“数据规模”转向“数据质量 × 工程交付能力 ÷ 获取时间”。巨头们支付天价,购买的不仅是数据,更是难以估价的“研发时间”和“试错风险的保险”。
无法绕开的暗礁已然浮现
所有“以人为中心”的方案,都面临数据隐私、个人生物信息、动作版权等合规与伦理的达摩克利斯之剑。博登智能等从自动驾驶领域带来的全流程合规框架,正从成本负担转变为核心竞争力。这道门槛,可能比技术门槛更能决定最终的产业格局。
随着数据生产成本的持续下探,产业的价值高地正在悄然转移。当高质量数据逐渐变得可规模化获取,真正的竞争壁垒将上移至:仿真-现实迁移的效率、复杂任务的长程规划与分解能力,以及关乎部署安全的人机交互伦理评估体系。数据是燃料,但决定能跑多远的,是发动机的设计与交通规则。
04
未来展望——从成本之战到基础设施定义权之争
这场竞赛的终局,或许并非某一条技术路径的完胜。更可能的前景是,催生出一个全新的产业分层——“数据基础设施运营商”。
它们将整合标准化的采集网络、高效的处理中台与严谨的合规流程,向全行业提供“数据即服务”(DaaS)。AI公司调用高质量行动数据,将像调用云计算资源一样方便。今天的方案商,或许将成为明天的运营商,或被其整合。
今天,我们正在见证的,不仅是一场关于成本的效率革命,更是一场关于创新的“数据平权”运动的壮丽前奏。为天价订单惊叹的我们,或许正在目睹一个更普惠、更活跃的智能体时代,在阵痛中加速诞生。