作者:左少彬 出品:AI智心
近日,一则消息在科技圈投下重磅炸弹:京东宣布,将建成全球规模最大、场景最全的具身智能数据采集中心,目标是在两年内积累超过1000万小时的优质数据。这不是一个简单的数据中心,而是一场被京东定义为“人类历史上规模最大的数据采集行动”的豪赌。
一、“燃料”焦虑:当机器人开始“内卷”
想象一下,你正在教一个三岁小孩认识世界。
你会指着苹果告诉他“这是苹果”,拉着他的手触摸,感受它的圆润和温度。这个过程,就是数据喂养。
对于具身智能——也就是我们常说的、能与物理世界交互的机器人——来说,数据就是它们认知世界的“燃料”。没有海量、高质量的数据,再聪明的“大脑”(AI大模型)也无法指挥“身体”(机器人硬件)完成复杂的任务。
当前,整个行业正陷入一场“燃料焦虑”。
大多数机器人公司依赖虚拟仿真环境来训练AI,就像让机器人在游戏里学习开车。
成本低,速度快,但问题在于,虚拟世界无法完美模拟现实。
一根柔软的电线、一件褶皱的衬衫,这些在物理世界司空见惯的东西,对仿真引擎来说却是噩梦。这导致机器人在虚拟世界里是“车神”,一到现实就“翻车”。
于是,获取真实世界的数据,成了决定行业胜负的关键胜负手。
二、京东的“阳谋”:把整个商业帝国变成“数据油井”
京东的解法,简单直接,却无人能复制:用人海战术,暴力破解。京东要动员数十万人参与数据采集,包括内部超过10万名员工,以及外部最多50万名各行业人员;仅在京东的“老家”宿迁,就将发动超10万市民。这背后,是京东将自身20余年积累的庞大实体供应链,瞬间转化为一个巨大的、活生生的数据训练场。
快递员:在爬楼送货时,身上的可穿戴设备记录下视觉、空间轨迹和力觉数据,教会机器人如何识别复杂楼道、如何平稳搬运包裹。
仓库分拣员:在“亚洲一号”智能仓里,他们的每一次抓取、放置动作,都在为机器人提供如何高效处理海量SKU的“教科书级”示范。
外卖小哥:在餐厅取餐、与顾客沟通的场景,被转化为机器人学习社会交互和复杂环境导航的宝贵教材。
宿迁市民:在超市购物、在家做饭、在公园散步,这些最日常的生活片段,构成了机器人理解“人类世界”的常识基础。京东构建了一条“采集—标注—训练—验证”的全流程数据流水线,覆盖物流仓储、工业制造、健康医疗、家庭服务、城市运维五大核心场景。目标是在一年内积累500万小时人类真实场景视频数据,两年内突破1000万小时,并同步采集100万小时的机器人本体数据。
这不再是“作坊式”的数据收集,而是工业化、规模化的“数据大生产运动”。
三、从“搬运工”到“数据主”:一场价值千亿的战略转身
京东此举,远不止是为了解决自己的物流效率问题,更是一盘下得极大的棋。
1.补齐产业链最缺失的一环
在北京亦庄,聚集了300多家机器人企业,形成了强大的硬件产业链。但所有人都缺数据。京东作为扎根此地的“链主”企业,此时建设数据采集中心,等于补齐了产业链最关键的短板,用“软基建”撬动整个“硬科技”生态。
2.从运营驱动到“数据+运营”双轮驱动
资本市场对京东的估值,长期基于其强大的供应链运营能力。但一旦市场意识到,京东手里握着一个全球最大、最真实的物理世界数据集,其估值逻辑将发生根本性改变。它不再只是一家电商公司,更是一家掌握着通往通用人工智能(AGI)钥匙的数据公司。
3.制定未来标准,掌握生态话语权
通过向行业开放数据,京东有望成为具身智能领域的“数据标准制定者”。未来,无论是哪家公司的机器人,要想在物流、零售等场景高效工作,可能都需要接入京东的数据体系进行训练。这相当于在机器人的“大脑”里,提前植入了京东的“基因”。

四、争议与挑战:海量数据是金矿还是砂砾?
当然,质疑声也随之而来。有业内人士冷静地指出,数据的质量和模态远比时长重要。普通市民佩戴设备产生的海量视频数据,对训练机器人“看”世界有帮助,但对于训练其“动”的控制策略,作用有限。真正稀缺的,是包含精确力觉、触觉反馈的“状态-动作对”数据。如果京东的“人海”只能贡献视频,而无法捕捉到人类抓取物体时肌肉的微妙发力,那么这些数据在后期转化为机器人可执行动作时,损耗率将极高。
此外,不同机器人的身体结构千差万别,一台机器臂学到的数据,很难直接用在另一台人形机器人上。缺乏统一标准,可能导致京东的数据只能“自用”,难以真正推动全行业发展。因此,金矿还是砂砾,取决于“炼金术”。此外,京东面临的挑战,不仅仅是技术上的(如何采集力觉数据),更是社会学上的(如何让员工心甘情愿地贡献数据)和经济学上的(如何让数据跨硬件通用)。
●如果京东能解决利益分配,让员工从“被替代者”变成“数据合伙人”;
●如果京东能制定数据标准,让不同形态的机器人都能读懂人类动作;
那么这1000万小时数据就是金矿。否则,它可能只是一堆昂贵的、带有偏见的、难以复用的“数字砂砾”。
写在最后:
京东的豪赌,标志着一个新时代的开启。具身智能的竞争,已经从单纯的算法和硬件竞赛,升级为对真实物理世界入口的争夺。谁能掌握最丰富、最真实的交互场景,谁就掌握了训练下一代智能体的“数据油井”。
这场由数十万人参与的“数据人海战”,无论最终产出的是金矿还是砂砾,都已然将行业竞争推向了拼资金、拼场景、拼人力的重资产阶段。当机器人开始学习人类,京东正试图成为那个最重要的“老师”。