在加州帕洛阿尔托的一间秘密实验室内,通往未来机器人时代的路,正由一种最原始、最重复的人类劳动铺就。
这不是一个关于算法突破的故事。
根据《Business Insider》的最新报道,数十名“数据收集者”正在这里,日复一日地为特斯拉的人形机器人Optimus,提供其最稀缺的养料——关于如何“成为人类”的数据。
这些数据收集者,是这个高科技实验室里最“低科技”的组成部分。
他们身上佩戴着配备五个摄像头的头盔,背上是重达40磅(约18公斤)的数据记录背包。
他们的工作,是模仿最基本的人类日常活动,并将其重复数百次。
举起一个杯子。擦拭一张桌子。将汽车零件进行分类整理。
有时,他们甚至会被要求完成一些看似荒诞的任务,比如跳一段“鸡舞”,或者做出扭动的舞姿。
一位前数据收集者形容这份工作,就像“在显微镜下做实验”。任务是极致的重复与枯燥。在每个八小时的工作班次中,他们必须至少生成四小时的、被认为是“可用”的影像数据。
这份工作还有一个独特的考核标准:如果他们的动作被判定为“不够人性化”,还可能面临某种形式的处罚。
这间实验室的运作模式,揭示了特斯拉,或者说整个具身智能领域,一个严峻的现实:
当AI在数字世界可以依靠抓取整个互联网的数据进行学习时,物理世界的AI,正面临着根本性的“数据饥荒”。
互联网上有无穷无尽的文本和图片,但几乎没有关于“如何用第一视角拿起杯子”的、带有精确物理参数的高质量数据。
特斯拉的选择,是自己“制造”这些数据。
这是一种最直接、最昂贵,也可能最有效的蛮力解决方案。用人类的重复劳动,为机器人的智能建立一个模仿的基座。
然而,故事的另一面是,这种庞大的数据采集工作,与Optimus机器人目前在公开场合的表现,形成了鲜明的反差。
特斯拉首席执行官埃隆·马斯克对Optimus寄予厚望,并定下了一个极具野心的目标:到今年年底,生产出5000台这样的机器人。
但在近期的公开演示中,机器人的表现并未给人留下深刻印象。其反应迟缓,动作不协调,远未达到流畅执行任务的水平。
报道中一个关键的细节是:为了向投资者和公众展示机器人的能力,这些演示通常需要由人类在幕后进行远程操控(Teleoperation),以确保流程的顺畅。
机器人尚未真正“学会”,它更多时候只是一个远程控制的提线木偶。
这个秘密实验室的存在,以及其内部略显笨拙的工作方式,恰恰解释了Optimus机器人当前状态的原因。
它说明,让一个AI模型理解语言和图像的复杂性,与让一个物理实体在现实世界中稳定地拿起一个杯子相比,可能是两种完全不同量级的挑战。
前者是关于信息和模式的,后者则关乎物理、重力、摩擦力和不可预测的环境变量。
特斯拉正在做的,是一场豪赌。
它赌的是,只要能喂给模型足够多的、由人类亲身演示的高质量数据,那个从量变到质变的“涌现”时刻,就终将到来。
尽管Optimus目前的表现仍显拙劣,但这间数据工厂的存在,本身就比任何一次流畅的、经过编排的演示都更能说明问题。
它说明特斯拉清楚地知道,通往真正自主的通用人形机器人的道路上,没有捷径。
唯一的路径,可能就隐藏在那数百万次枯燥的举杯、擦拭,以及偶尔显得滑稽的“鸡舞”之中。