躯体狂奔、灵魂迟滞与资本转向
幕布拉开,一位身高178cm,体重70kg,猫步平稳,体态婀娜的模特朝你走来。
别搞错了,这可不是什么国际时装周的T台,而是11月小鹏科技日的发布现场,这位惊艳众人的,也不是什么国际“超模”,而是小鹏推出的全新一代人形机器人IRON。
这样一场充满未来感,却又略显“诡异”的时装秀,很快便点燃了社交网络,网友们化身侦探,放大每一帧画面,有人指出机器人的关节反光不像金属;有人则怀疑动作流畅得不像机器;甚至有人脑补出特技演员蜷缩在壳内的离谱剧情。
面对铺天盖地的质疑,在当晚的发布会上,小鹏的工作人员选择直接在机器人运行状态下,剪开了IRON小腿的柔性“皮肤”与“肌肉”层,裸露的机械骨骼在聚光灯下继续完成猫步。
这样“以假乱真”的戏码,在具身智能飞速发展的今天,正在全球频频上演。
从拥有仿真外貌与灵巧双手,在中关村论坛提供咨询和公共服务的“小柒”,到波兰初创公司Clone Robotics打造的,有着逼真的人造骨骼和肌肉,还能“出汗”降温的机器人Protoclone……
可以说2025年的人形机器人,在“像人”的形似之路上已经走得足够远了,那么问题来了,其距离“是人”的智能内核还有多远?
01躯体“狂奔”,灵魂“滞后”
人形机器人的“躯体”在2025年展现出了更多的可能性。
一方面,是因为核心部件的“封锁线”正在被突破。
曾长期被国外厂商垄断的行星滚柱丝杠、谐波减速器、高精度轴承等关键部件,在国内供应链的攻坚下,正从“能用”走向“好用且便宜”。
以行星滚柱丝杠为例,过去它长期被GSA、Rollvis、Rexroth等欧洲企业垄断,单价高达数万元,且交期漫长,而在2025年,双林股份、五洲新春等国内企业通过工艺创新和反向工程,在保证性能达到工业级门槛的前提下,成功大幅削减了冗余成本。
国产化替代不仅意味着成本曲线有望被彻底重塑,更关乎供应链安全,为人形机器人从“实验室珍品”迈向“工业消费品”按下了“加速键”。
另一方面,作为与外界交互的“最后一厘米”,灵巧手也被中国玩家撕开了关键缺口。
一只好用的灵巧手,不止能完成握手、抓物等基础操作,还能钻进精密仪器里拧动微型螺丝,甚至在手术台上帮医生夹起比头发丝还细的缝合线。
然而,这样关键的技术在很长一段时间里,却处于“能动”的“1.0阶段”,而从“能动”到“能用、好用、持久用”的“2.0阶段”仍存在巨大鸿沟。
所幸,凭借着完整的产业链和庞大的市场需求,国产灵巧手快速崛起,据相关统计数据,截至2025年7月,中国灵巧手企业已经超过60家,直接拿下全球市场的半壁江山。
部分中国灵巧手企业已从“跟跑”追至“并跑”,甚至部分领域实现“领跑”。比如8月中旬,智元机器人发布的OmniHand2025系列灵巧手,包括了面向交互服务的“灵动款”和专注专业作业的“专业款”;又比如作为激光雷达领域的头部玩家,速腾聚创今年初推出的第二代灵巧手Papert2.0,其在指尖、指腹和手掌上共有15组力传感器,能负载5公斤,执行复杂的操作……
机器人本体正变得越来越强壮、敏捷与稳定,然而,一个日益强大的“躯体”,仍在焦灼地等待一个足够聪明的“灵魂”。
毕竟,“炫技”与“干活”之间,横亘着巨大的效率鸿沟,人形机器人距离“替代人类”还有很长一段路要走。
摩根士丹利的报告就指出,即便是在“搬运箱子”这种标准化的简单任务中,行业头部企业优必选的人形机器人,虽能达到99%的成功率,但搬运单个箱子仍需耗时1.5分钟,效率仅为人类的30%。
硬件搭好了“舞台”,但决定“演出”真正价值的,永远是舞台上那个名为“智能”的灵魂,2025年的进展也从侧面证明,我们能造出更强大的身体,但如何为其注入常识与智慧,仍是横亘在整个产业面前的谜题。
02人形机器人“大脑”,陷入进化迷局
五年前,人形机器人的硬件就已不是障碍,目前真正制约人形机器人发展的是软件能力,也就是其“大脑”。
自变量机器人创始人王潜在接受“中国经营报”采访时就表示:“现在还缺乏足够智能的‘大脑’,让机器人能像人类一样思考、判断并灵活操作。”
2023年7月28日,谷歌DeepMind发布了全球首个控制机器人的视觉语言动作(VLA)模型RT-2,给人形机器人的“大脑进化”指明了方向。
所谓VLA,即通过将人类指令和外界多模态信息(声音、图像、视频),经由大语言模型的理解与规划,最终输出控制机器人身体的动作。
如此清晰的技术逻辑,使得VLA模型一度被视为连接ChatGPT所代表的数字智能与物理世界的“完美桥梁”,并被人形机器人厂商广泛应用。
然而,这座桥梁在2025年显露出了“结构性裂缝”,物理世界数据的稀缺与复杂性,成为制约VLA模型能力跃升的主要瓶颈。
因为大型VLA模型通常拥有数十亿级别的参数量,这导致它们在运行时对计算资源的要求极高,并且为了使VLA能够有效工作,往往需要大量的高质量训练样本,但现实中获取这样丰富且多样化的数据并非易事。
(王力宏演唱会上的机器人伴舞)
宇树科技创始人王兴兴就曾指出,VLA模型是一个相对比较傻瓜式的架构。基于VLA模型的机器人现在跳舞、打拳效果很不错,可如果要训练机器人跳全新的舞蹈,每次有新的动作都要从头开始训练。
可以看出,现在的VLA模型更像一个需要精心喂养的“专家系统”,而非能够举一反三的“通用学生”。
更深刻的质疑则指向了架构本身。小鹏汽车创始人何小鹏曾提出,从视觉到语言、再从语言到动作的两次“转译”过程中,都存在着巨大的信息损耗,语言作为中间媒介,损失了原始视觉数据中的大量细节和物理世界的连续性信息。
于是,他提出了一种相对有些“激进”的思路,即“砍掉L环节”,构建从视觉直接到动作的“世界模型”(World Model)。
其理想是让AI通过海量视频数据,直接学习物理世界的底层规律与运动映射,试图让模型具备对物理世界的深层理解和预测能力,而非仅仅基于语言进行推理。理想很“丰满”,但现实是目前还未出现清晰的技术收敛趋势。
因此,尽管行业内已有不少玩家清醒认识到了VLA模型的局限,并积极探索“世界模型”等新范式,但在过去一年,关于“大脑”进化的终极路径,仍无“标准答案”。
03人形机器人,行至价值重构前夜
尽管行业仍未完全驱散技术路径的“迷雾”,但市场对机器人产业前景,仍抱持长期看好的态度。
IDC预测,到2029年全球机器人市场规模将突破4000亿美元,中国将占据近半份额,年复合增长率约15%。
需求的扩张催生出了一轮轮的融资热,截止12月初,国内机器人产业链相关的投融资事件已经超过550起,融资金额超过839亿元。即使落地路径尚未完全跑通,智元机器人、宇树科技等头部企业的估值均已达到数百亿级别。
不过,当时间的指针拨向2026年,资本市场评估人形机器人公司的标尺,正在发生根本性转变。
一家名为灵启万物的初创公司,在11月发布了一组Demo视频:一台经过改造的宇树G1机器人,在真实的家庭环境中,自主完成了拉窗帘、叠衣服、浇花、倒垃圾、整理杂物等一系列复杂任务。短短4个月时间里,灵启万物就完成了3轮融资,总融资额近亿元。
某种程度上,这进一步佐证了资本市场的态度,即相比于“能否完成高难度后空翻”,“能否在特定场景下,形成可衡量、可持续的商业闭环?”开始变得更加重要。
资本市场开始用真金白银,为那些展现出解决实际问题潜力的“务实派”投票。
首当其冲,就是在汽车制造、3C电子装配、物流仓储这些流程清晰、环境结构化程度高的领域,人形机器人正从点缀性的“科技展品”,走向承担实际生产任务的“工位员工”,这里已经诞生了行业第一批“血与火”验证过的真实订单与稳定收入。
与大规模工业客户相比,家庭消费场景的渗透逻辑则更为复杂。机器人要完成衣物折叠、餐具整理等多项任务,非常考验模型的泛化性和鲁棒性。并且,机器人在面对面服务于人的时候给予的体验感也会被越来越看重。
毕竟,机器人在与人面对面交互时,其流畅性、拟人化程度乃至情绪反馈能力,将直接决定用户粘性与服务价值。这也意味着,下一阶段的竞争,或许不仅是硬件的竞赛,更是人机交互与场景理解深度的比拼。
总而言之,即将到来的2026年,或许并非万众期待的技术“爆炸奇点”,但它极有可能成为一个更为重要的“分化奇点”。
潮水将更清晰地分辨出,谁是沉迷于聚光灯下的表演者,谁又是深耕于用户需求中的价值创造者。当资本的喧嚣渐趋理性,那些在核心部件、场景数据与商业闭环中构筑了真实竞争力的企业,才会被时代选中,去真正触摸那片属于人形机器人的“星辰大海”。
* 图片来源于网络,侵权请联系删除
原文标题 : 人形机器人的2025年:“皮囊”已就绪,“灵魂”何时觉醒?