降维打击:GPT-5.4 开启“原生电脑操控”时代
2026 年 3 月,OpenAI 毫无预兆地发布了 GPT-5.4,这一举动彻底重塑了 AI Agent(智能体)的竞争格局。作为 OpenAI 首个具备“原生电脑使用能力”的通用模型,GPT-5.4 不再依赖外部适配层,而是直接通过屏幕截图识别、模拟鼠标点击和键盘输入,像人类一样在桌面环境中操作软件。
在衡量真实桌面导航能力的 OSWorld-Verified 基准测试中,GPT-5.4 的成功率飙升至 75.0%。作为对比,人类的平均基准线仅为 72.4%,而前代 GPT-5.2 仅为 47.3%。这意味着,AI 操控电脑的熟练度历史上首次超越了普通人类用户。
实测体验:打工人的“数字替身”成真
目前 GPT-5.4 已在网页版和 Codex 平台上线。实测显示,该模型几乎可以接管电脑上的所有操作流:
深度应用控制:它能直接调起日历应用并自主申请权限来定制提醒;能精准定位并打开“小宇宙”等第三方 APP 并播放指定节目。
系统级权限:用户可以要求它直接更换电脑壁纸,或在终端(Terminal)中熟练调用各种开发工具。
原生计算逻辑:它不再只是给出计算结果,而是能直接在电脑自带的计算器 APP 内部进行模拟操作。
这种“原生感”标志着 AI 从“对话助手”正式进化为“执行实体”。
天作之合:GPT-5.4 完美命中 OpenClaw 痛点
2026 年初爆火的开源项目 OpenClaw(其 Star 数已突破 25 万)迎来了它的“天选模型”。OpenClaw 的核心理念是“真正干活的 AI”,而 GPT-5.4 在四个关键维度上与其完美匹配:
原生操控匹配:接入 GPT-5.4 后的 OpenClaw 无需复杂的 Hack 手段即可实现桌面自动化,性能提升直观。
100 万 Token 续航:超长上下文窗口解决了 Agent 在长程任务中“健忘”的顽疾,让 OpenClaw 拥有足够大的“工作台”处理复杂文件。
Tool Search 成本革命:GPT-5.4 的按需取用机制使 Token 消耗降低了 47%,极大降低了 7×24 小时运行 Agent 的 API 费用。
推理能力跃升:在专业工作任务中,GPT-5.4 表现超过 83% 的人类专家,让 OpenClaw 从简单的“脚本运行器”进化为能处理财务分析、投资备忘录的高级专家。
业界评价:人类金领工作的“奇点”已至
HyperWriteAI 首席执行官 Matt Shumer 评价 GPT-5.4 的编程能力“近乎完美无瑕”;Mercor AI 首席执行官 Brenda 则认为,该模型即将超越顶尖咨询公司、投行和律所的专业能力。这意味着,曾经被认为难以替代的人类精英金领工作,正面临来自 AI 智能体的全方位挑战。
OpenAI 杰出科学家 Sebastien Bubeck 更是用图示暗示了编程能力的质变。随着 OpenClaw 官方文档正式提供 GPT-5.4 接入方案,个人 AI 员工从概念走向现实的路径已彻底打通。2026 年,AI 的叙事逻辑已正式从“它能写什么”转向“它能完成什么”。