近日,OpenAI工程师 Ryan Lopopolo 通过长文 《Harness engineering》 揭开了内部团队使用Codex的重度玩法。这场实验不仅产出了名为 Symphony 的“幽灵库”,更定义了一种全新的工程工作方式。
核心实验:给自己戴上“零人工写码”的镣铐
Ryan 在实验之初给自己设下了一个夸张的限制:绝对不亲手写任何代码。
从痛苦到爆发: 实验初期,由于模型难以处理复杂逻辑,开发速度仅为人工的十分之一。
倒逼工具进化: 为了让 Agent 独立完工,团队被迫开发出一套极其精细的Harness(开发台)体系。
指数级增效: 随着GPT-5.4等推理模型的迭代,这套系统的产出效率最终远超任何单一工程师团队。
关键战术:把构建时间死守在“一分钟”
在OpenAI内部,Agent 的高效运行依赖于极致的反馈速度:
内部循环(Inner Loop): 团队通过不断重做构建系统(从 Makefile 到 Bazel 再到 Nx),确保构建时间严格控制在 1分钟 以内。
逻辑拆解: 如果构建变慢,Agent 会自动将构建图谱拆解得更细,直到复杂度降至阈值以下,以维持 Agent 的“专注力”。
范式转移:人变成了 PR Review 的瓶颈
当代码可以被极其容易地并行化时,真正稀缺的是“人类注意力”。
合并后评审: 团队不再在合并前进行冗长的人工 Review,而是将其自动化,大部分人工 Review 发生在代码合并之后,用于抽查质量和沉淀经验。
可观测性赋能: 工程师的工作不再是修 Bug,而是为 Agent 提供Traces(追踪)和可观测性工具,让 Agent 具备“自愈”能力。
经验“蒸馏”: 将资深工程师脑子里的“隐性经验”写进 Skill 文档和测试中,将其固化为系统上下文。
行业未来:“幽灵库”与依赖内部化
Ryan 提出了一个极具冲击力的观点:随着 Token 成本趋近于零,软件依赖可能会逐渐消失。
Ghost Libraries(幽灵库): 开发者只需定义一份高保真 Spec(规格),让 Agent 在本地重新组装实现。
依赖内部化: 对于中低复杂度的第三方库,Agent 可以直接重写并内联到仓库中,剥离无用代码,打造完全自控的技术栈。
结语:从“副驾驶”到“独立队友”
在 OpenAI Frontier 团队 的视野里,未来的软件开发不再是围绕人的习惯优化工作流,而是围绕 Agent 的可读性 重构整个代码库。当 Agent 能够自主处理从代码编写、CI 部署到生产监控的全链路任务,人类工程师的角色将彻底转向系统架构的“牧羊人”。