在AI的战场上,最响亮的炮火往往是在寂静中准备的。据开发者圈内流出的消息,OpenAI正在秘密测试一项代号为“榛子”(Hazelnut)的计划,其核心直指ChatGPT交互方式的根基——一个名为“Skills”(技能)的全新功能。
这并非一次简单的功能迭代。它是一次深刻的范式转移,更是一场针对其头号劲敌Anthropic旗下Claude同名功能的精准反击。长期以来,用户通过GPTs商店构建和分享定制化的AI“人格”,但“Skills”的出现,标志着OpenAI正在决然地从“基于角色的设定集”转向“基于能力的指令集”。
这或许是自GPT Store发布以来,OpenAI在生态战略上最重要的一次自我否定与进化。它预示着那个由无数孤立“数字人格”构成的GPTs时代正在走向黄昏,而一个更高效、更强大、也更接近“智能操作系统”内核的时代,即将来临。
从“角色扮演”到“能力堆栈”
要理解这场变革的必要性,必须先剖析当前GPTs模式的内在困境。
GPTs的本质,是让用户为AI设定一个“角色”,例如“你是一个专业的法律顾问”或“你是一个富有创意的营销文案写手”。这种模式在单一任务中表现尚可,但其天花板极低。每一个GPT都是一个数据孤岛,它们之间难以协同工作;更致命的是,为了维持这个“角色”,大量的背景指令被持续加载在上下文窗口中,造成了巨大的、无谓的资源消耗。
开发者Tibor在社交平台X上的一段话,精准地揭示了问题的本质:
“与侧重于特定角色设定的GPT不同,Skills更强调教导AI具备特定的能力、工作流程以及领域知识。”
这正是Claude已经验证过的、一条更优越的路径。一个设计精良的“前端设计”Skill,可以让AI在接到“构建一个网页应用”的模糊指令时,像一个经验丰富的工程师一样,主动调用HTML、CSS、JavaScript等多项子能力。它思考的不再是“我应该扮演谁”,而是“完成这项任务需要哪些能力的组合”。
这种从“人格”到“能力”的转变,是AI从“玩具”走向“工具”的决定性一步。
“技能”的四大信条:借鉴与超越
据透露,“Skills”的设计哲学,很大程度上借鉴了行业内的最佳实践,并形成了四大核心特性,每一条都直击GPTs的痛点。
首先,是可组合性(Composability)。 这意味着技能可以像乐高积木一样被自由叠加和调用。当面对一个复杂任务时,系统不再依赖一个无所不包的“超级GPT”,而是能智能地识别任务需求,并自动协调多个专精的“微技能”协同工作。AI在这里,化身为一个懂得任务拆解与资源调度的项目经理。
其次,是高移植性(Portability)。 开发者只需构建一次技能,就能在ChatGPT的网页版、桌面客户端乃至API中通用。这是一个明确的信号:OpenAI意图构建一个真正统一的、跨平台的开发者生态,而非一个仅限于Web界面的“小应用”市场。
再次,是极致的高效(Efficiency)。 技能将按需加载。只有在处理相关任务时,特定的指令集才会被调取,这极大地解放了宝贵的上下文窗口,为处理更长、更复杂的任务留出了空间。这是对GPTs“常驻后台”式资源浪费的彻底颠覆。
最后,是强大的执行力(Execution)。 新的技能体系将支持编写并直接运行可执行代码。这解决了传统纯令牌生成模型在处理严谨逻辑和编程任务时的根本性不可靠问题。AI不再只是“说”代码,而是能够真正地“写”和“跑”代码,这是从“模拟智能”到“功能智能”的关键跨越。
通往操作系统的最后拼图
随着“Skills”功能的浮现,以及配套的“斜杠命令”(Slash Commands)交互方式和技能编辑器的推出,OpenAI的战略意图已昭然若揭。
它正在全力推动ChatGPT完成一次终极进化:从一个无所不知的“聊天机器人”,蜕变为一个无所不能的“智能操作系统”。
在这个新的操作系统里,“Skills”就是内核级的API和驱动程序,而用户和开发者,则是基于这些底层能力构建上层应用的创造者。OpenAI甚至计划允许用户将现有的GPTs一键转换为“技能”,以确保这场生态大迁徙的平滑过渡。
这盘棋的赌注极大。它意味着OpenAI不再满足于做一个AI时代的“App Store”,而是要成为那个制定标准、提供底层能力的“微软”或“谷歌”。这场与Anthropic的竞争,已不再是模型参数或聊天体验的较量,而是关乎谁能率先定义下一代人机交互的底层架构,谁能率先锁定未来十年最有价值的开发者生态。
尽管官方尚未宣布确切的上线日期,但市场普遍预期这一变革将在2026年初正式落地。届时,我们或许会发现,我们与AI的互动方式,以及我们对AI的全部想象,都将被彻底重塑。一个真正属于“AI原生”应用的时代,或许才刚刚开始。