Claude Opus 4.6 登顶AI智商基准测试

Claude Opus 4.6 登顶AI智商基准测试

2026年02月09日 15:50
本文共计577个字,预计阅读时长2分钟。
来源/aibase 责编/爱力方

大模型竞争格局再度洗牌。根据最新发布的 Artificial Analysis 智能指数,Anthropic 的旗舰模型Claude Opus4.6凭借卓越的表现力压群雄,正式登顶该权威排行榜。这一指数综合了编程、代理任务和科学推理等十项深度测试,Opus4.6在代理类工作任务、终端编程以及物理研究课题上均斩获第一

image.png

值得关注的是,尽管 Opus4.6的运行成本高达2,486美元,略高于 OpenAIGPT-5.2的2,304美元,但在效率表现上却呈现出显著差异。数据显示,Opus4.6在测试过程中消耗了约5,800万个输出 Token,虽然这一数字是前代机型4.5的两倍,但相较于 GPT-5.2惊人的1.3亿个 Token,Opus4.6显然在信息密度和处理逻辑上更为精简。目前,该模型已全面上线Claude.ai平台,并支持通过 Google Vertex、AWS Bedrock 等主流云服务进行调用。

然而,Anthropic 的领先地位正面临严峻挑战。行业巨头 OpenAI 的新一代编程利器Codex5.3已在备测名单中。分析人士指出,一旦 Codex5.3完成所有基准测试,其在代码编写及相关逻辑领域的优势极有可能助其重夺王座。这场“全球最聪明模型”的拉锯战,远未到盖棺论定的时候。

来源:登顶AI智商基准测试:Claude Opus 4.6 强势超车 GPT-5.2 | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯