12月9日,在人工智能领域两个最前沿的、由社区驱动的评测平台——Design Arena与LM Arena——之上,多位独立的测试者,发现了一个异常的信号。
两款代号分别为“Chestnut”(栗子)与“Hazelnut”(榛子)的、全新的、来源不明的图像生成模型,正在进行着小规模的、匿名的盲测。
这并非一次常规的算法更新。
根据其在盲测中所展现出的、惊人的性能,以及其背后所透露出的、OpenAI标志性的发布节奏,一个清晰的猜测,正在业内迅速形成:
这,极有可能是OpenAI下一代的、尚未公开发布的图像生成模型。

这也是继今年5月,其gpt-image-1正式发布之后,OpenAI在“文本到图像”这一关键领域,所释放出的、最重大的一个进展信号。
“摄影级”的真实感,与“无幻觉”的文字
根据已公开的盲测样本与初步的评分数据,这款新模型,在多个关键的维度上,都表现出了显著的、甚至是跨越式的提升。
-
世界知识的理解能力: 与谷歌最新的Nano Banana Pro相比,其对复杂概念的理解与视觉化能力,已基本持平。
-
人物肖像的真实感: 它能够,生成出接近“摄影级”真实感的、名人风格的自拍图像。其在面部细节、五官比例、光影处理等方面的表现,均大幅优于上一代的gpt-image-1。
-
图像内文字的渲染能力: 在这一长期困扰所有图像生成模型的“老大难”问题上,它的表现,尤为突出。它能够,在图像中,精准地嵌入清晰、可读的代码片段、流程图的标签,以及复杂的数学公式。过去那种常见的、如同“鬼画符”般的文字扭曲与幻觉问题,几乎被彻底杜绝。
目前,这两款模型,均以匿名的形式,参与着排行榜的竞争。其中,代号为“Chestnut”的,被认为可能是其轻量级的版本(可能对应未来的“Image-2-mini”)。而代号为“Hazelnut”的,则可能是其旗舰级的版本(可能对应“Image-2”)。

一场即将到来的“闪电战”
业内人士分析,这种小规模的、匿名的盲测,通常是OpenAI在进行重大模型发布前的、1到3周的常规流程。
而结合此前,关于GPT-5.2即将提前发布(原定年底,现传闻可能提前至本周或下周)的路线图,一个更为宏大的图景,开始浮现:
OpenAI,极有可能,将把其下一代的语言大模型,与这款全新的图像生成模型,进行同步的、捆绑式的发布。
这,将是一次,旨在全面压制竞争对手的“闪电战”。
一旦确认发布,这将是OpenAI,自DALL·E 3之后,时隔14个月,在图像生成能力上,所实现的最大的一次跃迁。
它也将使其,在与谷歌的Imagen、Midjourney,以及新兴的挑战者Flux等对手的正面竞争中,重新夺回,其在多模态领域的、无可争议的主动权。
目前,OpenAI的官方,尚未对此作出任何回应。
但整个行业,都已开始屏息以待。
因为所有人都知道,当OpenAI,开始以一种匿名的方式,在公开的竞技场上,测试其新武器时,一场新的、更为激烈的技术军备竞赛,已然,箭在弦上。