OpenAI新图像模型疑曝光 开启盲测引关注

OpenAI新图像模型疑曝光 开启盲测引关注

爱力方

爱力方

2025年12月10日 15:54
本文共计1214个字,预计阅读时长5分钟。
来源/爱力方 责编/爱力方

12月9日,在人工智能领域两个最前沿的、由社区驱动的评测平台——Design Arena与LM Arena——之上,多位独立的测试者,发现了一个异常的信号。

两款代号分别为“Chestnut”(栗子)与“Hazelnut”(榛子)的、全新的、来源不明的图像生成模型,正在进行着小规模的、匿名的盲测。

这并非一次常规的算法更新。

根据其在盲测中所展现出的、惊人的性能,以及其背后所透露出的、OpenAI标志性的发布节奏,一个清晰的猜测,正在业内迅速形成:

这,极有可能是OpenAI下一代的、尚未公开发布的图像生成模型。

QQ20251210-141417.png

这也是继今年5月,其gpt-image-1正式发布之后,OpenAI在“文本到图像”这一关键领域,所释放出的、最重大的一个进展信号。

“摄影级”的真实感,与“无幻觉”的文字

根据已公开的盲测样本与初步的评分数据,这款新模型,在多个关键的维度上,都表现出了显著的、甚至是跨越式的提升。

  • 世界知识的理解能力: 与谷歌最新的Nano Banana Pro相比,其对复杂概念的理解与视觉化能力,已基本持平。

  • 人物肖像的真实感: 它能够,生成出接近“摄影级”真实感的、名人风格的自拍图像。其在面部细节、五官比例、光影处理等方面的表现,均大幅优于上一代的gpt-image-1。

  • 图像内文字的渲染能力: 在这一长期困扰所有图像生成模型的“老大难”问题上,它的表现,尤为突出。它能够,在图像中,精准地嵌入清晰、可读的代码片段、流程图的标签,以及复杂的数学公式。过去那种常见的、如同“鬼画符”般的文字扭曲与幻觉问题,几乎被彻底杜绝。

目前,这两款模型,均以匿名的形式,参与着排行榜的竞争。其中,代号为“Chestnut”的,被认为可能是其轻量级的版本(可能对应未来的“Image-2-mini”)。而代号为“Hazelnut”的,则可能是其旗舰级的版本(可能对应“Image-2”)。

QQ20251210-141358.png

一场即将到来的“闪电战”

业内人士分析,这种小规模的、匿名的盲测,通常是OpenAI在进行重大模型发布前的、1到3周的常规流程。

而结合此前,关于GPT-5.2即将提前发布(原定年底,现传闻可能提前至本周或下周)的路线图,一个更为宏大的图景,开始浮现:

OpenAI,极有可能,将把其下一代的语言大模型,与这款全新的图像生成模型,进行同步的、捆绑式的发布。

这,将是一次,旨在全面压制竞争对手的“闪电战”。

一旦确认发布,这将是OpenAI,自DALL·E 3之后,时隔14个月,在图像生成能力上,所实现的最大的一次跃迁。

它也将使其,在与谷歌的Imagen、Midjourney,以及新兴的挑战者Flux等对手的正面竞争中,重新夺回,其在多模态领域的、无可争议的主动权。

目前,OpenAI的官方,尚未对此作出任何回应。

但整个行业,都已开始屏息以待。

因为所有人都知道,当OpenAI,开始以一种匿名的方式,在公开的竞技场上,测试其新武器时,一场新的、更为激烈的技术军备竞赛,已然,箭在弦上。

声明:本文来自爱力方,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯