在中国AI大模型的这场、日益白热化的“内卷”战争中,当绝大多数的玩家,都还在“参数规模”和“上下文长度”这两个、传统的、二维的战场上,进行着激烈的、同质化的消耗战时,一场更为深刻的、关乎“思考”本身的、高维度的“升维打击”,正由“深度求索”(DeepSeek),悍然发动。
12月4日,这家,被业界普遍视为“中国开源AI技术天花板”的公司,在没有任何预告的情况下,突然地,向全球,同时,甩出了两张“王炸”:
DeepSeek-V3.2正式版与其极致推理版的DeepSeek-V3.2-Speciale。

而比其发布,更具冲击力的,是其“交付”的速度——发布,即上线!
在其公告发出的瞬间,其官方的网页端、移动App,以及API接口,便已全部,完成了“零感知”的、无缝的后台切换。
第一张“王炸”:DeepSeek-V3.2——开源世界里,首个,实现了“思考即工具调用”的通用大模型。
本次V3.2版本,最大的、也是最具革命性的亮点,在于它史无前例地,将AI的“思考过程”(Chain-of-Thought),与“工具调用”(Tool-calling),这两大核心能力,进行了深度的、原生的融合。
它,支持两种模式,并行运行:
-
“思考模式”: 当面对一个需要多步规划和复杂逻辑推演的任务时,模型,会首先,在自己的“脑海”中,进行一步步的、长链条的推理;然后,在推理出最终的、最优的行动路径之后,再去精准地,调用外部的工具(如代码解释器、搜索引擎等),来完成任务。
-
“非思考模式”: 而当面对简单的、日常的问答时,模型,则依然会,保持其闪电般的、毫秒级的快速响应。
这种,能够根据任务的复杂性,来动态地,调整自身“思考深度”的、灵活的架构,其背后,是DeepSeek,在“智能体(Agent)合成训练数据”上的巨大投入。
而其所带来的成果,是惊人的:
在没有任何,针对特定榜单,进行专项训练的情况下,V3.2,在发布之后,便直接地,“横扫”了当前,所有主流的、公开的智能体评测榜单,轻松地,登顶“开源第一”的位置,甚至,在部分指标上,已经开始,逼近那些,最顶级的、闭源的商业模型的表现。
而第二张“王炸”:DeepSeek-V3.2-Speciale——则是一场,更为纯粹的、不计成本的、旨在将开源模型的“推理能力”,推向其物理极限的“暴力美学”展示。
如果说,V3.2,是一个在“性能”与“效率”之间,取得了完美平衡的“全能战士”。
那么,Speciale版本,则可以被理解为,一个,将“思考”这个单一维度的能力,“开到最大”的、偏执的“推理狂魔”。
它,不仅,完整地,继承了其前代、曾在全球数学领域,一战封神的DeepSeek-Math-V2,在数学定理证明上的顶级能力。
更在长链条的逻辑推演、复杂问题的自主分解、以及多步骤的任务规划等,这些,最能体现AI“智商上限”的场景中,展现出了惊人的、超越所有现有开源模型的稳定性。
社区的早期实测显示:在那些,需要进行30步以上的、深度推理的、极度复杂的任务中,Speciale版本的最终正确率,相比于其他所有的开源模型,都形成了“断层式”的领先。
它,也因此,被兴奋的开发者社区,戏称为“开源的o3/o4杀手”(意指其性能,已开始,挑战OpenAI的GPT-3.5/4系列)。
爱力方的分析认为,DeepSeek的这次“双子闪电战”,其背后,是一种极其清晰、也极具侵略性的“竞争范式定义”战略。
它,以一种无可辩驳的方式,向整个行业,宣告:
AI大模型的竞争,其下半场,将不再是,关于“谁能记-住更多知识”(更大的参数、更长的上下文)的“记忆力”比拼。
它,将是一场,关于“谁能更好地,运用知识,去解决复杂问题”的“思考力”的较量。
当全球所有的大厂,都还在,疯狂地,内卷于模型的“尺寸”时,DeepSeek,则以一种“四两拨千斤”的方式,直接地,将战火,烧到了“思考”这个,更高维度的、也更接近于“智能本质”的核心战场之上。
更令人感到“恐怖”的是,这一切,还仅仅只是,DeepSeek-V3系列的、一个“点二”的中间迭代版本。
DeepSeek,便已用这样一场,堪称“疯狂”的“两连发”,将整个开源社区的“血压”,直接拉满。
一边,是灵活高效、可堪大用的V3.2。
另一边,则是推理疯魔、直逼天花板的Speciale。
它,直接地,将“性能的上限”,与“易用性的下限”,同时地,卷到了一个,令所有竞争对手,都感到窒息的、全新的高度。
这一波,由中国的开源力量,所发起的、针对“思考”本身的终极革命,其最终,将为全球的AI版图,带来何等深刻的、颠覆性的变革,可能才刚刚开始,被我们所真正地认识到。
而现在,压力,已经给到了牌桌上的,所有其他人。
下一个,轮到谁,来接招?