DeepSeek双模型重磅开源长文本与深度思考能力再突破

2025年12月03日 10:40

本文共计583个字，预计阅读时长2分钟。

来源/aibase 责编/爱力方

本文转载自AIbase

原文标题：DeepSeek V3.2 双模型发布：线性复杂度长文本 + 无惩罚深度思考，开源阵营再冲第一梯队

DeepSeek 发布 V3.2（标准版）与 V3.2-Speciale(深度思考版)，官方评测显示:

- V3.2在128k 上下文场景下与 GPT-5互有胜负

- V3.2-Speciale 在 MMLU、HumanEval 等基准中与 Gemini3Pro 打平，IMO2025盲测获金牌分数线83.3%

转正稀疏注意力（DSA）是核心升级:通过“目录”式路由token，将长文本计算复杂度从O(n²)降至O(n)，显存占用下降40%，推理速度提升2.2倍，首次在开源模型实现百万token单卡推理。

后训练环节，团队把>10%整群算力投入强化学习，采用组对强化学习（GRPO）+多数投票，让模型在代码、数学与工具调用任务上逼近闭源对手。V3.2-Speciale取消“思考长度惩罚”，鼓励更长链式推理，平均输出token较Gemini3Pro高32%，但准确率提升4.8个百分点。

模型已上线GitHub与Hugging Face，权重采用Apache2.0协议，允许商业化。DeepSeek表示，下一步将开源长文本DSA内核与RL训练框架，继续把“闭源优势”转化为社区基础设施。行业评论称，若后续版本保持迭代节奏，开源阵营有望在2026年前实现“长文本+推理”双重领先。

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表A³·爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

TAGS: DeepSeek 开源模型长文本处理人工智能模型优化

热门资讯

30秒生成应用的AI助手来了！蚂蚁集团灵光App正式上线

2025-11-18

·

56 浏览
告别复制粘贴！NotebookLM直接“读懂”文档，你只需动嘴，它来做PPT

2025-11-21

·

55 浏览
从跑酷到叠衣：机器人行业为何集体放弃“炫技”？

2025-11-25

·

49 浏览
2.2亿用户，115亿美元血亏：OpenAI的“万亿帝国”，是梦想还是泡沫？

2025-11-26

·

47 浏览
Pokee AI：核心技术与生态资源驱动的AI Agent平民化浪潮

2025-11-04

·

40 浏览
从六轴到七轴，不止多一轴：松灵NERO发布，开启机器人精细操作新篇章

2025-12-01

·

36 浏览

通知

尊敬的用户

user

DeepSeek双模型重磅开源长文本与深度思考能力再突破

相关图文

Anthropic聘请IPO律师加速推进上市进程

马斯克分享擎天柱跑步视频人形机器人研发再提速

法国Mistral发布新AI模型挑战OpenAI与谷歌

Mistral AI推出Mistral 3开源模型：128K上下文、单A100运行，价格仅为GPT-4o一半

众擎T800人形机器人发布起售价18万元

黑五战报：Rufus成交率飙升，亚马逊AI助手成假日季转化引擎

热门资讯

30秒生成应用的AI助手来了！蚂蚁集团灵光App正式上线

告别复制粘贴！NotebookLM直接“读懂”文档，你只需动嘴，它来做PPT

从跑酷到叠衣：机器人行业为何集体放弃“炫技”？

2.2亿用户，115亿美元血亏：OpenAI的“万亿帝国”，是梦想还是泡沫？

Pokee AI：核心技术与生态资源驱动的AI Agent平民化浪潮

从六轴到七轴，不止多一轴：松灵NERO发布，开启机器人精细操作新篇章

快讯

均普智能回应募投延期及场地出租重启10亿元定增布局机器人领域

大厂布局养龙虾产业腾讯小米纷纷涉足背后有何考量

AI助力养龙虾热潮腾讯小米布局上门安装服务

OpenClaw爆火引热议，不同群体以独特方式参与安装热潮

刘忠军教授：推动创新医疗技术在AI领域的应用

李萌：人形机器人何时迎来"iPhone时刻"？智能玩具或成新兴大产业

帕西尼再获超10亿融资估值突破百亿以全球唯一百亿级实采全模态数据重塑具身智能模型天花板

斯坦福李飞飞团队提出新框架机器人可从错误中学习

西南科大爬壁机器人实现全角度翻转突破

穆南杉提出人类AI智能体生命进化理论

推荐专栏

爱力方

机器人大讲堂

下一篇

user

DeepSeek双模型重磅开源 长文本与深度思考能力再突破

相关图文

Anthropic聘请IPO律师 加速推进上市进程

马斯克分享擎天柱跑步视频 人形机器人研发再提速

法国Mistral发布新AI模型 挑战OpenAI与谷歌

Mistral AI推出Mistral 3开源模型：128K上下文、单A100运行，价格仅为GPT-4o一半

众擎T800人形机器人发布 起售价18万元

黑五战报：Rufus成交率飙升，亚马逊AI助手成假日季转化引擎

热门资讯

30秒生成应用的AI助手来了！蚂蚁集团灵光App正式上线

告别复制粘贴！NotebookLM直接“读懂”文档，你只需动嘴，它来做PPT

从跑酷到叠衣：机器人行业为何集体放弃“炫技”？

2.2亿用户，115亿美元血亏：OpenAI的“万亿帝国”，是梦想还是泡沫？

Pokee AI：核心技术与生态资源驱动的AI Agent平民化浪潮

从六轴到七轴，不止多一轴：松灵NERO发布，开启机器人精细操作新篇章

快讯

均普智能回应募投延期及场地出租 重启10亿元定增布局机器人领域

大厂布局养龙虾产业 腾讯小米纷纷涉足背后有何考量

AI助力养龙虾热潮 腾讯小米布局上门安装服务

OpenClaw爆火引热议，不同群体以独特方式参与安装热潮

刘忠军教授：推动创新医疗技术在AI领域的应用

李萌：人形机器人何时迎来"iPhone时刻"？智能玩具或成新兴大产业

帕西尼再获超10亿融资 估值突破百亿 以全球唯一百亿级实采全模态数据重塑具身智能模型天花板

斯坦福李飞飞团队提出新框架 机器人可从错误中学习

西南科大爬壁机器人实现全角度翻转突破

穆南杉提出人类AI智能体生命进化理论

推荐专栏

爱力方

机器人大讲堂

下一篇

DeepSeek双模型重磅开源长文本与深度思考能力再突破

Anthropic聘请IPO律师加速推进上市进程

马斯克分享擎天柱跑步视频人形机器人研发再提速

法国Mistral发布新AI模型挑战OpenAI与谷歌

众擎T800人形机器人发布起售价18万元

均普智能回应募投延期及场地出租重启10亿元定增布局机器人领域

大厂布局养龙虾产业腾讯小米纷纷涉足背后有何考量

AI助力养龙虾热潮腾讯小米布局上门安装服务

帕西尼再获超10亿融资估值突破百亿以全球唯一百亿级实采全模态数据重塑具身智能模型天花板

斯坦福李飞飞团队提出新框架机器人可从错误中学习