DeepSeek V4与腾讯混元模型4月同步亮相

2026年03月16日 11:06
本文共计733个字,预计阅读时长3分钟。
来源/aibase 责编/爱力方

据《白鲸实验室》独家消息,备受期待的 DeepSeek V4 与姚顺雨新混元模型将于 2026 年 4 月正式发布。DeepSeek V4 是由梁文锋主导研发的多模态大模型,经过长期的打磨与提升,预计在代码能力和长期记忆方面都有显著进展。这一模型的发布与 DeepSeek 团队近年来的研究方向相符,尤其是在视觉内容处理和人工智能搜索能力上。

梁文锋的研究集中于 “条件记忆” 机制的探讨,他在 2026 年 1 月发布的论文《Conditional Memory via Scalable Lookup》中提出了相关理论。此外,2025 年 12 月,他又发表了《mHC: Manifold-Constrained Hyper-Connections》,进一步优化底层架构。这些研究旨在解决 Transformer 模型在记忆和训练稳定性上的不足。DeepSeek V4 不仅具备强大的多模态处理能力,还将深度适配国产芯片,力求成为第一个完全依赖国产算力的核心模型。

与此同时,姚顺雨的新混元模型也将在 4 月发布。姚顺雨自 2025 年 12 月起担任腾讯总办首席 AI 科学家,并同时负责 AI Infra 部门和大语言模型部。他在 2026 年 2 月发布的论文 CL-bench 提出了针对 “上下文学习” 的新评测基准,强调长上下文与 Agent 可用性的重要性。根据相关消息,姚顺雨的新模型将拥有约 30 亿个参数,且他的团队从一开始就重视模型的实际应用而非单纯的参数竞赛。

两者的发布不仅引发了市场的高度关注,也预示着中国在人工智能领域的快速发展。无论是 DeepSeek V4 的长期记忆能力,还是腾讯混元模型在真实任务评测方面的进展,都在努力回答未来大模型如何更好地适应生产环境的问题。

来源:报道称DeepSeek V4 与腾讯姚顺雨混元模型 4 月同步发布 | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯