英伟达(NVIDIA)在AI大模型领域再次投下震撼弹。3月12日,英伟达正式发布了专为AI智能体(Agent)设计的新一代开源大模型——Nemotron3Super。该模型凭借极高的推理效率和卓越的任务成功率,迅速成为开源社区的焦点。
架构革新:推理速度暴增300%
Nemotron3Super采用了创新的 Mamba-MoE 混合架构,参数总量为1200亿,激活参数仅为120亿。这种设计让其在保持强大性能的同时,推理速度提升了3倍,吞吐量更是暴涨5倍。此外,该模型支持高达1M 的超长上下文,有效解决了多智能体协同中常见的“目标跑偏”和“上下文爆炸”问题。

实力刷榜:开源界的“性能天花板”
在多项权威测评中,Nemotron3Super表现抢眼。它不仅登顶了 Artificial Analysis 的效率与开放性榜单,更驱动英伟达自研的 AI-Q 智能体在 DeepResearch Bench 双榜位列第一。值得注意的是,该模型在热门智能体任务 OpenClaw 中的成功率高达85.6%,表现已逼近闭源大模型 Claude Opus4.6和 GPT-5.4。
适配“黑格尔”平台:支持NVFP4训练
为了充分发挥自研硬件的优势,Nemotron3Super除了支持 BF16和 FP8格式外,还专门针对英伟达最新的 Blackwell 平台及后续架构支持了 NVFP4训练。这一特性将进一步降低大模型的训练成本并提升算力利用率。
生态联动:大厂集体集成
目前,Nemotron3Super已被 Perplexity、Palantir、西门子及戴尔等多家科技巨头集成,并同步上线 AWS、Azure 和 Google Cloud 等主流云平台。作为一款开源免费的模型,它为开发者提供了一个低成本、高性能的替代方案,极大地冲击了当前闭源大模型的市场格局。