腾讯清华联手推出SongGeneration 2 音素错误率仅8.55%

2026年03月10日 10:32

本文共计932个字，预计阅读时长4分钟。

来源/aibase 责编/爱力方

AI 音乐赛道在2026年初迎来了又一次震撼余震。3月9日，由腾讯与清华大学人机语音交互实验室联合研发的音乐基础模型 SongGeneration2 正式面世。这款模型不仅在技术架构上实现了质的飞跃，更在多个核心维度上直接“断崖式领先”目前主流的开源模型，甚至在整体质量上完成了对顶级商业模型的正面硬刚。

三大突破:让 AI 音乐不再有“塑料感”

SongGeneration2的核心优越性源于其底层架构的全面升级，主要解决了过往 AI 音乐的三大痛点:

高音乐性: 不同于简单的旋律叠加，该模型能处理复杂的多轨编曲，空间层次感极强。
高歌词准确性: 咬字不清、幻觉跑调成了过去式。其音素错误率（PER）仅为 8.55%，这一数据显著优于顶级商业模型Suno v5（12.4%），仅次于MiniMax2.5。
极强可控性: 无论是文本描述还是音频提示，它都能精准遵循，深度定制风格与情绪。

“双核”驱动:LLM 与扩散模型的梦幻联动

在架构设计上，SongGeneration2采用了创新的混合式 LLM-扩散架构:

作曲大脑（LeLM）: 负责规划全局结构与演唱细节，解决“怎么唱”的问题。
高保真渲染器（Diffusion）: 在语言模型的指导下，合成极其复杂的声学细节。
分层表征: 首创混合表征与多轨表征并行建模，兼顾了旋律的稳定性与音质的细腻度。

真开源、低门槛:普通电脑也能“写歌”

最令开发者振奋的是，腾讯此次展现了极大的开源诚意。拥有4B 参数的 SongGeneration-v2-large 模型已正式开源，支持中英等多语种生成。令人惊讶的是，它在配备 22GB 显存 的消费级硬件上即可流畅运行，实现了本地化、私密化创作的可能。

为了让用户即刻体验，项目组还在 HuggingFace 推出了 SongGeneration-v2-Fast 版本，牺牲极小部分音质以换取极速生成——一分钟内即可诞生一首完整单曲。

从SongGeneration2的表现来看，AI 音乐已经从“极客玩具”正式跨入“商业级应用”的大门。随着未来支持12G 显存的 Medium 模型及自动化评估框架的开源，全民“作曲家”的时代或许真的不再遥远。

来源：Suno 压力大了！腾讯联手清华发布 SongGeneration 2，音素错误率低至 8.55% | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表A³·爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

通知

尊敬的用户

user

资讯

腾讯清华联手推出SongGeneration 2 音素错误率仅8.55%

腾讯清华联手推出SongGeneration 2 音素错误率仅8.55%

相关图文

腾讯小龙虾首日流量爆表团队紧急扩容致歉补偿

腾讯推出WorkBuddy智能体兼容OpenClaw可切换多模型

腾讯QClaw内测启动一键部署OpenClaw接入微信QQ

腾讯推出全新小龙虾产品

腾讯内测QClaw一键启动包微信QQ双端接入OpenClaw

AI音乐迎马斯克时刻：Suno v5携手Lyria3引爆全场，全链路智能生产开启打工人创意更稳

热门资讯

豆包亮相春晚送出超10万份科技礼品及8888元现金红包

微软研究高温超导技术破解数据中心供电难题

美国一家人形机器人企业突发倒闭

海外推特热议，冯骥惊叹“庆幸Seedance是中国的AI”

字节跳动发布Seedance 2.0，Tim揭露AI训练黑盒

LaST₀：赋予机器人物理直觉，摆脱语言依赖像人类思考动作

快讯

微软CEO纳德拉：AI不可怕拒绝学习才危险

腾讯WorkBuddy上线 1分钟连接企微智能体大战升级桌面端

中国主导制定11项新能源汽车国际标准

短剧行业剧变真人制作保底取消 AI产能激增千倍

AI大模型落地潮来袭小天互连助力企业高效办公

Anthropic推出代码审查工具应对AI编程泛滥问题

低空经济与人形机器人爆发电池需求或迎风口

企业家畅谈AI赋能千行百业智能经济新形态崛起

AI成企业差评降温剂有效缓解情绪化公关

奇瑞孚祯投资管理中心申请注销

推荐专栏

爱力方

机器人大讲堂

下一篇

user

资讯

腾讯清华联手推出SongGeneration 2 音素错误率仅8.55%

腾讯清华联手推出SongGeneration 2 音素错误率仅8.55%

相关图文

腾讯小龙虾首日流量爆表 团队紧急扩容致歉补偿

腾讯推出WorkBuddy智能体 兼容OpenClaw可切换多模型

腾讯QClaw内测启动 一键部署OpenClaw接入微信QQ

腾讯推出全新小龙虾产品

腾讯内测QClaw一键启动包 微信QQ双端接入OpenClaw

AI音乐迎马斯克时刻：Suno v5携手Lyria3引爆全场，全链路智能生产开启打工人创意更稳

热门资讯

豆包亮相春晚 送出超10万份科技礼品及8888元现金红包

微软研究高温超导技术破解数据中心供电难题

美国一家人形机器人企业突发倒闭

海外推特热议，冯骥惊叹“庆幸Seedance是中国的AI”

字节跳动发布Seedance 2.0，Tim揭露AI训练黑盒

LaST₀：赋予机器人物理直觉，摆脱语言依赖像人类思考动作

快讯

微软CEO纳德拉：AI不可怕 拒绝学习才危险

腾讯WorkBuddy上线 1分钟连接企微 智能体大战升级桌面端

中国主导制定11项新能源汽车国际标准

短剧行业剧变 真人制作保底取消 AI产能激增千倍

AI大模型落地潮来袭 小天互连助力企业高效办公

Anthropic推出代码审查工具 应对AI编程泛滥问题

低空经济与人形机器人爆发 电池需求或迎风口

企业家畅谈AI赋能千行百业 智能经济新形态崛起

AI成企业差评降温剂 有效缓解情绪化公关

奇瑞孚祯投资管理中心申请注销

推荐专栏

爱力方

机器人大讲堂

下一篇

腾讯小龙虾首日流量爆表团队紧急扩容致歉补偿

腾讯推出WorkBuddy智能体兼容OpenClaw可切换多模型

腾讯QClaw内测启动一键部署OpenClaw接入微信QQ

腾讯内测QClaw一键启动包微信QQ双端接入OpenClaw

豆包亮相春晚送出超10万份科技礼品及8888元现金红包

微软CEO纳德拉：AI不可怕拒绝学习才危险

腾讯WorkBuddy上线 1分钟连接企微智能体大战升级桌面端

短剧行业剧变真人制作保底取消 AI产能激增千倍

AI大模型落地潮来袭小天互连助力企业高效办公

Anthropic推出代码审查工具应对AI编程泛滥问题

低空经济与人形机器人爆发电池需求或迎风口

企业家畅谈AI赋能千行百业智能经济新形态崛起

AI成企业差评降温剂有效缓解情绪化公关