阿里Qwen3-TTS发布：49种音色支持10语9方言，准确率超越主流商用模型-A³·爱力方

阿里Qwen3-TTS发布：49种音色支持10语9方言，准确率超越主流商用模型

2025年12月08日 15:00

本文共计924个字，预计阅读时长4分钟。

来源/aibase 责编/爱力方

阿里巴巴正式推出 Qwen3家族最新成员 Qwen3-TTS，主打“零样本、多角色、跨语言”语音合成。新模型在词错误率（WER）国际基准上显著优于主流商用引擎，同步上线阿里云控制台，开发者可0元调用100万字符额度。

49种高品质音色，一键切换角色

从温柔少女到方言大叔，Qwen3-TTS 内置49种官方音色，覆盖旁白、客服、直播、教育等场景;支持10种语言 +9种中国方言（粤语、四川话、东北话等），同一文本可秒级切换音色，无需重新训练。

文本→语气→节奏，全自动“拟人化”

模型采用自回归声学模型 + 韵律预测模块，可根据标点、情感标签自动升降调、插入停顿;在48kHz 采样率下，MOS 得分达4.53，显著高于行业平均4.1。

WER 显著优于商用模型

在多语言语音合成公开测试集（MLS + Common Voice）上，Qwen3-TTS 英文 WER 降至2.8%，中文1.9%，较 Azure TTS 再降18% 与24%，刷新开源 SOTA。

教育场景“零样本”落地

阿里云同步发布“一键朗读”插件，教师上传 PPT 即可自动生成带方言的讲解音频，目前已在上海120所中小学试点，帮助学生用“家乡话”听写单词。

定价与入口

- 免费层:100万字符/月，49种音色不限调用

- 付费层:0.8元/万字符，支持 SSML 与实时流式合成

- 控制台:console.aliyun.com → 人工智能 → 语音合成 → Qwen3-TTS（已全量）

下一步计划

阿里透露，2025Q1将开放“10秒音色克隆”接口，用户上传短音频即可生成私有说话人，并推出80kHz 超采样版本，瞄准播客、有声书与虚拟偶像市场。

行业观察

TTS 赛道正从“可听懂”走向“可角色化”。Qwen3-TTS 用开源+低价组合冲击 Azure、AWS 商用池，同时给直播、客服、教育三大场景提供“零样本”落地路径。伴随克隆音色与超采样版本发布，语音生成或将进入“人人都能配旁白”的新阶段。AIbase 将持续跟踪其克隆接口开放进度与商用案例。

项目地址：https://modelscope.cn/studios/Qwen/Qwen3-TTS-Demo

来源：“开口即角色”！阿里 Qwen3-TTS 登场：49 种音色 + 10 语言 9 方言，WER 碾压主流商用模型 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表A³·爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

通知

尊敬的用户

user

阿里Qwen3-TTS发布：49种音色支持10语9方言，准确率超越主流商用模型

相关图文

人形机器人概念持续走强五洲新春强势封板

伊利亚·苏茨克韦：AI的强力推手与深刻反思者

Meta AI与全球八家媒体合作实现新闻实时推送与导流

当“铁锈地带”，开始，梦想“钢铁侠”：一场由“国家意志”驱动的、针对“机器人主权”的终极豪赌

AI视频的“第三条道路”：当苹果STARFlow-V，用“归一化流”，向Sora与Veo，发起“非对称”攻击

DeepMind CEO展望2026年AI三大趋势

热门资讯

30秒生成应用的AI助手来了！蚂蚁集团灵光App正式上线

告别复制粘贴！NotebookLM直接“读懂”文档，你只需动嘴，它来做PPT

从跑酷到叠衣：机器人行业为何集体放弃“炫技”？

2.2亿用户，115亿美元血亏：OpenAI的“万亿帝国”，是梦想还是泡沫？

从六轴到七轴，不止多一轴：松灵NERO发布，开启机器人精细操作新篇章

Meta发布Omnilingual ASR系统：实现1600种语言的语音识别

快讯

荣耀CEO李健详解人形机器人三大消费场景：购物协助、工作检查与陪伴

英伟达ABB合作开发AI工业机器人

朱啸虎李开复等投资人分享OpenClaw创业关键策略

光互联成市场焦点 GTC+OFC下周开幕美银推荐相关股票

银行缘何对OpenClaw"AI小龙虾"避而远之

全球第二大车企CEO预警：利润暴跌50% 拟裁员超5万

退役新能源车电池如何变废为宝

科创板晚报：优刻得云主机未成规模微芯生物拟1.2亿回购

信通院启动智能体测评 OpenClaw受关注数据隐私安全成重点

智能家居觉醒 Matter协议推动主动智能时代

推荐专栏

爱力方

机器人大讲堂

下一篇

user

阿里Qwen3-TTS发布：49种音色支持10语9方言，准确率超越主流商用模型

相关图文

人形机器人概念持续走强 五洲新春强势封板

伊利亚·苏茨克韦：AI的强力推手与深刻反思者

Meta AI与全球八家媒体合作 实现新闻实时推送与导流

当“铁锈地带”，开始，梦想“钢铁侠”：一场由“国家意志”驱动的、针对“机器人主权”的终极豪赌

AI视频的“第三条道路”：当苹果STARFlow-V，用“归一化流”，向Sora与Veo，发起“非对称”攻击

DeepMind CEO展望2026年AI三大趋势

热门资讯

30秒生成应用的AI助手来了！蚂蚁集团灵光App正式上线

告别复制粘贴！NotebookLM直接“读懂”文档，你只需动嘴，它来做PPT

从跑酷到叠衣：机器人行业为何集体放弃“炫技”？

2.2亿用户，115亿美元血亏：OpenAI的“万亿帝国”，是梦想还是泡沫？

从六轴到七轴，不止多一轴：松灵NERO发布，开启机器人精细操作新篇章

Meta发布Omnilingual ASR系统：实现1600种语言的语音识别

快讯

荣耀CEO李健详解人形机器人三大消费场景：购物协助、工作检查与陪伴

英伟达ABB合作开发AI工业机器人

朱啸虎李开复等投资人分享OpenClaw创业关键策略

光互联成市场焦点 GTC+OFC下周开幕 美银推荐相关股票

银行缘何对OpenClaw"AI小龙虾"避而远之

全球第二大车企CEO预警：利润暴跌50% 拟裁员超5万

退役新能源车电池如何变废为宝

科创板晚报：优刻得云主机未成规模 微芯生物拟1.2亿回购

信通院启动智能体测评 OpenClaw受关注 数据隐私安全成重点

智能家居觉醒 Matter协议推动主动智能时代

推荐专栏

爱力方

机器人大讲堂

下一篇

人形机器人概念持续走强五洲新春强势封板

Meta AI与全球八家媒体合作实现新闻实时推送与导流

光互联成市场焦点 GTC+OFC下周开幕美银推荐相关股票

科创板晚报：优刻得云主机未成规模微芯生物拟1.2亿回购

信通院启动智能体测评 OpenClaw受关注数据隐私安全成重点