资讯

Hume AI开源TADA模型手机端可流畅运行700秒长音频

2026年03月12日 14:49

本文共计745个字，预计阅读时长3分钟。

来源/aibase 责编/爱力方

Hume AI近日开源发布了其最新语音生成模型TADA（Text-Acoustic Dual Alignment），这是一款基于大语言模型的文本转语音(TTS)系统，采用创新的文本-声学双对齐架构，显著提升了生成效率、可靠性和适用场景。

据官方介绍，TADA通过将文本token与声学表示实现1:1严格同步，彻底解决了传统LLM-based TTS系统中常见的token级内容幻觉（hallucination）问题。在超过1000个测试样本的评估中，该模型实现了零内容幻觉的表现。

在性能方面，TADA的生成速度比同级别LLM TTS系统快5倍以上，同时资源消耗极低:每秒音频仅需2-3帧计算资源，而传统方案通常需要12.5至75帧。这使得模型能够在手机、边缘设备等低功耗硬件上实现本地推理，无需依赖云端服务器。

TADA支持包括中文在内的多种语言（多语言版本基于Llama3.23B参数规模），并提供1B(主要针对英语)和3B多语言预训练模型。模型采用2048token的上下文窗口，能够一次性生成约700秒的连续音频，远超传统方案在相同token限制下仅能支持约70秒的水平。

另一项重要创新是同步转录功能:模型在生成语音的同时直接输出对应文本转录，无需额外运行独立的语音识别（ASR）流程，从而实现零额外延迟的文字输出。这一特性对于实时字幕、语音交互和内容创作等应用具有显著价值。

在人类主观评测中，TADA的自然度和音色相似度排名位居第二，超越了多个参数规模更大、训练数据更多的系统，展现出极具竞争力的语音质量。

地址：https://huggingface.co/collections/HumeAI/tada

来源：Hume AI开源TADA：5倍速零幻觉TTS，能在手机上跑700秒长音频 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表A³·爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

TAGS: TTS模型开源项目语音生成多语言支持边缘计算

热门资讯

豆包亮相春晚送出超10万份科技礼品及8888元现金红包

匿名

2026-02-10

·

5234 浏览
微软研究高温超导技术破解数据中心供电难题

匿名

2026-02-11

·

1327 浏览
美国一家人形机器人企业突发倒闭

机器人大讲堂

2026-02-11

·

1252 浏览
海外推特热议，冯骥惊叹“庆幸Seedance是中国的AI”

匿名

2026-02-10

·

1000 浏览
顶级风投布局AI虚拟人与实时互动影像生成赛道

匿名

2026-02-10

·

96 浏览
Notion 集成 MiniMax M2.5 打造高性价比 AI 办公生态

匿名

2026-03-02

·

94 浏览

通知

尊敬的用户

user

资讯

Hume AI开源TADA模型手机端可流畅运行700秒长音频

相关图文

OpenClaw助推算力券走红代表委员呼吁构建算力生态

无锡高新区出台12条新政力挺OpenClaw 最高补贴500万

OpenClaw创始人澄清未入驻中文社交媒体引发大模型圈关注

OpenClaw登顶GitHub星榜 2026年或成AI智能体元年

人形机器人智能大脑进化路径

谷歌AI虚拟形象支持24种语言打破语言障碍

热门资讯

豆包亮相春晚送出超10万份科技礼品及8888元现金红包

微软研究高温超导技术破解数据中心供电难题

美国一家人形机器人企业突发倒闭

海外推特热议，冯骥惊叹“庆幸Seedance是中国的AI”

顶级风投布局AI虚拟人与实时互动影像生成赛道

Notion 集成 MiniMax M2.5 打造高性价比 AI 办公生态

快讯

普通人养龙虾需先升级内存

港股恒生科技持续回调智谱重挫9% 汽车股逆市上扬

理想汽车2025年营收1123亿降22% 净利11亿暴跌86%

AI干预中东局势引忧虑美国会敦促强化监管

COFE+第六代咖啡机器人进驻香港大学轻店模式革新校园消费

八大VLM操控机器人实测：Gemini登顶 GPT-5.2全败三大缺陷曝光

小天互连AI助手升级合同审核功能提升效率告别人工

NVIDIA开源大模型Nemotron 3 Super性能媲美GPT-5.4

中国具身智能大模型A1机器人斩获吉尼斯世界纪录

腾讯回应数据抓取争议：本地镜像定位分担99%流量

推荐专栏

爱力方

机器人大讲堂

下一篇

user

资讯

Hume AI开源TADA模型 手机端可流畅运行700秒长音频

相关图文

OpenClaw助推算力券走红 代表委员呼吁构建算力生态

无锡高新区出台12条新政力挺OpenClaw 最高补贴500万

OpenClaw创始人澄清未入驻中文社交媒体 引发大模型圈关注

OpenClaw登顶GitHub星榜 2026年或成AI智能体元年

人形机器人智能大脑进化路径

谷歌AI虚拟形象支持24种语言打破语言障碍

热门资讯

豆包亮相春晚 送出超10万份科技礼品及8888元现金红包

微软研究高温超导技术破解数据中心供电难题

美国一家人形机器人企业突发倒闭

海外推特热议，冯骥惊叹“庆幸Seedance是中国的AI”

顶级风投布局AI虚拟人与实时互动影像生成赛道

Notion 集成 MiniMax M2.5 打造高性价比 AI 办公生态

快讯

普通人养龙虾需先升级内存

港股恒生科技持续回调 智谱重挫9% 汽车股逆市上扬

理想汽车2025年营收1123亿降22% 净利11亿暴跌86%

AI干预中东局势引忧虑 美国会敦促强化监管

COFE+第六代咖啡机器人进驻香港大学 轻店模式革新校园消费

八大VLM操控机器人实测：Gemini登顶 GPT-5.2全败 三大缺陷曝光

小天互连AI助手升级合同审核功能 提升效率告别人工

NVIDIA开源大模型Nemotron 3 Super性能媲美GPT-5.4

中国具身智能大模型A1机器人斩获吉尼斯世界纪录

腾讯回应数据抓取争议：本地镜像定位分担99%流量

推荐专栏

爱力方

机器人大讲堂

下一篇

Hume AI开源TADA模型手机端可流畅运行700秒长音频

OpenClaw助推算力券走红代表委员呼吁构建算力生态

OpenClaw创始人澄清未入驻中文社交媒体引发大模型圈关注

豆包亮相春晚送出超10万份科技礼品及8888元现金红包

港股恒生科技持续回调智谱重挫9% 汽车股逆市上扬

AI干预中东局势引忧虑美国会敦促强化监管

COFE+第六代咖啡机器人进驻香港大学轻店模式革新校园消费

八大VLM操控机器人实测：Gemini登顶 GPT-5.2全败三大缺陷曝光

小天互连AI助手升级合同审核功能提升效率告别人工