资讯

通义实验室发布PrismAudio：让AI听懂视频实现智能配音告别声画分离

2026年03月24日 16:59

本文共计777个字，预计阅读时长3分钟。

来源/aibase 责编/爱力方

在 AI 视频生成大火的当下，“有画无声”或“声不对位”一直是影响沉浸感的最后一道屏障。针对这一痛点，阿里通义实验室近期推出了全新的视频生成音频（Video-to-Audio）框架——PrismAudio。该研究已被顶级 AI 会议 ICLR2026收录，核心旨在为视频自动配上严丝合缝的环境音效。

先思考再发声:引入“思维链”的配音大师

传统的配音模型通常是“直觉式”生成，容易出现马蹄落在地上却发出鸟叫，或者声音比画面慢半拍的尴尬情况。PrismAudio 的突破在于它学会了“先写笔记，再发声”。

分解式思维链: 模型在生成声音前，会先分析视频内容:画面里有什么?声音何时开始?音质是清脆还是低沉?声源在左还是在右?
四重老师打分: 为了确保质量，研发团队引入了强化学习，由四位“虚拟老师”从语义一致性、时序同步性、美学质量和空间准确性四个维度同时打分。这种多维度的反馈机制，解决了以往模型“顾此失彼”的顽疾。

轻量且高效:9秒视频配音仅需0.6秒

除了听得准，PrismAudio 还跑得极快。得益于自研的 Fast-GRPO 高效训练算法，该模型在性能跨越式提升的同时，保持了极高的运行效率:

小身材大能量: 模型参数仅为5.18亿，远低于动辄数十亿参数的同类模型。
极速响应: 生成一段9秒的高质量音频仅需 0.63秒，几乎做到了“即传即得”。

行业观察:环境音效的“真”时代

PrismAudio 的出现，不仅为影视后期、短视频创作提供了强大的自动化工具，也为多目标生成任务提供了新的思路。当 AI 能够精准权衡声音的质感与空间感，未来的视频创作将真正实现“所见即所闻”。

论文地址:arXiv:2511.18833

开源地址:https://prismaudio-project.github.io/

来源：告别“声画两张皮”：通义实验室发布 PrismAudio，让 AI 听懂视频再配音 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表A³·爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

0

0

TAGS: AI配音视频生成音频同步 PrismAudio 通义实验室

相关图文

Seedance 2.0因版权纠纷受阻

Seedance 2.0因版权纠纷受阻

匿名

2026-03-19

阿里推出Fun-CineForge 首开电影级多模态配音大模型

阿里推出Fun-CineForge 首开电影级多模态配音大模型

匿名

2026-03-17

阿里通义开源影视级配音模型Fun-CineForge 解决音画同步问题

阿里通义开源影视级配音模型Fun-CineForge 解决音画同步问题

匿名

2026-03-16

通义开源首个影视级配音大模型 AI实现情感化语音

通义开源首个影视级配音大模型 AI实现情感化语音

匿名

2026-03-16

AI革新影视配音通义开源Fun-CineForge攻克多人对话

AI革新影视配音通义开源Fun-CineForge攻克多人对话

匿名

2026-03-16

OpenAI计划为ChatGPT整合视频生成工具Sora

OpenAI计划为ChatGPT整合视频生成工具Sora

匿名

2026-03-15

热门资讯

OpenClaw实测：文件丢失、搜索报错、发邮件卡死专家称尚不成熟

匿名

2026-02-24

·

216 浏览
AI数据中心需求激增东方电气股价飙升逾12%

匿名

2026-02-26

·

135 浏览
年薪百万缺人！具身智能企业掀起人才争夺战

匿名

2026-02-25

·

125 浏览
两会政策预期升温三月A股走向引关注

匿名

2026-02-28

·

110 浏览
2025人形机器人行业：330台新品亮相，融资达668亿元

匿名

2026-02-24

·

102 浏览
萌友智能携手环球影业IP 2026年AI陪伴赛道洗牌灵魂成突围关键

匿名

2026-03-17

·

99 浏览

快讯

SWTCHEnergy发布智能插座与灵活充电器完善电动汽车充电产品线

2026-03-25

·

0 浏览

金安智能：航天技术赋能具身智能，打造中国智造新标杆

2026-03-25

·

0 浏览

突发千亿存储芯片股签订15亿美元存储晶圆采购合同盘后公告集锦

2026-03-25

·

0 浏览

上任一年即换帅北京汽车80后董事长王昊离任张国富拟接任

2026-03-25

·

0 浏览

申报倒计时第三届LeadeRobot具身智能与人形机器人评选开放四大专业奖项及三大TOP50榜单

2026-03-24

·

0 浏览

13个传感器软手加持，康奈尔大学打造能看会摸采摘机器人登Nature子刊

2026-03-24

·

0 浏览

杭州西湖机器人发布泰坦o1 人机协作迈入身外化身时代

2026-03-24

·

0 浏览

龙虾点燃OPC热潮 AI智能体推动生产关系重塑

2026-03-24

·

0 浏览

复旦实验室回头客：协作机械臂凭实力常驻顶尖学府

2026-03-24

·

19 浏览

SK海力士传拟赴美上市募资最高100亿美元加码AI基建

2026-03-24

·

0 浏览

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读

机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台

关注爱力方，掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/

浙ICP备2025176963号-1

标签云 RSS订阅滚动资讯资讯排行

下一篇

已是最新内容。