Character AI联合耶鲁大学发布Ovi：实现音画同步的视频生成模型

2025年11月14日 10:53

本文共计370个字，预计阅读时长2分钟。

来源/互联网责编/爱力方

Character AI与耶鲁大学研究团队发布了开源项目Ovi。这项音画同步视频生成技术重新定义了多媒体内容的创作边界。

双骨干交叉模态融合架构将音频与视频置于同等地位。两个模态在扩散过程中持续交换信息。传统流程中先后生成的模式被彻底颠覆。

两个功能对称的分支采用相同的扩散变换器架构。音频流与视频流在潜在空间直接交互。参数共享机制消除了冗余计算。嘴唇运动与声波振动的对应关系通过实时对齐实现。

旋转位置嵌入技术解决了时序对齐难题。数学缩放公式使音视频时间步长达成精确映射。统一的文本提示策略同时引导两个模态的生成方向。

训练数据经过多层筛选与增强处理。音视频对数据集与纯音频库形成互补。数据管道的严谨设计反映在生成样本的保真度上。

github:https://github.com/character-ai/Ovi 开源协议允许开发者访问完整代码库。

声明：本文来自互联网，版权归作者所有。文章内容仅代表作者独立观点，不代表A³·爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

TAGS: 音画同步视频生成人工智能开源技术多媒体处理

热门资讯

《Sci.Robot.》顶刊发表浙大陈柳青团队提出“机器人同伴有效失败教学法”让学习效率更高！

2025-10-19

·

78 浏览
我国机器人产量居全球首位

2025-10-20

·

49 浏览
Pokee AI：核心技术与生态资源驱动的AI Agent平民化浪潮

2025-11-04

·

40 浏览
MPS 人形机器人解决方案 “芯片+算法+系统”三位一体的创新驱控

2025-10-22

·

35 浏览
人形机器人IRON发布：从实验室原型到商业场景的技术跃迁

2025-11-06

·

35 浏览
Meta发布Omnilingual ASR系统：实现1600种语言的语音识别

2025-11-11

·

34 浏览

0 浏览

通知

尊敬的用户

user

Character AI联合耶鲁大学发布Ovi：实现音画同步的视频生成模型

相关图文

这可能是AI圈最贵的一次离职：200亿美元“世界模型”路线的存亡时刻

30秒生成应用的AI助手来了！蚂蚁集团灵光App正式上线

贝索斯神秘AI公司携62亿美元归来，一场针对“物理世界”的AI豪赌

灵渠OS机器人操作系统将于年底开源

地瓜机器人与傅利叶智能正式达成战略合作

全球数据中心投资飙升，绿色能源将成主流?

热门资讯

《Sci.Robot.》顶刊发表浙大陈柳青团队提出“机器人同伴有效失败教学法”让学习效率更高！

我国机器人产量居全球首位

Pokee AI：核心技术与生态资源驱动的AI Agent平民化浪潮

MPS 人形机器人解决方案 “芯片+算法+系统”三位一体的创新驱控

人形机器人IRON发布：从实验室原型到商业场景的技术跃迁

Meta发布Omnilingual ASR系统：实现1600种语言的语音识别

快讯

消费者购车洽谈遭录音奥迪门店称厂家要求折射经销商返利考核压力

2026年大模型GEO优化服务商标杆企业推荐精选

马云谈AI时代胜负关键：不在芯片在心跳阿里核心高管齐聚云谷论教育

2026年GEO优化服务商Top3推荐：商家AI搜索流量布局指南

中国AI产品创新提速美图RoboNeo登顶巴西App Store分类榜

全国人大代表吴丰礼：建议试点粤港澳大湾区AI制度创新，夯实具身智能工业数据基建

头部酒企新春首课聚焦AI：不转型就出局

千问持续投入AI办事春节完成2亿笔真实订单

追觅科技在浙江新设智能科技公司，注册资本2000万元

霍尔木兹海峡受阻丰田被迫减产4万辆汽车

推荐专栏

爱力方

机器人大讲堂

下一篇

user

Character AI联合耶鲁大学发布Ovi：实现音画同步的视频生成模型

相关图文

这可能是AI圈最贵的一次离职：200亿美元“世界模型”路线的存亡时刻

30秒生成应用的AI助手来了！蚂蚁集团灵光App正式上线

贝索斯神秘AI公司携62亿美元归来，一场针对“物理世界”的AI豪赌

灵渠OS机器人操作系统将于年底开源

地瓜机器人与傅利叶智能正式达成战略合作

全球数据中心投资飙升，绿色能源将成主流?

热门资讯

《Sci.Robot.》顶刊发表浙大陈柳青团队提出“机器人同伴有效失败教学法”让学习效率更高！

我国机器人产量居全球首位

Pokee AI：核心技术与生态资源驱动的AI Agent平民化浪潮

MPS 人形机器人解决方案 “芯片+算法+系统”三位一体的创新驱控

人形机器人IRON发布：从实验室原型到商业场景的技术跃迁

Meta发布Omnilingual ASR系统：实现1600种语言的语音识别

快讯

消费者购车洽谈遭录音 奥迪门店称厂家要求 折射经销商返利考核压力

2026年大模型GEO优化服务商标杆企业推荐精选

马云谈AI时代胜负关键：不在芯片在心跳 阿里核心高管齐聚云谷论教育

2026年GEO优化服务商Top3推荐：商家AI搜索流量布局指南

中国AI产品创新提速 美图RoboNeo登顶巴西App Store分类榜

全国人大代表吴丰礼：建议试点粤港澳大湾区AI制度创新，夯实具身智能工业数据基建

头部酒企新春首课聚焦AI：不转型就出局

千问持续投入AI办事 春节完成2亿笔真实订单

追觅科技在浙江新设智能科技公司，注册资本2000万元

霍尔木兹海峡受阻 丰田被迫减产4万辆汽车

推荐专栏

爱力方

机器人大讲堂

下一篇

消费者购车洽谈遭录音奥迪门店称厂家要求折射经销商返利考核压力

马云谈AI时代胜负关键：不在芯片在心跳阿里核心高管齐聚云谷论教育

中国AI产品创新提速美图RoboNeo登顶巴西App Store分类榜

千问持续投入AI办事春节完成2亿笔真实订单

霍尔木兹海峡受阻丰田被迫减产4万辆汽车