字节发布InfinityStar框架:视频生成效率提升至58秒

字节发布InfinityStar框架:视频生成效率提升至58秒

2025年11月12日 11:20
本文共计296个字,预计阅读时长1分钟。
来源/互联网 责编/爱力方

字节跳动发布InfinityStar框架。5秒720p视频生成时间降至58秒。统一的架构同时支持图像生成、文本生成视频和视频续写。

image.png
传统模型将视频视为3D数据块。InfinityStar采用时空金字塔模型。空间尺度与时间维度被显式分离。外观信息与动态运动信息实现解耦。

image.png
预训练的变分自编码器成为知识基础。新模型通过继承策略获取视频特征。训练时间缩短。计算资源消耗下降。

测试结果显示视觉质量保持稳定。生成速度突破现有技术瓶颈。长视频生成的技术路径开始显现。多样化任务处理的可能性正在打开。

github:https://github.com/FoundationVision/InfinityStar

声明:本文来自互联网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯