谷歌Veo 3.1全面升级:多图一致、原生竖版、4K超分

谷歌Veo 3.1全面升级:多图一致、原生竖版、4K超分

爱力方

爱力方

2026年01月16日 16:14
本文共计1551个字,预计阅读时长6分钟。
来源/爱力方 责编/爱力方

这或许是人工智能视频生成领域,自诞生以来,距离“真正可用”最近的一次。近日,当Google DeepMind为其旗舰视频模型Veo 3.1,推出一系列重大迭代更新时,一个长期以来困扰着所有创作者的、关于“一致性”与“实用性”的噩梦,正被系统性地终结。

这并非又一次在生成时长或视觉效果上的浅层优化。它是一次深刻的、直击行业核心痛点的“范式级”跃迁。通过对其“Ingredients to Video”(多图参考生视频)功能的全面进化,并历史性地加入了原生竖版输出与专业级4K超分能力,谷歌正试图将Veo,从一个只能生成惊艳“片段”的“技术玩具”,历史性地,提升为一个能够被信赖、被深度集成到真实工作流中的“生产力工具”。

“多图参考”的进化:一场对“失忆症”的终极治愈

AI视频生成最大的“原罪”,在于其跨镜头的“失忆症”。前一个镜头里的主角,在下一个镜头里可能就换了一张脸;精心设计的物体,也可能在转场后“变异”。这种“一致性”的缺失,是所有叙事性创作的“天敌”。

QQ20260116-111828.jpg

而Veo 3.1的“Ingredients to Video”功能的全面进化,正是对这场“失忆症”的一次终极治愈。

该功能允许用户上传最多三张独立的参考图像——可以是一张人物肖像,一张背景照片,一张特定的物体或纹理贴图——并结合一句简短的提示词,来“指导”AI生成动态视频。

最新的更新,将这种“指导”的精确性,提升到了一个前所未有的高度:

  • 角色的身份,可以在完全不同的场景和动作中,保持稳定不变。

  • 物体的形态、背景的风格、材质的纹理,都可以在多个镜头间,被无缝地、一致地复用。

这意味着,创作者终于可以真正地,去实现“让同一个主角,在多个不同的场景中,演绎一段连贯的故事”这种最基础、也最重要的叙事需求。创作的自由度与最终成片的专业感,因此得到了同步的、爆炸性的跃升。

原生竖版 + 4K超分:一场对“工作流”的深刻尊重

如果说“一致性”的解决,是让AI视频“能用”,那么原生竖版输出与4K超分能力的加入,则是让它真正变得“好用”的关键一步。

首先,是原生9:16竖版输出。

这是一个看似微小、实则极具洞察力的功能。它深刻地,体现了谷歌对当前“移动优先”内容生态的尊重。

创作者不再需要将AI生成的横版视频,进行尴尬的后期裁剪或拉伸,从而导致画质损失与构图破坏。Veo 3.1可以直接生成完美适配YouTube Shorts、TikTok、Instagram Reels等主流短视频平台的、全屏无损的竖版内容。这极大地简化了工作流,为短视频创作者,节省了宝贵的时间。

其次,是专业级的画质飞跃。

模型的基础生成分辨率已提升至720p,但通过谷歌先进的超分辨率技术,用户可以一步到位地,获得更清晰的1088p版本(官方称其“锐利干净,适合剪辑后期”),乃至全新的、令人惊叹的4K分辨率版本。

4K输出,意味着AI生成的视频素材,已不再仅仅是满足于在手机屏幕上观看的“快消品”。它已经具备了在大屏幕上播放、甚至被用于更高保真度专业制作的潜力。

远瞻:从“实验”到“商用”的最后一跃

爱力方的点评:Veo 3.1,精准地、一次性地,击中了AI视频创作的两大核心痛点——一致性与适配性。

当一个AI视频工具,能够同时保证“人物/物体稳定不变”、“原生适配短视频”、“输出专业级4K画质”时,它便已经完成了从“实验阶段”到“商用门槛”的、最关键的最后一跃。

目前,这项强大的“素材生视频”功能,已在Flow平台中,通过Veo 3.1-Fast模型,向用户提供快速生成体验;而广大的普通用户,则可以通过订阅Gemini app的Plus/Pro/Ultra服务,立即上手体验。

这标志着,AI视频创作,正从过去那个充满不确定性、需要大量“开盲盒”式尝试的“魔法时代”,正式进入一个更可控、更可靠、更专业的“工业时代”。

声明:本文来自爱力方,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯