在AI视频生成的这场、日益白热化的全球“军备竞赛”中,一场更为深刻的、关乎“记忆”与“一致性”的终极革命,正由中国的短视频巨头快手,悍然发动。
其旗下的可灵AI(Kling AI),近日,正式发布了一项,名为“主体库”(Subject Library)的、堪称“颠覆性”的全新功能。
这,并非又一次,在单条视频的生成质量或时长上的线性提升。
它,是一次深刻的、系统性的、旨在为AI视频大模型,植入一种“长期记忆”能力的范式革命。
其核心的目标,只有一个:
彻底地,终结那个,长期以来,一直困扰着所有AI视频创作者的、最核心、也最致命的“噩梦”——AI,记不住“脸”。

在过去,即便是使用最顶级的AI视频模型,当用户,试图,去创作一个,包含了多个不同镜头的、连贯的叙事短片时,他们,都必然会,面临一个,令人沮丧的“随机性”困境:
故事的主角,会在每一个新的镜头中,“随机地”,变成一张,全新的、陌生的“脸”。
而可灵的“主体库”,正是为了,从根本上,攻克这一行业性的顽疾,而诞生的。
其工作流程,被设计得,极其简单,却又无比强大:
-
上传与“记忆”:
-
用户,只需,上传一张,包含了其想要“记住”的核心角色的、任意角度的静态图片。
-
-
AI的“3D脑补”:
-
系统,会自动地,对这张2D的图片,进行智能的分析,并为其,“脑补”出其侧脸、背面、以及各种光照下的、缺失的局部细节,从而,在后台,为其,生成一个,可被用于多视角渲染的、隐式的3D数字资产。
-
-
“@”一下,一键调用:
-
在完成了“记忆”之后,用户,便可以在,任何一个新的、未来的视频生成任务中,通过,输入一个,类似于在社交媒体上“@”好友的、简单的指令——「@角色名」——来一键地,调用这个,被储存在“主体库”中的、独一无二的“数字身份”。
-

其结果,是一种,在“跨镜头一致性”上,前所未有的、革命性的飞跃。
官方宣称,在使用“主体库”功能后,其角色的主体一致性,可以高达96%以上。
这意味着,无论是,在不同的场景之间进行切换,还是,在不同的光照条件下进行表演,角色的面部特征、发型、乃至服饰的细节,都能够,保持惊人的一致。
“AI变脸”,这个,长期以来,一直将AI视频,禁锢在“单镜头素材”阶段的、最大的“技术枷LOCK”,被彻底地,砸开了。
而为了,让这种“调用”,变得更加智能和高效,可灵,还为其,配备了一套“AI智能描述”的功能。
-
系统,会自动地,从用户上传的图片中,提取出关于角色的“发色、服饰、风格”等关键的视觉特征,并为其,自动地,生成一段,60字以内的、精准的关键词描述。
-
实验显示,在使用,这种,由AI自己生成的、结构化的“智能描述”之后,其在复杂场景下的、一次性生成成功率,提升了27%,平均,为用户,节省了12分钟的、手动调整和优化提示词的时间。

爱力方的分析认为,可灵的这次“主体库”的发布,其战略意图,是清晰而极具侵略性的。
在一个,所有的竞争对手,都还在,疯狂地,内卷于“单条视频,能否,生成4K/60fps”的、“画质”的战争时,可灵,则以一种“四两拨千斤”的方式,极其精明地,将整个战场,拉升到了一个,全新的、也可能更具商业价值的维度——“跨镜头的、叙事的一致性”。
这,相当于,为每一个AI视频的创作者,都配备了一颗,可以被无限复用的“数字记忆芯片”。
这场“记忆”革命,其可能带来的行业冲击,是巨大而深远的:
-
对于影视行业: 制片方,可以用“主体库”,在前期,就锁定主角的数字造型,然后,快速地,去生成各种不同场景下的、动态的“故事板”(Storyboard),从而,极大地,降低昂贵的外景复拍成本。
-
对于跨境电商: 商家,只需,一次性地,上传一张模特的图片,即可批量地产出其在不同场景下、试穿不同产品的、多语种的“虚拟试穿”视频,其制作成本,可被降至传统拍摄的1/10。
-
对于虚拟偶像产业: IP的运营方,可以将一个虚拟偶像的形象,完整地,存入库中。然后,海量的粉丝,便可以通过,简单的「@角色」指令,去安全地、合规地,进行各种“二次创作”,而无需,再担心“换脸”所带来的侵权风险。
当AI视频,终于,完成了从“好玩”,到“好用”的、这最后、也是最关键的一跃时,一个属于短视频、广告、乃至长剧集的、全新的“AI工业化”生产流程,或许,就将被彻底地重写。
而可灵,凭借其,在这条,关于“记忆”的全新赛道上的、决定性的、领先的身位,无疑,已经,为其,在这场,注定将异常残酷的AI视频“终局之-战”中,赢得了,那个,最宝贵的、也是最有利的“战略制高点”。