在人工智能(AI)的这场、由科技巨头们,所主导的、充满了“万亿参数”和“千亿美金”的、史诗级的“诸神之战”中,一个近乎于“神话”般的、“大卫击败歌利亚”的时刻,正由一家小型的、独立的初创公司,悍然上演。
美国东部时间12月2日,全球领先的AI视频生成初创公司Runway,正式宣布,其最新一代的模型Gen-4.5,在第三方的、匿名的、由全球用户共同参与“盲测”的Video Arena平台上,成功地,登顶榜首。

在参与者,完全不知情的情况下,它,击败了来自谷歌的Veo 3,和来自OpenAI的Sora 2 Pro。
这,是历史上第一次,一个由小团队(Runway目前仅有120名员工)所打造的大模型,在这样一场公平的、公开的、直接的“硬碰硬”中,战胜了那些,拥有着近乎于“无限”算力和资源的科技巨头。
“一百人,对阵(拥有)万亿(参数和美金)的(巨头),”Runway的首席执行官Cristóbal Valenzuela,在宣布这一消息时,一语道破了这场胜利的本质,“我们,所依靠的,不是预算的规模,而是研究的密度。”
这场胜利的背后,是Runway,对其自研的“时空混合Transformer”(Spatio-Temporal Mixture Transformer)架构的、一次极致的、专注的、快速的迭代。
Gen-4.5,其核心的技术指标,或许,并不追求在每一个维度上,都做到“最大”或“最长”。
-
分辨率: 1080p
-
帧率: 24fps
-
单次生成时长: 最长18秒
但它,将其所有的“火力”,都精准地,集中在了那些,最能决定一段视频,“看起来是否专业、是否可信”的、更为精细的维度之上:
-
运动幅度的真实性。
-
镜头语言的丰富性。
-
以及,物理世界因果关系的连贯性。
内部的测试数据显示,Gen-4.5,对于像“子弹时间慢动作”、“手持摄像机跟随拍摄”这类、极其复杂的、专业级的“导演指令”,其“一次生成通过率”,已经提升至了68%——这个数字,比其上一代的模型,要高出整整19个百分点。
Valenzuela透露,该模型,在内部的开发代号,正是“大卫”(David)。其寓意,不言而喻。
而比其在盲测平台上的胜利,更具商业价值的,是Gen-4.5,已经在美国的多家顶级影视工作室中,完成了“商业闭环的验证”。
这,正是Runway,与那些,至今,仍将自己的顶级模型,束之高阁的巨头们,最根本的、也是最致命的差异所在。
Runway,从诞生之日起,就将自己,定位为一个,为专业的创意工作者,提供“生产力工具”的公司,而非一个,进行前沿技术探索的“研究实验室”。
这家目前估值已达35.5亿美元、背后拥有General Atlantic、Baillie Gifford和英伟达等顶级资本支持的公司,也公布了其清晰的、极具侵略性的商业化“时间表”:
-
本周起: 将通过其官方网站、API接口以及合作伙伴的渠道,向全球的客户,分批地,开放Gen-4.5的访问。
-
明年第一季度: 将正式地,推出面向大型客户的、企业级的微调(Fine-tuning)和本地化部署(On-premise Deployment)方案。
其目标,是继续地,扩大其,在广告、短片制作和影视预览(Pre-visualization)这些高价值的商业应用场景中的市场份额。
AIbase的分析认为,Runway的这次“登顶”,其意义,已远超一次简单的、排行榜上的名次更迭。
它,更像是一次深刻的、关于“AI时代创新模式”的“思想解放”。
它,以一种无可辩驳的方式,向整个行业,证明了:
在这场看似“赢家通吃”的AI竞赛中,“更大”,并不总是等于“更好”。
通过对特定领域的、专注的、高密度的研究,以及,通过与真实世界、真实客户的需求,进行快速的、持续的迭代和反馈,小型的、敏捷的团队,完全有可能,在与科技巨头的竞争中,找到自己的“非对称优势”,并实现“以小博大”的奇迹。
如果,Runway,能够继续地,保持其当前这种,令人敬畏的迭代节奏,那么,全球的AI视频赛道,或许将历史上第一次,出现一个,能够与巨头们,进行持久的、长期的、差异化竞争的、真正的“独立极”。