每经记者|张梓桐 每经编辑|董兴生

◼︎行业属性:AI视频生成
◼︎估值/融资轮次:C轮
◼︎核心竞争力:低门槛创作,全球化用户,差异化定位
◼︎未来关键词:PixVerse、先ToC后ToB
虽然AI(人工智能)视频生成已经成为2026年科技行业最炙手可热的赛道之一,但就在三年前(2023年),当爱诗科技创始人王长虎带着在微软亚洲研究院和字节跳动积累的多年视觉技术经验决定创业时,大多数投资人并不看好这个赛道。
彼时,AI生成还停留在图文阶段,视频生成面临诸多技术瓶颈,赛道尚处于无人问津的冷寂期。
就在2026年3月,亚洲AI视频生成领域的最大单次融资纪录诞生。这项纪录的缔造者正是爱诗科技——公司完成由鼎晖香港基金、鼎晖VGC、鼎晖百孚领投,产业资本中国儒意、三七互娱等参与投资的3亿美元C轮融资。
这距离公司上一轮融资还不足一年——2025年10月,爱诗科技刚刚完成B+轮超过1亿元人民币融资,复星锐正等参与投资。2025年9月,公司还完成超过6000万美元B轮融资,由阿里巴巴领投,达晨财智、深创投等机构参与。
“在创业初期,尽管99%的投资人不看好视频生成赛道,我们坚信AI技术将彻底改变内容创作方式。”王长虎在最新这轮融资落地后接受每日经济新闻《对话未来商业》栏目(以下简称NBD)(更多内容,详见专题|对话未来商业记录、预见、让未来发生)专访时表示。
根据全球知名的独立AI基准测试与分析平台Artificial Analysis.ai 2026年2月的最新排名,在全球图生视频(无音频)赛道排行榜中,爱诗科技旗下PixVerse V5.6凭借1291的ELO(一种用于衡量AI模型之间相对能力的动态排名机制)综合质量评分(通过盲测对战得出)位列第四,仅次于马斯克旗下xAI的grok-imagine-video、快手旗下可灵(Kling AI)的Kling 2.5 Turbo 1080p与Kling 3.0 Omni 1080p(Pro)。
图片来源:网页截图
如今,3亿美元融资到账。这家从“非共识”中突围的公司,正试图用“实时交互”重新定义AI视频的下一个时代。当视频变得可交互,内容产业的底层逻辑能否彻底重构?
Sora风暴下的反击
王长虎复盘“背水一战”,三个月破局是关键
2023年10月,在公司成立仅6个月后,王长虎带着团队率先完成了业内首个可生成4K质量视频的AI视频生成模型,时间早于美国人工智能研究公司OpenAI发布的AI文生视频大模型Sora的发布。
2024年2月,Sora横空出世。面对Sora带来的竞争压力,爱诗科技选择加码大模型训练,尽管当时现金流仅够支撑一次尝试。
2025年2月,爱诗科技推出面向海外的AI视频生成工具PixVerseV4,实现5秒内即可生成高质量360p视频;同年6月,国内版“拍我AI”(PixVerse)正式上线,并在2025年8月突破1亿用户。随后,2025年11月,V5Fast上线,30秒即可生成1080p视频。
本轮最新融资完成后,据称,资金将主要用于爱诗科技视频基础模型的持续迭代、实时世界模型的前沿研发、下一代互动娱乐范式的产品化与全球化的人才团队建设。
NBD:你曾经在演讲中提到,创业初期投资人不看好视频生成赛道,认为5年内无法落地。当时你是如何说服团队坚定押注这一非共识方向,又是如何平衡“坚持正确的事”与融资困境的?
王长虎:在创业初期,尽管99%的投资人不看好视频生成赛道,我们坚信AI技术将彻底改变内容创作方式。我们通过展示早期原型和市场潜力,特别是PixVerseV1发布后生成4K质量视频的能力,逐步赢得团队的信任。
对于融资,我们采取了“小步快跑”的策略,专注于快速迭代产品,并用实际成果(如用户增长、技术突破)来说服投资人。同时,我们也注重内部沟通,确保团队成员理解我们的愿景和技术路线图。
NBD:Sora横空出世时,行业中有声音质疑中国AI视频领域落后,你怎么看这种质疑声音?
王长虎:尽管Sora横空出世时,有人质疑中国AI视频领域的落后,但我们坚信自身的技术积累。依托抖音、TikTok等平台积累的大规模数据处理能力和深度学习算法经验,我们在视频生成领域具备独特优势。
具体而言,这些平台帮助我们积累了丰富的用户行为数据和内容理解能力,使得我们在模型训练和优化上更具竞争力。此外,我们还拥有强大的研发团队,能够快速响应市场需求并持续创新。
NBD:面对Sora带来的竞争压力,公司选择加码大模型训练。你在一次公开演讲中提及,当时现金流仅够支撑一次尝试,你和团队是如何下定决心、破釜沉舟的?
王长虎:面对Sora的竞争压力,我们制定了明确的技术路线图,聚焦大模型训练和性能优化。首先,我们确定了短期目标(如提升生成速度和质量),并通过模块化开发降低试错成本。其次,我们建立了高效的反馈机制,确保每次迭代都能迅速验证效果。
最后,在资源有限的情况下,我们集中资源攻克关键瓶颈(如一致性与运动轨迹优化),确保在三个月内实现显著突破。
NBD:PixVerse目前在全球排名靠前,你将PixVerse的成功归结于哪些因素?这一产品逻辑是如何平衡技术实现难度与普通用户需求的?
王长虎:PixVerse的成功在于降低了创作门槛,提升了用户体验。我们通过封装提示词模板、提供多模态支持等方式,简化了操作流程,使普通用户也能轻松上手。
为了实现接近100%的视频生成成功率,我们采用了多层次的质量控制体系,包括预训练模型、实时渲染优化以及用户反馈循环。这不仅提高了技术实现的稳定性,也更好地满足了普通用户的多样化需求。
先To C后To B
AI视频下半场:全球化与中国化的“双轨战役”
当前AI视频生成赛道已进入技术与商业化双线竞速的下半场,国产模型迎来集体崛起。阿里云万相2.6、火山引擎Seedance2.0、快手可灵AI、MiniMax海螺AI等相继推出新一代视频大模型,在画质、一致性、长生成等维度快速逼近全球第一梯队。
面对字节跳动等巨头入局、Seedance2.0等模型接连爆火的行业环境,王长虎在访谈中也直言,爱诗科技在努力保持差异化竞争路线。与多数厂商偏重国内市场、聚焦专业创作者、优先B端或内容生态协同的路径不同,爱诗科技从成立之初便选择先To C(个人用户)后To B(企业用户)、优先海外再拓国内的路线,以全球普通用户为核心用户,走出一条与巨头错位竞争、全球化原生的差异化道路。
NBD:选择“先To C后To B、优先海外再拓国内”的战略,除了团队有全球化经验,是否也考虑过国内外市场的用户习惯、竞争格局差异?这一战略对后续商业化落地带来了哪些影响?
王长虎:我们从一开始就希望做一个面向全球用户的平台。团队本身具有全球化经验,因此产品早期更多是围绕全球创作者社区进行验证和迭代,在不断提升模型能力的同时,也逐步根据不同市场的需求推进本地化布局。
这一战略帮助我们在短时间内积累了大量用户(如超过1亿全球用户),为后续商业化奠定了基础。
NBD:模版特效的病毒式传播成为产品爆发点,但也面临同行快速跟进,你认为PixVerse能超越单一特效、实现品牌出圈的核心壁垒是什么?如何避免陷入“特效火而品牌弱”的困境?
王长虎:PixVerse的核心壁垒在于其全面的创作工具链和持续创新能力。模版特效的病毒式传播只是我们众多功能中的一个亮点。为了巩固并加强品牌优势,我们不断推出新功能(如音画同步生成、分镜创作等),并通过社区运营增强用户忠诚度。
此外,我们还注重品牌建设,通过高质量的内容输出和用户案例展示,树立专业形象,确保品牌价值不断提升。
NBD:“拍我AI”正式在国内公测后,针对国内市场做了中国化模型与模板适配,相较于海外版PixVerse,国内版在功能、运营、合规上有哪些差异化设计?如何应对国内的盗版问题与竞争环境?
王长虎:国内版“拍我AI”在功能上进行了本地化适配,增加了更多符合中国文化背景的模板和特效。在运营方面,我们加强了与本地合作伙伴的合作,提升了用户体验。针对盗版问题,我们采取了严格的版权保护措施,并与相关机构合作打击侵权行为。同时,我们注重合规性,确保所有内容和服务符合国家法规要求。
NBD:目前公司已从To C切入To B业务,服务互联网营销、电商等场景,基于过亿用户的实践经验,你认为To B业务的核心竞争力是什么?未来To B与To C业务的资源分配比例会如何规划?
王长虎:To B业务的核心竞争力,来自我们在To C场景中积累的大规模创作数据与产品实践。依托超过1亿用户的真实创作反馈,我们能够更好地理解视频内容生产的实际需求,并将这些能力沉淀为面向企业的解决方案。
目前,PixVerse的B端业务已经深入互联网、电商、影视、游戏等多个行业场景。例如,我们与支付宝、百度、腾讯等互联网公司探索AI在增长营销中的应用,与京东一起重构电商视觉内容生产流程,也与儒意、掌阅、三七互娱等合作伙伴共同探索影视级与互动内容的生成能力。
在技术层面,我们正在持续推进“基础模型+垂类模型”的能力体系,通过R系列和C系列模型,为不同产业场景提供更具针对性的内容生成能力,并将这些能力逐步沉淀为可规模化应用的行业解决方案。
未来To B与To C业务仍会保持协同发展。To C为产品提供真实的创作生态和数据反馈,而ToB则推动技术在产业中的规模化落地,两部分都会持续投入,并根据市场需求动态调整资源配置。