字节跳动推出StoryMem技术解决AI视频角色走样问题-A³·爱力方

字节跳动推出StoryMem技术解决AI视频角色走样问题

2026年01月04日 11:24

本文共计812个字，预计阅读时长3分钟。

来源/aibase 责编/爱力方

针对 AI 视频生成领域长期存在的“角色走样”与“环境闪烁”难题，字节跳动与南洋理工大学研究团队近期联合推出名为 StoryMem 的创新系统。该系统通过引入一种类似人类记忆的机制，成功实现了长视频跨场景创作的高度一致性，解决了 Sora、Kling 等模型在多镜头叙事时容易出现的视觉偏差痛点。

StoryMem 的核心逻辑在于其独特的“混合记忆库”设计。研究人员指出，将所有场景强行塞入单个模型会导致计算成本激增，而分段生成又会丢失关联。为此，StoryMem 选择性地存储先前场景的关键帧作为参考。该算法利用双重过滤器，先通过语义分析挑选视觉核心帧，再通过质量检测剔除模糊图像。在生成新场景时，这些关键帧会配合一种名为 RoPE（旋转位置嵌入）的技术输入模型。通过赋予记忆帧“负时间索引”，系统能引导 AI 将其识别为“过去的事件”，从而确保角色形象和背景细节在故事推进中保持稳定。

值得关注的是，StoryMem 的实现方式极为高效。它基于阿里巴巴开源模型 Wan2.2-I2V 的 LoRa 版本运行，在拥有140亿参数的基础模型上仅增加了约7亿参数，显著降低了训练门槛。在包含300条场景说明的 ST-Bench 基准测试中，StoryMem 的跨场景一致性较基础模型提升了28.7%，在美学得分与用户偏好上也全面超越了 HoloCine 等现有前沿技术。

此外，该系统还展现了极高的实用价值，支持用户上传自定义照片作为“记忆起点”来生成连贯故事，并能实现更平滑的场景过渡。尽管在处理多角色并发及大幅度动作衔接上仍有局限，但团队已在 Hugging Face 开放了权重数据，并上线了项目页面供开发者探索。

地址:https://kevin-thu.github.io/StoryMem/

https://huggingface.co/Kevin-thu/StoryMem

来源：字节跳动发布 StoryMem:给 AI 视频装上“长期记忆”，彻底解决角色走样难题 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表A³·爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

通知

尊敬的用户

user

字节跳动推出StoryMem技术解决AI视频角色走样问题

相关图文

字节AI编程工具2025报告出炉 Trae月活突破160万国内编程生态加速升级

输入脚本秒生视频字节开源StoryMem解决AI角色变脸问题

清华开源TurboDiffusion 实现AI视频秒级生成提速最高200倍

字节发布Seed新模型数学竞赛夺金展推理实力

清华开源TurboDiffusion，AI视频生成提速200倍，消费级显卡可秒出大片

爱诗科技联手BytePlus 加速AI视频一键生成

热门资讯

非遗科技赋能泾渭茯茶成优选

特斯拉Model 3车主实现全程自动驾驶横穿美国无人驾驶出租车或将到来

Perplexity推出BrowseSafe 护航AI浏览器代理安全

众筹失败反获特斯拉订单 Manus逆袭成供应商

罗福莉加入小米首秀：中国AI模型与顶尖差距缩短至数月，出身农村家庭曾获雷军千万元年薪

阿里Qwen推出新一代图像编辑模型，人物一致性显著增强

快讯

智谱AI发布道歉及补偿方案

2026年机器人技术风口或将聚焦VLX与灵巧操控

日本网友嘲讽中国除冰机器人中国网友回以“夏虫不可语冰”

具身智能如何跨越规模化生死线？

机器人产业从春晚展示到落地应用，价值之路如何突破？

SK海力士预测AI浪潮将推动内存价格持续上涨

春节科技热：AI产品领跑新年“电子年货”销售

SK海力士高盛电话会：客户需求无法全部满足存储价格持续上涨

光谷重点企业春节不停工 AI光模块订单延续至四季度

购车为何多推荐7年分期付款？

推荐专栏

爱力方

机器人大讲堂

下一篇

user

字节跳动推出StoryMem技术 解决AI视频角色走样问题

相关图文

字节AI编程工具2025报告出炉 Trae月活突破160万 国内编程生态加速升级

输入脚本秒生视频 字节开源StoryMem解决AI角色变脸问题

清华开源TurboDiffusion 实现AI视频秒级生成 提速最高200倍

字节发布Seed新模型 数学竞赛夺金展推理实力

清华开源TurboDiffusion，AI视频生成提速200倍，消费级显卡可秒出大片

爱诗科技联手BytePlus 加速AI视频一键生成

热门资讯

非遗科技赋能泾渭茯茶成优选

特斯拉Model 3车主实现全程自动驾驶横穿美国 无人驾驶出租车或将到来

Perplexity推出BrowseSafe 护航AI浏览器代理安全

众筹失败反获特斯拉订单 Manus逆袭成供应商

罗福莉加入小米首秀：中国AI模型与顶尖差距缩短至数月，出身农村家庭曾获雷军千万元年薪

阿里Qwen推出新一代图像编辑模型，人物一致性显著增强

快讯

智谱AI发布道歉及补偿方案

2026年机器人技术风口或将聚焦VLX与灵巧操控

日本网友嘲讽中国除冰机器人 中国网友回以“夏虫不可语冰”

具身智能如何跨越规模化生死线？

机器人产业从春晚展示到落地应用，价值之路如何突破？

SK海力士预测AI浪潮将推动内存价格持续上涨

春节科技热：AI产品领跑新年“电子年货”销售

SK海力士高盛电话会：客户需求无法全部满足 存储价格持续上涨

光谷重点企业春节不停工 AI光模块订单延续至四季度

购车为何多推荐7年分期付款？

推荐专栏

爱力方

机器人大讲堂

下一篇

字节跳动推出StoryMem技术解决AI视频角色走样问题

字节AI编程工具2025报告出炉 Trae月活突破160万国内编程生态加速升级

输入脚本秒生视频字节开源StoryMem解决AI角色变脸问题

清华开源TurboDiffusion 实现AI视频秒级生成提速最高200倍

字节发布Seed新模型数学竞赛夺金展推理实力

特斯拉Model 3车主实现全程自动驾驶横穿美国无人驾驶出租车或将到来

日本网友嘲讽中国除冰机器人中国网友回以“夏虫不可语冰”

SK海力士高盛电话会：客户需求无法全部满足存储价格持续上涨