高德FantasyWorld发布即登顶全球模型榜 阿里空间智能再获突破

高德FantasyWorld发布即登顶全球模型榜 阿里空间智能再获突破

2026年01月09日 17:29
本文共计1158个字,预计阅读时长4分钟。
来源/aibase 责编/爱力方

阿里巴巴旗下高德地图正式推出自研世界模型“FantasyWorld”,凭借海量真实导航数据优势,这一模型迅速在国际权威基准WorldScore Leaderboard上夺得综合得分第一,进一步扩展了阿里在AI基础模型领域的布局。FantasyWorld聚焦于高品质3D世界构建,正成为具身智能自动驾驶领域的新焦点。

 FantasyWorld的核心技术突破

FantasyWorld旨在为具身智能与通用人工智能(AGI)提供高质量3D世界模型。其创新在于:在冻结的视频基础模型骨干上,增设可训练的几何分支,实现“视频潜变量”和“隐式3D场”的联合建模,仅需一次前向计算即可完成。

image.png

这一设计显著提升了生成视频的视觉真实感,同时大幅改善多视角一致性和几何保真度。相比近期其他几何一致性方法,FantasyWorld在多视角协同、风格一致性以及极端视角(如180°旋转)下的物体形状与纹理保持上表现出色。模型生成的3D潜变量可直接解码为深度图或点云,支持下游任务无需额外优化。

 登顶WorldScore:国际认可的实力证明

WorldScore是由斯坦福大学李飞飞团队主导的统一世界生成基准,涵盖静态/动态场景、可控性、一致性等多维度评估。目前,FantasyWorld在综合得分以及关键指标(如静态世界得分78.55、动态世界得分66.89)上位居榜首,超越多家国内外竞争模型。

相关论文已被ICLR2025、NeurIPS2025等顶会收录,高德方面表示模型将于近期开源,进一步推动学术与产业合作。

 实际应用落地:飞行街景引领空间智能新体验

FantasyWorld已率先应用于高德地图的“飞行街景”功能。商家仅需上传几段手机视频,即可免费生成高保真3D虚拟漫游街景,帮助用户提前“身临其境”了解餐厅布局、座位区等细节,同时助力线下商家提升流量。

这一功能被视为“技术平权”的体现,降低了专业3D建模门槛。高德还内部成立了具身业务部,探索机器人、机器狗等方向,结合空间智能全面转向物理AI。

 行业影响:世界模型时代加速到来

随着自动驾驶转向端到端视觉语言行动(VLA)方案,以及具身智能的迅猛发展,追求物理真实性和3D一致性的世界模型正变得至关重要。FantasyWorld的推出,不仅强化了阿里在多模态AI的版图,还凸显了中国企业在真实世界数据驱动下的空间智能优势。

AIbase观点:FantasyWorld标志着世界模型从视频生成向可交互3D模拟的跃进,将深刻影响AR/VR、机器人导航、数字孪生等领域的未来。高德凭借亿级用户数据积累,或将在物理AI赛道占据先机。AIbase将持续关注其开源进展与更多应用落地,为读者带来深度解读。

来源:高德FantasyWorld一经发布就登顶世界模型榜首,阿里空间智能再下一城! | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯