在AI助手的赛道上,一场关于“交互范式”的革命,正由蚂蚁集团悍然发动。
该公司于11月18日,正式发布了其全新的全模态通用AI助手——“灵光”。

(图说:11月18日灵光App上架应用商店)
这并非又一个在聊天问答能力上进行渐进式改良的产品。灵光的出现,其核心,是试图从根本上,重塑AI助手与用户之间的关系:
AI,将不再仅仅是一个被动的“信息提供者”。它将进化为一个主动的、即时的、能够为用户“创造工具”的“生产力伙伴”。
而实现这一目标的关键,是其开创性地,在移动端,实现了**“自然语言30秒生成可交互小应用”**的能力。
灵光的第一个突破,在于其对“对话”本身的重新设计。

(图说:灵光对话界面呈现极简风格,同时又提供多元的信息展示形式)
它将每一次的问答,都视为一次“信息的策展”,而非简单的文字堆砌。
-
结构化思维: 它会首先对用户的复杂问题,进行逻辑上的拆解,以一种层次清晰、重点突出的方式,来组织其回答,确保用户能够“秒懂”核心知识。
-
全模-态可视化: 它的回答,将不再局限于文本。它能够实时地,生成动态的3D模型、可被拖拽交互的地图、嵌入式的音视频片段,乃至可被筛选排序的数据图表。
这种兼具了“逻辑张力”与“信息美感”的全新交互体验,其背后,是灵光在技术上的一个关键实现:业内首个,完全基于“全代码生成”的多模态内容输出能力。
这意味着,用户在屏幕上所看到的、所有非文本的可视化组件——无论是图表、动画,还是3D模型——都是由其背后的大模型,根据当前的对话情境,即时地、动态地,用代码“绘制”出来的。
为了实现这一点,灵光构建了一个由多个智能体(Agent)协作的Agentic架构。它能够根据用户的需求,动态地,去调度专门负责图像、3D、动画等不同任务的专用Agent与工具,进行实时的、并行的协作。
然而,比其对话体验更具颠覆性的,是其面向所有普通用户,首次推出的“灵光闪应用”功能。
这是整个人机交互领域,一次极具想象力的跃迁。
用户,在与灵光的对话过程中,只需用一句自然语言,描述一个自己当下面临的、需要计算或决策的场景,灵光,便能在最快30秒、平均1分钟的时间内,为其生成一款功能完整的、可交互的、定制化的AI小应用。
例如:
-
当用户问,“一个完美的溏心蛋,到底要煮多久?”
-
灵光,在给出常规建议的同时,会直接生成一个“溏心蛋时间计算器”。用户可以在这个小应用中,根据自己手中鸡蛋的大小、想要的熟度(三分熟、五分熟、全熟),来自定义参数,从而获得一个完全个性化的、精准的烹饪时间。
-
-
当用户问,“怎样养一辆车,才最划算?”
-
灵光,则可以生成一个“养车成本计算器”。用户可以在其中,自由地,输入自己每月的行驶里程、当前的油价、保险费用等变量,来实时地,计算和比较不同的拥车方案。
-

(图说:灵光对话可唤起闪应用,最快30秒生成日常生活小应用)
更关键的是,灵光所生成的“闪应用”,并非一个简单的、只能进行前端展示的静态页面。
它可以直接调用其背后的大模型,以及外部的API等后端能力。
这意味着,它所能实现的场景边界,被极大地拓宽了。例如,一个“旅行规划器”闪应用,不仅能为你生成一份行程单,更能实时地,去查询机票的价格、酒店的空房情况,并最终,完成预订。
作为一款“全模态”的通用AI助手,灵光还通过其“灵光开眼”功能,将交互的边界,从数字世界,延伸到了物理世界。
它搭载了AGI相机技术,能够通过手机的摄像头,对实时的视频流,进行解析和理解。
在旅行的场景下,用户只需将手机,对准一座古老的建筑,灵光,便能实时地“看见”它,并为其,提供详尽的、图文并茂的语音讲解。
爱力方的分析认为,灵光的发布,深刻地,揭示了AI应用在2025年,一个至关重要的转型趋势:
从“场景化的信息工具”,向“场景化的生产力工具”的进化。
其核心理念——“让复杂变简单”——通过一种前所未有的方式,将“应用开发”这件原本属于专业开发者的事情,以一种无感知的、即时的方式,嵌入到了每一个普通用户的日常对话之中。
它正在从根本上,重新定义“通用型AI助手”的生产力边界。
当AI,不仅能“告诉你”答案,更能直接“为你打造”一个解决问题的工具时,一场真正意义上的、关于个人生产力的革命,才算真正地,拉开了序幕。