颠覆互联网的下一波浪潮:Agentic Web来了

2025年08月09日 08:21
本文共计4237个字,预计阅读时长15分钟。
来源/互联网 责编/爱立方

你不会再「上网」,而是说出一个目标,然后由一群 AI 自动完成。

——未来互联网使用场景设想

过去三十年,互联网经历了从静态网页到智能推荐的深刻演变。如今,我们正站在互联网的另一个重大转折点上。

这一转折,来自一种全新的范式设想 ——Agentic Web,一个由 AI 智能体组成的、目标导向型的互联网系统。在这个新框架中,用户不再手动浏览网页、点击按钮,而是通过自然语言向智能体发出一个目标,AI 会自主规划、搜索、调用服务、协调其他智能体,最终完成复杂任务。

这不是幻想,而是由 UC Berkeley、UCL、上海交通大学、上海创智学院等机构的研究者联合提出,并在论文中系统论述的 Web 重构方案。

论文标题:Agentic Web: Weaving the Next Web with AI Agents

作者:Yingxuan Yang, Mulei Ma, Yuxuan Huang, Huacan Chai, Chenyu Gong, Haoran Geng, Yuanjian Zhou, Ying Wen, Meng Fang, Muhao Chen, Shangding Gu, Ming Jin, Costas Spanos, Yang Yang, Pieter Abbeel, Dawn Song, Weinan Zhang, Jun Wang

单位:上海交通大学,University of California, Berkeley,University College London,上海创智学院等

链接: https://arxiv.org/abs/2507.21206

Github: https://github.com/SafeRL-Lab/agentic-web

这是一次对互联网底层逻辑的全面「改写提案」:人类不再是唯一的网络使用者,智能体将成为 Web 的主要操作者。任务由人类发起,但由 AI 执行。在这个新架构中,网页、服务、平台不再是面向人的交互界面,而是为智能体而生的协作接口。

本文将从技术架构、理论模型、系统协议、典型应用与挑战五个方面,深度解析这场关于「智能体驱动互联网」的范式革命。

一、三次范式跃迁:Web 正在走向「自动化」

互联网的演化是一部「人–信息」关系的技术史。过去三十年,Web 主要经历了三次范式转变:

PC Web:关键词驱动的「目录网络」

在 PC Web 时代,网页以静态内容为主,信息由机构集中生成,并通过人工分类和超链接构成一个「数字黄页」。用户必须主动发起搜索、点击浏览,任务执行线性、明确但效率不高。

商业模式以关键词搜索广告为主,代表性系统如 Google AdWords,依赖点击率 (CTR) 和每次点击成本 (CPC) 来衡量效果,形成了基于「人类意图」的搜索营销生态。

Mobile Web:推荐驱动的「内容爆炸」

伴随社交平台、短视频、电商 UGC 的激增,信息量呈指数增长。传统搜索引擎难以应对如此庞大的内容分发压力,取而代之的是推荐系统主导的信息分发范式。

用户逐渐从「搜索者」变为「消费者」,算法根据行为数据动态推荐内容,平台从内容聚合器变为算法中介。商业模型转向精准推荐与信息流广告,强调停留时间、转化率和千次展示成本 (eCPM)

Agentic Web:智能体驱动的「行动网络」

如今,我们正步入第三次变革浪潮:AI 智能体成为主角,Web 从「人读内容」转向「智能体执行任务」。信息不再静态储存在网页中,而是被嵌入 LLM 参数中,被智能体调用、组合与再加工。

Web 的角色不再是信息仓库,而是一个充满「可行动资源」的生态系统,供智能体发现、协调、调用。任务不再依赖用户逐步操作,而是由 AI 智能体全流程完成,从发现信息到调用服务再到反馈结果。

这一趋势预示着:未来的 Web,将由 AI 智能体构建、运营与使用。我们需要重新理解什么是「网页」、什么是「流量」、甚至什么是「用户」。

互联网不再只是人类的空间,它正逐步变成一个由智能体共同参与、协作、创造价值的生态系统。

二、什么是 Agentic Web?

论文中的定义指出:

Agentic Web 是一个分布式、交互式的互联网生态系统,其中由大语言模型 (LLMs) 驱动的自主软件智能体,能够持续规划、协调、执行目标导向的任务。在这个范式中,网络资源和服务不仅可供人类使用,还可以供智能体访问,使得智能体与智能体之间 (Agent-to-Agent) 的互动成为常态。

简言之,它是一个由 AI 来「上网」、执行任务、人类只是「发出指令」的网络形态。

Agentic Web 的核心在于「委托 + 执行」

在 Agentic Web 中,用户不再需要手动搜索、点击、复制或粘贴内容,而是可以通过与智能体的对话来委托任务。比如用户只需说:

「帮我规划一个周末东京行程,预算 3 千元,要避开台风。」

之后,剩下的所有工作都由智能体自动完成—— 从查询天气、搜寻航班、比对价格,到预定酒店、整合日程,整个过程完全自动化。而且,这些智能体可以与其他智能体 (如航司 API、酒店 API、旅游数据智能体等) 协作与谈判,实现任务目标。这不仅仅是像 ChatGPT 那样的单轮问答,而是通过多个步骤和多智能体协作来完成的,代表着 AI 真正参与到了Web 的操作层面

Agent 在系统中的身份是「双重」的:

Agent-as-User (作为用户)

如同人类访问网页一样,智能体可以模拟点击、填写表单、读取接口,进行市场分析、数据抓取、自动交易等任务。

Agent-as-Interface (作为接口)

智能体也可以作为「超级助手」,接收用户的自然语言指令,自动解析、调用多个服务、整合结果,执行多步流程。

一个完备的智能体,常常同时具备这两个角色:既能代表人类与系统交互,也能作为系统对人类的接口,真正实现「意图—执行」的闭环。

三、理解 Agentic Web 的「三个核心维度」

论文从三个核心维度全面理解 Agentic Web 的结构:

智能维度 (Intelligence)AI 智能体需要具备真正的「认知能力」,包括:

上下文理解:能读懂网页、结构化数据、自然语言

长程规划:能分解复杂任务,生成执行计划

适应性学习:通过经验不断优化策略

多模态整合:同时处理文本、图像、API、数据表格等

这些能力意味着智能体不是被动的「响应工具」,而是具有持续学习和自主策略的「数字行动体」。

交互维度 (Interaction)Agentic Web 打破了「人类点击网页」的操作范式,转向基于语义的智能交互:

使用 MCP (Model Context Protocol)、A2A (Agent-to-Agent) 协议,实现智能体之间的发现、能力描述、状态共享

支持多步任务语境保持 (如购物流程、问诊流程)

实现 Agent-to-Agent 协作与任务拆解

智能体之间不是「调用」,而是协商、协同执行,如一个旅游智能体主动向天气智能体请求数据,再联动地图与订票工具,完成任务。

经济维度 (Economy)

Agentic Web 中,最具突破性的设想是:Agent Attention Economy (智能体注意力经济)

传统广告模型追求「人类点击」;Agentic Web 中,资源方争夺的对象变成「AI 智能体的调用」。

这意味着未来将出现:

面向智能体的推荐系统;

为智能体投放的广告;

服务市场中按「智能体调用率」竞价;

智能体的调用频次、完成率、效率将成为新的「流量指标」,商业竞争的重心也将从争夺用户注意力,转向争夺智能体「注意力」。

四、应用场景:从搜索替代到智能事务系统

为了更好地理解它的实际价值,我们可以将 Agentic Web 的核心能力拆解为三大类:事务型 (Transactional)、信息型 (Informational) 和交流型 (Communicational)。它们共同构成了智能体参与数字世界的三种基本方式。

事务型:从「点击下单」到「全自动完成任务」

传统 Web 中,用户需要逐页浏览、搜索信息、逐步操作才能完成一项任务,例如订酒店、买机票、办签证。而在 Agentic Web 中,你只需告诉智能体一句话:

「帮我订一个下周三从上海到东京的往返机票,经济舱,避开台风。」

剩下的 —— 查询航司、比价、确认时间、填写资料、支付确认 —— 都由智能体自主完成。它不仅调用航司 API,还能根据你过往偏好 (如信用卡积分、环保航线) 进行权衡,甚至在发生变更时自动重订。

这种智能化的事务处理能力,正在由「Mobile Agents」「App Agents」进一步延展到设备层。例如,智能体可以在你的手机上同步日程、修改会议安排、甚至整合多个应用自动执行跨平台任务。

信息型:从「搜索引擎」到「持续知识发现」

今天的信息检索依赖搜索引擎和社交推荐,但在数据过载的背景下,我们获取的是信息洪流。

Agentic Web 支持的「信息型智能体」,则更像是一个长期陪伴式研究助理。以「Deepresearch Agent」为例:

它可以持续追踪一个研究领域的新论文;

自动梳理引用网络和方法论差异;

合理推断趋势、生成研究摘要;

甚至根据你的研究兴趣,推荐潜在合作者。

这种智能体并不是一次性地「查一查」,而是具备长期「认知记忆」和动态「学习能力」的信息分析引擎。它们协作构成一个持续进化的知识网络,大大提升了信息筛选和洞察能力。

交流型:智能体之间能沟通、协作、谈判

相比以人为中心的传统 Web,Agentic Web 真正的变革在于让智能体可以与其他智能体协作,形成类似「数字组织」的多体系统。

在科研领域,一个跨国研究项目中,不同学校的智能体可以:

自动同步实验时间表;

共享数据集;

生成联合成果;

自动分配署名与经费比例。

在制造业或供应链中,不同企业的智能体可实时对接需求、响应变化、自主协商条款。这种跨智能体协同工作流,依赖于一整套新型通信协议 (如 MCP、A2A),支持语义对齐、任务协同与多方自治。

简而言之:Web 不再是人和机器之间的桥梁,而是智能体之间的操作舞台。

五、挑战:Agentic Web 的复杂难题与未来瓶颈

虽然 Agentic Web 展现出令人兴奋的前景,但要真正落地为现实中的下一代互联网,它面临的是一组系统性、相互交织、跨学科的复杂挑战—— 远不只是提升 AI 智能体的能力,更关乎整个网络基础设施、经济体系与人机协作范式的重构。

这不仅是个技术性难题,更是一个需要全局观的系统性工程。构建Agentic Web的难题,远不仅仅是提高个体智能体的能力,而是如何在现有互联网基础上,架构出一个可靠、安全、可信的全新计算层。这些挑战跨越了多个领域,彼此之间存在深刻的相互依赖与关联。接下来,我们将逐一解析这些挑战。

智能体基础能力:推理、记忆与安全性

 

声明:本文来自互联网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯