强化Agent能力为何成为国产基础大模型在2026年的重要发展方向

每经记者｜叶晓丹每经编辑｜杨军

近期，国产大模型动作频频。

4月2日，阿里发布千问新一代大语言模型Qwen3.6-Plus。4月8日，DeepSeek（深度求索）上线专家模式，这是DeepSeek走红以来首次在产品端引入模式分层设计，此前3月份，DeepSeek释放了和Agent（智能体）相关多个岗位的招聘需求。

《每日经济新闻》记者注意到，不论是阿里千问还是DeepSeek大模型，都在强化基础大模型Agent的能力。2026年初，以OpenClaw（一款开源人工智能体框架，俗称“龙虾”）为代表的“龙虾热”火爆国内外，如果说2025年还是“千模混战”，2026年AI（人工智能）主战场已全面转向智能体，Agent 对Token（词元）的消耗正以百倍、千倍速度狂飙。

IDC（国际数据公司）中国研究总监卢言霞向《每日经济新闻》记者表示，强化Agent能力是基础大模型2026年的重要发展方向，可能包括深度研究、智能办公、AI代码助手等通用场景。

中科院计算所客座博士生导师、中国计算机学会数字金融分会常务执委白硕在接受《每日经济新闻》记者采访时表示，随着AI应用爆发，对基础大模型Agent能力，未来将更重视在Harness Engineering（直译为驾驭工程）领域的提升。据了解，Harness Engineering是一个不强调模型性能，更强调工程环境，通过让“驾驭模型的系统环境”更专业而提升使用效果的范式。

下一代OpenClaw将支持视频生成

有“龙虾之父”之称的OpenClaw创始人彼得·斯坦伯格（Peter Steinberger）近日在社交平台宣称，下一代OpenClaw智能体产品将迎来两大核心升级——全新融入AI视频生成能力，并成为全球首个官方适配阿里千问大模型的智能体框架。

4月2日，阿里发布千问新一代大语言模型Qwen3.6-Plus，其中最引人注目的是，新模型显著增强了模型的智能体编程能力。在代码智能体领域以及通用智能体与工具使用方面，新模型表现突出。

4月4日，OpenRouter官方数据显示，Qwen3.6-Plus的日调用量突破1.4万亿Token。

Agent对Token的消耗正以前所未有的速度激增。国家数据局局长刘烈宏披露了一组数据，到今年3月，我国日均词元调用量已超过140万亿，相比2024年初的1000亿增长1000多倍，相比2025年底的100万亿，3个月时间又增长40%多。

在英伟达GTC开发者大会上，黄仁勋给出了一个极具冲击力的定义：Token是AI时代的新大宗商品，是新货币，也是衡量企业竞争力的核心标尺。

而OpenClaw这类Agent产品彻底改变了AI交互形态，使其能落地完成复杂任务，也让Token需求迎来爆发式增长。

不只是阿里千问基础大模型强化了Agent能力，DeepSeek通用大模型自2025年以来也强化了Agent能力。

《每日经济新闻》记者注意到，在DeepSeek官网上，3月24日发布的一系列招聘岗位中，有不少和Agent相关的岗位。譬如Agent全栈开发工程师、Agent深度学习算法研究员、Agent数据策略工程师等。

2025年12月，DeepSeek更新V3.2正式版，就强调其新模型强化Agent能力，融入思考推理。在这个版本的模型中，DeepSeek提出了一种大规模Agent训练数据合成方法，构造了大量“难解答，易验证”的强化学习任务（“1800+”环境，“85000+”复杂指令），大幅提高了模型的泛化能力。

专家模式具备领域深度增强等特点

当前，AI Agent（人工智能体）能力很大程度上依赖于基础大模型能力的提升，基础大模型提供核心能力，而Agent通过系统化设计将这些能力转化为实际应用价值，国产基础大模型正在强化Agent能力。

横向对比来看，不论是千问大模型还是DeepSeek，均实现支持高达1M Tokens（100万个词元）上下文长度，大模型在长文档、多轮对话信息提取上更精准。

卢言霞认为，当前基础大模型竞争的关键是编程能力、智能体能力等。强化Agent能力是基础大模型2026年的重要发展方向，可能包括深度研究、智能办公、AI代码助手等通用场景。

在AI应用端，浙江华通云数据科技有限公司副总裁林建龙在接受《每日经济新闻》记者采访时坦言，当前AI Agent仍面临一些问题。譬如大多数AI系统仍然停留在“工具”“技能”层面，无法真正成为企业的“数字化员工”。传统工作流编排和简单对话系统虽然能够完成一些预定义的任务，但缺乏深度理解业务场景、独立思考和持续学习的能力，难以满足企业复杂多变的业务需求。

林建龙表示，未来的AI Agent不是简单的工具，而是一个基于大模型之上的各个行业领域专家。这种专家Agent具备以下核心特征：第一，具备深厚的行业专业知识，能够理解并处理复杂的业务问题；第二，能够深度融入企业业务流程，与现有系统无缝对接；第三，具备持续学习和自我优化能力，能够在实践中不断提升；第四，能够独立完成特定任务，而不仅仅是提供建议或答案。

4月8日，DeepSeek上线的专家模式就提到，专家模式具备领域深度增强、多步推理可视化、引用溯源强化、自定义专家组合、长上下文压缩优化等特点。专家模式沿用了 R1的长思维链推理能力，但针对专业领域做了定向蒸馏和微调，使“快思考”与“慢思考”在领域内更平衡。

林建龙也强调了未来“专家 Agent”理念的实现，需要系统化和工程化的方法。他表示，当前华通云正围绕底座模型、数据管理、提示词工程、长期记忆等核心技术要素，构建了一套完整的AI Agent开发框架。

其中底座模型提供基础的认知和推理能力，数据管理完成对企业数据的链接和交互，提示词工程负责将业务需求转化为模型可理解的任务指令，MCP Tools（用于与外部系统进行交互的工具集或协议）提供与外部系统交互的能力，Skills（技能）封装了特定领域的专业技能，长期记忆机制则使Agent能够在多轮交互中积累经验、实现智能的个性化服务。

封面图片来源：每经媒资库

来源：强化Agent能力，为何成为国产基础大模型2026年重要发展方向？ | 每日经济新闻