每经记者|叶晓丹 每经编辑|杨军
近期,国产大模型动作频频。
4月2日,阿里发布千问新一代大语言模型Qwen3.6-Plus。4月8日,DeepSeek(深度求索)上线专家模式,这是DeepSeek走红以来首次在产品端引入模式分层设计,此前3月份,DeepSeek释放了和Agent(智能体)相关多个岗位的招聘需求。
《每日经济新闻》记者注意到,不论是阿里千问还是DeepSeek大模型,都在强化基础大模型Agent的能力。2026年初,以OpenClaw(一款开源人工智能体框架,俗称“龙虾”)为代表的“龙虾热”火爆国内外,如果说2025年还是“千模混战”,2026年AI(人工智能)主战场已全面转向智能体,Agent 对Token(词元)的消耗正以百倍、千倍速度狂飙。
IDC(国际数据公司)中国研究总监卢言霞向《每日经济新闻》记者表示,强化Agent能力是基础大模型2026年的重要发展方向,可能包括深度研究、智能办公、AI代码助手等通用场景。
中科院计算所客座博士生导师、中国计算机学会数字金融分会常务执委白硕在接受《每日经济新闻》记者采访时表示,随着AI应用爆发,对基础大模型Agent能力,未来将更重视在Harness Engineering(直译为驾驭工程)领域的提升。据了解,Harness Engineering是一个不强调模型性能,更强调工程环境,通过让“驾驭模型的系统环境”更专业而提升使用效果的范式。
下一代OpenClaw将支持视频生成
有“龙虾之父”之称的OpenClaw创始人彼得·斯坦伯格(Peter Steinberger)近日在社交平台宣称,下一代OpenClaw智能体产品将迎来两大核心升级——全新融入AI视频生成能力,并成为全球首个官方适配阿里千问大模型的智能体框架。
4月2日,阿里发布千问新一代大语言模型Qwen3.6-Plus,其中最引人注目的是,新模型显著增强了模型的智能体编程能力。在代码智能体领域以及通用智能体与工具使用方面,新模型表现突出。
4月4日,OpenRouter官方数据显示,Qwen3.6-Plus的日调用量突破1.4万亿Token。
Agent对Token的消耗正以前所未有的速度激增。国家数据局局长刘烈宏披露了一组数据,到今年3月,我国日均词元调用量已超过140万亿,相比2024年初的1000亿增长1000多倍,相比2025年底的100万亿,3个月时间又增长40%多。
在英伟达GTC开发者大会上,黄仁勋给出了一个极具冲击力的定义:Token是AI时代的新大宗商品,是新货币,也是衡量企业竞争力的核心标尺。
而OpenClaw这类Agent产品彻底改变了AI交互形态,使其能落地完成复杂任务,也让Token需求迎来爆发式增长。
不只是阿里千问基础大模型强化了Agent能力,DeepSeek通用大模型自2025年以来也强化了Agent能力。
《每日经济新闻》记者注意到,在DeepSeek官网上,3月24日发布的一系列招聘岗位中,有不少和Agent相关的岗位。譬如Agent全栈开发工程师、Agent深度学习算法研究员、Agent数据策略工程师等。
2025年12月,DeepSeek更新V3.2正式版,就强调其新模型强化Agent能力,融入思考推理。在这个版本的模型中,DeepSeek提出了一种大规模Agent训练数据合成方法,构造了大量“难解答,易验证”的强化学习任务(“1800+”环境,“85000+”复杂指令),大幅提高了模型的泛化能力。
专家模式具备领域深度增强等特点
当前,AI Agent(人工智能体)能力很大程度上依赖于基础大模型能力的提升,基础大模型提供核心能力,而Agent通过系统化设计将这些能力转化为实际应用价值,国产基础大模型正在强化Agent能力。
横向对比来看,不论是千问大模型还是DeepSeek,均实现支持高达1M Tokens(100万个词元)上下文长度,大模型在长文档、多轮对话信息提取上更精准。
卢言霞认为,当前基础大模型竞争的关键是编程能力、智能体能力等。强化Agent能力是基础大模型2026年的重要发展方向,可能包括深度研究、智能办公、AI代码助手等通用场景。
在AI应用端,浙江华通云数据科技有限公司副总裁林建龙在接受《每日经济新闻》记者采访时坦言,当前AI Agent仍面临一些问题。譬如大多数AI系统仍然停留在“工具”“技能”层面,无法真正成为企业的“数字化员工”。传统工作流编排和简单对话系统虽然能够完成一些预定义的任务,但缺乏深度理解业务场景、独立思考和持续学习的能力,难以满足企业复杂多变的业务需求。
林建龙表示,未来的AI Agent不是简单的工具,而是一个基于大模型之上的各个行业领域专家。这种专家Agent具备以下核心特征:第一,具备深厚的行业专业知识,能够理解并处理复杂的业务问题;第二,能够深度融入企业业务流程,与现有系统无缝对接;第三,具备持续学习和自我优化能力,能够在实践中不断提升;第四,能够独立完成特定任务,而不仅仅是提供建议或答案。
4月8日,DeepSeek上线的专家模式就提到,专家模式具备领域深度增强、多步推理可视化、引用溯源强化、自定义专家组合、长上下文压缩优化等特点。专家模式沿用了 R1的长思维链推理能力,但针对专业领域做了定向蒸馏和微调,使“快思考”与“慢思考”在领域内更平衡。
林建龙也强调了未来“专家 Agent”理念的实现,需要系统化和工程化的方法。他表示,当前华通云正围绕底座模型、数据管理、提示词工程、长期记忆等核心技术要素,构建了一套完整的AI Agent开发框架。
其中底座模型提供基础的认知和推理能力,数据管理完成对企业数据的链接和交互,提示词工程负责将业务需求转化为模型可理解的任务指令,MCP Tools(用于与外部系统进行交互的工具集或协议)提供与外部系统交互的能力,Skills(技能)封装了特定领域的专业技能,长期记忆机制则使Agent能够在多轮交互中积累经验、实现智能的个性化服务。
封面图片来源:每经媒资库