在人工智能(AI)的发展史中,每一个时代,都有一个,定义其核心能力的关键词。
深度学习时代,这个词,是“感知”。
大语言模型时代,这个词,是“生成”。
而现在,一个全新的、也可能,是更具终极意义的时代,其大门,正被缓缓地,推开。
在近日举行的“Force原动力”年度大会上,火山引擎的总裁谭待,为这个,即将到来的新时代,给出了一个清晰的定义。
这个时代的核心,将是“行动”。而其,最核心的载体,将是“智能体”(Agent)。
谭待指出,在经历了过去两年,近乎于“狂飙突进”式的发展之后,AI大模型的竞争,其“上半场”,已经,基本结束。
这个“上半场”的核心,是“能力的-比拼”。其典型的应用形态,是我们,早已习以为常的、被动的、基于文本的“问答式”交互。
而现在,整个行业,正在不可逆转地,进入到一个,更为艰难、也更具商业价值的“下半场”。
这个“下半场”的核心,将不再是“聊天”。它,将是“干活”。
AI,正在被要求,去深入到,像汽车、制造、餐饮这类,充满了高复杂度、高动态性、以及高风险性的真实产业场景之中。在这些场景里,AI,需要,同时地,去处理,来自人类的自然语言指令、来自摄像头的实时视觉输入、来自各种传感器的物理世界数据,以及,与企业内部各种软件系统,进行交互的工具输出。
“这,要求模型,具备,一种,类似于人类的、多模态的理解能力,和对环境的、主动的操作能力,”谭待强调,“而不再是,仅仅,去依赖于,那些,由开发者,所预先设定好的、僵硬的API接口。”
然而,在这场,从“聊天”,到“干活”的伟大迁徙中,一个新的、巨大的“瓶颈”,也随之浮出水-面。
“我们发现,模型本身的能力,其实,已经足够强大,”谭待坦言,“但,如何,能够,将这种强大的、通用的能力,稳定地、可靠地、可扩展地,封装为一个,能够,在真实的生产环境中,7x24小时运行的Agent,仍然是,整个行业,都共同面临的、最大的工程化瓶颈。”
这,正是火山引擎,此次,正式发布的AgentKit,所要解决的核心问题。
它,并非又一个,全新的AI模型。
它,是一套,源自于字节跳动,那庞大的、内部业务实践的、完整的“智能体开发与运行框架”。
AgentKit,为开发者提供了一整套,覆盖了从任务规划、工具调用、记忆管理,到安全沙箱、监控回溯的全链路组件。其目标,是极大地,降低Agent的开发门槛与后期的运维成本。
谭待,更是进一步地,做出了一个,更为宏大的、也更具颠覆性的预言:
在未来的AI时代,整个数字世界的基础设施的核心,将不再是,我们今天,所熟悉的Web页面或移动App。
它,将是,智能Agent。
这个预言,其背后,是一种,对未来云计算架构的、深刻的“重构”:
-
数据库,将需要,去支持Agent,那复杂的、长期的状态的持久化。
-
计算资源,将需要,根据Agent,所执行的任务流,来进行动态的、实时的调度。
-
网络,则需要,去保障,多个Agent之间,进行协同工作时,那至关重要的、低延迟的通信。
“Agent,不是,一个,被动的‘功能模块’,”谭待,最后,总结道,“它,是一个,拥有着自己的目标、自己的记忆,和自己的行动能力的、全新的‘数字员工’。”
而在这场,深刻的“组织变革”中,一个,同样重要、也更具挑战性的问题,也随之而来。
我们,应该如何,去管理和约束,这些,日益强大的“数字员工”?
面对AI,那与生俱来的、被滥用的风险,谭待,也强调,传统的、基于“边界”的防护思想,已经,彻底失效。
安全的能力,必须,被深度地,“内生”于Agent运行的、每一个环节之中。
火山引擎,已在其AgentKit中,原生集成了,包括输入内容的过滤、输出内容的合规性校验、对敏感操作的审批流程,以及,对所有行为的、完整的审计机制。
当AI,不再,仅仅是,回答你的问题,而是开始,主动地,为你,执行任务时,一场,真正意义上的、深刻的产业智能化革命,才算真正地,开始。
而AgentKit的开源与云原生集成,或许,将成为,中国的企业,在这场,全新的“Agent经济”的浪潮中,扬帆起航的、那个,最关键的、也是最重要的“加速器”。