AI客服的“终局”范本?当美团,用10%的数据,换来12%的满意度提升

爱力方

爱力方

2025年11月26日 10:40
本文共计1904个字,预计阅读时长7分钟。
来源/互联网 责编/爱力方

人工智能(AI)的浪潮,正从“通用能力”的展示,不可逆转地,涌向“垂直行业”的深度落地之时,中国的本地生活巨头——美团——刚刚,为我们,提供了一个堪称“教科书级”的成功范本。

近日,美团的LongCat Interaction团队,正式发布了其WOWService大模型交互系统的技术白皮书。

这并非又一次停留在PPT层面的“概念发布”。

它,是一份详细的、来自于真实世界最大规模、最复杂业务场景之一的“实战报告”。

其核心的、经过了线上全量验证的“战果”,是惊人的:

通过一套全新的“数据+知识双驱动”与“四阶段训练”体系,美团,在仅使用了相当于传统方案10%的标注数据量的情况下,成功地,将其智能客服,在复杂业务场景下的问题解决率,提升了9%,而用户的满意度,则提升了12%。

这场“以小博大”的效率革命,其背后,是美团,对如何将一个“通用”的大模型,“改造”为一个“懂业务”的“专家”的、一次系统性的方法论重塑。

其核心的框架,可以被拆解为三个关键的支柱:

  1. “数据 + 知识”的双轮驱动:

    • 它,不再是像传统的模型训练那样,仅仅是去“喂”给模型海量的、非结构化的对话日志。

    • 它,创新性地,将这些真实的、包含了用户真实情感和口语化表达的**“对话数据”,与那些结构化的、逻辑严谨的、包含了SKU、促销规则、售后政策等信息的“业务知识图谱”**,进行了联合的训练。

    • 其结果是,模型,不仅学会了如何“像人一样说话”,更学会了如何“像一个资深业务专家一样,准确地思考”。其在关键业务知识点上的回答准确率,高达96%

  2. “多智能体”(Multi-Agent)的协同作战:

    • 它,不再依赖于一个单一的、试图解决所有问题的“全能型”大模型。

    • 它,构建了一套“总指挥 + 特种兵”的协同作战体系:

      • 一个主Agent,负责对用户的意图,进行初步的识别和理解,并将任务,分发给最合适的“专家”。

      • 而一系列的子Agent,则各自专精于一个特定的、垂直的业务场景,例如,退款、修改地址、开发票、预定酒店等。

    • 这种“专业的人,做专业的事”的模式,使得其平均的响应时长,下降了27%

  3. “自我优化”的进化闭环:

    • 系统,会每日自动地从线上数以亿计的真实对话中,抽取那些获得了用户“高评分”的成功案例。

    • 然后,它会自动地为这些成功的对话,进行“标注”,并将其作为最高质量的“养料”,重新地“回流”到下一轮的模型训练之中。

    • 这构建起了一个“7天一小迭代”的、永不停止的、自我进化的飞轮。

而比其框架设计,更具“实战”价值的,是其在白皮书中,所详细披露的“四阶段精益训练流程”。

这几乎可以被视为,所有希望在垂直领域,深度应用大模型的企业,都应遵循的一份“标准作业程序”(SOP):

  • 第一阶段(持续预训练): 用高达500亿token的、精选的本地生活领域的语料,对一个通用的基座大模型,进行“二次预训练”,使其,首先,“听懂”这个行业的“行话”。

  • 第二阶段(有监督微调): 仅用10%的、高质量的人工标注数据,便达到了传统方法需要100%标注数据,才能达到的效果。这一步,为其,节省了高达75%的、昂贵的标注成本。

  • 第三阶段(直接偏好优化,DPO): 通过大量的“好”与“坏”的回答样本对,对模型,进行“风格”上的校准,使其,在保证准确性的同时,也能够,以一种“既礼貌,又高效”的方式,与用户进行沟通。

  • 第四阶段(基于人类反馈的强化学习,RLHF): 将模型的线上实时奖励,直接地,与“问题解决率 + 用户评分”这两个最核心的“商业目标”,进行挂钩,从而,驱动模型,自动地,向着“商业价值最大化”的方向,进行对齐。

爱力方的分析认为,美团WOWService的这次技术白皮书发布,其意义,已远超一次单纯的企业技术宣传。

它更像是一次深刻的“知识共享”。

它系统性地,回答了在AI应用的“下半场”,那个最核心、也最关键的问题:如何,将一个“无所不知”的“通才”AI,真正地,改造为一个,能够在复杂的、真实的商业场景中,“解决问题”的“专才”AI?

根据白皮书的数据,WOWService系统,目前,已在美团的外卖、到店、酒店、出行等六大核心业务线上,完成了全量的部署。

在大促的高峰期,其系统,能够稳定地,承受超过8000 QPS(每秒查询次数)的巨大压力。

而其为整个集团,所带来的、最直接的商业回报,是18%的、整体客服人力的节省,以及,在复杂场景下,高达84%的、一次性问题解决率。

美团,也宣布计划将在2026年第一季度,开源其<7B参数的轻量化版本WOWService-Lite,以及其核心的多智能体框架,供整个社区,进行二次开发。

一场由“实战派”,所引领的、关于“AI深度落地”的全新篇章,正被中国的科技巨头,悍然开启。

声明:本文来自互联网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯