Meta推出CoT-Verifier:通过归因图定位AI推理错误

Meta推出CoT-Verifier:通过归因图定位AI推理错误

爱力方

爱力方

2025年11月28日 15:34
本文共计418个字,预计阅读时长2分钟。
来源/互联网 责编/爱力方

Meta AI实验室在Hugging Face发布了CoT-Verifier。这个基于Llama3.1改造的模型开始解剖链式思维的内部电路。推理过程的每一步现在暴露在结构分析之下。

传统验证方法检查最终答案。Meta选择了另一条路径。 前向推理生成完整的归因图。正确与错误推理的图结构呈现系统性差异。 轻量级分类器在这些图特征上训练。错误步骤的预测准确率达到当前最优水平。 数学、逻辑、常识任务各自展示独特的故障图谱。推理失败显示出可量化的计算模式。

image.png

归因图提供了干预通道。 实验中对高可疑节点进行定向消融。Llama3.1在MATH数据集的准确率提升4.2个百分点。主干网络保持冻结状态。 推理纠错从结果检查转向过程导航。

模型代码已开放。脚本支持一键复现。 开发者输入待验证的CoT路径。输出包含每一步的结构异常分数。系统标识最可能出错的上游节点。 论文结尾指向新的研究方向。图干预方法将扩展至代码生成和多模态推理。白盒分析可能成为大型语言模型的标准配置。

声明:本文来自互联网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯