北电数智骄阳·工业大模型获工联院权威测评第一,登顶国产大模型工业场景榜首

北电数智骄阳·工业大模型获工联院权威测评第一,登顶国产大模型工业场景榜首

2025年12月30日 15:22
本文共计1449个字,预计阅读时长5分钟。
来源/资讯中国 责编/爱力方

近日,工信部直属科研事业单位中国工业互联网研究院发布《人工智能大模型工业应用能力测评报告》。报告显示,由北电数智自主研发的“骄阳・工业大模型”在核心工业场景能力评测中表现突出,尤其在工具调用、多步推理、工业标准问答、产品客服四项关键评测维度,均位列参评国产大模型首位,是本次测评中表现最佳的国产大模型。

本次评测由我国工业互联网领域核心研究机构——中国工业互联网研究院组织开展,旨在系统、全面、科学地评估国内外主流大模型在工业领域的应用性能,全面反映模型在工业场景落地时的综合能力水平,为工业大模型的选型与应用提供可靠依据。

为了有效指引人工智能在工业领域的落地发展,本次测评重点推出工业领域智能体能力评测专项。“骄阳·工业大模型”在国产大模型阵营中脱颖而出,在四大评测项中斩获两项第一、一项第二的成绩:

● 在智能体工具调用能力测试中,“骄阳·工业大模型”综合排名位列国产大模型第一,在工具选择与参数匹配等细分能力上表现突出,标志着模型具备强大的自主或半自主执行任务能力,可通过与多系统交互,优化或辅助复杂工业流程落地,为工业场景自动化运营奠定基础。

● 在智能体多步推理能力测试中,“骄阳·工业大模型”展现了出色的记忆管理、任务多步执行与错误检测能力。在实际工业环境中,模型在处理类似设备故障诊断、工艺参数优化等复杂的工业任务流程时,能够准确调用历史信息与中间结果,减少人工干预成本,实现更高效、精准的工业化运营与流程优化。

● 在智能体自主规划能力测试中,“骄阳·工业大模型”的表现位居国产大模型前列。在任务分解、约束识别与动态校准三项细分能力上具有突出优势,这让模型能够根据不同条件,实时优化生产排程、资源调度等多约束复杂任务;同时,出色的自主规划能力也让模型能够将长流程目标系统拆解为可执行步骤,从而提升智能排产、工艺优化等工业场景下决策的可靠性与敏捷性。

除在智能体能力评测表现亮眼外,在工业场景能力测试专项中,“骄阳·工业大模型”同样斩获佳绩,在三大评测子项中摘得两项桂冠:

在工业标准问答测试中,“骄阳·工业大模型” 在适用范围判断、专业术语理解、规则查询与定位等细分维度上优势明显,这意味着在实际工业环境中,模型可针对工艺手册、设备运维指南、安全规范等工业文档,精准定位问题核心内容,为工人快速提供准确的标准条款解读,从而为工业生产中的技术决策、流程优化提供精准信息支撑,提升研发与生产的合规性效率。

在产品客服能力评测中,“骄阳·工业大模型”在产品功能参数理解、对抗性问答等维度表现突出,这证明了模型能够提供稳定、专业、安全的应答能力。可帮助企业建立全天候、不间断的响应体系,提升客服响应的专业性与熟练度,优化服务效率与质量,进而显著提升用户满意度。

作为北电数智面向泛工业场景自主研发的大模型,“骄阳·工业大模型”此前已经在国内权威评测机构SuperCLUE发布的专项工业大模型榜单(SC-Industry)中,以总分第一的成绩登顶。模型现已在装备制造、医疗器械、家纺印刷等领域部署应用,并取得多项标杆成果。此次再度取得国产大模型最佳表现,充分印证了北电数智正在通过“技术创新+产业落地”双轮驱动,加速将工业大模型转化为驱动制造业提质增效的核心生产力。

未来,北电数智将继续深化“AI+工业”融合创新,持续优化“骄阳·工业大模型”在更多复杂场景下的表现,为中国工业高质量发展注入更多动能。

来源:工联院权威测评发布!北电数智骄阳·工业大模型多项测试排名第一,登顶工业场景下国产大模型榜首-资讯中国 | 资讯中国

声明:本文来自资讯中国,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯