亚马逊Nova 2模型家族发布,技术性能全面领先
亚马逊在2025年re:Invent大会上发布了全新的Nova 2模型家族,包括Nova2Lite、Nova2Pro等四款模型。该系列在推理、多模态处理、代码生成和Agent任务方面展现出领先的价格性能比,并在多项基准测试中与Claude、GPT-5、Gemini等顶尖模型持平或更优。新模型还支持实时网页查找和代码执行,确保信息的准确性和时效性。
人形机器人跑动作业兼顾,稳如老狗的秘密
本文介绍了佐治亚理工学院与清华大学研究团队提出的SEEC稳定末端执行器控制框架,该框架成功解决了人形机器人在动态行走时难以保持精准操作的核心难题。通过模型增强残差学习、扰动生成策略和模块化设计,SEEC让机器人能够在行走中稳定执行端盘、握持等任务,性能超越传统方法,实现了移动与操作的高效解耦与零样本适配。
亚马逊推出Nova Forge 企业可早期注入数据定制专属模型
亚马逊在re:Invent2025大会上发布Nova Forge服务,允许企业在Nova模型训练周期的任意阶段深度注入专有数据,打造既保留前沿推理能力又深刻理解业务语境的专属“Novellas”模型,解决了企业知识融合的长期难题。
千问APP升级学习大模型 拍照答疑更精准
千问APP推出基于Qwen3训练的全新学习大模型Qwen3-Learning,具备拍照答疑、跨文化多语言解题、作业批改等功能,覆盖从小学到高中的全学科,支持印刷体和手写体识别。同时,APP还提供免费的Qwen-Image模型和万相视频生成模型,自公测以来下载量已突破1000万,展现了AI在教育领域的创新应用和巨大潜力。
商汤开源NEO架构:数据量锐减九成,多模态模型性能仍领先
商汤科技联合南洋理工大学S-Lab发布原生多模态架构NEO,通过全新设计实现像素到Token的连续映射,数据需求仅为业界平均的1/10,在多个基准测试中取得SOTA性能,并开源模型权重与训练脚本。
武大推出RGMP框架 泛化成功率87% 数据效率提升5倍
武汉大学团队提出RGMP框架,将几何语义技能推理与视觉运动控制相结合,显著提升人形机器人的环境适应能力。该框架在泛化测试中成功率高达87%,数据效率较现有最优模型提升5倍,为低成本、高效率的机器人训练提供了创新解决方案。
DeepSeek双模型重磅开源 长文本与深度思考能力再突破
DeepSeek发布V3.2双模型,标准版在128k上下文场景下与GPT-5互有胜负,深度思考版在多项基准测试中与Gemini3Pro打平。核心升级转正稀疏注意力(DSA)将长文本计算复杂度降至线性,显存占用下降40%,推理速度提升2.2倍,首次实现开源模型百万token单卡推理。模型已开源并允许商业化,下一步将开源DSA内核与RL训练框架,推动开源阵营在长文本与推理能力上冲击领先地位。
Mistral AI推出Mistral 3开源模型:128K上下文、单A100运行,价格仅为GPT-4o一半
Mistral AI发布Mistral 3系列开源模型,包括3B、8B、14B及最强的Mistral Large3,支持128K上下文长度,在单张A100上即可运行。新模型在性能基准测试中与Llama3.1相当,定价仅为GPT-4o的一半,旨在为开发者和企业提供高性价比的AI解决方案。
登顶T-RO!清华仿生“海龟”机器人,实现水陆动态环境全自主适应
清华大学研发出智能仿生两栖龟形机器人IBATR,能通过视觉-触觉融合感知系统以99.17%的准确率识别地形,并自主切换步态,实现水陆动态环境的全自主适应。该机器人采用轻量化设计,结合贝叶斯优化算法,在复杂海岸带等场景展现出高机动性与强稳定性,相关成果发表于国际顶级期刊。
机器人学的“范式转移”:超材料正重新定义“智能”,让本能先于思考
本文探讨了超材料如何赋予机器人身体本能,通过设计材料的微观结构,使机器人能够实现感知、驱动和计算的本体化。文章分析了传统机器人系统的局限性,并介绍了超材料的三大设计原则,包括力学启发架构、重构结构等,展望了未来机器人在救援、航天等领域的应用前景。
破解机器人的“小型化魔咒”?“折纸”骨架给出完美答案:更小、更强、更高效
本文介绍了首尔大学研究团队在《Science Robotics》上发表的折叠卷绕式波纹(FoRoGated)结构创新成果。该结构结合折纸与编织技术,解决了机器人伸缩机构既要紧凑存储又要高承载的核心矛盾。通过平行条带柔性编织连接,实现了多层卷绕时的平滑滑动与高强度支撑,使机器人能在0.73米高度下展开至3.43米,承载12.5公斤负载。这项技术为仓储、救援及太空探索机器人提供了突破性解决方案。
快手旗舰 Keye-VL-671B-A37B 重磅发布,多模态推理能力实现新突破
快手发布新一代旗舰多模态模型Keye-VL-671B-A37B,该模型具备'善看会想'特性,在通用视觉理解、视频分析和数学推理等核心能力上实现突破。采用DeepSeek-V3-Terminus作为基座,通过三阶段预训练和系统优化,显著提升了多模态理解与复杂推理能力。未来将强化多模态Agent能力,支持工具调用和深度思考,推动多模态AI向更通用、可靠的方向发展。
昆仑万维正式推出Mureka V7.6 与 O2 模型发布,更高质量和更具创新性
昆仑万维正式发布Mureka V7.6和O2模型,标志着AI音乐创作进入新时代。新版本在音乐生成质量、编曲能力和音质方面实现显著提升,特别优化了中文歌曲的演绎效果和情感表现。同时增强了系统速度与稳定性,支持大规模商业化应用,推动AI音乐向实时互动和协作方向发展,已吸引全球近700万用户注册体验。
大模型“幻觉”终结的开始?Meta CoT验证器发布,推理可靠性迎来分水岭
Meta AI实验室发布基于Llama3.1的CoT-Verifier模型,创新性地采用白盒方法分析AI推理过程。该工具通过TopK转码器机制和CRV方法,深入解析推理步骤的归因图结构特征差异,不仅能预测推理错误,还能通过定向干预纠正错误,为提升大型语言模型推理能力提供全新视角。
IMO金牌成AI试金石?DeepSeek-Math-V2的突破,让学术界重新审视AI极限
DeepSeek正式发布DeepSeek-Math-V2开源数学推理模型,这款6850亿参数的MoE模型成为全球首个达到国际数学奥林匹克金牌水平的开源AI。模型采用创新的‘生成-验证’双模型闭环机制,通过实时逻辑审查和自我修正实现真正的可自我验证能力。在2025年IMO竞赛中取得83.3%正确率获得金牌,在普特南数学竞赛中更是取得118/120的近乎满分成绩,全面超越此前所有公开模型。