资讯
快手AI编程模型KAT-Coder-Pro V1跻身全球榜单前十
快手研发的Agentic Coding模型KAT-Coder-Pro V1在Artificial Analysis Intelligence Index评测中取得突破性进展,以64分超越Claude4.5Sonnet,强势入围全球AI榜单Top10,并在Non-Reasoning Model榜单中斩获第一名。该模型不仅性能卓越,还实现了出色的价格与性能平衡,输出Token消耗量远低于同性能区间模型。
地平线携手生态伙伴共促机器人产业繁荣
文章介绍了地平线在2025年具身智能规模化落地关键期的战略布局,包括发布HoloMotion和HoloBrain两大开源模型,携手生态伙伴推出超100款智能产品。通过技术生态大会,地平线与清华大学、傅利叶、Vbot等伙伴探讨了从智能汽车到机器人的技术跃迁,聚焦反应式智能、情感交互等前沿方向,共同推动机器人产业向高端化、规模化发展。
Meta开源战略生变:闭源模型借力阿里Qwen,扎克伯格人才战略转向
Meta从开源先锋转向闭源战略,计划于2026年发布闭源AI模型'Avocado',其训练竟依赖阿里巴巴开源模型Qwen。这一转变源于Llama4的失败和内部重组,新任首席AI官亚历山大·王推动闭源路线,导致开源团队裁员和核心人物离职。文章揭示了Meta战略信仰的崩塌及全球AI竞争中开源与闭源的复杂博弈。
智谱开源周落幕 四项视频生成技术开放
智谱多模态开源周圆满落幕,团队开源了四项视频生成核心技术:SCAIL、RealVideo、Kaleido和SSVAE。这些技术分别针对影视级角色动画生成、实时流式视频生成、多主体一致性生成以及训练效率优化,旨在解决视频生成领域的关键难题,推动AI视频技术的发展与创新。
阿里通义发布Qwen3-Omni-Flash新版本
阿里通义Qwen团队发布最新全模态大模型Qwen3-Omni-Flash-2025-12-01,该版本基于Qwen3-Omni构建,支持文本、图像、音频和视频等多种输入形式,实现实时流式响应。升级亮点包括音视频交互体验全面优化、系统提示自定义功能开放、多语言处理能力增强以及语音生成更拟人化,显著提升了人机交互的自然度与精准度。
杭州人形企业双线并进引领产业革命
杭州两家代表性人形机器人企业——云深处科技与智澄AI,揭示了行业在技术路线上的关键分野。云深处科技走的是“硬件优先”的务实路径,从四足机器人切入,强调稳定性和场景深耕;而智澄AI则高举“模型驱动”旗帜,以世界模型为核心,追求对物理世界的通用理解。文章探讨了两种技术哲学背后的商业化策略,展现了行业从概念炒作转向务实生存的发展趋势。
瑞士科学家用虾壳研发机器人登顶刊
瑞士科学家利用废弃虾壳制造出生物混合型机器人,该机器人能够抓取物体、搬运重物并推动游泳。这项创新研究发表在《Advanced Science》期刊上,展示了将食物垃圾转化为可持续机器人技术的潜力,为环保与科技结合提供了新思路。
阿里通义发布SAPO强化学习法,提升大语言模型性能
阿里通义Qwen团队推出新型强化学习方法SAPO,通过平滑温度控制门控函数替代传统硬剪切,有效解决大语言模型在强化学习中的策略优化不稳定问题。该方法具备连续信任域、序列级一致性和token级自适应性等优势,在数学推理、代码生成等任务上表现显著优于GRPO和GSPO,为AI研究提供了新方向。
AI代码的“价格屠夫”:当Mistral,用“免费”,向GitHub Copilot,发起“总攻”
Mistral AI发布第二代开源编程模型Devstral2,拥有1230亿参数,在SWE-Bench Verified基准测试中取得72.2%的优异成绩,刷新开源代码模型纪录。该模型成本效益显著,官方宣称比Claude Sonnet便宜7倍,同时推出轻量免费版Devstral Small2和CLI工具Mistral Vibe,支持自然语言批量修改代码,为开发者提供高性价比的AI编程解决方案。
深大团队提升机器人导航成功率至72.5%
深圳大学李坚强教授团队联合多所高校提出视觉-语言导航新框架UNeMo,通过多模态世界模型与分层预测反馈机制,让机器人能预测未来视觉状态并做出更智能的导航决策。该框架在资源消耗大幅降低的同时,在未知环境中的导航成功率可达72.5%,推理效率提升40%,尤其在长轨迹导航中表现突出,相关论文已入选AAAI2026。
Mistral AI发布第二代开源编码模型 性能显著增强
Mistral AI发布第二代开源编码模型Devstral2和Devstral Small2,性能显著提升。Devstral2拥有1230亿参数,在SWE-Bench基准测试中得分72.2%,成本效益优于竞争对手,但需高性能硬件支持。Devstral Small2为轻量级模型,采用免费Apache2.0许可,适合标准硬件。同时推出Mistral Vibe命令行工具,助力开发者自动化代码修改。
全球首款原生多模态架构NEO问世,实现视觉语言无缝融合
文章介绍了全球首个原生多模态架构NEO的诞生,它由国内研究团队开发,通过统一模型设计从根本上融合视觉与语言,而非传统拼接方式。NEO凭借原生图块嵌入、三维旋转位置编码和原生多头注意力三大技术突破,在少量数据下实现性能超越,标志着AI从规模扩张转向智能架构的新方向。
MIT新方法大幅提升大模型计算效率
MIT研究团队开发了名为实例自适应缩放的新技术,通过动态调整大型语言模型的计算资源,显著提升了运算效率。该方法根据问题复杂度优化推理轨迹,使计算量减少一半的同时保持准确性,为LLM的高效应用提供了创新解决方案。
中国黑科技实现裸眼3D 未来已来无需眼镜
复旦大学博士生团队研发的EyeReal裸眼3D显示技术登上《Nature》期刊,无需眼镜即可实现超100度观看角度、全视差显示和聚焦视差效果,结合AI与计算光学突破物理限制,为虚拟现实、游戏和医疗等领域带来革命性视觉体验。
英伟达联手Mistral AI发布开放模型家族
英伟达与Mistral AI合作推出开放源的Mistral 3模型家族,采用混合专家架构,具备410亿活跃参数和6750亿总参数,针对企业AI工作负载优化。该模型支持多语言和多模态,可在云端、数据中心及边缘设备部署,同时发布九个小模型推动AI技术普及。合作旨在加速AI开发效率,助力前沿AI民主化。