瑞士科学家用虾壳研发机器人登顶刊

瑞士科学家用虾壳研发机器人登顶刊

瑞士科学家利用废弃虾壳制造出生物混合型机器人,该机器人能够抓取物体、搬运重物并推动游泳。这项创新研究发表在《Advanced Science》期刊上,展示了将食物垃圾转化为可持续机器人技术的潜力,为环保与科技结合提供了新思路。

机器人大讲堂
7
0

阿里通义发布SAPO强化学习法,提升大语言模型性能

阿里通义发布SAPO强化学习法,提升大语言模型性能

阿里通义Qwen团队推出新型强化学习方法SAPO,通过平滑温度控制门控函数替代传统硬剪切,有效解决大语言模型在强化学习中的策略优化不稳定问题。该方法具备连续信任域、序列级一致性和token级自适应性等优势,在数学推理、代码生成等任务上表现显著优于GRPO和GSPO,为AI研究提供了新方向。

13
0

AI代码的“价格屠夫”:当Mistral,用“免费”,向GitHub Copilot,发起“总攻”

AI代码的“价格屠夫”:当Mistral,用“免费”,向GitHub Copilot,发起“总攻”

Mistral AI发布第二代开源编程模型Devstral2,拥有1230亿参数,在SWE-Bench Verified基准测试中取得72.2%的优异成绩,刷新开源代码模型纪录。该模型成本效益显著,官方宣称比Claude Sonnet便宜7倍,同时推出轻量免费版Devstral Small2和CLI工具Mistral Vibe,支持自然语言批量修改代码,为开发者提供高性价比的AI编程解决方案。

爱力方
18
0

深大团队提升机器人导航成功率至72.5%

深大团队提升机器人导航成功率至72.5%

深圳大学李坚强教授团队联合多所高校提出视觉-语言导航新框架UNeMo,通过多模态世界模型与分层预测反馈机制,让机器人能预测未来视觉状态并做出更智能的导航决策。该框架在资源消耗大幅降低的同时,在未知环境中的导航成功率可达72.5%,推理效率提升40%,尤其在长轨迹导航中表现突出,相关论文已入选AAAI2026。

7
0

Mistral AI发布第二代开源编码模型 性能显著增强

Mistral AI发布第二代开源编码模型 性能显著增强

Mistral AI发布第二代开源编码模型Devstral2和Devstral Small2,性能显著提升。Devstral2拥有1230亿参数,在SWE-Bench基准测试中得分72.2%,成本效益优于竞争对手,但需高性能硬件支持。Devstral Small2为轻量级模型,采用免费Apache2.0许可,适合标准硬件。同时推出Mistral Vibe命令行工具,助力开发者自动化代码修改。

6
0

全球首款原生多模态架构NEO问世,实现视觉语言无缝融合

全球首款原生多模态架构NEO问世,实现视觉语言无缝融合

文章介绍了全球首个原生多模态架构NEO的诞生,它由国内研究团队开发,通过统一模型设计从根本上融合视觉与语言,而非传统拼接方式。NEO凭借原生图块嵌入、三维旋转位置编码和原生多头注意力三大技术突破,在少量数据下实现性能超越,标志着AI从规模扩张转向智能架构的新方向。

1
0

MIT新方法大幅提升大模型计算效率

MIT新方法大幅提升大模型计算效率

MIT研究团队开发了名为实例自适应缩放的新技术,通过动态调整大型语言模型的计算资源,显著提升了运算效率。该方法根据问题复杂度优化推理轨迹,使计算量减少一半的同时保持准确性,为LLM的高效应用提供了创新解决方案。

2
0

中国黑科技实现裸眼3D 未来已来无需眼镜

中国黑科技实现裸眼3D 未来已来无需眼镜

复旦大学博士生团队研发的EyeReal裸眼3D显示技术登上《Nature》期刊,无需眼镜即可实现超100度观看角度、全视差显示和聚焦视差效果,结合AI与计算光学突破物理限制,为虚拟现实、游戏和医疗等领域带来革命性视觉体验。

4
0

英伟达联手Mistral AI发布开放模型家族

英伟达联手Mistral AI发布开放模型家族

英伟达与Mistral AI合作推出开放源的Mistral 3模型家族,采用混合专家架构,具备410亿活跃参数和6750亿总参数,针对企业AI工作负载优化。该模型支持多语言和多模态,可在云端、数据中心及边缘设备部署,同时发布九个小模型推动AI技术普及。合作旨在加速AI开发效率,助力前沿AI民主化。

9
0

英伟达小模型成本仅为GPT-5 Pro三十六分之一

英伟达小模型成本仅为GPT-5 Pro三十六分之一

英伟达4B小模型NVARC在ARC-AGI2评测中以27.64%的成绩超越GPT-5 Pro,同时单任务成本仅为20美分,远低于对手的7美元。文章详细介绍了其零预训练深度学习方法和创新的合成数据管道,展示了小模型在特定领域的高效适应性和成本优势。

爱力方
7
0

我国首发农耕大模型,赋能耕地保护监测

我国首发农耕大模型,赋能耕地保护监测

中国农业科学院发布我国首个农耕大模型1.0,专注于高标准农田建设监测和耕地保护。该模型采用创新架构,能自动检测耕地时空变化、预警风险,并对农田基础设施进行健康诊断,为农业智能化管理和可持续发展提供关键技术支撑。

2
0

京东云JoyBuilder助力GR00T N1.5千卡训练,推动具身智能规模化应用

京东云JoyBuilder助力GR00T N1.5千卡训练,推动具身智能规模化应用

京东云JoyBuilder模型开发平台完成关键升级,成功支持GR00T N1.5模型完成千卡级训练,成为行业首家支持具身智能千卡级LeRobot开源训练框架的AI开发平台。通过全栈优化,训练效率较开源社区版本提升3.5倍,大幅加速了具身智能迈向规模化落地的进程。

爱力方
4
0

阿里Qwen3-TTS发布:49种音色支持10语9方言,准确率超越主流商用模型

阿里Qwen3-TTS发布:49种音色支持10语9方言,准确率超越主流商用模型

阿里巴巴推出Qwen3-TTS语音合成模型,支持49种音色、10种语言和9种方言,实现零样本多角色切换。该模型在WER基准测试中超越主流商用引擎,提供免费额度并已上线阿里云,适用于教育、客服、直播等场景。

0
0

腾讯混元2.0内测启动,406B参数号称推理性能国内领先

腾讯混元2.0内测启动,406B参数号称推理性能国内领先

腾讯发布新一代自研大模型混元2.0,总参数达406B,采用MoE架构提升推理速度,在数学、代码等复杂任务上表现突出,支持256K长上下文窗口。模型已在腾讯云API及元宝、ima等应用灰度上线,并计划于2026年开源,推动国产大模型生态发展。

爱力方
9
0

微软发布VibeVoice‑Realtime 实时文本转语音模型 助力互动应用

微软发布VibeVoice‑Realtime 实时文本转语音模型 助力互动应用

微软推出VibeVoice-Realtime-0.5B,这是一款轻量级实时文本转语音模型,支持流式文本输入和长篇语音输出。该模型能在约300毫秒内开始输出可听语音,特别适合代理对话、实时数据讲述等互动式应用。通过交错窗口设计和声学标记器优化,它在LibriSpeech测试中字错误率仅2.00%,表现卓越,为AI语音合成提供了高效解决方案。

0
0