资讯

英伟达小模型成本仅为GPT-5 Pro三十六分之一

英伟达4B小模型NVARC在ARC-AGI2评测中以27.64%的成绩超越GPT-5 Pro，同时单任务成本仅为20美分，远低于对手的7美元。文章详细介绍了其零预训练深度学习方法和创新的合成数据管道，展示了小模型在特定领域的高效适应性和成本优势。

爱力方

2025-12-08 16:28

我国首发农耕大模型，赋能耕地保护监测

中国农业科学院发布我国首个农耕大模型1.0，专注于高标准农田建设监测和耕地保护。该模型采用创新架构，能自动检测耕地时空变化、预警风险，并对农田基础设施进行健康诊断，为农业智能化管理和可持续发展提供关键技术支撑。

aibase

2025-12-08 15:11

京东云JoyBuilder助力GR00T N1.5千卡训练，推动具身智能规模化应用

京东云JoyBuilder模型开发平台完成关键升级，成功支持GR00T N1.5模型完成千卡级训练，成为行业首家支持具身智能千卡级LeRobot开源训练框架的AI开发平台。通过全栈优化，训练效率较开源社区版本提升3.5倍，大幅加速了具身智能迈向规模化落地的进程。

爱力方

2025-12-08 15:02

阿里Qwen3-TTS发布：49种音色支持10语9方言，准确率超越主流商用模型

阿里巴巴推出Qwen3-TTS语音合成模型，支持49种音色、10种语言和9种方言，实现零样本多角色切换。该模型在WER基准测试中超越主流商用引擎，提供免费额度并已上线阿里云，适用于教育、客服、直播等场景。

aibase

2025-12-08 15:00

腾讯混元2.0内测启动，406B参数号称推理性能国内领先

腾讯发布新一代自研大模型混元2.0，总参数达406B，采用MoE架构提升推理速度，在数学、代码等复杂任务上表现突出，支持256K长上下文窗口。模型已在腾讯云API及元宝、ima等应用灰度上线，并计划于2026年开源，推动国产大模型生态发展。

爱力方

2025-12-08 11:22

微软发布VibeVoice‑Realtime 实时文本转语音模型助力互动应用

微软推出VibeVoice-Realtime-0.5B，这是一款轻量级实时文本转语音模型，支持流式文本输入和长篇语音输出。该模型能在约300毫秒内开始输出可听语音，特别适合代理对话、实时数据讲述等互动式应用。通过交错窗口设计和声学标记器优化，它在LibriSpeech测试中字错误率仅2.00%，表现卓越，为AI语音合成提供了高效解决方案。

aibase

2025-12-08 11:14

美团开源6B参数图像生成模型LongCat-Image，中文图文生成与编辑达SOTA

美团LongCat团队开源6B参数图像生成模型LongCat-Image，在文生图和图像编辑任务中达到开源SOTA水平。模型特别优化中文文字生成，支持复杂汉字渲染，适用于海报设计等场景。通过课程学习和主观评估确保高质量输出，用户可通过Hugging Face和GitHub访问体验。

aibase

2025-12-08 11:12

谷歌Colab集成KaggleHub 一键调用数据集与模型

谷歌Colab推出KaggleHub集成功能，用户现在可以直接在Colab笔记本中搜索Kaggle数据集、模型和竞赛，无需离开编辑器即可快速获取资源。新功能通过数据探索器简化了访问流程，减少了繁琐的API配置步骤，降低了技术门槛，提升了数据分析和模型开发的效率。

aibase

2025-12-08 10:27

腾讯发布混元2.0大模型，全面提升多项能力

腾讯正式发布自研大模型混元2.0（Tencent HY2.0），该模型采用混合专家（MoE）架构，拥有4060亿参数，支持256K超长上下文，在数学、科学、代码等复杂推理场景中表现卓越，综合能力稳居国内第一梯队。同时，DeepSeek V3.2也接入腾讯生态，两大模型已在元宝等AI应用中上线，并通过腾讯云开放API服务。

aibase

2025-12-06 19:02

英伟达发布AI新框架 8亿参数模型优化工具管理

英伟达与香港大学联合发布8亿参数AI模型Orchestrator，通过ToolOrchestra强化学习框架训练，能够智能协调多种工具和大型语言模型解决复杂问题。该模型在基准测试中以更低成本实现更高准确性，并能根据用户偏好灵活选择工具，为企业提供经济高效的AI解决方案。

aibase

2025-12-05 17:45

火山引擎升级豆包语音识别模型2.0 多语种识别精度显著提升

火山引擎发布豆包语音识别模型2.0，该模型在推理能力和多模态理解上实现显著升级。它不仅针对专有名词、多音字等复杂场景优化，提升识别准确率，还新增对13种海外语言的支持，并能结合图像内容进行精准识别，有效拓展了跨语言和多场景应用。

aibase

2025-12-05 16:29

阿里通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union，6B参数性能超越Flux

阿里巴巴通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union模型，这是一个仅6亿参数的高效ControlNet扩展，支持姿态、边缘、深度等多条件精确控制，显著提升图像生成的创意与精准度。模型轻量高效，硬件要求低，适用于电商设计、影视特效等专业场景，已在Hugging Face平台开源并支持商用。

aibase

2025-12-05 16:01

微软开源实时语音模型VibeVoice，0.5B参数实现300毫秒响应，支持90分钟长音频流畅播放

微软开源实时语音模型VibeVoice-Realtime-0.5B，具备极低延迟（300ms开声）、超长音频生成（90分钟不喘）和多角色对话（支持4人）等强大功能。模型轻量高效，支持中英文，情感表达自然，适用于实时语音助手、有声阅读等场景，已在HuggingFace开源。

aibase

2025-12-05 16:00

MIT算法突破登《Science》子刊，微型机器人飞行速度提升447%

麻省理工学院（MIT）团队在《Science Advances》发表最新研究，成功开发出750毫克扑翼机器人，通过创新的深度学习鲁棒管状模型预测控制（RTMPC）算法，实现了昆虫级的敏捷飞行。该机器人能在0.47秒内完成急速转向，速度提升高达447%，并能在强风中稳定飞行，突破了微型机器人飞行在敏捷性、鲁棒性和计算效率上的“不可能三角”。

机器人大讲堂

2025-12-05 15:39

中国团队研发可编程肿瘤精准绞杀技术，实现自我消亡

中国研究团队在《Science Advances》发表突破性成果，开发出可编程超软水凝胶免疫机器人（HIM）。该机器人能在磁场控制下行走、翻滚、爬行，精准抵达肿瘤部位，通过包裹式递送免疫细胞高效杀伤肿瘤，并在完成任务后自动溶解，避免二次手术风险。这项技术为细胞免疫治疗提供了靶向递送新方案，已在动物实验中验证疗效。

机器人大讲堂

2025-12-05 10:18

1 ...12 13 14 15 16 ... 20

通知

尊敬的用户

user

资讯

英伟达小模型成本仅为GPT-5 Pro三十六分之一

我国首发农耕大模型，赋能耕地保护监测

京东云JoyBuilder助力GR00T N1.5千卡训练，推动具身智能规模化应用

阿里Qwen3-TTS发布：49种音色支持10语9方言，准确率超越主流商用模型

腾讯混元2.0内测启动，406B参数号称推理性能国内领先

微软发布VibeVoice‑Realtime 实时文本转语音模型助力互动应用

美团开源6B参数图像生成模型LongCat-Image，中文图文生成与编辑达SOTA

谷歌Colab集成KaggleHub 一键调用数据集与模型

腾讯发布混元2.0大模型，全面提升多项能力

英伟达发布AI新框架 8亿参数模型优化工具管理

火山引擎升级豆包语音识别模型2.0 多语种识别精度显著提升

阿里通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union，6B参数性能超越Flux

微软开源实时语音模型VibeVoice，0.5B参数实现300毫秒响应，支持90分钟长音频流畅播放

MIT算法突破登《Science》子刊，微型机器人飞行速度提升447%

中国团队研发可编程肿瘤精准绞杀技术，实现自我消亡

快讯

均普智能回应募投延期及场地出租重启10亿元定增布局机器人领域

大厂布局养龙虾产业腾讯小米纷纷涉足背后有何考量

AI助力养龙虾热潮腾讯小米布局上门安装服务

OpenClaw爆火引热议，不同群体以独特方式参与安装热潮

刘忠军教授：推动创新医疗技术在AI领域的应用

李萌：人形机器人何时迎来"iPhone时刻"？智能玩具或成新兴大产业

帕西尼再获超10亿融资估值突破百亿以全球唯一百亿级实采全模态数据重塑具身智能模型天花板

斯坦福李飞飞团队提出新框架机器人可从错误中学习

西南科大爬壁机器人实现全角度翻转突破

穆南杉提出人类AI智能体生命进化理论

推荐专栏

爱力方

机器人大讲堂

user

资讯

英伟达小模型成本仅为GPT-5 Pro三十六分之一

我国首发农耕大模型，赋能耕地保护监测

京东云JoyBuilder助力GR00T N1.5千卡训练，推动具身智能规模化应用

阿里Qwen3-TTS发布：49种音色支持10语9方言，准确率超越主流商用模型

腾讯混元2.0内测启动，406B参数号称推理性能国内领先

微软发布VibeVoice‑Realtime 实时文本转语音模型 助力互动应用

美团开源6B参数图像生成模型LongCat-Image，中文图文生成与编辑达SOTA

谷歌Colab集成KaggleHub 一键调用数据集与模型

腾讯发布混元2.0大模型，全面提升多项能力

英伟达发布AI新框架 8亿参数模型优化工具管理

火山引擎升级豆包语音识别模型2.0 多语种识别精度显著提升

阿里通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union，6B参数性能超越Flux

微软开源实时语音模型VibeVoice，0.5B参数实现300毫秒响应，支持90分钟长音频流畅播放

MIT算法突破登《Science》子刊，微型机器人飞行速度提升447%

中国团队研发可编程肿瘤精准绞杀技术，实现自我消亡

快讯

均普智能回应募投延期及场地出租 重启10亿元定增布局机器人领域

大厂布局养龙虾产业 腾讯小米纷纷涉足背后有何考量

AI助力养龙虾热潮 腾讯小米布局上门安装服务

OpenClaw爆火引热议，不同群体以独特方式参与安装热潮

刘忠军教授：推动创新医疗技术在AI领域的应用

李萌：人形机器人何时迎来"iPhone时刻"？智能玩具或成新兴大产业

帕西尼再获超10亿融资 估值突破百亿 以全球唯一百亿级实采全模态数据重塑具身智能模型天花板

斯坦福李飞飞团队提出新框架 机器人可从错误中学习

西南科大爬壁机器人实现全角度翻转突破

穆南杉提出人类AI智能体生命进化理论

推荐专栏

爱力方

机器人大讲堂

微软发布VibeVoice‑Realtime 实时文本转语音模型助力互动应用

均普智能回应募投延期及场地出租重启10亿元定增布局机器人领域

大厂布局养龙虾产业腾讯小米纷纷涉足背后有何考量

AI助力养龙虾热潮腾讯小米布局上门安装服务

帕西尼再获超10亿融资估值突破百亿以全球唯一百亿级实采全模态数据重塑具身智能模型天花板

斯坦福李飞飞团队提出新框架机器人可从错误中学习