英伟达小模型成本仅为GPT-5 Pro三十六分之一

英伟达小模型成本仅为GPT-5 Pro三十六分之一

英伟达4B小模型NVARC在ARC-AGI2评测中以27.64%的成绩超越GPT-5 Pro,同时单任务成本仅为20美分,远低于对手的7美元。文章详细介绍了其零预训练深度学习方法和创新的合成数据管道,展示了小模型在特定领域的高效适应性和成本优势。

爱力方 2025-12-08 16:28
7
0

我国首发农耕大模型,赋能耕地保护监测

我国首发农耕大模型,赋能耕地保护监测

中国农业科学院发布我国首个农耕大模型1.0,专注于高标准农田建设监测和耕地保护。该模型采用创新架构,能自动检测耕地时空变化、预警风险,并对农田基础设施进行健康诊断,为农业智能化管理和可持续发展提供关键技术支撑。

2025-12-08 15:11
2
0

京东云JoyBuilder助力GR00T N1.5千卡训练,推动具身智能规模化应用

京东云JoyBuilder助力GR00T N1.5千卡训练,推动具身智能规模化应用

京东云JoyBuilder模型开发平台完成关键升级,成功支持GR00T N1.5模型完成千卡级训练,成为行业首家支持具身智能千卡级LeRobot开源训练框架的AI开发平台。通过全栈优化,训练效率较开源社区版本提升3.5倍,大幅加速了具身智能迈向规模化落地的进程。

爱力方 2025-12-08 15:02
4
0

阿里Qwen3-TTS发布:49种音色支持10语9方言,准确率超越主流商用模型

阿里Qwen3-TTS发布:49种音色支持10语9方言,准确率超越主流商用模型

阿里巴巴推出Qwen3-TTS语音合成模型,支持49种音色、10种语言和9种方言,实现零样本多角色切换。该模型在WER基准测试中超越主流商用引擎,提供免费额度并已上线阿里云,适用于教育、客服、直播等场景。

2025-12-08 15:00
0
0

腾讯混元2.0内测启动,406B参数号称推理性能国内领先

腾讯混元2.0内测启动,406B参数号称推理性能国内领先

腾讯发布新一代自研大模型混元2.0,总参数达406B,采用MoE架构提升推理速度,在数学、代码等复杂任务上表现突出,支持256K长上下文窗口。模型已在腾讯云API及元宝、ima等应用灰度上线,并计划于2026年开源,推动国产大模型生态发展。

爱力方 2025-12-08 11:22
9
0

微软发布VibeVoice‑Realtime 实时文本转语音模型 助力互动应用

微软发布VibeVoice‑Realtime 实时文本转语音模型 助力互动应用

微软推出VibeVoice-Realtime-0.5B,这是一款轻量级实时文本转语音模型,支持流式文本输入和长篇语音输出。该模型能在约300毫秒内开始输出可听语音,特别适合代理对话、实时数据讲述等互动式应用。通过交错窗口设计和声学标记器优化,它在LibriSpeech测试中字错误率仅2.00%,表现卓越,为AI语音合成提供了高效解决方案。

2025-12-08 11:14
0
0

美团开源6B参数图像生成模型LongCat-Image,中文图文生成与编辑达SOTA

美团开源6B参数图像生成模型LongCat-Image,中文图文生成与编辑达SOTA

美团LongCat团队开源6B参数图像生成模型LongCat-Image,在文生图和图像编辑任务中达到开源SOTA水平。模型特别优化中文文字生成,支持复杂汉字渲染,适用于海报设计等场景。通过课程学习和主观评估确保高质量输出,用户可通过Hugging Face和GitHub访问体验。

2025-12-08 11:12
0
0

谷歌Colab集成KaggleHub 一键调用数据集与模型

谷歌Colab集成KaggleHub 一键调用数据集与模型

谷歌Colab推出KaggleHub集成功能,用户现在可以直接在Colab笔记本中搜索Kaggle数据集、模型和竞赛,无需离开编辑器即可快速获取资源。新功能通过数据探索器简化了访问流程,减少了繁琐的API配置步骤,降低了技术门槛,提升了数据分析和模型开发的效率。

2025-12-08 10:27
0
0

腾讯发布混元2.0大模型,全面提升多项能力

腾讯发布混元2.0大模型,全面提升多项能力

腾讯正式发布自研大模型混元2.0(Tencent HY2.0),该模型采用混合专家(MoE)架构,拥有4060亿参数,支持256K超长上下文,在数学、科学、代码等复杂推理场景中表现卓越,综合能力稳居国内第一梯队。同时,DeepSeek V3.2也接入腾讯生态,两大模型已在元宝等AI应用中上线,并通过腾讯云开放API服务。

2025-12-06 19:02
10
0

英伟达发布AI新框架 8亿参数模型优化工具管理

英伟达发布AI新框架 8亿参数模型优化工具管理

英伟达与香港大学联合发布8亿参数AI模型Orchestrator,通过ToolOrchestra强化学习框架训练,能够智能协调多种工具和大型语言模型解决复杂问题。该模型在基准测试中以更低成本实现更高准确性,并能根据用户偏好灵活选择工具,为企业提供经济高效的AI解决方案。

2025-12-05 17:45
22
0

火山引擎升级豆包语音识别模型2.0 多语种识别精度显著提升

火山引擎升级豆包语音识别模型2.0 多语种识别精度显著提升

火山引擎发布豆包语音识别模型2.0,该模型在推理能力和多模态理解上实现显著升级。它不仅针对专有名词、多音字等复杂场景优化,提升识别准确率,还新增对13种海外语言的支持,并能结合图像内容进行精准识别,有效拓展了跨语言和多场景应用。

2025-12-05 16:29
10
0

阿里通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union,6B参数性能超越Flux

阿里通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union,6B参数性能超越Flux

阿里巴巴通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union模型,这是一个仅6亿参数的高效ControlNet扩展,支持姿态、边缘、深度等多条件精确控制,显著提升图像生成的创意与精准度。模型轻量高效,硬件要求低,适用于电商设计、影视特效等专业场景,已在Hugging Face平台开源并支持商用。

2025-12-05 16:01
0
0

微软开源实时语音模型VibeVoice,0.5B参数实现300毫秒响应,支持90分钟长音频流畅播放

微软开源实时语音模型VibeVoice,0.5B参数实现300毫秒响应,支持90分钟长音频流畅播放

微软开源实时语音模型VibeVoice-Realtime-0.5B,具备极低延迟(300ms开声)、超长音频生成(90分钟不喘)和多角色对话(支持4人)等强大功能。模型轻量高效,支持中英文,情感表达自然,适用于实时语音助手、有声阅读等场景,已在HuggingFace开源。

2025-12-05 16:00
0
0

MIT算法突破登《Science》子刊,微型机器人飞行速度提升447%

MIT算法突破登《Science》子刊,微型机器人飞行速度提升447%

麻省理工学院(MIT)团队在《Science Advances》发表最新研究,成功开发出750毫克扑翼机器人,通过创新的深度学习鲁棒管状模型预测控制(RTMPC)算法,实现了昆虫级的敏捷飞行。该机器人能在0.47秒内完成急速转向,速度提升高达447%,并能在强风中稳定飞行,突破了微型机器人飞行在敏捷性、鲁棒性和计算效率上的“不可能三角”。

机器人大讲堂 2025-12-05 15:39
0
0

中国团队研发可编程肿瘤精准绞杀技术,实现自我消亡

中国团队研发可编程肿瘤精准绞杀技术,实现自我消亡

中国研究团队在《Science Advances》发表突破性成果,开发出可编程超软水凝胶免疫机器人(HIM)。该机器人能在磁场控制下行走、翻滚、爬行,精准抵达肿瘤部位,通过包裹式递送免疫细胞高效杀伤肿瘤,并在完成任务后自动溶解,避免二次手术风险。这项技术为细胞免疫治疗提供了靶向递送新方案,已在动物实验中验证疗效。

2025-12-05 10:18
8
0