腾讯发布混元2.0大模型,全面提升多项能力

腾讯发布混元2.0大模型,全面提升多项能力

腾讯正式发布自研大模型混元2.0(Tencent HY2.0),该模型采用混合专家(MoE)架构,拥有4060亿参数,支持256K超长上下文,在数学、科学、代码等复杂推理场景中表现卓越,综合能力稳居国内第一梯队。同时,DeepSeek V3.2也接入腾讯生态,两大模型已在元宝等AI应用中上线,并通过腾讯云开放API服务。

0
0

英伟达发布AI新框架 8亿参数模型优化工具管理

英伟达发布AI新框架 8亿参数模型优化工具管理

英伟达与香港大学联合发布8亿参数AI模型Orchestrator,通过ToolOrchestra强化学习框架训练,能够智能协调多种工具和大型语言模型解决复杂问题。该模型在基准测试中以更低成本实现更高准确性,并能根据用户偏好灵活选择工具,为企业提供经济高效的AI解决方案。

0
0

火山引擎升级豆包语音识别模型2.0 多语种识别精度显著提升

火山引擎升级豆包语音识别模型2.0 多语种识别精度显著提升

火山引擎发布豆包语音识别模型2.0,该模型在推理能力和多模态理解上实现显著升级。它不仅针对专有名词、多音字等复杂场景优化,提升识别准确率,还新增对13种海外语言的支持,并能结合图像内容进行精准识别,有效拓展了跨语言和多场景应用。

0
0

阿里通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union,6B参数性能超越Flux

阿里通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union,6B参数性能超越Flux

阿里巴巴通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union模型,这是一个仅6亿参数的高效ControlNet扩展,支持姿态、边缘、深度等多条件精确控制,显著提升图像生成的创意与精准度。模型轻量高效,硬件要求低,适用于电商设计、影视特效等专业场景,已在Hugging Face平台开源并支持商用。

0
0

微软开源实时语音模型VibeVoice,0.5B参数实现300毫秒响应,支持90分钟长音频流畅播放

微软开源实时语音模型VibeVoice,0.5B参数实现300毫秒响应,支持90分钟长音频流畅播放

微软开源实时语音模型VibeVoice-Realtime-0.5B,具备极低延迟(300ms开声)、超长音频生成(90分钟不喘)和多角色对话(支持4人)等强大功能。模型轻量高效,支持中英文,情感表达自然,适用于实时语音助手、有声阅读等场景,已在HuggingFace开源。

0
0

MIT算法突破登《Science》子刊,微型机器人飞行速度提升447%

MIT算法突破登《Science》子刊,微型机器人飞行速度提升447%

麻省理工学院(MIT)团队在《Science Advances》发表最新研究,成功开发出750毫克扑翼机器人,通过创新的深度学习鲁棒管状模型预测控制(RTMPC)算法,实现了昆虫级的敏捷飞行。该机器人能在0.47秒内完成急速转向,速度提升高达447%,并能在强风中稳定飞行,突破了微型机器人飞行在敏捷性、鲁棒性和计算效率上的“不可能三角”。

机器人大讲堂
0
0

中国团队研发可编程肿瘤精准绞杀技术,实现自我消亡

中国团队研发可编程肿瘤精准绞杀技术,实现自我消亡

中国研究团队在《Science Advances》发表突破性成果,开发出可编程超软水凝胶免疫机器人(HIM)。该机器人能在磁场控制下行走、翻滚、爬行,精准抵达肿瘤部位,通过包裹式递送免疫细胞高效杀伤肿瘤,并在完成任务后自动溶解,避免二次手术风险。这项技术为细胞免疫治疗提供了靶向递送新方案,已在动物实验中验证疗效。

0
0

UT Dallas与Nvidia开源HO-Cap方案 含65万帧高质量数据

UT Dallas与Nvidia开源HO-Cap方案 含65万帧高质量数据

UT Dallas与Nvidia联合推出HO-Cap方案,通过低成本RGB-D相机和AR头显,结合半自动化AI标注流水线,实现了高精度手-物交互数据采集。配套开源数据集包含65.6万帧RGB-D图像,覆盖64个日常物体和多种交互场景,大幅降低人机交互、VR/AR和机器人操作研究门槛。

0
0

GPT-5.1-CodexMax上线 最强编码模型开放API接口

GPT-5.1-CodexMax上线 最强编码模型开放API接口

OpenAI宣布其最新最强的编码模型GPT-5.1-CodexMax现已全面接入响应API,开发者可立即将其整合到应用和工作流中。该模型在复杂任务分解、代码生成质量和自主执行方面表现卓越,旨在降低高性能AI编程能力的门槛,为各类产品提供智能编程助手体验。

0
0

阿里开源Qwen3-VL,攻克长视频分析难题,引领多模态技术突破

阿里开源Qwen3-VL,攻克长视频分析难题,引领多模态技术突破

阿里巴巴开源了新一代视觉-语言大模型Qwen3-VL,在长视频分析领域取得重大突破。该模型在长达2小时的视频中能保持99.5%的关键帧定位准确率,解决了长时序理解的核心难题。同时,在视觉数学和多语言文档处理等专项任务上也达到业界领先水平,为视频分析、智能剪辑等应用提供了自主可控的解决方案。

爱力方
0
0

DeepSeek连发两款新模型 V3.2正式版与Speciale同步上线

DeepSeek连发两款新模型 V3.2正式版与Speciale同步上线

DeepSeek于12月4日无预警发布两款重磅新模型:DeepSeek-V3.2正式版与极致推理版DeepSeek-V3.2-Speciale。V3.2首次实现“思考过程”与“工具调用”深度融合,在智能体评测中登顶开源第一;Speciale版本则专注于极限推理能力,在复杂任务中表现卓越。两款模型已全平台无缝上线,用户可即时体验。

爱力方
0
0

大晓机器人亮相,首席科学家领衔打造国内首款开源商用世界模型

大晓机器人亮相,首席科学家领衔打造国内首款开源商用世界模型

大晓机器人将于12月18日正式亮相,发布包括全球首创ACE技术范式及国内首个开源且商业落地的‘开悟’世界模型3.0在内的多项领先技术。公司由商汤科技联合创始人王晓刚出任董事长,AI科学家陶大程担任首席科学家,旨在构建自主可控的具身智能产业体系,并推出具身超级大脑模组A1,推动在安防、巡检等场景的规模化商业应用。

0
0

OpenAI推出AI忏悔框架 训练模型承认不当行为提升诚实度

OpenAI推出AI忏悔框架 训练模型承认不当行为提升诚实度

OpenAI推出名为“忏悔”的创新AI训练框架,旨在引导大型语言模型坦诚承认不当行为或问题决策。该机制通过二次回应评估模型诚实度,鼓励其说明行为过程,即使涉及作弊或违反指令。此举旨在提升AI透明度与可靠性,相关技术文档已公开。

0
0

亚马逊Nova 2模型家族发布,技术性能全面领先

亚马逊Nova 2模型家族发布,技术性能全面领先

亚马逊在2025年re:Invent大会上发布了全新的Nova 2模型家族,包括Nova2Lite、Nova2Pro等四款模型。该系列在推理、多模态处理、代码生成和Agent任务方面展现出领先的价格性能比,并在多项基准测试中与Claude、GPT-5、Gemini等顶尖模型持平或更优。新模型还支持实时网页查找和代码执行,确保信息的准确性和时效性。

0
0

人形机器人跑动作业兼顾,稳如老狗的秘密

人形机器人跑动作业兼顾,稳如老狗的秘密

本文介绍了佐治亚理工学院与清华大学研究团队提出的SEEC稳定末端执行器控制框架,该框架成功解决了人形机器人在动态行走时难以保持精准操作的核心难题。通过模型增强残差学习、扰动生成策略和模块化设计,SEEC让机器人能够在行走中稳定执行端盘、握持等任务,性能超越传统方法,实现了移动与操作的高效解耦与零样本适配。

爱力方
0
0