上海人工智能实验室推出DualVLN,机器人视觉语言导航成功率提升至70.7%

上海人工智能实验室推出DualVLN,机器人视觉语言导航成功率提升至70.7%

上海人工智能实验室提出的DualVLN框架,通过解耦高层语义推理与低层运动控制,采用‘慢思考、快行动’的双系统架构,显著提升了机器人视觉语言导航的性能。该方案在VLN-CE等基准测试中取得70.7%的导航成功率,刷新纪录,并在动态行人场景中展现出强大的稳健性和避障能力,推动机器人导航向现实应用迈进。

2025-12-31 17:22
2
0

顶刊发布!失明患者迎来新希望 机器人视网膜静脉插管系统问世

顶刊发布!失明患者迎来新希望 机器人视网膜静脉插管系统问世

约翰斯·霍普金斯大学团队在《Science Robotics》发表突破性研究,开发出基于深度学习的自主视网膜静脉插管系统。该系统利用三个卷积神经网络实现微米级精准操作,在离体猪眼实验中成功率高达90%,并能实时补偿眼部运动。这项技术突破了人类手部震颤的生理极限,大幅简化手术流程,为视网膜静脉阻塞患者提供了精准、高效的新治疗希望,有望推动高难度眼科手术的普及化。

2025-12-31 11:36
1
0

多模态大模型最新评测结果公布 Gemini-3-Pro稳居榜首 国产模型豆包、商汤表现亮眼 Qwen3-VL成为首个开源高分模型

多模态大模型最新评测结果公布 Gemini-3-Pro稳居榜首 国产模型豆包、商汤表现亮眼 Qwen3-VL成为首个开源高分模型

SuperCLUE-VLM发布2025年12月多模态视觉语言模型评测榜单,谷歌Gemini-3-Pro以83.64分断层领先。国产模型中,商汤SenseNova V6.5Pro和字节豆包大模型表现亮眼,分别位列第二、第三。阿里Qwen3-VL成为首个总分突破70分的开源模型,推动技术民主化。榜单揭示了多模态竞赛进入实用化新阶段,视觉推理仍是关键瓶颈。

2025-12-31 11:36
0
0

隐私无忧!离线AI笔记助手WitNote问世

隐私无忧!离线AI笔记助手WitNote问世

WitNote是一款完全离线的AI笔记助手,支持Windows和macOS平台,让用户能在本地使用大语言模型进行文本润色、总结和续写等操作,所有数据均保留在本机,无需担心隐私泄露或支付月费。它支持Markdown编辑,并能一键导入Obsidian的.md文件,提供快速、安全的离线笔记体验。

2025-12-30 18:05
0
0

三星Exynos 2600芯片推动AI突破,模型体积锐减九成

三星Exynos 2600芯片推动AI突破,模型体积锐减九成

三星新一代Exynos 2600芯片整合Nota公司的AI模型优化技术,能在保持高精度的同时将AI模型体积缩小90%以上,支持大规模生成式AI模型在移动设备本地流畅运行,无需网络连接。该合作还涉及开发Exynos AI Studio工具链,简化AI模型部署流程,推动移动AI技术的普及与应用。

爱力方 2025-12-30 17:23
11
0

北电数智骄阳·工业大模型获工联院权威测评第一,登顶国产大模型工业场景榜首

北电数智骄阳·工业大模型获工联院权威测评第一,登顶国产大模型工业场景榜首

中国工业互联网研究院最新测评显示,北电数智自主研发的“骄阳·工业大模型”在工具调用、多步推理、工业标准问答和产品客服等关键工业场景能力评测中均位列国产大模型首位,成为本次测评表现最佳的国产模型。该模型已在装备制造、医疗器械等领域成功应用,展现了其在优化工业流程、提升生产效率方面的强大潜力。

2025-12-30 15:22
9
0

北大发布ManualVLA模型 长程精细任务成功率显著提升

北大发布ManualVLA模型 长程精细任务成功率显著提升

北京大学联合团队提出的ManualVLA模型,通过创新的双专家架构和手册链式思维机制,显著提升了机器人在乐高组装、物体重排等长程精细任务中的规划与执行能力,平均成功率比现有最佳方案高出32%。

2025-12-29 17:51
14
0

AI编程工具Windsurf Wave13发布 SWE-1.5模型限免

AI编程工具Windsurf Wave13发布 SWE-1.5模型限免

Windsurf AI编程工具发布Wave13版本,核心升级包括默认启用高性能SWE-1.5模型并限时免费开放,引入并行智能体技术实现多任务协同开发,以及优化交互体验如并排视图和专用终端。这些改进旨在提升复杂代码处理效率和团队协作流畅度。

2025-12-29 16:49
3
0

输入脚本秒生视频 字节开源StoryMem解决AI角色变脸问题

输入脚本秒生视频 字节开源StoryMem解决AI角色变脸问题

字节跳动与南洋理工大学联合开源StoryMem框架,通过创新的视觉记忆机制,将单镜头视频扩散模型转化为多镜头长视频故事讲述者。该框架能根据分镜脚本自动生成超过1分钟、角色与场景高度连贯的叙事视频,有效解决AI视频生成中的角色“变脸”和场景跳变问题,适用于广告、影视预制作和短视频创作等领域。

爱力方 2025-12-29 14:41
16
0

机器人治疗自闭症效果显著 临床试验132名儿童验证眼神微笑优势

机器人治疗自闭症效果显著 临床试验132名儿童验证眼神微笑优势

最新发表在《Science Robotics》的研究通过两项随机对照试验,首次提供了机器人辅助治疗自闭症的高质量临床证据。研究发现,机器人治疗师在提升自闭症儿童核心社交技能方面与传统疗法效果相当,同时能显著增加孩子的眼神注视时间和自发微笑频率,有效解决传统疗法中孩子容易失去兴趣的瓶颈问题。

机器人大讲堂 2025-12-29 14:32
19
0

NVIDIA推出NitroGen:游戏代理视觉行动新突破

NVIDIA推出NitroGen:游戏代理视觉行动新突破

NVIDIA推出NitroGen视觉行动基础模型,能够从网络游戏视频中直接学习操作,覆盖超过1000款游戏。该模型经过4万小时训练,配备通用模拟器和预训练策略,在新游戏中表现提升显著,零-shot评估任务完成率达45%-60%。

2025-12-29 11:31
10
0

视频AI应用几分钟即可搭建 开源框架VideoPipe简化CV开发

视频AI应用几分钟即可搭建 开源框架VideoPipe简化CV开发

VideoPipe是一款开源视频分析框架,通过创新的管道架构让开发者像搭积木一样快速构建视频AI应用。它支持多源视频流输入、多样化推理引擎,并覆盖从拉流到推流的完整处理链路,极大降低了计算机视觉应用的开发门槛和落地周期。

爱力方 2025-12-29 11:16
4
0

智谱GLM-4.7编程大赛夺冠,引领开源AI新方向

智谱GLM-4.7编程大赛夺冠,引领开源AI新方向

智谱GLM-4.7模型在WebDev编程榜单上超越GPT-5.2,成为开源大模型第一,被誉为Claude Code最佳平替。文章详细介绍了其技术优势,包括后训练优化、多语言编码支持及在消费级显卡上的高效运行,同时宣布开源Slime框架,展现了国产AI模型的国际竞争力。

爱力方 2025-12-29 10:48
4
0

石智航WIYH数据集开源,全球首款具身VLTA多模态数据加速智能落地

石智航WIYH数据集开源,全球首款具身VLTA多模态数据加速智能落地

它石智航开源全球首个具身VLTA多模态数据集WIYH,通过Human-centric采集范式破解真实世界数据难题,包含超10万条人类操作视频、40余种任务类型,覆盖多行业场景,为具身智能提供高质量训练数据,加速机器人技术落地。

2025-12-26 17:59
1
0

Liquid AI发布LFM2-2.6B-Exp实验模型 性能超越百亿级巨兽

Liquid AI发布LFM2-2.6B-Exp实验模型 性能超越百亿级巨兽

Liquid AI发布仅2.6B参数的实验性模型LFM2-2.6B-Exp,该模型通过纯强化学习优化,在指令跟随、知识问答和数学推理等基准测试中表现卓越,甚至超越数百亿参数的大型模型。专为边缘设备设计,支持高效本地部署,已完全开源,加速高性能AI向设备端普及。

爱力方 2025-12-26 17:16
10
0