AI医疗持续突破 谷歌开源两大模型 实现图像与语音识别

2026年01月14日 16:14
本文共计1055个字,预计阅读时长4分钟。
来源/财联社 责编/爱力方

《科创板日报》1月14日讯 近日,谷歌宣布推出新一代开源医疗AI模型MedGemma 1.5,以增强医学影像支持功能。

这款医疗AI模型可追溯至去年,当时谷歌通过其人工智能开发者基金会项目发布了MedGemma开源医疗生成式人工智能模型集,旨在为开发者提供评估和调整的起点,以适应其医疗应用场景。截至目前,其下载量已突破数百万次。此次更新能够使开发人员将模型集应用于涉及多种医学成像模式的应用,包括:

高维医学影像:计算机断层扫描(CT)、磁共振成像(MRI)和组织病理学;

纵向医学影像:胸部X光片时间序列回顾;

解剖定位:胸部X光片中解剖结构的定位;

医学文档理解:从医学实验室报告中提取结构化数据。

除了MedGemma 1.5外,谷歌还于近期发布了MedASR——一款全新的开源自动语音识别 (ASR) 模型,专为医疗听写而优化。据悉,其初始版本允许开发者将医疗语音转换为文本,并可与MedGemma无缝集成,用于执行高级推理任务。

近期以来,医疗行业应用AI趋势逐渐明确。谷歌援引风投机构Menlo Ventures的数据称,医疗保健行业正在引领企业采用人工智能的步伐,其部署AI的速度是其他行业的2.2倍。从细分环节的AI应用率来看,卫生系统以27%的占比遥遥领先,超过了门诊机构的18%,而即便是动作稍慢的支付方也有14%。

与此同时,AI巨头和初创也开始竞逐医疗赛道,近日催化不断。在OpenAI推出ChatGPTHealth几天后,Anthropic即宣布推出医疗保健和生命科学服务,使其Claude人工智能平台的用户能够共享对其健康记录的访问权限。国内方面,百川智能于昨日正式开源新一代医疗大模型Baichuan-M3,其在HealthBench中以65.1分的综合成绩位列全球第一。

中信证券认为,2026年AI医疗的逻辑发生了根本性的变化,核心在于今年AI医疗的支付方更加明确,而且支付力更强。因此,今年AI医疗的商业化确定性有望增强,并打开AI医疗商业化的空间。

投资方面,华福证券1月12日研报指出,十五五”规划开年,预计后续开年财政也将会释放更积极信号,重视超跌底部AI医疗应用机会。AI应用端需求闭环方能持续支撑AI产业可持续发展,当前AI医疗底部跌破1月主升浪最低点,政策-基本面-事件催化兼具,最新上线“蚂蚁阿福”流量凸显AI医疗应用真实需求,相关公司AI收入增长可见,商业化开启加速趋势,建议关注:康众医疗、润达医疗、嘉和美康、美年健康。

来源:AI医疗催化不断!谷歌发布两大开源模型 能看图、能听写 | 财联社

声明:本文来自财联社,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯