谷歌发布首款离线 AI 听写应用 Eloquent:手机秒变专业速录员

2026年04月07日 10:22
本文共计751个字,预计阅读时长3分钟。
来源/aibase 责编/爱力方

当地时间4月6日(周一),谷歌在 iOS 平台低调上线了一款名为 “Google AI Edge Eloquent” 的实验性语音输入应用。该应用主打“离线优先”与“智能润色”,旨在利用边缘侧 AI 技术,将自然的口语实时转化为专业、精炼的文本。此举标志着谷歌正式切入由 Wispr Flow 和 SuperWhisper 领跑的高端 AI 语音转文字赛道。

核心技术与功能亮点:

Eloquent 搭载了谷歌最新发布的 Gemma4 系列(E2B/E4B 规格)自动语音识别(ASR)模型。该模型支持完全离线运行,用户在下载模型包后即可实现本地转录,有效保障隐私并降低延迟。应用具备强大的“智能去杂”功能,能自动识别并过滤“嗯”、“啊”等语气词及重复修正,输出逻辑连贯的文本。

产品深度集成与交互:

  • 多模态风格转换: 提供“要点”、“正式”、“简短”和“完整”四种文本处理模式。

  • 云端协同(可选): 开启云模式后,应用将调用云端 Gemini 模型进行深层文本清理。

  • 个性化语境: 支持从 Gmail 导入用户专属的关键词、人名及术语,并允许建立自定义词汇表。

  • 生产力统计: 实时显示听写字数、每分钟字速(WPM)及历史会话记录。

市场策略与未来布局:

目前该应用在 iOS App Store 免费提供,无订阅费或使用限制,相比每年收费85美元的 SuperWhisper 等竞品具有极强冲击力。尽管首发于 iOS,但官方描述确认了 Android 版本的开发计划,并预告将支持系统级键盘集成及类似 Wispr Flow 的悬浮按钮功能。作为 Google AI Edge 品牌下的重要成员,Eloquent 的发布不仅是工具类应用的尝试,更是谷歌展示 Gemma 模型在移动端部署能力的标杆案例。

来源:谷歌悄然发布 Google AI Edge Eloquent:基于 Gemma4的免费离线 AI 听写神器 | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/