NotebookLM新增图像识别功能 实现板书内容结构化检索

NotebookLM新增图像识别功能 实现板书内容结构化检索

2025年11月17日 11:48
本文共计468个字,预计阅读时长2分钟。
来源/互联网 责编/爱力方

谷歌在NotebookLM中解锁了图像数据源入口。黑板板书、教科书扫描页、街拍表格——这些视觉信息现在可以转化为可查询的数字资产。系统自动完成OCR与语义解析的工序,自然语言成为检索图中内容的钥匙。全平台免费开放的同时,谷歌预告未来数周将推出本地处理选项。敏感资料上传云端的路径正在被重新设计。

111.jpg

多模态模型构成了新版NotebookLM的底层架构。它能区分手写潦草与印刷规整的区域,重建表格的逻辑骨架,并将这些视觉元素与既有的文本、音频、视频笔记编织成知识网络。谷歌演示现场:拍摄课堂板书后询问“左下角公式如何推导”,系统光标精准落位,随即展开推导步骤的解析。扫描教材第127页的表格后,单元格数值成为直接查询对象。街头咖啡店菜单的照片上传后,拿铁价格从像素阵列中浮现。

功能上线48小时,教育账号上传图像量突破50万页。这个数字较前一周增长340%。谷歌的路线图显示,明年NotebookLM将与AR眼镜的实时拍摄接口完成对接。“所见即所问”的交互模式正在从实验室走向现实。图像处理沿用现有免费配额。关于付费加速通道的规划,公司保持沉默。

声明:本文来自互联网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯