资讯

Sakana AI发布超轻量插件，实现大模型快速处理海量文档

2026年02月28日 10:42

本文共计880个字，预计阅读时长3分钟。

来源/aibase 责编/爱力方

大模型在处理长文本时“内存焦虑”有望成为历史。近日，总部位于东京的AI初创公司Sakana AI发布了两项突破性技术:Text-to-LoRA （T2L） 和 Doc-to-LoRA （D2L）。这两项技术通过创新的“超网络”架构，让大模型无需重新训练，就能在不到一秒的时间内“吞下”超长文档或学会新任务。

长期以来，AI开发者一直面临两难选择:是把长文档塞进对话框（导致反应变慢且极度耗内存），还是花大价钱对模型进行微调。Sakana AI给出了第三种方案——通过“一次性付费”的预训练，生成极小的权重插件(LoRA)，实现低成本、高效率的模型适配。

Doc-to-LoRA:12GB内存需求降至50MB

这是本次发布中最令人惊叹的技术。传统方式处理12.8万Token（约十万字）的文档时，模型需要占用超过12GB的显存来记录信息。而使用D2L技术，模型能将这些信息直接“消化”进不到50MB的插件中。

速度惊人:传统技术消化文档需要40到100秒，而D2L仅需不足1秒。
打破上限:它让模型能够处理比原生窗口长4倍的文本，且在“大海捞针”测试中保持了近乎完美的准确率。

Text-to-LoRA:用大白话“定制”AI

Text-to-LoRA则让模型变得更加听话。用户只需要用自然语言描述一个任务（比如“帮我解决复杂的数学竞赛题”），系统就能自动生成一个专属的性能增强插件。实验证明，这种方式生成的适配器在数学和逻辑推理任务中，表现甚至超过了专门针对该任务训练的独立模型。

跨界神技:让文字模型也能“看图”

研究人员还发现了一个意外惊喜:D2L具备强大的跨模态能力。通过将视觉信息映射到纯文字模型的参数中，一个从未见过图片的文字模型，竟然能以75.03%的准确率对图像进行分类。

Sakana AI的这一系列成果，不仅极大降低了个人和企业定制私有AI模型的门槛，也为实现更轻量、更智能的通用人工智能（AGI）开辟了新路径。

论文:https://arxiv.org/pdf/2602.15902

来源：告别“大内存”时代！Sakana AI推出超轻量插件，让大模型秒速内化海量文档 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表A³·爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

13

0

TAGS: Sakana AI 大模型优化轻量插件文档处理

相关图文

AI PCB又传新消息行业扩产趋势已定 HDI等高阶产能成“香饽饽”

AI PCB又传新消息行业扩产趋势已定 HDI等高阶产能成“香饽饽”

匿名

2026-03-13

AI冲击理财业养虾潮引发职业焦虑

AI冲击理财业养虾潮引发职业焦虑

匿名

2026-03-12

沸点计划AWE首秀具身智能机械臂 AI重构火锅未来场景

沸点计划AWE首秀具身智能机械臂 AI重构火锅未来场景

匿名

2026-03-12

AMD苏姿丰12年来首访韩国将晤三星李在镕争夺HBM产能

AMD苏姿丰12年来首访韩国将晤三星李在镕争夺HBM产能

匿名

2026-03-12

雷军谈小米手机AI战略：拥抱智能时代

雷军谈小米手机AI战略：拥抱智能时代

匿名

2026-03-12

科技巨头应对AI电荒杠杆资金加仓概念股名单出炉

科技巨头应对AI电荒杠杆资金加仓概念股名单出炉

匿名

2026-03-12

热门资讯

Notion 集成 MiniMax M2.5 打造高性价比 AI 办公生态

匿名

2026-03-02

·

94 浏览
Zopia革新短剧制作：多智能体协作，24小时自动产出电影级作品

匿名

2026-03-03

·

94 浏览
荣耀Magic V6首发端侧AI智能体打造龙虾宇宙生态

匿名

2026-03-11

·

92 浏览
AI春节大战复盘：90亿催熟流量，超级App之门如何开启

匿名

2026-03-03

·

92 浏览
腾讯回应数据抓取争议：本地镜像定位分担99%流量

匿名

2026-03-12

·

92 浏览
小米机器人新突破：视觉语言理解与实时执行双升级

匿名

2026-02-12

·

91 浏览

快讯

高德将发布首款四足机器人

2026-04-14

·

0 浏览

网易云音乐就广告出现诡异画面致歉该广告内容为男士脖子扭向背后但身体完全不动

2026-04-14

·

0 浏览

AI颠覆、科技革命搅动视听产业，这场国家级盛会将透露哪些重要信号？

2026-04-14

·

0 浏览

2025年老牌机器人企业扎根刚需场景发展

2026-04-14

·

0 浏览

亚钾国际澄清：在老挝被限产及股东资产注入传闻不实

2026-04-14

·

0 浏览

继宇树科技之后，顶级私募机构再度出手领投PNDbotics

2026-04-14

·

0 浏览

全球首个3C精密产线验证：智元精灵G2连续作业8小时，成功率超99.5%

2026-04-14

·

0 浏览

乐聚牵头国家级开源社区落地具身智能数据荒问题有望得到解决

2026-04-14

·

0 浏览

LPDDR6首发权争夺战：四巨头竞逐下一代内存王座

2026-04-14

·

12 浏览

奥尔特曼住宅遇袭的警示：AI精英叙事须及时纠偏

2026-04-14

·

0 浏览

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读

机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台

关注爱力方，掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/

浙ICP备2025176963号-1

标签云 RSS订阅滚动资讯资讯排行

下一篇

Meta打破英伟达垄断，签署数百亿美元大单租用谷歌TPU自研AI模型

2026-02-28 10:42