11月18日,在2025年的OceanBase年度发布会上,这家源自蚂蚁集团的分布式数据库巨头,正式发布并宣布全面开源其首款专为AI时代打造的AI原生数据库——OceanBase seekdb。
这并非又一次在传统数据库之上,进行的“AI功能叠加”。
它是一次深刻的、从底层架构开始的、旨在将“数据存储”与“智能推理”进行深度融合的范式跃迁。
其核心目标,是为开发者,提供一个“开箱即用”的、能够让AI大模型,安全、高效地,与企业私有数据,进行实时交互的“AI数据基座”。

OceanBase的CEO杨冰,在发布会上,一针见血地指出了当前企业AI落地的一个核心瓶颈:
“AI的真正瓶颈,不在于模型,而在于数据。”
尤其是在金融、政务等对数据安全和实时性要求达到极致的行业,AI需要在毫秒级的时间内,完成基于海量私有数据的实时推理。
而传统的IT架构,为了实现这一点,往往需要将向量数据库、关系型数据库、全文搜索引擎、以及数据仓库等多个独立的系统,进行复杂的“拼接”,形成一条漫长而脆弱的数据链路。
这不仅导致了极低的开发和运维效率,更带来了严重的权限管理混乱和数据延迟风险。
“seekdb,不是传统数据库的功能叠加,”杨-冰强调,“它是专为AI时代,重构的AI原生数据库。我们的目标,是成为大模型与企业私有数据进行融合计算的那个‘实时入口层’。”
为了实现这一目标,seekdb带来了三大核心的技术突破:
第一,是其AI原生的“混合搜索”能力。
这是其与传统数据库,最根本性的“分水岭”。
seekdb支持在一个统一的查询语句中,无缝地,融合向量检索(用于语义相似性搜索)、全文搜索(用于关键词匹配)以及传统的标量过滤(用于精确条件筛选)。
例如,在金融反欺诈的场景中,风控人员,现在可以用一句近乎于自然语言的查询,来替代过去需要跨多个系统进行的复杂操作:
查询“最近7天内,所有交易金额超过5万元、且交易地点出现异常、并且其行为模式,与已知的历史欺诈样本,在向量空间上高度相似”的所有用户。
这种能力,其背后,是seekdb采用的“粗排+精排”的多阶段检索机制,以及其对向量、文本、JSON、GIS(地理信息)等多模态数据的统一存储与索引能力。
第二,是极致简化的部署与使用体验。
seekdb被设计为极度的轻量化和敏捷。
其最低的运行要求,仅为1核CPU和2GB内存。开发者,可以通过一句pip install命令,实现“一键安装、秒级启动”。
它支持嵌入式和客户端/服务器两种部署模式,可以被轻松地,集成到智能Agent、本地应用或云端服务中,极大地,降低了AI应用的工程化门槛。
第三,是其对开发者生态的全面拥抱。
seekdb以Apache 2.0这一最开放的协议,向全球进行了开源。
它全面兼容HuggingFace、Dify、LangChain等超过30种主流的AI框架,以及MCP大模型协议,并同时提供了传统的SQL和更受AI开发者青-睐的Python SDK两种交互方式。
AIbase的分析认为,OceanBase seek-db的发布和开源,深刻地,揭示了数据库这一古老领域,在AI时代,一个至关重要的进化方向:
未来的数据库,必须能够同时地,为“人类”和“AI智能体”,这两种截然不同的“用户”,提供服务。
-
对于人类用户(例如,DBA或业务分析师),它需要提供稳定、可靠、高性能的事务处理(TP)和分析处理(AP)能力。
-
对于AI智能体,它则需要提供一个能够“理解”数据语义的、高效的、实时的混合搜索入口。
OceanBase的“Data×AI”战略,正是试图在一个统一的、一体化的内核中,同时满足这三种日益融合的需求。
而seekdb,正是这场宏大战略中,那枚最锋利的、负责“破局”的“先锋”。
当数据库,不再仅仅是一个被动地“存储”数据的仓库,而开始进化为一个能够主动地“理解”数据、并在数据源头,直接驱动实时、可信智能的“引擎”时,一场真正意义上的、由数据驱动的“智能原生”架构革命,才算真正地,拉开了序幕。