HydraDB融资650万美元种子轮，用本体论上下文图谱挑战向量数据库：「相似度0.94不代表相关」

据 1M AI News 监测，AI 数据库初创公司 HydraDB 宣布完成 650 万美元种子轮融资。创始人 Nishkarsh 在 X 上表示，当前所有系统检索上下文的方式都是同一套路：向量搜索将一切存为扁平的 embedding，然后返回「感觉上最接近」的结果。「相似？当然。相关？几乎从来不是。」

Nishkarsh 用一个案例说明问题：有人让 AI 查一份合同，得到了一份详尽、精心组织的答案——但内容来自一个完全不同的客户文件。原因是 embedding 在语言足够接近时，无法区分 Q3 续约条款和 Q1 终止通知。他指出，一旦文档量超过 1,000 万份，这种混淆会频繁发生，「向量数据库的准确率就崩了」。

HydraDB 的方案是构建一个以本体论（ontology）为核心的上下文图谱：不只是计算向量相似度，而是映射实体之间的关系、理解文档背后的「为什么」、追踪信息随时间的演变。Nishkarsh 举例，当用户查询「Apple」时，系统知道你指的是你正在服务的那家客户公司，而不是水果。

原文链接

纠错/举报