据 1M AI News 监测,AI 数据库初创公司 HydraDB 宣布完成 650 万美元种子轮融资。创始人 Nishkarsh 在 X 上表示,当前所有系统检索上下文的方式都是同一套路:向量搜索将一切存为扁平的 embedding,然后返回「感觉上最接近」的结果。「相似?当然。相关?几乎从来不是。」
Nishkarsh 用一个案例说明问题:有人让 AI 查一份合同,得到了一份详尽、精心组织的答案——但内容来自一个完全不同的客户文件。原因是 embedding 在语言足够接近时,无法区分 Q3 续约条款和 Q1 终止通知。他指出,一旦文档量超过 1,000 万份,这种混淆会频繁发生,「向量数据库的准确率就崩了」。
HydraDB 的方案是构建一个以本体论(ontology)为核心的上下文图谱:不只是计算向量相似度,而是映射实体之间的关系、理解文档背后的「为什么」、追踪信息随时间的演变。Nishkarsh 举例,当用户查询「Apple」时,系统知道你指的是你正在服务的那家客户公司,而不是水果。