header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
扫码下载APP

HydraDB融资650万美元种子轮,用本体论上下文图谱挑战向量数据库:「相似度0.94不代表相关」

1M AI News 监测,AI 数据库初创公司 HydraDB 宣布完成 650 万美元种子轮融资。创始人 Nishkarsh 在 X 上表示,当前所有系统检索上下文的方式都是同一套路:向量搜索将一切存为扁平的 embedding,然后返回「感觉上最接近」的结果。「相似?当然。相关?几乎从来不是。」

Nishkarsh 用一个案例说明问题:有人让 AI 查一份合同,得到了一份详尽、精心组织的答案——但内容来自一个完全不同的客户文件。原因是 embedding 在语言足够接近时,无法区分 Q3 续约条款和 Q1 终止通知。他指出,一旦文档量超过 1,000 万份,这种混淆会频繁发生,「向量数据库的准确率就崩了」。

HydraDB 的方案是构建一个以本体论(ontology)为核心的上下文图谱:不只是计算向量相似度,而是映射实体之间的关系、理解文档背后的「为什么」、追踪信息随时间的演变。Nishkarsh 举例,当用户查询「Apple」时,系统知道你指的是你正在服务的那家客户公司,而不是水果。

举报 纠错/举报
纠错/举报
提交
新增文库
仅自己可见
公开
保存
选择文库
新增文库
取消
完成