Agent 检索策略首次系统对比

#ARTICLE HackerNews 2026.06.10

值得看指数 73.0 NO. 007 · 2026.06.10

发布2026/06/09Score87Comments41

为什么值得看

论文首次系统比较了 RAG、工具调用等检索策略与 Agent 架构的交互效果，发现简单文本匹配（grep 级）在特定场景下竟优于复杂向量检索。对构建 Agent 搜索系统的工程师有直接选型参考价值。

编辑判断

这篇论文的隐性价值在于戳破了一个行业惯性：大家做 Agent 搜索时默认上向量数据库+重排序的复杂栈，但作者发现当 Agent 具备多步推理和工具调用能力时，检索端的'智能'边际效用递减。这类似于去年 Google 那篇'RAG 不需要那么大模型'的发现，但反向作用于检索侧。

如果你的 Agent 已经做了多轮规划和工具编排，不妨先用 BM25 或甚至 grep 跑 baseline，很可能省掉一套向量 infra 的维护成本。论文代码未明确是否开源，建议关注 arXiv 后续更新。

社区反馈

意见分歧 42 条评论

核心争论：简单文本匹配 vs 复杂向量检索的适用边界，以及是否应让 Agent 自主多工具选择

sys_64738

Surely 'strings' would be even better?

yodon

Feels important, but I wish they also had compared against something like MeiliSearch or Algolia.

verdverm

100%, there's even Typesense, open source Algolia, which can do hybrid search and a number of other fancy things I'm currently working on a markdown kb / search tool for my agents, in part built on TS

替代方案： MeiliSearchAlgoliaTypesenseripgrepugrepgsc-clictagsHotdocs

查看原文 →