无需向量库的RAG新方案

#REPO GitHub Trending 2026.05.08

推荐指数 72.0 NO. 004 · 2026.05.08

Stars29,434

为什么值得看

PageIndex 提出一种基于推理的 RAG 架构，完全弃用向量数据库和文本分块，通过结构化推理直接定位文档内容。对受困于向量检索精度低、chunk 边界割裂问题的工程团队，这是一条值得验证的新路径。

📑 PageIndex: Document Index for Vectorless, Reasoning-based RAG

媒体预览

编辑判断

当前 RAG 的主流范式是向量检索加分块，但 chunk 边界导致的语义断裂和向量漂移是长期痛点，大家通常用重排序、多路召回或更精细的 chunk 策略来缓解。PageIndex 的做法是彻底跳过这个环节，让模型直接对文档结构进行推理定位，这更接近人类翻书查找信息的方式。

与 LlamaIndex、LangChain 的 RAG 模板相比，这不是渐进优化而是架构替换，风险在于推理成本和延迟是否可控，以及百万级文档规模的实际表现。项目已提供基于 OpenAI Agents SDK 的 agentic 示例，如果你正在维护一套向量检索管线且对召回质量不满意，可以用一个下午跑通 demo 对比评估，而不是直接替换现有系统。

Star History

生态分析

Experimental

RAG基础设施层的颠覆性替代方案，以推理取代向量检索

独特价值：零向量、零分块的结构化推理检索，根治传统RAG精度痛点

竞品：

google/adk-python ★ 19.5k 通用Agent开发框架，PageIndex专注文档检索推理架构

microsoft/agent-framework ★ 10.2k 多Agent编排框架，PageIndex聚焦RAG检索层创新

查看原文 →