RAG认知核心优化减少幻觉
为什么值得看
OCC-RAG提出用"最优认知核心"替代传统RAG的全文检索,通过识别文档中最小充分信息片段来回答查询,降低噪声干扰。在多个QA数据集上提升了答案忠实度,对生产环境RAG系统优化有直接参考价值。
媒体预览
编辑判断
当前RAG的主流做法是检索Top-K文档块直接塞进prompt,但冗余信息是幻觉的重要来源之一。这篇的核心思路其实是"做减法"——不是找更多相关文本,而是定位最少必要信息,这和Self-RAG、Corrective RAG等"做加法"的范式形成互补。
实验显示在Natural Questions等数据集上忠实度指标有稳定提升,但论文未明确对比同样做片段筛选的REPLUG或URI方法。如果作者开源了认知核心的抽取模块,值得接入现有RAG管线做A/B测试,尤其适合长文档问答场景。