LLM 长期记忆新基准,SOTA 成绩
PaperGuru 提出首个生命周期感知记忆(LAM)形式化框架,在 PaperBench 和 SurveyBench 两个长程 Agent 基准上取得 SOTA。对构建需要跨会话保持上下文的生产级 Agent 系统有直接参考价值。
PaperGuru 提出首个生命周期感知记忆(LAM)形式化框架,在 PaperBench 和 SurveyBench 两个长程 Agent 基准上取得 SOTA。对构建需要跨会话保持上下文的生产级 Agent 系统有直接参考价值。
Lifecycle-Aware Memory for long-horizon LLM agents — 66.05% on PaperBench, 94.66% on SurveyBench, 10 peer-reviewed acceptances at FSE/ICML/TOSEM/AEI/ICoGB
当前长程 Agent 的记忆实现大多是临时方案:要么用简单向量检索做 RAG,要么把全量历史硬塞进上下文窗口,两者都无法处理信息的时效性、相关性和遗忘曲线。PaperGuru 的四公理形式化(创建、激活、衰减、归档)是第一次把这个问题严格定义下来。
与 MemGPT 等现有方案相比,关键差异在于生命周期语义是内建原语而非外部规则,这意味着记忆状态转换本身成为可优化目标。项目已有多篇顶会/期刊背书,但 115 stars 说明社区认知还在早期,工程成熟度待验证。
如果你在构建需要持续运行数周以上的研究助手、投资分析 Agent 或客服系统,这个框架值得作为记忆层的设计参考,而非直接替换现有方案。
长程LLM Agent记忆框架的学术前沿探索者,聚焦生命周期感知记忆新范式。
独特价值:首个形式化LAM框架,PaperBench/SurveyBench双SOTA,10篇顶会背书。