LLM 长期记忆新基准，SOTA 成绩

#REPO GitHub Search 2026.05.13

推荐指数 69.0 NO. 002 · 2026.05.13

Stars115创建4 天前Forks17Issues0

为什么值得看

PaperGuru 提出首个生命周期感知记忆（LAM）形式化框架，在 PaperBench 和 SurveyBench 两个长程 Agent 基准上取得 SOTA。对构建需要跨会话保持上下文的生产级 Agent 系统有直接参考价值。

Lifecycle-Aware Memory for long-horizon LLM agents — 66.05% on PaperBench, 94.66% on SurveyBench, 10 peer-reviewed acceptances at FSE/ICML/TOSEM/AEI/ICoGB

媒体预览

编辑判断

当前长程 Agent 的记忆实现大多是临时方案：要么用简单向量检索做 RAG，要么把全量历史硬塞进上下文窗口，两者都无法处理信息的时效性、相关性和遗忘曲线。PaperGuru 的四公理形式化（创建、激活、衰减、归档）是第一次把这个问题严格定义下来。

与 MemGPT 等现有方案相比，关键差异在于生命周期语义是内建原语而非外部规则，这意味着记忆状态转换本身成为可优化目标。项目已有多篇顶会/期刊背书，但 115 stars 说明社区认知还在早期，工程成熟度待验证。

如果你在构建需要持续运行数周以上的研究助手、投资分析 Agent 或客服系统，这个框架值得作为记忆层的设计参考，而非直接替换现有方案。

Star History

生态分析

Experimental

长程LLM Agent记忆框架的学术前沿探索者，聚焦生命周期感知记忆新范式。

独特价值：首个形式化LAM框架，PaperBench/SurveyBench双SOTA，10篇顶会背书。

查看原文 →