LLM 长期记忆新基准,SOTA 成绩
PaperGuru 提出首个生命周期感知记忆(LAM)形式化框架,在 PaperBench 和 SurveyBench 两个长程 Agent 基准上取得 SOTA。对构建需要跨会话保持上下文的生产级 Agent 系统有直接参考价值。
Mercury Skills 是一个跨平台兼容的 AI Agent 技能库,提供 130 多个覆盖开发、DevOps、健康等 20 个领域的可安装、可组合技能。对使用 Claude Code、Cursor、Codex CLI 等工具的工程师,可直接复用结构化 expertise 而不必重复写 prompt。
A curated registry of reusable Mercury Agent, Open Claw or Hermes Agent skills designed for real developer workflows, persistent memory, and token-efficient execution.
目前大多数 AI 编程工具(Cursor、Windsurf、Claude Code)的痛点是上下文碎片化,用户每次都要重新描述项目结构和技术栈。Mercury Skills 的做法是把领域知识封装成可复用模块,类似给 Agent 装插件而非每次从零 prompt。
跟 LangChain Hub 或 OpenAI 的 GPTs 相比,它的差异化在于纯文本技能文件,不绑定任何平台生态,甚至可以直接丢给 Gemini CLI 或本地模型用。但 102 stars 说明社区还在早期验证阶段,技能质量参差不齐是开源知识库的典型风险。
如果你团队内部已经在用 Cursor rules 或 Claude 的 project instructions 做知识沉淀,可以把这个库当作参考架构,把自有规范改写成类似格式,比直接搬运它的技能更实际。
面向多IDE的跨平台Agent技能注册中心,填补通用可复用技能库空白
独特价值:130+跨领域可组合技能,支持Claude/Cursor/Codex即插即用