AI 编码代理的持久化记忆层
Beads 是一个基于 Dolt 的分布式图结构问题追踪器,为 AI 编码代理提供持久化、依赖感知的结构化记忆,替代易丢失上下文的 Markdown 计划文件。对正在构建长周期任务代理的团队来说,这是解决"做着做着就忘了"问题的关键基础设施。
Cua 让 AI Agent 在 macOS 后台无感操控原生应用,支持 Chromium、Figma、Blender 等非无障碍接口场景,不抢光标和焦点。对需要自动化复杂桌面工作流的团队,这是首次实现真正"后台运行"的跨应用 Agent 方案。
Open-source infrastructure for Computer-Use Agents. Sandboxes, SDKs, and benchmarks to train and evaluate AI agents that can control full desktops (macOS, Linux, Windows).
之前做桌面自动化的团队大多依赖 AppleScript、Apple Accessibility API 或截图+OCR 的笨办法,前者被沙盒限制死,后者慢且不准。Cua 的 trick 在于用底层输入事件注入和像素级状态推断,绕过 AX 框架的盲区,这让它能操控 Chrome 内嵌页面、WebGL 画布这些传统 RPA 工具(如 Playwright、Selenium)和 Accessibility 方案都搞不定的场景。
跟 Anthropic 的 Computer Use 或 Adept 比,Cua 不是远程 VM 方案,而是本地后台运行,这意味着响应延迟更低、数据不出境,适合金融、医疗等合规敏感场景。但代价是只绑 macOS,Windows/Linux 团队暂时用不了。
最该试的人:用 Claude Code/Cursor 做开发但卡在"Agent 没法帮我操作设计稿、调 DAW 参数、跑游戏测试"的工程师;以及做企业级 RPA 替代方案的创业者,这里有一个新的技术栈窗口。