AI 代理后台操控电脑不抢鼠标
推荐指数 74.0 NO. 001 · 2026.06.16
Stars18,104
为什么值得看
Cua 是一套让 AI 代理在后台静默操控 macOS/Windows 桌面的工具链,支持点击、输入、验证而不抢占用户光标。对需要部署 coding agent 或自动化工作流的团队,解决了人机共用一台机器的核心冲突。
Open-source infrastructure for Computer-Use Agents. Sandboxes, SDKs, and benchmarks to train and evaluate AI agents that can control full desktops (macOS, Linux, Windows).
媒体预览
编辑判断
之前让 AI 代理操作电脑的主流方案是 Docker 容器或远程 Linux VNC,但 macOS 原生应用和 Windows GUI 的自动化一直是盲区,团队要么买专用机器隔离,要么忍受光标被抢。Cua 的差异化在于用底层驱动实现真后台,同时配套了 benchmark 数据集 Cua Bench 和 macOS VM 工具 Lume,形成完整闭环。
跟 Anthropic 的 Computer Use API 或 Browser-use 相比,Cua 更偏向基础设施层,不绑定特定模型,且通过 MCP server 让任何支持 MCP 的 agent 都能接入。如果你在用 Claude Code、Cursor Agent 或自研 coding agent,且需要它操作 Xcode、Figma 这类原生应用,这是目前少数能直接试用的方案。
Star History
生态分析
Beta
开源桌面自动化基础设施层,专注多OS沙箱化AI代理运行环境
独特价值:唯一支持macOS原生虚拟化+后台静默操控的开源CUA基础设施
竞品:
anthropics/anthropic-cookbook 非竞品:示例代码合集,无桌面虚拟化基础设施