Mistral 把编程代理搬上云端
Mistral 发布 Medium 3.5 模型,推出云端远程编程代理,可从 CLI 或 Le Chat 启动并行任务并在完成后通知用户。Le Chat 新增 Work 模式支持复杂多步骤任务,这对需要异步处理大量编码任务的工程师和团队能显著减少上下文切换成本。
Harness 是一个原生 macOS 工具,用 LLM 代理驱动 iOS Simulator、macOS 或 Web 应用,通过自然语言目标执行真实用户行为测试而非脚本化 UI 测试。对 AI 工程师和创业者来说,它把用户验收测试从"写脚本维护脚本"变成了"描述目标等结果",大幅降低测试门槛并能发现真实 UX 摩擦点。
AI-driven user testing for iOS Simulator, macOS apps, and web apps. Write a goal in plain language; an LLM agent drives the UI and reports friction. macOS 14+, Swift 6.
传统移动端自动化测试被 XCUITest、Appium 这类框架垄断,但维护成本极高,脚本一碰 UI 改版就崩。Harness 的解法是用视觉理解+LLM 替代定位器(locator),这跟 Browser-use、Computer-use 的思路同源,但它是首个专门针对 Apple 生态的原生工具。
跟 Maestro、Detox 这些跨平台方案比,Harness 不追求"一次编写多平台运行",而是死磕 Apple 原生体验:直接操控 iOS Simulator 的 Metal 渲染层,截图延迟更低。劣势是目前仅 127 stars,生态极早期,CI/CD 集成能力未验证。
最该试的人群:独立开发者或小团队做 macOS/iOS 产品、没有专职 QA、想快速验证 onboarding 流程的。如果你还在手写 XCUITest 测注册流程,这个工具能省你半天。
原生 macOS 端 AI 驱动 UI 测试工具,聚焦 iOS/macOS/Web 应用的自然语言验收测试
独特价值:以 LLM 代理直接操控 iOS Simulator 和 macOS UI,用自然语言替代脚本化测试