NVIDIA开源高效图像视频生成套件
SANA是NVIDIA实验室推出的高分辨率图像与视频生成代码库,覆盖SANA、SANA-1.5、SANA-Sprint等多个模型,提供完整训练推理管线。对需要自托管文生图/视频服务的团队来说,这是目前少数同时支持高效推理和完整训练流程的开源方案。
AIPointer 是开源桌面覆盖层工具,按住快捷键后会在光标旁弹出毛玻璃对话框,截取指针周围屏幕区域发送给视觉 LLM 解答。对需要频繁理解 UI、代码、图表的工程师,它把"截图-上传-提问"的三步流程压成了按住即问的单手操作。
The AI cursor companion. Hold a key, ask a question, get an answer about whatever your cursor is pointing at. Vision LLM overlay for macOS, Windows, Linux. Multi-provider (OpenRouter, Anthropic, OpenAI, Gemini). Voice in/out. MIT licensed. No telemetry.
之前解决"屏幕上这是什么"的痛点,要么用 Arc 浏览器的 Ask on Page 局限在网页,要么手动截图丢给 ChatGPT/Claude 的网页端,流程割裂。AIPointer 的关键设计是 Right-Cmd/Right-Ctrl 的左右手分区——左手不离开键盘区,右手不离开鼠标,比 Raycast AI 的弹窗更贴合"看到即问"的肌肉记忆。
跟 Screenpipe、Rewind 这类全量录屏检索工具比,AIPointer 不走本地知识库路线,而是轻量触发、即用即走,更适合临时性的视觉问答而非长期记忆。目前 119 stars 说明概念验证已过,但 forks 仅 2 个暗示代码贡献度低,API key 自理的模式也过滤掉了纯小白用户。
最该试的人群:前端工程师调试别人写的复杂 UI、产品经理评审设计稿时快速问组件含义、以及任何需要频繁"读图"但不想打断工作流的桌面用户。Windows/Linux 支持已到位,但 glassmorphism 框在 HDR 屏幕上的渲染稳定性待观察。
开源跨平台视觉AI覆盖层工具,专注光标上下文即时问答的开发者效率层
独特价值:按住即问的单手操作,将截图-上传-提问三步压缩为光标级实时视觉交互