Google 拆分 TPU 为训练/推理双架构

今日精选 · Today's Picks

OpenAI 用 WebSocket 砍掉 Agent 延迟

OpenAI 在 Responses API 中引入 WebSocket 支持，配合连接级缓存重构了 Codex Agent 的执行循环。对正在搭建实时 Agent 系统的团队，这是官方给出的低延迟架构参考实现。

OpenAI Blog📅 发布2026/04/22

ChatGPT 上线云端编码代理

OpenAI 在 ChatGPT 中推出基于 Codex 的 workspace agents，可在云端自动执行复杂工作流并跨工具协作。对团队而言，这意味着 AI 从对话助手进化为能实际操作用户现有工具链的自动化执行层，安全性和规模化是核心卖点。

CodexChatGPTAI Agent

OpenAI Blog📅 发布2026/04/22

003

AI 代理 HTTP 流量安全代理

CrabTrap 是 Brex 开源的 HTTP/HTTPS 代理，拦截 AI 代理的所有外发请求，通过确定性规则 + LLM 策略判断进行实时放行或阻断，并完整审计落库。AI 代理越权访问敏感 API 的风险正在从理论变成合规事故，这是目前少有的生产级开源方案。

BrexAI Agent SecurityPostgreSQL

GitHub Search⭐ Stars299📅 创建5 天前

004

Vercel 推出 AI Agent 技能共享 CLI

skills 是 Vercel Labs 发布的 CLI 工具，让开发者能为 OpenCode、Claude Code、Codex、Cursor 等 40 多款 AI 编码 Agent 安装和管理可复用的技能包。对团队来说，这意味着终于能把内部编码规范、API 调用模式、调试流程沉淀为标准化技能，避免每个 Agent 重复造轮子。

VercelClaude CodeCursor

GitHub Trending⭐ Stars15,357

005

Langfuse 开源 LLM 工程平台升级

Langfuse 是开源的 LLM 工程平台，提供开发、监控、评估和调试全链路工具。25K stars 且明确加码开源策略，对需要自托管或数据敏感的企业团队是重要信号。

LangfuseLLMOpsClickHouse

GitHub Trending⭐ Stars25,513

006

AI代码溯源标准：一键追踪谁写的

AI Attestation 是一个放在仓库根目录的 YAML 文件，自动追踪 AI 生成代码的比例、工具来源及合规扫描状态。对需要向审计、客户或开源社区证明代码来源的企业和团队，这是目前最轻量的合规方案。

GitYAML合规

GitHub Search⭐ Stars145📅 创建6 天前

007

一句话生成完整短视频，零剪辑

Pixelle-Video 是端到端 AI 短视频自动化引擎，输入主题即可输出带文案、画面、配音、BGM 的成品视频。对需要批量生产内容但缺乏剪辑人力的团队，这是目前 GitHub 上集成度最高的开源方案。

ComfyUITTS数字人

GitHub Trending⭐ Stars5,447

008

开源元数据平台统一数据治理

OpenMetadata 是一个统一元数据平台，提供数据发现、可观测性和治理能力，支持列级血缘追踪和多种数据服务连接器。AI 工程师处理多源数据管道时，它能解决元数据分散、数据血缘不清导致的调试和维护难题。

OpenMetadata数据血缘数据治理

GitHub Trending⭐ Stars12,066

009

安全测试工具箱升级：185+工具一键调用

hackingtool v2.0 是面向安全研究员的渗透测试工具聚合平台，支持按名称、标签搜索和 OS 自适应菜单。对需要频繁切换工具做安全审计的工程师，能省去大量环境配置和文档查找时间。

渗透测试Python 3.10Kali Linux

GitHub Trending⭐ Stars59,432

010

27B模型逼近旗舰代码能力

阿里通义千问发布Qwen3.6-27B，用27B稠密模型实现通常需70B+才能达到的代码生成水平。对AI工程师意味着本地部署和API成本可大幅降低，中小团队能以消费级硬件运行接近GPT-4级别的编程助手。

Qwen代码生成模型蒸馏

HackerNews📅 发布2026/04/22

011

Google 拆分 TPU 为训练/推理双架构

Google Cloud Next 发布第八代 TPU，首次拆分为训练专用 TPU 8t 和推理专用 TPU 8i 两种架构。这意味着 Google 正式承认训练和推理的硬件需求已彻底分化，对做模型训练和 AI Agent 部署的工程师来说，选型逻辑要重新算。

TPUGeminiAI Agent

HackerNews📅 发布2026/04/22

012

Google 自曝 TPU v8 架构细节

Google Cloud 两位高管发文详解第八代 TPU 架构设计，核心转向适配 MoE 模型和推理密集型负载。对 AI 基础设施选型有直接参考价值，尤其是长上下文和 agentic AI 场景下的硬件瓶颈判断。

TPU v8MoEGoogle Cloud

HackerNews📅 发布2026/04/22

013

DuckDB 推稳定版湖仓格式 DuckLake

DuckDB 1.5.2 补丁版修复多项 bug 并提升性能，同时正式发布 DuckLake v1.0 湖仓格式规范及参考实现，承诺向后兼容并支持数据内联。对数据工程师而言，这意味着在笔记本到浏览器的全场景下，用单机分析引擎就能直接读写生产级湖仓，无需 Spark 或 Trino 等重型基础设施。

DuckDBDuckLake数据湖仓

HackerNews📅 发布2026/04/22

014

Zed 让多 Agent 并行协作

Zed 编辑器新增 Threads Sidebar，支持在同一窗口并行运行多个 AI Agent，每个线程可独立配置访问权限和模型。对需要跨仓库、多任务并行的开发者，这是目前最流畅的 Agent 编排方案。

ZedAI AgentOpen Source

HackerNews📅 发布2026/04/22

015

Martin Fowler 谈 AI 时代的三种技术债

Martin Fowler 与 Kent Beck 在 Pragmatic Summit 对谈，提出技术债应扩展为技术债务、认知债务、意图债务三类，并讨论 AI 对 TDD、敏捷及行业绩效指标的冲击。两位敏捷宣言签署者的视角，对判断 AI 原生开发流程的演进方向有直接参考价值。

TDD敏捷开发Kent Beck

HackerNews📅 发布2026/04/22

016

Google 第八代 TPU 拆分训练推理

Google 发布 TPU 8t（训练）和 TPU 8i（推理），首次在同代架构中针对训练和推理做专用芯片拆分。训练集群可扩至 9600 芯片、121 ExaFlops，推理芯片配 288GB HBM 让工作集全留片上——云厂商自研芯片的军备竞赛已升级到架构层面分化。

TPUGoogle CloudAI芯片

奇客Solidot📅 发布2026/04/22

017

纯电1000km春运实测：理想5C vs 特斯拉

V2EX热帖讨论深圳回湖北1000km纯电春运补能实况，Model Y车主反馈冬季续航腰斩至200km，理想i6凭5C超充和专人值守成备选。核心矛盾：增程/插混车主春节抢桩加剧纯电焦虑，下高速城区充电成隐性策略。

理想i6Model Y5C超充

V2EX