Google 拆分 TPU 为训练/推理双架构
值得看指数 77.0 NO. 011 · 2026.04.23
发布2026/04/22Score307Comments151
为什么值得看
Google Cloud Next 发布第八代 TPU,首次拆分为训练专用 TPU 8t 和推理专用 TPU 8i 两种架构。这意味着 Google 正式承认训练和推理的硬件需求已彻底分化,对做模型训练和 AI Agent 部署的工程师来说,选型逻辑要重新算。
编辑判断
Google 把 TPU 拆成两条线,等于公开承认 Nvidia 的 H100/B200 统一架构路线有问题。TPU 8i 专门优化推理,意味着 Google 预判 Agent 场景下推理成本会指数级膨胀,需要把每 token 成本压到极限。
这对创业团队有两个信号:一是自研推理芯片的窗口期还在,但得选准场景;二是用 TPU 做训练的成本优势可能扩大,但生态锁定比 CUDA 更深,押注前要想好退路。已经在用 Google Cloud 的团队可以盯一下 8i 的 pricing,如果比 A100 推理便宜 30% 以上,迁移 ROI 可能为正。