Anthropic 静默缩减缓存致成本飙升
值得看指数 67.0 NO. 012 · 2026.04.13
发布2026/04/12Score349Comments258
为什么值得看
Anthropic在3月初未通知用户即将prompt cache的TTL从1小时缩短至5分钟。这导致开发者缓存创建成本激增20-32%,需要立即检查配额消耗和成本结构。
编辑判断
Anthropic此举极可能是应对算力紧张或提升ARPU的手段,通过缩短缓存窗口迫使高频应用更频繁写入缓存。这对依赖长上下文缓存的AI应用(如代码助手、长文档分析)是直接成本冲击,初创公司利润率将被压缩。
建议立即检查你的Claude API账单中缓存写入费用占比,如果超过总成本30%,需要紧急优化提示词复用策略或考虑模型切换。同时建议建立多云缓存策略,避免被单一供应商的隐性政策变动绑架。