AMAZINGINDEX.COM 每日 AI 简报
50.2
VOL. 2026.06
2026.06.01
← 返回 2026.06.01 日报
日报快照 · Daily Snapshot
NO. 010

手机跑4B文生图,权重压到1bit

#ARTICLE HackerNews 2026.06.01
值得看指数 70.0 NO. 010 · 2026.06.01
发布2026/05/31Score142Comments52
查看原文 →

PrismML发布Bonsai Image 4B系列,1-bit版本用二元权重+FP16缩放因子实现1.125有效位宽,4B参数可在笔记本和手机本地运行高质量扩散推理。端侧AI落地最难的是内存带宽而非算力,这个压缩比让消费级设备跑生图首次变得可行。

手机跑4B文生图,权重压到1bit

端侧生图之前不是没人做,但要么用SD-Turbo牺牲质量,要么靠苹果Neural Engine搞封闭生态。Bonsai的1bit方案走了一条中间路线:用group-wise scaling保精度,用极端量化砍带宽,这跟Qualcomm的AI Hub或者微软的BitNet路径不同,它直接瞄准的是消费级GPU和手机的DRAM墙。

值得对比的是Stability AI的SDXL-Turbo和苹果MLC-LLM的扩散支持,Bonsai的4B参数+1bit在iPhone上的实际latency和功耗数据会是关键。如果你在考虑端侧AIGC的产品化,建议等社区复现后重点测两个指标:首token生成时间和连续出图的thermal throttling表现。

意见分歧 52 条评论

核心争论:端侧AI能否替代云端订阅,还是数据中心永远更优

sorenjan

They call it a diffusion model, but it's based on Flux.2 which is a rectified flow model.

MitPitt

Lately I've noticed posts with barely 10 points getting to HN frontpage. Was it always like this?

Aboutplants

I just assume bots

替代方案: Taalaschatjimmy.ai