LiquidAI 发布 8B 新架构模型
为什么值得看
LiquidAI 推出基于 LFM(Liquid Foundation Model)架构的 8B 参数模型,采用非 Transformer 的液态神经网络设计。该架构在同等参数量下可能实现更高效的序列建模,为边缘部署和实时应用提供新选择。
编辑判断
LiquidAI 是 MIT 背景的团队,核心卖点是用连续时间神经网络替代离散注意力机制,理论上推理时内存不随序列长度膨胀。之前类似路线的是 Mamba 系列,但 Mamba 的硬件优化生态远未成熟。
这个 8B 模型的 37K 下载量和 378 likes 说明社区关注度中等,还没到引爆点。真正值得关注的是它是否在长文本任务上比 Mamba-2 或 Transformer 有稳定优势,以及 HuggingFace 上的推理实现是否足够成熟。
如果你在探索非 Transformer 架构的生产部署,建议先跑一下它的长文本 PPL 和下游任务 benchmark,但别急着替换现有管线——液态神经网络的训练稳定性和工具链成熟度仍是未知数。