AMAZINGINDEX.COM 每日 AI 简报
53.0
VOL. 2026.06
2026.06.11
← 返回 2026.06.11 日报
日报快照 · Daily Snapshot
NO. 020

快手开源256K长视频MoE模型

#HF_PAPERS HuggingFace Papers 2026.06.11
值得看指数 86.0 NO. 020 · 2026.06.11
upvotes166comments1

Kwai Keye-VL-2.0-30B-A3B 将 DeepSeek 稀疏注意力首次适配到多模态架构,实现小时级视频无损理解。对做视频 Agent、长内容分析的团队来说,这是目前开源界唯一能跑通 256K 视频上下文的方案。

快手开源256K长视频MoE模型

长视频理解的瓶颈从来不是模型参数量,而是帧级特征的冗余计算。之前主流方案要么暴力抽帧丢信息(如 Video-LLaMA 的均匀采样),要么用 Q-Former 压缩但破坏时序结构,Keye-VL-2.0 用 DSA 做动态帧选择,相当于给视觉 token 加了门控。

30B 总参数、3B 激活量的 MoE 设计很克制,单卡 A100 能跑推理,这比动辄 70B 全激活的模型务实得多。快手自身有短视频生态,这个模型很可能是内部 Agent 工作流的副产品,开源时机选在 Sora 热度消退、实用视频 Agent 需求上升的阶段,很准。

如果你在做人机交互、直播内容审核、教育视频分析,建议优先测它的时序推理能力,不要只看 benchmark 分数。

查看原文 →