英伟达开源长视频生成加速框架
LongLive 2.0 是英伟达实验室推出的长视频生成基础设施,支持 NVFP4 量化、并行训练和推理,帧率达 45.7 FPS。对做视频生成的团队来说,这是目前少有的同时覆盖训练加速(AR+蒸馏)和推理优化的完整方案,且已集成 KV Cache 压缩。
LongLive 2.0 是英伟达实验室推出的长视频生成基础设施,支持 NVFP4 量化、并行训练和推理,帧率达 45.7 FPS。对做视频生成的团队来说,这是目前少有的同时覆盖训练加速(AR+蒸馏)和推理优化的完整方案,且已集成 KV Cache 压缩。
LongLive 2.0: Infra - Long Video Gen
长视频生成的核心瓶颈从来不是模型本身,而是显存和算力怎么撑住分钟级序列。之前大家做这块的工程方案很分散,训练用 DeepSpeed 或 Megatron 拼一拼,推理再换一套,FP8 量化也是各自为战。
LongLive 2.0 的关键是把 NVFP4、序列并行、KV Cache 压缩(TriAttention)串成了一条龙,而且 DMD 蒸馏直接做进训练管线,这意味着你可以用一套 infra 从训到推,不用在工具链之间来回迁移。跟 CogVideo、Mochi 这类开源视频模型比,它们只放权重,LongLive 放的是工程体系。
如果你在做超过 10 秒的视频生成产品,或者正在用 Diffusion Transformer 做内部原型,这个 repo 的工程参考价值很高,建议重点看它的 parallel attention 和 NVFP4 kernel 实现。
英伟达官方长视频生成基础设施,填补训练到推理全栈优化空白
独特价值:唯一同时覆盖AR蒸馏训练加速与NVFP4推理优化的长视频方案