# CogVideoX-5B
📄 Read in English | 🤗 Huggingface Space | 🌐 Github | 📜 arxiv
## 作品案例 ## 模型介绍 CogVideoX是 [清影](https://chatglm.cn/video) 同源的开源版本视频生成模型。下表展示目前我们提供的视频生成模型列表,以及相关基础信息。模型名 | CogVideoX-2B | CogVideoX-5B (当前仓库) |
---|---|---|
模型介绍 | 入门级模型,兼顾兼容性。运行,二次开发成本低。 | 视频生成质量更高,视觉效果更好的更大尺寸模型。 |
推理速度 (Step = 50) |
FP16: ~90* s | BF16: ~180* s |
单GPU显存消耗 |
18GB using SAT 12GB* using diffusers |
26GB using SAT 21GB* using diffusers |
单GPU量化推理显存消耗(diffusers) |
INT8: 7.8GB* INT4: 不支持 |
INT8: 11.5GB* INT4: 不支持 |
多GPU推理显存消耗 | 10GB* using diffusers |
15GB* using diffusers |
微调显存消耗(每卡) | 47 GB (bs=1, LORA) 61 GB (bs=2, LORA) 62GB (bs=1, SFT) |
63 GB (bs=1, LORA) 80 GB (bs=2, LORA) 75GB (bs=1, SFT) |
提示词语言 | English* | |
提示词长度上限 | 226 Tokens | |
视频长度 | 6 秒 | |
帧率 | 8 帧 / 秒 | |
视频分辨率 | 720 * 480,不支持其他分辨率(含微调) | |
位置编码 | 3d_sincos_pos_embed | 3d_rope_pos_embed |