IT之家 8 月 28 日消息,智谱 AI 开源了 CogVideoX-5B 视频生成模型,相比此前开源的 CogVideoX-2B,官方称其视频生成质量更高,视觉效果更好。
官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早期显卡运行CogVideoX-2B,在 RTX 3060 等桌面端“甜品卡”运行CogVideoX-5B模型。
CogVideoX 是一个大规模 DiT(diffusion transformer)模型,用于文本生成视频任务,主要采用了以下技术:
CogVideoX-5B 与 CogVideoX-2B 详细参数比较如下:
IT之家附相关链接: