Wan
Wan
软件描述
具备前沿性能的高级视频模型,可在消费级显卡上生成 480p/720p 视频,支持文本到视频、图像转换、编辑以及利用强大 VAE 实现独特的双语文本生成任务。
官方网站
访问软件的官方网站了解更多信息
tongyi.aliyun.com
什么是 Wan?
万:开放且先进的大规模视频生成模型。
在本仓库中,我们推出了 Wan2.1,这是一个全面且开放的视频基础模型套件,显著推动了视频生成技术的发展。Wan2.1具备以下核心特性:
领先性能:Wan2.1在多个基准测试中均优于现有的开源模型和前沿商业解决方案。
支持消费级显卡:T2V-1.3B 模型仅需 8.19 GB 显存,可兼容几乎所有消费级显卡。其可在 RTX 4090 上约 4 分钟内生成一段 5 秒的 480P 视频(无需使用量化等优化技术)。其性能甚至可与部分闭源模型相媲美。
多任务支持:Wan2.1在文本到视频、图像到视频、视频编辑、文本到图像以及视频到音频等任务上表现卓越,显著推动了视频生成领域的发展。
视觉文本生成:Wan2.1是首个能够生成中英文文本的视频模型,具备强大的文本生成能力,显著提升了其实际应用场景。
强大的视频 VAE:Wan-VAE 实现了极高的效率与性能,能够高效编码和解码任意长度的 1080P 视频,同时完整保留时间信息,是视频和图像生成的理想基础模型。
🔄 替代方案
53 个选择
QuickMagic Motion Capture
QuickMagic能高效地将视频中的2D关节数据转换为3D动作数据。与传统方法相比,它简化了3D动作的制作流程,提升了动画效率。
利用AI生成的场景、一致的角色、自动化的视觉效果、配音和剪辑,将脚本即时转化为草稿视频。适用于广告、解说视频、YouTube视频和短片,简化早期视频制作流程,让用户能够专注于优化最终输出。

Waver 1.0
Waver 1.0 是一个创新的AI视频生成平台,能够将文本和图像输入转化为动态视频内容。该平台具备先进的动作合成技术、可定制的视频风格以及高质量的输出渲染,使创作者能够生成专业级的视频内容……