Wan
Wan
软件描述
具备前沿性能的高级视频模型,可在消费级显卡上生成 480p/720p 视频,支持文本到视频、图像转换、编辑以及利用强大 VAE 实现独特的双语文本生成任务。
官方网站
访问软件的官方网站了解更多信息
tongyi.aliyun.com
什么是 Wan?
万:开放且先进的大规模视频生成模型。
在本仓库中,我们推出了 Wan2.1,这是一个全面且开放的视频基础模型套件,显著推动了视频生成技术的发展。Wan2.1具备以下核心特性:
领先性能:Wan2.1在多个基准测试中均优于现有的开源模型和前沿商业解决方案。
支持消费级显卡:T2V-1.3B 模型仅需 8.19 GB 显存,可兼容几乎所有消费级显卡。其可在 RTX 4090 上约 4 分钟内生成一段 5 秒的 480P 视频(无需使用量化等优化技术)。其性能甚至可与部分闭源模型相媲美。
多任务支持:Wan2.1在文本到视频、图像到视频、视频编辑、文本到图像以及视频到音频等任务上表现卓越,显著推动了视频生成领域的发展。
视觉文本生成:Wan2.1是首个能够生成中英文文本的视频模型,具备强大的文本生成能力,显著提升了其实际应用场景。
强大的视频 VAE:Wan-VAE 实现了极高的效率与性能,能够高效编码和解码任意长度的 1080P 视频,同时完整保留时间信息,是视频和图像生成的理想基础模型。
🔄 替代方案
53 个选择Kaiber SuperStudio
利用先进的人工智能技术,将图片和文本转化为视频。探索 Spotify Canvas 为音乐人、艺术家和创意工作者提供的独特功能,无需任何付费即可使用。非常适合那些希望拓展创意人工智能边界的人群。

W.A.L.T Video Diffusion
W.A.L.T 是一种基于变换器的扩散模型方法,用于生成逼真的视频。它采用因果编码器将图像和视频压缩到统一的潜在空间,并使用窗口注意力架构实现空间与时空的联合生成建模。

Hailuo AI
利用机器学习实现智能视频和音频创作,轻松生成高质量内容。包含剪辑工具、转场效果、模板和个性化设置,帮助企业、市场营销、在线教育、医疗健康及媒体行业简化内容制作流程。
PixVerse 是一个强大的生成式人工智能模型,可让您在几分钟内轻松将多模态输入转换为令人惊叹的视频。探索 PixVerse 带来的艺术创作无限可能!