Wan
Wan
软件描述
性能先进的视频模型,可在消费级GPU上生成480/720p视频,支持文本到视频、图像转换、编辑以及使用强大VAE的双语文本生成等任务。
官方网站
访问软件的官方网站了解更多信息
tongyi.aliyun.com
什么是 Wan?
万:开放且先进的大规模视频生成模型。
在本仓库中,我们发布了 Wan2.1,这是一个全面且开源的视频基础模型套件,推动了视频生成技术的边界。Wan2.1 具备以下关键特性:
SOTA 性能:Wan2.1 在多个基准测试中持续优于现有开源模型及业界领先的商业解决方案。
支持消费级 GPU:T2V-1.3B 模型仅需 8.19 GB 显存,可适配几乎全部消费级显卡。在 RTX 4090 上约 4 分钟即可生成一段 5 秒、480P 的视频(未使用量化等优化技术),性能甚至可媲美部分闭源模型。
多任务支持:Wan2.1 在文生视频、图生视频、视频编辑、文生图和视频生音频等多个任务上表现卓越,显著推进视频生成领域发展。
视觉文本生成:Wan2.1 是首个能够生成中英文文本的视频模型,具备强大的文本生成能力,大幅提升实际应用价值。
强大的视频 VAE:Wan-VAE 实现了卓越的效率与性能,可编码解码任意长度的 1080P 视频并保留时序信息,是视频与图像生成的理想基础。
🔄 替代方案
56 个选择
PhotoToVideo
借助我们的AI动画技术,将静态照片瞬间变为引人入胜的视频。无需任何技术技能,几分钟内即可让您的图片栩栩如生。

HuMo AI
HuMo AI 由字节跳动驱动,让创作者能够打造惊艳且以人为本的视频,具备无与伦比的真实感和控制力。支持文本、图像和音频输入,可将简单创意转化为高度定制化、逼真的成果。

Deevid AI
使用AI驱动的工具,将文字提示、图像或视频片段转换为电影级高质量视频,支持动画过渡、风格变换、创意模板及友好编辑界面,简化营销、个人或社交内容的制作流程。

Sora2 AI
Sora 2 标志着视频生成技术的质的飞跃,是视频人工智能领域的“GPT-3.5时刻”。与以往扭曲现实以匹配提示的模型不同,Sora 2 理解并尊重物理规律。

Nereo AI
Nereo 是一个一体化的多模型 AI 视频平台,整合了 Veo3 和 Seedance 的功能,实现无缝高效的高速内容创作。




