雷思软件

返回软件列表

W.A.L.T Video Diffusion

W.A.L.T Video Diffusion

W.A.L.T Video Diffusion

AI视频生成器

软件描述

W.A.L.T. 是一种基于变压器的扩散建模方法，用于生成逼真的视频。它使用因果编码器将图像和视频压缩到统一的潜在空间，并采用窗口注意力架构实现联合的空间与时空生成建模。

官方网站

访问软件的官方网站了解更多信息

官方认证

walt-video-diffusion.github.io

安全链接HTTPS

什么是 W.A.L.T Video Diffusion?

W.A.L.T. 是一种基于Transformer的扩散建模方法，用于生成逼真的视频。它采用因果编码器将图像和视频压缩到统一的潜在空间，并使用窗口注意力架构实现联合的空间与时空生成建模。该设计无需分类器自由引导，即可在视频（UCF-101 和 Kinetics-600）和图像（ImageNet）生成基准上达到顶尖性能。我们还采用三模型级联结构进行文本到视频生成，可生成分辨率为512×896、帧率为每秒8帧的视频。

主要功能

✓ 图像到图像生成 ✓ 人工智能驱动

🔄 替代方案

34 个选择

Runway

AI视频生成器, 视频编辑器

0

创意套件提供30多个AI工具，可用于生成图像、编辑视频和音频、微调风格、氛围和分辨率、擦除或替换图像区域、扩展图像、手动或AI驱动的视频编辑，并支持实时团队协作。

DomoAI

AI视频生成器

0

全面的AI驱动平台，支持视频创作、图像转视频、文本转图像，以及动漫风格转写实照片等多种样式（如日本动漫、纸艺风、3D卡通），提供丰富的创意工具以供实验与制作。

Infinity AI

AI视频生成器

★5

一个视频基础模型，可帮助用户设计并动画化富有表现力、逼真的角色。它支持脚本到视频的转换，并提供无广告的基于网络的体验以及AI驱动的功能。

Google Flow

AI视频生成器, 视频编辑器

0

专为影视制作打造的AI工具，融合了谷歌Gemini AI技术，以及先进的视频生成模型Veo 3和下一代图像创作系统Imagen 4。

KLING AI

AI视频生成器, AI图像生成器

★1

用生成式AI工具激发您的创意，打造图像与视频。KLING AI专注于品质、多样性与易用性，服务于艺术家、营销人员及内容创作者。享受直观的界面、灵活的媒体格式以及与平台无缝集成的工作流程。

Pika Labs

AI视频生成器, AI图像生成器

0

AI驱动的工具，可将文本转化为视频，无需编辑技能。只需输入想要的文本，即可轻松创建引人入胜、吸引眼球的视觉效果。通过易于使用的创意视频动画，尽情释放想象力。

LensGo

AI视频生成器

★3

LensGo.ai 是一个基于网络的AI平台，可使用可定制模型生成图像和视频，将文本转换为视频，并支持用户使用个人图像训练模型。

Seedance

AI视频生成器, 大型语言模型（LLM）工具

0

一个支持从文本和图像生成多帧视频的模型。它在语义理解与提示遵循方面取得突破，能够生成1080p、动作流畅、细节丰富且具有电影质感的视频。

上一页第 2 页，共 5 页下一页

许可证免费 • 专有

支持平台