Voicebox

软件描述

Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 在各类语音任务中表现优于专用 AI 模型……

官方网站

访问软件的官方网站了解更多信息

官方认证

voicebox.metademolab.com

安全链接HTTPS

什么是 Voicebox?

Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 仅通过上下文学习即可在各类语音任务中超越专用 AI 模型的表现。Voicebox 可以合成六种语言的语音,去除瞬态噪声,编辑内容,在不同语言间迁移音频风格,并生成多样化的语音样本。此外,其语音生成速度比当前最先进的自回归模型快多达 20 倍。

🔄 替代方案

37 个选择
NaturalReader

NaturalReader

语音合成服务

2.8

Natural Reader 是一款专业的文本转语音软件,可将任何书面文字转换为语音。Natural Reader 的付费版本具有更多功能。

免费个人 • 专有
查看详情

Kokoro 是一个拥有 8200 万参数的开源轻量级 TTS 模型。尽管架构轻量,其音质可与更大模型相媲美,同时速度更快、成本更低。

免费 • 开源
查看详情
4.5

将印刷或数字文本、PDF 文件和网页文章转换为语音音频,支持自然音色的AI语音、可调节的播放速度、跨设备同步、离线访问、照片扫描支持,以及内容组织与管理工具。

免费增值 • 专有
查看详情
4

VoiceCraft 是一种基于令牌填充的神经编解码语言模型,在包括有声书、网络视频和播客在内的真实场景数据上,于语音编辑和零样本文本到语音(TTS)任务中均达到了最先进水平。

免费 • 开源
查看详情
3

一款开源工具,通过分析您的X/推特个人资料数据,利用ElevenLabs Voice Design API生成定制语音,并集成Hedra视频API,带来创新的音视频体验。

免费 • 开源
查看详情

语音引擎是OpenAI推出的文本转语音生成平台,可通过输入文本和一段15秒的音频样本,生成与原说话者声音高度相似的自然语音。

付费 • 专有
查看详情

通过上传网站、PDF文件或文档创建AI播客,选择可定制的主持人和脚本,通过大纲规划生成节目,编辑输出内容,并发布音频,为创作者简化制作流程,无需手动录制。

免费增值 • 专有
查看详情

Wondercraft AI 是一款工具,可让用户利用生成式人工智能技术轻松创建专业水准的播客。它无需大量录制和撰写脚本,用户只需录制60秒的语音样本,AI即可据此克隆其……

付费 • 专有
查看详情
上一页
下一页