Voicebox

Voicebox
软件描述
Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 在各类语音任务中表现优于专用 AI 模型……
官方网站
访问软件的官方网站了解更多信息
voicebox.metademolab.com
什么是 Voicebox?
Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 仅通过上下文学习即可在各类语音任务中超越专用 AI 模型的表现。Voicebox 可以合成六种语言的语音,去除瞬态噪声,编辑内容,在不同语言间迁移音频风格,并生成多样化的语音样本。此外,其语音生成速度比当前最先进的自回归模型快多达 20 倍。
🔄 替代方案
37 个选择
TexVoz
TexVoz 是最佳的在线文本转语音转换器,拥有自然流畅的语音。支持 65 种语言及 400 多种不同口音的语音。可将音频下载为 mp3 格式。为有声书、朗读、电子学习制作精彩音频。

OpenWebTTS
开源 Speechify 替代品。使用本地模型阅读 PDF 和 EPUB 文件。

With Audio
一次性付费、注重隐私的桌面应用程序,可将文本转换为同步音频——无需订阅,无需云端存储,仅提供专注的离线阅读与听读体验。

Invocly
Invocly 是一款功能强大的文档转语音平台,专为创作者、专业人士和企业设计,帮助您让文字栩栩如生。只需点击几次,即可将任意文档转换为多种语言和音色的自然语音。

Speechki
发现Speechki,这款专为各年龄和背景用户设计的简单高效的文本转语音平台。由Greycroft、Alchemist以及Blinkist创始人支持,Speechki提供超过500种AI语音,涵盖77种语言,满足您的音频需求。

Lazybird
LazyBird 可让您为视频、播客、有声书、广告、TikTok 等创作逼真自然的配音。该工具提供超过 200 种语音,支持 100 多种语言,涵盖不同年龄和个性的男女声。


