Voicebox

Voicebox
软件描述
Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 在各类语音任务中表现优于专用 AI 模型……
官方网站
访问软件的官方网站了解更多信息
voicebox.metademolab.com
什么是 Voicebox?
Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 仅通过上下文学习即可在各类语音任务中超越专用 AI 模型的表现。Voicebox 可以合成六种语言的语音,去除瞬态噪声,编辑内容,在不同语言间迁移音频风格,并生成多样化的语音样本。此外,其语音生成速度比当前最先进的自回归模型快多达 20 倍。
🔄 替代方案
37 个选择
SpeechParrot.app
无需订阅模式的在线文字转语音转换器。按需付费,仅支付您需要的部分。支持超过30种语言,可生成适用于商业用途的自然语音。

Speakabo
使用 Speakabo,将文本转换为音频并下载 MP3 文件。Speakabo 拥有全球最丰富的真人语音库(100 多种声音,20 多种语言),由人工智能驱动。通过高级自定义功能(支持 SSML 标签),几分钟内即可生成惊艳的音频。
Audeus 是一款文本转语音应用,可使用自然逼真的语音朗读您的文档。通过同步的文字高亮功能,即时将阅读速度提升一倍或三倍,提高专注力并增强理解力。立即开始使用。

Real-Time Voice Cloning
免费开源AI语音克隆与文本转语音合成。5秒内克隆声音,实时生成任意语音。

Resemble AI
Resemble AI 是一家合成语音人工智能公司,通过配备实时 API 的文本转语音生成器,为您的克隆语音提供增强功能,打造沉浸式体验。Resemble AI 支持 44 kHz 语音,并包含低延迟 API。

Bark (AI)
Bark 是由 Suno 开发的基于 Transformer 的文本转音频模型,能够生成高度逼真的多语言语音以及其他音频内容,包括音乐、背景噪音和简单的音效。

VozFly
VozFly 是最佳的在线文字转语音转换器,得益于其先进技术、现代化特性以及丰富的语音选择。开始创建专业音频,并以 MP3、OGG 和 WAV 等多种格式下载您的文件。


