Voicebox

软件描述

Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 在各类语音任务中表现优于专用 AI 模型……

官方网站

访问软件的官方网站了解更多信息

官方认证

voicebox.metademolab.com

安全链接HTTPS
立即访问

什么是 Voicebox?

Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 仅通过上下文学习即可在各类语音任务中超越专用 AI 模型的表现。Voicebox 可以合成六种语言的语音,去除瞬态噪声,编辑内容,在不同语言间迁移音频风格,并生成多样化的语音样本。此外,其语音生成速度比当前最先进的自回归模型快多达 20 倍。

🔄 替代方案

37 个选择
0

SpeakLine 让你的 Mac 与你对话!

SpeechParrot.app

SpeechParrot.app

0

无需订阅模式的在线文字转语音转换器。按需付费,仅支付您需要的部分。支持超过30种语言,可生成适用于商业用途的自然语音。

0

使用 Speakabo,将文本转换为音频并下载 MP3 文件。Speakabo 拥有全球最丰富的真人语音库(100 多种声音,20 多种语言),由人工智能驱动。通过高级自定义功能(支持 SSML 标签),几分钟内即可生成惊艳的音频。

Audeus Text to Speech Reader

Audeus Text to Speech Reader

5

Audeus 是一款文本转语音应用,可使用自然逼真的语音朗读您的文档。通过同步的文字高亮功能,即时将阅读速度提升一倍或三倍,提高专注力并增强理解力。立即开始使用。

Real-Time Voice Cloning

Real-Time Voice Cloning

5

免费开源AI语音克隆与文本转语音合成。5秒内克隆声音,实时生成任意语音。

0

Resemble AI 是一家合成语音人工智能公司,通过配备实时 API 的文本转语音生成器,为您的克隆语音提供增强功能,打造沉浸式体验。Resemble AI 支持 44 kHz 语音,并包含低延迟 API。

0

Bark 是由 Suno 开发的基于 Transformer 的文本转音频模型,能够生成高度逼真的多语言语音以及其他音频内容,包括音乐、背景噪音和简单的音效。

0

VozFly 是最佳的在线文字转语音转换器,得益于其先进技术、现代化特性以及丰富的语音选择。开始创建专业音频,并以 MP3、OGG 和 WAV 等多种格式下载您的文件。

上一页下一页