Voicebox

Voicebox
软件描述
Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 在各类语音任务中表现优于专用 AI 模型……
官方网站
访问软件的官方网站了解更多信息
voicebox.metademolab.com
什么是 Voicebox?
Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 仅通过上下文学习即可在各类语音任务中超越专用 AI 模型的表现。Voicebox 可以合成六种语言的语音,去除瞬态噪声,编辑内容,在不同语言间迁移音频风格,并生成多样化的语音样本。此外,其语音生成速度比当前最先进的自回归模型快多达 20 倍。
🔄 替代方案
37 个选择
NaturalReader
Natural Reader 是一款专业的文本转语音软件,可将任何书面文字转换为语音。Natural Reader 的付费版本具有更多功能。

Speechify
将印刷或数字文本、PDF 文件和网页文章转换为语音音频,支持自然音色的AI语音、可调节的播放速度、跨设备同步、离线访问、照片扫描支持,以及内容组织与管理工具。

VoiceCraft
VoiceCraft 是一种基于令牌填充的神经编解码语言模型,在包括有声书、网络视频和播客在内的真实场景数据上,于语音编辑和零样本文本到语音(TTS)任务中均达到了最先进水平。

X to Voice
一款开源工具,通过分析您的X/推特个人资料数据,利用ElevenLabs Voice Design API生成定制语音,并集成Hedra视频API,带来创新的音视频体验。
语音引擎是OpenAI推出的文本转语音生成平台,可通过输入文本和一段15秒的音频样本,生成与原说话者声音高度相似的自然语音。
通过上传网站、PDF文件或文档创建AI播客,选择可定制的主持人和脚本,通过大纲规划生成节目,编辑输出内容,并发布音频,为创作者简化制作流程,无需手动录制。




