VoiceCraft

VoiceCraft
软件描述
VoiceCraft 是一种基于令牌填充的神经编解码语言模型,在包括有声书、网络视频和播客在内的真实场景数据上,于语音编辑和零样本文本到语音(TTS)任务中均达到了最先进水平。
官方网站
访问软件的官方网站了解更多信息
jasonppy.github.io
什么是 VoiceCraft?
VoiceCraft 是一种基于令牌填充的神经编解码语言模型,在包括有声书、网络视频和播客在内的真实场景数据上,实现了语音编辑和零样本文本到语音(TTS)的最先进性能。克隆未见过的声音或编辑录音时,VoiceCraft 仅需几秒钟的语音即可完成。
🔄 替代方案
42 个选择
Dia TTS
Dia 是由 Nari Labs 开发的一款 16 亿参数的文本转语音模型,通过 PytorchModelHubMixin 集成推送到 Hub。

Murf AI
Murf AI Studio 可让您更改脚本,或将您的家庭风格语音录制转换为高质量的AI配音,适用于视频、演示文稿或仅需文本转语音的场景。

TTSMaker
TTSMaker 是一款免费的文本转语音工具,提供语音合成服务,支持多种语言:英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语、越南语等,并提供多种语音风格,可用于朗读文本和电子书,还可……

Amazon Polly
Amazon Polly 使用深度学习技术合成自然流畅的人类语音,使您能够将文章转换为语音。通过多种语言中数十种逼真的语音,您可以使用 Amazon Polly 构建语音激活的应用程序。

Voicebox
Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 在各类语音任务中表现优于专用 AI 模型……

iMyFone VoxBox
iMyFone VoxBox 是一款利用AI文本转语音和语音克隆技术创建逼真配音的软件。它可将文本转换为引人入胜的音频,并提供超过4000种声音供个性化定制。该软件支持79种语言,包含背景...
使用AI将文本转换为专业的基于浏览器的高清视频,提供300多种语音、40多种语言、场景合并、自定义视觉效果和音乐、快速制作、无限下载以及便捷协作,适用于营销、培训或入职等用途。



