VoiceCraft

4

软件描述

VoiceCraft 是一种基于令牌填充的神经编解码语言模型,在包括有声书、网络视频和播客在内的真实场景数据上,于语音编辑和零样本文本到语音(TTS)任务中均达到了最先进水平。

官方网站

访问软件的官方网站了解更多信息

官方认证

jasonppy.github.io

安全链接HTTPS
立即访问

什么是 VoiceCraft?

VoiceCraft 是一种基于令牌填充的神经编解码语言模型,在包括有声书、网络视频和播客在内的真实场景数据上,实现了语音编辑和零样本文本到语音(TTS)的最先进性能。克隆未见过的声音或编辑录音时,VoiceCraft 仅需几秒钟的语音即可完成。

🔄 替代方案

42 个选择
0

Dia 是由 Nari Labs 开发的一款 16 亿参数的文本转语音模型,通过 PytorchModelHubMixin 集成推送到 Hub。

5

Murf AI Studio 可让您更改脚本,或将您的家庭风格语音录制转换为高质量的AI配音,适用于视频、演示文稿或仅需文本转语音的场景。

4

TTSMaker 是一款免费的文本转语音工具,提供语音合成服务,支持多种语言:英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语、越南语等,并提供多种语音风格,可用于朗读文本和电子书,还可……

Amazon Polly

Amazon Polly

4

Amazon Polly 使用深度学习技术合成自然流畅的人类语音,使您能够将文章转换为语音。通过多种语言中数十种逼真的语音,您可以使用 Amazon Polly 构建语音激活的应用程序。

0

Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 在各类语音任务中表现优于专用 AI 模型……

iMyFone VoxBox

iMyFone VoxBox

5

iMyFone VoxBox 是一款利用AI文本转语音和语音克隆技术创建逼真配音的软件。它可将文本转换为引人入胜的音频,并提供超过4000种声音供个性化定制。该软件支持79种语言,包含背景...

1

使用AI将文本转换为专业的基于浏览器的高清视频,提供300多种语音、40多种语言、场景合并、自定义视觉效果和音乐、快速制作、无限下载以及便捷协作,适用于营销、培训或入职等用途。

0

通过使用900多种逼真的AI语音为您受众朗读故事、文章和博客,提升内容可访问性、用户参与度及页面停留时间。

上一页下一页
评分4.0 / 5.0

支持平台

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。

GitHub