Kokoro

Kokoro
软件描述
Kokoro 是一个拥有 8200 万参数的开源轻量级 TTS 模型。尽管架构轻量,其音质可与更大模型相媲美,同时速度更快、成本更低。
官方网站
访问软件的官方网站了解更多信息
huggingface.co
什么是 Kokoro?
Kokoro 是一个开源的轻量级TTS模型,参数量为8200万。尽管架构轻巧,其音质与更大模型相当,同时速度更快、成本更低。由于采用Apache许可证的权重,Kokoro可部署于从生产环境到个人项目等各种场景。
🔄 替代方案
64 个选择
AIVocal
AIVocal 是您的一站式AI语音助手,适用于AI播客、语音生成、人声编辑和语音控制。无论是会议转录还是制作高质量音频内容,AIVocal都能让语音工作更智能、更高效。

TTSMaker
TTSMaker 是一款免费的文本转语音工具,提供语音合成服务,支持多种语言:英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语、越南语等,并提供多种语音风格,可用于朗读文本和电子书,还可……

Amazon Polly
Amazon Polly 使用深度学习技术合成自然流畅的人类语音,使您能够将文章转换为语音。通过多种语言中数十种逼真的语音,您可以使用 Amazon Polly 构建语音激活的应用程序。

eSpeak NG
eSpeak NG 是一款适用于 Linux、Windows、Android 及其他操作系统的轻量级开源文本转语音合成软件。它支持 100 多种语言和口音,基于 Jonathan Duddington 开发的 eSpeak 引擎。

Voicebox
Voicebox 是基于 Meta 非自回归流匹配模型的先进语音生成模型。通过在大规模数据上学习文本引导的语音补全任务,Voicebox 在各类语音任务中表现优于专用 AI 模型……

iMyFone VoxBox
iMyFone VoxBox 是一款利用AI文本转语音和语音克隆技术创建逼真配音的软件。它可将文本转换为引人入胜的音频,并提供超过4000种声音供个性化定制。该软件支持79种语言,包含背景...
将文本转换为逼真的语音或短视频,支持700多种选项、65种以上语言的AI合成语音、自动字幕,以及快速便捷的基于网页的工具,适用于社交、教育、在线学习和营销内容,同时提升可访问性。

Verbose
Verbose 是一款将文字转换为语音的软件,旨在帮助阅读困难或更倾向于听内容的用户。使用 Verbose,用户可将文档、电子邮件、网页及其他文本内容转换为……


