发现各种软件替代方案,找到更适合您的选择

4

我们很高兴推出 Chatterbox,这是 Resemble AI 首个面向生产环境的开源文本转语音模型。Chatterbox 采用 MIT 许可证,经过与 ElevenLabs 等领先闭源系统对比测试,在逐项对比评估中始终更受青睐。

提供 44 个替代方案

5

Kokoro 是一个拥有 8200 万参数的开源轻量级 TTS 模型。尽管架构轻量,其音质可与更大模型相媲美,同时速度更快、成本更低。

提供 64 个替代方案

Abogen 是一款强大的文本转语音工具,可轻松在几秒钟内将 ePub、PDF 或文本文件转换为高质量音频,并匹配字幕。可用于有声书、Instagram、YouTube、TikTok 的配音,或任何需要自然语音效果的项目……

Dia 是由 Nari Labs 开发的一款 16 亿参数的文本转语音模型,通过 PytorchModelHubMixin 集成推送到 Hub。

Amphion 是一个用于音频、音乐和语音生成的工具包。其目的是支持可复现的研究,并帮助初级研究人员和工程师入门音频、音乐和语音生成领域的研究与开发。

一种能够在单次生成中实现超逼真对话的TTS模型。

VibeVoice 是一种新型框架,可从文本生成富有表现力的长篇多说话人对话音频,例如播客。它解决了传统文本转语音(TTS)系统中的诸多挑战,特别是在可扩展性、说话人一致性等方面……