雷思软件

发现各种软件替代方案，找到更适合您的选择

展开

★4

我们很高兴推出 Chatterbox，这是 Resemble AI 首个面向生产环境的开源文本转语音模型。Chatterbox 采用 MIT 许可证，经过与 ElevenLabs 等领先闭源系统对比测试，在逐项对比评估中始终更受青睐。

提供 44 个替代方案

★5

Kokoro 是一个拥有 8200 万参数的开源轻量级 TTS 模型。尽管架构轻量，其音质可与更大模型相媲美，同时速度更快、成本更低。

提供 64 个替代方案

Abogen 是一款强大的文本转语音工具，可轻松在几秒钟内将 ePub、PDF 或文本文件转换为高质量音频，并匹配字幕。可用于有声书、Instagram、YouTube、TikTok 的配音，或任何需要自然语音效果的项目……

Dia 是由 Nari Labs 开发的一款 16 亿参数的文本转语音模型，通过 PytorchModelHubMixin 集成推送到 Hub。

Amphion 是一个用于音频、音乐和语音生成的工具包。其目的是支持可复现的研究，并帮助初级研究人员和工程师入门音频、音乐和语音生成领域的研究与开发。

一种能够在单次生成中实现超逼真对话的TTS模型。

VibeVoice 是一种新型框架，可从文本生成富有表现力的长篇多说话人对话音频，例如播客。它解决了传统文本转语音（TTS）系统中的诸多挑战，特别是在可扩展性、说话人一致性等方面……