Chatterbox TTS

Chatterbox TTS

Chatterbox TTS

语音合成服务

4

软件描述

我们很高兴推出 Chatterbox,这是 Resemble AI 首个面向生产环境的开源文本转语音模型。Chatterbox 采用 MIT 许可证,经过与 ElevenLabs 等领先闭源系统对比测试,在逐项对比评估中始终更受青睐。

官方网站

访问软件的官方网站了解更多信息

官方认证

resemble-ai.github.io

安全链接HTTPS
立即访问

什么是 Chatterbox TTS?

我们很高兴推出 Chatterbox,这是 Resemble AI 首个面向生产环境的开源 TTS 模型。Chatterbox 采用 MIT 许可证,已与 ElevenLabs 等领先闭源系统进行基准测试,在对比评估中始终更受青睐。

无论你正在制作表情包、视频、游戏或 AI 代理,Chatterbox 都能让你的内容栩栩如生。它也是首个支持情感夸张控制的开源 TTS 模型,这一强大功能可让声音更具表现力。立即在我们的 Hugging Face Gradio 应用中体验。

如果你喜欢该模型但需要扩展性能或提升精度,欢迎了解我们性价比极高的 TTS 服务(链接)。其具备可靠的性能和低于 200ms 的超低延迟,非常适合应用于代理、应用程序或互动媒体等生产场景。

关键特性

  • 行业领先零样本 TTS
  • 0.5B 参数 Llama 骨干网络
  • 独特的情感夸张/强度控制
  • 推理过程对齐感知,高度稳定
  • 基于 50 万小时清洗数据训练
  • 输出带水印
  • 内置简易语音转换脚本
  • 性能超越 ElevenLabs

使用建议
通用场景(TTS 和语音代理):
默认设置(exaggeration=0.5, cfg_weight=0.5)适用于大多数提示。

若参考说话人语速较快,可将 cfg_weight 降低至约 0.3 以改善节奏。

富有表现力或戏剧性表达:
尝试降低 cfg_weight(例如 ~0.3),并将 exaggeration 提高至 0.7 或更高。

更高的夸张值通常会加快语速;降低 cfg_weight 可通过更慢、更从容的节奏进行补偿。

🔄 替代方案

44 个选择
ARES - Your Universal AI Access Pass

ARES - Your Universal AI Access Pass

5

厌倦了订阅?我们懂你。ARES让你无需订阅即可使用多个AI工具。

Mycroft Mimic

Mycroft Mimic

0

Mimic 是一款功能强大的文本转语音工具。它具有低延迟和小资源占用的特点。其高质量的语音选项也使其在其他开源文本转语音项目中脱颖而出。

VoiceOverMaker

VoiceOverMaker

0

使用神经网络,从文本生成多种语言和音色的自然语音,配备高级浏览器编辑器、MP3、WAV或MP4导出选项、SSML格式、转录功能、视频录制、自定义设置及协作工具。

0

TurboTTS 是一款免费的在线文本转语音工具,支持多达 70 种语言,超过 300 种真实人声可供选择,操作简单便捷。

5

一个以质量为重点训练的多语音TTS系统。

Real-Time Voice Cloning

Real-Time Voice Cloning

5

免费开源AI语音克隆与文本转语音合成。5秒内克隆声音,实时生成任意语音。

SpeakMyVoice

SpeakMyVoice

0

使用SpeakMyVoice,您始终参与对话。 您的声音,您的故事,您的自由。 打字发声:轻松表达自我。只需输入文字,让我们的应用随时随地成为您的声音。 自然语音:选择多种逼真语音,甚至可定制。

0

吉瑟里特是寻找AI视频创作工具、提升视频制作速度,以及发现最佳语音合成声音以制作精彩配音和视频的最佳场所。

上一页下一页
评分4.0 / 5.0

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。

GitHub