Dia TTS Model
软件描述
一种能够一次性生成超逼真对话的TTS模型。
官方网站
访问软件的官方网站了解更多信息
github.com
安全链接HTTPS
什么是 Dia TTS Model?
Dia 是由 Nari Labs 开发的一款 16 亿参数的文本转语音模型。Dia 能够直接从文本转录稿生成高度逼真的对话。您可以对输出进行音频条件控制,实现情感和语调的调节。该模型还能生成非语言交流,如笑声、咳嗽、清嗓等。为加速研究,我们提供了预训练模型检查点和推理代码的访问权限。模型权重托管在 Hugging Face 上。目前该模型仅支持英文生成。