Dia TTS Model
软件描述
一种能够在单次生成中实现超逼真对话的TTS模型。
官方网站
访问软件的官方网站了解更多信息
github.com
安全链接HTTPS
什么是 Dia TTS Model?
Dia 是由 Nari Labs 开发的 16 亿参数文本转语音模型。
Dia 可直接从文本稿件生成高度逼真的对话。您可基于音频进行条件控制,实现情感与语调调节。该模型还可生成非语言交流内容,如笑声、咳嗽、清嗓等。
为加速研究,我们提供预训练模型检查点及推理代码。模型权重托管于 Hugging Face。目前该模型仅支持英文生成。

