发现各种软件替代方案,找到更适合您的选择
一种能够在单次生成中实现超逼真对话的TTS模型。
VibeVoice 是一种新型框架,可从文本生成富有表现力的长篇多说话人对话音频,例如播客。它解决了传统文本转语音(TTS)系统中的诸多挑战,特别是在可扩展性、说话人一致性等方面……