Amphion

访问软件的官方网站了解更多信息

官方认证

openhlt.github.io

安全链接HTTPS

什么是 Amphion?

Amphion 是一个用于音频、音乐和语音生成的工具包。其目标是支持可复现的研究，并帮助初级研究人员和工程师入门音频、音乐及语音生成领域的研究与开发。Amphion 具有独特功能：对经典模型或架构进行可视化展示。我们相信，这些可视化有助于初级研究人员和工程师更深入地理解模型。

Amphion 的核心目标是提供一个平台，用于研究将任意输入转换为音频的方法。Amphion 设计用于支持各类生成任务，包括但不限于：

TTS：文本到语音
SVS：歌声合成
VC：语音转换
SVC：歌声转换
TTA：文本到音频
TTM：文本到音乐
等等…

除了具体的生成任务外，Amphion 还包含多种声码器和评估指标。声码器是生成高质量音频信号的重要模块，而评估指标则对于确保生成任务中度量的一致性至关重要。此外，Amphion 致力于推动音频生成在真实场景中的应用，例如构建大规模语音合成数据集。