Stable Audio Open

Stable Audio Open
软件描述
Stable Audio Open 允许任何人仅通过简单的文本提示生成长达 47 秒的高质量音频数据。其专业训练使其非常适合用于制作鼓点、乐器片段、环境音效、拟音录音及其他音乐制作用的音频样本。
官方网站
访问软件的官方网站了解更多信息
huggingface.co
什么是 Stable Audio Open?
Stable Audio Open 允许任何人仅通过简单的文本提示生成长达 47 秒的高质量音频数据。其专项训练使其非常适合用于制作鼓点、乐器旋律片段、环境音效、拟音录音及其他音乐制作与声音设计所需的音频样本。
此次开源发布的一个关键优势是,用户可使用自己的定制音频数据对模型进行微调。例如,一名鼓手可以使用自己录制的鼓声样本进行微调,以生成新的节奏。
与 Stable Audio 的区别
Stable Audio 产品可生成长度达三分钟、具有连贯音乐结构的高质量完整曲目,并支持音频到音频生成、连贯多段式音乐创作等高级功能。
而 Stable Audio Open 则专注于音频样本、音效和制作元素。尽管它能生成简短的音乐片段,但并未针对完整歌曲、旋律或人声进行优化。该开源模型为声音设计中的生成式 AI 提供了前瞻视角,同时优先考虑负责任的发展并与创意社区协同推进。
新模型基于 Freesound 和 Free Music Archive 的音频数据进行训练,使我们在尊重创作者权益的前提下,成功打造了一款开放音频模型。
主要功能
🔄 替代方案
44 个选择Suno 使任何人都能创作音乐,无论技能水平如何。它无需乐器,仅凭想象力即可实现。Suno AI 原名为 Bark(AI),已从生成语音发展为创造各种……
Sonauto 是一款 AI 音乐编辑器,可将提示、歌词或旋律快速转换为任意风格的完整歌曲。例如,几分钟内,你就可以用 Sonauto 为朋友创作一首原创生日歌,并由弗兰克·辛纳屈演唱。
Stable Audio 是由 Stability AI 开发的音乐生成产品,采用一种新颖的潜在扩散模型,可根据文本元数据和时间信息生成不同长度的音频,提供更快的推理速度以及对内容和时长的创作控制。








