Stable Audio

软件描述

Stable Audio 是由 Stability AI 开发的音乐生成产品,采用一种新颖的潜在扩散模型,可根据文本元数据和时间信息生成不同长度的音频,提供更快的推理速度以及对内容和时长的创作控制。

官方网站

访问软件的官方网站了解更多信息

官方认证

www.stableaudio.com

安全链接HTTPS
立即访问

什么是 Stable Audio?

Stable Audio 是 Stability AI 开发的一款音乐生成产品。作为首款采用最新生成式 AI 技术的同类产品,它通过简洁易用的网页界面,实现更快、更高质量的音乐与音效生成。Stability AI 提供基础免费版 Stable Audio,可生成并下载最长 45 秒的音频;另有“Pro”订阅版本,支持生成时长 90 秒且可用于商业项目的音频。

Stable Audio 非常适合希望创作音乐素材的音乐人,但创作者的应用场景几乎无限。用户只需输入描述性文本提示及期望的音频长度,系统即可生成相应音频。例如,输入“后摇滚,吉他,鼓组,贝斯,弦乐,振奋人心,鼓舞人心,忧郁,流畅,原始,史诗感,情感丰富,125 BPM”,并请求生成一段 95 秒的音频。

使用扩散模型生成音频的主要问题在于,这类模型通常被训练为生成固定尺寸的输出。例如,一个音频扩散模型可能仅在 30 秒音频片段上进行训练,因此只能以 30 秒为单位生成音频。当需要处理长度差异极大的音频(如完整歌曲)时,这一限制尤为明显。

音频扩散模型通常基于较长音频文件中随机截取的片段进行训练,这些片段会被裁剪或填充至模型训练所需长度。在音乐生成场景下,这会导致模型倾向于生成歌曲中的任意片段,可能从乐句中间开始或结束。

我们推出了 Stable Audio,一种基于文本元数据、音频时长和起始时间进行条件控制的潜在扩散模型架构,可精确控制生成音频的内容与长度。这种额外的时间条件机制使我们能够生成指定长度的音频,最大可达训练窗口大小。

通过使用高度下采样的音频潜在表示,推理速度远超原始音频。结合最新的扩散采样技术,我们的旗舰模型 Stable Audio 在 NVIDIA A100 GPU 上可在不到一秒内完成 95 秒立体声、44.1 kHz 采样率音频的渲染。

🔄 替代方案

46 个选择
0

自动分析任意视频,通过简单的网页应用生成无版权、完美同步的背景音乐——还可选AI配音。无需编辑,无需担心授权问题,只需上传即可使用。

2

几秒钟内创作原创歌曲,即使你从未制作过音乐。

0

推出荣获2023年CES与2024年GDA奖项的MixAudio,这是一款多模态AI音乐生成器——您快速便捷的音乐创作解决方案。通过文本、图像和音频输入您的创意,即可在数秒内获得四首量身定制的曲目!

0

使用流行艺人声音模型(如 Juice WRLD、Drake、Kanye West 和 Travis Scott)生成AI音乐翻唱,自定义音轨。享受免费初始音轨创作、友好操作平台、分享功能,以及在 TikTok 和 YouTube 上广受欢迎的热门翻唱。

0

使用AI驱动的伴奏、详细的音频编辑、BPM和效果,以及在线分享选项,通过移动工作室将人声创意转化为多种风格的完整编曲,支持新手与资深创作者进行音乐制作。

0

“丰富音乐”是一款程序化音乐生成器,无需任何音乐知识即可创作音乐。只需按下几个按钮,便可生成新歌曲。

0

Musicfy 是一款人工智能驱动的工具,用户只需几秒钟即可创建自己喜爱歌曲的翻唱版本。该工具提供了一个包含众多热门歌曲的音乐库,涵盖Ariana Grande、Eminem、Drake等多位艺术家的作品。

0

Musicful 是一个由人工智能驱动的平台,可通过文本、歌词或音频输入,让您即时创建、发现并自定义免版税音乐。

上一页下一页
评分5.0 / 5.0

支持平台