stable-audio-2.0

stable-audio-2.0

来自 Stability AI 公司推出的文字生成音频技术及模型
2025-09-29
音视频处理
价格:
$0.02/credits

大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

Stable Audio 可以根据文本描述生成最长三分钟的高质量音乐和音效,采样率为 44.1kHz 立体声。请参阅我们的提示指南,学习如何编写有效的提示,以获得最佳生成效果。

Stable Audio 2.5:快速、高质量、长时音乐与音频生成

我们最先进的音频生成模型,能够生成最长 3 分钟、44.1 kHz 立体声的作品。Stable Audio 2.5 支持文本转音频、音频转音频和音频修补流程——创作者可以上传声音,并通过自然语言提示将其转换为新的乐器、风格或流派。非常适合音乐制作、电影级声音设计和混音。

Stable Audio 2.0:高质量音频生成

专为文本转音频和音频转音频而构建,同样能生成最长 3 分钟、44.1 kHz 的立体声。Stable Audio 2.0 非常适合用于创意发想、音乐示范以及氛围声景。它针对追求从简单提示中获得细致且较长输出的专业创作者进行了优化。


stable-audio-2 通常消耗在20-23 credits,即0.4-0.46ptc

stable-audio-2.5 消耗固定在20 credits,即0.4ptc

API调试台

登录后,探索更多精彩功能! 点击登录

API列表 (2)

API描述接口地址请求方法稳定性参数说明
Text-to-Audio(文字生成音乐)
POST
稳定
查看详情
Audio-to-Audio(参考生成音乐)
POST
稳定
查看详情

API价格表

$
模型说明302.AI价格

Text-to-Audio(文字生成音乐)

-

$0.02/credits

Audio-to-Audio(参考生成音乐)

-

$0.02/credits