ComfyUI-StableAudioOpen

★ 32

文本到音频音频生成ComfyUI扩展stable-audio-open

将stable-audio-open音频生成模型集成到ComfyUI中，实现从文本到音频的生成与参数控制，便于在可视化流水线中制作和调整音频。

💡 在ComfyUI中通过文本描述生成并导出音频样本。

🍴 5 Forks💻 Python🔄 2024-10-18

📦

网盘下载

复制链接后前往夸克网盘下载

https://pan.quark.cn/s/e98a62d17551

📦 requirements.txt

stable-audio-tools

📄 README

中文 | English

介绍

音频生成模型 stable-audio-open 在ComfyUI中的实现，让ComfyUI也可以实现文生音频功能。

进入节点目录, ComfyUI/custom_nodes/

git clone https://github.com/MoonHugo/ComfyUI-StableAudioOpen.git

cd ComfyUI-StableAudioOpen

pip install -r requirements.txt

重启ComfyUI

直接下载节点源码包，然后解压到custom_nodes目录下，最后重启ComfyUI

通过ComfyUI-Manager安装，搜索“ComfyUI-StableAudioOpen”进行安装

prompt: 正向提示词，比如：The sound of dog barking.

negative_prompt: 反向提示词，比如：Low quality.

seed: 整数类型，设置种子值来确保结果的可重复性，取值范围在0到0xffffffffffffffff之间。

control_after_generate: 种子变化方式，有固定、增加、减少、随机四种方式。

steps: 生成音频步数，比如：250

cfg_scale: 取值范围是0到10，默认值为6，值越高，生成的内容通常更紧密地符合给定的描述，但可能牺牲一些创造性。

sampler_type: 采样类型，有dpmpp-3m-sde、dpmpp-2m-sde、k-heun、k-dpmpp-2s-ancestral、k-dpm-2、k-dpm-fast六种采样类型。

audio_length: 设置生成的音频长度，单位是秒，最高可以生成47秒的音频。

save_path: 设置保存音频路径，比如：C:\Users\Desktop\，如果为空，则默认保存在ComfyUI\output\stable-audio-open-1.0里面。

load_local_model: 加载本地模型，默认值是False。

local_model_path: 加载本地模型的时候需要把load_local_model设置为True，并把local_model_path设置为本地模型所在路径，例如：J:\stable_audio_open，如下所示：

感谢stabilityai/stable-audio-open-1.0仓库的所有作者 stabilityai/stable-audio-open-1.0

[](https://star-history.com/#MoonHugo/ComfyUI-StableAudioOpen&Date)