ComfyUI-AudioX

★ 11

音频加载音频处理可视化工作流FFmpeg 兼容

在 ComfyUI 中集成 AudioX 节点，实现音频加载、处理与导出，便于可视化构建音频处理与生成流程

💡 在可视化流程中处理、生成并导出音频数据

🍴 2 Forks💻 Python🔄 2025-05-27

🔗 GitHub 原文

📦

网盘下载

复制链接后前往夸克网盘下载

https://pan.quark.cn/s/a9fb3a59e10c

📦 requirements.txt

aeiou
alias-free-torch==0.0.6
auraloss==0.4.0
descript-audio-codec==1.0.0
decord==0.6.0
einops
einops_exts
ema-pytorch==0.2.3
encodec==0.1.1
huggingface_hub
importlib-resources==5.12.0
k-diffusion==0.1.1
laion-clap==1.1.6
local-attention==1.8.6
pandas==2.0.2
pedalboard==0.9.14
prefigure==0.0.9
pytorch_lightning==2.4.0
PyWavelets==1.4.1
safetensors
sentencepiece==0.1.99
torch>=2.0.1
torchaudio>=2.0.2
torchmetrics==0.11.4
tqdm
transformers
v-diffusion-pytorch==0.0.2
vector-quantize-pytorch==1.9.14
wandb
webdataset==0.2.48
x-transformers<1.27.0

📄 README

ComfyUI-AudioX

Make AudioX avialbe in ComfyUI.

AudioX: Diffusion Transformer for Anything-to-Audio Generation.

Installation

Make sure you have ComfyUI installed

Clone this repository into your ComfyUI’s custom_nodes directory:

cd ComfyUI/custom_nodes
git clone https://github.com/Yuan-ManX/ComfyUI-AudioX.git

Install dependencies:

cd ComfyUI-AudioX
pip install -r requirements.txt
conda install -c conda-forge ffmpeg libsndfile

Model

Pretrained Checkpoints

Download the pretrained model from 🤗 AudioX on Hugging Face:

mkdir -p model
wget https://huggingface.co/HKUSTAudio/AudioX/resolve/main/model.ckpt -O model/model.ckpt
wget https://huggingface.co/HKUSTAudio/AudioX/resolve/main/config.json -O model/config.json