ComfyUI-UniversalToolkit

ComfyUI-UniversalToolkit
★ 65

图像处理音频处理掩码操作v3兼容
ComfyUI 的全能工具包,集图像、掩码、音频与实用节点于一体,模块化设计、高性能并 v3 兼容。
💡 用于批量化的图像、掩码与音频一体化处理
🍴 4 Forks💻 Python🔄 2026-03-16
📦
网盘下载
复制链接后前往夸克网盘下载
https://pan.quark.cn/s/51137d50651f
📦 requirements.txt
#
Core
dependencies
torch>=1.9.0
numpy>=1.21.0
Pillow>=8.0.0
opencv-python>=4.5.0
#
Audio
processing
librosa>=0.8.0
torchaudio>=1.9.0
soundfile>=0.10.0
#
Scientific
computing
scipy>=1.7.0
#
Color
matching
color-matcher
#
Network
requests
requests>=2.25.0
aiohttp>=3.8.0
#
Progress
bars
(optional
but
useful)
tqdm>=4.60.0
📄 README

ComfyUI-UniversalToolkit

[](https://github.com/whmc76/ComfyUI-UniversalToolkit)

[](LICENSE)

[](https://github.com/comfyanonymous/ComfyUI)

一个功能全面的ComfyUI工具包,提供丰富的图像处理、音频处理、掩码操作和实用工具节点,支持批量处理、智能分析、色彩迁移等多种高级功能。

🌟 主要特性

  • 🎨 图像处理:色彩迁移、图像拼接、尺寸调整、深度图模糊等
  • 🎵 音频处理:音频加载、裁剪、重采样、增益调节等
  • 🎭 掩码操作:掩码运算、填充、裁剪、预览等
  • 🛠️ 实用工具:数学表达式、文本处理、显存清理、预设加载等
  • 📱 智能预设:33种Kontext VLM系统预设,支持动态场景描述
  • 🔧 模块化设计:按功能分类,易于维护和扩展
  • ⚡ 高性能:支持批量处理,优化内存使用
  • 📦 安装

    方法一:通过ComfyUI-Manager安装(推荐)

  • 在ComfyUI中打开ComfyUI-Manager
  • 搜索 “ComfyUI-UniversalToolkit”
  • 点击安装
  • 方法二:手动安装

  • 将本插件文件夹放入ComfyUI的 custom_nodes/ 目录下
  • 安装依赖:
  • “`bash

    pip install -r requirements.txt

    “`

    依赖要求

    Pillow
    numpy
    torch
    librosa
    torchaudio
    opencv-python
    scipy
    tqdm

    🎯 节点功能详解

    🎨 图像处理节点

    基础图像处理

  • EmptyUnitGenerator_UTK:生成指定尺寸的空白图像、掩码和潜在空间
  • ImageRatioDetector_UTK:检测图像宽高比,支持多种比例格式
  • ImageConcatenate_UTK:水平或垂直拼接两张图像
  • ImageConcatenateMulti_UTK:智能拼接多张图像,支持2-4图自动布局
  • #### 图像变换与调整
  • ResizeImageVerKJ_UTK:KJ v2 风格的高兼容缩放,支持 stretch/resize/pad/pad_edge/pad_edge_pixel/crop/pillarbox_blur/total_pixels 与 crop_position
  • ImageScaleByAspectRatio_UTK:按指定宽高比缩放图像(已支持与 KJ v2 一致的 fit 模式与 crop_position,背景色为预设清单)
  • ImageMaskScaleAs_UTK:按参考图像尺寸缩放图像(已支持与 KJ v2 一致的 fit 模式与 crop_position,pad_color 为预设清单)
  • ImageScaleRestore_UTK:将图像恢复到原始尺寸
  • ImageRemoveAlpha_UTK:移除图像的Alpha通道
  • ImageCombineAlpha_UTK:合并Alpha通道到图像
  • 高级图像处理

  • ImitationHueNode_UTK:图像色彩迁移,支持皮肤保护和区域处理
  • DepthMapBlur_UTK:基于深度图的智能模糊,模拟景深效果
  • ImagePadForOutpaintMasked_UTK:外绘扩展,支持像素和百分比模式
  • ImageAndMaskPreview_UTK:图像和掩码预览,支持叠加和并排显示
  • 掩码相关图像处理

  • CropByMask_UTK:基于掩码智能裁剪,支持多种检测模式
  • RestoreCropBox_UTK:恢复裁剪框到原始背景
  • FillMaskedArea_UTK:掩码区域填充,支持多种算法
  • CheckMask_UTK:检查掩码有效性
  • 🎵 音频处理节点

  • LoadAudioPlusFromPath_UTK:从本地路径加载音频,支持采样率、声道、裁剪、增益等参数
  • AudioCropProcess_UTK:音频裁剪处理,支持重采样、增益、声道处理,与原生上传节点无缝对接
  • 🎭 掩码操作节点

  • MaskAnd_UTK:掩码与运算
  • MaskSub_UTK:掩码减法运算
  • MaskAdd_UTK:掩码加法运算
  • BlockifyMask_UTK:将掩码按 block_size 马赛克化(支持 cpu/cuda;可选二值化)
  • 🛠️ 工具节点

    文本处理

  • TextboxNode_UTK:多行文本输入框
  • TextConcatenate_UTK:文本拼接,支持自定义分隔符
  • ThinkRemover_UTK:分离文本中的思考内容
  • 数学与逻辑

  • MathExpression_UTK:数学表达式计算,支持复杂公式和函数
  • BestContextWindow_UTK:最佳滑动窗口帧数计算(满足 4n+1,最小化补帧;输出 best_window/padding/padded_total/segments)
  • 系统工具

  • PurgeVRAM_UTK:显存清理,支持选择性清理缓存和模型
  • LoraInfo_UTK:LoRA信息查询,获取CivitAI触发词、示例提示词、基础模型、元数据等信息
  • 预设系统

  • LoadKontextPresets_UTK:Kontext VLM系统预设,包含33种专业图像变换预设,分为8个主要分类:
  • 🎯 核心编辑类 (1个)

  • Universal Editor (万能编辑) – 默认预设,精确的图像编辑指令转换
  • 🖼️ 图像合成类 (2个)

  • Context Deep Fusion (情境深度融合) – 深度融合不同上下文的头部和身体
  • Seamless Integration (无痕融合) – 微调级别的图像合成
  • 🌍 场景环境类 (5个)

  • Scene Teleportation (场景传送) – 将主体传送到不同环境
  • Season Change (季节变换) – 改变场景的季节设定
  • Fantasy World (幻想领域) – 转换为奇幻或科幻世界
  • Furniture Removal (清空家具) – 移除房间内的所有家具
  • Interior Design (室内设计) – 重新设计室内空间风格
  • 📷 摄影技术类 (4个)

  • Camera Movement (移动镜头) – 戏剧性的镜头移动效果
  • Relighting (重新布光) – 完全改变图像的光照和氛围
  • Camera Zoom (画面缩放) – 有目的的缩放效果
  • Tilt-Shift Miniature (微缩世界) – 倾斜移轴微缩效果
  • Reflection Addition (添加倒影) – 添加反射表面增强构图
  • Character Pose & Viewpoint Change (角色姿势视角变换) – 改变角色视角保持特征一致
  • 🛒 电商应用类 (6个)

  • Professional Product Photography (专业产品图) – 商业级产品摄影效果
  • Product Lifestyle Scene (产品生活场景图) – 产品在生活场景中的展示
  • Model Hand Product Close-Up (模特手持特写) – 模特手持产品的特写摄影
  • Fashion Try-On Model Showcase (时尚试穿展示) – 服装试穿展示
  • Product Pattern Extraction (产品图案提取) – 从指定对象提取花纹或logo
  • Logo Transfer to Product (品牌融合植入) – 将logo无缝融合到产品图片中
  • 👤 人物变换类 (4个)

  • Hair Style Change (更换发型) – 完整的发型变换
  • Bodybuilding Transformation (肌肉猛男化) – 肌肉发达的体型变换
  • Age Transformation (时光旅人) – 年龄变换效果
  • Fashion Makeover (衣橱改造) – 完整的时尚改造
  • 🎨 艺术风格类 (6个)

  • Image Colorization (图像上色) – 黑白图像的艺术上色
  • Cartoon/Anime Style (卡通漫画化) – 卡通或动漫风格转换
  • Artistic Style Imitation (艺术风格模仿) – 著名艺术运动风格模仿
  • Pixel Art (像素艺术) – 像素艺术风格转换
  • Pencil Sketch (铅笔手绘) – 铅笔素描风格
  • Oil Painting (油画风格) – 油画风格转换
  • ✨ 实用功能类 (3个)

  • Material Transformation (材质置换) – 将主体转换为不同材质
  • Text Addition (添加文字) – 在图像中添加文字
  • Text Removal (移除文字) – 移除图像中的文字
  • 🚀 使用示例

    图像拼接示例

    ImageConcatenate_UTK
    ├── 输入:两张图像
    ├── 模式:水平/垂直拼接
    ├── 输出:拼接后的图像

    色彩迁移示例

    ImitationHueNode_UTK
    ├── 输入:源图像 + 目标图像
    ├── 参数:皮肤保护、亮度调节、对比度调节
    ├── 输出:色彩迁移后的图像

    音频处理示例

    AudioCropProcess_UTK
    ├── 输入:音频文件
    ├── 参数:裁剪时间、重采样率、增益调节
    ├── 输出:处理后的音频

    📋 版本历史

    v1.4.7 (最新)

  • 修复 resize 与 pad 方法表现相同的问题:
  • ResizeImageVerKJ (UTK):resize 模式只等比缩放不填充,pad 模式填充到目标尺寸
  • ImageMaskScaleAs (UTK):resize 返回实际缩放尺寸,pad 填充到目标尺寸并正确输出尺寸
  • ImageScaleByAspectRatio (UTK):resize 返回实际缩放尺寸,pad 填充到目标尺寸并正确输出尺寸
  • resize:等比缩放,输出尺寸 = 缩放后尺寸(可能小于目标尺寸)
  • pad:等比缩放 + 背景填充,输出尺寸 = 目标尺寸(固定尺寸)
  • v1.4.6

  • 新增 Resize Image ver KJ (UTK),完整对齐 KJ v2 调整模式,支持 crop_position 与 mask 同步缩放;pad_edge/pad_edge_pixel 行为与 KJ 对齐
  • 升级 Image Mask Scale As (UTK)Image Scale By Aspect Ratio (UTK):支持同样的 fit 模式、crop_position,并将背景色改为预设清单
  • 新增 Blockify Mask (UTK):掩码块化,支持二值化
  • 新增 Best Context Window (UTK):计算满足 4n+1 的最佳窗口,最小化补帧
  • 统一分类命名:UniversalToolkit/Tools
  • v1.3.2

  • 新增电商应用类,重新组织预设分类结构
  • 创建专门的电商应用类,包含6个专业电商功能:
  • Ecommerce-Professional Product Photography (专业产品图)
  • Ecommerce-Product Lifestyle Scene (产品生活场景图)
  • Ecommerce-Model Hand Product Close-Up (模特手持特写)
  • Ecommerce-Fashion Try-On Model Showcase (时尚试穿展示)
  • Ecommerce-Product Pattern Extraction (产品图案提取)
  • Ecommerce-Logo Transfer to Product (品牌融合植入)
  • 新增品牌融合植入功能,支持将logo无缝融合到产品图片中
  • 优化预设分类逻辑,将通用功能保留在实用功能类中
  • 提升电商专业功能的使用体验和分类清晰度
  • 保持所有预设的完整功能,总数达到33个,覆盖更全面的图像处理需求
  • v1.2.8

  • 新增模特手持特写预设和优化产品摄影预设
  • 新增Photo-Model Hand Product Close-Up (模特手持特写)预设,专门用于生成模特手持产品的特写摄影场景
  • 将Photo-Model Product Trial改名为Photo-Product Lifestyle Scene (产品生活场景图),更准确反映功能
  • 升级Photo-Professional Product Photography (专业产品图)预设,强调场景驱动环境优先级
  • 优化专业产品图预设:严格遵循用户场景要求,避免默认影棚背景
  • 改进场景匹配:提供购物中心橱窗、咖啡厅、户外公园等具体场景示例
  • 增强环境匹配灯光:根据场景使用商场环境光、户外自然光、室内温暖灯光
  • 提升构图焦点:强调自然前景/背景整合,保持产品作为明确焦点
  • 完善输出要求:详细描述场景设置、相机角度、背景元素、灯光风格和构图
  • 保持所有预设的完整功能,总数达到32个,覆盖更全面的图像处理需求
  • v1.2.7

  • 升级专业产品摄影和模特试用产品图预设
  • 新增Photo-Model Product Trial (模特试用产品图)预设,专门用于生成模特使用商品的场景图
  • 升级Photo-Professional Product Photography (专业产品图)预设,使用更精确的商业摄影指令
  • 优化专业产品图预设:增强场景响应式环境、专业灯光阴影控制、构图焦点卓越性
  • 改进模特试用产品图预设:强调模特产品互动、生活化环境整合、专业模特呈现
  • 提升商业摄影质量标准:确保锐利对焦、准确曝光、专业调色
  • 增强真实故事叙述:创造既真实又令人向往的生活方式故事
  • 完善输出要求:详细描述摄影设置、灯光安排、背景处理、相机角度和构图风格
  • 保持所有预设的完整功能,总数达到31个,覆盖更全面的图像处理需求
  • v1.2.6

  • 进一步优化角色姿势视角变换预设
  • 使用更精确的提示词结构,提升指令的准确性
  • 明确指定相机角度、位置和角色动作的描述要求
  • 强调角色正在执行的具体动作,让变换更加生动
  • 优化brief描述,支持更具体的用户需求
  • 保持所有角色特征的一致性要求
  • 确保光照、阴影和透视的自然性
  • 提升预设指令的精确性和实用性
  • v1.2.5

    v1.2.4

  • 优化预设分类结构,提升用户体验
  • 将原11个分类优化为7个主要分类:核心编辑、图像合成、场景环境、摄影技术、人物变换、艺术风格、特殊效果
  • 合并相似类别,减少重复,提升分类逻辑性
  • 保持所有30个预设的完整功能不变
  • 优化预设顺序,万能编辑作为默认选项
  • v1.2.3

  • 新增花纹提取预设和优化用户体验
  • 添加Pattern Extraction (花纹提取)预设,支持指定提取对象
  • 将Universal Editor (万能编辑)预设移到最前面作为默认选项
  • 优化预设顺序,提升用户使用体验
  • 支持从任意对象中提取花纹、logo、图案等
  • 完全支持$user_prompt$占位符替换机制
  • 预设总数达到30个,覆盖各种图像处理需求
  • v1.2.2

  • 新增万能编辑预设功能
  • 添加Universal Editor (万能编辑)预设,支持精确的图像编辑指令转换
  • 基于Kontext格式和Flux模型的编辑指令生成
  • 支持人物、物体、背景、风格、文本等多种编辑类型
  • 严格遵循9条编辑规则,确保视觉一致性和精确性
  • 完全支持$user_prompt$占位符替换机制
  • 优化预设指令结构,移除重复的英文输出要求
  • v1.2.1

  • 升级LoadKontextPresets_UTK节点功能
  • 新增用户提示输入参数,支持动态场景描述
  • 为所有27个预设添加$user_prompt$占位符
  • 智能占位符替换,提升VLM模型生成指令的针对性
  • v1.2.0

  • 全面更新README文档,提供详细的功能介绍和使用指南
  • 优化项目结构和文档组织
  • 完善节点功能说明和分类
  • 更新版本推送代码,确保发布流程顺畅
  • 提升项目整体文档质量和用户体验
  • v1.1.9

  • 升级LoadKontextPresets_UTK节点功能
  • 新增用户提示输入参数,支持动态场景描述
  • 为所有27个预设添加$user_prompt$占位符
  • 智能占位符替换,提升VLM模型生成指令的针对性
  • v1.1.8

  • 新增LoadKontextPresets_UTK节点
  • 提供25种图像变换预设
  • 支持情境深度融合、场景传送等多种预设
  • v1.1.7

  • 新增ThinkRemover_UTK节点
  • 支持分离文本中的思考内容
  • v1.1.6

  • 新增TextboxNode_UTK节点
  • 支持在图像上添加自定义样式文本框
  • v1.1.5

  • 优化ImitationHueNode_UTK节点的色彩迁移算法
  • 改进皮肤保护功能,提高肤色保持效果
  • v1.1.4

  • 版本更新发布,支持ComfyUI-Manager和Registry获取
  • 确保与ComfyUI v3完全兼容
  • v1.1.3

  • 修复PurgeVRAM_UTK节点类型不匹配问题
  • 修复CheckMask_UTK节点NoneType错误
  • 完成模块化重构
  • v1.1.2

  • 修复DepthMapBlur_UTK节点kernel size类型问题
  • 修正EmptyUnitGenerator_UTK输出shape
  • 完善节点导入路径
  • v1.1.1

  • 项目重构,按功能分类组织代码
  • 新增多个图像处理节点
  • 提高代码可维护性
  • v1.1.0

  • 新增CropByMask_UTK和RestoreCropBox_UTK节点
  • 支持掩码裁剪和恢复功能
  • v1.0.9

  • 新增PurgeVRAM_UTK节点
  • 支持显存清理功能
  • v1.0.8

  • 新增ImitationHueNode_UTK节点
  • 支持图像色彩迁移功能
  • v1.0.7

  • 改进ImagePadForOutpaintMasked节点
  • 新增数据模式和背景颜色选项
  • v1.0.6

  • 新增ImageAndMaskPreview_UTK节点
  • 支持图像和掩码同时预览
  • v1.0.5

  • 新增ImagePadForOutpaintMasked_UTK节点
  • 支持外绘时扩展图像尺寸
  • v1.0.4

  • 新增FillMaskedArea_UTK节点
  • 支持三种填充模式
  • v1.0.3

  • 新增掩码像素级运算节点
  • 修正节点注册与显示名风格
  • v1.0.2

  • 删除无用节点
  • 新增AudioCropProcess节点
  • 修复音频处理相关bug
  • v1.0.1

  • 改进图像拼接节点
  • 添加图像尺寸匹配和最大尺寸限制
  • v1.0.0

  • 初始版本发布
  • 包含基础图像处理、文本处理、工具类节点
  • 🔧 兼容性

  • ComfyUI版本:v1.0.0+
  • Python版本:3.8+
  • 操作系统:Windows, macOS, Linux
  • GPU支持:NVIDIA CUDA (推荐)
  • 界面设置与 Nodes 2.0 说明

    启用上下文菜单自动嵌套子目录

    在 ComfyUI 设置中可开启「启用上下文菜单自动嵌套子目录」。开启后,在模型/文件选择等带路径的 combo 下拉中,选项会按子目录折叠为层级菜单,便于在子目录较多的场景下选择。

    关于 Nodes 2.0:该功能通过修补 LiteGraph 的 ContextMenu 实现。若使用 Nodes 2.0(官方 Vue 前端),combo 下拉可能不再经过 ContextMenu,导致本功能不生效。此时可:

  • 在 ComfyUI 菜单中切换回 LiteGraph Canvas(关闭 Nodes 2.0)以使用本功能,或
  • 关注 ComfyUI 后续是否提供 combo 选项转换的扩展 API。
  • 验证方式:开启本设置后,点击任意模型/文件类节点的下拉,若浏览器控制台出现 UniversalToolkit contextMenu nest patch applied 日志,说明补丁已生效;若无该日志,则当前前端未使用 ContextMenu,本功能在该界面下不可用。

    📁 项目结构

    ComfyUI-UniversalToolkit/
    ├── nodes/
    │   ├── image/           # 图像处理节点
    │   ├── audio/           # 音频处理节点
    │   ├── mask/            # 掩码操作节点
    │   ├── tools/           # 工具节点
    │   └── image_utils.py   # 图像工具函数
    ├── web/                 # Web界面扩展
    ├── reference_code/      # 参考代码
    ├── __init__.py          # 主入口文件
    ├── requirements.txt     # 依赖列表
    ├── pyproject.toml       # 项目配置
    └── README.md           # 说明文档

    🤝 贡献

    欢迎提交Issue和Pull Request!

    开发规范

  • 遵循PEP8代码风格
  • 节点命名统一加_UTK后缀
  • 所有节点必须通过测试验证
  • 新增功能需更新文档
  • 📄 许可证

    本项目采用MIT许可证 – 详见LICENSE文件

    👨‍💻 作者信息

  • 作者:CyberDickLang
  • 邮箱:286878701@qq.com
  • GitHubhttps://github.com/whmc76
  • 🙏 致谢

    感谢以下项目的开源贡献:

  • ComfyUI – 优秀的AI图像生成框架
  • ComfyUI-LayerStyle – 模块化设计参考
  • ComfyUI-MingNodes – 色彩迁移算法参考
  • Kontext – VLM预设系统
  • kjnodes – 节点开发参考和灵感
  • audio-separation-nodes-comfyui – 音频处理节点参考

  • ⭐ 如果这个项目对您有帮助,请给我们一个Star!