ComfyUI-VisualQueryTemplate

ComfyUI-VisualQueryTemplate
★ 13

视觉问答图像转文本自动标注HuggingFace
ComfyUI节点,利用模板化视觉问答(Hugging Face VQA transformers)把图片转成可控的结构化描述,便于自动标注与提示词生成。
💡 对图片批量生成结构化描述,用于数据标注或提示词制作。
🍴 3 Forks💻 Python🔄 2025-04-01
📦
网盘下载
复制链接后前往夸克网盘下载
https://pan.quark.cn/s/e98a62d17551
📦 requirements.txt
torch
numpy
transformers
Screenshot 2024-08-28 144142
image
image
📄 README

ComfyUI-VisualQueryTemplate

A ComfyUI node for transforming images into descriptive text using templated visual question answering. Leverages Hugging Face’s VQA models with transformers