ComfyUI-Gemini-API

★ 243

Google GeminiComfyUI 集成API 节点多模态生成

在ComfyUI中集成Google Gemini API，便于在节点流程中直接调用Gemini模型进行文本与多模态交互和生成。

💡 在ComfyUI流程中直接调用Google Gemini进行文本或多模态生成

🍴 27 Forks💻 Python🔄 2025-05-08

🔗 GitHub 原文

📦

网盘下载

复制链接后前往夸克网盘下载

https://pan.quark.cn/s/af9fbf81e746

📦 requirements.txt

google-genai>=1.5.0
Pillow>=10.1.0
requests
numpy
torch

📄 README

ComfyUI Gemini API

中文 | English

用于在comfyUI中调用Google Gemini API。

安装说明

方法一：手动安装

将此存储库克隆到ComfyUI的custom_nodes目录：

“`

cd ComfyUI/custom_nodes

git clone https://github.com/CY-CHENYUE/ComfyUI-Gemini-API

“`

安装所需依赖：

如果你使用ComfyUI便携版

“`

..\..\..\python_embeded\python.exe -m pip install -r requirements.txt

“`

如果你使用自己的Python环境

“`

path\to\your\python.exe -m pip install -r requirements.txt

“`

方法二：通过ComfyUI Manager安装

在ComfyUI中安装并打开ComfyUI Manager

在Manager中搜索”Gemini API”

点击安装按钮

安装完成后重启ComfyUI

节点说明

Gemini 2.0 image

通过Gemini API生成图像的节点。

输入参数：

prompt (必填)：描述你想要生成的图像的文本提示词

api_key (必填)：你的Google Gemini API密钥（首次设置后会自动保存）

model：模型选择

aspect_ratio：选择图像方向（自由比例、横屏、竖屏、方形）

temperature：控制生成多样性的参数（0.0-2.0）

seed (可选)：随机种子，指定值可重现结果

images (可选)：参考图像输入，支持多张图片

输出：

image：生成的图像，可以连接到ComfyUI的其他节点

API Respond：包含处理日志和API返回的文本信息

使用场景：

创建独特的概念艺术

基于文本描述生成图像

使用一张或多张参考图像创建风格一致的新图像

基于图像的编辑操作

多图片功能说明：

节点现在支持同时输入多张参考图像

多张图像将一起发送给Gemini API作为风格参考

系统会自动调整提示词，告知模型有多张参考图像

此功能非常适合混合多种风格或提供更多参考信息

获取API密钥

访问Google AI Studio

创建一个账户或登录

在”API Keys”部分创建一个新的API密钥

复制API密钥并粘贴到节点的api_key参数中（只需首次输入，之后会自动保存）

温度参数说明

温度值范围：0.0到2.0

较低的温度（接近0）：生成更确定性、可预测的结果

较高的温度（接近2）：生成更多样化、创造性的结果

默认值1.0：平衡确定性和创造性

注意事项

API可能有使用限制或费用，请查阅Google的官方文档

图像生成质量和速度取决于Google的服务器状态和您的网络连接

参考图像功能会将您的图像提供给Google服务，请注意隐私影响

首次使用时需要输入API密钥，之后会自动存储在节点目录中的gemini_api_key.txt文件中

关于图像方向Gemini API 会根据选择的方向（横屏、竖屏或方形）生成适合的图像（但是模型并不一定可以按照要求生成）

Contact Me

X (Twitter): @cychenyue

TikTok: @cychenyue

YouTube: @CY-CHENYUE

BiliBili: @CY-CHENYUE

小红书: @CY-CHENYUE