ComfyUI_VVL_VideoCamera_Advanced

★ 6

视频相机参数估计VGGT模型模型加载

基于VGGT模型的专业视频相机参数估计工具集，提供模型加载与推理接口，便于在ComfyUI中自动识别并复用摄像机参数。

💡 在ComfyUI流程中自动估计视频帧的相机参数用于后处理。

🍴 2 Forks💻 Python🔄 2025-06-23

📦

网盘下载

复制链接后前往夸克网盘下载

https://pan.quark.cn/s/f414772aa5c3

📦 requirements.txt

torch==2.3.1
torchvision==0.18.1
numpy==1.26.1
Pillow
huggingface_hub
einops
safetensors
pydantic==2.10.6

📄 README

ComfyUI VVL Video Camera Advanced

专业的视频相机参数估计工具集，基于 VGGT 模型。

独立的模型加载器，从 ComfyUI/models/vggt/ 目录加载模型。

输入:

device: 设备选择 (auto/cuda/cpu)

vggt_model: 模型版本 (VGGT-1B)

输出:

vggt_model: 模型实例

视频相机参数估计节点。

输入:

vggt_model: 来自模型加载器的模型实例

video: 视频文件或对象

frame_interval: 帧间隔 (默认5)

max_frames: 最大帧数 (默认60)

输出:

intrinsics_json: 相机内参 (JSON)

trajectory_preview: 轨迹可视化图像

poses_json: 相机外参和位置 (JSON)

模型会从以下目录自动加载：

ComfyUI/models/vggt/
├── vggt_1b.pt    # VGGT-1B 模型文件

如果本地没有模型文件，会自动从 HuggingFace 下载。

添加 VVL VGGT Model Loader 节点

添加 VVL VGGT Video Camera Estimator 节点

连接模型加载器输出到估计器的 vggt_model 输入

连接视频源到 video 输入

运行获得相机参数和轨迹可视化

模块化设计: 独立的模型加载和处理节点

智能缓存: 避免重复加载模型

多设备支持: 自动选择最优设备

精度适配: 根据硬件自动调整数据类型

3D可视化: 多视角轨迹预览