torch==2.3.1 torchvision==0.18.1 numpy==1.26.1 Pillow huggingface_hub einops safetensors pydantic==2.10.6
专业的视频相机参数估计工具集,基于 VGGT 模型。
独立的模型加载器,从 ComfyUI/models/vggt/ 目录加载模型。
输入:
device: 设备选择 (auto/cuda/cpu)vggt_model: 模型版本 (VGGT-1B)输出:
vggt_model: 模型实例视频相机参数估计节点。
输入:
vggt_model: 来自模型加载器的模型实例video: 视频文件或对象frame_interval: 帧间隔 (默认5)max_frames: 最大帧数 (默认60)输出:
intrinsics_json: 相机内参 (JSON)trajectory_preview: 轨迹可视化图像poses_json: 相机外参和位置 (JSON)模型会从以下目录自动加载:
ComfyUI/models/vggt/
├── vggt_1b.pt # VGGT-1B 模型文件
如果本地没有模型文件,会自动从 HuggingFace 下载。
VVL VGGT Model Loader 节点VVL VGGT Video Camera Estimator 节点vggt_model 输入video 输入