ComfyUI-Imatrix

★ 6

量化优化imatrixComfyUI-GGUF模型精度提升

实验性节点，用于生成imatrix文件以减小ComfyUI-GGUF的GGUF量化误差，通过累积与保存imatrix数据来改善量化精度。

💡 对模型多次运行后保存imatrix以减少量化误差。

🍴 2 Forks💻 Python🔄 2025-06-07

📦

网盘下载

复制链接后前往夸克网盘下载

https://pan.quark.cn/s/c73fe210bae7

📄 README

ComfyUI-GGUFで利用するGGUFファイルの量子化誤差を小さくするための、imatrixファイルを作るための実験的ノードです。

↓Flux-dev Q2_Kでの実験

モデルはここにおいてます。

使い方

MODELをImatrixUNETLoaderノードで読み込みます。

何かしらのワークフローを実行します。

SaveImatrixノードでimatrixをセーブできます。

ファイルはこのフォルダのimatrix_dataに保存されます。

SaveImatrixノードにあるImage入力は実行順をコントロールするためのものであり使われませんが、

生成IMAGEをつけるといいタイミングで実行してくれそうです。

モデルをロードしてから、実行のたびにimatrixが更新され続けるはずなので、

何度か実行した結果を平均したい場合は、最後の実行時にだけセーブノードを追加するといいと思います。

ComfyUI-GGUFのtoolsにある説明文通りGGUFファイルをつくって、

量子化時に--imatrix を追加するとできます。

GGUFファイルのテンソルは1次元目が256の倍数になるよう変換されるため、一部のモデルではconvert.pyを買い替える必要があると思います。

ただし256の倍数でないとQX_K量子化ができないので、解決策もとむ。

またConv層があるモデルもconvert.pyの書き換えが必要です。カーネル次元をflattenして2次元テンソルにしてください。