logo
pub

Flux AIをNF4でマスターしよう!スピードとクオリティアップのコツ

概要

やっほー!Flux AIを手に入れたんだね。Black Forest Labsの素晴らしい画像生成ツールだよね?めっちゃいいよね!でも、そのパワーを本当に引き出すには、特にあの便利なFluxチェックポイントを使うには、ちょっとした調整が必要なんだ。さあ、いろんなFluxチェックポイントを使って、最高のパフォーマンスを引き出す方法を見ていこう!

対応しているFluxチェックポイント

1. 利用可能なチェックポイント

生のFluxやGGUFを探してる?この投稿をチェックしてみて!

2. なんでNF4?

  • 速度: 6GB/8GB/12GBのGPUでは、NF4はFP8よりも1.3倍から4倍速いんだ。
  • サイズ: NF4のウェイトはFP8の半分のサイズだよ。
  • 精度: NF4は数値精度やダイナミックレンジでFP8に勝ることが多いんだ。

Fluxチェックポイントの使い方

1. GPUのセットアップ

  • CUDAサポート: もし11.7より新しいCUDAに対応してるなら、NF4を選んでね。おめでとう!flux1-dev-bnb-nf4.safetensorsだけでOKだよ。
  • 古いGPU: GTX 10XXや20XXみたいな古いGPUなら、flux1-dev-fp8.safetensorsをダウンロードしてね。

2. UIでの読み込み

  • UIでは、Forgeがウェイトタイプを強制的に読み込むオプションを提供してるよ。
  • 一般的には自動に設定して、ダウンロードしたチェックポイントのデフォルト精度を使ってね。

ヒント: NF4オプションでFP8チェックポイントを読み込まないでね!

推論速度を上げる

1. デフォルト設定

  • Forgeのプリセットは速いけど、もっと速度を上げることもできるよ。
  • 例: 8GBのVRAM、32GBのCPUメモリ、16GBの共有GPUメモリ。

2. オフロードとスワップ

  • モデルのサイズがGPUメモリを超えたら、モデルを分けよう。ある部分をGPUに、もう一つを"スワップ"場所(CPUか共有メモリ)に読み込んでね。
  • 共有メモリは約15%速くなるけど、機器によってはクラッシュするかもしれないから注意してね。

3. GPUウェイトの調整

  • 大きなGPUウェイトは速さを上げるけど、あまり大きすぎるとクラッシュするかも。
  • 小さなGPUウェイトは遅いけど、大きな画像を拡散することはできるよ。

例となる設定

Flux-devの例

DiffusionでFlux-devを使用中:
- GPUメモリ: 8GB
- CPUメモリ: 32GB
- 共有GPUメモリ: 16GB
- 時間: 1.5分

例となるプロンプト

ジャングルの中の宇宙飛行士、寒色パレット、抑えた色合い、非常に詳細で、シャープなフォーカス。
ステップ: 20, サンプラー: Euler, スケジュールタイプ: Simple, CFGスケール: 1, 蒸留CFGスケール: 3.5, シード: 12345, サイズ: 896x1152, モデル: flux1-dev-bnb-nf4-v2

よくある質問(FAQ)

どのチェックポイントを使えばいいの?

  • GPUが新しいCUDAバージョン(>11.7)をサポートしてるなら、flux1-dev-bnb-nf4.safetensorsを使った方が、速度と精度が良いよ。
  • 古いGPUなら、flux1-dev-fp8.safetensorsにしておこう。

GPUがT5テキストエンコーダーを使ってるか確認する方法は?

  • T5はデフォルトでFP8になってるかも、互換性がない可能性があるから。NF4が扱える設定にすると、T5テキストエンコーダーの性能が最大限に引き出せるよ。

CPUとGPUの間でパーツをスワップするにはどうするの?

  • 設定に行って、スワップ場所を選んでね。共有メモリは速い傾向があるけど、安定性を先にチェックしてね。

NF4でSDXLみたいなモデルは使えるの?

  • もちろん!NF4のDiffusionはSDXLみたいなモデルを平均して約35%速くするよ。ただし、シードを完全に再現するわけじゃないけどね。

インペインティングやimg2imgの問題をどうにかしたい?

  • Forgeの最新バージョンを使ってるか確認してね。必要だったらアップデートして、黒い画像の問題や出力が missing になるのを解消しよう。

モデルをNF4に変換するには?

  • カスタムスクリプトか、コミュニティが共有してるリンク、例えばこのNF4バージョンのflux1-schnell-bnbが役立つかも: flux1-schnell-bnb-nf4.safetensors

じゃ、これでばっちり!これらの調整で、Flux AIのチェックポイントを最大限に活用できるはずだよ。楽しんで作品を作ってね!