- pub
Mastering Flux AI mit NF4: Geschwindigkeit und Qualitätsverbesserungen
Übersicht
Hey, was geht? Du hast also Flux AI, dieses coole Bildgenerierungstool von Black Forest Labs, am Start, oder? Mega, oder? Aber um die volle Power auszunutzen, besonders mit den coolen Flux-Checkpoints, musst du wissen, wie du das Ding richtig anpassen kannst. Lass uns mal schauen, wie du verschiedene Flux-Checkpoints nutzen kannst, um die beste Leistung rauszuholen!
Unterstützte Flux-Checkpoints
1. Verfügbare Checkpoints
- flux1-dev-bnb-nf4-v2.safetensors: Voller flux-dev-Checkpoint mit dem Hauptmodell in NF4.
- Empfohlen: Lad es dir von HuggingFace herunter
- flux1-dev-fp8.safetensors: Voller flux-dev-Checkpoint mit dem Hauptmodell in FP8.
Suchst du nach rohem Flux oder GGUF? Schau dir diesen Beitrag an.
2. Warum NF4?
- Geschwindigkeit: Für 6GB/8GB/12GB GPUs kann NF4 1,3x bis 4x schneller sein als FP8.
- Größe: NF4-Gewichte sind ungefähr halb so groß wie FP8.
- Genauigkeit: NF4 hat oft die Nase vorn in numerischer Präzision und dynamischem Bereich.
Nutzung von Flux-Checkpoints
1. Setze deine GPU auf
- CUDA-Unterstützung: Wenn dein Gerät CUDA neuer als 11.7 unterstützt, nimm NF4. Glückwunsch, du brauchst nur die
flux1-dev-bnb-nf4.safetensors
. - Ältere GPUs: Hast du eine ältere GPU wie GTX 10XX/20XX, lad dir die
flux1-dev-fp8.safetensors
herunter.
2. Laden in der UI
- In der UI bietet Forge die Option, den Gewichtstyp beim Laden zu erzwingen.
- Im Allgemeinen solltest du es auf Auto setzen, um die Standard-Präzision in deinem heruntergeladenen Checkpoint zu nutzen.
Tipp: Lade den FP8-Checkpoint nicht mit der NF4-Option!
Beschleunigung der Inferenzgeschwindigkeit
1. Standardeinstellungen
- Die Voreinstellungen von Forge sind schnell, aber du kannst noch einen drauflegen.
- Beispielsystem: 8GB VRAM, 32GB CPU-Speicher und 16GB gemeinsamer GPU-Speicher.
2. Offloading und Swapping
- Wenn die Modellgröße > GPU-Speicher, teile das Modell auf. Lad einen Teil in die GPU und den anderen Teil in den „Swap“-Speicher, entweder CPU oder Shared Memory.
- Shared Memory kann ~15% schneller sein, könnte aber auf manchen Geräten abstürzen.
3. Feinabstimmung der GPU-Gewichte
- Größere GPU-Gewichte = schnellere Geschwindigkeit, aber zu groß könnte zu Abstürzen führen.
- Kleinere GPU-Gewichte = langsamere Geschwindigkeit, aber möglich, größere Bilder zu diffundieren.
Beispielkonfigurationen
Beispiel mit Flux-dev
Verwendung von Flux-dev bei der Diffusion:
- GPU-Speicher: 8GB
- CPU-Speicher: 32GB
- Gemeinsamer GPU-Speicher: 16GB
- Zeit: 1,5 min
Beispiel-Prompts
Astronaut in einem Dschungel, kaltes Farbschema, gedämpfte Farben, sehr detailliert, scharfer Fokus.
Schritte: 20, Sampler: Euler, Planartyp: Einfach, CFG-Skala: 1, Destillierte CFG-Skala: 3,5, Seed: 12345, Größe: 896x1152, Modell: flux1-dev-bnb-nf4-v2
Häufige Fragen (FAQ)
Welche Checkpoints sollte ich verwenden?
- Wenn deine GPU neuere CUDA-Versionen (>11.7) unterstützt, nimm
flux1-dev-bnb-nf4.safetensors
für bessere Geschwindigkeit und Präzision. - Für ältere GPUs bleib bei
flux1-dev-fp8.safetensors
.
Wie kann ich sicherstellen, dass meine GPU den T5-Textencoder verwendet?
- T5 könnte standardmäßig auf FP8 stehen, was nicht kompatibel sein könnte. Stelle sicher, dass dein Setup NF4 unterstützen kann, um das Beste aus dem T5-Textencoder rauszuholen.
Wie kann ich Teile zwischen CPU und GPU tauschen?
- Geh zu den Einstellungen und wähle die Swap-Standorte aus. Shared Memory ist oft schneller, aber prüfe zuerst die Stabilität.
Kann ich Modelle wie SDXL mit NF4 verwenden?
- Klar! Die Nutzung von NF4-Diffusion beschleunigt Modelle wie SDXL im Durchschnitt um etwa 35%, allerdings wird nicht exakt die gleiche Seed-Replikation erzielt.
Probleme mit Inpainting oder img2img?
- Stelle sicher, dass du die neueste Version von Forge verwendest. Aktualisiere sie gegebenenfalls, um Probleme mit schwarzen Bildern oder fehlenden Ausgaben zu beheben.
Wie konvertiere ich Modelle zu NF4?
- Vielleicht helfen dir benutzerdefinierte Skripte oder von der Community geteilte Links wie diese NF4-Version von
flux1-schnell-bnb
: flux1-schnell-bnb-nf4.safetensors.
So, und das war's auch schon! Mit diesen Tweaks bist du bereit, das Beste aus deinen Flux AI-Checkpoints rauszuholen. Viel Spaß beim Kreieren!