- pub
PuLID-FLUX: Soluzione di Personalizzazione ID per Flux AI
Introduzione a PuLID-FLUX
PuLID-FLUX è una nuova soluzione per la personalizzazione degli ID senza bisogno di sintonizzazione per il modello FLUX.1-dev. Mantiene il comportamento originale del modello, ma permette di personalizzare gli ID con alta fedeltà.
Cos'è PuLID-FLUX?
PuLID-FLUX-v0.9.0 è un modello che ti lascia personalizzare l’identificazione senza sintonizzare il modello FLUX.1-dev. È super flessibile e mantiene le prestazioni originali del modello, aggiungendo ID unici alle immagini.
Configurazione e Integrazione
Installazione di PuLID-FLUX
- Clona il Repository: Vai sulla pagina GitHub di PuLID a PuLID GitHub.
- Imposta l'Ambiente: Segui la guida per impostare l'ambiente necessario (versione Python, dipendenze, ecc.).
git clone https://github.com/ToTheBeginning/PuLID.git cd PuLID pip install -r requirements.txt
- Scarica i Modelli Necessari:
- Scarica
flux1-dev.safetensors
eae.safetensors
da black-forest-labs/FLUX.1-dev. - Il modello PuLID-FLUX verrà scaricato automaticamente da Hugging Face.
- Scarica
- Esegui l'Applicazione:
python app_flux.py
Utilizzo di Diverse Configurazioni di Memoria
Naive bf16
- Esegui direttamente con
bf16
:python app_flux.py
- La memoria di picco è sotto i 45GB.
bf16 + Offload
- Usa l'offloading per risparmiare memoria:
python app_flux.py --offload
- La memoria di picco è sotto i 30GB.
fp8 + Offload (Per GPU di Consumo)
- Assicurati di installare requisiti aggiuntivi:
pip install -r requirements-fp8.txt
- Usa il checkpoint
flux-dev-fp8
:python app_flux.py --offload --fp8 --onnx_provider cpu
- La memoria di picco è sotto i 15GB (per GPU con 16GB di memoria).
- Per chi ha 24GB di memoria grafica:
python app_flux.py --offload --fp8
- La memoria di picco è sotto i 17GB.
- Nota: con fp8 la qualità dei dettagli facciali può essere inferiore rispetto a bf16.
bf16 + Aggressive Offload
- Usa un offloading più aggressivo:
python app_flux.py --aggressive_offload
- La memoria di picco è circa 23GB, ma il processo sarà molto lento.
Demo Online
- Provalo su Hugging Face: Demo PuLID-FLUX
ComfyUI
- Resta aggiornato sull’implementazione della community che supporta ComfyUI.
Risultati Visivi
Consigli Utili
Sintonizzazione dei Parametri
1. Tempo per Iniziare a Inserire l'ID
- Controlla il momento in cui inserire l'ID. Imposta il compromesso tra fedeltà dell'ID e modificabilità.
- Uso:
- Immagini realistiche: inizia a timestep 4.
- Maggiore somiglianza ID: abbassa il valore.
- Immagini stilizzate: impostalo a 0-1.
2. Vero Scala CFG
- FLUX.1-dev utilizza la distillazione della guida con una scala di guida modulata per simulare il CFG.
- Confronta
vero CFG
confalso CFG
per scene fotorealistiche e stilizzate.
Dettagli Tecnici
- Cambiato l'encoder ID da MLP a Transformer.
- Ispirato da Flamingo, blocchi di cross-attention vengono inseriti ogni pochi blocchi DIT per gestire l'interazione tra le caratteristiche ID e quelle dell'immagine DIT.
- Metodo di accelerazione opzionale simile a SDXL-Lightning, ma non essenziale per l'addestramento di PuLID.
Licenza
Se usi il modello FLUX.1-dev, devi seguire la licenza del modello FLUX.1-dev.
Contatti
Per domande o suggerimenti, contatta Yanze Wu o apri un problema/discussione sulla pagina GitHub.
FAQ Aggiuntive
D: Come posso provare PuLID-FLUX? R: Puoi iniziare visitando la loro pagina GitHub a PuLID-FLUX GitHub e seguendo le istruzioni di installazione.
D: PuLID-FLUX supporta l'uso commerciale? R: La licenza su GitHub di PuLID-FLUX permette l'uso commerciale, ma modelli integrati come Insightface hanno restrizioni commerciali.
D: Qual è la VRAM consigliata per PuLID-FLUX? R: Inizialmente erano richiesti 45GB, ma ottimizzazioni ora permettono di usare 16GB.
D: Cosa fare se mi serve un nodo ComfyUI? R: Non c’è ancora un nodo compatibile, ma gli sviluppatori come Cubiq stanno per rilasciarne uno a breve.
D: Come posso risolvere il problema di sfocatura nelle immagini in output? R: Le tecniche di upscaling possono spesso ridurre efficacemente la sfocatura.
D: Qual è il principale vantaggio di usare PuLID-FLUX rispetto ad altri modelli? R: PuLID-FLUX offre un'opzione di personalizzazione ID ad alta fedeltà e senza sintonizzazione, rendendolo uno strumento robusto per una personalizzazione precisa delle immagini.
D: Può PuLID-FLUX funzionare con immagini non umane? R: Anche se è progettato principalmente per la personalizzazione degli ID umani, sperimentare con immagini non umane può portare a risultati interessanti. Visita la pagina demo per provare.
Prestando attenzione agli aggiornamenti più recenti e alle ottimizzazioni, utilizzare PuLID-FLUX può essere gestibile e molto gratificante per gli appassionati di generazione di immagini.