Rifinire il Tuo Flux Dev LoRA con Flux AI

Panoramica: Affinare Flux AI con LoRA

Vuoi creare modelli di immagini personalizzati? Puoi farlo usando LoRA di Flux AI. È davvero potente per la resa precisa del testo, composizioni complesse e anatomia realistica. Ecco come puoi affinare con le tue immagini. Puoi seguire il tutorial qui.

Passi per Affinare il Tuo LoRA di Flux Dev

Passo 1: Prepara le Tue Immagini di Allenamento

Prendi un bel po' di immagini (5-6 per soggetti semplici, di più se sono complessi).

Linee Guida:
- Le immagini dovrebbero concentrarsi sul soggetto.
- Va bene JPEG o PNG. Le dimensioni e i nomi dei file non importano.
- Non usare immagini di altri senza il loro permesso.
Comprimi le tue immagini:
```
zip -r data.zip data
```
Carica il tuo file zip dove può essere accessibile pubblicamente, tipo S3 o GitHub Pages.

Passo 2: Imposta il Tuo Token API di Replicate

Prendi il tuo token API da replicate.com/account e settalo nel tuo ambiente:

export REPLICATE_API_TOKEN=tuo_token

Passo 3: Crea un Modello su Replicate

Visita replicate.com/create per impostare il tuo modello. Puoi renderlo pubblico o privato.

Passo 4: Inizia l'Allenamento

Usa Python per avviare il processo di allenamento. Prima, installa il pacchetto Python di Replicate:

pip install replicate

Poi, crea il tuo lavoro di allenamento:

import replicate

training = replicate.trainings.create(
    version="ostris/flux-dev-lora-trainer",
    input={
        "input_images": "https://il-tuo-url-di-upload/data.zip",
    },
    destination="tuo-username/tuo-modello"
)
print(training)

Opzioni di Affinamento

Volti: Aggiungi questa riga per concentrarti sui volti:
```
"use_face_detection_instead": True,
```

Stile: Regola i tassi di apprendimento per gli stili:

"lora_lr": 2e-4,
"caption_prefix": 'Nello stile di XYZ,',

Monitora il Tuo Allenamento

Controlla i progressi del tuo allenamento su replicate.com/trainings o in modo programmatico:

training.reload()
print(training.status)

Esegui il Tuo Modello Allenato

Dopo l'allenamento, puoi eseguire il modello tramite il sito web di Replicate o tramite API:

output = replicate.run(
    "tuo-username/tuo-modello:version",
    input={"prompt": "una foto di XYZ che cavalca un unicorno arcobaleno"},
)

Come Funziona l'Affinamento

Le tue immagini passano per un pre-processamento:

SwinIR: Ingrossa le immagini.
BLIP: Crea didascalie di testo.
CLIPSeg: Rimuove le regioni non importanti.

Puoi dare un'occhiata a ulteriori dettagli nella README del modello SDXL.

Uso Avanzato: Integrazione con i Diffusori

Carica i pesi allenati nei Diffusori:

from diffusers import DiffusionPipeline
pipe = DiffusionPipeline.from_pretrained('stabilityai/stable-diffusion-xl-base-1.0')
pipe.unet.load_state_dict(torch.load("percorso-ai-pesi-unet.pth"))
# Ora puoi generare immagini
pipe(prompt="Una foto di <s0>").images[0].save("output.png")

FAQ

Posso usare LoRA per più concetti?

Sì, LoRA può gestire più concetti, è super versatile.

È LoRA migliore per stili o volti?

LoRA è bravissima con gli stili ma potrebbe avere qualche difficoltà con i volti.

Quante immagini mi servono?

Consiglio almeno 10 immagini.

Dove posso caricare il mio LoRA allenato?

Puoi caricarlo su un repository di Hugging Face.