Kendi Flux Geliştirme LoRA'nızı Flux AI ile İnce Ayarlama

Genel Bakış: LoRA ile Flux AI’i İyileştirme

Kendine özel görsel modeller mi yapmak istiyorsun? Flux AI’in LoRA’sını kullanarak bunu yapabilirsin. Bu şey, metinleri doğru biçimde yansıtma, karmaşık kompozisyonlar oluşturma ve gerçekçi anatomi için süper etkili. Kendi görsellerinle nasıl iyileştirme yapabileceğini buradan öğrenebilirsin buradan.

Flux Dev LoRA’ını İyileştirmek İçin Adımlar

Adım 1: Eğitim Görsellerini Hazırla

Bir sürü görsel al (basit konular için 5-6 tane, karmaşık bir şeyse daha fazlası).

Rehberler:
- Görseller konuya odaklanmalı.
- JPEG ya da PNG sorun değil. Boyutlar ve dosya isimleri önemli değil.
- Başkalarının görsellerini izinsiz kullanma.
Görsellerini zip yap:
```
zip -r data.zip data
```
Zip dosyanı herkesin erişebileceği bir yere yükle, mesela S3 ya da GitHub Pages.

Adım 2: Replicate API Token’ını Ayarla

API token’ını replicate.com/account adresinden al ve ortamında ayarla:

export REPLICATE_API_TOKEN=your_token

Adım 3: Replicate’te Model Oluştur

Modelini kurmak için replicate.com/create sayfasına git. Modelini herkese açık ya da özel yapabilirsin.

Adım 4: Eğitime Başla

Eğitim sürecini başlatmak için Python kullan. Replicate Python paketini kur:

pip install replicate

Sonra, eğitim işini oluştur:

import replicate

training = replicate.trainings.create(
    version="ostris/flux-dev-lora-trainer",
    input={
        "input_images": "https://your-upload-url/data.zip",
    },
    destination="your-username/your-model"
)
print(training)

İyileştirme Seçenekleri

Yüzler: Yüzlere önem verirken bu satırı ekle:
```
"use_face_detection_instead": True,
```

Tarz: Tarzlar için öğrenme oranlarını ayarla:

"lora_lr": 2e-4,
"caption_prefix": 'XYZ tarzında,',

Eğitiminizi İzleyin

Eğitim ilerlemeni replicate.com/trainings üzerinden kontrol et ya da programlı bir şekilde:

training.reload()
print(training.status)

Eğitilmiş Modelini Çalıştırma

Eğitimden sonra, modeli Replicate web sitesi ya da API üzerinden çalıştırabilirsin:

output = replicate.run(
    "your-username/your-model:version",
    input={"prompt": "XYZ’nin bir renkli tekboynuz üzerinde olduğu fotoğrafı"},
)

İyileştirme Nasıl Çalışır?

Görsellerin birkaç işlemden geçiyor:

SwinIR: Görselleri büyütüyor.
BLIP: Metin başlıkları oluşturuyor.
CLIPSeg: Gereksiz bölgeleri kaldırıyor.

Daha fazla bilgi için SDXL model README sayfasına göz atabilirsin.

Gelişmiş Kullanım: Diffusers Entegrasyonu

Eğitilmiş ağırlıkları Diffusers’a yükle:

from diffusers import DiffusionPipeline
pipe = DiffusionPipeline.from_pretrained('stabilityai/stable-diffusion-xl-base-1.0')
pipe.unet.load_state_dict(torch.load("path-to-unet-weights.pth"))
# Artık görseller oluşturabilirsin
pipe(prompt="Bir fotoğraf <s0>").images[0].save("output.png")

Sıkça Sorulan Sorular

LoRA’yı birden fazla kavram için kullanabilir miyim?

Evet, LoRA birden fazla kavramı yönetebiliyor, çok yönlü.

LoRA, tarzlar mı yoksa yüzler için mi daha iyi?

LoRA tarzlar konusunda oldukça iyi ama yüzlerde zorlanabilir.

Ne kadar görsel gerekiyor?

Minimum 10 görsel öneriliyor.

Eğitilmiş LoRA’mı nerede yükleyebilirim?

Bunu bir Hugging Face deposuna yükleyebilirsin.