- pub
Kendi Flux Geliştirme LoRA'nızı Flux AI ile İnce Ayarlama
Genel Bakış: LoRA ile Flux AI’i İyileştirme
Kendine özel görsel modeller mi yapmak istiyorsun? Flux AI’in LoRA’sını kullanarak bunu yapabilirsin. Bu şey, metinleri doğru biçimde yansıtma, karmaşık kompozisyonlar oluşturma ve gerçekçi anatomi için süper etkili. Kendi görsellerinle nasıl iyileştirme yapabileceğini buradan öğrenebilirsin buradan.
Flux Dev LoRA’ını İyileştirmek İçin Adımlar
Adım 1: Eğitim Görsellerini Hazırla
Bir sürü görsel al (basit konular için 5-6 tane, karmaşık bir şeyse daha fazlası).
- Rehberler:
- Görseller konuya odaklanmalı.
- JPEG ya da PNG sorun değil. Boyutlar ve dosya isimleri önemli değil.
- Başkalarının görsellerini izinsiz kullanma.
- Görsellerini zip yap:
zip -r data.zip data
- Zip dosyanı herkesin erişebileceği bir yere yükle, mesela S3 ya da GitHub Pages.
Adım 2: Replicate API Token’ını Ayarla
API token’ını replicate.com/account adresinden al ve ortamında ayarla:
export REPLICATE_API_TOKEN=your_token
Adım 3: Replicate’te Model Oluştur
Modelini kurmak için replicate.com/create sayfasına git. Modelini herkese açık ya da özel yapabilirsin.
Adım 4: Eğitime Başla
Eğitim sürecini başlatmak için Python kullan. Replicate Python paketini kur:
pip install replicate
Sonra, eğitim işini oluştur:
import replicate
training = replicate.trainings.create(
version="ostris/flux-dev-lora-trainer",
input={
"input_images": "https://your-upload-url/data.zip",
},
destination="your-username/your-model"
)
print(training)
İyileştirme Seçenekleri
- Yüzler: Yüzlere önem verirken bu satırı ekle:
"use_face_detection_instead": True,
- Tarz: Tarzlar için öğrenme oranlarını ayarla:
"lora_lr": 2e-4, "caption_prefix": 'XYZ tarzında,',
Eğitiminizi İzleyin
Eğitim ilerlemeni replicate.com/trainings üzerinden kontrol et ya da programlı bir şekilde:
training.reload()
print(training.status)
Eğitilmiş Modelini Çalıştırma
Eğitimden sonra, modeli Replicate web sitesi ya da API üzerinden çalıştırabilirsin:
output = replicate.run(
"your-username/your-model:version",
input={"prompt": "XYZ’nin bir renkli tekboynuz üzerinde olduğu fotoğrafı"},
)
İyileştirme Nasıl Çalışır?
Görsellerin birkaç işlemden geçiyor:
- SwinIR: Görselleri büyütüyor.
- BLIP: Metin başlıkları oluşturuyor.
- CLIPSeg: Gereksiz bölgeleri kaldırıyor.
Daha fazla bilgi için SDXL model README sayfasına göz atabilirsin.
Gelişmiş Kullanım: Diffusers Entegrasyonu
Eğitilmiş ağırlıkları Diffusers’a yükle:
from diffusers import DiffusionPipeline
pipe = DiffusionPipeline.from_pretrained('stabilityai/stable-diffusion-xl-base-1.0')
pipe.unet.load_state_dict(torch.load("path-to-unet-weights.pth"))
# Artık görseller oluşturabilirsin
pipe(prompt="Bir fotoğraf <s0>").images[0].save("output.png")
Sıkça Sorulan Sorular
LoRA’yı birden fazla kavram için kullanabilir miyim?
Evet, LoRA birden fazla kavramı yönetebiliyor, çok yönlü.
LoRA, tarzlar mı yoksa yüzler için mi daha iyi?
LoRA tarzlar konusunda oldukça iyi ama yüzlerde zorlanabilir.
Ne kadar görsel gerekiyor?
Minimum 10 görsel öneriliyor.
Eğitilmiş LoRA’mı nerede yükleyebilirim?
Bunu bir Hugging Face deposuna yükleyebilirsin.