logo
pub

PuLID-FLUX: حل تخصيص الهوية لـ Flux AI

مقدمة في PuLID-FLUX

PuLID-FLUX هو حل جديد لتخصيص الهوية بدون ضبط للنموذج FLUX.1-dev. بيحافظ على سلوك النموذج الأصلي مع إمكانية تخصيص هوية عالية الدقة.

إيش هو PuLID-FLUX؟

PuLID-FLUX-v0.9.0 هو نموذج يتيح لك تخصيص الهوية بدون الحاجة لضبط لنموذج FLUX.1-dev. النموذج مرن جداً ويحتفظ بأداء النموذج الأصلي بنفس الوقت اللي يضيف فيه هويات فريدة للصور.

الإعداد والاندماج

تثبيت PuLID-FLUX

  1. استنساخ المستودع: روح لصفحة PuLID على GitHub PuLID GitHub.
  2. إعداد البيئة: اتبع الدليل لتثبيت البيئة المطلوبة (نسخة بايثون، تبعيات، وغيرها).
    git clone https://github.com/ToTheBeginning/PuLID.git
    cd PuLID
    pip install -r requirements.txt
    
  3. تحميل النماذج المطلوبة:
  4. تشغيل التطبيق:
    python app_flux.py
    

استخدام تكوينات ذاكرة مختلفة

Naive bf16

  • شغلها مباشرة مع bf16:
    python app_flux.py
    
    • الذاكرة القصوى تحت 45GB.

bf16 + Offload

  • استخدم التحميل لتوفير الذاكرة:
    python app_flux.py --offload
    
    • الذاكرة القصوى تحت 30GB.

fp8 + Offload (لـ GPUs من مستوى المستخدم)

  • تأكد إنك مثبت المتطلبات الإضافية:
    pip install -r requirements-fp8.txt
    
  • استخدم flux-dev-fp8:
    python app_flux.py --offload --fp8 --onnx_provider cpu
    
    • الذاكرة القصوى تحت 15GB (لـ GPUs بسعة 16GB).
    • لـ مستخدمي ذاكرة 24GB:
    python app_flux.py --offload --fp8
    
    • الذاكرة القصوى تحت 17GB.
    - ملاحظة: جودة تفاصيل الوجه تقل مع fp8 مقارنة بـ bf16.
    

bf16 + Aggressive Offload

  • استخدم تحميل أكثر عدوانية:
    python app_flux.py --aggressive_offload
    
    • الذاكرة القصوى حوالي 23GB، لكن العملية بتكون بطيئة جداً.

تجربة على الإنترنت

ComfyUI

  • تابعوا دعم ComfyUI من المجتمع.

النتائج البصرية

puLID_flux_results

نصائح مفيدة

ضبط المعلمات

1. وقت بدء إدخال الهوية

  • يتحكم في توقيت إدخال الهوية. يحدد توازن دقة الهوية وقابلية التحرير.
  • الاستخدام:
    • صور واقعية: ابدأ في الوقت 4.
    • تشابه الهوية أعلى: قلل القيمة.
    • صور ذات طابع فني: اضبطها على 0-1.
start_id

2. True CFG Scale

  • FLUX.1-dev يستخدم تكرير التوجيه مع مقياس توجيه معدل لمحاكاة CFG.
  • قارن بين true CFG و fake CFG للمشاهد الفوتوغرافية والفنية.
fake_cfg_vs_true_cfg_fidelity

التفاصيل التقنية

  • تم تغيير مشفر الهوية من MLP إلى Transformer.
  • مستلهم من Flamingo، تم إضافة كتلة انتباه متقاطعة كل بضع كتل DIT للتعامل مع تفاعل ميزات الهوية مع ميزات صورة DIT.
  • طريقة تسريع اختيارية تشبه SDXL-Lightning، لكن غير ضرورية لتدريب PuLID.

الرخصة

طالما أنك تستخدم نموذج FLUX.1-dev، يجب أن تتبع رخصة نموذج FLUX.1-dev.

الاتصال

لأي استفسارات أو اقتراحات، تواصل مع Yanze Wu أو افتح قضية/مناقشة على صفحة GitHub.

أسئلة شائعة إضافية

س: كيف أستطيع تجربة PuLID-FLUX؟ ج: يمكنك بدءاً من زيارة صفحة GitHub الخاصة بهم PuLID-FLUX GitHub واتباع تعليمات الإعداد.

س: هل PuLID-FLUX يدعم الاستخدام التجاري؟ ج: الرخصة الموجودة على GitHub تشير إلى أن الاستخدام التجاري مسموح، لكن النماذج المدمجة مثل Insightface لديها قيود على الاستخدام التجاري.

س: ما هو الحد الأدنى من VRAM لـ PuLID-FLUX؟ ج: في البداية كان يحتاج 45GB، لكن التحسينات جعلته ممكن للعمل على 16GB الآن.

س: ماذا لو احتجت إلى عقدة ComfyUI؟ ج: عقدة متوافقة غير متاحة بعد، لكن المطورين مثل Cubiq متوقع منهم إصدار واحدة قريباً.

س: كيف أتعامل مع الضبابية في الصور الناتجة؟ ج: تقنيات التكبير ممكن تساعد في تقليل الضبابية بشكل فعال.

س: ما هي الميزة الرئيسية لاستخدام PuLID-FLUX مقارنة بالنماذج الأخرى؟ ج: PuLID-FLUX يقدم خيار تخصيص هوية عالي الدقة بدون ضبط، مما يجعله أداة قوية لتخصيص الصور بدقة.

س: هل PuLID-FLUX يمكن أن يعمل مع صور غير بشرية؟ ج: على الرغم من إنه مصمم بشكل أساسي لتخصيص هوية البشر، التجربة مع الصور غير البشرية يمكن أن تعطي نتائج مثيرة. زور صفحة العرض وجرب.

من خلال الانتباه لأحدث التحديثات والتحسينات، استخدام PuLID-FLUX يمكن أن يكون سهل ومجزي لعشاق توليد الصور الجادين.