logo
pub

إتقان Flux AI مع NF4: تحسينات السرعة والجودة

لمحة عامة

أهلاً! يعني، انت حصلت على الـ Flux AI، أداة رائعة لتوليد الصور من Black Forest Labs، صح؟ بصراحة، قدرتك رهيبة، مو؟ بس عشان تطلق قوته بشكل حقيقي، خصوصًا مع نقاط تفتيش Flux، لازم تعرف كيف تضبطها صح. يلا نغوص في كيفية استخدام نقاط تفتيش Flux المختلفة ونطلع أفضل أداء منها!

نقاط تفتيش Flux المدعومة

1. النقاط المتاحة

  • flux1-dev-bnb-nf4-v2.safetensors: نقطة تفتيش كاملة flux-dev مع النموذج الرئيسي بنمط NF4.
  • flux1-dev-fp8.safetensors: نقطة تفتيش كاملة flux-dev مع النموذج الرئيسي بنمط FP8.

تبحث عن Flux أو GGUF الخام؟ شوف هذه التدوينة.

2. ليش NF4؟

  • السرعة: بالنسبة لكروت الشاشة 6GB/8GB/12GB، NF4 ممكن يكون 1.3x إلى 4x أسرع من FP8.
  • الحجم: أوزان NF4 تقريبًا نصف حجم FP8.
  • الدقة: NF4 في كثير من الأحيان يتفوق على FP8 في الدقة العددية والمدى الديناميكي.

استخدام نقاط تفتيش Flux

1. ضبط كرت الشاشة

  • دعم CUDA: إذا جهازك يدعم CUDA أحدث من 11.7، استخدم NF4. مبروك، بس تحتاج flux1-dev-bnb-nf4.safetensors.
  • كروت الشاشة القديمة: لو عندك كرت شاشة قديم زي GTX 10XX/20XX، حمل flux1-dev-fp8.safetensors.

2. التحميل في واجهة المستخدم

  • في الواجهة، Forge يعطيك خيار قسري لنوع الوزن المحمل.
  • بشكل عام، حطه على Auto عشان تستخدم الدقة الافتراضية في نقطة التفتيش اللي حملتها.

نصيحة: لا تحمل نقطة FP8 مع خيار NF4!

تسريع سرعة الاستدلال

1. الإعدادات الافتراضية

  • إعدادات Forge سريعة، بس تقدر تدفع حدود السرعة أكثر.
  • مثال لنظام: 8GB VRAM، 32GB ذاكرة CPU، و16GB ذاكرة GPU مشتركة.

2. التحويل والتبديل

  • إذا حجم النموذج > ذاكرة GPU، قسم النموذج. حمل جزء على GPU والجزء الآخر لموقع "التبديل"، سواء CPU أو ذاكرة مشتركة.
  • الذاكرة المشتركة ممكن تكون أسرع بـ ~15% بس ممكن تتعطل في بعض الأجهزة.

3. ضبط أوزان GPU

  • أوزان GPU الأكبر = سرعة أسرع، بس لو كانت كبيرة جدًا ممكن تسبب تعطل.
  • أوزان GPU أصغر = سرعة أبطأ، بس ممكن تفكر في تفريق صور أكبر.

إعدادات الأمثلة

مثال مع Flux-dev

استخدام Flux-dev في الانشار:
- ذاكرة GPU: 8GB
- ذاكرة CPU: 32GB
- ذاكرة GPU المشتركة: 16GB
- الوقت: 1.5 دقيقة

أمثلة على الكلمات الدالة

رائد فضاء في غابة، لوحة ألوان باردة، ألوان باهتة، تفاصيل دقيقة جدًا، تركيز حاد.
الخطوات: 20، مٌعين: أويلر، نوع الجدول: بسيط، مقياس CFG: 1، مقياس CFG المقطر: 3.5، البذور: 12345، الحجم: 896x1152، النموذج: flux1-dev-bnb-nf4-v2

الأسئلة الشائعة

أي نقاط تفتيش يجب أن أستخدم؟

  • إذا GPU الخاص بك يدعم إصدارات CUDA الأحدث (>11.7)، استخدم flux1-dev-bnb-nf4.safetensors عشان سرعة ودقة أفضل.
  • لكروت الشاشة القديمة، التزم بـ flux1-dev-fp8.safetensors.

كيف أأكد أن كرت الشاشة يستخدم مشفر النصوص T5؟

  • T5 ممكن يضبط على FP8 اللي ممكن تكون غير متوافقة. تأكد إن إعداداتك قادرة على التعامل مع NF4 عشان تحصل على أفضل أداء من مشفر النصوص T5.

كيف أقدر أبدل الأجزاء بين CPU وGPU؟

  • روح للإعدادات واختر مواقع التبديل. الذاكرة المشتركة أسرع عادةً بس تأكد الأول من الاستقرار.

هل يمكنني استخدام نماذج زى SDXL مع NF4؟

  • أكيد! استخدام NF4 للتفريق يسرع النماذج زى SDXL بحوالي 35% في المتوسط، بس مو بالضبط ينسخ البذور.

عندي مشاكل في إعادة الرسم أو img2img؟

  • تأكد إنك على أحدث إصدار من Forge. حدثه إذا كان لازم لحل مشاكل الصور السوداء أو النواتج المفقودة.

كيف أحول النماذج إلى NF4؟

  • سكريبتات مخصصة أو روابط مشتركة من المجتمع مثل هذا الإصدار NF4 من flux1-schnell-bnb ممكن تساعدك: flux1-schnell-bnb-nf4.safetensors.

وهكذا! مع هذه التعديلات، أنت جاهز عشان تطلع أفضل ما عندك من نقاط تفتيش Flux AI. استمتع بخلقك!