- pub
PuLID-FLUX: Решение для кастомизации ID для Flux AI
Введение в PuLID-FLUX
PuLID-FLUX — это новое решение для настройки ID без необходимости тонкой настройки для модели FLUX.1-dev. Оно сохраняет поведение оригинальной модели, но позволяет добавлять индивидуальные ID.
Что такое PuLID-FLUX?
PuLID-FLUX-v0.9.0 — это модель, которая позволяет настраивать идентификацию без тонкой настройки для модели FLUX.1-dev. Она очень гибкая и сохраняет производительность оригинальной модели при добавлении уникальных ID к изображениям.
Установка и интеграция
Установка PuLID-FLUX
- Клонировать репозиторий: Зайди на страницу PuLID в GitHub: PuLID GitHub.
- Настроить окружение: Следуй инструкциям по настройке необходимого окружения (версия Python, зависимости и т.д.).
git clone https://github.com/ToTheBeginning/PuLID.git cd PuLID pip install -r requirements.txt
- Скачать нужные модели:
- Скачай
flux1-dev.safetensors
иae.safetensors
с black-forest-labs/FLUX.1-dev. - Модель PuLID-FLUX будет скачана автоматически с Hugging Face.
- Скачай
- Запустить приложение:
python app_flux.py
Использование различных конфигураций памяти
Наивный bf16
- Запуск с
bf16
напрямую:python app_flux.py
- Пиковая память ниже 45ГБ.
bf16 + Offload
- Используй offloading для экономии памяти:
python app_flux.py --offload
- Пиковая память ниже 30ГБ.
fp8 + Offload (Для потребительских GPU)
- Убедись, что дополнительные требования установлены:
pip install -r requirements-fp8.txt
- Используй контрольный пункт
flux-dev-fp8
:python app_flux.py --offload --fp8 --onnx_provider cpu
- Пиковая память ниже 15ГБ (для GPU с 16ГБ памяти).
- Для пользователей с 24ГБ видеопамяти:
python app_flux.py --offload --fp8
- Пиковая память ниже 17ГБ.
- Примечание: качество fp8 хуже по сравнению с bf16 в деталях лиц.
bf16 + Агрессивный Offload
- Используй более агрессивный offloading:
python app_flux.py --aggressive_offload
- Пиковая память около 23ГБ, но процесс будет очень медленным.
Онлайн демо
- Попробуй на Hugging Face: Demos PuLID-FLUX
ComfyUI
- Следи за реализацией поддержки ComfyUI от сообщества.
Визуальные результаты

Полезные советы
Настройка параметров
1. Таймстеп для начала вставки ID
- Управляет временем вставки ID. Определяет баланс между точностью ID и редактируемостью.
- Использование:
- Реалистичные изображения: начинай с таймстепа 4.
- Более высокая схожесть ID: уменьшай значение.
- Стилизованные изображения: устанавливай на 0-1.

2. Истинный CFG Scale
- FLUX.1-dev использует дистилляцию руководства с модулированным шкалированием, чтобы симулировать CFG.
- Сравнивай
истинный CFG
сложным CFG
для фотореалистичных и стилизованных сцен.

Технические детали
- Переключили кодировщик ID с MLP на Transformer.
- Вдохновлено Flamingo, добавлены дополнительные блоки перекрестного внимания каждые несколько блоков DIT для работы с взаимодействием ID и DIT.
- Опциональный метод ускорения, похожий на SDXL-Lightning, хотя не критичен для обучения PuLID.
Лицензия
Пока ты используешь модель FLUX.1-dev, нужно следовать лицензии модели FLUX.1-dev.
Контакт
Если есть вопросы или предложения, можешь обратиться к Yanze Wu или открыть вопрос/обсуждение на странице GitHub.
Дополнительные часто задаваемые вопросы
В: Как я могу попробовать PuLID-FLUX? О: Начни с их страницы в GitHub: PuLID-FLUX GitHub и следуй инструкциям по установке.
В: Поддерживает ли PuLID-FLUX коммерческое использование? О: Лицензия PuLID-FLUX в GitHub указывает, что коммерческое использование разрешено, но интегрированные модели, такие как Insightface, имеют ограничения.
В: Какой рекомендованный VRAM для PuLID-FLUX? О: Сначала требовалось 45ГБ, но оптимизации сделали возможным запуск на 16ГБ.
В: Что делать, если мне нужен узел ComfyUI? О: Пока совместимого узла нет, но разработчики, как Cubiq, ожидаются с выпуском такого узла в ближайшее время.
В: Как справиться с размазанными изображениями? О: Техники увеличения могут помочь эффективно убрать размазанность.
В: Какое главное преимущество PuLID-FLUX по сравнению с другими моделями? О: PuLID-FLUX предлагает настройку ID без тонкой настройки и с высокой точностью, что делает его полезным инструментом для точной настройки изображений.
В: Может ли PuLID-FLUX работать с не-человеческими изображениями? О: Хотя модель в основном предназначена для настройки ID людях, эксперименты с не-человеческими изображениями могут принести интересные результаты. Заходи на страницу демо, чтобы попробовать.
Если внимательно следить за последними обновлениями и оптимизациями, использование PuLID-FLUX может быть и простым, и очень полезным для серьезных энтузиастов генерации изображений.