- pub
PuLID-FLUX: Solução de Personalização de ID para Flux AI
Introdução ao PuLID-FLUX
O PuLID-FLUX é uma nova solução de personalização de ID que não precisa de ajuste para o modelo FLUX.1-dev. Ele mantém o comportamento original do modelo e ainda permite uma personalização de ID com alta fidelidade.
O que é PuLID-FLUX?
O PuLID-FLUX-v0.9.0 é um modelo que deixa você personalizar identificações sem precisar ajustar o modelo FLUX.1-dev. Ele é bem flexível e mantém o desempenho do modelo original enquanto adiciona IDs únicos às imagens.
Configuração e Integração
Instalando o PuLID-FLUX
- Clone o Repositório: Vá para a página do PuLID no GitHub em PuLID GitHub.
- Configure o Ambiente: Siga o guia para configurar o ambiente necessário (versão do Python, dependências, etc.).
git clone https://github.com/ToTheBeginning/PuLID.git cd PuLID pip install -r requirements.txt
- Baixe os Modelos Necessários:
- Baixe
flux1-dev.safetensors
eae.safetensors
em black-forest-labs/FLUX.1-dev. - O modelo PuLID-FLUX será baixado automaticamente do Hugging Face.
- Baixe
- Execute o Aplicativo:
python app_flux.py
Usando Diferentes Configurações de Memória
Naive bf16
- Execute com
bf16
diretamente:python app_flux.py
- O pico de memória fica abaixo de 45GB.
bf16 + Offload
- Use offloading para economizar memória:
python app_flux.py --offload
- O pico de memória fica abaixo de 30GB.
fp8 + Offload (Para GPUs de Consumo)
- Verifique se você tem os requisitos adicionais instalados:
pip install -r requirements-fp8.txt
- Use o checkpoint
flux-dev-fp8
:python app_flux.py --offload --fp8 --onnx_provider cpu
- O pico de memória fica abaixo de 15GB (para GPUs com 16GB de memória).
- Para usuários com 24GB de memória gráfica:
python app_flux.py --offload --fp8
- O pico de memória fica abaixo de 17GB.
- Nota: fp8 tem degradação de qualidade nos detalhes do rosto em comparação ao bf16.
bf16 + Offload Agressivo
- Use offloading mais agressivo:
python app_flux.py --aggressive_offload
- O pico de memória fica em torno de 23GB, mas o processo será bem lento.
Demonstração Online
- Experimente no Hugging Face: Demo PuLID-FLUX
ComfyUI
- Fique ligado na implementação de suporte ao ComfyUI pela comunidade.
Resultados Visuais
Dicas Úteis
Ajuste de Parâmetros
1. Tempo para Começar a Inserir ID
- Controla o momento da inserção do ID. Define a fidelidade do ID e a possibilidade de edição.
- Uso:
- Imagens realistas: Comece no tempo 4.
- Maior similaridade de ID: Diminua o valor.
- Imagens estilizadas: Defina de 0 a 1.
2. Verdadeiro CFG Scale
- O FLUX.1-dev usa destilação de orientação com uma escala de orientação modulada para simular CFG.
- Compare
true CFG
comfake CFG
para cenas fotorrealistas e estilizadas.
Detalhes Técnicos
- Mudou o codificador de ID de MLP para Transformer.
- Inspirado pelo Flamingo, blocos de atenção cruzada adicionais são inseridos a cada alguns blocos DIT para lidar com a interação das características do ID com as características da imagem DIT.
- Método de aceleração opcional, semelhante ao SDXL-Lightning, mas não essencial para treinar o PuLID.
Licença
Enquanto você usar o modelo FLUX.1-dev, deve seguir a licença do modelo FLUX.1-dev.
Contato
Para dúvidas ou sugestões, entre em contato com Yanze Wu ou abra um problema/discussão na página do GitHub.
FAQs Adicionais
Q: Como posso experimentar o PuLID-FLUX? A: Você pode começar visitando a página do GitHub deles em PuLID-FLUX GitHub e seguindo as instruções de configuração.
Q: O PuLID-FLUX suporta uso comercial? A: A licença no GitHub do PuLID-FLUX sugere que o uso comercial é permitido, mas modelos integrados como o Insightface têm restrições comerciais.
Q: Qual é a VRAM recomendada para PuLID-FLUX? A: Inicialmente, eram necessários 45GB, mas otimizações tornaram possível rodar com 16GB agora.
Q: E se eu precisar de um node para ComfyUI? A: Um node compatível ainda não está disponível, mas desenvolvedores como Cubiq devem lançar um em breve.
Q: Como lido com a borrão nas imagens de saída? A: Técnicas de upscale podem geralmente mitigar o borrão de forma eficaz.
Q: Qual é a principal vantagem de usar o PuLID-FLUX em relação a outros modelos? A: O PuLID-FLUX oferece uma opção de personalização de ID de alta fidelidade e sem ajustes, tornando-se uma ferramenta robusta para personalização precisa de imagens.
Q: O PuLID-FLUX pode funcionar com imagens não-humanas? A: Embora seja projetado principalmente para personalização de ID humano, experimentar com imagens não-humanas pode gerar resultados interessantes. Acesse a página de demonstração para tentar.
Mantendo atenção nas atualizações e otimizações mais recentes, usar o PuLID-FLUX pode ser tanto manejável quanto altamente gratificante para amantes sérios da geração de imagens.