logo
pub

Dominando Flux AI con NF4: Mejoras en Velocidad y Calidad

Resumen

¡Hola! Entonces, ¿tienes en tus manos Flux AI, una herramienta increíble para generar imágenes de Black Forest Labs, verdad? ¡Está genial, ¿no?! Pero para sacar todo su potencial, sobre todo con esos chulos puntos de control de Flux, tienes que saber cómo ajustarlo bien. Vamos a ver cómo puedes usar los diferentes puntos de control de Flux y obtener el mejor rendimiento de ellos.

Puntos de Control de Flux Soportados

1. Puntos de Control Disponibles

¿Buscas raw Flux o GGUF? Echa un vistazo a este post.

2. ¿Por qué NF4?

  • Velocidad: Para GPUs de 6GB/8GB/12GB, NF4 puede ser 1.3x hasta 4x más rápido que FP8.
  • Tamaño: Los pesos de NF4 son aproximadamente la mitad del tamaño de FP8.
  • Precisión: NF4 suele superar a FP8 en precisión numérica y rango dinámico.

Usando los Puntos de Control de Flux

1. Configura tu GPU

  • Soporte de CUDA: Si tu dispositivo soporta CUDA más reciente que la 11.7, usa NF4. ¡Felicidades! Solo necesitas el flux1-dev-bnb-nf4.safetensors.
  • GPUs más viejas: Si tienes una GPU más antigua como GTX 10XX/20XX, descarga el flux1-dev-fp8.safetensors.

2. Cargando en la UI

  • En la UI, Forge te da la opción de forzar el tipo de peso de carga.
  • Generalmente, configúralo en Auto para usar la precisión por defecto en tu punto de control descargado.

Consejo: ¡No cargues el punto de control FP8 con la opción NF4!

Aumentando la Velocidad de Inferencia

1. Configuraciones Predeterminadas

  • Los presets de Forge son rápidos, pero puedes empujar el límite de velocidad aún más.
  • Sistema Ejemplo: 8GB de VRAM, 32GB de memoria de CPU y 16GB de memoria compartida de GPU.

2. Desplazamiento y Cambio

  • Si el tamaño del modelo > memoria GPU, divide el modelo. Carga una parte en la GPU y la otra en un lugar de "swap", ya sea CPU o memoria compartida.
  • Memoria compartida puede ser ~15% más rápida, pero podría fallar en algunos dispositivos.

3. Ajustando los Pesos de GPU

  • Pesos mayores de GPU = velocidad más rápida, pero si son demasiado grandes podrían causar fallos.
  • Pesos más pequeños de GPU = velocidad más lenta pero posible de difundir imágenes más grandes.

Configuraciones de Ejemplo

Ejemplo con Flux-dev

Usando Flux-dev en difusión:
- Memoria GPU: 8GB
- Memoria CPU: 32GB
- Memoria compartida GPU: 16GB
- Tiempo: 1.5 min

Ejemplos de Prompts

Astronauta en una jungla, paleta de colores fríos, colores apagados, muy detallado, foco agudo.
Pasos: 20, Muestreador: Euler, Tipo de programación: Simple, Escala CFG: 1, Escala CFG destilada: 3.5, Semilla: 12345, Tamaño: 896x1152, Modelo: flux1-dev-bnb-nf4-v2

Preguntas Frecuentes

¿Qué puntos de control debería usar?

  • Si tu GPU soporta versiones más nuevas de CUDA (>11.7), usa flux1-dev-bnb-nf4.safetensors para mejor velocidad y precisión.
  • Para GPUs más viejas, quédate con flux1-dev-fp8.safetensors.

¿Cómo puedo asegurarme de que mi GPU esté usando el codificador de texto T5?

  • T5 podría usar FP8 por defecto, lo que podría ser incompatible. Asegúrate de que tu configuración soporte NF4 para sacarle el máximo provecho al codificador de texto T5.

¿Cómo puedo cambiar partes entre CPU y GPU?

  • Ve a configuraciones y selecciona los lugares de swap. La memoria compartida tiende a ser más rápida, pero primero verifica la estabilidad.

¿Puedo usar modelos como SDXL con NF4?

  • ¡Claro! Usar NF4 en difusión acelera modelos como SDXL alrededor del 35% de media, aunque no replica exactamente las semillas.

¿Problemas con inpainting o img2img?

  • Asegúrate de estar en la última versión de Forge. Actualízalo si es necesario para resolver problemas de imágenes negras o salidas faltantes.

¿Cómo convertir modelos a NF4?

¡Y ahí lo tienes! Con estos ajustes, deberías estar listo para sacar lo mejor de tus puntos de control Flux AI. ¡Que te diviertas creando!