logo
pub

Resumen del Modelo HyFU V1: Desatando Funcionalidades Híbridas en Flux AI

Flux Unchained by SCG

Flux Unchained por SCG

  • Autor: socalguitarist
  • Publicado: 2024-08-14T17:53:00.922Z

Detalles del Modelo

  • ID del Modelo: 645943
  • Nombre del Modelo: Flux Unchained por SCG
  • Tipo de Modelo: Entrenado con Checkpoint

Versiones del Modelo

VersiónModelo BasePasosÉpocasClip SkipPalabras EntrenadasNombreTamaño del ArchivoEnlace de Descarga
HyFU-8-Step-Hybrid-v1.0Flux.1 DNingunoNingunoNingunoHyFU-8-step-v1.0-pruned.safetensors11340.41 MBEnlace
SchnFU-v1.3-Unet-4stepFlux.1 SNingunoNingunoNingunoSchnFU-fp8-1.3.0.safetensors11340.44 MBEnlace
FU_V1_Unet_Only(FP8)Flux.1 DNingunoNingunoNingunoFluxUnchained_fp8_unet_only.safetensors11350.17 MBEnlace
FU(t5_16xfp8_e4m3fn)_v1.1Flux.1 DNingunoNingunoNingunoFluxUnchained_v1.1.0.safetensors20829.46 MBEnlace
FU(t5_8x8_e4m3fn)_v1.1Flux.1 DNingunoNingunoNingunoFluxVision.d(8x8_e4m3fn)_v1.safetensors16287.67 MBEnlace

Introducción al Modelo HyFU V1

El Modelo HyFU V1 es una novedad dentro del ecosistema de Flux AI. Se creó al fusionar entrenamientos de LoRA de bajo peso en varias pasadas sobre el modelo base Flux.d. Este modelo de funcionalidad híbrida (HyFU) está diseñado para manejar contenido NSFW, incluyendo anatomía femenina y conceptos complejos. Aún está en desarrollo (WIP) y se planean mejoras, pero los resultados hasta ahora son muy buenos.

El modelo se entrenó con una mezcla de fotogramas cinematográficos, fotografía artística y desnudos explícitos y artísticos. Alrededor del 80% del contenido explícito está basado en fotografía, mientras que el 20% utiliza IA e ilustraciones. Esto le da al modelo un conjunto de datos equilibrado para producir salidas realistas y estilísticas.

Cómo Funciona

El HyFU usa una técnica híbrida donde se combinan varias pasadas de entrenamiento. Se basa en el modelo flux.1_dev_8x8_e4m3fn-marduk191 y opera a calidad FP16 (con opción a FP8 si se solicita). Esto permite al modelo generar imágenes muy precisas y detalladas, mientras se mantienen las demandas computacionales razonables.

El modelo es particularmente efectivo para manejar imágenes tanto SFW (seguras para el trabajo) como NSFW (no seguras para el trabajo). Los usuarios han notado que responde a los prompts de manera similar al modelo base flux, lo que lo hace versátil a través de diferentes estilos artísticos.

Características del Modelo

  • Generación NSFW: Especial atención en generar anatomía femenina adecuada y contenido explícito.
  • Conjunto de Datos Equilibrado: Entrenado con 5,000 imágenes que mezclan arte y fotografía explícita.
  • FP16 & FP8: Modelo FP16 completo para mayor calidad, aunque hay una versión FP8 disponible si se solicita.
  • Prompts Flexibles: Los prompts funcionan de manera similar al modelo base flux, lo que facilita su uso.

Explicación de las Versiones del Modelo

HyFU 8-Step Hybrid V1.0

El modelo híbrido HyFU 8-pasos es la versión más popular por su equilibrio entre velocidad y calidad. Soporta composiciones más complejas y maneja poses realistas, que pueden ser complicadas para otras versiones.

  • Híbrido 8-Pasos: Diseñado para minimizar la deformación del cuerpo, especialmente en imágenes de cuerpo completo, superando a las versiones más rápidas de 4 pasos.

Modelo Schnell 4-Step

La versión "Schnell" o "rápida" es más veloz, pero menos robusta al manejar poses complejas o detalles más allá de los retratos. Es ideal para usuarios que quieren resultados rápidos y no se enfocan en composiciones intrincadas.

  • Schnell 4-Step: Renderizados más rápidos, pero con más limitaciones para manejar poses detalladas o tomas de cuerpo completo.

Preguntas Frecuentes (FAQs)

¿El modelo funciona con anatomía masculina?

El enfoque actual está muy centrado en la anatomía femenina, y ha habido solicitudes para entrenar el modelo en cuerpos masculinos y femeninos. Pero, por ahora, está más adecuado para trabajos NSFW centrados en femenino.

¿El modelo funciona en sistemas con 8GB de VRAM?

Sí, hay formas de ejecutar el modelo en sistemas con VRAM limitada. Los usuarios han reportado resultados exitosos en configuraciones con 6GB o incluso 3GB de VRAM, aunque tal vez necesites optimizar configuraciones como usar versiones NF4 o GGUF.

¿Puedo quitar el desenfoque de fondo o el efecto bokeh?

Desafortunadamente, este es un problema conocido. Los prompts negativos ralentizan significativamente la generación. En lugar de prompts negativos, intenta usar descriptores como "cámara de teléfono, enfoque plano, gran angular" para reducir el desenfoque de fondo sin sacrificar rendimiento.

¿Funciona con Automatic1111?

Si bien es posible, se recomienda usar este modelo con Forge o ComfyUI para mejor manejo de memoria y un rendimiento más fluido en general. Algunos usuarios reportan lentitudes severas o bloqueos al intentar ejecutar el modelo en A1111, especialmente al agregar LoRAs.

¿Hay forma de acelerar el tiempo de renderizado?

Para renders más rápidos, los usuarios pueden probar el muestreador LCM con un programador BETA a 1.0 CFG. Esta configuración produce buenos resultados en tan solo 4 pasos. Ten en cuenta que agregar LoRAs puede ralentizar el proceso significativamente.

¿Por qué estoy obteniendo errores en Forge?

Si te aparecen errores como "¡No tienes el dictado de estado CLIP!", asegúrate de tener los archivos correctos en tu carpeta VAE, incluyendo ae.safetensors, clip_l.safetensors y t5xxl_fp16.safetensors. Todos deben cargarse juntos para que el modelo funcione correctamente.

Conclusión

El Modelo HyFU V1 es una herramienta versátil y en evolución dentro de la línea de Flux AI. Brilla en la generación de composiciones complejas, incluyendo imágenes NSFW con anatomía adecuada, y ofrece diferentes versiones para satisfacer varias necesidades de los usuarios. Ya sea que busques velocidad o detalle, hay una versión del modelo para ti. Como es un trabajo en progreso, espera mejoras y características adicionales en futuras actualizaciones.