logo
pub

Flux AI와 NF4로 속도와 품질 개선하기

개요

안녕하세요! Flux AI, 블랙 포레스트 랩스의 멋진 이미지 생성 도구를 손에 넣었군요? 정말 멋지죠? 근데 진짜 힘을 발휘하려면, 특히 그 멋진 Flux 체크포인트와 함께 쓰려면 잘 조정하는 방법을 알아야 해요. 자, 그럼 어떻게 다양한 Flux 체크포인트를 활용해 성능을 최대로 끌어올릴 수 있는지 dive 해볼게요!

지원하는 Flux 체크포인트

1. 사용 가능한 체크포인트

원하는 원본 Flux나 GGUF가 필요해? 이 포스트를 확인해봐.

2. 왜 NF4야?

  • 속도: 6GB/8GB/12GB GPU에서, NF4가 FP8보다 1.3배에서 4배 더 빠를 수 있어.
  • 크기: NF4의 가중치는 FP8의 절반 크기야.
  • 정확도: NF4는 숫자 정밀도와 동적 범위에서 종종 FP8을 이겨.

Flux 체크포인트 사용하기

1. GPU 설정하기

  • CUDA 지원: 장치가 11.7보다 새 버전의 CUDA를 지원하면 NF4로 가세요. 축하해요, flux1-dev-bnb-nf4.safetensors만 필요해요.
  • 구형 GPU: GTX 10XX/20XX 같은 구형 GPU가 있다면, flux1-dev-fp8.safetensors를 다운로드하세요.

2. UI에서 로딩하기

  • UI에서는 Forge가 로딩할 가중치 타입을 강제로 설정할 수 있는 옵션이 있어요.
  • 일반적으로는 자동으로 설정해서 다운로드한 체크포인트의 기본 정밀도를 사용해.

: NF4 옵션으로 FP8 체크포인트를 로드하지 마세요!

추론 속도 높이기

1. 기본 설정

  • Forge의 기본 설정도 빠르긴 한데, 속도를 더 끌어올릴 방법도 있어요.
  • 예시 시스템: 8GB VRAM, 32GB CPU 메모리, 16GB 공유 GPU 메모리.

2. 오프로드 및 스왑

  • 모델 크기가 GPU 메모리보다 크면 모델을 나누세요. 일부는 GPU로, 나머지는 "스왑" 위치(예: CPU 또는 공유 메모리)에 로드해.
  • 공유 메모리가 약 15% 더 빠를 수 있지만, 일부 장치에서 충돌할 수도 있어.

3. GPU 가중치 조정하기

  • 큰 GPU 가중치는 속도를 빠르게 하는데, 너무 크면 충돌할 수 있어요.
  • 작은 GPU 가중치는 속도를 느리게 하지만, 더 큰 이미지를 확산시킬 수 있어요.

예시 설정

Flux-dev 예시

확산에서 Flux-dev 사용:
- GPU 메모리: 8GB
- CPU 메모리: 32GB
- 공유 GPU 메모리: 16GB
- 시간: 1.5분

예시 프롬프트

정글 속의 우주 비행사, 차가운 색 팔레트, muted colors, 매우 상세하고, 선명하게 초점 맞춤.
단계: 20, 샘플러: 유러, 스케줄 유형: 간단, CFG 스케일: 1, 증류된 CFG 스케일: 3.5, Seed: 12345, 크기: 896x1152, 모델: flux1-dev-bnb-nf4-v2

자주 묻는 질문 (FAQ)

어떤 체크포인트를 사용해야 할까?

  • GPU가 새로운 CUDA 버전(>11.7)을 지원하면, 속도와 정밀도를 위해 flux1-dev-bnb-nf4.safetensors를 사용하세요.
  • 구형 GPU는 flux1-dev-fp8.safetensors를 사용해야 해요.

GPU가 T5 텍스트 인코더를 사용하게 하려면 어떻게 해야 하지?

  • T5가 기본적으로 FP8로 설정될 수 있는데, 이게 호환되지 않을 수 있어요. NF4를 처리할 수 있는 설정을 해주세요.

CPU와 GPU 간에 부품을 스왑하려면 어떻게 해?

  • 설정으로 가서 스왑 위치를 선택하세요. 공유 메모리가 더 빠른 경향이 있지만, 먼저 안정성을 확인해봐.

NF4로 SDXL 같은 모델을 사용할 수 있을까?

  • 물론이죠! NF4 확산을 사용하면 SDXL 같은 모델이 평균적으로 약 35% 빨라지지만, 씨드는 정확히 복제되진 않아요.

인페인팅이나 img2img 문제를 해결하려면?

  • Forge의 최신 버전을 사용하고 있는지 확인하세요. 필요하다면 업데이트해서 검은 이미지 문제나 누락된 출력을 해결하세요.

모델을 NF4로 변환하려면 어떻게 해?

  • 커스텀 스크립트나 커뮤니티 공유 링크를 참고해 보세요. 예를 들어, 이 NF4 버전의 flux1-schnell-bnb가 도움이 될 수 있어요: flux1-schnell-bnb-nf4.safetensors.

자, 이제 이렇게 조정하면 Flux AI 체크포인트를 최대한 활용할 수 있을 거예요. 행복한 창작하세요!