Flux.1 LoRA 및 DoRA 훈련을 위한 최적화된 OneTrainer 설정과 팁 (20% 더 빠름)

훈련 준비하기

먼저, Flux AI 모델이 맞는지 확인해봐. OneTrainer는 Flux, 1 dev, pro, schnall 같은 여러 모델을 지원해. 네 프로젝트에 맞는 모델을 써야 해.

하드웨어 요구 사항:
- GPU: 최소 3060을 추천해. 4090으로 훈련하면 성능이 더 좋아.
- VRAM: 고해상도를 처리하려면 최소 12GB는 필요해.
- RAM: 최소 10GB RAM을 권장하고, 더 많을수록 좋아.
소프트웨어 요구 사항:
- 운영 체제: Windows와 Linux에서 테스트 되었어.
- 의존성: 모든 의존성이 설치 되어있는지 확인해. 필요한 라이브러리와 도구는 OneTrainer 문서에서 확인해.

더 좋은 품질을 위해:
- 해상도를 768이나 1024로 설정해.
EMA 설정:
- EMA: SDXL 훈련 중에 사용해.
- EMA GPU: VRAM을 아끼려면 EMA를 "GPU"에서 "OFF"로 해.
학습률:
- 시작할 때 0.0003이나 0.0004로 해봐. 너의 필요에 맞게 조정해.
에포크 수:
- 보통 40 에포크면 좋은 결과를 내. 데이터셋의 복잡성에 따라서 조정해.

그래디언트 체크포인팅:
- 속도가 느리다면 이걸 꺼보는 것도 좋아, 특히 하드웨어가 더 높은 VRAM을 지원하면 그렇고.
bf16 vs nfloat4:
- "모델" 탭에서 Override Prior Data Type를 bf16으로 바꾸면 품질이 올라갈 수 있어. 이 설정은 VRAM과 속도에 영향을 줘.

Q1: OneTrainer를 Flux.1 외의 모델에서 사용할 수 있어?

응, OneTrainer는 SD 1.5, SDXL 같은 모델도 지원해. 설정은 모델에 따라서 달라질 거야.

Q2: OneTrainer는 자동으로 개념 이름을 트리거 단어로 사용해?

응, 개념 이름이 트리거 단어로 작용할 수 있어. 네 프로젝트에 맞는 의미 있는 이름으로 설정해.

Q3: 훈련 중에 VRAM을 효과적으로 관리하려면 어떻게 해?

Gradient Checkpointing을 CPU_OFFLOAD로 설정해. 이 설정이 VRAM 사용량을 줄이면서 속도에 큰 영향은 없어.

Q4: NF4와 전체 정밀도 레이어를 사용할 때의 영향은 뭐야?

NF4는 VRAM 사용량을 줄이지만 품질이 약간 떨어질 수 있어. 전체 정밀도 레이어는 품질을 유지하지만 더 많은 VRAM이 필요해.

Q5: LoRA 모델의 크기를 줄이는 방법은?

Rank와 Alpha 값을 줄이거나 LoRA weight data type을 bfloat16로 설정해. 이게 크기를 줄이지만 품질에 영향 줄 수 있어.

Q6: OneTrainer가 다중 해상도 훈련을 처리할 수 있어?

응, OneTrainer는 다중 해상도 훈련을 지원해. 설정 방법은 OneTrainer 위키에서 확인해.

Q7: DoRA를 사용할 때 이미지가 분홍색 정적처럼 보여. 어떻게 해야 해?

어텐션 레이어 설정을 확인해. 어텐션 레이어를 "full"로 쓰지 않는 게 좋을 수 있어, 이게 문제를 일으킬 수 있어.

Q8: OneTrainer에서 여러 대상을 다루려면 어떻게 해야 해?

각 대상을 위해 다른 반복 값을 설정해서 균형 잡힌 훈련을 해. 데이터를 잘 정리해서 두 대상이 고르게 훈련받도록 해.

Q9: OneTrainer에 '스플릿 모드' 같은 기능이 있어?

OneTrainer에는 '스플릿 모드'가 없어. 대신 Gradient Checkpointing의 CPU_OFFLOAD 설정을 사용해 VRAM을 더 효과적으로 관리해.

Q10: 제 품질을 높이기 위해서 VRAM 사용량을 늘리는 설정을 조정할 수 있어?

응, 해상도를 올리고 데이터 타입과 그래디언트 체크포인팅 설정을 조정해 품질을 높일 수 있어.

이 가이드가 Flux AI 모델로 OneTrainer를 효과적으로 사용하는 데 필요한 모든 단계, 설정, 문제 해결 팁을 제공해. 훈련 잘 해!