logo
pub

Flux AI를 위한 애니메이션 감성 LoRA 훈련: 단계별 가이드

01 01 01 01

소개: Flux AI 로라 훈련 시작하기

안녕하세요! 애니메이션 스타일의 로라를 Flux AI로 훈련하는 방법이 궁금하신가요? 그렇다면 여기가 딱 맞는 곳이에요! 이 가이드는 단계별로 과정을 안내해줄 거예요. 주요 파라미터도 설명하고, 흔히 묻는 질문에도 답해드릴게요. Flux AI은 정말 자세하고 현실적인 이미지를 만드는 데 훌륭하고, 훈련된 로라를 활용하면 생성된 아트워크에 더 많은 제어권을 가질 수 있어요.

단계별 훈련 과정

1. 올바른 도구와 자원 선택하기

먼저 몇 가지 도구와 데이터셋이 필요해요:

  • 훈련 도구: XLabs AI x-flux
  • 훈련 인스턴스: RunPod A100 SXM (80GB VRAM, 기본 설정으로 42GB만 사용해요)
  • 이미지 자르기 및 크기 조절 도구: BIRME
  • 자동 캡셔닝 도구: 자연어와 태그 스타일 캡션을 위한 TagGUI

2. 데이터셋 준비하기

데이터셋은 잘 태그되고 적절한 크기(512x512 픽셀, 정사각형)여야 해요:

- 이 예시는 단 700장의 이미지에요 (앞으로는 더 많이 모은다 생각하세요)
- "anime art of" 같은 접두사를 활용해 자연어 캡션을 위해 internlm 같은 도구를 사용하세요

3. 환경 설정하기

필요한 소프트웨어와 환경을 설정해 주세요:

4. 훈련 실행하기

이런 설정을 사용해서 훈련을 시작하세요:

train_batch_size: 1
num_workers: 4
img_size: 512
learning_rate: 1e-5
lr_scheduler: constant
lr_warmup_steps: 10
adam_beta1: 0.9
adam_beta2: 0.999
adam_weight_decay: 0.01
adam_epsilon: 1e-8
max_grad_norm: 1.0

보통 2,500단계 정도면 충분하고, 비용은 약 1달러, RunPod A100 SXM 인스턴스에서 약 40분 걸려요.

자주 묻는 질문(FAQs)

1. 이 로라를 스넬 같은 다른 모델에 사용할 수 있나요?

네, 로라는 Flux.1 Dev와 스넬 모두 호환 되지만, Flux.1 Dev에 최적화 되어 있어요.

2. 훈련에 최적인 단계 수와 이미지 수는 얼마인가요?

약 2,500단계와 700장이 넘는 이미지가 더 좋은 결과를 줄 거예요. 하지만 데이터셋의 다양성에 따라 달라질 수 있어요.

3. 자연어와 태그 스타일 캡션을 둘 다 사용할 수 있나요?

네, 하지만 자연어 캡션이 일반적으로 Flux AI에서 더 좋은 결과를 내요.

4. 얼마나 많은 VRAM이 필요하나요?

적어도 42GB VRAM을 추천해요. 더 낮은 사양으로 훈련하면 오류가 발생할 수 있어요.

5. 클라우드에서 훈련 환경은 어떻게 세팅하나요?

YouTube 가이드를 따라서 약 20분 만에 RunPod를 설정할 수 있어요.

6. 로컬 머신에서 훈련할 수 있나요?

가능하지만 도전적이에요. 듀얼 3090 세팅이 통할 수도 있지만 클라우드에서 훈련하는 게 더 쉽고 비용 효율적이에요.

결론

Flux를 위한 애니메이션 스타일의 로라 훈련은 정말 재미있고 보람 있어요. 올바른 도구와 단계만 있으면, Flux의 이미지 생성 능력을 강화할 수 있는 멋진 결과를 얻을 수 있어요. 한번 시도해 보세요! 훈련 화이팅!

더 자세한 내용은 전체 토론 링크를 보세요: https://reddit.com/r/StableDiffusion/comments/1enuib1/i_trained_an_anime_aesthetic_lora_for_flux/

여기서 로라를 다운로드하세요: https://civitai.com/models/633553?modelVersionId=708301