- pub
Flux AI로 표현력 및 몸매 형상 개선하기 위한 새로운 데이터셋 사용하기
새로운 데이터셋 실험하기
나는 Flux AI로 작업 중인데, 특히 새로운 데이터셋을 사용해서 표현과 몸체 모양의 정확성을 높이는 데 집중하고 있어. 256개의 이미지로 훈련해봤는데, 여기 실험의 주요 사항과 사진 몇 장이 있어.
문제가 발생한 부분
- 과적합: 256개의 이미지를 사용하니까 과적합이 생겼어. 이를 관리하려면 자세한提示词가 필요했는데, 그러다 보니 생성된 배경에 영향이 좀 있었어.
- 데이터셋 일관성: 다른 시간에 촬영한 이미지들은 머리카락, 체중, 피부색이 달라서 최종 결과에 일관성이 없었어.
- 표현 다양성: 초기 세트는 표현의 다양성이 적어서 얼굴 결과물이 별로 다양하지 않았어.
해결책과 개선점
- 자세한提示词: 과적합을 관리하기 위해提示词를 더 구체적으로 작성했어, 특히 환경에 대해 Claude 3.5를 사용했어.
- 개선된 데이터셋: 표현의 다양성을 높이고 짧은 간격으로 이미지를 일관되게 캡처했어.
- 고급 도구 활용: Kohya GUI로 훈련하고, SUPIR로 업스케일링, LLaVA로 캡션을 개선했어.
데이터셋 만들고 사용하기
데이터셋 준비하기
- Poco X6 카메라로 촬영했어.
- 다양한 표현과 몸체 모양을 캡처하는 데 집중했어.
- 최상의 결과를 위해 내 연구한 워크플로우를 적용했어.
훈련 워크플로우
- 다양한 데이터셋 모으기: 데이터셋에 다양한 표현과 관점을 포함시켜야 해.
- 훈련 튜토리얼 따라하기: LoRA 훈련을 위한 가이드를 사용했어.
- UI로 이미지生成하기: SwarmUI로 특정提示词로 이미지를 생성했어.
- SUPIR로 이미지 업스케일링하기: 이미지 품질을 높이기 위해 업스케일링 했어.
주요 결과
- 몸체 모양 정밀도: 모델이 몸체 모양을 정확하게 배웠고, 얼굴 특징 같은 미세한 디테일까지 포함했어.
- 향상된 현실감: 출력물이 훨씬 더 생동감 있고 해부학적으로도 정확했어.
- 표현 다양성: 개선된 얼굴 표현 결과가 이미지에 더 많은 생기를 불어넣었어.
팁과 베스트 프랙티스
- 구체적인提示词 사용하기: 과적합을 관리하기 위해 설명적인提示词을 포함시켜야 해.
- 양보다 질: 작고 일관된 데이터셋이 더 안정적인 결과를 낼 수 있어.
- 도구 실험하기: 훈련과 업스케일링을 위해 여러 도구를 활용해보고, 니즈에 맞는 것을 찾아봐.
추가 자료
- SwarmUI 튜토리얼: SwarmUI 튜토리얼 비디오
- CivitAI의 훈련 데이터셋과 워크플로우: CivitAI 모델 페이지
결론
Flux AI을 사용해서 데이터셋과 워크플로우를 실험하고 개선함으로써 표현과 몸체 모양의 정확성을 높일 수 있었어. 과적합과 일관성 문제가 있었지만, 자세한提示词과 다양한 데이터 덕분에 인상적인 결과를 얻었어. 앞으로는 워크플로우를 더 향상시키고 새로운 데이터셋을 탐색할 계획이야.
자주 묻는 질문 (FAQ)
1. Flux AI이 뭐예요?
Flux AI은 Black Forest Labs에서 만든 오픈 소스 이미지 생성 도구야. 정교한 텍스트와 복잡한 구성, 해부학적으로 정확한 이미지를 제작하는 데 특화되어 있어.
2. Flux AI로 과적합을 어떻게 처리해요?
과적합은 배경과 환경을 설명하는 자세한提示词를 제공함으로써 관리할 수 있어. 이렇게 하면 데이터셋에서 반복적인 요소의 영향을 줄일 수 있어.
3. 데이터셋을 위해 어떤 카메라를 사용했어요?
나는 Poco X6 카메라로 모든 이미지를 촬영했어. 이미지 캡처의 일관성이 더 나은 훈련 결과를 위해 매우 중요해.
4. Flux AI이 한 이미지에서 여러 표현을 처리할 수 있어요?
응, Flux AI은 데이터셋이 탄탄하고 다양할 경우 다양한 표현을 처리할 수 있어. 여러 가지 표현을 포함하는 데이터셋을 갖추는 게 중요해.
5. 훈련과 이미지 생성을 위해 어떤 도구와 UI를 사용했어요?
훈련을 위해 Kohya GUI를 사용했고, 이미지 생성을 위해 SwarmUI를 이용했어. 그리고 SUPIR는 업스케일링에, LLaVA는 캡션 향상에 사용했어.
6. Flux AI 훈련을 위한 이상적인 이미지 해상도는 뭐예요?
1024x1024 해상도로 훈련이 가장 좋은 결과를 낼 수 있어. 더 낮은 해상도는 디테일과 품질을 잃을 수 있어.
7. 데이터셋의 일관성은 어떻게 관리해요?
이미지를 통제된 일관된 환경에서 짧은 시간 동안 캡처함으로써 일관성을 개선할 수 있어. 이렇게 하면 머리카락, 체중, 피부색의 변동을 최소화할 수 있어.
8. 12GB VRAM으로 Flux AI을 사용할 수 있어요?
응, 12GB VRAM으로 Flux AI 모델의 훈련이 가능해. 더 강력한 GPU에 비해 훈련 시간이 더 걸릴 수는 있지만, 충분히 가능해.
추가 질문이 있어요?
더 궁금한 점이 있거나 추가적인 도움이 필요하면 언제든지 연락하거나 댓글 남겨줘!