- pub
인스타그램 에디션: Flux AI의 아마추어 사진 촬영 로라 리뷰
소개: 텍스트와 손 문제
사람들이 Flux AI로 이미지 생성할 때 텍스트와 손을 정확하게 만드는 데 문제가 있다는 걸 알아차렸어. 이런 문제들은 원래 좋은 이미지의 몰입감을 깨트릴 수 있어.
해결책: 새로운 학습 방법
이런 문제들 해결을 위해, 최신 버전의 도구가 개선점을 도입했어. 특히, 텍스트와 손의 변형을 훈련 데이터에 추가하고, Flux AI로 고급提示어를 사용하는 게 좋은 결과를 보여줬어.
자료 링크
단계 및 효과성
단계 1: 새로운 데이터로 훈련하기
- 이미지와 학습 속도: 아주 낮은 학습 속도인 0.00001로 210개의 이미지를 기반으로 AdamW8Bit 최적화기를 사용해 훈련했어.
- 훈련 기간: 모델이 세부 사항을 충분히 배울 수 있도록 9000단계 이상 훈련했어.
- 提示어에 색상 팔레트 포함: 전형적인 AI 이미지 느낌을 깨트리기 위해提示어에 색상 팔레트를 포함했어.
단계 2: 해상도 조정
- 추천 해상도: 이미지를 896x1152로 생성하는 게 좋아. 이 해상도가 일반적으로 파일 크기를 관리하면서 잘 작동해.
- 고해상도 수정: 이전에 고해상도 요구 사항으로 문제가 있었던 사람들에게, 새 모델은 극도로 높은 해상도를 사용할 필요를 줄여줘. 더 나은 결과를 원하면 'hires fix' 설정을 사용해.
단계 3:提示어 다듬기 기술
- 동적提示어: 생성된 내용의 반복성을 피하기 위해 동의어 세트를 사용하는 게 좋아.
- GPT-4와 고급提示어 사용: GPT-4 같은 도구를 활용해 기존提示어를 다듬고 확장할 수 있어. 여러 캐릭터 간 상호작용이나 복잡한 구성을 생성하는 것도 포함돼.
최적화 방법
출력을 최적화하려면:
- 동적提示어: 여러 동의어 세트를 가진提示어를 사용해 다양한 결과를 탐색하고 다양성을 높여봐.
- 단계 수 실험: 20, 30, 40단계 같은 다양한 단계 수로 실험해봐. 이미지 품질이 가장 잘 수렴하는 지점을 찾아보는 거야.
- 업스케일링 피하기: 업스케일링은 세세한 디테일을 매끄럽게 만들 수 있으니, 고해상도로 직접 이미지를 생성하는 게 나아.
이론적 지식:
- 학습 속도 영향: 0.00001 같은 낮은 학습 속도가 점진적인 조정에 도움을 줘서 디테일을 더 정확하게 잡을 수 있어.
- 최적화기 선택: AdamW8Bit은 희소 기울기를 잘 처리하고 복잡한 패턴을 학습하는 데 효과적이야.
- 이미지 해상도: 기본 고해상도에서 이미지를 생성하는 게 업스케일링보다 더 좋은 품질을 내는 경우가 많아. 업스케일링은 아티팩트나 흐릿함을 유발할 수 있어.
적합한 상황
이 모델은 특히 좋은 것이야:
- 리얼한 사진: 사실적인 디테일로 생생한 사진 만들기.
- 인스타그램 스타일 이미지: 눈에 띄는 비주얼이 중요한 소셜 미디어에 딱이야.
- 복잡한 구성: 여러 요소가 필요하거나 캐릭터 간의 복잡한 상호작용이 필요한 상황.
한계와 단점
- 손과 텍스트: 이 요소들은 아직 완벽하지 않아서 왜곡된 모습이 나올 수 있어.
- 피부 질감: 잘못 다루면 어떤 이미지는 지나치게 반짝이거나 왁스같은 피부 질감이 생길 수 있어.
- 고해상도 단점: 높은 해상도는 배경 흐림을 줄여주지만, 새로운 문제(디테일이 매끄러워지는 등)가 생길 수 있어.
자주 묻는 질문
1. 이미지 생성에 가장 좋은 해상도는 뭐예요?
896x1152면 좋지만, 더 자세한 결과를 위해 더 높은 해상도로 실험해도 돼.
2. 반짝이는 피부 문제를 어떻게 해결하나요?
DDIM_uniform 같은 샘플러로 높은 단계 수(28+)를 사용하면 더 좋은 포토리얼리즘을 얻을 수 있어.
3. 이 도구 상업적 용도로 사용할 수 있나요?
응, 가능하지만 Flux AI와 Civitai 웹사이트에서 라이센스 조건을 확인해봐야 해.
4. 왜 일부 이미지가 여전히 배경 흐림 문제 있나요?
배경 흐림은 조심스러운 훈련과 특정提示어 조정으로 최소화할 수 있어. 업스케일링은 피하는 게 좋아.
5. 텍스트를 정확하게 생성하는 방법은?
훈련 데이터에 다양한 텍스트 사례를 포함하면 정확성을 높일 수 있어.
6. '플라스틱' 같은 느낌을 피하려면 어떤 설정이 필요해요?
잘 조정된提示어, 적절한 샘플러를 조합하고 지나치게 매끄럽게 처리하지 않으면 더 자연스러운 느낌을 얻을 수 있어.
추가 질문
이 모델을 다른 도구와 어떻게 통합하나요?
다른 Flux AI 도구나 Hedra 같은 얼굴 애니메이션 도구와 결합할 수 있어. 다양한 효과를 낼 수 있을 거야.
자신의 모델을 훈련할 때 최선의 방법은 뭐예요?
다양한 데이터셋을 사용하고, 손과 텍스트의 변형을 포함시키고, 다양한提示어와 해상도로 실험해봐.
실패한 생성물은 어떻게 처리해요?
실패 패턴을 파악하고,提示어 또는 훈련 데이터를 조정하고, 여러 테스트를 실행해서 결과를 개선할 수 있어.
지원받을 수 있는 커뮤니티 자료나 포럼이 있나요?
응, Reddit이나 Discord 같은 커뮤니티에서 Flux AI 관련된 지원이나 경험을 공유받을 수 있어.
이 버전은 다른 버전과 어떻게 비교돼요?
이 버전은 고해상도 생성 문제를 해결하고, 색상 팔레트 준수를 개선하고, 더욱 다양한 훈련 데이터를 포함하는 데 초점을 맞추고 있어.
3D 렌더나 애니메이션에도 사용할 수 있나요?
주로 포토리얼리즘에 초점을 맞추고 있지만, 추가 훈련과 도구 통합으로 3D 렌더에도 확장할 수 있어.