Blog Playground

pub: 2024年9月13日

用 Flux AI 来提升表达和身材形状，配合新数据集

尝试新数据集

我最近在用 Flux AI，特别是想用一个新数据集来提高表情和体型的准确性。这个过程用了 256 张图像。下面是一些实验的关键点和图片。

遇到的问题

过拟合：用 256 张图像导致了过拟合。为了解决这个问题，需要更详细的提示词，这影响了生成的背景。
数据集一致性：不同时间拍摄的图像，导致头发、体重和肤色有不同，最终结果不太一致。
表情：最初的数据集表情种类有限，导致脸部结果不够多样。

解决方案和改进

详细提示词：通过让提示词更详细来控制过拟合，尤其是在环境描述上，使用了 Claude 3.5。
改进数据集：增加表情的多样性，并在短时间内保持一致的图像捕捉。
利用高级工具：使用了 Kohya GUI 进行训练，SUPIR 用于放大图像，LLaVA 用来增强描述。

创建和使用数据集

数据集准备

用 Poco X6 摄像头拍摄。
专注于捕捉各种表情和体型。
实施了我自己研究的工作流，以获得最佳结果。

训练流程

收集多样化的数据集：确保数据集包含丰富的表情和视角。
遵循训练教程：参考了 LoRA 的培训指南。
通过界面生成图像：使用 SwarmUI 生成带有具体提示词的图像。
用 SUPIR 放大图像：提升图像质量。

关键成果

体型精准度：模型准确学习了体型，包括诸如面部特征等细节。
增强的真实感：输出的图像真实感大大提高，解剖学上也更准确。
表情多样性：改进的表情结果让图像更生动。

小贴士和最佳实践

使用具体的提示词：包含描述性提示以控制过拟合。
质量重于数量：小且一致的数据集可以产生更稳定的结果。
尝试各种工具：利用不同的工具进行训练和放大，找出最适合你需要的。

额外资源

SwarmUI 教程：SwarmUI 教程视频
CivitAI上的培训数据集和工作流：CivitAI Model Page

总结

用 Flux AI，我通过实验和改进数据集和工作流，成功提升了表情和体型的准确性。虽然过拟合和一致性的问题是挑战，但详细的提示词和多样化的数据帮助我得到了很好的结果。未来的工作将继续改进工作流，并探索新数据集。

常见问题解答 (FAQ)

1. Flux AI是什么？

Flux AI 是一个开源的图像生成工具，由 Black Forest Labs 创建。它专注于生成精确的文本、复杂的构图和解剖学上准确的图像。

2. 你是怎么处理 Flux AI 的过拟合问题的？

过拟合可以通过提供详细的提示词来管理，描述背景和环境。这减少了数据集中重复元素的影响。

3. 你用什么相机拍摄数据集的图片？

我用了 Poco X6 摄像头拍摄数据集中的所有图像。保持图像捕捉的一致性对获得更好的训练结果很重要。

4. Flux AI 能否在一张图像中处理多种表情？

可以的，Flux AI 可以处理多样的表情，只要数据集足够强大且多样。确保你的数据集中包含不同的表情，这样就能做到。

5. 你用了什么工具和界面来进行训练和生成图像？

我用 Kohya GUI 进行训练，SwarmUI 生成图像。此外，还用 SUPIR 来放大，LLaVA 用来增强描述。

6. 用 Flux AI 训练的理想图像分辨率是什么？

1024x1024 的分辨率效果最好。分辨率太低可能会导致细节和质量的损失。

7. 你是怎么管理数据集不一致的问题的？

通过在短时间内在可控和统一的环境中捕捉图像，可以提高一致性。这能减少头发、体重和肤色的变化。

8. 用 12GB 的显存能使用 Flux AI 吗？

可以的，你可以用 12GB 的显存训练 Flux AI 模型。虽然训练时间可能会比更强的 GPU 久点，但这是可行的。

还有其他问题吗？

如果你还有更多问题或者需要帮助，随时可以联系我，或者留言哦！

SHARE