Blog Playground

pub: 2024年10月11日

6GB 显存：用 Kohya GUI 开启 Flux AI 的高级微调

Flux AI 和 Kohya GUI 介绍

Flux AI 以其真实感和构图准确性著称，跟 Kohya GUI 合作，带来了一次改变细调功能的革命。现在更新后，即使是只有 6GB VRAM 的 GPU，也能进行细调，达到更大 48GB GPU 的质量水平。

Flux AI 和 Kohya GUI 背景

Flux AI 是一个开源工具，由黑森林实验室开发，文本准确性和解剖真实性都很高。它提供了多种模型，比如 dev、pro 和 schnell，以满足不同的创作需求。Kohya GUI 则提供了一个用户友好的界面，可以高效地进行这些模型的细调，现在对 VRAM 的要求也降低了。

更新的影响

VRAM 需求降低让更多创作者能够参与到全面细调中，以前因为硬件限制没办法的创作者可以现在尝试了。这次更新大大拓展了 AI 在创意领域的应用，让高水平的 AI 图像生成工具变得人人可用。

操作指南

使用 Kohya GUI 和 Flux AI 的步骤指南

选择 Flux AI 模型：选个合适的 Flux AI 模型（dev、pro 或 schnell），看哪个更合适你的创作需求。
访问 Kohya GUI：去更新过的 GUI 平台，确保你有最新版本，支持新 VRAM 要求。
输入描述生成图像：输入详细描述，帮助引导图像生成过程。
根据需要调整设置：使用新的块交换技术，优化细调，适应你的 VRAM 限制。
开始细调：启动过程，并且监控质量。Kohya GUI 的灵活性让你可以实时调整输出。
审查和提取：一旦对细调结果满意，就用 Kohya GUI 的功能提取结果。

理论见解

细调和 LoRA 训练：细调是调整整个模型的参数，而 LoRA 则是在静态模型上优化额外的向量权重。
块交换技术：这些技术帮助缓解 VRAM 限制，让模型参数的处理更有效。

满足用户需求

教程和指南：用户希望有更多详细教程，特别是数据集准备和分辨率的具体细节。很多人希望能有视频指南和 FAQ 页面，方便新手使用。
多 GPU 支持：很多人对能否支持多 GPU 的功能非常感兴趣，希望加快处理速度，尽管目前对 VRAM 的要求比较高。
文档改进：用户希望能有更清晰的文档，尤其是在命令行使用和后台操作方面，方便他们优化工作流程。

其他用户问题

我可以用同一个细调训练多个角色吗？
- 一般不行。不同角色的特征可能会交叉，除非在同一个图像上下文中训练。
Kohya GUI 支持文本编码器的细调吗？
- 现在 GUI 只支持 UNet 或 DIT 的细调，不支持文本编码器。
用笔记本电脑细调会有限制吗？
- 会的，笔记本电脑因为散热问题可能处理速度慢，特别是长时间的任务。
有给高级用户的 CLI 版本吗？
- 虽然主要是基于 GUI 的，Kohya 生成的 CLI 命令可以用于更技术性的流程。
LoRA 训练与全细调相比，最低 VRAM 要求是多少？
- LoRA 至少需要 8GB VRAM 用于 512px 图像，而全细调现在可以从 6GB VRAM 开始，但计算时间会增加。
Flux AI 模型会超越 SDXL 或 SD 1.5 模型吗？
- 很多用户发现，Flux AI 在质量上确实表现更好，尤其是在新的细调能力下。

随着这些进展，Kohya GUI 和 Flux AI 正在一起推动 AI 驱动图像生成领域的边界。更新使得先进的 AI 工具变得更加可及和高效，让全世界的创意用户受益。

SHARE