用 Flux AI 精调你自己的 Flux Dev LoRA

概述：用 LoRA 微调 Flux AI

想要创造自定义的图像模型吗？你可以用 Flux AI 的 LoRA 来实现哦。这个工具特别适合精准渲染文本、复杂的构图和真实的人体结构。下面是怎么用你自己的图片来进行微调的步骤。你可以在这里跟着操作。

微调你的 Flux Dev LoRA 的步骤

步骤 1：准备你的训练图片

先准备一堆图片（简单的主题5-6张，复杂的多准备点）。

指南：
- 图片要聚焦在主题上。
- JPEG 或 PNG 格式都行，尺寸和文件名无所谓。
- 不要未经别人允许就用他们的图片。
把图片压缩成 zip：
```
zip -r data.zip data
```
把你的 zip 文件上传到可以公开访问的地方，比如 S3 或 GitHub 页面。

步骤 2：设置你的 Replicate API Token

从 replicate.com/account 拿到你的 API token，然后在你的环境中设置：

export REPLICATE_API_TOKEN=your_token

步骤 3：在 Replicate 上创建模型

访问 replicate.com/create 来设置你的模型。你可以选择公开或私有。

步骤 4：开始训练

用 Python 启动训练过程。先安装 Replicate Python 包：

pip install replicate

然后，创建你的训练作业：

import replicate

training = replicate.trainings.create(
    version="ostris/flux-dev-lora-trainer",
    input={
        "input_images": "https://your-upload-url/data.zip",
    },
    destination="your-username/your-model"
)
print(training)

微调选项

人脸： 加入这行代码来专注人脸：
```
"use_face_detection_instead": True,
```

风格： 调整风格的学习率：

"lora_lr": 2e-4,
"caption_prefix": '以 XYZ 的风格，',

监控你的训练

在 replicate.com/trainings 查看你的训练进度，或者通过编程方式：

training.reload()
print(training.status)

运行你训练好的模型

训练完成后，你可以通过 Replicate 网站或 API 来运行模型：

output = replicate.run(
    "your-username/your-model:version",
    input={"prompt": "一张 XYZ 骑着彩虹独角兽的照片"},
)

微调是怎么工作的

你的图片会经过预处理：

SwinIR：提升图片分辨率。
BLIP：生成文本标题。
CLIPSeg：去除不重要的区域。

想了解更多可以看一下 SDXL 模型的 README。

进阶用法：与 Diffusers 集成

将训练好的权重加载到 Diffusers：

from diffusers import DiffusionPipeline
pipe = DiffusionPipeline.from_pretrained('stabilityai/stable-diffusion-xl-base-1.0')
pipe.unet.load_state_dict(torch.load("path-to-unet-weights.pth"))
# 现在你可以生成图像了
pipe(prompt="一张 <s0> 的照片").images[0].save("output.png")

常见问题

我可以用 LoRA 处理多个概念吗？

当然可以，LoRA 能处理多个概念，挺灵活的。

LoRA 对风格和人脸哪个更厉害？

LoRA 在风格上表现更好，但在人脸上可能会有点吃力。

我需要准备多少张图片？

最好准备至少10张图片。

我可以把训练好的 LoRA 上传到哪里？

你可以把它上传到 Hugging Face 的仓库。