LoRA 低秩适配

当前功能处于实验阶段，API可能在未来版本中变更。

LoRA（大语言模型的低秩适配）是一种轻量级训练技术，能显著减少可训练参数量。其原理是通过向模型注入少量新权重参数，仅训练这些新增参数。这使得LoRA训练速度更快、内存效率更高，并生成更小的模型权重文件（通常仅数百MB），便于存储和分享。LoRA还可与DreamBooth等其他训练技术结合以加速训练过程。

LoRA具有高度通用性，目前已支持以下应用场景：DreamBooth、Kandinsky 2.2、Stable Diffusion XL、文生图以及Wuerstchen。

本指南将通过解析train_text_to_image_lora.py脚本，帮助您深入理解其工作原理，并掌握如何针对具体需求进行定制化修改。

运行脚本前，请确保从源码安装库：

git clone https://github.com/huggingface/diffusers
cd diffusers
pip install .

进入包含训练脚本的示例目录，并安装所需依赖：

PyTorch

Flax

🤗 Accelerate是一个支持多GPU/TPU训练和混合精度计算的库，它能根据硬件环境自动配置训练方案。参阅🤗 Accelerate快速入门了解更多。

初始化🤗 Accelerate环境：

accelerate config

若要创建默认配置环境（不进行交互式设置）：

accelerate config default

若在非交互环境（如Jupyter notebook）中使用：

from accelerate.utils import write_basic_config

write_basic_config()

如需训练自定义数据集，请参考创建训练数据集指南了解数据准备流程。

以下章节重点解析训练脚本中与LoRA相关的核心部分，但不会涵盖所有实现细节。如需完整理解，建议直接阅读脚本源码，如有疑问欢迎反馈。

脚本参数

训练脚本提供众多参数用于定制训练过程。所有参数及其说明均定义在parse_args()函数中。多数参数设有默认值，您也可以通过命令行参数覆盖：

例如增加训练轮次：

accelerate launch train_text_to_image_lora.py \
  --num_train_epochs=150 \

基础参数说明可参考文生图训练指南，此处重点介绍LoRA相关参数：

--rank：低秩矩阵的内部维度，数值越高可训练参数越多
--learning_rate：默认学习率为1e-4，但使用LoRA时可适当提高

训练脚本实现

数据集预处理和训练循环逻辑位于main()函数，如需定制训练流程，可在此处进行修改。

与参数说明类似，训练流程的完整解析请参考文生图指南，下文重点介绍LoRA相关实现。

UNet

text encoder

优化器仅对lora_layers参数进行优化：

optimizer = optimizer_cls(
    lora_layers,
    lr=args.learning_rate,
    betas=(args.adam_beta1, args.adam_beta2),
    weight_decay=args.adam_weight_decay,
    eps=args.adam_epsilon,
)

除LoRA层设置外，该训练脚本与标准train_text_to_image.py基本相同！

启动训练

完成所有配置后，即可启动训练脚本！🚀

以下示例使用Naruto BLIP captions训练生成火影角色。请设置环境变量MODEL_NAME和DATASET_NAME指定基础模型和数据集，OUTPUT_DIR设置输出目录，HUB_MODEL_ID指定Hub存储库名称。脚本运行后将生成以下文件：

模型检查点
pytorch_lora_weights.safetensors（训练好的LoRA权重）

多GPU训练请添加--multi_gpu参数。

在11GB显存的2080 Ti显卡上完整训练约需5小时。

export MODEL_NAME="stable-diffusion-v1-5/stable-diffusion-v1-5"
export OUTPUT_DIR="/sddata/finetune/lora/naruto"
export HUB_MODEL_ID="naruto-lora"
export DATASET_NAME="lambdalabs/naruto-blip-captions"

accelerate launch --mixed_precision="fp16"  train_text_to_image_lora.py \
  --pretrained_model_name_or_path=$MODEL_NAME \
  --dataset_name=$DATASET_NAME \
  --dataloader_num_workers=8 \
  --resolution=512 \
  --center_crop \
  --random_flip \
  --train_batch_size=1 \
  --gradient_accumulation_steps=4 \
  --max_train_steps=15000 \
  --learning_rate=1e-04 \
  --max_grad_norm=1 \
  --lr_scheduler="cosine" \
  --lr_warmup_steps=0 \
  --output_dir=${OUTPUT_DIR} \
  --push_to_hub \
  --hub_model_id=${HUB_MODEL_ID} \
  --report_to=wandb \
  --checkpointing_steps=500 \
  --validation_prompt="蓝色眼睛的火影忍者角色" \
  --seed=1337

训练完成后，您可以通过以下方式进行推理：

from diffusers import AutoPipelineForText2Image
import torch

pipeline = AutoPipelineForText2Image.from_pretrained("stable-diffusion-v1-5/stable-diffusion-v1-5", torch_dtype=torch.float16).to("cuda")
pipeline.load_lora_weights("path/to/lora/model", weight_name="pytorch_lora_weights.safetensors")
image = pipeline("A naruto with blue eyes").images[0]

后续步骤

恭喜完成LoRA模型训练！如需进一步了解模型使用方法，可参考以下指南：

学习如何加载不同格式的LoRA权重（如Kohya或TheLastBen训练的模型）
掌握使用PEFT进行多LoRA组合推理的技巧

< > Update on GitHub

Diffusers

LoRA 低秩适配

脚本参数

训练脚本实现

启动训练

后续步骤