license: other
tags:
- text-to-image
- stable-diffusion
- lora
- diffusers
- chinese
- realism
- asian
- elderly
- style
- children
- middle-age
base_model: stabilityai/stable-diffusion-xl-base-1.0
instance_prompt: null
widget:
- text: ' a middle-aged man in front of a building, half body'
- text: photograph of a female high school student in class room, half body
- text: portrait photograph of an old man on street, half body
- text: a young man on street, half body
- text: a young woman on street, half body
当代华人 Contemporary Chinese for XL1.0 and SD1.5 (CivitAI)
a middle-aged man in front of a building, half body
尝试优化基础模型中缺乏华人形象的问题,使用 500 张人物环境肖像照,典型职业肖像照和环境照训练,力图覆盖不同性别和年龄段。
使用时无需 Trigger Words,在 SD 1.5 下权重一般不超过 0.8,在 SDXL 1.0 下权重可提高到 1.0。
注意:easynegative 和 ng_deepnegative_v1_75t 两个 Embeddings 会影响此 LoRA 效果,请避免同时使用。
V2.0 for SDXL 1.0 更新:
SDXL 1.0 对亚洲人形象的支持,相对于 SD 1.5 已经有了很大的提升。 我仍然针对 SDXL 训练了一个版本,在基础模型表现不佳的情况下可以尝试使用此 LoRA。
以下的说明主要针对 SD 1.5 版本。
V2.0 for SD 1.5 更新:
以 fp16 精度保存,以提供对早期显卡的支持。
基于 Realistic Vision v2.0 训练,大幅提高 epochs 到 80,大幅提高了人物形象和场景的真实性。
由于真实性的提高,可能在一些情况下,美学效果有所降低。如需要可继续使用 V1.2 版。
以下是基于 Realistic Vision v2.0 进行的 4 组对比,展示基础模型原生亚洲人(Asian),华人(Chinese)与本 LoRA 在权重 0.8 下生成的华人形象的区别:
此 LoRA 可与主要的基础模型配合使用。以下是基于 5 个常用基础模型(Realistic Vision v4.0,ReV Animated v1.2.2,Deliberate v2,ChilloutMix,Disney Pixar Cartoon type B v1.0)的应用效果对比:
如果我的工作对你有帮助,欢迎留下你的评价和评论,也请试用我的其他 LoRA 作品。你的支持对我非常重要。
最后埋了一下快递小哥的彩蛋,请自行挖掘😀
Image examples for the model:
photograph of a female high school student in class room, half body
portrait photograph of an old man on street, half body
a young man on street, half body
a young woman on street, half body