Model Card for VRoid Diffusion Unconditional

This is a latent unconditional diffusion model to demonstrate how U-Net training affects the generated images.

Pretrained Text Encoder (OpenCLIP) is removed, but an empty text encoder is included for compatibility with StableDiffusionPipeline.
VAE is from Mitsua Diffusion One, Mitsua Open RAIL-M License, Training Data: Public Domain/CC0 + Licensed
U-Net is trained from scratch using full version of VRoid Image Dataset Lite with some modifications.
- The architecture of the U-Net model was modified to conform to unconditional image generation. Cross-attention blocks are replaced by self-attention blocks.
VRoid is a trademark or registered trademark of Pixiv inc. in Japan and other regions.

Model variant

This model works only on diffusers StableDiffusionPipeline. This model will not work on A1111 WebUI.

from diffusers import StableDiffusionPipeline
pipeline = StableDiffusionPipeline.from_pretrained("Mitsua/vroid-diffusion-test-unconditional")

Image generation for research and educational purposes.

Any deployed use case of the model.

We use full version of VRoid Image Dataset Lite with some modifications.