8BitStudio
/

Aniimage-1

+"""
+Aniimage Generator — Generate anime images from text prompts.
+https://huggingface.co/8BitStudio/Aniimage-1
+Usage:
+    pip install torch torchvision diffusers transformers safetensors pillow huggingface_hub
+    python generate_hf.py
+"""
+import os
+import sys
+import torch
+import torch.nn.functional as F
+import numpy as np
+import tkinter as tk
+from tkinter import ttk, simpledialog
+from pathlib import Path
+from PIL import Image, ImageTk, ImageEnhance, ImageFilter
+from threading import Thread
+# ── Paths ─────────────────────────────────────────────────────────────────────
+SCRIPT_DIR = Path(__file__).resolve().parent
+MODEL_DIR = SCRIPT_DIR / "models"
+OUTPUT_DIR = SCRIPT_DIR / "generated"
+# ── HuggingFace repo ─────────────────────────────────────────────────────────
+HF_REPO_ID = "8BitStudio/Aniimage-1"
+# ── UNet config (must match training) ─────────────────────────────────────────
+UNET_CONFIG = dict(
+    sample_size=32,
+    in_channels=4,
+    out_channels=4,
+    block_out_channels=(256, 512, 768, 1024),
+    layers_per_block=2,
+    cross_attention_dim=768,
+    attention_head_dim=8,
+    down_block_types=("DownBlock2D", "CrossAttnDownBlock2D",
+                      "CrossAttnDownBlock2D", "DownBlock2D"),
+    up_block_types=("UpBlock2D", "CrossAttnUpBlock2D",
+                    "CrossAttnUpBlock2D", "UpBlock2D"),
+)
+VAE_ID = "stabilityai/sd-vae-ft-mse"
+CLIP_ID = "openai/clip-vit-large-patch14"
+SCHEDULER_LIST = [
+    "DPM++ 2M Karras",
+    "DPM++ SDE Karras",
+    "Euler a",
+    "Euler",
+    "DDIM",
+]
+DEFAULT_NEGATIVE = (
+    "low quality, ugly, blurry, distorted, deformed, bad anatomy, "
+    "bad proportions, extra limbs, missing limbs, watermark, text, "
+    "signature, washed out, flat colors, manga panel, disfigured, "
+    "poorly drawn, jpeg artifacts, cropped, out of frame"
+)
+# ── Model discovery ───────────────────────────────────────────────────────────
+def download_from_hf():
+    """Download model weights from HuggingFace if not already cached."""
+    try:
+        from huggingface_hub import hf_hub_download
+    except ImportError:
+        print("Install huggingface_hub: pip install huggingface_hub")
+        return None
+    MODEL_DIR.mkdir(parents=True, exist_ok=True)
+    aniimage_dir = MODEL_DIR / "Aniimage-1"
+    weights_path = aniimage_dir / "diffusion_pytorch_model.safetensors"
+    if weights_path.exists():
+        print("Aniimage-1 weights already downloaded.")
+        return aniimage_dir
+    print(f"Downloading Aniimage-1 from {HF_REPO_ID}...")
+    aniimage_dir.mkdir(parents=True, exist_ok=True)
+    import shutil
+    dl_weights = hf_hub_download(repo_id=HF_REPO_ID,
+                                  filename="diffusion_pytorch_model.safetensors")
+    shutil.copy2(dl_weights, weights_path)
+    try:
+        dl_config = hf_hub_download(repo_id=HF_REPO_ID, filename="config.json")
+        shutil.copy2(dl_config, aniimage_dir / "config.json")
+    except Exception:
+        pass
+    print("Download complete!")
+    return aniimage_dir
+def find_models():
+    """Find all available models."""
+    options = []
+    if MODEL_DIR.exists():
+        for d in sorted(MODEL_DIR.iterdir()):
+            if d.is_dir():
+                safetensors = d / "diffusion_pytorch_model.safetensors"
+                ema_path = d / "ema_unet.pt"
+                unet_path = d / "unet.pt"
+                if safetensors.exists():
+                    options.append(("safetensors", d.name, d, "256"))
+                elif ema_path.exists() or unet_path.exists():
+                    options.append(("checkpoint", d.name, d, "256"))
+    return options
+# ── Theme ─────────────────────────────────────────────────────────────────────
+C = {
+    "bg":         "#111119",
+    "panel":      "#1b1b2f",
+    "card":       "#24243e",
+    "card_sel":   "#3a3a6e",
+    "border":     "#2e2e52",
+    "accent":     "#6c5ce7",
+    "accent_h":   "#8577ed",
+    "red":        "#e74c3c",
+    "green":      "#2ecc71",
+    "text":       "#eaeaea",
+    "text2":      "#a0a0b8",
+    "text3":      "#60607a",
+    "input":      "#16162a",
+    "input_fg":   "#dcdcf0",
+}
+class Generator:
+    def __init__(self, device="cuda"):
+        self.device = device if device == "cuda" and torch.cuda.is_available() else "cpu"
+        self.vae = None
+        self.text_encoder = None
+        self.tokenizer = None
+        self.unet = None
+        self.scheduler = None
+        self.loaded_checkpoint = None
+        self.latent_size = 32
+        self.output_size = 256
+        self.cancelled = False
+    def switch_device(self, new_device):
+        """Move all loaded models to a new device."""
+        new_device = new_device if new_device == "cuda" and torch.cuda.is_available() else "cpu"
+        if new_device == self.device:
+            return
+        self.device = new_device
+        if self.vae is not None:
+            self.vae = self.vae.to(self.device)
+        if self.text_encoder is not None:
+            self.text_encoder = self.text_encoder.to(self.device)
+        if self.unet is not None:
+            self.unet = self.unet.to(self.device)
+        self.loaded_checkpoint = None  # force reload on next generate
+        print(f"Switched to {self.device.upper()}")
+    def load_shared(self):
+        if self.vae is not None:
+            return
+        from diffusers import AutoencoderKL
+        from transformers import CLIPTextModel, CLIPTokenizer
+        print("Loading VAE...")
+        self.vae = AutoencoderKL.from_pretrained(VAE_ID).to(self.device)
+        self.vae.eval()
+        print("Loading CLIP text encoder...")
+        self.tokenizer = CLIPTokenizer.from_pretrained(CLIP_ID)
+        self.text_encoder = CLIPTextModel.from_pretrained(CLIP_ID).to(self.device)
+        self.text_encoder.eval()
+        self.scheduler = self._make_scheduler("DPM++ 2M Karras")
+        self.scheduler_name = "DPM++ 2M Karras"
+        print("Shared models loaded.")
+    def _make_scheduler(self, name="DPM++ 2M Karras"):
+        from diffusers import (DDIMScheduler, DPMSolverMultistepScheduler,
+                               EulerAncestralDiscreteScheduler,
+                               EulerDiscreteScheduler)
+        base = dict(num_train_timesteps=1000, beta_schedule="scaled_linear",
+                    prediction_type="epsilon")
+        if name == "DPM++ 2M Karras":
+            return DPMSolverMultistepScheduler(
+                **base, algorithm_type="dpmsolver++",
+                solver_order=2, use_karras_sigmas=True)
+        elif name == "DPM++ SDE Karras":
+            return DPMSolverMultistepScheduler(
+                **base, algorithm_type="sde-dpmsolver++",
+                use_karras_sigmas=True)
+        elif name == "Euler a":
+            return EulerAncestralDiscreteScheduler(**base)
+        elif name == "Euler":
+            return EulerDiscreteScheduler(**base)
+        else:
+            return DDIMScheduler(**base, clip_sample=False,
+                                set_alpha_to_one=False)
+    def set_scheduler(self, name):
+        self.scheduler = self._make_scheduler(name)
+        self.scheduler_name = name
+    def load_model(self, model_path: Path, res_label: str = "256"):
+        if str(model_path) == self.loaded_checkpoint:
+            return
+        from diffusers import UNet2DConditionModel
+        self.load_shared()
+        if res_label == "512":
+            self.latent_size = 64
+            self.output_size = 512
+        else:
+            self.latent_size = 32
+            self.output_size = 256
+        unet_cfg = dict(UNET_CONFIG)
+        unet_cfg["sample_size"] = self.latent_size
+        print(f"Loading UNet from {model_path.name} ({res_label}px)...")
+        self.unet = UNet2DConditionModel(**unet_cfg).to(self.device)
+        safetensors_path = model_path / "diffusion_pytorch_model.safetensors"
+        ema_path = model_path / "ema_unet.pt"
+        unet_path = model_path / "unet.pt"
+        if safetensors_path.exists():
+            from safetensors.torch import load_file
+            state = load_file(str(safetensors_path), device=str(self.device))
+            self.unet.load_state_dict(state)
+            print("Loaded safetensors weights.")
+        elif ema_path.exists():
+            state = torch.load(ema_path, map_location=self.device, weights_only=True)
+            if "shadow_params" in state:
+                params = dict(self.unet.named_parameters())
+                keys = list(params.keys())
+                for i, sp in enumerate(state["shadow_params"]):
+                    params[keys[i]].data.copy_(sp)
+            else:
+                self.unet.load_state_dict(state)
+            print("Loaded EMA weights.")
+        elif unet_path.exists():
+            self.unet.load_state_dict(
+                torch.load(unet_path, map_location=self.device, weights_only=True))
+            print("Loaded UNet weights.")
+        else:
+            raise FileNotFoundError(f"No weights found in {model_path}")
+        self.unet.eval()
+        self.loaded_checkpoint = str(model_path)
+        print(f"Ready to generate at {self.output_size}x{self.output_size}!")
+    def _decode_latents(self, latents, post_process=False):
+        scaled = latents / self.vae.config.scaling_factor
+        with torch.no_grad():
+            image = self.vae.decode(scaled.float()).sample
+        image = (image.float() / 2 + 0.5).clamp(0, 1)
+        image = image.cpu().permute(0, 2, 3, 1).numpy()[0]
+        image = (image * 255).round().astype("uint8")
+        img = Image.fromarray(image)
+        if post_process:
+            img = self._post_process(img)
+        return img
+    def _sharpen_latents(self, latents, amount=0.08):
+        blurred = F.avg_pool2d(latents, kernel_size=3, stride=1, padding=1)
+        return latents + amount * (latents - blurred)
+    def _post_process(self, img):
+        img = img.filter(ImageFilter.UnsharpMask(radius=1.5, percent=40, threshold=2))
+        img = ImageEnhance.Contrast(img).enhance(1.06)
+        img = ImageEnhance.Color(img).enhance(1.10)
+        return img
+    def _image_quality_score(self, img: Image.Image) -> float:
+        arr = np.array(img.convert("L"), dtype=np.float32)
+        lap = (np.roll(arr, 1, 0) + np.roll(arr, -1, 0)
+             + np.roll(arr, 1, 1) + np.roll(arr, -1, 1) - 4.0 * arr)
+        sharpness = float(np.var(lap))
+        arr_rgb = np.array(img, dtype=np.float32)
+        color_var = float(np.mean(np.var(arr_rgb, axis=(0, 1))))
+        score = (sharpness * 0.6 + color_var * 0.4)
+        return min(100.0, score / 10.0)
+    @torch.no_grad()
+    def generate(self, prompt: str, negative_prompt: str = "",
+                 steps: int = 25, guidance_scale: float = 7.5,
+                 seed: int = -1, preview_callback=None,
+                 preview_every: int = 5) -> tuple:
+        if seed < 0:
+            seed = torch.randint(0, 2**32, (1,)).item()
+        gen = torch.Generator(device=self.device).manual_seed(seed)
+        tok = self.tokenizer(prompt, padding="max_length",
+                             max_length=self.tokenizer.model_max_length,
+                             truncation=True, return_tensors="pt")
+        text_emb = self.text_encoder(tok.input_ids.to(self.device))[0]
+        tok_neg = self.tokenizer(negative_prompt if negative_prompt else "",
+                                 padding="max_length",
+                                 max_length=self.tokenizer.model_max_length,
+                                 truncation=True, return_tensors="pt")
+        neg_emb = self.text_encoder(tok_neg.input_ids.to(self.device))[0]
+        text_emb_combined = torch.cat([neg_emb, text_emb])
+        scheduler = self._make_scheduler(self.scheduler_name)
+        scheduler.set_timesteps(steps, device=self.device)
+        latents = torch.randn(1, 4, self.latent_size, self.latent_size,
+                               generator=gen, device=self.device)
+        latents = latents * scheduler.init_noise_sigma
+        timesteps = scheduler.timesteps
+        total_steps = len(timesteps)
+        for step_i, t in enumerate(timesteps):
+            if self.cancelled:
+                return None, seed
+            latent_input = torch.cat([latents] * 2)
+            latent_input = scheduler.scale_model_input(latent_input, t)
+            with torch.autocast(device_type="cuda", dtype=torch.bfloat16,
+                                enabled=(self.device == "cuda")):
+                pred = self.unet(latent_input, t,
+                                 encoder_hidden_states=text_emb_combined).sample
+            pred_neg, pred_text = pred.chunk(2)
+            pred = pred_neg + guidance_scale * (pred_text - pred_neg)
+            latents = scheduler.step(pred, t, latents).prev_sample
+            if (preview_callback and step_i > 0
+                    and step_i % preview_every == 0
+                    and step_i < total_steps - 1):
+                preview = self._decode_latents(latents, post_process=False)
+                preview_callback(preview, step_i + 1, total_steps)
+        latents = self._sharpen_latents(latents)
+        final = self._decode_latents(latents, post_process=True)
+        return final, seed
+    @torch.no_grad()
+    def generate_adaptive(self, prompt: str, negative_prompt: str = "",
+                          base_steps: int = 25, max_steps: int = 85,
+                          guidance_scale: float = 7.5,
+                          quality_threshold: float = 45.0,
+                          preview_callback=None, preview_every: int = 5,
+                          status_callback=None) -> tuple:
+        result = self.generate(
+            prompt=prompt, negative_prompt=negative_prompt,
+            steps=base_steps, guidance_scale=guidance_scale,
+            preview_callback=preview_callback, preview_every=preview_every)
+        if result[0] is None:
+            return result
+        image, seed = result
+        quality = self._image_quality_score(image)
+        if status_callback:
+            status_callback(f"Quality: {quality:.1f}/100")
+        if quality >= quality_threshold:
+            return image, seed
+        rounds = 0
+        max_rounds = (max_steps - base_steps) // 20
+        while quality < quality_threshold and rounds < max_rounds:
+            if self.cancelled:
+                return image, seed
+            rounds += 1
+            if status_callback:
+                status_callback(f"Refining +20 steps (round {rounds})...")
+            refined = self.refine(
+                source_image=image, prompt=prompt,
+                negative_prompt=negative_prompt,
+                extra_steps=20, strength=0.3,
+                guidance_scale=guidance_scale,
+                preview_callback=preview_callback, preview_every=5)
+            if refined is None:
+                return image, seed
+            image = refined
+            quality = self._image_quality_score(image)
+            if status_callback:
+                status_callback(f"Quality after round {rounds}: {quality:.1f}/100")
+        return image, seed
+    @torch.no_grad()
+    def refine(self, source_image: Image.Image, prompt: str,
+               negative_prompt: str = "", extra_steps: int = 20,
+               strength: float = 0.35, guidance_scale: float = 7.5,
+               preview_callback=None, preview_every: int = 5) -> Image.Image:
+        img = source_image.resize((self.output_size, self.output_size), Image.LANCZOS)
+        img_tensor = torch.from_numpy(np.array(img)).float().div(127.5).sub(1.0)
+        img_tensor = img_tensor.permute(2, 0, 1).unsqueeze(0).to(self.device)
+        with torch.no_grad():
+            latents = self.vae.encode(img_tensor.float()).latent_dist.sample()
+        latents = latents * self.vae.config.scaling_factor
+        tok = self.tokenizer(prompt, padding="max_length",
+                             max_length=self.tokenizer.model_max_length,
+                             truncation=True, return_tensors="pt")
+        text_emb = self.text_encoder(tok.input_ids.to(self.device))[0]
+        tok_neg = self.tokenizer(negative_prompt if negative_prompt else "",
+                                 padding="max_length",
+                                 max_length=self.tokenizer.model_max_length,
+                                 truncation=True, return_tensors="pt")
+        neg_emb = self.text_encoder(tok_neg.input_ids.to(self.device))[0]
+        text_emb_combined = torch.cat([neg_emb, text_emb])
+        scheduler = self._make_scheduler(self.scheduler_name)
+        scheduler.set_timesteps(extra_steps, device=self.device)
+        start_step = max(0, int(len(scheduler.timesteps) * (1 - strength)))
+        timesteps = scheduler.timesteps[start_step:]
+        noise = torch.randn_like(latents)
+        latents = scheduler.add_noise(latents, noise, timesteps[:1])
+        total_steps = len(timesteps)
+        for step_i, t in enumerate(timesteps):
+            if self.cancelled:
+                return None
+            latent_input = torch.cat([latents] * 2)
+            latent_input = scheduler.scale_model_input(latent_input, t)
+            with torch.autocast(device_type="cuda", dtype=torch.bfloat16,
+                                enabled=(self.device == "cuda")):
+                pred = self.unet(latent_input, t,
+                                 encoder_hidden_states=text_emb_combined).sample
+            pred_neg, pred_text = pred.chunk(2)
+            pred = pred_neg + guidance_scale * (pred_text - pred_neg)
+            latents = scheduler.step(pred, t, latents).prev_sample
+            if (preview_callback and step_i > 0
+                    and step_i % preview_every == 0
+                    and step_i < total_steps - 1):
+                preview = self._decode_latents(latents, post_process=False)
+                preview_callback(preview, step_i + 1, total_steps)
+        latents = self._sharpen_latents(latents)
+        return self._decode_latents(latents, post_process=True)
+# ── GUI ───────────────────────────────────────────────────────────────────────
+class App:
+    def __init__(self):
+        self.gen = Generator()
+        self.models = find_models()
+        self.generated_images = []
+        self.generated_seeds = []
+        self.photo_refs = []
+        self.generating = False
+        self.selected_index = None
+        self.root = tk.Tk()
+        self.root.title("Aniimage")
+        self.root.configure(bg=C["bg"])
+        self.root.resizable(True, True)
+        self.root.geometry("900x780")
+        self.root.minsize(640, 500)
+        self._setup_styles()
+        self._build_ui()
+    def _setup_styles(self):
+        s = ttk.Style()
+        s.theme_use("clam")
+        # Base
+        s.configure(".", background=C["bg"], foreground=C["text"], font=("Segoe UI", 10))
+        s.configure("TFrame", background=C["bg"])
+        s.configure("TLabel", background=C["bg"], foreground=C["text"])
+        s.configure("TCheckbutton", background=C["bg"], foreground=C["text"])
+        # Combobox — readable text
+        s.configure("TCombobox", fieldbackground=C["input"], foreground=C["input_fg"],
+                    selectbackground=C["accent"], selectforeground="#ffffff",
+                    arrowcolor=C["text2"], padding=4)
+        s.map("TCombobox",
+              fieldbackground=[("readonly", C["input"])],
+              foreground=[("readonly", C["input_fg"])],
+              selectbackground=[("readonly", C["accent"])],
+              selectforeground=[("readonly", "#ffffff")])
+        # Combobox dropdown list colors
+        self.root.option_add("*TCombobox*Listbox.background", C["input"])
+        self.root.option_add("*TCombobox*Listbox.foreground", C["input_fg"])
+        self.root.option_add("*TCombobox*Listbox.selectBackground", C["accent"])
+        self.root.option_add("*TCombobox*Listbox.selectForeground", "#ffffff")
+        self.root.option_add("*TCombobox*Listbox.font", ("Segoe UI", 10))
+        # Spinbox
+        s.configure("TSpinbox", fieldbackground=C["input"], foreground=C["input_fg"],
+                    arrowcolor=C["text2"], padding=3)
+        # Buttons
+        s.configure("TButton", font=("Segoe UI", 10), padding=(14, 7),
+                    background=C["card"], foreground=C["text"])
+        s.map("TButton", background=[("active", C["card_sel"]), ("disabled", C["bg"])],
+              foreground=[("disabled", C["text3"])])
+        s.configure("Go.TButton", font=("Segoe UI", 11, "bold"), padding=(20, 9),
+                    background=C["accent"], foreground="#ffffff")
+        s.map("Go.TButton", background=[("active", C["accent_h"]),
+                                         ("disabled", C["border"])])
+        s.configure("Stop.TButton", font=("Segoe UI", 10, "bold"), padding=(14, 7),
+                    background=C["red"], foreground="#ffffff")
+        s.map("Stop.TButton", background=[("active", "#c0392b"),
+                                           ("disabled", C["border"])])
+        # Labelframe
+        s.configure("TLabelframe", background=C["bg"], foreground=C["text2"])
+        s.configure("TLabelframe.Label", background=C["bg"],
+                    foreground=C["text2"], font=("Segoe UI", 9, "bold"))
+        # Scrollbar
+        s.configure("Vertical.TScrollbar", background=C["card"],
+                    troughcolor=C["bg"], arrowcolor=C["text3"])
+    def _make_entry(self, parent, font_size=11, dim=False):
+        """Create a styled tk.Entry with readable text."""
+        return tk.Entry(parent, font=("Segoe UI", font_size),
+                        bg=C["input"], fg=C["input_fg"] if not dim else C["text2"],
+                        insertbackground=C["input_fg"],
+                        relief="flat", bd=6,
+                        selectbackground=C["accent"], selectforeground="#ffffff",
+                        highlightthickness=1, highlightcolor=C["accent"],
+                        highlightbackground=C["border"])
+    def _build_ui(self):
+        # ── Header ────────────────────────────────────────────────────────
+        header = tk.Frame(self.root, bg=C["panel"], padx=20, pady=12)
+        header.pack(fill=tk.X)
+        tk.Label(header, text="Aniimage", bg=C["panel"], fg=C["accent"],
+                 font=("Segoe UI", 20, "bold")).pack(side=tk.LEFT)
+        tk.Label(header, text="by 8BitStudio", bg=C["panel"], fg=C["text3"],
+                 font=("Segoe UI", 10)).pack(side=tk.LEFT, padx=(10, 0), pady=(6, 0))
+        # Device switch — right side of header
+        device_frame = tk.Frame(header, bg=C["panel"])
+        device_frame.pack(side=tk.RIGHT)
+        tk.Label(device_frame, text="Device:", bg=C["panel"], fg=C["text2"],
+                 font=("Segoe UI", 9)).pack(side=tk.LEFT, padx=(0, 5))
+        self.device_var = tk.StringVar(value="GPU" if self.gen.device == "cuda" else "CPU")
+        devices = ["GPU", "CPU"] if torch.cuda.is_available() else ["CPU"]
+        device_combo = ttk.Combobox(device_frame, textvariable=self.device_var,
+                                     values=devices, state="readonly", width=5)
+        device_combo.pack(side=tk.LEFT)
+        device_combo.bind("<<ComboboxSelected>>", self._on_device_change)
+        # ── Main content — two-column: controls left, images right ────────
+        main = tk.Frame(self.root, bg=C["bg"])
+        main.pack(fill=tk.BOTH, expand=True, padx=12, pady=(8, 12))
+        # Left panel (controls)
+        left = tk.Frame(main, bg=C["panel"], width=340, padx=16, pady=12)
+        left.pack(side=tk.LEFT, fill=tk.Y, padx=(0, 8))
+        left.pack_propagate(False)
+        # Right panel (image grid)
+        right = tk.Frame(main, bg=C["bg"])
+        right.pack(side=tk.LEFT, fill=tk.BOTH, expand=True)
+        self._build_controls(left)
+        self._build_grid(right)
+    def _build_controls(self, parent):
+        # ── Model ─────────────────────────────────────────────────────────
+        tk.Label(parent, text="Model", bg=C["panel"], fg=C["text2"],
+                 font=("Segoe UI", 9, "bold")).pack(anchor=tk.W)
+        self.model_var = tk.StringVar()
+        model_names = [m[1] for m in self.models] or ["No models found"]
+        self.model_combo = ttk.Combobox(parent, textvariable=self.model_var,
+                                        values=model_names, state="readonly", width=32)
+        self.model_combo.pack(fill=tk.X, pady=(3, 12))
+        self.model_combo.current(len(model_names) - 1)
+        # ── Prompt ────────────────────────────────────────────────────────
+        tk.Label(parent, text="Prompt", bg=C["panel"], fg=C["text2"],
+                 font=("Segoe UI", 9, "bold")).pack(anchor=tk.W)
+        self.prompt_entry = self._make_entry(parent)
+        self.prompt_entry.pack(fill=tk.X, pady=(3, 8))
+        self.prompt_entry.insert(0, "a smiling anime girl with long blue hair")
+        self.prompt_entry.bind("<Return>", lambda e: self.on_generate())
+        # ── Negative prompt ───────────────────────────────────────────────
+        tk.Label(parent, text="Negative prompt", bg=C["panel"], fg=C["text3"],
+                 font=("Segoe UI", 9)).pack(anchor=tk.W)
+        self.neg_entry = self._make_entry(parent, font_size=9, dim=True)
+        self.neg_entry.pack(fill=tk.X, pady=(3, 12))
+        self.neg_entry.insert(0, DEFAULT_NEGATIVE)
+        # ── Settings grid ─────────────────────────────────────────────────
+        grid = tk.Frame(parent, bg=C["panel"])
+        grid.pack(fill=tk.X, pady=(0, 8))
+        # Row 1: Scheduler
+        tk.Label(grid, text="Scheduler", bg=C["panel"], fg=C["text2"],
+                 font=("Segoe UI", 9)).grid(row=0, column=0, sticky="w", pady=(0, 6))
+        self.scheduler_var = tk.StringVar(value="DPM++ 2M Karras")
+        sched_combo = ttk.Combobox(grid, textvariable=self.scheduler_var,
+                                    values=SCHEDULER_LIST, state="readonly", width=18)
+        sched_combo.grid(row=0, column=1, columnspan=3, sticky="ew", padx=(8, 0), pady=(0, 6))
+        sched_combo.bind("<<ComboboxSelected>>", self._on_scheduler_change)
+        # Row 2: Steps, CFG, Count
+        tk.Label(grid, text="Steps", bg=C["panel"], fg=C["text2"],
+                 font=("Segoe UI", 9)).grid(row=1, column=0, sticky="w", pady=(0, 6))
+        self.steps_var = tk.StringVar(value="25")
+        tk.Entry(grid, textvariable=self.steps_var, width=5, font=("Segoe UI", 10),
+                 bg=C["input"], fg=C["input_fg"], insertbackground=C["input_fg"],
+                 relief="flat", bd=4).grid(row=1, column=1, sticky="w", padx=(8, 12), pady=(0, 6))
+        tk.Label(grid, text="CFG", bg=C["panel"], fg=C["text2"],
+                 font=("Segoe UI", 9)).grid(row=1, column=2, sticky="w", pady=(0, 6))
+        self.cfg_var = tk.StringVar(value="7.5")
+        tk.Entry(grid, textvariable=self.cfg_var, width=5, font=("Segoe UI", 10),
+                 bg=C["input"], fg=C["input_fg"], insertbackground=C["input_fg"],
+                 relief="flat", bd=4).grid(row=1, column=3, sticky="w", padx=(8, 0), pady=(0, 6))
+        # Row 3: Count, Live preview
+        tk.Label(grid, text="Count", bg=C["panel"], fg=C["text2"],
+                 font=("Segoe UI", 9)).grid(row=2, column=0, sticky="w", pady=(0, 6))
+        self.count_var = tk.StringVar(value="4")
+        ttk.Spinbox(grid, from_=1, to=12, textvariable=self.count_var, width=4,
+                     font=("Segoe UI", 10)).grid(row=2, column=1, sticky="w", padx=(8, 12), pady=(0, 6))
+        self.live_preview_var = tk.BooleanVar(value=False)
+        ttk.Checkbutton(grid, text="Live preview",
+                         variable=self.live_preview_var).grid(
+            row=2, column=2, columnspan=2, sticky="w", pady=(0, 6))
+        grid.columnconfigure(1, weight=1)
+        grid.columnconfigure(3, weight=1)
+        # ── Auto quality ──────────────────────────────────────────────────
+        self.auto_quality_var = tk.BooleanVar(value=False)
+        ttk.Checkbutton(parent, text="Auto quality (refine if undercooked)",
+                         variable=self.auto_quality_var).pack(anchor=tk.W, pady=(0, 12))
+        # ── Buttons ───────────────────────────────────────────────────────
+        btn_frame = tk.Frame(parent, bg=C["panel"])
+        btn_frame.pack(fill=tk.X, pady=(0, 10))
+        self.gen_btn = ttk.Button(btn_frame, text="Generate", command=self.on_generate,
+                                  style="Go.TButton")
+        self.gen_btn.pack(fill=tk.X, pady=(0, 5))
+        btn_row = tk.Frame(btn_frame, bg=C["panel"])
+        btn_row.pack(fill=tk.X)
+        self.stop_btn = ttk.Button(btn_row, text="Stop", command=self.on_stop,
+                                   state=tk.DISABLED, style="Stop.TButton")
+        self.stop_btn.pack(side=tk.LEFT, fill=tk.X, expand=True, padx=(0, 3))
+        self.save_btn = ttk.Button(btn_row, text="Save Selected", command=self.on_save,
+                                   state=tk.DISABLED)
+        self.save_btn.pack(side=tk.LEFT, fill=tk.X, expand=True, padx=(3, 3))
+        self.save_all_btn = ttk.Button(btn_row, text="Save All", command=self.on_save_all,
+                                       state=tk.DISABLED)
+        self.save_all_btn.pack(side=tk.LEFT, fill=tk.X, expand=True, padx=(3, 0))
+        # ── Prompt queue ─────────────────────────────────────────────────
+        sep = tk.Frame(parent, height=1, bg=C["border"])
+        sep.pack(fill=tk.X, pady=(8, 10))
+        tk.Label(parent, text="Prompt Queue", bg=C["panel"], fg=C["text2"],
+                 font=("Segoe UI", 9, "bold")).pack(anchor=tk.W)
+        queue_input = tk.Frame(parent, bg=C["panel"])
+        queue_input.pack(fill=tk.X, pady=(4, 0))
+        self.queue_entry = self._make_entry(queue_input, font_size=9)
+        self.queue_entry.pack(side=tk.LEFT, fill=tk.X, expand=True, padx=(0, 4))
+        self.queue_entry.bind("<Return>", lambda e: self._queue_add())
+        ttk.Button(queue_input, text="Add", width=4,
+                   command=self._queue_add).pack(side=tk.LEFT)
+        self.queue_listbox = tk.Listbox(
+            parent, height=4, bg=C["input"], fg=C["input_fg"],
+            selectbackground=C["accent"], selectforeground="#fff",
+            font=("Segoe UI", 9), activestyle="none",
+            relief="flat", bd=4, highlightthickness=0)
+        self.queue_listbox.pack(fill=tk.X, pady=(5, 0))
+        queue_btns = tk.Frame(parent, bg=C["panel"])
+        queue_btns.pack(fill=tk.X, pady=(4, 0))
+        self.queue_run_btn = ttk.Button(queue_btns, text="Run Queue",
+                                         command=self.on_run_queue, style="Go.TButton")
+        self.queue_run_btn.pack(side=tk.LEFT, padx=(0, 4))
+        for txt, cmd in [("Remove", self._queue_remove), ("Clear", self._queue_clear),
+                         ("Up", self._queue_move_up), ("Down", self._queue_move_down),
+                         ("+ Current", self._queue_add_current)]:
+            ttk.Button(queue_btns, text=txt, command=cmd).pack(side=tk.LEFT, padx=2)
+        # ── Status bar ────────────────────────────────────────────────────
+        status_frame = tk.Frame(parent, bg=C["bg"], padx=8, pady=6)
+        status_frame.pack(fill=tk.X, side=tk.BOTTOM)
+        self.status_var = tk.StringVar(value="Ready")
+        tk.Label(status_frame, textvariable=self.status_var,
+                 bg=C["bg"], fg=C["green"], font=("Segoe UI", 9),
+                 anchor="w").pack(fill=tk.X)
+    def _build_grid(self, parent):
+        self.canvas = tk.Canvas(parent, bg=C["bg"], highlightthickness=0)
+        scrollbar = ttk.Scrollbar(parent, orient=tk.VERTICAL, command=self.canvas.yview)
+        self.grid_frame = tk.Frame(self.canvas, bg=C["bg"])
+        self.grid_frame.bind("<Configure>",
+                              lambda e: self.canvas.configure(
+                                  scrollregion=self.canvas.bbox("all")))
+        self.canvas_window = self.canvas.create_window((0, 0), window=self.grid_frame,
+                                                        anchor="nw")
+        self.canvas.configure(yscrollcommand=scrollbar.set)
+        self.canvas.pack(side=tk.LEFT, fill=tk.BOTH, expand=True)
+        scrollbar.pack(side=tk.RIGHT, fill=tk.Y)
+        self.canvas.bind("<Configure>", self._on_canvas_resize)
+        self.canvas.bind_all("<MouseWheel>",
+                              lambda e: self.canvas.yview_scroll(
+                                  int(-1 * (e.delta / 120)), "units"))
+        self.placeholder = tk.Label(self.grid_frame,
+                                     text="Generated images\nwill appear here",
+                                     bg=C["bg"], fg=C["text3"],
+                                     font=("Segoe UI", 13), justify="center")
+        self.placeholder.grid(row=0, column=0, pady=80)
+    # ── Event handlers ────────────────────────────────────────────────────
+    def _on_device_change(self, event=None):
+        choice = self.device_var.get()
+        new_dev = "cuda" if choice == "GPU" else "cpu"
+        self.status_var.set(f"Switching to {choice}...")
+        self.root.update()
+        self.gen.switch_device(new_dev)
+        self.status_var.set(f"Now using {choice}")
+    def _on_scheduler_change(self, event=None):
+        name = self.scheduler_var.get()
+        self.gen.set_scheduler(name)
+        self.status_var.set(f"Scheduler: {name}")
+    def _on_canvas_resize(self, event):
+        self.canvas.itemconfig(self.canvas_window, width=event.width)
+        if self.generated_images:
+            self._layout_grid()
+    def _get_grid_cols(self):
+        canvas_w = self.canvas.winfo_width()
+        if canvas_w < 50:
+            canvas_w = 560
+        tile_size = self._get_tile_size()
+        return max(1, canvas_w // (tile_size + 16))
+    def _get_tile_size(self):
+        n = len(self.generated_images)
+        if n <= 2: return 260
+        elif n <= 4: return 220
+        elif n <= 6: return 180
+        else: return 160
+    def _layout_grid(self):
+        for w in self.grid_frame.winfo_children():
+            w.destroy()
+        self.photo_refs.clear()
+        if not self.generated_images:
+            return
+        tile_size = self._get_tile_size()
+        cols = self._get_grid_cols()
+        for i, (img, seed) in enumerate(zip(self.generated_images, self.generated_seeds)):
+            row, col = divmod(i, cols)
+            is_selected = (i == self.selected_index)
+            card_bg = C["accent"] if is_selected else C["card"]
+            card = tk.Frame(self.grid_frame, bg=card_bg, padx=3, pady=3)
+            card.grid(row=row, column=col, padx=5, pady=5, sticky="nsew")
+            display = img.resize((tile_size, tile_size), Image.LANCZOS)
+            photo = ImageTk.PhotoImage(display)
+            self.photo_refs.append(photo)
+            img_label = tk.Label(card, image=photo, bg=card_bg, bd=0)
+            img_label.pack()
+            img_label.bind("<Button-1>", lambda e, idx=i: self._select_image(idx))
+            img_label.bind("<Button-3>", lambda e, idx=i: self._show_refine_menu(e, idx))
+            tk.Label(card, text=f"seed: {seed}", bg=card_bg,
+                     fg=C["text3"], font=("Segoe UI", 8)).pack()
+        for c in range(cols):
+            self.grid_frame.columnconfigure(c, weight=1)
+    def _select_image(self, idx):
+        if idx >= len(self.generated_images):
+            return
+        self.selected_index = idx
+        self.save_btn.configure(state=tk.NORMAL)
+        self.status_var.set(f"Selected image {idx + 1} (seed: {self.generated_seeds[idx]})")
+        self._layout_grid()
+    def _show_refine_menu(self, event, idx):
+        if self.generating:
+            return
+        menu = tk.Menu(self.root, tearoff=0, bg=C["card"], fg=C["text"],
+                       activebackground=C["accent"], activeforeground="#fff",
+                       font=("Segoe UI", 10), bd=0)
+        menu.add_command(label="  Refine (more steps)...  ",
+                         command=lambda: self._ask_refine(idx))
+        menu.tk_popup(event.x_root, event.y_root)
+    def _ask_refine(self, idx):
+        extra = simpledialog.askinteger(
+            "Refine Image", "Extra denoising steps:",
+            initialvalue=20, minvalue=5, maxvalue=200, parent=self.root)
+        if extra is None:
+            return
+        self._select_image(idx)
+        self.generating = True
+        self.gen.cancelled = False
+        self.gen_btn.configure(state=tk.DISABLED)
+        self.stop_btn.configure(state=tk.NORMAL)
+        self.status_var.set(f"Refining image {idx + 1}...")
+        self.root.update()
+        Thread(target=self._refine_thread, args=(idx, extra), daemon=True).start()
+    def _refine_thread(self, idx, extra_steps):
+        try:
+            source = self.generated_images[idx]
+            prompt = self.prompt_entry.get().strip()
+            neg = self.neg_entry.get().strip()
+            cfg = float(self.cfg_var.get())
+            callback = self._show_preview if self.live_preview_var.get() else None
+            refined = self.gen.refine(
+                source_image=source, prompt=prompt, negative_prompt=neg,
+                extra_steps=extra_steps, guidance_scale=cfg,
+                preview_callback=callback, preview_every=5)
+            if refined is not None:
+                self.generated_images[idx] = refined
+                self.generated_seeds[idx] = f"{self.generated_seeds[idx]}+R{extra_steps}"
+                self._layout_grid()
+                self.status_var.set(f"Refined image {idx + 1}")
+            else:
+                self.status_var.set("Refine stopped.")
+            self.root.update()
+        except Exception as e:
+            self.status_var.set(f"Refine error: {e}")
+            import traceback; traceback.print_exc()
+        finally:
+            self.generating = False
+            self.gen.cancelled = False
+            self.gen_btn.configure(state=tk.NORMAL)
+            self.stop_btn.configure(state=tk.DISABLED)
+    # ── Queue ─────────────────────────────────────────────────────────────
+    def _queue_add(self):
+        text = self.queue_entry.get().strip()
+        if text:
+            self.queue_listbox.insert(tk.END, text)
+            self.queue_entry.delete(0, tk.END)
+    def _queue_add_current(self):
+        text = self.prompt_entry.get().strip()
+        if text:
+            self.queue_listbox.insert(tk.END, text)
+    def _queue_remove(self):
+        sel = self.queue_listbox.curselection()
+        if sel:
+            self.queue_listbox.delete(sel[0])
+    def _queue_clear(self):
+        self.queue_listbox.delete(0, tk.END)
+    def _queue_move_up(self):
+        sel = self.queue_listbox.curselection()
+        if sel and sel[0] > 0:
+            idx = sel[0]
+            text = self.queue_listbox.get(idx)
+            self.queue_listbox.delete(idx)
+            self.queue_listbox.insert(idx - 1, text)
+            self.queue_listbox.selection_set(idx - 1)
+    def _queue_move_down(self):
+        sel = self.queue_listbox.curselection()
+        if sel and sel[0] < self.queue_listbox.size() - 1:
+            idx = sel[0]
+            text = self.queue_listbox.get(idx)
+            self.queue_listbox.delete(idx)
+            self.queue_listbox.insert(idx + 1, text)
+            self.queue_listbox.selection_set(idx + 1)
+    def on_run_queue(self):
+        if self.generating or not self.models:
+            return
+        prompts = list(self.queue_listbox.get(0, tk.END))
+        if not prompts:
+            self.status_var.set("Queue is empty")
+            return
+        self.generating = True
+        self.gen.cancelled = False
+        self.gen_btn.configure(state=tk.DISABLED)
+        self.queue_run_btn.configure(state=tk.DISABLED)
+        self.stop_btn.configure(state=tk.NORMAL)
+        Thread(target=self._queue_thread, args=(prompts,), daemon=True).start()
+    def _queue_thread(self, prompts):
+        try:
+            idx = self.model_combo.current()
+            mdl = self.models[idx]
+            self.status_var.set(f"Loading {mdl[1]}...")
+            self.root.update()
+            self.gen.load_model(mdl[2], mdl[3])
+            neg = self.neg_entry.get().strip()
+            steps = int(self.steps_var.get())
+            cfg = float(self.cfg_var.get())
+            num_images = max(1, min(12, int(self.count_var.get())))
+            live_preview = self.live_preview_var.get()
+            auto_quality = self.auto_quality_var.get()
+            self.generated_images.clear()
+            self.generated_seeds.clear()
+            self.selected_index = None
+            if self.placeholder:
+                self.placeholder.destroy()
+                self.placeholder = None
+            for p_idx, prompt in enumerate(prompts):
+                if self.gen.cancelled:
+                    break
+                self.queue_listbox.selection_clear(0, tk.END)
+                self.queue_listbox.selection_set(p_idx)
+                self.queue_listbox.see(p_idx)
+                for img_i in range(num_images):
+                    if self.gen.cancelled:
+                        break
+                    self.status_var.set(
+                        f"[{p_idx + 1}/{len(prompts)}] image {img_i + 1}/{num_images}")
+                    self.root.update()
+                    callback = None
+                    if live_preview:
+                        self._setup_preview_card()
+                        callback = self._show_preview
+                    if auto_quality:
+                        image, used_seed = self.gen.generate_adaptive(
+                            prompt=prompt, negative_prompt=neg,
+                            base_steps=steps, max_steps=steps + 60,
+                            guidance_scale=cfg,
+                            preview_callback=callback, preview_every=5,
+                            status_callback=lambda m: (
+                                self.status_var.set(m), self.root.update()))
+                    else:
+                        image, used_seed = self.gen.generate(
+                            prompt=prompt, negative_prompt=neg,
+                            steps=steps, guidance_scale=cfg,
+                            preview_callback=callback, preview_every=5)
+                    if image is None:
+                        break
+                    self.generated_images.append(image)
+                    self.generated_seeds.append(used_seed)
+                    save_path = self._next_save_path(prompt)
+                    image.save(save_path)
+                    self._layout_grid()
+                    self.root.update()
+                if self.gen.cancelled:
+                    break
+            done = len(self.generated_images)
+            self.status_var.set(
+                f"Queue {'stopped' if self.gen.cancelled else 'done'}! {done} images saved.")
+            if done > 0:
+                self.save_all_btn.configure(state=tk.NORMAL)
+        except Exception as e:
+            self.status_var.set(f"Queue error: {e}")
+            import traceback; traceback.print_exc()
+        finally:
+            self.generating = False
+            self.gen.cancelled = False
+            self.gen_btn.configure(state=tk.NORMAL)
+            self.queue_run_btn.configure(state=tk.NORMAL)
+            self.stop_btn.configure(state=tk.DISABLED)
+    # ── Generation ────────────────────────────────────────────────────────
+    def on_stop(self):
+        if self.generating:
+            self.gen.cancelled = True
+            self.status_var.set("Stopping...")
+            self.root.update()
+    def on_generate(self):
+        if self.generating or not self.models:
+            return
+        self.generating = True
+        self.gen.cancelled = False
+        self.gen_btn.configure(state=tk.DISABLED)
+        self.stop_btn.configure(state=tk.NORMAL)
+        self.status_var.set("Loading model...")
+        self.root.update()
+        Thread(target=self._generate_thread, daemon=True).start()
+    def _setup_preview_card(self):
+        tile_size = self._get_tile_size()
+        cols = self._get_grid_cols()
+        row, col = divmod(len(self.generated_images), cols)
+        card = tk.Frame(self.grid_frame, bg=C["card"], padx=3, pady=3)
+        card.grid(row=row, column=col, padx=5, pady=5, sticky="nsew")
+        self._preview_label = tk.Label(card, bg=C["card"],
+                                        width=tile_size, height=tile_size)
+        self._preview_label.pack()
+        self.root.update()
+    def _show_preview(self, preview_img, step, total):
+        tile_size = self._get_tile_size()
+        display = preview_img.resize((tile_size, tile_size), Image.LANCZOS)
+        photo = ImageTk.PhotoImage(display)
+        self._preview_photo = photo
+        if hasattr(self, '_preview_label') and self._preview_label.winfo_exists():
+            self._preview_label.configure(image=photo)
+        self.status_var.set(f"Step {step}/{total}")
+        self.root.update()
+    def _generate_thread(self):
+        try:
+            idx = self.model_combo.current()
+            mdl = self.models[idx]
+            self.status_var.set(f"Loading {mdl[1]}...")
+            self.root.update()
+            self.gen.load_model(mdl[2], mdl[3])
+            prompt = self.prompt_entry.get().strip()
+            neg = self.neg_entry.get().strip()
+            steps = int(self.steps_var.get())
+            cfg = float(self.cfg_var.get())
+            num_images = max(1, min(12, int(self.count_var.get())))
+            live_preview = self.live_preview_var.get()
+            auto_quality = self.auto_quality_var.get()
+            self.generated_images.clear()
+            self.generated_seeds.clear()
+            self.selected_index = None
+            if self.placeholder:
+                self.placeholder.destroy()
+                self.placeholder = None
+            for i in range(num_images):
+                if self.gen.cancelled:
+                    break
+                self.status_var.set(f"Generating {i + 1}/{num_images}...")
+                self.root.update()
+                callback = None
+                if live_preview:
+                    self._setup_preview_card()
+                    callback = self._show_preview
+                if auto_quality:
+                    image, used_seed = self.gen.generate_adaptive(
+                        prompt=prompt, negative_prompt=neg,
+                        base_steps=steps, max_steps=steps + 60,
+                        guidance_scale=cfg,
+                        preview_callback=callback, preview_every=5,
+                        status_callback=lambda m: (
+                            self.status_var.set(m), self.root.update()))
+                else:
+                    image, used_seed = self.gen.generate(
+                        prompt=prompt, negative_prompt=neg,
+                        steps=steps, guidance_scale=cfg,
+                        preview_callback=callback, preview_every=5)
+                if image is None:
+                    break
+                self.generated_images.append(image)
+                self.generated_seeds.append(used_seed)
+                self._layout_grid()
+                self.root.update()
+            done = len(self.generated_images)
+            if self.gen.cancelled:
+                self.status_var.set(f"Stopped. {done} image(s) kept.")
+            else:
+                self.status_var.set(f"Done! {done} images. Click to select.")
+            if done > 0:
+                self.save_all_btn.configure(state=tk.NORMAL)
+            self.save_btn.configure(state=tk.DISABLED)
+        except Exception as e:
+            self.status_var.set(f"Error: {e}")
+            import traceback; traceback.print_exc()
+        finally:
+            self.generating = False
+            self.gen.cancelled = False
+            self.gen_btn.configure(state=tk.NORMAL)
+            self.stop_btn.configure(state=tk.DISABLED)
+    # ── Save ──────────────────────────────────────────────────────────────
+    def _next_save_path(self, prompt_text):
+        OUTPUT_DIR.mkdir(parents=True, exist_ok=True)
+        slug = prompt_text.strip()[:50] if prompt_text.strip() else "untitled"
+        base = OUTPUT_DIR / f"{slug}.png"
+        if not base.exists():
+            return base
+        n = 1
+        while True:
+            path = OUTPUT_DIR / f"{slug} {n}.png"
+            if not path.exists():
+                return path
+            n += 1
+    def on_save(self):
+        if self.selected_index is None or not self.generated_images:
+            return
+        img = self.generated_images[self.selected_index]
+        path = self._next_save_path(self.prompt_entry.get().strip())
+        img.save(path)
+        self.status_var.set(f"Saved: {path.name}")
+    def on_save_all(self):
+        if not self.generated_images:
+            return
+        prompt_text = self.prompt_entry.get().strip()
+        for img in self.generated_images:
+            path = self._next_save_path(prompt_text)
+            img.save(path)
+        self.status_var.set(f"Saved {len(self.generated_images)} images")
+    def run(self):
+        self.root.mainloop()
+# ── Entry point ───────────────────────────────────────────────────────────────
+if __name__ == "__main__":
+    models = find_models()
+    if not models:
+        print("No models found locally. Downloading from HuggingFace...")
+        result = download_from_hf()
+        if result:
+            models = find_models()
+    if not models:
+        print("No models found!")
+        print(f"Place model weights in: {MODEL_DIR}/YourModelName/")
+        print("Expected files: diffusion_pytorch_model.safetensors or ema_unet.pt")
+        sys.exit(1)
+    print(f"Found {len(models)} model(s): {', '.join(m[1] for m in models)}")
+    print(f"Device: {'CUDA (GPU)' if torch.cuda.is_available() else 'CPU'}")
+    print("Starting Aniimage...")
+    app = App()
+    app.run()