tolgacangoz
/

matryoshka-diffusion-models

Text-to-Image

Diffusers

Safetensors

English

mdm

Model card Files Files and versions Community

tolgacangoz commited on Oct 8, 2024

Commit

ca01bef

verified ·

1 Parent(s): 04b9c24

Upload matryoshka.py

Browse files

Files changed (1) hide show

unet/nesting_level_0/matryoshka.py +34 -7

unet/nesting_level_0/matryoshka.py CHANGED Viewed

@@ -20,6 +20,7 @@
 import inspect
 import math
 from dataclasses import dataclass
 from typing import Any, Callable, Dict, List, Optional, Tuple, Union
@@ -3782,8 +3783,6 @@ class MatryoshkaPipeline(
         else:
             raise ValueError("Currently, nesting levels 0, 1, and 2 are supported.")
-        unet = unet.to(self.device)
         if hasattr(scheduler.config, "steps_offset") and scheduler.config.steps_offset != 1:
             deprecation_message = (
                 f"The configuration file of this scheduler: {scheduler} is outdated. `steps_offset`"
@@ -3832,6 +3831,9 @@ class MatryoshkaPipeline(
             new_config["sample_size"] = 64
             unet._internal_dict = FrozenDict(new_config)
         self.register_modules(
             text_encoder=text_encoder,
             tokenizer=tokenizer,
@@ -3840,10 +3842,32 @@ class MatryoshkaPipeline(
             feature_extractor=feature_extractor,
             image_encoder=image_encoder,
         )
-        if hasattr(unet, "nest_ratio"):
-            scheduler.scales = unet.nest_ratio + [1]
         self.image_processor = VaeImageProcessor(do_resize=False)
     def encode_prompt(
         self,
         prompt,
@@ -4625,9 +4649,12 @@ class MatryoshkaPipeline(
         image = latents
         if self.scheduler.scales is not None:
-            for i in range(len(image)):
-                image[i] = image[i] * self.scheduler.scales[i]
-                image[i] = self.image_processor.postprocess(image[i], output_type=output_type)
         else:
             image = self.image_processor.postprocess(image, output_type=output_type)

 import inspect
+import gc
 import math
 from dataclasses import dataclass
 from typing import Any, Callable, Dict, List, Optional, Tuple, Union
         else:
             raise ValueError("Currently, nesting levels 0, 1, and 2 are supported.")
         if hasattr(scheduler.config, "steps_offset") and scheduler.config.steps_offset != 1:
             deprecation_message = (
                 f"The configuration file of this scheduler: {scheduler} is outdated. `steps_offset`"
             new_config["sample_size"] = 64
             unet._internal_dict = FrozenDict(new_config)
+        if hasattr(unet, "nest_ratio"):
+            scheduler.scales = unet.nest_ratio + [1]
         self.register_modules(
             text_encoder=text_encoder,
             tokenizer=tokenizer,
             feature_extractor=feature_extractor,
             image_encoder=image_encoder,
         )
+        self.register_to_config(nesting_level=nesting_level)
         self.image_processor = VaeImageProcessor(do_resize=False)
+    def change_nesting_level(self, nesting_level: int):
+        if nesting_level == 0:
+            if hasattr(self.unet, "nest_ratio"):
+                self.scheduler.scales = None
+            self.unet = MatryoshkaUNet2DConditionModel.from_pretrained("tolgacangoz/matryoshka-diffusion-models",
+                                                                      subfolder="unet/nesting_level_0").to(self.device)
+            self.config.nesting_level = 0
+        elif nesting_level == 1:
+            self.unet = NestedUNet2DConditionModel.from_pretrained("tolgacangoz/matryoshka-diffusion-models",
+                                                                    subfolder="unet/nesting_level_1").to(self.device)
+            self.config.nesting_level = 1
+            self.scheduler.scales = self.unet.nest_ratio + [1]
+        elif nesting_level == 2:
+            self.unet = NestedUNet2DConditionModel.from_pretrained("tolgacangoz/matryoshka-diffusion-models",
+                                                                    subfolder="unet/nesting_level_2").to(self.device)
+            self.config.nesting_level = 2
+            self.scheduler.scales = self.unet.nest_ratio + [1]
+        else:
+            raise ValueError("Currently, nesting levels 0, 1, and 2 are supported.")
+        gc.collect()
+        torch.cuda.empty_cache()
     def encode_prompt(
         self,
         prompt,
         image = latents
         if self.scheduler.scales is not None:
+            scales = [
+                image[i].size(-1) / image[-1].size(-1)
+                for i in range(len(image))
+                ]
+            for i, (img, scale) in enumerate(zip(image, scales)):
+                image[i] = self.image_processor.postprocess(img * scale, output_type=output_type)[0]
         else:
             image = self.image_processor.postprocess(image, output_type=output_type)