Spaces:

thu-ml
/

unidiffuser

Running on Zero

App Files Files Community

hysts HF staff commited on Oct 4, 2023

Commit

a17d56c

•

1 Parent(s): 0481263

Update

Browse files

Files changed (2) hide show

app.py +64 -4
model.py +0 -78

app.py CHANGED Viewed

@@ -7,16 +7,15 @@ import random
 import gradio as gr
 import numpy as np
 import torch
-from model import Model
 DESCRIPTION = "# [UniDiffuser](https://github.com/thu-ml/unidiffuser)"
 if not torch.cuda.is_available():
     DESCRIPTION += "\n<p>Running on CPU 🥶</p>"
-model = Model()
 MAX_SEED = np.iinfo(np.int32).max
@@ -27,6 +26,67 @@ def randomize_seed_fn(seed: int, randomize_seed: bool) -> int:
     return seed
 def create_demo(mode_name: str) -> gr.Blocks:
     with gr.Blocks() as demo:
         with gr.Row():
@@ -82,7 +142,7 @@ def create_demo(mode_name: str) -> gr.Blocks:
             outputs=seed,
             queue=False,
         ).then(
-            fn=model.run,
             inputs=[
                 mode,
                 prompt,

 import gradio as gr
 import numpy as np
+import PIL.Image
 import torch
+from diffusers import UniDiffuserPipeline
 DESCRIPTION = "# [UniDiffuser](https://github.com/thu-ml/unidiffuser)"
 if not torch.cuda.is_available():
     DESCRIPTION += "\n<p>Running on CPU 🥶</p>"
 MAX_SEED = np.iinfo(np.int32).max
     return seed
+device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
+if torch.cuda.is_available():
+    pipe = UniDiffuserPipeline.from_pretrained("thu-ml/unidiffuser-v1", torch_dtype=torch.float16)
+    pipe.to(device)
+def run(
+    mode: str,
+    prompt: str,
+    image: PIL.Image.Image | None,
+    seed: int = 0,
+    num_steps: int = 20,
+    guidance_scale: float = 8.0,
+) -> tuple[PIL.Image.Image | None, str]:
+    generator = torch.Generator(device=device).manual_seed(seed)
+    if mode == "t2i":
+        pipe.set_text_to_image_mode()
+        sample = pipe(prompt=prompt, num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator)
+        return sample.images[0], ""
+    elif mode == "i2t":
+        pipe.set_image_to_text_mode()
+        sample = pipe(image=image, num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator)
+        return None, sample.text[0]
+    elif mode == "joint":
+        pipe.set_joint_mode()
+        sample = pipe(num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator)
+        return sample.images[0], sample.text[0]
+    elif mode == "i":
+        pipe.set_image_mode()
+        sample = pipe(num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator)
+        return sample.images[0], ""
+    elif mode == "t":
+        pipe.set_text_mode()
+        sample = pipe(num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator)
+        return None, sample.text[0]
+    elif mode == "i2t2i":
+        pipe.set_image_to_text_mode()
+        sample = pipe(image=image, num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator)
+        pipe.set_text_to_image_mode()
+        sample = pipe(
+            prompt=sample.text[0],
+            num_inference_steps=num_steps,
+            guidance_scale=guidance_scale,
+            generator=generator,
+        )
+        return sample.images[0], ""
+    elif mode == "t2i2t":
+        pipe.set_text_to_image_mode()
+        sample = pipe(prompt=prompt, num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator)
+        pipe.set_image_to_text_mode()
+        sample = pipe(
+            image=sample.images[0],
+            num_inference_steps=num_steps,
+            guidance_scale=guidance_scale,
+            generator=generator,
+        )
+        return None, sample.text[0]
+    else:
+        raise ValueError
 def create_demo(mode_name: str) -> gr.Blocks:
     with gr.Blocks() as demo:
         with gr.Row():
             outputs=seed,
             queue=False,
         ).then(
+            fn=run,
             inputs=[
                 mode,
                 prompt,

model.py DELETED Viewed

@@ -1,78 +0,0 @@
-from __future__ import annotations
-import PIL.Image
-import torch
-from diffusers import UniDiffuserPipeline
-class Model:
-    def __init__(self):
-        self.device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
-        if self.device.type == "cuda":
-            self.pipe = UniDiffuserPipeline.from_pretrained("thu-ml/unidiffuser-v1", torch_dtype=torch.float16)
-            self.pipe.to(self.device)
-        else:
-            self.pipe = UniDiffuserPipeline.from_pretrained("thu-ml/unidiffuser-v1")
-    def run(
-        self,
-        mode: str,
-        prompt: str,
-        image: PIL.Image.Image | None,
-        seed: int = 0,
-        num_steps: int = 20,
-        guidance_scale: float = 8.0,
-    ) -> tuple[PIL.Image.Image | None, str]:
-        generator = torch.Generator(device=self.device).manual_seed(seed)
-        if mode == "t2i":
-            self.pipe.set_text_to_image_mode()
-            sample = self.pipe(
-                prompt=prompt, num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator
-            )
-            return sample.images[0], ""
-        elif mode == "i2t":
-            self.pipe.set_image_to_text_mode()
-            sample = self.pipe(
-                image=image, num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator
-            )
-            return None, sample.text[0]
-        elif mode == "joint":
-            self.pipe.set_joint_mode()
-            sample = self.pipe(num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator)
-            return sample.images[0], sample.text[0]
-        elif mode == "i":
-            self.pipe.set_image_mode()
-            sample = self.pipe(num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator)
-            return sample.images[0], ""
-        elif mode == "t":
-            self.pipe.set_text_mode()
-            sample = self.pipe(num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator)
-            return None, sample.text[0]
-        elif mode == "i2t2i":
-            self.pipe.set_image_to_text_mode()
-            sample = self.pipe(
-                image=image, num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator
-            )
-            self.pipe.set_text_to_image_mode()
-            sample = self.pipe(
-                prompt=sample.text[0],
-                num_inference_steps=num_steps,
-                guidance_scale=guidance_scale,
-                generator=generator,
-            )
-            return sample.images[0], ""
-        elif mode == "t2i2t":
-            self.pipe.set_text_to_image_mode()
-            sample = self.pipe(
-                prompt=prompt, num_inference_steps=num_steps, guidance_scale=guidance_scale, generator=generator
-            )
-            self.pipe.set_image_to_text_mode()
-            sample = self.pipe(
-                image=sample.images[0],
-                num_inference_steps=num_steps,
-                guidance_scale=guidance_scale,
-                generator=generator,
-            )
-            return None, sample.text[0]
-        else:
-            raise ValueError