Spaces:

alaaawad
/

CLIPSeg_x_SD

Runtime error

App Files Files Community

alaaawad commited on Dec 11, 2022

Commit

98bd5e6

•

1 Parent(s): f4e3685

use diffusers

Browse files

Files changed (2) hide show

app.py +30 -12
requirements.txt +4 -2

app.py CHANGED Viewed

@@ -1,3 +1,4 @@
 from transformers import CLIPSegProcessor, CLIPSegForImageSegmentation
 import gradio as gr
 from PIL import Image
@@ -5,32 +6,49 @@ import torch
 import matplotlib.pyplot as plt
 import cv2
-processor = CLIPSegProcessor.from_pretrained("CIDAS/clipseg-rd64-refined")
-model = CLIPSegForImageSegmentation.from_pretrained("CIDAS/clipseg-rd64-refined")
-def process_image(image, prompt):
-  inputs = processor(text=prompt, images=image, padding="max_length", return_tensors="pt")
   # predict
   with torch.no_grad():
-    outputs = model(**inputs)
     preds = outputs.logits
-  filename = f"mask.png"
-  plt.imsave(filename, torch.sigmoid(preds))
-  return Image.open("mask.png").convert("RGB")
-title = "Interactive demo: zero-shot image segmentation with CLIPSeg"
-description = "Demo for using CLIPSeg, a CLIP-based model for zero- and one-shot image segmentation. To use it, simply upload an image and add a text to mask (identify in the image), or use one of the examples below and click 'submit'. Results will show up in a few seconds."
 article = "<p style='text-align: center'><a href='https://arxiv.org/abs/2112.10003'>CLIPSeg: Image Segmentation Using Text and Image Prompts</a> | <a href='https://huggingface.co/docs/transformers/main/en/model_doc/clipseg'>HuggingFace docs</a></p>"
 interface = gr.Interface(fn=process_image,
-                     inputs=[gr.Image(type="pil"), gr.Textbox(label="Please describe what you want to identify")],
-                     outputs=gr.Image(type="pil"),
                      title=title,
                      description=description,
                      article=article)

+from diffusers import StableDiffusionInpaintPipeline
 from transformers import CLIPSegProcessor, CLIPSegForImageSegmentation
 import gradio as gr
 from PIL import Image
 import matplotlib.pyplot as plt
 import cv2
+clip_seg_processor = CLIPSegProcessor.from_pretrained("CIDAS/clipseg-rd64-refined")
+clip_seg_model = CLIPSegForImageSegmentation.from_pretrained("CIDAS/clipseg-rd64-refined")
+sd_inpainting_model = StableDiffusionInpaintPipeline.from_pretrained("stable-diffusion-2-inpainting", revision="fp16", torch_dtype=torch.float16)
+def process_image(image, prompt1, prompt2):
+  inputs = clip_seg_processor(text=prompt, images=image, padding="max_length", return_tensors="pt")
   # predict
   with torch.no_grad():
+    outputs = clip_seg_model(**inputs)
     preds = outputs.logits
+  filename_mask = f"mask.png"
+  plt.imsave(filename_mask, torch.sigmoid(preds))
+  mask_image = Image.open(filename_mask).convert("RGB")
+  with torch.no_grad():
+    output_image = sd_inpainting_model(prompt=prompt2, image=image, mask_image=mask_image).images[0]
+  filename_sd = f"sd.png"
+  output_image.save(filename_sd)
+  sd_image = Image.open(filename_sd).convert("RGB")
+  return [mask_image, sd_image]
+title = "Interactive demo: Prompt based inPainting using CLIPSeg x Stable Diffusion"
+description = "Demo for prompt based inPainting. It uses CLIPSeg, a CLIP-based model for zero- and one-shot image segmentation. Once it identifies the image segment based on a text mask, or use one of the examples below and click 'submit'. Results will show up in a few seconds."
 article = "<p style='text-align: center'><a href='https://arxiv.org/abs/2112.10003'>CLIPSeg: Image Segmentation Using Text and Image Prompts</a> | <a href='https://huggingface.co/docs/transformers/main/en/model_doc/clipseg'>HuggingFace docs</a></p>"
 interface = gr.Interface(fn=process_image,
+                     inputs=[
+                        gr.Image(type="pil"),
+                        gr.Textbox(label="What to identify"),
+                        gr.Textbox(label="What to replace it with"),
+                      ],
+                     outputs=[
+                        gr.Image(type="pil"),
+                        gr.Image(type="pil"),
+                     ],
                      title=title,
                      description=description,
                      article=article)

requirements.txt CHANGED Viewed

@@ -1,5 +1,7 @@
-git+https://github.com/huggingface/transformers.git
 accelerate
-git+https://github.com/huggingface/diffusers.git
 torch
 opencv-python

 accelerate
+diffusers
 torch
 opencv-python
+transformers
+accelerate
+scipy