masterful
/

gligen-1-4-inpainting-text-box

StableDiffusionPipeline

stable-diffusion

stable-diffusion-diffusers

Inference Endpoints

Model card Files Files and versions Community

nikhilg commited on Aug 16, 2023

Commit

8449f5e

•

1 Parent(s): ff5ec05

Update README.md

Files changed (1) hide show

README.md +13 -14

README.md CHANGED Viewed

@@ -68,34 +68,33 @@ Running the pipeline with the default PNDM scheduler:
 ```python
 import torch
-import torchvision
 from diffusers import StableDiffusionGLIGENPipeline
 from diffusers.utils import load_image
-model_id = "masterful/gligen-1-4-inpainting-text-box"
-device = "cuda"
-pipe = StableDiffusionGLIGENPipeline.from_pretrained(model_id, variant="fp16", torch_dtype=torch.float16)
-pipe = pipe.to(device)
-input_image = load_image("https://hf.co/datasets/huggingface/documentation-images/resolve/main/diffusers/gligen/livingroom_modern.png")
 prompt = "a birthday cake"
-boxes = [[0.2676,0.6088,0.4773,0.7183]]
-phrases=["a birthday cake"]
 images = pipe(
     prompt=prompt,
-    num_images_per_prompt=1,
     gligen_phrases=phrases,
     gligen_inpaint_image=input_image,
     gligen_boxes=boxes,
     gligen_scheduled_sampling_beta=1,
-    output_type="np",
     num_inference_steps=50,
 ).images
-images = torch.stack([torch.from_numpy(image) for image in images]).permute(0, 3, 1, 2)
-torchvision.utils.save_image(images, "./gligen-1-4-inpainting-text-box.jpg", nrow=1, normalize=False)
 ```
@@ -183,4 +182,4 @@ Refer [`GLIGEN`](https://github.com/gligen/GLIGEN) for more details.
     }
 ```
-*This model card was written by: Robin Rombach and Patrick Esser and is based on the [DALL-E Mini model card](https://huggingface.co/dalle-mini/dalle-mini).*

 ```python
 import torch
 from diffusers import StableDiffusionGLIGENPipeline
 from diffusers.utils import load_image
+# Insert objects described by text at the region defined by bounding boxes
+pipe = StableDiffusionGLIGENPipeline.from_pretrained(
+    "masterful/gligen-1-4-inpainting-text-box", variant="fp16", torch_dtype=torch.float16
+)
+pipe = pipe.to("cuda")
+input_image = load_image(
+    "https://hf.co/datasets/huggingface/documentation-images/resolve/main/diffusers/gligen/livingroom_modern.png"
+)
 prompt = "a birthday cake"
+boxes = [[0.2676, 0.6088, 0.4773, 0.7183]]
+phrases = ["a birthday cake"]
 images = pipe(
     prompt=prompt,
     gligen_phrases=phrases,
     gligen_inpaint_image=input_image,
     gligen_boxes=boxes,
     gligen_scheduled_sampling_beta=1,
+    output_type="pil",
     num_inference_steps=50,
 ).images
+images[0].save("./gligen-1-4-inpainting-text-box.jpg")
 ```
     }
 ```
+*This model card was written by: [Nikhil Gajendrakumar](https://github.com/nikhil-masterful) and is based on the [DALL-E Mini model card](https://huggingface.co/dalle-mini/dalle-mini).*