Spaces:

Adapter
/

T2I-Adapter

Runtime error

App Files Files Community

Adapter commited on Mar 4, 2023

Commit

aa0bbd7

1 Parent(s): b8fb5b9

canny

Browse files

Files changed (4) hide show

app.py +4 -2
demo/demos.py +26 -0
demo/model.py +62 -1
ldm/modules/encoders/adapter.py +0 -1

app.py CHANGED Viewed

@@ -8,14 +8,14 @@ os.system('mim install mmcv-full==1.7.0')
 from demo.model import Model_all
 import gradio as gr
-from demo.demos import create_demo_keypose, create_demo_sketch, create_demo_draw, create_demo_seg, create_demo_depth, create_demo_depth_keypose, create_demo_color, create_demo_color_sketch, create_demo_openpose, create_demo_style_sketch
 import torch
 import subprocess
 import shlex
 from huggingface_hub import hf_hub_url
 urls = {
-    'TencentARC/T2I-Adapter':['models/t2iadapter_keypose_sd14v1.pth', 'models/t2iadapter_color_sd14v1.pth', 'models/t2iadapter_openpose_sd14v1.pth', 'models/t2iadapter_seg_sd14v1.pth', 'models/t2iadapter_sketch_sd14v1.pth', 'models/t2iadapter_depth_sd14v1.pth','third-party-models/body_pose_model.pth', "models/t2iadapter_style_sd14v1.pth"],
     'CompVis/stable-diffusion-v-1-4-original':['sd-v1-4.ckpt'],
     'andite/anything-v4.0':['anything-v4.0-pruned.ckpt', 'anything-v4.0.vae.pt'],
 }
@@ -67,6 +67,8 @@ with gr.Blocks(css='style.css') as demo:
             create_demo_openpose(model.process_openpose)
         with gr.TabItem('Keypose'):
             create_demo_keypose(model.process_keypose)
         with gr.TabItem('Sketch'):
             create_demo_sketch(model.process_sketch)
         with gr.TabItem('Draw'):

 from demo.model import Model_all
 import gradio as gr
+from demo.demos import create_demo_keypose, create_demo_sketch, create_demo_draw, create_demo_seg, create_demo_depth, create_demo_depth_keypose, create_demo_color, create_demo_color_sketch, create_demo_openpose, create_demo_style_sketch, create_demo_canny
 import torch
 import subprocess
 import shlex
 from huggingface_hub import hf_hub_url
 urls = {
+    'TencentARC/T2I-Adapter':['models/t2iadapter_keypose_sd14v1.pth', 'models/t2iadapter_color_sd14v1.pth', 'models/t2iadapter_openpose_sd14v1.pth', 'models/t2iadapter_seg_sd14v1.pth', 'models/t2iadapter_sketch_sd14v1.pth', 'models/t2iadapter_depth_sd14v1.pth','third-party-models/body_pose_model.pth', "models/t2iadapter_style_sd14v1.pth", "models/t2iadapter_canny_sd14v1.pth"],
     'CompVis/stable-diffusion-v-1-4-original':['sd-v1-4.ckpt'],
     'andite/anything-v4.0':['anything-v4.0-pruned.ckpt', 'anything-v4.0.vae.pt'],
 }
             create_demo_openpose(model.process_openpose)
         with gr.TabItem('Keypose'):
             create_demo_keypose(model.process_keypose)
+        with gr.TabItem('Canny'):
+            create_demo_canny(model.process_canny)
         with gr.TabItem('Sketch'):
             create_demo_sketch(model.process_sketch)
         with gr.TabItem('Draw'):

demo/demos.py CHANGED Viewed

@@ -90,6 +90,32 @@ def create_demo_sketch(process):
         run_button.click(fn=process, inputs=ips, outputs=[result])
     return demo
 def create_demo_color_sketch(process):
     with gr.Blocks() as demo:
         with gr.Row():

         run_button.click(fn=process, inputs=ips, outputs=[result])
     return demo
+def create_demo_canny(process):
+    with gr.Blocks() as demo:
+        with gr.Row():
+            gr.Markdown('## T2I-Adapter (Canny)')
+        with gr.Row():
+            with gr.Column():
+                input_img = gr.Image(source='upload', type="numpy")
+                prompt = gr.Textbox(label="Prompt")
+                neg_prompt = gr.Textbox(label="Negative Prompt",
+                value='ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face')
+                pos_prompt = gr.Textbox(label="Positive Prompt",
+                value = 'crafted, elegant, meticulous, magnificent, maximum details, extremely hyper aesthetic, intricately detailed')
+                with gr.Row():
+                    type_in = gr.inputs.Radio(['Canny', 'Image'], type="value", default='Image', label='Input Types\n (You can input an image or a canny map)')
+                    color_back = gr.inputs.Radio(['White', 'Black'], type="value", default='Black', label='Color of the canny background\n (Only work for canny input)')
+                run_button = gr.Button(label="Run")
+                con_strength = gr.Slider(label="Controling Strength (The guidance strength of the canny to the result)", minimum=0, maximum=1, value=1, step=0.1)
+                scale = gr.Slider(label="Guidance Scale (Classifier free guidance)", minimum=0.1, maximum=30.0, value=7.5, step=0.1)
+                fix_sample = gr.inputs.Radio(['True', 'False'], type="value", default='False', label='Fix Sampling\n (Fix the random seed)')
+                base_model = gr.inputs.Radio(['sd-v1-4.ckpt', 'anything-v4.0-pruned.ckpt'], type="value", default='sd-v1-4.ckpt', label='The base model you want to use')
+            with gr.Column():
+                result = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(grid=2, height='auto')
+            ips = [input_img, type_in, color_back, prompt, neg_prompt, pos_prompt, fix_sample, scale, con_strength, base_model]
+        run_button.click(fn=process, inputs=ips, outputs=[result])
+    return demo
 def create_demo_color_sketch(process):
     with gr.Blocks() as demo:
         with gr.Row():

demo/model.py CHANGED Viewed

@@ -74,7 +74,6 @@ def imshow_keypoints(img,
         if idx > 1:
             continue
         kpts = kpts['keypoints']
-        # print(kpts)
         kpts = np.array(kpts, copy=False)
         # draw each point on image
@@ -138,6 +137,9 @@ class Model_all:
         self.sampler = PLMSSampler(self.base_model)
         # sketch part
         self.model_sketch = Adapter(channels=[320, 640, 1280, 1280][:4], nums_rb=2, ksize=1, sk=True,
                                     use_conv=False).to(device)
         self.model_sketch.load_state_dict(torch.load("models/t2iadapter_sketch_sd14v1.pth", map_location=device))
@@ -277,6 +279,65 @@ class Model_all:
         return [im_edge, x_samples_ddim]
     @torch.no_grad()
     def process_color_sketch(self, input_img_sketch, input_img_color, type_in, type_in_color, w_sketch, w_color, color_back, prompt, neg_prompt, pos_prompt, fix_sample, scale, con_strength, base_model):
         if self.current_base != base_model:

         if idx > 1:
             continue
         kpts = kpts['keypoints']
         kpts = np.array(kpts, copy=False)
         # draw each point on image
         self.sampler = PLMSSampler(self.base_model)
         # sketch part
+        self.model_canny = Adapter(channels=[320, 640, 1280, 1280][:4], nums_rb=2, ksize=1, sk=True,
+                                    use_conv=False).to(device)
+        self.model_canny.load_state_dict(torch.load("models/t2iadapter_canny_sd14v1.pth", map_location=device))
         self.model_sketch = Adapter(channels=[320, 640, 1280, 1280][:4], nums_rb=2, ksize=1, sk=True,
                                     use_conv=False).to(device)
         self.model_sketch.load_state_dict(torch.load("models/t2iadapter_sketch_sd14v1.pth", map_location=device))
         return [im_edge, x_samples_ddim]
+    @torch.no_grad()
+    def process_canny(self, input_img, type_in, color_back, prompt, neg_prompt, pos_prompt, fix_sample, scale,
+                       con_strength, base_model):
+        if self.current_base != base_model:
+            ckpt = os.path.join("models", base_model)
+            pl_sd = torch.load(ckpt, map_location="cuda")
+            if "state_dict" in pl_sd:
+                sd = pl_sd["state_dict"]
+            else:
+                sd = pl_sd
+            self.base_model.load_state_dict(sd, strict=False)
+            self.current_base = base_model
+            if 'anything' in base_model.lower():
+                self.load_vae()
+        con_strength = int((1 - con_strength) * 50)
+        if fix_sample == 'True':
+            seed_everything(42)
+        im = cv2.resize(input_img, (512, 512))
+        if type_in == 'Canny':
+            if color_back == 'White':
+                im = 255 - im
+            im_edge = im.copy()
+            im = img2tensor(im)[0].unsqueeze(0).unsqueeze(0) / 255.
+        elif type_in == 'Image':
+            im = cv2.Canny(im,100,200)
+            im = img2tensor(im[..., None], bgr2rgb=True, float32=True).unsqueeze(0) / 255.
+            im_edge = tensor2img(im)
+        # extract condition features
+        c = self.base_model.get_learned_conditioning([prompt + ', ' + pos_prompt])
+        nc = self.base_model.get_learned_conditioning([neg_prompt])
+        features_adapter = self.model_canny(im.to(self.device))
+        shape = [4, 64, 64]
+        # sampling
+        samples_ddim, _ = self.sampler.sample(S=50,
+                                              conditioning=c,
+                                              batch_size=1,
+                                              shape=shape,
+                                              verbose=False,
+                                              unconditional_guidance_scale=scale,
+                                              unconditional_conditioning=nc,
+                                              eta=0.0,
+                                              x_T=None,
+                                              features_adapter1=features_adapter,
+                                              mode='sketch',
+                                              con_strength=con_strength)
+        x_samples_ddim = self.base_model.decode_first_stage(samples_ddim)
+        x_samples_ddim = torch.clamp((x_samples_ddim + 1.0) / 2.0, min=0.0, max=1.0)
+        x_samples_ddim = x_samples_ddim.to('cpu')
+        x_samples_ddim = x_samples_ddim.permute(0, 2, 3, 1).numpy()[0]
+        x_samples_ddim = 255. * x_samples_ddim
+        x_samples_ddim = x_samples_ddim.astype(np.uint8)
+        return [im_edge, x_samples_ddim]
     @torch.no_grad()
     def process_color_sketch(self, input_img_sketch, input_img_color, type_in, type_in_color, w_sketch, w_color, color_back, prompt, neg_prompt, pos_prompt, fix_sample, scale, con_strength, base_model):
         if self.current_base != base_model:

ldm/modules/encoders/adapter.py CHANGED Viewed

@@ -64,7 +64,6 @@ class ResnetBlock(nn.Module):
         if in_c != out_c or sk==False:
             self.in_conv = nn.Conv2d(in_c, out_c, ksize, 1, ps)
         else:
-            # print('n_in')
             self.in_conv = None
         self.block1 = nn.Conv2d(out_c, out_c, 3, 1, 1)
         self.act = nn.ReLU()

         if in_c != out_c or sk==False:
             self.in_conv = nn.Conv2d(in_c, out_c, ksize, 1, ps)
         else:
             self.in_conv = None
         self.block1 = nn.Conv2d(out_c, out_c, 3, 1, 1)
         self.act = nn.ReLU()