ui-refexp-click

Sleeping

App Files Files Community

ivelin commited on Apr 20, 2023

Commit

c04ab4e

1 Parent(s): a8e6b52

fix: gradio update related issues

Browse files

Signed-off-by: ivelin <ivelin.eth@gmail.com>

Files changed (1) hide show

app.py +7 -6

app.py CHANGED Viewed

@@ -15,7 +15,8 @@ def load_model(pretrained_revision: str = 'main'):
     pretrained_repo_name = 'ivelin/donut-refexp-click'
     # revision can be git commit hash, branch or tag
     # use 'main' for latest revision
-    print(f"Loading model checkpoint from repo: {pretrained_repo_name}, revision: {pretrained_revision}")
     processor = DonutProcessor.from_pretrained(
         pretrained_repo_name, revision=pretrained_revision, use_auth_token="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")
     processor.image_processor.do_align_long_axis = False
@@ -28,10 +29,10 @@ def load_model(pretrained_revision: str = 'main'):
     print(f'processor image size: {processor.image_processor.size}')
     model = VisionEncoderDecoderModel.from_pretrained(
         pretrained_repo_name, use_auth_token="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", revision=pretrained_revision)
     device = "cuda" if torch.cuda.is_available() else "cpu"
     model.to(device)
 def prepare_image_for_encoder(image=None, output_image_size=None):
     """
@@ -89,13 +90,13 @@ def translate_point_coords_from_out_to_in(point=None, input_image_size=None, out
         f"translated point={point}, resized_image_size: {resized_width, resized_height}")
-def process_refexp(image: Image, prompt: str, model_revision: str = 'main'):
     print(f"(image, prompt): {image}, {prompt}")
     if not model_revision:
         model_revision = 'main'
     print(f"model checkpoint revision: {model_revision}")
     load_model(model_revision)
@@ -222,7 +223,7 @@ examples = [["example_1.jpg", "select the setting icon from top right corner", "
 demo = gr.Interface(fn=process_refexp,
                     inputs=[gr.Image(type="pil"), "text", "text"],
-                    outputs=[gr.Image(type="pil"), "json"],
                     title=title,
                     description=description,
                     article=article,

     pretrained_repo_name = 'ivelin/donut-refexp-click'
     # revision can be git commit hash, branch or tag
     # use 'main' for latest revision
+    print(
+        f"Loading model checkpoint from repo: {pretrained_repo_name}, revision: {pretrained_revision}")
     processor = DonutProcessor.from_pretrained(
         pretrained_repo_name, revision=pretrained_revision, use_auth_token="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")
     processor.image_processor.do_align_long_axis = False
     print(f'processor image size: {processor.image_processor.size}')
     model = VisionEncoderDecoderModel.from_pretrained(
         pretrained_repo_name, use_auth_token="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", revision=pretrained_revision)
     device = "cuda" if torch.cuda.is_available() else "cpu"
     model.to(device)
 def prepare_image_for_encoder(image=None, output_image_size=None):
     """
         f"translated point={point}, resized_image_size: {resized_width, resized_height}")
+def process_refexp(image, prompt: str, model_revision: str = 'main'):
     print(f"(image, prompt): {image}, {prompt}")
     if not model_revision:
         model_revision = 'main'
     print(f"model checkpoint revision: {model_revision}")
     load_model(model_revision)
 demo = gr.Interface(fn=process_refexp,
                     inputs=[gr.Image(type="pil"), "text", "text"],
+                    outputs=[gr.Image(type="pil", shape=(820)), "json"],
                     title=title,
                     description=description,
                     article=article,