Spaces:

Joyantac33
/

donut-base-finetuned-docvqa

Runtime error

App Files Files Community

Joyantac33 commited on Jun 8, 2023

Commit

bcbb9bc

•

1 Parent(s): 4e3eecd

Upload 8 files

Browse files

Files changed (9) hide show

.gitattributes +1 -0
000.jpg +0 -0
README.md +5 -5
app.py +52 -0
data_sample.jpg +0 -0
gitattributes.txt +35 -0
requirements.txt +5 -0
sample_image_cord_test_receipt_00004.png +3 -0
sample_image_cord_test_receipt_00012.png +0 -0

.gitattributes CHANGED Viewed

@@ -32,3 +32,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+sample_image_cord_test_receipt_00004.png filter=lfs diff=lfs merge=lfs -text

000.jpg ADDED Viewed

README.md CHANGED Viewed

@@ -1,10 +1,10 @@
 ---
-title: Donut Base Finetuned Docvqa
-emoji: 🐠
-colorFrom: pink
-colorTo: purple
 sdk: gradio
-sdk_version: 3.34.0
 app_file: app.py
 pinned: false
 ---

 ---
+title: Donut Base Finetuned Cord V2
+emoji: 🍩
+colorFrom: blue
+colorTo: gray
 sdk: gradio
+sdk_version: 3.0.26
 app_file: app.py
 pinned: false
 ---

app.py ADDED Viewed

	@@ -0,0 +1,52 @@

+"""
+Donut
+Copyright (c) 2022-present NAVER Corp.
+MIT License
+https://github.com/clovaai/donut
+"""
+import gradio as gr
+import torch
+from PIL import Image
+from donut import DonutModel
+def _init_weights(DonutModel, module):
+        pass
+def demo_process(input_img):
+    global pretrained_model, task_prompt, task_name
+    # input_img = Image.fromarray(input_img)
+    output = pretrained_model.inference(image=input_img, prompt=task_prompt)["predictions"][0]
+    return output
+task_prompt = f"<s_cord-v2>"
+image = Image.open("./sample_image_cord_test_receipt_00004.png")
+image.save("cord_sample_receipt1.png")
+image = Image.open("./sample_image_cord_test_receipt_00012.png")
+image.save("cord_sample_receipt2.png")
+DonutModel._init_weights= _init_weights
+pretrained_model = DonutModel.from_pretrained("naver-clova-ix/donut-base-finetuned-docvqa",ignore_mismatched_sizes=True)
+pretrained_model.eval()
+demo = gr.Interface(
+    fn=demo_process,
+    inputs= gr.inputs.Image(type="pil"),
+    outputs="json",
+    title=f"Donut 🍩 demonstration for `cord-v2` task",
+    description="""This model is trained with 800 Indonesian receipt images of CORD dataset. <br>
+Demonstrations for other types of documents/tasks are available at https://github.com/clovaai/donut <br>
+More CORD receipt images are available at https://huggingface.co/datasets/naver-clova-ix/cord-v2
+More details are available at:
+- Paper: https://arxiv.org/abs/2111.15664
+- GitHub: https://github.com/clovaai/donut""",
+    examples=[["cord_sample_receipt1.png"], ["cord_sample_receipt2.png"]],
+    cache_examples=False,
+)
+demo.launch()

data_sample.jpg ADDED Viewed

gitattributes.txt ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+sample_image_cord_test_receipt_00004.png filter=lfs diff=lfs merge=lfs -text

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+torch
+donut-python
+gradio
+transformers==4.24.0
+timm==0.6.13

sample_image_cord_test_receipt_00004.png ADDED Viewed

Git LFS Details

SHA256: 8f3eee7068c96e86cdb2e4b5c53085cb5e1439462edd55c373548cb1962801ad
Pointer size: 132 Bytes
Size of remote file: 1.64 MB

sample_image_cord_test_receipt_00012.png ADDED Viewed