Spaces:

musadac
/

VilanOCR-Urdu-English-Chinese

Runtime error

musadac commited on Apr 10, 2023

Commit

a4172ab

1 Parent(s): 2c72c7b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -80,21 +80,21 @@ processortext2 = CustomOCRProcessor(image_processor,tokenizer)
 import os
 huggingface_token = os.environ.get("HUGGINGFACE_TOKEN")
 model = {}
-model['single-urdu'] = VisionEncoderDecoderModel.from_pretrained("musadac/vilanocr-single-urdu", use_auth_token=huggingface_token)
-model['multi-urdu'] = VisionEncoderDecoderModel.from_pretrained("musadac/ViLanOCR", use_auth_token=huggingface_token)
-model['medical'] = VisionEncoderDecoderModel.from_pretrained("musadac/vilanocr-multi-medical", use_auth_token=huggingface_token)
-model['chinese'] = VisionEncoderDecoderModel.from_pretrained("musadac/vilanocr-single-chinese", use_auth_token=huggingface_token)
 st.title("Image OCR with musadac/vilanocr")
 model_name = st.selectbox("Choose an OCR model", ["single-urdu", "multi-urdu", "medical","chinese" ])
 uploaded_file = st.file_uploader("Choose an image", type=["jpg", "jpeg", "png"])
 if uploaded_file is not None:
     img = Image.open(uploaded_file).convert("RGB")
     pixel_values = processortext2(img.convert("RGB"), return_tensors="pt").pixel_values
     with torch.no_grad():
-        generated_ids = model[model_name].generate(pixel_values)
     result = processortext2.batch_decode(generated_ids, skip_special_tokens=True)[0]
     st.write("OCR Result:")

 import os
 huggingface_token = os.environ.get("HUGGINGFACE_TOKEN")
 model = {}
+model['single-urdu'] = "musadac/vilanocr-single-urdu"
+model['multi-urdu'] = "musadac/ViLanOCR"
+model['medical'] = "musadac/vilanocr-multi-medical"
+model['chinese'] = "musadac/vilanocr-single-chinese"
 st.title("Image OCR with musadac/vilanocr")
 model_name = st.selectbox("Choose an OCR model", ["single-urdu", "multi-urdu", "medical","chinese" ])
 uploaded_file = st.file_uploader("Choose an image", type=["jpg", "jpeg", "png"])
 if uploaded_file is not None:
+    model2 = VisionEncoderDecoderModel.from_pretrained(model[model_name], use_auth_token=huggingface_token)
     img = Image.open(uploaded_file).convert("RGB")
     pixel_values = processortext2(img.convert("RGB"), return_tensors="pt").pixel_values
     with torch.no_grad():
+        generated_ids = model2.generate(pixel_values)
     result = processortext2.batch_decode(generated_ids, skip_special_tokens=True)[0]
     st.write("OCR Result:")