Spaces:

HEHEBOIOG
/

EasyOCRHandwritten

Build error

App Files Files Community

HEHEBOIOG commited on Jul 30

Commit

e398b3a

•

1 Parent(s): 100eff5

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -12

app.py CHANGED Viewed

@@ -5,9 +5,18 @@ from PIL import ImageDraw
 import gradio as gr
 import torch
 import easyocr
-torch.hub.download_url_to_file('https://github.com/JaidedAI/EasyOCR/raw/master/examples/english.png', 'english.png')
-torch.hub.download_url_to_file('https://i.imgur.com/mwQFd7G.jpeg', 'Hindi.jpeg')
 def draw_boxes(image, bounds, color='yellow', width=2):
     draw = ImageDraw.Draw(image)
@@ -16,18 +25,24 @@ def draw_boxes(image, bounds, color='yellow', width=2):
         draw.line([*p0, *p1, *p2, *p3, *p0], fill=color, width=width)
     return image
-def inference(img, lang):
     reader = easyocr.Reader(lang)
-    bounds = reader.readtext(img.name)
-    im = PIL.Image.open(img.name)
-    draw_boxes(im, bounds)
-    im.save('result.jpg')
-    return ['result.jpg', pd.DataFrame(bounds).iloc[: , 1:]]
 title = 'EasyOCR'
 description = 'Realtime EasyOCR.'
 article = "<p style='text-align: center'><a href='https://www.jaided.ai/easyocr/'>OCR for written scripts.</a> | <a href='https://github.com/JaidedAI/EasyOCR'>Github Repo</a></p>"
-examples = [['english.png',['en']],['Hindi.jpeg',['hi', 'en']]]
 css = ".output_image, .input_image {height: 40rem !important; width: 100% !important;}"
 choices = [
     "en",
@@ -35,12 +50,12 @@ choices = [
    ]
 gr.Interface(
     inference,
-    [gr.inputs.Image(type='file', label='Input'),gr.inputs.CheckboxGroup(choices, type="value", default=['en'], label='language')],
-    [gr.outputs.Image(type='file', label='Output'), gr.outputs.Dataframe(headers=['text', 'confidence'])],
     title=title,
     description=description,
     article=article,
     examples=examples,
     css=css,
     enable_queue=True
-    ).launch(debug=True)

 import gradio as gr
 import torch
 import easyocr
+import fitz  # PyMuPDF
+# Function to extract images from PDF
+def pdf_to_images(pdf_path):
+    doc = fitz.open(pdf_path)
+    images = []
+    for page_num in range(len(doc)):
+        page = doc.load_page(page_num)
+        pix = page.get_pixmap()
+        img = Image.frombytes("RGB", [pix.width, pix.height], pix.samples)
+        images.append(img)
+    return images
 def draw_boxes(image, bounds, color='yellow', width=2):
     draw = ImageDraw.Draw(image)
         draw.line([*p0, *p1, *p2, *p3, *p0], fill=color, width=width)
     return image
+def inference(pdf, lang):
     reader = easyocr.Reader(lang)
+    images = pdf_to_images(pdf.name)
+    results = []
+    for i, img in enumerate(images):
+        img_path = f'page_{i + 1}.jpg'
+        img.save(img_path)
+        bounds = reader.readtext(img_path)
+        draw_boxes(img, bounds)
+        result_img_path = f'result_{i + 1}.jpg'
+        img.save(result_img_path)
+        results.append((result_img_path, pd.DataFrame(bounds).iloc[:, 1:]))
+    return results
 title = 'EasyOCR'
 description = 'Realtime EasyOCR.'
 article = "<p style='text-align: center'><a href='https://www.jaided.ai/easyocr/'>OCR for written scripts.</a> | <a href='https://github.com/JaidedAI/EasyOCR'>Github Repo</a></p>"
+examples = [['example.pdf',['en']]]
 css = ".output_image, .input_image {height: 40rem !important; width: 100% !important;}"
 choices = [
     "en",
    ]
 gr.Interface(
     inference,
+    [gr.inputs.File(type='file', label='Input PDF'), gr.inputs.CheckboxGroup(choices, type="value", default=['en'], label='language')],
+    [gr.outputs.File(type='file', label='Output Images'), gr.outputs.Dataframe(headers=['text', 'confidence'])],
     title=title,
     description=description,
     article=article,
     examples=examples,
     css=css,
     enable_queue=True
+    ).launch(debug=True)