Spaces:

Snowad
/

JAP-OCR

Sleeping

App Files Files Community

Snowad commited on Apr 25

Commit

705192b

•

1 Parent(s): a33bdf1

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -14

app.py CHANGED Viewed

@@ -3,8 +3,8 @@ import jaconv
 import gradio as gr
 from transformers import AutoTokenizer, AutoFeatureExtractor, VisionEncoderDecoderModel
 from PIL import Image
-import torch
-import spaces, time
 tokenizer = AutoTokenizer.from_pretrained("kha-white/manga-ocr-base")
@@ -13,8 +13,6 @@ model.to("cuda")
 feature_extractor = AutoFeatureExtractor.from_pretrained("kha-white/manga-ocr-base")
-examples = ["00.jpg", "01.jpg", "02.jpg", "03.jpg", "04.jpg", "05.jpg", "06.jpg", "07.jpg", "08.jpg", "09.jpg", "10.jpg", "11.jpg"]
 def post_process(text):
   text = ''.join(text.split())
   text = text.replace('…', '...')
@@ -22,20 +20,37 @@ def post_process(text):
   text = jaconv.h2z(text, ascii=True, digit=True)
   return text
 @spaces.GPU
-def manga_ocr(img):
-  img = img.convert('L').convert('RGB')
-  pixel_values = feature_extractor(img, return_tensors="pt").pixel_values.to("cuda")
-  start_time = time.time()
-  output = model.generate(pixel_values)[0]
-  print("Time taken for OCR:", time.time() - start_time)
-  text = tokenizer.decode(output, skip_special_tokens=True)
-  text = post_process(text)
-  return text
 iface = gr.Interface(
     fn=manga_ocr,
-    inputs=gr.Image(type='pil'),
     outputs="text",
     title="Manga OCR",
     description="Extract Manga in lighting speed ⚡",

 import gradio as gr
 from transformers import AutoTokenizer, AutoFeatureExtractor, VisionEncoderDecoderModel
 from PIL import Image
+import torch, time
+import spaces
 tokenizer = AutoTokenizer.from_pretrained("kha-white/manga-ocr-base")
 feature_extractor = AutoFeatureExtractor.from_pretrained("kha-white/manga-ocr-base")
 def post_process(text):
   text = ''.join(text.split())
   text = text.replace('…', '...')
   text = jaconv.h2z(text, ascii=True, digit=True)
   return text
+# @spaces.GPU
+# def manga_ocr(img):
+#   img = img.convert('L').convert('RGB')
+#   pixel_values = feature_extractor(img, return_tensors="pt").pixel_values.to("cuda")
+#   start_time = time.time()
+#   output = model.generate(pixel_values)[0]
+#   print("Time taken for OCR:", time.time() - start_time)
+#   text = tokenizer.decode(output, skip_special_tokens=True)
+#   text = post_process(text)
+#   return text
 @spaces.GPU
+def manga_ocr(imgs):
+  texts = []
+  for img in imgs:
+    img = Image.open(img)
+    img = img.convert('L').convert('RGB')
+    pixel_values = feature_extractor(img, return_tensors="pt").pixel_values.to("cuda")
+    start_time = time.time()
+    output = model.generate(pixel_values)[0]
+    print("Time taken for OCR:", time.time() - start_time)
+    text = tokenizer.decode(output, skip_special_tokens=True)
+    text = post_process(text)
+    texts.append(text)
+  return "|||".join(texts)
 iface = gr.Interface(
     fn=manga_ocr,
+    inputs=gr.File(file_types=["image"], file_count="multiple"),
     outputs="text",
     title="Manga OCR",
     description="Extract Manga in lighting speed ⚡",