Spaces:

omkar56
/

Text-to-Image-OCR-FASTAPI

Sleeping

omkar56 commited on Dec 9, 2023

Commit

c07cdd2

1 Parent(s): 9a8224c

Update main.py

Files changed (1) hide show

main.py CHANGED Viewed

@@ -5,7 +5,9 @@ from fastapi.security.api_key import APIKeyHeader
 from typing import Optional, Annotated
 from fastapi.encoders import jsonable_encoder
 from PIL import Image
-from io import BytesIO
 import pytesseract
 from nltk.tokenize import sent_tokenize
 from transformers import MarianMTModel, MarianTokenizer
@@ -30,9 +32,14 @@ async def ocr(
         print("[1]",os.popen(f'cat /etc/debian_version').read())
         print("[2]",os.popen(f'cat /etc/issue').read())
         print("[3]",os.popen(f'apt search tesseract').read())
-        content = await image.read()
-        image = Image.open(BytesIO(content))
-        print("[image]",content)
         if hasattr(pytesseract, "image_to_string"):
             print("Image to string function is available")
         else:

 from typing import Optional, Annotated
 from fastapi.encoders import jsonable_encoder
 from PIL import Image
+import io
+import cv2
+import numpy as np
 import pytesseract
 from nltk.tokenize import sent_tokenize
 from transformers import MarianMTModel, MarianTokenizer
         print("[1]",os.popen(f'cat /etc/debian_version').read())
         print("[2]",os.popen(f'cat /etc/issue').read())
         print("[3]",os.popen(f'apt search tesseract').read())
+        # content = await image.read()
+        # image = Image.open(BytesIO(content))
+        image_stream = io.BytesIO(image)
+        image_stream.seek(0)
+        file_bytes = np.asarray(bytearray(image_stream.read()), dtype=np.uint8)
+        frame = cv2.imdecode(file_bytes, cv2.IMREAD_COLOR)
+        # label = read_img(frame)
+        print("[image]",frame)
         if hasattr(pytesseract, "image_to_string"):
             print("Image to string function is available")
         else: