desarrolloasesoreslocales
commited on
Commit
•
4db117d
1
Parent(s):
f74c3b8
Update app.py
Browse files
app.py
CHANGED
@@ -14,6 +14,9 @@ import pytesseract
|
|
14 |
from pdf2image import convert_from_path
|
15 |
from PIL import Image
|
16 |
|
|
|
|
|
|
|
17 |
def ocrtotext(filename):
|
18 |
# Almacena todas las páginas del PDF en una variable
|
19 |
image_file_list = [] # Lista para almacenar los nombres de los archivos de imagen
|
|
|
14 |
from pdf2image import convert_from_path
|
15 |
from PIL import Image
|
16 |
|
17 |
+
pytesseract.pytesseract.tesseract_cmd = r".\lib\Tesseract-OCR\tesseract.exe"
|
18 |
+
path_to_poppler_exe = Path(r".\lib\poppler-0.68.0\bin")
|
19 |
+
|
20 |
def ocrtotext(filename):
|
21 |
# Almacena todas las páginas del PDF en una variable
|
22 |
image_file_list = [] # Lista para almacenar los nombres de los archivos de imagen
|