GAS17 commited on
Commit
b85f524
·
verified ·
1 Parent(s): 5017d58

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +13 -8
app.py CHANGED
@@ -1,16 +1,21 @@
1
  import gradio as gr
2
- import pdfquery
3
 
4
  def consultar_pdf(pdf_file, consulta):
5
- # Cargar el PDF
6
- pdf = pdfquery.PDFQuery(pdf_file.name)
7
- pdf.load()
8
 
9
- # Realizar la consulta
10
- resultado = pdf.pq(consulta).text()
 
 
 
11
 
12
- # Devolver el resultado de la consulta
13
- return resultado
 
 
 
14
 
15
  # Crear la interfaz de Gradio
16
  iface = gr.Interface(
 
1
  import gradio as gr
2
+ import fitz # PyMuPDF
3
 
4
  def consultar_pdf(pdf_file, consulta):
5
+ # Abrir el archivo PDF
6
+ pdf_document = fitz.open(pdf_file.name)
 
7
 
8
+ # Recorrer todas las páginas y extraer el texto
9
+ texto_completo = ""
10
+ for page_num in range(pdf_document.page_count):
11
+ page = pdf_document.load_page(page_num)
12
+ texto_completo += page.get_text()
13
 
14
+ # Buscar la consulta dentro del texto extraído
15
+ if consulta.lower() in texto_completo.lower():
16
+ return f"Consulta encontrada: {consulta}"
17
+ else:
18
+ return "Consulta no encontrada"
19
 
20
  # Crear la interfaz de Gradio
21
  iface = gr.Interface(