Spaces:

regraded01
/

pdf-to-table

Running

App Files Files Community

pdf-to-table / pdfParser.py

regraded01's picture

init

2267014 about 1 year ago

282 Bytes

	import PyPDF2
	import streamlit as st


	@st.cache_resource
	def get_pdf_text(filepath):
	# Open the PDF file in read-binary mode
	# Create a PDF object
	pdf = PyPDF2.PdfReader(filepath)
	pdf_text = " ".join([page.extract_text() for page in pdf.pages])
	return pdf_text