PDF2SLIDE2

Runtime error

newoz commited on Sep 18, 2023

Commit

b59663b

1 Parent(s): ce08e63

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
 import streamlit as st
-import PyPDF2
-import io
 # Titre de l'application
 st.title("Afficher le texte d'un fichier PDF")
@@ -10,21 +9,18 @@ uploaded_file = st.file_uploader("Sélectionnez un fichier PDF", type=["pdf"])
 if uploaded_file is not None:
     # Lecture du contenu du fichier PDF
-    pdf_reader = PyPDF2.PdfFileReader(uploaded_file)
-    # Nombre total de pages dans le PDF
-    num_pages = pdf_reader.numPages
     # Créez une liste pour stocker le texte de chaque page
     pdf_text = []
     # Parcourez toutes les pages et extrayez le texte
-    for page_number in range(num_pages):
-        page = pdf_reader.getPage(page_number)
-        page_text = page.extractText()
         pdf_text.append(page_text)
     # Affichez le texte complet du PDF
     st.subheader("Texte complet du PDF:")
-    full_text = " ".join(pdf_text)
-    st.write(full_text)

 import streamlit as st
+import fitz  # Utilisation de PyMuPDF (PdfReader) pour extraire le texte depuis le PDF
 # Titre de l'application
 st.title("Afficher le texte d'un fichier PDF")
 if uploaded_file is not None:
     # Lecture du contenu du fichier PDF
+    pdf_document = fitz.open(stream=uploaded_file.read(), filetype="pdf")
     # Créez une liste pour stocker le texte de chaque page
     pdf_text = []
     # Parcourez toutes les pages et extrayez le texte
+    for page_number in range(pdf_document.page_count):
+        page = pdf_document.load_page(page_number)
+        page_text = page.get_text()
         pdf_text.append(page_text)
     # Affichez le texte complet du PDF
     st.subheader("Texte complet du PDF:")
+    full_text = "\n".join(pdf_text)
+    st.text(full_text)