Spaces:

ProjektSeminarLSBIM
/

Streamlit_Docker

Paused

MaxGit32 commited on Dec 3, 2023

Commit

20c069f

•

1 Parent(s): c013680

Update pages/llm.py

Files changed (1) hide show

pages/llm.py CHANGED Viewed

@@ -7,6 +7,7 @@ import os
 from PyPDF2 import PdfReader
 from transformers import pipeline
 from transformers import AutoModel
 ###########
@@ -20,6 +21,7 @@ from transformers import AutoModel
 # PDF in String umwandeln
 def get_pdf_text(folder_path):
     text = ""
     # Durchsuche alle Dateien im angegebenen Verzeichnis
     for filename in os.listdir(folder_path):
@@ -32,7 +34,7 @@ def get_pdf_text(folder_path):
                 text += page.extract_text()
             #text += '\n'
-    return text
 #Chunks erstellen
 def get_text_chunks(text):
@@ -77,6 +79,8 @@ def get_llm_answer(user_question):
     #user_question = st.text_area("Stell mir eine Frage: ")
             #if os.path.exists("./Store"): #Nutzereingabe nur eingelesen, wenn vectorstore angelegt
     # Retriever sucht passende Textausschnitte in den PDFs (unformatiert)
     retriever=get_vectorstore().as_retriever()
     retrieved_docs=retriever.invoke(
     user_question
@@ -93,7 +97,7 @@ def get_llm_answer(user_question):
     # Frage beantworten mit Q&A Pipeline
     answer = qa_pipeline(question=user_question, context=context, max_length=200)
-    return answer["answer"]
 def main():
     st.set_page_config(

 from PyPDF2 import PdfReader
 from transformers import pipeline
 from transformers import AutoModel
+from googletrans import Translator
 ###########
 # PDF in String umwandeln
 def get_pdf_text(folder_path):
+    translator = Translator()
     text = ""
     # Durchsuche alle Dateien im angegebenen Verzeichnis
     for filename in os.listdir(folder_path):
                 text += page.extract_text()
             #text += '\n'
+    return translator.translate(text, dest ='en').text
 #Chunks erstellen
 def get_text_chunks(text):
     #user_question = st.text_area("Stell mir eine Frage: ")
             #if os.path.exists("./Store"): #Nutzereingabe nur eingelesen, wenn vectorstore angelegt
     # Retriever sucht passende Textausschnitte in den PDFs (unformatiert)
+    translator = Translator()
+    translator.translate(user_question, dest='en')
     retriever=get_vectorstore().as_retriever()
     retrieved_docs=retriever.invoke(
     user_question
     # Frage beantworten mit Q&A Pipeline
     answer = qa_pipeline(question=user_question, context=context, max_length=200)
+    return translator.translate(answer["answer"], dest='de')
 def main():
     st.set_page_config(