Update utils.py
Browse files
utils.py
CHANGED
@@ -92,7 +92,7 @@ llm_template2 = "Fasse folgenden Text als Überschrift mit maximal 3 Worten zusa
|
|
92 |
|
93 |
rag_template = """Nutze die folgenden Kontext (Beginnend mit dem Wort 'Kontext:') aus Teilen aus den angehängten Dokumenten, um die Frage (Beginnend mit dem Wort 'Frage: ')
|
94 |
"am Ende zu beantworten. Wenn du die Frage aus dem folgenden Kontext nicht beantworten kannst, dann versuche eine Beantwortung aus deinen eigenen trainierten Daten zu finden.
|
95 |
-
" Mache das kenntlich, ob du dich auf den hier angehängten Kontext beziehst oder ob du anhand deiner Daten antwortest.
|
96 |
+ template + "Kontext: {context} Frage: {question} """
|
97 |
|
98 |
#################################################
|
@@ -113,6 +113,7 @@ PATH_WORK = "."
|
|
113 |
CHROMA_DIR = "/chroma/kkg"
|
114 |
CHROMA_PDF = './chroma/kkg/pdf'
|
115 |
CHROMA_WORD = './chroma/kkg/word'
|
|
|
116 |
YOUTUBE_DIR = "/youtube"
|
117 |
HISTORY_PFAD = "/data/history"
|
118 |
|
@@ -203,15 +204,17 @@ def document_loading_splitting():
|
|
203 |
# kreiere einen DirectoryLoader für jeden file type
|
204 |
pdf_loader = create_directory_loader('.pdf', CHROMA_PDF)
|
205 |
word_loader = create_directory_loader('.word', CHROMA_WORD)
|
206 |
-
|
207 |
|
208 |
# Load the files
|
209 |
pdf_documents = pdf_loader.load()
|
210 |
word_documents = word_loader.load()
|
|
|
211 |
|
212 |
#alle zusammen in docs...
|
213 |
docs.extend(pdf_documents)
|
214 |
docs.extend(word_documents)
|
|
|
215 |
|
216 |
#andere loader...
|
217 |
# Load PDF
|
@@ -225,7 +228,7 @@ def document_loading_splitting():
|
|
225 |
docs.extend(loader.load())
|
226 |
################################
|
227 |
# Document splitting
|
228 |
-
text_splitter = RecursiveCharacterTextSplitter(chunk_overlap =
|
229 |
splits = text_splitter.split_documents(docs)
|
230 |
|
231 |
return splits
|
|
|
92 |
|
93 |
rag_template = """Nutze die folgenden Kontext (Beginnend mit dem Wort 'Kontext:') aus Teilen aus den angehängten Dokumenten, um die Frage (Beginnend mit dem Wort 'Frage: ')
|
94 |
"am Ende zu beantworten. Wenn du die Frage aus dem folgenden Kontext nicht beantworten kannst, dann versuche eine Beantwortung aus deinen eigenen trainierten Daten zu finden.
|
95 |
+
" Mache das kenntlich, ob du dich auf den hier angehängten Kontext beziehst oder ob du anhand deiner Daten antwortest."""
|
96 |
+ template + "Kontext: {context} Frage: {question} """
|
97 |
|
98 |
#################################################
|
|
|
113 |
CHROMA_DIR = "/chroma/kkg"
|
114 |
CHROMA_PDF = './chroma/kkg/pdf'
|
115 |
CHROMA_WORD = './chroma/kkg/word'
|
116 |
+
CHROMA_EXCEL = './chroma/kkg/excel'
|
117 |
YOUTUBE_DIR = "/youtube"
|
118 |
HISTORY_PFAD = "/data/history"
|
119 |
|
|
|
204 |
# kreiere einen DirectoryLoader für jeden file type
|
205 |
pdf_loader = create_directory_loader('.pdf', CHROMA_PDF)
|
206 |
word_loader = create_directory_loader('.word', CHROMA_WORD)
|
207 |
+
excel_loader = create_directory_loader('.excel', CHROMA_EXCEL)
|
208 |
|
209 |
# Load the files
|
210 |
pdf_documents = pdf_loader.load()
|
211 |
word_documents = word_loader.load()
|
212 |
+
excel_documents = excel_loader.load()
|
213 |
|
214 |
#alle zusammen in docs...
|
215 |
docs.extend(pdf_documents)
|
216 |
docs.extend(word_documents)
|
217 |
+
docs.extend(excel_documents)
|
218 |
|
219 |
#andere loader...
|
220 |
# Load PDF
|
|
|
228 |
docs.extend(loader.load())
|
229 |
################################
|
230 |
# Document splitting
|
231 |
+
text_splitter = RecursiveCharacterTextSplitter(chunk_overlap = 250, chunk_size = 2000)
|
232 |
splits = text_splitter.split_documents(docs)
|
233 |
|
234 |
return splits
|