Spaces:

ShivanshMathur007
/

MoP

Sleeping

ShivanshMathur007 commited on Apr 1

Commit

0428475

•

1 Parent(s): 179fb88

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -23,14 +23,14 @@ def MOP(path):
   docs=[]
   loader = PyPDFDirectoryLoader(path)
   docs = loader.load()
-  text_splitter = RecursiveCharacterTextSplitter(chunk_size=2000 , chunk_overlap=500)
   text_chunks = text_splitter.split_documents(docs)
   embeddings = HuggingFaceEmbeddings(model_name="thenlper/gte-base")
   vector_store = FAISS.from_documents(text_chunks, embedding=embeddings)
   filename_to_keep = 'Dummy_standard MoP_template_new.pdf'
   prompt_file=delete_files_except(filename_to_keep,path)
   repo_id="mistralai/Mixtral-8x7B-Instruct-v0.1"
-  llm = HuggingFaceHub(repo_id=repo_id, model_kwargs={"temperature": 0.1, "max_new_tokens": 4096})
   retriever = vector_store.as_retriever(search_type="similarity",search_kwargs={"k": len(text_chunks)})
   qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=retriever,verbose=True)
   message= f"""<s> [INST] You have two documents:

   docs=[]
   loader = PyPDFDirectoryLoader(path)
   docs = loader.load()
+  text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000 , chunk_overlap=500)
   text_chunks = text_splitter.split_documents(docs)
   embeddings = HuggingFaceEmbeddings(model_name="thenlper/gte-base")
   vector_store = FAISS.from_documents(text_chunks, embedding=embeddings)
   filename_to_keep = 'Dummy_standard MoP_template_new.pdf'
   prompt_file=delete_files_except(filename_to_keep,path)
   repo_id="mistralai/Mixtral-8x7B-Instruct-v0.1"
+  llm = HuggingFaceHub(repo_id=repo_id, model_kwargs={"temperature": 0.1, "max_new_tokens": 2048})
   retriever = vector_store.as_retriever(search_type="similarity",search_kwargs={"k": len(text_chunks)})
   qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=retriever,verbose=True)
   message= f"""<s> [INST] You have two documents: