api-rag-index-chat

Runtime error

App Files Files Community

Chris4K commited on Mar 18, 2024

Commit

7a83584

verified ·

1 Parent(s): cb39965

Update app.py

Browse files

Files changed (1) hide show

app.py +28 -6

app.py CHANGED Viewed

@@ -115,7 +115,7 @@ async def startup():
     domain_url = 'https://www.bofrost.de/faq/'
     urls = get_all_links_from_domain(domain_url)
-    retriever_chain = index_urls_in_rag(urls)
 # Define API endpoint to receive queries and provide responses
 @app.post("/generate/")
@@ -123,10 +123,24 @@ def generate(user_input):
     return get_response(user_input, [])
 def get_response(message, history=[]):
-    dialog = history_to_dialog_format(history)
-    dialog.append({"role": "user", "content": message})
       # Define the prompt as a ChatPromptValue object
     #user_input = ChatPromptValue(user_input)
@@ -135,11 +149,19 @@ def get_response(message, history=[]):
     #input_ids = user_input.tensor
-    #vs = get_vectorstore_from_url(user_url, all_domain)
-    vs = get_vectorstore_from_url("https://huggingface.co/Chris4K")
     history =[]
-    retriever_chain = get_context_retriever_chain(vs)
     conversation_rag_chain = get_conversational_rag_chain(retriever_chain)
     response = conversation_rag_chain.invoke({

     domain_url = 'https://www.bofrost.de/faq/'
     urls = get_all_links_from_domain(domain_url)
+    print(urls)
 # Define API endpoint to receive queries and provide responses
 @app.post("/generate/")
     return get_response(user_input, [])
+def get_conversational_rag_chain(retriever_chain):
+    llm = load_model(model_name)
+    prompt = ChatPromptTemplate.from_messages([
+      ("system", "Du bist eine freundlicher Mitarbeiterin Namens Susie und arbeitest in einenm Call Center. Du beantwortest basierend auf dem Context. Benutze nur den Inhalt des Context. Füge wenn möglich die Quelle hinzu. Antworte mit: Ich bin mir nicht sicher. Wenn die Antwort nicht aus dem Context hervorgeht. Antworte auf Deutsch, bitte? CONTEXT:\n\n{context}"),
+      MessagesPlaceholder(variable_name="chat_history"),
+      ("user", "{input}"),
+    ])
+    stuff_documents_chain = create_stuff_documents_chain(llm,prompt)
+    return create_retrieval_chain(retriever_chain, stuff_documents_chain)
 def get_response(message, history=[]):
+   # dialog = history_to_dialog_format(history)
+   # dialog.append({"role": "user", "content": message})
       # Define the prompt as a ChatPromptValue object
     #user_input = ChatPromptValue(user_input)
     #input_ids = user_input.tensor
+    model = "BAAI/bge-base-en-v1.5"
+    encode_kwargs = {
+        "normalize_embeddings": True
+    }  # set True to compute cosine similarity
+    embeddings = HuggingFaceBgeEmbeddings(
+        model_name=model, encode_kwargs=encode_kwargs, model_kwargs={"device": "cpu"}
+    )
+    # load from disk
+    vector_store = Chroma(persist_directory="/home/user/.cache/chroma_db", embedding_function=embeddings)
     history =[]
+    retriever_chain = get_context_retriever_chain(vector_store)
     conversation_rag_chain = get_conversational_rag_chain(retriever_chain)
     response = conversation_rag_chain.invoke({