Spaces:

emarron
/

elderscrolls_lore_bot

Runtime error

emar commited on Jun 25

Commit

86518f0

•

1 Parent(s): 981a527

revert to best working version

Files changed (1) hide show

app.py CHANGED Viewed

@@ -21,39 +21,44 @@ Settings.embed_model = HuggingFaceEmbedding(model_name="BAAI/bge-base-en-v1.5",
 Settings.llm = HuggingFaceLLM(
     model_name="meta-llama/Meta-Llama-3-8B-Instruct",
     tokenizer_name="meta-llama/Meta-Llama-3-8B-Instruct",
-    context_window=4096,
-    max_new_tokens=512,
-    generate_kwargs={"temperature": 0.3, "top_k": 50, "top_p": 0.85},
     device_map="auto",
 )
 storage_context = StorageContext.from_defaults(persist_dir=PERSIST_DIR)
 index = load_index_from_storage(storage_context)
-prompt_helper = PromptHelper(
-    context_window=4096,
-    num_output=512,
-    chunk_overlap_ratio=0.1,
-    chunk_size_limit=None
-)
-retriever = VectorIndexRetriever(
-    index=index,
-    similarity_top_k=5,
-)
-query_engine = RetrieverQueryEngine.from_args(
-    retriever,
-    node_postprocessors=[SimilarityPostprocessor(similarity_cutoff=0.7)],
-    prompt_helper=prompt_helper
 )
-def chatbot_response(message, history):
-    # Add a custom prompt template
-    prompt = f"Based on the Elder Scrolls lore, please answer the following question:\n\n{message}\n\nAnswer:"
-    response = query_engine.query(prompt)
-    return str(response)
-query_engine = index.as_query_engine()
 @spaces.GPU

 Settings.llm = HuggingFaceLLM(
     model_name="meta-llama/Meta-Llama-3-8B-Instruct",
     tokenizer_name="meta-llama/Meta-Llama-3-8B-Instruct",
+    context_window=2048,
+    max_new_tokens=256,
+    generate_kwargs={"temperature": 0.7, "top_k": 50, "top_p": 0.95},
     device_map="auto",
 )
 storage_context = StorageContext.from_defaults(persist_dir=PERSIST_DIR)
 index = load_index_from_storage(storage_context)
+# prompt_helper = PromptHelper(
+#     context_window=4096,
+#     num_output=512,
+#     chunk_overlap_ratio=0.1,
+#     chunk_size_limit=None
+# )
+# retriever = VectorIndexRetriever(
+#     index=index,
+#     similarity_top_k=5,
+# )
+# query_engine = RetrieverQueryEngine.from_args(
+#     retriever,
+#     node_postprocessors=[SimilarityPostprocessor(similarity_cutoff=0.7)],
+#     prompt_helper=prompt_helper
+# )
+rerank = SentenceTransformerRerank(
+    model="BAAI/bge-reranker-large", top_n=5  # Note here
 )
+query_engine = index.as_query_engine(streaming=True, similarity_top_k=1, node_postprocessors=[rerank])
+# def chatbot_response(message, history):
+#     # Add a custom prompt template
+#     prompt = f"Based on the Elder Scrolls lore, please answer the following question:\n\n{message}\n\nAnswer:"
+#     response = query_engine.query(prompt)
+#     return str(response)
 @spaces.GPU