Spaces:

vinhnx90
/

inkchatgpt

Sleeping

vinhnx90 commited on Apr 14

Commit

d1e97a4

•

1 Parent(s): d036875

Update app

Files changed (2) hide show

app.py CHANGED Viewed

@@ -47,23 +47,19 @@ with st.sidebar:
         with col2:
             st.header(":books: InkChatGPT")
-    # chat_tab,
-    documents_tab, settings_tab = st.tabs(
-        [
-            # "Chat",
-            "Documents",
-            "Settings",
-        ]
-    )
     with settings_tab:
         openai_api_key = st.text_input("OpenAI API Key", type="password")
         if len(msgs.messages) == 0 or st.button("Clear message history"):
             msgs.clear()
-            msgs.add_ai_message("""
-            Hi, your uploaded document(s) had been analyzed.
-            Feel free to ask me any questions. For example: you can start by asking me `'What is this book about?` or `Tell me about the content of this book!`'
-            """)
     with documents_tab:
         uploaded_files = st.file_uploader(
@@ -74,10 +70,12 @@ with st.sidebar:
         )
 if not openai_api_key:
-    st.info("🔑 Please Add your **OpenAI API key** on the `Settings` to continue.")
 if uploaded_files:
-    result_retriever = configure_retriever(uploaded_files)
     if result_retriever is not None:
         memory = ConversationBufferMemory(

         with col2:
             st.header(":books: InkChatGPT")
+    documents_tab, settings_tab = st.tabs(["Documents", "Settings"])
     with settings_tab:
         openai_api_key = st.text_input("OpenAI API Key", type="password")
+        cohere_api_key = ""
+        if st.toggle(
+            label="Use Cohere's Rerank", help="https://txt.cohere.com/rerank/"
+        ):
+            cohere_api_key = st.text_input("Cohere API Key", type="password")
         if len(msgs.messages) == 0 or st.button("Clear message history"):
             msgs.clear()
+            msgs.add_ai_message("Hello, how can I help you?")
     with documents_tab:
         uploaded_files = st.file_uploader(
         )
 if not openai_api_key:
+    st.info("🔑 Please open the `Settings` tab from side bar menu to get started.")
 if uploaded_files:
+    result_retriever = configure_retriever(
+        uploaded_files, cohere_api_key=cohere_api_key
+    )
     if result_retriever is not None:
         memory = ConversationBufferMemory(

document_retriever.py CHANGED Viewed

@@ -3,7 +3,7 @@ import tempfile
 import streamlit as st
 from langchain.retrievers import ContextualCompressionRetriever
 from langchain_cohere import CohereRerank
 from langchain_community.document_loaders import Docx2txtLoader, PyPDFLoader, TextLoader
 from langchain_community.embeddings import HuggingFaceEmbeddings
@@ -11,10 +11,11 @@ from langchain_community.vectorstores import DocArrayInMemorySearch
 from langchain_text_splitters import RecursiveCharacterTextSplitter
 EMBEDDING_MODEL = "sentence-transformers/all-MiniLM-L6-v2"
 @st.cache_resource(ttl="1h")
-def configure_retriever(files, use_compression=False):
     # Read documents
     docs = []
     temp_dir = tempfile.TemporaryDirectory()
@@ -54,8 +55,13 @@ def configure_retriever(files, use_compression=False):
     if not use_compression:
         return retriever
-    compressor = CohereRerank()
     return ContextualCompressionRetriever(
-        base_compressor=compressor,
-        base_retriever=retriever,
     )

 import streamlit as st
 from langchain.retrievers import ContextualCompressionRetriever
+from langchain.retrievers.document_compressors import EmbeddingsFilter
 from langchain_cohere import CohereRerank
 from langchain_community.document_loaders import Docx2txtLoader, PyPDFLoader, TextLoader
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain_text_splitters import RecursiveCharacterTextSplitter
 EMBEDDING_MODEL = "sentence-transformers/all-MiniLM-L6-v2"
+RERANK_MODEL = "rerank-english-v2.0"
 @st.cache_resource(ttl="1h")
+def configure_retriever(files, cohere_api_key, use_compression=False):
     # Read documents
     docs = []
     temp_dir = tempfile.TemporaryDirectory()
     if not use_compression:
         return retriever
+    if cohere_api_key.len() == 0:
+        compressor = EmbeddingsFilter(embeddings=embeddings, similarity_threshold=0.76)
+    else:
+        compressor = CohereRerank(
+            top_n=3, model=RERANK_MODEL, cohere_api_key=cohere_api_key
+        )
     return ContextualCompressionRetriever(
+        base_compressor=compressor, base_retriever=retriever
     )