RAQA-with-LlamaIndex-and-a-fine-tuned-GPT-35

Runtime error

App Files Files Community

harpreetsahota commited on Aug 29, 2023

Commit

0a74a8e

•

1 Parent(s): fbaa379

Update app.py

Browse files

Files changed (1) hide show

app.py +47 -100

app.py CHANGED Viewed

@@ -1,121 +1,68 @@
-import chainlit as cl
-from langchain.embeddings.openai import OpenAIEmbeddings
-from langchain.document_loaders.csv_loader import CSVLoader
-from langchain.embeddings import CacheBackedEmbeddings
-from langchain.text_splitter import RecursiveCharacterTextSplitter
-from langchain.vectorstores import FAISS
-from langchain.chains import RetrievalQA
-from langchain.chat_models import ChatOpenAI
-from langchain.storage import LocalFileStore
-from langchain.prompts.chat import (
-    ChatPromptTemplate,
-    SystemMessagePromptTemplate,
-    HumanMessagePromptTemplate,
 )
 import chainlit as cl
-text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
-system_template = """
-Use the following pieces of context to answer the user's question.
-Please respond as if you were Miles Morales from the Spider-Man comics and movies. General speech patterns: Uses contractions often, like "I'm," "can't," and "don't."
-Might sprinkle in some Spanish, given his Puerto Rican heritage. References to modern pop culture, music, or tech. Miles is a brave young hero, grappling with his dual
-heritage and urban life. He has a passion for music, especially hip-hop, and is also into art, being a graffiti artist himself. He speaks with an urban and youthful tone,
-reflecting the voice of modern NYC youth. He might occasionally reference modern pop culture, his friends, or his school life.
-If you don't know the answer, just say you're unsure. Don't try to make up an answer.
-You can make inferences based on the context as long as it aligns with Miles' personality and experiences.
-Example of your interaction:
-User: "What did you think of the latest Spider-Man movie?"
-MilesBot: "Haha, watching Spider-Man on screen is always surreal for me. But it's cool to see different takes on the web-slinger's story. Always reminds me of the Spider-Verse!"
-Example of your response:
-```
-The answer is foo
-```
-Begin!
-----------------
-{context}"""
-messages = [
-    SystemMessagePromptTemplate.from_template(system_template),
-    HumanMessagePromptTemplate.from_template("{question}"),
-]
-prompt = ChatPromptTemplate(messages=messages)
-chain_type_kwargs = {"prompt": prompt}
-@cl.author_rename
-def rename(orig_author: str):
-    rename_dict = {"RetrievalQA": "Crawling the Spiderverse"}
-    return rename_dict.get(orig_author, orig_author)
 @cl.on_chat_start
-async def init():
-    msg = cl.Message(content=f"Building Index...")
-    await msg.send()
-    # build FAISS index from csv
-    loader = CSVLoader(file_path="./data/spiderverse.csv", source_column="Review_Url")
-    data = loader.load()
-    documents = text_splitter.transform_documents(data)
-    store = LocalFileStore("./cache/")
-    core_embeddings_model = OpenAIEmbeddings()
-    embedder = CacheBackedEmbeddings.from_bytes_store(
-        core_embeddings_model, store, namespace=core_embeddings_model.model
     )
-    # make async docsearch
-    docsearch = await cl.make_async(FAISS.from_documents)(documents, embedder)
-    chain = RetrievalQA.from_chain_type(
-        ChatOpenAI(model="gpt-4", temperature=0, streaming=True),
-        chain_type="stuff",
-        return_source_documents=True,
-        retriever=docsearch.as_retriever(),
-        chain_type_kwargs = {"prompt": prompt}
     )
-    msg.content = f"Index built!"
-    await msg.send()
-    cl.user_session.set("chain", chain)
 @cl.on_message
 async def main(message):
-    chain = cl.user_session.get("chain")
-    cb = cl.AsyncLangchainCallbackHandler(
-        stream_final_answer=False, answer_prefix_tokens=["FINAL", "ANSWER"]
-    )
-    cb.answer_reached = True
-    res = await chain.acall(message, callbacks=[cb], )
-    answer = res["result"]
-    source_elements = []
-    visited_sources = set()
-    # Get the documents from the user session
-    docs = res["source_documents"]
-    metadatas = [doc.metadata for doc in docs]
-    all_sources = [m["source"] for m in metadatas]
-    for source in all_sources:
-        if source in visited_sources:
-            continue
-        visited_sources.add(source)
-        # Create the text element referenced in the message
-        source_elements.append(
-            cl.Text(content="https://www.imdb.com" + source, name="Review URL")
-        )
-    if source_elements:
-        answer += f"\nSources: {', '.join([e.content.decode('utf-8') for e in source_elements])}"
-    else:
-        answer += "\nNo sources found"
-    await cl.Message(content=answer, elements=source_elements).send()

+import os
+import openai
+from llama_index.query_engine.retriever_query_engine import RetrieverQueryEngine
+from llama_index.callbacks.base import CallbackManager
+from llama_index import (
+    LLMPredictor,
+    ServiceContext,
+    StorageContext,
+    load_index_from_storage,
 )
+from llama_index.llms import OpenAI
 import chainlit as cl
+openai.api_key = os.environ.get("OPENAI_API_KEY")
+try:
+    # rebuild storage context
+    storage_context = StorageContext.from_defaults(persist_dir="./storage")
+    # load index
+    index = load_index_from_storage(storage_context)
+except:
+    from llama_index import GPTVectorStoreIndex, SimpleDirectoryReader
+    documents = SimpleDirectoryReader(input_files=["hitchhikers.pdf"]).load_data()
+    index = GPTVectorStoreIndex.from_documents(documents)
+    index.storage_context.persist()
 @cl.on_chat_start
+async def factory():
+    llm_predictor = LLMPredictor(
+        llm=OpenAI(
+            temperature=0,
+            model="ft:gpt-3.5-turbo-0613:personal::7ru6l1bi",
+            streaming=True,
+            context_window=2048,
+        ),
     )
+    service_context = ServiceContext.from_defaults(
+        llm_predictor=llm_predictor,
+        chunk_size=512,
+        callback_manager=CallbackManager([cl.LlamaIndexCallbackHandler()]),
     )
+    query_engine = index.as_query_engine(
+        service_context=service_context,
+        streaming=True,
+    )
+    cl.user_session.set("query_engine", query_engine)
 @cl.on_message
 async def main(message):
+    query_engine = cl.user_session.get("query_engine")  # type: RetrieverQueryEngine
+    response = await cl.make_async(query_engine.query)(message)
+    response_message = cl.Message(content="")
+    for token in response.response_gen:
+        await response_message.stream_token(token=token)
+    if response.response_txt:
+        response_message.content = response.response_txt
+    await response_message.send()