Spaces:

ldhldh
/

langchain_gradio

Runtime error

App Files Files Community

ldhldh commited on Oct 14, 2023

Commit

42efc58

•

1 Parent(s): 59b1a71

Update app.py

Browse files

Files changed (1) hide show

app.py +35 -27

app.py CHANGED Viewed

@@ -7,50 +7,55 @@ import re
 import asyncio
 import requests
 import shutil
-from langchain.llms import LlamaCpp
 from langchain import PromptTemplate, LLMChain
 from langchain.retrievers.document_compressors import EmbeddingsFilter
 from langchain.retrievers import ContextualCompressionRetriever
 from langchain.chains import RetrievalQA
 from langchain.vectorstores import FAISS
 from langchain.embeddings import HuggingFaceEmbeddings
-from langchain.prompts import PromptTemplate
 from langchain.text_splitter import CharacterTextSplitter
 from langchain.document_loaders import PyPDFLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
-from langchain.vectorstores import FAISS
-from langchain.embeddings import HuggingFaceEmbeddings
 torch_device = "cuda" if torch.cuda.is_available() else "cpu"
 print("Running on device:", torch_device)
 print("CPU threads:", torch.get_num_threads())
-llm = LlamaCpp(
-    model_path='Llama-2-ko-7B-chat-gguf-q4_0.bin',
-    temperature=0.5,
-    top_p=0.9,
-    max_tokens=80,
-    verbose=True,
-    n_ctx=2048,
-    n_gpu_layers=-1,
-    f16_kv=True
-)
 # 임베딩 모델 로드
 embeddings = HuggingFaceEmbeddings(model_name="intfloat/multilingual-e5-large")
 # faiss_db 로 로컬에 로드하기
 docsearch = FAISS.load_local("", embeddings)
 embeddings_filter = EmbeddingsFilter(
-    embeddings=embeddings,
     similarity_threshold=0.7,
     k = 2,
 )
 # 압축 검색기 생성
 compression_retriever = ContextualCompressionRetriever(
 	# embeddings_filter 설정
-    base_compressor=embeddings_filter,
     # retriever 를 호출하여 검색쿼리와 유사한 텍스트를 찾음
     base_retriever=docsearch.as_retriever()
 )
@@ -58,7 +63,7 @@ compression_retriever = ContextualCompressionRetriever(
 id_list = []
 history = []
-customer_data = ""
 context = "{context}"
 question = "{question}"
@@ -76,29 +81,31 @@ def gen(x, id, customer_data):
     if matched == 0:
         index = len(id_list)
         id_list.append(id)
         history.append('상담원:무엇을 도와드릴까요?\n')
         bot_str = f"현재 고객님께서 가입된 보험은 {customer_data}입니다.\n\n궁금하신 것이 있으신가요?"
         return bot_str
     else:
         if x == "초기화":
             history[index] = '상담원:무엇을 도와드릴까요?\n'
-            bot_str = f"대화기록이 초기화되었습니다.\n\n현재 고객님께서 가입된 보험은 {customer_data}입니다.\n\n궁금하신 것이 있으신가요?"
             return bot_str
         elif x == "가입정보":
-            bot_str = f"현재 고객님께서 가입된 보험은 {customer_data}입니다.\n\n궁금하신 것이 있으신가요?"
             return bot_str
         else:
             context = "{context}"
             question = "{question}"
-            customer_data_newline = customer_data.replace(",","\n")
             prompt_template = f"""당신은 보험 상담원입니다. 아래에 질문과 관련된 약관 정보, 응답 지침과 고객의 보험 가입 정보, 고객과의 상담기록이 주어집니다. 요청을 적절히 완료하는 응답을 작성하세요.
 {context}
 ### 명령어:
-다음 지침을 참고하여 상담원으로서 고객에게 필요한 응답을 제공하세요.
 [지침]
 1.고객의 가입 정보를 꼭 확인하여 고객이 가입한 보험에 대한 내용만 제공하세요.
 2.고객이 가입한 보험이라면 고객의 질문에 대해 적절히 답변하세요.
@@ -119,19 +126,20 @@ def gen(x, id, customer_data):
             # RetrievalQA 클래스의 from_chain_type이라는 클래스 메서드를 호출하여 질의응�� 객체를 생성
             qa = RetrievalQA.from_chain_type(
-              llm=llm,
               chain_type="stuff",
-              retriever=compression_retriever,
               return_source_documents=False,
-              verbose=True,
               chain_type_kwargs={"prompt": PromptTemplate(
                   input_variables=["context","question"],
                   template=prompt_template,
               )},
             )
-            query=f"나는 현재 {customer_data}만 가입한 상황이야. {x}"
             response = qa({"query":query})
-            output_str = response['result'].split("###")[0].split("\u200b")[0]
             history[index] += f"고객:{x}\n상담원:{output_str}\n"
             return output_str
 def reset_textbox():

 import asyncio
 import requests
 import shutil
 from langchain import PromptTemplate, LLMChain
 from langchain.retrievers.document_compressors import EmbeddingsFilter
 from langchain.retrievers import ContextualCompressionRetriever
 from langchain.chains import RetrievalQA
 from langchain.vectorstores import FAISS
 from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.text_splitter import CharacterTextSplitter
 from langchain.document_loaders import PyPDFLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
+import os
+from langchain.llms import OpenAI
+llm = OpenAI(model_name='text-davinci-003')
 torch_device = "cuda" if torch.cuda.is_available() else "cpu"
 print("Running on device:", torch_device)
 print("CPU threads:", torch.get_num_threads())
+loader = PyPDFLoader("total.pdf")
+pages = loader.load()
+# 데이터를 불러와서 텍스트를 일정한 수로 나누고 구분자로 연결하는 작업
+text_splitter = RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=0)
+texts = text_splitter.split_documents(pages)
+print(f"문서에 {len(texts)}개의 문서를 가지고 있습니다.")
 # 임베딩 모델 로드
 embeddings = HuggingFaceEmbeddings(model_name="intfloat/multilingual-e5-large")
+# 문서에 있는 텍스트를 임베딩하고 FAISS 에 인덱스를 구축함
+index = FAISS.from_documents(
+	documents=texts,
+	embedding=embeddings,
+	)
+# faiss_db 로 로컬에 저장하기
+index.save_local("")
 # faiss_db 로 로컬에 로드하기
 docsearch = FAISS.load_local("", embeddings)
 embeddings_filter = EmbeddingsFilter(
+    embeddings=embeddings,
     similarity_threshold=0.7,
     k = 2,
 )
 # 압축 검색기 생성
 compression_retriever = ContextualCompressionRetriever(
 	# embeddings_filter 설정
+    base_compressor=embeddings_filter,
     # retriever 를 호출하여 검색쿼리와 유사한 텍스트를 찾음
     base_retriever=docsearch.as_retriever()
 )
 id_list = []
 history = []
+customer_data_list = []
 context = "{context}"
 question = "{question}"
     if matched == 0:
         index = len(id_list)
         id_list.append(id)
+        customer_data_list.append(customer_data)
         history.append('상담원:무엇을 도와드릴까요?\n')
         bot_str = f"현재 고객님께서 가입된 보험은 {customer_data}입니다.\n\n궁금하신 것이 있으신가요?"
         return bot_str
     else:
         if x == "초기화":
+            customer_data_list[index] = customer_data
             history[index] = '상담원:무엇을 도와드릴까요?\n'
+            bot_str = f"대화기록이 모두 초기화되었습니다.\n\n현재 고객님께서 가입된 보험은 {customer_data}입니다.\n\n궁금하신 것이 있으신가요?"
             return bot_str
         elif x == "가입정보":
+            bot_str = f"현재 고객님께서 가입된 보험은 {customer_data_list[index]}입니다.\n\n궁금하신 것이 있으신가요?"
             return bot_str
         else:
             context = "{context}"
             question = "{question}"
+            customer_data_newline = customer_data_list[index].replace(",","\n")
             prompt_template = f"""당신은 보험 상담원입니다. 아래에 질문과 관련된 약관 정보, 응답 지침과 고객의 보험 가입 정보, 고객과의 상담기록이 주어집니다. 요청을 적절히 완료하는 응답을 작성하세요.
 {context}
 ### 명령어:
+다음 지침을 참고하여 상담원으로서 고객에게 필요한 응답을 간결하게 제공하세요.
 [지침]
 1.고객의 가입 정보를 꼭 확인하여 고객이 가입한 보험에 대한 내용만 제공하세요.
 2.고객이 가입한 보험이라면 고객의 질문에 대해 적절히 답변하세요.
             # RetrievalQA 클래스의 from_chain_type이라는 클래스 메서드를 호출하여 질의응�� 객체를 생성
             qa = RetrievalQA.from_chain_type(
+              llm=llm,
               chain_type="stuff",
+              retriever=compression_retriever,
               return_source_documents=False,
+              verbose=True,
               chain_type_kwargs={"prompt": PromptTemplate(
                   input_variables=["context","question"],
                   template=prompt_template,
               )},
             )
+            query=f"나는 현재 {customer_data_list[index]}만 가입한 상황이야. {x}"
             response = qa({"query":query})
+            output_str = response['result']
+            print(prompt_template + output_str)
             history[index] += f"고객:{x}\n상담원:{output_str}\n"
             return output_str
 def reset_textbox():