Spaces:
Runtime error
Runtime error
Update app.py
Browse files
app.py
CHANGED
@@ -25,6 +25,26 @@ torch_device = "cuda" if torch.cuda.is_available() else "cpu"
|
|
25 |
print("Running on device:", torch_device)
|
26 |
print("CPU threads:", torch.get_num_threads())
|
27 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
28 |
|
29 |
# faiss_db λ‘ λ‘컬μ λ‘λνκΈ°
|
30 |
docsearch = FAISS.load_local("", embeddings)
|
@@ -119,7 +139,6 @@ def gen(x, id, customer_data):
|
|
119 |
else:
|
120 |
customer_data_newline = customer_data_list[index].replace(",","\n")
|
121 |
prompt_template = f"""λΉμ μ 보ν μλ΄μμ
λλ€. μλμ μ§λ¬Έκ³Ό κ΄λ ¨λ μ½κ΄ μ 보, μλ΅ μ§μΉ¨κ³Ό κ³ κ°μ 보ν κ°μ
μ 보, κ³ κ°κ³Όμ μλ΄κΈ°λ‘μ΄ μ£Όμ΄μ§λλ€. μμ²μ μ μ ν μλ£νλ μλ΅μ μμ±νμΈμ.
|
122 |
-
|
123 |
[보νλͺ©λ‘]
|
124 |
λΌμ΄ννλλμ 기보νβ
‘
|
125 |
λΌμ΄ννλλμ’
μ 보ν
|
@@ -138,9 +157,7 @@ def gen(x, id, customer_data):
|
|
138 |
λΌμ΄ννλλμ°κΈμ μΆλ³΄νβ
‘
|
139 |
1λ
λΆν°μ μΆλ³΄ν
|
140 |
λΌμ΄ννλλμ°κΈλ³΄νβ
‘
|
141 |
-
|
142 |
{context}
|
143 |
-
|
144 |
### λͺ
λ Ήμ΄:
|
145 |
λ€μ μ§μΉ¨μ μ°Έκ³ νμ¬ μλ΄μμΌλ‘μ κ³ κ°μκ² νμν μλ΅μ μ 곡νμΈμ.
|
146 |
[μ§μΉ¨]
|
@@ -149,15 +166,12 @@ def gen(x, id, customer_data):
|
|
149 |
3.κ³ κ°μ΄ κ°μ
νμ§ μμ 보νμ 보μμ κ΄ν μ§λ¬Έμ κ΄λ ¨ 보νμ μκ°νλ©° 보μμ΄ λΆκ°λ₯νλ€λ μ μ μλ΄νμΈμ.
|
150 |
4.κ³ κ°μ΄ κ°μ
νμ§ μμ 보νμ κ°μ
μ΄ νμνλ€κ³ 보νλͺ
μ νμ€νκ² μΈκΈνμΈμ.
|
151 |
λ€μ μ
λ ₯μ μ£Όμ΄μ§λ κ³ κ°μ 보ν κ°μ
μ 보μ μλ΄ κΈ°λ‘μ λ³΄κ³ κ³ κ°μκ² λμλλ μ 보λ₯Ό μ 곡νμΈμ. μ°¨κ·Όμ°¨κ·Ό μκ°νμ¬ λ΅λ³νμΈμ. λΉμ μ μ ν μ μμ΅λλ€.
|
152 |
-
|
153 |
### μ
λ ₯:
|
154 |
[κ³ κ°μ κ°μ
μ 보]
|
155 |
{customer_data_newline}
|
156 |
-
|
157 |
[μλ΄ κΈ°λ‘]
|
158 |
{history[index]}
|
159 |
κ³ κ°:{question}
|
160 |
-
|
161 |
### μλ΅:
|
162 |
"""
|
163 |
|
|
|
25 |
print("Running on device:", torch_device)
|
26 |
print("CPU threads:", torch.get_num_threads())
|
27 |
|
28 |
+
loader = PyPDFLoader("total.pdf")
|
29 |
+
pages = loader.load()
|
30 |
+
|
31 |
+
# λ°μ΄ν°λ₯Ό λΆλ¬μμ ν
μ€νΈλ₯Ό μΌμ ν μλ‘ λλκ³ κ΅¬λΆμλ‘ μ°κ²°νλ μμ
|
32 |
+
text_splitter = RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=0)
|
33 |
+
texts = text_splitter.split_documents(pages)
|
34 |
+
|
35 |
+
print(f"λ¬Έμμ {len(texts)}κ°μ λ¬Έμλ₯Ό κ°μ§κ³ μμ΅λλ€.")
|
36 |
+
|
37 |
+
# μλ² λ© λͺ¨λΈ λ‘λ
|
38 |
+
embeddings = HuggingFaceEmbeddings(model_name="intfloat/multilingual-e5-large")
|
39 |
+
|
40 |
+
# λ¬Έμμ μλ ν
μ€νΈλ₯Ό μλ² λ©νκ³ FAISS μ μΈλ±μ€λ₯Ό ꡬμΆν¨
|
41 |
+
index = FAISS.from_documents(
|
42 |
+
documents=texts,
|
43 |
+
embedding=embeddings,
|
44 |
+
)
|
45 |
+
|
46 |
+
# faiss_db λ‘ λ‘컬μ μ μ₯νκΈ°
|
47 |
+
index.save_local("")
|
48 |
|
49 |
# faiss_db λ‘ λ‘컬μ λ‘λνκΈ°
|
50 |
docsearch = FAISS.load_local("", embeddings)
|
|
|
139 |
else:
|
140 |
customer_data_newline = customer_data_list[index].replace(",","\n")
|
141 |
prompt_template = f"""λΉμ μ 보ν μλ΄μμ
λλ€. μλμ μ§λ¬Έκ³Ό κ΄λ ¨λ μ½κ΄ μ 보, μλ΅ μ§μΉ¨κ³Ό κ³ κ°μ 보ν κ°μ
μ 보, κ³ κ°κ³Όμ μλ΄κΈ°λ‘μ΄ μ£Όμ΄μ§λλ€. μμ²μ μ μ ν μλ£νλ μλ΅μ μμ±νμΈμ.
|
|
|
142 |
[보νλͺ©λ‘]
|
143 |
λΌμ΄ννλλμ 기보νβ
‘
|
144 |
λΌμ΄ννλλμ’
μ 보ν
|
|
|
157 |
λΌμ΄ννλλμ°κΈμ μΆλ³΄νβ
‘
|
158 |
1λ
λΆν°μ μΆλ³΄ν
|
159 |
λΌμ΄ννλλμ°κΈλ³΄νβ
‘
|
|
|
160 |
{context}
|
|
|
161 |
### λͺ
λ Ήμ΄:
|
162 |
λ€μ μ§μΉ¨μ μ°Έκ³ νμ¬ μλ΄μμΌλ‘μ κ³ κ°μκ² νμν μλ΅μ μ 곡νμΈμ.
|
163 |
[μ§μΉ¨]
|
|
|
166 |
3.κ³ κ°μ΄ κ°μ
νμ§ μμ 보νμ 보μμ κ΄ν μ§λ¬Έμ κ΄λ ¨ 보νμ μκ°νλ©° 보μμ΄ λΆκ°λ₯νλ€λ μ μ μλ΄νμΈμ.
|
167 |
4.κ³ κ°μ΄ κ°μ
νμ§ μμ 보νμ κ°μ
μ΄ νμνλ€κ³ 보νλͺ
μ νμ€νκ² μΈκΈνμΈμ.
|
168 |
λ€μ μ
λ ₯μ μ£Όμ΄μ§λ κ³ κ°μ 보ν κ°μ
μ 보μ μλ΄ κΈ°λ‘μ λ³΄κ³ κ³ κ°μκ² λμλλ μ 보λ₯Ό μ 곡νμΈμ. μ°¨κ·Όμ°¨κ·Ό μκ°νμ¬ λ΅λ³νμΈμ. λΉμ μ μ ν μ μμ΅λλ€.
|
|
|
169 |
### μ
λ ₯:
|
170 |
[κ³ κ°μ κ°μ
μ 보]
|
171 |
{customer_data_newline}
|
|
|
172 |
[μλ΄ κΈ°λ‘]
|
173 |
{history[index]}
|
174 |
κ³ κ°:{question}
|
|
|
175 |
### μλ΅:
|
176 |
"""
|
177 |
|