RAGOndevice

Running on Zero

App Files Files Community

cutechicken commited on 4 days ago

Commit

e468070

•

1 Parent(s): 0126cba

Update app.py

Browse files

Files changed (1) hide show

app.py +94 -61

app.py CHANGED Viewed

@@ -281,67 +281,6 @@ def init_msg():
     return "파일을 분석하고 있습니다..."
-@spaces.GPU
-def stream_chat(message: str, history: list, uploaded_file, temperature: float, max_new_tokens: int, top_p: float, top_k: int, penalty: float):
-    try:
-        print(f'message is - {message}')
-        print(f'history is - {history}')
-        # 파일 업로드 처리
-        file_context = ""
-        if uploaded_file:
-            content, file_type = read_uploaded_file(uploaded_file)
-            if content:
-                file_context = f"\n\n업로드된 파일 내용:\n```\n{content}\n```"
-        # 관련 컨텍스트 찾기
-        relevant_contexts = find_relevant_context(message)
-        wiki_context = "\n\n관련 위키피디아 정보:\n"
-        for ctx in relevant_contexts:
-            wiki_context += f"Q: {ctx['question']}\nA: {ctx['answer']}\n유사도: {ctx['similarity']:.3f}\n\n"
-        # 대화 히스토리 구성
-        conversation = []
-        for prompt, answer in history:
-            conversation.extend([
-                {"role": "user", "content": prompt},
-                {"role": "assistant", "content": answer}
-            ])
-        # 최종 프롬프트 구성
-        final_message = file_context + wiki_context + "\n현재 질문: " + message
-        conversation.append({"role": "user", "content": final_message})
-        input_ids = tokenizer.apply_chat_template(conversation, tokenize=False, add_generation_prompt=True)
-        inputs = tokenizer(input_ids, return_tensors="pt").to(0)
-        streamer = TextIteratorStreamer(tokenizer, timeout=10., skip_prompt=True, skip_special_tokens=True)
-        generate_kwargs = dict(
-            inputs,
-            streamer=streamer,
-            top_k=top_k,
-            top_p=top_p,
-            repetition_penalty=penalty,
-            max_new_tokens=max_new_tokens,
-            do_sample=True,
-            temperature=temperature,
-            eos_token_id=[255001],
-        )
-        thread = Thread(target=model.generate, kwargs=generate_kwargs)
-        thread.start()
-        buffer = ""
-        for new_text in streamer:
-            buffer += new_text
-            yield "", history + [[message, buffer]]
-    except Exception as e:
-        error_message = f"오류가 발생했습니다: {str(e)}"
-        yield "", history + [[message, error_message]]
 CSS = """
 /* 3D 스타일 CSS */
 :root {
@@ -518,6 +457,80 @@ body {
 }
 """
 def create_demo():
     with gr.Blocks(css=CSS) as demo:
         with gr.Column():
@@ -554,6 +567,23 @@ def create_demo():
                         elem_classes="send-button custom-button",
                         scale=1
                     )
             with gr.Accordion("🎮 고급 설정", open=False):
                 with gr.Row():
@@ -580,6 +610,9 @@ def create_demo():
                             label="반복 억제 🔄"
                         )
             # Examples 위치 수정
             gr.Examples(
                 examples=[

     return "파일을 분석하고 있습니다..."
 CSS = """
 /* 3D 스타일 CSS */
 :root {
 }
 """
+@spaces.GPU
+def stream_chat(message: str, history: list, uploaded_file, temperature: float, max_new_tokens: int, top_p: float, top_k: int, penalty: float):
+    try:
+        print(f'message is - {message}')
+        print(f'history is - {history}')
+        # 파일 업로드 처리
+        file_context = ""
+        if uploaded_file and message == "파일을 분석하고 있습니다...":
+            try:
+                content, file_type = read_uploaded_file(uploaded_file)
+                if content:
+                    file_analysis = analyze_file_content(content, file_type)
+                    file_context = f"\n\n📄 파일 분석 결과:\n{file_analysis}\n\n파일 내용:\n```\n{content}\n```"
+                    message = "업로드된 파일을 분석해주세요."
+            except Exception as e:
+                print(f"파일 분석 오류: {str(e)}")
+                file_context = f"\n\n❌ 파일 분석 중 오류가 발생했습니다: {str(e)}"
+        # 관련 컨텍스트 찾기
+        try:
+            relevant_contexts = find_relevant_context(message)
+            wiki_context = "\n\n관련 위키피디아 정보:\n"
+            for ctx in relevant_contexts:
+                wiki_context += f"Q: {ctx['question']}\nA: {ctx['answer']}\n유사도: {ctx['similarity']:.3f}\n\n"
+        except Exception as e:
+            print(f"컨텍스트 검색 오류: {str(e)}")
+            wiki_context = ""
+        # 대화 히스토리 구성
+        conversation = []
+        for prompt, answer in history:
+            conversation.extend([
+                {"role": "user", "content": prompt},
+                {"role": "assistant", "content": answer}
+            ])
+        # 최종 프롬프트 구성
+        final_message = file_context + wiki_context + "\n현재 질문: " + message
+        conversation.append({"role": "user", "content": final_message})
+        # 토크나이저 설정
+        input_ids = tokenizer.apply_chat_template(conversation, tokenize=False, add_generation_prompt=True)
+        inputs = tokenizer(input_ids, return_tensors="pt").to(0)
+        streamer = TextIteratorStreamer(tokenizer, timeout=10., skip_prompt=True, skip_special_tokens=True)
+        generate_kwargs = dict(
+            inputs,
+            streamer=streamer,
+            top_k=top_k,
+            top_p=top_p,
+            repetition_penalty=penalty,
+            max_new_tokens=max_new_tokens,
+            do_sample=True,
+            temperature=temperature,
+            eos_token_id=[255001],
+        )
+        thread = Thread(target=model.generate, kwargs=generate_kwargs)
+        thread.start()
+        buffer = ""
+        for new_text in streamer:
+            buffer += new_text
+            yield "", history + [[message, buffer]]
+    except Exception as e:
+        error_message = f"오류가 발생했습니다: {str(e)}"
+        print(f"Stream chat 오류: {error_message}")
+        yield "", history + [[message, error_message]]
 def create_demo():
     with gr.Blocks(css=CSS) as demo:
         with gr.Column():
                         elem_classes="send-button custom-button",
                         scale=1
                     )
+        # 이벤트 바인딩 수정
+        def init_msg():
+            return "파일을 분석하고 있습니다..."
+        file_upload.change(
+            fn=init_msg,
+            outputs=msg,
+            queue=False
+        ).then(
+            fn=stream_chat,
+            inputs=[msg, chatbot, file_upload, temperature, max_new_tokens, top_p, top_k, penalty],
+            outputs=[msg, chatbot],
+            queue=True
+        )
             with gr.Accordion("🎮 고급 설정", open=False):
                 with gr.Row():
                             label="반복 억제 🔄"
                         )
             # Examples 위치 수정
             gr.Examples(
                 examples=[