Spaces:

powerpuf-bot
/

dataxet-chatbot

Sleeping

App Files Files Community

Chananchida commited on Feb 7, 2024

Commit

649600a

verified ·

1 Parent(s): 10e1d54

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -5

app.py CHANGED Viewed

@@ -29,6 +29,7 @@ DATA_PATH='data/dataset.xlsx'
 def load_data(path=DATA_PATH):
     df = pd.read_excel(path, sheet_name='Default')
     df['Context'] = pd.read_excel(path, sheet_name='mdeberta')['Context']
     print('Load data done')
     return df
@@ -177,6 +178,10 @@ def predict_test(model, tokenizer, embedding_model, df, question, index):  # sen
     return output
 def highlight_text(text, start_index, end_index):
     highlighted_text = ""
     for i, char in enumerate(text):
         if i == start_index:
@@ -196,10 +201,12 @@ def chat_interface_after(question, history):
     return highlighted_answer
 examples=[
-                                    'อยากทราบความถี่ในการดึงข้อมูลของ DXT360 ในแต่ละแพลตฟอร์ม',
-                                    'อยากทราบความถี่ในการดึงข้อมูลของ DXT360 บน Twitter',
-                                    'ช่องทางติดตามข่าวสารของเรา',
-                                    'ขอช่องทางติดตามข่าวสารทาง Line หน่อย'
                                 ]
 demo_before = gr.ChatInterface(fn=chat_interface_before,
                                 examples=examples)
@@ -211,8 +218,8 @@ interface = gr.TabbedInterface([demo_before, demo_after], ["Before", "After"])
 if __name__ == "__main__":
     # Load your model, tokenizer, data, and index here...
     model, tokenizer = load_model('wangchanberta-hyp')
     embedding_model = load_embedding_model()
-    df = load_data()
     index = set_index(prepare_sentences_vector(load_embeddings(EMBEDDINGS_PATH)))
     interface.launch()

 def load_data(path=DATA_PATH):
     df = pd.read_excel(path, sheet_name='Default')
     df['Context'] = pd.read_excel(path, sheet_name='mdeberta')['Context']
+    print(len(df))
     print('Load data done')
     return df
     return output
 def highlight_text(text, start_index, end_index):
+    if start_index < 0:
+      start_index = 0
+    if end_index > len(text):
+      end_index = len(text)
     highlighted_text = ""
     for i, char in enumerate(text):
         if i == start_index:
     return highlighted_answer
 examples=[
+            'อยากทราบความถี่ในการดึงข้อมูลของ DXT360 ในแต่ละแพลตฟอร์ม',
+            'อยากทราบความถี่ในการดึงข้อมูลของ DXT360 บน Twitter',
+            'ช่องทางติดตามข่าวสารของเรา',
+            'ขอช่องทางติดตามข่าวสารทาง Line หน่อย',
+            'ช่องทางติดตามข่าวสารของเรา',
+            'ขอช่องทางติดตามข่าวสารทาง Line หน่อย',
                                 ]
 demo_before = gr.ChatInterface(fn=chat_interface_before,
                                 examples=examples)
 if __name__ == "__main__":
     # Load your model, tokenizer, data, and index here...
+    df = load_data()
     model, tokenizer = load_model('wangchanberta-hyp')
     embedding_model = load_embedding_model()
     index = set_index(prepare_sentences_vector(load_embeddings(EMBEDDINGS_PATH)))
     interface.launch()