Spaces:

cahya
/

indochat

Runtime error

App Files Files Community

cahya commited on Feb 13, 2023

Commit

a4b0cb5

1 Parent(s): 99167bb

fix cuda device and penalti alpha

Browse files

Files changed (1) hide show

app.py +13 -9

app.py CHANGED Viewed

@@ -3,24 +3,27 @@ import gradio as gr
 from transformers import pipeline
 import os
-device = "cuda" if torch.cuda.is_available() else "cpu"
 HF_AUTH_TOKEN = os.environ.get("HF_AUTH_TOKEN")
 text_generation_model = "cahya/indochat-tiny"
 text_generation = pipeline("text-generation", text_generation_model, use_auth_token=HF_AUTH_TOKEN, device=device)
-def get_answer(user_input, decoding_methods, top_k, top_p, temperature, repetition_penalty, penalty_alpha):
     if decoding_methods == "Beam Search":
         do_sample = False
     elif decoding_methods == "Sampling":
         do_sample = True
     else:
         do_sample = False
     print(user_input, decoding_methods, do_sample, top_k, top_p, temperature, repetition_penalty, penalty_alpha)
     prompt = f"User: {user_input}\nAssistant: "
     generated_text = text_generation(f"{prompt}", min_length=50, max_length=200, num_return_sequences=1,
-                                     do_sample=do_sample, top_k=top_k, top_p=top_p, temperature=temperature,
-                                     repetition_penalty=repetition_penalty)#, penalty_alpha=penalty_alpha)
     answer = generated_text[0]["generated_text"]
     answer_without_prompt = answer[len(prompt)+1:]
     return answer_without_prompt
@@ -28,8 +31,7 @@ def get_answer(user_input, decoding_methods, top_k, top_p, temperature, repetiti
 with gr.Blocks() as demo:
     with gr.Row():
-        gr.Markdown(
-            "## IndoChat")
     with gr.Row():
         with gr.Column():
             user_input = gr.inputs.Textbox(placeholder="",
@@ -37,8 +39,10 @@ with gr.Blocks() as demo:
                                            default="Bagaimana cara mendidik anak supaya tidak berbohong?")
             decoding_methods = gr.inputs.Dropdown(["Beam Search", "Sampling", "Contrastive Search"],
                                                   default="Sampling")
-            top_k = gr.inputs.Slider(label="Top K: The number of highest probability vocabulary tokens to keep",
-                                     default=40, maximum=50, minimum=1, step=1)
             top_p = gr.inputs.Slider(label="Top P", default=0.9, step=0.05, minimum=0.1, maximum=1.0)
             temperature = gr.inputs.Slider(label="Temperature", default=0.5, step=0.05, minimum=0.1, maximum=1.0)
             repetition_penalty = gr.inputs.Slider(label="Repetition Penalty", default=1.1, step=0.05, minimum=1.0, maximum=2.0)
@@ -50,7 +54,7 @@ with gr.Blocks() as demo:
     with gr.Row():
         gr.Markdown("![visitor badge](https://visitor-badge.glitch.me/badge?page_id=cahya_indochat)")
-    button_generate_story.click(get_answer, inputs=[user_input, decoding_methods, top_k, top_p, temperature,
                                                     repetition_penalty, penalty_alpha], outputs=[generated_answer])
 demo.launch(enable_queue=False)

 from transformers import pipeline
 import os
+device = torch.cuda.current_device() if torch.cuda.is_available() else "cpu"
 HF_AUTH_TOKEN = os.environ.get("HF_AUTH_TOKEN")
 text_generation_model = "cahya/indochat-tiny"
 text_generation = pipeline("text-generation", text_generation_model, use_auth_token=HF_AUTH_TOKEN, device=device)
+def get_answer(user_input, decoding_methods, num_beams, top_k, top_p, temperature, repetition_penalty, penalty_alpha):
     if decoding_methods == "Beam Search":
         do_sample = False
+        penalty_alpha = 0
     elif decoding_methods == "Sampling":
         do_sample = True
+        penalty_alpha = 0
     else:
         do_sample = False
     print(user_input, decoding_methods, do_sample, top_k, top_p, temperature, repetition_penalty, penalty_alpha)
     prompt = f"User: {user_input}\nAssistant: "
     generated_text = text_generation(f"{prompt}", min_length=50, max_length=200, num_return_sequences=1,
+                                     num_beams=num_beams, do_sample=do_sample, top_k=top_k, top_p=top_p,
+                                     temperature=temperature, repetition_penalty=repetition_penalty,
+                                     penalty_alpha=penalty_alpha)
     answer = generated_text[0]["generated_text"]
     answer_without_prompt = answer[len(prompt)+1:]
     return answer_without_prompt
 with gr.Blocks() as demo:
     with gr.Row():
+        gr.Markdown("## IndoChat")
     with gr.Row():
         with gr.Column():
             user_input = gr.inputs.Textbox(placeholder="",
                                            default="Bagaimana cara mendidik anak supaya tidak berbohong?")
             decoding_methods = gr.inputs.Dropdown(["Beam Search", "Sampling", "Contrastive Search"],
                                                   default="Sampling")
+            num_beams = gr.inputs.Slider(label="Number of beams for beam search",
+                                     default=1, minimum=1, maximum=10, step=1)
+            top_k = gr.inputs.Slider(label="Top K",
+                                     default=30, maximum=50, minimum=1, step=1)
             top_p = gr.inputs.Slider(label="Top P", default=0.9, step=0.05, minimum=0.1, maximum=1.0)
             temperature = gr.inputs.Slider(label="Temperature", default=0.5, step=0.05, minimum=0.1, maximum=1.0)
             repetition_penalty = gr.inputs.Slider(label="Repetition Penalty", default=1.1, step=0.05, minimum=1.0, maximum=2.0)
     with gr.Row():
         gr.Markdown("![visitor badge](https://visitor-badge.glitch.me/badge?page_id=cahya_indochat)")
+    button_generate_story.click(get_answer, inputs=[user_input, decoding_methods, num_beams, top_k, top_p, temperature,
                                                     repetition_penalty, penalty_alpha], outputs=[generated_answer])
 demo.launch(enable_queue=False)