Spaces:

zubairsamo
/

transformers_streaming

Sleeping

joaogante HF staff commited on Mar 31, 2023

Commit

183e675

•

1 Parent(s): 2503b95

haha tokens go brrr

Files changed (3) hide show

__pycache__/app.cpython-310.pyc ADDED Viewed

Binary file (1.38 kB). View file

app.py CHANGED Viewed

@@ -1,24 +1,46 @@
 import gradio as gr
-import random
-import time
 with gr.Blocks() as demo:
     chatbot = gr.Chatbot()
     msg = gr.Textbox()
     clear = gr.Button("Clear")
-    def user(user_message, history):
-        return "", history + [[user_message, None]]
-    def bot(history):
-        bot_message = random.choice(["Yes", "No"])
-        history[-1][1] = bot_message
-        time.sleep(1)
         return history
-    msg.submit(user, [msg, chatbot], [msg, chatbot], queue=False).then(
-        bot, chatbot, chatbot
     )
-    clear.click(lambda: None, None, chatbot, queue=False)
 demo.launch()

 import gradio as gr
+from threading import Thread
+from transformers import AutoModelForCausalLM, AutoTokenizer, IteratorStreamer
+# Global variable loading
+tokenizer = AutoTokenizer.from_pretrained("gpt2")
+print("Loading the model...")
+model = AutoModelForCausalLM.from_pretrained("gpt2")
+print("Done!")
+# Gradio app
 with gr.Blocks() as demo:
+    def user(user_message, history):
+        return "", history + [[user_message, None]]
     chatbot = gr.Chatbot()
     msg = gr.Textbox()
     clear = gr.Button("Clear")
+    def update_chatbot(history):
+        user_query = history[-1][0]
+        history[-1][1] = ""
+        model_inputs = tokenizer([user_query], return_tensors="pt")
+        # Start generation on a separate thread, so that we don't block the UI. The text is pulled from the streamer
+        # in the main thread.
+        streamer = IteratorStreamer(tokenizer)
+        generate_kwargs = dict(model_inputs, streamer=streamer, max_new_tokens=200, do_sample=True)
+        t = Thread(target=model.generate, kwargs=generate_kwargs)
+        t.start()
+        # Pull the generated text from the streamer, and update the chatbot.
+        for new_text in streamer:
+            history[-1][1] += new_text
+            yield history
         return history
+    msg.submit(user, [msg, chatbot], [msg, chatbot]).then(
+        update_chatbot, chatbot, chatbot
     )
+    clear.click(lambda: None, None, chatbot)
+demo.queue()
 demo.launch()

requirements.txt CHANGED Viewed

	@@ -1 +1 @@
1	- git+https://github.com/~~huggingface~~/transformers.git # transformers from ~~`main`~~


1	+ git+https://github.com/gante/transformers.git@streamer_iterator # transformers from dev branch