AIO_Chat

Sleeping

eswardivi commited on Apr 18

Commit

e9cb74c

•

1 Parent(s): e2534da

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -33,7 +33,7 @@ else:
 # Dispatch Errors
-@spaces.GPU
 def chat(message, history, temperature, top_p, top_k, max_tokens):
     start_time = time.time()
     chat = []
@@ -72,8 +72,7 @@ def chat(message, history, temperature, top_p, top_k, max_tokens):
     tokens_per_second = tokens / total_time if total_time > 0 else 0
     timing_info = f"\n\nTime taken to first token: {first_token_time:.2f} seconds\nTokens per second: {tokens_per_second:.2f}"
-    gr.Info(timing_info)
-    yield partial_text
 demo = gr.ChatInterface(

 # Dispatch Errors
+@spaces.GPU(duration=150)
 def chat(message, history, temperature, top_p, top_k, max_tokens):
     start_time = time.time()
     chat = []
     tokens_per_second = tokens / total_time if total_time > 0 else 0
     timing_info = f"\n\nTime taken to first token: {first_token_time:.2f} seconds\nTokens per second: {tokens_per_second:.2f}"
+    yield partial_text +  timing_info
 demo = gr.ChatInterface(