Spaces:

chansung
/

gradio_together_tgi

Runtime error

File size: 1,972 Bytes

016174f
0d32d53
135d31c
e94efa0
135d31c
 
e94efa0
d87df45
 
 
 
 
 
 
 
 
 
 
 
 
 
 
0d32d53
d87df45
 
 
 
 
 
 
 
 
 
 
6ada2c7
 
d87df45
 
 
 
 
 
1f4fa87
d87df45
caf9a86
 
 
1e3dfee
 
7c54130
d87df45
1e3dfee
d87df45
016174f
 
 
 
 
 
 
 
 
0d32d53
016174f

import argparse
import gradio as gr
from openai import AsyncOpenAI

base_url = "http://127.0.0.1:8080/v1"
client = AsyncOpenAI(base_url=base_url, api_key="-")

"""
frequency_penalty: Optional[float] = None,
logit_bias: Optional[List[float]] = None,
logprobs: Optional[bool] = None,
top_logprobs: Optional[int] = None,
max_tokens: Optional[int] = None,
n: Optional[int] = None,
presence_penalty: Optional[float] = None,
stream: bool = False,
seed: Optional[int] = None,
temperature: Optional[float] = None,
top_p: Optional[float] = None,
tools: Optional[List[Tool]] = None,
tool_choice: Optional[str] = None,
"""

def _default_parameters():
    return {
        "max_tokens": 256,
        "stream": True,
        "temperature": 0.9,
    }

def _translate_messages(history):
    messages = []

    for conv in history:
        messages.append({"role":"user", "content":conv[0]})
        messages.append({"role":"assistant", "content":conv[1]})

    return messages

async def echo(message, history):
    parameters = _default_parameters()
    messages = _translate_messages(history)
    messages.append({"role":"user", "content":message})
    
    responses = await client.chat.completions.create(
        model="tgi", messages=messages, **parameters
    )

    full_resp = ""    
    async for resp in responses:
        full_resp = full_resp + resp.choices[0].delta.content
        yield full_resp

def main(args):
    demo = gr.ChatInterface(
        fn=echo, 
        examples=["hello", "how are you?", "What is Large Language Model?"], 
        title="Space of Gradio ➕ Text Generation Inference",
        multimodal=False
    )
    
    demo.queue().launch(server_name="0.0.0.0", server_port=args.port)

if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="This is my Gradio app's description")
    parser.add_argument("--port", type=int, default=7860, help="Port to expose Gradio app")
    
    args = parser.parse_args()    
    main(args)