svc-gradiotei-fm-template

Sleeping

App Files Files Community

chansung commited on Mar 21

Commit

f9aa63c

•

1 Parent(s): 71388ca

.

Browse files

Files changed (3) hide show

app/gen/openllm.py +46 -0
app/main.py +2 -51
app/ui.py +13 -0

app/gen/openllm.py ADDED Viewed

	@@ -0,0 +1,46 @@

+from openai import AsyncOpenAI
+base_url = "http://127.0.0.1:8080/v1"
+client = AsyncOpenAI(base_url=base_url, api_key="-")
+def _default_parameters():
+    """
+        frequency_penalty: Optional[float] = None,
+        logit_bias: Optional[List[float]] = None,
+        logprobs: Optional[bool] = None,
+        top_logprobs: Optional[int] = None,
+        max_tokens: Optional[int] = None,
+        n: Optional[int] = None,
+        presence_penalty: Optional[float] = None,
+        stream: bool = False,
+        seed: Optional[int] = None,
+        temperature: Optional[float] = None,
+        top_p: Optional[float] = None,
+        tools: Optional[List[Tool]] = None,
+        tool_choice: Optional[str] = None,
+    """
+    return {
+        "max_tokens": 256,
+        "stream": True,
+        "temperature": 0.9,
+    }
+def ranslate_messages(history):
+    messages = []
+    for conv in history:
+        messages.append({"role":"user", "content":conv[0]})
+        messages.append({"role":"assistant", "content":conv[1]})
+    return messages
+async def chat(messages, parameters=None):
+    if parameters is None:
+        parameters = _default_parameters()
+    responses = await client.chat.completions.create(
+        model="tgi", messages=messages, **parameters
+    )
+    async for resp in responses:
+        yield resp.choices[0].delta.content

app/main.py CHANGED Viewed

@@ -1,59 +1,10 @@
 import argparse
 import gradio as gr
-from openai import AsyncOpenAI
-base_url = "http://127.0.0.1:8080/v1"
-client = AsyncOpenAI(base_url=base_url, api_key="-")
-"""
-frequency_penalty: Optional[float] = None,
-logit_bias: Optional[List[float]] = None,
-logprobs: Optional[bool] = None,
-top_logprobs: Optional[int] = None,
-max_tokens: Optional[int] = None,
-n: Optional[int] = None,
-presence_penalty: Optional[float] = None,
-stream: bool = False,
-seed: Optional[int] = None,
-temperature: Optional[float] = None,
-top_p: Optional[float] = None,
-tools: Optional[List[Tool]] = None,
-tool_choice: Optional[str] = None,
-"""
-def _default_parameters():
-    return {
-        "max_tokens": 256,
-        "stream": True,
-        "temperature": 0.9,
-    }
-def _translate_messages(history):
-    messages = []
-    for conv in history:
-        messages.append({"role":"user", "content":conv[0]})
-        messages.append({"role":"assistant", "content":conv[1]})
-    return messages
-async def echo(message, history):
-    parameters = _default_parameters()
-    messages = _translate_messages(history)
-    messages.append({"role":"user", "content":message})
-    responses = await client.chat.completions.create(
-        model="tgi", messages=messages, **parameters
-    )
-    full_resp = ""
-    async for resp in responses:
-        full_resp = full_resp + resp.choices[0].delta.content
-        yield full_resp
 def main(args):
     demo = gr.ChatInterface(
-        fn=echo,
         examples=["hello", "how are you?", "What is Large Language Model?"],
         title="Space of Gradio ➕ Text Generation Inference",
         multimodal=False

 import argparse
 import gradio as gr
+from app.ui import chat
 def main(args):
     demo = gr.ChatInterface(
+        fn=chat,
         examples=["hello", "how are you?", "What is Large Language Model?"],
         title="Space of Gradio ➕ Text Generation Inference",
         multimodal=False

app/ui.py ADDED Viewed

	@@ -0,0 +1,13 @@

+from app.gen.openllm import (
+    chat,
+    translate_messages,
+)
+async def chat(message, history):
+    messages = translate_messages(history)
+    messages.append({"role":"user", "content":message})
+    full_resp = ""
+    async for resp in chat(messages):
+        full_resp = full_resp + resp
+        yield full_resp