from openai import OpenAI import gradio as gr AUDIO_OUTPUT_FILE = "output" # prefixo do nome do arquivo de áudio .wav OPENAI_CLIENT = None # Função para converter o histórico de chat para o formato esperado pela API do OpenAI def to_openai_chat_history(system_prompt, curr_message, chat_history): prompt = [ { 'role': 'system', 'content': system_prompt } ] for turn in chat_history: user_message, bot_message = turn prompt.append( {'role': 'user', 'content' : user_message} ) prompt.append( {'role': 'assistant', 'content' : bot_message} ) prompt.append( {'role': 'user', 'content' : curr_message } ) return prompt def respond(system_prompt, user_message, chat_history, temperature, voice="echo"): openai_history = to_openai_chat_history(system_prompt, user_message, chat_history) bot_response = OPENAI_CLIENT.chat.completions.create( messages=openai_history, temperature=temperature, model="gpt-3.5-turbo") assistant_msg = bot_response.choices[0].message.content # salva o audio response = OPENAI_CLIENT.audio.speech.create( model="tts-1", voice=voice, input=assistant_msg ) output_audio_file = f"{AUDIO_OUTPUT_FILE}-{len(chat_history)+1:03}.wav" #response.stream_to_file(output_audio_file) response.write_to_file(output_audio_file) # adiciona ao chat, com o tipo de dado esperado pelo Gradio chat_history.append( (user_message, assistant_msg) ) return "", chat_history, output_audio_file def reset_and_apply(openai_key): global OPENAI_CLIENT OPENAI_CLIENT = OpenAI(api_key=openai_key) return [("", "Olá, vamos falar de futebol?")], AUDIO_OUTPUT_FILE + "-001.wav" with gr.Blocks() as demo: # aqui, é resetado e instanciado o cliente initial_chat_history, initial_audio = reset_and_apply("no-key") chatbot = gr.Chatbot(value=initial_chat_history) audio_out = gr.Audio(label="Listen to the response", value=initial_audio, autoplay=True, interactive=False) user_msg = gr.Textbox(label="Prompt") with gr.Accordion(label="Advanced options",open=False): system = gr.Textbox(label="System message", lines=3, value="Você é uma acompanhante de uma criança com idade entre 6 e 8 anos que adora futebol. \ Fale sobre times do Brasil, Inglaterra e Espanha e sobre seleções. Fale sobre craques do passado e grandes jogos. Fale sobre títulos de Copa do Mundo. Seja divertido e pró-ativo,\ tentando iniciar novos assuntos. Fale, no máximo, três frases por mensagem. E faça no máximo 1 pergunta por mensagem.") openai_key = gr.Textbox(label="OPENAI API key", placeholder="Insert your API key here") temperature = gr.Slider(label="temperature", minimum=0.0, maximum=1.0, value=0.5, step=0.1) # opções de vozes, de uma lista predefinida voice = gr.Dropdown(label="Voice", choices=["echo", "nova", "alloy", "fable", "onyx", "shimmer"], value="echo") btnReset = gr.Button("Reset and apply") btnReset.click(reset_and_apply, inputs=[openai_key], outputs=[chatbot, audio_out]) submit_btn = gr.Button("Submit") clear_btn = gr.ClearButton(components=[user_msg, chatbot], value="Clear console") submit_btn.click(respond, inputs=[system, user_msg, chatbot, temperature, voice], outputs=[user_msg, chatbot, audio_out]) # Click on the button user_msg.submit( respond, inputs=[system, user_msg, chatbot, temperature, voice], outputs=[user_msg, chatbot, audio_out]) # Press enter to submit - same effect demo.queue().launch()