from openai import OpenAI

import gradio as gr


AUDIO_OUTPUT_FILE = "output"   # prefixo do nome do arquivo de áudio .wav

OPENAI_CLIENT = None


# Função para converter o histórico de chat para o formato esperado pela API do OpenAI
def to_openai_chat_history(system_prompt, curr_message, chat_history):
    prompt = [ { 'role': 'system', 'content': system_prompt } ]
    for turn in chat_history:
        user_message, bot_message = turn
        prompt.append( {'role': 'user', 'content' : user_message} )
        prompt.append( {'role': 'assistant', 'content' : bot_message} )
    prompt.append( {'role': 'user', 'content' : curr_message } )
    return prompt


def respond(system_prompt, user_message, chat_history, temperature, voice="echo"):
        openai_history = to_openai_chat_history(system_prompt, user_message, chat_history)

        bot_response = OPENAI_CLIENT.chat.completions.create(
            messages=openai_history,
            temperature=temperature,
            model="gpt-3.5-turbo")

        assistant_msg = bot_response.choices[0].message.content

        # salva o audio 
        response = OPENAI_CLIENT.audio.speech.create(
            model="tts-1",
            voice=voice,
            input=assistant_msg
        )

        output_audio_file = f"{AUDIO_OUTPUT_FILE}-{len(chat_history)+1:03}.wav"
        #response.stream_to_file(output_audio_file)
        response.write_to_file(output_audio_file)

        # adiciona ao chat, com o tipo de dado esperado pelo Gradio
        chat_history.append( (user_message, assistant_msg) )
        
        return "", chat_history, output_audio_file


def reset_and_apply(openai_key):
    global OPENAI_CLIENT
    OPENAI_CLIENT = OpenAI(api_key=openai_key)
    return [("", "Olá, vamos falar de futebol?")], AUDIO_OUTPUT_FILE + "-001.wav"


with gr.Blocks() as demo:
    # aqui, é resetado e instanciado o cliente
    initial_chat_history, initial_audio = reset_and_apply("no-key")

    chatbot = gr.Chatbot(value=initial_chat_history)
    audio_out = gr.Audio(label="Listen to the response", value=initial_audio, autoplay=True, interactive=False)
    user_msg = gr.Textbox(label="Prompt")
    
    with gr.Accordion(label="Advanced options",open=False):
        system = gr.Textbox(label="System message", lines=3, value="Você é uma acompanhante de uma criança com idade entre 6 e 8 anos que adora futebol. \
Fale sobre times do Brasil, Inglaterra e Espanha e sobre seleções. Fale sobre craques do passado e grandes jogos. Fale sobre títulos de Copa do Mundo. Seja divertido e pró-ativo,\
tentando iniciar novos assuntos. Fale, no máximo, três frases por mensagem. E faça no máximo 1 pergunta por mensagem.")
        openai_key = gr.Textbox(label="OPENAI API key", placeholder="Insert your API key here")
        temperature = gr.Slider(label="temperature", minimum=0.0, maximum=1.0, value=0.5, step=0.1)
        # opções de vozes, de uma lista predefinida
        voice = gr.Dropdown(label="Voice", choices=["echo", "nova", "alloy", "fable", "onyx", "shimmer"], value="echo")
        btnReset = gr.Button("Reset and apply")
        btnReset.click(reset_and_apply, inputs=[openai_key], outputs=[chatbot, audio_out])
    
    submit_btn = gr.Button("Submit")
    clear_btn = gr.ClearButton(components=[user_msg, chatbot], value="Clear console")

    submit_btn.click(respond, inputs=[system, user_msg, chatbot, temperature, voice], outputs=[user_msg, chatbot, audio_out])  # Click on the button
    user_msg.submit( respond, inputs=[system, user_msg, chatbot, temperature, voice], outputs=[user_msg, chatbot, audio_out])  # Press enter to submit - same effect


demo.queue().launch()