Spaces:

Core23
/

Haki_V2

Sleeping

Core23 commited on Nov 19, 2023

Commit

d585923

1 Parent(s): 8a5702d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -119,42 +119,31 @@ def generate_response(transcribed_text):
     return response.choices[0].message.content
 def inference(text):
-    response = client.audio.create(
-        model="tts-1-hd",
-        voice="alloy",
-        text=text
-    )
-    if hasattr(response, 'url'):
-        audio_url = response.url
-        return audio_url
-    else:
-        raise Exception("An error occurred: OpenAI did not return a valid response for the audio file.")
 def process_audio_and_respond(audio):
-    text = transcribe(audio)
-    response_text = generate_response(text)
-    audio_url = inference(response_text)
-    response = requests.get(audio_url)
-    # Create temporary audio file
-    with tempfile.NamedTemporaryFile(suffix=".mp3", delete=False) as temp_file:
-        temp_file.write(response.content)
-        temp_filepath = temp_file.name
-    return response_text, temp_filepath
 demo = gr.Interface(
-    process_audio_and_respond,
-    gr.inputs.Audio(source="microphone", type="filepath", label="Bonyeza kitufe cha kurekodi na uliza swali lako"),
-    [
-        gr.outputs.Textbox(label="Jibu (kwa njia ya maandishi)"),
-        gr.outputs.Audio(type="filepath", label="Jibu kwa njia ya sauti (Bofya kusikiliza Jibu)")
-    ],
-    description="Uliza Swali kuhusu haki and sheria za udongo",
-    theme="compact",
-    layout="vertical",
-    allow_flagging=False,
-    live=True,
 )
 demo.launch()

     return response.choices[0].message.content
 def inference(text):
+   client = openai.OpenAI(api_key='your_api_key')
+   response = client.audio.speech.create(
+       model="tts-1",
+       voice="alloy",
+       input=text
+   )
+   output_file = "tts_output.mp3"
+   response.stream_to_file(output_file)
+   return output_file
 def process_audio_and_respond(audio):
+   text = transcribe(audio)
+   response_text = generate_response(text)
+   output_file = inference(response_text)
+   return response_text, output_file
 demo = gr.Interface(
+   process_audio_and_respond,
+   gr.inputs.Audio(source="microphone", type="filepath", label="Bonyeza kitufe cha kurekodi na uliza swali lako"),
+   [gr.outputs.Textbox(label="Jibu (kwa njia ya maandishi)"), gr.outputs.Audio(type="filepath", label="Jibu kwa njia ya sauti (Bofya kusikiliza Jibu)")],
+   description="Uliza Swali kuhusu haki and sheria za udongo",
+   theme="compact",
+   layout="vertical",
+   allow_flagging=False,
+   live=True,
 )
 demo.launch()