Spaces:

maven-ai-llm-app-group
/

ai_language_buddy

Runtime error

Nathan Franklin commited on Aug 27, 2024

Commit

8cf49b6

1 Parent(s): 65e32e0

add edge-tts capability for text to speech

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,8 +1,19 @@
 import gradio as gr
 from faster_whisper import WhisperModel
 model = WhisperModel("tiny", compute_type="float32")
 def generate_response(
     language_level, buddy_personality,
     language_choice, user_query_audio,
@@ -29,8 +40,10 @@ def generate_response(
     # Convert llm response to audio
     # Return None to reset user input audio and
     # llm response + user inputs in chatbot_history object to be displayed
-    return None, chatbot_history, user_query_audio
 with gr.Blocks() as demo:

 import gradio as gr
 from faster_whisper import WhisperModel
+import edge_tts
+import tempfile
+import asyncio
 model = WhisperModel("tiny", compute_type="float32")
+# Text-to-speech function
+async def text_to_speech(text, voice):
+    communicate = edge_tts.Communicate(text, voice)
+    with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp_file:
+        tmp_path = tmp_file.name
+        await communicate.save(tmp_path)
+    return tmp_path, None
 def generate_response(
     language_level, buddy_personality,
     language_choice, user_query_audio,
     # Convert llm response to audio
     # Return None to reset user input audio and
     # llm response + user inputs in chatbot_history object to be displayed
+    voice_short_name = "en-US-BrianNeural"
+    bot_message_audio, warning = asyncio.run(text_to_speech(text=bot_message, voice=voice_short_name))
+    return None, chatbot_history, bot_message_audio
 with gr.Blocks() as demo:

requirements.txt CHANGED Viewed

@@ -1,2 +1,3 @@
 faster-whisper==1.0.3
-gradio==4.42.0

 faster-whisper==1.0.3
+gradio==4.42.0
+edge-tts==6.1.12