Spaces:

jawill
/

nlp_textToSpeech

Sleeping

jwphantom commited on Mar 5

Commit

81eafca

•

1 Parent(s): 536bb23

fisrt commit

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,6 +4,7 @@ import torch
 import soundfile as sf
 import numpy as np
 import gradio as gr
 # Charger les modèles et les embeddings du locuteur une seule fois pour éviter de les recharger à chaque appel
 processor = SpeechT5Processor.from_pretrained("microsoft/speecht5_tts")
@@ -22,15 +23,11 @@ def text_to_speech(text):
         inputs["input_ids"], speaker_embeddings, vocoder=vocoder
     )
-    # Enregistrer le fichier audio
-    output_filename = "speech.wav"
-    sf.write(output_filename, speech.numpy(), samplerate=16000)
-    # Lire le fichier audio
-    with open(output_filename, "rb") as file:
-        audio_bytes = file.read()
-    return audio_bytes
 # Créer l'interface Gradio
@@ -39,7 +36,7 @@ interface = gr.Interface(
     inputs="text",
     outputs=gr.Audio(label="Processed Audio"),
     title="Application du type Text to speech",
-    description="Entrez un texte en anglais et l'application va la traduire",
 )
 # Lancer l'interface Gradio

 import soundfile as sf
 import numpy as np
 import gradio as gr
+import io
 # Charger les modèles et les embeddings du locuteur une seule fois pour éviter de les recharger à chaque appel
 processor = SpeechT5Processor.from_pretrained("microsoft/speecht5_tts")
         inputs["input_ids"], speaker_embeddings, vocoder=vocoder
     )
+    # Enregistrer l'audio dans un buffer
+    buffer = io.BytesIO()
+    sf.write(buffer, speech.numpy(), samplerate=16000, format="WAV")
+    return buffer.getvalue()
 # Créer l'interface Gradio
     inputs="text",
     outputs=gr.Audio(label="Processed Audio"),
     title="Application du type Text to speech",
+    description="Entrez un texte en anglais et l'application va la traduire NB: ne mettez pas de virgule",
 )
 # Lancer l'interface Gradio