jwphantom commited on
Commit
81eafca
1 Parent(s): 536bb23

fisrt commit

Browse files
Files changed (1) hide show
  1. app.py +6 -9
app.py CHANGED
@@ -4,6 +4,7 @@ import torch
4
  import soundfile as sf
5
  import numpy as np
6
  import gradio as gr
 
7
 
8
  # Charger les modèles et les embeddings du locuteur une seule fois pour éviter de les recharger à chaque appel
9
  processor = SpeechT5Processor.from_pretrained("microsoft/speecht5_tts")
@@ -22,15 +23,11 @@ def text_to_speech(text):
22
  inputs["input_ids"], speaker_embeddings, vocoder=vocoder
23
  )
24
 
25
- # Enregistrer le fichier audio
26
- output_filename = "speech.wav"
27
- sf.write(output_filename, speech.numpy(), samplerate=16000)
28
 
29
- # Lire le fichier audio
30
- with open(output_filename, "rb") as file:
31
- audio_bytes = file.read()
32
-
33
- return audio_bytes
34
 
35
 
36
  # Créer l'interface Gradio
@@ -39,7 +36,7 @@ interface = gr.Interface(
39
  inputs="text",
40
  outputs=gr.Audio(label="Processed Audio"),
41
  title="Application du type Text to speech",
42
- description="Entrez un texte en anglais et l'application va la traduire",
43
  )
44
 
45
  # Lancer l'interface Gradio
 
4
  import soundfile as sf
5
  import numpy as np
6
  import gradio as gr
7
+ import io
8
 
9
  # Charger les modèles et les embeddings du locuteur une seule fois pour éviter de les recharger à chaque appel
10
  processor = SpeechT5Processor.from_pretrained("microsoft/speecht5_tts")
 
23
  inputs["input_ids"], speaker_embeddings, vocoder=vocoder
24
  )
25
 
26
+ # Enregistrer l'audio dans un buffer
27
+ buffer = io.BytesIO()
28
+ sf.write(buffer, speech.numpy(), samplerate=16000, format="WAV")
29
 
30
+ return buffer.getvalue()
 
 
 
 
31
 
32
 
33
  # Créer l'interface Gradio
 
36
  inputs="text",
37
  outputs=gr.Audio(label="Processed Audio"),
38
  title="Application du type Text to speech",
39
+ description="Entrez un texte en anglais et l'application va la traduire NB: ne mettez pas de virgule",
40
  )
41
 
42
  # Lancer l'interface Gradio