Spaces:

unijoh
/

metaambod

Running

unijoh commited on Jun 14

Commit

bbe9b6e

•

1 Parent(s): 2f67968

Update tts.py

Files changed (1) hide show

tts.py CHANGED Viewed

@@ -3,6 +3,7 @@ from transformers import SpeechT5ForTextToSpeech, SpeechT5Processor
 import logging
 import numpy as np
 import soundfile as sf
 # Set up logging
 logging.basicConfig(level=logging.DEBUG)
@@ -31,7 +32,8 @@ def synthesize_speech(text):
         # Decode the generated speech and save to an audio file
         waveform = speech.cpu().numpy().flatten()
-        sf.write("output.wav", waveform, 16000)
         logging.info("Audio file saved successfully.")
         return "output.wav"
     except Exception as e:

 import logging
 import numpy as np
 import soundfile as sf
+import torchaudio
 # Set up logging
 logging.basicConfig(level=logging.DEBUG)
         # Decode the generated speech and save to an audio file
         waveform = speech.cpu().numpy().flatten()
+        # Use torchaudio to save the waveform
+        torchaudio.save("output.wav", torch.tensor(waveform).unsqueeze(0), 16000)
         logging.info("Audio file saved successfully.")
         return "output.wav"
     except Exception as e: