bark-voice-cloning-polish-HuBERT-quantizer

Running

Hobis commited on May 28, 2023

Commit

45caaa1

•

1 Parent(s): 8fa79f2

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,9 +10,9 @@ from hubert.customtokenizer import CustomTokenizer
 from encodec import EncodecModel
 from encodec.utils import convert_audio
-def process_audio(audio_file):
     hubert_model = CustomHubert(checkpoint_path='hubert.pt')
-    wav, sr = torchaudio.load(audio_file)
     if wav.shape[0] == 2:
         wav = wav.mean(0, keepdim=True)
     semantic_vectors = hubert_model.forward(wav, input_sample_hz=sr)
@@ -30,8 +30,8 @@ def process_audio(audio_file):
     np.savez('helloWorld.npz', semantic_prompt=semantic_tokens, fine_prompt=fine_prompt, coarse_prompt=coarse_prompt)
     return os.path.abspath('helloWorld.npz')
-def audio_file_processing(input_audio):
-    processed_file = process_audio('audio.wav')
     return processed_file
 audio_input = gr.inputs.Audio(label="Select an audio file")
@@ -40,3 +40,4 @@ audio_output = gr.outputs.File(label="Download")
 gr.Interface(fn=audio_file_processing, inputs=audio_input, outputs=audio_output).launch()

 from encodec import EncodecModel
 from encodec.utils import convert_audio
+def process_audio():
     hubert_model = CustomHubert(checkpoint_path='hubert.pt')
+    wav, sr = torchaudio.load("audio.wav")
     if wav.shape[0] == 2:
         wav = wav.mean(0, keepdim=True)
     semantic_vectors = hubert_model.forward(wav, input_sample_hz=sr)
     np.savez('helloWorld.npz', semantic_prompt=semantic_tokens, fine_prompt=fine_prompt, coarse_prompt=coarse_prompt)
     return os.path.abspath('helloWorld.npz')
+def audio_file_processing():
+    processed_file = process_audio()
     return processed_file
 audio_input = gr.inputs.Audio(label="Select an audio file")
 gr.Interface(fn=audio_file_processing, inputs=audio_input, outputs=audio_output).launch()