Spaces:

rahgadda
/

bark-voice-generator

Running

App Files Files Community

rahgadda commited on Aug 11, 2023

Commit

ec66fcf

•

1 Parent(s): 5767f76

Initial Draft

Browse files

Files changed (1) hide show

voice.py +14 -9

voice.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import gradio as gr
 from transformers import AutoProcessor, BarkModel
 import scipy
 ############################
 ### Variable Declaration ###
@@ -8,11 +9,13 @@ import scipy
 # -- UI Variables
 ui_input_voice_presenter=gr.Dropdown(
-    ["v2/en_speaker_0","v2/en_speaker_9"], label="Voice Presenter"
 )
 ui_input_filename=gr.Textbox(label="Input WAV Filename")
 ui_input_text=gr.Textbox(lines=22,label="Input Text")
-ui_output=gr.Audio(label="Output")
 # -- Model Variables
 processor = AutoProcessor.from_pretrained("suno/bark")
@@ -24,7 +27,7 @@ model = BarkModel.from_pretrained("suno/bark")
 # -- On Click of Submit Button in UI
 def submit(voice_presenter, filename, input_text):
-   print("Hello World")
    inputs = processor(input_text, voice_preset=voice_presenter)
    audio_array = model.generate(**inputs)
@@ -32,17 +35,19 @@ def submit(voice_presenter, filename, input_text):
    sample_rate = model.generation_config.sample_rate
    scipy.io.wavfile.write(filename, rate=sample_rate, data=audio_array)
-   return gr.Audio(source=[os.path.join(os.path.dirname(__file__),filename)])
 ############################
 ###### Main Program ########
 ############################
 ui_input_filename.value="sample.wav"
-ui_input_text.value = """
-                      Hello uh ... [clears throat],
-                      Bark is a transformer-based text-to-speech model proposed by Suno AI.
-                      This voice is auto generated
-                      """
 # -- Start of Program - Main
 def main():

 import gradio as gr
 from transformers import AutoProcessor, BarkModel
 import scipy
+import os
 ############################
 ### Variable Declaration ###
 # -- UI Variables
 ui_input_voice_presenter=gr.Dropdown(
+    choices=["v2/en_speaker_0","v2/en_speaker_9"],
+    value=["v2/en_speaker_0"],
+    label="Voice Presenter"
 )
 ui_input_filename=gr.Textbox(label="Input WAV Filename")
 ui_input_text=gr.Textbox(lines=22,label="Input Text")
+ui_output=gr.Audio(label="Output",value=os.path.join(os.path.dirname(__file__))+"/sample.wav")
 # -- Model Variables
 processor = AutoProcessor.from_pretrained("suno/bark")
 # -- On Click of Submit Button in UI
 def submit(voice_presenter, filename, input_text):
+   print("Started Generating Voice")
    inputs = processor(input_text, voice_preset=voice_presenter)
    audio_array = model.generate(**inputs)
    sample_rate = model.generation_config.sample_rate
    scipy.io.wavfile.write(filename, rate=sample_rate, data=audio_array)
+   print("Generation of Voice completed")
+   return os.path.join(os.path.dirname(__file__))+"/sample.wav"
 ############################
 ###### Main Program ########
 ############################
+ui_input_voice_presenter.value="v2/en_speaker_0"
 ui_input_filename.value="sample.wav"
+ui_input_text.value = """Hello uh ... [clears throat],
+Bark is a transformer-based text-to-speech model proposed by Suno AI.
+This voice is auto generated
+"""
 # -- Start of Program - Main
 def main():