Spaces:

nineninesix
/

KaniTTS

Running on Zero

App Files Files Community

ylankgz commited on Sep 18

Commit

00e4cff

1 Parent(s): 4e3722d

Fix error: generate_speech takes 6 arguments

Browse files

Files changed (1) hide show

app.py +25 -26

app.py CHANGED Viewed

@@ -60,7 +60,7 @@ print("All models loaded!")
 @spaces.GPU
-def generate_speech_gpu(text, model_choice):
     """
     Generate speech from text using the selected model on GPU
     """
@@ -102,8 +102,8 @@ with gr.Blocks(title="😻 KaniTTS - Text to Speech", theme=gr.themes.Default())
             model_dropdown = gr.Dropdown(
                 choices=list(models_configs.keys()),
                 value=list(models_configs.keys())[0],
-                label="Select Model",
-                info="Base - default model, Female - female voice, Male - male voice"
             )
             text_input = gr.Textbox(
@@ -112,6 +112,28 @@ with gr.Blocks(title="😻 KaniTTS - Text to Speech", theme=gr.themes.Default())
                 lines=3,
                 max_lines=10
             )
             generate_btn = gr.Button("🎵 Generate Speech", variant="primary", size="lg")
@@ -128,28 +150,6 @@ with gr.Blocks(title="😻 KaniTTS - Text to Speech", theme=gr.themes.Default())
                 value="Ready to generate speech",
                 lines=3
             )
-        with gr.Accordion("Settings", open=False):
-            temperature = gr.Slider(
-                minimum=0.1, maximum=1.5, value=0.6, step=0.05,
-                label="Temperature",
-                info="Higher values (0.7-1.0) create more expressive but less stable speech"
-            )
-            top_p = gr.Slider(
-                minimum=0.1, maximum=1.0, value=0.95, step=0.05,
-                label="Top P",
-                info="Nucleus sampling threshold"
-            )
-            repetition_penalty = gr.Slider(
-                minimum=1.0, maximum=2.0, value=1.1, step=0.05,
-                label="Repetition Penalty",
-                info="Higher values discourage repetitive patterns"
-            )
-            max_new_tokens = gr.Slider(
-                minimum=100, maximum=2000, value=1200, step=100,
-                label="Max Length",
-                info="Maximum length of generated audio (in tokens)"
-            )
     # GPU generation event
     generate_btn.click(
@@ -158,7 +158,6 @@ with gr.Blocks(title="😻 KaniTTS - Text to Speech", theme=gr.themes.Default())
         outputs=[audio_output, time_report_output]
     )
-    gr.Markdown("## Examples")
     def play_demo(text):
         return (22050, demo_examples[text]), 'DEMO'

 @spaces.GPU
+def generate_speech_gpu(text, model_choice, temperature, top_p, repetition_penalty, max_new_tokens):
     """
     Generate speech from text using the selected model on GPU
     """
             model_dropdown = gr.Dropdown(
                 choices=list(models_configs.keys()),
                 value=list(models_configs.keys())[0],
+                label="Selected Model",
+                info="Base generates random voices"
             )
             text_input = gr.Textbox(
                 lines=3,
                 max_lines=10
             )
+            with gr.Accordion("Settings", open=False):
+                temperature = gr.Slider(
+                    minimum=0.1, maximum=1.5, value=0.6, step=0.05,
+                    label="Temperature",
+                    info="Higher values (0.7-1.0) create more expressive but less stable speech"
+                )
+                top_p = gr.Slider(
+                    minimum=0.1, maximum=1.0, value=0.95, step=0.05,
+                    label="Top P",
+                    info="Nucleus sampling threshold"
+                )
+                repetition_penalty = gr.Slider(
+                    minimum=1.0, maximum=2.0, value=1.1, step=0.05,
+                    label="Repetition Penalty",
+                    info="Higher values discourage repetitive patterns"
+                )
+                max_new_tokens = gr.Slider(
+                    minimum=100, maximum=2000, value=1200, step=100,
+                    label="Max Length",
+                    info="Maximum length of generated audio (in tokens)"
+                )
             generate_btn = gr.Button("🎵 Generate Speech", variant="primary", size="lg")
                 value="Ready to generate speech",
                 lines=3
             )
     # GPU generation event
     generate_btn.click(
         outputs=[audio_output, time_report_output]
     )
     def play_demo(text):
         return (22050, demo_examples[text]), 'DEMO'