Spaces:

aletrn
/

ai-pronunciation-trainer

Running

App Files Files Community

alessandro trinca tornidor commited on Nov 30, 2024

Commit

c0961d5

1 Parent(s): 333afb5

feat: limit the number of recognized words that can be selected

Browse files

Files changed (1) hide show

app.py +20 -3

app.py CHANGED Viewed

@@ -127,10 +127,24 @@ with gr.Blocks(css=css, head=js.head_driver_tour) as gradio_app:
                 btn_recognize_speech_accuracy = gr.Button(value="Recognize speech accuracy", elem_id="btn-recognize-speech-accuracy-id-element")
             with gr.Row():
                 with gr.Column(scale=1, min_width=50):
-                    num_tot_recognized_words = gr.Number(label="Total recognized words", visible=True, minimum=0)
                 with gr.Column(scale=1, min_width=50):
-                    num_selected_recognized_words = gr.Number(label="Recognized word index", visible=True, value=0, minimum=0)
                 with gr.Column(scale=2, min_width=100):
                     audio_splitted_student_recording_stt = gr.Audio(
                         label="Splitted Speech-toText audio output",
                         type="filepath",
@@ -156,6 +170,7 @@ with gr.Blocks(css=css, head=js.head_driver_tour) as gradio_app:
     def get_updated_score_by_language(text: str, audio_rec: str | Path, lang: str, score_de: float, score_en: float):
         _transcribed_text, _letter_correctness, _pronunciation_accuracy, _recording_ipa, _ideal_ipa, _num_tot_recognized_words, _res = lambdaSpeechToScore.get_speech_to_score_tuple(text, audio_rec, lang, remove_random_file=False)
         output = {
             text_transcribed_hidden: _transcribed_text,
             text_letter_correctness: _letter_correctness,
@@ -164,6 +179,7 @@ with gr.Blocks(css=css, head=js.head_driver_tour) as gradio_app:
             text_ideal_ipa: _ideal_ipa,
             text_raw_json_output_hidden: _res,
             num_tot_recognized_words: _num_tot_recognized_words,
         }
         match lang:
             case "de":
@@ -193,7 +209,8 @@ with gr.Blocks(css=css, head=js.head_driver_tour) as gradio_app:
             text_raw_json_output_hidden,
             number_score_de,
             number_score_en,
-            num_tot_recognized_words
         ],
     )
     btn_run_tts.click(fn=None, inputs=[text_student_transcription, radio_language], outputs=audio_tts, js=js.js_play_audio)

                 btn_recognize_speech_accuracy = gr.Button(value="Recognize speech accuracy", elem_id="btn-recognize-speech-accuracy-id-element")
             with gr.Row():
                 with gr.Column(scale=1, min_width=50):
+                    num_tot_recognized_words = gr.Number(label="Total recognized words", visible=True, minimum=0, interactive=False)
                 with gr.Column(scale=1, min_width=50):
+                    num_selected_recognized_words = gr.Number(label="Recognized word index", visible=True, minimum=0, value=0)
+                    def change_max_selected_words(n):
+                        app_logger.info(f"change_max_selected_words: {n} ...")
+                        app_logger.info(f"num_selected_recognized_words.maximum, pre: {num_selected_recognized_words.maximum} ...")
+                        new_num_selected_recognized_words = gr.Number(label=f"Recognized word index, max {n}!", visible=True, value=0, minimum=0, maximum=n)
+                        app_logger.info(f"num_selected_recognized_words.maximum, post: {num_selected_recognized_words.maximum} ...")
+                        return new_num_selected_recognized_words
+                    num_tot_recognized_words.change(
+                        change_max_selected_words,
+                        inputs=[num_tot_recognized_words],
+                         outputs=[num_selected_recognized_words],
+                    )
                 with gr.Column(scale=2, min_width=100):
+                    # todo: use https://www.gradio.app/docs/gradio/multimodaltextbox
                     audio_splitted_student_recording_stt = gr.Audio(
                         label="Splitted Speech-toText audio output",
                         type="filepath",
     def get_updated_score_by_language(text: str, audio_rec: str | Path, lang: str, score_de: float, score_en: float):
         _transcribed_text, _letter_correctness, _pronunciation_accuracy, _recording_ipa, _ideal_ipa, _num_tot_recognized_words, _res = lambdaSpeechToScore.get_speech_to_score_tuple(text, audio_rec, lang, remove_random_file=False)
+        new_num_selected_recognized_words = gr.Number(label="Recognized word index", visible=True, value=0)
         output = {
             text_transcribed_hidden: _transcribed_text,
             text_letter_correctness: _letter_correctness,
             text_ideal_ipa: _ideal_ipa,
             text_raw_json_output_hidden: _res,
             num_tot_recognized_words: _num_tot_recognized_words,
+            num_selected_recognized_words: new_num_selected_recognized_words
         }
         match lang:
             case "de":
             text_raw_json_output_hidden,
             number_score_de,
             number_score_en,
+            num_tot_recognized_words,
+            num_selected_recognized_words
         ],
     )
     btn_run_tts.click(fn=None, inputs=[text_student_transcription, radio_language], outputs=audio_tts, js=js.js_play_audio)