generate-subtitles-for-videos

Running

App Files Files Community

csukuangfj commited on Sep 20, 2023

Commit

e4911f7

•

1 Parent(s): f7cc7c3

small fixes

Browse files

Files changed (2) hide show

app.py +52 -10
model.py +1 -0

app.py CHANGED Viewed

@@ -98,6 +98,10 @@ def process_uploaded_file(
     logging.info(f"Processing uploaded file: {in_filename}")
     show_file_info(in_filename)
     recognizer = get_pretrained_model(repo_id)
     vad = get_vad()
@@ -145,32 +149,70 @@ with demo:
     with gr.Tabs():
         with gr.TabItem("Upload video from disk"):
-            uploaded_file = gr.Video(
                 source="upload",
                 interactive=True,
                 label="Upload from disk",
                 show_share_button=True,
             )
-            upload_button = gr.Button("Submit for recognition")
             output_video = gr.Video(label="Output")
-            output_srt_file = gr.File(label="Generated subtitles", show_label=True)
-            output_info = gr.HTML(label="Info")
-            output_textbox = gr.Textbox(label="Recognized speech from uploaded file")
-        upload_button.click(
             process_uploaded_file,
             inputs=[
                 language_radio,
                 model_dropdown,
-                uploaded_file,
             ],
             outputs=[
                 output_video,
-                output_srt_file,
-                output_info,
-                output_textbox,
             ],
         )

     logging.info(f"Processing uploaded file: {in_filename}")
     show_file_info(in_filename)
+    return process(language, repo_id, in_filename)
+def process(language: str, repo_id: str, in_filename: str):
     recognizer = get_pretrained_model(repo_id)
     vad = get_vad()
     with gr.Tabs():
         with gr.TabItem("Upload video from disk"):
+            uploaded_video_file = gr.Video(
                 source="upload",
                 interactive=True,
                 label="Upload from disk",
                 show_share_button=True,
             )
+            upload_video_button = gr.Button("Submit for recognition")
             output_video = gr.Video(label="Output")
+            output_srt_file_video = gr.File(
+                label="Generated subtitles", show_label=True
+            )
+            output_info_video = gr.HTML(label="Info")
+            output_textbox_video = gr.Textbox(
+                label="Recognized speech from uploaded video file"
+            )
+        with gr.TabItem("Upload audio from disk"):
+            uploaded_audio_file = gr.Audio(
+                source="upload",  # Choose between "microphone", "upload"
+                type="filepath",
+                optional=False,
+                label="Upload audio from disk",
+            )
+            upload_audio_button = gr.Button("Submit for recognition")
+            output_audio = gr.Video(label="Output")
+            output_srt_file_audio = gr.File(
+                label="Generated subtitles", show_label=True
+            )
+            output_info_audio = gr.HTML(label="Info")
+            output_textbox_audio = gr.Textbox(
+                label="Recognized speech from uploaded audio file"
+            )
+        upload_video_button.click(
             process_uploaded_file,
             inputs=[
                 language_radio,
                 model_dropdown,
+                uploaded_video_file,
             ],
             outputs=[
                 output_video,
+                output_srt_file_video,
+                output_info_video,
+                output_textbox_video,
+            ],
+        )
+        upload_audio_button.click(
+            process_uploaded_file,
+            inputs=[
+                language_radio,
+                model_dropdown,
+                uploaded_audio_file,
+            ],
+            outputs=[
+                output_audio,
+                output_srt_file_audio,
+                output_info_audio,
+                output_textbox_audio,
             ],
         )

model.py CHANGED Viewed

@@ -321,6 +321,7 @@ def _get_english_model(repo_id: str) -> sherpa_onnx.OfflineRecognizer:
 chinese_models = {
     "csukuangfj/sherpa-onnx-conformer-zh-stateless2-2023-05-23": _get_wenetspeech_pre_trained_model,  # noqa
     "zrjin/sherpa-onnx-zipformer-multi-zh-hans-2023-9-2": _get_multi_zh_hans_pre_trained_model,  # noqa
 }

 chinese_models = {
+    "csukuangfj/sherpa-onnx-paraformer-zh-2023-03-28": _get_paraformer_zh_pre_trained_model,
     "csukuangfj/sherpa-onnx-conformer-zh-stateless2-2023-05-23": _get_wenetspeech_pre_trained_model,  # noqa
     "zrjin/sherpa-onnx-zipformer-multi-zh-hans-2023-9-2": _get_multi_zh_hans_pre_trained_model,  # noqa
 }