generate-subtitles-for-videos

Running

App Files Files Community

csukuangfj commited on Sep 18, 2023

Commit

ea07244

1 Parent(s): ef89ca3

begin to add model

Browse files

Files changed (2) hide show

app.py +24 -2
model.py +38 -0

app.py CHANGED Viewed

@@ -22,6 +22,7 @@
 import logging
 import gradio as gr
 title = "# Next-gen Kaldi: Generate subtitles for videos"
@@ -51,6 +52,14 @@ css = """
 """
 def build_html_output(s: str, style: str = "result_item_success"):
     return f"""
     <div class='result'>
@@ -63,6 +72,7 @@ def build_html_output(s: str, style: str = "result_item_success"):
 def process_uploaded_file(
     language: str,
     in_filename: str,
 ):
     if in_filename is None or in_filename == "":
@@ -82,7 +92,7 @@ demo = gr.Blocks(css=css)
 with demo:
     gr.Markdown(title)
-    language_choices = ["English", "Chinese"]
     language_radio = gr.Radio(
         label="Language",
@@ -90,12 +100,23 @@ with demo:
         value=language_choices[0],
     )
     with gr.Tabs():
         with gr.TabItem("Upload video from disk"):
             uploaded_file = gr.Video(
                 source="upload",
                 interactive=True,
-                type="filepath",
                 label="Upload from disk",
             )
             upload_button = gr.Button("Submit for recognition")
@@ -106,6 +127,7 @@ with demo:
             process_uploaded_file,
             inputs=[
                 language_radio,
                 uploaded_file,
             ],
             outputs=[uploaded_output, uploaded_html_info],

 import logging
 import gradio as gr
+from model import language_to_models
 title = "# Next-gen Kaldi: Generate subtitles for videos"
 """
+def update_model_dropdown(language: str):
+    if language in language_to_models:
+        choices = language_to_models[language]
+        return gr.Dropdown.update(choices=choices, value=choices[0])
+    raise ValueError(f"Unsupported language: {language}")
 def build_html_output(s: str, style: str = "result_item_success"):
     return f"""
     <div class='result'>
 def process_uploaded_file(
     language: str,
+    repo_id: str,
     in_filename: str,
 ):
     if in_filename is None or in_filename == "":
 with demo:
     gr.Markdown(title)
+    language_choices = list(language_to_models.keys())
     language_radio = gr.Radio(
         label="Language",
         value=language_choices[0],
     )
+    model_dropdown = gr.Dropdown(
+        choices=language_to_models[language_choices[0]],
+        label="Select a model",
+        value=language_to_models[language_choices[0]][0],
+    )
+    language_radio.change(
+        update_model_dropdown,
+        inputs=language_radio,
+        outputs=model_dropdown,
+    )
     with gr.Tabs():
         with gr.TabItem("Upload video from disk"):
             uploaded_file = gr.Video(
                 source="upload",
                 interactive=True,
                 label="Upload from disk",
             )
             upload_button = gr.Button("Submit for recognition")
             process_uploaded_file,
             inputs=[
                 language_radio,
+                model_dropdown,
                 uploaded_file,
             ],
             outputs=[uploaded_output, uploaded_html_info],

model.py ADDED Viewed

	@@ -0,0 +1,38 @@

+# Copyright      2022-2023  Xiaomi Corp.        (authors: Fangjun Kuang)
+#
+# See LICENSE for clarification regarding multiple authors
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+from huggingface_hub import hf_hub_download
+english_models = {
+    "whisper-tiny.en": _get_whisper_model,
+    "whisper-base.en": _get_whisper_model,
+    "whisper-small.en": _get_whisper_model,
+}
+chinese_english_mixed_models = {
+    "csukuangfj/sherpa-onnx-paraformer-zh-2023-03-28": _get_paraformer_zh_pre_trained_model,
+}
+russian_models = {
+    "alphacep/vosk-model-ru": _get_russian_pre_trained_model,
+    "alphacep/vosk-model-small-ru": _get_russian_pre_trained_model,
+}
+language_to_models = {
+    "English": list(english_models.keys()),
+    "Chinese+English": list(chinese_english_mixed_models.keys()),
+    "Russian": list(russian_models.keys()),
+}