asr-inference

Running on Zero

App Files Files Community

Ankush Rana commited on Mar 6, 2024

Commit

5208902

1 Parent(s): 94ca74e

fix bug wav audio int8

Browse files

Files changed (2) hide show

app.py +7 -21
requirements.txt +1 -0

app.py CHANGED Viewed

@@ -4,6 +4,7 @@ import gradio as gr
 import yt_dlp as youtube_dl
 from transformers import pipeline
 from transformers.pipelines.audio_utils import ffmpeg_read
 import tempfile
 import os
@@ -26,11 +27,11 @@ def transcribe(inputs, task):
         raise gr.Error("Cap fitxer d'àudio introduit! Si us plau pengeu un fitxer "\
                        "o enregistreu un àudio abans d'enviar la vostra sol·licitud")
     text = pipe(inputs, batch_size=BATCH_SIZE, generate_kwargs={"task": task}, return_timestamps=True)["text"]
     return  text
-demo = gr.Blocks()
 description_string = "Transcripció automatica de micròfon o de fitxers d'audio.\n Aquest demostrador está desenvolupat per"\
               " comprovar els models de reconeixement de parla pels móbils. Per ara utilitza el checkpoint "\
               f"[{MODEL_NAME}](https://huggingface.co/{MODEL_NAME}) i la llibreria de 🤗 Transformers per la transcripció."
@@ -38,33 +39,18 @@ description_string = "Transcripció automatica de micròfon o de fitxers d'audio
 file_transcribe = gr.Interface(
     fn=transcribe,
     inputs=[
-        gr.inputs.Audio(source="upload", type="filepath", optional=True, label="Audio file"),
-        gr.inputs.Radio(["transcribe", "translate"], label="Task", default="transcribe"),
     ],
     outputs="text",
-    layout="horizontal",
-    theme="huggingface",
     title="Transcripció automàtica d'àudio",
     description=(description_string),
     allow_flagging="never",
 )
-mf_transcribe = gr.Interface(
-    fn=transcribe,
-    inputs=[
-        gr.inputs.Audio(source="microphone", type="filepath", optional=True),
-        gr.inputs.Radio(["transcribe", "translate"], label="Task", default="transcribe"),
-    ],
-    outputs="text",
-    layout="horizontal",
-    theme="huggingface",
-    title="Whisper Large V3: Transcribe Audio",
-    description=(description_string),
-    allow_flagging="never",
-)
-with demo:
-    gr.TabbedInterface([file_transcribe, mf_transcribe], ["Fitxer d'Àudio", "Micròfon"])
-demo.launch(enable_queue=True)

 import yt_dlp as youtube_dl
 from transformers import pipeline
 from transformers.pipelines.audio_utils import ffmpeg_read
+from AinaTheme import theme
 import tempfile
 import os
         raise gr.Error("Cap fitxer d'àudio introduit! Si us plau pengeu un fitxer "\
                        "o enregistreu un àudio abans d'enviar la vostra sol·licitud")
     text = pipe(inputs, batch_size=BATCH_SIZE, generate_kwargs={"task": task}, return_timestamps=True)["text"]
     return  text
 description_string = "Transcripció automatica de micròfon o de fitxers d'audio.\n Aquest demostrador está desenvolupat per"\
               " comprovar els models de reconeixement de parla pels móbils. Per ara utilitza el checkpoint "\
               f"[{MODEL_NAME}](https://huggingface.co/{MODEL_NAME}) i la llibreria de 🤗 Transformers per la transcripció."
 file_transcribe = gr.Interface(
     fn=transcribe,
     inputs=[
+        gr.Audio(sources=["upload", "microphone"], type="filepath", label="Audio"),
+        gr.Radio(["transcribe", "translate"], label="Task", value="transcribe"),
     ],
     outputs="text",
     title="Transcripció automàtica d'àudio",
     description=(description_string),
     allow_flagging="never",
 )
+demo = gr.TabbedInterface([file_transcribe], ["Fitxer"], theme=theme)
+if __name__ == "__main__":
+    demo.launch()

requirements.txt CHANGED Viewed

@@ -1,3 +1,4 @@
 git+https://github.com/huggingface/transformers
 torch
 yt-dlp

 git+https://github.com/huggingface/transformers
 torch
 yt-dlp
+gradio==4.20.0