Spaces:

philipp-zettl
/

lit-speech-recognition

Sleeping

philipp-zettl commited on Jul 25, 2024

Commit

91d1b63

verified ·

1 Parent(s): aad3791

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,11 @@
 import gradio as gr
 import whisper
-from transformers import pipeline
 model_name = "Aismantas/whisper-base-lithuanian"
 asr_pipeline = pipeline("automatic-speech-recognition", model=model_name)
@@ -9,7 +13,8 @@ asr_pipeline = pipeline("automatic-speech-recognition", model=model_name)
 def transcribe(filepath):
     # Assuming the file is named 'audio.wav'
     # Run the transcription
-    return asr_pipeline(filepath)
 demo = gr.Interface(fn=transcribe, inputs=[gr.Audio(type='filepath')], outputs="text")

 import gradio as gr
 import whisper
+from transformers import MarianMTModel, MarianTokenizer, pipeline
+model_name = "Helsinki-NLP/opus-mt-tc-big-lt-en"
+tokenizer = MarianTokenizer.from_pretrained(model_name)
+translation_model = MarianMTModel.from_pretrained(model_name)
 model_name = "Aismantas/whisper-base-lithuanian"
 asr_pipeline = pipeline("automatic-speech-recognition", model=model_name)
 def transcribe(filepath):
     # Assuming the file is named 'audio.wav'
     # Run the transcription
+    transcript = asr_pipeline(filepath)
+    return translation_model.generate(**tokenizer(transcript['text'], return_tensors="pt", padding=True))
 demo = gr.Interface(fn=transcribe, inputs=[gr.Audio(type='filepath')], outputs="text")