Spaces:

abnerh
/

video-to-subs

Paused

abnerh commited on Feb 14, 2022

Commit

953aff6

•

1 Parent(s): d6d4252

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,6 +6,7 @@ from process_audio import segment_audio
 from write_srt import write_to_file
 from clean_text import clean_english, clean_german, clean_spanish
 from transformers import Wav2Vec2Processor, Wav2Vec2ForCTC
 import torch
 import gradio as gr
@@ -14,13 +15,13 @@ english_model = "facebook/wav2vec2-large-960h-lv60-self"
 english_tokenizer = Wav2Vec2Processor.from_pretrained(english_model)
 english_asr_model = Wav2Vec2ForCTC.from_pretrained(english_model)
-german_model = "jonatasgrosman/wav2vec2-large-xlsr-53-german"
-german_tokenizer = Wav2Vec2Processor.from_pretrained(german_model)
-german_asr_model = Wav2Vec2ForCTC.from_pretrained(german_model)
 spanish_model = "patrickvonplaten/wav2vec2-large-xlsr-53-spanish-with-lm"
-spanish_tokenizer = Wav2Vec2Processor.from_pretrained(spanish_model)
-spanish_asr_model = Wav2Vec2ForCTC.from_pretrained(spanish_model)
 # Get German corpus and update nltk
 command = ["python", "-m", "textblob.download_corpora"]

 from write_srt import write_to_file
 from clean_text import clean_english, clean_german, clean_spanish
 from transformers import Wav2Vec2Processor, Wav2Vec2ForCTC
+from transformers import AutoModelForCTC, AutoProcessor
 import torch
 import gradio as gr
 english_tokenizer = Wav2Vec2Processor.from_pretrained(english_model)
 english_asr_model = Wav2Vec2ForCTC.from_pretrained(english_model)
+german_model = "flozi00/wav2vec2-large-xlsr-53-german-with-lm"
+german_tokenizer = AutoProcessor.from_pretrained(german_model)
+german_asr_model = AutoModelForCTC.from_pretrained(german_model)
 spanish_model = "patrickvonplaten/wav2vec2-large-xlsr-53-spanish-with-lm"
+spanish_tokenizer = AutoProcessor.from_pretrained(spanish_model)
+spanish_asr_model = AutoModelForCTC.from_pretrained(spanish_model)
 # Get German corpus and update nltk
 command = ["python", "-m", "textblob.download_corpora"]