Dumiiii
/

wav2vec2-xls-r-300m-romanian

Automatic Speech Recognition

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Dumiiii commited on Jan 17, 2022

Commit

a8857e4

·

1 Parent(s): 408febd

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -8,7 +8,7 @@ model-index:
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
-## This model achieves WER on common-voice ro test split of WER: 14.602631%
 # wav2vec2-xls-r-300m-romanian
 This model is a fine-tuned version of [facebook/wav2vec2-xls-r-300m](https://huggingface.co/facebook/wav2vec2-xls-r-300m) on an common voice ro and RSS dataset.
@@ -73,7 +73,7 @@ processor = Wav2Vec2Processor.from_pretrained("Dumiiii/wav2vec2-xls-r-300m-roman
 model = Wav2Vec2ForCTC.from_pretrained("Dumiiii/wav2vec2-xls-r-300m-romanian")
 model.to("cuda")
-chars_to_ignore_regex = '[\\\\\\\\,\\\\\\\\?\\\\\\\\.\\\\\\\\!\\\\\\\\-\\\\\\\\;\\\\\\\\:\\\\\\\\"\\\\\\\\â€œ]'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 # Preprocessing the datasets.

 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
+## This model achieves WER on common-voice ro test split of WER: 12.457178%
 # wav2vec2-xls-r-300m-romanian
 This model is a fine-tuned version of [facebook/wav2vec2-xls-r-300m](https://huggingface.co/facebook/wav2vec2-xls-r-300m) on an common voice ro and RSS dataset.
 model = Wav2Vec2ForCTC.from_pretrained("Dumiiii/wav2vec2-xls-r-300m-romanian")
 model.to("cuda")
+chars_to_ignore_regex = '['+string.punctuation+']'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 # Preprocessing the datasets.