joaoalvarenga
/

wav2vec2-large-xlsr-portuguese

Automatic Speech Recognition

portuguese-speech-corpus

xlsr-fine-tuning-week

Inference Endpoints

Model card Files Files and versions Community

joaoalvarenga commited on Mar 24, 2021

Commit

2c9efbe

•

1 Parent(s): fc61f67

Update README.md

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -49,8 +49,8 @@ from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
 test_dataset = load_dataset("common_voice", "pt", split="test[:2%]")
-processor = Wav2Vec2Processor.from_pretrained("joorock12/wav2vec2-large-xlsr-53-portuguese")
-model = Wav2Vec2ForCTC.from_pretrained("joorock12/wav2vec2-large-xlsr-53-portuguese")
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
@@ -89,11 +89,11 @@ import re
 test_dataset = load_dataset("common_voice", "pt", split="test")
 wer = load_metric("wer")
-processor = Wav2Vec2Processor.from_pretrained("joorock12/wav2vec2-large-xlsr-53-portuguese")
-model = Wav2Vec2ForCTC.from_pretrained("joorock12/wav2vec2-large-xlsr-53-portuguese")
 model.to("cuda")
-chars_to_ignore_regex = '[\\\\,\\\\?\\\\.\\\\!\\\\-\\\\;\\\\:\\\\"\\\\“]'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 # Preprocessing the datasets.

 test_dataset = load_dataset("common_voice", "pt", split="test[:2%]")
+processor = Wav2Vec2Processor.from_pretrained("joorock12/wav2vec2-large-xlsr-portuguese")
+model = Wav2Vec2ForCTC.from_pretrained("joorock12/wav2vec2-large-xlsr-portuguese")
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 test_dataset = load_dataset("common_voice", "pt", split="test")
 wer = load_metric("wer")
+processor = Wav2Vec2Processor.from_pretrained("joorock12/wav2vec2-large-xlsr-portuguese")
+model = Wav2Vec2ForCTC.from_pretrained("joorock12/wav2vec2-large-xlsr-portuguese")
 model.to("cuda")
+chars_to_ignore_regex = '[\,\?\.\!\-\;\:\"\“\'\�]'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 # Preprocessing the datasets.