Marxav
/

wav2vec2-large-xlsr-53-breton

Automatic Speech Recognition

xlsr-fine-tuning-week

Inference Endpoints

Model card Files Files and versions Community

Marxav commited on Apr 1, 2021

Commit

0df6f44

•

1 Parent(s): 27f961c

Fix double backslashs

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -39,7 +39,7 @@ model = Wav2Vec2ForCTC.from_pretrained("Marxav/wav2vec2-large-xlsr-53-breton")
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
-chars_to_ignore_regex = '[\\\\\\\\,\\\\,\\\\?\\\\.\\\\!\\\\;\\\\:\\\\"\\\\“\\\\%\\\\”\\\\�\\\\(\\\\)\\\\/\\\\«\\\\»\\\\½\\\\…]'
 # Preprocessing the datasets.
 # We need to read the audio files as arrays
@@ -67,7 +67,7 @@ print("Reference:", test_dataset["sentence"][:nb_samples])
 ```
 The above code leads to the following prediction for the first two samples:
 * Prediction: ["nel ler ket dont abenn eus netra la vez ser mirc'hid evel sij", 'an eil hag egile']
-* Reference: ['"N\\\\\\\\'haller ket dont a-benn eus netra pa vezer nec\\\\\\\\'het evel-se."', 'An eil hag egile.']
 The model can be evaluated as follows on the {language} test data of Common Voice.
 ```python
@@ -85,7 +85,7 @@ processor = Wav2Vec2Processor.from_pretrained('Marxav/wav2vec2-large-xlsr-53-bre
 model = Wav2Vec2ForCTC.from_pretrained('Marxav/wav2vec2-large-xlsr-53-breton2')
 model.to("cuda")
-chars_to_ignore_regex = '[\\\\\\\\,\\\\,\\\\?\\\\.\\\\!\\\\;\\\\:\\\\"\\\\“\\\\%\\\\”\\\\�\\\\(\\\\)\\\\/\\\\«\\\\»\\\\½\\\\…]'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)

 resampler = torchaudio.transforms.Resample(48_000, 16_000)
+chars_to_ignore_regex = '[\\,\,\?\.\!\;\:\"\“\%\”\�\(\)\/\«\»\½\…]'
 # Preprocessing the datasets.
 # We need to read the audio files as arrays
 ```
 The above code leads to the following prediction for the first two samples:
 * Prediction: ["nel ler ket dont abenn eus netra la vez ser mirc'hid evel sij", 'an eil hag egile']
+* Reference: ["N'haller ket dont a-benn eus netra pa vezer nec'het evel-se ", 'An eil hag egile ']
 The model can be evaluated as follows on the {language} test data of Common Voice.
 ```python
 model = Wav2Vec2ForCTC.from_pretrained('Marxav/wav2vec2-large-xlsr-53-breton2')
 model.to("cuda")
+chars_to_ignore_regex = '[\\,\,\?\.\!\;\:\"\“\%\”\�\(\)\/\«\»\½\…]'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)