vumichien
/

wav2vec2-large-xlsr-japanese

Automatic Speech Recognition

xlsr-fine-tuning-week

Inference Endpoints

Model card Files Files and versions Community

patrickvonplaten commited on Mar 30, 2021

Commit

ded564d

·

1 Parent(s): bdbf2fe

Update README.md

Files changed (1) hide show

README.md +4 -2

README.md CHANGED Viewed

@@ -37,10 +37,11 @@ import librosa
 from datasets import load_dataset
 import MeCab
 from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
 # config
 wakati = MeCab.Tagger("-Owakati")
-chars_to_ignore_regex = '[\\\\\\\\,\\\\\\\\、\\\\\\\\。\\\\\\\\．\\\\\\\\「\\\\\\\\」\\\\\\\\…\\\\\\\\？\\\\\\\\・]'
 # load data, processor and model
 test_dataset = load_dataset("common_voice", "ja", split="test[:2%]")
@@ -76,10 +77,11 @@ import torchaudio
 from datasets import load_dataset, load_metric
 import MeCab
 from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
 #config
 wakati = MeCab.Tagger("-Owakati")
-chars_to_ignore_regex = '[\\\\\\\\,\\\\\\\\、\\\\\\\\。\\\\\\\\．\\\\\\\\「\\\\\\\\」\\\\\\\\…\\\\\\\\？\\\\\\\\・]'
 # load data, processor and model
 test_dataset = load_dataset("common_voice", "ja", split="test")

 from datasets import load_dataset
 import MeCab
 from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
+import re
 # config
 wakati = MeCab.Tagger("-Owakati")
+chars_to_ignore_regex = '[\\\\\\\\\\\\\\\\,\\\\\\\\\\\\\\\\、\\\\\\\\\\\\\\\\。\\\\\\\\\\\\\\\\．\\\\\\\\\\\\\\\\「\\\\\\\\\\\\\\\\」\\\\\\\\\\\\\\\\…\\\\\\\\\\\\\\\\？\\\\\\\\\\\\\\\\・]'
 # load data, processor and model
 test_dataset = load_dataset("common_voice", "ja", split="test[:2%]")
 from datasets import load_dataset, load_metric
 import MeCab
 from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
+import re
 #config
 wakati = MeCab.Tagger("-Owakati")
+chars_to_ignore_regex = '[\\\\\\\\\\\\\\\\,\\\\\\\\\\\\\\\\、\\\\\\\\\\\\\\\\。\\\\\\\\\\\\\\\\．\\\\\\\\\\\\\\\\「\\\\\\\\\\\\\\\\」\\\\\\\\\\\\\\\\…\\\\\\\\\\\\\\\\？\\\\\\\\\\\\\\\\・]'
 # load data, processor and model
 test_dataset = load_dataset("common_voice", "ja", split="test")