birgermoell commited on
Commit
1d6f694
1 Parent(s): f185505

Updated alphabet

Browse files
Files changed (3) hide show
  1. alphabet.json +1 -3
  2. lm.py +0 -3
  3. preprocessor_config.json +4 -1
alphabet.json CHANGED
@@ -1,3 +1 @@
1
- {"labels": ["'", " ", "1", "A", "0", "Z", "S", "E", "K", "3", "Ö", "V", "H", "X", "Å", "M", "C", "8", "R", "J", "I", "5", "6", "U", "P", "D", "Q", "N", "4", "2", "B", "W", "7", "", "G", "F", "T", "Ä", "L", "O", "Y", "É", "9", "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v", "w", "x", "y", "z", "\u00e4", "\u00e5", "\u00e9", "\u00f4", "\u00f6", "\u00fc", "\u2047", "", "<s>", "</s>"], "is_bpe": false}
2
-
3
-
 
1
+ {"labels": ["", "R", "Z", "<s>", " ", "0", "9", "G", "F", "3", "L", "E", "Y", "Å", "A", "U", "J", "X", "T", "I", "M", "P", "N", "B", "É", "7", "</s>", "Ä", "1", "4", "C", "Ö", "", "H", "V", "'", "5", "K", "W", "Q", "O", "6", "2", "8", "D", "S"], "is_bpe": false}
 
 
lm.py CHANGED
@@ -22,8 +22,5 @@ input_values = processor(resampled_audio, return_tensors="pt").input_values
22
 
23
  with torch.no_grad():
24
  logits = model(input_values).logits
25
- import pdb
26
- pdb.set_trace()
27
-
28
  transcription = processor.batch_decode(logits.numpy()).text
29
  print(transcription)
 
22
 
23
  with torch.no_grad():
24
  logits = model(input_values).logits
 
 
 
25
  transcription = processor.batch_decode(logits.numpy()).text
26
  print(transcription)
preprocessor_config.json CHANGED
@@ -5,5 +5,8 @@
5
  "padding_side": "right",
6
  "padding_value": 0,
7
  "return_attention_mask": true,
8
- "sampling_rate": 16000
 
9
  }
 
 
 
5
  "padding_side": "right",
6
  "padding_value": 0,
7
  "return_attention_mask": true,
8
+ "sampling_rate": 16000,
9
+ "processor_class": "Wav2Vec2ProcessorWithLM"
10
  }
11
+
12
+