bmilde commited on
Commit
27b48ee
1 Parent(s): 123d423

Update model

Browse files
Files changed (21) hide show
  1. README.md +1324 -0
  2. data/de_token_list/bpe_unigram1024/bpe.model +3 -0
  3. exp/asr_stats_raw_de_bpe1024/train/feats_stats.npz +3 -0
  4. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/RESULTS.md +29 -0
  5. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/config.yaml +1224 -0
  6. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/acc.png +0 -0
  7. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/backward_time.png +0 -0
  8. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/cer.png +0 -0
  9. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/cer_ctc.png +0 -0
  10. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/forward_time.png +0 -0
  11. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/gpu_max_cached_mem_GB.png +0 -0
  12. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/iter_time.png +0 -0
  13. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/loss.png +0 -0
  14. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/loss_att.png +0 -0
  15. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/loss_ctc.png +0 -0
  16. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/optim0_lr0.png +0 -0
  17. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/optim_step_time.png +0 -0
  18. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/train_time.png +0 -0
  19. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/wer.png +0 -0
  20. exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/valid.acc.ave_10best.pth +3 -0
  21. meta.yaml +8 -0
README.md ADDED
@@ -0,0 +1,1324 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - espnet
4
+ - audio
5
+ - automatic-speech-recognition
6
+ language: de
7
+ datasets:
8
+ - speechcatcher
9
+ license: cc-by-4.0
10
+ ---
11
+
12
+ ## ESPnet2 ASR model
13
+
14
+ ### `speechcatcher/speechcatcher_german_espnet_streaming_transformer_13k_train_size_l_raw_de_bpe1024`
15
+
16
+ This model was trained by bmilde using speechcatcher recipe in [espnet](https://github.com/espnet/espnet/).
17
+
18
+ ### Demo: How to use in ESPnet2
19
+
20
+ Follow the [ESPnet installation instructions](https://espnet.github.io/espnet/installation.html)
21
+ if you haven't done that already.
22
+
23
+ ```bash
24
+ cd espnet
25
+ git checkout df10e664a3e1a3cbbe8363b1d93e94ad5d8b147f
26
+ pip install -e .
27
+ cd egs2/speechcatcher/asr1
28
+ ./run.sh --skip_data_prep false --skip_train true --download_model speechcatcher/speechcatcher_german_espnet_streaming_transformer_13k_train_size_l_raw_de_bpe1024
29
+ ```
30
+
31
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
32
+ # RESULTS
33
+ ## Environments
34
+ - date: `Mon Feb 20 01:09:18 UTC 2023`
35
+ - python version: `3.10.8 (main, Nov 4 2022, 13:48:29) [GCC 11.2.0]`
36
+ - espnet version: `espnet 202211`
37
+ - pytorch version: `pytorch 1.12.1+cu116`
38
+ - Git hash: `df10e664a3e1a3cbbe8363b1d93e94ad5d8b147f`
39
+ - Commit date: `Fri Feb 3 13:38:18 2023 +0000`
40
+
41
+ ## asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024
42
+ ### WER
43
+
44
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
45
+ |---|---|---|---|---|---|---|---|---|
46
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|2497|260537|70.1|22.4|7.5|5.5|35.4|99.8|
47
+
48
+ ### CER
49
+
50
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
51
+ |---|---|---|---|---|---|---|---|---|
52
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|2497|1569438|86.7|5.2|8.0|5.2|18.5|99.8|
53
+
54
+ ### TER
55
+
56
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
57
+ |---|---|---|---|---|---|---|---|---|
58
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|2497|512776|75.5|15.6|8.9|5.9|30.4|99.8|
59
+
60
+ ## ASR config
61
+
62
+ <details><summary>expand</summary>
63
+
64
+ ```
65
+ config: conf/train_asr_streaming_transformer_size_l.yaml
66
+ print_config: false
67
+ log_level: INFO
68
+ dry_run: false
69
+ iterator_type: sequence
70
+ output_dir: exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024
71
+ ngpu: 1
72
+ seed: 0
73
+ num_workers: 1
74
+ num_att_plot: 0
75
+ dist_backend: nccl
76
+ dist_init_method: env://
77
+ dist_world_size: 4
78
+ dist_rank: 0
79
+ local_rank: 0
80
+ dist_master_addr: localhost
81
+ dist_master_port: 55625
82
+ dist_launcher: null
83
+ multiprocessing_distributed: true
84
+ unused_parameters: false
85
+ sharded_ddp: false
86
+ cudnn_enabled: true
87
+ cudnn_benchmark: false
88
+ cudnn_deterministic: true
89
+ collect_stats: false
90
+ write_collected_feats: false
91
+ max_epoch: 20
92
+ patience: 3
93
+ val_scheduler_criterion:
94
+ - valid
95
+ - acc
96
+ early_stopping_criterion:
97
+ - valid
98
+ - acc
99
+ - max
100
+ best_model_criterion:
101
+ - - valid
102
+ - acc
103
+ - max
104
+ keep_nbest_models: 10
105
+ nbest_averaging_interval: 0
106
+ grad_clip: 5
107
+ grad_clip_type: 2.0
108
+ grad_noise: false
109
+ accum_grad: 1
110
+ no_forward_run: false
111
+ resume: true
112
+ train_dtype: float32
113
+ use_amp: false
114
+ log_interval: null
115
+ use_matplotlib: true
116
+ use_tensorboard: true
117
+ create_graph_in_tensorboard: false
118
+ use_wandb: false
119
+ wandb_project: null
120
+ wandb_id: null
121
+ wandb_entity: null
122
+ wandb_name: null
123
+ wandb_model_log_interval: -1
124
+ detect_anomaly: false
125
+ pretrain_path: null
126
+ init_param: []
127
+ ignore_init_mismatch: false
128
+ freeze_param: []
129
+ num_iters_per_epoch: null
130
+ batch_size: 64
131
+ valid_batch_size: null
132
+ batch_bins: 1000000
133
+ valid_batch_bins: null
134
+ train_shape_file:
135
+ - exp/asr_stats_raw_de_bpe1024/train/speech_shape
136
+ - exp/asr_stats_raw_de_bpe1024/train/text_shape.bpe
137
+ valid_shape_file:
138
+ - exp/asr_stats_raw_de_bpe1024/valid/speech_shape
139
+ - exp/asr_stats_raw_de_bpe1024/valid/text_shape.bpe
140
+ batch_type: folded
141
+ valid_batch_type: null
142
+ fold_length:
143
+ - 80000
144
+ - 150
145
+ sort_in_batch: descending
146
+ sort_batch: descending
147
+ multiple_iterator: false
148
+ chunk_length: 500
149
+ chunk_shift_ratio: 0.5
150
+ num_cache_chunks: 1024
151
+ train_data_path_and_name_and_type:
152
+ - - dump/raw/train/wav.scp
153
+ - speech
154
+ - sound
155
+ - - dump/raw/train/text
156
+ - text
157
+ - text
158
+ valid_data_path_and_name_and_type:
159
+ - - dump/raw/dev/wav.scp
160
+ - speech
161
+ - sound
162
+ - - dump/raw/dev/text
163
+ - text
164
+ - text
165
+ allow_variable_data_keys: false
166
+ max_cache_size: 0.0
167
+ max_cache_fd: 32
168
+ valid_max_cache_size: null
169
+ exclude_weight_decay: false
170
+ exclude_weight_decay_conf: {}
171
+ optim: adam
172
+ optim_conf:
173
+ lr: 0.001
174
+ scheduler: warmuplr
175
+ scheduler_conf:
176
+ warmup_steps: 25000
177
+ token_list:
178
+ - <blank>
179
+ - <unk>
180
+ - ','
181
+ - .
182
+ - t
183
+ - ▁
184
+ - e
185
+ - en
186
+ - s
187
+ - n
188
+ - ▁ich
189
+ - ▁das
190
+ - ▁und
191
+ - ▁die
192
+ - er
193
+ - ▁ist
194
+ - ▁auch
195
+ - ▁so
196
+ - st
197
+ - ▁der
198
+ - ▁nicht
199
+ - ▁es
200
+ - ▁ein
201
+ - r
202
+ - ▁in
203
+ - f
204
+ - ▁dann
205
+ - ▁ja
206
+ - d
207
+ - ▁da
208
+ - g
209
+ - h
210
+ - m
211
+ - o
212
+ - u
213
+ - b
214
+ - ▁wir
215
+ - ▁zu
216
+ - ▁du
217
+ - ▁ge
218
+ - ▁Und
219
+ - i
220
+ - a
221
+ - ▁mit
222
+ - ▁den
223
+ - in
224
+ - ▁man
225
+ - l
226
+ - ▁auf
227
+ - ▁dass
228
+ - sch
229
+ - ▁jetzt
230
+ - '?'
231
+ - ge
232
+ - ▁was
233
+ - ▁er
234
+ - ▁Ja
235
+ - ▁hat
236
+ - '-'
237
+ - p
238
+ - ▁war
239
+ - ▁eine
240
+ - ▁F
241
+ - ▁aber
242
+ - ▁mal
243
+ - ▁oder
244
+ - y
245
+ - ▁noch
246
+ - te
247
+ - ung
248
+ - ▁haben
249
+ - ▁Ich
250
+ - ▁be
251
+ - ▁Das
252
+ - ▁wie
253
+ - ä
254
+ - ▁an
255
+ - ▁habe
256
+ - k
257
+ - ▁von
258
+ - ▁sich
259
+ - ▁K
260
+ - al
261
+ - ▁wenn
262
+ - la
263
+ - ▁schon
264
+ - ig
265
+ - ra
266
+ - lich
267
+ - re
268
+ - de
269
+ - ch
270
+ - ▁für
271
+ - it
272
+ - ▁Also
273
+ - w
274
+ - ▁A
275
+ - es
276
+ - ▁sind
277
+ - ▁ver
278
+ - le
279
+ - or
280
+ - ▁sie
281
+ - ▁B
282
+ - ü
283
+ - ▁also
284
+ - ▁ganz
285
+ - ▁T
286
+ - ▁im
287
+ - ▁dem
288
+ - ter
289
+ - an
290
+ - ck
291
+ - ▁St
292
+ - ▁aus
293
+ - ▁G
294
+ - ▁kann
295
+ - ▁bei
296
+ - ▁halt
297
+ - ▁H
298
+ - el
299
+ - ▁immer
300
+ - z
301
+ - ▁einfach
302
+ - ▁P
303
+ - ö
304
+ - ▁S
305
+ - ▁weil
306
+ - ▁mir
307
+ - se
308
+ - ▁f
309
+ - ut
310
+ - ten
311
+ - ▁wo
312
+ - ▁Sch
313
+ - us
314
+ - ▁vor
315
+ - ur
316
+ - ▁sehr
317
+ - ri
318
+ - kt
319
+ - ing
320
+ - ▁E
321
+ - il
322
+ - ▁gut
323
+ - ▁mich
324
+ - ▁Aber
325
+ - 'on'
326
+ - und
327
+ - cht
328
+ - ▁als
329
+ - den
330
+ - ar
331
+ - ie
332
+ - um
333
+ - ▁uns
334
+ - ste
335
+ - ▁Da
336
+ - hr
337
+ - ▁über
338
+ - be
339
+ - ▁einen
340
+ - ▁Be
341
+ - ▁ihr
342
+ - is
343
+ - ▁wieder
344
+ - ▁glaube
345
+ - ▁Ge
346
+ - at
347
+ - ▁irgendwie
348
+ - li
349
+ - ▁nur
350
+ - we
351
+ - ro
352
+ - ▁bisschen
353
+ - he
354
+ - ▁mehr
355
+ - ▁M
356
+ - tz
357
+ - ▁muss
358
+ - gen
359
+ - ▁sagen
360
+ - ben
361
+ - ▁wirklich
362
+ - ▁alle
363
+ - nd
364
+ - ▁wird
365
+ - ▁gibt
366
+ - ▁um
367
+ - ▁m
368
+ - ▁natürlich
369
+ - ▁viel
370
+ - me
371
+ - nt
372
+ - et
373
+ - ▁diese
374
+ - ▁U
375
+ - '0'
376
+ - ▁sein
377
+ - ▁nach
378
+ - ▁hier
379
+ - ▁meine
380
+ - ern
381
+ - lo
382
+ - ion
383
+ - ▁eigentlich
384
+ - ▁O
385
+ - ▁machen
386
+ - ▁bin
387
+ - ▁So
388
+ - ll
389
+ - ▁hast
390
+ - ▁weiß
391
+ - ▁Re
392
+ - c
393
+ - ▁I
394
+ - ▁sch
395
+ - ▁C
396
+ - ▁vielleicht
397
+ - iert
398
+ - ach
399
+ - ▁b
400
+ - ne
401
+ - x
402
+ - ze
403
+ - rei
404
+ - ru
405
+ - ma
406
+ - ▁zum
407
+ - ▁finde
408
+ - ß
409
+ - ▁N
410
+ - ▁Die
411
+ - rt
412
+ - ich
413
+ - ▁Ma
414
+ - uch
415
+ - ▁eben
416
+ - rü
417
+ - ▁Ver
418
+ - ein
419
+ - ▁In
420
+ - R
421
+ - ieren
422
+ - ▁Ha
423
+ - ssen
424
+ - ft
425
+ - chen
426
+ - am
427
+ - di
428
+ - der
429
+ - hl
430
+ - ▁Es
431
+ - ▁gesagt
432
+ - zu
433
+ - ▁ne
434
+ - ▁An
435
+ - ▁k
436
+ - ▁1
437
+ - ▁am
438
+ - hn
439
+ - ▁gerade
440
+ - pp
441
+ - her
442
+ - ▁alles
443
+ - nen
444
+ - ▁geht
445
+ - ▁genau
446
+ - ha
447
+ - ▁Jahr
448
+ - ▁re
449
+ - ▁werden
450
+ - ▁w
451
+ - ▁Z
452
+ - isch
453
+ - ▁p
454
+ - ▁Er
455
+ - ke
456
+ - ▁Wir
457
+ - au
458
+ - mm
459
+ - ik
460
+ - ▁mein
461
+ - ▁dir
462
+ - ▁einem
463
+ - un
464
+ - ▁würde
465
+ - ▁We
466
+ - ▁zwei
467
+ - v
468
+ - ▁doch
469
+ - ▁keine
470
+ - ▁erst
471
+ - na
472
+ - and
473
+ - ▁gar
474
+ - ▁hin
475
+ - ▁durch
476
+ - ▁V
477
+ - kommen
478
+ - ell
479
+ - ul
480
+ - end
481
+ - ▁können
482
+ - j
483
+ - fe
484
+ - ▁richtig
485
+ - ff
486
+ - ▁Me
487
+ - ▁andere
488
+ - lie
489
+ - '...'
490
+ - wi
491
+ - ol
492
+ - art
493
+ - ▁Leute
494
+ - ▁Zeit
495
+ - ▁Ein
496
+ - ran
497
+ - ner
498
+ - ▁ab
499
+ - nk
500
+ - ation
501
+ - ▁viele
502
+ - ▁g
503
+ - S
504
+ - rie
505
+ - ▁ob
506
+ - im
507
+ - ver
508
+ - ür
509
+ - rk
510
+ - ▁einer
511
+ - men
512
+ - ▁ent
513
+ - iv
514
+ - lei
515
+ - ▁gemacht
516
+ - sp
517
+ - ▁hatte
518
+ - ▁weiter
519
+ - sten
520
+ - che
521
+ - ang
522
+ - all
523
+ - ir
524
+ - hör
525
+ - ▁Was
526
+ - aus
527
+ - ier
528
+ - ▁Ne
529
+ - ▁Li
530
+ - ▁hab
531
+ - ass
532
+ - L
533
+ - igen
534
+ - zi
535
+ - ungen
536
+ - ▁Spiel
537
+ - ▁will
538
+ - ▁unter
539
+ - ag
540
+ - ▁macht
541
+ - ber
542
+ - ▁Sp
543
+ - zen
544
+ - ▁denn
545
+ - ken
546
+ - ▁des
547
+ - ▁Ka
548
+ - lle
549
+ - id
550
+ - sen
551
+ - ▁dich
552
+ - ▁st
553
+ - ▁Du
554
+ - ▁kommt
555
+ - spiel
556
+ - ▁Fall
557
+ - ▁Man
558
+ - ▁Se
559
+ - ▁W
560
+ - ▁dieser
561
+ - ▁Ko
562
+ - ga
563
+ - ▁De
564
+ - ▁groß
565
+ - ▁Le
566
+ - ▁schön
567
+ - ▁La
568
+ - ▁jeden
569
+ - ▁D
570
+ - ▁Genau
571
+ - gt
572
+ - ▁dieses
573
+ - ungs
574
+ - ▁J
575
+ - pro
576
+ - ▁Co
577
+ - ▁Beispiel
578
+ - ▁heißt
579
+ - ▁s
580
+ - ist
581
+ - rä
582
+ - ho
583
+ - ▁damit
584
+ - ▁Wo
585
+ - ▁unsere
586
+ - ▁le
587
+ - ert
588
+ - '5'
589
+ - ni
590
+ - tt
591
+ - gel
592
+ - ▁her
593
+ - ve
594
+ - ▁sondern
595
+ - mp
596
+ - reich
597
+ - ▁Sa
598
+ - ''''
599
+ - ▁lang
600
+ - ▁rein
601
+ - ▁neu
602
+ - ▁sagt
603
+ - ▁tatsächlich
604
+ - ▁kein
605
+ - är
606
+ - nehmen
607
+ - ▁bis
608
+ - elt
609
+ - ad
610
+ - teil
611
+ - ▁euch
612
+ - ta
613
+ - ▁a
614
+ - ▁anderen
615
+ - ▁raus
616
+ - op
617
+ - ▁Der
618
+ - ige
619
+ - arbeit
620
+ - ▁Film
621
+ - ▁Ba
622
+ - ▁heute
623
+ - ▁wäre
624
+ - ▁nochmal
625
+ - ▁ange
626
+ - ▁Sie
627
+ - ick
628
+ - ▁of
629
+ - ler
630
+ - ▁un
631
+ - ische
632
+ - weise
633
+ - lä
634
+ - kl
635
+ - ▁Na
636
+ - iß
637
+ - wa
638
+ - ▁wer
639
+ - ▁Ding
640
+ - ▁okay
641
+ - ▁Ra
642
+ - halt
643
+ - ▁we
644
+ - ▁Pa
645
+ - ▁Thema
646
+ - heit
647
+ - ▁ko
648
+ - ▁Dann
649
+ - ▁diesen
650
+ - schaft
651
+ - ▁möchte
652
+ - ▁hätte
653
+ - lu
654
+ - ▁Al
655
+ - bar
656
+ - ▁Tag
657
+ - mo
658
+ - ▁Wie
659
+ - ▁waren
660
+ - ▁sp
661
+ - ▁wurde
662
+ - ▁Auf
663
+ - ce
664
+ - ▁Frage
665
+ - ▁kannst
666
+ - wo
667
+ - ▁Mi
668
+ - ▁deine
669
+ - ▁To
670
+ - mi
671
+ - ▁dazu
672
+ - äng
673
+ - ▁bist
674
+ - ischen
675
+ - ▁Mo
676
+ - ▁ihn
677
+ - 'no'
678
+ - zieh
679
+ - ▁Ab
680
+ - ▁kommen
681
+ - ▁Menschen
682
+ - anz
683
+ - ▁Wenn
684
+ - ▁ha
685
+ - ▁Vor
686
+ - ▁Ro
687
+ - stell
688
+ - ▁Zu
689
+ - ▁je
690
+ - rau
691
+ - eln
692
+ - ab
693
+ - hin
694
+ - ka
695
+ - schau
696
+ - ▁Pro
697
+ - ger
698
+ - P
699
+ - ▁Bo
700
+ - ▁gerne
701
+ - ko
702
+ - nis
703
+ - ▁drei
704
+ - ▁gleich
705
+ - ld
706
+ - ▁klar
707
+ - ack
708
+ - ▁Aus
709
+ - ün
710
+ - ▁nie
711
+ - A
712
+ - ▁tr
713
+ - ▁seine
714
+ - ▁Mit
715
+ - geben
716
+ - ▁soll
717
+ - '4'
718
+ - ▁diesem
719
+ - lau
720
+ - ▁müssen
721
+ - ▁kleine
722
+ - ▁kurz
723
+ - mmer
724
+ - ment
725
+ - stellen
726
+ - ▁Wa
727
+ - ▁Podcast
728
+ - ▁Wi
729
+ - ▁the
730
+ - ▁Woche
731
+ - ▁guck
732
+ - ▁quasi
733
+ - ▁Ho
734
+ - mal
735
+ - ▁sei
736
+ - ▁Po
737
+ - krieg
738
+ - aff
739
+ - ▁nächste
740
+ - itz
741
+ - ▁20
742
+ - tag
743
+ - '9'
744
+ - ▁Ende
745
+ - richt
746
+ - uck
747
+ - ör
748
+ - ▁2
749
+ - dem
750
+ - mpf
751
+ - vi
752
+ - 'off'
753
+ - ▁Leben
754
+ - ▁wichtig
755
+ - ▁gesehen
756
+ - ▁gehen
757
+ - ress
758
+ - ▁sag
759
+ - M
760
+ - ▁echt
761
+ - ▁etwas
762
+ - stand
763
+ - zähl
764
+ - führ
765
+ - T
766
+ - ▁wenig
767
+ - ▁zusammen
768
+ - ▁paar
769
+ - ▁Di
770
+ - ▁einmal
771
+ - bo
772
+ - ▁sehen
773
+ - ▁Sachen
774
+ - ▁Kon
775
+ - bi
776
+ - ▁dabei
777
+ - gend
778
+ - pass
779
+ - ic
780
+ - ▁könnte
781
+ - ▁Weil
782
+ - zeit
783
+ - ▁denke
784
+ - F
785
+ - ▁Folge
786
+ - man
787
+ - ▁wollte
788
+ - kauf
789
+ - ▁weg
790
+ - ▁3
791
+ - ▁selbst
792
+ - '1'
793
+ - hol
794
+ - co
795
+ - ▁wollen
796
+ - bau
797
+ - '2'
798
+ - B
799
+ - ▁wahrscheinlich
800
+ - ank
801
+ - ▁Mal
802
+ - ▁letzten
803
+ - fahren
804
+ - ▁vom
805
+ - ▁Do
806
+ - hi
807
+ - ▁eher
808
+ - D
809
+ - ▁selber
810
+ - ord
811
+ - ▁super
812
+ - ▁musst
813
+ - ▁drauf
814
+ - ▁jemand
815
+ - '8'
816
+ - ▁gegen
817
+ - ▁überhaupt
818
+ - ▁The
819
+ - ▁Okay
820
+ - ▁beim
821
+ - ▁sage
822
+ - pa
823
+ - ▁dafür
824
+ - vor
825
+ - ▁Frau
826
+ - ▁hatten
827
+ - ▁drin
828
+ - '6'
829
+ - ▁sozusagen
830
+ - iz
831
+ - ▁fand
832
+ - ▁Tra
833
+ - folg
834
+ - ▁Nach
835
+ - ▁tun
836
+ - ▁dein
837
+ - ität
838
+ - C
839
+ - ▁Oder
840
+ - ▁zurück
841
+ - ▁Nein
842
+ - po
843
+ - ▁cool
844
+ - ▁sowas
845
+ - ▁sieht
846
+ - gehen
847
+ - schi
848
+ - ▁Gott
849
+ - ▁schnell
850
+ - form
851
+ - ▁ihm
852
+ - ▁besser
853
+ - ▁gab
854
+ - wä
855
+ - ▁äh
856
+ - ▁Kinder
857
+ - änder
858
+ - ▁sollte
859
+ - ▁Jo
860
+ - ▁voll
861
+ - ▁War
862
+ - ▁kenne
863
+ - ▁zwar
864
+ - ▁total
865
+ - ▁welche
866
+ - ▁passiert
867
+ - ▁Hand
868
+ - fall
869
+ - ▁irgendwann
870
+ - ▁Problem
871
+ - war
872
+ - qu
873
+ - fühl
874
+ - ▁Wer
875
+ - ▁wissen
876
+ - ▁dort
877
+ - ▁jeder
878
+ - ca
879
+ - ▁deswegen
880
+ - sprech
881
+ - ▁davon
882
+ - ▁damals
883
+ - trag
884
+ - ▁nämlich
885
+ - ▁Punkt
886
+ - ▁Welt
887
+ - ▁abge
888
+ - '7'
889
+ - log
890
+ - ▁sogar
891
+ - ▁kam
892
+ - legen
893
+ - ▁Moment
894
+ - igkeit
895
+ - ▁konnte
896
+ - ▁komm
897
+ - ▁gewesen
898
+ - ▁anders
899
+ - ▁Bi
900
+ - K
901
+ - ▁eigene
902
+ - ▁liebe
903
+ - ▁Teil
904
+ - ▁Lo
905
+ - ▁toll
906
+ - ▁Arbeit
907
+ - ▁Seite
908
+ - genommen
909
+ - ▁to
910
+ - ▁alt
911
+ - ▁trotzdem
912
+ - ▁gehört
913
+ - ▁Jetzt
914
+ - ▁mache
915
+ - ▁Dr
916
+ - ▁relativ
917
+ - sicht
918
+ - ▁steht
919
+ - ▁Auto
920
+ - ▁darüber
921
+ - nehm
922
+ - ▁irgendwas
923
+ - ▁ohne
924
+ - ▁Geld
925
+ - ▁Euro
926
+ - ieß
927
+ - suche
928
+ - ▁vier
929
+ - einander
930
+ - ▁Grund
931
+ - ▁Gefühl
932
+ - gestellt
933
+ - ▁sa
934
+ - ativ
935
+ - G
936
+ - ▁darauf
937
+ - I
938
+ - ▁All
939
+ - ▁Anfang
940
+ - ▁darf
941
+ - ▁Freund
942
+ - ▁direkt
943
+ - ▁irgendwo
944
+ - ▁letzte
945
+ - ▁schlecht
946
+ - ▁manchmal
947
+ - ▁Bild
948
+ - ▁Geschichte
949
+ - ▁interessant
950
+ - E
951
+ - ▁komplett
952
+ - ▁Ahnung
953
+ - bringen
954
+ - nutz
955
+ - bild
956
+ - ▁frag
957
+ - V
958
+ - ▁Kind
959
+ - ▁meisten
960
+ - ▁gehabt
961
+ - ▁gedacht
962
+ - ▁erstmal
963
+ - ▁fast
964
+ - ▁stimmt
965
+ - '3'
966
+ - laufen
967
+ - ▁bestimmt
968
+ - zahl
969
+ - ▁Über
970
+ - kommt
971
+ - gegangen
972
+ - setzen
973
+ - ▁funktioniert
974
+ - ▁spielen
975
+ - ▁Person
976
+ - ▁Sinn
977
+ - ▁dachte
978
+ - ▁fünf
979
+ - ▁hoch
980
+ - bereit
981
+ - ▁brauche
982
+ - ▁zwischen
983
+ - ▁Spaß
984
+ - ▁spannend
985
+ - ▁ehrlich
986
+ - ▁krass
987
+ - ▁schreib
988
+ - ▁zumindest
989
+ - zeug
990
+ - ▁Musik
991
+ - W
992
+ - fahr
993
+ - ▁solche
994
+ - ▁Deutschland
995
+ - ▁gespielt
996
+ - geschrieben
997
+ - Ä
998
+ - ▁später
999
+ - Y
1000
+ - O
1001
+ - H
1002
+ - '!'
1003
+ - U
1004
+ - N
1005
+ - Q
1006
+ - Ö
1007
+ - X
1008
+ - Z
1009
+ - J
1010
+ - '%'
1011
+ - Ü
1012
+ - é
1013
+ - «
1014
+ - »
1015
+ - '&'
1016
+ - Ã
1017
+ - à
1018
+ - ş
1019
+ - q
1020
+ - ¤
1021
+ - Ÿ
1022
+ - €
1023
+ - è
1024
+ - ı
1025
+ - ç
1026
+ - ú
1027
+ - ë
1028
+ - ¶
1029
+ - á
1030
+ - ć
1031
+ - —
1032
+ - õ
1033
+ - ğ
1034
+ - í
1035
+ - °
1036
+ - ô
1037
+ - _
1038
+ - ó
1039
+ - /
1040
+ - å
1041
+ - $
1042
+ - ́
1043
+ - û
1044
+ - ›
1045
+ - ê
1046
+ - ‹
1047
+ - '"'
1048
+ - ñ
1049
+ - Ş
1050
+ - č
1051
+ - )
1052
+ - É
1053
+ - μ
1054
+ - ø
1055
+ - š
1056
+ - о
1057
+ - ł
1058
+ - ù
1059
+ - ã
1060
+ - ā
1061
+ - ©
1062
+ - а
1063
+ - ':'
1064
+ - е
1065
+ - œ
1066
+ - и
1067
+ - н
1068
+ - â
1069
+ - î
1070
+ - т
1071
+ - ń
1072
+ - р
1073
+ - к
1074
+ - 你
1075
+ - æ
1076
+ - „
1077
+ - Č
1078
+ - с
1079
+ - ♪
1080
+ - д
1081
+ - Š
1082
+ - в
1083
+ - ï
1084
+ - İ
1085
+ - л
1086
+ - À
1087
+ - у
1088
+ - ь
1089
+ - я
1090
+ - м
1091
+ - ę
1092
+ - ś
1093
+ - ž
1094
+ - п
1095
+ - '='
1096
+ - ō
1097
+ - ř
1098
+ - Æ
1099
+ - ш
1100
+ - з
1101
+ - ы
1102
+ - ū
1103
+ - ș
1104
+ - Ø
1105
+ - '~'
1106
+ - ì
1107
+ - ò
1108
+ - ο
1109
+ - ч
1110
+ - г
1111
+ - ý
1112
+ - ̄
1113
+ - ц
1114
+ - Х
1115
+ - ż
1116
+ - З
1117
+ - б
1118
+ - ¡
1119
+ - Н
1120
+ - ă
1121
+ - ̃
1122
+ - К
1123
+ - ж
1124
+ - ไ
1125
+ - ồ
1126
+ - ♫
1127
+ - ر
1128
+ - х
1129
+ - ン
1130
+ - Ç
1131
+ - §
1132
+ - ⁄
1133
+ - +
1134
+ - '*'
1135
+ - Å
1136
+ - і
1137
+ - Á
1138
+ - ī
1139
+ - џ
1140
+ - ู
1141
+ - ;
1142
+ - '>'
1143
+ - Î
1144
+ - ą
1145
+ - Đ
1146
+ - Ȗ
1147
+ - Ε
1148
+ - έ
1149
+ - δ
1150
+ - ι
1151
+ - λ
1152
+ - ς
1153
+ - τ
1154
+ - υ
1155
+ - ύ
1156
+ - О
1157
+ - Т
1158
+ - و
1159
+ - ک
1160
+ - ں
1161
+ - ด
1162
+ - ม
1163
+ - ่
1164
+ - ṣ
1165
+ - “
1166
+ - ♥
1167
+ - き
1168
+ - つ
1169
+ - ぶ
1170
+ - ら
1171
+ - チ
1172
+ - ッ
1173
+ - ホ
1174
+ - ロ
1175
+ - 中
1176
+ - 以
1177
+ - 佢
1178
+ - 利
1179
+ - 厲
1180
+ - 句
1181
+ - 可
1182
+ - 吃
1183
+ - 国
1184
+ - 士
1185
+ - 好
1186
+ - 安
1187
+ - 害
1188
+ - 度
1189
+ - 手
1190
+ - 晃
1191
+ - 法
1192
+ - Ć
1193
+ - ě
1194
+ - Б
1195
+ - ج
1196
+ - 救
1197
+ - ά
1198
+ - –
1199
+ - ダ
1200
+ - 制
1201
+ - <sos/eos>
1202
+ init: null
1203
+ input_size: null
1204
+ ctc_conf:
1205
+ dropout_rate: 0.0
1206
+ ctc_type: builtin
1207
+ reduce: true
1208
+ ignore_nan_grad: null
1209
+ zero_infinity: true
1210
+ joint_net_conf: null
1211
+ use_preprocessor: true
1212
+ token_type: bpe
1213
+ bpemodel: data/de_token_list/bpe_unigram1024/bpe.model
1214
+ non_linguistic_symbols: null
1215
+ cleaner: null
1216
+ g2p: null
1217
+ speech_volume_normalize: null
1218
+ rir_scp: null
1219
+ rir_apply_prob: 1.0
1220
+ noise_scp: null
1221
+ noise_apply_prob: 1.0
1222
+ noise_db_range: '13_15'
1223
+ short_noise_thres: 0.5
1224
+ frontend: default
1225
+ frontend_conf:
1226
+ n_fft: 512
1227
+ win_length: 400
1228
+ hop_length: 160
1229
+ fs: 16k
1230
+ specaug: specaug
1231
+ specaug_conf:
1232
+ apply_time_warp: true
1233
+ time_warp_window: 5
1234
+ time_warp_mode: bicubic
1235
+ apply_freq_mask: true
1236
+ freq_mask_width_range:
1237
+ - 0
1238
+ - 30
1239
+ num_freq_mask: 2
1240
+ apply_time_mask: true
1241
+ time_mask_width_range:
1242
+ - 0
1243
+ - 40
1244
+ num_time_mask: 2
1245
+ normalize: global_mvn
1246
+ normalize_conf:
1247
+ stats_file: exp/asr_stats_raw_de_bpe1024/train/feats_stats.npz
1248
+ model: espnet
1249
+ model_conf:
1250
+ ctc_weight: 0.3
1251
+ lsm_weight: 0.1
1252
+ length_normalized_loss: false
1253
+ preencoder: null
1254
+ preencoder_conf: {}
1255
+ encoder: contextual_block_transformer
1256
+ encoder_conf:
1257
+ output_size: 256
1258
+ attention_heads: 8
1259
+ linear_units: 2048
1260
+ num_blocks: 22
1261
+ dropout_rate: 0.1
1262
+ positional_dropout_rate: 0.1
1263
+ attention_dropout_rate: 0.0
1264
+ input_layer: conv2d
1265
+ normalize_before: true
1266
+ block_size: 40
1267
+ hop_size: 16
1268
+ look_ahead: 16
1269
+ init_average: true
1270
+ ctx_pos_enc: true
1271
+ postencoder: null
1272
+ postencoder_conf: {}
1273
+ decoder: transformer
1274
+ decoder_conf:
1275
+ attention_heads: 8
1276
+ linear_units: 2048
1277
+ num_blocks: 12
1278
+ dropout_rate: 0.1
1279
+ positional_dropout_rate: 0.1
1280
+ self_attention_dropout_rate: 0.0
1281
+ src_attention_dropout_rate: 0.0
1282
+ preprocessor: default
1283
+ preprocessor_conf: {}
1284
+ required:
1285
+ - output_dir
1286
+ - token_list
1287
+ version: '202211'
1288
+ distributed: true
1289
+ ```
1290
+
1291
+ </details>
1292
+
1293
+
1294
+
1295
+ ### Citing ESPnet
1296
+
1297
+ ```BibTex
1298
+ @inproceedings{watanabe2018espnet,
1299
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1300
+ title={{ESPnet}: End-to-End Speech Processing Toolkit},
1301
+ year={2018},
1302
+ booktitle={Proceedings of Interspeech},
1303
+ pages={2207--2211},
1304
+ doi={10.21437/Interspeech.2018-1456},
1305
+ url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
1306
+ }
1307
+
1308
+
1309
+
1310
+
1311
+ ```
1312
+
1313
+ or arXiv:
1314
+
1315
+ ```bibtex
1316
+ @misc{watanabe2018espnet,
1317
+ title={ESPnet: End-to-End Speech Processing Toolkit},
1318
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1319
+ year={2018},
1320
+ eprint={1804.00015},
1321
+ archivePrefix={arXiv},
1322
+ primaryClass={cs.CL}
1323
+ }
1324
+ ```
data/de_token_list/bpe_unigram1024/bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d2a79cd7d5b52001ecfbb2d56d5901ee197083bae6f623d48be9394978644bbc
3
+ size 251740
exp/asr_stats_raw_de_bpe1024/train/feats_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:a7777e6a9c4b89d96ff9ab112217df503f8e9b328a5f24a95518634f500d5111
3
+ size 1402
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/RESULTS.md ADDED
@@ -0,0 +1,29 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
2
+ # RESULTS
3
+ ## Environments
4
+ - date: `Mon Feb 20 01:09:18 UTC 2023`
5
+ - python version: `3.10.8 (main, Nov 4 2022, 13:48:29) [GCC 11.2.0]`
6
+ - espnet version: `espnet 202211`
7
+ - pytorch version: `pytorch 1.12.1+cu116`
8
+ - Git hash: `df10e664a3e1a3cbbe8363b1d93e94ad5d8b147f`
9
+ - Commit date: `Fri Feb 3 13:38:18 2023 +0000`
10
+
11
+ ## asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024
12
+ ### WER
13
+
14
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
15
+ |---|---|---|---|---|---|---|---|---|
16
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|2497|260537|70.1|22.4|7.5|5.5|35.4|99.8|
17
+
18
+ ### CER
19
+
20
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
21
+ |---|---|---|---|---|---|---|---|---|
22
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|2497|1569438|86.7|5.2|8.0|5.2|18.5|99.8|
23
+
24
+ ### TER
25
+
26
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
27
+ |---|---|---|---|---|---|---|---|---|
28
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|2497|512776|75.5|15.6|8.9|5.9|30.4|99.8|
29
+
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/config.yaml ADDED
@@ -0,0 +1,1224 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ config: conf/train_asr_streaming_transformer_size_l.yaml
2
+ print_config: false
3
+ log_level: INFO
4
+ dry_run: false
5
+ iterator_type: sequence
6
+ output_dir: exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024
7
+ ngpu: 1
8
+ seed: 0
9
+ num_workers: 1
10
+ num_att_plot: 0
11
+ dist_backend: nccl
12
+ dist_init_method: env://
13
+ dist_world_size: 4
14
+ dist_rank: 0
15
+ local_rank: 0
16
+ dist_master_addr: localhost
17
+ dist_master_port: 55625
18
+ dist_launcher: null
19
+ multiprocessing_distributed: true
20
+ unused_parameters: false
21
+ sharded_ddp: false
22
+ cudnn_enabled: true
23
+ cudnn_benchmark: false
24
+ cudnn_deterministic: true
25
+ collect_stats: false
26
+ write_collected_feats: false
27
+ max_epoch: 20
28
+ patience: 3
29
+ val_scheduler_criterion:
30
+ - valid
31
+ - acc
32
+ early_stopping_criterion:
33
+ - valid
34
+ - acc
35
+ - max
36
+ best_model_criterion:
37
+ - - valid
38
+ - acc
39
+ - max
40
+ keep_nbest_models: 10
41
+ nbest_averaging_interval: 0
42
+ grad_clip: 5
43
+ grad_clip_type: 2.0
44
+ grad_noise: false
45
+ accum_grad: 1
46
+ no_forward_run: false
47
+ resume: true
48
+ train_dtype: float32
49
+ use_amp: false
50
+ log_interval: null
51
+ use_matplotlib: true
52
+ use_tensorboard: true
53
+ create_graph_in_tensorboard: false
54
+ use_wandb: false
55
+ wandb_project: null
56
+ wandb_id: null
57
+ wandb_entity: null
58
+ wandb_name: null
59
+ wandb_model_log_interval: -1
60
+ detect_anomaly: false
61
+ pretrain_path: null
62
+ init_param: []
63
+ ignore_init_mismatch: false
64
+ freeze_param: []
65
+ num_iters_per_epoch: null
66
+ batch_size: 64
67
+ valid_batch_size: null
68
+ batch_bins: 1000000
69
+ valid_batch_bins: null
70
+ train_shape_file:
71
+ - exp/asr_stats_raw_de_bpe1024/train/speech_shape
72
+ - exp/asr_stats_raw_de_bpe1024/train/text_shape.bpe
73
+ valid_shape_file:
74
+ - exp/asr_stats_raw_de_bpe1024/valid/speech_shape
75
+ - exp/asr_stats_raw_de_bpe1024/valid/text_shape.bpe
76
+ batch_type: folded
77
+ valid_batch_type: null
78
+ fold_length:
79
+ - 80000
80
+ - 150
81
+ sort_in_batch: descending
82
+ sort_batch: descending
83
+ multiple_iterator: false
84
+ chunk_length: 500
85
+ chunk_shift_ratio: 0.5
86
+ num_cache_chunks: 1024
87
+ train_data_path_and_name_and_type:
88
+ - - dump/raw/train/wav.scp
89
+ - speech
90
+ - sound
91
+ - - dump/raw/train/text
92
+ - text
93
+ - text
94
+ valid_data_path_and_name_and_type:
95
+ - - dump/raw/dev/wav.scp
96
+ - speech
97
+ - sound
98
+ - - dump/raw/dev/text
99
+ - text
100
+ - text
101
+ allow_variable_data_keys: false
102
+ max_cache_size: 0.0
103
+ max_cache_fd: 32
104
+ valid_max_cache_size: null
105
+ exclude_weight_decay: false
106
+ exclude_weight_decay_conf: {}
107
+ optim: adam
108
+ optim_conf:
109
+ lr: 0.001
110
+ scheduler: warmuplr
111
+ scheduler_conf:
112
+ warmup_steps: 25000
113
+ token_list:
114
+ - <blank>
115
+ - <unk>
116
+ - ','
117
+ - .
118
+ - t
119
+ - ▁
120
+ - e
121
+ - en
122
+ - s
123
+ - n
124
+ - ▁ich
125
+ - ▁das
126
+ - ▁und
127
+ - ▁die
128
+ - er
129
+ - ▁ist
130
+ - ▁auch
131
+ - ▁so
132
+ - st
133
+ - ▁der
134
+ - ▁nicht
135
+ - ▁es
136
+ - ▁ein
137
+ - r
138
+ - ▁in
139
+ - f
140
+ - ▁dann
141
+ - ▁ja
142
+ - d
143
+ - ▁da
144
+ - g
145
+ - h
146
+ - m
147
+ - o
148
+ - u
149
+ - b
150
+ - ▁wir
151
+ - ▁zu
152
+ - ▁du
153
+ - ▁ge
154
+ - ▁Und
155
+ - i
156
+ - a
157
+ - ▁mit
158
+ - ▁den
159
+ - in
160
+ - ▁man
161
+ - l
162
+ - ▁auf
163
+ - ▁dass
164
+ - sch
165
+ - ▁jetzt
166
+ - '?'
167
+ - ge
168
+ - ▁was
169
+ - ▁er
170
+ - ▁Ja
171
+ - ▁hat
172
+ - '-'
173
+ - p
174
+ - ▁war
175
+ - ▁eine
176
+ - ▁F
177
+ - ▁aber
178
+ - ▁mal
179
+ - ▁oder
180
+ - y
181
+ - ▁noch
182
+ - te
183
+ - ung
184
+ - ▁haben
185
+ - ▁Ich
186
+ - ▁be
187
+ - ▁Das
188
+ - ▁wie
189
+ - ä
190
+ - ▁an
191
+ - ▁habe
192
+ - k
193
+ - ▁von
194
+ - ▁sich
195
+ - ▁K
196
+ - al
197
+ - ▁wenn
198
+ - la
199
+ - ▁schon
200
+ - ig
201
+ - ra
202
+ - lich
203
+ - re
204
+ - de
205
+ - ch
206
+ - ▁für
207
+ - it
208
+ - ▁Also
209
+ - w
210
+ - ▁A
211
+ - es
212
+ - ▁sind
213
+ - ▁ver
214
+ - le
215
+ - or
216
+ - ▁sie
217
+ - ▁B
218
+ - ü
219
+ - ▁also
220
+ - ▁ganz
221
+ - ▁T
222
+ - ▁im
223
+ - ▁dem
224
+ - ter
225
+ - an
226
+ - ck
227
+ - ▁St
228
+ - ▁aus
229
+ - ▁G
230
+ - ▁kann
231
+ - ▁bei
232
+ - ▁halt
233
+ - ▁H
234
+ - el
235
+ - ▁immer
236
+ - z
237
+ - ▁einfach
238
+ - ▁P
239
+ - ö
240
+ - ▁S
241
+ - ▁weil
242
+ - ▁mir
243
+ - se
244
+ - ▁f
245
+ - ut
246
+ - ten
247
+ - ▁wo
248
+ - ▁Sch
249
+ - us
250
+ - ▁vor
251
+ - ur
252
+ - ▁sehr
253
+ - ri
254
+ - kt
255
+ - ing
256
+ - ▁E
257
+ - il
258
+ - ▁gut
259
+ - ▁mich
260
+ - ▁Aber
261
+ - 'on'
262
+ - und
263
+ - cht
264
+ - ▁als
265
+ - den
266
+ - ar
267
+ - ie
268
+ - um
269
+ - ▁uns
270
+ - ste
271
+ - ▁Da
272
+ - hr
273
+ - ▁über
274
+ - be
275
+ - ▁einen
276
+ - ▁Be
277
+ - ▁ihr
278
+ - is
279
+ - ▁wieder
280
+ - ▁glaube
281
+ - ▁Ge
282
+ - at
283
+ - ▁irgendwie
284
+ - li
285
+ - ▁nur
286
+ - we
287
+ - ro
288
+ - ▁bisschen
289
+ - he
290
+ - ▁mehr
291
+ - ▁M
292
+ - tz
293
+ - ▁muss
294
+ - gen
295
+ - ▁sagen
296
+ - ben
297
+ - ▁wirklich
298
+ - ▁alle
299
+ - nd
300
+ - ▁wird
301
+ - ▁gibt
302
+ - ▁um
303
+ - ▁m
304
+ - ▁natürlich
305
+ - ▁viel
306
+ - me
307
+ - nt
308
+ - et
309
+ - ▁diese
310
+ - ▁U
311
+ - '0'
312
+ - ▁sein
313
+ - ▁nach
314
+ - ▁hier
315
+ - ▁meine
316
+ - ern
317
+ - lo
318
+ - ion
319
+ - ▁eigentlich
320
+ - ▁O
321
+ - ▁machen
322
+ - ▁bin
323
+ - ▁So
324
+ - ll
325
+ - ▁hast
326
+ - ▁weiß
327
+ - ▁Re
328
+ - c
329
+ - ▁I
330
+ - ▁sch
331
+ - ▁C
332
+ - ▁vielleicht
333
+ - iert
334
+ - ach
335
+ - ▁b
336
+ - ne
337
+ - x
338
+ - ze
339
+ - rei
340
+ - ru
341
+ - ma
342
+ - ▁zum
343
+ - ▁finde
344
+ - ß
345
+ - ▁N
346
+ - ▁Die
347
+ - rt
348
+ - ich
349
+ - ▁Ma
350
+ - uch
351
+ - ▁eben
352
+ - rü
353
+ - ▁Ver
354
+ - ein
355
+ - ▁In
356
+ - R
357
+ - ieren
358
+ - ▁Ha
359
+ - ssen
360
+ - ft
361
+ - chen
362
+ - am
363
+ - di
364
+ - der
365
+ - hl
366
+ - ▁Es
367
+ - ▁gesagt
368
+ - zu
369
+ - ▁ne
370
+ - ▁An
371
+ - ▁k
372
+ - ▁1
373
+ - ▁am
374
+ - hn
375
+ - ▁gerade
376
+ - pp
377
+ - her
378
+ - ▁alles
379
+ - nen
380
+ - ▁geht
381
+ - ▁genau
382
+ - ha
383
+ - ▁Jahr
384
+ - ▁re
385
+ - ▁werden
386
+ - ▁w
387
+ - ▁Z
388
+ - isch
389
+ - ▁p
390
+ - ▁Er
391
+ - ke
392
+ - ▁Wir
393
+ - au
394
+ - mm
395
+ - ik
396
+ - ▁mein
397
+ - ▁dir
398
+ - ▁einem
399
+ - un
400
+ - ▁würde
401
+ - ▁We
402
+ - ▁zwei
403
+ - v
404
+ - ▁doch
405
+ - ▁keine
406
+ - ▁erst
407
+ - na
408
+ - and
409
+ - ▁gar
410
+ - ▁hin
411
+ - ▁durch
412
+ - ▁V
413
+ - kommen
414
+ - ell
415
+ - ul
416
+ - end
417
+ - ▁können
418
+ - j
419
+ - fe
420
+ - ▁richtig
421
+ - ff
422
+ - ▁Me
423
+ - ▁andere
424
+ - lie
425
+ - '...'
426
+ - wi
427
+ - ol
428
+ - art
429
+ - ▁Leute
430
+ - ▁Zeit
431
+ - ▁Ein
432
+ - ran
433
+ - ner
434
+ - ▁ab
435
+ - nk
436
+ - ation
437
+ - ▁viele
438
+ - ▁g
439
+ - S
440
+ - rie
441
+ - ▁ob
442
+ - im
443
+ - ver
444
+ - ür
445
+ - rk
446
+ - ▁einer
447
+ - men
448
+ - ▁ent
449
+ - iv
450
+ - lei
451
+ - ▁gemacht
452
+ - sp
453
+ - ▁hatte
454
+ - ▁weiter
455
+ - sten
456
+ - che
457
+ - ang
458
+ - all
459
+ - ir
460
+ - hör
461
+ - ▁Was
462
+ - aus
463
+ - ier
464
+ - ▁Ne
465
+ - ▁Li
466
+ - ▁hab
467
+ - ass
468
+ - L
469
+ - igen
470
+ - zi
471
+ - ungen
472
+ - ▁Spiel
473
+ - ▁will
474
+ - ▁unter
475
+ - ag
476
+ - ▁macht
477
+ - ber
478
+ - ▁Sp
479
+ - zen
480
+ - ▁denn
481
+ - ken
482
+ - ▁des
483
+ - ▁Ka
484
+ - lle
485
+ - id
486
+ - sen
487
+ - ▁dich
488
+ - ▁st
489
+ - ▁Du
490
+ - ▁kommt
491
+ - spiel
492
+ - ▁Fall
493
+ - ▁Man
494
+ - ▁Se
495
+ - ▁W
496
+ - ▁dieser
497
+ - ▁Ko
498
+ - ga
499
+ - ▁De
500
+ - ▁groß
501
+ - ▁Le
502
+ - ▁schön
503
+ - ▁La
504
+ - ▁jeden
505
+ - ▁D
506
+ - ▁Genau
507
+ - gt
508
+ - ▁dieses
509
+ - ungs
510
+ - ▁J
511
+ - pro
512
+ - ▁Co
513
+ - ▁Beispiel
514
+ - ▁heißt
515
+ - ▁s
516
+ - ist
517
+ - rä
518
+ - ho
519
+ - ▁damit
520
+ - ▁Wo
521
+ - ▁unsere
522
+ - ▁le
523
+ - ert
524
+ - '5'
525
+ - ni
526
+ - tt
527
+ - gel
528
+ - ▁her
529
+ - ve
530
+ - ▁sondern
531
+ - mp
532
+ - reich
533
+ - ▁Sa
534
+ - ''''
535
+ - ▁lang
536
+ - ▁rein
537
+ - ▁neu
538
+ - ▁sagt
539
+ - ▁tatsächlich
540
+ - ▁kein
541
+ - är
542
+ - nehmen
543
+ - ▁bis
544
+ - elt
545
+ - ad
546
+ - teil
547
+ - ▁euch
548
+ - ta
549
+ - ▁a
550
+ - ▁anderen
551
+ - ▁raus
552
+ - op
553
+ - ▁Der
554
+ - ige
555
+ - arbeit
556
+ - ▁Film
557
+ - ▁Ba
558
+ - ▁heute
559
+ - ▁wäre
560
+ - ▁nochmal
561
+ - ▁ange
562
+ - ▁Sie
563
+ - ick
564
+ - ▁of
565
+ - ler
566
+ - ▁un
567
+ - ische
568
+ - weise
569
+ - lä
570
+ - kl
571
+ - ▁Na
572
+ - iß
573
+ - wa
574
+ - ▁wer
575
+ - ▁Ding
576
+ - ▁okay
577
+ - ▁Ra
578
+ - halt
579
+ - ▁we
580
+ - ▁Pa
581
+ - ▁Thema
582
+ - heit
583
+ - ▁ko
584
+ - ▁Dann
585
+ - ▁diesen
586
+ - schaft
587
+ - ▁möchte
588
+ - ▁hätte
589
+ - lu
590
+ - ▁Al
591
+ - bar
592
+ - ▁Tag
593
+ - mo
594
+ - ▁Wie
595
+ - ▁waren
596
+ - ▁sp
597
+ - ▁wurde
598
+ - ▁Auf
599
+ - ce
600
+ - ▁Frage
601
+ - ▁kannst
602
+ - wo
603
+ - ▁Mi
604
+ - ▁deine
605
+ - ▁To
606
+ - mi
607
+ - ▁dazu
608
+ - äng
609
+ - ▁bist
610
+ - ischen
611
+ - ▁Mo
612
+ - ▁ihn
613
+ - 'no'
614
+ - zieh
615
+ - ▁Ab
616
+ - ▁kommen
617
+ - ▁Menschen
618
+ - anz
619
+ - ▁Wenn
620
+ - ▁ha
621
+ - ▁Vor
622
+ - ▁Ro
623
+ - stell
624
+ - ▁Zu
625
+ - ▁je
626
+ - rau
627
+ - eln
628
+ - ab
629
+ - hin
630
+ - ka
631
+ - schau
632
+ - ▁Pro
633
+ - ger
634
+ - P
635
+ - ▁Bo
636
+ - ▁gerne
637
+ - ko
638
+ - nis
639
+ - ▁drei
640
+ - ▁gleich
641
+ - ld
642
+ - ▁klar
643
+ - ack
644
+ - ▁Aus
645
+ - ün
646
+ - ▁nie
647
+ - A
648
+ - ▁tr
649
+ - ▁seine
650
+ - ▁Mit
651
+ - geben
652
+ - ▁soll
653
+ - '4'
654
+ - ▁diesem
655
+ - lau
656
+ - ▁müssen
657
+ - ▁kleine
658
+ - ▁kurz
659
+ - mmer
660
+ - ment
661
+ - stellen
662
+ - ▁Wa
663
+ - ▁Podcast
664
+ - ▁Wi
665
+ - ▁the
666
+ - ▁Woche
667
+ - ▁guck
668
+ - ▁quasi
669
+ - ▁Ho
670
+ - mal
671
+ - ▁sei
672
+ - ▁Po
673
+ - krieg
674
+ - aff
675
+ - ▁nächste
676
+ - itz
677
+ - ▁20
678
+ - tag
679
+ - '9'
680
+ - ▁Ende
681
+ - richt
682
+ - uck
683
+ - ör
684
+ - ▁2
685
+ - dem
686
+ - mpf
687
+ - vi
688
+ - 'off'
689
+ - ▁Leben
690
+ - ▁wichtig
691
+ - ▁gesehen
692
+ - ▁gehen
693
+ - ress
694
+ - ▁sag
695
+ - M
696
+ - ▁echt
697
+ - ▁etwas
698
+ - stand
699
+ - zähl
700
+ - führ
701
+ - T
702
+ - ▁wenig
703
+ - ▁zusammen
704
+ - ▁paar
705
+ - ▁Di
706
+ - ▁einmal
707
+ - bo
708
+ - ▁sehen
709
+ - ▁Sachen
710
+ - ▁Kon
711
+ - bi
712
+ - ▁dabei
713
+ - gend
714
+ - pass
715
+ - ic
716
+ - ▁könnte
717
+ - ▁Weil
718
+ - zeit
719
+ - ▁denke
720
+ - F
721
+ - ▁Folge
722
+ - man
723
+ - ▁wollte
724
+ - kauf
725
+ - ▁weg
726
+ - ▁3
727
+ - ▁selbst
728
+ - '1'
729
+ - hol
730
+ - co
731
+ - ▁wollen
732
+ - bau
733
+ - '2'
734
+ - B
735
+ - ▁wahrscheinlich
736
+ - ank
737
+ - ▁Mal
738
+ - ▁letzten
739
+ - fahren
740
+ - ▁vom
741
+ - ▁Do
742
+ - hi
743
+ - ▁eher
744
+ - D
745
+ - ▁selber
746
+ - ord
747
+ - ▁super
748
+ - ▁musst
749
+ - ▁drauf
750
+ - ▁jemand
751
+ - '8'
752
+ - ▁gegen
753
+ - ▁überhaupt
754
+ - ▁The
755
+ - ▁Okay
756
+ - ▁beim
757
+ - ▁sage
758
+ - pa
759
+ - ▁dafür
760
+ - vor
761
+ - ▁Frau
762
+ - ▁hatten
763
+ - ▁drin
764
+ - '6'
765
+ - ▁sozusagen
766
+ - iz
767
+ - ▁fand
768
+ - ▁Tra
769
+ - folg
770
+ - ▁Nach
771
+ - ▁tun
772
+ - ▁dein
773
+ - ität
774
+ - C
775
+ - ▁Oder
776
+ - ▁zurück
777
+ - ▁Nein
778
+ - po
779
+ - ▁cool
780
+ - ▁sowas
781
+ - ▁sieht
782
+ - gehen
783
+ - schi
784
+ - ▁Gott
785
+ - ▁schnell
786
+ - form
787
+ - ▁ihm
788
+ - ▁besser
789
+ - ▁gab
790
+ - wä
791
+ - ▁äh
792
+ - ▁Kinder
793
+ - änder
794
+ - ▁sollte
795
+ - ▁Jo
796
+ - ▁voll
797
+ - ▁War
798
+ - ▁kenne
799
+ - ▁zwar
800
+ - ▁total
801
+ - ▁welche
802
+ - ▁passiert
803
+ - ▁Hand
804
+ - fall
805
+ - ▁irgendwann
806
+ - ▁Problem
807
+ - war
808
+ - qu
809
+ - fühl
810
+ - ▁Wer
811
+ - ▁wissen
812
+ - ▁dort
813
+ - ▁jeder
814
+ - ca
815
+ - ▁deswegen
816
+ - sprech
817
+ - ▁davon
818
+ - ▁damals
819
+ - trag
820
+ - ▁nämlich
821
+ - ▁Punkt
822
+ - ▁Welt
823
+ - ▁abge
824
+ - '7'
825
+ - log
826
+ - ▁sogar
827
+ - ▁kam
828
+ - legen
829
+ - ▁Moment
830
+ - igkeit
831
+ - ▁konnte
832
+ - ▁komm
833
+ - ▁gewesen
834
+ - ▁anders
835
+ - ▁Bi
836
+ - K
837
+ - ▁eigene
838
+ - ▁liebe
839
+ - ▁Teil
840
+ - ▁Lo
841
+ - ▁toll
842
+ - ▁Arbeit
843
+ - ▁Seite
844
+ - genommen
845
+ - ▁to
846
+ - ▁alt
847
+ - ▁trotzdem
848
+ - ▁gehört
849
+ - ▁Jetzt
850
+ - ▁mache
851
+ - ▁Dr
852
+ - ▁relativ
853
+ - sicht
854
+ - ▁steht
855
+ - ▁Auto
856
+ - ▁darüber
857
+ - nehm
858
+ - ▁irgendwas
859
+ - ▁ohne
860
+ - ▁Geld
861
+ - ▁Euro
862
+ - ieß
863
+ - suche
864
+ - ▁vier
865
+ - einander
866
+ - ▁Grund
867
+ - ▁Gefühl
868
+ - gestellt
869
+ - ▁sa
870
+ - ativ
871
+ - G
872
+ - ▁darauf
873
+ - I
874
+ - ▁All
875
+ - ▁Anfang
876
+ - ▁darf
877
+ - ▁Freund
878
+ - ▁direkt
879
+ - ▁irgendwo
880
+ - ▁letzte
881
+ - ▁schlecht
882
+ - ▁manchmal
883
+ - ▁Bild
884
+ - ▁Geschichte
885
+ - ▁interessant
886
+ - E
887
+ - ▁komplett
888
+ - ▁Ahnung
889
+ - bringen
890
+ - nutz
891
+ - bild
892
+ - ▁frag
893
+ - V
894
+ - ▁Kind
895
+ - ▁meisten
896
+ - ▁gehabt
897
+ - ▁gedacht
898
+ - ▁erstmal
899
+ - ▁fast
900
+ - ▁stimmt
901
+ - '3'
902
+ - laufen
903
+ - ▁bestimmt
904
+ - zahl
905
+ - ▁Über
906
+ - kommt
907
+ - gegangen
908
+ - setzen
909
+ - ▁funktioniert
910
+ - ▁spielen
911
+ - ▁Person
912
+ - ▁Sinn
913
+ - ▁dachte
914
+ - ▁fünf
915
+ - ▁hoch
916
+ - bereit
917
+ - ▁brauche
918
+ - ▁zwischen
919
+ - ▁Spaß
920
+ - ▁spannend
921
+ - ▁ehrlich
922
+ - ▁krass
923
+ - ▁schreib
924
+ - ▁zumindest
925
+ - zeug
926
+ - ▁Musik
927
+ - W
928
+ - fahr
929
+ - ▁solche
930
+ - ▁Deutschland
931
+ - ▁gespielt
932
+ - geschrieben
933
+ - Ä
934
+ - ▁später
935
+ - Y
936
+ - O
937
+ - H
938
+ - '!'
939
+ - U
940
+ - N
941
+ - Q
942
+ - Ö
943
+ - X
944
+ - Z
945
+ - J
946
+ - '%'
947
+ - Ü
948
+ - é
949
+ - «
950
+ - »
951
+ - '&'
952
+ - Ã
953
+ - à
954
+ - ş
955
+ - q
956
+ - ¤
957
+ - Ÿ
958
+ - €
959
+ - è
960
+ - ı
961
+ - ç
962
+ - ú
963
+ - ë
964
+ - ¶
965
+ - á
966
+ - ć
967
+ - —
968
+ - õ
969
+ - ğ
970
+ - í
971
+ - °
972
+ - ô
973
+ - _
974
+ - ó
975
+ - /
976
+ - å
977
+ - $
978
+ - ́
979
+ - û
980
+ - ›
981
+ - ê
982
+ - ‹
983
+ - '"'
984
+ - ñ
985
+ - Ş
986
+ - č
987
+ - )
988
+ - É
989
+ - μ
990
+ - ø
991
+ - š
992
+ - о
993
+ - ł
994
+ - ù
995
+ - ã
996
+ - ā
997
+ - ©
998
+ - а
999
+ - ':'
1000
+ - е
1001
+ - œ
1002
+ - и
1003
+ - н
1004
+ - â
1005
+ - î
1006
+ - т
1007
+ - ń
1008
+ - р
1009
+ - к
1010
+ - 你
1011
+ - æ
1012
+ - „
1013
+ - Č
1014
+ - с
1015
+ - ♪
1016
+ - д
1017
+ - Š
1018
+ - в
1019
+ - ï
1020
+ - İ
1021
+ - л
1022
+ - À
1023
+ - у
1024
+ - ь
1025
+ - я
1026
+ - м
1027
+ - ę
1028
+ - ś
1029
+ - ž
1030
+ - п
1031
+ - '='
1032
+ - ō
1033
+ - ř
1034
+ - Æ
1035
+ - ш
1036
+ - з
1037
+ - ы
1038
+ - ū
1039
+ - ș
1040
+ - Ø
1041
+ - '~'
1042
+ - ì
1043
+ - ò
1044
+ - ο
1045
+ - ч
1046
+ - г
1047
+ - ý
1048
+ - ̄
1049
+ - ц
1050
+ - Х
1051
+ - ż
1052
+ - З
1053
+ - б
1054
+ - ¡
1055
+ - Н
1056
+ - ă
1057
+ - ̃
1058
+ - К
1059
+ - ж
1060
+ - ไ
1061
+ - ồ
1062
+ - ♫
1063
+ - ر
1064
+ - х
1065
+ - ン
1066
+ - Ç
1067
+ - §
1068
+ - ⁄
1069
+ - +
1070
+ - '*'
1071
+ - Å
1072
+ - і
1073
+ - Á
1074
+ - ī
1075
+ - џ
1076
+ - ู
1077
+ - ;
1078
+ - '>'
1079
+ - Î
1080
+ - ą
1081
+ - Đ
1082
+ - Ȗ
1083
+ - Ε
1084
+ - έ
1085
+ - δ
1086
+ - ι
1087
+ - λ
1088
+ - ς
1089
+ - τ
1090
+ - υ
1091
+ - ύ
1092
+ - О
1093
+ - Т
1094
+ - و
1095
+ - ک
1096
+ - ں
1097
+ - ด
1098
+ - ม
1099
+ - ่
1100
+ - ṣ
1101
+ - “
1102
+ - ♥
1103
+ - き
1104
+ - つ
1105
+ - ぶ
1106
+ - ら
1107
+ - チ
1108
+ - ッ
1109
+ - ホ
1110
+ - ロ
1111
+ - 中
1112
+ - 以
1113
+ - 佢
1114
+ - 利
1115
+ - 厲
1116
+ - 句
1117
+ - 可
1118
+ - 吃
1119
+ - 国
1120
+ - 士
1121
+ - 好
1122
+ - 安
1123
+ - 害
1124
+ - 度
1125
+ - 手
1126
+ - 晃
1127
+ - 法
1128
+ - Ć
1129
+ - ě
1130
+ - Б
1131
+ - ج
1132
+ - 救
1133
+ - ά
1134
+ - –
1135
+ - ダ
1136
+ - 制
1137
+ - <sos/eos>
1138
+ init: null
1139
+ input_size: null
1140
+ ctc_conf:
1141
+ dropout_rate: 0.0
1142
+ ctc_type: builtin
1143
+ reduce: true
1144
+ ignore_nan_grad: null
1145
+ zero_infinity: true
1146
+ joint_net_conf: null
1147
+ use_preprocessor: true
1148
+ token_type: bpe
1149
+ bpemodel: data/de_token_list/bpe_unigram1024/bpe.model
1150
+ non_linguistic_symbols: null
1151
+ cleaner: null
1152
+ g2p: null
1153
+ speech_volume_normalize: null
1154
+ rir_scp: null
1155
+ rir_apply_prob: 1.0
1156
+ noise_scp: null
1157
+ noise_apply_prob: 1.0
1158
+ noise_db_range: '13_15'
1159
+ short_noise_thres: 0.5
1160
+ frontend: default
1161
+ frontend_conf:
1162
+ n_fft: 512
1163
+ win_length: 400
1164
+ hop_length: 160
1165
+ fs: 16k
1166
+ specaug: specaug
1167
+ specaug_conf:
1168
+ apply_time_warp: true
1169
+ time_warp_window: 5
1170
+ time_warp_mode: bicubic
1171
+ apply_freq_mask: true
1172
+ freq_mask_width_range:
1173
+ - 0
1174
+ - 30
1175
+ num_freq_mask: 2
1176
+ apply_time_mask: true
1177
+ time_mask_width_range:
1178
+ - 0
1179
+ - 40
1180
+ num_time_mask: 2
1181
+ normalize: global_mvn
1182
+ normalize_conf:
1183
+ stats_file: exp/asr_stats_raw_de_bpe1024/train/feats_stats.npz
1184
+ model: espnet
1185
+ model_conf:
1186
+ ctc_weight: 0.3
1187
+ lsm_weight: 0.1
1188
+ length_normalized_loss: false
1189
+ preencoder: null
1190
+ preencoder_conf: {}
1191
+ encoder: contextual_block_transformer
1192
+ encoder_conf:
1193
+ output_size: 256
1194
+ attention_heads: 8
1195
+ linear_units: 2048
1196
+ num_blocks: 22
1197
+ dropout_rate: 0.1
1198
+ positional_dropout_rate: 0.1
1199
+ attention_dropout_rate: 0.0
1200
+ input_layer: conv2d
1201
+ normalize_before: true
1202
+ block_size: 40
1203
+ hop_size: 16
1204
+ look_ahead: 16
1205
+ init_average: true
1206
+ ctx_pos_enc: true
1207
+ postencoder: null
1208
+ postencoder_conf: {}
1209
+ decoder: transformer
1210
+ decoder_conf:
1211
+ attention_heads: 8
1212
+ linear_units: 2048
1213
+ num_blocks: 12
1214
+ dropout_rate: 0.1
1215
+ positional_dropout_rate: 0.1
1216
+ self_attention_dropout_rate: 0.0
1217
+ src_attention_dropout_rate: 0.0
1218
+ preprocessor: default
1219
+ preprocessor_conf: {}
1220
+ required:
1221
+ - output_dir
1222
+ - token_list
1223
+ version: '202211'
1224
+ distributed: true
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/acc.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/backward_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/cer.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/cer_ctc.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/forward_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/gpu_max_cached_mem_GB.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/iter_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/loss.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/loss_att.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/loss_ctc.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/optim0_lr0.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/optim_step_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/train_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/images/wer.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/valid.acc.ave_10best.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:addcc631ff5456fbfab7425a19b910039003730c88d602e415efeb465b975c5d
3
+ size 202349741
meta.yaml ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ espnet: '202211'
2
+ files:
3
+ asr_model_file: exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/valid.acc.ave_10best.pth
4
+ python: 3.10.8 (main, Nov 4 2022, 13:48:29) [GCC 11.2.0]
5
+ timestamp: 1676855359.557663
6
+ torch: 1.12.1+cu116
7
+ yaml_files:
8
+ asr_train_config: exp/asr_train_asr_streaming_transformer_size_l_raw_de_bpe1024/config.yaml