bmilde commited on
Commit
89eeb5c
1 Parent(s): c19163a

Update model

Browse files
Files changed (21) hide show
  1. README.md +1322 -1
  2. data/de_token_list/bpe_unigram1024/bpe.model +3 -0
  3. exp/asr_stats_raw_de_bpe1024/train/feats_stats.npz +3 -0
  4. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/RESULTS.md +29 -0
  5. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/config.yaml +1224 -0
  6. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/acc.png +0 -0
  7. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/backward_time.png +0 -0
  8. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/cer.png +0 -0
  9. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/cer_ctc.png +0 -0
  10. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/forward_time.png +0 -0
  11. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/gpu_max_cached_mem_GB.png +0 -0
  12. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/iter_time.png +0 -0
  13. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/loss.png +0 -0
  14. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/loss_att.png +0 -0
  15. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/loss_ctc.png +0 -0
  16. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/optim0_lr0.png +0 -0
  17. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/optim_step_time.png +0 -0
  18. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/train_time.png +0 -0
  19. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/wer.png +0 -0
  20. exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/valid.acc.ave_6best.pth +3 -0
  21. meta.yaml +8 -0
README.md CHANGED
@@ -1,3 +1,1324 @@
1
  ---
2
- license: mit
 
 
 
 
 
 
 
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ tags:
3
+ - espnet
4
+ - audio
5
+ - automatic-speech-recognition
6
+ language: de
7
+ datasets:
8
+ - speechcatcher
9
+ license: cc-by-4.0
10
  ---
11
+
12
+ ## ESPnet2 ASR model
13
+
14
+ ### `speechcatcher/speechcatcher_german_espnet_streaming_transformer_26k_train_size_xl_raw_de_bpe1024`
15
+
16
+ This model was trained by bmilde using speechcatcher recipe in [espnet](https://github.com/espnet/espnet/).
17
+
18
+ ### Demo: How to use in ESPnet2
19
+
20
+ Follow the [ESPnet installation instructions](https://espnet.github.io/espnet/installation.html)
21
+ if you haven't done that already.
22
+
23
+ ```bash
24
+ cd espnet
25
+ git checkout 3c5ef096510a399c4a2431dc4f0ab4aca8f25d44
26
+ pip install -e .
27
+ cd egs2/speechcatcher/asr1
28
+ ./run.sh --skip_data_prep false --skip_train true --download_model speechcatcher/speechcatcher_german_espnet_streaming_transformer_26k_train_size_xl_raw_de_bpe1024
29
+ ```
30
+
31
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
32
+ # RESULTS
33
+ ## Environments
34
+ - date: `Mon Apr 17 15:34:02 UTC 2023`
35
+ - python version: `3.10.8 (main, Nov 4 2022, 13:48:29) [GCC 11.2.0]`
36
+ - espnet version: `espnet 202211`
37
+ - pytorch version: `pytorch 1.12.1+cu116`
38
+ - Git hash: `3c5ef096510a399c4a2431dc4f0ab4aca8f25d44`
39
+ - Commit date: `Sun Mar 5 15:44:25 2023 +0000`
40
+
41
+ ## asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024
42
+ ### WER
43
+
44
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
45
+ |---|---|---|---|---|---|---|---|---|
46
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|3194|270767|85.2|12.5|2.3|6.4|21.3|98.1|
47
+
48
+ ### CER
49
+
50
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
51
+ |---|---|---|---|---|---|---|---|---|
52
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|3194|1641511|95.3|2.2|2.5|5.7|10.4|98.1|
53
+
54
+ ### TER
55
+
56
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
57
+ |---|---|---|---|---|---|---|---|---|
58
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|3194|551111|89.8|7.4|2.8|8.1|18.3|98.1|
59
+
60
+ ## ASR config
61
+
62
+ <details><summary>expand</summary>
63
+
64
+ ```
65
+ config: conf/train_asr_streaming_transformer_size_xl.yaml
66
+ print_config: false
67
+ log_level: INFO
68
+ dry_run: false
69
+ iterator_type: sequence
70
+ output_dir: exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024
71
+ ngpu: 1
72
+ seed: 0
73
+ num_workers: 1
74
+ num_att_plot: 0
75
+ dist_backend: nccl
76
+ dist_init_method: env://
77
+ dist_world_size: 4
78
+ dist_rank: 0
79
+ local_rank: 0
80
+ dist_master_addr: localhost
81
+ dist_master_port: 58047
82
+ dist_launcher: null
83
+ multiprocessing_distributed: true
84
+ unused_parameters: false
85
+ sharded_ddp: false
86
+ cudnn_enabled: true
87
+ cudnn_benchmark: false
88
+ cudnn_deterministic: true
89
+ collect_stats: false
90
+ write_collected_feats: false
91
+ max_epoch: 16
92
+ patience: 3
93
+ val_scheduler_criterion:
94
+ - valid
95
+ - acc
96
+ early_stopping_criterion:
97
+ - valid
98
+ - acc
99
+ - max
100
+ best_model_criterion:
101
+ - - valid
102
+ - acc
103
+ - max
104
+ keep_nbest_models: 6
105
+ nbest_averaging_interval: 0
106
+ grad_clip: 5
107
+ grad_clip_type: 2.0
108
+ grad_noise: false
109
+ accum_grad: 1
110
+ no_forward_run: false
111
+ resume: true
112
+ train_dtype: float32
113
+ use_amp: false
114
+ log_interval: null
115
+ use_matplotlib: true
116
+ use_tensorboard: true
117
+ create_graph_in_tensorboard: false
118
+ use_wandb: false
119
+ wandb_project: null
120
+ wandb_id: null
121
+ wandb_entity: null
122
+ wandb_name: null
123
+ wandb_model_log_interval: -1
124
+ detect_anomaly: false
125
+ pretrain_path: null
126
+ init_param: []
127
+ ignore_init_mismatch: false
128
+ freeze_param: []
129
+ num_iters_per_epoch: null
130
+ batch_size: 32
131
+ valid_batch_size: null
132
+ batch_bins: 1000000
133
+ valid_batch_bins: null
134
+ train_shape_file:
135
+ - exp/asr_stats_raw_de_bpe1024/train/speech_shape
136
+ - exp/asr_stats_raw_de_bpe1024/train/text_shape.bpe
137
+ valid_shape_file:
138
+ - exp/asr_stats_raw_de_bpe1024/valid/speech_shape
139
+ - exp/asr_stats_raw_de_bpe1024/valid/text_shape.bpe
140
+ batch_type: folded
141
+ valid_batch_type: null
142
+ fold_length:
143
+ - 80000
144
+ - 150
145
+ sort_in_batch: descending
146
+ sort_batch: descending
147
+ multiple_iterator: false
148
+ chunk_length: 500
149
+ chunk_shift_ratio: 0.5
150
+ num_cache_chunks: 1024
151
+ train_data_path_and_name_and_type:
152
+ - - dump/raw/train/wav.scp
153
+ - speech
154
+ - sound
155
+ - - dump/raw/train/text
156
+ - text
157
+ - text
158
+ valid_data_path_and_name_and_type:
159
+ - - dump/raw/dev/wav.scp
160
+ - speech
161
+ - sound
162
+ - - dump/raw/dev/text
163
+ - text
164
+ - text
165
+ allow_variable_data_keys: false
166
+ max_cache_size: 0.0
167
+ max_cache_fd: 32
168
+ valid_max_cache_size: null
169
+ exclude_weight_decay: false
170
+ exclude_weight_decay_conf: {}
171
+ optim: adam
172
+ optim_conf:
173
+ lr: 0.001
174
+ scheduler: warmuplr
175
+ scheduler_conf:
176
+ warmup_steps: 25000
177
+ token_list:
178
+ - <blank>
179
+ - <unk>
180
+ - ','
181
+ - .
182
+ - ▁
183
+ - t
184
+ - en
185
+ - e
186
+ - s
187
+ - n
188
+ - ▁ich
189
+ - ▁das
190
+ - ▁die
191
+ - ▁und
192
+ - ▁ist
193
+ - er
194
+ - ▁auch
195
+ - ▁so
196
+ - ▁der
197
+ - m
198
+ - st
199
+ - ▁nicht
200
+ - ▁es
201
+ - r
202
+ - ▁ein
203
+ - ▁in
204
+ - ▁dann
205
+ - d
206
+ - ▁ja
207
+ - ▁da
208
+ - u
209
+ - g
210
+ - o
211
+ - ▁zu
212
+ - f
213
+ - ▁wir
214
+ - ▁ge
215
+ - ▁Und
216
+ - b
217
+ - ▁du
218
+ - h
219
+ - l
220
+ - ▁den
221
+ - ▁man
222
+ - ▁mit
223
+ - ▁dass
224
+ - ▁auf
225
+ - ge
226
+ - ▁jetzt
227
+ - k
228
+ - ▁er
229
+ - in
230
+ - ▁hat
231
+ - '?'
232
+ - ▁was
233
+ - sch
234
+ - '-'
235
+ - ä
236
+ - ▁war
237
+ - ▁eine
238
+ - ▁Ja
239
+ - ▁aber
240
+ - ▁mal
241
+ - ra
242
+ - i
243
+ - ▁noch
244
+ - ung
245
+ - ▁haben
246
+ - p
247
+ - ▁oder
248
+ - y
249
+ - te
250
+ - ▁F
251
+ - ▁Das
252
+ - ▁Ich
253
+ - ▁an
254
+ - re
255
+ - ▁wie
256
+ - ▁von
257
+ - ▁sich
258
+ - ▁be
259
+ - ▁habe
260
+ - an
261
+ - ▁wenn
262
+ - ���schon
263
+ - w
264
+ - de
265
+ - ig
266
+ - ▁K
267
+ - al
268
+ - ch
269
+ - ▁für
270
+ - lich
271
+ - ▁T
272
+ - ▁Also
273
+ - le
274
+ - la
275
+ - ▁sie
276
+ - es
277
+ - el
278
+ - ü
279
+ - ▁sind
280
+ - ▁A
281
+ - ▁also
282
+ - or
283
+ - ▁ver
284
+ - ▁im
285
+ - ▁ganz
286
+ - ▁dem
287
+ - z
288
+ - ▁aus
289
+ - ▁bei
290
+ - ▁B
291
+ - ▁halt
292
+ - ▁kann
293
+ - ter
294
+ - li
295
+ - ö
296
+ - it
297
+ - ▁immer
298
+ - ▁einfach
299
+ - ck
300
+ - ten
301
+ - ▁weil
302
+ - a
303
+ - ▁mir
304
+ - ▁P
305
+ - ▁S
306
+ - ▁vor
307
+ - gen
308
+ - ▁sehr
309
+ - ▁G
310
+ - ri
311
+ - ▁wo
312
+ - ut
313
+ - ur
314
+ - ▁E
315
+ - ▁St
316
+ - ▁gut
317
+ - ▁Aber
318
+ - he
319
+ - il
320
+ - ▁als
321
+ - ▁Sch
322
+ - ▁über
323
+ - tz
324
+ - ▁mich
325
+ - und
326
+ - se
327
+ - um
328
+ - ▁uns
329
+ - ar
330
+ - ro
331
+ - ing
332
+ - ▁ihr
333
+ - den
334
+ - ▁einen
335
+ - ▁f
336
+ - ▁wieder
337
+ - ze
338
+ - ▁glaube
339
+ - ie
340
+ - ▁bisschen
341
+ - ▁nur
342
+ - ▁Ge
343
+ - me
344
+ - ▁irgendwie
345
+ - ▁mehr
346
+ - hr
347
+ - us
348
+ - ▁sagen
349
+ - ▁wird
350
+ - ▁muss
351
+ - nt
352
+ - 'on'
353
+ - ▁alle
354
+ - ▁Da
355
+ - ▁wirklich
356
+ - ▁natürlich
357
+ - ▁Be
358
+ - et
359
+ - ▁diese
360
+ - '0'
361
+ - ▁gibt
362
+ - ▁H
363
+ - ▁um
364
+ - ben
365
+ - be
366
+ - ma
367
+ - at
368
+ - ste
369
+ - ▁nach
370
+ - ▁k
371
+ - ▁viel
372
+ - ▁sein
373
+ - nd
374
+ - ▁hier
375
+ - ▁meine
376
+ - cht
377
+ - ▁eigentlich
378
+ - ▁So
379
+ - kt
380
+ - ▁O
381
+ - ern
382
+ - ▁machen
383
+ - is
384
+ - ▁I
385
+ - ▁bin
386
+ - ▁weiß
387
+ - ▁Ver
388
+ - ll
389
+ - ▁hast
390
+ - ▁Ma
391
+ - ▁C
392
+ - uch
393
+ - ru
394
+ - ▁vielleicht
395
+ - rei
396
+ - ▁Re
397
+ - c
398
+ - ha
399
+ - iert
400
+ - ▁Die
401
+ - ▁zum
402
+ - icht
403
+ - ▁finde
404
+ - ell
405
+ - ▁eben
406
+ - ▁1
407
+ - ne
408
+ - ▁s
409
+ - di
410
+ - lo
411
+ - ▁sch
412
+ - chen
413
+ - ein
414
+ - hl
415
+ - ▁Es
416
+ - ▁gesagt
417
+ - we
418
+ - ▁U
419
+ - ft
420
+ - zu
421
+ - nen
422
+ - ▁am
423
+ - ▁In
424
+ - ieren
425
+ - ▁werden
426
+ - ▁An
427
+ - ▁Er
428
+ - pp
429
+ - ▁geht
430
+ - hn
431
+ - ▁Jahr
432
+ - ▁R
433
+ - isch
434
+ - ▁alles
435
+ - ▁gerade
436
+ - ▁M
437
+ - rt
438
+ - der
439
+ - ▁ne
440
+ - ▁genau
441
+ - ▁re
442
+ - ag
443
+ - end
444
+ - ▁Wir
445
+ - ▁Ha
446
+ - ▁würde
447
+ - ▁p
448
+ - ▁doch
449
+ - ▁zwei
450
+ - ▁einem
451
+ - ▁erst
452
+ - ▁g
453
+ - ▁w
454
+ - ▁keine
455
+ - au
456
+ - ik
457
+ - ▁durch
458
+ - ▁hin
459
+ - her
460
+ - un
461
+ - art
462
+ - mm
463
+ - ▁dir
464
+ - ▁Spiel
465
+ - kommen
466
+ - ▁gar
467
+ - ▁b
468
+ - ▁mein
469
+ - S
470
+ - ver
471
+ - ff
472
+ - ▁können
473
+ - zi
474
+ - ▁Ein
475
+ - im
476
+ - ▁andere
477
+ - na
478
+ - ▁richtig
479
+ - ei
480
+ - rk
481
+ - ul
482
+ - lle
483
+ - fe
484
+ - ▁W
485
+ - wi
486
+ - ach
487
+ - sp
488
+ - rie
489
+ - ▁Zeit
490
+ - ▁Leute
491
+ - ▁ab
492
+ - ▁viele
493
+ - ▁Ka
494
+ - ▁We
495
+ - ke
496
+ - and
497
+ - ▁ob
498
+ - ür
499
+ - ner
500
+ - ▁Ko
501
+ - wa
502
+ - ▁einer
503
+ - ber
504
+ - ko
505
+ - x
506
+ - ▁weiter
507
+ - ation
508
+ - ▁gemacht
509
+ - ▁hatte
510
+ - spiel
511
+ - ▁Ne
512
+ - ▁des
513
+ - ▁Z
514
+ - '...'
515
+ - sten
516
+ - che
517
+ - sen
518
+ - hör
519
+ - ▁Man
520
+ - ▁dieser
521
+ - igen
522
+ - ▁unter
523
+ - ▁N
524
+ - ▁L
525
+ - ion
526
+ - ▁Was
527
+ - ssen
528
+ - ß
529
+ - ken
530
+ - ungen
531
+ - ▁le
532
+ - ▁will
533
+ - ga
534
+ - ▁denn
535
+ - am
536
+ - ▁J
537
+ - ▁kommt
538
+ - ▁ent
539
+ - ▁st
540
+ - iv
541
+ - ▁D
542
+ - ▁groß
543
+ - ir
544
+ - ▁hab
545
+ - nder
546
+ - aus
547
+ - ▁macht
548
+ - ist
549
+ - ▁dieses
550
+ - ▁Li
551
+ - si
552
+ - ho
553
+ - ▁Fall
554
+ - rü
555
+ - ▁De
556
+ - so
557
+ - ▁Du
558
+ - ve
559
+ - '5'
560
+ - ▁Ba
561
+ - ▁ange
562
+ - ▁heißt
563
+ - ni
564
+ - ht
565
+ - rä
566
+ - '3'
567
+ - ▁Wo
568
+ - ▁dich
569
+ - ▁sagt
570
+ - ▁Le
571
+ - pro
572
+ - gel
573
+ - ▁Se
574
+ - ▁schön
575
+ - mp
576
+ - ▁jeden
577
+ - id
578
+ - ▁damit
579
+ - ▁Al
580
+ - ▁Me
581
+ - ▁Co
582
+ - ▁Beispiel
583
+ - ol
584
+ - ▁her
585
+ - ▁sondern
586
+ - V
587
+ - ▁unsere
588
+ - ▁Genau
589
+ - ▁Sie
590
+ - all
591
+ - gt
592
+ - ▁La
593
+ - ▁euch
594
+ - ▁neu
595
+ - ub
596
+ - ▁Sp
597
+ - ▁bis
598
+ - ▁tatsächlich
599
+ - ier
600
+ - ▁Pa
601
+ - ▁rein
602
+ - tion
603
+ - mo
604
+ - elt
605
+ - sa
606
+ - ▁Der
607
+ - ige
608
+ - ▁anderen
609
+ - schaft
610
+ - lu
611
+ - ka
612
+ - ische
613
+ - ▁kein
614
+ - ▁Na
615
+ - ungs
616
+ - ▁wäre
617
+ - ''''
618
+ - reich
619
+ - ▁raus
620
+ - nehmen
621
+ - ▁Film
622
+ - ▁nochmal
623
+ - ▁wer
624
+ - tra
625
+ - ger
626
+ - ler
627
+ - lä
628
+ - ▁hätte
629
+ - j
630
+ - halt
631
+ - ▁heute
632
+ - ▁a
633
+ - ld
634
+ - ick
635
+ - ▁diesen
636
+ - ▁Sa
637
+ - ta
638
+ - ▁wurde
639
+ - eiß
640
+ - bar
641
+ - lei
642
+ - ▁To
643
+ - ▁Ding
644
+ - arbeit
645
+ - ischen
646
+ - ▁of
647
+ - ▁un
648
+ - ▁Auf
649
+ - ▁Dann
650
+ - wo
651
+ - ▁ihn
652
+ - ▁Mo
653
+ - ▁Mi
654
+ - ▁Ab
655
+ - ▁Ho
656
+ - ▁Zu
657
+ - ▁Ra
658
+ - pf
659
+ - v
660
+ - ▁Frage
661
+ - ▁okay
662
+ - ▁waren
663
+ - ▁Wie
664
+ - sse
665
+ - ▁möchte
666
+ - ▁dazu
667
+ - fall
668
+ - ▁Vor
669
+ - äng
670
+ - '4'
671
+ - sam
672
+ - 'no'
673
+ - ▁Tag
674
+ - ▁kommen
675
+ - A
676
+ - ▁mach
677
+ - ▁seine
678
+ - ▁Wa
679
+ - ich
680
+ - ▁Wenn
681
+ - ▁Menschen
682
+ - P
683
+ - ▁sp
684
+ - lass
685
+ - ▁diesem
686
+ - ün
687
+ - hin
688
+ - ▁klar
689
+ - ▁2
690
+ - ▁soll
691
+ - ▁Thema
692
+ - geben
693
+ - ▁je
694
+ - '9'
695
+ - ▁Aus
696
+ - ▁Ro
697
+ - schau
698
+ - ▁deine
699
+ - ▁Bo
700
+ - heit
701
+ - voll
702
+ - teil
703
+ - ex
704
+ - ce
705
+ - ▁kannst
706
+ - ment
707
+ - acht
708
+ - ▁drei
709
+ - cken
710
+ - ▁bist
711
+ - ▁gleich
712
+ - nis
713
+ - ▁müssen
714
+ - är
715
+ - ▁Po
716
+ - ▁Mit
717
+ - op
718
+ - ▁gerne
719
+ - ▁nie
720
+ - ad
721
+ - lang
722
+ - ▁Woche
723
+ - ▁kurz
724
+ - stellen
725
+ - mmer
726
+ - ▁Sta
727
+ - ffen
728
+ - ▁quasi
729
+ - ▁gegen
730
+ - akt
731
+ - ▁kleine
732
+ - fer
733
+ - ▁20
734
+ - ▁guck
735
+ - ▁Ende
736
+ - ▁gesehen
737
+ - ▁Wi
738
+ - ör
739
+ - ▁nächste
740
+ - mal
741
+ - ab
742
+ - ▁Fa
743
+ - '1'
744
+ - ▁Podcast
745
+ - bi
746
+ - dem
747
+ - ▁wenig
748
+ - führ
749
+ - tag
750
+ - bo
751
+ - krieg
752
+ - pass
753
+ - ▁etwas
754
+ - hi
755
+ - stand
756
+ - ▁the
757
+ - ▁sehen
758
+ - F
759
+ - M
760
+ - ▁könnte
761
+ - ▁gehen
762
+ - T
763
+ - ▁wichtig
764
+ - zeit
765
+ - ▁Leben
766
+ - ▁He
767
+ - ▁paar
768
+ - mpf
769
+ - ▁Do
770
+ - ▁einmal
771
+ - pa
772
+ - ▁echt
773
+ - ▁Kon
774
+ - ▁Gott
775
+ - ▁dabei
776
+ - ▁zusammen
777
+ - '2'
778
+ - ▁Di
779
+ - vi
780
+ - D
781
+ - '6'
782
+ - ▁weg
783
+ - ▁Unter
784
+ - zähl
785
+ - B
786
+ - bring
787
+ - ▁denke
788
+ - ▁wollen
789
+ - ▁letzten
790
+ - hol
791
+ - ▁Sachen
792
+ - ▁Tra
793
+ - '8'
794
+ - ba
795
+ - ▁Folge
796
+ - ▁vom
797
+ - ▁tr
798
+ - ah
799
+ - ▁wollte
800
+ - ▁selbst
801
+ - ▁Weil
802
+ - co
803
+ - kauf
804
+ - gi
805
+ - ia
806
+ - ▁wahrscheinlich
807
+ - ▁ha
808
+ - ▁Mal
809
+ - ▁Pro
810
+ - uß
811
+ - ▁überhaupt
812
+ - bau
813
+ - ja
814
+ - weg
815
+ - ▁eher
816
+ - folg
817
+ - C
818
+ - rich
819
+ - ▁fand
820
+ - ic
821
+ - ▁selber
822
+ - ▁super
823
+ - vor
824
+ - ack
825
+ - ▁beim
826
+ - ▁jemand
827
+ - ▁dafür
828
+ - ▁drauf
829
+ - ▁Nach
830
+ - ▁musst
831
+ - ��hatten
832
+ - ▁ihm
833
+ - ▁tun
834
+ - ▁sage
835
+ - fahren
836
+ - ▁zurück
837
+ - ▁gab
838
+ - ▁drin
839
+ - ▁sieht
840
+ - ▁sozusagen
841
+ - schrei
842
+ - ▁Hi
843
+ - ▁Okay
844
+ - ▁Oder
845
+ - ▁lange
846
+ - iz
847
+ - ieß
848
+ - ität
849
+ - ▁Jo
850
+ - fang
851
+ - ▁Wer
852
+ - '7'
853
+ - gehen
854
+ - anz
855
+ - ▁Nein
856
+ - ▁besser
857
+ - ▁Frau
858
+ - ▁schnell
859
+ - stehen
860
+ - ▁sowas
861
+ - ▁Problem
862
+ - ▁Punkt
863
+ - ▁Haus
864
+ - ▁zwar
865
+ - ▁sollte
866
+ - form
867
+ - ▁passiert
868
+ - ca
869
+ - ▁wissen
870
+ - ▁Vi
871
+ - ▁dein
872
+ - ▁Bi
873
+ - ▁deswegen
874
+ - pi
875
+ - lauf
876
+ - ▁welche
877
+ - ▁total
878
+ - ▁nämlich
879
+ - ▁davon
880
+ - ▁Hand
881
+ - ▁War
882
+ - ▁Kinder
883
+ - ▁irgendwann
884
+ - qu
885
+ - ▁Welt
886
+ - ▁cool
887
+ - bei
888
+ - ▁abge
889
+ - ▁dort
890
+ - fin
891
+ - weis
892
+ - ▁kenne
893
+ - ▁damals
894
+ - sprech
895
+ - ▁sogar
896
+ - schaff
897
+ - ▁Ga
898
+ - ▁jeder
899
+ - fühl
900
+ - ▁Mein
901
+ - ▁kam
902
+ - igkeit
903
+ - ▁Teil
904
+ - ▁konnte
905
+ - ▁Seite
906
+ - ▁Moment
907
+ - ▁steht
908
+ - ▁gewesen
909
+ - ▁Ta
910
+ - K
911
+ - ▁Schw
912
+ - port
913
+ - log
914
+ - ▁anders
915
+ - trag
916
+ - ▁liebe
917
+ - ▁eigene
918
+ - genommen
919
+ - ▁lassen
920
+ - ▁trotzdem
921
+ - ▁toll
922
+ - ▁relativ
923
+ - ▁Jetzt
924
+ - ▁gehört
925
+ - R
926
+ - ▁komm
927
+ - ▁ohne
928
+ - ▁Geld
929
+ - ▁Art
930
+ - ▁Vo
931
+ - ▁Lo
932
+ - land
933
+ - ▁alt
934
+ - ▁Euro
935
+ - rück
936
+ - ▁Grund
937
+ - ▁darüber
938
+ - ▁No
939
+ - setzt
940
+ - keit
941
+ - nehm
942
+ - ▁Arbeit
943
+ - G
944
+ - ▁Auto
945
+ - ▁Mu
946
+ - ▁Gefühl
947
+ - gestellt
948
+ - ▁vier
949
+ - ▁schlecht
950
+ - L
951
+ - ▁Anfang
952
+ - ▁darauf
953
+ - ▁Bild
954
+ - einander
955
+ - ▁irgendwas
956
+ - ▁letzte
957
+ - I
958
+ - ▁Dr
959
+ - ▁darf
960
+ - ▁Dank
961
+ - ▁interessant
962
+ - ativ
963
+ - E
964
+ - ▁irgendwo
965
+ - ▁direkt
966
+ - ▁Geschichte
967
+ - ▁spielen
968
+ - ▁Freund
969
+ - ▁manchmal
970
+ - frage
971
+ - va
972
+ - ▁Nu
973
+ - ▁los
974
+ - ▁komplett
975
+ - ▁fast
976
+ - ▁früh
977
+ - ▁seit
978
+ - ▁Über
979
+ - ▁Ganz
980
+ - ▁erstmal
981
+ - gang
982
+ - ▁stimmt
983
+ - nutz
984
+ - kommt
985
+ - ▁Ahnung
986
+ - ▁gedacht
987
+ - klär
988
+ - ▁weit
989
+ - zahl
990
+ - ▁Kind
991
+ - ▁funktioniert
992
+ - ▁zumindest
993
+ - gegangen
994
+ - bild
995
+ - ▁gehabt
996
+ - ▁Deutschland
997
+ - setzen
998
+ - ▁meisten
999
+ - ▁bestimmt
1000
+ - ▁zwischen
1001
+ - ▁gespielt
1002
+ - ▁hoch
1003
+ - ▁Person
1004
+ - ▁ehrlich
1005
+ - ▁Sinn
1006
+ - ▁fünf
1007
+ - ▁solche
1008
+ - ▁brauche
1009
+ - ▁dachte
1010
+ - ▁Spaß
1011
+ - schied
1012
+ - ▁fest
1013
+ - ▁sprechen
1014
+ - ziehen
1015
+ - geschrieben
1016
+ - ▁Idee
1017
+ - ▁spannend
1018
+ - ▁später
1019
+ - Ä
1020
+ - W
1021
+ - fällt
1022
+ - ▁offen
1023
+ - ▁Herr
1024
+ - ▁krass
1025
+ - ▁schwierig
1026
+ - ▁bitte
1027
+ - fahr
1028
+ - erweise
1029
+ - ▁Musik
1030
+ - ▁ziemlich
1031
+ - punkt
1032
+ - ▁stark
1033
+ - ▁freue
1034
+ - fass
1035
+ - ▁irgendein
1036
+ - ▁hoffe
1037
+ - ▁Chris
1038
+ - ▁Situation
1039
+ - ▁sehe
1040
+ - ▁schwer
1041
+ - ▁normal
1042
+ - ▁Mensch
1043
+ - ▁Vielleicht
1044
+ - ▁egal
1045
+ - '000'
1046
+ - ▁Minuten
1047
+ - H
1048
+ - Y
1049
+ - O
1050
+ - ▁Herz
1051
+ - ▁Bundes
1052
+ - ▁darum
1053
+ - ▁braucht
1054
+ - ▁worden
1055
+ - ▁leider
1056
+ - ▁irgendwelche
1057
+ - ▁Monat
1058
+ - hält
1059
+ - ▁gewisse
1060
+ - ▁verschiedene
1061
+ - spekt
1062
+ - ▁Video
1063
+ - ▁Qua
1064
+ - ▁Stelle
1065
+ - U
1066
+ - '!'
1067
+ - N
1068
+ - Q
1069
+ - Ö
1070
+ - X
1071
+ - Z
1072
+ - J
1073
+ - '%'
1074
+ - é
1075
+ - Ü
1076
+ - »
1077
+ - «
1078
+ - '&'
1079
+ - –
1080
+ - à
1081
+ - '*'
1082
+ - q
1083
+ - €
1084
+ - è
1085
+ - ş
1086
+ - ú
1087
+ - ć
1088
+ - á
1089
+ - ë
1090
+ - ç
1091
+ - —
1092
+ - í
1093
+ - °
1094
+ - /
1095
+ - å
1096
+ - $
1097
+ - č
1098
+ - ô
1099
+ - š
1100
+ - ó
1101
+ - _
1102
+ - ñ
1103
+ - ı
1104
+ - õ
1105
+ - '"'
1106
+ - ›
1107
+ - ́
1108
+ - ‹
1109
+ - ⁄
1110
+ - ê
1111
+ - û
1112
+ - É
1113
+ - ':'
1114
+ - ğ
1115
+ - Ã
1116
+ - )
1117
+ - ø
1118
+ - ♪
1119
+ - ã
1120
+ - ł
1121
+ - Ş
1122
+ - ù
1123
+ - ž
1124
+ - î
1125
+ - â
1126
+ - ń
1127
+ - Č
1128
+ - ï
1129
+ - ā
1130
+ - Š
1131
+ - ș
1132
+ - '='
1133
+ - ę
1134
+ - ś
1135
+ - ō
1136
+ - ð
1137
+ - İ
1138
+ - ă
1139
+ - ū
1140
+ - ò
1141
+ - ř
1142
+ - Ø
1143
+ - ý
1144
+ - ì
1145
+ - ē
1146
+ - ̄
1147
+ - μ
1148
+ - ż
1149
+ - ·
1150
+ - À
1151
+ - Á
1152
+ - ο
1153
+ - ṇ
1154
+ - ě
1155
+ - ;
1156
+ - ^
1157
+ - Î
1158
+ - ą
1159
+ - о
1160
+ - ה
1161
+ - ♫
1162
+ - 스
1163
+ - 해
1164
+ - §
1165
+ - λ
1166
+ - τ
1167
+ - Ó
1168
+ - đ
1169
+ - Ž
1170
+ - ț
1171
+ - '>'
1172
+ - '~'
1173
+ - £
1174
+ - Å
1175
+ - ź
1176
+ - Ż
1177
+ - Ȗ
1178
+ - Ε
1179
+ - Π
1180
+ - έ
1181
+ - δ
1182
+ - ς
1183
+ - υ
1184
+ - ύ
1185
+ - а
1186
+ - р
1187
+ - у
1188
+ - щ
1189
+ - ё
1190
+ - י
1191
+ - ث
1192
+ - ض
1193
+ - “
1194
+ - ►
1195
+ - っ
1196
+ - ぱ
1197
+ - る
1198
+ - 些
1199
+ - +
1200
+ - م
1201
+ - <sos/eos>
1202
+ init: null
1203
+ input_size: null
1204
+ ctc_conf:
1205
+ dropout_rate: 0.0
1206
+ ctc_type: builtin
1207
+ reduce: true
1208
+ ignore_nan_grad: null
1209
+ zero_infinity: true
1210
+ joint_net_conf: null
1211
+ use_preprocessor: true
1212
+ token_type: bpe
1213
+ bpemodel: data/de_token_list/bpe_unigram1024/bpe.model
1214
+ non_linguistic_symbols: null
1215
+ cleaner: null
1216
+ g2p: null
1217
+ speech_volume_normalize: null
1218
+ rir_scp: null
1219
+ rir_apply_prob: 1.0
1220
+ noise_scp: null
1221
+ noise_apply_prob: 1.0
1222
+ noise_db_range: '13_15'
1223
+ short_noise_thres: 0.5
1224
+ frontend: default
1225
+ frontend_conf:
1226
+ n_fft: 512
1227
+ win_length: 400
1228
+ hop_length: 160
1229
+ fs: 16k
1230
+ specaug: specaug
1231
+ specaug_conf:
1232
+ apply_time_warp: true
1233
+ time_warp_window: 5
1234
+ time_warp_mode: bicubic
1235
+ apply_freq_mask: true
1236
+ freq_mask_width_range:
1237
+ - 0
1238
+ - 30
1239
+ num_freq_mask: 2
1240
+ apply_time_mask: true
1241
+ time_mask_width_range:
1242
+ - 0
1243
+ - 40
1244
+ num_time_mask: 2
1245
+ normalize: global_mvn
1246
+ normalize_conf:
1247
+ stats_file: exp/asr_stats_raw_de_bpe1024/train/feats_stats.npz
1248
+ model: espnet
1249
+ model_conf:
1250
+ ctc_weight: 0.3
1251
+ lsm_weight: 0.1
1252
+ length_normalized_loss: false
1253
+ preencoder: null
1254
+ preencoder_conf: {}
1255
+ encoder: contextual_block_transformer
1256
+ encoder_conf:
1257
+ output_size: 256
1258
+ attention_heads: 8
1259
+ linear_units: 2048
1260
+ num_blocks: 30
1261
+ dropout_rate: 0.1
1262
+ positional_dropout_rate: 0.1
1263
+ attention_dropout_rate: 0.0
1264
+ input_layer: conv2d
1265
+ normalize_before: true
1266
+ block_size: 40
1267
+ hop_size: 16
1268
+ look_ahead: 16
1269
+ init_average: true
1270
+ ctx_pos_enc: true
1271
+ postencoder: null
1272
+ postencoder_conf: {}
1273
+ decoder: transformer
1274
+ decoder_conf:
1275
+ attention_heads: 8
1276
+ linear_units: 2048
1277
+ num_blocks: 14
1278
+ dropout_rate: 0.1
1279
+ positional_dropout_rate: 0.1
1280
+ self_attention_dropout_rate: 0.0
1281
+ src_attention_dropout_rate: 0.0
1282
+ preprocessor: default
1283
+ preprocessor_conf: {}
1284
+ required:
1285
+ - output_dir
1286
+ - token_list
1287
+ version: '202211'
1288
+ distributed: true
1289
+ ```
1290
+
1291
+ </details>
1292
+
1293
+
1294
+
1295
+ ### Citing ESPnet
1296
+
1297
+ ```BibTex
1298
+ @inproceedings{watanabe2018espnet,
1299
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1300
+ title={{ESPnet}: End-to-End Speech Processing Toolkit},
1301
+ year={2018},
1302
+ booktitle={Proceedings of Interspeech},
1303
+ pages={2207--2211},
1304
+ doi={10.21437/Interspeech.2018-1456},
1305
+ url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
1306
+ }
1307
+
1308
+
1309
+
1310
+
1311
+ ```
1312
+
1313
+ or arXiv:
1314
+
1315
+ ```bibtex
1316
+ @misc{watanabe2018espnet,
1317
+ title={ESPnet: End-to-End Speech Processing Toolkit},
1318
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1319
+ year={2018},
1320
+ eprint={1804.00015},
1321
+ archivePrefix={arXiv},
1322
+ primaryClass={cs.CL}
1323
+ }
1324
+ ```
data/de_token_list/bpe_unigram1024/bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cb6184c1556318870c90a6c8c8e13a014423c68ee41aef8ec6fba11db63a480d
3
+ size 252034
exp/asr_stats_raw_de_bpe1024/train/feats_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d3ec1d4aba4b3adc157dd424d0b96e1d3a734a926707ee0c3c1c5bd25b1b0439
3
+ size 1402
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/RESULTS.md ADDED
@@ -0,0 +1,29 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
2
+ # RESULTS
3
+ ## Environments
4
+ - date: `Mon Apr 17 15:34:02 UTC 2023`
5
+ - python version: `3.10.8 (main, Nov 4 2022, 13:48:29) [GCC 11.2.0]`
6
+ - espnet version: `espnet 202211`
7
+ - pytorch version: `pytorch 1.12.1+cu116`
8
+ - Git hash: `3c5ef096510a399c4a2431dc4f0ab4aca8f25d44`
9
+ - Commit date: `Sun Mar 5 15:44:25 2023 +0000`
10
+
11
+ ## asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024
12
+ ### WER
13
+
14
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
15
+ |---|---|---|---|---|---|---|---|---|
16
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|3194|270767|85.2|12.5|2.3|6.4|21.3|98.1|
17
+
18
+ ### CER
19
+
20
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
21
+ |---|---|---|---|---|---|---|---|---|
22
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|3194|1641511|95.3|2.2|2.5|5.7|10.4|98.1|
23
+
24
+ ### TER
25
+
26
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
27
+ |---|---|---|---|---|---|---|---|---|
28
+ |decode_asr_streaming_asr_model_valid.acc.ave/test|3194|551111|89.8|7.4|2.8|8.1|18.3|98.1|
29
+
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/config.yaml ADDED
@@ -0,0 +1,1224 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ config: conf/train_asr_streaming_transformer_size_xl.yaml
2
+ print_config: false
3
+ log_level: INFO
4
+ dry_run: false
5
+ iterator_type: sequence
6
+ output_dir: exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024
7
+ ngpu: 1
8
+ seed: 0
9
+ num_workers: 1
10
+ num_att_plot: 0
11
+ dist_backend: nccl
12
+ dist_init_method: env://
13
+ dist_world_size: 4
14
+ dist_rank: 0
15
+ local_rank: 0
16
+ dist_master_addr: localhost
17
+ dist_master_port: 58047
18
+ dist_launcher: null
19
+ multiprocessing_distributed: true
20
+ unused_parameters: false
21
+ sharded_ddp: false
22
+ cudnn_enabled: true
23
+ cudnn_benchmark: false
24
+ cudnn_deterministic: true
25
+ collect_stats: false
26
+ write_collected_feats: false
27
+ max_epoch: 16
28
+ patience: 3
29
+ val_scheduler_criterion:
30
+ - valid
31
+ - acc
32
+ early_stopping_criterion:
33
+ - valid
34
+ - acc
35
+ - max
36
+ best_model_criterion:
37
+ - - valid
38
+ - acc
39
+ - max
40
+ keep_nbest_models: 6
41
+ nbest_averaging_interval: 0
42
+ grad_clip: 5
43
+ grad_clip_type: 2.0
44
+ grad_noise: false
45
+ accum_grad: 1
46
+ no_forward_run: false
47
+ resume: true
48
+ train_dtype: float32
49
+ use_amp: false
50
+ log_interval: null
51
+ use_matplotlib: true
52
+ use_tensorboard: true
53
+ create_graph_in_tensorboard: false
54
+ use_wandb: false
55
+ wandb_project: null
56
+ wandb_id: null
57
+ wandb_entity: null
58
+ wandb_name: null
59
+ wandb_model_log_interval: -1
60
+ detect_anomaly: false
61
+ pretrain_path: null
62
+ init_param: []
63
+ ignore_init_mismatch: false
64
+ freeze_param: []
65
+ num_iters_per_epoch: null
66
+ batch_size: 32
67
+ valid_batch_size: null
68
+ batch_bins: 1000000
69
+ valid_batch_bins: null
70
+ train_shape_file:
71
+ - exp/asr_stats_raw_de_bpe1024/train/speech_shape
72
+ - exp/asr_stats_raw_de_bpe1024/train/text_shape.bpe
73
+ valid_shape_file:
74
+ - exp/asr_stats_raw_de_bpe1024/valid/speech_shape
75
+ - exp/asr_stats_raw_de_bpe1024/valid/text_shape.bpe
76
+ batch_type: folded
77
+ valid_batch_type: null
78
+ fold_length:
79
+ - 80000
80
+ - 150
81
+ sort_in_batch: descending
82
+ sort_batch: descending
83
+ multiple_iterator: false
84
+ chunk_length: 500
85
+ chunk_shift_ratio: 0.5
86
+ num_cache_chunks: 1024
87
+ train_data_path_and_name_and_type:
88
+ - - dump/raw/train/wav.scp
89
+ - speech
90
+ - sound
91
+ - - dump/raw/train/text
92
+ - text
93
+ - text
94
+ valid_data_path_and_name_and_type:
95
+ - - dump/raw/dev/wav.scp
96
+ - speech
97
+ - sound
98
+ - - dump/raw/dev/text
99
+ - text
100
+ - text
101
+ allow_variable_data_keys: false
102
+ max_cache_size: 0.0
103
+ max_cache_fd: 32
104
+ valid_max_cache_size: null
105
+ exclude_weight_decay: false
106
+ exclude_weight_decay_conf: {}
107
+ optim: adam
108
+ optim_conf:
109
+ lr: 0.001
110
+ scheduler: warmuplr
111
+ scheduler_conf:
112
+ warmup_steps: 25000
113
+ token_list:
114
+ - <blank>
115
+ - <unk>
116
+ - ','
117
+ - .
118
+ - ▁
119
+ - t
120
+ - en
121
+ - e
122
+ - s
123
+ - n
124
+ - ▁ich
125
+ - ▁das
126
+ - ▁die
127
+ - ▁und
128
+ - ▁ist
129
+ - er
130
+ - ▁auch
131
+ - ▁so
132
+ - ▁der
133
+ - m
134
+ - st
135
+ - ▁nicht
136
+ - ▁es
137
+ - r
138
+ - ▁ein
139
+ - ▁in
140
+ - ▁dann
141
+ - d
142
+ - ▁ja
143
+ - ▁da
144
+ - u
145
+ - g
146
+ - o
147
+ - ▁zu
148
+ - f
149
+ - ▁wir
150
+ - ▁ge
151
+ - ▁Und
152
+ - b
153
+ - ▁du
154
+ - h
155
+ - l
156
+ - ▁den
157
+ - ▁man
158
+ - ▁mit
159
+ - ▁dass
160
+ - ▁auf
161
+ - ge
162
+ - ▁jetzt
163
+ - k
164
+ - ▁er
165
+ - in
166
+ - ▁hat
167
+ - '?'
168
+ - ▁was
169
+ - sch
170
+ - '-'
171
+ - ä
172
+ - ▁war
173
+ - ▁eine
174
+ - ▁Ja
175
+ - ▁aber
176
+ - ▁mal
177
+ - ra
178
+ - i
179
+ - ▁noch
180
+ - ung
181
+ - ▁haben
182
+ - p
183
+ - ▁oder
184
+ - y
185
+ - te
186
+ - ▁F
187
+ - ▁Das
188
+ - ▁Ich
189
+ - ▁an
190
+ - re
191
+ - ▁wie
192
+ - ▁von
193
+ - ▁sich
194
+ - ▁be
195
+ - ▁habe
196
+ - an
197
+ - ▁wenn
198
+ - ▁schon
199
+ - w
200
+ - de
201
+ - ig
202
+ - ▁K
203
+ - al
204
+ - ch
205
+ - ▁für
206
+ - lich
207
+ - ▁T
208
+ - ▁Also
209
+ - le
210
+ - la
211
+ - ▁sie
212
+ - es
213
+ - el
214
+ - ü
215
+ - ▁sind
216
+ - ▁A
217
+ - ▁also
218
+ - or
219
+ - ▁ver
220
+ - ▁im
221
+ - ▁ganz
222
+ - ▁dem
223
+ - z
224
+ - ▁aus
225
+ - ▁bei
226
+ - ▁B
227
+ - ▁halt
228
+ - ▁kann
229
+ - ter
230
+ - li
231
+ - ö
232
+ - it
233
+ - ▁immer
234
+ - ▁einfach
235
+ - ck
236
+ - ten
237
+ - ▁weil
238
+ - a
239
+ - ▁mir
240
+ - ▁P
241
+ - ▁S
242
+ - ▁vor
243
+ - gen
244
+ - ▁sehr
245
+ - ▁G
246
+ - ri
247
+ - ▁wo
248
+ - ut
249
+ - ur
250
+ - ▁E
251
+ - ▁St
252
+ - ▁gut
253
+ - ▁Aber
254
+ - he
255
+ - il
256
+ - ▁als
257
+ - ▁Sch
258
+ - ▁über
259
+ - tz
260
+ - ▁mich
261
+ - und
262
+ - se
263
+ - um
264
+ - ▁uns
265
+ - ar
266
+ - ro
267
+ - ing
268
+ - ▁ihr
269
+ - den
270
+ - ▁einen
271
+ - ▁f
272
+ - ▁wieder
273
+ - ze
274
+ - ▁glaube
275
+ - ie
276
+ - ▁bisschen
277
+ - ▁nur
278
+ - ▁Ge
279
+ - me
280
+ - ▁irgendwie
281
+ - ▁mehr
282
+ - hr
283
+ - us
284
+ - ▁sagen
285
+ - ▁wird
286
+ - ▁muss
287
+ - nt
288
+ - 'on'
289
+ - ▁alle
290
+ - ▁Da
291
+ - ▁wirklich
292
+ - ▁natürlich
293
+ - ▁Be
294
+ - et
295
+ - ▁diese
296
+ - '0'
297
+ - ▁gibt
298
+ - ▁H
299
+ - ▁um
300
+ - ben
301
+ - be
302
+ - ma
303
+ - at
304
+ - ste
305
+ - ▁nach
306
+ - ▁k
307
+ - ▁viel
308
+ - ▁sein
309
+ - nd
310
+ - ▁hier
311
+ - ▁meine
312
+ - cht
313
+ - ▁eigentlich
314
+ - ▁So
315
+ - kt
316
+ - ▁O
317
+ - ern
318
+ - ▁machen
319
+ - is
320
+ - ▁I
321
+ - ▁bin
322
+ - ▁weiß
323
+ - ▁Ver
324
+ - ll
325
+ - ▁hast
326
+ - ▁Ma
327
+ - ▁C
328
+ - uch
329
+ - ru
330
+ - ▁vielleicht
331
+ - rei
332
+ - ▁Re
333
+ - c
334
+ - ha
335
+ - iert
336
+ - ▁Die
337
+ - ▁zum
338
+ - icht
339
+ - ▁finde
340
+ - ell
341
+ - ▁eben
342
+ - ▁1
343
+ - ne
344
+ - ▁s
345
+ - di
346
+ - lo
347
+ - ▁sch
348
+ - chen
349
+ - ein
350
+ - hl
351
+ - ▁Es
352
+ - ▁gesagt
353
+ - we
354
+ - ▁U
355
+ - ft
356
+ - zu
357
+ - nen
358
+ - ▁am
359
+ - ▁In
360
+ - ieren
361
+ - ▁werden
362
+ - ▁An
363
+ - ▁Er
364
+ - pp
365
+ - ▁geht
366
+ - hn
367
+ - ▁Jahr
368
+ - ▁R
369
+ - isch
370
+ - ▁alles
371
+ - ▁gerade
372
+ - ▁M
373
+ - rt
374
+ - der
375
+ - ▁ne
376
+ - ▁genau
377
+ - ▁re
378
+ - ag
379
+ - end
380
+ - ▁Wir
381
+ - ▁Ha
382
+ - ▁würde
383
+ - ▁p
384
+ - ▁doch
385
+ - ▁zwei
386
+ - ▁einem
387
+ - ▁erst
388
+ - ▁g
389
+ - ▁w
390
+ - ▁keine
391
+ - au
392
+ - ik
393
+ - ▁durch
394
+ - ▁hin
395
+ - her
396
+ - un
397
+ - art
398
+ - mm
399
+ - ▁dir
400
+ - ▁Spiel
401
+ - kommen
402
+ - ▁gar
403
+ - ▁b
404
+ - ▁mein
405
+ - S
406
+ - ver
407
+ - ff
408
+ - ▁können
409
+ - zi
410
+ - ▁Ein
411
+ - im
412
+ - ▁andere
413
+ - na
414
+ - ▁richtig
415
+ - ei
416
+ - rk
417
+ - ul
418
+ - lle
419
+ - fe
420
+ - ▁W
421
+ - wi
422
+ - ach
423
+ - sp
424
+ - rie
425
+ - ▁Zeit
426
+ - ▁Leute
427
+ - ▁ab
428
+ - ▁viele
429
+ - ▁Ka
430
+ - ▁We
431
+ - ke
432
+ - and
433
+ - ▁ob
434
+ - ür
435
+ - ner
436
+ - ▁Ko
437
+ - wa
438
+ - ▁einer
439
+ - ber
440
+ - ko
441
+ - x
442
+ - ▁weiter
443
+ - ation
444
+ - ▁gemacht
445
+ - ▁hatte
446
+ - spiel
447
+ - ▁Ne
448
+ - ▁des
449
+ - ▁Z
450
+ - '...'
451
+ - sten
452
+ - che
453
+ - sen
454
+ - hör
455
+ - ▁Man
456
+ - ▁dieser
457
+ - igen
458
+ - ▁unter
459
+ - ▁N
460
+ - ▁L
461
+ - ion
462
+ - ▁Was
463
+ - ssen
464
+ - ß
465
+ - ken
466
+ - ungen
467
+ - ▁le
468
+ - ▁will
469
+ - ga
470
+ - ▁denn
471
+ - am
472
+ - ▁J
473
+ - ▁kommt
474
+ - ▁ent
475
+ - ▁st
476
+ - iv
477
+ - ▁D
478
+ - ▁groß
479
+ - ir
480
+ - ▁hab
481
+ - nder
482
+ - aus
483
+ - ▁macht
484
+ - ist
485
+ - ▁dieses
486
+ - ▁Li
487
+ - si
488
+ - ho
489
+ - ▁Fall
490
+ - rü
491
+ - ▁De
492
+ - so
493
+ - ▁Du
494
+ - ve
495
+ - '5'
496
+ - ▁Ba
497
+ - ▁ange
498
+ - ▁heißt
499
+ - ni
500
+ - ht
501
+ - rä
502
+ - '3'
503
+ - ▁Wo
504
+ - ▁dich
505
+ - ▁sagt
506
+ - ▁Le
507
+ - pro
508
+ - gel
509
+ - ▁Se
510
+ - ▁schön
511
+ - mp
512
+ - ▁jeden
513
+ - id
514
+ - ▁damit
515
+ - ▁Al
516
+ - ▁Me
517
+ - ▁Co
518
+ - ▁Beispiel
519
+ - ol
520
+ - ▁her
521
+ - ▁sondern
522
+ - V
523
+ - ▁unsere
524
+ - ▁Genau
525
+ - ▁Sie
526
+ - all
527
+ - gt
528
+ - ▁La
529
+ - ▁euch
530
+ - ▁neu
531
+ - ub
532
+ - ▁Sp
533
+ - ▁bis
534
+ - ▁tatsächlich
535
+ - ier
536
+ - ▁Pa
537
+ - ▁rein
538
+ - tion
539
+ - mo
540
+ - elt
541
+ - sa
542
+ - ▁Der
543
+ - ige
544
+ - ▁anderen
545
+ - schaft
546
+ - lu
547
+ - ka
548
+ - ische
549
+ - ▁kein
550
+ - ▁Na
551
+ - ungs
552
+ - ▁wäre
553
+ - ''''
554
+ - reich
555
+ - ▁raus
556
+ - nehmen
557
+ - ▁Film
558
+ - ▁nochmal
559
+ - ▁wer
560
+ - tra
561
+ - ger
562
+ - ler
563
+ - lä
564
+ - ▁hätte
565
+ - j
566
+ - halt
567
+ - ▁heute
568
+ - ▁a
569
+ - ld
570
+ - ick
571
+ - ▁diesen
572
+ - ▁Sa
573
+ - ta
574
+ - ▁wurde
575
+ - eiß
576
+ - bar
577
+ - lei
578
+ - ▁To
579
+ - ▁Ding
580
+ - arbeit
581
+ - ischen
582
+ - ▁of
583
+ - ▁un
584
+ - ▁Auf
585
+ - ▁Dann
586
+ - wo
587
+ - ▁ihn
588
+ - ▁Mo
589
+ - ▁Mi
590
+ - ▁Ab
591
+ - ▁Ho
592
+ - ▁Zu
593
+ - ▁Ra
594
+ - pf
595
+ - v
596
+ - ▁Frage
597
+ - ▁okay
598
+ - ▁waren
599
+ - ▁Wie
600
+ - sse
601
+ - ▁möchte
602
+ - ▁dazu
603
+ - fall
604
+ - ▁Vor
605
+ - äng
606
+ - '4'
607
+ - sam
608
+ - 'no'
609
+ - ▁Tag
610
+ - ▁kommen
611
+ - A
612
+ - ▁mach
613
+ - ▁seine
614
+ - ▁Wa
615
+ - ich
616
+ - ▁Wenn
617
+ - ▁Menschen
618
+ - P
619
+ - ▁sp
620
+ - lass
621
+ - ▁diesem
622
+ - ün
623
+ - hin
624
+ - ▁klar
625
+ - ▁2
626
+ - ▁soll
627
+ - ▁Thema
628
+ - geben
629
+ - ▁je
630
+ - '9'
631
+ - ▁Aus
632
+ - ▁Ro
633
+ - schau
634
+ - ▁deine
635
+ - ▁Bo
636
+ - heit
637
+ - voll
638
+ - teil
639
+ - ex
640
+ - ce
641
+ - ▁kannst
642
+ - ment
643
+ - acht
644
+ - ▁drei
645
+ - cken
646
+ - ▁bist
647
+ - ▁gleich
648
+ - nis
649
+ - ▁müssen
650
+ - är
651
+ - ▁Po
652
+ - ▁Mit
653
+ - op
654
+ - ▁gerne
655
+ - ▁nie
656
+ - ad
657
+ - lang
658
+ - ▁Woche
659
+ - ▁kurz
660
+ - stellen
661
+ - mmer
662
+ - ▁Sta
663
+ - ffen
664
+ - ▁quasi
665
+ - ▁gegen
666
+ - akt
667
+ - ▁kleine
668
+ - fer
669
+ - ▁20
670
+ - ▁guck
671
+ - ▁Ende
672
+ - ▁gesehen
673
+ - ▁Wi
674
+ - ör
675
+ - ▁nächste
676
+ - mal
677
+ - ab
678
+ - ▁Fa
679
+ - '1'
680
+ - ▁Podcast
681
+ - bi
682
+ - dem
683
+ - ▁wenig
684
+ - führ
685
+ - tag
686
+ - bo
687
+ - krieg
688
+ - pass
689
+ - ▁etwas
690
+ - hi
691
+ - stand
692
+ - ▁the
693
+ - ▁sehen
694
+ - F
695
+ - M
696
+ - ▁könnte
697
+ - ▁gehen
698
+ - T
699
+ - ▁wichtig
700
+ - zeit
701
+ - ▁Leben
702
+ - ▁He
703
+ - ▁paar
704
+ - mpf
705
+ - ▁Do
706
+ - ▁einmal
707
+ - pa
708
+ - ▁echt
709
+ - ▁Kon
710
+ - ▁Gott
711
+ - ▁dabei
712
+ - ▁zusammen
713
+ - '2'
714
+ - ▁Di
715
+ - vi
716
+ - D
717
+ - '6'
718
+ - ▁weg
719
+ - ▁Unter
720
+ - zähl
721
+ - B
722
+ - bring
723
+ - ▁denke
724
+ - ▁wollen
725
+ - ▁letzten
726
+ - hol
727
+ - ▁Sachen
728
+ - ▁Tra
729
+ - '8'
730
+ - ba
731
+ - ▁Folge
732
+ - ▁vom
733
+ - ▁tr
734
+ - ah
735
+ - ▁wollte
736
+ - ▁selbst
737
+ - ▁Weil
738
+ - co
739
+ - kauf
740
+ - gi
741
+ - ia
742
+ - ▁wahrscheinlich
743
+ - ▁ha
744
+ - ▁Mal
745
+ - ▁Pro
746
+ - uß
747
+ - ▁überhaupt
748
+ - bau
749
+ - ja
750
+ - weg
751
+ - ▁eher
752
+ - folg
753
+ - C
754
+ - rich
755
+ - ▁fand
756
+ - ic
757
+ - ▁selber
758
+ - ▁super
759
+ - vor
760
+ - ack
761
+ - ▁beim
762
+ - ▁jemand
763
+ - ▁dafür
764
+ - ▁drauf
765
+ - ▁Nach
766
+ - ▁musst
767
+ - ▁hatten
768
+ - ▁ihm
769
+ - ▁tun
770
+ - ▁sage
771
+ - fahren
772
+ - ▁zurück
773
+ - ▁gab
774
+ - ▁drin
775
+ - ▁sieht
776
+ - ▁sozusagen
777
+ - schrei
778
+ - ▁Hi
779
+ - ▁Okay
780
+ - ▁Oder
781
+ - ▁lange
782
+ - iz
783
+ - ieß
784
+ - ität
785
+ - ▁Jo
786
+ - fang
787
+ - ▁Wer
788
+ - '7'
789
+ - gehen
790
+ - anz
791
+ - ▁Nein
792
+ - ▁besser
793
+ - ▁Frau
794
+ - ▁schnell
795
+ - stehen
796
+ - ▁sowas
797
+ - ▁Problem
798
+ - ▁Punkt
799
+ - ▁Haus
800
+ - ▁zwar
801
+ - ▁sollte
802
+ - form
803
+ - ▁passiert
804
+ - ca
805
+ - ▁wissen
806
+ - ▁Vi
807
+ - ▁dein
808
+ - ▁Bi
809
+ - ▁deswegen
810
+ - pi
811
+ - lauf
812
+ - ▁welche
813
+ - ▁total
814
+ - ▁nämlich
815
+ - ▁davon
816
+ - ▁Hand
817
+ - ▁War
818
+ - ▁Kinder
819
+ - ▁irgendwann
820
+ - qu
821
+ - ▁Welt
822
+ - ▁cool
823
+ - bei
824
+ - ▁abge
825
+ - ▁dort
826
+ - fin
827
+ - weis
828
+ - ▁kenne
829
+ - ▁damals
830
+ - sprech
831
+ - ▁sogar
832
+ - schaff
833
+ - ▁Ga
834
+ - ▁jeder
835
+ - fühl
836
+ - ▁Mein
837
+ - ▁kam
838
+ - igkeit
839
+ - ▁Teil
840
+ - ▁konnte
841
+ - ▁Seite
842
+ - ▁Moment
843
+ - ▁steht
844
+ - ▁gewesen
845
+ - ▁Ta
846
+ - K
847
+ - ▁Schw
848
+ - port
849
+ - log
850
+ - ▁anders
851
+ - trag
852
+ - ▁liebe
853
+ - ▁eigene
854
+ - genommen
855
+ - ▁lassen
856
+ - ▁trotzdem
857
+ - ▁toll
858
+ - ▁relativ
859
+ - ▁Jetzt
860
+ - ▁gehört
861
+ - R
862
+ - ▁komm
863
+ - ▁ohne
864
+ - ▁Geld
865
+ - ▁Art
866
+ - ▁Vo
867
+ - ▁Lo
868
+ - land
869
+ - ▁alt
870
+ - ▁Euro
871
+ - rück
872
+ - ▁Grund
873
+ - ▁darüber
874
+ - ▁No
875
+ - setzt
876
+ - keit
877
+ - nehm
878
+ - ▁Arbeit
879
+ - G
880
+ - ▁Auto
881
+ - ▁Mu
882
+ - ▁Gefühl
883
+ - gestellt
884
+ - ▁vier
885
+ - ▁schlecht
886
+ - L
887
+ - ▁Anfang
888
+ - ▁darauf
889
+ - ▁Bild
890
+ - einander
891
+ - ▁irgendwas
892
+ - ▁letzte
893
+ - I
894
+ - ▁Dr
895
+ - ▁darf
896
+ - ▁Dank
897
+ - ▁interessant
898
+ - ativ
899
+ - E
900
+ - ▁irgendwo
901
+ - ▁direkt
902
+ - ▁Geschichte
903
+ - ▁spielen
904
+ - ▁Freund
905
+ - ▁manchmal
906
+ - frage
907
+ - va
908
+ - ▁Nu
909
+ - ▁los
910
+ - ▁komplett
911
+ - ▁fast
912
+ - ▁früh
913
+ - ▁seit
914
+ - ▁Über
915
+ - ▁Ganz
916
+ - ▁erstmal
917
+ - gang
918
+ - ▁stimmt
919
+ - nutz
920
+ - kommt
921
+ - ▁Ahnung
922
+ - ▁gedacht
923
+ - klär
924
+ - ▁weit
925
+ - zahl
926
+ - ▁Kind
927
+ - ▁funktioniert
928
+ - ▁zumindest
929
+ - gegangen
930
+ - bild
931
+ - ▁gehabt
932
+ - ▁Deutschland
933
+ - setzen
934
+ - ▁meisten
935
+ - ▁bestimmt
936
+ - ▁zwischen
937
+ - ▁gespielt
938
+ - ▁hoch
939
+ - ▁Person
940
+ - ▁ehrlich
941
+ - ▁Sinn
942
+ - ▁fünf
943
+ - ▁solche
944
+ - ▁brauche
945
+ - ▁dachte
946
+ - ▁Spaß
947
+ - schied
948
+ - ▁fest
949
+ - ▁sprechen
950
+ - ziehen
951
+ - geschrieben
952
+ - ▁Idee
953
+ - ▁spannend
954
+ - ▁später
955
+ - Ä
956
+ - W
957
+ - fällt
958
+ - ▁offen
959
+ - ▁Herr
960
+ - ▁krass
961
+ - ▁schwierig
962
+ - ▁bitte
963
+ - fahr
964
+ - erweise
965
+ - ▁Musik
966
+ - ▁ziemlich
967
+ - punkt
968
+ - ▁stark
969
+ - ▁freue
970
+ - fass
971
+ - ▁irgendein
972
+ - ▁hoffe
973
+ - ▁Chris
974
+ - ▁Situation
975
+ - ▁sehe
976
+ - ▁schwer
977
+ - ▁normal
978
+ - ▁Mensch
979
+ - ▁Vielleicht
980
+ - ▁egal
981
+ - '000'
982
+ - ▁Minuten
983
+ - H
984
+ - Y
985
+ - O
986
+ - ▁Herz
987
+ - ▁Bundes
988
+ - ▁darum
989
+ - ▁braucht
990
+ - ▁worden
991
+ - ▁leider
992
+ - ▁irgendwelche
993
+ - ▁Monat
994
+ - hält
995
+ - ▁gewisse
996
+ - ▁verschiedene
997
+ - spekt
998
+ - ▁Video
999
+ - ▁Qua
1000
+ - ▁Stelle
1001
+ - U
1002
+ - '!'
1003
+ - N
1004
+ - Q
1005
+ - Ö
1006
+ - X
1007
+ - Z
1008
+ - J
1009
+ - '%'
1010
+ - é
1011
+ - Ü
1012
+ - »
1013
+ - «
1014
+ - '&'
1015
+ - –
1016
+ - à
1017
+ - '*'
1018
+ - q
1019
+ - €
1020
+ - è
1021
+ - ş
1022
+ - ú
1023
+ - ć
1024
+ - á
1025
+ - ë
1026
+ - ç
1027
+ - —
1028
+ - í
1029
+ - °
1030
+ - /
1031
+ - å
1032
+ - $
1033
+ - č
1034
+ - ô
1035
+ - š
1036
+ - ó
1037
+ - _
1038
+ - ñ
1039
+ - ı
1040
+ - õ
1041
+ - '"'
1042
+ - ›
1043
+ - ́
1044
+ - ‹
1045
+ - ⁄
1046
+ - ê
1047
+ - û
1048
+ - É
1049
+ - ':'
1050
+ - ğ
1051
+ - Ã
1052
+ - )
1053
+ - ø
1054
+ - ♪
1055
+ - ã
1056
+ - ł
1057
+ - Ş
1058
+ - ù
1059
+ - ž
1060
+ - î
1061
+ - â
1062
+ - ń
1063
+ - Č
1064
+ - ï
1065
+ - ā
1066
+ - Š
1067
+ - ș
1068
+ - '='
1069
+ - ę
1070
+ - ś
1071
+ - ō
1072
+ - ð
1073
+ - İ
1074
+ - ă
1075
+ - ū
1076
+ - ò
1077
+ - ř
1078
+ - Ø
1079
+ - ý
1080
+ - ì
1081
+ - ē
1082
+ - ̄
1083
+ - μ
1084
+ - ż
1085
+ - ·
1086
+ - À
1087
+ - Á
1088
+ - ο
1089
+ - ṇ
1090
+ - ě
1091
+ - ;
1092
+ - ^
1093
+ - Î
1094
+ - ą
1095
+ - о
1096
+ - ה
1097
+ - ♫
1098
+ - 스
1099
+ - 해
1100
+ - §
1101
+ - λ
1102
+ - τ
1103
+ - Ó
1104
+ - đ
1105
+ - Ž
1106
+ - ț
1107
+ - '>'
1108
+ - '~'
1109
+ - £
1110
+ - Å
1111
+ - ź
1112
+ - Ż
1113
+ - Ȗ
1114
+ - Ε
1115
+ - Π
1116
+ - έ
1117
+ - δ
1118
+ - ς
1119
+ - υ
1120
+ - ύ
1121
+ - а
1122
+ - р
1123
+ - у
1124
+ - щ
1125
+ - ё
1126
+ - י
1127
+ - ث
1128
+ - ض
1129
+ - “
1130
+ - ►
1131
+ - っ
1132
+ - ぱ
1133
+ - る
1134
+ - 些
1135
+ - +
1136
+ - م
1137
+ - <sos/eos>
1138
+ init: null
1139
+ input_size: null
1140
+ ctc_conf:
1141
+ dropout_rate: 0.0
1142
+ ctc_type: builtin
1143
+ reduce: true
1144
+ ignore_nan_grad: null
1145
+ zero_infinity: true
1146
+ joint_net_conf: null
1147
+ use_preprocessor: true
1148
+ token_type: bpe
1149
+ bpemodel: data/de_token_list/bpe_unigram1024/bpe.model
1150
+ non_linguistic_symbols: null
1151
+ cleaner: null
1152
+ g2p: null
1153
+ speech_volume_normalize: null
1154
+ rir_scp: null
1155
+ rir_apply_prob: 1.0
1156
+ noise_scp: null
1157
+ noise_apply_prob: 1.0
1158
+ noise_db_range: '13_15'
1159
+ short_noise_thres: 0.5
1160
+ frontend: default
1161
+ frontend_conf:
1162
+ n_fft: 512
1163
+ win_length: 400
1164
+ hop_length: 160
1165
+ fs: 16k
1166
+ specaug: specaug
1167
+ specaug_conf:
1168
+ apply_time_warp: true
1169
+ time_warp_window: 5
1170
+ time_warp_mode: bicubic
1171
+ apply_freq_mask: true
1172
+ freq_mask_width_range:
1173
+ - 0
1174
+ - 30
1175
+ num_freq_mask: 2
1176
+ apply_time_mask: true
1177
+ time_mask_width_range:
1178
+ - 0
1179
+ - 40
1180
+ num_time_mask: 2
1181
+ normalize: global_mvn
1182
+ normalize_conf:
1183
+ stats_file: exp/asr_stats_raw_de_bpe1024/train/feats_stats.npz
1184
+ model: espnet
1185
+ model_conf:
1186
+ ctc_weight: 0.3
1187
+ lsm_weight: 0.1
1188
+ length_normalized_loss: false
1189
+ preencoder: null
1190
+ preencoder_conf: {}
1191
+ encoder: contextual_block_transformer
1192
+ encoder_conf:
1193
+ output_size: 256
1194
+ attention_heads: 8
1195
+ linear_units: 2048
1196
+ num_blocks: 30
1197
+ dropout_rate: 0.1
1198
+ positional_dropout_rate: 0.1
1199
+ attention_dropout_rate: 0.0
1200
+ input_layer: conv2d
1201
+ normalize_before: true
1202
+ block_size: 40
1203
+ hop_size: 16
1204
+ look_ahead: 16
1205
+ init_average: true
1206
+ ctx_pos_enc: true
1207
+ postencoder: null
1208
+ postencoder_conf: {}
1209
+ decoder: transformer
1210
+ decoder_conf:
1211
+ attention_heads: 8
1212
+ linear_units: 2048
1213
+ num_blocks: 14
1214
+ dropout_rate: 0.1
1215
+ positional_dropout_rate: 0.1
1216
+ self_attention_dropout_rate: 0.0
1217
+ src_attention_dropout_rate: 0.0
1218
+ preprocessor: default
1219
+ preprocessor_conf: {}
1220
+ required:
1221
+ - output_dir
1222
+ - token_list
1223
+ version: '202211'
1224
+ distributed: true
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/acc.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/backward_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/cer.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/cer_ctc.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/forward_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/gpu_max_cached_mem_GB.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/iter_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/loss.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/loss_att.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/loss_ctc.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/optim0_lr0.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/optim_step_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/train_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/images/wer.png ADDED
exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/valid.acc.ave_6best.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:13fb42d6e4b24a0869b497eacf5db6a26b642889368471d938ef27fbfb7efbf9
3
+ size 257128709
meta.yaml ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ espnet: '202211'
2
+ files:
3
+ asr_model_file: exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/valid.acc.ave_6best.pth
4
+ python: 3.10.8 (main, Nov 4 2022, 13:48:29) [GCC 11.2.0]
5
+ timestamp: 1681745643.404914
6
+ torch: 1.12.1+cu116
7
+ yaml_files:
8
+ asr_train_config: exp/asr_train_asr_streaming_transformer_size_xl_raw_de_bpe1024/config.yaml