pyf98 commited on
Commit
24d4db1
1 Parent(s): 5372c41

add model files

Browse files
README.md ADDED
@@ -0,0 +1,1312 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - espnet
4
+ - audio
5
+ - automatic-speech-recognition
6
+ language: noinfo
7
+ datasets:
8
+ - fisher_callhome_spanish
9
+ license: cc-by-4.0
10
+ ---
11
+
12
+ ## ESPnet2 ASR model
13
+
14
+ ### `pyf98/fisher_callhome_spanish_conformer`
15
+
16
+ This model was trained by Yifan Peng using fisher_callhome_spanish recipe in [espnet](https://github.com/espnet/espnet/).
17
+
18
+ ### Demo: How to use in ESPnet2
19
+
20
+ Follow the [ESPnet installation instructions](https://espnet.github.io/espnet/installation.html)
21
+ if you haven't done that already.
22
+
23
+ ```bash
24
+ cd espnet
25
+ git checkout 568bd0808f7509f9735282537db4c68dc3bdf376
26
+ pip install -e .
27
+ cd egs2/fisher_callhome_spanish/asr1
28
+ ./run.sh --skip_data_prep false --skip_train true --download_model pyf98/fisher_callhome_spanish_conformer
29
+ ```
30
+
31
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
32
+ # RESULTS
33
+ ## Environments
34
+ - date: `Tue Feb 28 20:50:34 CST 2023`
35
+ - python version: `3.9.15 (main, Nov 24 2022, 14:31:59) [GCC 11.2.0]`
36
+ - espnet version: `espnet 202301`
37
+ - pytorch version: `pytorch 1.13.1`
38
+ - Git hash: `568bd0808f7509f9735282537db4c68dc3bdf376`
39
+ - Commit date: `Tue Feb 28 06:06:06 2023 -0500`
40
+
41
+ ## exp/asr_train_asr_conformer6_raw_bpe1000_sp
42
+ ### WER
43
+
44
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
45
+ |---|---|---|---|---|---|---|---|---|
46
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|37989|68.2|23.8|7.9|6.5|38.3|79.2|
47
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|19035|67.5|24.0|8.5|6.3|38.8|82.4|
48
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|40961|83.3|12.0|4.6|4.0|20.7|63.2|
49
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|39888|83.7|12.1|4.1|4.7|20.9|63.2|
50
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|40011|85.7|10.7|3.6|5.2|19.4|61.5|
51
+
52
+ ### CER
53
+
54
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
55
+ |---|---|---|---|---|---|---|---|---|
56
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|181052|83.6|6.7|9.7|6.0|22.4|79.2|
57
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|91266|83.1|6.8|10.1|5.7|22.6|82.4|
58
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|194297|93.0|2.7|4.3|3.9|10.9|63.2|
59
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|189965|93.5|2.7|3.9|4.2|10.7|63.2|
60
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|194507|94.6|2.2|3.2|4.7|10.1|61.5|
61
+
62
+ ### TER
63
+
64
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
65
+ |---|---|---|---|---|---|---|---|---|
66
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|57692|65.2|19.2|15.6|4.6|39.4|79.2|
67
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|28951|64.3|19.0|16.7|4.9|40.5|82.4|
68
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|55907|83.1|9.8|7.1|3.8|20.7|63.2|
69
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|53966|83.8|10.0|6.2|4.3|20.4|63.2|
70
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|54212|86.4|8.6|5.0|4.9|18.5|61.5|
71
+
72
+ ## ASR config
73
+
74
+ <details><summary>expand</summary>
75
+
76
+ ```
77
+ config: conf/tuning/train_asr_conformer6.yaml
78
+ print_config: false
79
+ log_level: INFO
80
+ dry_run: false
81
+ iterator_type: sequence
82
+ output_dir: exp/asr_train_asr_conformer6_raw_bpe1000_sp
83
+ ngpu: 1
84
+ seed: 0
85
+ num_workers: 4
86
+ num_att_plot: 3
87
+ dist_backend: nccl
88
+ dist_init_method: env://
89
+ dist_world_size: null
90
+ dist_rank: null
91
+ local_rank: 0
92
+ dist_master_addr: null
93
+ dist_master_port: null
94
+ dist_launcher: null
95
+ multiprocessing_distributed: false
96
+ unused_parameters: false
97
+ sharded_ddp: false
98
+ cudnn_enabled: true
99
+ cudnn_benchmark: false
100
+ cudnn_deterministic: true
101
+ collect_stats: false
102
+ write_collected_feats: false
103
+ max_epoch: 50
104
+ patience: null
105
+ val_scheduler_criterion:
106
+ - valid
107
+ - loss
108
+ early_stopping_criterion:
109
+ - valid
110
+ - loss
111
+ - min
112
+ best_model_criterion:
113
+ - - valid
114
+ - acc
115
+ - max
116
+ keep_nbest_models: 10
117
+ nbest_averaging_interval: 0
118
+ grad_clip: 3
119
+ grad_clip_type: 2.0
120
+ grad_noise: false
121
+ accum_grad: 1
122
+ no_forward_run: false
123
+ resume: true
124
+ train_dtype: float32
125
+ use_amp: false
126
+ log_interval: null
127
+ use_matplotlib: true
128
+ use_tensorboard: true
129
+ create_graph_in_tensorboard: false
130
+ use_wandb: false
131
+ wandb_project: null
132
+ wandb_id: null
133
+ wandb_entity: null
134
+ wandb_name: null
135
+ wandb_model_log_interval: -1
136
+ detect_anomaly: false
137
+ pretrain_path: null
138
+ init_param: []
139
+ ignore_init_mismatch: false
140
+ freeze_param: []
141
+ num_iters_per_epoch: null
142
+ batch_size: 20
143
+ valid_batch_size: null
144
+ batch_bins: 10000000
145
+ valid_batch_bins: null
146
+ train_shape_file:
147
+ - exp/asr_stats_raw_bpe1000_sp/train/speech_shape
148
+ - exp/asr_stats_raw_bpe1000_sp/train/text_shape.bpe
149
+ valid_shape_file:
150
+ - exp/asr_stats_raw_bpe1000_sp/valid/speech_shape
151
+ - exp/asr_stats_raw_bpe1000_sp/valid/text_shape.bpe
152
+ batch_type: numel
153
+ valid_batch_type: null
154
+ fold_length:
155
+ - 80000
156
+ - 150
157
+ sort_in_batch: descending
158
+ sort_batch: descending
159
+ multiple_iterator: false
160
+ chunk_length: 500
161
+ chunk_shift_ratio: 0.5
162
+ num_cache_chunks: 1024
163
+ train_data_path_and_name_and_type:
164
+ - - dump/raw/train_sp/wav.scp
165
+ - speech
166
+ - kaldi_ark
167
+ - - dump/raw/train_sp/text
168
+ - text
169
+ - text
170
+ valid_data_path_and_name_and_type:
171
+ - - dump/raw/dev/wav.scp
172
+ - speech
173
+ - kaldi_ark
174
+ - - dump/raw/dev/text
175
+ - text
176
+ - text
177
+ allow_variable_data_keys: false
178
+ max_cache_size: 0.0
179
+ max_cache_fd: 32
180
+ valid_max_cache_size: null
181
+ exclude_weight_decay: false
182
+ exclude_weight_decay_conf: {}
183
+ optim: adam
184
+ optim_conf:
185
+ lr: 4.0
186
+ scheduler: noamlr
187
+ scheduler_conf:
188
+ model_size: 256
189
+ warmup_steps: 25000
190
+ token_list:
191
+ - <blank>
192
+ - <unk>
193
+ - ▁que
194
+ - s
195
+ - ▁no
196
+ - ▁y
197
+ - ▁de
198
+ - ▁a
199
+ - ▁sí
200
+ - ▁la
201
+ - ▁es
202
+ - ▁en
203
+ - r
204
+ - n
205
+ - ▁yo
206
+ - ▁el
207
+ - ▁me
208
+ - ▁pero
209
+ - ▁lo
210
+ - ▁o
211
+ - ▁se
212
+ - ▁un
213
+ - ▁los
214
+ - ▁como
215
+ - ▁ah
216
+ - ▁con
217
+ - ▁por
218
+ - ▁si
219
+ - ▁eh
220
+ - ▁eso
221
+ - ▁una
222
+ - ▁porque
223
+ - a
224
+ - ▁mi
225
+ - ▁tu
226
+ - ▁para
227
+ - ▁más
228
+ - ▁ya
229
+ - ▁te
230
+ - do
231
+ - ▁bueno
232
+ - ▁hay
233
+ - l
234
+ - ▁ajá
235
+ - ▁pues
236
+ - u
237
+ - o
238
+ - ▁qué
239
+ - e
240
+ - c
241
+ - ▁le
242
+ - ▁entonces
243
+ - ▁está
244
+ - ra
245
+ - da
246
+ - ▁así
247
+ - ▁muy
248
+ - ▁las
249
+ - ▁claro
250
+ - ▁también
251
+ - ndo
252
+ - ▁todo
253
+ - ▁bien
254
+ - ▁uno
255
+ - d
256
+ - ▁sé
257
+ - re
258
+ - ▁mhm
259
+ - la
260
+ - to
261
+ - ta
262
+ - i
263
+ - ▁sea
264
+ - b
265
+ - t
266
+ - ▁ca
267
+ - é
268
+ - te
269
+ - es
270
+ - ▁son
271
+ - ▁aquí
272
+ - ▁al
273
+ - mos
274
+ - ▁gente
275
+ - ▁tiene
276
+ - ▁ha
277
+ - ▁mucho
278
+ - ca
279
+ - ▁cuando
280
+ - ▁oh
281
+ - ▁su
282
+ - ▁re
283
+ - g
284
+ - ▁mm
285
+ - ti
286
+ - ba
287
+ - ▁este
288
+ - ▁creo
289
+ - ▁va
290
+ - v
291
+ - lo
292
+ - ó
293
+ - le
294
+ - y
295
+ - ▁cómo
296
+ - í
297
+ - ci
298
+ - p
299
+ - na
300
+ - ▁del
301
+ - ce
302
+ - ▁verdad
303
+ - ro
304
+ - ▁tengo
305
+ - er
306
+ - ▁ellos
307
+ - ▁era
308
+ - ▁ahí
309
+ - ▁él
310
+ - ▁estoy
311
+ - ▁he
312
+ - ▁ahora
313
+ - m
314
+ - ▁
315
+ - f
316
+ - ma
317
+ - ▁llama
318
+ - ▁ma
319
+ - ▁cosas
320
+ - ri
321
+ - ▁años
322
+ - en
323
+ - ▁hace
324
+ - ▁co
325
+ - co
326
+ - ción
327
+ - h
328
+ - á
329
+ - de
330
+ - ▁e
331
+ - ▁nada
332
+ - ▁casa
333
+ - 'no'
334
+ - ▁algo
335
+ - ▁pa
336
+ - ▁estaba
337
+ - nta
338
+ - ga
339
+ - ar
340
+ - ▁in
341
+ - ▁están
342
+ - ▁gusta
343
+ - si
344
+ - ▁di
345
+ - ▁cu
346
+ - ▁dos
347
+ - mente
348
+ - ▁vi
349
+ - ▁veces
350
+ - ▁uh
351
+ - so
352
+ - ▁ella
353
+ - ▁tienen
354
+ - ▁ese
355
+ - di
356
+ - ▁fue
357
+ - ▁hacer
358
+ - se
359
+ - ▁siempre
360
+ - ▁so
361
+ - li
362
+ - ▁dice
363
+ - go
364
+ - ▁vez
365
+ - ▁soy
366
+ - ▁persona
367
+ - ▁ba
368
+ - ▁acá
369
+ - ▁digo
370
+ - ía
371
+ - ▁ejemplo
372
+ - ▁música
373
+ - ▁usted
374
+ - ron
375
+ - ▁ver
376
+ - cu
377
+ - ▁ve
378
+ - ▁ni
379
+ - ▁mucha
380
+ - sa
381
+ - ▁esa
382
+ - pe
383
+ - ría
384
+ - ve
385
+ - ▁ser
386
+ - ▁okay
387
+ - ▁pasa
388
+ - z
389
+ - ▁puede
390
+ - an
391
+ - ▁cosa
392
+ - ▁da
393
+ - ▁otra
394
+ - me
395
+ - ▁ay
396
+ - ▁habla
397
+ - al
398
+ - ▁sabes
399
+ - ▁después
400
+ - ja
401
+ - ▁tiempo
402
+ - nd
403
+ - ne
404
+ - ado
405
+ - mi
406
+ - pa
407
+ - ▁po
408
+ - ▁d
409
+ - ▁ju
410
+ - ▁i
411
+ - ▁otro
412
+ - ▁allá
413
+ - ▁m
414
+ - ica
415
+ - ▁estados
416
+ - tu
417
+ - ▁todos
418
+ - nte
419
+ - iendo
420
+ - va
421
+ - ▁donde
422
+ - ▁tan
423
+ - ▁mismo
424
+ - ▁esta
425
+ - ▁t
426
+ - ▁mo
427
+ - ▁ir
428
+ - ▁unidos
429
+ - ▁trabajo
430
+ - ▁poco
431
+ - tos
432
+ - cho
433
+ - ▁menos
434
+ - ▁ven
435
+ - ▁tenía
436
+ - ▁c
437
+ - ▁personas
438
+ - ▁tener
439
+ - za
440
+ - ▁mira
441
+ - ▁dónde
442
+ - mo
443
+ - ▁pro
444
+ - ▁mejor
445
+ - ▁li
446
+ - ▁nunca
447
+ - ▁decir
448
+ - ▁estás
449
+ - ▁l
450
+ - ▁tra
451
+ - ▁ciudad
452
+ - ▁per
453
+ - rio
454
+ - ▁pre
455
+ - ▁voy
456
+ - ▁exacto
457
+ - ▁tienes
458
+ - ▁había
459
+ - ▁f
460
+ - ▁sabe
461
+ - tra
462
+ - sta
463
+ - ▁muchos
464
+ - idad
465
+ - ▁país
466
+ - ▁p
467
+ - ▁mu
468
+ - ▁hasta
469
+ - ▁parte
470
+ - ▁igual
471
+ - ▁muchas
472
+ - ▁día
473
+ - mp
474
+ - ▁comp
475
+ - ▁parece
476
+ - ido
477
+ - ciones
478
+ - ▁pu
479
+ - ▁esto
480
+ - ▁nueva
481
+ - ▁nosotros
482
+ - jo
483
+ - ▁ex
484
+ - ▁problema
485
+ - ▁ro
486
+ - ▁pe
487
+ - ▁tema
488
+ - cia
489
+ - k
490
+ - ble
491
+ - ▁do
492
+ - ▁tres
493
+ - ▁van
494
+ - ▁sa
495
+ - ▁um
496
+ - ▁hm
497
+ - ▁estar
498
+ - ▁sal
499
+ - ▁s
500
+ - fi
501
+ - je
502
+ - ▁hola
503
+ - ▁york
504
+ - ▁tanto
505
+ - os
506
+ - ge
507
+ - ▁vida
508
+ - ▁familia
509
+ - ▁ra
510
+ - ▁les
511
+ - das
512
+ - ▁teléfono
513
+ - ie
514
+ - ▁mundo
515
+ - ▁hu
516
+ - ▁digamos
517
+ - ▁quiere
518
+ - nos
519
+ - ▁bastante
520
+ - ste
521
+ - j
522
+ - qui
523
+ - les
524
+ - ▁hablar
525
+ - res
526
+ - ▁b
527
+ - ▁u
528
+ - ▁español
529
+ - ▁tal
530
+ - ▁dios
531
+ - che
532
+ - ▁han
533
+ - ▁dinero
534
+ - pi
535
+ - ni
536
+ - ▁difícil
537
+ - st
538
+ - ▁v
539
+ - ▁gra
540
+ - dos
541
+ - ue
542
+ - ▁chi
543
+ - ▁em
544
+ - ▁dicen
545
+ - ▁antes
546
+ - tas
547
+ - era
548
+ - ▁año
549
+ - ▁vive
550
+ - ▁cierto
551
+ - ia
552
+ - rá
553
+ - ria
554
+ - po
555
+ - nt
556
+ - ▁religión
557
+ - que
558
+ - ▁ci
559
+ - ▁cinco
560
+ - ▁ne
561
+ - ió
562
+ - ▁cre
563
+ - ente
564
+ - ñ
565
+ - ir
566
+ - ▁car
567
+ - ▁to
568
+ - bo
569
+ - ▁casi
570
+ - men
571
+ - ▁niños
572
+ - ▁ti
573
+ - bu
574
+ - w
575
+ - il
576
+ - ▁cada
577
+ - ieron
578
+ - cha
579
+ - ▁dije
580
+ - x
581
+ - ▁pienso
582
+ - ▁g
583
+ - ▁llega
584
+ - ento
585
+ - ▁grande
586
+ - ▁todavía
587
+ - ▁realmente
588
+ - ▁alguna
589
+ - ▁todas
590
+ - ▁mar
591
+ - cio
592
+ - ▁acuerdo
593
+ - mb
594
+ - ▁segu
595
+ - rse
596
+ - ▁mal
597
+ - ▁estamos
598
+ - ▁tipo
599
+ - be
600
+ - ▁pone
601
+ - ▁eres
602
+ - ▁sin
603
+ - ▁tenemos
604
+ - encia
605
+ - ▁alguien
606
+ - cto
607
+ - tar
608
+ - ▁vos
609
+ - ▁fi
610
+ - ▁haciendo
611
+ - ▁quién
612
+ - ▁toda
613
+ - ▁viene
614
+ - io
615
+ - ura
616
+ - ▁pen
617
+ - ▁hombre
618
+ - ▁hacen
619
+ - ▁hablando
620
+ - ▁ayuda
621
+ - ▁hi
622
+ - ▁trata
623
+ - ▁hoy
624
+ - ito
625
+ - ten
626
+ - ▁na
627
+ - ▁exactamente
628
+ - ▁escucha
629
+ - ver
630
+ - un
631
+ - ▁conoce
632
+ - gue
633
+ - ño
634
+ - ▁filadelfia
635
+ - ita
636
+ - ▁poder
637
+ - ▁fa
638
+ - án
639
+ - ▁puedo
640
+ - ▁lugar
641
+ - ▁vamos
642
+ - ▁yeah
643
+ - ú
644
+ - ▁desde
645
+ - ▁pi
646
+ - lla
647
+ - ▁hora
648
+ - lu
649
+ - ▁otros
650
+ - ▁méxico
651
+ - ▁internet
652
+ - ▁res
653
+ - ▁solamente
654
+ - ban
655
+ - ▁usa
656
+ - ▁vas
657
+ - ▁fui
658
+ - ▁estado
659
+ - ▁lleva
660
+ - ▁mil
661
+ - ▁solo
662
+ - ▁entre
663
+ - ▁wow
664
+ - ▁éste
665
+ - ch
666
+ - den
667
+ - ▁frío
668
+ - ▁cree
669
+ - ▁caso
670
+ - ▁estudia
671
+ - ▁am
672
+ - ▁busca
673
+ - ▁dis
674
+ - ▁trabaja
675
+ - ▁fe
676
+ - ▁bo
677
+ - ▁hecho
678
+ - ▁pueden
679
+ - ▁poquito
680
+ - ter
681
+ - ▁vivir
682
+ - ▁amigo
683
+ - ▁cuánto
684
+ - ▁ga
685
+ - ▁esas
686
+ - ul
687
+ - ▁tampoco
688
+ - ▁hijos
689
+ - ▁unos
690
+ - el
691
+ - ▁cuatro
692
+ - ▁sus
693
+ - ▁com
694
+ - ▁aunque
695
+ - ▁seguro
696
+ - ▁ce
697
+ - ▁forma
698
+ - ▁debe
699
+ - los
700
+ - ▁ta
701
+ - cion
702
+ - ones
703
+ - ▁puedes
704
+ - ▁mamá
705
+ - ▁cuenta
706
+ - ▁mis
707
+ - ▁diferente
708
+ - ▁quiero
709
+ - ▁ho
710
+ - ▁vivo
711
+ - ▁celular
712
+ - ero
713
+ - ▁universidad
714
+ - ▁be
715
+ - ▁misma
716
+ - ▁deja
717
+ - ▁cuál
718
+ - ▁inglés
719
+ - ▁nombre
720
+ - dia
721
+ - ▁paga
722
+ - ▁ahorita
723
+ - ▁cambia
724
+ - gra
725
+ - ▁dan
726
+ - ▁allí
727
+ - ▁rico
728
+ - ▁puerto
729
+ - ▁buenas
730
+ - ▁manera
731
+ - ▁cri
732
+ - ▁días
733
+ - ▁ésta
734
+ - ▁cualquier
735
+ - ▁países
736
+ - ing
737
+ - tica
738
+ - ina
739
+ - ▁buena
740
+ - ▁nadie
741
+ - ▁decía
742
+ - ▁piensa
743
+ - ▁sobre
744
+ - ▁esposo
745
+ - ▁qui
746
+ - ▁chile
747
+ - tro
748
+ - ▁toma
749
+ - ▁dijo
750
+ - ▁quieren
751
+ - ▁película
752
+ - ▁semana
753
+ - ▁sistema
754
+ - ▁come
755
+ - ▁mujer
756
+ - ▁veo
757
+ - ▁n
758
+ - ida
759
+ - ▁otras
760
+ - ▁medio
761
+ - ón
762
+ - ▁diez
763
+ - ▁cerca
764
+ - ▁iba
765
+ - ico
766
+ - gan
767
+ - ▁necesita
768
+ - zo
769
+ - ▁oye
770
+ - ▁san
771
+ - ▁bu
772
+ - ▁entiendes
773
+ - tó
774
+ - rme
775
+ - ▁sería
776
+ - ▁argentina
777
+ - ▁momento
778
+ - miento
779
+ - ▁know
780
+ - ▁seis
781
+ - ▁fo
782
+ - ▁toca
783
+ - ▁manda
784
+ - ▁w
785
+ - ▁iglesia
786
+ - ▁dólares
787
+ - ▁ja
788
+ - ▁diferentes
789
+ - ista
790
+ - ▁escuela
791
+ - ▁fácil
792
+ - ▁sale
793
+ - ▁interesante
794
+ - ▁padre
795
+ - ▁gana
796
+ - ▁inter
797
+ - ▁papá
798
+ - mina
799
+ - ▁pregunta
800
+ - iente
801
+ - ▁realidad
802
+ - ▁conozco
803
+ - ▁dar
804
+ - sión
805
+ - ▁tenido
806
+ - ▁trabajar
807
+ - ▁pareja
808
+ - ▁gu
809
+ - ▁mío
810
+ - ▁hijo
811
+ - ig
812
+ - ▁vivi
813
+ - ▁computadora
814
+ - ▁visto
815
+ - ▁importante
816
+ - ▁pasado
817
+ - ▁vol
818
+ - ▁tenga
819
+ - ho
820
+ - ▁pagar
821
+ - ▁latino
822
+ - ▁corre
823
+ - ▁haber
824
+ - ▁televisión
825
+ - ▁luego
826
+ - ▁relación
827
+ - ▁señor
828
+ - ▁tanta
829
+ - ▁mujeres
830
+ - iza
831
+ - ▁treinta
832
+ - ▁idea
833
+ - ▁salir
834
+ - ▁americano
835
+ - ▁encanta
836
+ - ▁meses
837
+ - ▁pasó
838
+ - ▁programa
839
+ - ▁algún
840
+ - ▁pri
841
+ - ▁estuve
842
+ - ▁comprar
843
+ - ▁contra
844
+ - ▁bonito
845
+ - ▁colombia
846
+ - ▁compra
847
+ - ▁super
848
+ - ▁hacía
849
+ - ▁imp
850
+ - ▁cultura
851
+ - ▁fíjate
852
+ - ▁sino
853
+ - ▁poner
854
+ - ▁fuera
855
+ - ▁ri
856
+ - ▁veinte
857
+ - ▁buen
858
+ - ▁único
859
+ - ▁entiendo
860
+ - ▁depende
861
+ - ▁fu
862
+ - ▁españa
863
+ - ▁quizás
864
+ - ▁esté
865
+ - ▁gracias
866
+ - ▁hija
867
+ - tico
868
+ - ▁imagino
869
+ - q
870
+ - ▁quiera
871
+ - ▁comuni
872
+ - ▁espera
873
+ - ▁go
874
+ - ▁primera
875
+ - ▁clase
876
+ - ▁general
877
+ - ▁diciendo
878
+ - ▁carro
879
+ - ▁anda
880
+ - ▁somos
881
+ - ▁sabía
882
+ - ▁amiga
883
+ - ▁vaya
884
+ - ▁compañía
885
+ - ▁siete
886
+ - ▁viste
887
+ - ▁canadá
888
+ - ▁cuanto
889
+ - ▁empeza
890
+ - ▁mayor
891
+ - ▁lleg
892
+ - ▁ido
893
+ - ▁malo
894
+ - ▁debería
895
+ - ▁gobierno
896
+ - ▁edad
897
+ - ▁situación
898
+ - ▁trabajando
899
+ - tivo
900
+ - ▁calle
901
+ - ▁veinti
902
+ - ▁mayoría
903
+ - ▁plan
904
+ - ▁viviendo
905
+ - ▁termina
906
+ - ▁llamo
907
+ - ▁viaja
908
+ - ▁social
909
+ - ▁jo
910
+ - ▁ciento
911
+ - ▁joven
912
+ - ▁estudio
913
+ - ▁hablo
914
+ - ▁empieza
915
+ - ▁podía
916
+ - ▁baila
917
+ - ▁punto
918
+ - ▁matrimonio
919
+ - ▁primero
920
+ - ▁entiende
921
+ - ▁perdón
922
+ - ▁niña
923
+ - ▁pobre
924
+ - fect
925
+ - ▁hispano
926
+ - ▁auto
927
+ - ▁importa
928
+ - ▁tarde
929
+ - ▁vivía
930
+ - ▁gustaría
931
+ - ▁diferencia
932
+ - ▁pueda
933
+ - ▁experiencia
934
+ - ▁ángeles
935
+ - ▁pie
936
+ - ▁oportunidad
937
+ - ▁mañana
938
+ - ▁nuevo
939
+ - ▁ningún
940
+ - ▁k
941
+ - ▁razón
942
+ - ▁minutos
943
+ - vis
944
+ - ▁además
945
+ - ▁cha
946
+ - ▁nueve
947
+ - ▁comercial
948
+ - ▁demasiado
949
+ - ▁encontrar
950
+ - port
951
+ - ▁sentido
952
+ - ▁número
953
+ - ▁política
954
+ - ▁niño
955
+ - ▁grupo
956
+ - ▁pensar
957
+ - ▁hermano
958
+ - ísimo
959
+ - ▁raza
960
+ - ▁afuera
961
+ - ▁quince
962
+ - ▁sitio
963
+ - ▁policía
964
+ - ▁gusto
965
+ - ▁fuerte
966
+ - ▁miami
967
+ - ▁palabra
968
+ - ▁montón
969
+ - ▁cincuenta
970
+ - ▁falta
971
+ - ▁recuerdo
972
+ - ▁visita
973
+ - ▁normal
974
+ - ▁especialmente
975
+ - ▁hizo
976
+ - ▁salud
977
+ - ▁partido
978
+ - ▁plata
979
+ - ▁venezuela
980
+ - ▁ru
981
+ - ▁novia
982
+ - ▁cierta
983
+ - ▁educa
984
+ - ▁área
985
+ - ▁maneja
986
+ - ▁quien
987
+ - ▁acostumbra
988
+ - ▁conocí
989
+ - ▁doctor
990
+ - ▁inmigrante
991
+ - ▁básicamente
992
+ - ▁mexicano
993
+ - ▁comida
994
+ - ▁algunos
995
+ - ▁enseña
996
+ - ▁cuarenta
997
+ - ▁supuesto
998
+ - ▁panamá
999
+ - ▁religiones
1000
+ - ▁cuestión
1001
+ - ▁bi
1002
+ - ▁final
1003
+ - ▁encuentro
1004
+ - ▁llevo
1005
+ - ▁tenés
1006
+ - ▁hermana
1007
+ - ▁papel
1008
+ - ▁existe
1009
+ - ▁aprende
1010
+ - ▁novio
1011
+ - ▁encontr
1012
+ - ▁cambio
1013
+ - ▁negocio
1014
+ - ▁atrás
1015
+ - ▁podría
1016
+ - ▁miedo
1017
+ - ismo
1018
+ - ▁increíble
1019
+ - ▁pongo
1020
+ - ▁aparte
1021
+ - ▁osea
1022
+ - ▁médico
1023
+ - ▁acento
1024
+ - ▁terrible
1025
+ - ▁enferm
1026
+ - ▁hablé
1027
+ - ▁regresa
1028
+ - ▁texas
1029
+ - ▁jurado
1030
+ - ▁última
1031
+ - ▁peor
1032
+ - ▁estuvo
1033
+ - ▁dentro
1034
+ - ▁color
1035
+ - ▁viví
1036
+ - ▁right
1037
+ - ▁chicago
1038
+ - ▁servicio
1039
+ - ▁interesa
1040
+ - ▁muchísimo
1041
+ - ▁email
1042
+ - ▁escucho
1043
+ - ▁pronto
1044
+ - ▁homosexual
1045
+ - ▁rápido
1046
+ - ▁esposa
1047
+ - ▁principio
1048
+ - ▁llen
1049
+ - ▁hospital
1050
+ - ▁imagínate
1051
+ - ▁peligro
1052
+ - ▁cuándo
1053
+ - ▁uhum
1054
+ - ▁apartamento
1055
+ - ▁funciona
1056
+ - ▁historia
1057
+ - ▁tecnología
1058
+ - ▁control
1059
+ - ▁ninguna
1060
+ - ▁juntos
1061
+ - ▁encuentra
1062
+ - ▁horrible
1063
+ - ▁centro
1064
+ - ▁atención
1065
+ - ▁hubiera
1066
+ - ▁totalmente
1067
+ - ▁california
1068
+ - ▁católica
1069
+ - ▁molesta
1070
+ - ▁gustó
1071
+ - ▁información
1072
+ - ▁méjico
1073
+ - ▁suerte
1074
+ - ▁argentino
1075
+ - ▁divi
1076
+ - ▁florida
1077
+ - ▁guerra
1078
+ - ▁aires
1079
+ - ▁nieve
1080
+ - ▁obviamente
1081
+ - ▁pelea
1082
+ - ▁nuestro
1083
+ - ▁simplemente
1084
+ - ▁pequeño
1085
+ - ▁clima
1086
+ - ▁europa
1087
+ - ▁imagina
1088
+ - ▁arriba
1089
+ - ▁leyes
1090
+ - ▁playa
1091
+ - ▁violencia
1092
+ - ▁conversa
1093
+ - ▁fiesta
1094
+ - ▁tranquilo
1095
+ - ▁acepta
1096
+ - ▁último
1097
+ - ▁única
1098
+ - ▁definitivamente
1099
+ - ▁incluso
1100
+ - ▁idioma
1101
+ - ▁favor
1102
+ - ▁blanco
1103
+ - ▁presidente
1104
+ - ▁invierno
1105
+ - ▁separa
1106
+ - ivo
1107
+ - ▁primer
1108
+ - ▁nuestra
1109
+ - ▁bonita
1110
+ - ▁culpa
1111
+ - ▁vota
1112
+ - ▁entendí
1113
+ - ▁madre
1114
+ - ▁conocido
1115
+ - ▁arregl
1116
+ - ▁acerca
1117
+ - ▁washington
1118
+ - ▁radio
1119
+ - ▁opina
1120
+ - ▁contigo
1121
+ - ▁podemos
1122
+ - ▁pensando
1123
+ - ▁duro
1124
+ - ▁conmigo
1125
+ - ▁verano
1126
+ - '0'
1127
+ - ▁negro
1128
+ - ▁mientras
1129
+ - ▁nací
1130
+ - ▁toronto
1131
+ - ▁recibi
1132
+ - ▁hicieron
1133
+ - ▁boston
1134
+ - ▁campo
1135
+ - ▁repente
1136
+ - ▁cocina
1137
+ - ▁cuesta
1138
+ - ▁conseguir
1139
+ - ▁jóvenes
1140
+ - ▁olvida
1141
+ - ▁ochenta
1142
+ - ▁nivel
1143
+ - ▁sociedad
1144
+ - ▁chiquito
1145
+ - ▁guatemala
1146
+ - ▁político
1147
+ - ▁supongo
1148
+ - ▁empezó
1149
+ - ▁época
1150
+ - ▁siquiera
1151
+ - ▁agarra
1152
+ - ▁católico
1153
+ - ▁pennsylvania
1154
+ - ▁medicina
1155
+ - ▁entender
1156
+ - ▁italia
1157
+ - ▁especial
1158
+ - ▁atlanta
1159
+ - ▁navidad
1160
+ - ▁cantidad
1161
+ - ▁domingo
1162
+ - ▁cristiano
1163
+ - ▁opinión
1164
+ - ▁crédito
1165
+ - ▁noticias
1166
+ - ▁houston
1167
+ - ▁preocupa
1168
+ - ▁mensaje
1169
+ - ▁américa
1170
+ - ▁perfecto
1171
+ - ▁dijiste
1172
+ - '1'
1173
+ - '2'
1174
+ - '5'
1175
+ - _
1176
+ - '-'
1177
+ - '3'
1178
+ - '6'
1179
+ - '4'
1180
+ - '9'
1181
+ - '8'
1182
+ - '7'
1183
+ - A
1184
+ - B
1185
+ - ì
1186
+ - à
1187
+ - ç
1188
+ - è
1189
+ - ü
1190
+ - <sos/eos>
1191
+ init: null
1192
+ input_size: null
1193
+ ctc_conf:
1194
+ dropout_rate: 0.0
1195
+ ctc_type: builtin
1196
+ reduce: true
1197
+ ignore_nan_grad: null
1198
+ zero_infinity: true
1199
+ joint_net_conf: null
1200
+ use_preprocessor: true
1201
+ token_type: bpe
1202
+ bpemodel: data/token_list/bpe_unigram1000/bpe.model
1203
+ non_linguistic_symbols: null
1204
+ cleaner: null
1205
+ g2p: null
1206
+ speech_volume_normalize: null
1207
+ rir_scp: null
1208
+ rir_apply_prob: 1.0
1209
+ noise_scp: null
1210
+ noise_apply_prob: 1.0
1211
+ noise_db_range: '13_15'
1212
+ short_noise_thres: 0.5
1213
+ aux_ctc_tasks: []
1214
+ frontend: default
1215
+ frontend_conf:
1216
+ n_fft: 512
1217
+ win_length: 400
1218
+ hop_length: 160
1219
+ fs: 8k
1220
+ specaug: specaug
1221
+ specaug_conf:
1222
+ apply_time_warp: true
1223
+ time_warp_window: 5
1224
+ time_warp_mode: bicubic
1225
+ apply_freq_mask: true
1226
+ freq_mask_width_range:
1227
+ - 0
1228
+ - 30
1229
+ num_freq_mask: 2
1230
+ apply_time_mask: true
1231
+ time_mask_width_range:
1232
+ - 0
1233
+ - 40
1234
+ num_time_mask: 2
1235
+ normalize: global_mvn
1236
+ normalize_conf:
1237
+ stats_file: exp/asr_stats_raw_bpe1000_sp/train/feats_stats.npz
1238
+ model: espnet
1239
+ model_conf:
1240
+ ctc_weight: 0.3
1241
+ lsm_weight: 0.1
1242
+ length_normalized_loss: false
1243
+ preencoder: null
1244
+ preencoder_conf: {}
1245
+ encoder: conformer
1246
+ encoder_conf:
1247
+ output_size: 256
1248
+ attention_heads: 4
1249
+ linear_units: 2048
1250
+ num_blocks: 12
1251
+ dropout_rate: 0.1
1252
+ positional_dropout_rate: 0.1
1253
+ attention_dropout_rate: 0.1
1254
+ input_layer: conv2d
1255
+ normalize_before: true
1256
+ macaron_style: true
1257
+ pos_enc_layer_type: rel_pos
1258
+ selfattention_layer_type: rel_selfattn
1259
+ activation_type: swish
1260
+ use_cnn_module: true
1261
+ cnn_module_kernel: 31
1262
+ postencoder: null
1263
+ postencoder_conf: {}
1264
+ decoder: transformer
1265
+ decoder_conf:
1266
+ input_layer: embed
1267
+ num_blocks: 6
1268
+ linear_units: 2048
1269
+ dropout_rate: 0.1
1270
+ preprocessor: default
1271
+ preprocessor_conf: {}
1272
+ required:
1273
+ - output_dir
1274
+ - token_list
1275
+ version: '202301'
1276
+ distributed: false
1277
+ ```
1278
+
1279
+ </details>
1280
+
1281
+
1282
+
1283
+ ### Citing ESPnet
1284
+
1285
+ ```BibTex
1286
+ @inproceedings{watanabe2018espnet,
1287
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1288
+ title={{ESPnet}: End-to-End Speech Processing Toolkit},
1289
+ year={2018},
1290
+ booktitle={Proceedings of Interspeech},
1291
+ pages={2207--2211},
1292
+ doi={10.21437/Interspeech.2018-1456},
1293
+ url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
1294
+ }
1295
+
1296
+
1297
+
1298
+
1299
+ ```
1300
+
1301
+ or arXiv:
1302
+
1303
+ ```bibtex
1304
+ @misc{watanabe2018espnet,
1305
+ title={ESPnet: End-to-End Speech Processing Toolkit},
1306
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1307
+ year={2018},
1308
+ eprint={1804.00015},
1309
+ archivePrefix={arXiv},
1310
+ primaryClass={cs.CL}
1311
+ }
1312
+ ```
data/token_list/bpe_unigram1000/bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:67120d752c50bae982c37fcab3df20a63fa5d37670e8e9c3de2ec841d539fd52
3
+ size 253712
exp/asr_stats_raw_bpe1000_sp/train/feats_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6a45b2ea668ff9b083784887057a34ed304670cf5a7e0cec7f8bcedb9292b9c4
3
+ size 1402
exp/asr_train_asr_conformer6_raw_bpe1000_sp/RESULTS.md ADDED
@@ -0,0 +1,41 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
2
+ # RESULTS
3
+ ## Environments
4
+ - date: `Tue Feb 28 20:50:34 CST 2023`
5
+ - python version: `3.9.15 (main, Nov 24 2022, 14:31:59) [GCC 11.2.0]`
6
+ - espnet version: `espnet 202301`
7
+ - pytorch version: `pytorch 1.13.1`
8
+ - Git hash: `568bd0808f7509f9735282537db4c68dc3bdf376`
9
+ - Commit date: `Tue Feb 28 06:06:06 2023 -0500`
10
+
11
+ ## exp/asr_train_asr_conformer6_raw_bpe1000_sp
12
+ ### WER
13
+
14
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
15
+ |---|---|---|---|---|---|---|---|---|
16
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|37989|68.2|23.8|7.9|6.5|38.3|79.2|
17
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|19035|67.5|24.0|8.5|6.3|38.8|82.4|
18
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|40961|83.3|12.0|4.6|4.0|20.7|63.2|
19
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|39888|83.7|12.1|4.1|4.7|20.9|63.2|
20
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|40011|85.7|10.7|3.6|5.2|19.4|61.5|
21
+
22
+ ### CER
23
+
24
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
25
+ |---|---|---|---|---|---|---|---|---|
26
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|181052|83.6|6.7|9.7|6.0|22.4|79.2|
27
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|91266|83.1|6.8|10.1|5.7|22.6|82.4|
28
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|194297|93.0|2.7|4.3|3.9|10.9|63.2|
29
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|189965|93.5|2.7|3.9|4.2|10.7|63.2|
30
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|194507|94.6|2.2|3.2|4.7|10.1|61.5|
31
+
32
+ ### TER
33
+
34
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
35
+ |---|---|---|---|---|---|---|---|---|
36
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|57692|65.2|19.2|15.6|4.6|39.4|79.2|
37
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|28951|64.3|19.0|16.7|4.9|40.5|82.4|
38
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|55907|83.1|9.8|7.1|3.8|20.7|63.2|
39
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|53966|83.8|10.0|6.2|4.3|20.4|63.2|
40
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|54212|86.4|8.6|5.0|4.9|18.5|61.5|
41
+
exp/asr_train_asr_conformer6_raw_bpe1000_sp/config.yaml ADDED
@@ -0,0 +1,1200 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ config: conf/tuning/train_asr_conformer6.yaml
2
+ print_config: false
3
+ log_level: INFO
4
+ dry_run: false
5
+ iterator_type: sequence
6
+ output_dir: exp/asr_train_asr_conformer6_raw_bpe1000_sp
7
+ ngpu: 1
8
+ seed: 0
9
+ num_workers: 4
10
+ num_att_plot: 3
11
+ dist_backend: nccl
12
+ dist_init_method: env://
13
+ dist_world_size: null
14
+ dist_rank: null
15
+ local_rank: 0
16
+ dist_master_addr: null
17
+ dist_master_port: null
18
+ dist_launcher: null
19
+ multiprocessing_distributed: false
20
+ unused_parameters: false
21
+ sharded_ddp: false
22
+ cudnn_enabled: true
23
+ cudnn_benchmark: false
24
+ cudnn_deterministic: true
25
+ collect_stats: false
26
+ write_collected_feats: false
27
+ max_epoch: 50
28
+ patience: null
29
+ val_scheduler_criterion:
30
+ - valid
31
+ - loss
32
+ early_stopping_criterion:
33
+ - valid
34
+ - loss
35
+ - min
36
+ best_model_criterion:
37
+ - - valid
38
+ - acc
39
+ - max
40
+ keep_nbest_models: 10
41
+ nbest_averaging_interval: 0
42
+ grad_clip: 3
43
+ grad_clip_type: 2.0
44
+ grad_noise: false
45
+ accum_grad: 1
46
+ no_forward_run: false
47
+ resume: true
48
+ train_dtype: float32
49
+ use_amp: false
50
+ log_interval: null
51
+ use_matplotlib: true
52
+ use_tensorboard: true
53
+ create_graph_in_tensorboard: false
54
+ use_wandb: false
55
+ wandb_project: null
56
+ wandb_id: null
57
+ wandb_entity: null
58
+ wandb_name: null
59
+ wandb_model_log_interval: -1
60
+ detect_anomaly: false
61
+ pretrain_path: null
62
+ init_param: []
63
+ ignore_init_mismatch: false
64
+ freeze_param: []
65
+ num_iters_per_epoch: null
66
+ batch_size: 20
67
+ valid_batch_size: null
68
+ batch_bins: 10000000
69
+ valid_batch_bins: null
70
+ train_shape_file:
71
+ - exp/asr_stats_raw_bpe1000_sp/train/speech_shape
72
+ - exp/asr_stats_raw_bpe1000_sp/train/text_shape.bpe
73
+ valid_shape_file:
74
+ - exp/asr_stats_raw_bpe1000_sp/valid/speech_shape
75
+ - exp/asr_stats_raw_bpe1000_sp/valid/text_shape.bpe
76
+ batch_type: numel
77
+ valid_batch_type: null
78
+ fold_length:
79
+ - 80000
80
+ - 150
81
+ sort_in_batch: descending
82
+ sort_batch: descending
83
+ multiple_iterator: false
84
+ chunk_length: 500
85
+ chunk_shift_ratio: 0.5
86
+ num_cache_chunks: 1024
87
+ train_data_path_and_name_and_type:
88
+ - - dump/raw/train_sp/wav.scp
89
+ - speech
90
+ - kaldi_ark
91
+ - - dump/raw/train_sp/text
92
+ - text
93
+ - text
94
+ valid_data_path_and_name_and_type:
95
+ - - dump/raw/dev/wav.scp
96
+ - speech
97
+ - kaldi_ark
98
+ - - dump/raw/dev/text
99
+ - text
100
+ - text
101
+ allow_variable_data_keys: false
102
+ max_cache_size: 0.0
103
+ max_cache_fd: 32
104
+ valid_max_cache_size: null
105
+ exclude_weight_decay: false
106
+ exclude_weight_decay_conf: {}
107
+ optim: adam
108
+ optim_conf:
109
+ lr: 4.0
110
+ scheduler: noamlr
111
+ scheduler_conf:
112
+ model_size: 256
113
+ warmup_steps: 25000
114
+ token_list:
115
+ - <blank>
116
+ - <unk>
117
+ - ▁que
118
+ - s
119
+ - ▁no
120
+ - ▁y
121
+ - ▁de
122
+ - ▁a
123
+ - ▁sí
124
+ - ▁la
125
+ - ▁es
126
+ - ▁en
127
+ - r
128
+ - n
129
+ - ▁yo
130
+ - ▁el
131
+ - ▁me
132
+ - ▁pero
133
+ - ▁lo
134
+ - ▁o
135
+ - ▁se
136
+ - ▁un
137
+ - ▁los
138
+ - ▁como
139
+ - ▁ah
140
+ - ▁con
141
+ - ▁por
142
+ - ▁si
143
+ - ▁eh
144
+ - ▁eso
145
+ - ▁una
146
+ - ▁porque
147
+ - a
148
+ - ▁mi
149
+ - ▁tu
150
+ - ▁para
151
+ - ▁más
152
+ - ▁ya
153
+ - ▁te
154
+ - do
155
+ - ▁bueno
156
+ - ▁hay
157
+ - l
158
+ - ▁ajá
159
+ - ▁pues
160
+ - u
161
+ - o
162
+ - ▁qué
163
+ - e
164
+ - c
165
+ - ▁le
166
+ - ▁entonces
167
+ - ▁está
168
+ - ra
169
+ - da
170
+ - ▁así
171
+ - ▁muy
172
+ - ▁las
173
+ - ▁claro
174
+ - ▁también
175
+ - ndo
176
+ - ▁todo
177
+ - ▁bien
178
+ - ▁uno
179
+ - d
180
+ - ▁sé
181
+ - re
182
+ - ▁mhm
183
+ - la
184
+ - to
185
+ - ta
186
+ - i
187
+ - ▁sea
188
+ - b
189
+ - t
190
+ - ▁ca
191
+ - é
192
+ - te
193
+ - es
194
+ - ▁son
195
+ - ▁aquí
196
+ - ▁al
197
+ - mos
198
+ - ▁gente
199
+ - ▁tiene
200
+ - ▁ha
201
+ - ▁mucho
202
+ - ca
203
+ - ▁cuando
204
+ - ▁oh
205
+ - ▁su
206
+ - ▁re
207
+ - g
208
+ - ▁mm
209
+ - ti
210
+ - ba
211
+ - ▁este
212
+ - ▁creo
213
+ - ▁va
214
+ - v
215
+ - lo
216
+ - ó
217
+ - le
218
+ - y
219
+ - ▁cómo
220
+ - í
221
+ - ci
222
+ - p
223
+ - na
224
+ - ▁del
225
+ - ce
226
+ - ▁verdad
227
+ - ro
228
+ - ▁tengo
229
+ - er
230
+ - ▁ellos
231
+ - ▁era
232
+ - ▁ahí
233
+ - ▁él
234
+ - ▁estoy
235
+ - ▁he
236
+ - ▁ahora
237
+ - m
238
+ - ▁
239
+ - f
240
+ - ma
241
+ - ▁llama
242
+ - ▁ma
243
+ - ▁cosas
244
+ - ri
245
+ - ▁años
246
+ - en
247
+ - ▁hace
248
+ - ▁co
249
+ - co
250
+ - ción
251
+ - h
252
+ - á
253
+ - de
254
+ - ▁e
255
+ - ▁nada
256
+ - ▁casa
257
+ - 'no'
258
+ - ▁algo
259
+ - ▁pa
260
+ - ▁estaba
261
+ - nta
262
+ - ga
263
+ - ar
264
+ - ▁in
265
+ - ▁están
266
+ - ▁gusta
267
+ - si
268
+ - ▁di
269
+ - ▁cu
270
+ - ▁dos
271
+ - mente
272
+ - ▁vi
273
+ - ▁veces
274
+ - ▁uh
275
+ - so
276
+ - ▁ella
277
+ - ▁tienen
278
+ - ▁ese
279
+ - di
280
+ - ▁fue
281
+ - ▁hacer
282
+ - se
283
+ - ▁siempre
284
+ - ▁so
285
+ - li
286
+ - ▁dice
287
+ - go
288
+ - ▁vez
289
+ - ▁soy
290
+ - ▁persona
291
+ - ▁ba
292
+ - ▁acá
293
+ - ▁digo
294
+ - ía
295
+ - ▁ejemplo
296
+ - ▁música
297
+ - ▁usted
298
+ - ron
299
+ - ▁ver
300
+ - cu
301
+ - ▁ve
302
+ - ▁ni
303
+ - ▁mucha
304
+ - sa
305
+ - ▁esa
306
+ - pe
307
+ - ría
308
+ - ve
309
+ - ▁ser
310
+ - ▁okay
311
+ - ▁pasa
312
+ - z
313
+ - ▁puede
314
+ - an
315
+ - ▁cosa
316
+ - ▁da
317
+ - ▁otra
318
+ - me
319
+ - ▁ay
320
+ - ▁habla
321
+ - al
322
+ - ▁sabes
323
+ - ▁después
324
+ - ja
325
+ - ▁tiempo
326
+ - nd
327
+ - ne
328
+ - ado
329
+ - mi
330
+ - pa
331
+ - ▁po
332
+ - ▁d
333
+ - ▁ju
334
+ - ▁i
335
+ - ▁otro
336
+ - ▁allá
337
+ - ▁m
338
+ - ica
339
+ - ▁estados
340
+ - tu
341
+ - ▁todos
342
+ - nte
343
+ - iendo
344
+ - va
345
+ - ▁donde
346
+ - ▁tan
347
+ - ▁mismo
348
+ - ▁esta
349
+ - ▁t
350
+ - ▁mo
351
+ - ▁ir
352
+ - ▁unidos
353
+ - ▁trabajo
354
+ - ▁poco
355
+ - tos
356
+ - cho
357
+ - ▁menos
358
+ - ▁ven
359
+ - ▁tenía
360
+ - ▁c
361
+ - ▁personas
362
+ - ▁tener
363
+ - za
364
+ - ▁mira
365
+ - ▁dónde
366
+ - mo
367
+ - ▁pro
368
+ - ▁mejor
369
+ - ▁li
370
+ - ▁nunca
371
+ - ▁decir
372
+ - ▁estás
373
+ - ▁l
374
+ - ▁tra
375
+ - ▁ciudad
376
+ - ▁per
377
+ - rio
378
+ - ▁pre
379
+ - ▁voy
380
+ - ▁exacto
381
+ - ▁tienes
382
+ - ▁había
383
+ - ▁f
384
+ - ▁sabe
385
+ - tra
386
+ - sta
387
+ - ▁muchos
388
+ - idad
389
+ - ▁país
390
+ - ▁p
391
+ - ▁mu
392
+ - ▁hasta
393
+ - ▁parte
394
+ - ▁igual
395
+ - ▁muchas
396
+ - ▁día
397
+ - mp
398
+ - ▁comp
399
+ - ▁parece
400
+ - ido
401
+ - ciones
402
+ - ▁pu
403
+ - ▁esto
404
+ - ▁nueva
405
+ - ▁nosotros
406
+ - jo
407
+ - ▁ex
408
+ - ▁problema
409
+ - ▁ro
410
+ - ▁pe
411
+ - ▁tema
412
+ - cia
413
+ - k
414
+ - ble
415
+ - ▁do
416
+ - ▁tres
417
+ - ▁van
418
+ - ▁sa
419
+ - ▁um
420
+ - ▁hm
421
+ - ▁estar
422
+ - ▁sal
423
+ - ▁s
424
+ - fi
425
+ - je
426
+ - ▁hola
427
+ - ▁york
428
+ - ▁tanto
429
+ - os
430
+ - ge
431
+ - ▁vida
432
+ - ▁familia
433
+ - ▁ra
434
+ - ▁les
435
+ - das
436
+ - ▁teléfono
437
+ - ie
438
+ - ▁mundo
439
+ - ▁hu
440
+ - ▁digamos
441
+ - ▁quiere
442
+ - nos
443
+ - ▁bastante
444
+ - ste
445
+ - j
446
+ - qui
447
+ - les
448
+ - ▁hablar
449
+ - res
450
+ - ▁b
451
+ - ▁u
452
+ - ▁español
453
+ - ▁tal
454
+ - ▁dios
455
+ - che
456
+ - ▁han
457
+ - ▁dinero
458
+ - pi
459
+ - ni
460
+ - ▁difícil
461
+ - st
462
+ - ▁v
463
+ - ▁gra
464
+ - dos
465
+ - ue
466
+ - ▁chi
467
+ - ▁em
468
+ - ▁dicen
469
+ - ▁antes
470
+ - tas
471
+ - era
472
+ - ▁año
473
+ - ▁vive
474
+ - ▁cierto
475
+ - ia
476
+ - rá
477
+ - ria
478
+ - po
479
+ - nt
480
+ - ▁religión
481
+ - que
482
+ - ▁ci
483
+ - ▁cinco
484
+ - ▁ne
485
+ - ió
486
+ - ▁cre
487
+ - ente
488
+ - ñ
489
+ - ir
490
+ - ▁car
491
+ - ▁to
492
+ - bo
493
+ - ▁casi
494
+ - men
495
+ - ▁niños
496
+ - ▁ti
497
+ - bu
498
+ - w
499
+ - il
500
+ - ▁cada
501
+ - ieron
502
+ - cha
503
+ - ▁dije
504
+ - x
505
+ - ▁pienso
506
+ - ▁g
507
+ - ▁llega
508
+ - ento
509
+ - ▁grande
510
+ - ▁todavía
511
+ - ▁realmente
512
+ - ▁alguna
513
+ - ▁todas
514
+ - ▁mar
515
+ - cio
516
+ - ▁acuerdo
517
+ - mb
518
+ - ▁segu
519
+ - rse
520
+ - ▁mal
521
+ - ▁estamos
522
+ - ▁tipo
523
+ - be
524
+ - ▁pone
525
+ - ▁eres
526
+ - ▁sin
527
+ - ▁tenemos
528
+ - encia
529
+ - ▁alguien
530
+ - cto
531
+ - tar
532
+ - ▁vos
533
+ - ▁fi
534
+ - ▁haciendo
535
+ - ▁quién
536
+ - ▁toda
537
+ - ▁viene
538
+ - io
539
+ - ura
540
+ - ▁pen
541
+ - ▁hombre
542
+ - ▁hacen
543
+ - ▁hablando
544
+ - ▁ayuda
545
+ - ▁hi
546
+ - ▁trata
547
+ - ▁hoy
548
+ - ito
549
+ - ten
550
+ - ▁na
551
+ - ▁exactamente
552
+ - ▁escucha
553
+ - ver
554
+ - un
555
+ - ▁conoce
556
+ - gue
557
+ - ño
558
+ - ▁filadelfia
559
+ - ita
560
+ - ▁poder
561
+ - ▁fa
562
+ - án
563
+ - ▁puedo
564
+ - ▁lugar
565
+ - ▁vamos
566
+ - ▁yeah
567
+ - ú
568
+ - ▁desde
569
+ - ▁pi
570
+ - lla
571
+ - ▁hora
572
+ - lu
573
+ - ▁otros
574
+ - ▁méxico
575
+ - ▁internet
576
+ - ▁res
577
+ - ▁solamente
578
+ - ban
579
+ - ▁usa
580
+ - ▁vas
581
+ - ▁fui
582
+ - ▁estado
583
+ - ▁lleva
584
+ - ▁mil
585
+ - ▁solo
586
+ - ▁entre
587
+ - ▁wow
588
+ - ▁éste
589
+ - ch
590
+ - den
591
+ - ▁frío
592
+ - ▁cree
593
+ - ▁caso
594
+ - ▁estudia
595
+ - ▁am
596
+ - ▁busca
597
+ - ▁dis
598
+ - ▁trabaja
599
+ - ▁fe
600
+ - ▁bo
601
+ - ▁hecho
602
+ - ▁pueden
603
+ - ▁poquito
604
+ - ter
605
+ - ▁vivir
606
+ - ▁amigo
607
+ - ▁cuánto
608
+ - ▁ga
609
+ - ▁esas
610
+ - ul
611
+ - ▁tampoco
612
+ - ▁hijos
613
+ - ▁unos
614
+ - el
615
+ - ▁cuatro
616
+ - ▁sus
617
+ - ▁com
618
+ - ▁aunque
619
+ - ▁seguro
620
+ - ▁ce
621
+ - ▁forma
622
+ - ▁debe
623
+ - los
624
+ - ▁ta
625
+ - cion
626
+ - ones
627
+ - ▁puedes
628
+ - ▁mamá
629
+ - ▁cuenta
630
+ - ▁mis
631
+ - ▁diferente
632
+ - ▁quiero
633
+ - ▁ho
634
+ - ▁vivo
635
+ - ▁celular
636
+ - ero
637
+ - ▁universidad
638
+ - ▁be
639
+ - ▁misma
640
+ - ▁deja
641
+ - ▁cuál
642
+ - ▁inglés
643
+ - ▁nombre
644
+ - dia
645
+ - ▁paga
646
+ - ▁ahorita
647
+ - ▁cambia
648
+ - gra
649
+ - ▁dan
650
+ - ▁allí
651
+ - ▁rico
652
+ - ▁puerto
653
+ - ▁buenas
654
+ - ▁manera
655
+ - ▁cri
656
+ - ▁días
657
+ - ▁ésta
658
+ - ▁cualquier
659
+ - ▁países
660
+ - ing
661
+ - tica
662
+ - ina
663
+ - ▁buena
664
+ - ▁nadie
665
+ - ▁decía
666
+ - ▁piensa
667
+ - ▁sobre
668
+ - ▁esposo
669
+ - ▁qui
670
+ - ▁chile
671
+ - tro
672
+ - ▁toma
673
+ - ▁dijo
674
+ - ▁quieren
675
+ - ▁película
676
+ - ▁semana
677
+ - ▁sistema
678
+ - ▁come
679
+ - ▁mujer
680
+ - ▁veo
681
+ - ▁n
682
+ - ida
683
+ - ▁otras
684
+ - ▁medio
685
+ - ón
686
+ - ▁diez
687
+ - ▁cerca
688
+ - ▁iba
689
+ - ico
690
+ - gan
691
+ - ▁necesita
692
+ - zo
693
+ - ▁oye
694
+ - ▁san
695
+ - ▁bu
696
+ - ▁entiendes
697
+ - tó
698
+ - rme
699
+ - ▁sería
700
+ - ▁argentina
701
+ - ▁momento
702
+ - miento
703
+ - ▁know
704
+ - ▁seis
705
+ - ▁fo
706
+ - ▁toca
707
+ - ▁manda
708
+ - ▁w
709
+ - ▁iglesia
710
+ - ▁dólares
711
+ - ▁ja
712
+ - ▁diferentes
713
+ - ista
714
+ - ▁escuela
715
+ - ▁fácil
716
+ - ▁sale
717
+ - ▁interesante
718
+ - ▁padre
719
+ - ▁gana
720
+ - ▁inter
721
+ - ▁papá
722
+ - mina
723
+ - ▁pregunta
724
+ - iente
725
+ - ▁realidad
726
+ - ▁conozco
727
+ - ▁dar
728
+ - sión
729
+ - ▁tenido
730
+ - ▁trabajar
731
+ - ▁pareja
732
+ - ▁gu
733
+ - ▁mío
734
+ - ▁hijo
735
+ - ig
736
+ - ▁vivi
737
+ - ▁computadora
738
+ - ▁visto
739
+ - ▁importante
740
+ - ▁pasado
741
+ - ▁vol
742
+ - ▁tenga
743
+ - ho
744
+ - ▁pagar
745
+ - ▁latino
746
+ - ▁corre
747
+ - ▁haber
748
+ - ▁televisión
749
+ - ▁luego
750
+ - ▁relación
751
+ - ▁señor
752
+ - ▁tanta
753
+ - ▁mujeres
754
+ - iza
755
+ - ▁treinta
756
+ - ▁idea
757
+ - ▁salir
758
+ - ▁americano
759
+ - ▁encanta
760
+ - ▁meses
761
+ - ▁pasó
762
+ - ▁programa
763
+ - ▁algún
764
+ - ▁pri
765
+ - ▁estuve
766
+ - ▁comprar
767
+ - ▁contra
768
+ - ▁bonito
769
+ - ▁colombia
770
+ - ▁compra
771
+ - ▁super
772
+ - ▁hacía
773
+ - ▁imp
774
+ - ▁cultura
775
+ - ▁fíjate
776
+ - ▁sino
777
+ - ▁poner
778
+ - ▁fuera
779
+ - ▁ri
780
+ - ▁veinte
781
+ - ▁buen
782
+ - ▁único
783
+ - ▁entiendo
784
+ - ▁depende
785
+ - ▁fu
786
+ - ▁españa
787
+ - ▁quizás
788
+ - ▁esté
789
+ - ▁gracias
790
+ - ▁hija
791
+ - tico
792
+ - ▁imagino
793
+ - q
794
+ - ▁quiera
795
+ - ▁comuni
796
+ - ▁espera
797
+ - ▁go
798
+ - ▁primera
799
+ - ▁clase
800
+ - ▁general
801
+ - ▁diciendo
802
+ - ▁carro
803
+ - ▁anda
804
+ - ▁somos
805
+ - ▁sabía
806
+ - ▁amiga
807
+ - ▁vaya
808
+ - ▁compañía
809
+ - ▁siete
810
+ - ▁viste
811
+ - ▁canadá
812
+ - ▁cuanto
813
+ - ▁empeza
814
+ - ▁mayor
815
+ - ▁lleg
816
+ - ▁ido
817
+ - ▁malo
818
+ - ▁debería
819
+ - ▁gobierno
820
+ - ▁edad
821
+ - ▁situación
822
+ - ▁trabajando
823
+ - tivo
824
+ - ▁calle
825
+ - ▁veinti
826
+ - ▁mayoría
827
+ - ▁plan
828
+ - ▁viviendo
829
+ - ▁termina
830
+ - ▁llamo
831
+ - ▁viaja
832
+ - ▁social
833
+ - ▁jo
834
+ - ▁ciento
835
+ - ▁joven
836
+ - ▁estudio
837
+ - ▁hablo
838
+ - ▁empieza
839
+ - ▁podía
840
+ - ▁baila
841
+ - ▁punto
842
+ - ▁matrimonio
843
+ - ▁primero
844
+ - ▁entiende
845
+ - ▁perdón
846
+ - ▁niña
847
+ - ▁pobre
848
+ - fect
849
+ - ▁hispano
850
+ - ▁auto
851
+ - ▁importa
852
+ - ▁tarde
853
+ - ▁vivía
854
+ - ▁gustaría
855
+ - ▁diferencia
856
+ - ▁pueda
857
+ - ▁experiencia
858
+ - ▁ángeles
859
+ - ▁pie
860
+ - ▁oportunidad
861
+ - ▁mañana
862
+ - ▁nuevo
863
+ - ▁ningún
864
+ - ▁k
865
+ - ▁razón
866
+ - ▁minutos
867
+ - vis
868
+ - ▁además
869
+ - ▁cha
870
+ - ▁nueve
871
+ - ▁comercial
872
+ - ▁demasiado
873
+ - ▁encontrar
874
+ - port
875
+ - ▁sentido
876
+ - ▁número
877
+ - ▁política
878
+ - ▁niño
879
+ - ▁grupo
880
+ - ▁pensar
881
+ - ▁hermano
882
+ - ísimo
883
+ - ▁raza
884
+ - ▁afuera
885
+ - ▁quince
886
+ - ▁sitio
887
+ - ▁policía
888
+ - ▁gusto
889
+ - ▁fuerte
890
+ - ▁miami
891
+ - ▁palabra
892
+ - ▁montón
893
+ - ▁cincuenta
894
+ - ▁falta
895
+ - ▁recuerdo
896
+ - ▁visita
897
+ - ▁normal
898
+ - ▁especialmente
899
+ - ▁hizo
900
+ - ▁salud
901
+ - ▁partido
902
+ - ▁plata
903
+ - ▁venezuela
904
+ - ▁ru
905
+ - ▁novia
906
+ - ▁cierta
907
+ - ▁educa
908
+ - ▁área
909
+ - ▁maneja
910
+ - ▁quien
911
+ - ▁acostumbra
912
+ - ▁conocí
913
+ - ▁doctor
914
+ - ▁inmigrante
915
+ - ▁básicamente
916
+ - ▁mexicano
917
+ - ▁comida
918
+ - ▁algunos
919
+ - ▁enseña
920
+ - ▁cuarenta
921
+ - ▁supuesto
922
+ - ▁panamá
923
+ - ▁religiones
924
+ - ▁cuestión
925
+ - ▁bi
926
+ - ▁final
927
+ - ▁encuentro
928
+ - ▁llevo
929
+ - ▁tenés
930
+ - ▁hermana
931
+ - ▁papel
932
+ - ▁existe
933
+ - ▁aprende
934
+ - ▁novio
935
+ - ▁encontr
936
+ - ▁cambio
937
+ - ▁negocio
938
+ - ▁atrás
939
+ - ▁podría
940
+ - ▁miedo
941
+ - ismo
942
+ - ▁increíble
943
+ - ▁pongo
944
+ - ▁aparte
945
+ - ▁osea
946
+ - ▁médico
947
+ - ▁acento
948
+ - ▁terrible
949
+ - ▁enferm
950
+ - ▁hablé
951
+ - ▁regresa
952
+ - ▁texas
953
+ - ▁jurado
954
+ - ▁última
955
+ - ▁peor
956
+ - ▁estuvo
957
+ - ▁dentro
958
+ - ▁color
959
+ - ▁viví
960
+ - ▁right
961
+ - ▁chicago
962
+ - ▁servicio
963
+ - ▁interesa
964
+ - ▁muchísimo
965
+ - ▁email
966
+ - ▁escucho
967
+ - ▁pronto
968
+ - ▁homosexual
969
+ - ▁rápido
970
+ - ▁esposa
971
+ - ▁principio
972
+ - ▁llen
973
+ - ▁hospital
974
+ - ▁imagínate
975
+ - ▁peligro
976
+ - ▁cuándo
977
+ - ▁uhum
978
+ - ▁apartamento
979
+ - ▁funciona
980
+ - ▁historia
981
+ - ▁tecnología
982
+ - ▁control
983
+ - ▁ninguna
984
+ - ▁juntos
985
+ - ▁encuentra
986
+ - ▁horrible
987
+ - ▁centro
988
+ - ▁atención
989
+ - ▁hubiera
990
+ - ▁totalmente
991
+ - ▁california
992
+ - ▁católica
993
+ - ▁molesta
994
+ - ▁gustó
995
+ - ▁información
996
+ - ▁méjico
997
+ - ▁suerte
998
+ - ▁argentino
999
+ - ▁divi
1000
+ - ▁florida
1001
+ - ▁guerra
1002
+ - ▁aires
1003
+ - ▁nieve
1004
+ - ▁obviamente
1005
+ - ▁pelea
1006
+ - ▁nuestro
1007
+ - ▁simplemente
1008
+ - ▁pequeño
1009
+ - ▁clima
1010
+ - ▁europa
1011
+ - ▁imagina
1012
+ - ▁arriba
1013
+ - ▁leyes
1014
+ - ▁playa
1015
+ - ▁violencia
1016
+ - ▁conversa
1017
+ - ▁fiesta
1018
+ - ▁tranquilo
1019
+ - ▁acepta
1020
+ - ▁último
1021
+ - ▁única
1022
+ - ▁definitivamente
1023
+ - ▁incluso
1024
+ - ▁idioma
1025
+ - ▁favor
1026
+ - ▁blanco
1027
+ - ▁presidente
1028
+ - ▁invierno
1029
+ - ▁separa
1030
+ - ivo
1031
+ - ▁primer
1032
+ - ▁nuestra
1033
+ - ▁bonita
1034
+ - ▁culpa
1035
+ - ▁vota
1036
+ - ▁entendí
1037
+ - ▁madre
1038
+ - ▁conocido
1039
+ - ▁arregl
1040
+ - ▁acerca
1041
+ - ▁washington
1042
+ - ▁radio
1043
+ - ▁opina
1044
+ - ▁contigo
1045
+ - ▁podemos
1046
+ - ▁pensando
1047
+ - ▁duro
1048
+ - ▁conmigo
1049
+ - ▁verano
1050
+ - '0'
1051
+ - ▁negro
1052
+ - ▁mientras
1053
+ - ▁nací
1054
+ - ▁toronto
1055
+ - ▁recibi
1056
+ - ▁hicieron
1057
+ - ▁boston
1058
+ - ▁campo
1059
+ - ▁repente
1060
+ - ▁cocina
1061
+ - ▁cuesta
1062
+ - ▁conseguir
1063
+ - ▁jóvenes
1064
+ - ▁olvida
1065
+ - ▁ochenta
1066
+ - ▁nivel
1067
+ - ▁sociedad
1068
+ - ▁chiquito
1069
+ - ▁guatemala
1070
+ - ▁político
1071
+ - ▁supongo
1072
+ - ▁empezó
1073
+ - ▁época
1074
+ - ▁siquiera
1075
+ - ▁agarra
1076
+ - ▁católico
1077
+ - ▁pennsylvania
1078
+ - ▁medicina
1079
+ - ▁entender
1080
+ - ▁italia
1081
+ - ▁especial
1082
+ - ▁atlanta
1083
+ - ▁navidad
1084
+ - ▁cantidad
1085
+ - ▁domingo
1086
+ - ▁cristiano
1087
+ - ▁opinión
1088
+ - ▁crédito
1089
+ - ▁noticias
1090
+ - ▁houston
1091
+ - ▁preocupa
1092
+ - ▁mensaje
1093
+ - ▁américa
1094
+ - ▁perfecto
1095
+ - ▁dijiste
1096
+ - '1'
1097
+ - '2'
1098
+ - '5'
1099
+ - _
1100
+ - '-'
1101
+ - '3'
1102
+ - '6'
1103
+ - '4'
1104
+ - '9'
1105
+ - '8'
1106
+ - '7'
1107
+ - A
1108
+ - B
1109
+ - ì
1110
+ - à
1111
+ - ç
1112
+ - è
1113
+ - ü
1114
+ - <sos/eos>
1115
+ init: null
1116
+ input_size: null
1117
+ ctc_conf:
1118
+ dropout_rate: 0.0
1119
+ ctc_type: builtin
1120
+ reduce: true
1121
+ ignore_nan_grad: null
1122
+ zero_infinity: true
1123
+ joint_net_conf: null
1124
+ use_preprocessor: true
1125
+ token_type: bpe
1126
+ bpemodel: data/token_list/bpe_unigram1000/bpe.model
1127
+ non_linguistic_symbols: null
1128
+ cleaner: null
1129
+ g2p: null
1130
+ speech_volume_normalize: null
1131
+ rir_scp: null
1132
+ rir_apply_prob: 1.0
1133
+ noise_scp: null
1134
+ noise_apply_prob: 1.0
1135
+ noise_db_range: '13_15'
1136
+ short_noise_thres: 0.5
1137
+ aux_ctc_tasks: []
1138
+ frontend: default
1139
+ frontend_conf:
1140
+ n_fft: 512
1141
+ win_length: 400
1142
+ hop_length: 160
1143
+ fs: 8k
1144
+ specaug: specaug
1145
+ specaug_conf:
1146
+ apply_time_warp: true
1147
+ time_warp_window: 5
1148
+ time_warp_mode: bicubic
1149
+ apply_freq_mask: true
1150
+ freq_mask_width_range:
1151
+ - 0
1152
+ - 30
1153
+ num_freq_mask: 2
1154
+ apply_time_mask: true
1155
+ time_mask_width_range:
1156
+ - 0
1157
+ - 40
1158
+ num_time_mask: 2
1159
+ normalize: global_mvn
1160
+ normalize_conf:
1161
+ stats_file: exp/asr_stats_raw_bpe1000_sp/train/feats_stats.npz
1162
+ model: espnet
1163
+ model_conf:
1164
+ ctc_weight: 0.3
1165
+ lsm_weight: 0.1
1166
+ length_normalized_loss: false
1167
+ preencoder: null
1168
+ preencoder_conf: {}
1169
+ encoder: conformer
1170
+ encoder_conf:
1171
+ output_size: 256
1172
+ attention_heads: 4
1173
+ linear_units: 2048
1174
+ num_blocks: 12
1175
+ dropout_rate: 0.1
1176
+ positional_dropout_rate: 0.1
1177
+ attention_dropout_rate: 0.1
1178
+ input_layer: conv2d
1179
+ normalize_before: true
1180
+ macaron_style: true
1181
+ pos_enc_layer_type: rel_pos
1182
+ selfattention_layer_type: rel_selfattn
1183
+ activation_type: swish
1184
+ use_cnn_module: true
1185
+ cnn_module_kernel: 31
1186
+ postencoder: null
1187
+ postencoder_conf: {}
1188
+ decoder: transformer
1189
+ decoder_conf:
1190
+ input_layer: embed
1191
+ num_blocks: 6
1192
+ linear_units: 2048
1193
+ dropout_rate: 0.1
1194
+ preprocessor: default
1195
+ preprocessor_conf: {}
1196
+ required:
1197
+ - output_dir
1198
+ - token_list
1199
+ version: '202301'
1200
+ distributed: false
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/acc.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/backward_time.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/cer.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/cer_ctc.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/forward_time.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/gpu_max_cached_mem_GB.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/iter_time.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/loss.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/loss_att.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/loss_ctc.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/optim0_lr0.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/optim_step_time.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/train_time.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/images/wer.png ADDED
exp/asr_train_asr_conformer6_raw_bpe1000_sp/valid.acc.ave_10best.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8b879d52984812b19e6cd0a01889e15543c44c83fe6eb1849967b7da1e3d16de
3
+ size 175382453
meta.yaml ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ espnet: '202301'
2
+ files:
3
+ asr_model_file: exp/asr_train_asr_conformer6_raw_bpe1000_sp/valid.acc.ave_10best.pth
4
+ python: "3.9.15 (main, Nov 24 2022, 14:31:59) \n[GCC 11.2.0]"
5
+ timestamp: 1677639060.618573
6
+ torch: 1.13.1
7
+ yaml_files:
8
+ asr_train_config: exp/asr_train_asr_conformer6_raw_bpe1000_sp/config.yaml