Automatic Speech Recognition
ESPnet
Spanish
audio
pyf98 commited on
Commit
5af86e6
1 Parent(s): 8453d6e

add model files

Browse files
Files changed (21) hide show
  1. README.md +1321 -0
  2. data/token_list/bpe_unigram1000/bpe.model +3 -0
  3. exp/asr_stats_raw_bpe1000_sp/train/feats_stats.npz +3 -0
  4. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/RESULTS.md +41 -0
  5. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/config.yaml +1205 -0
  6. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/acc.png +0 -0
  7. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/backward_time.png +0 -0
  8. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/cer.png +0 -0
  9. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/cer_ctc.png +0 -0
  10. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/forward_time.png +0 -0
  11. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/gpu_max_cached_mem_GB.png +0 -0
  12. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/iter_time.png +0 -0
  13. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/loss.png +0 -0
  14. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/loss_att.png +0 -0
  15. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/loss_ctc.png +0 -0
  16. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/optim0_lr0.png +0 -0
  17. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/optim_step_time.png +0 -0
  18. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/train_time.png +0 -0
  19. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/wer.png +0 -0
  20. exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/valid.acc.ave_10best.pth +3 -0
  21. meta.yaml +8 -0
README.md ADDED
@@ -0,0 +1,1321 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - espnet
4
+ - audio
5
+ - automatic-speech-recognition
6
+ language: noinfo
7
+ datasets:
8
+ - fisher_callhome_spanish
9
+ license: cc-by-4.0
10
+ ---
11
+
12
+ ## ESPnet2 ASR model
13
+
14
+ ### `pyf98/fisher_callhome_spanish_e_branchformer`
15
+
16
+ This model was trained by Yifan Peng using fisher_callhome_spanish recipe in [espnet](https://github.com/espnet/espnet/).
17
+
18
+ References:
19
+ - [E-Branchformer: Branchformer with Enhanced merging for speech recognition (SLT 2022)](https://arxiv.org/abs/2210.00077)
20
+ - [Branchformer: Parallel MLP-Attention Architectures to Capture Local and Global Context for Speech Recognition and Understanding (ICML 2022)](https://proceedings.mlr.press/v162/peng22a.html)
21
+
22
+ ### Demo: How to use in ESPnet2
23
+
24
+ Follow the [ESPnet installation instructions](https://espnet.github.io/espnet/installation.html)
25
+ if you haven't done that already.
26
+
27
+ ```bash
28
+ cd espnet
29
+ git checkout 568bd0808f7509f9735282537db4c68dc3bdf376
30
+ pip install -e .
31
+ cd egs2/fisher_callhome_spanish/asr1
32
+ ./run.sh --skip_data_prep false --skip_train true --download_model pyf98/fisher_callhome_spanish_e_branchformer
33
+ ```
34
+
35
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
36
+ # RESULTS
37
+ ## Environments
38
+ - date: `Tue Feb 28 21:03:54 CST 2023`
39
+ - python version: `3.9.15 (main, Nov 24 2022, 14:31:59) [GCC 11.2.0]`
40
+ - espnet version: `espnet 202301`
41
+ - pytorch version: `pytorch 1.13.1`
42
+ - Git hash: `568bd0808f7509f9735282537db4c68dc3bdf376`
43
+ - Commit date: `Tue Feb 28 06:06:06 2023 -0500`
44
+
45
+ ## exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp
46
+ ### WER
47
+
48
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
49
+ |---|---|---|---|---|---|---|---|---|
50
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|37989|69.4|23.2|7.5|7.2|37.8|79.0|
51
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|19035|68.6|23.1|8.2|6.3|37.6|81.7|
52
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|40961|83.7|11.9|4.5|4.2|20.5|62.4|
53
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|39888|84.4|11.8|3.9|4.6|20.2|62.8|
54
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|40011|86.3|10.2|3.5|5.0|18.7|60.3|
55
+
56
+ ### CER
57
+
58
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
59
+ |---|---|---|---|---|---|---|---|---|
60
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|181052|84.4|6.4|9.3|6.4|22.0|79.0|
61
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|91266|83.7|6.4|9.8|5.7|21.9|81.7|
62
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|194297|93.2|2.6|4.2|3.9|10.7|62.4|
63
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|189965|93.8|2.5|3.6|4.1|10.3|62.8|
64
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|194507|94.8|2.1|3.1|4.6|9.8|60.3|
65
+
66
+ ### TER
67
+
68
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
69
+ |---|---|---|---|---|---|---|---|---|
70
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|57692|66.2|18.6|15.2|5.0|38.8|79.0|
71
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|28951|65.5|18.2|16.3|4.8|39.3|81.7|
72
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|55907|83.4|9.7|6.9|3.9|20.5|62.4|
73
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|53966|84.5|9.6|5.8|4.2|19.6|62.8|
74
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|54212|86.8|8.2|5.0|4.8|18.0|60.3|
75
+
76
+ ## ASR config
77
+
78
+ <details><summary>expand</summary>
79
+
80
+ ```
81
+ config: conf/tuning/train_asr_e_branchformer_e16.yaml
82
+ print_config: false
83
+ log_level: INFO
84
+ dry_run: false
85
+ iterator_type: sequence
86
+ output_dir: exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp
87
+ ngpu: 1
88
+ seed: 0
89
+ num_workers: 4
90
+ num_att_plot: 3
91
+ dist_backend: nccl
92
+ dist_init_method: env://
93
+ dist_world_size: null
94
+ dist_rank: null
95
+ local_rank: 0
96
+ dist_master_addr: null
97
+ dist_master_port: null
98
+ dist_launcher: null
99
+ multiprocessing_distributed: false
100
+ unused_parameters: false
101
+ sharded_ddp: false
102
+ cudnn_enabled: true
103
+ cudnn_benchmark: false
104
+ cudnn_deterministic: true
105
+ collect_stats: false
106
+ write_collected_feats: false
107
+ max_epoch: 50
108
+ patience: null
109
+ val_scheduler_criterion:
110
+ - valid
111
+ - loss
112
+ early_stopping_criterion:
113
+ - valid
114
+ - loss
115
+ - min
116
+ best_model_criterion:
117
+ - - valid
118
+ - acc
119
+ - max
120
+ keep_nbest_models: 10
121
+ nbest_averaging_interval: 0
122
+ grad_clip: 3
123
+ grad_clip_type: 2.0
124
+ grad_noise: false
125
+ accum_grad: 1
126
+ no_forward_run: false
127
+ resume: true
128
+ train_dtype: float32
129
+ use_amp: false
130
+ log_interval: null
131
+ use_matplotlib: true
132
+ use_tensorboard: true
133
+ create_graph_in_tensorboard: false
134
+ use_wandb: false
135
+ wandb_project: null
136
+ wandb_id: null
137
+ wandb_entity: null
138
+ wandb_name: null
139
+ wandb_model_log_interval: -1
140
+ detect_anomaly: false
141
+ pretrain_path: null
142
+ init_param: []
143
+ ignore_init_mismatch: false
144
+ freeze_param: []
145
+ num_iters_per_epoch: null
146
+ batch_size: 20
147
+ valid_batch_size: null
148
+ batch_bins: 10000000
149
+ valid_batch_bins: null
150
+ train_shape_file:
151
+ - exp/asr_stats_raw_bpe1000_sp/train/speech_shape
152
+ - exp/asr_stats_raw_bpe1000_sp/train/text_shape.bpe
153
+ valid_shape_file:
154
+ - exp/asr_stats_raw_bpe1000_sp/valid/speech_shape
155
+ - exp/asr_stats_raw_bpe1000_sp/valid/text_shape.bpe
156
+ batch_type: numel
157
+ valid_batch_type: null
158
+ fold_length:
159
+ - 80000
160
+ - 150
161
+ sort_in_batch: descending
162
+ sort_batch: descending
163
+ multiple_iterator: false
164
+ chunk_length: 500
165
+ chunk_shift_ratio: 0.5
166
+ num_cache_chunks: 1024
167
+ train_data_path_and_name_and_type:
168
+ - - dump/raw/train_sp/wav.scp
169
+ - speech
170
+ - kaldi_ark
171
+ - - dump/raw/train_sp/text
172
+ - text
173
+ - text
174
+ valid_data_path_and_name_and_type:
175
+ - - dump/raw/dev/wav.scp
176
+ - speech
177
+ - kaldi_ark
178
+ - - dump/raw/dev/text
179
+ - text
180
+ - text
181
+ allow_variable_data_keys: false
182
+ max_cache_size: 0.0
183
+ max_cache_fd: 32
184
+ valid_max_cache_size: null
185
+ exclude_weight_decay: false
186
+ exclude_weight_decay_conf: {}
187
+ optim: adam
188
+ optim_conf:
189
+ lr: 4.0
190
+ scheduler: noamlr
191
+ scheduler_conf:
192
+ model_size: 256
193
+ warmup_steps: 25000
194
+ token_list:
195
+ - <blank>
196
+ - <unk>
197
+ - ▁que
198
+ - s
199
+ - ▁no
200
+ - ▁y
201
+ - ▁de
202
+ - ▁a
203
+ - ▁sí
204
+ - ▁la
205
+ - ▁es
206
+ - ▁en
207
+ - r
208
+ - n
209
+ - ▁yo
210
+ - ▁el
211
+ - ▁me
212
+ - ▁pero
213
+ - ▁lo
214
+ - ▁o
215
+ - ▁se
216
+ - ▁un
217
+ - ▁los
218
+ - ▁como
219
+ - ▁ah
220
+ - ▁con
221
+ - ▁por
222
+ - ▁si
223
+ - ▁eh
224
+ - ▁eso
225
+ - ▁una
226
+ - ▁porque
227
+ - a
228
+ - ▁mi
229
+ - ▁tu
230
+ - ▁para
231
+ - ▁más
232
+ - ▁ya
233
+ - ▁te
234
+ - do
235
+ - ▁bueno
236
+ - ▁hay
237
+ - l
238
+ - ▁ajá
239
+ - ▁pues
240
+ - u
241
+ - o
242
+ - ▁qué
243
+ - e
244
+ - c
245
+ - ▁le
246
+ - ▁entonces
247
+ - ▁está
248
+ - ra
249
+ - da
250
+ - ▁así
251
+ - ▁muy
252
+ - ▁las
253
+ - ▁claro
254
+ - ▁también
255
+ - ndo
256
+ - ▁todo
257
+ - ▁bien
258
+ - ▁uno
259
+ - d
260
+ - ▁sé
261
+ - re
262
+ - ▁mhm
263
+ - la
264
+ - to
265
+ - ta
266
+ - i
267
+ - ▁sea
268
+ - b
269
+ - t
270
+ - ▁ca
271
+ - é
272
+ - te
273
+ - es
274
+ - ▁son
275
+ - ▁aquí
276
+ - ▁al
277
+ - mos
278
+ - ▁gente
279
+ - ▁tiene
280
+ - ▁ha
281
+ - ▁mucho
282
+ - ca
283
+ - ▁cuando
284
+ - ▁oh
285
+ - ▁su
286
+ - ▁re
287
+ - g
288
+ - ▁mm
289
+ - ti
290
+ - ba
291
+ - ▁este
292
+ - ▁creo
293
+ - ▁va
294
+ - v
295
+ - lo
296
+ - ó
297
+ - le
298
+ - y
299
+ - ▁cómo
300
+ - í
301
+ - ci
302
+ - p
303
+ - na
304
+ - ▁del
305
+ - ce
306
+ - ▁verdad
307
+ - ro
308
+ - ▁tengo
309
+ - er
310
+ - ▁ellos
311
+ - ▁era
312
+ - ▁ahí
313
+ - ▁él
314
+ - ▁estoy
315
+ - ▁he
316
+ - ▁ahora
317
+ - m
318
+ - ▁
319
+ - f
320
+ - ma
321
+ - ▁llama
322
+ - ▁ma
323
+ - ▁cosas
324
+ - ri
325
+ - ▁años
326
+ - en
327
+ - ▁hace
328
+ - ▁co
329
+ - co
330
+ - ción
331
+ - h
332
+ - á
333
+ - de
334
+ - ▁e
335
+ - ▁nada
336
+ - ▁casa
337
+ - 'no'
338
+ - ▁algo
339
+ - ▁pa
340
+ - ▁estaba
341
+ - nta
342
+ - ga
343
+ - ar
344
+ - ▁in
345
+ - ▁están
346
+ - ▁gusta
347
+ - si
348
+ - ▁di
349
+ - ▁cu
350
+ - ▁dos
351
+ - mente
352
+ - ▁vi
353
+ - ▁veces
354
+ - ▁uh
355
+ - so
356
+ - ▁ella
357
+ - ▁tienen
358
+ - ▁ese
359
+ - di
360
+ - ▁fue
361
+ - ▁hacer
362
+ - se
363
+ - ▁siempre
364
+ - ▁so
365
+ - li
366
+ - ▁dice
367
+ - go
368
+ - ▁vez
369
+ - ▁soy
370
+ - ▁persona
371
+ - ▁ba
372
+ - ▁acá
373
+ - ▁digo
374
+ - ía
375
+ - ▁ejemplo
376
+ - ▁música
377
+ - ▁usted
378
+ - ron
379
+ - ▁ver
380
+ - cu
381
+ - ▁ve
382
+ - ▁ni
383
+ - ▁mucha
384
+ - sa
385
+ - ▁esa
386
+ - pe
387
+ - ría
388
+ - ve
389
+ - ▁ser
390
+ - ▁okay
391
+ - ▁pasa
392
+ - z
393
+ - ▁puede
394
+ - an
395
+ - ▁cosa
396
+ - ▁da
397
+ - ▁otra
398
+ - me
399
+ - ▁ay
400
+ - ▁habla
401
+ - al
402
+ - ▁sabes
403
+ - ▁después
404
+ - ja
405
+ - ▁tiempo
406
+ - nd
407
+ - ne
408
+ - ado
409
+ - mi
410
+ - pa
411
+ - ▁po
412
+ - ▁d
413
+ - ▁ju
414
+ - ▁i
415
+ - ▁otro
416
+ - ▁allá
417
+ - ▁m
418
+ - ica
419
+ - ▁estados
420
+ - tu
421
+ - ▁todos
422
+ - nte
423
+ - iendo
424
+ - va
425
+ - ▁donde
426
+ - ▁tan
427
+ - ▁mismo
428
+ - ▁esta
429
+ - ▁t
430
+ - ▁mo
431
+ - ▁ir
432
+ - ▁unidos
433
+ - ▁trabajo
434
+ - ▁poco
435
+ - tos
436
+ - cho
437
+ - ▁menos
438
+ - ▁ven
439
+ - ▁tenía
440
+ - ▁c
441
+ - ▁personas
442
+ - ▁tener
443
+ - za
444
+ - ▁mira
445
+ - ▁dónde
446
+ - mo
447
+ - ▁pro
448
+ - ▁mejor
449
+ - ▁li
450
+ - ▁nunca
451
+ - ▁decir
452
+ - ▁estás
453
+ - ▁l
454
+ - ▁tra
455
+ - ▁ciudad
456
+ - ▁per
457
+ - rio
458
+ - ▁pre
459
+ - ▁voy
460
+ - ▁exacto
461
+ - ▁tienes
462
+ - ▁había
463
+ - ▁f
464
+ - ▁sabe
465
+ - tra
466
+ - sta
467
+ - ▁muchos
468
+ - idad
469
+ - ▁país
470
+ - ▁p
471
+ - ▁mu
472
+ - ▁hasta
473
+ - ▁parte
474
+ - ▁igual
475
+ - ▁muchas
476
+ - ▁día
477
+ - mp
478
+ - ▁comp
479
+ - ▁parece
480
+ - ido
481
+ - ciones
482
+ - ▁pu
483
+ - ▁esto
484
+ - ▁nueva
485
+ - ▁nosotros
486
+ - jo
487
+ - ▁ex
488
+ - ▁problema
489
+ - ▁ro
490
+ - ▁pe
491
+ - ▁tema
492
+ - cia
493
+ - k
494
+ - ble
495
+ - ▁do
496
+ - ▁tres
497
+ - ▁van
498
+ - ▁sa
499
+ - ▁um
500
+ - ▁hm
501
+ - ▁estar
502
+ - ▁sal
503
+ - ▁s
504
+ - fi
505
+ - je
506
+ - ▁hola
507
+ - ▁york
508
+ - ▁tanto
509
+ - os
510
+ - ge
511
+ - ▁vida
512
+ - ▁familia
513
+ - ▁ra
514
+ - ▁les
515
+ - das
516
+ - ▁teléfono
517
+ - ie
518
+ - ▁mundo
519
+ - ▁hu
520
+ - ▁digamos
521
+ - ▁quiere
522
+ - nos
523
+ - ▁bastante
524
+ - ste
525
+ - j
526
+ - qui
527
+ - les
528
+ - ▁hablar
529
+ - res
530
+ - ▁b
531
+ - ▁u
532
+ - ▁español
533
+ - ▁tal
534
+ - ▁dios
535
+ - che
536
+ - ▁han
537
+ - ▁dinero
538
+ - pi
539
+ - ni
540
+ - ▁difícil
541
+ - st
542
+ - ▁v
543
+ - ▁gra
544
+ - dos
545
+ - ue
546
+ - ▁chi
547
+ - ▁em
548
+ - ▁dicen
549
+ - ▁antes
550
+ - tas
551
+ - era
552
+ - ▁año
553
+ - ▁vive
554
+ - ▁cierto
555
+ - ia
556
+ - rá
557
+ - ria
558
+ - po
559
+ - nt
560
+ - ▁religión
561
+ - que
562
+ - ▁ci
563
+ - ▁cinco
564
+ - ▁ne
565
+ - ió
566
+ - ▁cre
567
+ - ente
568
+ - ñ
569
+ - ir
570
+ - ▁car
571
+ - ▁to
572
+ - bo
573
+ - ▁casi
574
+ - men
575
+ - ▁niños
576
+ - ▁ti
577
+ - bu
578
+ - w
579
+ - il
580
+ - ▁cada
581
+ - ieron
582
+ - cha
583
+ - ▁dije
584
+ - x
585
+ - ▁pienso
586
+ - ▁g
587
+ - ▁llega
588
+ - ento
589
+ - ▁grande
590
+ - ▁todavía
591
+ - ▁realmente
592
+ - ▁alguna
593
+ - ▁todas
594
+ - ▁mar
595
+ - cio
596
+ - ▁acuerdo
597
+ - mb
598
+ - ▁segu
599
+ - rse
600
+ - ▁mal
601
+ - ▁estamos
602
+ - ▁tipo
603
+ - be
604
+ - ▁pone
605
+ - ▁eres
606
+ - ▁sin
607
+ - ▁tenemos
608
+ - encia
609
+ - ▁alguien
610
+ - cto
611
+ - tar
612
+ - ▁vos
613
+ - ▁fi
614
+ - ▁haciendo
615
+ - ▁quién
616
+ - ▁toda
617
+ - ▁viene
618
+ - io
619
+ - ura
620
+ - ▁pen
621
+ - ▁hombre
622
+ - ▁hacen
623
+ - ▁hablando
624
+ - ▁ayuda
625
+ - ▁hi
626
+ - ▁trata
627
+ - ▁hoy
628
+ - ito
629
+ - ten
630
+ - ▁na
631
+ - ▁exactamente
632
+ - ▁escucha
633
+ - ver
634
+ - un
635
+ - ▁conoce
636
+ - gue
637
+ - ño
638
+ - ▁filadelfia
639
+ - ita
640
+ - ▁poder
641
+ - ▁fa
642
+ - án
643
+ - ▁puedo
644
+ - ▁lugar
645
+ - ▁vamos
646
+ - ▁yeah
647
+ - ú
648
+ - ▁desde
649
+ - ▁pi
650
+ - lla
651
+ - ▁hora
652
+ - lu
653
+ - ▁otros
654
+ - ▁méxico
655
+ - ▁internet
656
+ - ▁res
657
+ - ▁solamente
658
+ - ban
659
+ - ▁usa
660
+ - ▁vas
661
+ - ▁fui
662
+ - ▁estado
663
+ - ▁lleva
664
+ - ▁mil
665
+ - ▁solo
666
+ - ▁entre
667
+ - ▁wow
668
+ - ▁éste
669
+ - ch
670
+ - den
671
+ - ▁frío
672
+ - ▁cree
673
+ - ▁caso
674
+ - ▁estudia
675
+ - ▁am
676
+ - ▁busca
677
+ - ▁dis
678
+ - ▁trabaja
679
+ - ▁fe
680
+ - ▁bo
681
+ - ▁hecho
682
+ - ▁pueden
683
+ - ▁poquito
684
+ - ter
685
+ - ▁vivir
686
+ - ▁amigo
687
+ - ▁cuánto
688
+ - ▁ga
689
+ - ▁esas
690
+ - ul
691
+ - ▁tampoco
692
+ - ▁hijos
693
+ - ▁unos
694
+ - el
695
+ - ▁cuatro
696
+ - ▁sus
697
+ - ▁com
698
+ - ▁aunque
699
+ - ▁seguro
700
+ - ▁ce
701
+ - ▁forma
702
+ - ▁debe
703
+ - los
704
+ - ▁ta
705
+ - cion
706
+ - ones
707
+ - ▁puedes
708
+ - ▁mamá
709
+ - ▁cuenta
710
+ - ▁mis
711
+ - ▁diferente
712
+ - ▁quiero
713
+ - ▁ho
714
+ - ▁vivo
715
+ - ▁celular
716
+ - ero
717
+ - ▁universidad
718
+ - ▁be
719
+ - ▁misma
720
+ - ▁deja
721
+ - ▁cuál
722
+ - ▁inglés
723
+ - ▁nombre
724
+ - dia
725
+ - ▁paga
726
+ - ▁ahorita
727
+ - ▁cambia
728
+ - gra
729
+ - ▁dan
730
+ - ▁allí
731
+ - ▁rico
732
+ - ▁puerto
733
+ - ▁buenas
734
+ - ▁manera
735
+ - ▁cri
736
+ - ▁días
737
+ - ▁ésta
738
+ - ▁cualquier
739
+ - ▁países
740
+ - ing
741
+ - tica
742
+ - ina
743
+ - ▁buena
744
+ - ▁nadie
745
+ - ▁decía
746
+ - ▁piensa
747
+ - ▁sobre
748
+ - ▁esposo
749
+ - ▁qui
750
+ - ▁chile
751
+ - tro
752
+ - ▁toma
753
+ - ▁dijo
754
+ - ▁quieren
755
+ - ▁película
756
+ - ▁semana
757
+ - ▁sistema
758
+ - ▁come
759
+ - ▁mujer
760
+ - ▁veo
761
+ - ▁n
762
+ - ida
763
+ - ▁otras
764
+ - ▁medio
765
+ - ón
766
+ - ▁diez
767
+ - ▁cerca
768
+ - ▁iba
769
+ - ico
770
+ - gan
771
+ - ▁necesita
772
+ - zo
773
+ - ▁oye
774
+ - ▁san
775
+ - ▁bu
776
+ - ▁entiendes
777
+ - tó
778
+ - rme
779
+ - ▁sería
780
+ - ▁argentina
781
+ - ▁momento
782
+ - miento
783
+ - ▁know
784
+ - ▁seis
785
+ - ▁fo
786
+ - ▁toca
787
+ - ▁manda
788
+ - ▁w
789
+ - ▁iglesia
790
+ - ▁dólares
791
+ - ▁ja
792
+ - ▁diferentes
793
+ - ista
794
+ - ▁escuela
795
+ - ▁fácil
796
+ - ▁sale
797
+ - ▁interesante
798
+ - ▁padre
799
+ - ▁gana
800
+ - ▁inter
801
+ - ▁papá
802
+ - mina
803
+ - ▁pregunta
804
+ - iente
805
+ - ▁realidad
806
+ - ▁conozco
807
+ - ▁dar
808
+ - sión
809
+ - ▁tenido
810
+ - ▁trabajar
811
+ - ▁pareja
812
+ - ▁gu
813
+ - ▁mío
814
+ - ▁hijo
815
+ - ig
816
+ - ▁vivi
817
+ - ▁computadora
818
+ - ▁visto
819
+ - ▁importante
820
+ - ▁pasado
821
+ - ▁vol
822
+ - ▁tenga
823
+ - ho
824
+ - ▁pagar
825
+ - ▁latino
826
+ - ▁corre
827
+ - ▁haber
828
+ - ▁televisión
829
+ - ▁luego
830
+ - ▁relación
831
+ - ▁señor
832
+ - ▁tanta
833
+ - ▁mujeres
834
+ - iza
835
+ - ▁treinta
836
+ - ▁idea
837
+ - ▁salir
838
+ - ▁americano
839
+ - ▁encanta
840
+ - ▁meses
841
+ - ▁pasó
842
+ - ▁programa
843
+ - ▁algún
844
+ - ▁pri
845
+ - ▁estuve
846
+ - ▁comprar
847
+ - ▁contra
848
+ - ▁bonito
849
+ - ▁colombia
850
+ - ▁compra
851
+ - ▁super
852
+ - ▁hacía
853
+ - ▁imp
854
+ - ▁cultura
855
+ - ▁fíjate
856
+ - ▁sino
857
+ - ▁poner
858
+ - ▁fuera
859
+ - ▁ri
860
+ - ▁veinte
861
+ - ▁buen
862
+ - ▁único
863
+ - ▁entiendo
864
+ - ▁depende
865
+ - ▁fu
866
+ - ▁españa
867
+ - ▁quizás
868
+ - ▁esté
869
+ - ▁gracias
870
+ - ▁hija
871
+ - tico
872
+ - ▁imagino
873
+ - q
874
+ - ▁quiera
875
+ - ▁comuni
876
+ - ▁espera
877
+ - ▁go
878
+ - ▁primera
879
+ - ▁clase
880
+ - ▁general
881
+ - ▁diciendo
882
+ - ▁carro
883
+ - ▁anda
884
+ - ▁somos
885
+ - ▁sabía
886
+ - ▁amiga
887
+ - ▁vaya
888
+ - ▁compañía
889
+ - ▁siete
890
+ - ▁viste
891
+ - ▁canadá
892
+ - ▁cuanto
893
+ - ▁empeza
894
+ - ▁mayor
895
+ - ▁lleg
896
+ - ▁ido
897
+ - ▁malo
898
+ - ▁debería
899
+ - ▁gobierno
900
+ - ▁edad
901
+ - ▁situación
902
+ - ▁trabajando
903
+ - tivo
904
+ - ▁calle
905
+ - ▁veinti
906
+ - ▁mayoría
907
+ - ▁plan
908
+ - ▁viviendo
909
+ - ▁termina
910
+ - ▁llamo
911
+ - ▁viaja
912
+ - ▁social
913
+ - ▁jo
914
+ - ▁ciento
915
+ - ▁joven
916
+ - ▁estudio
917
+ - ▁hablo
918
+ - ▁empieza
919
+ - ▁podía
920
+ - ▁baila
921
+ - ▁punto
922
+ - ▁matrimonio
923
+ - ▁primero
924
+ - ▁entiende
925
+ - ▁perdón
926
+ - ▁niña
927
+ - ▁pobre
928
+ - fect
929
+ - ▁hispano
930
+ - ▁auto
931
+ - ▁importa
932
+ - ▁tarde
933
+ - ▁vivía
934
+ - ▁gustaría
935
+ - ▁diferencia
936
+ - ▁pueda
937
+ - ▁experiencia
938
+ - ▁ángeles
939
+ - ▁pie
940
+ - ▁oportunidad
941
+ - ▁mañana
942
+ - ▁nuevo
943
+ - ▁ningún
944
+ - ▁k
945
+ - ▁razón
946
+ - ▁minutos
947
+ - vis
948
+ - ▁además
949
+ - ▁cha
950
+ - ▁nueve
951
+ - ▁comercial
952
+ - ▁demasiado
953
+ - ▁encontrar
954
+ - port
955
+ - ▁sentido
956
+ - ▁número
957
+ - ▁política
958
+ - ▁niño
959
+ - ▁grupo
960
+ - ▁pensar
961
+ - ▁hermano
962
+ - ísimo
963
+ - ▁raza
964
+ - ▁afuera
965
+ - ▁quince
966
+ - ▁sitio
967
+ - ▁policía
968
+ - ▁gusto
969
+ - ▁fuerte
970
+ - ▁miami
971
+ - ▁palabra
972
+ - ▁montón
973
+ - ▁cincuenta
974
+ - ▁falta
975
+ - ▁recuerdo
976
+ - ▁visita
977
+ - ▁normal
978
+ - ▁especialmente
979
+ - ▁hizo
980
+ - ▁salud
981
+ - ▁partido
982
+ - ▁plata
983
+ - ▁venezuela
984
+ - ▁ru
985
+ - ▁novia
986
+ - ▁cierta
987
+ - ▁educa
988
+ - ▁área
989
+ - ▁maneja
990
+ - ▁quien
991
+ - ▁acostumbra
992
+ - ▁conocí
993
+ - ▁doctor
994
+ - ▁inmigrante
995
+ - ▁básicamente
996
+ - ▁mexicano
997
+ - ▁comida
998
+ - ▁algunos
999
+ - ▁enseña
1000
+ - ▁cuarenta
1001
+ - ▁supuesto
1002
+ - ▁panamá
1003
+ - ▁religiones
1004
+ - ▁cuestión
1005
+ - ▁bi
1006
+ - ▁final
1007
+ - ▁encuentro
1008
+ - ▁llevo
1009
+ - ▁tenés
1010
+ - ▁hermana
1011
+ - ▁papel
1012
+ - ▁existe
1013
+ - ▁aprende
1014
+ - ▁novio
1015
+ - ▁encontr
1016
+ - ▁cambio
1017
+ - ▁negocio
1018
+ - ▁atrás
1019
+ - ▁podría
1020
+ - ▁miedo
1021
+ - ismo
1022
+ - ▁increíble
1023
+ - ▁pongo
1024
+ - ▁aparte
1025
+ - ▁osea
1026
+ - ▁médico
1027
+ - ▁acento
1028
+ - ▁terrible
1029
+ - ▁enferm
1030
+ - ▁hablé
1031
+ - ▁regresa
1032
+ - ▁texas
1033
+ - ▁jurado
1034
+ - ▁última
1035
+ - ▁peor
1036
+ - ▁estuvo
1037
+ - ▁dentro
1038
+ - ▁color
1039
+ - ▁viví
1040
+ - ▁right
1041
+ - ▁chicago
1042
+ - ▁servicio
1043
+ - ▁interesa
1044
+ - ▁muchísimo
1045
+ - ▁email
1046
+ - ▁escucho
1047
+ - ▁pronto
1048
+ - ▁homosexual
1049
+ - ▁rápido
1050
+ - ▁esposa
1051
+ - ▁principio
1052
+ - ▁llen
1053
+ - ▁hospital
1054
+ - ▁imagínate
1055
+ - ▁peligro
1056
+ - ▁cuándo
1057
+ - ▁uhum
1058
+ - ▁apartamento
1059
+ - ▁funciona
1060
+ - ▁historia
1061
+ - ▁tecnología
1062
+ - ▁control
1063
+ - ▁ninguna
1064
+ - ▁juntos
1065
+ - ▁encuentra
1066
+ - ▁horrible
1067
+ - ▁centro
1068
+ - ▁atención
1069
+ - ▁hubiera
1070
+ - ▁totalmente
1071
+ - ▁california
1072
+ - ▁católica
1073
+ - ▁molesta
1074
+ - ▁gustó
1075
+ - ▁información
1076
+ - ▁méjico
1077
+ - ▁suerte
1078
+ - ▁argentino
1079
+ - ▁divi
1080
+ - ▁florida
1081
+ - ▁guerra
1082
+ - ▁aires
1083
+ - ▁nieve
1084
+ - ▁obviamente
1085
+ - ▁pelea
1086
+ - ▁nuestro
1087
+ - ▁simplemente
1088
+ - ▁pequeño
1089
+ - ▁clima
1090
+ - ▁europa
1091
+ - ▁imagina
1092
+ - ▁arriba
1093
+ - ▁leyes
1094
+ - ▁playa
1095
+ - ▁violencia
1096
+ - ▁conversa
1097
+ - ▁fiesta
1098
+ - ▁tranquilo
1099
+ - ▁acepta
1100
+ - ▁último
1101
+ - ▁única
1102
+ - ▁definitivamente
1103
+ - ▁incluso
1104
+ - ▁idioma
1105
+ - ▁favor
1106
+ - ▁blanco
1107
+ - ▁presidente
1108
+ - ▁invierno
1109
+ - ▁separa
1110
+ - ivo
1111
+ - ▁primer
1112
+ - ▁nuestra
1113
+ - ▁bonita
1114
+ - ▁culpa
1115
+ - ▁vota
1116
+ - ▁entendí
1117
+ - ▁madre
1118
+ - ▁conocido
1119
+ - ▁arregl
1120
+ - ▁acerca
1121
+ - ▁washington
1122
+ - ▁radio
1123
+ - ▁opina
1124
+ - ▁contigo
1125
+ - ▁podemos
1126
+ - ▁pensando
1127
+ - ▁duro
1128
+ - ▁conmigo
1129
+ - ▁verano
1130
+ - '0'
1131
+ - ▁negro
1132
+ - ▁mientras
1133
+ - ▁nací
1134
+ - ▁toronto
1135
+ - ▁recibi
1136
+ - ▁hicieron
1137
+ - ▁boston
1138
+ - ▁campo
1139
+ - ▁repente
1140
+ - ▁cocina
1141
+ - ▁cuesta
1142
+ - ▁conseguir
1143
+ - ▁jóvenes
1144
+ - ▁olvida
1145
+ - ▁ochenta
1146
+ - ▁nivel
1147
+ - ▁sociedad
1148
+ - ▁chiquito
1149
+ - ▁guatemala
1150
+ - ▁político
1151
+ - ▁supongo
1152
+ - ▁empezó
1153
+ - ▁época
1154
+ - ▁siquiera
1155
+ - ▁agarra
1156
+ - ▁católico
1157
+ - ▁pennsylvania
1158
+ - ▁medicina
1159
+ - ▁entender
1160
+ - ▁italia
1161
+ - ▁especial
1162
+ - ▁atlanta
1163
+ - ▁navidad
1164
+ - ▁cantidad
1165
+ - ▁domingo
1166
+ - ▁cristiano
1167
+ - ▁opinión
1168
+ - ▁crédito
1169
+ - ▁noticias
1170
+ - ▁houston
1171
+ - ▁preocupa
1172
+ - ▁mensaje
1173
+ - ▁américa
1174
+ - ▁perfecto
1175
+ - ▁dijiste
1176
+ - '1'
1177
+ - '2'
1178
+ - '5'
1179
+ - _
1180
+ - '-'
1181
+ - '3'
1182
+ - '6'
1183
+ - '4'
1184
+ - '9'
1185
+ - '8'
1186
+ - '7'
1187
+ - A
1188
+ - B
1189
+ - ì
1190
+ - à
1191
+ - ç
1192
+ - è
1193
+ - ü
1194
+ - <sos/eos>
1195
+ init: null
1196
+ input_size: null
1197
+ ctc_conf:
1198
+ dropout_rate: 0.0
1199
+ ctc_type: builtin
1200
+ reduce: true
1201
+ ignore_nan_grad: null
1202
+ zero_infinity: true
1203
+ joint_net_conf: null
1204
+ use_preprocessor: true
1205
+ token_type: bpe
1206
+ bpemodel: data/token_list/bpe_unigram1000/bpe.model
1207
+ non_linguistic_symbols: null
1208
+ cleaner: null
1209
+ g2p: null
1210
+ speech_volume_normalize: null
1211
+ rir_scp: null
1212
+ rir_apply_prob: 1.0
1213
+ noise_scp: null
1214
+ noise_apply_prob: 1.0
1215
+ noise_db_range: '13_15'
1216
+ short_noise_thres: 0.5
1217
+ aux_ctc_tasks: []
1218
+ frontend: default
1219
+ frontend_conf:
1220
+ n_fft: 512
1221
+ win_length: 400
1222
+ hop_length: 160
1223
+ fs: 8k
1224
+ specaug: specaug
1225
+ specaug_conf:
1226
+ apply_time_warp: true
1227
+ time_warp_window: 5
1228
+ time_warp_mode: bicubic
1229
+ apply_freq_mask: true
1230
+ freq_mask_width_range:
1231
+ - 0
1232
+ - 30
1233
+ num_freq_mask: 2
1234
+ apply_time_mask: true
1235
+ time_mask_width_range:
1236
+ - 0
1237
+ - 40
1238
+ num_time_mask: 2
1239
+ normalize: global_mvn
1240
+ normalize_conf:
1241
+ stats_file: exp/asr_stats_raw_bpe1000_sp/train/feats_stats.npz
1242
+ model: espnet
1243
+ model_conf:
1244
+ ctc_weight: 0.3
1245
+ lsm_weight: 0.1
1246
+ length_normalized_loss: false
1247
+ preencoder: null
1248
+ preencoder_conf: {}
1249
+ encoder: e_branchformer
1250
+ encoder_conf:
1251
+ output_size: 256
1252
+ attention_heads: 4
1253
+ attention_layer_type: rel_selfattn
1254
+ pos_enc_layer_type: rel_pos
1255
+ rel_pos_type: latest
1256
+ cgmlp_linear_units: 1024
1257
+ cgmlp_conv_kernel: 31
1258
+ use_linear_after_conv: false
1259
+ gate_activation: identity
1260
+ num_blocks: 16
1261
+ dropout_rate: 0.1
1262
+ positional_dropout_rate: 0.1
1263
+ attention_dropout_rate: 0.1
1264
+ input_layer: conv2d
1265
+ layer_drop_rate: 0.0
1266
+ linear_units: 1024
1267
+ positionwise_layer_type: linear
1268
+ use_ffn: true
1269
+ macaron_ffn: true
1270
+ merge_conv_kernel: 31
1271
+ postencoder: null
1272
+ postencoder_conf: {}
1273
+ decoder: transformer
1274
+ decoder_conf:
1275
+ input_layer: embed
1276
+ num_blocks: 6
1277
+ linear_units: 2048
1278
+ dropout_rate: 0.1
1279
+ preprocessor: default
1280
+ preprocessor_conf: {}
1281
+ required:
1282
+ - output_dir
1283
+ - token_list
1284
+ version: '202301'
1285
+ distributed: false
1286
+ ```
1287
+
1288
+ </details>
1289
+
1290
+
1291
+
1292
+ ### Citing ESPnet
1293
+
1294
+ ```BibTex
1295
+ @inproceedings{watanabe2018espnet,
1296
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1297
+ title={{ESPnet}: End-to-End Speech Processing Toolkit},
1298
+ year={2018},
1299
+ booktitle={Proceedings of Interspeech},
1300
+ pages={2207--2211},
1301
+ doi={10.21437/Interspeech.2018-1456},
1302
+ url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
1303
+ }
1304
+
1305
+
1306
+
1307
+
1308
+ ```
1309
+
1310
+ or arXiv:
1311
+
1312
+ ```bibtex
1313
+ @misc{watanabe2018espnet,
1314
+ title={ESPnet: End-to-End Speech Processing Toolkit},
1315
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1316
+ year={2018},
1317
+ eprint={1804.00015},
1318
+ archivePrefix={arXiv},
1319
+ primaryClass={cs.CL}
1320
+ }
1321
+ ```
data/token_list/bpe_unigram1000/bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:67120d752c50bae982c37fcab3df20a63fa5d37670e8e9c3de2ec841d539fd52
3
+ size 253712
exp/asr_stats_raw_bpe1000_sp/train/feats_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6a45b2ea668ff9b083784887057a34ed304670cf5a7e0cec7f8bcedb9292b9c4
3
+ size 1402
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/RESULTS.md ADDED
@@ -0,0 +1,41 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
2
+ # RESULTS
3
+ ## Environments
4
+ - date: `Tue Feb 28 21:03:54 CST 2023`
5
+ - python version: `3.9.15 (main, Nov 24 2022, 14:31:59) [GCC 11.2.0]`
6
+ - espnet version: `espnet 202301`
7
+ - pytorch version: `pytorch 1.13.1`
8
+ - Git hash: `568bd0808f7509f9735282537db4c68dc3bdf376`
9
+ - Commit date: `Tue Feb 28 06:06:06 2023 -0500`
10
+
11
+ ## exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp
12
+ ### WER
13
+
14
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
15
+ |---|---|---|---|---|---|---|---|---|
16
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|37989|69.4|23.2|7.5|7.2|37.8|79.0|
17
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|19035|68.6|23.1|8.2|6.3|37.6|81.7|
18
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|40961|83.7|11.9|4.5|4.2|20.5|62.4|
19
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|39888|84.4|11.8|3.9|4.6|20.2|62.8|
20
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|40011|86.3|10.2|3.5|5.0|18.7|60.3|
21
+
22
+ ### CER
23
+
24
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
25
+ |---|---|---|---|---|---|---|---|---|
26
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|181052|84.4|6.4|9.3|6.4|22.0|79.0|
27
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|91266|83.7|6.4|9.8|5.7|21.9|81.7|
28
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|194297|93.2|2.6|4.2|3.9|10.7|62.4|
29
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|189965|93.8|2.5|3.6|4.1|10.3|62.8|
30
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|194507|94.8|2.1|3.1|4.6|9.8|60.3|
31
+
32
+ ### TER
33
+
34
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
35
+ |---|---|---|---|---|---|---|---|---|
36
+ |decode_conformer_asr_model_valid.acc.ave/callhome_devtest|3964|57692|66.2|18.6|15.2|5.0|38.8|79.0|
37
+ |decode_conformer_asr_model_valid.acc.ave/callhome_evltest|1829|28951|65.5|18.2|16.3|4.8|39.3|81.7|
38
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev|3979|55907|83.4|9.7|6.9|3.9|20.5|62.4|
39
+ |decode_conformer_asr_model_valid.acc.ave/fisher_dev2|3961|53966|84.5|9.6|5.8|4.2|19.6|62.8|
40
+ |decode_conformer_asr_model_valid.acc.ave/fisher_test|3641|54212|86.8|8.2|5.0|4.8|18.0|60.3|
41
+
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/config.yaml ADDED
@@ -0,0 +1,1205 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ config: conf/tuning/train_asr_e_branchformer_e16.yaml
2
+ print_config: false
3
+ log_level: INFO
4
+ dry_run: false
5
+ iterator_type: sequence
6
+ output_dir: exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp
7
+ ngpu: 1
8
+ seed: 0
9
+ num_workers: 4
10
+ num_att_plot: 3
11
+ dist_backend: nccl
12
+ dist_init_method: env://
13
+ dist_world_size: null
14
+ dist_rank: null
15
+ local_rank: 0
16
+ dist_master_addr: null
17
+ dist_master_port: null
18
+ dist_launcher: null
19
+ multiprocessing_distributed: false
20
+ unused_parameters: false
21
+ sharded_ddp: false
22
+ cudnn_enabled: true
23
+ cudnn_benchmark: false
24
+ cudnn_deterministic: true
25
+ collect_stats: false
26
+ write_collected_feats: false
27
+ max_epoch: 50
28
+ patience: null
29
+ val_scheduler_criterion:
30
+ - valid
31
+ - loss
32
+ early_stopping_criterion:
33
+ - valid
34
+ - loss
35
+ - min
36
+ best_model_criterion:
37
+ - - valid
38
+ - acc
39
+ - max
40
+ keep_nbest_models: 10
41
+ nbest_averaging_interval: 0
42
+ grad_clip: 3
43
+ grad_clip_type: 2.0
44
+ grad_noise: false
45
+ accum_grad: 1
46
+ no_forward_run: false
47
+ resume: true
48
+ train_dtype: float32
49
+ use_amp: false
50
+ log_interval: null
51
+ use_matplotlib: true
52
+ use_tensorboard: true
53
+ create_graph_in_tensorboard: false
54
+ use_wandb: false
55
+ wandb_project: null
56
+ wandb_id: null
57
+ wandb_entity: null
58
+ wandb_name: null
59
+ wandb_model_log_interval: -1
60
+ detect_anomaly: false
61
+ pretrain_path: null
62
+ init_param: []
63
+ ignore_init_mismatch: false
64
+ freeze_param: []
65
+ num_iters_per_epoch: null
66
+ batch_size: 20
67
+ valid_batch_size: null
68
+ batch_bins: 10000000
69
+ valid_batch_bins: null
70
+ train_shape_file:
71
+ - exp/asr_stats_raw_bpe1000_sp/train/speech_shape
72
+ - exp/asr_stats_raw_bpe1000_sp/train/text_shape.bpe
73
+ valid_shape_file:
74
+ - exp/asr_stats_raw_bpe1000_sp/valid/speech_shape
75
+ - exp/asr_stats_raw_bpe1000_sp/valid/text_shape.bpe
76
+ batch_type: numel
77
+ valid_batch_type: null
78
+ fold_length:
79
+ - 80000
80
+ - 150
81
+ sort_in_batch: descending
82
+ sort_batch: descending
83
+ multiple_iterator: false
84
+ chunk_length: 500
85
+ chunk_shift_ratio: 0.5
86
+ num_cache_chunks: 1024
87
+ train_data_path_and_name_and_type:
88
+ - - dump/raw/train_sp/wav.scp
89
+ - speech
90
+ - kaldi_ark
91
+ - - dump/raw/train_sp/text
92
+ - text
93
+ - text
94
+ valid_data_path_and_name_and_type:
95
+ - - dump/raw/dev/wav.scp
96
+ - speech
97
+ - kaldi_ark
98
+ - - dump/raw/dev/text
99
+ - text
100
+ - text
101
+ allow_variable_data_keys: false
102
+ max_cache_size: 0.0
103
+ max_cache_fd: 32
104
+ valid_max_cache_size: null
105
+ exclude_weight_decay: false
106
+ exclude_weight_decay_conf: {}
107
+ optim: adam
108
+ optim_conf:
109
+ lr: 4.0
110
+ scheduler: noamlr
111
+ scheduler_conf:
112
+ model_size: 256
113
+ warmup_steps: 25000
114
+ token_list:
115
+ - <blank>
116
+ - <unk>
117
+ - ▁que
118
+ - s
119
+ - ▁no
120
+ - ▁y
121
+ - ▁de
122
+ - ▁a
123
+ - ▁sí
124
+ - ▁la
125
+ - ▁es
126
+ - ▁en
127
+ - r
128
+ - n
129
+ - ▁yo
130
+ - ▁el
131
+ - ▁me
132
+ - ▁pero
133
+ - ▁lo
134
+ - ▁o
135
+ - ▁se
136
+ - ▁un
137
+ - ▁los
138
+ - ▁como
139
+ - ▁ah
140
+ - ▁con
141
+ - ▁por
142
+ - ▁si
143
+ - ▁eh
144
+ - ▁eso
145
+ - ▁una
146
+ - ▁porque
147
+ - a
148
+ - ▁mi
149
+ - ▁tu
150
+ - ▁para
151
+ - ▁más
152
+ - ▁ya
153
+ - ▁te
154
+ - do
155
+ - ▁bueno
156
+ - ▁hay
157
+ - l
158
+ - ▁ajá
159
+ - ▁pues
160
+ - u
161
+ - o
162
+ - ▁qué
163
+ - e
164
+ - c
165
+ - ▁le
166
+ - ▁entonces
167
+ - ▁está
168
+ - ra
169
+ - da
170
+ - ▁así
171
+ - ▁muy
172
+ - ▁las
173
+ - ▁claro
174
+ - ▁también
175
+ - ndo
176
+ - ▁todo
177
+ - ▁bien
178
+ - ▁uno
179
+ - d
180
+ - ▁sé
181
+ - re
182
+ - ▁mhm
183
+ - la
184
+ - to
185
+ - ta
186
+ - i
187
+ - ▁sea
188
+ - b
189
+ - t
190
+ - ▁ca
191
+ - é
192
+ - te
193
+ - es
194
+ - ▁son
195
+ - ▁aquí
196
+ - ▁al
197
+ - mos
198
+ - ▁gente
199
+ - ▁tiene
200
+ - ▁ha
201
+ - ▁mucho
202
+ - ca
203
+ - ▁cuando
204
+ - ▁oh
205
+ - ▁su
206
+ - ▁re
207
+ - g
208
+ - ▁mm
209
+ - ti
210
+ - ba
211
+ - ▁este
212
+ - ▁creo
213
+ - ▁va
214
+ - v
215
+ - lo
216
+ - ó
217
+ - le
218
+ - y
219
+ - ▁cómo
220
+ - í
221
+ - ci
222
+ - p
223
+ - na
224
+ - ▁del
225
+ - ce
226
+ - ▁verdad
227
+ - ro
228
+ - ▁tengo
229
+ - er
230
+ - ▁ellos
231
+ - ▁era
232
+ - ▁ahí
233
+ - ▁él
234
+ - ▁estoy
235
+ - ▁he
236
+ - ▁ahora
237
+ - m
238
+ - ▁
239
+ - f
240
+ - ma
241
+ - ▁llama
242
+ - ▁ma
243
+ - ▁cosas
244
+ - ri
245
+ - ▁años
246
+ - en
247
+ - ▁hace
248
+ - ▁co
249
+ - co
250
+ - ción
251
+ - h
252
+ - á
253
+ - de
254
+ - ▁e
255
+ - ▁nada
256
+ - ▁casa
257
+ - 'no'
258
+ - ▁algo
259
+ - ▁pa
260
+ - ▁estaba
261
+ - nta
262
+ - ga
263
+ - ar
264
+ - ▁in
265
+ - ▁están
266
+ - ▁gusta
267
+ - si
268
+ - ▁di
269
+ - ▁cu
270
+ - ▁dos
271
+ - mente
272
+ - ▁vi
273
+ - ▁veces
274
+ - ▁uh
275
+ - so
276
+ - ▁ella
277
+ - ▁tienen
278
+ - ▁ese
279
+ - di
280
+ - ▁fue
281
+ - ▁hacer
282
+ - se
283
+ - ▁siempre
284
+ - ▁so
285
+ - li
286
+ - ▁dice
287
+ - go
288
+ - ▁vez
289
+ - ▁soy
290
+ - ▁persona
291
+ - ▁ba
292
+ - ▁acá
293
+ - ▁digo
294
+ - ía
295
+ - ▁ejemplo
296
+ - ▁música
297
+ - ▁usted
298
+ - ron
299
+ - ▁ver
300
+ - cu
301
+ - ▁ve
302
+ - ▁ni
303
+ - ▁mucha
304
+ - sa
305
+ - ▁esa
306
+ - pe
307
+ - ría
308
+ - ve
309
+ - ▁ser
310
+ - ▁okay
311
+ - ▁pasa
312
+ - z
313
+ - ▁puede
314
+ - an
315
+ - ▁cosa
316
+ - ▁da
317
+ - ▁otra
318
+ - me
319
+ - ▁ay
320
+ - ▁habla
321
+ - al
322
+ - ▁sabes
323
+ - ▁después
324
+ - ja
325
+ - ▁tiempo
326
+ - nd
327
+ - ne
328
+ - ado
329
+ - mi
330
+ - pa
331
+ - ▁po
332
+ - ▁d
333
+ - ▁ju
334
+ - ▁i
335
+ - ▁otro
336
+ - ▁allá
337
+ - ▁m
338
+ - ica
339
+ - ▁estados
340
+ - tu
341
+ - ▁todos
342
+ - nte
343
+ - iendo
344
+ - va
345
+ - ▁donde
346
+ - ▁tan
347
+ - ▁mismo
348
+ - ▁esta
349
+ - ▁t
350
+ - ▁mo
351
+ - ▁ir
352
+ - ▁unidos
353
+ - ▁trabajo
354
+ - ▁poco
355
+ - tos
356
+ - cho
357
+ - ▁menos
358
+ - ▁ven
359
+ - ▁tenía
360
+ - ▁c
361
+ - ▁personas
362
+ - ▁tener
363
+ - za
364
+ - ▁mira
365
+ - ▁dónde
366
+ - mo
367
+ - ▁pro
368
+ - ▁mejor
369
+ - ▁li
370
+ - ▁nunca
371
+ - ▁decir
372
+ - ▁estás
373
+ - ▁l
374
+ - ▁tra
375
+ - ▁ciudad
376
+ - ▁per
377
+ - rio
378
+ - ▁pre
379
+ - ▁voy
380
+ - ▁exacto
381
+ - ▁tienes
382
+ - ▁había
383
+ - ▁f
384
+ - ▁sabe
385
+ - tra
386
+ - sta
387
+ - ▁muchos
388
+ - idad
389
+ - ▁país
390
+ - ▁p
391
+ - ▁mu
392
+ - ▁hasta
393
+ - ▁parte
394
+ - ▁igual
395
+ - ▁muchas
396
+ - ▁día
397
+ - mp
398
+ - ▁comp
399
+ - ▁parece
400
+ - ido
401
+ - ciones
402
+ - ▁pu
403
+ - ▁esto
404
+ - ▁nueva
405
+ - ▁nosotros
406
+ - jo
407
+ - ▁ex
408
+ - ▁problema
409
+ - ▁ro
410
+ - ▁pe
411
+ - ▁tema
412
+ - cia
413
+ - k
414
+ - ble
415
+ - ▁do
416
+ - ▁tres
417
+ - ▁van
418
+ - ▁sa
419
+ - ▁um
420
+ - ▁hm
421
+ - ▁estar
422
+ - ▁sal
423
+ - ▁s
424
+ - fi
425
+ - je
426
+ - ▁hola
427
+ - ▁york
428
+ - ▁tanto
429
+ - os
430
+ - ge
431
+ - ▁vida
432
+ - ▁familia
433
+ - ▁ra
434
+ - ▁les
435
+ - das
436
+ - ▁teléfono
437
+ - ie
438
+ - ▁mundo
439
+ - ▁hu
440
+ - ▁digamos
441
+ - ▁quiere
442
+ - nos
443
+ - ▁bastante
444
+ - ste
445
+ - j
446
+ - qui
447
+ - les
448
+ - ▁hablar
449
+ - res
450
+ - ▁b
451
+ - ▁u
452
+ - ▁español
453
+ - ▁tal
454
+ - ▁dios
455
+ - che
456
+ - ▁han
457
+ - ▁dinero
458
+ - pi
459
+ - ni
460
+ - ▁difícil
461
+ - st
462
+ - ▁v
463
+ - ▁gra
464
+ - dos
465
+ - ue
466
+ - ▁chi
467
+ - ▁em
468
+ - ▁dicen
469
+ - ▁antes
470
+ - tas
471
+ - era
472
+ - ▁año
473
+ - ▁vive
474
+ - ▁cierto
475
+ - ia
476
+ - rá
477
+ - ria
478
+ - po
479
+ - nt
480
+ - ▁religión
481
+ - que
482
+ - ▁ci
483
+ - ▁cinco
484
+ - ▁ne
485
+ - ió
486
+ - ▁cre
487
+ - ente
488
+ - ñ
489
+ - ir
490
+ - ▁car
491
+ - ▁to
492
+ - bo
493
+ - ▁casi
494
+ - men
495
+ - ▁niños
496
+ - ▁ti
497
+ - bu
498
+ - w
499
+ - il
500
+ - ▁cada
501
+ - ieron
502
+ - cha
503
+ - ▁dije
504
+ - x
505
+ - ▁pienso
506
+ - ▁g
507
+ - ▁llega
508
+ - ento
509
+ - ▁grande
510
+ - ▁todavía
511
+ - ▁realmente
512
+ - ▁alguna
513
+ - ▁todas
514
+ - ▁mar
515
+ - cio
516
+ - ▁acuerdo
517
+ - mb
518
+ - ▁segu
519
+ - rse
520
+ - ▁mal
521
+ - ▁estamos
522
+ - ▁tipo
523
+ - be
524
+ - ▁pone
525
+ - ▁eres
526
+ - ▁sin
527
+ - ▁tenemos
528
+ - encia
529
+ - ▁alguien
530
+ - cto
531
+ - tar
532
+ - ▁vos
533
+ - ▁fi
534
+ - ▁haciendo
535
+ - ▁quién
536
+ - ▁toda
537
+ - ▁viene
538
+ - io
539
+ - ura
540
+ - ▁pen
541
+ - ▁hombre
542
+ - ▁hacen
543
+ - ▁hablando
544
+ - ▁ayuda
545
+ - ▁hi
546
+ - ▁trata
547
+ - ▁hoy
548
+ - ito
549
+ - ten
550
+ - ▁na
551
+ - ▁exactamente
552
+ - ▁escucha
553
+ - ver
554
+ - un
555
+ - ▁conoce
556
+ - gue
557
+ - ño
558
+ - ▁filadelfia
559
+ - ita
560
+ - ▁poder
561
+ - ▁fa
562
+ - án
563
+ - ▁puedo
564
+ - ▁lugar
565
+ - ▁vamos
566
+ - ▁yeah
567
+ - ú
568
+ - ▁desde
569
+ - ▁pi
570
+ - lla
571
+ - ▁hora
572
+ - lu
573
+ - ▁otros
574
+ - ▁méxico
575
+ - ▁internet
576
+ - ▁res
577
+ - ▁solamente
578
+ - ban
579
+ - ▁usa
580
+ - ▁vas
581
+ - ▁fui
582
+ - ▁estado
583
+ - ▁lleva
584
+ - ▁mil
585
+ - ▁solo
586
+ - ▁entre
587
+ - ▁wow
588
+ - ▁éste
589
+ - ch
590
+ - den
591
+ - ▁frío
592
+ - ▁cree
593
+ - ▁caso
594
+ - ▁estudia
595
+ - ▁am
596
+ - ▁busca
597
+ - ▁dis
598
+ - ▁trabaja
599
+ - ▁fe
600
+ - ▁bo
601
+ - ▁hecho
602
+ - ▁pueden
603
+ - ▁poquito
604
+ - ter
605
+ - ▁vivir
606
+ - ▁amigo
607
+ - ▁cuánto
608
+ - ▁ga
609
+ - ▁esas
610
+ - ul
611
+ - ▁tampoco
612
+ - ▁hijos
613
+ - ▁unos
614
+ - el
615
+ - ▁cuatro
616
+ - ▁sus
617
+ - ▁com
618
+ - ▁aunque
619
+ - ▁seguro
620
+ - ▁ce
621
+ - ▁forma
622
+ - ▁debe
623
+ - los
624
+ - ▁ta
625
+ - cion
626
+ - ones
627
+ - ▁puedes
628
+ - ▁mamá
629
+ - ▁cuenta
630
+ - ▁mis
631
+ - ▁diferente
632
+ - ▁quiero
633
+ - ▁ho
634
+ - ▁vivo
635
+ - ▁celular
636
+ - ero
637
+ - ▁universidad
638
+ - ▁be
639
+ - ▁misma
640
+ - ▁deja
641
+ - ▁cuál
642
+ - ▁inglés
643
+ - ▁nombre
644
+ - dia
645
+ - ▁paga
646
+ - ▁ahorita
647
+ - ▁cambia
648
+ - gra
649
+ - ▁dan
650
+ - ▁allí
651
+ - ▁rico
652
+ - ▁puerto
653
+ - ▁buenas
654
+ - ▁manera
655
+ - ▁cri
656
+ - ▁días
657
+ - ▁ésta
658
+ - ▁cualquier
659
+ - ▁países
660
+ - ing
661
+ - tica
662
+ - ina
663
+ - ▁buena
664
+ - ▁nadie
665
+ - ▁decía
666
+ - ▁piensa
667
+ - ▁sobre
668
+ - ▁esposo
669
+ - ▁qui
670
+ - ▁chile
671
+ - tro
672
+ - ▁toma
673
+ - ▁dijo
674
+ - ▁quieren
675
+ - ▁película
676
+ - ▁semana
677
+ - ▁sistema
678
+ - ▁come
679
+ - ▁mujer
680
+ - ▁veo
681
+ - ▁n
682
+ - ida
683
+ - ▁otras
684
+ - ▁medio
685
+ - ón
686
+ - ▁diez
687
+ - ▁cerca
688
+ - ▁iba
689
+ - ico
690
+ - gan
691
+ - ▁necesita
692
+ - zo
693
+ - ▁oye
694
+ - ▁san
695
+ - ▁bu
696
+ - ▁entiendes
697
+ - tó
698
+ - rme
699
+ - ▁sería
700
+ - ▁argentina
701
+ - ▁momento
702
+ - miento
703
+ - ▁know
704
+ - ▁seis
705
+ - ▁fo
706
+ - ▁toca
707
+ - ▁manda
708
+ - ▁w
709
+ - ▁iglesia
710
+ - ▁dólares
711
+ - ▁ja
712
+ - ▁diferentes
713
+ - ista
714
+ - ▁escuela
715
+ - ▁fácil
716
+ - ▁sale
717
+ - ▁interesante
718
+ - ▁padre
719
+ - ▁gana
720
+ - ▁inter
721
+ - ▁papá
722
+ - mina
723
+ - ▁pregunta
724
+ - iente
725
+ - ▁realidad
726
+ - ▁conozco
727
+ - ▁dar
728
+ - sión
729
+ - ▁tenido
730
+ - ▁trabajar
731
+ - ▁pareja
732
+ - ▁gu
733
+ - ▁mío
734
+ - ▁hijo
735
+ - ig
736
+ - ▁vivi
737
+ - ▁computadora
738
+ - ▁visto
739
+ - ▁importante
740
+ - ▁pasado
741
+ - ▁vol
742
+ - ▁tenga
743
+ - ho
744
+ - ▁pagar
745
+ - ▁latino
746
+ - ▁corre
747
+ - ▁haber
748
+ - ▁televisión
749
+ - ▁luego
750
+ - ▁relación
751
+ - ▁señor
752
+ - ▁tanta
753
+ - ▁mujeres
754
+ - iza
755
+ - ▁treinta
756
+ - ▁idea
757
+ - ▁salir
758
+ - ▁americano
759
+ - ▁encanta
760
+ - ▁meses
761
+ - ▁pasó
762
+ - ▁programa
763
+ - ▁algún
764
+ - ▁pri
765
+ - ▁estuve
766
+ - ▁comprar
767
+ - ▁contra
768
+ - ▁bonito
769
+ - ▁colombia
770
+ - ▁compra
771
+ - ▁super
772
+ - ▁hacía
773
+ - ▁imp
774
+ - ▁cultura
775
+ - ▁fíjate
776
+ - ▁sino
777
+ - ▁poner
778
+ - ▁fuera
779
+ - ▁ri
780
+ - ▁veinte
781
+ - ▁buen
782
+ - ▁único
783
+ - ▁entiendo
784
+ - ▁depende
785
+ - ▁fu
786
+ - ▁españa
787
+ - ▁quizás
788
+ - ▁esté
789
+ - ▁gracias
790
+ - ▁hija
791
+ - tico
792
+ - ▁imagino
793
+ - q
794
+ - ▁quiera
795
+ - ▁comuni
796
+ - ▁espera
797
+ - ▁go
798
+ - ▁primera
799
+ - ▁clase
800
+ - ▁general
801
+ - ▁diciendo
802
+ - ▁carro
803
+ - ▁anda
804
+ - ▁somos
805
+ - ▁sabía
806
+ - ▁amiga
807
+ - ▁vaya
808
+ - ▁compañía
809
+ - ▁siete
810
+ - ▁viste
811
+ - ▁canadá
812
+ - ▁cuanto
813
+ - ▁empeza
814
+ - ▁mayor
815
+ - ▁lleg
816
+ - ▁ido
817
+ - ▁malo
818
+ - ▁debería
819
+ - ▁gobierno
820
+ - ▁edad
821
+ - ▁situación
822
+ - ▁trabajando
823
+ - tivo
824
+ - ▁calle
825
+ - ▁veinti
826
+ - ▁mayoría
827
+ - ▁plan
828
+ - ▁viviendo
829
+ - ▁termina
830
+ - ▁llamo
831
+ - ▁viaja
832
+ - ▁social
833
+ - ▁jo
834
+ - ▁ciento
835
+ - ▁joven
836
+ - ▁estudio
837
+ - ▁hablo
838
+ - ▁empieza
839
+ - ▁podía
840
+ - ▁baila
841
+ - ▁punto
842
+ - ▁matrimonio
843
+ - ▁primero
844
+ - ▁entiende
845
+ - ▁perdón
846
+ - ▁niña
847
+ - ▁pobre
848
+ - fect
849
+ - ▁hispano
850
+ - ▁auto
851
+ - ▁importa
852
+ - ▁tarde
853
+ - ▁vivía
854
+ - ▁gustaría
855
+ - ▁diferencia
856
+ - ▁pueda
857
+ - ▁experiencia
858
+ - ▁ángeles
859
+ - ▁pie
860
+ - ▁oportunidad
861
+ - ▁ma��ana
862
+ - ▁nuevo
863
+ - ▁ningún
864
+ - ▁k
865
+ - ▁razón
866
+ - ▁minutos
867
+ - vis
868
+ - ▁además
869
+ - ▁cha
870
+ - ▁nueve
871
+ - ▁comercial
872
+ - ▁demasiado
873
+ - ▁encontrar
874
+ - port
875
+ - ▁sentido
876
+ - ▁número
877
+ - ▁política
878
+ - ▁niño
879
+ - ▁grupo
880
+ - ▁pensar
881
+ - ▁hermano
882
+ - ísimo
883
+ - ▁raza
884
+ - ▁afuera
885
+ - ▁quince
886
+ - ▁sitio
887
+ - ▁policía
888
+ - ▁gusto
889
+ - ▁fuerte
890
+ - ▁miami
891
+ - ▁palabra
892
+ - ▁montón
893
+ - ▁cincuenta
894
+ - ▁falta
895
+ - ▁recuerdo
896
+ - ▁visita
897
+ - ▁normal
898
+ - ▁especialmente
899
+ - ▁hizo
900
+ - ▁salud
901
+ - ▁partido
902
+ - ▁plata
903
+ - ▁venezuela
904
+ - ▁ru
905
+ - ▁novia
906
+ - ▁cierta
907
+ - ▁educa
908
+ - ▁área
909
+ - ▁maneja
910
+ - ▁quien
911
+ - ▁acostumbra
912
+ - ▁conocí
913
+ - ▁doctor
914
+ - ▁inmigrante
915
+ - ▁básicamente
916
+ - ▁mexicano
917
+ - ▁comida
918
+ - ▁algunos
919
+ - ▁enseña
920
+ - ▁cuarenta
921
+ - ▁supuesto
922
+ - ▁panamá
923
+ - ▁religiones
924
+ - ▁cuestión
925
+ - ▁bi
926
+ - ▁final
927
+ - ▁encuentro
928
+ - ▁llevo
929
+ - ▁tenés
930
+ - ▁hermana
931
+ - ▁papel
932
+ - ▁existe
933
+ - ▁aprende
934
+ - ▁novio
935
+ - ▁encontr
936
+ - ▁cambio
937
+ - ▁negocio
938
+ - ▁atrás
939
+ - ▁podría
940
+ - ▁miedo
941
+ - ismo
942
+ - ▁increíble
943
+ - ▁pongo
944
+ - ▁aparte
945
+ - ▁osea
946
+ - ▁médico
947
+ - ▁acento
948
+ - ▁terrible
949
+ - ▁enferm
950
+ - ▁hablé
951
+ - ▁regresa
952
+ - ▁texas
953
+ - ▁jurado
954
+ - ▁última
955
+ - ▁peor
956
+ - ▁estuvo
957
+ - ▁dentro
958
+ - ▁color
959
+ - ▁viví
960
+ - ▁right
961
+ - ▁chicago
962
+ - ▁servicio
963
+ - ▁interesa
964
+ - ▁muchísimo
965
+ - ▁email
966
+ - ▁escucho
967
+ - ▁pronto
968
+ - ▁homosexual
969
+ - ▁rápido
970
+ - ▁esposa
971
+ - ▁principio
972
+ - ▁llen
973
+ - ▁hospital
974
+ - ▁imagínate
975
+ - ▁peligro
976
+ - ▁cuándo
977
+ - ▁uhum
978
+ - ▁apartamento
979
+ - ▁funciona
980
+ - ▁historia
981
+ - ▁tecnología
982
+ - ▁control
983
+ - ▁ninguna
984
+ - ▁juntos
985
+ - ▁encuentra
986
+ - ▁horrible
987
+ - ▁centro
988
+ - ▁atención
989
+ - ▁hubiera
990
+ - ▁totalmente
991
+ - ▁california
992
+ - ▁católica
993
+ - ▁molesta
994
+ - ▁gustó
995
+ - ▁información
996
+ - ▁méjico
997
+ - ▁suerte
998
+ - ▁argentino
999
+ - ▁divi
1000
+ - ▁florida
1001
+ - ▁guerra
1002
+ - ▁aires
1003
+ - ▁nieve
1004
+ - ▁obviamente
1005
+ - ▁pelea
1006
+ - ▁nuestro
1007
+ - ▁simplemente
1008
+ - ▁pequeño
1009
+ - ▁clima
1010
+ - ▁europa
1011
+ - ▁imagina
1012
+ - ▁arriba
1013
+ - ▁leyes
1014
+ - ▁playa
1015
+ - ▁violencia
1016
+ - ▁conversa
1017
+ - ▁fiesta
1018
+ - ▁tranquilo
1019
+ - ▁acepta
1020
+ - ▁último
1021
+ - ▁única
1022
+ - ▁definitivamente
1023
+ - ▁incluso
1024
+ - ▁idioma
1025
+ - ▁favor
1026
+ - ▁blanco
1027
+ - ▁presidente
1028
+ - ▁invierno
1029
+ - ▁separa
1030
+ - ivo
1031
+ - ▁primer
1032
+ - ▁nuestra
1033
+ - ▁bonita
1034
+ - ▁culpa
1035
+ - ▁vota
1036
+ - ▁entendí
1037
+ - ▁madre
1038
+ - ▁conocido
1039
+ - ▁arregl
1040
+ - ▁acerca
1041
+ - ▁washington
1042
+ - ▁radio
1043
+ - ▁opina
1044
+ - ▁contigo
1045
+ - ▁podemos
1046
+ - ▁pensando
1047
+ - ▁duro
1048
+ - ▁conmigo
1049
+ - ▁verano
1050
+ - '0'
1051
+ - ▁negro
1052
+ - ▁mientras
1053
+ - ▁nací
1054
+ - ▁toronto
1055
+ - ▁recibi
1056
+ - ▁hicieron
1057
+ - ▁boston
1058
+ - ▁campo
1059
+ - ▁repente
1060
+ - ▁cocina
1061
+ - ▁cuesta
1062
+ - ▁conseguir
1063
+ - ▁jóvenes
1064
+ - ▁olvida
1065
+ - ▁ochenta
1066
+ - ▁nivel
1067
+ - ▁sociedad
1068
+ - ▁chiquito
1069
+ - ▁guatemala
1070
+ - ▁político
1071
+ - ▁supongo
1072
+ - ▁empezó
1073
+ - ▁época
1074
+ - ▁siquiera
1075
+ - ▁agarra
1076
+ - ▁católico
1077
+ - ▁pennsylvania
1078
+ - ▁medicina
1079
+ - ▁entender
1080
+ - ▁italia
1081
+ - ▁especial
1082
+ - ▁atlanta
1083
+ - ▁navidad
1084
+ - ▁cantidad
1085
+ - ▁domingo
1086
+ - ▁cristiano
1087
+ - ▁opinión
1088
+ - ▁crédito
1089
+ - ▁noticias
1090
+ - ▁houston
1091
+ - ▁preocupa
1092
+ - ▁mensaje
1093
+ - ▁américa
1094
+ - ▁perfecto
1095
+ - ▁dijiste
1096
+ - '1'
1097
+ - '2'
1098
+ - '5'
1099
+ - _
1100
+ - '-'
1101
+ - '3'
1102
+ - '6'
1103
+ - '4'
1104
+ - '9'
1105
+ - '8'
1106
+ - '7'
1107
+ - A
1108
+ - B
1109
+ - ì
1110
+ - à
1111
+ - ç
1112
+ - è
1113
+ - ü
1114
+ - <sos/eos>
1115
+ init: null
1116
+ input_size: null
1117
+ ctc_conf:
1118
+ dropout_rate: 0.0
1119
+ ctc_type: builtin
1120
+ reduce: true
1121
+ ignore_nan_grad: null
1122
+ zero_infinity: true
1123
+ joint_net_conf: null
1124
+ use_preprocessor: true
1125
+ token_type: bpe
1126
+ bpemodel: data/token_list/bpe_unigram1000/bpe.model
1127
+ non_linguistic_symbols: null
1128
+ cleaner: null
1129
+ g2p: null
1130
+ speech_volume_normalize: null
1131
+ rir_scp: null
1132
+ rir_apply_prob: 1.0
1133
+ noise_scp: null
1134
+ noise_apply_prob: 1.0
1135
+ noise_db_range: '13_15'
1136
+ short_noise_thres: 0.5
1137
+ aux_ctc_tasks: []
1138
+ frontend: default
1139
+ frontend_conf:
1140
+ n_fft: 512
1141
+ win_length: 400
1142
+ hop_length: 160
1143
+ fs: 8k
1144
+ specaug: specaug
1145
+ specaug_conf:
1146
+ apply_time_warp: true
1147
+ time_warp_window: 5
1148
+ time_warp_mode: bicubic
1149
+ apply_freq_mask: true
1150
+ freq_mask_width_range:
1151
+ - 0
1152
+ - 30
1153
+ num_freq_mask: 2
1154
+ apply_time_mask: true
1155
+ time_mask_width_range:
1156
+ - 0
1157
+ - 40
1158
+ num_time_mask: 2
1159
+ normalize: global_mvn
1160
+ normalize_conf:
1161
+ stats_file: exp/asr_stats_raw_bpe1000_sp/train/feats_stats.npz
1162
+ model: espnet
1163
+ model_conf:
1164
+ ctc_weight: 0.3
1165
+ lsm_weight: 0.1
1166
+ length_normalized_loss: false
1167
+ preencoder: null
1168
+ preencoder_conf: {}
1169
+ encoder: e_branchformer
1170
+ encoder_conf:
1171
+ output_size: 256
1172
+ attention_heads: 4
1173
+ attention_layer_type: rel_selfattn
1174
+ pos_enc_layer_type: rel_pos
1175
+ rel_pos_type: latest
1176
+ cgmlp_linear_units: 1024
1177
+ cgmlp_conv_kernel: 31
1178
+ use_linear_after_conv: false
1179
+ gate_activation: identity
1180
+ num_blocks: 16
1181
+ dropout_rate: 0.1
1182
+ positional_dropout_rate: 0.1
1183
+ attention_dropout_rate: 0.1
1184
+ input_layer: conv2d
1185
+ layer_drop_rate: 0.0
1186
+ linear_units: 1024
1187
+ positionwise_layer_type: linear
1188
+ use_ffn: true
1189
+ macaron_ffn: true
1190
+ merge_conv_kernel: 31
1191
+ postencoder: null
1192
+ postencoder_conf: {}
1193
+ decoder: transformer
1194
+ decoder_conf:
1195
+ input_layer: embed
1196
+ num_blocks: 6
1197
+ linear_units: 2048
1198
+ dropout_rate: 0.1
1199
+ preprocessor: default
1200
+ preprocessor_conf: {}
1201
+ required:
1202
+ - output_dir
1203
+ - token_list
1204
+ version: '202301'
1205
+ distributed: false
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/acc.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/backward_time.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/cer.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/cer_ctc.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/forward_time.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/gpu_max_cached_mem_GB.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/iter_time.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/loss.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/loss_att.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/loss_ctc.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/optim0_lr0.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/optim_step_time.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/train_time.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/images/wer.png ADDED
exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/valid.acc.ave_10best.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:3d57f840097c205a0a42c16d36c083c94905612a2ebc6cc43302e8da89907111
3
+ size 173046725
meta.yaml ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ espnet: '202301'
2
+ files:
3
+ asr_model_file: exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/valid.acc.ave_10best.pth
4
+ python: "3.9.15 (main, Nov 24 2022, 14:31:59) \n[GCC 11.2.0]"
5
+ timestamp: 1677639836.07657
6
+ torch: 1.13.1
7
+ yaml_files:
8
+ asr_train_config: exp/asr_train_asr_e_branchformer_e16_raw_bpe1000_sp/config.yaml