Automatic Speech Recognition
ESPnet
Sundanese
audio
Siddhant commited on
Commit
cf1ad95
1 Parent(s): c0062bb

import from zenodo

Browse files
README.md ADDED
@@ -0,0 +1,43 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - espnet
4
+ - audio
5
+ - automatic-speech-recognition
6
+ language: su
7
+ datasets:
8
+ - su_openslr36
9
+ license: cc-by-4.0
10
+ ---
11
+ ## ESPnet2 ASR pretrained model
12
+ ### `su_openslr36`
13
+ ♻️ Imported from https://zenodo.org/record/5090135/
14
+
15
+ This model was trained by su_openslr36 using su_openslr36/asr1 recipe in [espnet](https://github.com/espnet/espnet/).
16
+ ### Demo: How to use in ESPnet2
17
+ ```python
18
+ # coming soon
19
+ ```
20
+ ### Citing ESPnet
21
+ ```BibTex
22
+ @inproceedings{watanabe2018espnet,
23
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson {Enrique Yalta Soplin} and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
24
+ title={{ESPnet}: End-to-End Speech Processing Toolkit},
25
+ year={2018},
26
+ booktitle={Proceedings of Interspeech},
27
+ pages={2207--2211},
28
+ doi={10.21437/Interspeech.2018-1456},
29
+ url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
30
+ }
31
+
32
+ ```
33
+ or arXiv:
34
+ ```bibtex
35
+ @misc{watanabe2018espnet,
36
+ title={ESPnet: End-to-End Speech Processing Toolkit},
37
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Enrique Yalta Soplin and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
38
+ year={2018},
39
+ eprint={1804.00015},
40
+ archivePrefix={arXiv},
41
+ primaryClass={cs.CL}
42
+ }
43
+ ```
data/token_list/bpe_unigram1000/bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:10c596a2c27c533d1de72ebf607edfc0f2fc3fae8a9770f998a0d6c51495d818
3
+ size 252039
exp/asr_stats_raw_bpe1000/train/feats_stats.npz ADDED
Binary file (1.4 kB). View file
 
exp/asr_train_asr_raw_bpe1000/196epoch.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:10848443b9b121a13f86d982576155c1390d35eef2504acbe7b1a11f4cd0323c
3
+ size 111680269
exp/asr_train_asr_raw_bpe1000/RESULTS.md ADDED
@@ -0,0 +1,32 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
2
+ # RESULTS
3
+ ## Environments
4
+ - date: `Fri Jul 9 20:43:31 PDT 2021`
5
+ - python version: `3.8.5 (default, Sep 4 2020, 07:30:14) [GCC 7.3.0]`
6
+ - espnet version: `espnet 0.10.0`
7
+ - pytorch version: `pytorch 1.8.1+cu102`
8
+ - Git hash: `049c1203da14ec06a8f8290575f5a44a5b1634d1`
9
+ - Commit date: `Fri Jul 9 08:52:32 2021 -0700`
10
+
11
+ ## asr_train_asr_raw_bpe1000
12
+ ### WER
13
+
14
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
15
+ |---|---|---|---|---|---|---|---|---|
16
+ |decode_asr_asr_model_valid.acc.best/sunda_test|2185|17916|98.5|1.2|0.3|0.1|1.6|5.0|
17
+ |decode_asr_batch_size1_asr_model_valid.acc.best/sunda_test|2185|17916|98.5|1.2|0.3|0.1|1.6|5.0|
18
+
19
+ ### CER
20
+
21
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
22
+ |---|---|---|---|---|---|---|---|---|
23
+ |decode_asr_asr_model_valid.acc.best/sunda_test|2185|117265|99.5|0.2|0.3|0.1|0.6|5.0|
24
+ |decode_asr_batch_size1_asr_model_valid.acc.best/sunda_test|2185|117265|99.5|0.2|0.3|0.1|0.6|5.0|
25
+
26
+ ### TER
27
+
28
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
29
+ |---|---|---|---|---|---|---|---|---|
30
+ |decode_asr_asr_model_valid.acc.best/sunda_test|2185|36414|98.5|0.9|0.6|0.2|1.6|5.0|
31
+ |decode_asr_batch_size1_asr_model_valid.acc.best/sunda_test|2185|36414|98.5|0.9|0.6|0.2|1.6|5.0|
32
+
exp/asr_train_asr_raw_bpe1000/config.yaml ADDED
@@ -0,0 +1,1161 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ config: conf/train_asr.yaml
2
+ print_config: false
3
+ log_level: INFO
4
+ dry_run: false
5
+ iterator_type: sequence
6
+ output_dir: exp/asr_train_asr_raw_bpe1000
7
+ ngpu: 1
8
+ seed: 0
9
+ num_workers: 1
10
+ num_att_plot: 3
11
+ dist_backend: nccl
12
+ dist_init_method: env://
13
+ dist_world_size: 2
14
+ dist_rank: 0
15
+ local_rank: 0
16
+ dist_master_addr: localhost
17
+ dist_master_port: 44079
18
+ dist_launcher: null
19
+ multiprocessing_distributed: true
20
+ unused_parameters: false
21
+ sharded_ddp: false
22
+ cudnn_enabled: true
23
+ cudnn_benchmark: false
24
+ cudnn_deterministic: true
25
+ collect_stats: false
26
+ write_collected_feats: false
27
+ max_epoch: 200
28
+ patience: 20
29
+ val_scheduler_criterion:
30
+ - valid
31
+ - loss
32
+ early_stopping_criterion:
33
+ - valid
34
+ - loss
35
+ - min
36
+ best_model_criterion:
37
+ - - valid
38
+ - acc
39
+ - max
40
+ keep_nbest_models: 10
41
+ grad_clip: 5
42
+ grad_clip_type: 2.0
43
+ grad_noise: false
44
+ accum_grad: 2
45
+ no_forward_run: false
46
+ resume: true
47
+ train_dtype: float32
48
+ use_amp: false
49
+ log_interval: null
50
+ use_tensorboard: true
51
+ use_wandb: false
52
+ wandb_project: null
53
+ wandb_id: null
54
+ wandb_entity: null
55
+ wandb_name: null
56
+ wandb_model_log_interval: -1
57
+ detect_anomaly: false
58
+ pretrain_path: null
59
+ init_param: []
60
+ ignore_init_mismatch: false
61
+ freeze_param: []
62
+ num_iters_per_epoch: null
63
+ batch_size: 32
64
+ valid_batch_size: null
65
+ batch_bins: 1000000
66
+ valid_batch_bins: null
67
+ train_shape_file:
68
+ - exp/asr_stats_raw_bpe1000/train/speech_shape
69
+ - exp/asr_stats_raw_bpe1000/train/text_shape.bpe
70
+ valid_shape_file:
71
+ - exp/asr_stats_raw_bpe1000/valid/speech_shape
72
+ - exp/asr_stats_raw_bpe1000/valid/text_shape.bpe
73
+ batch_type: folded
74
+ valid_batch_type: null
75
+ fold_length:
76
+ - 80000
77
+ - 150
78
+ sort_in_batch: descending
79
+ sort_batch: descending
80
+ multiple_iterator: false
81
+ chunk_length: 500
82
+ chunk_shift_ratio: 0.5
83
+ num_cache_chunks: 1024
84
+ train_data_path_and_name_and_type:
85
+ - - dump/raw/sunda_train/wav.scp
86
+ - speech
87
+ - sound
88
+ - - dump/raw/sunda_train/text
89
+ - text
90
+ - text
91
+ valid_data_path_and_name_and_type:
92
+ - - dump/raw/sunda_dev/wav.scp
93
+ - speech
94
+ - sound
95
+ - - dump/raw/sunda_dev/text
96
+ - text
97
+ - text
98
+ allow_variable_data_keys: false
99
+ max_cache_size: 0.0
100
+ max_cache_fd: 32
101
+ valid_max_cache_size: null
102
+ optim: adam
103
+ optim_conf:
104
+ lr: 10.0
105
+ scheduler: noamlr
106
+ scheduler_conf:
107
+ warmup_steps: 25000
108
+ token_list:
109
+ - <blank>
110
+ - <unk>
111
+ - ▁
112
+ - ▁DI
113
+ - KEUR
114
+ - ▁KU
115
+ - ▁JEUNG
116
+ - ▁OL
117
+ - ▁NINGALI
118
+ - NCARA
119
+ - ▁WARTAWAN
120
+ - OHOK
121
+ - WAWA
122
+ - POTO
123
+ - A
124
+ - I
125
+ - E
126
+ - Y
127
+ - S
128
+ - O
129
+ - AN
130
+ - T
131
+ - NA
132
+ - N
133
+ - R
134
+ - RA
135
+ - L
136
+ - ER
137
+ - H
138
+ - D
139
+ - ▁KA
140
+ - 'ON'
141
+ - U
142
+ - TA
143
+ - IN
144
+ - ▁K
145
+ - ▁S
146
+ - P
147
+ - MA
148
+ - G
149
+ - K
150
+ - AR
151
+ - LA
152
+ - RI
153
+ - NG
154
+ - M
155
+ - EL
156
+ - ▁M
157
+ - ▁D
158
+ - DI
159
+ - LE
160
+ - B
161
+ - IE
162
+ - ▁P
163
+ - Z
164
+ - W
165
+ - WI
166
+ - ▁B
167
+ - ▁MAR
168
+ - EN
169
+ - AD
170
+ - ▁T
171
+ - .
172
+ - SON
173
+ - ▁F
174
+ - AS
175
+ - IS
176
+ - UR
177
+ - KA
178
+ - ▁LI
179
+ - MAN
180
+ - ING
181
+ - UNG
182
+ - ▁G
183
+ - ▁AL
184
+ - V
185
+ - TON
186
+ - UN
187
+ - WA
188
+ - ▁AYA
189
+ - ▁POE
190
+ - F
191
+ - ▁TI
192
+ - ▁DINA
193
+ - ▁NI
194
+ - TH
195
+ - RE
196
+ - ▁O
197
+ - ▁ARI
198
+ - ▁HA
199
+ - CA
200
+ - NE
201
+ - CK
202
+ - ORAN
203
+ - ▁JA
204
+ - ▁ME
205
+ - TO
206
+ - AH
207
+ - ▁SI
208
+ - US
209
+ - ▁C
210
+ - ▁SO
211
+ - UL
212
+ - LO
213
+ - DEWI
214
+ - ES
215
+ - ▁BA
216
+ - ▁Z
217
+ - ▁MI
218
+ - AL
219
+ - ▁RO
220
+ - ED
221
+ - ▁SA
222
+ - KY
223
+ - ▁PA
224
+ - ▁SU
225
+ - EK
226
+ - ▁BE
227
+ - SA
228
+ - TYA
229
+ - ▁CA
230
+ - IKA
231
+ - ▁BEN
232
+ - NDA
233
+ - CE
234
+ - ▁JO
235
+ - NATA
236
+ - ▁H
237
+ - IA
238
+ - ▁RU
239
+ - INA
240
+ - ▁CHRIS
241
+ - ▁SAND
242
+ - ▁THE
243
+ - IM
244
+ - BERT
245
+ - ▁SAM
246
+ - YA
247
+ - C
248
+ - HA
249
+ - ▁HO
250
+ - ▁LEE
251
+ - KU
252
+ - GO
253
+ - ▁DON
254
+ - ▁IR
255
+ - ATI
256
+ - UK
257
+ - ▁W
258
+ - GER
259
+ - ZI
260
+ - ▁JOHN
261
+ - ▁IS
262
+ - ANG
263
+ - ▁KE
264
+ - LEY
265
+ - ▁RE
266
+ - ▁SE
267
+ - ▁BO
268
+ - IF
269
+ - ▁MUHAM
270
+ - MY
271
+ - ▁JACK
272
+ - LY
273
+ - DO
274
+ - KI
275
+ - ▁KAT
276
+ - ▁RAM
277
+ - KH
278
+ - IC
279
+ - ▁L
280
+ - ▁JI
281
+ - AM
282
+ - ▁JESSI
283
+ - ▁BELL
284
+ - ▁MO
285
+ - AVID
286
+ - RO
287
+ - HAM
288
+ - EM
289
+ - OR
290
+ - JA
291
+ - ▁HE
292
+ - SARI
293
+ - MAD
294
+ - ID
295
+ - '-'
296
+ - LAN
297
+ - OT
298
+ - RAH
299
+ - ASA
300
+ - ▁ELIZABETH
301
+ - INE
302
+ - ▁TOM
303
+ - ▁LE
304
+ - ▁LA
305
+ - ▁REZ
306
+ - ▁AND
307
+ - ▁JENN
308
+ - UM
309
+ - ▁MARIA
310
+ - ▁BON
311
+ - ▁CHO
312
+ - FA
313
+ - YONG
314
+ - ▁TITI
315
+ - HEN
316
+ - ▁BR
317
+ - EB
318
+ - ▁ANU
319
+ - ISA
320
+ - ▁PE
321
+ - ▁DO
322
+ - ▁TEU
323
+ - TEN
324
+ - ▁MIR
325
+ - ▁NU
326
+ - WAN
327
+ - ▁RI
328
+ - EZ
329
+ - ▁VIN
330
+ - MAL
331
+ - OS
332
+ - OOR
333
+ - RAN
334
+ - ▁WIN
335
+ - BING
336
+ - ▁YU
337
+ - ▁GI
338
+ - ▁AHM
339
+ - ANTI
340
+ - ▁LU
341
+ - ALI
342
+ - ▁NO
343
+ - ▁BILL
344
+ - ▁YO
345
+ - J
346
+ - SHA
347
+ - ▁ADAM
348
+ - LIE
349
+ - ▁SOPHI
350
+ - CKY
351
+ - ▁JON
352
+ - ▁MARTIN
353
+ - ▁KHAN
354
+ - DER
355
+ - ▁KAP
356
+ - ▁JOE
357
+ - ▁WON
358
+ - ▁JAME
359
+ - ▁WILLIAM
360
+ - ▁J
361
+ - ▁KAR
362
+ - ▁AR
363
+ - MITH
364
+ - ▁ADI
365
+ - UA
366
+ - ▁CHANDRA
367
+ - ▁RIZ
368
+ - ▁ASHLE
369
+ - ▁RICHARD
370
+ - ▁PUTRI
371
+ - ▁JOSH
372
+ - ▁HARRIS
373
+ - ▁GUN
374
+ - RINA
375
+ - ▁INDRA
376
+ - ARA
377
+ - ▁LAT
378
+ - ▁EM
379
+ - ▁AYU
380
+ - ▁VAN
381
+ - WATI
382
+ - CHAN
383
+ - SYA
384
+ - ▁ALI
385
+ - CHEL
386
+ - ▁PAN
387
+ - ALL
388
+ - BU
389
+ - ▁CH
390
+ - AWA
391
+ - ▁ABD
392
+ - NS
393
+ - ERRY
394
+ - AEL
395
+ - ▁DAR
396
+ - ▁JU
397
+ - NY
398
+ - ▁SHAH
399
+ - ELLY
400
+ - HU
401
+ - ▁MICHEL
402
+ - ▁CAR
403
+ - RIO
404
+ - ULIN
405
+ - ▁DAHLIA
406
+ - ▁KANG
407
+ - ▁MIN
408
+ - ▁LOBA
409
+ - ▁YUKI
410
+ - ▁EVA
411
+ - ▁WILL
412
+ - INDAH
413
+ - ▁JUD
414
+ - NTY
415
+ - ▁CIT
416
+ - ▁JUN
417
+ - ▁MC
418
+ - ▁JUSTI
419
+ - PERT
420
+ - ▁CI
421
+ - ▁US
422
+ - ▁YUN
423
+ - ▁SIMP
424
+ - NIE
425
+ - DAD
426
+ - ▁MEL
427
+ - ▁SHERI
428
+ - ▁PAUL
429
+ - RYAN
430
+ - ▁RAN
431
+ - ▁VI
432
+ - HAKIM
433
+ - ▁FAT
434
+ - ALLEN
435
+ - UNGAN
436
+ - ▁MARC
437
+ - MES
438
+ - ▁CRIST
439
+ - ▁MARK
440
+ - ▁DANIEL
441
+ - ▁ROSS
442
+ - FAN
443
+ - ▁REEVE
444
+ - ▁JULIA
445
+ - ZHA
446
+ - ONEY
447
+ - ▁KANTO
448
+ - ▁KATE
449
+ - ▁JIM
450
+ - ▁LAU
451
+ - ▁WOOD
452
+ - BAMA
453
+ - LOR
454
+ - LUM
455
+ - GHAN
456
+ - ▁TRI
457
+ - ▁MICH
458
+ - ▁DU
459
+ - RTIKA
460
+ - ▁RICK
461
+ - ESSA
462
+ - TIK
463
+ - EVIN
464
+ - ▁TAY
465
+ - ANDAR
466
+ - ▁SHI
467
+ - ELA
468
+ - ▁GAD
469
+ - ▁WIB
470
+ - ▁JE
471
+ - CHOLAS
472
+ - YAM
473
+ - ▁HARU
474
+ - ▁TUR
475
+ - ▁CHARL
476
+ - ▁SHAR
477
+ - JAYA
478
+ - ▁HYUN
479
+ - X
480
+ - ▁SYAH
481
+ - ▁LANCE
482
+ - LVIN
483
+ - UKI
484
+ - ▁PAPA
485
+ - ▁DARA
486
+ - AUDY
487
+ - ▁SHA
488
+ - ▁SIT
489
+ - ARAH
490
+ - SEA
491
+ - ▁BUL
492
+ - ▁CO
493
+ - BANG
494
+ - KEUN
495
+ - LINA
496
+ - RYA
497
+ - ▁NGAR
498
+ - RIANA
499
+ - ▁GEDE
500
+ - AWAN
501
+ - ▁PANG
502
+ - ▁MELL
503
+ - AKE
504
+ - STIAN
505
+ - NDRA
506
+ - ▁CAFE
507
+ - DAY
508
+ - ▁BAD
509
+ - ▁LAUR
510
+ - ▁KRIS
511
+ - ▁REBO
512
+ - ▁NEP
513
+ - ▁ROBB
514
+ - ▁STONE
515
+ - BAH
516
+ - WARD
517
+ - ▁FAR
518
+ - LIA
519
+ - ▁SORA
520
+ - PATI
521
+ - ▁RATU
522
+ - ▁KAMAR
523
+ - ▁SUN
524
+ - ▁MEDIA
525
+ - EPP
526
+ - ▁AGUS
527
+ - ▁MASA
528
+ - NDY
529
+ - ▁LAM
530
+ - NDES
531
+ - TINA
532
+ - ▁DEV
533
+ - ISH
534
+ - ▁GREEN
535
+ - ORO
536
+ - BALE
537
+ - ▁SURYA
538
+ - ▁PARK
539
+ - RAHMAN
540
+ - IPUT
541
+ - ▁GINANJAR
542
+ - REW
543
+ - ▁VICTORIA
544
+ - ▁JANET
545
+ - ▁BAY
546
+ - OSTER
547
+ - ▁STE
548
+ - ▁RITA
549
+ - ▁ARM
550
+ - ▁MAHER
551
+ - ▁CARE
552
+ - MELA
553
+ - WART
554
+ - ALIK
555
+ - ▁ANGEL
556
+ - STRONG
557
+ - ▁CRUISE
558
+ - ▁DANI
559
+ - ▁CLIN
560
+ - ▁AYEUNA
561
+ - ▁SONG
562
+ - ▁FACHR
563
+ - GITA
564
+ - RANDA
565
+ - ▁MAU
566
+ - KITA
567
+ - ICIA
568
+ - ▁FEB
569
+ - ▁ANT
570
+ - VIA
571
+ - ▁TURNE
572
+ - PORT
573
+ - ▁RAS
574
+ - LIU
575
+ - ▁OCTA
576
+ - ▁KHALI
577
+ - OPH
578
+ - ▁STEP
579
+ - ▁WEST
580
+ - ▁SEUNG
581
+ - HIM
582
+ - ▁FERNAND
583
+ - LESTARI
584
+ - ▁RY
585
+ - SCAR
586
+ - REGAR
587
+ - AMIR
588
+ - SAPUTRA
589
+ - ▁AGNES
590
+ - ▁MULYA
591
+ - HONY
592
+ - AFFLE
593
+ - ▁PERSI
594
+ - ▁CHE
595
+ - OLIVIA
596
+ - ▁SALMA
597
+ - ▁RONAL
598
+ - HOPE
599
+ - HUN
600
+ - ▁ROSE
601
+ - ILARI
602
+ - ▁KRISTEN
603
+ - ▁NOVITA
604
+ - ▁KAKA
605
+ - AMIL
606
+ - ▁RON
607
+ - ▁CITA
608
+ - ALBAR
609
+ - ▁VIR
610
+ - ▁FENI
611
+ - IOR
612
+ - ▁LED
613
+ - ▁ELVI
614
+ - ▁YOON
615
+ - ▁RIDWAN
616
+ - ▁RAF
617
+ - ▁ASTRI
618
+ - ▁DUA
619
+ - ▁MILL
620
+ - ▁DES
621
+ - IEF
622
+ - ▁TAM
623
+ - ▁ROY
624
+ - ▁KOES
625
+ - SUMA
626
+ - ▁CHIN
627
+ - ▁ROD
628
+ - ▁PIT
629
+ - KARNA
630
+ - LANK
631
+ - ▁YAYAN
632
+ - ▁BIG
633
+ - ▁ANIS
634
+ - OHANG
635
+ - QI
636
+ - ▁ALAM
637
+ - ▁MEG
638
+ - MAHE
639
+ - OWO
640
+ - ▁DOMIN
641
+ - ▁CHER
642
+ - IMBERL
643
+ - INTAN
644
+ - MORE
645
+ - ▁SUKA
646
+ - ▁NINI
647
+ - ▁STEFAN
648
+ - ▁CASE
649
+ - NAJ
650
+ - SEUEUR
651
+ - STER
652
+ - ▁JORDAN
653
+ - ▁ARIF
654
+ - ▁KIRAN
655
+ - YAKI
656
+ - ETTI
657
+ - ▁YUNG
658
+ - ASIH
659
+ - ▁SHEI
660
+ - QUE
661
+ - ▁STEV
662
+ - ▁VER
663
+ - MAJA
664
+ - ▁WAHYU
665
+ - ▁MICHE
666
+ - ▁BIMB
667
+ - HAB
668
+ - ▁BAHA
669
+ - ▁CAME
670
+ - ▁ALEXAND
671
+ - ▁ZAC
672
+ - ▁FRED
673
+ - ▁PIER
674
+ - ▁PINK
675
+ - ▁THOM
676
+ - ▁DJ
677
+ - ▁EMIL
678
+ - GIE
679
+ - ▁NICO
680
+ - ▁RUS
681
+ - ▁INDONESIA
682
+ - ▁KURNIA
683
+ - ▁FITRI
684
+ - IKO
685
+ - YANA
686
+ - ▁BOW
687
+ - LETT
688
+ - ▁HOL
689
+ - ▁MONA
690
+ - ▁ANDY
691
+ - GHAZ
692
+ - ▁MAG
693
+ - ▁NAD
694
+ - LANA
695
+ - ESIH
696
+ - ASMI
697
+ - ▁ARMAND
698
+ - ▁ADE
699
+ - DJA
700
+ - OVA
701
+ - AURE
702
+ - KUMAH
703
+ - ▁DANU
704
+ - ▁JERE
705
+ - ▁KIM
706
+ - ▁HAZ
707
+ - ▁GAL
708
+ - DANE
709
+ - ▁LEV
710
+ - ▁AMIN
711
+ - IBRA
712
+ - ▁MELAN
713
+ - ▁LOUIS
714
+ - ▁PURNAMA
715
+ - CENT
716
+ - ▁BRAMA
717
+ - ▁DANANG
718
+ - ▁DEVI
719
+ - ▁RANGGA
720
+ - ▁IQBA
721
+ - ▁POPP
722
+ - AYN
723
+ - HETT
724
+ - ▁DIMAS
725
+ - ▁MAND
726
+ - ▁NGAL
727
+ - ▁AGU
728
+ - ▁IVAN
729
+ - ▁FANN
730
+ - ▁IB
731
+ - ▁CLARK
732
+ - ▁HERMAN
733
+ - ▁ANA
734
+ - RELL
735
+ - LIAM
736
+ - LENN
737
+ - USSY
738
+ - ▁AHAD
739
+ - ▁RIRI
740
+ - OVI
741
+ - NTEN
742
+ - BRATA
743
+ - RID
744
+ - ▁ANNI
745
+ - ▁HERLIN
746
+ - ▁SULISTY
747
+ - SUHU
748
+ - ▁ANDRE
749
+ - ▁SENEN
750
+ - ▁NAND
751
+ - NAGARA
752
+ - ▁ANGGA
753
+ - ▁KRIST
754
+ - ACH
755
+ - PIRANG
756
+ - NDER
757
+ - DARI
758
+ - JUNG
759
+ - STADI
760
+ - ▁SALASA
761
+ - RLAND
762
+ - ▁NGOPI
763
+ - ▁JUMAAH
764
+ - ▁MANG
765
+ - RANI
766
+ - DHI
767
+ - ▁RAMADHAN
768
+ - ▁KIR
769
+ - ▁RATUS
770
+ - ▁AISH
771
+ - DIANA
772
+ - ▁MINGGON
773
+ - ▁KEMIS
774
+ - ▁LEO
775
+ - ASHI
776
+ - ▁SHAN
777
+ - ▁BANDUNG
778
+ - ▁IWA
779
+ - ▁PANTAI
780
+ - WEN
781
+ - ▁AWAK
782
+ - ▁PRESIDEN
783
+ - ▁NIR
784
+ - ▁MANCA
785
+ - ▁SAPTU
786
+ - CHA
787
+ - ▁KARD
788
+ - NTUH
789
+ - ▁MUSE
790
+ - STASI
791
+ - KMAN
792
+ - ▁FANS
793
+ - ▁ANYAR
794
+ - ▁ABI
795
+ - NGIR
796
+ - ▁DONGKAP
797
+ - '5'
798
+ - NGSI
799
+ - Q
800
+ - ▁PROPERT
801
+ - ▁NYIA
802
+ - NGGIH
803
+ - ▁DIDAMEL
804
+ - ▁NASIONAL
805
+ - OLI
806
+ - ▁KAAYA
807
+ - ▁KYL
808
+ - ▁UJANG
809
+ - ▁PENGG
810
+ - ▁POSTER
811
+ - ▁IEU
812
+ - IMAH
813
+ - ANDRY
814
+ - ▁KAGIATAN
815
+ - ▁KABUL
816
+ - ARIM
817
+ - ▁RUPIAH
818
+ - CAGE
819
+ - ▁MUSI
820
+ - ▁PART
821
+ - IBURAN
822
+ - ▁GAGA
823
+ - SUF
824
+ - ▁EFFE
825
+ - GEND
826
+ - ▁BLACK
827
+ - ▁ALBA
828
+ - ▁KUNC
829
+ - ▁VALEN
830
+ - IJAH
831
+ - ▁ANTARA
832
+ - OODY
833
+ - JOL
834
+ - ▁FOO
835
+ - ▁POLAND
836
+ - ▁METAL
837
+ - HYUN
838
+ - ADONA
839
+ - ▁ALEXA
840
+ - ARTI
841
+ - ▁BUSH
842
+ - ▁NORT
843
+ - LICA
844
+ - ▁GAMBAR
845
+ - ▁DOWN
846
+ - ▁QUEEN
847
+ - ▁STREE
848
+ - ▁CUT
849
+ - ▁BROK
850
+ - BEG
851
+ - ▁STAN
852
+ - ▁QUI
853
+ - GBA
854
+ - LEVI
855
+ - RIGHT
856
+ - ▁SEBA
857
+ - ▁WIZ
858
+ - IPAN
859
+ - ▁SUMBANG
860
+ - ▁ROLL
861
+ - ▁KARNO
862
+ - ESTU
863
+ - ▁ADJ
864
+ - ▁BIL
865
+ - AVO
866
+ - ▁NGADA
867
+ - ▁KOKO
868
+ - ▁NABI
869
+ - ▁GOES
870
+ - ▁FIGHT
871
+ - ▁STILL
872
+ - ▁PATT
873
+ - RRES
874
+ - ERENA
875
+ - ILANG
876
+ - ISTY
877
+ - ATUM
878
+ - ▁GUARDI
879
+ - ERJUN
880
+ - ▁NGAGE
881
+ - ▁LOREN
882
+ - ETRAL
883
+ - BIR
884
+ - FRON
885
+ - ▁SAHI
886
+ - ▁MISS
887
+ - ▁GRAND
888
+ - ▁GIGI
889
+ - ▁HYD
890
+ - ▁APPLE
891
+ - UYAN
892
+ - ▁WINTER
893
+ - ▁PETRA
894
+ - MAJU
895
+ - ▁BATU
896
+ - ▁MIHAR
897
+ - ▁BIDE
898
+ - ▁CECEP
899
+ - DIANTO
900
+ - DINI
901
+ - ▁AFGAN
902
+ - ▁WALK
903
+ - ▁CASI
904
+ - ▁DAMON
905
+ - ▁GARE
906
+ - ▁GAWE
907
+ - ▁MERC
908
+ - ▁TRAIN
909
+ - ▁TULU
910
+ - ▁KEYS
911
+ - ▁NGALAMA
912
+ - ▁BROWN
913
+ - ▁MAYORI
914
+ - ▁ELLI
915
+ - ▁GEUS
916
+ - ▁MEUNANG
917
+ - ▁KEND
918
+ - IKER
919
+ - SUT
920
+ - RAIG
921
+ - ▁SYARIF
922
+ - TEMAT
923
+ - ORGAN
924
+ - COTT
925
+ - LLAS
926
+ - ▁PANDU
927
+ - ▁PANGAB
928
+ - ▁WALT
929
+ - ▁SUPER
930
+ - EXTO
931
+ - IPT
932
+ - ▁MOSS
933
+ - ▁NASSA
934
+ - ▁HUG
935
+ - NADIA
936
+ - JUB
937
+ - HANKS
938
+ - ▁GRACE
939
+ - EATING
940
+ - ARDIAN
941
+ - ▁WISNU
942
+ - ▁ANGKAT
943
+ - ▁KOME
944
+ - NCER
945
+ - BIP
946
+ - SLIM
947
+ - ▁HYE
948
+ - USSE
949
+ - RENCE
950
+ - LOPE
951
+ - AKAMA
952
+ - SAHANA
953
+ - ▁INTERNET
954
+ - ▁MUKTI
955
+ - UTS
956
+ - ▁TERE
957
+ - ▁POP
958
+ - ���MULAN
959
+ - ▁BUNGA
960
+ - ▁USAHA
961
+ - BRUG
962
+ - ▁SCR
963
+ - ▁WATSON
964
+ - ▁SLAV
965
+ - PLAY
966
+ - ▁RIYAD
967
+ - ▁FELT
968
+ - RAINI
969
+ - ▁MUCH
970
+ - AMUNGK
971
+ - ▁BANK
972
+ - ▁DUNYA
973
+ - ▁FALS
974
+ - BET
975
+ - MUSU
976
+ - ▁BLOOM
977
+ - ▁HIGH
978
+ - ▁LILIS
979
+ - ▁KOLO
980
+ - ▁BRUNO
981
+ - ▁AJI
982
+ - COCK
983
+ - ▁PRIM
984
+ - ▁UNTUNG
985
+ - ▁STAT
986
+ - ▁HILL
987
+ - ▁ROBIN
988
+ - ▁GRAVE
989
+ - ▁MORRIS
990
+ - RAJAT
991
+ - ▁GEORGE
992
+ - ▁UTAMI
993
+ - ▁FORD
994
+ - ▁PISAN
995
+ - ▁JULI
996
+ - ROACH
997
+ - HIK
998
+ - ▁SAKULIA
999
+ - ▁CAKRA
1000
+ - ▁SOLIHUN
1001
+ - RUMP
1002
+ - ▁NANI
1003
+ - CULES
1004
+ - HINI
1005
+ - ▁HYU
1006
+ - ▁GEORGI
1007
+ - ▁PUTRA
1008
+ - ▁JEONG
1009
+ - VITA
1010
+ - ▁REST
1011
+ - ▁PEGG
1012
+ - LUNT
1013
+ - ONALD
1014
+ - ▁BEAT
1015
+ - ICHO
1016
+ - AVEN
1017
+ - ▁SARDI
1018
+ - OLEH
1019
+ - PUTIN
1020
+ - TIANA
1021
+ - ▁CUCU
1022
+ - HARGA
1023
+ - PUSPA
1024
+ - ▁CROW
1025
+ - ▁ISLAM
1026
+ - ▁PERMAN
1027
+ - ▁NUNU
1028
+ - ▁BUBBLE
1029
+ - ▁SUKSES
1030
+ - ▁SUGAND
1031
+ - BAGJA
1032
+ - LESTI
1033
+ - IFFE
1034
+ - PHAR
1035
+ - ▁APRIL
1036
+ - ▁AGAT
1037
+ - ▁ARCH
1038
+ - ▁SHEE
1039
+ - ▁GILL
1040
+ - ▁COFF
1041
+ - STISI
1042
+ - ▁ENDANG
1043
+ - INDRO
1044
+ - OBAN
1045
+ - GALUNG
1046
+ - PPIE
1047
+ - ▁PETE
1048
+ - ▁BAREN
1049
+ - BOURNE
1050
+ - LESIA
1051
+ - MAIL
1052
+ - ▁PRINCE
1053
+ - ▁LANGIT
1054
+ - SWOR
1055
+ - SEBAT
1056
+ - TISS
1057
+ - UWAI
1058
+ - ▁WEI
1059
+ - NIGHT
1060
+ - SADEW
1061
+ - DALE
1062
+ - AMBO
1063
+ - IGG
1064
+ - AGASKAR
1065
+ - ▁HEATH
1066
+ - RESNA
1067
+ - HALLE
1068
+ - AMIT
1069
+ - ▁BRANCH
1070
+ - AKOTA
1071
+ - ▁BARB
1072
+ - ▁CHEMI
1073
+ - ▁PRIATNA
1074
+ - '0'
1075
+ - ▁COBA
1076
+ - ▁ESPE
1077
+ - ITJE
1078
+ - WULAN
1079
+ - ▁GUGUM
1080
+ - NSIL
1081
+ - UNGSU
1082
+ - ▁BLUE
1083
+ - ▁ASEP
1084
+ - TILES
1085
+ - UCI
1086
+ - ITEPU
1087
+ - ▁PROJECT
1088
+ - PPOL
1089
+ - Í
1090
+ - '1'
1091
+ - '"'
1092
+ - '6'
1093
+ - '2'
1094
+ - '3'
1095
+ - '8'
1096
+ - ''''
1097
+ - '9'
1098
+ - '7'
1099
+ - '4'
1100
+ - '!'
1101
+ - È
1102
+ - ','
1103
+ - ;
1104
+ - '&'
1105
+ - Ä
1106
+ - Ñ
1107
+ - Ō
1108
+ - <sos/eos>
1109
+ init: chainer
1110
+ input_size: null
1111
+ ctc_conf:
1112
+ dropout_rate: 0.0
1113
+ ctc_type: builtin
1114
+ reduce: true
1115
+ ignore_nan_grad: true
1116
+ model_conf:
1117
+ ctc_weight: 0.3
1118
+ lsm_weight: 0.1
1119
+ length_normalized_loss: false
1120
+ use_preprocessor: true
1121
+ token_type: bpe
1122
+ bpemodel: data/token_list/bpe_unigram1000/bpe.model
1123
+ non_linguistic_symbols: null
1124
+ cleaner: null
1125
+ g2p: null
1126
+ speech_volume_normalize: null
1127
+ rir_scp: null
1128
+ rir_apply_prob: 1.0
1129
+ noise_scp: null
1130
+ noise_apply_prob: 1.0
1131
+ noise_db_range: '13_15'
1132
+ frontend: default
1133
+ frontend_conf:
1134
+ fs: 16k
1135
+ specaug: null
1136
+ specaug_conf: {}
1137
+ normalize: global_mvn
1138
+ normalize_conf:
1139
+ stats_file: exp/asr_stats_raw_bpe1000/train/feats_stats.npz
1140
+ preencoder: null
1141
+ preencoder_conf: {}
1142
+ encoder: transformer
1143
+ encoder_conf:
1144
+ input_layer: conv2d
1145
+ num_blocks: 12
1146
+ linear_units: 2048
1147
+ dropout_rate: 0.1
1148
+ output_size: 256
1149
+ attention_heads: 4
1150
+ attention_dropout_rate: 0.0
1151
+ decoder: transformer
1152
+ decoder_conf:
1153
+ input_layer: embed
1154
+ num_blocks: 6
1155
+ linear_units: 2048
1156
+ dropout_rate: 0.1
1157
+ required:
1158
+ - output_dir
1159
+ - token_list
1160
+ version: 0.9.10
1161
+ distributed: true
exp/asr_train_asr_raw_bpe1000/images/acc.png ADDED
exp/asr_train_asr_raw_bpe1000/images/backward_time.png ADDED
exp/asr_train_asr_raw_bpe1000/images/cer.png ADDED
exp/asr_train_asr_raw_bpe1000/images/cer_ctc.png ADDED
exp/asr_train_asr_raw_bpe1000/images/forward_time.png ADDED
exp/asr_train_asr_raw_bpe1000/images/gpu_max_cached_mem_GB.png ADDED
exp/asr_train_asr_raw_bpe1000/images/iter_time.png ADDED
exp/asr_train_asr_raw_bpe1000/images/loss.png ADDED
exp/asr_train_asr_raw_bpe1000/images/loss_att.png ADDED
exp/asr_train_asr_raw_bpe1000/images/loss_ctc.png ADDED
exp/asr_train_asr_raw_bpe1000/images/optim0_lr0.png ADDED
exp/asr_train_asr_raw_bpe1000/images/optim_step_time.png ADDED
exp/asr_train_asr_raw_bpe1000/images/train_time.png ADDED
exp/asr_train_asr_raw_bpe1000/images/wer.png ADDED
meta.yaml ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ espnet: 0.10.0
2
+ files:
3
+ asr_model_file: exp/asr_train_asr_raw_bpe1000/196epoch.pth
4
+ python: "3.8.5 (default, Sep 4 2020, 07:30:14) \n[GCC 7.3.0]"
5
+ timestamp: 1625888611.903976
6
+ torch: 1.8.1+cu102
7
+ yaml_files:
8
+ asr_train_config: exp/asr_train_asr_raw_bpe1000/config.yaml