ylacombe HF staff commited on
Commit
83c15ca
1 Parent(s): b8f2737

Upload 2 files

Browse files
Files changed (2) hide show
  1. checkpoint.pth +3 -0
  2. config.json +293 -0
checkpoint.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:48e3ff3fd0b5348e095f0468e60ae727507564100f58142ef3a922ead6e0a4d0
3
+ size 207860748
config.json ADDED
@@ -0,0 +1,293 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "train": {
3
+ "segment_size": 16384
4
+ },
5
+ "data": {
6
+ "sampling_rate": 44100,
7
+ "filter_length": 2048,
8
+ "hop_length": 512,
9
+ "add_blank": true,
10
+ "n_speakers": 256,
11
+ "spk2id": {
12
+ "KR": 0
13
+ }
14
+ },
15
+ "model": {
16
+ "use_spk_conditioned_encoder": true,
17
+ "use_noise_scaled_mas": true,
18
+ "use_mel_posterior_encoder": false,
19
+ "use_duration_discriminator": true,
20
+ "inter_channels": 192,
21
+ "hidden_channels": 192,
22
+ "filter_channels": 768,
23
+ "n_heads": 2,
24
+ "n_layers": 6,
25
+ "n_layers_trans_flow": 3,
26
+ "kernel_size": 3,
27
+ "p_dropout": 0.1,
28
+ "resblock": "1",
29
+ "resblock_kernel_sizes": [
30
+ 3,
31
+ 7,
32
+ 11
33
+ ],
34
+ "resblock_dilation_sizes": [
35
+ [
36
+ 1,
37
+ 3,
38
+ 5
39
+ ],
40
+ [
41
+ 1,
42
+ 3,
43
+ 5
44
+ ],
45
+ [
46
+ 1,
47
+ 3,
48
+ 5
49
+ ]
50
+ ],
51
+ "upsample_rates": [
52
+ 8,
53
+ 8,
54
+ 2,
55
+ 2,
56
+ 2
57
+ ],
58
+ "upsample_initial_channel": 512,
59
+ "upsample_kernel_sizes": [
60
+ 16,
61
+ 16,
62
+ 8,
63
+ 2,
64
+ 2
65
+ ],
66
+ "n_layers_q": 3,
67
+ "use_spectral_norm": false,
68
+ "gin_channels": 256
69
+ },
70
+ "symbols": [
71
+ "_",
72
+ "\"",
73
+ "(",
74
+ ")",
75
+ "*",
76
+ "/",
77
+ ":",
78
+ "AA",
79
+ "E",
80
+ "EE",
81
+ "En",
82
+ "N",
83
+ "OO",
84
+ "Q",
85
+ "V",
86
+ "[",
87
+ "\\",
88
+ "]",
89
+ "^",
90
+ "a",
91
+ "a:",
92
+ "aa",
93
+ "ae",
94
+ "ah",
95
+ "ai",
96
+ "an",
97
+ "ang",
98
+ "ao",
99
+ "aw",
100
+ "ay",
101
+ "b",
102
+ "by",
103
+ "c",
104
+ "ch",
105
+ "d",
106
+ "dh",
107
+ "dy",
108
+ "e",
109
+ "e:",
110
+ "eh",
111
+ "ei",
112
+ "en",
113
+ "eng",
114
+ "er",
115
+ "ey",
116
+ "f",
117
+ "g",
118
+ "gy",
119
+ "h",
120
+ "hh",
121
+ "hy",
122
+ "i",
123
+ "i0",
124
+ "i:",
125
+ "ia",
126
+ "ian",
127
+ "iang",
128
+ "iao",
129
+ "ie",
130
+ "ih",
131
+ "in",
132
+ "ing",
133
+ "iong",
134
+ "ir",
135
+ "iu",
136
+ "iy",
137
+ "j",
138
+ "jh",
139
+ "k",
140
+ "ky",
141
+ "l",
142
+ "m",
143
+ "my",
144
+ "n",
145
+ "ng",
146
+ "ny",
147
+ "o",
148
+ "o:",
149
+ "ong",
150
+ "ou",
151
+ "ow",
152
+ "oy",
153
+ "p",
154
+ "py",
155
+ "q",
156
+ "r",
157
+ "ry",
158
+ "s",
159
+ "sh",
160
+ "t",
161
+ "th",
162
+ "ts",
163
+ "ty",
164
+ "u",
165
+ "u:",
166
+ "ua",
167
+ "uai",
168
+ "uan",
169
+ "uang",
170
+ "uh",
171
+ "ui",
172
+ "un",
173
+ "uo",
174
+ "uw",
175
+ "v",
176
+ "van",
177
+ "ve",
178
+ "vn",
179
+ "w",
180
+ "x",
181
+ "y",
182
+ "z",
183
+ "zh",
184
+ "zy",
185
+ "~",
186
+ "¡",
187
+ "¿",
188
+ "æ",
189
+ "ç",
190
+ "ð",
191
+ "ø",
192
+ "ŋ",
193
+ "œ",
194
+ "ɐ",
195
+ "ɑ",
196
+ "ɒ",
197
+ "ɔ",
198
+ "ɕ",
199
+ "ə",
200
+ "ɛ",
201
+ "ɜ",
202
+ "ɡ",
203
+ "ɣ",
204
+ "ɥ",
205
+ "ɦ",
206
+ "ɪ",
207
+ "ɫ",
208
+ "ɬ",
209
+ "ɭ",
210
+ "ɯ",
211
+ "ɲ",
212
+ "ɵ",
213
+ "ɸ",
214
+ "ɹ",
215
+ "ɾ",
216
+ "ʁ",
217
+ "ʃ",
218
+ "ʊ",
219
+ "ʌ",
220
+ "ʎ",
221
+ "ʏ",
222
+ "ʑ",
223
+ "ʒ",
224
+ "ʝ",
225
+ "ʲ",
226
+ "ˈ",
227
+ "ˌ",
228
+ "ː",
229
+ "̃",
230
+ "̩",
231
+ "β",
232
+ "θ",
233
+ "ᄀ",
234
+ "ᄁ",
235
+ "ᄂ",
236
+ "ᄃ",
237
+ "ᄄ",
238
+ "ᄅ",
239
+ "ᄆ",
240
+ "ᄇ",
241
+ "ᄈ",
242
+ "ᄉ",
243
+ "ᄊ",
244
+ "ᄋ",
245
+ "ᄌ",
246
+ "ᄍ",
247
+ "ᄎ",
248
+ "ᄏ",
249
+ "ᄐ",
250
+ "ᄑ",
251
+ "ᄒ",
252
+ "ᅡ",
253
+ "ᅢ",
254
+ "ᅣ",
255
+ "ᅤ",
256
+ "ᅥ",
257
+ "ᅦ",
258
+ "ᅧ",
259
+ "ᅨ",
260
+ "ᅩ",
261
+ "ᅪ",
262
+ "ᅫ",
263
+ "ᅬ",
264
+ "ᅭ",
265
+ "ᅮ",
266
+ "ᅯ",
267
+ "ᅰ",
268
+ "ᅱ",
269
+ "ᅲ",
270
+ "ᅳ",
271
+ "ᅴ",
272
+ "ᅵ",
273
+ "ᆨ",
274
+ "ᆫ",
275
+ "ᆮ",
276
+ "ᆯ",
277
+ "ᆷ",
278
+ "ᆸ",
279
+ "ᆼ",
280
+ "ㄸ",
281
+ "!",
282
+ "?",
283
+ "…",
284
+ ",",
285
+ ".",
286
+ "'",
287
+ "-",
288
+ "SP",
289
+ "UNK"
290
+ ],
291
+ "num_tones": 16,
292
+ "num_languages": 10
293
+ }