nielsr HF staff commited on
Commit
6896b7a
1 Parent(s): ae7cd71

Upload processor

Browse files
preprocessor_config.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "apply_ocr": true,
3
+ "do_normalize": true,
4
+ "do_rescale": true,
5
+ "do_resize": true,
6
+ "image_mean": [
7
+ 0.485,
8
+ 0.456,
9
+ 0.406
10
+ ],
11
+ "image_processor_type": "UdopImageProcessor",
12
+ "image_std": [
13
+ 0.229,
14
+ 0.224,
15
+ 0.225
16
+ ],
17
+ "ocr_lang": null,
18
+ "processor_class": "UdopProcessor",
19
+ "resample": 2,
20
+ "rescale_factor": 0.00392156862745098,
21
+ "size": {
22
+ "height": 224,
23
+ "width": 224
24
+ },
25
+ "tesseract_config": ""
26
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,1208 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "additional_special_tokens": [
3
+ "<extra_id_0>",
4
+ "<extra_id_1>",
5
+ "<extra_id_2>",
6
+ "<extra_id_3>",
7
+ "<extra_id_4>",
8
+ "<extra_id_5>",
9
+ "<extra_id_6>",
10
+ "<extra_id_7>",
11
+ "<extra_id_8>",
12
+ "<extra_id_9>",
13
+ "<extra_id_10>",
14
+ "<extra_id_11>",
15
+ "<extra_id_12>",
16
+ "<extra_id_13>",
17
+ "<extra_id_14>",
18
+ "<extra_id_15>",
19
+ "<extra_id_16>",
20
+ "<extra_id_17>",
21
+ "<extra_id_18>",
22
+ "<extra_id_19>",
23
+ "<extra_id_20>",
24
+ "<extra_id_21>",
25
+ "<extra_id_22>",
26
+ "<extra_id_23>",
27
+ "<extra_id_24>",
28
+ "<extra_id_25>",
29
+ "<extra_id_26>",
30
+ "<extra_id_27>",
31
+ "<extra_id_28>",
32
+ "<extra_id_29>",
33
+ "<extra_id_30>",
34
+ "<extra_id_31>",
35
+ "<extra_id_32>",
36
+ "<extra_id_33>",
37
+ "<extra_id_34>",
38
+ "<extra_id_35>",
39
+ "<extra_id_36>",
40
+ "<extra_id_37>",
41
+ "<extra_id_38>",
42
+ "<extra_id_39>",
43
+ "<extra_id_40>",
44
+ "<extra_id_41>",
45
+ "<extra_id_42>",
46
+ "<extra_id_43>",
47
+ "<extra_id_44>",
48
+ "<extra_id_45>",
49
+ "<extra_id_46>",
50
+ "<extra_id_47>",
51
+ "<extra_id_48>",
52
+ "<extra_id_49>",
53
+ "<extra_id_50>",
54
+ "<extra_id_51>",
55
+ "<extra_id_52>",
56
+ "<extra_id_53>",
57
+ "<extra_id_54>",
58
+ "<extra_id_55>",
59
+ "<extra_id_56>",
60
+ "<extra_id_57>",
61
+ "<extra_id_58>",
62
+ "<extra_id_59>",
63
+ "<extra_id_60>",
64
+ "<extra_id_61>",
65
+ "<extra_id_62>",
66
+ "<extra_id_63>",
67
+ "<extra_id_64>",
68
+ "<extra_id_65>",
69
+ "<extra_id_66>",
70
+ "<extra_id_67>",
71
+ "<extra_id_68>",
72
+ "<extra_id_69>",
73
+ "<extra_id_70>",
74
+ "<extra_id_71>",
75
+ "<extra_id_72>",
76
+ "<extra_id_73>",
77
+ "<extra_id_74>",
78
+ "<extra_id_75>",
79
+ "<extra_id_76>",
80
+ "<extra_id_77>",
81
+ "<extra_id_78>",
82
+ "<extra_id_79>",
83
+ "<extra_id_80>",
84
+ "<extra_id_81>",
85
+ "<extra_id_82>",
86
+ "<extra_id_83>",
87
+ "<extra_id_84>",
88
+ "<extra_id_85>",
89
+ "<extra_id_86>",
90
+ "<extra_id_87>",
91
+ "<extra_id_88>",
92
+ "<extra_id_89>",
93
+ "<extra_id_90>",
94
+ "<extra_id_91>",
95
+ "<extra_id_92>",
96
+ "<extra_id_93>",
97
+ "<extra_id_94>",
98
+ "<extra_id_95>",
99
+ "<extra_id_96>",
100
+ "<extra_id_97>",
101
+ "<extra_id_98>",
102
+ "<extra_id_99>",
103
+ "<extra_l_id_0>",
104
+ "<extra_l_id_1>",
105
+ "<extra_l_id_2>",
106
+ "<extra_l_id_3>",
107
+ "<extra_l_id_4>",
108
+ "<extra_l_id_5>",
109
+ "<extra_l_id_6>",
110
+ "<extra_l_id_7>",
111
+ "<extra_l_id_8>",
112
+ "<extra_l_id_9>",
113
+ "<extra_l_id_10>",
114
+ "<extra_l_id_11>",
115
+ "<extra_l_id_12>",
116
+ "<extra_l_id_13>",
117
+ "<extra_l_id_14>",
118
+ "<extra_l_id_15>",
119
+ "<extra_l_id_16>",
120
+ "<extra_l_id_17>",
121
+ "<extra_l_id_18>",
122
+ "<extra_l_id_19>",
123
+ "<extra_l_id_20>",
124
+ "<extra_l_id_21>",
125
+ "<extra_l_id_22>",
126
+ "<extra_l_id_23>",
127
+ "<extra_l_id_24>",
128
+ "<extra_l_id_25>",
129
+ "<extra_l_id_26>",
130
+ "<extra_l_id_27>",
131
+ "<extra_l_id_28>",
132
+ "<extra_l_id_29>",
133
+ "<extra_l_id_30>",
134
+ "<extra_l_id_31>",
135
+ "<extra_l_id_32>",
136
+ "<extra_l_id_33>",
137
+ "<extra_l_id_34>",
138
+ "<extra_l_id_35>",
139
+ "<extra_l_id_36>",
140
+ "<extra_l_id_37>",
141
+ "<extra_l_id_38>",
142
+ "<extra_l_id_39>",
143
+ "<extra_l_id_40>",
144
+ "<extra_l_id_41>",
145
+ "<extra_l_id_42>",
146
+ "<extra_l_id_43>",
147
+ "<extra_l_id_44>",
148
+ "<extra_l_id_45>",
149
+ "<extra_l_id_46>",
150
+ "<extra_l_id_47>",
151
+ "<extra_l_id_48>",
152
+ "<extra_l_id_49>",
153
+ "<extra_l_id_50>",
154
+ "<extra_l_id_51>",
155
+ "<extra_l_id_52>",
156
+ "<extra_l_id_53>",
157
+ "<extra_l_id_54>",
158
+ "<extra_l_id_55>",
159
+ "<extra_l_id_56>",
160
+ "<extra_l_id_57>",
161
+ "<extra_l_id_58>",
162
+ "<extra_l_id_59>",
163
+ "<extra_l_id_60>",
164
+ "<extra_l_id_61>",
165
+ "<extra_l_id_62>",
166
+ "<extra_l_id_63>",
167
+ "<extra_l_id_64>",
168
+ "<extra_l_id_65>",
169
+ "<extra_l_id_66>",
170
+ "<extra_l_id_67>",
171
+ "<extra_l_id_68>",
172
+ "<extra_l_id_69>",
173
+ "<extra_l_id_70>",
174
+ "<extra_l_id_71>",
175
+ "<extra_l_id_72>",
176
+ "<extra_l_id_73>",
177
+ "<extra_l_id_74>",
178
+ "<extra_l_id_75>",
179
+ "<extra_l_id_76>",
180
+ "<extra_l_id_77>",
181
+ "<extra_l_id_78>",
182
+ "<extra_l_id_79>",
183
+ "<extra_l_id_80>",
184
+ "<extra_l_id_81>",
185
+ "<extra_l_id_82>",
186
+ "<extra_l_id_83>",
187
+ "<extra_l_id_84>",
188
+ "<extra_l_id_85>",
189
+ "<extra_l_id_86>",
190
+ "<extra_l_id_87>",
191
+ "<extra_l_id_88>",
192
+ "<extra_l_id_89>",
193
+ "<extra_l_id_90>",
194
+ "<extra_l_id_91>",
195
+ "<extra_l_id_92>",
196
+ "<extra_l_id_93>",
197
+ "<extra_l_id_94>",
198
+ "<extra_l_id_95>",
199
+ "<extra_l_id_96>",
200
+ "<extra_l_id_97>",
201
+ "<extra_l_id_98>",
202
+ "<extra_l_id_99>",
203
+ "</extra_l_id_0>",
204
+ "</extra_l_id_1>",
205
+ "</extra_l_id_2>",
206
+ "</extra_l_id_3>",
207
+ "</extra_l_id_4>",
208
+ "</extra_l_id_5>",
209
+ "</extra_l_id_6>",
210
+ "</extra_l_id_7>",
211
+ "</extra_l_id_8>",
212
+ "</extra_l_id_9>",
213
+ "</extra_l_id_10>",
214
+ "</extra_l_id_11>",
215
+ "</extra_l_id_12>",
216
+ "</extra_l_id_13>",
217
+ "</extra_l_id_14>",
218
+ "</extra_l_id_15>",
219
+ "</extra_l_id_16>",
220
+ "</extra_l_id_17>",
221
+ "</extra_l_id_18>",
222
+ "</extra_l_id_19>",
223
+ "</extra_l_id_20>",
224
+ "</extra_l_id_21>",
225
+ "</extra_l_id_22>",
226
+ "</extra_l_id_23>",
227
+ "</extra_l_id_24>",
228
+ "</extra_l_id_25>",
229
+ "</extra_l_id_26>",
230
+ "</extra_l_id_27>",
231
+ "</extra_l_id_28>",
232
+ "</extra_l_id_29>",
233
+ "</extra_l_id_30>",
234
+ "</extra_l_id_31>",
235
+ "</extra_l_id_32>",
236
+ "</extra_l_id_33>",
237
+ "</extra_l_id_34>",
238
+ "</extra_l_id_35>",
239
+ "</extra_l_id_36>",
240
+ "</extra_l_id_37>",
241
+ "</extra_l_id_38>",
242
+ "</extra_l_id_39>",
243
+ "</extra_l_id_40>",
244
+ "</extra_l_id_41>",
245
+ "</extra_l_id_42>",
246
+ "</extra_l_id_43>",
247
+ "</extra_l_id_44>",
248
+ "</extra_l_id_45>",
249
+ "</extra_l_id_46>",
250
+ "</extra_l_id_47>",
251
+ "</extra_l_id_48>",
252
+ "</extra_l_id_49>",
253
+ "</extra_l_id_50>",
254
+ "</extra_l_id_51>",
255
+ "</extra_l_id_52>",
256
+ "</extra_l_id_53>",
257
+ "</extra_l_id_54>",
258
+ "</extra_l_id_55>",
259
+ "</extra_l_id_56>",
260
+ "</extra_l_id_57>",
261
+ "</extra_l_id_58>",
262
+ "</extra_l_id_59>",
263
+ "</extra_l_id_60>",
264
+ "</extra_l_id_61>",
265
+ "</extra_l_id_62>",
266
+ "</extra_l_id_63>",
267
+ "</extra_l_id_64>",
268
+ "</extra_l_id_65>",
269
+ "</extra_l_id_66>",
270
+ "</extra_l_id_67>",
271
+ "</extra_l_id_68>",
272
+ "</extra_l_id_69>",
273
+ "</extra_l_id_70>",
274
+ "</extra_l_id_71>",
275
+ "</extra_l_id_72>",
276
+ "</extra_l_id_73>",
277
+ "</extra_l_id_74>",
278
+ "</extra_l_id_75>",
279
+ "</extra_l_id_76>",
280
+ "</extra_l_id_77>",
281
+ "</extra_l_id_78>",
282
+ "</extra_l_id_79>",
283
+ "</extra_l_id_80>",
284
+ "</extra_l_id_81>",
285
+ "</extra_l_id_82>",
286
+ "</extra_l_id_83>",
287
+ "</extra_l_id_84>",
288
+ "</extra_l_id_85>",
289
+ "</extra_l_id_86>",
290
+ "</extra_l_id_87>",
291
+ "</extra_l_id_88>",
292
+ "</extra_l_id_89>",
293
+ "</extra_l_id_90>",
294
+ "</extra_l_id_91>",
295
+ "</extra_l_id_92>",
296
+ "</extra_l_id_93>",
297
+ "</extra_l_id_94>",
298
+ "</extra_l_id_95>",
299
+ "</extra_l_id_96>",
300
+ "</extra_l_id_97>",
301
+ "</extra_l_id_98>",
302
+ "</extra_l_id_99>",
303
+ "<extra_t_id_0>",
304
+ "<extra_t_id_1>",
305
+ "<extra_t_id_2>",
306
+ "<extra_t_id_3>",
307
+ "<extra_t_id_4>",
308
+ "<extra_t_id_5>",
309
+ "<extra_t_id_6>",
310
+ "<extra_t_id_7>",
311
+ "<extra_t_id_8>",
312
+ "<extra_t_id_9>",
313
+ "<extra_t_id_10>",
314
+ "<extra_t_id_11>",
315
+ "<extra_t_id_12>",
316
+ "<extra_t_id_13>",
317
+ "<extra_t_id_14>",
318
+ "<extra_t_id_15>",
319
+ "<extra_t_id_16>",
320
+ "<extra_t_id_17>",
321
+ "<extra_t_id_18>",
322
+ "<extra_t_id_19>",
323
+ "<extra_t_id_20>",
324
+ "<extra_t_id_21>",
325
+ "<extra_t_id_22>",
326
+ "<extra_t_id_23>",
327
+ "<extra_t_id_24>",
328
+ "<extra_t_id_25>",
329
+ "<extra_t_id_26>",
330
+ "<extra_t_id_27>",
331
+ "<extra_t_id_28>",
332
+ "<extra_t_id_29>",
333
+ "<extra_t_id_30>",
334
+ "<extra_t_id_31>",
335
+ "<extra_t_id_32>",
336
+ "<extra_t_id_33>",
337
+ "<extra_t_id_34>",
338
+ "<extra_t_id_35>",
339
+ "<extra_t_id_36>",
340
+ "<extra_t_id_37>",
341
+ "<extra_t_id_38>",
342
+ "<extra_t_id_39>",
343
+ "<extra_t_id_40>",
344
+ "<extra_t_id_41>",
345
+ "<extra_t_id_42>",
346
+ "<extra_t_id_43>",
347
+ "<extra_t_id_44>",
348
+ "<extra_t_id_45>",
349
+ "<extra_t_id_46>",
350
+ "<extra_t_id_47>",
351
+ "<extra_t_id_48>",
352
+ "<extra_t_id_49>",
353
+ "<extra_t_id_50>",
354
+ "<extra_t_id_51>",
355
+ "<extra_t_id_52>",
356
+ "<extra_t_id_53>",
357
+ "<extra_t_id_54>",
358
+ "<extra_t_id_55>",
359
+ "<extra_t_id_56>",
360
+ "<extra_t_id_57>",
361
+ "<extra_t_id_58>",
362
+ "<extra_t_id_59>",
363
+ "<extra_t_id_60>",
364
+ "<extra_t_id_61>",
365
+ "<extra_t_id_62>",
366
+ "<extra_t_id_63>",
367
+ "<extra_t_id_64>",
368
+ "<extra_t_id_65>",
369
+ "<extra_t_id_66>",
370
+ "<extra_t_id_67>",
371
+ "<extra_t_id_68>",
372
+ "<extra_t_id_69>",
373
+ "<extra_t_id_70>",
374
+ "<extra_t_id_71>",
375
+ "<extra_t_id_72>",
376
+ "<extra_t_id_73>",
377
+ "<extra_t_id_74>",
378
+ "<extra_t_id_75>",
379
+ "<extra_t_id_76>",
380
+ "<extra_t_id_77>",
381
+ "<extra_t_id_78>",
382
+ "<extra_t_id_79>",
383
+ "<extra_t_id_80>",
384
+ "<extra_t_id_81>",
385
+ "<extra_t_id_82>",
386
+ "<extra_t_id_83>",
387
+ "<extra_t_id_84>",
388
+ "<extra_t_id_85>",
389
+ "<extra_t_id_86>",
390
+ "<extra_t_id_87>",
391
+ "<extra_t_id_88>",
392
+ "<extra_t_id_89>",
393
+ "<extra_t_id_90>",
394
+ "<extra_t_id_91>",
395
+ "<extra_t_id_92>",
396
+ "<extra_t_id_93>",
397
+ "<extra_t_id_94>",
398
+ "<extra_t_id_95>",
399
+ "<extra_t_id_96>",
400
+ "<extra_t_id_97>",
401
+ "<extra_t_id_98>",
402
+ "<extra_t_id_99>",
403
+ "</extra_t_id_0>",
404
+ "</extra_t_id_1>",
405
+ "</extra_t_id_2>",
406
+ "</extra_t_id_3>",
407
+ "</extra_t_id_4>",
408
+ "</extra_t_id_5>",
409
+ "</extra_t_id_6>",
410
+ "</extra_t_id_7>",
411
+ "</extra_t_id_8>",
412
+ "</extra_t_id_9>",
413
+ "</extra_t_id_10>",
414
+ "</extra_t_id_11>",
415
+ "</extra_t_id_12>",
416
+ "</extra_t_id_13>",
417
+ "</extra_t_id_14>",
418
+ "</extra_t_id_15>",
419
+ "</extra_t_id_16>",
420
+ "</extra_t_id_17>",
421
+ "</extra_t_id_18>",
422
+ "</extra_t_id_19>",
423
+ "</extra_t_id_20>",
424
+ "</extra_t_id_21>",
425
+ "</extra_t_id_22>",
426
+ "</extra_t_id_23>",
427
+ "</extra_t_id_24>",
428
+ "</extra_t_id_25>",
429
+ "</extra_t_id_26>",
430
+ "</extra_t_id_27>",
431
+ "</extra_t_id_28>",
432
+ "</extra_t_id_29>",
433
+ "</extra_t_id_30>",
434
+ "</extra_t_id_31>",
435
+ "</extra_t_id_32>",
436
+ "</extra_t_id_33>",
437
+ "</extra_t_id_34>",
438
+ "</extra_t_id_35>",
439
+ "</extra_t_id_36>",
440
+ "</extra_t_id_37>",
441
+ "</extra_t_id_38>",
442
+ "</extra_t_id_39>",
443
+ "</extra_t_id_40>",
444
+ "</extra_t_id_41>",
445
+ "</extra_t_id_42>",
446
+ "</extra_t_id_43>",
447
+ "</extra_t_id_44>",
448
+ "</extra_t_id_45>",
449
+ "</extra_t_id_46>",
450
+ "</extra_t_id_47>",
451
+ "</extra_t_id_48>",
452
+ "</extra_t_id_49>",
453
+ "</extra_t_id_50>",
454
+ "</extra_t_id_51>",
455
+ "</extra_t_id_52>",
456
+ "</extra_t_id_53>",
457
+ "</extra_t_id_54>",
458
+ "</extra_t_id_55>",
459
+ "</extra_t_id_56>",
460
+ "</extra_t_id_57>",
461
+ "</extra_t_id_58>",
462
+ "</extra_t_id_59>",
463
+ "</extra_t_id_60>",
464
+ "</extra_t_id_61>",
465
+ "</extra_t_id_62>",
466
+ "</extra_t_id_63>",
467
+ "</extra_t_id_64>",
468
+ "</extra_t_id_65>",
469
+ "</extra_t_id_66>",
470
+ "</extra_t_id_67>",
471
+ "</extra_t_id_68>",
472
+ "</extra_t_id_69>",
473
+ "</extra_t_id_70>",
474
+ "</extra_t_id_71>",
475
+ "</extra_t_id_72>",
476
+ "</extra_t_id_73>",
477
+ "</extra_t_id_74>",
478
+ "</extra_t_id_75>",
479
+ "</extra_t_id_76>",
480
+ "</extra_t_id_77>",
481
+ "</extra_t_id_78>",
482
+ "</extra_t_id_79>",
483
+ "</extra_t_id_80>",
484
+ "</extra_t_id_81>",
485
+ "</extra_t_id_82>",
486
+ "</extra_t_id_83>",
487
+ "</extra_t_id_84>",
488
+ "</extra_t_id_85>",
489
+ "</extra_t_id_86>",
490
+ "</extra_t_id_87>",
491
+ "</extra_t_id_88>",
492
+ "</extra_t_id_89>",
493
+ "</extra_t_id_90>",
494
+ "</extra_t_id_91>",
495
+ "</extra_t_id_92>",
496
+ "</extra_t_id_93>",
497
+ "</extra_t_id_94>",
498
+ "</extra_t_id_95>",
499
+ "</extra_t_id_96>",
500
+ "</extra_t_id_97>",
501
+ "</extra_t_id_98>",
502
+ "</extra_t_id_99>",
503
+ "<loc_0>",
504
+ "<loc_1>",
505
+ "<loc_2>",
506
+ "<loc_3>",
507
+ "<loc_4>",
508
+ "<loc_5>",
509
+ "<loc_6>",
510
+ "<loc_7>",
511
+ "<loc_8>",
512
+ "<loc_9>",
513
+ "<loc_10>",
514
+ "<loc_11>",
515
+ "<loc_12>",
516
+ "<loc_13>",
517
+ "<loc_14>",
518
+ "<loc_15>",
519
+ "<loc_16>",
520
+ "<loc_17>",
521
+ "<loc_18>",
522
+ "<loc_19>",
523
+ "<loc_20>",
524
+ "<loc_21>",
525
+ "<loc_22>",
526
+ "<loc_23>",
527
+ "<loc_24>",
528
+ "<loc_25>",
529
+ "<loc_26>",
530
+ "<loc_27>",
531
+ "<loc_28>",
532
+ "<loc_29>",
533
+ "<loc_30>",
534
+ "<loc_31>",
535
+ "<loc_32>",
536
+ "<loc_33>",
537
+ "<loc_34>",
538
+ "<loc_35>",
539
+ "<loc_36>",
540
+ "<loc_37>",
541
+ "<loc_38>",
542
+ "<loc_39>",
543
+ "<loc_40>",
544
+ "<loc_41>",
545
+ "<loc_42>",
546
+ "<loc_43>",
547
+ "<loc_44>",
548
+ "<loc_45>",
549
+ "<loc_46>",
550
+ "<loc_47>",
551
+ "<loc_48>",
552
+ "<loc_49>",
553
+ "<loc_50>",
554
+ "<loc_51>",
555
+ "<loc_52>",
556
+ "<loc_53>",
557
+ "<loc_54>",
558
+ "<loc_55>",
559
+ "<loc_56>",
560
+ "<loc_57>",
561
+ "<loc_58>",
562
+ "<loc_59>",
563
+ "<loc_60>",
564
+ "<loc_61>",
565
+ "<loc_62>",
566
+ "<loc_63>",
567
+ "<loc_64>",
568
+ "<loc_65>",
569
+ "<loc_66>",
570
+ "<loc_67>",
571
+ "<loc_68>",
572
+ "<loc_69>",
573
+ "<loc_70>",
574
+ "<loc_71>",
575
+ "<loc_72>",
576
+ "<loc_73>",
577
+ "<loc_74>",
578
+ "<loc_75>",
579
+ "<loc_76>",
580
+ "<loc_77>",
581
+ "<loc_78>",
582
+ "<loc_79>",
583
+ "<loc_80>",
584
+ "<loc_81>",
585
+ "<loc_82>",
586
+ "<loc_83>",
587
+ "<loc_84>",
588
+ "<loc_85>",
589
+ "<loc_86>",
590
+ "<loc_87>",
591
+ "<loc_88>",
592
+ "<loc_89>",
593
+ "<loc_90>",
594
+ "<loc_91>",
595
+ "<loc_92>",
596
+ "<loc_93>",
597
+ "<loc_94>",
598
+ "<loc_95>",
599
+ "<loc_96>",
600
+ "<loc_97>",
601
+ "<loc_98>",
602
+ "<loc_99>",
603
+ "<loc_100>",
604
+ "<loc_101>",
605
+ "<loc_102>",
606
+ "<loc_103>",
607
+ "<loc_104>",
608
+ "<loc_105>",
609
+ "<loc_106>",
610
+ "<loc_107>",
611
+ "<loc_108>",
612
+ "<loc_109>",
613
+ "<loc_110>",
614
+ "<loc_111>",
615
+ "<loc_112>",
616
+ "<loc_113>",
617
+ "<loc_114>",
618
+ "<loc_115>",
619
+ "<loc_116>",
620
+ "<loc_117>",
621
+ "<loc_118>",
622
+ "<loc_119>",
623
+ "<loc_120>",
624
+ "<loc_121>",
625
+ "<loc_122>",
626
+ "<loc_123>",
627
+ "<loc_124>",
628
+ "<loc_125>",
629
+ "<loc_126>",
630
+ "<loc_127>",
631
+ "<loc_128>",
632
+ "<loc_129>",
633
+ "<loc_130>",
634
+ "<loc_131>",
635
+ "<loc_132>",
636
+ "<loc_133>",
637
+ "<loc_134>",
638
+ "<loc_135>",
639
+ "<loc_136>",
640
+ "<loc_137>",
641
+ "<loc_138>",
642
+ "<loc_139>",
643
+ "<loc_140>",
644
+ "<loc_141>",
645
+ "<loc_142>",
646
+ "<loc_143>",
647
+ "<loc_144>",
648
+ "<loc_145>",
649
+ "<loc_146>",
650
+ "<loc_147>",
651
+ "<loc_148>",
652
+ "<loc_149>",
653
+ "<loc_150>",
654
+ "<loc_151>",
655
+ "<loc_152>",
656
+ "<loc_153>",
657
+ "<loc_154>",
658
+ "<loc_155>",
659
+ "<loc_156>",
660
+ "<loc_157>",
661
+ "<loc_158>",
662
+ "<loc_159>",
663
+ "<loc_160>",
664
+ "<loc_161>",
665
+ "<loc_162>",
666
+ "<loc_163>",
667
+ "<loc_164>",
668
+ "<loc_165>",
669
+ "<loc_166>",
670
+ "<loc_167>",
671
+ "<loc_168>",
672
+ "<loc_169>",
673
+ "<loc_170>",
674
+ "<loc_171>",
675
+ "<loc_172>",
676
+ "<loc_173>",
677
+ "<loc_174>",
678
+ "<loc_175>",
679
+ "<loc_176>",
680
+ "<loc_177>",
681
+ "<loc_178>",
682
+ "<loc_179>",
683
+ "<loc_180>",
684
+ "<loc_181>",
685
+ "<loc_182>",
686
+ "<loc_183>",
687
+ "<loc_184>",
688
+ "<loc_185>",
689
+ "<loc_186>",
690
+ "<loc_187>",
691
+ "<loc_188>",
692
+ "<loc_189>",
693
+ "<loc_190>",
694
+ "<loc_191>",
695
+ "<loc_192>",
696
+ "<loc_193>",
697
+ "<loc_194>",
698
+ "<loc_195>",
699
+ "<loc_196>",
700
+ "<loc_197>",
701
+ "<loc_198>",
702
+ "<loc_199>",
703
+ "<loc_200>",
704
+ "<loc_201>",
705
+ "<loc_202>",
706
+ "<loc_203>",
707
+ "<loc_204>",
708
+ "<loc_205>",
709
+ "<loc_206>",
710
+ "<loc_207>",
711
+ "<loc_208>",
712
+ "<loc_209>",
713
+ "<loc_210>",
714
+ "<loc_211>",
715
+ "<loc_212>",
716
+ "<loc_213>",
717
+ "<loc_214>",
718
+ "<loc_215>",
719
+ "<loc_216>",
720
+ "<loc_217>",
721
+ "<loc_218>",
722
+ "<loc_219>",
723
+ "<loc_220>",
724
+ "<loc_221>",
725
+ "<loc_222>",
726
+ "<loc_223>",
727
+ "<loc_224>",
728
+ "<loc_225>",
729
+ "<loc_226>",
730
+ "<loc_227>",
731
+ "<loc_228>",
732
+ "<loc_229>",
733
+ "<loc_230>",
734
+ "<loc_231>",
735
+ "<loc_232>",
736
+ "<loc_233>",
737
+ "<loc_234>",
738
+ "<loc_235>",
739
+ "<loc_236>",
740
+ "<loc_237>",
741
+ "<loc_238>",
742
+ "<loc_239>",
743
+ "<loc_240>",
744
+ "<loc_241>",
745
+ "<loc_242>",
746
+ "<loc_243>",
747
+ "<loc_244>",
748
+ "<loc_245>",
749
+ "<loc_246>",
750
+ "<loc_247>",
751
+ "<loc_248>",
752
+ "<loc_249>",
753
+ "<loc_250>",
754
+ "<loc_251>",
755
+ "<loc_252>",
756
+ "<loc_253>",
757
+ "<loc_254>",
758
+ "<loc_255>",
759
+ "<loc_256>",
760
+ "<loc_257>",
761
+ "<loc_258>",
762
+ "<loc_259>",
763
+ "<loc_260>",
764
+ "<loc_261>",
765
+ "<loc_262>",
766
+ "<loc_263>",
767
+ "<loc_264>",
768
+ "<loc_265>",
769
+ "<loc_266>",
770
+ "<loc_267>",
771
+ "<loc_268>",
772
+ "<loc_269>",
773
+ "<loc_270>",
774
+ "<loc_271>",
775
+ "<loc_272>",
776
+ "<loc_273>",
777
+ "<loc_274>",
778
+ "<loc_275>",
779
+ "<loc_276>",
780
+ "<loc_277>",
781
+ "<loc_278>",
782
+ "<loc_279>",
783
+ "<loc_280>",
784
+ "<loc_281>",
785
+ "<loc_282>",
786
+ "<loc_283>",
787
+ "<loc_284>",
788
+ "<loc_285>",
789
+ "<loc_286>",
790
+ "<loc_287>",
791
+ "<loc_288>",
792
+ "<loc_289>",
793
+ "<loc_290>",
794
+ "<loc_291>",
795
+ "<loc_292>",
796
+ "<loc_293>",
797
+ "<loc_294>",
798
+ "<loc_295>",
799
+ "<loc_296>",
800
+ "<loc_297>",
801
+ "<loc_298>",
802
+ "<loc_299>",
803
+ "<loc_300>",
804
+ "<loc_301>",
805
+ "<loc_302>",
806
+ "<loc_303>",
807
+ "<loc_304>",
808
+ "<loc_305>",
809
+ "<loc_306>",
810
+ "<loc_307>",
811
+ "<loc_308>",
812
+ "<loc_309>",
813
+ "<loc_310>",
814
+ "<loc_311>",
815
+ "<loc_312>",
816
+ "<loc_313>",
817
+ "<loc_314>",
818
+ "<loc_315>",
819
+ "<loc_316>",
820
+ "<loc_317>",
821
+ "<loc_318>",
822
+ "<loc_319>",
823
+ "<loc_320>",
824
+ "<loc_321>",
825
+ "<loc_322>",
826
+ "<loc_323>",
827
+ "<loc_324>",
828
+ "<loc_325>",
829
+ "<loc_326>",
830
+ "<loc_327>",
831
+ "<loc_328>",
832
+ "<loc_329>",
833
+ "<loc_330>",
834
+ "<loc_331>",
835
+ "<loc_332>",
836
+ "<loc_333>",
837
+ "<loc_334>",
838
+ "<loc_335>",
839
+ "<loc_336>",
840
+ "<loc_337>",
841
+ "<loc_338>",
842
+ "<loc_339>",
843
+ "<loc_340>",
844
+ "<loc_341>",
845
+ "<loc_342>",
846
+ "<loc_343>",
847
+ "<loc_344>",
848
+ "<loc_345>",
849
+ "<loc_346>",
850
+ "<loc_347>",
851
+ "<loc_348>",
852
+ "<loc_349>",
853
+ "<loc_350>",
854
+ "<loc_351>",
855
+ "<loc_352>",
856
+ "<loc_353>",
857
+ "<loc_354>",
858
+ "<loc_355>",
859
+ "<loc_356>",
860
+ "<loc_357>",
861
+ "<loc_358>",
862
+ "<loc_359>",
863
+ "<loc_360>",
864
+ "<loc_361>",
865
+ "<loc_362>",
866
+ "<loc_363>",
867
+ "<loc_364>",
868
+ "<loc_365>",
869
+ "<loc_366>",
870
+ "<loc_367>",
871
+ "<loc_368>",
872
+ "<loc_369>",
873
+ "<loc_370>",
874
+ "<loc_371>",
875
+ "<loc_372>",
876
+ "<loc_373>",
877
+ "<loc_374>",
878
+ "<loc_375>",
879
+ "<loc_376>",
880
+ "<loc_377>",
881
+ "<loc_378>",
882
+ "<loc_379>",
883
+ "<loc_380>",
884
+ "<loc_381>",
885
+ "<loc_382>",
886
+ "<loc_383>",
887
+ "<loc_384>",
888
+ "<loc_385>",
889
+ "<loc_386>",
890
+ "<loc_387>",
891
+ "<loc_388>",
892
+ "<loc_389>",
893
+ "<loc_390>",
894
+ "<loc_391>",
895
+ "<loc_392>",
896
+ "<loc_393>",
897
+ "<loc_394>",
898
+ "<loc_395>",
899
+ "<loc_396>",
900
+ "<loc_397>",
901
+ "<loc_398>",
902
+ "<loc_399>",
903
+ "<loc_400>",
904
+ "<loc_401>",
905
+ "<loc_402>",
906
+ "<loc_403>",
907
+ "<loc_404>",
908
+ "<loc_405>",
909
+ "<loc_406>",
910
+ "<loc_407>",
911
+ "<loc_408>",
912
+ "<loc_409>",
913
+ "<loc_410>",
914
+ "<loc_411>",
915
+ "<loc_412>",
916
+ "<loc_413>",
917
+ "<loc_414>",
918
+ "<loc_415>",
919
+ "<loc_416>",
920
+ "<loc_417>",
921
+ "<loc_418>",
922
+ "<loc_419>",
923
+ "<loc_420>",
924
+ "<loc_421>",
925
+ "<loc_422>",
926
+ "<loc_423>",
927
+ "<loc_424>",
928
+ "<loc_425>",
929
+ "<loc_426>",
930
+ "<loc_427>",
931
+ "<loc_428>",
932
+ "<loc_429>",
933
+ "<loc_430>",
934
+ "<loc_431>",
935
+ "<loc_432>",
936
+ "<loc_433>",
937
+ "<loc_434>",
938
+ "<loc_435>",
939
+ "<loc_436>",
940
+ "<loc_437>",
941
+ "<loc_438>",
942
+ "<loc_439>",
943
+ "<loc_440>",
944
+ "<loc_441>",
945
+ "<loc_442>",
946
+ "<loc_443>",
947
+ "<loc_444>",
948
+ "<loc_445>",
949
+ "<loc_446>",
950
+ "<loc_447>",
951
+ "<loc_448>",
952
+ "<loc_449>",
953
+ "<loc_450>",
954
+ "<loc_451>",
955
+ "<loc_452>",
956
+ "<loc_453>",
957
+ "<loc_454>",
958
+ "<loc_455>",
959
+ "<loc_456>",
960
+ "<loc_457>",
961
+ "<loc_458>",
962
+ "<loc_459>",
963
+ "<loc_460>",
964
+ "<loc_461>",
965
+ "<loc_462>",
966
+ "<loc_463>",
967
+ "<loc_464>",
968
+ "<loc_465>",
969
+ "<loc_466>",
970
+ "<loc_467>",
971
+ "<loc_468>",
972
+ "<loc_469>",
973
+ "<loc_470>",
974
+ "<loc_471>",
975
+ "<loc_472>",
976
+ "<loc_473>",
977
+ "<loc_474>",
978
+ "<loc_475>",
979
+ "<loc_476>",
980
+ "<loc_477>",
981
+ "<loc_478>",
982
+ "<loc_479>",
983
+ "<loc_480>",
984
+ "<loc_481>",
985
+ "<loc_482>",
986
+ "<loc_483>",
987
+ "<loc_484>",
988
+ "<loc_485>",
989
+ "<loc_486>",
990
+ "<loc_487>",
991
+ "<loc_488>",
992
+ "<loc_489>",
993
+ "<loc_490>",
994
+ "<loc_491>",
995
+ "<loc_492>",
996
+ "<loc_493>",
997
+ "<loc_494>",
998
+ "<loc_495>",
999
+ "<loc_496>",
1000
+ "<loc_497>",
1001
+ "<loc_498>",
1002
+ "<loc_499>",
1003
+ "<loc_500>",
1004
+ "<other_0>",
1005
+ "<other_1>",
1006
+ "<other_2>",
1007
+ "<other_3>",
1008
+ "<other_4>",
1009
+ "<other_5>",
1010
+ "<other_6>",
1011
+ "<other_7>",
1012
+ "<other_8>",
1013
+ "<other_9>",
1014
+ "<other_10>",
1015
+ "<other_11>",
1016
+ "<other_12>",
1017
+ "<other_13>",
1018
+ "<other_14>",
1019
+ "<other_15>",
1020
+ "<other_16>",
1021
+ "<other_17>",
1022
+ "<other_18>",
1023
+ "<other_19>",
1024
+ "<other_20>",
1025
+ "<other_21>",
1026
+ "<other_22>",
1027
+ "<other_23>",
1028
+ "<other_24>",
1029
+ "<other_25>",
1030
+ "<other_26>",
1031
+ "<other_27>",
1032
+ "<other_28>",
1033
+ "<other_29>",
1034
+ "<other_30>",
1035
+ "<other_31>",
1036
+ "<other_32>",
1037
+ "<other_33>",
1038
+ "<other_34>",
1039
+ "<other_35>",
1040
+ "<other_36>",
1041
+ "<other_37>",
1042
+ "<other_38>",
1043
+ "<other_39>",
1044
+ "<other_40>",
1045
+ "<other_41>",
1046
+ "<other_42>",
1047
+ "<other_43>",
1048
+ "<other_44>",
1049
+ "<other_45>",
1050
+ "<other_46>",
1051
+ "<other_47>",
1052
+ "<other_48>",
1053
+ "<other_49>",
1054
+ "<other_50>",
1055
+ "<other_51>",
1056
+ "<other_52>",
1057
+ "<other_53>",
1058
+ "<other_54>",
1059
+ "<other_55>",
1060
+ "<other_56>",
1061
+ "<other_57>",
1062
+ "<other_58>",
1063
+ "<other_59>",
1064
+ "<other_60>",
1065
+ "<other_61>",
1066
+ "<other_62>",
1067
+ "<other_63>",
1068
+ "<other_64>",
1069
+ "<other_65>",
1070
+ "<other_66>",
1071
+ "<other_67>",
1072
+ "<other_68>",
1073
+ "<other_69>",
1074
+ "<other_70>",
1075
+ "<other_71>",
1076
+ "<other_72>",
1077
+ "<other_73>",
1078
+ "<other_74>",
1079
+ "<other_75>",
1080
+ "<other_76>",
1081
+ "<other_77>",
1082
+ "<other_78>",
1083
+ "<other_79>",
1084
+ "<other_80>",
1085
+ "<other_81>",
1086
+ "<other_82>",
1087
+ "<other_83>",
1088
+ "<other_84>",
1089
+ "<other_85>",
1090
+ "<other_86>",
1091
+ "<other_87>",
1092
+ "<other_88>",
1093
+ "<other_89>",
1094
+ "<other_90>",
1095
+ "<other_91>",
1096
+ "<other_92>",
1097
+ "<other_93>",
1098
+ "<other_94>",
1099
+ "<other_95>",
1100
+ "<other_96>",
1101
+ "<other_97>",
1102
+ "<other_98>",
1103
+ "<other_99>",
1104
+ "<other_100>",
1105
+ "<other_101>",
1106
+ "<other_102>",
1107
+ "<other_103>",
1108
+ "<other_104>",
1109
+ "<other_105>",
1110
+ "<other_106>",
1111
+ "<other_107>",
1112
+ "<other_108>",
1113
+ "<other_109>",
1114
+ "<other_110>",
1115
+ "<other_111>",
1116
+ "<other_112>",
1117
+ "<other_113>",
1118
+ "<other_114>",
1119
+ "<other_115>",
1120
+ "<other_116>",
1121
+ "<other_117>",
1122
+ "<other_118>",
1123
+ "<other_119>",
1124
+ "<other_120>",
1125
+ "<other_121>",
1126
+ "<other_122>",
1127
+ "<other_123>",
1128
+ "<other_124>",
1129
+ "<other_125>",
1130
+ "<other_126>",
1131
+ "<other_127>",
1132
+ "<other_128>",
1133
+ "<other_129>",
1134
+ "<other_130>",
1135
+ "<other_131>",
1136
+ "<other_132>",
1137
+ "<other_133>",
1138
+ "<other_134>",
1139
+ "<other_135>",
1140
+ "<other_136>",
1141
+ "<other_137>",
1142
+ "<other_138>",
1143
+ "<other_139>",
1144
+ "<other_140>",
1145
+ "<other_141>",
1146
+ "<other_142>",
1147
+ "<other_143>",
1148
+ "<other_144>",
1149
+ "<other_145>",
1150
+ "<other_146>",
1151
+ "<other_147>",
1152
+ "<other_148>",
1153
+ "<other_149>",
1154
+ "<other_150>",
1155
+ "<other_151>",
1156
+ "<other_152>",
1157
+ "<other_153>",
1158
+ "<other_154>",
1159
+ "<other_155>",
1160
+ "<other_156>",
1161
+ "<other_157>",
1162
+ "<other_158>",
1163
+ "<other_159>",
1164
+ "<other_160>",
1165
+ "<other_161>",
1166
+ "<other_162>",
1167
+ "<other_163>",
1168
+ "<other_164>",
1169
+ "<other_165>",
1170
+ "<other_166>",
1171
+ "<other_167>",
1172
+ "<other_168>",
1173
+ "<other_169>",
1174
+ "<other_170>",
1175
+ "<other_171>",
1176
+ "<other_172>",
1177
+ "<other_173>",
1178
+ "<other_174>",
1179
+ "<other_175>",
1180
+ "<other_176>",
1181
+ "<other_177>",
1182
+ "<other_178>",
1183
+ "<other_179>",
1184
+ "<other_180>",
1185
+ "<other_181>",
1186
+ "<other_182>",
1187
+ "<other_183>",
1188
+ "<other_184>",
1189
+ "<other_185>",
1190
+ "<other_186>",
1191
+ "<other_187>",
1192
+ "<other_188>",
1193
+ "<other_189>",
1194
+ "<other_190>",
1195
+ "<other_191>",
1196
+ "<other_192>",
1197
+ "<other_193>",
1198
+ "<other_194>",
1199
+ "<other_195>",
1200
+ "<other_196>",
1201
+ "<other_197>",
1202
+ "<other_198>",
1203
+ "<other_199>"
1204
+ ],
1205
+ "eos_token": "</s>",
1206
+ "pad_token": "<pad>",
1207
+ "unk_token": "<unk>"
1208
+ }
spiece.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d60acb128cf7b7f2536e8f38a5b18a05535c9e14c7a355904270e15b0945ea86
3
+ size 791656
tokenizer_config.json ADDED
@@ -0,0 +1,1230 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "additional_special_tokens": [
3
+ "<extra_id_0>",
4
+ "<extra_id_1>",
5
+ "<extra_id_2>",
6
+ "<extra_id_3>",
7
+ "<extra_id_4>",
8
+ "<extra_id_5>",
9
+ "<extra_id_6>",
10
+ "<extra_id_7>",
11
+ "<extra_id_8>",
12
+ "<extra_id_9>",
13
+ "<extra_id_10>",
14
+ "<extra_id_11>",
15
+ "<extra_id_12>",
16
+ "<extra_id_13>",
17
+ "<extra_id_14>",
18
+ "<extra_id_15>",
19
+ "<extra_id_16>",
20
+ "<extra_id_17>",
21
+ "<extra_id_18>",
22
+ "<extra_id_19>",
23
+ "<extra_id_20>",
24
+ "<extra_id_21>",
25
+ "<extra_id_22>",
26
+ "<extra_id_23>",
27
+ "<extra_id_24>",
28
+ "<extra_id_25>",
29
+ "<extra_id_26>",
30
+ "<extra_id_27>",
31
+ "<extra_id_28>",
32
+ "<extra_id_29>",
33
+ "<extra_id_30>",
34
+ "<extra_id_31>",
35
+ "<extra_id_32>",
36
+ "<extra_id_33>",
37
+ "<extra_id_34>",
38
+ "<extra_id_35>",
39
+ "<extra_id_36>",
40
+ "<extra_id_37>",
41
+ "<extra_id_38>",
42
+ "<extra_id_39>",
43
+ "<extra_id_40>",
44
+ "<extra_id_41>",
45
+ "<extra_id_42>",
46
+ "<extra_id_43>",
47
+ "<extra_id_44>",
48
+ "<extra_id_45>",
49
+ "<extra_id_46>",
50
+ "<extra_id_47>",
51
+ "<extra_id_48>",
52
+ "<extra_id_49>",
53
+ "<extra_id_50>",
54
+ "<extra_id_51>",
55
+ "<extra_id_52>",
56
+ "<extra_id_53>",
57
+ "<extra_id_54>",
58
+ "<extra_id_55>",
59
+ "<extra_id_56>",
60
+ "<extra_id_57>",
61
+ "<extra_id_58>",
62
+ "<extra_id_59>",
63
+ "<extra_id_60>",
64
+ "<extra_id_61>",
65
+ "<extra_id_62>",
66
+ "<extra_id_63>",
67
+ "<extra_id_64>",
68
+ "<extra_id_65>",
69
+ "<extra_id_66>",
70
+ "<extra_id_67>",
71
+ "<extra_id_68>",
72
+ "<extra_id_69>",
73
+ "<extra_id_70>",
74
+ "<extra_id_71>",
75
+ "<extra_id_72>",
76
+ "<extra_id_73>",
77
+ "<extra_id_74>",
78
+ "<extra_id_75>",
79
+ "<extra_id_76>",
80
+ "<extra_id_77>",
81
+ "<extra_id_78>",
82
+ "<extra_id_79>",
83
+ "<extra_id_80>",
84
+ "<extra_id_81>",
85
+ "<extra_id_82>",
86
+ "<extra_id_83>",
87
+ "<extra_id_84>",
88
+ "<extra_id_85>",
89
+ "<extra_id_86>",
90
+ "<extra_id_87>",
91
+ "<extra_id_88>",
92
+ "<extra_id_89>",
93
+ "<extra_id_90>",
94
+ "<extra_id_91>",
95
+ "<extra_id_92>",
96
+ "<extra_id_93>",
97
+ "<extra_id_94>",
98
+ "<extra_id_95>",
99
+ "<extra_id_96>",
100
+ "<extra_id_97>",
101
+ "<extra_id_98>",
102
+ "<extra_id_99>",
103
+ "<extra_l_id_0>",
104
+ "<extra_l_id_1>",
105
+ "<extra_l_id_2>",
106
+ "<extra_l_id_3>",
107
+ "<extra_l_id_4>",
108
+ "<extra_l_id_5>",
109
+ "<extra_l_id_6>",
110
+ "<extra_l_id_7>",
111
+ "<extra_l_id_8>",
112
+ "<extra_l_id_9>",
113
+ "<extra_l_id_10>",
114
+ "<extra_l_id_11>",
115
+ "<extra_l_id_12>",
116
+ "<extra_l_id_13>",
117
+ "<extra_l_id_14>",
118
+ "<extra_l_id_15>",
119
+ "<extra_l_id_16>",
120
+ "<extra_l_id_17>",
121
+ "<extra_l_id_18>",
122
+ "<extra_l_id_19>",
123
+ "<extra_l_id_20>",
124
+ "<extra_l_id_21>",
125
+ "<extra_l_id_22>",
126
+ "<extra_l_id_23>",
127
+ "<extra_l_id_24>",
128
+ "<extra_l_id_25>",
129
+ "<extra_l_id_26>",
130
+ "<extra_l_id_27>",
131
+ "<extra_l_id_28>",
132
+ "<extra_l_id_29>",
133
+ "<extra_l_id_30>",
134
+ "<extra_l_id_31>",
135
+ "<extra_l_id_32>",
136
+ "<extra_l_id_33>",
137
+ "<extra_l_id_34>",
138
+ "<extra_l_id_35>",
139
+ "<extra_l_id_36>",
140
+ "<extra_l_id_37>",
141
+ "<extra_l_id_38>",
142
+ "<extra_l_id_39>",
143
+ "<extra_l_id_40>",
144
+ "<extra_l_id_41>",
145
+ "<extra_l_id_42>",
146
+ "<extra_l_id_43>",
147
+ "<extra_l_id_44>",
148
+ "<extra_l_id_45>",
149
+ "<extra_l_id_46>",
150
+ "<extra_l_id_47>",
151
+ "<extra_l_id_48>",
152
+ "<extra_l_id_49>",
153
+ "<extra_l_id_50>",
154
+ "<extra_l_id_51>",
155
+ "<extra_l_id_52>",
156
+ "<extra_l_id_53>",
157
+ "<extra_l_id_54>",
158
+ "<extra_l_id_55>",
159
+ "<extra_l_id_56>",
160
+ "<extra_l_id_57>",
161
+ "<extra_l_id_58>",
162
+ "<extra_l_id_59>",
163
+ "<extra_l_id_60>",
164
+ "<extra_l_id_61>",
165
+ "<extra_l_id_62>",
166
+ "<extra_l_id_63>",
167
+ "<extra_l_id_64>",
168
+ "<extra_l_id_65>",
169
+ "<extra_l_id_66>",
170
+ "<extra_l_id_67>",
171
+ "<extra_l_id_68>",
172
+ "<extra_l_id_69>",
173
+ "<extra_l_id_70>",
174
+ "<extra_l_id_71>",
175
+ "<extra_l_id_72>",
176
+ "<extra_l_id_73>",
177
+ "<extra_l_id_74>",
178
+ "<extra_l_id_75>",
179
+ "<extra_l_id_76>",
180
+ "<extra_l_id_77>",
181
+ "<extra_l_id_78>",
182
+ "<extra_l_id_79>",
183
+ "<extra_l_id_80>",
184
+ "<extra_l_id_81>",
185
+ "<extra_l_id_82>",
186
+ "<extra_l_id_83>",
187
+ "<extra_l_id_84>",
188
+ "<extra_l_id_85>",
189
+ "<extra_l_id_86>",
190
+ "<extra_l_id_87>",
191
+ "<extra_l_id_88>",
192
+ "<extra_l_id_89>",
193
+ "<extra_l_id_90>",
194
+ "<extra_l_id_91>",
195
+ "<extra_l_id_92>",
196
+ "<extra_l_id_93>",
197
+ "<extra_l_id_94>",
198
+ "<extra_l_id_95>",
199
+ "<extra_l_id_96>",
200
+ "<extra_l_id_97>",
201
+ "<extra_l_id_98>",
202
+ "<extra_l_id_99>",
203
+ "</extra_l_id_0>",
204
+ "</extra_l_id_1>",
205
+ "</extra_l_id_2>",
206
+ "</extra_l_id_3>",
207
+ "</extra_l_id_4>",
208
+ "</extra_l_id_5>",
209
+ "</extra_l_id_6>",
210
+ "</extra_l_id_7>",
211
+ "</extra_l_id_8>",
212
+ "</extra_l_id_9>",
213
+ "</extra_l_id_10>",
214
+ "</extra_l_id_11>",
215
+ "</extra_l_id_12>",
216
+ "</extra_l_id_13>",
217
+ "</extra_l_id_14>",
218
+ "</extra_l_id_15>",
219
+ "</extra_l_id_16>",
220
+ "</extra_l_id_17>",
221
+ "</extra_l_id_18>",
222
+ "</extra_l_id_19>",
223
+ "</extra_l_id_20>",
224
+ "</extra_l_id_21>",
225
+ "</extra_l_id_22>",
226
+ "</extra_l_id_23>",
227
+ "</extra_l_id_24>",
228
+ "</extra_l_id_25>",
229
+ "</extra_l_id_26>",
230
+ "</extra_l_id_27>",
231
+ "</extra_l_id_28>",
232
+ "</extra_l_id_29>",
233
+ "</extra_l_id_30>",
234
+ "</extra_l_id_31>",
235
+ "</extra_l_id_32>",
236
+ "</extra_l_id_33>",
237
+ "</extra_l_id_34>",
238
+ "</extra_l_id_35>",
239
+ "</extra_l_id_36>",
240
+ "</extra_l_id_37>",
241
+ "</extra_l_id_38>",
242
+ "</extra_l_id_39>",
243
+ "</extra_l_id_40>",
244
+ "</extra_l_id_41>",
245
+ "</extra_l_id_42>",
246
+ "</extra_l_id_43>",
247
+ "</extra_l_id_44>",
248
+ "</extra_l_id_45>",
249
+ "</extra_l_id_46>",
250
+ "</extra_l_id_47>",
251
+ "</extra_l_id_48>",
252
+ "</extra_l_id_49>",
253
+ "</extra_l_id_50>",
254
+ "</extra_l_id_51>",
255
+ "</extra_l_id_52>",
256
+ "</extra_l_id_53>",
257
+ "</extra_l_id_54>",
258
+ "</extra_l_id_55>",
259
+ "</extra_l_id_56>",
260
+ "</extra_l_id_57>",
261
+ "</extra_l_id_58>",
262
+ "</extra_l_id_59>",
263
+ "</extra_l_id_60>",
264
+ "</extra_l_id_61>",
265
+ "</extra_l_id_62>",
266
+ "</extra_l_id_63>",
267
+ "</extra_l_id_64>",
268
+ "</extra_l_id_65>",
269
+ "</extra_l_id_66>",
270
+ "</extra_l_id_67>",
271
+ "</extra_l_id_68>",
272
+ "</extra_l_id_69>",
273
+ "</extra_l_id_70>",
274
+ "</extra_l_id_71>",
275
+ "</extra_l_id_72>",
276
+ "</extra_l_id_73>",
277
+ "</extra_l_id_74>",
278
+ "</extra_l_id_75>",
279
+ "</extra_l_id_76>",
280
+ "</extra_l_id_77>",
281
+ "</extra_l_id_78>",
282
+ "</extra_l_id_79>",
283
+ "</extra_l_id_80>",
284
+ "</extra_l_id_81>",
285
+ "</extra_l_id_82>",
286
+ "</extra_l_id_83>",
287
+ "</extra_l_id_84>",
288
+ "</extra_l_id_85>",
289
+ "</extra_l_id_86>",
290
+ "</extra_l_id_87>",
291
+ "</extra_l_id_88>",
292
+ "</extra_l_id_89>",
293
+ "</extra_l_id_90>",
294
+ "</extra_l_id_91>",
295
+ "</extra_l_id_92>",
296
+ "</extra_l_id_93>",
297
+ "</extra_l_id_94>",
298
+ "</extra_l_id_95>",
299
+ "</extra_l_id_96>",
300
+ "</extra_l_id_97>",
301
+ "</extra_l_id_98>",
302
+ "</extra_l_id_99>",
303
+ "<extra_t_id_0>",
304
+ "<extra_t_id_1>",
305
+ "<extra_t_id_2>",
306
+ "<extra_t_id_3>",
307
+ "<extra_t_id_4>",
308
+ "<extra_t_id_5>",
309
+ "<extra_t_id_6>",
310
+ "<extra_t_id_7>",
311
+ "<extra_t_id_8>",
312
+ "<extra_t_id_9>",
313
+ "<extra_t_id_10>",
314
+ "<extra_t_id_11>",
315
+ "<extra_t_id_12>",
316
+ "<extra_t_id_13>",
317
+ "<extra_t_id_14>",
318
+ "<extra_t_id_15>",
319
+ "<extra_t_id_16>",
320
+ "<extra_t_id_17>",
321
+ "<extra_t_id_18>",
322
+ "<extra_t_id_19>",
323
+ "<extra_t_id_20>",
324
+ "<extra_t_id_21>",
325
+ "<extra_t_id_22>",
326
+ "<extra_t_id_23>",
327
+ "<extra_t_id_24>",
328
+ "<extra_t_id_25>",
329
+ "<extra_t_id_26>",
330
+ "<extra_t_id_27>",
331
+ "<extra_t_id_28>",
332
+ "<extra_t_id_29>",
333
+ "<extra_t_id_30>",
334
+ "<extra_t_id_31>",
335
+ "<extra_t_id_32>",
336
+ "<extra_t_id_33>",
337
+ "<extra_t_id_34>",
338
+ "<extra_t_id_35>",
339
+ "<extra_t_id_36>",
340
+ "<extra_t_id_37>",
341
+ "<extra_t_id_38>",
342
+ "<extra_t_id_39>",
343
+ "<extra_t_id_40>",
344
+ "<extra_t_id_41>",
345
+ "<extra_t_id_42>",
346
+ "<extra_t_id_43>",
347
+ "<extra_t_id_44>",
348
+ "<extra_t_id_45>",
349
+ "<extra_t_id_46>",
350
+ "<extra_t_id_47>",
351
+ "<extra_t_id_48>",
352
+ "<extra_t_id_49>",
353
+ "<extra_t_id_50>",
354
+ "<extra_t_id_51>",
355
+ "<extra_t_id_52>",
356
+ "<extra_t_id_53>",
357
+ "<extra_t_id_54>",
358
+ "<extra_t_id_55>",
359
+ "<extra_t_id_56>",
360
+ "<extra_t_id_57>",
361
+ "<extra_t_id_58>",
362
+ "<extra_t_id_59>",
363
+ "<extra_t_id_60>",
364
+ "<extra_t_id_61>",
365
+ "<extra_t_id_62>",
366
+ "<extra_t_id_63>",
367
+ "<extra_t_id_64>",
368
+ "<extra_t_id_65>",
369
+ "<extra_t_id_66>",
370
+ "<extra_t_id_67>",
371
+ "<extra_t_id_68>",
372
+ "<extra_t_id_69>",
373
+ "<extra_t_id_70>",
374
+ "<extra_t_id_71>",
375
+ "<extra_t_id_72>",
376
+ "<extra_t_id_73>",
377
+ "<extra_t_id_74>",
378
+ "<extra_t_id_75>",
379
+ "<extra_t_id_76>",
380
+ "<extra_t_id_77>",
381
+ "<extra_t_id_78>",
382
+ "<extra_t_id_79>",
383
+ "<extra_t_id_80>",
384
+ "<extra_t_id_81>",
385
+ "<extra_t_id_82>",
386
+ "<extra_t_id_83>",
387
+ "<extra_t_id_84>",
388
+ "<extra_t_id_85>",
389
+ "<extra_t_id_86>",
390
+ "<extra_t_id_87>",
391
+ "<extra_t_id_88>",
392
+ "<extra_t_id_89>",
393
+ "<extra_t_id_90>",
394
+ "<extra_t_id_91>",
395
+ "<extra_t_id_92>",
396
+ "<extra_t_id_93>",
397
+ "<extra_t_id_94>",
398
+ "<extra_t_id_95>",
399
+ "<extra_t_id_96>",
400
+ "<extra_t_id_97>",
401
+ "<extra_t_id_98>",
402
+ "<extra_t_id_99>",
403
+ "</extra_t_id_0>",
404
+ "</extra_t_id_1>",
405
+ "</extra_t_id_2>",
406
+ "</extra_t_id_3>",
407
+ "</extra_t_id_4>",
408
+ "</extra_t_id_5>",
409
+ "</extra_t_id_6>",
410
+ "</extra_t_id_7>",
411
+ "</extra_t_id_8>",
412
+ "</extra_t_id_9>",
413
+ "</extra_t_id_10>",
414
+ "</extra_t_id_11>",
415
+ "</extra_t_id_12>",
416
+ "</extra_t_id_13>",
417
+ "</extra_t_id_14>",
418
+ "</extra_t_id_15>",
419
+ "</extra_t_id_16>",
420
+ "</extra_t_id_17>",
421
+ "</extra_t_id_18>",
422
+ "</extra_t_id_19>",
423
+ "</extra_t_id_20>",
424
+ "</extra_t_id_21>",
425
+ "</extra_t_id_22>",
426
+ "</extra_t_id_23>",
427
+ "</extra_t_id_24>",
428
+ "</extra_t_id_25>",
429
+ "</extra_t_id_26>",
430
+ "</extra_t_id_27>",
431
+ "</extra_t_id_28>",
432
+ "</extra_t_id_29>",
433
+ "</extra_t_id_30>",
434
+ "</extra_t_id_31>",
435
+ "</extra_t_id_32>",
436
+ "</extra_t_id_33>",
437
+ "</extra_t_id_34>",
438
+ "</extra_t_id_35>",
439
+ "</extra_t_id_36>",
440
+ "</extra_t_id_37>",
441
+ "</extra_t_id_38>",
442
+ "</extra_t_id_39>",
443
+ "</extra_t_id_40>",
444
+ "</extra_t_id_41>",
445
+ "</extra_t_id_42>",
446
+ "</extra_t_id_43>",
447
+ "</extra_t_id_44>",
448
+ "</extra_t_id_45>",
449
+ "</extra_t_id_46>",
450
+ "</extra_t_id_47>",
451
+ "</extra_t_id_48>",
452
+ "</extra_t_id_49>",
453
+ "</extra_t_id_50>",
454
+ "</extra_t_id_51>",
455
+ "</extra_t_id_52>",
456
+ "</extra_t_id_53>",
457
+ "</extra_t_id_54>",
458
+ "</extra_t_id_55>",
459
+ "</extra_t_id_56>",
460
+ "</extra_t_id_57>",
461
+ "</extra_t_id_58>",
462
+ "</extra_t_id_59>",
463
+ "</extra_t_id_60>",
464
+ "</extra_t_id_61>",
465
+ "</extra_t_id_62>",
466
+ "</extra_t_id_63>",
467
+ "</extra_t_id_64>",
468
+ "</extra_t_id_65>",
469
+ "</extra_t_id_66>",
470
+ "</extra_t_id_67>",
471
+ "</extra_t_id_68>",
472
+ "</extra_t_id_69>",
473
+ "</extra_t_id_70>",
474
+ "</extra_t_id_71>",
475
+ "</extra_t_id_72>",
476
+ "</extra_t_id_73>",
477
+ "</extra_t_id_74>",
478
+ "</extra_t_id_75>",
479
+ "</extra_t_id_76>",
480
+ "</extra_t_id_77>",
481
+ "</extra_t_id_78>",
482
+ "</extra_t_id_79>",
483
+ "</extra_t_id_80>",
484
+ "</extra_t_id_81>",
485
+ "</extra_t_id_82>",
486
+ "</extra_t_id_83>",
487
+ "</extra_t_id_84>",
488
+ "</extra_t_id_85>",
489
+ "</extra_t_id_86>",
490
+ "</extra_t_id_87>",
491
+ "</extra_t_id_88>",
492
+ "</extra_t_id_89>",
493
+ "</extra_t_id_90>",
494
+ "</extra_t_id_91>",
495
+ "</extra_t_id_92>",
496
+ "</extra_t_id_93>",
497
+ "</extra_t_id_94>",
498
+ "</extra_t_id_95>",
499
+ "</extra_t_id_96>",
500
+ "</extra_t_id_97>",
501
+ "</extra_t_id_98>",
502
+ "</extra_t_id_99>",
503
+ "<loc_0>",
504
+ "<loc_1>",
505
+ "<loc_2>",
506
+ "<loc_3>",
507
+ "<loc_4>",
508
+ "<loc_5>",
509
+ "<loc_6>",
510
+ "<loc_7>",
511
+ "<loc_8>",
512
+ "<loc_9>",
513
+ "<loc_10>",
514
+ "<loc_11>",
515
+ "<loc_12>",
516
+ "<loc_13>",
517
+ "<loc_14>",
518
+ "<loc_15>",
519
+ "<loc_16>",
520
+ "<loc_17>",
521
+ "<loc_18>",
522
+ "<loc_19>",
523
+ "<loc_20>",
524
+ "<loc_21>",
525
+ "<loc_22>",
526
+ "<loc_23>",
527
+ "<loc_24>",
528
+ "<loc_25>",
529
+ "<loc_26>",
530
+ "<loc_27>",
531
+ "<loc_28>",
532
+ "<loc_29>",
533
+ "<loc_30>",
534
+ "<loc_31>",
535
+ "<loc_32>",
536
+ "<loc_33>",
537
+ "<loc_34>",
538
+ "<loc_35>",
539
+ "<loc_36>",
540
+ "<loc_37>",
541
+ "<loc_38>",
542
+ "<loc_39>",
543
+ "<loc_40>",
544
+ "<loc_41>",
545
+ "<loc_42>",
546
+ "<loc_43>",
547
+ "<loc_44>",
548
+ "<loc_45>",
549
+ "<loc_46>",
550
+ "<loc_47>",
551
+ "<loc_48>",
552
+ "<loc_49>",
553
+ "<loc_50>",
554
+ "<loc_51>",
555
+ "<loc_52>",
556
+ "<loc_53>",
557
+ "<loc_54>",
558
+ "<loc_55>",
559
+ "<loc_56>",
560
+ "<loc_57>",
561
+ "<loc_58>",
562
+ "<loc_59>",
563
+ "<loc_60>",
564
+ "<loc_61>",
565
+ "<loc_62>",
566
+ "<loc_63>",
567
+ "<loc_64>",
568
+ "<loc_65>",
569
+ "<loc_66>",
570
+ "<loc_67>",
571
+ "<loc_68>",
572
+ "<loc_69>",
573
+ "<loc_70>",
574
+ "<loc_71>",
575
+ "<loc_72>",
576
+ "<loc_73>",
577
+ "<loc_74>",
578
+ "<loc_75>",
579
+ "<loc_76>",
580
+ "<loc_77>",
581
+ "<loc_78>",
582
+ "<loc_79>",
583
+ "<loc_80>",
584
+ "<loc_81>",
585
+ "<loc_82>",
586
+ "<loc_83>",
587
+ "<loc_84>",
588
+ "<loc_85>",
589
+ "<loc_86>",
590
+ "<loc_87>",
591
+ "<loc_88>",
592
+ "<loc_89>",
593
+ "<loc_90>",
594
+ "<loc_91>",
595
+ "<loc_92>",
596
+ "<loc_93>",
597
+ "<loc_94>",
598
+ "<loc_95>",
599
+ "<loc_96>",
600
+ "<loc_97>",
601
+ "<loc_98>",
602
+ "<loc_99>",
603
+ "<loc_100>",
604
+ "<loc_101>",
605
+ "<loc_102>",
606
+ "<loc_103>",
607
+ "<loc_104>",
608
+ "<loc_105>",
609
+ "<loc_106>",
610
+ "<loc_107>",
611
+ "<loc_108>",
612
+ "<loc_109>",
613
+ "<loc_110>",
614
+ "<loc_111>",
615
+ "<loc_112>",
616
+ "<loc_113>",
617
+ "<loc_114>",
618
+ "<loc_115>",
619
+ "<loc_116>",
620
+ "<loc_117>",
621
+ "<loc_118>",
622
+ "<loc_119>",
623
+ "<loc_120>",
624
+ "<loc_121>",
625
+ "<loc_122>",
626
+ "<loc_123>",
627
+ "<loc_124>",
628
+ "<loc_125>",
629
+ "<loc_126>",
630
+ "<loc_127>",
631
+ "<loc_128>",
632
+ "<loc_129>",
633
+ "<loc_130>",
634
+ "<loc_131>",
635
+ "<loc_132>",
636
+ "<loc_133>",
637
+ "<loc_134>",
638
+ "<loc_135>",
639
+ "<loc_136>",
640
+ "<loc_137>",
641
+ "<loc_138>",
642
+ "<loc_139>",
643
+ "<loc_140>",
644
+ "<loc_141>",
645
+ "<loc_142>",
646
+ "<loc_143>",
647
+ "<loc_144>",
648
+ "<loc_145>",
649
+ "<loc_146>",
650
+ "<loc_147>",
651
+ "<loc_148>",
652
+ "<loc_149>",
653
+ "<loc_150>",
654
+ "<loc_151>",
655
+ "<loc_152>",
656
+ "<loc_153>",
657
+ "<loc_154>",
658
+ "<loc_155>",
659
+ "<loc_156>",
660
+ "<loc_157>",
661
+ "<loc_158>",
662
+ "<loc_159>",
663
+ "<loc_160>",
664
+ "<loc_161>",
665
+ "<loc_162>",
666
+ "<loc_163>",
667
+ "<loc_164>",
668
+ "<loc_165>",
669
+ "<loc_166>",
670
+ "<loc_167>",
671
+ "<loc_168>",
672
+ "<loc_169>",
673
+ "<loc_170>",
674
+ "<loc_171>",
675
+ "<loc_172>",
676
+ "<loc_173>",
677
+ "<loc_174>",
678
+ "<loc_175>",
679
+ "<loc_176>",
680
+ "<loc_177>",
681
+ "<loc_178>",
682
+ "<loc_179>",
683
+ "<loc_180>",
684
+ "<loc_181>",
685
+ "<loc_182>",
686
+ "<loc_183>",
687
+ "<loc_184>",
688
+ "<loc_185>",
689
+ "<loc_186>",
690
+ "<loc_187>",
691
+ "<loc_188>",
692
+ "<loc_189>",
693
+ "<loc_190>",
694
+ "<loc_191>",
695
+ "<loc_192>",
696
+ "<loc_193>",
697
+ "<loc_194>",
698
+ "<loc_195>",
699
+ "<loc_196>",
700
+ "<loc_197>",
701
+ "<loc_198>",
702
+ "<loc_199>",
703
+ "<loc_200>",
704
+ "<loc_201>",
705
+ "<loc_202>",
706
+ "<loc_203>",
707
+ "<loc_204>",
708
+ "<loc_205>",
709
+ "<loc_206>",
710
+ "<loc_207>",
711
+ "<loc_208>",
712
+ "<loc_209>",
713
+ "<loc_210>",
714
+ "<loc_211>",
715
+ "<loc_212>",
716
+ "<loc_213>",
717
+ "<loc_214>",
718
+ "<loc_215>",
719
+ "<loc_216>",
720
+ "<loc_217>",
721
+ "<loc_218>",
722
+ "<loc_219>",
723
+ "<loc_220>",
724
+ "<loc_221>",
725
+ "<loc_222>",
726
+ "<loc_223>",
727
+ "<loc_224>",
728
+ "<loc_225>",
729
+ "<loc_226>",
730
+ "<loc_227>",
731
+ "<loc_228>",
732
+ "<loc_229>",
733
+ "<loc_230>",
734
+ "<loc_231>",
735
+ "<loc_232>",
736
+ "<loc_233>",
737
+ "<loc_234>",
738
+ "<loc_235>",
739
+ "<loc_236>",
740
+ "<loc_237>",
741
+ "<loc_238>",
742
+ "<loc_239>",
743
+ "<loc_240>",
744
+ "<loc_241>",
745
+ "<loc_242>",
746
+ "<loc_243>",
747
+ "<loc_244>",
748
+ "<loc_245>",
749
+ "<loc_246>",
750
+ "<loc_247>",
751
+ "<loc_248>",
752
+ "<loc_249>",
753
+ "<loc_250>",
754
+ "<loc_251>",
755
+ "<loc_252>",
756
+ "<loc_253>",
757
+ "<loc_254>",
758
+ "<loc_255>",
759
+ "<loc_256>",
760
+ "<loc_257>",
761
+ "<loc_258>",
762
+ "<loc_259>",
763
+ "<loc_260>",
764
+ "<loc_261>",
765
+ "<loc_262>",
766
+ "<loc_263>",
767
+ "<loc_264>",
768
+ "<loc_265>",
769
+ "<loc_266>",
770
+ "<loc_267>",
771
+ "<loc_268>",
772
+ "<loc_269>",
773
+ "<loc_270>",
774
+ "<loc_271>",
775
+ "<loc_272>",
776
+ "<loc_273>",
777
+ "<loc_274>",
778
+ "<loc_275>",
779
+ "<loc_276>",
780
+ "<loc_277>",
781
+ "<loc_278>",
782
+ "<loc_279>",
783
+ "<loc_280>",
784
+ "<loc_281>",
785
+ "<loc_282>",
786
+ "<loc_283>",
787
+ "<loc_284>",
788
+ "<loc_285>",
789
+ "<loc_286>",
790
+ "<loc_287>",
791
+ "<loc_288>",
792
+ "<loc_289>",
793
+ "<loc_290>",
794
+ "<loc_291>",
795
+ "<loc_292>",
796
+ "<loc_293>",
797
+ "<loc_294>",
798
+ "<loc_295>",
799
+ "<loc_296>",
800
+ "<loc_297>",
801
+ "<loc_298>",
802
+ "<loc_299>",
803
+ "<loc_300>",
804
+ "<loc_301>",
805
+ "<loc_302>",
806
+ "<loc_303>",
807
+ "<loc_304>",
808
+ "<loc_305>",
809
+ "<loc_306>",
810
+ "<loc_307>",
811
+ "<loc_308>",
812
+ "<loc_309>",
813
+ "<loc_310>",
814
+ "<loc_311>",
815
+ "<loc_312>",
816
+ "<loc_313>",
817
+ "<loc_314>",
818
+ "<loc_315>",
819
+ "<loc_316>",
820
+ "<loc_317>",
821
+ "<loc_318>",
822
+ "<loc_319>",
823
+ "<loc_320>",
824
+ "<loc_321>",
825
+ "<loc_322>",
826
+ "<loc_323>",
827
+ "<loc_324>",
828
+ "<loc_325>",
829
+ "<loc_326>",
830
+ "<loc_327>",
831
+ "<loc_328>",
832
+ "<loc_329>",
833
+ "<loc_330>",
834
+ "<loc_331>",
835
+ "<loc_332>",
836
+ "<loc_333>",
837
+ "<loc_334>",
838
+ "<loc_335>",
839
+ "<loc_336>",
840
+ "<loc_337>",
841
+ "<loc_338>",
842
+ "<loc_339>",
843
+ "<loc_340>",
844
+ "<loc_341>",
845
+ "<loc_342>",
846
+ "<loc_343>",
847
+ "<loc_344>",
848
+ "<loc_345>",
849
+ "<loc_346>",
850
+ "<loc_347>",
851
+ "<loc_348>",
852
+ "<loc_349>",
853
+ "<loc_350>",
854
+ "<loc_351>",
855
+ "<loc_352>",
856
+ "<loc_353>",
857
+ "<loc_354>",
858
+ "<loc_355>",
859
+ "<loc_356>",
860
+ "<loc_357>",
861
+ "<loc_358>",
862
+ "<loc_359>",
863
+ "<loc_360>",
864
+ "<loc_361>",
865
+ "<loc_362>",
866
+ "<loc_363>",
867
+ "<loc_364>",
868
+ "<loc_365>",
869
+ "<loc_366>",
870
+ "<loc_367>",
871
+ "<loc_368>",
872
+ "<loc_369>",
873
+ "<loc_370>",
874
+ "<loc_371>",
875
+ "<loc_372>",
876
+ "<loc_373>",
877
+ "<loc_374>",
878
+ "<loc_375>",
879
+ "<loc_376>",
880
+ "<loc_377>",
881
+ "<loc_378>",
882
+ "<loc_379>",
883
+ "<loc_380>",
884
+ "<loc_381>",
885
+ "<loc_382>",
886
+ "<loc_383>",
887
+ "<loc_384>",
888
+ "<loc_385>",
889
+ "<loc_386>",
890
+ "<loc_387>",
891
+ "<loc_388>",
892
+ "<loc_389>",
893
+ "<loc_390>",
894
+ "<loc_391>",
895
+ "<loc_392>",
896
+ "<loc_393>",
897
+ "<loc_394>",
898
+ "<loc_395>",
899
+ "<loc_396>",
900
+ "<loc_397>",
901
+ "<loc_398>",
902
+ "<loc_399>",
903
+ "<loc_400>",
904
+ "<loc_401>",
905
+ "<loc_402>",
906
+ "<loc_403>",
907
+ "<loc_404>",
908
+ "<loc_405>",
909
+ "<loc_406>",
910
+ "<loc_407>",
911
+ "<loc_408>",
912
+ "<loc_409>",
913
+ "<loc_410>",
914
+ "<loc_411>",
915
+ "<loc_412>",
916
+ "<loc_413>",
917
+ "<loc_414>",
918
+ "<loc_415>",
919
+ "<loc_416>",
920
+ "<loc_417>",
921
+ "<loc_418>",
922
+ "<loc_419>",
923
+ "<loc_420>",
924
+ "<loc_421>",
925
+ "<loc_422>",
926
+ "<loc_423>",
927
+ "<loc_424>",
928
+ "<loc_425>",
929
+ "<loc_426>",
930
+ "<loc_427>",
931
+ "<loc_428>",
932
+ "<loc_429>",
933
+ "<loc_430>",
934
+ "<loc_431>",
935
+ "<loc_432>",
936
+ "<loc_433>",
937
+ "<loc_434>",
938
+ "<loc_435>",
939
+ "<loc_436>",
940
+ "<loc_437>",
941
+ "<loc_438>",
942
+ "<loc_439>",
943
+ "<loc_440>",
944
+ "<loc_441>",
945
+ "<loc_442>",
946
+ "<loc_443>",
947
+ "<loc_444>",
948
+ "<loc_445>",
949
+ "<loc_446>",
950
+ "<loc_447>",
951
+ "<loc_448>",
952
+ "<loc_449>",
953
+ "<loc_450>",
954
+ "<loc_451>",
955
+ "<loc_452>",
956
+ "<loc_453>",
957
+ "<loc_454>",
958
+ "<loc_455>",
959
+ "<loc_456>",
960
+ "<loc_457>",
961
+ "<loc_458>",
962
+ "<loc_459>",
963
+ "<loc_460>",
964
+ "<loc_461>",
965
+ "<loc_462>",
966
+ "<loc_463>",
967
+ "<loc_464>",
968
+ "<loc_465>",
969
+ "<loc_466>",
970
+ "<loc_467>",
971
+ "<loc_468>",
972
+ "<loc_469>",
973
+ "<loc_470>",
974
+ "<loc_471>",
975
+ "<loc_472>",
976
+ "<loc_473>",
977
+ "<loc_474>",
978
+ "<loc_475>",
979
+ "<loc_476>",
980
+ "<loc_477>",
981
+ "<loc_478>",
982
+ "<loc_479>",
983
+ "<loc_480>",
984
+ "<loc_481>",
985
+ "<loc_482>",
986
+ "<loc_483>",
987
+ "<loc_484>",
988
+ "<loc_485>",
989
+ "<loc_486>",
990
+ "<loc_487>",
991
+ "<loc_488>",
992
+ "<loc_489>",
993
+ "<loc_490>",
994
+ "<loc_491>",
995
+ "<loc_492>",
996
+ "<loc_493>",
997
+ "<loc_494>",
998
+ "<loc_495>",
999
+ "<loc_496>",
1000
+ "<loc_497>",
1001
+ "<loc_498>",
1002
+ "<loc_499>",
1003
+ "<loc_500>",
1004
+ "<other_0>",
1005
+ "<other_1>",
1006
+ "<other_2>",
1007
+ "<other_3>",
1008
+ "<other_4>",
1009
+ "<other_5>",
1010
+ "<other_6>",
1011
+ "<other_7>",
1012
+ "<other_8>",
1013
+ "<other_9>",
1014
+ "<other_10>",
1015
+ "<other_11>",
1016
+ "<other_12>",
1017
+ "<other_13>",
1018
+ "<other_14>",
1019
+ "<other_15>",
1020
+ "<other_16>",
1021
+ "<other_17>",
1022
+ "<other_18>",
1023
+ "<other_19>",
1024
+ "<other_20>",
1025
+ "<other_21>",
1026
+ "<other_22>",
1027
+ "<other_23>",
1028
+ "<other_24>",
1029
+ "<other_25>",
1030
+ "<other_26>",
1031
+ "<other_27>",
1032
+ "<other_28>",
1033
+ "<other_29>",
1034
+ "<other_30>",
1035
+ "<other_31>",
1036
+ "<other_32>",
1037
+ "<other_33>",
1038
+ "<other_34>",
1039
+ "<other_35>",
1040
+ "<other_36>",
1041
+ "<other_37>",
1042
+ "<other_38>",
1043
+ "<other_39>",
1044
+ "<other_40>",
1045
+ "<other_41>",
1046
+ "<other_42>",
1047
+ "<other_43>",
1048
+ "<other_44>",
1049
+ "<other_45>",
1050
+ "<other_46>",
1051
+ "<other_47>",
1052
+ "<other_48>",
1053
+ "<other_49>",
1054
+ "<other_50>",
1055
+ "<other_51>",
1056
+ "<other_52>",
1057
+ "<other_53>",
1058
+ "<other_54>",
1059
+ "<other_55>",
1060
+ "<other_56>",
1061
+ "<other_57>",
1062
+ "<other_58>",
1063
+ "<other_59>",
1064
+ "<other_60>",
1065
+ "<other_61>",
1066
+ "<other_62>",
1067
+ "<other_63>",
1068
+ "<other_64>",
1069
+ "<other_65>",
1070
+ "<other_66>",
1071
+ "<other_67>",
1072
+ "<other_68>",
1073
+ "<other_69>",
1074
+ "<other_70>",
1075
+ "<other_71>",
1076
+ "<other_72>",
1077
+ "<other_73>",
1078
+ "<other_74>",
1079
+ "<other_75>",
1080
+ "<other_76>",
1081
+ "<other_77>",
1082
+ "<other_78>",
1083
+ "<other_79>",
1084
+ "<other_80>",
1085
+ "<other_81>",
1086
+ "<other_82>",
1087
+ "<other_83>",
1088
+ "<other_84>",
1089
+ "<other_85>",
1090
+ "<other_86>",
1091
+ "<other_87>",
1092
+ "<other_88>",
1093
+ "<other_89>",
1094
+ "<other_90>",
1095
+ "<other_91>",
1096
+ "<other_92>",
1097
+ "<other_93>",
1098
+ "<other_94>",
1099
+ "<other_95>",
1100
+ "<other_96>",
1101
+ "<other_97>",
1102
+ "<other_98>",
1103
+ "<other_99>",
1104
+ "<other_100>",
1105
+ "<other_101>",
1106
+ "<other_102>",
1107
+ "<other_103>",
1108
+ "<other_104>",
1109
+ "<other_105>",
1110
+ "<other_106>",
1111
+ "<other_107>",
1112
+ "<other_108>",
1113
+ "<other_109>",
1114
+ "<other_110>",
1115
+ "<other_111>",
1116
+ "<other_112>",
1117
+ "<other_113>",
1118
+ "<other_114>",
1119
+ "<other_115>",
1120
+ "<other_116>",
1121
+ "<other_117>",
1122
+ "<other_118>",
1123
+ "<other_119>",
1124
+ "<other_120>",
1125
+ "<other_121>",
1126
+ "<other_122>",
1127
+ "<other_123>",
1128
+ "<other_124>",
1129
+ "<other_125>",
1130
+ "<other_126>",
1131
+ "<other_127>",
1132
+ "<other_128>",
1133
+ "<other_129>",
1134
+ "<other_130>",
1135
+ "<other_131>",
1136
+ "<other_132>",
1137
+ "<other_133>",
1138
+ "<other_134>",
1139
+ "<other_135>",
1140
+ "<other_136>",
1141
+ "<other_137>",
1142
+ "<other_138>",
1143
+ "<other_139>",
1144
+ "<other_140>",
1145
+ "<other_141>",
1146
+ "<other_142>",
1147
+ "<other_143>",
1148
+ "<other_144>",
1149
+ "<other_145>",
1150
+ "<other_146>",
1151
+ "<other_147>",
1152
+ "<other_148>",
1153
+ "<other_149>",
1154
+ "<other_150>",
1155
+ "<other_151>",
1156
+ "<other_152>",
1157
+ "<other_153>",
1158
+ "<other_154>",
1159
+ "<other_155>",
1160
+ "<other_156>",
1161
+ "<other_157>",
1162
+ "<other_158>",
1163
+ "<other_159>",
1164
+ "<other_160>",
1165
+ "<other_161>",
1166
+ "<other_162>",
1167
+ "<other_163>",
1168
+ "<other_164>",
1169
+ "<other_165>",
1170
+ "<other_166>",
1171
+ "<other_167>",
1172
+ "<other_168>",
1173
+ "<other_169>",
1174
+ "<other_170>",
1175
+ "<other_171>",
1176
+ "<other_172>",
1177
+ "<other_173>",
1178
+ "<other_174>",
1179
+ "<other_175>",
1180
+ "<other_176>",
1181
+ "<other_177>",
1182
+ "<other_178>",
1183
+ "<other_179>",
1184
+ "<other_180>",
1185
+ "<other_181>",
1186
+ "<other_182>",
1187
+ "<other_183>",
1188
+ "<other_184>",
1189
+ "<other_185>",
1190
+ "<other_186>",
1191
+ "<other_187>",
1192
+ "<other_188>",
1193
+ "<other_189>",
1194
+ "<other_190>",
1195
+ "<other_191>",
1196
+ "<other_192>",
1197
+ "<other_193>",
1198
+ "<other_194>",
1199
+ "<other_195>",
1200
+ "<other_196>",
1201
+ "<other_197>",
1202
+ "<other_198>",
1203
+ "<other_199>"
1204
+ ],
1205
+ "eos_token": "</s>",
1206
+ "extra_ids": 100,
1207
+ "loc_extra_ids": 501,
1208
+ "model_max_length": 1000000000000000019884624838656,
1209
+ "only_label_first_subword": true,
1210
+ "other_extra_ids": 200,
1211
+ "pad_token": "<pad>",
1212
+ "pad_token_box": [
1213
+ 0,
1214
+ 0,
1215
+ 0,
1216
+ 0
1217
+ ],
1218
+ "pad_token_label": -100,
1219
+ "processor_class": "UdopProcessor",
1220
+ "sep_token_box": [
1221
+ 1000,
1222
+ 1000,
1223
+ 1000,
1224
+ 1000
1225
+ ],
1226
+ "sp_model_kwargs": {},
1227
+ "special_tokens_map_file": null,
1228
+ "tokenizer_class": "UdopTokenizer",
1229
+ "unk_token": "<unk>"
1230
+ }