GinnM commited on
Commit
fde3dcd
1 Parent(s): 9352517

Upload tokenizer

Browse files
Files changed (3) hide show
  1. special_tokens_map.json +9 -0
  2. tokenizer.json +1716 -0
  3. tokenizer_config.json +5 -0
special_tokens_map.json ADDED
@@ -0,0 +1,9 @@
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": "<cls>",
3
+ "cls_token": "<cls>",
4
+ "eos_token": "<sep>",
5
+ "mask_token": "<mask>",
6
+ "pad_token": "<pad>",
7
+ "sep_token": "<sep>",
8
+ "unk_token": "<unk>"
9
+ }
tokenizer.json ADDED
@@ -0,0 +1,1716 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "version": "1.0",
3
+ "truncation": null,
4
+ "padding": null,
5
+ "added_tokens": [
6
+ {
7
+ "id": 0,
8
+ "content": "<pad>",
9
+ "single_word": false,
10
+ "lstrip": false,
11
+ "rstrip": false,
12
+ "normalized": false,
13
+ "special": true
14
+ },
15
+ {
16
+ "id": 1,
17
+ "content": "<cls>",
18
+ "single_word": false,
19
+ "lstrip": false,
20
+ "rstrip": false,
21
+ "normalized": false,
22
+ "special": true
23
+ },
24
+ {
25
+ "id": 2,
26
+ "content": "<sep>",
27
+ "single_word": false,
28
+ "lstrip": false,
29
+ "rstrip": false,
30
+ "normalized": false,
31
+ "special": true
32
+ },
33
+ {
34
+ "id": 3,
35
+ "content": "<unk>",
36
+ "single_word": false,
37
+ "lstrip": false,
38
+ "rstrip": false,
39
+ "normalized": false,
40
+ "special": true
41
+ },
42
+ {
43
+ "id": 4,
44
+ "content": "<mask>",
45
+ "single_word": false,
46
+ "lstrip": false,
47
+ "rstrip": false,
48
+ "normalized": false,
49
+ "special": true
50
+ }
51
+ ],
52
+ "normalizer": null,
53
+ "pre_tokenizer": null,
54
+ "post_processor": {
55
+ "type": "TemplateProcessing",
56
+ "single": [
57
+ {
58
+ "SpecialToken": {
59
+ "id": "<cls>",
60
+ "type_id": 0
61
+ }
62
+ },
63
+ {
64
+ "Sequence": {
65
+ "id": "A",
66
+ "type_id": 0
67
+ }
68
+ },
69
+ {
70
+ "SpecialToken": {
71
+ "id": "<sep>",
72
+ "type_id": 0
73
+ }
74
+ }
75
+ ],
76
+ "pair": [
77
+ {
78
+ "SpecialToken": {
79
+ "id": "<cls>",
80
+ "type_id": 0
81
+ }
82
+ },
83
+ {
84
+ "Sequence": {
85
+ "id": "A",
86
+ "type_id": 0
87
+ }
88
+ },
89
+ {
90
+ "SpecialToken": {
91
+ "id": "<sep>",
92
+ "type_id": 0
93
+ }
94
+ },
95
+ {
96
+ "Sequence": {
97
+ "id": "B",
98
+ "type_id": 1
99
+ }
100
+ },
101
+ {
102
+ "SpecialToken": {
103
+ "id": "<sep>",
104
+ "type_id": 1
105
+ }
106
+ }
107
+ ],
108
+ "special_tokens": {
109
+ "<cls>": {
110
+ "id": "<cls>",
111
+ "ids": [
112
+ 1
113
+ ],
114
+ "tokens": [
115
+ "<cls>"
116
+ ]
117
+ },
118
+ "<sep>": {
119
+ "id": "<sep>",
120
+ "ids": [
121
+ 2
122
+ ],
123
+ "tokens": [
124
+ "<sep>"
125
+ ]
126
+ }
127
+ }
128
+ },
129
+ "decoder": {
130
+ "type": "BPEDecoder",
131
+ "suffix": "</w>"
132
+ },
133
+ "model": {
134
+ "type": "BPE",
135
+ "dropout": null,
136
+ "unk_token": null,
137
+ "continuing_subword_prefix": null,
138
+ "end_of_word_suffix": null,
139
+ "fuse_unk": false,
140
+ "byte_fallback": false,
141
+ "vocab": {
142
+ "<pad>": 0,
143
+ "<cls>": 1,
144
+ "<sep>": 2,
145
+ "<unk>": 3,
146
+ "<mask>": 4,
147
+ "A": 5,
148
+ "B": 6,
149
+ "C": 7,
150
+ "D": 8,
151
+ "E": 9,
152
+ "F": 10,
153
+ "G": 11,
154
+ "H": 12,
155
+ "I": 13,
156
+ "K": 14,
157
+ "L": 15,
158
+ "M": 16,
159
+ "N": 17,
160
+ "O": 18,
161
+ "P": 19,
162
+ "Q": 20,
163
+ "R": 21,
164
+ "S": 22,
165
+ "T": 23,
166
+ "U": 24,
167
+ "V": 25,
168
+ "W": 26,
169
+ "X": 27,
170
+ "Y": 28,
171
+ "Z": 29,
172
+ "AA": 30,
173
+ "LL": 31,
174
+ "SS": 32,
175
+ "LA": 33,
176
+ "LS": 34,
177
+ "GG": 35,
178
+ "LV": 36,
179
+ "LR": 37,
180
+ "LE": 38,
181
+ "LG": 39,
182
+ "LT": 40,
183
+ "AV": 41,
184
+ "AG": 42,
185
+ "LP": 43,
186
+ "LD": 44,
187
+ "LI": 45,
188
+ "AS": 46,
189
+ "EE": 47,
190
+ "RR": 48,
191
+ "LK": 49,
192
+ "VV": 50,
193
+ "AT": 51,
194
+ "AE": 52,
195
+ "SG": 53,
196
+ "DG": 54,
197
+ "AR": 55,
198
+ "KK": 56,
199
+ "AI": 57,
200
+ "AP": 58,
201
+ "TT": 59,
202
+ "LN": 60,
203
+ "LF": 61,
204
+ "LQ": 62,
205
+ "AD": 63,
206
+ "SV": 64,
207
+ "ST": 65,
208
+ "SI": 66,
209
+ "SP": 67,
210
+ "DE": 68,
211
+ "TG": 69,
212
+ "TV": 70,
213
+ "SR": 71,
214
+ "SE": 72,
215
+ "DV": 73,
216
+ "PP": 74,
217
+ "KE": 75,
218
+ "KI": 76,
219
+ "DI": 77,
220
+ "GV": 78,
221
+ "AQ": 79,
222
+ "AF": 80,
223
+ "RV": 81,
224
+ "TI": 82,
225
+ "NI": 83,
226
+ "PV": 84,
227
+ "RE": 85,
228
+ "SF": 86,
229
+ "KV": 87,
230
+ "NG": 88,
231
+ "LY": 89,
232
+ "RI": 90,
233
+ "PG": 91,
234
+ "RG": 92,
235
+ "DD": 93,
236
+ "PE": 94,
237
+ "AK": 95,
238
+ "NV": 96,
239
+ "SD": 97,
240
+ "TE": 98,
241
+ "QQ": 99,
242
+ "NE": 100,
243
+ "SK": 101,
244
+ "LH": 102,
245
+ "SQ": 103,
246
+ "GI": 104,
247
+ "FV": 105,
248
+ "TP": 106,
249
+ "GE": 107,
250
+ "SN": 108,
251
+ "FI": 109,
252
+ "AY": 110,
253
+ "AN": 111,
254
+ "QV": 112,
255
+ "RK": 113,
256
+ "SY": 114,
257
+ "IV": 115,
258
+ "FE": 116,
259
+ "DP": 117,
260
+ "RP": 118,
261
+ "IE": 119,
262
+ "QE": 120,
263
+ "FG": 121,
264
+ "LM": 122,
265
+ "NN": 123,
266
+ "KG": 124,
267
+ "RT": 125,
268
+ "RD": 126,
269
+ "RQ": 127,
270
+ "II": 128,
271
+ "TD": 129,
272
+ "AH": 130,
273
+ "AM": 131,
274
+ "YV": 132,
275
+ "RF": 133,
276
+ "EV": 134,
277
+ "KN": 135,
278
+ "KD": 136,
279
+ "IG": 137,
280
+ "LC": 138,
281
+ "KT": 139,
282
+ "KP": 140,
283
+ "RY": 141,
284
+ "SH": 142,
285
+ "QG": 143,
286
+ "NP": 144,
287
+ "QI": 145,
288
+ "FD": 146,
289
+ "YG": 147,
290
+ "RN": 148,
291
+ "YE": 149,
292
+ "TF": 150,
293
+ "MV": 151,
294
+ "RH": 152,
295
+ "LW": 153,
296
+ "QP": 154,
297
+ "TN": 155,
298
+ "DF": 156,
299
+ "KQ": 157,
300
+ "YI": 158,
301
+ "ME": 159,
302
+ "VE": 160,
303
+ "LAA": 161,
304
+ "PD": 162,
305
+ "FF": 163,
306
+ "PI": 164,
307
+ "AC": 165,
308
+ "ND": 166,
309
+ "VG": 167,
310
+ "TY": 168,
311
+ "TQ": 169,
312
+ "SM": 170,
313
+ "AW": 171,
314
+ "KY": 172,
315
+ "HG": 173,
316
+ "SC": 174,
317
+ "HV": 175,
318
+ "ID": 176,
319
+ "KF": 177,
320
+ "EG": 178,
321
+ "KR": 179,
322
+ "EI": 180,
323
+ "MG": 181,
324
+ "TR": 182,
325
+ "NF": 183,
326
+ "SW": 184,
327
+ "TK": 185,
328
+ "YD": 186,
329
+ "NQ": 187,
330
+ "ALL": 188,
331
+ "MI": 189,
332
+ "PT": 190,
333
+ "NY": 191,
334
+ "QD": 192,
335
+ "GD": 193,
336
+ "NT": 194,
337
+ "HE": 195,
338
+ "VI": 196,
339
+ "PF": 197,
340
+ "ALA": 198,
341
+ "RS": 199,
342
+ "HI": 200,
343
+ "CG": 201,
344
+ "TS": 202,
345
+ "HP": 203,
346
+ "YF": 204,
347
+ "NK": 205,
348
+ "VD": 206,
349
+ "RW": 207,
350
+ "PQ": 208,
351
+ "RM": 209,
352
+ "LSS": 210,
353
+ "ED": 211,
354
+ "MD": 212,
355
+ "TH": 213,
356
+ "YY": 214,
357
+ "RC": 215,
358
+ "QK": 216,
359
+ "QF": 217,
360
+ "QT": 218,
361
+ "GF": 219,
362
+ "IP": 220,
363
+ "MP": 221,
364
+ "VP": 222,
365
+ "SA": 223,
366
+ "IF": 224,
367
+ "EK": 225,
368
+ "HD": 226,
369
+ "QR": 227,
370
+ "SLL": 228,
371
+ "QN": 229,
372
+ "HF": 230,
373
+ "VF": 231,
374
+ "YP": 232,
375
+ "GT": 233,
376
+ "DT": 234,
377
+ "GP": 235,
378
+ "MK": 236,
379
+ "CV": 237,
380
+ "MT": 238,
381
+ "AGG": 239,
382
+ "VT": 240,
383
+ "DY": 241,
384
+ "ALR": 242,
385
+ "ALV": 243,
386
+ "NR": 244,
387
+ "DK": 245,
388
+ "IT": 246,
389
+ "GK": 247,
390
+ "FP": 248,
391
+ "QY": 249,
392
+ "GR": 250,
393
+ "DR": 251,
394
+ "SAA": 252,
395
+ "ER": 253,
396
+ "LGG": 254,
397
+ "ALS": 255,
398
+ "EP": 256,
399
+ "ALG": 257,
400
+ "FT": 258,
401
+ "ASS": 259,
402
+ "HH": 260,
403
+ "ET": 261,
404
+ "EQ": 262,
405
+ "DN": 263,
406
+ "IK": 264,
407
+ "WV": 265,
408
+ "YT": 266,
409
+ "IN": 267,
410
+ "SLS": 268,
411
+ "MN": 269,
412
+ "QH": 270,
413
+ "ALE": 271,
414
+ "GN": 272,
415
+ "MF": 273,
416
+ "GY": 274,
417
+ "IY": 275,
418
+ "KH": 276,
419
+ "EN": 277,
420
+ "EF": 278,
421
+ "DQ": 279,
422
+ "PR": 280,
423
+ "KS": 281,
424
+ "GQ": 282,
425
+ "AAV": 283,
426
+ "YN": 284,
427
+ "ALT": 285,
428
+ "ARR": 286,
429
+ "AAG": 287,
430
+ "PN": 288,
431
+ "SLA": 289,
432
+ "RLL": 290,
433
+ "FY": 291,
434
+ "FN": 292,
435
+ "PK": 293,
436
+ "MQ": 294,
437
+ "ALP": 295,
438
+ "MR": 296,
439
+ "ALD": 297,
440
+ "CI": 298,
441
+ "SGG": 299,
442
+ "WI": 300,
443
+ "HT": 301,
444
+ "CE": 302,
445
+ "WG": 303,
446
+ "YK": 304,
447
+ "YQ": 305,
448
+ "CP": 306,
449
+ "HR": 307,
450
+ "VR": 308,
451
+ "SAS": 309,
452
+ "WE": 310,
453
+ "HQ": 311,
454
+ "ALI": 312,
455
+ "YR": 313,
456
+ "IQ": 314,
457
+ "FK": 315,
458
+ "VK": 316,
459
+ "ALK": 317,
460
+ "ADG": 318,
461
+ "SLV": 319,
462
+ "VN": 320,
463
+ "CD": 321,
464
+ "XX": 322,
465
+ "AEE": 323,
466
+ "SLP": 324,
467
+ "LAG": 325,
468
+ "IR": 326,
469
+ "VQ": 327,
470
+ "FQ": 328,
471
+ "TW": 329,
472
+ "SLT": 330,
473
+ "SLG": 331,
474
+ "TC": 332,
475
+ "PY": 333,
476
+ "SLR": 334,
477
+ "LAE": 335,
478
+ "LLV": 336,
479
+ "HY": 337,
480
+ "LLG": 338,
481
+ "LAV": 339,
482
+ "FR": 340,
483
+ "SLE": 341,
484
+ "KM": 342,
485
+ "HN": 343,
486
+ "SAV": 344,
487
+ "SAG": 345,
488
+ "DW": 346,
489
+ "LLE": 347,
490
+ "ALQ": 348,
491
+ "TM": 349,
492
+ "SLI": 350,
493
+ "AAE": 351,
494
+ "SAT": 352,
495
+ "CF": 353,
496
+ "DH": 354,
497
+ "SLD": 355,
498
+ "HK": 356,
499
+ "STT": 357,
500
+ "SLK": 358,
501
+ "EY": 359,
502
+ "GGG": 360,
503
+ "VY": 361,
504
+ "KW": 362,
505
+ "LSG": 363,
506
+ "AAAA": 364,
507
+ "PH": 365,
508
+ "ALF": 366,
509
+ "MM": 367,
510
+ "SAP": 368,
511
+ "SVV": 369,
512
+ "LEE": 370,
513
+ "RAA": 371,
514
+ "WD": 372,
515
+ "NH": 373,
516
+ "CT": 374,
517
+ "MY": 375,
518
+ "ALN": 376,
519
+ "AVV": 377,
520
+ "RLR": 378,
521
+ "ASG": 379,
522
+ "WT": 380,
523
+ "SEE": 381,
524
+ "SRR": 382,
525
+ "DM": 383,
526
+ "LSV": 384,
527
+ "KC": 385,
528
+ "TAA": 386,
529
+ "WQ": 387,
530
+ "IH": 388,
531
+ "AKK": 389,
532
+ "LSE": 390,
533
+ "SSG": 391,
534
+ "LVV": 392,
535
+ "AGV": 393,
536
+ "WP": 394,
537
+ "LLD": 395,
538
+ "SLF": 396,
539
+ "WF": 397,
540
+ "WR": 398,
541
+ "GH": 399,
542
+ "LLP": 400,
543
+ "CR": 401,
544
+ "LGV": 402,
545
+ "WN": 403,
546
+ "LLI": 404,
547
+ "SAI": 405,
548
+ "CN": 406,
549
+ "SLN": 407,
550
+ "LKE": 408,
551
+ "SAE": 409,
552
+ "LRE": 410,
553
+ "SAR": 411,
554
+ "LDE": 412,
555
+ "SDG": 413,
556
+ "FH": 414,
557
+ "CQ": 415,
558
+ "AAP": 416,
559
+ "LAD": 417,
560
+ "WK": 418,
561
+ "LTG": 419,
562
+ "TSS": 420,
563
+ "ASV": 421,
564
+ "AKE": 422,
565
+ "MH": 423,
566
+ "LVE": 424,
567
+ "LVG": 425,
568
+ "SLQ": 426,
569
+ "YH": 427,
570
+ "EEE": 428,
571
+ "SAD": 429,
572
+ "TLL": 430,
573
+ "CK": 431,
574
+ "RLA": 432,
575
+ "ATG": 433,
576
+ "QM": 434,
577
+ "SSV": 435,
578
+ "NM": 436,
579
+ "SKK": 437,
580
+ "LTV": 438,
581
+ "CC": 439,
582
+ "VVV": 440,
583
+ "AAI": 441,
584
+ "LSP": 442,
585
+ "AVG": 443,
586
+ "SSSS": 444,
587
+ "LSI": 445,
588
+ "ATV": 446,
589
+ "DC": 447,
590
+ "GM": 448,
591
+ "LPP": 449,
592
+ "ANG": 450,
593
+ "LAI": 451,
594
+ "FC": 452,
595
+ "SDE": 453,
596
+ "NC": 454,
597
+ "EH": 455,
598
+ "KLL": 456,
599
+ "SDI": 457,
600
+ "AKV": 458,
601
+ "LPV": 459,
602
+ "ALY": 460,
603
+ "LSD": 461,
604
+ "SDV": 462,
605
+ "SKI": 463,
606
+ "LGI": 464,
607
+ "PPP": 465,
608
+ "GGV": 466,
609
+ "SSP": 467,
610
+ "AKI": 468,
611
+ "TLT": 469,
612
+ "LDG": 470,
613
+ "AAD": 471,
614
+ "AVE": 472,
615
+ "LGE": 473,
616
+ "AGE": 474,
617
+ "NW": 475,
618
+ "TAT": 476,
619
+ "CY": 477,
620
+ "LPE": 478,
621
+ "LLF": 479,
622
+ "RLV": 480,
623
+ "LIE": 481,
624
+ "GW": 482,
625
+ "QW": 483,
626
+ "AEV": 484,
627
+ "LTE": 485,
628
+ "RLE": 486,
629
+ "SGV": 487,
630
+ "SSI": 488,
631
+ "LDV": 489,
632
+ "PM": 490,
633
+ "RAR": 491,
634
+ "ALH": 492,
635
+ "LRV": 493,
636
+ "SKE": 494,
637
+ "APV": 495,
638
+ "FM": 496,
639
+ "LIG": 497,
640
+ "SAF": 498,
641
+ "TLA": 499,
642
+ "DLL": 500,
643
+ "DAA": 501,
644
+ "PW": 502,
645
+ "AGI": 503,
646
+ "ADV": 504,
647
+ "LIV": 505,
648
+ "LPG": 506,
649
+ "DGV": 507,
650
+ "PAA": 508,
651
+ "FW": 509,
652
+ "LRG": 510,
653
+ "CH": 511,
654
+ "RLG": 512,
655
+ "ARV": 513,
656
+ "LLQ": 514,
657
+ "IM": 515,
658
+ "TAS": 516,
659
+ "SNI": 517,
660
+ "KLK": 518,
661
+ "LEV": 519,
662
+ "TLS": 520,
663
+ "TGG": 521,
664
+ "IC": 522,
665
+ "SDD": 523,
666
+ "RAG": 524,
667
+ "SLY": 525,
668
+ "RAV": 526,
669
+ "EEV": 527,
670
+ "STV": 528,
671
+ "XXXX": 529,
672
+ "SAQ": 530,
673
+ "AIV": 531,
674
+ "SNG": 532,
675
+ "ARE": 533,
676
+ "LAP": 534,
677
+ "RLS": 535,
678
+ "RGG": 536,
679
+ "YW": 537,
680
+ "APG": 538,
681
+ "YC": 539,
682
+ "LEG": 540,
683
+ "VVG": 541,
684
+ "SSE": 542,
685
+ "LEK": 543,
686
+ "ASE": 544,
687
+ "LLK": 545,
688
+ "TAV": 546,
689
+ "LVD": 547,
690
+ "ANV": 548,
691
+ "TGE": 549,
692
+ "SGE": 550,
693
+ "EEI": 551,
694
+ "LLN": 552,
695
+ "QQQQ": 553,
696
+ "ASP": 554,
697
+ "SKV": 555,
698
+ "LAQ": 556,
699
+ "TLR": 557,
700
+ "AEG": 558,
701
+ "STG": 559,
702
+ "ANI": 560,
703
+ "RRV": 561,
704
+ "LVI": 562,
705
+ "LKK": 563,
706
+ "APP": 564,
707
+ "VVE": 565,
708
+ "YM": 566,
709
+ "RRG": 567,
710
+ "LQE": 568,
711
+ "LLT": 569,
712
+ "LSF": 570,
713
+ "ADE": 571,
714
+ "QC": 572,
715
+ "AIE": 573,
716
+ "ARG": 574,
717
+ "LTP": 575,
718
+ "KKI": 576,
719
+ "TAG": 577,
720
+ "DEV": 578,
721
+ "LRD": 579,
722
+ "AIG": 580,
723
+ "RSS": 581,
724
+ "LDD": 582,
725
+ "RSR": 583,
726
+ "ASI": 584,
727
+ "HC": 585,
728
+ "WY": 586,
729
+ "LID": 587,
730
+ "ALM": 588,
731
+ "AVI": 589,
732
+ "LNE": 590,
733
+ "PC": 591,
734
+ "DGE": 592,
735
+ "AAQ": 593,
736
+ "SSD": 594,
737
+ "LED": 595,
738
+ "SNV": 596,
739
+ "TST": 597,
740
+ "LII": 598,
741
+ "LTD": 599,
742
+ "TLV": 600,
743
+ "LKV": 601,
744
+ "LTI": 602,
745
+ "LFV": 603,
746
+ "RSG": 604,
747
+ "AEI": 605,
748
+ "QLL": 606,
749
+ "RLP": 607,
750
+ "LEI": 608,
751
+ "LFG": 609,
752
+ "SPV": 610,
753
+ "TTV": 611,
754
+ "LDI": 612,
755
+ "TLP": 613,
756
+ "LGD": 614,
757
+ "SAK": 615,
758
+ "SIV": 616,
759
+ "LSK": 617,
760
+ "SVE": 618,
761
+ "AGD": 619,
762
+ "ALAA": 620,
763
+ "LAK": 621,
764
+ "TGV": 622,
765
+ "KKE": 623,
766
+ "TSG": 624,
767
+ "NLL": 625,
768
+ "KEI": 626,
769
+ "GGE": 627,
770
+ "LAF": 628,
771
+ "HW": 629,
772
+ "LSQ": 630,
773
+ "RVV": 631,
774
+ "SVG": 632,
775
+ "AAF": 633,
776
+ "ANE": 634,
777
+ "APE": 635,
778
+ "AAT": 636,
779
+ "LKD": 637,
780
+ "PLL": 638,
781
+ "LKI": 639,
782
+ "LSN": 640,
783
+ "LEQ": 641,
784
+ "RLT": 642,
785
+ "ATP": 643,
786
+ "SPE": 644,
787
+ "RAE": 645,
788
+ "RLD": 646,
789
+ "LGF": 647,
790
+ "TVV": 648,
791
+ "SEV": 649,
792
+ "DEI": 650,
793
+ "SGI": 651,
794
+ "STP": 652,
795
+ "GVG": 653,
796
+ "LKG": 654,
797
+ "SLH": 655,
798
+ "RRE": 656,
799
+ "HM": 657,
800
+ "AVD": 658,
801
+ "LNG": 659,
802
+ "LAT": 660,
803
+ "SVI": 661,
804
+ "DVE": 662,
805
+ "KAA": 663,
806
+ "ATE": 664,
807
+ "ATI": 665,
808
+ "SSF": 666,
809
+ "SNE": 667,
810
+ "LKN": 668,
811
+ "RLI": 669,
812
+ "AVP": 670,
813
+ "SAN": 671,
814
+ "LEN": 672,
815
+ "LVP": 673,
816
+ "ADI": 674,
817
+ "SRV": 675,
818
+ "EEG": 676,
819
+ "SII": 677,
820
+ "GGGG": 678,
821
+ "RLQ": 679,
822
+ "LPD": 680,
823
+ "DIV": 681,
824
+ "SEI": 682,
825
+ "LNV": 683,
826
+ "TLD": 684,
827
+ "QAA": 685,
828
+ "ASD": 686,
829
+ "TTG": 687,
830
+ "DDD": 688,
831
+ "LRI": 689,
832
+ "TVE": 690,
833
+ "MC": 691,
834
+ "STI": 692,
835
+ "REV": 693,
836
+ "SPP": 694,
837
+ "SIE": 695,
838
+ "WH": 696,
839
+ "SAY": 697,
840
+ "LAN": 698,
841
+ "MKK": 699,
842
+ "KEE": 700,
843
+ "TLG": 701,
844
+ "ARI": 702,
845
+ "AFV": 703,
846
+ "LRQ": 704,
847
+ "SGD": 705,
848
+ "TLE": 706,
849
+ "SVP": 707,
850
+ "LDP": 708,
851
+ "SSN": 709,
852
+ "LNI": 710,
853
+ "GGI": 711,
854
+ "DGD": 712,
855
+ "AGP": 713,
856
+ "FLL": 714,
857
+ "LAR": 715,
858
+ "ADD": 716,
859
+ "RIV": 717,
860
+ "KEV": 718,
861
+ "KKV": 719,
862
+ "TPP": 720,
863
+ "TAP": 721,
864
+ "LRP": 722,
865
+ "SIG": 723,
866
+ "AII": 724,
867
+ "KII": 725,
868
+ "VVD": 726,
869
+ "RRI": 727,
870
+ "TSP": 728,
871
+ "WM": 729,
872
+ "SRG": 730,
873
+ "LFE": 731,
874
+ "RGE": 732,
875
+ "RVE": 733,
876
+ "RLK": 734,
877
+ "TAE": 735,
878
+ "TTP": 736,
879
+ "LVF": 737,
880
+ "LFI": 738,
881
+ "ALC": 739,
882
+ "MAA": 740,
883
+ "SQQ": 741,
884
+ "DIE": 742,
885
+ "LQV": 743,
886
+ "REE": 744,
887
+ "AQV": 745,
888
+ "LRK": 746,
889
+ "LPI": 747,
890
+ "WW": 748,
891
+ "DED": 749,
892
+ "PPPP": 750,
893
+ "TLI": 751,
894
+ "RPG": 752,
895
+ "RAS": 753,
896
+ "RSV": 754,
897
+ "DGI": 755,
898
+ "KLI": 756,
899
+ "STE": 757,
900
+ "GGD": 758,
901
+ "SEG": 759,
902
+ "SPG": 760,
903
+ "ADP": 761,
904
+ "AGF": 762,
905
+ "AFG": 763,
906
+ "RGV": 764,
907
+ "VVI": 765,
908
+ "DVI": 766,
909
+ "TVG": 767,
910
+ "ARP": 768,
911
+ "AID": 769,
912
+ "RIE": 770,
913
+ "TLK": 771,
914
+ "TSV": 772,
915
+ "SFV": 773,
916
+ "TGI": 774,
917
+ "YLL": 775,
918
+ "SRE": 776,
919
+ "REI": 777,
920
+ "PPG": 778,
921
+ "RDG": 779,
922
+ "SRI": 780,
923
+ "NSS": 781,
924
+ "PEV": 782,
925
+ "LQQ": 783,
926
+ "TPV": 784,
927
+ "RRP": 785,
928
+ "KSS": 786,
929
+ "TTI": 787,
930
+ "KIE": 788,
931
+ "PGE": 789,
932
+ "LQG": 790,
933
+ "MLL": 791,
934
+ "SLM": 792,
935
+ "LGP": 793,
936
+ "RPV": 794,
937
+ "MW": 795,
938
+ "ASF": 796,
939
+ "KLV": 797,
940
+ "LND": 798,
941
+ "AKG": 799
942
+ },
943
+ "merges": [
944
+ "A A",
945
+ "L L",
946
+ "S S",
947
+ "L A",
948
+ "L S",
949
+ "G G",
950
+ "L V",
951
+ "L R",
952
+ "L E",
953
+ "L G",
954
+ "L T",
955
+ "A V",
956
+ "A G",
957
+ "L P",
958
+ "L D",
959
+ "L I",
960
+ "A S",
961
+ "E E",
962
+ "R R",
963
+ "L K",
964
+ "V V",
965
+ "A T",
966
+ "A E",
967
+ "S G",
968
+ "D G",
969
+ "A R",
970
+ "K K",
971
+ "A I",
972
+ "A P",
973
+ "T T",
974
+ "L N",
975
+ "L F",
976
+ "L Q",
977
+ "A D",
978
+ "S V",
979
+ "S T",
980
+ "S I",
981
+ "S P",
982
+ "D E",
983
+ "T G",
984
+ "T V",
985
+ "S R",
986
+ "S E",
987
+ "D V",
988
+ "P P",
989
+ "K E",
990
+ "K I",
991
+ "D I",
992
+ "G V",
993
+ "A Q",
994
+ "A F",
995
+ "R V",
996
+ "T I",
997
+ "N I",
998
+ "P V",
999
+ "R E",
1000
+ "S F",
1001
+ "K V",
1002
+ "N G",
1003
+ "L Y",
1004
+ "R I",
1005
+ "P G",
1006
+ "R G",
1007
+ "D D",
1008
+ "P E",
1009
+ "A K",
1010
+ "N V",
1011
+ "S D",
1012
+ "T E",
1013
+ "Q Q",
1014
+ "N E",
1015
+ "S K",
1016
+ "L H",
1017
+ "S Q",
1018
+ "G I",
1019
+ "F V",
1020
+ "T P",
1021
+ "G E",
1022
+ "S N",
1023
+ "F I",
1024
+ "A Y",
1025
+ "A N",
1026
+ "Q V",
1027
+ "R K",
1028
+ "S Y",
1029
+ "I V",
1030
+ "F E",
1031
+ "D P",
1032
+ "R P",
1033
+ "I E",
1034
+ "Q E",
1035
+ "F G",
1036
+ "L M",
1037
+ "N N",
1038
+ "K G",
1039
+ "R T",
1040
+ "R D",
1041
+ "R Q",
1042
+ "I I",
1043
+ "T D",
1044
+ "A H",
1045
+ "A M",
1046
+ "Y V",
1047
+ "R F",
1048
+ "E V",
1049
+ "K N",
1050
+ "K D",
1051
+ "I G",
1052
+ "L C",
1053
+ "K T",
1054
+ "K P",
1055
+ "R Y",
1056
+ "S H",
1057
+ "Q G",
1058
+ "N P",
1059
+ "Q I",
1060
+ "F D",
1061
+ "Y G",
1062
+ "R N",
1063
+ "Y E",
1064
+ "T F",
1065
+ "M V",
1066
+ "R H",
1067
+ "L W",
1068
+ "Q P",
1069
+ "T N",
1070
+ "D F",
1071
+ "K Q",
1072
+ "Y I",
1073
+ "M E",
1074
+ "V E",
1075
+ "L AA",
1076
+ "P D",
1077
+ "F F",
1078
+ "P I",
1079
+ "A C",
1080
+ "N D",
1081
+ "V G",
1082
+ "T Y",
1083
+ "T Q",
1084
+ "S M",
1085
+ "A W",
1086
+ "K Y",
1087
+ "H G",
1088
+ "S C",
1089
+ "H V",
1090
+ "I D",
1091
+ "K F",
1092
+ "E G",
1093
+ "K R",
1094
+ "E I",
1095
+ "M G",
1096
+ "T R",
1097
+ "N F",
1098
+ "S W",
1099
+ "T K",
1100
+ "Y D",
1101
+ "N Q",
1102
+ "A LL",
1103
+ "M I",
1104
+ "P T",
1105
+ "N Y",
1106
+ "Q D",
1107
+ "G D",
1108
+ "N T",
1109
+ "H E",
1110
+ "V I",
1111
+ "P F",
1112
+ "A LA",
1113
+ "R S",
1114
+ "H I",
1115
+ "C G",
1116
+ "T S",
1117
+ "H P",
1118
+ "Y F",
1119
+ "N K",
1120
+ "V D",
1121
+ "R W",
1122
+ "P Q",
1123
+ "R M",
1124
+ "L SS",
1125
+ "E D",
1126
+ "M D",
1127
+ "T H",
1128
+ "Y Y",
1129
+ "R C",
1130
+ "Q K",
1131
+ "Q F",
1132
+ "Q T",
1133
+ "G F",
1134
+ "I P",
1135
+ "M P",
1136
+ "V P",
1137
+ "S A",
1138
+ "I F",
1139
+ "E K",
1140
+ "H D",
1141
+ "Q R",
1142
+ "S LL",
1143
+ "Q N",
1144
+ "H F",
1145
+ "V F",
1146
+ "Y P",
1147
+ "G T",
1148
+ "D T",
1149
+ "G P",
1150
+ "M K",
1151
+ "C V",
1152
+ "M T",
1153
+ "A GG",
1154
+ "V T",
1155
+ "D Y",
1156
+ "A LR",
1157
+ "A LV",
1158
+ "N R",
1159
+ "D K",
1160
+ "I T",
1161
+ "G K",
1162
+ "F P",
1163
+ "Q Y",
1164
+ "G R",
1165
+ "D R",
1166
+ "S AA",
1167
+ "E R",
1168
+ "L GG",
1169
+ "A LS",
1170
+ "E P",
1171
+ "A LG",
1172
+ "F T",
1173
+ "A SS",
1174
+ "H H",
1175
+ "E T",
1176
+ "E Q",
1177
+ "D N",
1178
+ "I K",
1179
+ "W V",
1180
+ "Y T",
1181
+ "I N",
1182
+ "S LS",
1183
+ "M N",
1184
+ "Q H",
1185
+ "A LE",
1186
+ "G N",
1187
+ "M F",
1188
+ "G Y",
1189
+ "I Y",
1190
+ "K H",
1191
+ "E N",
1192
+ "E F",
1193
+ "D Q",
1194
+ "P R",
1195
+ "K S",
1196
+ "G Q",
1197
+ "AA V",
1198
+ "Y N",
1199
+ "A LT",
1200
+ "A RR",
1201
+ "AA G",
1202
+ "P N",
1203
+ "S LA",
1204
+ "R LL",
1205
+ "F Y",
1206
+ "F N",
1207
+ "P K",
1208
+ "M Q",
1209
+ "A LP",
1210
+ "M R",
1211
+ "A LD",
1212
+ "C I",
1213
+ "S GG",
1214
+ "W I",
1215
+ "H T",
1216
+ "C E",
1217
+ "W G",
1218
+ "Y K",
1219
+ "Y Q",
1220
+ "C P",
1221
+ "H R",
1222
+ "V R",
1223
+ "S AS",
1224
+ "W E",
1225
+ "H Q",
1226
+ "A LI",
1227
+ "Y R",
1228
+ "I Q",
1229
+ "F K",
1230
+ "V K",
1231
+ "A LK",
1232
+ "A DG",
1233
+ "S LV",
1234
+ "V N",
1235
+ "C D",
1236
+ "X X",
1237
+ "A EE",
1238
+ "S LP",
1239
+ "LA G",
1240
+ "I R",
1241
+ "V Q",
1242
+ "F Q",
1243
+ "T W",
1244
+ "S LT",
1245
+ "S LG",
1246
+ "T C",
1247
+ "P Y",
1248
+ "S LR",
1249
+ "LA E",
1250
+ "LL V",
1251
+ "H Y",
1252
+ "LL G",
1253
+ "LA V",
1254
+ "F R",
1255
+ "S LE",
1256
+ "K M",
1257
+ "H N",
1258
+ "S AV",
1259
+ "S AG",
1260
+ "D W",
1261
+ "LL E",
1262
+ "A LQ",
1263
+ "T M",
1264
+ "S LI",
1265
+ "AA E",
1266
+ "S AT",
1267
+ "C F",
1268
+ "D H",
1269
+ "S LD",
1270
+ "H K",
1271
+ "S TT",
1272
+ "S LK",
1273
+ "E Y",
1274
+ "GG G",
1275
+ "V Y",
1276
+ "K W",
1277
+ "LS G",
1278
+ "AA AA",
1279
+ "P H",
1280
+ "A LF",
1281
+ "M M",
1282
+ "S AP",
1283
+ "S VV",
1284
+ "LE E",
1285
+ "R AA",
1286
+ "W D",
1287
+ "N H",
1288
+ "C T",
1289
+ "M Y",
1290
+ "A LN",
1291
+ "AV V",
1292
+ "R LR",
1293
+ "AS G",
1294
+ "W T",
1295
+ "S EE",
1296
+ "S RR",
1297
+ "D M",
1298
+ "LS V",
1299
+ "K C",
1300
+ "T AA",
1301
+ "W Q",
1302
+ "I H",
1303
+ "A KK",
1304
+ "LS E",
1305
+ "SS G",
1306
+ "LV V",
1307
+ "AG V",
1308
+ "W P",
1309
+ "LL D",
1310
+ "S LF",
1311
+ "W F",
1312
+ "W R",
1313
+ "G H",
1314
+ "LL P",
1315
+ "C R",
1316
+ "LG V",
1317
+ "W N",
1318
+ "LL I",
1319
+ "S AI",
1320
+ "C N",
1321
+ "S LN",
1322
+ "LK E",
1323
+ "S AE",
1324
+ "LR E",
1325
+ "S AR",
1326
+ "LD E",
1327
+ "S DG",
1328
+ "F H",
1329
+ "C Q",
1330
+ "AA P",
1331
+ "LA D",
1332
+ "W K",
1333
+ "LT G",
1334
+ "T SS",
1335
+ "AS V",
1336
+ "A KE",
1337
+ "M H",
1338
+ "LV E",
1339
+ "LV G",
1340
+ "S LQ",
1341
+ "Y H",
1342
+ "EE E",
1343
+ "S AD",
1344
+ "T LL",
1345
+ "C K",
1346
+ "R LA",
1347
+ "AT G",
1348
+ "Q M",
1349
+ "SS V",
1350
+ "N M",
1351
+ "S KK",
1352
+ "LT V",
1353
+ "C C",
1354
+ "VV V",
1355
+ "AA I",
1356
+ "LS P",
1357
+ "AV G",
1358
+ "SS SS",
1359
+ "LS I",
1360
+ "AT V",
1361
+ "D C",
1362
+ "G M",
1363
+ "LP P",
1364
+ "A NG",
1365
+ "LA I",
1366
+ "F C",
1367
+ "S DE",
1368
+ "N C",
1369
+ "E H",
1370
+ "K LL",
1371
+ "S DI",
1372
+ "A KV",
1373
+ "LP V",
1374
+ "A LY",
1375
+ "LS D",
1376
+ "S DV",
1377
+ "S KI",
1378
+ "LG I",
1379
+ "PP P",
1380
+ "GG V",
1381
+ "SS P",
1382
+ "A KI",
1383
+ "T LT",
1384
+ "LD G",
1385
+ "AA D",
1386
+ "AV E",
1387
+ "LG E",
1388
+ "AG E",
1389
+ "N W",
1390
+ "T AT",
1391
+ "C Y",
1392
+ "LP E",
1393
+ "LL F",
1394
+ "R LV",
1395
+ "LI E",
1396
+ "G W",
1397
+ "Q W",
1398
+ "AE V",
1399
+ "LT E",
1400
+ "R LE",
1401
+ "SG V",
1402
+ "SS I",
1403
+ "LD V",
1404
+ "P M",
1405
+ "R AR",
1406
+ "A LH",
1407
+ "LR V",
1408
+ "S KE",
1409
+ "AP V",
1410
+ "F M",
1411
+ "LI G",
1412
+ "S AF",
1413
+ "T LA",
1414
+ "D LL",
1415
+ "D AA",
1416
+ "P W",
1417
+ "AG I",
1418
+ "AD V",
1419
+ "LI V",
1420
+ "LP G",
1421
+ "DG V",
1422
+ "P AA",
1423
+ "F W",
1424
+ "LR G",
1425
+ "C H",
1426
+ "R LG",
1427
+ "AR V",
1428
+ "LL Q",
1429
+ "I M",
1430
+ "T AS",
1431
+ "S NI",
1432
+ "K LK",
1433
+ "LE V",
1434
+ "T LS",
1435
+ "T GG",
1436
+ "I C",
1437
+ "S DD",
1438
+ "R AG",
1439
+ "S LY",
1440
+ "R AV",
1441
+ "EE V",
1442
+ "ST V",
1443
+ "XX XX",
1444
+ "S AQ",
1445
+ "AI V",
1446
+ "S NG",
1447
+ "AR E",
1448
+ "LA P",
1449
+ "R LS",
1450
+ "R GG",
1451
+ "Y W",
1452
+ "AP G",
1453
+ "Y C",
1454
+ "LE G",
1455
+ "VV G",
1456
+ "SS E",
1457
+ "LE K",
1458
+ "AS E",
1459
+ "LL K",
1460
+ "T AV",
1461
+ "LV D",
1462
+ "A NV",
1463
+ "TG E",
1464
+ "SG E",
1465
+ "EE I",
1466
+ "LL N",
1467
+ "QQ QQ",
1468
+ "AS P",
1469
+ "S KV",
1470
+ "LA Q",
1471
+ "T LR",
1472
+ "AE G",
1473
+ "ST G",
1474
+ "A NI",
1475
+ "RR V",
1476
+ "LV I",
1477
+ "LK K",
1478
+ "AP P",
1479
+ "VV E",
1480
+ "Y M",
1481
+ "RR G",
1482
+ "LQ E",
1483
+ "LL T",
1484
+ "LS F",
1485
+ "AD E",
1486
+ "Q C",
1487
+ "AI E",
1488
+ "AR G",
1489
+ "LT P",
1490
+ "KK I",
1491
+ "T AG",
1492
+ "DE V",
1493
+ "LR D",
1494
+ "AI G",
1495
+ "R SS",
1496
+ "LD D",
1497
+ "R SR",
1498
+ "AS I",
1499
+ "H C",
1500
+ "W Y",
1501
+ "LI D",
1502
+ "A LM",
1503
+ "AV I",
1504
+ "LN E",
1505
+ "P C",
1506
+ "DG E",
1507
+ "AA Q",
1508
+ "SS D",
1509
+ "LE D",
1510
+ "S NV",
1511
+ "T ST",
1512
+ "LI I",
1513
+ "LT D",
1514
+ "T LV",
1515
+ "LK V",
1516
+ "LT I",
1517
+ "LF V",
1518
+ "R SG",
1519
+ "AE I",
1520
+ "Q LL",
1521
+ "R LP",
1522
+ "LE I",
1523
+ "LF G",
1524
+ "SP V",
1525
+ "TT V",
1526
+ "LD I",
1527
+ "T LP",
1528
+ "LG D",
1529
+ "S AK",
1530
+ "SI V",
1531
+ "LS K",
1532
+ "SV E",
1533
+ "AG D",
1534
+ "A LAA",
1535
+ "LA K",
1536
+ "TG V",
1537
+ "KK E",
1538
+ "T SG",
1539
+ "N LL",
1540
+ "KE I",
1541
+ "GG E",
1542
+ "LA F",
1543
+ "H W",
1544
+ "LS Q",
1545
+ "R VV",
1546
+ "SV G",
1547
+ "AA F",
1548
+ "A NE",
1549
+ "AP E",
1550
+ "AA T",
1551
+ "LK D",
1552
+ "P LL",
1553
+ "LK I",
1554
+ "LS N",
1555
+ "LE Q",
1556
+ "R LT",
1557
+ "AT P",
1558
+ "SP E",
1559
+ "R AE",
1560
+ "R LD",
1561
+ "LG F",
1562
+ "T VV",
1563
+ "SE V",
1564
+ "DE I",
1565
+ "SG I",
1566
+ "ST P",
1567
+ "GV G",
1568
+ "LK G",
1569
+ "S LH",
1570
+ "RR E",
1571
+ "H M",
1572
+ "AV D",
1573
+ "LN G",
1574
+ "LA T",
1575
+ "SV I",
1576
+ "DV E",
1577
+ "K AA",
1578
+ "AT E",
1579
+ "AT I",
1580
+ "SS F",
1581
+ "S NE",
1582
+ "LK N",
1583
+ "R LI",
1584
+ "AV P",
1585
+ "S AN",
1586
+ "LE N",
1587
+ "LV P",
1588
+ "AD I",
1589
+ "SR V",
1590
+ "EE G",
1591
+ "SI I",
1592
+ "GG GG",
1593
+ "R LQ",
1594
+ "LP D",
1595
+ "DI V",
1596
+ "SE I",
1597
+ "LN V",
1598
+ "T LD",
1599
+ "Q AA",
1600
+ "AS D",
1601
+ "TT G",
1602
+ "DD D",
1603
+ "LR I",
1604
+ "TV E",
1605
+ "M C",
1606
+ "ST I",
1607
+ "RE V",
1608
+ "SP P",
1609
+ "SI E",
1610
+ "W H",
1611
+ "S AY",
1612
+ "LA N",
1613
+ "M KK",
1614
+ "K EE",
1615
+ "T LG",
1616
+ "AR I",
1617
+ "AF V",
1618
+ "LR Q",
1619
+ "SG D",
1620
+ "T LE",
1621
+ "SV P",
1622
+ "LD P",
1623
+ "SS N",
1624
+ "LN I",
1625
+ "GG I",
1626
+ "DG D",
1627
+ "AG P",
1628
+ "F LL",
1629
+ "LA R",
1630
+ "AD D",
1631
+ "RI V",
1632
+ "KE V",
1633
+ "KK V",
1634
+ "T PP",
1635
+ "T AP",
1636
+ "LR P",
1637
+ "SI G",
1638
+ "AI I",
1639
+ "KI I",
1640
+ "VV D",
1641
+ "RR I",
1642
+ "T SP",
1643
+ "W M",
1644
+ "SR G",
1645
+ "LF E",
1646
+ "RG E",
1647
+ "RV E",
1648
+ "R LK",
1649
+ "T AE",
1650
+ "TT P",
1651
+ "LV F",
1652
+ "LF I",
1653
+ "A LC",
1654
+ "M AA",
1655
+ "S QQ",
1656
+ "DI E",
1657
+ "LQ V",
1658
+ "R EE",
1659
+ "AQ V",
1660
+ "LR K",
1661
+ "LP I",
1662
+ "W W",
1663
+ "DE D",
1664
+ "PP PP",
1665
+ "T LI",
1666
+ "R PG",
1667
+ "R AS",
1668
+ "R SV",
1669
+ "DG I",
1670
+ "K LI",
1671
+ "ST E",
1672
+ "GG D",
1673
+ "SE G",
1674
+ "SP G",
1675
+ "AD P",
1676
+ "AG F",
1677
+ "AF G",
1678
+ "R GV",
1679
+ "VV I",
1680
+ "DV I",
1681
+ "TV G",
1682
+ "AR P",
1683
+ "AI D",
1684
+ "RI E",
1685
+ "T LK",
1686
+ "T SV",
1687
+ "SF V",
1688
+ "TG I",
1689
+ "Y LL",
1690
+ "SR E",
1691
+ "RE I",
1692
+ "PP G",
1693
+ "R DG",
1694
+ "SR I",
1695
+ "N SS",
1696
+ "PE V",
1697
+ "LQ Q",
1698
+ "T PV",
1699
+ "RR P",
1700
+ "K SS",
1701
+ "TT I",
1702
+ "KI E",
1703
+ "PG E",
1704
+ "LQ G",
1705
+ "M LL",
1706
+ "S LM",
1707
+ "LG P",
1708
+ "R PV",
1709
+ "M W",
1710
+ "AS F",
1711
+ "K LV",
1712
+ "LN D",
1713
+ "AK G"
1714
+ ]
1715
+ }
1716
+ }
tokenizer_config.json ADDED
@@ -0,0 +1,5 @@
 
 
 
 
 
 
1
+ {
2
+ "clean_up_tokenization_spaces": true,
3
+ "model_max_length": 1000000000000000019884624838656,
4
+ "tokenizer_class": "PreTrainedTokenizerFast"
5
+ }