lhy commited on
Commit
150b03a
1 Parent(s): 6820544

Upload tokenizer

Browse files
Files changed (4) hide show
  1. special_tokens_map.json +7 -0
  2. tokenizer.json +979 -0
  3. tokenizer_config.json +15 -0
  4. vocab.txt +829 -0
special_tokens_map.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": "[CLS]",
3
+ "mask_token": "[MASK]",
4
+ "pad_token": "[PAD]",
5
+ "sep_token": "[SEP]",
6
+ "unk_token": "[UNK]"
7
+ }
tokenizer.json ADDED
@@ -0,0 +1,979 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "version": "1.0",
3
+ "truncation": null,
4
+ "padding": null,
5
+ "added_tokens": [
6
+ {
7
+ "id": 5,
8
+ "content": "\u0001",
9
+ "single_word": false,
10
+ "lstrip": false,
11
+ "rstrip": false,
12
+ "normalized": false,
13
+ "special": true
14
+ },
15
+ {
16
+ "id": 6,
17
+ "content": "\u0002",
18
+ "single_word": false,
19
+ "lstrip": false,
20
+ "rstrip": false,
21
+ "normalized": false,
22
+ "special": true
23
+ },
24
+ {
25
+ "id": 7,
26
+ "content": "\u0003",
27
+ "single_word": false,
28
+ "lstrip": false,
29
+ "rstrip": false,
30
+ "normalized": false,
31
+ "special": true
32
+ },
33
+ {
34
+ "id": 8,
35
+ "content": "\u0004",
36
+ "single_word": false,
37
+ "lstrip": false,
38
+ "rstrip": false,
39
+ "normalized": false,
40
+ "special": true
41
+ },
42
+ {
43
+ "id": 9,
44
+ "content": "\u0005",
45
+ "single_word": false,
46
+ "lstrip": false,
47
+ "rstrip": false,
48
+ "normalized": false,
49
+ "special": true
50
+ }
51
+ ],
52
+ "normalizer": {
53
+ "type": "BertNormalizer",
54
+ "clean_text": true,
55
+ "handle_chinese_chars": false,
56
+ "strip_accents": false,
57
+ "lowercase": false
58
+ },
59
+ "pre_tokenizer": {
60
+ "type": "BertPreTokenizer"
61
+ },
62
+ "post_processor": {
63
+ "type": "TemplateProcessing",
64
+ "single": [
65
+ {
66
+ "SpecialToken": {
67
+ "id": "[CLS]",
68
+ "type_id": 0
69
+ }
70
+ },
71
+ {
72
+ "Sequence": {
73
+ "id": "A",
74
+ "type_id": 0
75
+ }
76
+ },
77
+ {
78
+ "SpecialToken": {
79
+ "id": "[SEP]",
80
+ "type_id": 0
81
+ }
82
+ }
83
+ ],
84
+ "pair": [
85
+ {
86
+ "SpecialToken": {
87
+ "id": "[CLS]",
88
+ "type_id": 0
89
+ }
90
+ },
91
+ {
92
+ "Sequence": {
93
+ "id": "A",
94
+ "type_id": 0
95
+ }
96
+ },
97
+ {
98
+ "SpecialToken": {
99
+ "id": "[SEP]",
100
+ "type_id": 0
101
+ }
102
+ },
103
+ {
104
+ "Sequence": {
105
+ "id": "B",
106
+ "type_id": 1
107
+ }
108
+ },
109
+ {
110
+ "SpecialToken": {
111
+ "id": "[SEP]",
112
+ "type_id": 1
113
+ }
114
+ }
115
+ ],
116
+ "special_tokens": {
117
+ "[CLS]": {
118
+ "id": "[CLS]",
119
+ "ids": [
120
+ 1
121
+ ],
122
+ "tokens": [
123
+ "[CLS]"
124
+ ]
125
+ },
126
+ "[SEP]": {
127
+ "id": "[SEP]",
128
+ "ids": [
129
+ 2
130
+ ],
131
+ "tokens": [
132
+ "[SEP]"
133
+ ]
134
+ }
135
+ }
136
+ },
137
+ "decoder": {
138
+ "type": "WordPiece",
139
+ "prefix": "##",
140
+ "cleanup": true
141
+ },
142
+ "model": {
143
+ "type": "WordPiece",
144
+ "unk_token": "[UNK]",
145
+ "continuing_subword_prefix": "##",
146
+ "max_input_chars_per_word": 100,
147
+ "vocab": {
148
+ "[UNK]": 0,
149
+ "[CLS]": 1,
150
+ "[SEP]": 2,
151
+ "[PAD]": 3,
152
+ "[MASK]": 4,
153
+ "\u0001": 5,
154
+ "\u0002": 6,
155
+ "\u0003": 7,
156
+ "\u0004": 8,
157
+ "\u0005": 9,
158
+ "!": 10,
159
+ "\"": 11,
160
+ "#": 12,
161
+ "$": 13,
162
+ "%": 14,
163
+ "&": 15,
164
+ "'": 16,
165
+ "(": 17,
166
+ ")": 18,
167
+ "*": 19,
168
+ "+": 20,
169
+ ",": 21,
170
+ "-": 22,
171
+ ".": 23,
172
+ "/": 24,
173
+ "0": 25,
174
+ "1": 26,
175
+ "2": 27,
176
+ "3": 28,
177
+ "4": 29,
178
+ "5": 30,
179
+ "6": 31,
180
+ "7": 32,
181
+ "8": 33,
182
+ "9": 34,
183
+ ":": 35,
184
+ ";": 36,
185
+ "<": 37,
186
+ "=": 38,
187
+ ">": 39,
188
+ "?": 40,
189
+ "@": 41,
190
+ "[": 42,
191
+ "\\": 43,
192
+ "]": 44,
193
+ "^": 45,
194
+ "_": 46,
195
+ "`": 47,
196
+ "a": 48,
197
+ "b": 49,
198
+ "c": 50,
199
+ "d": 51,
200
+ "e": 52,
201
+ "f": 53,
202
+ "g": 54,
203
+ "h": 55,
204
+ "i": 56,
205
+ "j": 57,
206
+ "k": 58,
207
+ "l": 59,
208
+ "m": 60,
209
+ "n": 61,
210
+ "o": 62,
211
+ "p": 63,
212
+ "q": 64,
213
+ "r": 65,
214
+ "s": 66,
215
+ "t": 67,
216
+ "u": 68,
217
+ "v": 69,
218
+ "w": 70,
219
+ "x": 71,
220
+ "y": 72,
221
+ "z": 73,
222
+ "{": 74,
223
+ "|": 75,
224
+ "}": 76,
225
+ "~": 77,
226
+ "¡": 78,
227
+ "¢": 79,
228
+ "£": 80,
229
+ "¥": 81,
230
+ "§": 82,
231
+ "¯": 83,
232
+ "µ": 84,
233
+ "º": 85,
234
+ "»": 86,
235
+ "¿": 87,
236
+ "À": 88,
237
+ "Â": 89,
238
+ "Ã": 90,
239
+ "Ä": 91,
240
+ "Å": 92,
241
+ "Ç": 93,
242
+ "Ë": 94,
243
+ "Í": 95,
244
+ "Î": 96,
245
+ "Ï": 97,
246
+ "Ñ": 98,
247
+ "Ó": 99,
248
+ "Ø": 100,
249
+ "Ù": 101,
250
+ "Ú": 102,
251
+ "Ü": 103,
252
+ "ß": 104,
253
+ "à": 105,
254
+ "á": 106,
255
+ "â": 107,
256
+ "ã": 108,
257
+ "ä": 109,
258
+ "å": 110,
259
+ "æ": 111,
260
+ "ç": 112,
261
+ "è": 113,
262
+ "é": 114,
263
+ "ê": 115,
264
+ "ë": 116,
265
+ "ì": 117,
266
+ "í": 118,
267
+ "î": 119,
268
+ "ï": 120,
269
+ "ñ": 121,
270
+ "ò": 122,
271
+ "ó": 123,
272
+ "ô": 124,
273
+ "õ": 125,
274
+ "ö": 126,
275
+ "ø": 127,
276
+ "ù": 128,
277
+ "ú": 129,
278
+ "û": 130,
279
+ "ü": 131,
280
+ "ý": 132,
281
+ "þ": 133,
282
+ "ā": 134,
283
+ "ă": 135,
284
+ "ą": 136,
285
+ "ć": 137,
286
+ "č": 138,
287
+ "ď": 139,
288
+ "đ": 140,
289
+ "ē": 141,
290
+ "ĕ": 142,
291
+ "ė": 143,
292
+ "Ę": 144,
293
+ "ę": 145,
294
+ "ě": 146,
295
+ "ġ": 147,
296
+ "ģ": 148,
297
+ "ĩ": 149,
298
+ "ī": 150,
299
+ "ĭ": 151,
300
+ "İ": 152,
301
+ "ı": 153,
302
+ "ĵ": 154,
303
+ "ķ": 155,
304
+ "ĸ": 156,
305
+ "ĺ": 157,
306
+ "ł": 158,
307
+ "ń": 159,
308
+ "ň": 160,
309
+ "ʼn": 161,
310
+ "ŋ": 162,
311
+ "ō": 163,
312
+ "ŏ": 164,
313
+ "ő": 165,
314
+ "œ": 166,
315
+ "ŕ": 167,
316
+ "ŗ": 168,
317
+ "Ř": 169,
318
+ "ř": 170,
319
+ "Ś": 171,
320
+ "ś": 172,
321
+ "Ş": 173,
322
+ "ş": 174,
323
+ "š": 175,
324
+ "ţ": 176,
325
+ "Ť": 177,
326
+ "ť": 178,
327
+ "ũ": 179,
328
+ "ū": 180,
329
+ "ŭ": 181,
330
+ "ű": 182,
331
+ "ų": 183,
332
+ "ŵ": 184,
333
+ "Ÿ": 185,
334
+ "ż": 186,
335
+ "ž": 187,
336
+ "ƀ": 188,
337
+ "Ɓ": 189,
338
+ "Ƅ": 190,
339
+ "ƅ": 191,
340
+ "Ƈ": 192,
341
+ "ƒ": 193,
342
+ "ƙ": 194,
343
+ "ƞ": 195,
344
+ "Ƭ": 196,
345
+ "Ư": 197,
346
+ "Ƴ": 198,
347
+ "Ǐ": 199,
348
+ "Ƿ": 200,
349
+ "ǹ": 201,
350
+ "ȋ": 202,
351
+ "ș": 203,
352
+ "ț": 204,
353
+ "ȧ": 205,
354
+ "ȯ": 206,
355
+ "Ʌ": 207,
356
+ "ɑ": 208,
357
+ "ɗ": 209,
358
+ "ɠ": 210,
359
+ "ɡ": 211,
360
+ "ɢ": 212,
361
+ "ɣ": 213,
362
+ "ɩ": 214,
363
+ "ɪ": 215,
364
+ "ɭ": 216,
365
+ "ɯ": 217,
366
+ "ɱ": 218,
367
+ "ɳ": 219,
368
+ "ɴ": 220,
369
+ "ɺ": 221,
370
+ "ɼ": 222,
371
+ "ɾ": 223,
372
+ "ʀ": 224,
373
+ "ʂ": 225,
374
+ "ʄ": 226,
375
+ "ʋ": 227,
376
+ "ʌ": 228,
377
+ "ʍ": 229,
378
+ "ʏ": 230,
379
+ "ʙ": 231,
380
+ "ʜ": 232,
381
+ "ʝ": 233,
382
+ "ʟ": 234,
383
+ "ʨ": 235,
384
+ "˄": 236,
385
+ "Α": 237,
386
+ "Β": 238,
387
+ "Ε": 239,
388
+ "Ζ": 240,
389
+ "Η": 241,
390
+ "Ι": 242,
391
+ "Κ": 243,
392
+ "Μ": 244,
393
+ "Ν": 245,
394
+ "Ο": 246,
395
+ "Ρ": 247,
396
+ "Τ": 248,
397
+ "Υ": 249,
398
+ "Χ": 250,
399
+ "ί": 251,
400
+ "α": 252,
401
+ "β": 253,
402
+ "γ": 254,
403
+ "η": 255,
404
+ "ι": 256,
405
+ "κ": 257,
406
+ "μ": 258,
407
+ "ν": 259,
408
+ "ο": 260,
409
+ "π": 261,
410
+ "ρ": 262,
411
+ "σ": 263,
412
+ "τ": 264,
413
+ "υ": 265,
414
+ "χ": 266,
415
+ "ω": 267,
416
+ "ϲ": 268,
417
+ "ϳ": 269,
418
+ "Ϲ": 270,
419
+ "Ϻ": 271,
420
+ "Ѕ": 272,
421
+ "Ј": 273,
422
+ "А": 274,
423
+ "В": 275,
424
+ "Е": 276,
425
+ "З": 277,
426
+ "К": 278,
427
+ "М": 279,
428
+ "Н": 280,
429
+ "О": 281,
430
+ "Р": 282,
431
+ "С": 283,
432
+ "Т": 284,
433
+ "У": 285,
434
+ "Х": 286,
435
+ "Ь": 287,
436
+ "а": 288,
437
+ "в": 289,
438
+ "г": 290,
439
+ "д": 291,
440
+ "е": 292,
441
+ "и": 293,
442
+ "к": 294,
443
+ "л": 295,
444
+ "н": 296,
445
+ "о": 297,
446
+ "п": 298,
447
+ "р": 299,
448
+ "с": 300,
449
+ "т": 301,
450
+ "у": 302,
451
+ "х": 303,
452
+ "ч": 304,
453
+ "ш": 305,
454
+ "щ": 306,
455
+ "ѐ": 307,
456
+ "ё": 308,
457
+ "ѕ": 309,
458
+ "і": 310,
459
+ "ј": 311,
460
+ "џ": 312,
461
+ "ѡ": 313,
462
+ "Ѵ": 314,
463
+ "ѵ": 315,
464
+ "ҏ": 316,
465
+ "қ": 317,
466
+ "ҡ": 318,
467
+ "ң": 319,
468
+ "ҥ": 320,
469
+ "Ү": 321,
470
+ "ү": 322,
471
+ "ҳ": 323,
472
+ "һ": 324,
473
+ "ҽ": 325,
474
+ "ӏ": 326,
475
+ "ԁ": 327,
476
+ "ԛ": 328,
477
+ "Ա": 329,
478
+ "Ի": 330,
479
+ "Ս": 331,
480
+ "Տ": 332,
481
+ "Օ": 333,
482
+ "ա": 334,
483
+ "գ": 335,
484
+ "զ": 336,
485
+ "ժ": 337,
486
+ "հ": 338,
487
+ "յ": 339,
488
+ "ս": 340,
489
+ "օ": 341,
490
+ "Ⴍ": 342,
491
+ "Ⴓ": 343,
492
+ "Ⴝ": 344,
493
+ "Ꭰ": 345,
494
+ "Ꭲ": 346,
495
+ "Ꭵ": 347,
496
+ "Ꭺ": 348,
497
+ "Ꭻ": 349,
498
+ "Ꮃ": 350,
499
+ "Ꮇ": 351,
500
+ "Ꮋ": 352,
501
+ "Ꮐ": 353,
502
+ "Ꮓ": 354,
503
+ "Ꮢ": 355,
504
+ "Ꮩ": 356,
505
+ "Ꮪ": 357,
506
+ "Ꮮ": 358,
507
+ "Ꮯ": 359,
508
+ "Ꮲ": 360,
509
+ "Ꮶ": 361,
510
+ "Ᏼ": 362,
511
+ "ᚱ": 363,
512
+ "ᛁ": 364,
513
+ "ᛒ": 365,
514
+ "ᛕ": 366,
515
+ "ᛖ": 367,
516
+ "ᴄ": 368,
517
+ "ᴇ": 369,
518
+ "ᴋ": 370,
519
+ "ᴍ": 371,
520
+ "ᴏ": 372,
521
+ "ᴑ": 373,
522
+ "ᴜ": 374,
523
+ "ᴠ": 375,
524
+ "ᴡ": 376,
525
+ "ᴦ": 377,
526
+ "ᴨ": 378,
527
+ "ᴺ": 379,
528
+ "ᴼ": 380,
529
+ "ᴾ": 381,
530
+ "ᴿ": 382,
531
+ "ḟ": 383,
532
+ "ḱ": 384,
533
+ "ḿ": 385,
534
+ "ṁ": 386,
535
+ "ṅ": 387,
536
+ "Ṛ": 388,
537
+ "ṡ": 389,
538
+ "ẁ": 390,
539
+ "ẃ": 391,
540
+ "ẇ": 392,
541
+ "ἀ": 393,
542
+ "ἁ": 394,
543
+ "ἇ": 395,
544
+ "ἰ": 396,
545
+ "ἱ": 397,
546
+ "ἳ": 398,
547
+ "ὀ": 399,
548
+ "ὁ": 400,
549
+ "ὶ": 401,
550
+ "ί": 402,
551
+ "ῤ": 403,
552
+ "ῥ": 404,
553
+ "―": 405,
554
+ "₩": 406,
555
+ "€": 407,
556
+ "₿": 408,
557
+ "ℹ": 409,
558
+ "⋃": 410,
559
+ "𝘼": 411,
560
+ "𝘾": 412,
561
+ "𝘿": 413,
562
+ "𝙀": 414,
563
+ "𝙍": 415,
564
+ "𝙏": 416,
565
+ "##\u0001": 417,
566
+ "##\u0002": 418,
567
+ "##\u0003": 419,
568
+ "##\u0004": 420,
569
+ "##\u0005": 421,
570
+ "##!": 422,
571
+ "##\"": 423,
572
+ "###": 424,
573
+ "##$": 425,
574
+ "##%": 426,
575
+ "##&": 427,
576
+ "##'": 428,
577
+ "##(": 429,
578
+ "##)": 430,
579
+ "##*": 431,
580
+ "##+": 432,
581
+ "##,": 433,
582
+ "##-": 434,
583
+ "##.": 435,
584
+ "##/": 436,
585
+ "##0": 437,
586
+ "##1": 438,
587
+ "##2": 439,
588
+ "##3": 440,
589
+ "##4": 441,
590
+ "##5": 442,
591
+ "##6": 443,
592
+ "##7": 444,
593
+ "##8": 445,
594
+ "##9": 446,
595
+ "##:": 447,
596
+ "##;": 448,
597
+ "##<": 449,
598
+ "##=": 450,
599
+ "##>": 451,
600
+ "##?": 452,
601
+ "##@": 453,
602
+ "##[": 454,
603
+ "##\\": 455,
604
+ "##]": 456,
605
+ "##^": 457,
606
+ "##_": 458,
607
+ "##`": 459,
608
+ "##a": 460,
609
+ "##b": 461,
610
+ "##c": 462,
611
+ "##d": 463,
612
+ "##e": 464,
613
+ "##f": 465,
614
+ "##g": 466,
615
+ "##h": 467,
616
+ "##i": 468,
617
+ "##j": 469,
618
+ "##k": 470,
619
+ "##l": 471,
620
+ "##m": 472,
621
+ "##n": 473,
622
+ "##o": 474,
623
+ "##p": 475,
624
+ "##q": 476,
625
+ "##r": 477,
626
+ "##s": 478,
627
+ "##t": 479,
628
+ "##u": 480,
629
+ "##v": 481,
630
+ "##w": 482,
631
+ "##x": 483,
632
+ "##y": 484,
633
+ "##z": 485,
634
+ "##{": 486,
635
+ "##|": 487,
636
+ "##}": 488,
637
+ "##~": 489,
638
+ "##¡": 490,
639
+ "##¢": 491,
640
+ "##£": 492,
641
+ "##¥": 493,
642
+ "##§": 494,
643
+ "##¯": 495,
644
+ "##µ": 496,
645
+ "##º": 497,
646
+ "##»": 498,
647
+ "##¿": 499,
648
+ "##À": 500,
649
+ "##Â": 501,
650
+ "##Ã": 502,
651
+ "##Ä": 503,
652
+ "##Å": 504,
653
+ "##Ç": 505,
654
+ "##Ë": 506,
655
+ "##Í": 507,
656
+ "##Î": 508,
657
+ "##Ï": 509,
658
+ "##Ñ": 510,
659
+ "##Ó": 511,
660
+ "##Ø": 512,
661
+ "##Ù": 513,
662
+ "##Ú": 514,
663
+ "##Ü": 515,
664
+ "##ß": 516,
665
+ "##à": 517,
666
+ "##á": 518,
667
+ "##â": 519,
668
+ "##ã": 520,
669
+ "##ä": 521,
670
+ "##å": 522,
671
+ "##æ": 523,
672
+ "##ç": 524,
673
+ "##è": 525,
674
+ "##é": 526,
675
+ "##ê": 527,
676
+ "##ë": 528,
677
+ "##ì": 529,
678
+ "##í": 530,
679
+ "##î": 531,
680
+ "##ï": 532,
681
+ "##ñ": 533,
682
+ "##ò": 534,
683
+ "##ó": 535,
684
+ "##ô": 536,
685
+ "##õ": 537,
686
+ "##ö": 538,
687
+ "##ø": 539,
688
+ "##ù": 540,
689
+ "##ú": 541,
690
+ "##û": 542,
691
+ "##ü": 543,
692
+ "##ý": 544,
693
+ "##þ": 545,
694
+ "##ā": 546,
695
+ "##ă": 547,
696
+ "##ą": 548,
697
+ "##ć": 549,
698
+ "##č": 550,
699
+ "##ď": 551,
700
+ "##đ": 552,
701
+ "##ē": 553,
702
+ "##ĕ": 554,
703
+ "##ė": 555,
704
+ "##Ę": 556,
705
+ "##ę": 557,
706
+ "##ě": 558,
707
+ "##ġ": 559,
708
+ "##ģ": 560,
709
+ "##ĩ": 561,
710
+ "##ī": 562,
711
+ "##ĭ": 563,
712
+ "##İ": 564,
713
+ "##ı": 565,
714
+ "##ĵ": 566,
715
+ "##ķ": 567,
716
+ "##ĸ": 568,
717
+ "##ĺ": 569,
718
+ "##ł": 570,
719
+ "##ń": 571,
720
+ "##ň": 572,
721
+ "##ʼn": 573,
722
+ "##ŋ": 574,
723
+ "##ō": 575,
724
+ "##ŏ": 576,
725
+ "##ő": 577,
726
+ "##œ": 578,
727
+ "##ŕ": 579,
728
+ "##ŗ": 580,
729
+ "##Ř": 581,
730
+ "##ř": 582,
731
+ "##Ś": 583,
732
+ "##ś": 584,
733
+ "##Ş": 585,
734
+ "##ş": 586,
735
+ "##š": 587,
736
+ "##ţ": 588,
737
+ "##Ť": 589,
738
+ "##ť": 590,
739
+ "##ũ": 591,
740
+ "##ū": 592,
741
+ "##ŭ": 593,
742
+ "##ű": 594,
743
+ "##ų": 595,
744
+ "##ŵ": 596,
745
+ "##Ÿ": 597,
746
+ "##ż": 598,
747
+ "##ž": 599,
748
+ "##ƀ": 600,
749
+ "##Ɓ": 601,
750
+ "##Ƅ": 602,
751
+ "##ƅ": 603,
752
+ "##Ƈ": 604,
753
+ "##ƒ": 605,
754
+ "##ƙ": 606,
755
+ "##ƞ": 607,
756
+ "##Ƭ": 608,
757
+ "##Ư": 609,
758
+ "##Ƴ": 610,
759
+ "##Ǐ": 611,
760
+ "##Ƿ": 612,
761
+ "##ǹ": 613,
762
+ "##ȋ": 614,
763
+ "##ș": 615,
764
+ "##ț": 616,
765
+ "##ȧ": 617,
766
+ "##ȯ": 618,
767
+ "##Ʌ": 619,
768
+ "##ɑ": 620,
769
+ "##ɗ": 621,
770
+ "##ɠ": 622,
771
+ "##ɡ": 623,
772
+ "##ɢ": 624,
773
+ "##ɣ": 625,
774
+ "##ɩ": 626,
775
+ "##ɪ": 627,
776
+ "##ɭ": 628,
777
+ "##ɯ": 629,
778
+ "##ɱ": 630,
779
+ "##ɳ": 631,
780
+ "##ɴ": 632,
781
+ "##ɺ": 633,
782
+ "##ɼ": 634,
783
+ "##ɾ": 635,
784
+ "##ʀ": 636,
785
+ "##ʂ": 637,
786
+ "##ʄ": 638,
787
+ "##ʋ": 639,
788
+ "##ʌ": 640,
789
+ "##ʍ": 641,
790
+ "##ʏ": 642,
791
+ "##ʙ": 643,
792
+ "##ʜ": 644,
793
+ "##ʝ": 645,
794
+ "##ʟ": 646,
795
+ "##ʨ": 647,
796
+ "##˄": 648,
797
+ "##Α": 649,
798
+ "##Β": 650,
799
+ "##Ε": 651,
800
+ "##Ζ": 652,
801
+ "##Η": 653,
802
+ "##Ι": 654,
803
+ "##Κ": 655,
804
+ "##Μ": 656,
805
+ "##Ν": 657,
806
+ "##Ο": 658,
807
+ "##Ρ": 659,
808
+ "##Τ": 660,
809
+ "##Υ": 661,
810
+ "##Χ": 662,
811
+ "##ί": 663,
812
+ "##α": 664,
813
+ "##β": 665,
814
+ "##γ": 666,
815
+ "##η": 667,
816
+ "##ι": 668,
817
+ "##κ": 669,
818
+ "##μ": 670,
819
+ "##ν": 671,
820
+ "##ο": 672,
821
+ "##π": 673,
822
+ "##ρ": 674,
823
+ "##σ": 675,
824
+ "##τ": 676,
825
+ "##υ": 677,
826
+ "##χ": 678,
827
+ "##ω": 679,
828
+ "##ϲ": 680,
829
+ "##ϳ": 681,
830
+ "##Ϲ": 682,
831
+ "##Ϻ": 683,
832
+ "##Ѕ": 684,
833
+ "##Ј": 685,
834
+ "##А": 686,
835
+ "##В": 687,
836
+ "##Е": 688,
837
+ "##З": 689,
838
+ "##К": 690,
839
+ "##М": 691,
840
+ "##Н": 692,
841
+ "##О": 693,
842
+ "##Р": 694,
843
+ "##С": 695,
844
+ "##Т": 696,
845
+ "##У": 697,
846
+ "##Х": 698,
847
+ "##Ь": 699,
848
+ "##а": 700,
849
+ "##в": 701,
850
+ "##г": 702,
851
+ "##д": 703,
852
+ "##е": 704,
853
+ "##и": 705,
854
+ "##к": 706,
855
+ "##л": 707,
856
+ "##н": 708,
857
+ "##о": 709,
858
+ "##п": 710,
859
+ "##р": 711,
860
+ "##с": 712,
861
+ "##т": 713,
862
+ "##у": 714,
863
+ "##х": 715,
864
+ "##ч": 716,
865
+ "##ш": 717,
866
+ "##щ": 718,
867
+ "##ѐ": 719,
868
+ "##ё": 720,
869
+ "##ѕ": 721,
870
+ "##і": 722,
871
+ "##ј": 723,
872
+ "##џ": 724,
873
+ "##ѡ": 725,
874
+ "##Ѵ": 726,
875
+ "##ѵ": 727,
876
+ "##ҏ": 728,
877
+ "##қ": 729,
878
+ "##ҡ": 730,
879
+ "##ң": 731,
880
+ "##ҥ": 732,
881
+ "##Ү": 733,
882
+ "##ү": 734,
883
+ "##ҳ": 735,
884
+ "##һ": 736,
885
+ "##ҽ": 737,
886
+ "##ӏ": 738,
887
+ "##ԁ": 739,
888
+ "##ԛ": 740,
889
+ "##Ա": 741,
890
+ "##Ի": 742,
891
+ "##Ս": 743,
892
+ "##Տ": 744,
893
+ "##Օ": 745,
894
+ "##ա": 746,
895
+ "##գ": 747,
896
+ "##զ": 748,
897
+ "##ժ": 749,
898
+ "##հ": 750,
899
+ "##յ": 751,
900
+ "##ս": 752,
901
+ "##օ": 753,
902
+ "##Ⴍ": 754,
903
+ "##Ⴓ": 755,
904
+ "##Ⴝ": 756,
905
+ "##Ꭰ": 757,
906
+ "##Ꭲ": 758,
907
+ "##Ꭵ": 759,
908
+ "##Ꭺ": 760,
909
+ "##Ꭻ": 761,
910
+ "##Ꮃ": 762,
911
+ "##Ꮇ": 763,
912
+ "##Ꮋ": 764,
913
+ "##Ꮐ": 765,
914
+ "##Ꮓ": 766,
915
+ "##Ꮢ": 767,
916
+ "##Ꮩ": 768,
917
+ "##Ꮪ": 769,
918
+ "##Ꮮ": 770,
919
+ "##Ꮯ": 771,
920
+ "##Ꮲ": 772,
921
+ "##Ꮶ": 773,
922
+ "##Ᏼ": 774,
923
+ "##ᚱ": 775,
924
+ "##ᛁ": 776,
925
+ "##ᛒ": 777,
926
+ "##ᛕ": 778,
927
+ "##ᛖ": 779,
928
+ "##ᴄ": 780,
929
+ "##ᴇ": 781,
930
+ "##ᴋ": 782,
931
+ "##ᴍ": 783,
932
+ "##ᴏ": 784,
933
+ "##ᴑ": 785,
934
+ "##ᴜ": 786,
935
+ "##ᴠ": 787,
936
+ "##ᴡ": 788,
937
+ "##ᴦ": 789,
938
+ "##ᴨ": 790,
939
+ "##ᴺ": 791,
940
+ "##ᴼ": 792,
941
+ "##ᴾ": 793,
942
+ "##ᴿ": 794,
943
+ "##ḟ": 795,
944
+ "##ḱ": 796,
945
+ "##ḿ": 797,
946
+ "##ṁ": 798,
947
+ "##ṅ": 799,
948
+ "##Ṛ": 800,
949
+ "##ṡ": 801,
950
+ "##ẁ": 802,
951
+ "##ẃ": 803,
952
+ "##ẇ": 804,
953
+ "##ἀ": 805,
954
+ "##ἁ": 806,
955
+ "##ἇ": 807,
956
+ "##ἰ": 808,
957
+ "##ἱ": 809,
958
+ "##ἳ": 810,
959
+ "##ὀ": 811,
960
+ "##ὁ": 812,
961
+ "##ὶ": 813,
962
+ "##ί": 814,
963
+ "##ῤ": 815,
964
+ "##ῥ": 816,
965
+ "##―": 817,
966
+ "##₩": 818,
967
+ "##€": 819,
968
+ "##₿": 820,
969
+ "##ℹ": 821,
970
+ "##⋃": 822,
971
+ "##𝘼": 823,
972
+ "##𝘾": 824,
973
+ "##𝘿": 825,
974
+ "##𝙀": 826,
975
+ "##𝙍": 827,
976
+ "##𝙏": 828
977
+ }
978
+ }
979
+ }
tokenizer_config.json ADDED
@@ -0,0 +1,15 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "clean_text": false,
3
+ "cls_token": "[CLS]",
4
+ "do_basic_tokenize": true,
5
+ "do_lower_case": false,
6
+ "mask_token": "[MASK]",
7
+ "model_max_length": 512,
8
+ "never_split": null,
9
+ "pad_token": "[PAD]",
10
+ "sep_token": "[SEP]",
11
+ "strip_accents": false,
12
+ "tokenize_chinese_chars": false,
13
+ "tokenizer_class": "BertTokenizer",
14
+ "unk_token": "[UNK]"
15
+ }
vocab.txt ADDED
@@ -0,0 +1,829 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [UNK]
2
+ [CLS]
3
+ [SEP]
4
+ [PAD]
5
+ [MASK]
6
+ 
7
+ 
8
+ 
9
+ 
10
+ 
11
+ !
12
+ "
13
+ #
14
+ $
15
+ %
16
+ &
17
+ '
18
+ (
19
+ )
20
+ *
21
+ +
22
+ ,
23
+ -
24
+ .
25
+ /
26
+ 0
27
+ 1
28
+ 2
29
+ 3
30
+ 4
31
+ 5
32
+ 6
33
+ 7
34
+ 8
35
+ 9
36
+ :
37
+ ;
38
+ <
39
+ =
40
+ >
41
+ ?
42
+ @
43
+ [
44
+ \
45
+ ]
46
+ ^
47
+ _
48
+ `
49
+ a
50
+ b
51
+ c
52
+ d
53
+ e
54
+ f
55
+ g
56
+ h
57
+ i
58
+ j
59
+ k
60
+ l
61
+ m
62
+ n
63
+ o
64
+ p
65
+ q
66
+ r
67
+ s
68
+ t
69
+ u
70
+ v
71
+ w
72
+ x
73
+ y
74
+ z
75
+ {
76
+ |
77
+ }
78
+ ~
79
+ ¡
80
+ ¢
81
+ £
82
+ ¥
83
+ §
84
+ ¯
85
+ µ
86
+ º
87
+ »
88
+ ¿
89
+ À
90
+ Â
91
+ Ã
92
+ Ä
93
+ Å
94
+ Ç
95
+ Ë
96
+ Í
97
+ Î
98
+ Ï
99
+ Ñ
100
+ Ó
101
+ Ø
102
+ Ù
103
+ Ú
104
+ Ü
105
+ ß
106
+ à
107
+ á
108
+ â
109
+ ã
110
+ ä
111
+ å
112
+ æ
113
+ ç
114
+ è
115
+ é
116
+ ê
117
+ ë
118
+ ì
119
+ í
120
+ î
121
+ ï
122
+ ñ
123
+ ò
124
+ ó
125
+ ô
126
+ õ
127
+ ö
128
+ ø
129
+ ù
130
+ ú
131
+ û
132
+ ü
133
+ ý
134
+ þ
135
+ ā
136
+ ă
137
+ ą
138
+ ć
139
+ č
140
+ ď
141
+ đ
142
+ ē
143
+ ĕ
144
+ ė
145
+ Ę
146
+ ę
147
+ ě
148
+ ġ
149
+ ģ
150
+ ĩ
151
+ ī
152
+ ĭ
153
+ İ
154
+ ı
155
+ ĵ
156
+ ķ
157
+ ĸ
158
+ ĺ
159
+ ł
160
+ ń
161
+ ň
162
+ ʼn
163
+ ŋ
164
+ ō
165
+ ŏ
166
+ ő
167
+ œ
168
+ ŕ
169
+ ŗ
170
+ Ř
171
+ ř
172
+ Ś
173
+ ś
174
+ Ş
175
+ ş
176
+ š
177
+ ţ
178
+ Ť
179
+ ť
180
+ ũ
181
+ ū
182
+ ŭ
183
+ ű
184
+ ų
185
+ ŵ
186
+ Ÿ
187
+ ż
188
+ ž
189
+ ƀ
190
+ Ɓ
191
+ Ƅ
192
+ ƅ
193
+ Ƈ
194
+ ƒ
195
+ ƙ
196
+ ƞ
197
+ Ƭ
198
+ Ư
199
+ Ƴ
200
+ Ǐ
201
+ Ƿ
202
+ ǹ
203
+ ȋ
204
+ ș
205
+ ț
206
+ ȧ
207
+ ȯ
208
+ Ʌ
209
+ ɑ
210
+ ɗ
211
+ ɠ
212
+ ɡ
213
+ ɢ
214
+ ɣ
215
+ ɩ
216
+ ɪ
217
+ ɭ
218
+ ɯ
219
+ ɱ
220
+ ɳ
221
+ ɴ
222
+ ɺ
223
+ ɼ
224
+ ɾ
225
+ ʀ
226
+ ʂ
227
+ ʄ
228
+ ʋ
229
+ ʌ
230
+ ʍ
231
+ ʏ
232
+ ʙ
233
+ ʜ
234
+ ʝ
235
+ ʟ
236
+ ʨ
237
+ ˄
238
+ Α
239
+ Β
240
+ Ε
241
+ Ζ
242
+ Η
243
+ Ι
244
+ Κ
245
+ Μ
246
+ Ν
247
+ Ο
248
+ Ρ
249
+ Τ
250
+ Υ
251
+ Χ
252
+ ί
253
+ α
254
+ β
255
+ γ
256
+ η
257
+ ι
258
+ κ
259
+ μ
260
+ ν
261
+ ο
262
+ π
263
+ ρ
264
+ σ
265
+ τ
266
+ υ
267
+ χ
268
+ ω
269
+ ϲ
270
+ ϳ
271
+ Ϲ
272
+ Ϻ
273
+ Ѕ
274
+ Ј
275
+ А
276
+ В
277
+ Е
278
+ З
279
+ К
280
+ М
281
+ Н
282
+ О
283
+ Р
284
+ С
285
+ Т
286
+ У
287
+ Х
288
+ Ь
289
+ а
290
+ в
291
+ г
292
+ д
293
+ е
294
+ и
295
+ к
296
+ л
297
+ н
298
+ о
299
+ п
300
+ р
301
+ с
302
+ т
303
+ у
304
+ х
305
+ ч
306
+ ш
307
+ щ
308
+ ѐ
309
+ ё
310
+ ѕ
311
+ і
312
+ ј
313
+ џ
314
+ ѡ
315
+ Ѵ
316
+ ѵ
317
+ ҏ
318
+ қ
319
+ ҡ
320
+ ң
321
+ ҥ
322
+ Ү
323
+ ү
324
+ ҳ
325
+ һ
326
+ ҽ
327
+ ӏ
328
+ ԁ
329
+ ԛ
330
+ Ա
331
+ Ի
332
+ Ս
333
+ Տ
334
+ Օ
335
+ ա
336
+ գ
337
+ զ
338
+ ժ
339
+ հ
340
+ յ
341
+ ս
342
+ օ
343
+
344
+
345
+
346
+
347
+
348
+
349
+
350
+
351
+
352
+
353
+
354
+
355
+
356
+
357
+
358
+
359
+
360
+
361
+
362
+
363
+
364
+
365
+
366
+
367
+
368
+
369
+
370
+
371
+
372
+
373
+
374
+
375
+
376
+
377
+
378
+
379
+
380
+
381
+
382
+
383
+ ᴿ
384
+
385
+
386
+ ḿ
387
+
388
+
389
+
390
+
391
+
392
+
393
+
394
+
395
+
396
+
397
+
398
+
399
+
400
+
401
+
402
+
403
+
404
+
405
+
406
+
407
+
408
+
409
+
410
+
411
+
412
+ 𝘼
413
+ 𝘾
414
+ 𝘿
415
+ 𝙀
416
+ 𝙍
417
+ 𝙏
418
+ ##
419
+ ##
420
+ ##
421
+ ##
422
+ ##
423
+ ##!
424
+ ##"
425
+ ###
426
+ ##$
427
+ ##%
428
+ ##&
429
+ ##'
430
+ ##(
431
+ ##)
432
+ ##*
433
+ ##+
434
+ ##,
435
+ ##-
436
+ ##.
437
+ ##/
438
+ ##0
439
+ ##1
440
+ ##2
441
+ ##3
442
+ ##4
443
+ ##5
444
+ ##6
445
+ ##7
446
+ ##8
447
+ ##9
448
+ ##:
449
+ ##;
450
+ ##<
451
+ ##=
452
+ ##>
453
+ ##?
454
+ ##@
455
+ ##[
456
+ ##\
457
+ ##]
458
+ ##^
459
+ ##_
460
+ ##`
461
+ ##a
462
+ ##b
463
+ ##c
464
+ ##d
465
+ ##e
466
+ ##f
467
+ ##g
468
+ ##h
469
+ ##i
470
+ ##j
471
+ ##k
472
+ ##l
473
+ ##m
474
+ ##n
475
+ ##o
476
+ ##p
477
+ ##q
478
+ ##r
479
+ ##s
480
+ ##t
481
+ ##u
482
+ ##v
483
+ ##w
484
+ ##x
485
+ ##y
486
+ ##z
487
+ ##{
488
+ ##|
489
+ ##}
490
+ ##~
491
+ ##¡
492
+ ##¢
493
+ ##£
494
+ ##¥
495
+ ##§
496
+ ##¯
497
+ ##µ
498
+ ##º
499
+ ##»
500
+ ##¿
501
+ ##À
502
+ ##Â
503
+ ##Ã
504
+ ##Ä
505
+ ##Å
506
+ ##Ç
507
+ ##Ë
508
+ ##Í
509
+ ##Î
510
+ ##Ï
511
+ ##Ñ
512
+ ##Ó
513
+ ##Ø
514
+ ##Ù
515
+ ##Ú
516
+ ##Ü
517
+ ##ß
518
+ ##à
519
+ ##á
520
+ ##â
521
+ ##ã
522
+ ##ä
523
+ ##å
524
+ ##æ
525
+ ##ç
526
+ ##è
527
+ ##é
528
+ ##ê
529
+ ##ë
530
+ ##ì
531
+ ##í
532
+ ##î
533
+ ##ï
534
+ ##ñ
535
+ ##ò
536
+ ##ó
537
+ ##ô
538
+ ##õ
539
+ ##ö
540
+ ##ø
541
+ ##ù
542
+ ##ú
543
+ ##û
544
+ ##ü
545
+ ##ý
546
+ ##þ
547
+ ##ā
548
+ ##ă
549
+ ##ą
550
+ ##ć
551
+ ##č
552
+ ##ď
553
+ ##đ
554
+ ##ē
555
+ ##ĕ
556
+ ##ė
557
+ ##Ę
558
+ ##ę
559
+ ##ě
560
+ ##ġ
561
+ ##ģ
562
+ ##ĩ
563
+ ##ī
564
+ ##ĭ
565
+ ##İ
566
+ ##ı
567
+ ##ĵ
568
+ ##ķ
569
+ ##ĸ
570
+ ##ĺ
571
+ ##ł
572
+ ##ń
573
+ ##ň
574
+ ##ʼn
575
+ ##ŋ
576
+ ##ō
577
+ ##ŏ
578
+ ##ő
579
+ ##œ
580
+ ##ŕ
581
+ ##ŗ
582
+ ##Ř
583
+ ##ř
584
+ ##Ś
585
+ ##ś
586
+ ##Ş
587
+ ##ş
588
+ ##š
589
+ ##ţ
590
+ ##Ť
591
+ ##ť
592
+ ##ũ
593
+ ##ū
594
+ ##ŭ
595
+ ##ű
596
+ ##ų
597
+ ##ŵ
598
+ ##Ÿ
599
+ ##ż
600
+ ##ž
601
+ ##ƀ
602
+ ##Ɓ
603
+ ##Ƅ
604
+ ##ƅ
605
+ ##Ƈ
606
+ ##ƒ
607
+ ##ƙ
608
+ ##ƞ
609
+ ##Ƭ
610
+ ##Ư
611
+ ##Ƴ
612
+ ##Ǐ
613
+ ##Ƿ
614
+ ##ǹ
615
+ ##ȋ
616
+ ##ș
617
+ ##ț
618
+ ##ȧ
619
+ ##ȯ
620
+ ##Ʌ
621
+ ##ɑ
622
+ ##ɗ
623
+ ##ɠ
624
+ ##ɡ
625
+ ##ɢ
626
+ ##ɣ
627
+ ##ɩ
628
+ ##ɪ
629
+ ##ɭ
630
+ ##ɯ
631
+ ##ɱ
632
+ ##ɳ
633
+ ##ɴ
634
+ ##ɺ
635
+ ##ɼ
636
+ ##ɾ
637
+ ##ʀ
638
+ ##ʂ
639
+ ##ʄ
640
+ ##ʋ
641
+ ##ʌ
642
+ ##ʍ
643
+ ##ʏ
644
+ ##ʙ
645
+ ##ʜ
646
+ ##ʝ
647
+ ##ʟ
648
+ ##ʨ
649
+ ##˄
650
+ ##Α
651
+ ##Β
652
+ ##Ε
653
+ ##Ζ
654
+ ##Η
655
+ ##Ι
656
+ ##Κ
657
+ ##Μ
658
+ ##Ν
659
+ ##Ο
660
+ ##Ρ
661
+ ##Τ
662
+ ##Υ
663
+ ##Χ
664
+ ##ί
665
+ ##α
666
+ ##β
667
+ ##γ
668
+ ##η
669
+ ##ι
670
+ ##κ
671
+ ##μ
672
+ ##ν
673
+ ##ο
674
+ ##π
675
+ ##ρ
676
+ ##σ
677
+ ##τ
678
+ ##υ
679
+ ##χ
680
+ ##ω
681
+ ##ϲ
682
+ ##ϳ
683
+ ##Ϲ
684
+ ##Ϻ
685
+ ##Ѕ
686
+ ##Ј
687
+ ##А
688
+ ##В
689
+ ##Е
690
+ ##З
691
+ ##К
692
+ ##М
693
+ ##Н
694
+ ##О
695
+ ##Р
696
+ ##С
697
+ ##Т
698
+ ##У
699
+ ##Х
700
+ ##Ь
701
+ ##а
702
+ ##в
703
+ ##г
704
+ ##д
705
+ ##е
706
+ ##и
707
+ ##к
708
+ ##л
709
+ ##н
710
+ ##о
711
+ ##п
712
+ ##р
713
+ ##с
714
+ ##т
715
+ ##у
716
+ ##х
717
+ ##ч
718
+ ##ш
719
+ ##щ
720
+ ##ѐ
721
+ ##ё
722
+ ##ѕ
723
+ ##і
724
+ ##ј
725
+ ##џ
726
+ ##ѡ
727
+ ##Ѵ
728
+ ##ѵ
729
+ ##ҏ
730
+ ##қ
731
+ ##ҡ
732
+ ##ң
733
+ ##ҥ
734
+ ##Ү
735
+ ##ү
736
+ ##ҳ
737
+ ##һ
738
+ ##ҽ
739
+ ##ӏ
740
+ ##ԁ
741
+ ##ԛ
742
+ ##Ա
743
+ ##Ի
744
+ ##Ս
745
+ ##Տ
746
+ ##Օ
747
+ ##ա
748
+ ##գ
749
+ ##զ
750
+ ##ժ
751
+ ##հ
752
+ ##յ
753
+ ##ս
754
+ ##օ
755
+ ##Ⴍ
756
+ ##Ⴓ
757
+ ##Ⴝ
758
+ ##Ꭰ
759
+ ##Ꭲ
760
+ ##Ꭵ
761
+ ##Ꭺ
762
+ ##Ꭻ
763
+ ##Ꮃ
764
+ ##Ꮇ
765
+ ##Ꮋ
766
+ ##Ꮐ
767
+ ##Ꮓ
768
+ ##Ꮢ
769
+ ##Ꮩ
770
+ ##Ꮪ
771
+ ##Ꮮ
772
+ ##Ꮯ
773
+ ##Ꮲ
774
+ ##Ꮶ
775
+ ##Ᏼ
776
+ ##ᚱ
777
+ ##ᛁ
778
+ ##ᛒ
779
+ ##ᛕ
780
+ ##ᛖ
781
+ ##ᴄ
782
+ ##ᴇ
783
+ ##ᴋ
784
+ ##ᴍ
785
+ ##ᴏ
786
+ ##ᴑ
787
+ ##ᴜ
788
+ ##ᴠ
789
+ ##ᴡ
790
+ ##ᴦ
791
+ ##ᴨ
792
+ ##ᴺ
793
+ ##ᴼ
794
+ ##ᴾ
795
+ ##ᴿ
796
+ ##ḟ
797
+ ##ḱ
798
+ ##ḿ
799
+ ##ṁ
800
+ ##ṅ
801
+ ##Ṛ
802
+ ##ṡ
803
+ ##ẁ
804
+ ##ẃ
805
+ ##ẇ
806
+ ##ἀ
807
+ ##ἁ
808
+ ##ἇ
809
+ ##ἰ
810
+ ##ἱ
811
+ ##ἳ
812
+ ##ὀ
813
+ ##ὁ
814
+ ##ὶ
815
+ ##ί
816
+ ##ῤ
817
+ ##ῥ
818
+ ##―
819
+ ##₩
820
+ ##€
821
+ ##₿
822
+ ##ℹ
823
+ ##⋃
824
+ ##𝘼
825
+ ##𝘾
826
+ ##𝘿
827
+ ##𝙀
828
+ ##𝙍
829
+ ##𝙏