lysandre HF staff commited on
Commit
9df9490
1 Parent(s): b777f23

commit files to HF hub

Browse files
config.json ADDED
@@ -0,0 +1,44 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "hf-internal-testing/tiny-random-bert",
3
+ "architectures": [
4
+ "BertForSequenceClassification"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "custom_pipelines": {
9
+ "new-task": {
10
+ "default": {
11
+ "model": {
12
+ "pt": [
13
+ "hf-internal-testing/tiny-random-bert",
14
+ "main"
15
+ ]
16
+ }
17
+ },
18
+ "impl": "__main__.PairClassificationPipeline",
19
+ "pt": [
20
+ "AutoModelForSequenceClassification"
21
+ ],
22
+ "tf": [],
23
+ "type": "text"
24
+ }
25
+ },
26
+ "gradient_checkpointing": false,
27
+ "hidden_act": "gelu",
28
+ "hidden_dropout_prob": 0.1,
29
+ "hidden_size": 32,
30
+ "initializer_range": 0.02,
31
+ "intermediate_size": 37,
32
+ "layer_norm_eps": 1e-12,
33
+ "max_position_embeddings": 512,
34
+ "model_type": "bert",
35
+ "num_attention_heads": 4,
36
+ "num_hidden_layers": 5,
37
+ "pad_token_id": 0,
38
+ "position_embedding_type": "absolute",
39
+ "torch_dtype": "float32",
40
+ "transformers_version": "4.21.0.dev0",
41
+ "type_vocab_size": 16,
42
+ "use_cache": true,
43
+ "vocab_size": 1124
44
+ }
custom_pipeline.py ADDED
@@ -0,0 +1,52 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ from huggingface_hub.repository import Repository
2
+
3
+ from transformers import Pipeline, pipeline, AutoModelForSequenceClassification
4
+ from transformers.pipelines import PIPELINE_REGISTRY
5
+ import numpy as np
6
+
7
+ from transformers import Pipeline
8
+
9
+
10
+ def softmax(outputs):
11
+ maxes = np.max(outputs, axis=-1, keepdims=True)
12
+ shifted_exp = np.exp(outputs - maxes)
13
+ return shifted_exp / shifted_exp.sum(axis=-1, keepdims=True)
14
+
15
+
16
+ class PairClassificationPipeline(Pipeline):
17
+ def _sanitize_parameters(self, **kwargs):
18
+ preprocess_kwargs = {}
19
+ if "second_text" in kwargs:
20
+ preprocess_kwargs["second_text"] = kwargs["second_text"]
21
+ return preprocess_kwargs, {}, {}
22
+
23
+ def preprocess(self, text, second_text=None):
24
+ return self.tokenizer(text, text_pair=second_text, return_tensors=self.framework)
25
+
26
+ def _forward(self, model_inputs):
27
+ return self.model(**model_inputs)
28
+
29
+ def postprocess(self, model_outputs):
30
+ logits = model_outputs.logits[0].numpy()
31
+ probabilities = softmax(logits)
32
+
33
+ best_class = np.argmax(probabilities)
34
+ label = self.model.config.id2label[best_class]
35
+ score = probabilities[best_class].item()
36
+ logits = logits.tolist()
37
+ return {"label": label, "score": score, "logits": logits}
38
+
39
+ PIPELINE_REGISTRY.register_pipeline(
40
+ "new-task",
41
+ pipeline_class=PairClassificationPipeline,
42
+ pt_model=AutoModelForSequenceClassification,
43
+ default={"pt": ("hf-internal-testing/tiny-random-bert", "main")},
44
+ type="text", # current support type: text, audio, image, multimodal
45
+ )
46
+
47
+ pipe = pipeline("new-task")
48
+ print(pipe("This is a test"))
49
+
50
+ repo = Repository("test-dynamic-pipeline", clone_from="lysandre/test-dynamic-pipeline")
51
+ pipe.save_pretrained("test-dynamic-pipeline")
52
+ repo.push_to_hub()
pytorch_model.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:74628f86b7b75be82ff0cdc678f187c363c864954a3c1480162b2ba63d240811
3
+ size 383703
special_tokens_map.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": "[CLS]",
3
+ "mask_token": "[MASK]",
4
+ "pad_token": "[PAD]",
5
+ "sep_token": "[SEP]",
6
+ "unk_token": "[UNK]"
7
+ }
tokenizer.json ADDED
@@ -0,0 +1,1274 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "version": "1.0",
3
+ "truncation": null,
4
+ "padding": null,
5
+ "added_tokens": [
6
+ {
7
+ "id": 0,
8
+ "content": "[PAD]",
9
+ "single_word": false,
10
+ "lstrip": false,
11
+ "rstrip": false,
12
+ "normalized": false,
13
+ "special": true
14
+ },
15
+ {
16
+ "id": 1,
17
+ "content": "[UNK]",
18
+ "single_word": false,
19
+ "lstrip": false,
20
+ "rstrip": false,
21
+ "normalized": false,
22
+ "special": true
23
+ },
24
+ {
25
+ "id": 2,
26
+ "content": "[CLS]",
27
+ "single_word": false,
28
+ "lstrip": false,
29
+ "rstrip": false,
30
+ "normalized": false,
31
+ "special": true
32
+ },
33
+ {
34
+ "id": 3,
35
+ "content": "[SEP]",
36
+ "single_word": false,
37
+ "lstrip": false,
38
+ "rstrip": false,
39
+ "normalized": false,
40
+ "special": true
41
+ },
42
+ {
43
+ "id": 4,
44
+ "content": "[MASK]",
45
+ "single_word": false,
46
+ "lstrip": false,
47
+ "rstrip": false,
48
+ "normalized": false,
49
+ "special": true
50
+ }
51
+ ],
52
+ "normalizer": {
53
+ "type": "BertNormalizer",
54
+ "clean_text": true,
55
+ "handle_chinese_chars": true,
56
+ "strip_accents": null,
57
+ "lowercase": true
58
+ },
59
+ "pre_tokenizer": {
60
+ "type": "BertPreTokenizer"
61
+ },
62
+ "post_processor": {
63
+ "type": "TemplateProcessing",
64
+ "single": [
65
+ {
66
+ "SpecialToken": {
67
+ "id": "[CLS]",
68
+ "type_id": 0
69
+ }
70
+ },
71
+ {
72
+ "Sequence": {
73
+ "id": "A",
74
+ "type_id": 0
75
+ }
76
+ },
77
+ {
78
+ "SpecialToken": {
79
+ "id": "[SEP]",
80
+ "type_id": 0
81
+ }
82
+ }
83
+ ],
84
+ "pair": [
85
+ {
86
+ "SpecialToken": {
87
+ "id": "[CLS]",
88
+ "type_id": 0
89
+ }
90
+ },
91
+ {
92
+ "Sequence": {
93
+ "id": "A",
94
+ "type_id": 0
95
+ }
96
+ },
97
+ {
98
+ "SpecialToken": {
99
+ "id": "[SEP]",
100
+ "type_id": 0
101
+ }
102
+ },
103
+ {
104
+ "Sequence": {
105
+ "id": "B",
106
+ "type_id": 1
107
+ }
108
+ },
109
+ {
110
+ "SpecialToken": {
111
+ "id": "[SEP]",
112
+ "type_id": 1
113
+ }
114
+ }
115
+ ],
116
+ "special_tokens": {
117
+ "[CLS]": {
118
+ "id": "[CLS]",
119
+ "ids": [
120
+ 2
121
+ ],
122
+ "tokens": [
123
+ "[CLS]"
124
+ ]
125
+ },
126
+ "[SEP]": {
127
+ "id": "[SEP]",
128
+ "ids": [
129
+ 3
130
+ ],
131
+ "tokens": [
132
+ "[SEP]"
133
+ ]
134
+ }
135
+ }
136
+ },
137
+ "decoder": {
138
+ "type": "WordPiece",
139
+ "prefix": "##",
140
+ "cleanup": true
141
+ },
142
+ "model": {
143
+ "type": "WordPiece",
144
+ "unk_token": "[UNK]",
145
+ "continuing_subword_prefix": "##",
146
+ "max_input_chars_per_word": 100,
147
+ "vocab": {
148
+ "[PAD]": 0,
149
+ "[UNK]": 1,
150
+ "[CLS]": 2,
151
+ "[SEP]": 3,
152
+ "[MASK]": 4,
153
+ "!": 5,
154
+ "\"": 6,
155
+ "#": 7,
156
+ "$": 8,
157
+ "%": 9,
158
+ "&": 10,
159
+ "'": 11,
160
+ "(": 12,
161
+ ")": 13,
162
+ "*": 14,
163
+ "+": 15,
164
+ ",": 16,
165
+ "-": 17,
166
+ ".": 18,
167
+ "/": 19,
168
+ "0": 20,
169
+ "1": 21,
170
+ "2": 22,
171
+ "3": 23,
172
+ "4": 24,
173
+ "5": 25,
174
+ "6": 26,
175
+ "7": 27,
176
+ "8": 28,
177
+ "9": 29,
178
+ ":": 30,
179
+ ";": 31,
180
+ "<": 32,
181
+ "=": 33,
182
+ ">": 34,
183
+ "?": 35,
184
+ "@": 36,
185
+ "[": 37,
186
+ "\\": 38,
187
+ "]": 39,
188
+ "^": 40,
189
+ "_": 41,
190
+ "`": 42,
191
+ "a": 43,
192
+ "b": 44,
193
+ "c": 45,
194
+ "d": 46,
195
+ "e": 47,
196
+ "f": 48,
197
+ "g": 49,
198
+ "h": 50,
199
+ "i": 51,
200
+ "j": 52,
201
+ "k": 53,
202
+ "l": 54,
203
+ "m": 55,
204
+ "n": 56,
205
+ "o": 57,
206
+ "p": 58,
207
+ "q": 59,
208
+ "r": 60,
209
+ "s": 61,
210
+ "t": 62,
211
+ "u": 63,
212
+ "v": 64,
213
+ "w": 65,
214
+ "x": 66,
215
+ "y": 67,
216
+ "z": 68,
217
+ "|": 69,
218
+ "}": 70,
219
+ "~": 71,
220
+ "¡": 72,
221
+ "¢": 73,
222
+ "£": 74,
223
+ "¥": 75,
224
+ "§": 76,
225
+ "°": 77,
226
+ "±": 78,
227
+ "²": 79,
228
+ "³": 80,
229
+ "´": 81,
230
+ "µ": 82,
231
+ "·": 83,
232
+ "º": 84,
233
+ "½": 85,
234
+ "¿": 86,
235
+ "×": 87,
236
+ "ß": 88,
237
+ "æ": 89,
238
+ "ð": 90,
239
+ "ø": 91,
240
+ "þ": 92,
241
+ "đ": 93,
242
+ "ħ": 94,
243
+ "ı": 95,
244
+ "ł": 96,
245
+ "œ": 97,
246
+ "ɐ": 98,
247
+ "ɑ": 99,
248
+ "ɒ": 100,
249
+ "ɔ": 101,
250
+ "ə": 102,
251
+ "ɛ": 103,
252
+ "ɜ": 104,
253
+ "ɡ": 105,
254
+ "ɢ": 106,
255
+ "ɪ": 107,
256
+ "ɫ": 108,
257
+ "ɳ": 109,
258
+ "ɽ": 110,
259
+ "ɾ": 111,
260
+ "ʁ": 112,
261
+ "ʃ": 113,
262
+ "ʊ": 114,
263
+ "ʋ": 115,
264
+ "ʒ": 116,
265
+ "ʔ": 117,
266
+ "ʕ": 118,
267
+ "ʲ": 119,
268
+ "ʻ": 120,
269
+ "ʼ": 121,
270
+ "ʾ": 122,
271
+ "ʿ": 123,
272
+ "ˈ": 124,
273
+ "ˌ": 125,
274
+ "ː": 126,
275
+ "α": 127,
276
+ "β": 128,
277
+ "γ": 129,
278
+ "δ": 130,
279
+ "ε": 131,
280
+ "η": 132,
281
+ "θ": 133,
282
+ "ι": 134,
283
+ "κ": 135,
284
+ "λ": 136,
285
+ "μ": 137,
286
+ "��": 138,
287
+ "ξ": 139,
288
+ "ο": 140,
289
+ "π": 141,
290
+ "ρ": 142,
291
+ "ς": 143,
292
+ "σ": 144,
293
+ "τ": 145,
294
+ "υ": 146,
295
+ "φ": 147,
296
+ "χ": 148,
297
+ "ψ": 149,
298
+ "ω": 150,
299
+ "а": 151,
300
+ "б": 152,
301
+ "в": 153,
302
+ "г": 154,
303
+ "д": 155,
304
+ "е": 156,
305
+ "ж": 157,
306
+ "з": 158,
307
+ "и": 159,
308
+ "к": 160,
309
+ "л": 161,
310
+ "м": 162,
311
+ "н": 163,
312
+ "о": 164,
313
+ "п": 165,
314
+ "р": 166,
315
+ "с": 167,
316
+ "т": 168,
317
+ "у": 169,
318
+ "х": 170,
319
+ "ц": 171,
320
+ "ш": 172,
321
+ "ъ": 173,
322
+ "ы": 174,
323
+ "ь": 175,
324
+ "ю": 176,
325
+ "я": 177,
326
+ "є": 178,
327
+ "א": 179,
328
+ "ב": 180,
329
+ "ג": 181,
330
+ "ה": 182,
331
+ "ו": 183,
332
+ "ז": 184,
333
+ "ח": 185,
334
+ "י": 186,
335
+ "ל": 187,
336
+ "ם": 188,
337
+ "מ": 189,
338
+ "ן": 190,
339
+ "נ": 191,
340
+ "ס": 192,
341
+ "ף": 193,
342
+ "פ": 194,
343
+ "צ": 195,
344
+ "ר": 196,
345
+ "ש": 197,
346
+ "ת": 198,
347
+ "ء": 199,
348
+ "ا": 200,
349
+ "ب": 201,
350
+ "ة": 202,
351
+ "ت": 203,
352
+ "ث": 204,
353
+ "ج": 205,
354
+ "ح": 206,
355
+ "خ": 207,
356
+ "د": 208,
357
+ "ذ": 209,
358
+ "ر": 210,
359
+ "س": 211,
360
+ "ش": 212,
361
+ "ص": 213,
362
+ "ع": 214,
363
+ "ف": 215,
364
+ "ق": 216,
365
+ "ك": 217,
366
+ "ل": 218,
367
+ "م": 219,
368
+ "ن": 220,
369
+ "ه": 221,
370
+ "و": 222,
371
+ "ي": 223,
372
+ "ܐ": 224,
373
+ "ܕ": 225,
374
+ "ܗ": 226,
375
+ "ܝ": 227,
376
+ "ܠ": 228,
377
+ "ܢ": 229,
378
+ "ܬ": 230,
379
+ "अ": 231,
380
+ "ई": 232,
381
+ "क": 233,
382
+ "ग": 234,
383
+ "ण": 235,
384
+ "त": 236,
385
+ "द": 237,
386
+ "न": 238,
387
+ "प": 239,
388
+ "ब": 240,
389
+ "म": 241,
390
+ "य": 242,
391
+ "र": 243,
392
+ "ल": 244,
393
+ "व": 245,
394
+ "स": 246,
395
+ "ह": 247,
396
+ "ा": 248,
397
+ "ि": 249,
398
+ "আ": 250,
399
+ "ল": 251,
400
+ "হ": 252,
401
+ "া": 253,
402
+ "ਅ": 254,
403
+ "ਲ": 255,
404
+ "ਹ": 256,
405
+ "ਾ": 257,
406
+ "അ": 258,
407
+ "ള": 259,
408
+ "ഹ": 260,
409
+ "ാ": 261,
410
+ "ก": 262,
411
+ "ค": 263,
412
+ "ง": 264,
413
+ "ช": 265,
414
+ "ซ": 266,
415
+ "ญ": 267,
416
+ "ฐ": 268,
417
+ "ณ": 269,
418
+ "ด": 270,
419
+ "ต": 271,
420
+ "น": 272,
421
+ "บ": 273,
422
+ "ป": 274,
423
+ "พ": 275,
424
+ "ภ": 276,
425
+ "ม": 277,
426
+ "ย": 278,
427
+ "ร": 279,
428
+ "ล": 280,
429
+ "ว": 281,
430
+ "ศ": 282,
431
+ "ษ": 283,
432
+ "ส": 284,
433
+ "ห": 285,
434
+ "อ": 286,
435
+ "ฮ": 287,
436
+ "ะ": 288,
437
+ "า": 289,
438
+ "เ": 290,
439
+ "แ": 291,
440
+ "ไ": 292,
441
+ "ა": 293,
442
+ "ბ": 294,
443
+ "გ": 295,
444
+ "დ": 296,
445
+ "ე": 297,
446
+ "ვ": 298,
447
+ "ზ": 299,
448
+ "თ": 300,
449
+ "ი": 301,
450
+ "კ": 302,
451
+ "ლ": 303,
452
+ "მ": 304,
453
+ "ნ": 305,
454
+ "ო": 306,
455
+ "პ": 307,
456
+ "ჟ": 308,
457
+ "რ": 309,
458
+ "ს": 310,
459
+ "ტ": 311,
460
+ "უ": 312,
461
+ "ფ": 313,
462
+ "ქ": 314,
463
+ "ღ": 315,
464
+ "ყ": 316,
465
+ "შ": 317,
466
+ "ჩ": 318,
467
+ "ც": 319,
468
+ "ძ": 320,
469
+ "წ": 321,
470
+ "ჭ": 322,
471
+ "ხ": 323,
472
+ "ჯ": 324,
473
+ "ჰ": 325,
474
+ "ჱ": 326,
475
+ "ჲ": 327,
476
+ "ჳ": 328,
477
+ "ჴ": 329,
478
+ "ჵ": 330,
479
+ "ჶ": 331,
480
+ "ჷ": 332,
481
+ "ჸ": 333,
482
+ "ჹ": 334,
483
+ "ჺ": 335,
484
+ "჻": 336,
485
+ "ᄃ": 337,
486
+ "ᄅ": 338,
487
+ "ᄇ": 339,
488
+ "ᄋ": 340,
489
+ "ᄌ": 341,
490
+ "ᅡ": 342,
491
+ "ᅢ": 343,
492
+ "ᅦ": 344,
493
+ "ᅧ": 345,
494
+ "ᅩ": 346,
495
+ "ᅮ": 347,
496
+ "ᅵ": 348,
497
+ "ᆨ": 349,
498
+ "ᆫ": 350,
499
+ "ᆯ": 351,
500
+ "ᆸ": 352,
501
+ "ᆼ": 353,
502
+ "ᵻ": 354,
503
+ "‐": 355,
504
+ "‑": 356,
505
+ "–": 357,
506
+ "—": 358,
507
+ "―": 359,
508
+ "‘": 360,
509
+ "’": 361,
510
+ "“": 362,
511
+ "”": 363,
512
+ "„": 364,
513
+ "†": 365,
514
+ "‡": 366,
515
+ "•": 367,
516
+ "…": 368,
517
+ "′": 369,
518
+ "″": 370,
519
+ "⁄": 371,
520
+ "₣": 372,
521
+ "₤": 373,
522
+ "€": 374,
523
+ "₹": 375,
524
+ "⅓": 376,
525
+ "⅔": 377,
526
+ "→": 378,
527
+ "−": 379,
528
+ "≡": 380,
529
+ "≤": 381,
530
+ "①": 382,
531
+ "☉": 383,
532
+ "☫": 384,
533
+ "♀": 385,
534
+ "♭": 386,
535
+ "♯": 387,
536
+ "⚳": 388,
537
+ "ⴀ": 389,
538
+ "ⴂ": 390,
539
+ "ⴃ": 391,
540
+ "ⴈ": 392,
541
+ "ⴌ": 393,
542
+ "ⴕ": 394,
543
+ "ⴟ": 395,
544
+ "〈": 396,
545
+ "〉": 397,
546
+ "〜": 398,
547
+ "あ": 399,
548
+ "い": 400,
549
+ "う": 401,
550
+ "お": 402,
551
+ "か": 403,
552
+ "き": 404,
553
+ "く": 405,
554
+ "け": 406,
555
+ "こ": 407,
556
+ "さ": 408,
557
+ "し": 409,
558
+ "す": 410,
559
+ "せ": 411,
560
+ "た": 412,
561
+ "ち": 413,
562
+ "っ": 414,
563
+ "つ": 415,
564
+ "と": 416,
565
+ "な": 417,
566
+ "に": 418,
567
+ "の": 419,
568
+ "は": 420,
569
+ "ひ": 421,
570
+ "ふ": 422,
571
+ "ほ": 423,
572
+ "ま": 424,
573
+ "み": 425,
574
+ "め": 426,
575
+ "も": 427,
576
+ "ゃ": 428,
577
+ "ゆ": 429,
578
+ "ょ": 430,
579
+ "ら": 431,
580
+ "り": 432,
581
+ "る": 433,
582
+ "れ": 434,
583
+ "わ": 435,
584
+ "を": 436,
585
+ "ん": 437,
586
+ "ァ": 438,
587
+ "ア": 439,
588
+ "ィ": 440,
589
+ "イ": 441,
590
+ "ゥ": 442,
591
+ "ウ": 443,
592
+ "ェ": 444,
593
+ "エ": 445,
594
+ "ォ": 446,
595
+ "オ": 447,
596
+ "カ": 448,
597
+ "キ": 449,
598
+ "ク": 450,
599
+ "ケ": 451,
600
+ "コ": 452,
601
+ "サ": 453,
602
+ "シ": 454,
603
+ "ス": 455,
604
+ "セ": 456,
605
+ "タ": 457,
606
+ "チ": 458,
607
+ "ッ": 459,
608
+ "ツ": 460,
609
+ "テ": 461,
610
+ "ト": 462,
611
+ "ナ": 463,
612
+ "ニ": 464,
613
+ "ネ": 465,
614
+ "ノ": 466,
615
+ "ハ": 467,
616
+ "フ": 468,
617
+ "ヘ": 469,
618
+ "マ": 470,
619
+ "ミ": 471,
620
+ "ム": 472,
621
+ "モ": 473,
622
+ "ャ": 474,
623
+ "ュ": 475,
624
+ "ョ": 476,
625
+ "ラ": 477,
626
+ "リ": 478,
627
+ "ル": 479,
628
+ "レ": 480,
629
+ "ロ": 481,
630
+ "ン": 482,
631
+ "・": 483,
632
+ "ー": 484,
633
+ "一": 485,
634
+ "七": 486,
635
+ "下": 487,
636
+ "世": 488,
637
+ "丙": 489,
638
+ "中": 490,
639
+ "主": 491,
640
+ "乃": 492,
641
+ "之": 493,
642
+ "乙": 494,
643
+ "九": 495,
644
+ "二": 496,
645
+ "云": 497,
646
+ "人": 498,
647
+ "今": 499,
648
+ "付": 500,
649
+ "作": 501,
650
+ "侗": 502,
651
+ "依": 503,
652
+ "信": 504,
653
+ "傳": 505,
654
+ "儚": 506,
655
+ "充": 507,
656
+ "光": 508,
657
+ "全": 509,
658
+ "兵": 510,
659
+ "其": 511,
660
+ "具": 512,
661
+ "円": 513,
662
+ "再": 514,
663
+ "出": 515,
664
+ "判": 516,
665
+ "前": 517,
666
+ "剛": 518,
667
+ "劇": 519,
668
+ "劉": 520,
669
+ "動": 521,
670
+ "化": 522,
671
+ "北": 523,
672
+ "华": 524,
673
+ "厂": 525,
674
+ "去": 526,
675
+ "古": 527,
676
+ "可": 528,
677
+ "台": 529,
678
+ "史": 530,
679
+ "同": 531,
680
+ "名": 532,
681
+ "君": 533,
682
+ "吳": 534,
683
+ "周": 535,
684
+ "命": 536,
685
+ "和": 537,
686
+ "咲": 538,
687
+ "善": 539,
688
+ "四": 540,
689
+ "國": 541,
690
+ "園": 542,
691
+ "圣": 543,
692
+ "在": 544,
693
+ "坂": 545,
694
+ "堤": 546,
695
+ "場": 547,
696
+ "塘": 548,
697
+ "夕": 549,
698
+ "大": 550,
699
+ "天": 551,
700
+ "夫": 552,
701
+ "女": 553,
702
+ "妙": 554,
703
+ "姚": 555,
704
+ "子": 556,
705
+ "孟": 557,
706
+ "守": 558,
707
+ "安": 559,
708
+ "宋": 560,
709
+ "完": 561,
710
+ "宗": 562,
711
+ "宝": 563,
712
+ "宫": 564,
713
+ "寝": 565,
714
+ "寺": 566,
715
+ "小": 567,
716
+ "少": 568,
717
+ "尾": 569,
718
+ "山": 570,
719
+ "岳": 571,
720
+ "川": 572,
721
+ "州": 573,
722
+ "巳": 574,
723
+ "市": 575,
724
+ "師": 576,
725
+ "平": 577,
726
+ "广": 578,
727
+ "庆": 579,
728
+ "府": 580,
729
+ "座": 581,
730
+ "廬": 582,
731
+ "建": 583,
732
+ "式": 584,
733
+ "張": 585,
734
+ "彌": 586,
735
+ "彩": 587,
736
+ "彼": 588,
737
+ "後": 589,
738
+ "御": 590,
739
+ "德": 591,
740
+ "思": 592,
741
+ "愛": 593,
742
+ "憑": 594,
743
+ "憶": 595,
744
+ "應": 596,
745
+ "懷": 597,
746
+ "战": 598,
747
+ "戦": 599,
748
+ "扈": 600,
749
+ "技": 601,
750
+ "拉": 602,
751
+ "拳": 603,
752
+ "挑": 604,
753
+ "揺": 605,
754
+ "攻": 606,
755
+ "放": 607,
756
+ "政": 608,
757
+ "散": 609,
758
+ "斯": 610,
759
+ "方": 611,
760
+ "日": 612,
761
+ "旦": 613,
762
+ "旭": 614,
763
+ "昌": 615,
764
+ "明": 616,
765
+ "星": 617,
766
+ "春": 618,
767
+ "晋": 619,
768
+ "景": 620,
769
+ "曦": 621,
770
+ "月": 622,
771
+ "望": 623,
772
+ "未": 624,
773
+ "本": 625,
774
+ "李": 626,
775
+ "村": 627,
776
+ "杜": 628,
777
+ "束": 629,
778
+ "来": 630,
779
+ "林": 631,
780
+ "桜": 632,
781
+ "梶": 633,
782
+ "棘": 634,
783
+ "椎": 635,
784
+ "楊": 636,
785
+ "楚": 637,
786
+ "榮": 638,
787
+ "橘": 639,
788
+ "機": 640,
789
+ "正": 641,
790
+ "殻": 642,
791
+ "殿": 643,
792
+ "母": 644,
793
+ "水": 645,
794
+ "汉": 646,
795
+ "沂": 647,
796
+ "沙": 648,
797
+ "河": 649,
798
+ "泗": 650,
799
+ "波": 651,
800
+ "泣": 652,
801
+ "洪": 653,
802
+ "淹": 654,
803
+ "清": 655,
804
+ "湯": 656,
805
+ "漢": 657,
806
+ "澄": 658,
807
+ "澤": 659,
808
+ "火": 660,
809
+ "灯": 661,
810
+ "灵": 662,
811
+ "灼": 663,
812
+ "焼": 664,
813
+ "熱": 665,
814
+ "物": 666,
815
+ "狐": 667,
816
+ "狸": 668,
817
+ "玄": 669,
818
+ "王": 670,
819
+ "玩": 671,
820
+ "珂": 672,
821
+ "珙": 673,
822
+ "球": 674,
823
+ "理": 675,
824
+ "琦": 676,
825
+ "琪": 677,
826
+ "瓊": 678,
827
+ "生": 679,
828
+ "田": 680,
829
+ "畢": 681,
830
+ "番": 682,
831
+ "瘡": 683,
832
+ "白": 684,
833
+ "皮": 685,
834
+ "真": 686,
835
+ "砲": 687,
836
+ "礮": 688,
837
+ "祈": 689,
838
+ "神": 690,
839
+ "祠": 691,
840
+ "秋": 692,
841
+ "空": 693,
842
+ "立": 694,
843
+ "精": 695,
844
+ "約": 696,
845
+ "絵": 697,
846
+ "織": 698,
847
+ "義": 699,
848
+ "翠": 700,
849
+ "者": 701,
850
+ "耕": 702,
851
+ "肖": 703,
852
+ "胡": 704,
853
+ "膀": 705,
854
+ "臂": 706,
855
+ "興": 707,
856
+ "良": 708,
857
+ "花": 709,
858
+ "芳": 710,
859
+ "芽": 711,
860
+ "若": 712,
861
+ "英": 713,
862
+ "藕": 714,
863
+ "藥": 715,
864
+ "蘄": 716,
865
+ "蘇": 717,
866
+ "行": 718,
867
+ "裁": 719,
868
+ "規": 720,
869
+ "覺": 721,
870
+ "观": 722,
871
+ "解": 723,
872
+ "記": 724,
873
+ "誓": 725,
874
+ "誡": 726,
875
+ "誰": 727,
876
+ "謎": 728,
877
+ "许": 729,
878
+ "谭": 730,
879
+ "豪": 731,
880
+ "豫": 732,
881
+ "費": 733,
882
+ "贵": 734,
883
+ "赤": 735,
884
+ "趙": 736,
885
+ "足": 737,
886
+ "跡": 738,
887
+ "転": 739,
888
+ "辛": 740,
889
+ "逆": 741,
890
+ "遇": 742,
891
+ "運": 743,
892
+ "過": 744,
893
+ "遠": 745,
894
+ "選": 746,
895
+ "邦": 747,
896
+ "邱": 748,
897
+ "部": 749,
898
+ "郭": 750,
899
+ "都": 751,
900
+ "酈": 752,
901
+ "里": 753,
902
+ "野": 754,
903
+ "金": 755,
904
+ "銃": 756,
905
+ "鋼": 757,
906
+ "錄": 758,
907
+ "錡": 759,
908
+ "鍵": 760,
909
+ "鐵": 761,
910
+ "钱": 762,
911
+ "铁": 763,
912
+ "關": 764,
913
+ "防": 765,
914
+ "阿": 766,
915
+ "陈": 767,
916
+ "陳": 768,
917
+ "陽": 769,
918
+ "隊": 770,
919
+ "階": 771,
920
+ "集": 772,
921
+ "雪": 773,
922
+ "雲": 774,
923
+ "霖": 775,
924
+ "霹": 776,
925
+ "靂": 777,
926
+ "韓": 778,
927
+ "願": 779,
928
+ "顯": 780,
929
+ "颜": 781,
930
+ "马": 782,
931
+ "高": 783,
932
+ "龍": 784,
933
+ "ﷲ": 785,
934
+ "ﻋ": 786,
935
+ "/": 787,
936
+ "3": 788,
937
+ "~": 789,
938
+ "##e": 790,
939
+ "##t": 791,
940
+ "##f": 792,
941
+ "##r": 793,
942
+ "##n": 794,
943
+ "##o": 795,
944
+ "##a": 796,
945
+ "##3": 797,
946
+ "##4": 798,
947
+ "##0": 799,
948
+ "##i": 800,
949
+ "##u": 801,
950
+ "##b": 802,
951
+ "##s": 803,
952
+ "##g": 804,
953
+ "##p": 805,
954
+ "##l": 806,
955
+ "##d": 807,
956
+ "##c": 808,
957
+ "##v": 809,
958
+ "##y": 810,
959
+ "##h": 811,
960
+ "##k": 812,
961
+ "##ˈ": 813,
962
+ "##m": 814,
963
+ "##9": 815,
964
+ "##1": 816,
965
+ "##w": 817,
966
+ "##2": 818,
967
+ "##x": 819,
968
+ "##z": 820,
969
+ "##β": 821,
970
+ "##ø": 822,
971
+ "##7": 823,
972
+ "##5": 824,
973
+ "##j": 825,
974
+ "##8": 826,
975
+ "##ł": 827,
976
+ "##q": 828,
977
+ "##6": 829,
978
+ "##は": 830,
979
+ "##り": 831,
980
+ "##α": 832,
981
+ "##ο": 833,
982
+ "##ς": 834,
983
+ "##く": 835,
984
+ "##ん": 836,
985
+ "##ə": 837,
986
+ "##ɔ": 838,
987
+ "##ʔ": 839,
988
+ "##о": 840,
989
+ "##в": 841,
990
+ "##е": 842,
991
+ "##т": 843,
992
+ "##с": 844,
993
+ "##к": 845,
994
+ "##а": 846,
995
+ "##я": 847,
996
+ "##め": 848,
997
+ "##ي": 849,
998
+ "##د": 850,
999
+ "##ا": 851,
1000
+ "##ر": 852,
1001
+ "##ा": 853,
1002
+ "##ई": 854,
1003
+ "##ル": 855,
1004
+ "##ハ": 856,
1005
+ "##ト": 857,
1006
+ "##ス": 858,
1007
+ "##ψ": 859,
1008
+ "##ι": 860,
1009
+ "##セ": 861,
1010
+ "##リ": 862,
1011
+ "##オ": 863,
1012
+ "##ロ": 864,
1013
+ "##π": 865,
1014
+ "##τ": 866,
1015
+ "##κ": 867,
1016
+ "##ν": 868,
1017
+ "##θ": 869,
1018
+ "##η": 870,
1019
+ "##μ": 871,
1020
+ "##ッ": 872,
1021
+ "##フ": 873,
1022
+ "##ォ": 874,
1023
+ "##ン": 875,
1024
+ "##ア": 876,
1025
+ "##ク": 877,
1026
+ "##タ": 878,
1027
+ "##ー": 879,
1028
+ "##д": 880,
1029
+ "##р": 881,
1030
+ "##л": 882,
1031
+ "##こ": 883,
1032
+ "##と": 884,
1033
+ "##ı": 885,
1034
+ "##シ": 886,
1035
+ "##ʻ": 887,
1036
+ "##ი": 888,
1037
+ "##ρ": 889,
1038
+ "##ן": 890,
1039
+ "##ण": 891,
1040
+ "##न": 892,
1041
+ "##क": 893,
1042
+ "##ю": 894,
1043
+ "##з": 895,
1044
+ "##ラ": 896,
1045
+ "##ュ": 897,
1046
+ "##な": 898,
1047
+ "##き": 899,
1048
+ "##س": 900,
1049
+ "##م": 901,
1050
+ "##ت": 902,
1051
+ "##ნ": 903,
1052
+ "##ლ": 904,
1053
+ "##მ": 905,
1054
+ "##წ": 906,
1055
+ "##ფ": 907,
1056
+ "##ე": 908,
1057
+ "##ː": 909,
1058
+ "##ゆ": 910,
1059
+ "##ل": 911,
1060
+ "##ب": 912,
1061
+ "##ن": 913,
1062
+ "##ニ": 914,
1063
+ "##ל": 915,
1064
+ "##ה": 916,
1065
+ "##い": 917,
1066
+ "##ち": 918,
1067
+ "##ゃ": 919,
1068
+ "##י": 920,
1069
+ "##פ": 921,
1070
+ "##た": 922,
1071
+ "##ه": 923,
1072
+ "##ხ": 924,
1073
+ "##ჳ": 925,
1074
+ "##ს": 926,
1075
+ "##ß": 927,
1076
+ "##ʒ": 928,
1077
+ "##æ": 929,
1078
+ "##ล": 930,
1079
+ "##อ": 931,
1080
+ "##ฮ": 932,
1081
+ "##あ": 933,
1082
+ "##ɒ": 934,
1083
+ "##ᵻ": 935,
1084
+ "##ʊ": 936,
1085
+ "##ס": 937,
1086
+ "##ð": 938,
1087
+ "##ო": 939,
1088
+ "##თ": 940,
1089
+ "##ა": 941,
1090
+ "##ვ": 942,
1091
+ "##რ": 943,
1092
+ "##უ": 944,
1093
+ "##ェ": 945,
1094
+ "##テ": 946,
1095
+ "##ィ": 947,
1096
+ "##ˌ": 948,
1097
+ "##イ": 949,
1098
+ "##ف": 950,
1099
+ "##ტ": 951,
1100
+ "##ء": 952,
1101
+ "##х": 953,
1102
+ "##แ": 954,
1103
+ "##ก": 955,
1104
+ "##γ": 956,
1105
+ "##つ": 957,
1106
+ "##か": 958,
1107
+ "##エ": 959,
1108
+ "##đ": 960,
1109
+ "##ك": 961,
1110
+ "##и": 962,
1111
+ "##н": 963,
1112
+ "##せ": 964,
1113
+ "##マ": 965,
1114
+ "##ɪ": 966,
1115
+ "##δ": 967,
1116
+ "##გ": 968,
1117
+ "##す": 969,
1118
+ "##ɛ": 970,
1119
+ "##ق": 971,
1120
+ "##ع": 972,
1121
+ "##の": 973,
1122
+ "##ы": 974,
1123
+ "##ल": 975,
1124
+ "##ゥ": 976,
1125
+ "##ナ": 977,
1126
+ "##λ": 978,
1127
+ "##χ": 979,
1128
+ "##ਲ": 980,
1129
+ "##ਾ": 981,
1130
+ "##ਹ": 982,
1131
+ "##ε": 983,
1132
+ "##ъ": 984,
1133
+ "##п": 985,
1134
+ "##ו": 986,
1135
+ "##ף": 987,
1136
+ "##ɡ": 988,
1137
+ "##و": 989,
1138
+ "##ح": 990,
1139
+ "##う": 991,
1140
+ "##द": 992,
1141
+ "##ɫ": 993,
1142
+ "##ค": 994,
1143
+ "##ร": 995,
1144
+ "##ว": 996,
1145
+ "##ต": 997,
1146
+ "##レ": 998,
1147
+ "##チ": 999,
1148
+ "##σ": 1000,
1149
+ "##υ": 1001,
1150
+ "##カ": 1002,
1151
+ "##ป": 1003,
1152
+ "##ย": 1004,
1153
+ "##ャ": 1005,
1154
+ "##モ": 1006,
1155
+ "##ω": 1007,
1156
+ "##ɑ": 1008,
1157
+ "##ま": 1009,
1158
+ "##る": 1010,
1159
+ "##พ": 1011,
1160
+ "##у": 1012,
1161
+ "##ث": 1013,
1162
+ "##ミ": 1014,
1163
+ "##っ": 1015,
1164
+ "##し": 1016,
1165
+ "##ょ": 1017,
1166
+ "##に": 1018,
1167
+ "##れ": 1019,
1168
+ "##დ": 1020,
1169
+ "##ʿ": 1021,
1170
+ "##ム": 1022,
1171
+ "##र": 1023,
1172
+ "##ง": 1024,
1173
+ "##ไ": 1025,
1174
+ "##ช": 1026,
1175
+ "##า": 1027,
1176
+ "##є": 1028,
1177
+ "##स": 1029,
1178
+ "##ם": 1030,
1179
+ "##ة": 1031,
1180
+ "##ള": 1032,
1181
+ "##も": 1033,
1182
+ "##ჲ": 1034,
1183
+ "##わ": 1035,
1184
+ "##サ": 1036,
1185
+ "##א": 1037,
1186
+ "##ב": 1038,
1187
+ "##ר": 1039,
1188
+ "##ল": 1040,
1189
+ "##お": 1041,
1190
+ "##ɐ": 1042,
1191
+ "##ش": 1043,
1192
+ "##ภ": 1044,
1193
+ "##ด": 1045,
1194
+ "##ひ": 1046,
1195
+ "##ც": 1047,
1196
+ "##ɾ": 1048,
1197
+ "##ʲ": 1049,
1198
+ "##ウ": 1050,
1199
+ "##ァ": 1051,
1200
+ "##キ": 1052,
1201
+ "##3": 1053,
1202
+ "##を": 1054,
1203
+ "##ᅡ": 1055,
1204
+ "##ᆯ": 1056,
1205
+ "##ᄅ": 1057,
1206
+ "##ʃ": 1058,
1207
+ "##ჱ": 1059,
1208
+ "##º": 1060,
1209
+ "##ɳ": 1061,
1210
+ "##ら": 1062,
1211
+ "##ж": 1063,
1212
+ "##خ": 1064,
1213
+ "##ʁ": 1065,
1214
+ "##ะ": 1066,
1215
+ "##น": 1067,
1216
+ "##ษ": 1068,
1217
+ "##ฐ": 1069,
1218
+ "##м": 1070,
1219
+ "##ह": 1071,
1220
+ "##া": 1072,
1221
+ "##হ": 1073,
1222
+ "##व": 1074,
1223
+ "##œ": 1075,
1224
+ "##ᄇ": 1076,
1225
+ "##ᅮ": 1077,
1226
+ "##ᄃ": 1078,
1227
+ "##ᅢ": 1079,
1228
+ "##ɜ": 1080,
1229
+ "##ि": 1081,
1230
+ "##ग": 1082,
1231
+ "##ξ": 1083,
1232
+ "##נ": 1084,
1233
+ "##ქ": 1085,
1234
+ "##ص": 1086,
1235
+ "##ാ": 1087,
1236
+ "##ഹ": 1088,
1237
+ "##г": 1089,
1238
+ "##ܠ": 1090,
1239
+ "##ܗ": 1091,
1240
+ "##ܐ": 1092,
1241
+ "##ɽ": 1093,
1242
+ "##ツ": 1094,
1243
+ "##ซ": 1095,
1244
+ "##ш": 1096,
1245
+ "##ц": 1097,
1246
+ "##ь": 1098,
1247
+ "##ネ": 1099,
1248
+ "##ョ": 1100,
1249
+ "##ณ": 1101,
1250
+ "##ม": 1102,
1251
+ "##ノ": 1103,
1252
+ "##ש": 1104,
1253
+ "##מ": 1105,
1254
+ "##צ": 1106,
1255
+ "##ᅦ": 1107,
1256
+ "##ᅩ": 1108,
1257
+ "##ᆨ": 1109,
1258
+ "##ᅵ": 1110,
1259
+ "##ᆸ": 1111,
1260
+ "##ᅧ": 1112,
1261
+ "##ᆼ": 1113,
1262
+ "##ᄋ": 1114,
1263
+ "##ᆫ": 1115,
1264
+ "##เ": 1116,
1265
+ "##ذ": 1117,
1266
+ "##ܕ": 1118,
1267
+ "##ܝ": 1119,
1268
+ "##ܢ": 1120,
1269
+ "##ܬ": 1121,
1270
+ "##み": 1122,
1271
+ "##ת": 1123
1272
+ }
1273
+ }
1274
+ }
tokenizer_config.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": "[CLS]",
3
+ "do_lower_case": true,
4
+ "mask_token": "[MASK]",
5
+ "model_max_length": 512,
6
+ "name_or_path": "hf-internal-testing/tiny-random-bert",
7
+ "pad_token": "[PAD]",
8
+ "sep_token": "[SEP]",
9
+ "special_tokens_map_file": null,
10
+ "strip_accents": null,
11
+ "tokenize_chinese_chars": true,
12
+ "tokenizer_class": "BertTokenizer",
13
+ "unk_token": "[UNK]"
14
+ }
vocab.txt ADDED
@@ -0,0 +1,1124 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [PAD]
2
+ [UNK]
3
+ [CLS]
4
+ [SEP]
5
+ [MASK]
6
+ !
7
+ "
8
+ #
9
+ $
10
+ %
11
+ &
12
+ '
13
+ (
14
+ )
15
+ *
16
+ +
17
+ ,
18
+ -
19
+ .
20
+ /
21
+ 0
22
+ 1
23
+ 2
24
+ 3
25
+ 4
26
+ 5
27
+ 6
28
+ 7
29
+ 8
30
+ 9
31
+ :
32
+ ;
33
+ <
34
+ =
35
+ >
36
+ ?
37
+ @
38
+ [
39
+ \
40
+ ]
41
+ ^
42
+ _
43
+ `
44
+ a
45
+ b
46
+ c
47
+ d
48
+ e
49
+ f
50
+ g
51
+ h
52
+ i
53
+ j
54
+ k
55
+ l
56
+ m
57
+ n
58
+ o
59
+ p
60
+ q
61
+ r
62
+ s
63
+ t
64
+ u
65
+ v
66
+ w
67
+ x
68
+ y
69
+ z
70
+ |
71
+ }
72
+ ~
73
+ ¡
74
+ ¢
75
+ £
76
+ ¥
77
+ §
78
+ °
79
+ ±
80
+ ²
81
+ ³
82
+ ´
83
+ µ
84
+ ·
85
+ º
86
+ ½
87
+ ¿
88
+ ×
89
+ ß
90
+ æ
91
+ ð
92
+ ø
93
+ þ
94
+ đ
95
+ ħ
96
+ ı
97
+ ł
98
+ œ
99
+ ɐ
100
+ ɑ
101
+ ɒ
102
+ ɔ
103
+ ə
104
+ ɛ
105
+ ɜ
106
+ ɡ
107
+ ɢ
108
+ ɪ
109
+ ɫ
110
+ ɳ
111
+ ɽ
112
+ ɾ
113
+ ʁ
114
+ ʃ
115
+ ʊ
116
+ ʋ
117
+ ʒ
118
+ ʔ
119
+ ʕ
120
+ ʲ
121
+ ʻ
122
+ ʼ
123
+ ʾ
124
+ ʿ
125
+ ˈ
126
+ ˌ
127
+ ː
128
+ α
129
+ β
130
+ γ
131
+ δ
132
+ ε
133
+ η
134
+ θ
135
+ ι
136
+ κ
137
+ λ
138
+ μ
139
+ ν
140
+ ξ
141
+ ο
142
+ π
143
+ ρ
144
+ ς
145
+ σ
146
+ τ
147
+ υ
148
+ φ
149
+ χ
150
+ ψ
151
+ ω
152
+ а
153
+ б
154
+ в
155
+ г
156
+ д
157
+ е
158
+ ж
159
+ з
160
+ и
161
+ к
162
+ л
163
+ м
164
+ н
165
+ о
166
+ п
167
+ р
168
+ с
169
+ т
170
+ у
171
+ х
172
+ ц
173
+ ш
174
+ ъ
175
+ ы
176
+ ь
177
+ ю
178
+ я
179
+ є
180
+ א
181
+ ב
182
+ ג
183
+ ה
184
+ ו
185
+ ז
186
+ ח
187
+ י
188
+ ל
189
+ ם
190
+ מ
191
+ ן
192
+ נ
193
+ ס
194
+ ף
195
+ פ
196
+ צ
197
+ ר
198
+ ש
199
+ ת
200
+ ء
201
+ ا
202
+ ب
203
+ ة
204
+ ت
205
+ ث
206
+ ج
207
+ ح
208
+ خ
209
+ د
210
+ ذ
211
+ ر
212
+ س
213
+ ش
214
+ ص
215
+ ع
216
+ ف
217
+ ق
218
+ ك
219
+ ل
220
+ م
221
+ ن
222
+ ه
223
+ و
224
+ ي
225
+ ܐ
226
+ ܕ
227
+ ܗ
228
+ ܝ
229
+ ܠ
230
+ ܢ
231
+ ܬ
232
+
233
+
234
+
235
+
236
+
237
+
238
+
239
+
240
+
241
+
242
+
243
+
244
+
245
+
246
+
247
+
248
+
249
+
250
+ ि
251
+
252
+
253
+
254
+
255
+
256
+
257
+
258
+
259
+
260
+
261
+
262
+
263
+
264
+
265
+
266
+
267
+
268
+
269
+
270
+
271
+
272
+
273
+
274
+
275
+
276
+
277
+
278
+
279
+
280
+
281
+
282
+
283
+
284
+
285
+
286
+
287
+
288
+
289
+
290
+
291
+
292
+
293
+
294
+
295
+
296
+
297
+
298
+
299
+
300
+
301
+
302
+
303
+
304
+
305
+
306
+
307
+
308
+
309
+
310
+
311
+
312
+
313
+
314
+
315
+
316
+
317
+
318
+
319
+
320
+
321
+
322
+
323
+
324
+
325
+
326
+
327
+
328
+
329
+
330
+
331
+
332
+
333
+
334
+
335
+
336
+
337
+
338
+
339
+
340
+
341
+
342
+
343
+
344
+
345
+
346
+
347
+
348
+
349
+
350
+
351
+
352
+
353
+
354
+
355
+
356
+
357
+
358
+
359
+
360
+
361
+
362
+
363
+
364
+
365
+
366
+
367
+
368
+
369
+
370
+
371
+
372
+
373
+
374
+
375
+
376
+
377
+
378
+
379
+
380
+
381
+
382
+
383
+
384
+
385
+
386
+
387
+
388
+
389
+
390
+
391
+
392
+
393
+
394
+
395
+
396
+
397
+
398
+
399
+
400
+
401
+
402
+
403
+
404
+
405
+
406
+
407
+
408
+
409
+
410
+
411
+
412
+
413
+
414
+
415
+
416
+
417
+
418
+
419
+
420
+
421
+
422
+
423
+
424
+
425
+
426
+
427
+
428
+
429
+
430
+
431
+
432
+
433
+
434
+
435
+
436
+
437
+
438
+
439
+
440
+
441
+
442
+
443
+
444
+
445
+
446
+
447
+
448
+
449
+
450
+
451
+
452
+
453
+
454
+
455
+
456
+
457
+
458
+
459
+
460
+
461
+
462
+
463
+
464
+
465
+
466
+
467
+
468
+
469
+
470
+
471
+
472
+
473
+
474
+
475
+
476
+
477
+
478
+
479
+
480
+
481
+
482
+
483
+
484
+
485
+
486
+
487
+
488
+
489
+
490
+
491
+
492
+
493
+
494
+
495
+
496
+
497
+
498
+
499
+
500
+
501
+
502
+
503
+
504
+
505
+
506
+
507
+
508
+
509
+
510
+
511
+
512
+
513
+
514
+
515
+
516
+
517
+
518
+
519
+
520
+
521
+
522
+
523
+
524
+
525
+
526
+
527
+
528
+
529
+
530
+
531
+
532
+
533
+
534
+
535
+
536
+
537
+
538
+
539
+
540
+
541
+
542
+
543
+
544
+
545
+
546
+
547
+
548
+
549
+
550
+
551
+
552
+
553
+
554
+
555
+
556
+
557
+
558
+
559
+
560
+
561
+
562
+
563
+
564
+
565
+
566
+
567
+
568
+
569
+
570
+
571
+
572
+
573
+
574
+
575
+
576
+
577
+
578
+
579
+ 广
580
+
581
+
582
+
583
+
584
+
585
+
586
+
587
+
588
+
589
+
590
+
591
+
592
+
593
+
594
+
595
+
596
+
597
+
598
+
599
+
600
+
601
+
602
+
603
+
604
+
605
+
606
+
607
+
608
+
609
+
610
+
611
+
612
+
613
+
614
+
615
+
616
+
617
+
618
+
619
+
620
+
621
+
622
+
623
+
624
+
625
+
626
+
627
+
628
+
629
+
630
+
631
+
632
+
633
+
634
+
635
+
636
+
637
+
638
+
639
+
640
+
641
+
642
+
643
+
644
+ 殿
645
+
646
+
647
+
648
+
649
+
650
+
651
+
652
+
653
+
654
+
655
+
656
+
657
+
658
+
659
+
660
+
661
+
662
+
663
+
664
+
665
+
666
+
667
+
668
+
669
+
670
+
671
+
672
+
673
+
674
+
675
+
676
+
677
+
678
+
679
+
680
+
681
+
682
+
683
+
684
+
685
+
686
+
687
+
688
+
689
+
690
+
691
+
692
+
693
+
694
+
695
+
696
+
697
+
698
+
699
+
700
+
701
+
702
+
703
+
704
+
705
+
706
+
707
+
708
+
709
+
710
+
711
+
712
+
713
+
714
+
715
+
716
+
717
+
718
+
719
+
720
+
721
+
722
+
723
+
724
+
725
+
726
+
727
+
728
+
729
+
730
+
731
+
732
+
733
+
734
+
735
+
736
+
737
+
738
+
739
+
740
+
741
+
742
+
743
+
744
+
745
+
746
+
747
+
748
+
749
+
750
+
751
+
752
+
753
+
754
+
755
+
756
+
757
+
758
+
759
+
760
+
761
+
762
+
763
+
764
+
765
+
766
+
767
+
768
+
769
+
770
+
771
+
772
+
773
+
774
+
775
+
776
+
777
+
778
+
779
+
780
+
781
+
782
+
783
+
784
+
785
+
786
+
787
+
788
+
789
+
790
+
791
+ ##e
792
+ ##t
793
+ ##f
794
+ ##r
795
+ ##n
796
+ ##o
797
+ ##a
798
+ ##3
799
+ ##4
800
+ ##0
801
+ ##i
802
+ ##u
803
+ ##b
804
+ ##s
805
+ ##g
806
+ ##p
807
+ ##l
808
+ ##d
809
+ ##c
810
+ ##v
811
+ ##y
812
+ ##h
813
+ ##k
814
+ ##ˈ
815
+ ##m
816
+ ##9
817
+ ##1
818
+ ##w
819
+ ##2
820
+ ##x
821
+ ##z
822
+ ##β
823
+ ##ø
824
+ ##7
825
+ ##5
826
+ ##j
827
+ ##8
828
+ ##ł
829
+ ##q
830
+ ##6
831
+ ##は
832
+ ##り
833
+ ##α
834
+ ##ο
835
+ ##ς
836
+ ##く
837
+ ##ん
838
+ ##ə
839
+ ##ɔ
840
+ ##ʔ
841
+ ##о
842
+ ##в
843
+ ##е
844
+ ##т
845
+ ##с
846
+ ##к
847
+ ##а
848
+ ##я
849
+ ##め
850
+ ##ي
851
+ ##د
852
+ ##ا
853
+ ##ر
854
+ ##ा
855
+ ##ई
856
+ ##ル
857
+ ##ハ
858
+ ##ト
859
+ ##ス
860
+ ##ψ
861
+ ##ι
862
+ ##セ
863
+ ##リ
864
+ ##オ
865
+ ##ロ
866
+ ##π
867
+ ##τ
868
+ ##κ
869
+ ##ν
870
+ ##θ
871
+ ##η
872
+ ##μ
873
+ ##ッ
874
+ ##フ
875
+ ##ォ
876
+ ##ン
877
+ ##ア
878
+ ##ク
879
+ ##タ
880
+ ##ー
881
+ ##д
882
+ ##р
883
+ ##л
884
+ ##こ
885
+ ##と
886
+ ##ı
887
+ ##シ
888
+ ##ʻ
889
+ ##ი
890
+ ##ρ
891
+ ##ן
892
+ ##ण
893
+ ##न
894
+ ##क
895
+ ##ю
896
+ ##з
897
+ ##ラ
898
+ ##ュ
899
+ ##な
900
+ ##き
901
+ ##س
902
+ ##م
903
+ ##ت
904
+ ##ნ
905
+ ##ლ
906
+ ##მ
907
+ ##წ
908
+ ##ფ
909
+ ##ე
910
+ ##ː
911
+ ##ゆ
912
+ ##ل
913
+ ##ب
914
+ ##ن
915
+ ##ニ
916
+ ##ל
917
+ ##ה
918
+ ##い
919
+ ##ち
920
+ ##ゃ
921
+ ##י
922
+ ##פ
923
+ ##た
924
+ ##ه
925
+ ##ხ
926
+ ##ჳ
927
+ ##ს
928
+ ##ß
929
+ ##ʒ
930
+ ##æ
931
+ ##ล
932
+ ##อ
933
+ ##ฮ
934
+ ##あ
935
+ ##ɒ
936
+ ##ᵻ
937
+ ##ʊ
938
+ ##ס
939
+ ##ð
940
+ ##ო
941
+ ##თ
942
+ ##ა
943
+ ##ვ
944
+ ##რ
945
+ ##უ
946
+ ##ェ
947
+ ##テ
948
+ ##ィ
949
+ ##ˌ
950
+ ##イ
951
+ ##ف
952
+ ##ტ
953
+ ##ء
954
+ ##х
955
+ ##แ
956
+ ##ก
957
+ ##γ
958
+ ##つ
959
+ ##か
960
+ ##エ
961
+ ##đ
962
+ ##ك
963
+ ##и
964
+ ##н
965
+ ##せ
966
+ ##マ
967
+ ##ɪ
968
+ ##δ
969
+ ##გ
970
+ ##す
971
+ ##ɛ
972
+ ##ق
973
+ ##ع
974
+ ##の
975
+ ##ы
976
+ ##ल
977
+ ##ゥ
978
+ ##ナ
979
+ ##λ
980
+ ##χ
981
+ ##ਲ
982
+ ##ਾ
983
+ ##ਹ
984
+ ##ε
985
+ ##ъ
986
+ ##п
987
+ ##ו
988
+ ##ף
989
+ ##ɡ
990
+ ##و
991
+ ##ح
992
+ ##う
993
+ ##द
994
+ ##ɫ
995
+ ##ค
996
+ ##ร
997
+ ##ว
998
+ ##ต
999
+ ##レ
1000
+ ##チ
1001
+ ##σ
1002
+ ##υ
1003
+ ##カ
1004
+ ##ป
1005
+ ##ย
1006
+ ##ャ
1007
+ ##モ
1008
+ ##ω
1009
+ ##ɑ
1010
+ ##ま
1011
+ ##る
1012
+ ##พ
1013
+ ##у
1014
+ ##ث
1015
+ ##ミ
1016
+ ##っ
1017
+ ##し
1018
+ ##ょ
1019
+ ##に
1020
+ ##れ
1021
+ ##დ
1022
+ ##ʿ
1023
+ ##ム
1024
+ ##र
1025
+ ##ง
1026
+ ##ไ
1027
+ ##ช
1028
+ ##า
1029
+ ##є
1030
+ ##स
1031
+ ##ם
1032
+ ##ة
1033
+ ##ള
1034
+ ##も
1035
+ ##ჲ
1036
+ ##わ
1037
+ ##サ
1038
+ ##א
1039
+ ##ב
1040
+ ##ר
1041
+ ##ল
1042
+ ##お
1043
+ ##ɐ
1044
+ ##ش
1045
+ ##ภ
1046
+ ##ด
1047
+ ##ひ
1048
+ ##ც
1049
+ ##ɾ
1050
+ ##ʲ
1051
+ ##ウ
1052
+ ##ァ
1053
+ ##キ
1054
+ ##3
1055
+ ##を
1056
+ ##ᅡ
1057
+ ##ᆯ
1058
+ ##ᄅ
1059
+ ##ʃ
1060
+ ##ჱ
1061
+ ##º
1062
+ ##ɳ
1063
+ ##ら
1064
+ ##ж
1065
+ ##خ
1066
+ ##ʁ
1067
+ ##ะ
1068
+ ##น
1069
+ ##ษ
1070
+ ##ฐ
1071
+ ##м
1072
+ ##ह
1073
+ ##া
1074
+ ##হ
1075
+ ##व
1076
+ ##œ
1077
+ ##ᄇ
1078
+ ##ᅮ
1079
+ ##ᄃ
1080
+ ##ᅢ
1081
+ ##ɜ
1082
+ ##ि
1083
+ ##ग
1084
+ ##ξ
1085
+ ##נ
1086
+ ##ქ
1087
+ ##ص
1088
+ ##ാ
1089
+ ##ഹ
1090
+ ##г
1091
+ ##ܠ
1092
+ ##ܗ
1093
+ ##ܐ
1094
+ ##ɽ
1095
+ ##ツ
1096
+ ##ซ
1097
+ ##ш
1098
+ ##ц
1099
+ ##ь
1100
+ ##ネ
1101
+ ##ョ
1102
+ ##ณ
1103
+ ##ม
1104
+ ##ノ
1105
+ ##ש
1106
+ ##מ
1107
+ ##צ
1108
+ ##ᅦ
1109
+ ##ᅩ
1110
+ ##ᆨ
1111
+ ##ᅵ
1112
+ ##ᆸ
1113
+ ##ᅧ
1114
+ ##ᆼ
1115
+ ##ᄋ
1116
+ ##ᆫ
1117
+ ##เ
1118
+ ##ذ
1119
+ ##ܕ
1120
+ ##ܝ
1121
+ ##ܢ
1122
+ ##ܬ
1123
+ ##み
1124
+ ##ת