Update tiny models for VisionTextDualEncoderModel-vit-bert

#15
by sgugger - opened
Files changed (7) hide show
  1. config.json +5 -4
  2. preprocessor_config.json +1 -1
  3. pytorch_model.bin +1 -1
  4. tf_model.h5 +3 -0
  5. tokenizer.json +328 -328
  6. tokenizer_config.json +0 -1
  7. vocab.txt +280 -280
config.json CHANGED
@@ -1,5 +1,6 @@
1
  {
2
  "_commit_hash": null,
 
3
  "architectures": [
4
  "VisionTextDualEncoderModel"
5
  ],
@@ -7,7 +8,7 @@
7
  "model_type": "vision-text-dual-encoder",
8
  "projection_dim": 512,
9
  "text_config": {
10
- "_name_or_path": "/tmp/tmpwmqhff1f/decoder/BertModel",
11
  "add_cross_attention": false,
12
  "architectures": [
13
  "BertModel"
@@ -80,7 +81,7 @@
80
  "top_p": 1.0,
81
  "torch_dtype": "float32",
82
  "torchscript": false,
83
- "transformers_version": "4.25.0.dev0",
84
  "type_vocab_size": 16,
85
  "typical_p": 1.0,
86
  "use_bfloat16": false,
@@ -90,7 +91,7 @@
90
  "torch_dtype": "float32",
91
  "transformers_version": null,
92
  "vision_config": {
93
- "_name_or_path": "/tmp/tmpwmqhff1f/encoder/ViTModel",
94
  "add_cross_attention": false,
95
  "architectures": [
96
  "ViTModel"
@@ -165,7 +166,7 @@
165
  "top_p": 1.0,
166
  "torch_dtype": "float32",
167
  "torchscript": false,
168
- "transformers_version": "4.25.0.dev0",
169
  "typical_p": 1.0,
170
  "use_bfloat16": false
171
  }
1
  {
2
  "_commit_hash": null,
3
+ "_name_or_path": "tiny_models/vision-text-dual-encoder/VisionTextDualEncoderModel-vit-bert",
4
  "architectures": [
5
  "VisionTextDualEncoderModel"
6
  ],
8
  "model_type": "vision-text-dual-encoder",
9
  "projection_dim": 512,
10
  "text_config": {
11
+ "_name_or_path": "/tmp/tmpdem_f0da/decoder/BertModel",
12
  "add_cross_attention": false,
13
  "architectures": [
14
  "BertModel"
81
  "top_p": 1.0,
82
  "torch_dtype": "float32",
83
  "torchscript": false,
84
+ "transformers_version": "4.28.0.dev0",
85
  "type_vocab_size": 16,
86
  "typical_p": 1.0,
87
  "use_bfloat16": false,
91
  "torch_dtype": "float32",
92
  "transformers_version": null,
93
  "vision_config": {
94
+ "_name_or_path": "/tmp/tmpdem_f0da/encoder/ViTModel",
95
  "add_cross_attention": false,
96
  "architectures": [
97
  "ViTModel"
166
  "top_p": 1.0,
167
  "torch_dtype": "float32",
168
  "torchscript": false,
169
+ "transformers_version": "4.28.0.dev0",
170
  "typical_p": 1.0,
171
  "use_bfloat16": false
172
  }
preprocessor_config.json CHANGED
@@ -8,7 +8,7 @@
8
  0.5,
9
  0.5
10
  ],
11
- "image_processor_type": "ViTImageProcessor",
12
  "image_std": [
13
  0.5,
14
  0.5,
8
  0.5,
9
  0.5
10
  ],
11
+ "image_processor_type": "ViTFeatureExtractor",
12
  "image_std": [
13
  0.5,
14
  0.5,
pytorch_model.bin CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:3fb46eeeef53c003470020f7534b354d9d97f6195f2edd242b56a9ac30bb2910
3
  size 716569
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:13eee4a9e2b35a6991d933811ff7b624da193f427b498bd5e93a65f5b430abab
3
  size 716569
tf_model.h5 ADDED
@@ -0,0 +1,3 @@
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b0de4a38e4b06d603c305c925571301228afc101176ecc3628ca6670033caf21
3
+ size 905264
tokenizer.json CHANGED
@@ -935,340 +935,340 @@
935
  "/": 787,
936
  "3": 788,
937
  "~": 789,
938
- "##c": 790,
939
  "##r": 791,
940
- "##e": 792,
941
- "##a": 793,
942
- "##m": 794,
943
- "##i": 795,
944
- "##n": 796,
945
- "##g": 797,
946
- "##k": 798,
947
- "##p": 799,
948
- "##o": 800,
949
- "##t": 801,
950
- "##s": 802,
951
- "##l": 803,
952
- "##1": 804,
953
- "##h": 805,
954
- "##d": 806,
955
- "##j": 807,
956
- "##f": 808,
957
- "##y": 809,
958
- "##b": 810,
959
- "##u": 811,
960
- "##w": 812,
961
- "##v": 813,
962
- "##x": 814,
963
- "##5": 815,
964
- "##8": 816,
965
- "##3": 817,
966
- "##9": 818,
967
  "##7": 819,
968
- "##6": 820,
969
- "##z": 821,
970
- "##た": 822,
971
- "##め": 823,
972
- "##の": 824,
973
- "##0": 825,
974
- "##ा": 826,
975
- "##न": 827,
976
- "##ई": 828,
977
- "##4": 829,
978
- "##2": 830,
979
- "##ხ": 831,
980
- "##ვ": 832,
981
- "##ი": 833,
982
- "##ს": 834,
983
- "##q": 835,
984
- "##き": 836,
985
- "##つ": 837,
986
- "##う": 838,
987
- "##ള": 839,
988
- "##ɪ": 840,
989
- "##ォ": 841,
990
- "##ル": 842,
991
- "##テ": 843,
992
- "##ø": 844,
993
- "##ł": 845,
994
- "##া": 846,
995
- "##হ": 847,
996
- "##ল": 848,
997
- "##ʻ": 849,
998
- "##ण": 850,
999
- "##स": 851,
1000
- "##व": 852,
1001
- "##द": 853,
1002
- "##л": 854,
1003
- "##а": 855,
1004
- "##α": 856,
1005
- "##ο": 857,
1006
- "##ς": 858,
1007
- "##უ": 859,
1008
- "##რ": 860,
1009
- "##δ": 861,
1010
- "##μ": 862,
1011
- "##ə": 863,
1012
- "##ː": 864,
1013
- "##ˈ": 865,
1014
- "##ɳ": 866,
1015
- "##т": 867,
1016
- "##е": 868,
1017
- "##д": 869,
1018
- "##р": 870,
1019
- "##ツ": 871,
1020
- "##ネ": 872,
1021
- "##ɔ": 873,
1022
- "##ɡ": 874,
1023
- "##ʃ": 875,
1024
- "##ɒ": 876,
1025
- "##ᵻ": 877,
1026
- "##θ": 878,
1027
- "##ʊ": 879,
1028
- "##ъ": 880,
1029
- "##з": 881,
1030
- "##н": 882,
1031
- "##с": 883,
1032
- "##и": 884,
1033
- "##ア": 885,
1034
- "##リ": 886,
1035
- "##ス": 887,
1036
- "##ل": 888,
1037
- "##ا": 889,
1038
- "##د": 890,
1039
- "##ʁ": 891,
1040
- "##ו": 892,
1041
- "##פ": 893,
1042
- "##נ": 894,
1043
- "##ה": 895,
1044
- "##い": 896,
1045
- "##ち": 897,
1046
- "##ゃ": 898,
1047
- "##ん": 899,
1048
- "##お": 900,
1049
- "##ε": 901,
1050
- "##ρ": 902,
1051
- "##о": 903,
1052
- "##к": 904,
1053
- "##п": 905,
1054
- "##г": 906,
1055
- "##ო": 907,
1056
- "##ि": 908,
1057
- "##ग": 909,
1058
- "##გ": 910,
1059
- "##ა": 911,
1060
- "##ლ": 912,
1061
- "##س": 913,
1062
- "##ت": 914,
1063
- "##ن": 915,
1064
- "##す": 916,
1065
- "##ν": 917,
1066
- "##ラ": 918,
1067
- "##ッ": 919,
1068
- "##シ": 920,
1069
- "##ュ": 921,
1070
- "##ي": 922,
1071
- "##ف": 923,
1072
- "##æ": 924,
1073
- "##ω": 925,
1074
- "##τ": 926,
1075
- "##ι": 927,
1076
- "##ɛ": 928,
1077
- "##ჲ": 929,
1078
- "##ც": 930,
1079
  "##ɑ": 931,
1080
- "##ɾ": 932,
1081
- "##ล": 933,
1082
- "##อ": 934,
1083
- "##ฮ": 935,
1084
- "##ش": 936,
1085
- "##خ": 937,
1086
- "##ɽ": 938,
1087
- "##η": 939,
1088
- "##ら": 940,
1089
- "##ტ": 941,
1090
- "##ე": 942,
1091
- "##あ": 943,
1092
- "##ნ": 944,
1093
- "##な": 945,
1094
- "##ჱ": 946,
1095
- "##ト": 947,
1096
- "##ゥ": 948,
1097
- "##ナ": 949,
1098
- "##ー": 950,
1099
- "##დ": 951,
1100
- "##ქ": 952,
1101
- "##π": 953,
1102
- "##κ": 954,
1103
- "##λ": 955,
1104
- "##わ": 956,
1105
- "##レ": 957,
1106
- "##イ": 958,
1107
- "##ン": 959,
1108
- "##م": 960,
1109
- "##れ": 961,
1110
- "##ウ": 962,
1111
- "##ァ": 963,
1112
- "##キ": 964,
1113
- "##3": 965,
1114
- "##क": 966,
1115
- "##œ": 967,
1116
- "##υ": 968,
1117
- "##χ": 969,
1118
- "##フ": 970,
1119
- "##เ": 971,
1120
- "##ป": 972,
1121
- "##ย": 973,
1122
- "##タ": 974,
1123
- "##σ": 975,
1124
- "##ก": 976,
1125
- "##ว": 977,
1126
- "##ร": 978,
1127
- "##ص": 979,
1128
- "##ニ": 980,
1129
- "##र": 981,
1130
- "##ق": 982,
1131
- "##ܠ": 983,
1132
- "##ܗ": 984,
1133
- "##ܐ": 985,
1134
- "##ж": 986,
1135
- "##ゆ": 987,
1136
- "##り": 988,
1137
- "##ы": 989,
1138
- "##в": 990,
1139
- "##ף": 991,
1140
- "##か": 992,
1141
- "##ह": 993,
1142
- "##く": 994,
1143
- "##ð": 995,
1144
- "##º": 996,
1145
- "##ß": 997,
1146
- "##ャ": 998,
1147
- "##モ": 999,
1148
- "##ィ": 1000,
1149
- "##ן": 1001,
1150
- "##ク": 1002,
1151
- "##м": 1003,
1152
- "##ハ": 1004,
1153
- "##י": 1005,
1154
- "##ס": 1006,
1155
- "##ל": 1007,
1156
  "##đ": 1008,
1157
- "##მ": 1009,
1158
- "##ซ": 1010,
1159
- "##ʔ": 1011,
1160
- "##ه": 1012,
1161
- "##ם": 1013,
1162
- "##ξ": 1014,
1163
- "##แ": 1015,
1164
- "##ョ": 1016,
1165
- "##こ": 1017,
1166
- "##ム": 1018,
1167
- "##チ": 1019,
1168
- "##ェ": 1020,
1169
- "##ʲ": 1021,
1170
- "##ב": 1022,
1171
- "##ר": 1023,
1172
- "##γ": 1024,
1173
- "##א": 1025,
1174
- "##ま": 1026,
1175
- "##る": 1027,
1176
- "##ر": 1028,
1177
- "##ˌ": 1029,
1178
- "##ث": 1030,
1179
- "##თ": 1031,
1180
- "##せ": 1032,
1181
- "##წ": 1033,
1182
- "##ფ": 1034,
1183
- "##า": 1035,
1184
- "##ณ": 1036,
1185
- "##ม": 1037,
1186
- "##ต": 1038,
1187
- "##ب": 1039,
1188
- "##は": 1040,
1189
- "##サ": 1041,
1190
- "##ع": 1042,
1191
- "##ة": 1043,
1192
- "##カ": 1044,
1193
- "##ʿ": 1045,
1194
- "##ɐ": 1046,
1195
- "##ש": 1047,
1196
- "##מ": 1048,
1197
- "##צ": 1049,
1198
- "##ܕ": 1050,
1199
- "##ܝ": 1051,
1200
- "##ܢ": 1052,
1201
- "##ܬ": 1053,
1202
- "##ภ": 1054,
1203
- "##ด": 1055,
1204
- "##ロ": 1056,
1205
- "##ı": 1057,
1206
- "##ш": 1058,
1207
- "##ჳ": 1059,
1208
- "##я": 1060,
1209
- "##し": 1061,
1210
- "##ะ": 1062,
1211
- "##ช": 1063,
1212
- "##น": 1064,
1213
- "##エ": 1065,
1214
- "##ค": 1066,
1215
- "##も": 1067,
1216
- "##ᅦ": 1068,
1217
- "##ᄃ": 1069,
1218
- "##ᅩ": 1070,
1219
- "##ᆨ": 1071,
1220
- "##ᄅ": 1072,
1221
- "##ᅵ": 1073,
1222
- "##ᆸ": 1074,
1223
- "##ᄇ": 1075,
1224
- "##ᅧ": 1076,
1225
- "##ᆼ": 1077,
1226
- "##ᄋ": 1078,
1227
- "##ᆫ": 1079,
1228
- "##ᅢ": 1080,
1229
- "##み": 1081,
1230
- "##と": 1082,
1231
- "##ك": 1083,
1232
- "##є": 1084,
1233
- "##ء": 1085,
1234
- "##พ": 1086,
1235
- "##っ": 1087,
1236
- "##ょ": 1088,
1237
- "##に": 1089,
1238
- "##у": 1090,
1239
- "##マ": 1091,
1240
- "##و": 1092,
1241
- "##ਲ": 1093,
1242
- "##ਹ": 1094,
1243
- "##х": 1095,
1244
  "##ᅡ": 1096,
1245
  "##ᆯ": 1097,
1246
- "##β": 1098,
1247
- "##ת": 1099,
1248
- "##ɜ": 1100,
1249
- "##ψ": 1101,
1250
- "##ю": 1102,
1251
- "##ാ": 1103,
1252
- "##ഹ": 1104,
1253
- "##ц": 1105,
1254
- "##ь": 1106,
1255
- "##ᅮ": 1107,
1256
- "##ɫ": 1108,
1257
- "##ذ": 1109,
1258
- "##セ": 1110,
1259
- "##オ": 1111,
1260
- "##ح": 1112,
1261
- "##ひ": 1113,
1262
- "##を": 1114,
1263
- "##ʒ": 1115,
1264
- "##ง": 1116,
1265
- "##ไ": 1117,
1266
- "##ษ": 1118,
1267
- "##ฐ": 1119,
1268
- "##ल": 1120,
1269
- "##ਾ": 1121,
1270
- "##ミ": 1122,
1271
- "##ノ": 1123
1272
  }
1273
  }
1274
  }
935
  "/": 787,
936
  "3": 788,
937
  "~": 789,
938
+ "##e": 790,
939
  "##r": 791,
940
+ "##l": 792,
941
+ "##y": 793,
942
+ "##n": 794,
943
+ "##t": 795,
944
+ "##s": 796,
945
+ "##f": 797,
946
+ "##i": 798,
947
+ "##d": 799,
948
+ "##u": 800,
949
+ "##a": 801,
950
+ "##p": 802,
951
+ "##o": 803,
952
+ "##g": 804,
953
+ "##c": 805,
954
+ "##h": 806,
955
+ "##k": 807,
956
+ "##w": 808,
957
+ "##z": 809,
958
+ "##v": 810,
959
+ "##m": 811,
960
+ "##b": 812,
961
+ "##ロ": 813,
962
+ "##ル": 814,
963
+ "##ト": 815,
964
+ "##0": 816,
965
+ "##2": 817,
966
+ "##5": 818,
967
  "##7": 819,
968
+ "##1": 820,
969
+ "##4": 821,
970
+ "##x": 822,
971
+ "##j": 823,
972
+ "##す": 824,
973
+ "##め": 825,
974
+ "##3": 826,
975
+ "##8": 827,
976
+ "##q": 828,
977
+ "##6": 829,
978
+ "##ʻ": 830,
979
+ "##ł": 831,
980
+ "##9": 832,
981
+ "##ف": 833,
982
+ "##ن": 834,
983
+ "##ا": 835,
984
+ "##い": 836,
985
+ "##ب": 837,
986
+ "##ي": 838,
987
+ "##ت": 839,
988
+ "##ɔ": 840,
989
+ "##つ": 841,
990
+ "##う": 842,
991
+ "##ს": 843,
992
+ "##ო": 844,
993
+ "##მ": 845,
994
+ "##თ": 846,
995
+ "##ა": 847,
996
+ "##ვ": 848,
997
+ "##რ": 849,
998
+ "##უ": 850,
999
+ "##ლ": 851,
1000
+ "##ი": 852,
1001
+ "##י": 853,
1002
+ "##פ": 854,
1003
+ "##ה": 855,
1004
+ "##ø": 856,
1005
+ "##ร": 857,
1006
+ "##く": 858,
1007
+ "##み": 859,
1008
+ "##ტ": 860,
1009
+ "##ე": 861,
1010
+ "##ッ": 862,
1011
+ "##ラ": 863,
1012
+ "##ー": 864,
1013
+ "##フ": 865,
1014
+ "##ा": 866,
1015
+ "##द": 867,
1016
+ "##о": 868,
1017
+ "##в": 869,
1018
+ "##е": 870,
1019
+ "##т": 871,
1020
+ "##с": 872,
1021
+ "##к": 873,
1022
+ "##а": 874,
1023
+ "##я": 875,
1024
+ "##ア": 876,
1025
+ "##د": 877,
1026
+ "##ر": 878,
1027
+ "##ˈ": 879,
1028
+ "##ν": 880,
1029
+ "##θ": 881,
1030
+ "##η": 882,
1031
+ "##μ": 883,
1032
+ "##ο": 884,
1033
+ "##ι": 885,
1034
+ "##χ": 886,
1035
+ "##α": 887,
1036
+ "##τ": 888,
1037
+ "##κ": 889,
1038
+ "##ρ": 890,
1039
+ "##ω": 891,
1040
+ "##ς": 892,
1041
+ "##س": 893,
1042
+ "##م": 894,
1043
+ "##は": 895,
1044
+ "##イ": 896,
1045
+ "##き": 897,
1046
+ "##β": 898,
1047
+ "##л": 899,
1048
+ "##ы": 900,
1049
+ "##и": 901,
1050
+ "##λ": 902,
1051
+ "##พ": 903,
1052
+ "##を": 904,
1053
+ "##ɒ": 905,
1054
+ "##ᵻ": 906,
1055
+ "##ʊ": 907,
1056
+ "##ː": 908,
1057
+ "##ə": 909,
1058
+ "##ニ": 910,
1059
+ "##æ": 911,
1060
+ "##ε": 912,
1061
+ "##ב": 913,
1062
+ "##ר": 914,
1063
+ "##ם": 915,
1064
+ "##ะ": 916,
1065
+ "##ช": 917,
1066
+ "##อ": 918,
1067
+ "##น": 919,
1068
+ "##ᄇ": 920,
1069
+ "##ᅮ": 921,
1070
+ "##ᄃ": 922,
1071
+ "##ᅢ": 923,
1072
+ "##ʔ": 924,
1073
+ "##の": 925,
1074
+ "##な": 926,
1075
+ "##ら": 927,
1076
+ "##π": 928,
1077
+ "##ɪ": 929,
1078
+ "##ʃ": 930,
1079
  "##ɑ": 931,
1080
+ "##δ": 932,
1081
+ "##ც": 933,
1082
+ "##ล": 934,
1083
+ "##ย": 935,
1084
+ "##า": 936,
1085
+ "##ณ": 937,
1086
+ "##ม": 938,
1087
+ "##ต": 939,
1088
+ "##แ": 940,
1089
+ "##ก": 941,
1090
+ "##ス": 942,
1091
+ "##テ": 943,
1092
+ "##ィ": 944,
1093
+ "##ह": 945,
1094
+ "##ण": 946,
1095
+ "##ث": 947,
1096
+ "##р": 948,
1097
+ "##у": 949,
1098
+ "##н": 950,
1099
+ "##た": 951,
1100
+ "##り": 952,
1101
+ "##ق": 953,
1102
+ "##ش": 954,
1103
+ "##و": 955,
1104
+ "##া": 956,
1105
+ "##হ": 957,
1106
+ "##ゆ": 958,
1107
+ "##ل": 959,
1108
+ "##ェ": 960,
1109
+ "##ハ": 961,
1110
+ "##გ": 962,
1111
+ "##ნ": 963,
1112
+ "##र": 964,
1113
+ "##ള": 965,
1114
+ "##ჲ": 966,
1115
+ "##ウ": 967,
1116
+ "##ァ": 968,
1117
+ "##キ": 969,
1118
+ "##ュ": 970,
1119
+ "##リ": 971,
1120
+ "##3": 972,
1121
+ "##お": 973,
1122
+ "##ɳ": 974,
1123
+ "##ɡ": 975,
1124
+ "##ხ": 976,
1125
+ "##ɾ": 977,
1126
+ "##ו": 978,
1127
+ "##ع": 979,
1128
+ "##ة": 980,
1129
+ "##ß": 981,
1130
+ "##ネ": 982,
1131
+ "##ク": 983,
1132
+ "##シ": 984,
1133
+ "##ョ": 985,
1134
+ "##ン": 986,
1135
+ "##ك": 987,
1136
+ "##ɐ": 988,
1137
+ "##れ": 989,
1138
+ "##ܠ": 990,
1139
+ "##ܗ": 991,
1140
+ "##ܐ": 992,
1141
+ "##ɛ": 993,
1142
+ "##ל": 994,
1143
+ "##א": 995,
1144
+ "##か": 996,
1145
+ "##こ": 997,
1146
+ "##ツ": 998,
1147
+ "##ı": 999,
1148
+ "##あ": 1000,
1149
+ "##ん": 1001,
1150
+ "##ノ": 1002,
1151
+ "##っ": 1003,
1152
+ "##ן": 1004,
1153
+ "##ه": 1005,
1154
+ "##ल": 1006,
1155
+ "##ซ": 1007,
1156
  "##đ": 1008,
1157
+ "##ש": 1009,
1158
+ "##מ": 1010,
1159
+ "##צ": 1011,
1160
+ "##ჱ": 1012,
1161
+ "##ォ": 1013,
1162
+ "##ゥ": 1014,
1163
+ "##ナ": 1015,
1164
+ "##œ": 1016,
1165
+ "##न": 1017,
1166
+ "##ई": 1018,
1167
+ "##д": 1019,
1168
+ "##ち": 1020,
1169
+ "##ゃ": 1021,
1170
+ "##ল": 1022,
1171
+ "##ص": 1023,
1172
+ "##º": 1024,
1173
+ "##ψ": 1025,
1174
+ "##ਲ": 1026,
1175
+ "##ਾ": 1027,
1176
+ "##ਹ": 1028,
1177
+ "##ð": 1029,
1178
+ "##დ": 1030,
1179
+ "##し": 1031,
1180
+ "##ป": 1032,
1181
+ "##ʿ": 1033,
1182
+ "##ʁ": 1034,
1183
+ "##υ": 1035,
1184
+ "##ि": 1036,
1185
+ "##せ": 1037,
1186
+ "##ฮ": 1038,
1187
+ "##γ": 1039,
1188
+ "##ɜ": 1040,
1189
+ "##נ": 1041,
1190
+ "##ภ": 1042,
1191
+ "##ด": 1043,
1192
+ "##з": 1044,
1193
+ "##レ": 1045,
1194
+ "##ף": 1046,
1195
+ "##わ": 1047,
1196
+ "##ح": 1048,
1197
+ "##ャ": 1049,
1198
+ "##モ": 1050,
1199
+ "##サ": 1051,
1200
+ "##ъ": 1052,
1201
+ "##ж": 1053,
1202
+ "##ょ": 1054,
1203
+ "##に": 1055,
1204
+ "##เ": 1056,
1205
+ "##є": 1057,
1206
+ "##も": 1058,
1207
+ "##ɽ": 1059,
1208
+ "##ˌ": 1060,
1209
+ "##セ": 1061,
1210
+ "##オ": 1062,
1211
+ "##ま": 1063,
1212
+ "##ミ": 1064,
1213
+ "##ס": 1065,
1214
+ "##マ": 1066,
1215
+ "##ء": 1067,
1216
+ "##п": 1068,
1217
+ "##σ": 1069,
1218
+ "##と": 1070,
1219
+ "##ქ": 1071,
1220
+ "##ാ": 1072,
1221
+ "##ഹ": 1073,
1222
+ "##ჳ": 1074,
1223
+ "##ʒ": 1075,
1224
+ "##ว": 1076,
1225
+ "##ת": 1077,
1226
+ "##ذ": 1078,
1227
+ "##ю": 1079,
1228
+ "##х": 1080,
1229
+ "##る": 1081,
1230
+ "##ひ": 1082,
1231
+ "##タ": 1083,
1232
+ "##ш": 1084,
1233
+ "##ц": 1085,
1234
+ "##ь": 1086,
1235
+ "##ʲ": 1087,
1236
+ "##წ": 1088,
1237
+ "##ფ": 1089,
1238
+ "##क": 1090,
1239
+ "##ɫ": 1091,
1240
+ "##ษ": 1092,
1241
+ "##ฐ": 1093,
1242
+ "##ง": 1094,
1243
+ "##ไ": 1095,
1244
  "##ᅡ": 1096,
1245
  "##ᆯ": 1097,
1246
+ "##ᄅ": 1098,
1247
+ "##エ": 1099,
1248
+ "##व": 1100,
1249
+ "##ム": 1101,
1250
+ "##チ": 1102,
1251
+ "##ग": 1103,
1252
+ "##カ": 1104,
1253
+ "##ܕ": 1105,
1254
+ "##ܝ": 1106,
1255
+ "##ܢ": 1107,
1256
+ "##ܬ": 1108,
1257
+ "##ξ": 1109,
1258
+ "##خ": 1110,
1259
+ "##ᅦ": 1111,
1260
+ "##ᅩ": 1112,
1261
+ "##ᆨ": 1113,
1262
+ "##ᅵ": 1114,
1263
+ "##ᆸ": 1115,
1264
+ "##ᅧ": 1116,
1265
+ "##ᆼ": 1117,
1266
+ "##ᄋ": 1118,
1267
+ "##ᆫ": 1119,
1268
+ "##г": 1120,
1269
+ "##ค": 1121,
1270
+ "##स": 1122,
1271
+ "##м": 1123
1272
  }
1273
  }
1274
  }
tokenizer_config.json CHANGED
@@ -4,7 +4,6 @@
4
  "do_lower_case": true,
5
  "mask_token": "[MASK]",
6
  "model_max_length": 512,
7
- "name_or_path": "/tmp/tmpwmqhff1f/decoder/processors",
8
  "never_split": null,
9
  "pad_token": "[PAD]",
10
  "sep_token": "[SEP]",
4
  "do_lower_case": true,
5
  "mask_token": "[MASK]",
6
  "model_max_length": 512,
 
7
  "never_split": null,
8
  "pad_token": "[PAD]",
9
  "sep_token": "[SEP]",
vocab.txt CHANGED
@@ -788,337 +788,337 @@ z
788
 
789
 
790
 
791
- ##c
792
- ##r
793
  ##e
794
- ##a
795
- ##m
796
- ##i
797
  ##n
798
- ##g
799
- ##k
800
- ##p
801
- ##o
802
  ##t
803
  ##s
804
- ##l
805
- ##1
806
- ##h
807
- ##d
808
- ##j
809
  ##f
810
- ##y
811
- ##b
812
  ##u
 
 
 
 
 
 
 
813
  ##w
 
814
  ##v
815
- ##x
 
 
 
 
 
 
816
  ##5
817
- ##8
818
- ##3
819
- ##9
820
  ##7
821
- ##6
822
- ##z
823
- ##た
824
- ##め
825
- ##の
826
- ##0
827
- ##ा
828
- ##न
829
- ##ई
830
  ##4
831
- ##2
832
- ##ხ
833
- ##ვ
834
- ##ი
835
- ##ს
 
836
  ##q
837
- ##き
 
 
 
 
 
 
 
 
 
 
 
838
  ##つ
839
  ##う
840
- ##ള
841
- ##ɪ
842
- ##ォ
843
- ##ル
844
- ##テ
 
 
 
 
 
 
 
 
845
  ##ø
846
- ##ł
847
- ##া
848
- ##হ
849
- ##ল
850
- ##ʻ
851
- ##ण
852
- ##स
853
- ##व
 
 
854
  ##द
855
- ##л
856
- ##а
857
- ##α
858
- ##ο
859
- ##ς
860
- ##უ
861
- ##რ
862
- ##δ
863
- ##μ
864
- ##ə
865
- ##ː
866
- ##ˈ
867
- ##ɳ
868
- ##т
869
  ##е
870
- ##д
871
- ##р
872
- ##ツ
873
- ##ネ
874
- ##ɔ
875
- ##ɡ
876
- ##ʃ
877
- ##ɒ
878
- ##ᵻ
879
- ##θ
880
- ##ʊ
881
- ##ъ
882
- ##з
883
- ##н
884
  ##с
885
- ##и
 
 
886
  ##ア
887
- ##リ
888
- ##ス
889
- ##ل
890
- ##ا
891
  ##د
892
- ##ʁ
893
- ##ו
894
- ##פ
895
- ##נ
896
- ##ה
897
- ##い
898
- ##ち
899
- ##ゃ
900
- ##ん
901
- ##お
902
- ##ε
 
903
  ##ρ
904
- ##о
905
- ##к
906
- ##п
907
- ##г
908
- ##ო
909
- ##ि
910
- ##ग
911
- ##გ
912
- ##ა
913
- ##ლ
914
  ##س
915
- ##ت
916
- ##ن
917
- ##す
918
- ##ν
919
- ##ラ
920
- ##ッ
921
- ##シ
922
- ##ュ
923
- ##ي
924
- ##ف
 
 
 
 
 
 
 
925
  ##æ
926
- ##ω
927
- ##τ
928
- ##ι
929
- ##ɛ
930
- ##ჲ
931
- ##ც
 
 
 
 
 
 
 
 
 
 
 
 
 
932
  ##ɑ
933
- ##ɾ
 
934
  ##ล
935
- ##อ
936
- ##ฮ
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
937
  ##ش
938
- ##خ
939
- ##ɽ
940
- ##η
941
- ##ら
942
- ##ტ
943
- ##ე
944
- ##あ
 
945
  ##ნ
946
- ##な
947
- ##ჱ
948
- ##ト
949
- ##ゥ
950
- ##ナ
951
- ##ー
952
- ##დ
953
- ##ქ
954
- ##π
955
- ##κ
956
- ##λ
957
- ##わ
958
- ##レ
959
- ##イ
 
 
 
 
 
 
 
 
960
  ##ン
961
- ##م
 
962
  ##れ
963
- ##ウ
964
- ##ァ
965
- ##キ
966
- ##3
967
- ##क
968
- ##œ
969
- ##υ
970
- ##χ
971
- ##フ
972
- ##เ
973
- ##ป
974
- ##ย
975
- ##タ
976
- ##σ
977
- ##ก
978
- ##ว
979
- ##ร
980
- ##ص
981
- ##ニ
982
- ##र
983
- ##ق
984
  ##ܠ
985
  ##ܗ
986
  ##ܐ
987
- ##ж
988
- ##ゆ
989
- ##り
990
- ##ы
991
- ##в
992
- ##ף
993
  ##か
994
- ##ह
995
- ##く
996
- ##ð
997
- ##º
998
- ##ß
999
- ##ャ
1000
- ##モ
1001
- ##ィ
1002
  ##ן
1003
- ##ク
1004
- ##м
1005
- ##ハ
1006
- ##י
1007
- ##ס
1008
- ##ל
1009
- ##đ
1010
- ##მ
1011
- ##ซ
1012
- ##ʔ
1013
  ##ه
1014
- ##ם
1015
- ##ξ
1016
- ##แ
1017
- ##ョ
1018
- ##こ
1019
- ##ム
1020
- ##チ
1021
- ##ェ
1022
- ##ʲ
1023
- ##ב
1024
- ##ר
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1025
  ##γ
1026
- ##א
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1027
  ##ま
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1028
  ##る
1029
- ##ر
1030
- ##ˌ
1031
- ##ث
1032
- ##თ
1033
- ##せ
 
1034
  ##წ
1035
  ##ფ
1036
- ##า
1037
- ##ณ
1038
- ##ม
1039
- ##ต
1040
- ##ب
1041
- ##は
1042
- ##サ
1043
- ##ع
1044
- ##ة
 
 
 
 
 
1045
  ##カ
1046
- ##ʿ
1047
- ##ɐ
1048
- ##ש
1049
- ##מ
1050
- ##צ
1051
  ##ܕ
1052
  ##ܝ
1053
  ##ܢ
1054
  ##ܬ
1055
- ##ภ
1056
- ##ด
1057
- ##ロ
1058
- ##ı
1059
- ##ш
1060
- ##ჳ
1061
- ##я
1062
- ##し
1063
- ##ะ
1064
- ##ช
1065
- ##น
1066
- ##エ
1067
- ##ค
1068
- ##も
1069
  ##ᅦ
1070
- ##ᄃ
1071
  ##ᅩ
1072
  ##ᆨ
1073
- ##ᄅ
1074
  ##ᅵ
1075
  ##ᆸ
1076
- ##ᄇ
1077
  ##ᅧ
1078
  ##ᆼ
1079
  ##ᄋ
1080
  ##ᆫ
1081
- ##ᅢ
1082
- ##み
1083
- ##と
1084
- ##ك
1085
- ##є
1086
- ##ء
1087
- ##พ
1088
- ##っ
1089
- ##ょ
1090
- ##に
1091
- ##у
1092
- ##マ
1093
- ##و
1094
- ##ਲ
1095
- ##ਹ
1096
- ##х
1097
- ##ᅡ
1098
- ##ᆯ
1099
- ##β
1100
- ##ת
1101
- ##ɜ
1102
- ##ψ
1103
- ##ю
1104
- ##ാ
1105
- ##ഹ
1106
- ##ц
1107
- ##ь
1108
- ##ᅮ
1109
- ##ɫ
1110
- ##ذ
1111
- ##セ
1112
- ##オ
1113
- ##ح
1114
- ##ひ
1115
- ##を
1116
- ##ʒ
1117
- ##ง
1118
- ##ไ
1119
- ##ษ
1120
- ##ฐ
1121
- ##ल
1122
- ##ਾ
1123
- ##ミ
1124
- ##ノ
788
 
789
 
790
 
 
 
791
  ##e
792
+ ##r
793
+ ##l
794
+ ##y
795
  ##n
 
 
 
 
796
  ##t
797
  ##s
 
 
 
 
 
798
  ##f
799
+ ##i
800
+ ##d
801
  ##u
802
+ ##a
803
+ ##p
804
+ ##o
805
+ ##g
806
+ ##c
807
+ ##h
808
+ ##k
809
  ##w
810
+ ##z
811
  ##v
812
+ ##m
813
+ ##b
814
+ ##ロ
815
+ ##ル
816
+ ##ト
817
+ ##0
818
+ ##2
819
  ##5
 
 
 
820
  ##7
821
+ ##1
 
 
 
 
 
 
 
 
822
  ##4
823
+ ##x
824
+ ##j
825
+ ##す
826
+ ##め
827
+ ##3
828
+ ##8
829
  ##q
830
+ ##6
831
+ ##ʻ
832
+ ##ł
833
+ ##9
834
+ ##ف
835
+ ##ن
836
+ ##ا
837
+ ##い
838
+ ##ب
839
+ ##ي
840
+ ##ت
841
+ ##ɔ
842
  ##つ
843
  ##う
844
+ ##ს
845
+ ##ო
846
+ ##მ
847
+ ##თ
848
+ ##ა
849
+ ##ვ
850
+ ##რ
851
+ ##უ
852
+ ##ლ
853
+ ##ი
854
+ ##י
855
+ ##פ
856
+ ##ה
857
  ##ø
858
+ ##ร
859
+ ##く
860
+ ##み
861
+ ##ტ
862
+ ##ე
863
+ ##ッ
864
+ ##ラ
865
+ ##ー
866
+ ##フ
867
+ ##ा
868
  ##द
869
+ ##о
870
+ ##в
 
 
 
 
 
 
 
 
 
 
 
 
871
  ##е
872
+ ##т
 
 
 
 
 
 
 
 
 
 
 
 
 
873
  ##с
874
+ ##к
875
+ ##а
876
+ ##я
877
  ##ア
 
 
 
 
878
  ##د
879
+ ##ر
880
+ ##ˈ
881
+ ##ν
882
+ ##θ
883
+ ##η
884
+ ##μ
885
+ ##ο
886
+ ##ι
887
+ ##χ
888
+ ##α
889
+ ##τ
890
+ ##κ
891
  ##ρ
892
+ ##ω
893
+ ##ς
 
 
 
 
 
 
 
 
894
  ##س
895
+ ##م
896
+ ##は
897
+ ##イ
898
+ ##き
899
+ ##β
900
+ ##л
901
+ ##ы
902
+ ##и
903
+ ##λ
904
+ ##พ
905
+ ##を
906
+ ##ɒ
907
+ ##ᵻ
908
+ ##ʊ
909
+ ##ː
910
+ ##ə
911
+ ##ニ
912
  ##æ
913
+ ##ε
914
+ ##ב
915
+ ##ר
916
+ ##ם
917
+ ##ะ
918
+ ##ช
919
+ ##อ
920
+ ##น
921
+ ##ᄇ
922
+ ##ᅮ
923
+ ##ᄃ
924
+ ##ᅢ
925
+ ##ʔ
926
+ ##の
927
+ ##な
928
+ ##ら
929
+ ##π
930
+ ##ɪ
931
+ ##ʃ
932
  ##ɑ
933
+ ##δ
934
+ ##ც
935
  ##ล
936
+ ##ย
937
+ ##า
938
+ ##ณ
939
+ ##ม
940
+ ##ต
941
+ ##แ
942
+ ##ก
943
+ ##ス
944
+ ##テ
945
+ ##ィ
946
+ ##ह
947
+ ##ण
948
+ ##ث
949
+ ##р
950
+ ##у
951
+ ##н
952
+ ##た
953
+ ##り
954
+ ##ق
955
  ##ش
956
+ ##و
957
+ ##া
958
+ ##হ
959
+ ##ゆ
960
+ ##ل
961
+ ##ェ
962
+ ##ハ
963
+ ##გ
964
  ##ნ
965
+ ##र
966
+ ##ള
967
+ ##ჲ
968
+ ##ウ
969
+ ##ァ
970
+ ##キ
971
+ ##ュ
972
+ ##リ
973
+ ##3
974
+ ##お
975
+ ##ɳ
976
+ ##ɡ
977
+ ##ხ
978
+ ##ɾ
979
+ ##ו
980
+ ##ع
981
+ ##ة
982
+ ##ß
983
+ ##ネ
984
+ ##ク
985
+ ##シ
986
+ ##ョ
987
  ##ン
988
+ ##ك
989
+ ##ɐ
990
  ##れ
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
991
  ##ܠ
992
  ##ܗ
993
  ##ܐ
994
+ ##ɛ
995
+ ##ל
996
+ ##א
 
 
 
997
  ##か
998
+ ##こ
999
+ ##ツ
1000
+ ##ı
1001
+ ##あ
1002
+ ##ん
1003
+ ##ノ
1004
+ ##っ
 
1005
  ##ן
 
 
 
 
 
 
 
 
 
 
1006
  ##ه
1007
+ ##ल
1008
+ ##ซ
1009
+ ##đ
1010
+ ##ש
1011
+ ##מ
1012
+ ##צ
1013
+ ##ჱ
1014
+ ##ォ
1015
+ ##ゥ
1016
+ ##ナ
1017
+ ##œ
1018
+ ##न
1019
+ ##ई
1020
+ ##д
1021
+ ##ち
1022
+ ##ゃ
1023
+ ##ল
1024
+ ##ص
1025
+ ##º
1026
+ ##ψ
1027
+ ##ਲ
1028
+ ##ਾ
1029
+ ##ਹ
1030
+ ##ð
1031
+ ##დ
1032
+ ##し
1033
+ ##ป
1034
+ ##ʿ
1035
+ ##ʁ
1036
+ ##υ
1037
+ ##ि
1038
+ ##せ
1039
+ ##ฮ
1040
  ##γ
1041
+ ##ɜ
1042
+ ##נ
1043
+ ##ภ
1044
+ ##ด
1045
+ ##з
1046
+ ##レ
1047
+ ##ף
1048
+ ##わ
1049
+ ##ح
1050
+ ##ャ
1051
+ ##モ
1052
+ ##サ
1053
+ ##ъ
1054
+ ##ж
1055
+ ##ょ
1056
+ ##に
1057
+ ##เ
1058
+ ##є
1059
+ ##も
1060
+ ##ɽ
1061
+ ##ˌ
1062
+ ##セ
1063
+ ##オ
1064
  ##ま
1065
+ ##ミ
1066
+ ##ס
1067
+ ##マ
1068
+ ##ء
1069
+ ##п
1070
+ ##σ
1071
+ ##と
1072
+ ##ქ
1073
+ ##ാ
1074
+ ##ഹ
1075
+ ##ჳ
1076
+ ##ʒ
1077
+ ##ว
1078
+ ##ת
1079
+ ##ذ
1080
+ ##ю
1081
+ ##х
1082
  ##る
1083
+ ##ひ
1084
+ ##タ
1085
+ ##ш
1086
+ ##ц
1087
+ ##ь
1088
+ ##ʲ
1089
  ##წ
1090
  ##ფ
1091
+ ##क
1092
+ ##ɫ
1093
+ ##ษ
1094
+ ##ฐ
1095
+ ##ง
1096
+ ##ไ
1097
+ ##ᅡ
1098
+ ##ᆯ
1099
+ ##ᄅ
1100
+ ##エ
1101
+ ##व
1102
+ ##ム
1103
+ ##チ
1104
+ ##ग
1105
  ##カ
 
 
 
 
 
1106
  ##ܕ
1107
  ##ܝ
1108
  ##ܢ
1109
  ##ܬ
1110
+ ##ξ
1111
+ ##خ
 
 
 
 
 
 
 
 
 
 
 
 
1112
  ##ᅦ
 
1113
  ##ᅩ
1114
  ##ᆨ
 
1115
  ##ᅵ
1116
  ##ᆸ
 
1117
  ##ᅧ
1118
  ##ᆼ
1119
  ##ᄋ
1120
  ##ᆫ
1121
+ ##г
1122
+ ##ค
1123
+ ##स
1124
+ ##м