YuukiAsuna commited on
Commit
539038a
1 Parent(s): 9a0e370

Upload processor

Browse files
Files changed (3) hide show
  1. added_tokens.json +1155 -6
  2. tokenizer.json +0 -0
  3. tokenizer_config.json +0 -0
added_tokens.json CHANGED
@@ -1,12 +1,1161 @@
1
  {
2
- "</s_answer>": 57530,
3
- "</s_question>": 57528,
 
 
 
 
 
 
 
 
 
 
4
  "<no/>": 57526,
5
- "<s_answer>": 57529,
6
- "<s_docvqa>": 57531,
7
  "<s_iitcdip>": 57523,
8
- "<s_question>": 57527,
9
  "<s_synthdog>": 57524,
10
  "<sep/>": 57522,
11
- "<yes/>": 57525
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
12
  }
 
1
  {
2
+ "!?": 58127,
3
+ "',": 57701,
4
+ "'.": 58325,
5
+ ".1": 58501,
6
+ "1": 57573,
7
+ "4.": 57619,
8
+ "49.": 58451,
9
+ "6,": 58633,
10
+ "6.": 57708,
11
+ "7.": 58206,
12
+ "</s_answer>": 58679,
13
+ "</s_question>": 58677,
14
  "<no/>": 57526,
15
+ "<s_answer>": 58678,
16
+ "<s_docvqa>": 58680,
17
  "<s_iitcdip>": 57523,
18
+ "<s_question>": 58676,
19
  "<s_synthdog>": 57524,
20
  "<sep/>": 57522,
21
+ "<yes/>": 57525,
22
+ "Bảo": 58075,
23
+ "Chỉ": 58548,
24
+ "Cảm": 58252,
25
+ "Dương": 57686,
26
+ "Hồ": 57598,
27
+ "Kh": 58546,
28
+ "Nguyễn": 58336,
29
+ "Nh": 57724,
30
+ "Như": 58527,
31
+ "Phương": 57977,
32
+ "Số": 58217,
33
+ "Thu": 58591,
34
+ "Từ": 57816,
35
+ "Việt": 57913,
36
+ "anh": 57700,
37
+ "chỉ": 58034,
38
+ "chị": 58380,
39
+ "cả": 58505,
40
+ "hiệu": 58087,
41
+ "hoặc": 57952,
42
+ "iếc": 58263,
43
+ "iến": 58317,
44
+ "iếng": 57581,
45
+ "iếp": 58655,
46
+ "iết": 57530,
47
+ "iếu": 57908,
48
+ "iềm": 57969,
49
+ "iền": 57629,
50
+ "iều": 57832,
51
+ "iểm": 57559,
52
+ "iển": 58351,
53
+ "iểu": 58069,
54
+ "iện": 58071,
55
+ "iệp": 57932,
56
+ "iệt": 57798,
57
+ "iệu": 58596,
58
+ "một": 57528,
59
+ "ngh": 58352,
60
+ "người": 58549,
61
+ "năm": 57741,
62
+ "số": 57587,
63
+ "tiền": 57886,
64
+ "trước": 58567,
65
+ "trừ": 57888,
66
+ "tuổi": 58581,
67
+ "từ": 58481,
68
+ "urn": 58373,
69
+ "uyền": 57967,
70
+ "uyển": 58564,
71
+ "uyện": 57736,
72
+ "và": 57749,
73
+ "với": 58499,
74
+ "Â": 58041,
75
+ "Ô": 58258,
76
+ "ành": 57819,
77
+ "òm": 58311,
78
+ "được": 57830,
79
+ "để": 58216,
80
+ "ơ": 57792,
81
+ "ơi": 58123,
82
+ "ơn": 58289,
83
+ "Ư": 57790,
84
+ "ư": 58215,
85
+ "ưa": 58524,
86
+ "ưng": 58617,
87
+ "ưu": 58038,
88
+ "ương": 58529,
89
+ "ước": 58404,
90
+ "ưới": 57547,
91
+ "ướng": 57768,
92
+ "ười": 57731,
93
+ "ườm": 57813,
94
+ "ườn": 58478,
95
+ "ường": 57689,
96
+ "ưỡi": 58674,
97
+ "ưỡng": 57751,
98
+ "ược": 57812,
99
+ "ượn": 58437,
100
+ "ượng": 57986,
101
+ "ượt": 58484,
102
+ "ại": 57750,
103
+ "ạo": 58647,
104
+ "ả": 57829,
105
+ "ải": 58316,
106
+ "ảm": 57818,
107
+ "ản": 58134,
108
+ "ảng": 58632,
109
+ "ảo": 58598,
110
+ "ảy": 58129,
111
+ "Ẩ": 57529,
112
+ "ẩu": 58324,
113
+ "ậc": 58037,
114
+ "ậm": 57567,
115
+ "ận": 58608,
116
+ "ập": 57885,
117
+ "ật": 58145,
118
+ "ậu": 57809,
119
+ "ằn": 58138,
120
+ "ằng": 57900,
121
+ "ẳn": 57863,
122
+ "ặng": 58618,
123
+ "ặp": 58492,
124
+ "ặt": 57702,
125
+ "ẹn": 57845,
126
+ "ẻ": 58193,
127
+ "ẽ": 58231,
128
+ "ế": 58190,
129
+ "ết": 58114,
130
+ "ề": 57640,
131
+ "ền": 58209,
132
+ "ển": 57806,
133
+ "ễ": 58308,
134
+ "ễn": 58000,
135
+ "ệ": 58204,
136
+ "ện": 58646,
137
+ "ỉ": 57776,
138
+ "ỉnh": 58218,
139
+ "ị": 58601,
140
+ "ịa": 58319,
141
+ "ịch": 57670,
142
+ "ịnh": 58292,
143
+ "ỏa": 58439,
144
+ "Ố": 58279,
145
+ "ốc": 57773,
146
+ "ối": 58307,
147
+ "ốn": 58098,
148
+ "ống": 58341,
149
+ "ốt": 58270,
150
+ "ồi": 57622,
151
+ "ồn": 58636,
152
+ "ồng": 57684,
153
+ "ổ": 58490,
154
+ "ổi": 57711,
155
+ "ổng": 58665,
156
+ "ỗ": 57600,
157
+ "ỗng": 58503,
158
+ "ộ": 57956,
159
+ "ộc": 58614,
160
+ "ội": 58081,
161
+ "ộng": 57645,
162
+ "ột": 58447,
163
+ "ớ": 57630,
164
+ "ới": 58284,
165
+ "ời": 58036,
166
+ "ở": 57814,
167
+ "ởi": 58144,
168
+ "ợ": 58303,
169
+ "ợn": 58150,
170
+ "ợp": 58485,
171
+ "ủ": 58249,
172
+ "ủi": 58326,
173
+ "ủng": 58395,
174
+ "ứ": 58495,
175
+ "ứa": 57981,
176
+ "ức": 58184,
177
+ "ừng": 57985,
178
+ "ử": 58009,
179
+ "ửa": 58644,
180
+ "ửu": 57738,
181
+ "ữ": 57880,
182
+ "ững": 57542,
183
+ "ữu": 57616,
184
+ "ự": 57532,
185
+ "ựa": 57558,
186
+ "ực": 57920,
187
+ "ựu": 58532,
188
+ "ỳ": 57878,
189
+ "ỵ": 58537,
190
+ "ỷ": 57786,
191
+ "▁\"\"": 58142,
192
+ "▁Biển": 58056,
193
+ "▁Biểu": 57925,
194
+ "▁Biệt": 57589,
195
+ "▁Buồn": 57974,
196
+ "▁Bản": 58569,
197
+ "▁Bảng": 57661,
198
+ "▁Bảy": 58020,
199
+ "▁Bằng": 57709,
200
+ "▁Bến": 58235,
201
+ "▁Bệnh": 57548,
202
+ "▁Bỉ": 58182,
203
+ "▁Bốn": 57782,
204
+ "▁Bồ": 57759,
205
+ "▁Bổ": 57852,
206
+ "▁Bộ": 58023,
207
+ "▁Bờ": 57957,
208
+ "▁Bức": 58588,
209
+ "▁Bữa": 57595,
210
+ "▁Chiếc": 58166,
211
+ "▁Chiếu": 58277,
212
+ "▁Chuyến": 57935,
213
+ "▁Chuyện": 57696,
214
+ "▁Chư": 58137,
215
+ "▁Chưa": 58199,
216
+ "▁Chương": 58333,
217
+ "▁Chẳng": 58017,
218
+ "▁Chế": 58412,
219
+ "▁Chết": 57940,
220
+ "▁Chỉ": 57723,
221
+ "▁Chợ": 57704,
222
+ "▁Chủ": 57716,
223
+ "▁Chức": 57703,
224
+ "▁Chứng": 58542,
225
+ "▁Chữ": 57781,
226
+ "▁Cuối": 57712,
227
+ "▁Cuốn": 57755,
228
+ "▁Cuộc": 57821,
229
+ "▁Cơ": 58093,
230
+ "▁Cơm": 57606,
231
+ "▁Cơn": 57614,
232
+ "▁Cương": 57644,
233
+ "▁Cưới": 57906,
234
+ "▁Cường": 58659,
235
+ "▁Cả": 57911,
236
+ "▁Cảm": 58425,
237
+ "▁Cảnh": 58465,
238
+ "▁Cẩm": 58214,
239
+ "▁Cập": 57543,
240
+ "▁Cậu": 58021,
241
+ "▁Cặp": 58517,
242
+ "▁Cỏ": 58264,
243
+ "▁Cổ": 58155,
244
+ "▁Cờ": 58332,
245
+ "▁Của": 58146,
246
+ "▁Cứng": 57676,
247
+ "▁Cứu": 57673,
248
+ "▁Cừ": 58595,
249
+ "▁Cửu": 57609,
250
+ "▁Cực": 58362,
251
+ "▁Diễm": 57674,
252
+ "▁Diện": 57666,
253
+ "▁Diệp": 58136,
254
+ "▁Diệu": 58402,
255
+ "▁Dư": 58602,
256
+ "▁Dương": 57843,
257
+ "▁Dưới": 57766,
258
+ "▁Dược": 58044,
259
+ "▁Dị": 58399,
260
+ "▁Dịch": 58097,
261
+ "▁Dự": 58287,
262
+ "▁Dựa": 58476,
263
+ "▁Giả": 57693,
264
+ "▁Giải": 57828,
265
+ "▁Giảm": 57649,
266
+ "▁Giới": 57706,
267
+ "▁Giờ": 57679,
268
+ "▁Giữa": 57601,
269
+ "▁Gương": 57837,
270
+ "▁Hiến": 57654,
271
+ "▁Hiếu": 57810,
272
+ "▁Hiền": 58053,
273
+ "▁Hiển": 58205,
274
+ "▁Hiểu": 58417,
275
+ "▁Hiện": 58109,
276
+ "▁Hiệp": 58299,
277
+ "▁Hiệu": 57979,
278
+ "▁Hoặc": 58563,
279
+ "▁Huyền": 58315,
280
+ "▁Huyện": 58520,
281
+ "▁Huế": 58544,
282
+ "▁Huệ": 58272,
283
+ "▁Huỳnh": 58562,
284
+ "▁Hơn": 58502,
285
+ "▁Hư": 57866,
286
+ "▁Hưng": 58610,
287
+ "▁Hương": 57987,
288
+ "▁Hải": 58464,
289
+ "▁Hảo": 58078,
290
+ "▁Hậu": 58257,
291
+ "▁Hằng": 58415,
292
+ "▁Hệ": 58648,
293
+ "▁Hổ": 57937,
294
+ "▁Hộ": 57761,
295
+ "▁Hội": 58370,
296
+ "▁Khuyến": 57682,
297
+ "▁Khương": 57721,
298
+ "▁Khải": 58340,
299
+ "▁Khẩu": 57669,
300
+ "▁Khủng": 57917,
301
+ "▁Kiến": 57857,
302
+ "▁Kiếp": 58322,
303
+ "▁Kiều": 57860,
304
+ "▁Kiểm": 58625,
305
+ "▁Kiểu": 58467,
306
+ "▁Kiện": 57588,
307
+ "▁Kiệt": 58468,
308
+ "▁Kẻ": 57949,
309
+ "▁Kế": 57728,
310
+ "▁Kết": 58042,
311
+ "▁Kể": 58401,
312
+ "▁Kịch": 57804,
313
+ "▁Kỷ": 58515,
314
+ "▁Liễu": 58673,
315
+ "▁Luật": 58091,
316
+ "▁Lưu": 58356,
317
+ "▁Lương": 58461,
318
+ "▁Lượng": 57988,
319
+ "▁Lệ": 58558,
320
+ "▁Lịch": 57678,
321
+ "▁Lỗ": 58076,
322
+ "▁Lỗi": 58300,
323
+ "▁Lộ": 58561,
324
+ "▁Lộc": 58245,
325
+ "▁Lớn": 58658,
326
+ "▁Lớp": 57844,
327
+ "▁Lời": 58649,
328
+ "▁Lợi": 57877,
329
+ "▁Lựa": 58266,
330
+ "▁Lực": 57840,
331
+ "▁Mơ": 58409,
332
+ "▁Mưa": 58509,
333
+ "▁Mười": 58113,
334
+ "▁Mật": 58111,
335
+ "▁Mặc": 57770,
336
+ "▁Mặt": 57780,
337
+ "▁Mẹ": 58067,
338
+ "▁Mễ": 57694,
339
+ "▁Mộng": 58652,
340
+ "▁Một": 58203,
341
+ "▁Mới": 58147,
342
+ "▁Mức": 58480,
343
+ "▁Ngh": 57626,
344
+ "▁Nghệ": 57540,
345
+ "▁Nghị": 58454,
346
+ "▁Nguyện": 58385,
347
+ "▁Nguyệt": 57801,
348
+ "▁Nguồn": 57578,
349
+ "▁Ngư": 58019,
350
+ "▁Ngưu": 57618,
351
+ "▁Nhiều": 58318,
352
+ "▁Nhiệt": 58427,
353
+ "▁Nhu": 57753,
354
+ "▁Nhuận": 58163,
355
+ "▁Như": 58667,
356
+ "▁Nhược": 58210,
357
+ "▁Nhận": 58539,
358
+ "▁Nhập": 58171,
359
+ "▁Nhật": 58669,
360
+ "▁Nhị": 57538,
361
+ "▁Nhỏ": 58156,
362
+ "▁Nhớ": 58354,
363
+ "▁Những": 58207,
364
+ "▁Niềm": 58185,
365
+ "▁Nơi": 57873,
366
+ "▁Nương": 58645,
367
+ "▁Nước": 58531,
368
+ "▁Nếu": 58194,
369
+ "▁Nổi": 57909,
370
+ "▁Nỗi": 57625,
371
+ "▁Nội": 58589,
372
+ "▁Nợ": 58382,
373
+ "▁Nửa": 58535,
374
+ "▁Nữ": 57961,
375
+ "▁Phương": 57582,
376
+ "▁Phước": 57604,
377
+ "▁Phượng": 57748,
378
+ "▁Phật": 58436,
379
+ "▁Phủ": 57984,
380
+ "▁Quyết": 58543,
381
+ "▁Quyền": 58606,
382
+ "▁Quả": 58102,
383
+ "▁Quản": 57990,
384
+ "▁Quận": 58112,
385
+ "▁Quốc": 58301,
386
+ "▁Quỳnh": 58115,
387
+ "▁Rồi": 58384,
388
+ "▁Rồng": 57807,
389
+ "▁Rừng": 57778,
390
+ "▁Sơ": 57544,
391
+ "▁Sư": 58234,
392
+ "▁Sản": 58390,
393
+ "▁Số": 58106,
394
+ "▁Sở": 58058,
395
+ "▁Sức": 57592,
396
+ "▁Sử": 58620,
397
+ "▁Sự": 58253,
398
+ "▁Thiết": 58259,
399
+ "▁Thiếu": 57685,
400
+ "▁Thiện": 57698,
401
+ "▁Thuận": 58002,
402
+ "▁Thư": 57739,
403
+ "▁Thương": 58014,
404
+ "▁Thường": 57996,
405
+ "▁Thượng": 58247,
406
+ "▁Thả": 58345,
407
+ "▁Thảm": 57910,
408
+ "▁Thảo": 58607,
409
+ "▁Thẩm": 58556,
410
+ "▁Thật": 57899,
411
+ "▁Thế": 57680,
412
+ "▁Thề": 57637,
413
+ "▁Thể": 58536,
414
+ "▁Thị": 58592,
415
+ "▁Thịnh": 58012,
416
+ "▁Thống": 58096,
417
+ "▁Thổ": 58621,
418
+ "▁Thủ": 58095,
419
+ "▁Thủy": 57634,
420
+ "▁Thứ": 58090,
421
+ "▁Thừa": 58254,
422
+ "▁Tiến": 58545,
423
+ "▁Tiếng": 58063,
424
+ "▁Tiết": 58157,
425
+ "▁Tiền": 58177,
426
+ "▁Tiểu": 58032,
427
+ "▁Triệu": 58525,
428
+ "▁Truyện": 58433,
429
+ "▁Trước": 57695,
430
+ "▁Trường": 57648,
431
+ "▁Trưởng": 57683,
432
+ "▁Trận": 57802,
433
+ "▁Trẻ": 58232,
434
+ "▁Trộm": 58057,
435
+ "▁Trời": 58346,
436
+ "▁Trở": 58349,
437
+ "▁Trực": 57655,
438
+ "▁Tuyến": 58565,
439
+ "▁Tuyết": 58335,
440
+ "▁Tuyền": 58179,
441
+ "▁Tuyển": 58178,
442
+ "▁Tuệ": 58381,
443
+ "▁Tuổi": 58359,
444
+ "▁TƯ": 57762,
445
+ "▁Tư": 58294,
446
+ "▁Tươi": 57903,
447
+ "▁Tương": 58623,
448
+ "▁Tường": 58423,
449
+ "▁Tưởng": 58448,
450
+ "▁Tải": 57729,
451
+ "▁Tẩy": 58022,
452
+ "▁Tập": 58240,
453
+ "▁Tỉ": 57635,
454
+ "▁Tỉnh": 57864,
455
+ "▁Tịch": 58160,
456
+ "▁Tịnh": 57905,
457
+ "▁Tố": 57545,
458
+ "▁Tốc": 57796,
459
+ "▁Tống": 58180,
460
+ "▁Tứ": 57898,
461
+ "▁Tức": 58663,
462
+ "▁Từ": 57767,
463
+ "▁Tử": 57623,
464
+ "▁Tự": 58552,
465
+ "▁Tỷ": 58195,
466
+ "▁VTV": 57919,
467
+ "▁Viễn": 57639,
468
+ "▁Việc": 57732,
469
+ "▁Viện": 57579,
470
+ "▁Vương": 57841,
471
+ "▁Vượng": 58164,
472
+ "▁Vật": 57624,
473
+ "▁Vậy": 57939,
474
+ "▁Về": 58314,
475
+ "▁Vệ": 57575,
476
+ "▁Vị": 57948,
477
+ "▁Vịt": 58130,
478
+ "▁Với": 57531,
479
+ "▁Xương": 58305,
480
+ "▁Xếp": 58213,
481
+ "▁Yến": 58248,
482
+ "▁Yếu": 57710,
483
+ "▁biến": 58440,
484
+ "▁biết": 58361,
485
+ "▁biển": 58004,
486
+ "▁biểu": 58585,
487
+ "▁biệt": 58045,
488
+ "▁buổi": 58170,
489
+ "▁buộc": 58413,
490
+ "▁bàn": 58587,
491
+ "▁bưu": 57839,
492
+ "▁bước": 58446,
493
+ "▁bướm": 57533,
494
+ "▁bản": 58061,
495
+ "▁bảng": 58616,
496
+ "▁bảo": 57566,
497
+ "▁bậc": 58274,
498
+ "▁bật": 57991,
499
+ "▁bằng": 57787,
500
+ "▁bến": 57760,
501
+ "▁bề": 58286,
502
+ "▁bền": 57963,
503
+ "▁bệ": 58376,
504
+ "▁bệnh": 58033,
505
+ "▁bị": 57962,
506
+ "▁bịp": 58483,
507
+ "▁bỏ": 58378,
508
+ "▁bố": 58141,
509
+ "▁bối": 58656,
510
+ "▁bốn": 57658,
511
+ "▁bổ": 57699,
512
+ "▁bộ": 58108,
513
+ "▁bộc": 57855,
514
+ "▁bởi": 57553,
515
+ "▁bức": 57550,
516
+ "▁chiếc": 57564,
517
+ "▁chiến": 58222,
518
+ "▁chiếu": 57989,
519
+ "▁chiều": 57928,
520
+ "▁chuyến": 58650,
521
+ "▁chuyển": 57848,
522
+ "▁chuyện": 57915,
523
+ "▁chuẩn": 58079,
524
+ "▁chuỗi": 57733,
525
+ "▁chuộng": 58131,
526
+ "▁chưa": 57722,
527
+ "▁chương": 58441,
528
+ "▁chậm": 58198,
529
+ "▁chẳng": 58386,
530
+ "▁chặt": 58631,
531
+ "▁chẽ": 58475,
532
+ "▁chế": 58604,
533
+ "▁chết": 57896,
534
+ "▁chỉ": 58538,
535
+ "▁chỉnh": 57970,
536
+ "▁chị": 57831,
537
+ "▁chịu": 57597,
538
+ "▁chống": 58029,
539
+ "▁chốt": 57746,
540
+ "▁chồng": 58149,
541
+ "▁chỗ": 58534,
542
+ "▁chở": 58593,
543
+ "▁chủ": 58570,
544
+ "▁chủng": 57653,
545
+ "▁chứa": 58422,
546
+ "▁chức": 58418,
547
+ "▁chứng": 58428,
548
+ "▁chữ": 58586,
549
+ "▁chữa": 58074,
550
+ "▁cuối": 57641,
551
+ "▁cuốn": 58161,
552
+ "▁cuộc": 58337,
553
+ "▁cơ": 58463,
554
+ "▁cơn": 58334,
555
+ "▁cư": 58342,
556
+ "▁cướp": 58400,
557
+ "▁cường": 58302,
558
+ "▁cược": 58140,
559
+ "▁cả": 58511,
560
+ "▁cải": 58251,
561
+ "▁cảm": 57953,
562
+ "▁cản": 58497,
563
+ "▁cảng": 58285,
564
+ "▁cảnh": 58528,
565
+ "▁cận": 58496,
566
+ "▁cập": 57617,
567
+ "▁cậu": 58291,
568
+ "▁cặp": 57727,
569
+ "▁cỏ": 57765,
570
+ "▁cố": 58117,
571
+ "▁cống": 57612,
572
+ "▁cổ": 57960,
573
+ "▁cổng": 57594,
574
+ "▁cộng": 57836,
575
+ "▁cột": 58169,
576
+ "▁cờ": 57827,
577
+ "▁của": 57664,
578
+ "▁củng": 58275,
579
+ "▁cứ": 58255,
580
+ "▁cứu": 57621,
581
+ "▁cừu": 57643,
582
+ "▁cử": 57854,
583
+ "▁cửa": 58268,
584
+ "▁cực": 57537,
585
+ "▁danh": 58540,
586
+ "▁diều": 58512,
587
+ "▁diễn": 58572,
588
+ "▁diện": 58269,
589
+ "▁diệt": 57546,
590
+ "▁diệu": 58407,
591
+ "▁duyệt": 58429,
592
+ "▁dương": 58088,
593
+ "▁dưới": 58223,
594
+ "▁dường": 57583,
595
+ "▁dưỡng": 58575,
596
+ "▁dải": 57968,
597
+ "▁dậy": 57795,
598
+ "▁dễ": 58188,
599
+ "▁dị": 58068,
600
+ "▁dịch": 58165,
601
+ "▁dỡ": 58055,
602
+ "▁dứt": 57838,
603
+ "▁dừng": 57922,
604
+ "▁dữ": 58553,
605
+ "▁dự": 58551,
606
+ "▁dựa": 58227,
607
+ "▁dựng": 57992,
608
+ "▁ghế": 58073,
609
+ "▁giả": 58132,
610
+ "▁giải": 57580,
611
+ "▁giảm": 58201,
612
+ "▁giản": 57976,
613
+ "▁giếng": 57799,
614
+ "▁giết": 58260,
615
+ "▁giống": 58031,
616
+ "▁giới": 58238,
617
+ "▁giờ": 58456,
618
+ "▁giời": 58438,
619
+ "▁giữ": 57950,
620
+ "▁giữa": 58629,
621
+ "▁gậy": 57690,
622
+ "▁gặp": 58411,
623
+ "▁gốc": 58368,
624
+ "▁gồm": 58358,
625
+ "▁gỗ": 57713,
626
+ "▁gộp": 57958,
627
+ "▁gỡ": 57638,
628
+ "▁gợi": 58635,
629
+ "▁gửi": 58455,
630
+ "▁hiến": 58243,
631
+ "▁hiền": 58458,
632
+ "▁hiểm": 58261,
633
+ "▁hiển": 58119,
634
+ "▁hiểu": 58035,
635
+ "▁hiện": 57931,
636
+ "▁hiệp": 57769,
637
+ "▁hiệu": 57735,
638
+ "▁hoảng": 58026,
639
+ "▁hoặc": 57777,
640
+ "▁huyết": 58366,
641
+ "▁huyện": 57772,
642
+ "▁huống": 57907,
643
+ "▁huỳnh": 58283,
644
+ "▁hư": 58449,
645
+ "▁hương": 57557,
646
+ "▁hước": 58579,
647
+ "▁hướng": 58367,
648
+ "▁hưởng": 58638,
649
+ "▁hận": 58191,
650
+ "▁hậu": 58276,
651
+ "▁hẳn": 57870,
652
+ "▁hẹn": 58278,
653
+ "▁hết": 58330,
654
+ "▁hệ": 58306,
655
+ "▁hệt": 57971,
656
+ "▁hỏa": 58320,
657
+ "▁hỏi": 58560,
658
+ "▁hỏng": 58470,
659
+ "▁hố": 58388,
660
+ "▁hồ": 57688,
661
+ "▁hồi": 58312,
662
+ "▁hồn": 57527,
663
+ "▁hồng": 58208,
664
+ "▁hỗ": 58627,
665
+ "▁hộ": 57811,
666
+ "▁hội": 57805,
667
+ "▁hộp": 57646,
668
+ "▁hợp": 58310,
669
+ "▁hủy": 58233,
670
+ "▁hứng": 57775,
671
+ "▁hữu": 58116,
672
+ "▁khiến": 58226,
673
+ "▁khiếp": 57668,
674
+ "▁khiển": 58664,
675
+ "▁khoản": 58599,
676
+ "▁khoảng": 58082,
677
+ "▁khuyết": 58383,
678
+ "▁khả": 57793,
679
+ "▁khảo": 57955,
680
+ "▁khẩu": 57628,
681
+ "▁khẳng": 58230,
682
+ "▁khỏi": 57883,
683
+ "▁khối": 57611,
684
+ "▁khốn": 58671,
685
+ "▁khổ": 57882,
686
+ "▁khổng": 57823,
687
+ "▁khủng": 57995,
688
+ "▁khứ": 58555,
689
+ "▁kiến": 57535,
690
+ "▁kiềm": 58392,
691
+ "▁kiểm": 58084,
692
+ "▁kiểu": 58613,
693
+ "▁kiện": 57720,
694
+ "▁kẻ": 58221,
695
+ "▁kẻo": 57763,
696
+ "▁kế": 58271,
697
+ "▁kết": 58393,
698
+ "▁kể": 57862,
699
+ "▁kỉ": 57966,
700
+ "▁kịch": 58220,
701
+ "▁kỳ": 58414,
702
+ "▁kỷ": 57631,
703
+ "▁liền": 58640,
704
+ "▁liệt": 57740,
705
+ "▁liệu": 58162,
706
+ "▁luyến": 57671,
707
+ "▁luyện": 58143,
708
+ "▁luận": 57662,
709
+ "▁luật": 58387,
710
+ "▁luồng": 58389,
711
+ "▁lơ": 58435,
712
+ "▁lưu": 58498,
713
+ "▁lương": 58469,
714
+ "▁lưới": 57972,
715
+ "▁lưỡi": 58487,
716
+ "▁lược": 58011,
717
+ "▁lượng": 58426,
718
+ "▁lượt": 58174,
719
+ "▁lập": 57993,
720
+ "▁lặn": 58590,
721
+ "▁lặng": 58126,
722
+ "▁lặp": 57613,
723
+ "▁lẻ": 58574,
724
+ "▁lễ": 57789,
725
+ "▁lệ": 58296,
726
+ "▁lệch": 57771,
727
+ "▁lệnh": 58360,
728
+ "▁lịch": 57861,
729
+ "▁lốc": 57879,
730
+ "▁lối": 58657,
731
+ "▁lốp": 57577,
732
+ "▁lồ": 58050,
733
+ "▁lồng": 58003,
734
+ "▁lỗ": 58128,
735
+ "▁lỗi": 58241,
736
+ "▁lộ": 58212,
737
+ "▁lội": 57815,
738
+ "▁lớn": 58557,
739
+ "▁lớp": 58377,
740
+ "▁lời": 58445,
741
+ "▁lỡ": 58405,
742
+ "▁lợi": 57744,
743
+ "▁lừa": 58554,
744
+ "▁lửa": 57803,
745
+ "▁lựa": 57833,
746
+ "▁lực": 57871,
747
+ "▁miền": 57656,
748
+ "▁miễn": 58573,
749
+ "▁miện": 57876,
750
+ "▁miệng": 57835,
751
+ "▁muốn": 58641,
752
+ "▁muộn": 57783,
753
+ "▁mơ": 57785,
754
+ "▁mưa": 57856,
755
+ "▁mưu": 58265,
756
+ "▁mười": 58350,
757
+ "▁mượn": 57663,
758
+ "▁mượt": 57921,
759
+ "▁mảnh": 57980,
760
+ "▁mập": 58488,
761
+ "▁mật": 58086,
762
+ "▁mặc": 57808,
763
+ "▁mặt": 58104,
764
+ "▁mẹ": 58133,
765
+ "▁mẽ": 58347,
766
+ "▁mệnh": 58051,
767
+ "▁mỏng": 57563,
768
+ "▁mốc": 58309,
769
+ "▁mối": 58224,
770
+ "▁mỗi": 57610,
771
+ "▁mới": 58519,
772
+ "▁mở": 58099,
773
+ "▁mức": 58196,
774
+ "▁mừng": 57797,
775
+ "▁nghiệp": 58500,
776
+ "▁nghề": 57752,
777
+ "▁nghệ": 57894,
778
+ "▁nghị": 58015,
779
+ "▁nghịch": 58371,
780
+ "▁ngoặc": 58506,
781
+ "▁nguyền": 57672,
782
+ "▁nguyện": 58186,
783
+ "▁nguồn": 57904,
784
+ "▁nguội": 58489,
785
+ "▁người": 57534,
786
+ "▁ngược": 58135,
787
+ "▁ngập": 57994,
788
+ "▁ngốc": 57756,
789
+ "▁ngồi": 57552,
790
+ "▁ngờ": 57869,
791
+ "▁ngợi": 58121,
792
+ "▁ngừng": 57605,
793
+ "▁ngữ": 57975,
794
+ "▁ngựa": 57562,
795
+ "▁nh": 57788,
796
+ "▁nhiều": 57929,
797
+ "▁nhiệt": 58298,
798
+ "▁nhuận": 58634,
799
+ "▁như": 58571,
800
+ "▁nhưng": 58048,
801
+ "▁nhường": 57779,
802
+ "▁nhượng": 57881,
803
+ "▁nhảy": 58120,
804
+ "▁nhận": 57569,
805
+ "▁nhập": 57585,
806
+ "▁nhật": 57758,
807
+ "▁nhẹ": 57734,
808
+ "▁nhện": 58228,
809
+ "▁nhỏ": 58124,
810
+ "▁nhớ": 58396,
811
+ "▁những": 57554,
812
+ "▁niềm": 58192,
813
+ "▁nơi": 57947,
814
+ "▁nước": 58626,
815
+ "▁nản": 57591,
816
+ "▁nặng": 57884,
817
+ "▁nếu": 58288,
818
+ "▁nền": 58419,
819
+ "▁nối": 57794,
820
+ "▁nổi": 58662,
821
+ "▁nỗ": 57825,
822
+ "▁nội": 58357,
823
+ "▁nợ": 58651,
824
+ "▁nửa": 57730,
825
+ "▁nữ": 58583,
826
+ "▁nữa": 58052,
827
+ "▁phiếu": 57946,
828
+ "▁phương": 58060,
829
+ "▁phường": 58039,
830
+ "▁phượng": 58444,
831
+ "▁phải": 58472,
832
+ "▁phản": 58219,
833
+ "▁phẩm": 57941,
834
+ "▁phẩy": 58001,
835
+ "▁phận": 57902,
836
+ "▁phỏng": 57561,
837
+ "▁phố": 57715,
838
+ "▁phối": 58280,
839
+ "▁phổ": 58049,
840
+ "▁phủ": 58459,
841
+ "▁phức": 58516,
842
+ "▁quyết": 58006,
843
+ "▁quyền": 58297,
844
+ "▁quyển": 58600,
845
+ "▁quả": 58518,
846
+ "▁quản": 57551,
847
+ "▁quảng": 57964,
848
+ "▁quận": 57868,
849
+ "▁quốc": 58027,
850
+ "▁quỷ": 57930,
851
+ "▁rơi": 58453,
852
+ "▁rước": 57927,
853
+ "▁rưỡi": 57853,
854
+ "▁rải": 58344,
855
+ "▁rằng": 57565,
856
+ "▁rệt": 57754,
857
+ "▁rối": 57954,
858
+ "▁rồi": 58514,
859
+ "▁rồng": 57633,
860
+ "▁rổ": 58338,
861
+ "▁rỗng": 58577,
862
+ "▁rộng": 58584,
863
+ "▁rời": 57742,
864
+ "▁rủi": 58197,
865
+ "▁suốt": 58391,
866
+ "▁sơ": 58064,
867
+ "▁sơn": 58295,
868
+ "▁sư": 57714,
869
+ "▁sản": 57657,
870
+ "▁sẻ": 58122,
871
+ "▁sẽ": 58107,
872
+ "▁sỏi": 58406,
873
+ "▁số": 58609,
874
+ "▁sốc": 58374,
875
+ "▁sống": 57642,
876
+ "▁sốt": 58397,
877
+ "▁sớm": 57757,
878
+ "▁sở": 58183,
879
+ "▁sợ": 58007,
880
+ "▁sợi": 57536,
881
+ "▁sứ": 58568,
882
+ "▁sức": 57820,
883
+ "▁sử": 58158,
884
+ "▁sửa": 58290,
885
+ "▁sự": 57539,
886
+ "▁thiết": 58605,
887
+ "▁thiếu": 58450,
888
+ "▁thiểu": 57867,
889
+ "▁thiện": 58151,
890
+ "▁thiệt": 57998,
891
+ "▁thiệu": 58244,
892
+ "▁thuyết": 57620,
893
+ "▁thuyền": 57817,
894
+ "▁thuận": 58070,
895
+ "▁thuật": 58493,
896
+ "▁thuế": 57842,
897
+ "▁thuốc": 58491,
898
+ "▁thuộc": 58477,
899
+ "▁thư": 57997,
900
+ "▁thương": 58462,
901
+ "▁thước": 57846,
902
+ "▁thường": 57945,
903
+ "▁thưởng": 58092,
904
+ "▁thượng": 57632,
905
+ "▁thả": 58432,
906
+ "▁thải": 57717,
907
+ "▁thảm": 58030,
908
+ "▁thảo": 57747,
909
+ "▁thập": 58343,
910
+ "▁thật": 58080,
911
+ "▁thắng": 58013,
912
+ "▁thẳng": 58047,
913
+ "▁thẻ": 58474,
914
+ "▁thế": 58355,
915
+ "▁thể": 57887,
916
+ "▁thị": 58416,
917
+ "▁thịnh": 57872,
918
+ "▁thống": 57593,
919
+ "▁thổ": 58661,
920
+ "▁thợ": 57933,
921
+ "▁thủ": 57800,
922
+ "▁thủng": 57865,
923
+ "▁thủy": 58018,
924
+ "▁thứ": 57636,
925
+ "▁thức": 57926,
926
+ "▁thừa": 58094,
927
+ "▁thử": 57774,
928
+ "▁tiến": 57942,
929
+ "▁tiếng": 57719,
930
+ "▁tiếp": 58139,
931
+ "▁tiết": 57650,
932
+ "▁tiềm": 58369,
933
+ "▁tiền": 58494,
934
+ "▁tiểu": 58024,
935
+ "▁tiễn": 58666,
936
+ "▁tiệc": 57549,
937
+ "▁tiện": 57851,
938
+ "▁toả": 57590,
939
+ "▁triều": 57764,
940
+ "▁triển": 58100,
941
+ "▁triệu": 58153,
942
+ "▁truyền": 58473,
943
+ "▁truyện": 58442,
944
+ "▁trưa": 58457,
945
+ "▁trưng": 57586,
946
+ "▁trước": 58576,
947
+ "▁trường": 58282,
948
+ "▁trưởng": 58566,
949
+ "▁trả": 58622,
950
+ "▁trải": 58016,
951
+ "▁trận": 58313,
952
+ "▁trẻ": 58670,
953
+ "▁trị": 57834,
954
+ "▁trồng": 58101,
955
+ "▁trội": 58612,
956
+ "▁trời": 57849,
957
+ "▁trở": 58008,
958
+ "▁trợ": 57859,
959
+ "▁trừ": 58273,
960
+ "▁trữ": 58353,
961
+ "▁trực": 57627,
962
+ "▁tuyến": 58654,
963
+ "▁tuyển": 58239,
964
+ "▁tuyệt": 57681,
965
+ "▁tuổi": 57726,
966
+ "▁tăng": 58420,
967
+ "▁tư": 57647,
968
+ "▁tương": 57892,
969
+ "▁tước": 58394,
970
+ "▁tướng": 58471,
971
+ "▁tường": 58421,
972
+ "▁tưởng": 58293,
973
+ "▁tượng": 58103,
974
+ "▁tả": 57850,
975
+ "▁tải": 58615,
976
+ "▁tảng": 58443,
977
+ "▁tấn": 58167,
978
+ "▁tẩy": 58321,
979
+ "▁tập": 58175,
980
+ "▁tặng": 58424,
981
+ "▁tế": 58065,
982
+ "▁tệ": 57737,
983
+ "▁tỉ": 58046,
984
+ "▁tỉnh": 58085,
985
+ "▁tị": 58202,
986
+ "▁tịch": 57901,
987
+ "▁tố": 58148,
988
+ "▁tốc": 57965,
989
+ "▁tối": 58364,
990
+ "▁tốn": 58339,
991
+ "▁tốt": 57889,
992
+ "▁tồn": 57918,
993
+ "▁tổ": 58675,
994
+ "▁tổn": 58225,
995
+ "▁tổng": 58025,
996
+ "▁tộc": 58643,
997
+ "▁tội": 58323,
998
+ "▁tờ": 58267,
999
+ "▁tứ": 57602,
1000
+ "▁tức": 58611,
1001
+ "▁từ": 58582,
1002
+ "▁từng": 58375,
1003
+ "▁tử": 58403,
1004
+ "▁tự": 57745,
1005
+ "▁tựa": 58482,
1006
+ "▁tỷ": 57914,
1007
+ "▁viết": 57924,
1008
+ "▁viễn": 58408,
1009
+ "▁việc": 58005,
1010
+ "▁viện": 58040,
1011
+ "▁vượng": 57584,
1012
+ "▁vượt": 58486,
1013
+ "▁vận": 58028,
1014
+ "▁vật": 58125,
1015
+ "▁vậy": 58168,
1016
+ "▁vẹn": 58398,
1017
+ "▁vẻ": 57718,
1018
+ "▁về": 57983,
1019
+ "▁vệ": 58504,
1020
+ "▁vị": 58105,
1021
+ "▁vỏ": 58460,
1022
+ "▁vốn": 57705,
1023
+ "▁vỗ": 58668,
1024
+ "▁với": 57999,
1025
+ "▁vời": 58372,
1026
+ "▁vở": 57677,
1027
+ "▁vợ": 57596,
1028
+ "▁vợt": 57725,
1029
+ "▁vừa": 57572,
1030
+ "▁vững": 58328,
1031
+ "▁vực": 57875,
1032
+ "▁vựng": 58660,
1033
+ "▁xuống": 57934,
1034
+ "▁xưa": 58513,
1035
+ "▁xưng": 58072,
1036
+ "▁xưởng": 58533,
1037
+ "▁xảy": 57560,
1038
+ "▁xếp": 58624,
1039
+ "▁xỉ": 57687,
1040
+ "▁xứ": 58043,
1041
+ "▁xử": 57784,
1042
+ "▁yếu": 58619,
1043
+ "▁Âm": 58154,
1044
+ "▁Ân": 58452,
1045
+ "▁Âu": 57923,
1046
+ "▁Ô": 58250,
1047
+ "▁Ông": 57936,
1048
+ "▁Ý": 58329,
1049
+ "▁Điền": 58521,
1050
+ "▁Điều": 57660,
1051
+ "▁Điểm": 57691,
1052
+ "▁Điển": 57555,
1053
+ "▁Đơn": 58597,
1054
+ "▁Đường": 57912,
1055
+ "▁Được": 58176,
1056
+ "▁Đảng": 57938,
1057
+ "▁Đảo": 58110,
1058
+ "▁Đập": 58066,
1059
+ "▁Đậu": 58173,
1060
+ "▁Đằng": 57959,
1061
+ "▁Đặc": 57916,
1062
+ "▁Đặng": 58507,
1063
+ "▁Đế": 57978,
1064
+ "▁Đến": 58348,
1065
+ "▁Đề": 58256,
1066
+ "▁Để": 58578,
1067
+ "▁Đệ": 57943,
1068
+ "▁Địa": 57603,
1069
+ "▁Đống": 58430,
1070
+ "▁Đồ": 57576,
1071
+ "▁Đồng": 57697,
1072
+ "▁Đổi": 58522,
1073
+ "▁Đỗ": 57692,
1074
+ "▁Độ": 58304,
1075
+ "▁Đội": 58172,
1076
+ "▁Động": 58242,
1077
+ "▁Đời": 57667,
1078
+ "▁Đứa": 58281,
1079
+ "▁Đừng": 57895,
1080
+ "▁điền": 58010,
1081
+ "▁điều": 57541,
1082
+ "▁điểm": 58594,
1083
+ "▁điển": 58510,
1084
+ "▁điện": 57891,
1085
+ "▁điệp": 58062,
1086
+ "▁điệu": 57599,
1087
+ "▁đu": 58550,
1088
+ "▁đơn": 57826,
1089
+ "▁đưa": 57824,
1090
+ "▁đương": 58181,
1091
+ "▁đường": 57574,
1092
+ "▁được": 58054,
1093
+ "▁đảm": 57858,
1094
+ "▁đảng": 57607,
1095
+ "▁đảo": 58580,
1096
+ "▁đẩy": 58331,
1097
+ "▁đập": 57651,
1098
+ "▁đẳng": 58189,
1099
+ "▁đặc": 58327,
1100
+ "▁đặn": 57556,
1101
+ "▁đặt": 57890,
1102
+ "▁đẹp": 57652,
1103
+ "▁đế": 57951,
1104
+ "▁đếm": 58089,
1105
+ "▁đến": 58200,
1106
+ "▁đề": 58637,
1107
+ "▁đều": 58547,
1108
+ "▁để": 58236,
1109
+ "▁đệ": 57568,
1110
+ "▁đệm": 57659,
1111
+ "▁đỉnh": 58508,
1112
+ "▁địa": 57973,
1113
+ "▁địch": 57608,
1114
+ "▁định": 58526,
1115
+ "▁đỏ": 57615,
1116
+ "▁đốc": 57944,
1117
+ "▁đối": 57675,
1118
+ "▁đồ": 58159,
1119
+ "▁đồn": 58379,
1120
+ "▁đồng": 57791,
1121
+ "▁đổ": 57571,
1122
+ "▁đổi": 58639,
1123
+ "▁độ": 58410,
1124
+ "▁độc": 58523,
1125
+ "▁đội": 58365,
1126
+ "▁động": 58118,
1127
+ "▁đột": 58628,
1128
+ "▁đới": 57847,
1129
+ "▁đời": 58653,
1130
+ "▁đợi": 58363,
1131
+ "▁đợt": 58642,
1132
+ "▁đủ": 58211,
1133
+ "▁đứa": 58262,
1134
+ "▁đức": 58672,
1135
+ "▁đứng": 58246,
1136
+ "▁đừng": 58630,
1137
+ "▁đực": 58229,
1138
+ "▁Ơi": 57743,
1139
+ "▁Ơn": 58479,
1140
+ "▁ơn": 58059,
1141
+ "▁Ước": 58434,
1142
+ "▁ưa": 57570,
1143
+ "▁ưng": 57893,
1144
+ "▁ưu": 57822,
1145
+ "▁ước": 58077,
1146
+ "▁ướt": 57707,
1147
+ "▁Ả": 58152,
1148
+ "▁ải": 58083,
1149
+ "▁ảnh": 58187,
1150
+ "▁ẩm": 57665,
1151
+ "▁ẩn": 58559,
1152
+ "▁ỏi": 57874,
1153
+ "▁ốc": 57982,
1154
+ "▁ống": 57897,
1155
+ "▁ồn": 58530,
1156
+ "▁ổn": 58541,
1157
+ "▁ở": 58237,
1158
+ "▁ủng": 58431,
1159
+ "▁ủy": 58603,
1160
+ "▁ứng": 58466
1161
  }
tokenizer.json CHANGED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json CHANGED
The diff for this file is too large to render. See raw diff