Ozan Oktay
add tokenizer
0fdcbd3
|
[PAD] |
|
[UNK] |
|
[CLS] |
|
[SEP] |
|
[MASK] |
|
! |
|
" |
|
# |
|
$ |
|
% |
|
& |
|
' |
|
( |
|
) |
|
* |
|
+ |
|
, |
|
- |
|
. |
|
/ |
|
0 |
|
1 |
|
2 |
|
3 |
|
4 |
|
5 |
|
6 |
|
7 |
|
8 |
|
9 |
|
: |
|
; |
|
< |
|
= |
|
> |
|
? |
|
@ |
|
[ |
|
\ |
|
] |
|
^ |
|
_ |
|
` |
|
a |
|
b |
|
c |
|
d |
|
e |
|
f |
|
g |
|
h |
|
i |
|
j |
|
k |
|
l |
|
m |
|
n |
|
o |
|
p |
|
q |
|
r |
|
s |
|
t |
|
u |
|
v |
|
w |
|
x |
|
y |
|
z |
|
{ |
|
| |
|
} |
|
~ |
|
ยก |
|
ยข |
|
ยฃ |
|
ยค |
|
ยฅ |
|
ยฆ |
|
ยง |
|
ยจ |
|
ยฉ |
|
ยช |
|
ยซ |
|
ยฌ |
|
ยฎ |
|
ยฏ |
|
ยฐ |
|
ยฑ |
|
ยฒ |
|
ยณ |
|
ยด |
|
ยต |
|
ยถ |
|
ยท |
|
ยธ |
|
ยน |
|
ยบ |
|
ยป |
|
ยผ |
|
ยฝ |
|
ยพ |
|
ยฟ |
|
ร |
|
ร |
|
รฆ |
|
รฐ |
|
รท |
|
รธ |
|
รพ |
|
ฤ |
|
ฤง |
|
ฤฑ |
|
ฤธ |
|
ล |
|
ล |
|
ล |
|
ฦ
|
|
ฦ |
|
ฦ |
|
ฦ |
|
ฦ |
|
ฦ |
|
ฦญ |
|
ฦด |
|
ฦถ |
|
ฦฟ |
|
ว |
|
ว |
|
ว |
|
ว |
|
ศฃ |
|
ศฅ |
|
ศต |
|
ศผ |
|
ษ |
|
ษ |
|
ษ |
|
ษ |
|
ษ |
|
ษ |
|
ษ |
|
ษ |
|
ษ |
|
ษ |
|
ษ |
|
ษ |
|
ษ |
|
ษ |
|
ษก |
|
ษฃ |
|
ษค |
|
ษฅ |
|
ษฆ |
|
ษจ |
|
ษฉ |
|
ษช |
|
ษฌ |
|
ษญ |
|
ษฎ |
|
ษฏ |
|
ษฑ |
|
ษฒ |
|
ษณ |
|
ษต |
|
ษถ |
|
ษท |
|
ษธ |
|
ษน |
|
ษป |
|
ษพ |
|
ษฟ |
|
ส |
|
ส |
|
ส |
|
ส |
|
ส
|
|
ส |
|
ส |
|
ส |
|
ส |
|
ส |
|
ส |
|
ส |
|
ส |
|
ส |
|
ส |
|
ส |
|
ส |
|
ส |
|
ส |
|
ส |
|
สฆ |
|
สง |
|
สฐ |
|
สฑ |
|
สฒ |
|
สท |
|
สน |
|
สบ |
|
สผ |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
ห |
|
หค |
|
หช |
|
หญ |
|
หฎ |
|
หด |
|
อณ |
|
อป |
|
ฮ |
|
ฮ |
|
ฮ |
|
ฮ |
|
ฮ |
|
ฮฑ |
|
ฮฒ |
|
ฮณ |
|
ฮด |
|
ฮต |
|
ฮถ |
|
ฮท |
|
ฮธ |
|
ฮน |
|
ฮบ |
|
ฮป |
|
ฮผ |
|
ฮฝ |
|
ฮพ |
|
ฮฟ |
|
ฯ |
|
ฯ |
|
ฯ |
|
ฯ |
|
ฯ |
|
ฯ
|
|
ฯ |
|
ฯ |
|
ฯ |
|
ฯ |
|
ฯ |
|
ฯ |
|
ฯ |
|
ฯ |
|
ฯ |
|
ฯ |
|
ฯก |
|
ฯซ |
|
ฯญ |
|
ฯฐ |
|
ฯฑ |
|
ฯฒ |
|
ฯต |
|
ฯผ |
|
ะฐ |
|
ะฑ |
|
ะฒ |
|
ะณ |
|
ะด |
|
ะต |
|
ะถ |
|
ะท |
|
ะธ |
|
ะบ |
|
ะป |
|
ะผ |
|
ะฝ |
|
ะพ |
|
ะฟ |
|
ั |
|
ั |
|
ั |
|
ั |
|
ั |
|
ั
|
|
ั |
|
ั |
|
ั |
|
ั |
|
ั |
|
ั |
|
ั |
|
ั |
|
ั |
|
ั |
|
ั |
|
ั |
|
ั |
|
ัฑ |
|
ัณ |
|
ัต |
|
า |
|
า |
|
า |
|
าก |
|
าซ |
|
าฏ |
|
าฑ |
|
าณ |
|
าป |
|
ำ |
|
ำ |
|
ำ |
|
ำฉ |
|
ำฝ |
|
ิ |
|
ิ |
|
ึ |
|
ึ
|
|
ึพ |
|
ื |
|
ื |
|
ื |
|
ื |
|
ืฅ |
|
ืฉ |
|
ืณ |
|
ุ |
|
ุง |
|
ุช |
|
ุฏ |
|
ุฑ |
|
ุน |
|
ู |
|
ู |
|
ู |
|
ู |
|
ู |
|
ูก |
|
ูข |
|
ูฃ |
|
ูค |
|
ูฅ |
|
ูง |
|
ูจ |
|
ูฉ |
|
ูช |
|
ูฌ |
|
ูญ |
|
฿ |
|
฿ |
|
เกฉ |
|
เฃ |
|
เค |
|
เค |
|
เค |
|
เคฃ |
|
เคซ |
|
เคฐ |
|
เคฒ |
|
เคน |
|
เคพ |
|
เคฟ |
|
เฅฆ |
|
เธ |
|
เธ |
|
เธ |
|
เธ |
|
เธ |
|
เธ |
|
เธ |
|
เธ |
|
เธ |
|
เธ |
|
เธ |
|
เธ |
|
เธ |
|
เธข |
|
เธฃ |
|
เธฅ |
|
เธง |
|
เธจ |
|
เธซ |
|
เธญ |
|
เธฐ |
|
เธฒ |
|
เธฟ |
|
เน |
|
เน |
|
เน |
|
เน |
|
เผ |
|
แ |
|
แ |
|
แ |
|
แ |
|
แ |
|
แ |
|
แ
|
|
แ |
|
แ |
|
แ |
|
แ |
|
แ |
|
แ |
|
แ |
|
แ |
|
แ |
|
แ |
|
แ |
|
แ
|
|
แ
ก |
|
แ
ข |
|
แ
ฅ |
|
แ
ฆ |
|
แ
ง |
|
แ
จ |
|
แ
ฉ |
|
แ
ช |
|
แ
ฌ |
|
แ
ญ |
|
แ
ฎ |
|
แ
ฏ |
|
แ
ฐ |
|
แ
ฑ |
|
แ
ฒ |
|
แ
ณ |
|
แ
ด |
|
แ
ต |
|
แจ |
|
แฉ |
|
แช |
|
แซ |
|
แญ |
|
แฏ |
|
แท |
|
แธ |
|
แบ |
|
แป |
|
แผ |
|
แพ |
|
แ |
|
แ |
|
แ |
|
แซ |
|
แด |
|
แด
|
|
แด |
|
แด |
|
แด |
|
แด |
|
แดจ |
|
แดช |
|
แดณ |
|
แดต |
|
แดท |
|
แดบ |
|
แต |
|
แต |
|
แต |
|
แต |
|
แต |
|
แต |
|
แตฆ |
|
แตง |
|
แตช |
|
แตถ |
|
แตน |
|
แถฒ |
|
แพฝ |
|
แพฟ |
|
แฟพ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โก |
|
โข |
|
โฅ |
|
โฆ |
|
โง |
|
โฐ |
|
โฑ |
|
โฒ |
|
โณ |
|
โด |
|
โน |
|
โบ |
|
โป |
|
โพ |
|
โฟ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โฐ |
|
โฑ |
|
โด |
|
โต |
|
โถ |
|
โท |
|
โธ |
|
โน |
|
โบ |
|
โป |
|
โฝ |
|
โพ |
|
โฟ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ
|
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โฃ |
|
โค |
|
โฆ |
|
โฉ |
|
โฌ |
|
โฑ |
|
โณ |
|
โต |
|
โน |
|
โบ |
|
โ |
|
โ
|
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โข |
|
โค |
|
โง |
|
โฌ |
|
โฎ |
|
โฐ |
|
โฑ |
|
โณ |
|
โต |
|
โ
|
|
โ
|
|
โ
|
|
โ
|
|
โ
|
|
โ
|
|
โ
|
|
โ
|
|
โ
|
|
โ
ฐ |
|
โ
ฑ |
|
โ
ฒ |
|
โ
ณ |
|
โ
ด |
|
โ
ต |
|
โ
ถ |
|
โ
ท |
|
โ
ธ |
|
โ
น |
|
โ
บ |
|
โ
ป |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โฆ |
|
โท |
|
โผ |
|
โ |
|
โ |
|
โ
|
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โจ |
|
โ |
|
โ |
|
โ
|
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โก |
|
โข |
|
โฃ |
|
โฅ |
|
โง |
|
โจ |
|
โฉ |
|
โช |
|
โซ |
|
โด |
|
โถ |
|
โท |
|
โธ |
|
โผ |
|
โฝ |
|
โพ |
|
โ |
|
โ |
|
โ
|
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โก |
|
โฃ |
|
โค |
|
โฅ |
|
โฆ |
|
โง |
|
โจ |
|
โช |
|
โซ |
|
โฒ |
|
โณ |
|
โท |
|
โบ |
|
โป |
|
โฝ |
|
โฟ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โฃ |
|
โฅ |
|
โฟ |
|
โ |
|
โ
|
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โฎ |
|
โฏ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โข |
|
โฃ |
|
โด |
|
โบ |
|
โ |
|
โฏ |
|
โผ |
|
โฃ |
|
โ |
|
โก |
|
โข |
|
โฃ |
|
โค |
|
โฅ |
|
โฆ |
|
โง |
|
โด |
|
โต |
|
โถ |
|
โ |
|
โ |
|
โ |
|
โก |
|
โ |
|
โ |
|
โ
|
|
โ |
|
โค |
|
โฌ |
|
โด |
|
โ |
|
โ |
|
โช |
|
โณ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โก |
|
โช |
|
โซ |
|
โฌ |
|
โฒ |
|
โณ |
|
โด |
|
โต |
|
โถ |
|
โธ |
|
โน |
|
โบ |
|
โผ |
|
โฝ |
|
โพ |
|
โฟ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โฆ |
|
โฏ |
|
โป |
|
โ
|
|
โ |
|
โ |
|
โ |
|
โบ |
|
โ |
|
โ |
|
โข |
|
โฆ |
|
โช |
|
โญ |
|
โฏ |
|
โซ |
|
โ |
|
โ |
|
โ |
|
โด |
|
โถ |
|
โ |
|
โ |
|
โ |
|
โ |
|
โข |
|
โค |
|
โ |
|
โฆ |
|
โง |
|
โจ |
|
โฉ |
|
โต |
|
โถ |
|
โ |
|
โคณ |
|
โฆ |
|
โฆต |
|
โงง |
|
โงธ |
|
โงน |
|
โจ |
|
โจ |
|
โจฏ |
|
โฉ |
|
โฉฝ |
|
โฉพ |
|
โฉฟ |
|
โช
|
|
โช |
|
โช |
|
โช |
|
โชก |
|
โชข |
|
โชฏ |
|
โฌ |
|
โฌ |
|
โฌก |
|
โฌข |
|
โฌฐ |
|
โฌฝ |
|
โฑ |
|
โฑช |
|
โธฑ |
|
โฟฟ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใต |
|
ใ |
|
ใข |
|
ใซ |
|
ใก |
|
ใช |
|
ใฌ |
|
ใป |
|
ใผ |
|
ใ
ฃ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใ |
|
ใก |
|
ใถ |
|
ไธ |
|
ไธน |
|
ๅซ |
|
ๅ
ณ |
|
ๅ |
|
ๅณ |
|
ๅ |
|
ๅฐ |
|
ๅปถ |
|
ๆน |
|
ๆฐ |
|
ๆฑค |
|
ๆณจ |
|
ๆถ |
|
ๆถฒ |
|
ๆธ
|
|
ๆธฉ |
|
ๆฝ |
|
็ญ |
|
็ |
|
็ |
|
็ |
|
็ |
|
็ฅ |
|
็ฒ |
|
็บข |
|
่ |
|
่พ |
|
่ถ |
|
่ |
|
่พ |
|
่ |
|
่ |
|
่ฃ |
|
่ก |
|
่กฅ |
|
่ดฅ |
|
้ข |
|
้ฅฎ |
|
้ชจ |
|
๊ |
|
๊ |
|
๊ต |
|
๊ท |
|
๏ฌ |
|
๏ฌ |
|
๏ฌ |
|
๏ฌ |
|
๏ฌ |
|
๏ดพ |
|
๏ดฟ |
|
๏ธฐ |
|
๏น |
|
๏น |
|
๏น |
|
๏นข |
|
๏นฃ |
|
๏นค |
|
๏นฅ |
|
๏นฉ |
|
๏ผ
|
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผ |
|
๏ผป |
|
๏ผฝ |
|
๏ผพ |
|
๏ผฟ |
|
๏ฝ |
|
๏ฝ |
|
๏ฝ |
|
๏ฝ |
|
๏ฝ |
|
๏ฝ |
|
๏ฝ |
|
๏ฝ |
|
๏ฝ |
|
๏ฝ |
|
๏ฝข |
|
๏ฝค |
|
๏ฝฅ |
|
๏ฝฑ |
|
๏ฝต |
|
๏ฟก |
|
๏ฟฅ |
|
๏ฟฆ |
|
๏ฟผ |
|
๐ซ |
|
๐ด |
|
๐ธ |
|
๐ |
|
๐ |
|
๐ |
|
๐ |
|
๐ |
|
๐ |
|
๐ |
|
๐ |
|
๐ |
|
๐ก |
|
๐ฅ |
|
๐ |
|
๐ |
|
๐ |
|
๐ |
|
๐ข |
|
๐ฉ |
|
๐ช |
|
๐ซ |
|
๐ฎ |
|
๐ฏ |
|
๐ |
|
๐ |
|
๐ |
|
๐น |
|
๐ |
|
๐ |
|
๐ฑ |
|
๐ |
|
๐ |
|
๐ผ |
|
๐ฝ |
|
๐ |
|
๐ |
|
๐ |
|
๐
|
|
๐ |
|
๐ |
|
๐ |
|
๐ |
|
๐ |
|
๐ |
|
๐ |
|
๐ฐ |
|
##a |
|
##l |
|
##d |
|
##r |
|
##c |
|
##h |
|
##e |
|
##o |
|
##s |
|
##t |
|
##0 |
|
##1 |
|
##3 |
|
##2 |
|
##5 |
|
##9 |
|
##m |
|
##w |
|
##p |
|
##i |
|
##n |
|
##v |
|
##y |
|
##6 |
|
##8 |
|
##4 |
|
##ยฑ |
|
##b |
|
##u |
|
##g |
|
##7 |
|
##f |
|
##ยฐ |
|
##k |
|
##z |
|
##โ
ฐ |
|
##x |
|
##q |
|
##j |
|
##โค |
|
##ยฉ |
|
##ฮฒ |
|
##โ |
|
##ร |
|
##ยต |
|
##ฮผ |
|
##โ |
|
##โฅ |
|
##โป |
|
##โบ |
|
##รท |
|
##โ |
|
##โข |
|
##ยฎ |
|
##โ |
|
##ฮฑ |
|
##ร |
|
##ฮณ |
|
##ฮท |
|
##ยฝ |
|
##โผ |
|
##โ |
|
##ฮด |
|
##ยฃ |
|
##โ |
|
##ยน |
|
##โ |
|
##ยบ |
|
##โ |
|
##โ |
|
##โถ |
|
##โ |
|
##โ |
|
##โ |
|
##ยด |
|
##โฏ |
|
##โ |
|
##โต |
|
##โ |
|
##โ |
|
##ล |
|
##โด |
|
##โ
|
|
##โ
ฑ |
|
##ห |
|
##โ |
|
##โ |
|
##ห |
|
##ฮต |
|
##โฌ |
|
##ยณ |
|
##โถ |
|
##ยฒ |
|
##โ
ฒ |
|
##ฯ |
|
##โ
|
|
##โฉพ |
|
##โง |
|
##โ |
|
##โ |
|
##๏ฝฑ |
|
##ะพ |
|
##ฯ |
|
##โฐ |
|
##๐ก |
|
##๐ |
|
##๐ |
|
##๐ |
|
##๐ |
|
##โ |
|
##ยฌ |
|
##โ |
|
##โธ |
|
##รธ |
|
##โฉ |
|
##ฯ |
|
##๏ฌ |
|
##๏ฌ |