File size: 163 Bytes
751936e
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12

"""

## 疑问
- \u200d  是啥?
- 对emoji 划分12个类
"""

import json
emoji = json.load(open("tokenizer/emoji.json", "r", encoding="utf-8"))

print(emoji)