justin871030 commited on
Commit
a1e60a3
โ€ข
1 Parent(s): 0ec3228

Remove duplicate words in dictionary

Browse files
Files changed (3) hide show
  1. special_tokens_map.json +1 -1
  2. tokenizer_config.json +1 -1
  3. vocab.txt +2 -2
special_tokens_map.json CHANGED
@@ -4,5 +4,5 @@
4
  "pad_token": "[PAD]",
5
  "cls_token": "[CLS]",
6
  "mask_token": "[MASK]",
7
- "additional_special_tokens": ["[NAME]", "[RELIGION]", "๐Ÿ˜‚", "โค", "๐Ÿคฃ", "๐Ÿ˜ญ", "๐Ÿ‘", "โ™€", "๐Ÿ˜", "๐Ÿค”", "๐Ÿฆ€", "๐Ÿ‘", "๐Ÿป", "๐Ÿคท", "๐Ÿผ", "๐Ÿ™„", "๐Ÿ˜Š", "๐Ÿ”ฅ", "๐Ÿ˜ข", "๐Ÿ˜…", "๐Ÿ’œ", "๐Ÿ‘Œ", "โ™‚", "โ˜บ", "๐Ÿ˜Ž", "โ™ฅ", "๐Ÿ’ฏ", "๐Ÿ’ฆ", "๐Ÿ˜", "๐Ÿ˜”", "๐Ÿคข", "๐Ÿ’•", "๐Ÿ™", "๐Ÿ˜‰", "๐Ÿ™Œ", "๐Ÿคฆ", "๐Ÿ™ƒ", "๐Ÿ˜†", "๐Ÿ˜˜", "๐ŸŽถ", "๐Ÿ˜ค", "๐Ÿ˜", "๐Ÿ˜€", "๐Ÿค—", "๐Ÿ˜", "๐Ÿฝ", "๐Ÿ’ช", "๐Ÿ˜ก", "๐ŸŽ‰", "๐Ÿ‘€", "โœ”", "๐Ÿ”ช", "๐Ÿ˜„", "๐Ÿ˜ฌ", "๐Ÿ’–", "๐Ÿ˜ฅ", "๐Ÿ˜’", "โœŒ", "๐Ÿ’ƒ", "โ„ข", "๐Ÿ˜ฉ", "โ˜น", "๐Ÿ’…", "๐Ÿ˜ช", "๐Ÿ‘‘", "๐Ÿ˜ณ", "๐Ÿคช", "๐Ÿ˜•", "๐ŸŽ‚", "๐Ÿ˜ซ", "๐Ÿ’™", "๐Ÿคฎ", "๐Ÿšซ", "๐Ÿ˜ž", "๐Ÿ’Ž", "๐Ÿ˜ฑ", "๐Ÿ˜‘", "๐Ÿ˜–", "๐ŸŠ", "๐Ÿ™ˆ", "๐Ÿค ", "โฃ", "๐Ÿคฉ", "๐Ÿ™‚", "๐Ÿ‘Š", "๐Ÿ’›", "๐Ÿ’“", "๐Ÿ‘ฉ", "โœจ", "๐Ÿ˜ฃ", "๐Ÿ’—", "๐Ÿคž", "๐Ÿฅ€", "๐Ÿš“", "๐Ÿ˜ฐ", "๐Ÿ‘…", "๐Ÿ˜", "๐Ÿป", "๐Ÿค•", "๐Ÿ˜œ", "๐Ÿฆˆ", "๐Ÿ˜ƒ", "๐Ÿ˜ฎ", "โœŠ", "๐Ÿ’š", "๐ŸŽต", "๐Ÿ’จ", "โ˜", "๐ŸŒˆ", "๐Ÿ’„", "๐Ÿ‘ธ", "๐Ÿ’ฅ", "๐Ÿ–ค", "๐Ÿพ", "๐Ÿฉ", "๐Ÿ˜‹", "๐Ÿคฒ", "๐Ÿคค", "๐Ÿง›", "๐Ÿ˜‡", "โ„", "โ–ซ", "๐Ÿ’", "๐Ÿ˜ด", ":)", ":(", "XD", "xD", ":D", ":'("]
8
  }
 
4
  "pad_token": "[PAD]",
5
  "cls_token": "[CLS]",
6
  "mask_token": "[MASK]",
7
+ "additional_special_tokens": ["[NAME]", "[RELIGION]", "๐Ÿ˜‚", "โค", "๐Ÿคฃ", "๐Ÿ˜ญ", "๐Ÿ‘", "โ™€", "๐Ÿ˜", "๐Ÿค”", "๐Ÿฆ€", "๐Ÿ‘", "๐Ÿป", "๐Ÿคท", "๐Ÿผ", "๐Ÿ™„", "๐Ÿ˜Š", "๐Ÿ”ฅ", "๐Ÿ˜ข", "๐Ÿ˜…", "๐Ÿ’œ", "๐Ÿ‘Œ", "โ™‚", "โ˜บ", "๐Ÿ˜Ž", "๐Ÿ’ฏ", "๐Ÿ’ฆ", "๐Ÿ˜", "๐Ÿ˜”", "๐Ÿคข", "๐Ÿ’•", "๐Ÿ™", "๐Ÿ˜‰", "๐Ÿ™Œ", "๐Ÿคฆ", "๐Ÿ™ƒ", "๐Ÿ˜†", "๐Ÿ˜˜", "๐ŸŽถ", "๐Ÿ˜ค", "๐Ÿ˜", "๐Ÿ˜€", "๐Ÿค—", "๐Ÿ˜", "๐Ÿฝ", "๐Ÿ’ช", "๐Ÿ˜ก", "๐ŸŽ‰", "๐Ÿ‘€", "โœ”", "๐Ÿ”ช", "๐Ÿ˜„", "๐Ÿ˜ฌ", "๐Ÿ’–", "๐Ÿ˜ฅ", "๐Ÿ˜’", "โœŒ", "๐Ÿ’ƒ", "๐Ÿ˜ฉ", "โ˜น", "๐Ÿ’…", "๐Ÿ˜ช", "๐Ÿ‘‘", "๐Ÿ˜ณ", "๐Ÿคช", "๐Ÿ˜•", "๐ŸŽ‚", "๐Ÿ˜ซ", "๐Ÿ’™", "๐Ÿคฎ", "๐Ÿšซ", "๐Ÿ˜ž", "๐Ÿ’Ž", "๐Ÿ˜ฑ", "๐Ÿ˜‘", "๐Ÿ˜–", "๐ŸŠ", "๐Ÿ™ˆ", "๐Ÿค ", "โฃ", "๐Ÿคฉ", "๐Ÿ™‚", "๐Ÿ‘Š", "๐Ÿ’›", "๐Ÿ’“", "๐Ÿ‘ฉ", "โœจ", "๐Ÿ˜ฃ", "๐Ÿ’—", "๐Ÿคž", "๐Ÿฅ€", "๐Ÿš“", "๐Ÿ˜ฐ", "๐Ÿ‘…", "๐Ÿ˜", "๐Ÿป", "๐Ÿค•", "๐Ÿ˜œ", "๐Ÿฆˆ", "๐Ÿ˜ƒ", "๐Ÿ˜ฎ", "โœŠ", "๐Ÿ’š", "๐ŸŽต", "๐Ÿ’จ", "โ˜", "๐ŸŒˆ", "๐Ÿ’„", "๐Ÿ‘ธ", "๐Ÿ’ฅ", "๐Ÿ–ค", "๐Ÿพ", "๐Ÿฉ", "๐Ÿ˜‹", "๐Ÿคฒ", "๐Ÿคค", "๐Ÿง›", "๐Ÿ˜‡", "โ„", "โ–ซ", "๐Ÿ’", "๐Ÿ˜ด", ":)", ":(", "XD", "xD", ":D", ":'("]
8
  }
tokenizer_config.json CHANGED
@@ -6,5 +6,5 @@
6
  "pad_token": "[PAD]",
7
  "cls_token": "[CLS]",
8
  "mask_token": "[MASK]",
9
- "additional_special_tokens": ["[NAME]", "[RELIGION]", "๐Ÿ˜‚", "โค", "๐Ÿคฃ", "๐Ÿ˜ญ", "๐Ÿ‘", "โ™€", "๐Ÿ˜", "๐Ÿค”", "๐Ÿฆ€", "๐Ÿ‘", "๐Ÿป", "๐Ÿคท", "๐Ÿผ", "๐Ÿ™„", "๐Ÿ˜Š", "๐Ÿ”ฅ", "๐Ÿ˜ข", "๐Ÿ˜…", "๐Ÿ’œ", "๐Ÿ‘Œ", "โ™‚", "โ˜บ", "๐Ÿ˜Ž", "โ™ฅ", "๐Ÿ’ฏ", "๐Ÿ’ฆ", "๐Ÿ˜", "๐Ÿ˜”", "๐Ÿคข", "๐Ÿ’•", "๐Ÿ™", "๐Ÿ˜‰", "๐Ÿ™Œ", "๐Ÿคฆ", "๐Ÿ™ƒ", "๐Ÿ˜†", "๐Ÿ˜˜", "๐ŸŽถ", "๐Ÿ˜ค", "๐Ÿ˜", "๐Ÿ˜€", "๐Ÿค—", "๐Ÿ˜", "๐Ÿฝ", "๐Ÿ’ช", "๐Ÿ˜ก", "๐ŸŽ‰", "๐Ÿ‘€", "โœ”", "๐Ÿ”ช", "๐Ÿ˜„", "๐Ÿ˜ฌ", "๐Ÿ’–", "๐Ÿ˜ฅ", "๐Ÿ˜’", "โœŒ", "๐Ÿ’ƒ", "โ„ข", "๐Ÿ˜ฉ", "โ˜น", "๐Ÿ’…", "๐Ÿ˜ช", "๐Ÿ‘‘", "๐Ÿ˜ณ", "๐Ÿคช", "๐Ÿ˜•", "๐ŸŽ‚", "๐Ÿ˜ซ", "๐Ÿ’™", "๐Ÿคฎ", "๐Ÿšซ", "๐Ÿ˜ž", "๐Ÿ’Ž", "๐Ÿ˜ฑ", "๐Ÿ˜‘", "๐Ÿ˜–", "๐ŸŠ", "๐Ÿ™ˆ", "๐Ÿค ", "โฃ", "๐Ÿคฉ", "๐Ÿ™‚", "๐Ÿ‘Š", "๐Ÿ’›", "๐Ÿ’“", "๐Ÿ‘ฉ", "โœจ", "๐Ÿ˜ฃ", "๐Ÿ’—", "๐Ÿคž", "๐Ÿฅ€", "๐Ÿš“", "๐Ÿ˜ฐ", "๐Ÿ‘…", "๐Ÿ˜", "๐Ÿป", "๐Ÿค•", "๐Ÿ˜œ", "๐Ÿฆˆ", "๐Ÿ˜ƒ", "๐Ÿ˜ฎ", "โœŠ", "๐Ÿ’š", "๐ŸŽต", "๐Ÿ’จ", "โ˜", "๐ŸŒˆ", "๐Ÿ’„", "๐Ÿ‘ธ", "๐Ÿ’ฅ", "๐Ÿ–ค", "๐Ÿพ", "๐Ÿฉ", "๐Ÿ˜‹", "๐Ÿคฒ", "๐Ÿคค", "๐Ÿง›", "๐Ÿ˜‡", "โ„", "โ–ซ", "๐Ÿ’", "๐Ÿ˜ด", ":)", ":(", "XD", "xD", ":D", ":'("]
10
  }
 
6
  "pad_token": "[PAD]",
7
  "cls_token": "[CLS]",
8
  "mask_token": "[MASK]",
9
+ "additional_special_tokens": ["[NAME]", "[RELIGION]", "๐Ÿ˜‚", "โค", "๐Ÿคฃ", "๐Ÿ˜ญ", "๐Ÿ‘", "โ™€", "๐Ÿ˜", "๐Ÿค”", "๐Ÿฆ€", "๐Ÿ‘", "๐Ÿป", "๐Ÿคท", "๐Ÿผ", "๐Ÿ™„", "๐Ÿ˜Š", "๐Ÿ”ฅ", "๐Ÿ˜ข", "๐Ÿ˜…", "๐Ÿ’œ", "๐Ÿ‘Œ", "โ™‚", "โ˜บ", "๐Ÿ˜Ž", "๐Ÿ’ฏ", "๐Ÿ’ฆ", "๐Ÿ˜", "๐Ÿ˜”", "๐Ÿคข", "๐Ÿ’•", "๐Ÿ™", "๐Ÿ˜‰", "๐Ÿ™Œ", "๐Ÿคฆ", "๐Ÿ™ƒ", "๐Ÿ˜†", "๐Ÿ˜˜", "๐ŸŽถ", "๐Ÿ˜ค", "๐Ÿ˜", "๐Ÿ˜€", "๐Ÿค—", "๐Ÿ˜", "๐Ÿฝ", "๐Ÿ’ช", "๐Ÿ˜ก", "๐ŸŽ‰", "๐Ÿ‘€", "โœ”", "๐Ÿ”ช", "๐Ÿ˜„", "๐Ÿ˜ฌ", "๐Ÿ’–", "๐Ÿ˜ฅ", "๐Ÿ˜’", "โœŒ", "๐Ÿ’ƒ", "๐Ÿ˜ฉ", "โ˜น", "๐Ÿ’…", "๐Ÿ˜ช", "๐Ÿ‘‘", "๐Ÿ˜ณ", "๐Ÿคช", "๐Ÿ˜•", "๐ŸŽ‚", "๐Ÿ˜ซ", "๐Ÿ’™", "๐Ÿคฎ", "๐Ÿšซ", "๐Ÿ˜ž", "๐Ÿ’Ž", "๐Ÿ˜ฑ", "๐Ÿ˜‘", "๐Ÿ˜–", "๐ŸŠ", "๐Ÿ™ˆ", "๐Ÿค ", "โฃ", "๐Ÿคฉ", "๐Ÿ™‚", "๐Ÿ‘Š", "๐Ÿ’›", "๐Ÿ’“", "๐Ÿ‘ฉ", "โœจ", "๐Ÿ˜ฃ", "๐Ÿ’—", "๐Ÿคž", "๐Ÿฅ€", "๐Ÿš“", "๐Ÿ˜ฐ", "๐Ÿ‘…", "๐Ÿ˜", "๐Ÿป", "๐Ÿค•", "๐Ÿ˜œ", "๐Ÿฆˆ", "๐Ÿ˜ƒ", "๐Ÿ˜ฎ", "โœŠ", "๐Ÿ’š", "๐ŸŽต", "๐Ÿ’จ", "โ˜", "๐ŸŒˆ", "๐Ÿ’„", "๐Ÿ‘ธ", "๐Ÿ’ฅ", "๐Ÿ–ค", "๐Ÿพ", "๐Ÿฉ", "๐Ÿ˜‹", "๐Ÿคฒ", "๐Ÿคค", "๐Ÿง›", "๐Ÿ˜‡", "โ„", "โ–ซ", "๐Ÿ’", "๐Ÿ˜ด", ":)", ":(", "XD", "xD", ":D", ":'("]
10
  }
vocab.txt CHANGED
@@ -127,7 +127,6 @@
127
  โ™‚
128
  โ˜บ
129
  ๐Ÿ˜Ž
130
- โ™ฅ
131
  ๐Ÿ’ฏ
132
  ๐Ÿ’ฆ
133
  ๐Ÿ˜
@@ -161,7 +160,6 @@
161
  ๐Ÿ˜’
162
  โœŒ
163
  ๐Ÿ’ƒ
164
- โ„ข
165
  ๐Ÿ˜ฉ
166
  โ˜น
167
  ๐Ÿ’…
@@ -232,6 +230,8 @@ XD
232
  xD
233
  :D
234
  :'(
 
 
235
  [unused229]
236
  [unused230]
237
  [unused231]
 
127
  โ™‚
128
  โ˜บ
129
  ๐Ÿ˜Ž
 
130
  ๐Ÿ’ฏ
131
  ๐Ÿ’ฆ
132
  ๐Ÿ˜
 
160
  ๐Ÿ˜’
161
  โœŒ
162
  ๐Ÿ’ƒ
 
163
  ๐Ÿ˜ฉ
164
  โ˜น
165
  ๐Ÿ’…
 
230
  xD
231
  :D
232
  :'(
233
+ [unused227]
234
+ [unused228]
235
  [unused229]
236
  [unused230]
237
  [unused231]