Upload tokenizer

Files changed (3) hide show

special_tokens_map.json CHANGED Viewed

@@ -1,3 +1,8 @@
 {
-  "eos_token": "|<EOS>|"
 }

 {
+  "bos_token": "|<BOS>|",
+  "cls_token": "|<CLS>|",
+  "eos_token": "|<EOS>|",
+  "mask_token": "|<MASK>|",
+  "pad_token": "|<PAD>|",
+  "sep_token": "|<SEP>|"
 }

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -57,8 +57,17 @@
       "special": true
     }
   },
   "clean_up_tokenization_spaces": true,
   "eos_token": "|<EOS>|",
-  "model_max_length": 8000,
   "tokenizer_class": "PreTrainedTokenizerFast"
 }

       "special": true
     }
   },
+  "bos_token": "|<BOS>|",
   "clean_up_tokenization_spaces": true,
+  "cls_token": "|<CLS>|",
   "eos_token": "|<EOS>|",
+  "mask_token": "|<MASK>|",
+  "max_length": null,
+  "model_max_length": 256,
+  "pad_to_multiple_of": null,
+  "pad_token": "|<PAD>|",
+  "pad_token_type_id": 0,
+  "padding_side": "right",
+  "sep_token": "|<SEP>|",
   "tokenizer_class": "PreTrainedTokenizerFast"
 }