Upload tokenizer

Files changed (4) hide show

emoji.json ADDED Viewed

The diff for this file is too large to render. See raw diff

special_tokens_map.json ADDED Viewed

+{
+  "bos_token": "<|startoftext|>",
+  "eos_token": "<|endoftext|>",
+  "pad_token": "<|endoftext|>",
+  "unk_token": "<|endoftext|>"
+}

tokenizer_config.json ADDED Viewed

+{
+  "bos_token": "<|startoftext|>",
+  "do_clean_text": false,
+  "eos_token": "<|endoftext|>",
+  "model_max_length": 2048,
+  "name_or_path": "abeja/gpt-neox-japanese-2.7b",
+  "pad_token": "<|endoftext|>",
+  "special_tokens_map_file": null,
+  "tokenizer_class": "GPTNeoXJapaneseTokenizer",
+  "unk_token": "<|endoftext|>"
+}

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff