gpt2-base-japanese-v2 / tokenizer_config.json

add tokenizer

1e22941 over 2 years ago

325 Bytes

{"unk_token": "<|endoftext|>", "bos_token": "<|endoftext|>", "eos_token": "<|endoftext|>", "add_prefix_space": false, "keep_accents": true, "max_len": 80, "special_tokens_map_file": "classcat/gpt2-base-japanese-v2/special_tokens_map.json", "name_or_path": "classcat/gpt2-base-japanese-v2", "tokenizer_class": "GPT2Tokenizer"}