RikkiXu
/

zephyr-7b-sft-full

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-sft-full / tokenizer_config.json

RikkiXu's picture

Training in progress, step 1500

20d8790 verified about 1 month ago

history blame contribute delete

No virus

3.35 kB

	{
	"add_bos_token": true,
	"add_eos_token": false,
	"added_tokens_decoder": {
	"100000": {
	"content": "<｜begin▁of▁sentence｜>",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"100001": {
	"content": "<｜end▁of▁sentence｜>",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"100002": {
	"content": "ø",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100003": {
	"content": "ö",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100004": {
	"content": "ú",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100005": {
	"content": "ÿ",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100006": {
	"content": "õ",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100007": {
	"content": "÷",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100008": {
	"content": "û",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100009": {
	"content": "ý",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100010": {
	"content": "À",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100011": {
	"content": "ù",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100012": {
	"content": "Á",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100013": {
	"content": "þ",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	},
	"100014": {
	"content": "ü",
	"lstrip": false,
	"normalized": true,
	"rstrip": false,
	"single_word": false,
	"special": false
	}
	},
	"bos_token": "<｜begin▁of▁sentence｜>",
	"chat_template": "{% for message in messages %}\n{% if message['role'] == 'user' %}\n{{ 'User: '+ message['content'] }}\n{% elif message['role'] == 'assistant' %}\n{{ 'Assistant: ' + message['content'] + eos_token }}{% endif %}\n{% if loop.last and add_generation_prompt %}\n{{ 'Assistant: ' }}{% endif %}\n{% endfor %}",
	"clean_up_tokenization_spaces": false,
	"eos_token": "<｜end▁of▁sentence｜>",
	"legacy": true,
	"model_max_length": 4096,
	"pad_token": "<｜end▁of▁sentence｜>",
	"sp_model_kwargs": {},
	"tokenizer_class": "LlamaTokenizer",
	"unk_token": null,
	"use_default_system_prompt": false
	}