pycompetitive-codegen350M-qlora / tokenizer_config.json

Trained for 3 epochs in cleaned deepmind code contest dataset with only python codes

38badf6 over 1 year ago

237 Bytes

	{
	"add_prefix_space": false,
	"bos_token": "<\|endoftext\|>",
	"clean_up_tokenization_spaces": true,
	"eos_token": "<\|endoftext\|>",
	"model_max_length": 2048,
	"tokenizer_class": "CodeGenTokenizer",
	"unk_token": "<\|endoftext\|>"
	}