alayaran
/

bodo-roberta-base-sentencepiece-mlm

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

bodo-roberta-base-sentencepiece-mlm / tokenizer_config.json

Sanjib Narzary

sentence piece tokenizer added

f123184 10 months ago

history blame contribute delete

No virus

233 Bytes

	{
	"clean_up_tokenization_spaces": true,
	"model_max_length": 512,
	"special_tokens": [
	"<s>",
	"<pad>",
	"</s>",
	"<unk>",
	"<cls>",
	"<sep>",
	"<mask>"
	],
	"tokenizer_class": "PreTrainedTokenizerFast"
	}