Spaces:

xu-song
/

tokenizer-arena

add more tokenizers

f4973d4 11 months ago

199 Bytes

	from vocab.gpt_35_turbo import tokenizer


	print(tokenizer.get_vocab())


	text = "中"
	token_ids = tokenizer.encode(text)
	decode_str = tokenizer.convert_tokens_to_string(token_ids)
	print(decode_str)