Spaces:

xu-song
/

tokenizer-arena

App Files Files Community

tokenizer-arena / vocab /chinese_llama2 /demo.py

xu-song's picture

add more tokenizers

f4973d4 11 months ago

132 Bytes



	from vocab.chinese_llama2 import tokenizer

	encoding = tokenizer.encode("<s>开始</s>站位符<pad>试试<unk>")
	print(encoding)