tokenizer.json 한글 인코딩

#6
by leooj - opened

안녕하세요 beomi님, 혹시 제가 맞게 tokenizer를 사용하고 있다면, 한글인코딩이 깨진게 아닌가 궁금합니다.

Screenshot 2024-06-25 at 8.15.08 PM.png

Screenshot 2024-06-25 at 8.16.10 PM.png

안녕하세요. BBPE 인코딩이라 해당 처럼 나오는게 정상입니다.

beomi changed discussion status to closed

Sign up or log in to comment