THUDM
/

chatglm2-6b-int4

Inference Endpoints

Model card Files Files and versions Community

Update tokenization_chatglm.py

#20

by sylwia-kuros - opened Nov 8, 2023

base: refs/heads/main

←

from: refs/pr/20

Discussion Files changed

Files changed (1) hide show

tokenization_chatglm.py +3 -0

tokenization_chatglm.py CHANGED Viewed

@@ -70,6 +70,9 @@ class ChatGLMTokenizer(PreTrainedTokenizer):
         self.vocab_file = vocab_file
         self.tokenizer = SPTokenizer(vocab_file)
         self.special_tokens = {
             "<bos>": self.tokenizer.bos_id,
             "<eos>": self.tokenizer.eos_id,

         self.vocab_file = vocab_file
         self.tokenizer = SPTokenizer(vocab_file)
+        kwargs.pop("eos_token", None)
+        kwargs.pop("pad_token", None)
+        kwargs.pop("unk_token", None)
         self.special_tokens = {
             "<bos>": self.tokenizer.bos_id,
             "<eos>": self.tokenizer.eos_id,