LeoLM
/

leo-mistral-hessianai-7b-chat

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

bjoernp commited on Oct 9, 2023

Commit

8bc376c

·

1 Parent(s): 57e3994

Upload tokenizer

Files changed (2) hide show

special_tokens_map.json +7 -1
tokenizer_config.json +4 -2

special_tokens_map.json CHANGED Viewed

@@ -2,9 +2,15 @@
   "additional_special_tokens": [
     "<unk>",
     "<s>",
-    "</s>"
   ],
   "bos_token": "<s>",
   "eos_token": "</s>",
   "unk_token": "<unk>"
 }

   "additional_special_tokens": [
     "<unk>",
     "<s>",
+    "</s>",
+    "<|im_start|>",
+    "<|im_end|>"
   ],
   "bos_token": "<s>",
+  "cls_token": "</s>",
   "eos_token": "</s>",
+  "mask_token": "</s>",
+  "pad_token": "</s>",
+  "sep_token": "</s>",
   "unk_token": "<unk>"
 }

tokenizer_config.json CHANGED Viewed

@@ -44,7 +44,9 @@
   "additional_special_tokens": [
     "<unk>",
     "<s>",
-    "</s>"
   ],
   "bos_token": "<s>",
   "chat_template": "{% if not add_generation_prompt is defined %}{% set add_generation_prompt = false %}{% endif %}{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
@@ -52,7 +54,7 @@
   "eos_token": "</s>",
   "legacy": true,
   "model_max_length": 1000000000000000019884624838656,
-  "pad_token": null,
   "sp_model_kwargs": {},
   "spaces_between_special_tokens": false,
   "tokenizer_class": "LlamaTokenizer",

   "additional_special_tokens": [
     "<unk>",
     "<s>",
+    "</s>",
+    "<|im_start|>",
+    "<|im_end|>"
   ],
   "bos_token": "<s>",
   "chat_template": "{% if not add_generation_prompt is defined %}{% set add_generation_prompt = false %}{% endif %}{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
   "eos_token": "</s>",
   "legacy": true,
   "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
   "sp_model_kwargs": {},
   "spaces_between_special_tokens": false,
   "tokenizer_class": "LlamaTokenizer",