Tongjilibo
/

bert4torch_config

Tongjilibo commited on Sep 1, 2024

Commit

a3a9570

verified ·

1 Parent(s): b42c69f

Update deepseek-moe-16b-base/bert4torch_config.json

Files changed (1) hide show

deepseek-moe-16b-base/bert4torch_config.json CHANGED Viewed

@@ -1,4 +1,6 @@
 {
   "attention_bias": false,
   "attention_dropout": 0.0,
   "aux_loss_alpha": 0.001,
@@ -10,7 +12,6 @@
   "initializer_range": 0.02,
   "intermediate_size": 10944,
   "max_position_embeddings": 4096,
-  "model": "deepseek",
   "moe_intermediate_size": 1408,
   "moe_layer_freq": 1,
   "n_routed_experts": 64,
@@ -32,5 +33,5 @@
   "skip_init": true,
   "segment_vocab_size": 0,
   "rope_rank": "updown",
-  "generation_config": {"tokenizer_config": {"add_special_tokens": false, "skip_special_tokens": true}, "max_length": 4096, "eos_token_id": 100001}
 }

 {
+  "model": "deepseek",
+  "template": "pretrained_text_continuation",
   "attention_bias": false,
   "attention_dropout": 0.0,
   "aux_loss_alpha": 0.001,
   "initializer_range": 0.02,
   "intermediate_size": 10944,
   "max_position_embeddings": 4096,
   "moe_intermediate_size": 1408,
   "moe_layer_freq": 1,
   "n_routed_experts": 64,
   "skip_init": true,
   "segment_vocab_size": 0,
   "rope_rank": "updown",
+  "generation_config": {"tokenizer_config":  {"skip_special_tokens": true, "add_special_tokens": false}, "eos_token_id": [100001]}
 }