update: prepare for transformers

Signed-off-by: xuebi <xuebi@minimaxi.com>

Files changed (2) hide show

config.json CHANGED Viewed

@@ -79,7 +79,7 @@
   "layernorm_mlp_beta": 1.0,
   "max_position_embeddings": 196608,
   "mlp_intermediate_size": 8192,
-  "model_type": "minimax",
   "mtp_transformer_layers": 1,
   "num_attention_heads": 48,
   "num_experts_per_tok": 8,
@@ -96,6 +96,11 @@
     "weight_block_size": [
       128,
       128
     ]
   },
   "rms_norm_eps": 1e-06,

   "layernorm_mlp_beta": 1.0,
   "max_position_embeddings": 196608,
   "mlp_intermediate_size": 8192,
+  "model_type": "minimax_m2",
   "mtp_transformer_layers": 1,
   "num_attention_heads": 48,
   "num_experts_per_tok": 8,
     "weight_block_size": [
       128,
       128
+    ],
+    "modules_to_not_convert": [
+      "gate",
+      "e_score_correction_bias",
+      "lm_head"
     ]
   },
   "rms_norm_eps": 1e-06,

generation_config.json CHANGED Viewed

@@ -1,5 +1,7 @@
 {
   "do_sample": true,
   "temperature": 1.0,
   "top_p": 0.95,
   "top_k": 40,

 {
+  "bos_token_id": 200019,
   "do_sample": true,
+  "eos_token_id": 200020,
   "temperature": 1.0,
   "top_p": 0.95,
   "top_k": 40,