Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

config.json +5 -62
generation_config.json +1 -1
model-00001-of-00004.safetensors +2 -2
model-00002-of-00004.safetensors +2 -2
model-00003-of-00004.safetensors +2 -2
model-00004-of-00004.safetensors +2 -2
model.safetensors.index.json +228 -548

config.json CHANGED Viewed

@@ -1,6 +1,5 @@
 {
   "_commit_hash": null,
-  "_name_or_path": "./pretrained/InternVL2-8B",
   "architectures": [
     "InternVLChatModel"
   ],
@@ -96,105 +95,49 @@
     "top_p": 1.0,
     "torch_dtype": "bfloat16",
     "torchscript": false,
-    "transformers_version": "4.44.2",
     "typical_p": 1.0,
     "use_bfloat16": true,
-    "use_cache": false,
     "vocab_size": 92553
   },
-  "max_dynamic_patch": 6,
   "min_dynamic_patch": 1,
   "model_type": "internvl_chat",
-  "pad2square": false,
   "ps_version": "v2",
   "select_layer": -1,
   "template": "internlm2-chat",
   "torch_dtype": "bfloat16",
-  "transformers_version": null,
   "use_backbone_lora": 0,
-  "use_llm_lora": 16,
   "use_thumbnail": true,
   "vision_config": {
-    "_name_or_path": "",
-    "add_cross_attention": false,
     "architectures": [
       "InternVisionModel"
     ],
     "attention_dropout": 0.0,
-    "bad_words_ids": null,
-    "begin_suppress_tokens": null,
-    "bos_token_id": null,
-    "chunk_size_feed_forward": 0,
-    "cross_attention_hidden_size": null,
-    "decoder_start_token_id": null,
-    "diversity_penalty": 0.0,
-    "do_sample": false,
     "drop_path_rate": 0.0,
     "dropout": 0.0,
-    "early_stopping": false,
-    "encoder_no_repeat_ngram_size": 0,
-    "eos_token_id": null,
-    "exponential_decay_length_penalty": null,
-    "finetuning_task": null,
-    "forced_bos_token_id": null,
-    "forced_eos_token_id": null,
     "hidden_act": "gelu",
     "hidden_size": 1024,
-    "id2label": {
-      "0": "LABEL_0",
-      "1": "LABEL_1"
-    },
     "image_size": 448,
     "initializer_factor": 1.0,
     "initializer_range": 0.02,
     "intermediate_size": 4096,
-    "is_decoder": false,
-    "is_encoder_decoder": false,
-    "label2id": {
-      "LABEL_0": 0,
-      "LABEL_1": 1
-    },
     "layer_norm_eps": 1e-06,
-    "length_penalty": 1.0,
-    "max_length": 20,
-    "min_length": 0,
     "model_type": "intern_vit_6b",
-    "no_repeat_ngram_size": 0,
     "norm_type": "layer_norm",
     "num_attention_heads": 16,
-    "num_beam_groups": 1,
-    "num_beams": 1,
     "num_channels": 3,
     "num_hidden_layers": 24,
-    "num_return_sequences": 1,
     "output_attentions": false,
     "output_hidden_states": false,
-    "output_scores": false,
-    "pad_token_id": null,
     "patch_size": 14,
-    "prefix": null,
-    "problem_type": null,
-    "pruned_heads": {},
     "qk_normalization": false,
     "qkv_bias": true,
-    "remove_invalid_values": false,
-    "repetition_penalty": 1.0,
     "return_dict": true,
-    "return_dict_in_generate": false,
-    "sep_token_id": null,
-    "suppress_tokens": null,
-    "task_specific_params": null,
-    "temperature": 1.0,
-    "tf_legacy_loss": false,
-    "tie_encoder_decoder": false,
-    "tie_word_embeddings": true,
-    "tokenizer_class": null,
-    "top_k": 50,
-    "top_p": 1.0,
     "torch_dtype": "bfloat16",
-    "torchscript": false,
-    "transformers_version": "4.44.2",
-    "typical_p": 1.0,
     "use_bfloat16": true,
     "use_flash_attn": true
   }

 {
   "_commit_hash": null,
   "architectures": [
     "InternVLChatModel"
   ],
     "top_p": 1.0,
     "torch_dtype": "bfloat16",
     "torchscript": false,
+    "transformers_version": "4.37.2",
     "typical_p": 1.0,
     "use_bfloat16": true,
+    "use_cache": true,
     "vocab_size": 92553
   },
+  "max_dynamic_patch": 12,
   "min_dynamic_patch": 1,
   "model_type": "internvl_chat",
   "ps_version": "v2",
   "select_layer": -1,
   "template": "internlm2-chat",
   "torch_dtype": "bfloat16",
   "use_backbone_lora": 0,
+  "use_llm_lora": 0,
   "use_thumbnail": true,
   "vision_config": {
     "architectures": [
       "InternVisionModel"
     ],
     "attention_dropout": 0.0,
     "drop_path_rate": 0.0,
     "dropout": 0.0,
     "hidden_act": "gelu",
     "hidden_size": 1024,
     "image_size": 448,
     "initializer_factor": 1.0,
     "initializer_range": 0.02,
     "intermediate_size": 4096,
     "layer_norm_eps": 1e-06,
     "model_type": "intern_vit_6b",
     "norm_type": "layer_norm",
     "num_attention_heads": 16,
     "num_channels": 3,
     "num_hidden_layers": 24,
     "output_attentions": false,
     "output_hidden_states": false,
     "patch_size": 14,
     "qk_normalization": false,
     "qkv_bias": true,
     "return_dict": true,
     "torch_dtype": "bfloat16",
+    "transformers_version": "4.37.2",
     "use_bfloat16": true,
     "use_flash_attn": true
   }

generation_config.json CHANGED Viewed

@@ -4,5 +4,5 @@
     92542,
     92543
   ],
-  "transformers_version": "4.44.2"
 }

     92542,
     92543
   ],
+  "transformers_version": "4.37.2"
 }

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d25bbb2d1997918a6f9baf0c648fa6d899bcb810a1c0e151f4a8d1ee46f3efa8
-size 4959423416

 version https://git-lfs.github.com/spec/v1
+oid sha256:3d112f20b1afd32d37f8d418e047e86a0c783a401b4cebc68148a154de617225
+size 4939944336

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:61ddf1ada22fb21269f22df261bc143b089a62cc708f453717602f836ba1e927
-size 4942476624

 version https://git-lfs.github.com/spec/v1
+oid sha256:3f2e5450569f9b71a29699dcac11c195df8bb088bb15bbc589b2f528a03292d0
+size 4915914584

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c6bbfc022ca9768d95246a33f2d45fb4b8a10831603052f5a13986a180e8c521
-size 4942476664

 version https://git-lfs.github.com/spec/v1
+oid sha256:f8c241ab84d35a6c6d2cc457dd524435598da31bb466044d6314e7ad177b98d9
+size 4915914592

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:41bf312745b61b6b0df337ed72552c031bcff56ec000584f425a285879f72c86
-size 1381978232

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c58295c7daf96c868634a759f79a911b08c5081cc6f3fc4082b2d8b1c8b225f
+size 1379026920

model.safetensors.index.json CHANGED Viewed

@@ -1,555 +1,235 @@
 {
   "metadata": {
-    "total_size": 16226228224
   },
   "weight_map": {
-    "language_model.base_model.model.model.layers.0.attention.wo.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.attention.wo.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.attention.wo.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.attention.wqkv.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.attention.wqkv.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.attention.wqkv.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.attention_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.feed_forward.w1.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.feed_forward.w1.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.feed_forward.w1.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.feed_forward.w2.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.feed_forward.w2.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.feed_forward.w2.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.feed_forward.w3.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.feed_forward.w3.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.feed_forward.w3.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.0.ffn_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.attention.wo.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.attention.wo.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.attention.wo.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.attention.wqkv.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.attention.wqkv.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.attention.wqkv.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.attention_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.feed_forward.w1.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.feed_forward.w1.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.feed_forward.w1.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.feed_forward.w2.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.feed_forward.w2.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.feed_forward.w2.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.feed_forward.w3.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.feed_forward.w3.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.feed_forward.w3.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.1.ffn_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.attention.wo.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.attention.wo.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.attention.wo.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.attention.wqkv.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.attention.wqkv.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.attention.wqkv.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.attention_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.feed_forward.w2.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.feed_forward.w2.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.feed_forward.w2.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.feed_forward.w3.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.feed_forward.w3.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.feed_forward.w3.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.10.ffn_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.attention.wo.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.attention.wo.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.attention.wo.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.attention.wqkv.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.attention.wqkv.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.attention.wqkv.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.attention_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.feed_forward.w2.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.feed_forward.w2.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.feed_forward.w2.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.feed_forward.w3.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.feed_forward.w3.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.feed_forward.w3.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.11.ffn_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.attention.wo.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.attention.wo.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.attention.wo.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.attention.wqkv.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.attention.wqkv.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.attention.wqkv.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.attention_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.feed_forward.w2.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.feed_forward.w2.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.feed_forward.w2.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.feed_forward.w3.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.feed_forward.w3.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.feed_forward.w3.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.12.ffn_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.attention.wo.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.attention.wo.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.attention.wo.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.attention.wqkv.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.attention.wqkv.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.attention.wqkv.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.attention_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.feed_forward.w2.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.feed_forward.w2.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.feed_forward.w2.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.feed_forward.w3.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.feed_forward.w3.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.feed_forward.w3.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.13.ffn_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.attention.wo.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.attention.wo.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.attention.wo.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.attention.wqkv.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.attention.wqkv.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.attention.wqkv.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.attention_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.feed_forward.w2.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.feed_forward.w2.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.feed_forward.w2.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.feed_forward.w3.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.feed_forward.w3.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.feed_forward.w3.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.14.ffn_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.attention.wo.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.attention.wo.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.attention.wo.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.attention.wqkv.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.attention.wqkv.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.attention.wqkv.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.attention_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.feed_forward.w2.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.feed_forward.w2.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.feed_forward.w2.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.feed_forward.w3.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.feed_forward.w3.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.feed_forward.w3.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.15.ffn_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.attention.wo.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.attention.wo.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.attention.wo.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.attention.wqkv.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.attention.wqkv.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.attention.wqkv.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.attention_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.feed_forward.w2.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.feed_forward.w2.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.feed_forward.w2.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.feed_forward.w3.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.feed_forward.w3.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.feed_forward.w3.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.16.ffn_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.attention.wo.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.attention.wo.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.attention.wo.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.attention.wqkv.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.attention.wqkv.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.attention.wqkv.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.attention_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.feed_forward.w2.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.feed_forward.w2.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.feed_forward.w2.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.feed_forward.w3.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.feed_forward.w3.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.feed_forward.w3.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.17.ffn_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.attention.wo.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.attention.wo.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.attention.wo.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.attention.wqkv.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.attention.wqkv.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.attention.wqkv.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.attention_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.feed_forward.w2.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.feed_forward.w2.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.feed_forward.w2.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.feed_forward.w3.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.feed_forward.w3.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.feed_forward.w3.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.18.ffn_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.attention.wo.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.attention.wo.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.attention.wo.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.attention.wqkv.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.attention.wqkv.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.attention.wqkv.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.attention_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.feed_forward.w2.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.feed_forward.w2.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.feed_forward.w2.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.19.ffn_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.attention.wo.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.attention.wo.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.attention.wo.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.attention.wqkv.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.attention.wqkv.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.attention.wqkv.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.attention_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.feed_forward.w1.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.feed_forward.w1.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.feed_forward.w1.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.feed_forward.w2.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.feed_forward.w2.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.feed_forward.w2.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.feed_forward.w3.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.feed_forward.w3.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.feed_forward.w3.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.2.ffn_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.attention.wo.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.attention.wo.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.attention.wo.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.attention.wqkv.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.attention.wqkv.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.attention.wqkv.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.attention_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.feed_forward.w1.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.feed_forward.w1.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.feed_forward.w1.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.feed_forward.w2.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.feed_forward.w2.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.feed_forward.w2.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.20.ffn_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.attention.wo.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.attention.wo.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.attention.wo.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.attention.wqkv.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.attention.wqkv.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.attention.wqkv.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.attention_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.feed_forward.w1.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.feed_forward.w1.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.feed_forward.w1.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.feed_forward.w2.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.feed_forward.w2.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.feed_forward.w2.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.21.ffn_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.attention.wo.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.attention.wo.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.attention.wo.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.attention.wqkv.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.attention.wqkv.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.attention.wqkv.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.attention_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.feed_forward.w1.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.feed_forward.w1.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.feed_forward.w1.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.feed_forward.w2.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.feed_forward.w2.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.feed_forward.w2.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.22.ffn_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.attention.wo.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.attention.wo.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.attention.wo.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.attention.wqkv.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.attention.wqkv.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.attention.wqkv.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.attention_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.feed_forward.w1.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.feed_forward.w1.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.feed_forward.w1.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.feed_forward.w2.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.feed_forward.w2.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.feed_forward.w2.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.23.ffn_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.attention.wo.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.attention.wo.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.attention.wo.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.attention.wqkv.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.attention.wqkv.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.attention.wqkv.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.attention_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.feed_forward.w1.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.feed_forward.w1.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.feed_forward.w1.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.feed_forward.w2.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.feed_forward.w2.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.feed_forward.w2.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.24.ffn_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.attention.wo.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.attention.wo.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.attention.wo.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.attention.wqkv.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.attention.wqkv.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.attention.wqkv.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.attention_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.feed_forward.w1.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.feed_forward.w1.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.feed_forward.w1.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.feed_forward.w2.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.feed_forward.w2.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.feed_forward.w2.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.25.ffn_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.attention.wo.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.attention.wo.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.attention.wo.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.attention.wqkv.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.attention.wqkv.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.attention.wqkv.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.attention_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.feed_forward.w1.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.feed_forward.w1.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.feed_forward.w1.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.feed_forward.w2.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.feed_forward.w2.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.feed_forward.w2.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.26.ffn_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.attention.wo.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.attention.wo.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.attention.wo.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.attention.wqkv.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.attention.wqkv.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.attention.wqkv.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.attention_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.feed_forward.w1.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.feed_forward.w1.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.feed_forward.w1.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.feed_forward.w2.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.feed_forward.w2.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.feed_forward.w2.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.27.ffn_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.attention.wo.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.attention.wo.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.attention.wo.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.attention.wqkv.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.attention.wqkv.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.attention.wqkv.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.attention_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.feed_forward.w1.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.feed_forward.w1.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.feed_forward.w1.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.feed_forward.w2.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.feed_forward.w2.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.feed_forward.w2.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.28.ffn_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.attention.wo.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.attention.wo.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.attention.wo.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.attention.wqkv.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.attention.wqkv.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.attention.wqkv.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.attention_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.feed_forward.w1.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.feed_forward.w1.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.feed_forward.w1.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.feed_forward.w2.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.feed_forward.w2.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.feed_forward.w2.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.29.ffn_norm.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.attention.wo.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.attention.wo.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.attention.wo.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.attention.wqkv.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.attention.wqkv.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.attention.wqkv.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.attention_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.feed_forward.w1.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.feed_forward.w1.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.feed_forward.w1.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.feed_forward.w2.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.feed_forward.w2.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.feed_forward.w2.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.feed_forward.w3.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.feed_forward.w3.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.feed_forward.w3.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.3.ffn_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.attention.wo.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.attention.wo.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.attention.wo.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.attention.wqkv.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.attention.wqkv.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.attention.wqkv.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.attention_norm.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.feed_forward.w1.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.feed_forward.w1.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.feed_forward.w1.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.feed_forward.w2.base_layer.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.feed_forward.w2.lora_A.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.feed_forward.w2.lora_B.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.feed_forward.w3.base_layer.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.feed_forward.w3.lora_A.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.feed_forward.w3.lora_B.default.weight": "model-00003-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.30.ffn_norm.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.attention.wo.base_layer.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.attention.wo.lora_A.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.attention.wo.lora_B.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.attention.wqkv.base_layer.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.attention.wqkv.lora_A.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.attention.wqkv.lora_B.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.attention_norm.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.feed_forward.w1.base_layer.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.feed_forward.w1.lora_A.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.feed_forward.w1.lora_B.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.feed_forward.w2.base_layer.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.feed_forward.w2.lora_A.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.feed_forward.w2.lora_B.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.feed_forward.w3.base_layer.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.feed_forward.w3.lora_A.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.feed_forward.w3.lora_B.default.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.31.ffn_norm.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.attention.wo.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.attention.wo.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.attention.wo.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.attention.wqkv.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.attention.wqkv.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.attention.wqkv.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.attention_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.feed_forward.w1.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.feed_forward.w1.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.feed_forward.w1.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.feed_forward.w2.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.feed_forward.w2.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.feed_forward.w2.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.feed_forward.w3.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.feed_forward.w3.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.feed_forward.w3.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.4.ffn_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.attention.wo.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.attention.wo.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.attention.wo.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.attention.wqkv.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.attention.wqkv.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.attention.wqkv.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.attention_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.feed_forward.w1.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.feed_forward.w1.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.feed_forward.w1.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.feed_forward.w2.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.feed_forward.w2.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.feed_forward.w2.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.feed_forward.w3.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.feed_forward.w3.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.feed_forward.w3.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.5.ffn_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.attention.wo.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.attention.wo.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.attention.wo.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.attention.wqkv.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.attention.wqkv.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.attention.wqkv.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.attention_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.feed_forward.w1.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.feed_forward.w1.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.feed_forward.w1.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.feed_forward.w2.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.feed_forward.w2.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.feed_forward.w2.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.feed_forward.w3.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.feed_forward.w3.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.feed_forward.w3.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.6.ffn_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.attention.wo.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.attention.wo.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.attention.wo.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.attention.wqkv.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.attention.wqkv.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.attention.wqkv.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.attention_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.feed_forward.w1.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.feed_forward.w1.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.feed_forward.w1.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.feed_forward.w2.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.feed_forward.w2.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.feed_forward.w2.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.feed_forward.w3.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.feed_forward.w3.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.feed_forward.w3.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.7.ffn_norm.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.attention.wo.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.attention.wo.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.attention.wo.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.attention.wqkv.base_layer.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.attention.wqkv.lora_A.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.attention.wqkv.lora_B.default.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.attention_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.feed_forward.w2.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.feed_forward.w2.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.feed_forward.w2.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.feed_forward.w3.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.feed_forward.w3.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.feed_forward.w3.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.8.ffn_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.attention.wo.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.attention.wo.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.attention.wo.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.attention.wqkv.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.attention.wqkv.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.attention.wqkv.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.attention_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.feed_forward.w1.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.feed_forward.w1.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.feed_forward.w1.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.feed_forward.w2.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.feed_forward.w2.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.feed_forward.w2.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.feed_forward.w3.base_layer.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.feed_forward.w3.lora_A.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.feed_forward.w3.lora_B.default.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.layers.9.ffn_norm.weight": "model-00002-of-00004.safetensors",
-    "language_model.base_model.model.model.norm.weight": "model-00004-of-00004.safetensors",
-    "language_model.base_model.model.model.tok_embeddings.weight": "model-00001-of-00004.safetensors",
-    "language_model.base_model.model.output.weight": "model-00004-of-00004.safetensors",
     "mlp1.0.bias": "model-00004-of-00004.safetensors",
     "mlp1.0.weight": "model-00004-of-00004.safetensors",
     "mlp1.1.bias": "model-00004-of-00004.safetensors",

 {
   "metadata": {
+    "total_size": 16150730752
   },
   "weight_map": {
+    "language_model.model.layers.0.attention.wo.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.0.attention.wqkv.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.0.attention_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.0.feed_forward.w1.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.0.feed_forward.w2.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.0.feed_forward.w3.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.0.ffn_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.1.attention.wo.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.1.attention.wqkv.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.1.attention_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.1.feed_forward.w1.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.1.feed_forward.w2.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.1.feed_forward.w3.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.1.ffn_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.10.attention.wo.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.10.attention.wqkv.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.10.attention_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.10.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.10.feed_forward.w2.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.10.feed_forward.w3.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.10.ffn_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.11.attention.wo.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.11.attention.wqkv.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.11.attention_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.11.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.11.feed_forward.w2.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.11.feed_forward.w3.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.11.ffn_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.12.attention.wo.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.12.attention.wqkv.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.12.attention_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.12.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.12.feed_forward.w2.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.12.feed_forward.w3.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.12.ffn_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.13.attention.wo.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.13.attention.wqkv.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.13.attention_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.13.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.13.feed_forward.w2.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.13.feed_forward.w3.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.13.ffn_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.14.attention.wo.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.14.attention.wqkv.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.14.attention_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.14.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.14.feed_forward.w2.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.14.feed_forward.w3.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.14.ffn_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.15.attention.wo.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.15.attention.wqkv.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.15.attention_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.15.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.15.feed_forward.w2.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.15.feed_forward.w3.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.15.ffn_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.16.attention.wo.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.16.attention.wqkv.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.16.attention_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.16.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.16.feed_forward.w2.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.16.feed_forward.w3.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.16.ffn_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.17.attention.wo.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.17.attention.wqkv.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.17.attention_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.17.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.17.feed_forward.w2.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.17.feed_forward.w3.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.17.ffn_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.18.attention.wo.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.18.attention.wqkv.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.18.attention_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.18.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.18.feed_forward.w2.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.18.feed_forward.w3.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.18.ffn_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.19.attention.wo.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.19.attention.wqkv.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.19.attention_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.19.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.19.feed_forward.w2.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.19.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.19.ffn_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.2.attention.wo.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.2.attention.wqkv.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.2.attention_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.2.feed_forward.w1.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.2.feed_forward.w2.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.2.feed_forward.w3.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.2.ffn_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.20.attention.wo.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.20.attention.wqkv.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.20.attention_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.20.feed_forward.w1.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.20.feed_forward.w2.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.20.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.20.ffn_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.21.attention.wo.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.21.attention.wqkv.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.21.attention_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.21.feed_forward.w1.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.21.feed_forward.w2.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.21.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.21.ffn_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.22.attention.wo.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.22.attention.wqkv.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.22.attention_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.22.feed_forward.w1.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.22.feed_forward.w2.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.22.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.22.ffn_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.23.attention.wo.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.23.attention.wqkv.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.23.attention_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.23.feed_forward.w1.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.23.feed_forward.w2.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.23.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.23.ffn_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.24.attention.wo.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.24.attention.wqkv.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.24.attention_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.24.feed_forward.w1.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.24.feed_forward.w2.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.24.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.24.ffn_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.25.attention.wo.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.25.attention.wqkv.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.25.attention_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.25.feed_forward.w1.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.25.feed_forward.w2.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.25.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.25.ffn_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.26.attention.wo.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.26.attention.wqkv.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.26.attention_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.26.feed_forward.w1.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.26.feed_forward.w2.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.26.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.26.ffn_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.27.attention.wo.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.27.attention.wqkv.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.27.attention_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.27.feed_forward.w1.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.27.feed_forward.w2.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.27.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.27.ffn_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.28.attention.wo.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.28.attention.wqkv.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.28.attention_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.28.feed_forward.w1.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.28.feed_forward.w2.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.28.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.28.ffn_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.29.attention.wo.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.29.attention.wqkv.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.29.attention_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.29.feed_forward.w1.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.29.feed_forward.w2.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.29.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.29.ffn_norm.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.3.attention.wo.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.3.attention.wqkv.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.3.attention_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.3.feed_forward.w1.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.3.feed_forward.w2.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.3.feed_forward.w3.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.3.ffn_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.30.attention.wo.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.30.attention.wqkv.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.30.attention_norm.weight": "model-00004-of-00004.safetensors",
+    "language_model.model.layers.30.feed_forward.w1.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.30.feed_forward.w2.weight": "model-00004-of-00004.safetensors",
+    "language_model.model.layers.30.feed_forward.w3.weight": "model-00003-of-00004.safetensors",
+    "language_model.model.layers.30.ffn_norm.weight": "model-00004-of-00004.safetensors",
+    "language_model.model.layers.31.attention.wo.weight": "model-00004-of-00004.safetensors",
+    "language_model.model.layers.31.attention.wqkv.weight": "model-00004-of-00004.safetensors",
+    "language_model.model.layers.31.attention_norm.weight": "model-00004-of-00004.safetensors",
+    "language_model.model.layers.31.feed_forward.w1.weight": "model-00004-of-00004.safetensors",
+    "language_model.model.layers.31.feed_forward.w2.weight": "model-00004-of-00004.safetensors",
+    "language_model.model.layers.31.feed_forward.w3.weight": "model-00004-of-00004.safetensors",
+    "language_model.model.layers.31.ffn_norm.weight": "model-00004-of-00004.safetensors",
+    "language_model.model.layers.4.attention.wo.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.4.attention.wqkv.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.4.attention_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.4.feed_forward.w1.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.4.feed_forward.w2.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.4.feed_forward.w3.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.4.ffn_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.5.attention.wo.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.5.attention.wqkv.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.5.attention_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.5.feed_forward.w1.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.5.feed_forward.w2.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.5.feed_forward.w3.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.5.ffn_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.6.attention.wo.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.6.attention.wqkv.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.6.attention_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.6.feed_forward.w1.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.6.feed_forward.w2.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.6.feed_forward.w3.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.6.ffn_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.7.attention.wo.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.7.attention.wqkv.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.7.attention_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.7.feed_forward.w1.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.7.feed_forward.w2.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.7.feed_forward.w3.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.7.ffn_norm.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.8.attention.wo.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.8.attention.wqkv.weight": "model-00001-of-00004.safetensors",
+    "language_model.model.layers.8.attention_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.8.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.8.feed_forward.w2.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.8.feed_forward.w3.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.8.ffn_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.9.attention.wo.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.9.attention.wqkv.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.9.attention_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.9.feed_forward.w1.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.9.feed_forward.w2.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.9.feed_forward.w3.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.layers.9.ffn_norm.weight": "model-00002-of-00004.safetensors",
+    "language_model.model.norm.weight": "model-00004-of-00004.safetensors",
+    "language_model.model.tok_embeddings.weight": "model-00001-of-00004.safetensors",
+    "language_model.output.weight": "model-00004-of-00004.safetensors",
     "mlp1.0.bias": "model-00004-of-00004.safetensors",
     "mlp1.0.weight": "model-00004-of-00004.safetensors",
     "mlp1.1.bias": "model-00004-of-00004.safetensors",