Adding `safetensors` variant of this model

This is an automated PR created with https://huggingface.co/spaces/safetensors/convert

This new file is equivalent to `pytorch_model.bin` but safe in the sense that
no arbitrary code can be put into it.

These files also happen to load much faster than their pytorch counterpart:
https://colab.research.google.com/github/huggingface/notebooks/blob/main/safetensors_doc/en/speed.ipynb

The widgets on your model page will run using this model even if this is not merged
making sure the file actually works.

If you find any issues: please report here: https://huggingface.co/spaces/safetensors/convert/discussions

Feel free to ignore this PR.

Files changed (15) hide show

model-00001-of-00014.safetensors +3 -0
model-00002-of-00014.safetensors +3 -0
model-00003-of-00014.safetensors +3 -0
model-00004-of-00014.safetensors +3 -0
model-00005-of-00014.safetensors +3 -0
model-00006-of-00014.safetensors +3 -0
model-00007-of-00014.safetensors +3 -0
model-00008-of-00014.safetensors +3 -0
model-00009-of-00014.safetensors +3 -0
model-00010-of-00014.safetensors +3 -0
model-00011-of-00014.safetensors +3 -0
model-00012-of-00014.safetensors +3 -0
model-00013-of-00014.safetensors +3 -0
model-00014-of-00014.safetensors +3 -0
model.safetensors.index.json +652 -0

model-00001-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d20a7506ca376a919aca0e928fee90a9c79a440c2b061366db897bf20d6ab0a1
+size 2004065592

model-00002-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8da680368e0ece859ab110160697801f1e9f0b0617ec89e455e0d7483f700474
+size 1887841792

model-00003-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a2de64f7f7dc011efb06215fd5ec137f0f05a82ebad8d3633f794ff84a7a3be7
+size 1887841792

model-00004-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8e5d3d7e2f6a03788b0dc54c27d33cba18ce578bd3601c5181d4aaa160c5474e
+size 1887841800

model-00005-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2409150ba7ba606fa704bd5340b5d70ebe010bafa9427815f0a4ecd49a6c9f11
+size 1887841840

model-00006-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:af988d49d492e287b9a678051a9dc150eb46eda4c9611d21791b83c4b2ab8594
+size 1887841840

model-00007-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:487d8573049b5eee038149ddf88d2c4ab6d86dec007fccf2972daa3796263f16
+size 1887841840

model-00008-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:43dc2ed682bc01b7fe3cca8ef392e34b2591176e6acefa50b238415d7eff7d3d
+size 1887841840

model-00009-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3d2fc5243c0ccf476f1dcc66d97141cd74b655b136a4ee756a85e7b58dcab239
+size 1887841840

model-00010-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9ec43bbca0dc2fe302c62722af9708e1632ee176317413054af25af6acfa5de
+size 1887841840

model-00011-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:430fb8358939af74afab4cfeecad8456347bca0095cc57f0a9842a4254db4163
+size 1887841840

model-00012-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9699ea75c31010f10244c0e650f477d3c55fdc03016998897a44d18332cda781
+size 1887841840

model-00013-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:090be8bc9f03d2d1fb53da21cb7379b8a16fb38129ff0b2fca861d97afa1c2bc
+size 1887841840

model-00014-of-00014.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e48c8b24e0edecf69552643546199fa3d507629fee3f22883507f9f6aeeba228
+size 1563497080

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,652 @@

+{
+    "metadata": {
+        "total_size": 26221588480
+    },
+    "weight_map": {
+        "lm_head.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.embed_positions.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.embed_tokens.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.final_layer_norm.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.final_layer_norm.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.fc1.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.fc1.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.fc2.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.fc2.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.final_layer_norm.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.final_layer_norm.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.self_attn.k_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.self_attn.k_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.self_attn.out_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.self_attn.out_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.self_attn.q_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.self_attn.q_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.self_attn.v_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.self_attn.v_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.self_attn_layer_norm.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.0.self_attn_layer_norm.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.fc1.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.fc1.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.fc2.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.fc2.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.final_layer_norm.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.final_layer_norm.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.self_attn.k_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.self_attn.k_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.self_attn.out_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.self_attn.out_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.self_attn.q_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.self_attn.q_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.self_attn.v_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.self_attn.v_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.self_attn_layer_norm.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.1.self_attn_layer_norm.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.10.fc1.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.fc1.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.fc2.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.fc2.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.final_layer_norm.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.final_layer_norm.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.self_attn.k_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.self_attn.k_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.self_attn.out_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.self_attn.out_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.self_attn.q_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.self_attn.q_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.self_attn.v_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.self_attn.v_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.self_attn_layer_norm.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.10.self_attn_layer_norm.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.11.fc1.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.11.fc1.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.11.fc2.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.11.fc2.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.11.final_layer_norm.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.11.final_layer_norm.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.11.self_attn.k_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.11.self_attn.k_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.11.self_attn.out_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.11.self_attn.out_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.11.self_attn.q_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.11.self_attn.q_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.11.self_attn.v_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.11.self_attn.v_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.11.self_attn_layer_norm.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.11.self_attn_layer_norm.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.12.fc1.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.fc1.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.fc2.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.fc2.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.final_layer_norm.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.final_layer_norm.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.self_attn.k_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.self_attn.k_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.self_attn.out_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.self_attn.out_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.self_attn.q_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.self_attn.q_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.self_attn.v_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.self_attn.v_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.self_attn_layer_norm.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.12.self_attn_layer_norm.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.fc1.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.fc1.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.fc2.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.fc2.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.final_layer_norm.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.final_layer_norm.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.self_attn.k_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.self_attn.k_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.self_attn.out_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.self_attn.out_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.self_attn.q_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.self_attn.q_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.self_attn.v_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.self_attn.v_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.self_attn_layer_norm.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.13.self_attn_layer_norm.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.14.fc1.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.14.fc1.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.14.fc2.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.14.fc2.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.14.final_layer_norm.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.14.final_layer_norm.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.14.self_attn.k_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.14.self_attn.k_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.14.self_attn.out_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.14.self_attn.out_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.14.self_attn.q_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.14.self_attn.q_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.14.self_attn.v_proj.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.14.self_attn.v_proj.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.14.self_attn_layer_norm.bias": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.14.self_attn_layer_norm.weight": "model-00005-of-00014.safetensors",
+        "model.decoder.layers.15.fc1.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.fc1.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.fc2.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.fc2.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.final_layer_norm.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.final_layer_norm.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.self_attn.k_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.self_attn.k_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.self_attn.out_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.self_attn.out_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.self_attn.q_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.self_attn.q_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.self_attn.v_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.self_attn.v_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.self_attn_layer_norm.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.15.self_attn_layer_norm.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.fc1.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.fc1.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.fc2.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.fc2.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.final_layer_norm.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.final_layer_norm.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.self_attn.k_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.self_attn.k_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.self_attn.out_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.self_attn.out_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.self_attn.q_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.self_attn.q_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.self_attn.v_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.self_attn.v_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.self_attn_layer_norm.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.16.self_attn_layer_norm.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.17.fc1.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.17.fc1.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.17.fc2.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.17.fc2.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.17.final_layer_norm.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.17.final_layer_norm.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.17.self_attn.k_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.17.self_attn.k_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.17.self_attn.out_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.17.self_attn.out_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.17.self_attn.q_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.17.self_attn.q_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.17.self_attn.v_proj.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.17.self_attn.v_proj.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.17.self_attn_layer_norm.bias": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.17.self_attn_layer_norm.weight": "model-00006-of-00014.safetensors",
+        "model.decoder.layers.18.fc1.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.fc1.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.fc2.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.fc2.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.final_layer_norm.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.final_layer_norm.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.self_attn.k_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.self_attn.k_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.self_attn.out_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.self_attn.out_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.self_attn.q_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.self_attn.q_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.self_attn.v_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.self_attn.v_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.self_attn_layer_norm.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.18.self_attn_layer_norm.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.fc1.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.fc1.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.fc2.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.fc2.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.final_layer_norm.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.final_layer_norm.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.self_attn.k_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.self_attn.k_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.self_attn.out_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.self_attn.out_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.self_attn.q_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.self_attn.q_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.self_attn.v_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.self_attn.v_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.self_attn_layer_norm.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.19.self_attn_layer_norm.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.2.fc1.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.2.fc1.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.2.fc2.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.2.fc2.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.2.final_layer_norm.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.2.final_layer_norm.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.2.self_attn.k_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.2.self_attn.k_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.2.self_attn.out_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.2.self_attn.out_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.2.self_attn.q_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.2.self_attn.q_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.2.self_attn.v_proj.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.2.self_attn.v_proj.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.2.self_attn_layer_norm.bias": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.2.self_attn_layer_norm.weight": "model-00001-of-00014.safetensors",
+        "model.decoder.layers.20.fc1.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.20.fc1.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.20.fc2.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.20.fc2.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.20.final_layer_norm.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.20.final_layer_norm.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.20.self_attn.k_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.20.self_attn.k_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.20.self_attn.out_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.20.self_attn.out_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.20.self_attn.q_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.20.self_attn.q_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.20.self_attn.v_proj.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.20.self_attn.v_proj.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.20.self_attn_layer_norm.bias": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.20.self_attn_layer_norm.weight": "model-00007-of-00014.safetensors",
+        "model.decoder.layers.21.fc1.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.fc1.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.fc2.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.fc2.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.final_layer_norm.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.final_layer_norm.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.self_attn.k_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.self_attn.k_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.self_attn.out_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.self_attn.out_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.self_attn.q_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.self_attn.q_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.self_attn.v_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.self_attn.v_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.self_attn_layer_norm.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.21.self_attn_layer_norm.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.fc1.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.fc1.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.fc2.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.fc2.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.final_layer_norm.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.final_layer_norm.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.self_attn.k_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.self_attn.k_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.self_attn.out_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.self_attn.out_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.self_attn.q_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.self_attn.q_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.self_attn.v_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.self_attn.v_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.self_attn_layer_norm.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.22.self_attn_layer_norm.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.23.fc1.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.23.fc1.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.23.fc2.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.23.fc2.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.23.final_layer_norm.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.23.final_layer_norm.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.23.self_attn.k_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.23.self_attn.k_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.23.self_attn.out_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.23.self_attn.out_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.23.self_attn.q_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.23.self_attn.q_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.23.self_attn.v_proj.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.23.self_attn.v_proj.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.23.self_attn_layer_norm.bias": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.23.self_attn_layer_norm.weight": "model-00008-of-00014.safetensors",
+        "model.decoder.layers.24.fc1.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.fc1.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.fc2.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.fc2.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.final_layer_norm.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.final_layer_norm.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.self_attn.k_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.self_attn.k_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.self_attn.out_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.self_attn.out_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.self_attn.q_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.self_attn.q_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.self_attn.v_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.self_attn.v_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.self_attn_layer_norm.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.24.self_attn_layer_norm.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.fc1.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.fc1.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.fc2.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.fc2.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.final_layer_norm.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.final_layer_norm.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.self_attn.k_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.self_attn.k_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.self_attn.out_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.self_attn.out_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.self_attn.q_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.self_attn.q_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.self_attn.v_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.self_attn.v_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.self_attn_layer_norm.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.25.self_attn_layer_norm.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.26.fc1.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.26.fc1.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.26.fc2.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.26.fc2.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.26.final_layer_norm.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.26.final_layer_norm.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.26.self_attn.k_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.26.self_attn.k_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.26.self_attn.out_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.26.self_attn.out_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.26.self_attn.q_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.26.self_attn.q_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.26.self_attn.v_proj.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.26.self_attn.v_proj.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.26.self_attn_layer_norm.bias": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.26.self_attn_layer_norm.weight": "model-00009-of-00014.safetensors",
+        "model.decoder.layers.27.fc1.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.fc1.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.fc2.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.fc2.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.final_layer_norm.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.final_layer_norm.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.self_attn.k_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.self_attn.k_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.self_attn.out_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.self_attn.out_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.self_attn.q_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.self_attn.q_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.self_attn.v_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.self_attn.v_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.self_attn_layer_norm.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.27.self_attn_layer_norm.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.fc1.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.fc1.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.fc2.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.fc2.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.final_layer_norm.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.final_layer_norm.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.self_attn.k_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.self_attn.k_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.self_attn.out_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.self_attn.out_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.self_attn.q_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.self_attn.q_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.self_attn.v_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.self_attn.v_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.self_attn_layer_norm.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.28.self_attn_layer_norm.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.29.fc1.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.29.fc1.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.29.fc2.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.29.fc2.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.29.final_layer_norm.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.29.final_layer_norm.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.29.self_attn.k_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.29.self_attn.k_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.29.self_attn.out_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.29.self_attn.out_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.29.self_attn.q_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.29.self_attn.q_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.29.self_attn.v_proj.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.29.self_attn.v_proj.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.29.self_attn_layer_norm.bias": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.29.self_attn_layer_norm.weight": "model-00010-of-00014.safetensors",
+        "model.decoder.layers.3.fc1.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.fc1.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.fc2.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.fc2.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.final_layer_norm.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.final_layer_norm.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.self_attn.k_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.self_attn.k_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.self_attn.out_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.self_attn.out_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.self_attn.q_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.self_attn.q_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.self_attn.v_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.self_attn.v_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.self_attn_layer_norm.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.3.self_attn_layer_norm.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.30.fc1.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.fc1.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.fc2.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.fc2.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.final_layer_norm.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.final_layer_norm.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.self_attn.k_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.self_attn.k_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.self_attn.out_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.self_attn.out_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.self_attn.q_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.self_attn.q_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.self_attn.v_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.self_attn.v_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.self_attn_layer_norm.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.30.self_attn_layer_norm.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.fc1.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.fc1.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.fc2.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.fc2.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.final_layer_norm.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.final_layer_norm.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.self_attn.k_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.self_attn.k_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.self_attn.out_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.self_attn.out_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.self_attn.q_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.self_attn.q_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.self_attn.v_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.self_attn.v_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.self_attn_layer_norm.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.31.self_attn_layer_norm.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.32.fc1.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.32.fc1.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.32.fc2.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.32.fc2.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.32.final_layer_norm.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.32.final_layer_norm.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.32.self_attn.k_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.32.self_attn.k_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.32.self_attn.out_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.32.self_attn.out_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.32.self_attn.q_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.32.self_attn.q_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.32.self_attn.v_proj.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.32.self_attn.v_proj.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.32.self_attn_layer_norm.bias": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.32.self_attn_layer_norm.weight": "model-00011-of-00014.safetensors",
+        "model.decoder.layers.33.fc1.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.fc1.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.fc2.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.fc2.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.final_layer_norm.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.final_layer_norm.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.self_attn.k_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.self_attn.k_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.self_attn.out_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.self_attn.out_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.self_attn.q_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.self_attn.q_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.self_attn.v_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.self_attn.v_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.self_attn_layer_norm.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.33.self_attn_layer_norm.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.fc1.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.fc1.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.fc2.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.fc2.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.final_layer_norm.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.final_layer_norm.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.self_attn.k_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.self_attn.k_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.self_attn.out_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.self_attn.out_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.self_attn.q_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.self_attn.q_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.self_attn.v_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.self_attn.v_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.self_attn_layer_norm.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.34.self_attn_layer_norm.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.35.fc1.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.35.fc1.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.35.fc2.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.35.fc2.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.35.final_layer_norm.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.35.final_layer_norm.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.35.self_attn.k_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.35.self_attn.k_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.35.self_attn.out_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.35.self_attn.out_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.35.self_attn.q_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.35.self_attn.q_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.35.self_attn.v_proj.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.35.self_attn.v_proj.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.35.self_attn_layer_norm.bias": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.35.self_attn_layer_norm.weight": "model-00012-of-00014.safetensors",
+        "model.decoder.layers.36.fc1.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.fc1.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.fc2.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.fc2.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.final_layer_norm.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.final_layer_norm.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.self_attn.k_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.self_attn.k_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.self_attn.out_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.self_attn.out_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.self_attn.q_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.self_attn.q_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.self_attn.v_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.self_attn.v_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.self_attn_layer_norm.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.36.self_attn_layer_norm.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.fc1.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.fc1.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.fc2.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.fc2.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.final_layer_norm.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.final_layer_norm.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.self_attn.k_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.self_attn.k_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.self_attn.out_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.self_attn.out_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.self_attn.q_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.self_attn.q_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.self_attn.v_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.self_attn.v_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.self_attn_layer_norm.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.37.self_attn_layer_norm.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.38.fc1.bias": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.38.fc1.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.38.fc2.bias": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.38.fc2.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.38.final_layer_norm.bias": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.38.final_layer_norm.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.38.self_attn.k_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.38.self_attn.k_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.38.self_attn.out_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.38.self_attn.out_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.38.self_attn.q_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.38.self_attn.q_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.38.self_attn.v_proj.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.38.self_attn.v_proj.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.38.self_attn_layer_norm.bias": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.38.self_attn_layer_norm.weight": "model-00013-of-00014.safetensors",
+        "model.decoder.layers.39.fc1.bias": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.fc1.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.fc2.bias": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.fc2.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.final_layer_norm.bias": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.final_layer_norm.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.self_attn.k_proj.bias": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.self_attn.k_proj.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.self_attn.out_proj.bias": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.self_attn.out_proj.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.self_attn.q_proj.bias": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.self_attn.q_proj.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.self_attn.v_proj.bias": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.self_attn.v_proj.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.self_attn_layer_norm.bias": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.39.self_attn_layer_norm.weight": "model-00014-of-00014.safetensors",
+        "model.decoder.layers.4.fc1.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.fc1.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.fc2.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.fc2.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.final_layer_norm.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.final_layer_norm.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.self_attn.k_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.self_attn.k_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.self_attn.out_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.self_attn.out_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.self_attn.q_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.self_attn.q_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.self_attn.v_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.self_attn.v_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.self_attn_layer_norm.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.4.self_attn_layer_norm.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.5.fc1.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.5.fc1.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.5.fc2.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.5.fc2.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.5.final_layer_norm.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.5.final_layer_norm.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.5.self_attn.k_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.5.self_attn.k_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.5.self_attn.out_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.5.self_attn.out_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.5.self_attn.q_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.5.self_attn.q_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.5.self_attn.v_proj.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.5.self_attn.v_proj.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.5.self_attn_layer_norm.bias": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.5.self_attn_layer_norm.weight": "model-00002-of-00014.safetensors",
+        "model.decoder.layers.6.fc1.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.fc1.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.fc2.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.fc2.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.final_layer_norm.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.final_layer_norm.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.self_attn.k_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.self_attn.k_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.self_attn.out_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.self_attn.out_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.self_attn.q_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.self_attn.q_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.self_attn.v_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.self_attn.v_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.self_attn_layer_norm.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.6.self_attn_layer_norm.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.fc1.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.fc1.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.fc2.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.fc2.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.final_layer_norm.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.final_layer_norm.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.self_attn.k_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.self_attn.k_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.self_attn.out_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.self_attn.out_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.self_attn.q_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.self_attn.q_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.self_attn.v_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.self_attn.v_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.self_attn_layer_norm.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.7.self_attn_layer_norm.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.8.fc1.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.8.fc1.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.8.fc2.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.8.fc2.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.8.final_layer_norm.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.8.final_layer_norm.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.8.self_attn.k_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.8.self_attn.k_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.8.self_attn.out_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.8.self_attn.out_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.8.self_attn.q_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.8.self_attn.q_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.8.self_attn.v_proj.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.8.self_attn.v_proj.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.8.self_attn_layer_norm.bias": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.8.self_attn_layer_norm.weight": "model-00003-of-00014.safetensors",
+        "model.decoder.layers.9.fc1.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.fc1.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.fc2.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.fc2.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.final_layer_norm.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.final_layer_norm.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.self_attn.k_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.self_attn.k_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.self_attn.out_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.self_attn.out_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.self_attn.q_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.self_attn.q_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.self_attn.v_proj.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.self_attn.v_proj.weight": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.self_attn_layer_norm.bias": "model-00004-of-00014.safetensors",
+        "model.decoder.layers.9.self_attn_layer_norm.weight": "model-00004-of-00014.safetensors"
+    }
+}