MaziyarPanahi commited on Jul 9

Commit

5f3645e

•

1 Parent(s): f984a6a

Upload folder using huggingface_hub (#1)

- 51a0d514645b47fff85c9ab5470b573aa7aedd7c11116dc4f340b7611e7fff0c (d036ec90ec710a9b317a6ffbbe927fd03f0999f4)
- 0178716086d1a3d2dabd6da91a135981cf84ff96d4efc81491035dca19deb123 (6d2f07047a99130bf749cf54ef26dc54631927ab)
- 1c5d446c03bb5f3b0b363695f8424e722071017955fed6c67e7adb3d375afd3a (d75d3f9d808207932db0f329ce5529f60a223f24)
- 8ef4335ff194fe4408439d82aa46bbf22ff4875e59d6efec5a047a1e3238edac (09e27f5463930298857c961d6fbc1194d0438c9c)
- d12b99f48689aca58d64d7042bdfde30da466b76045068f1fd585b6c01b8d08d (845f276f1f8fd1b2b5ff94fc762b40cc548e9439)
- 1ace9ffdc90f4393f28d791f3dc8bf54ab7f34eecc245a0c2342ce2aec20076a (f87cba2135fb86ee6324fb470b388487268c305b)
- 90c1f63bc2dab8a4e0f298bc7dbbfdc507ac52aa4fea3e3a7a718c4c891ec356 (285194d31ee93aeae40c1362fa7b4bf74b1c6172)
- dcec637caf2f44f191e2567ce64c9baf2d6ac11e9d397082769ff39df4fdb2ac (eba3e49e8df180d2ac0cf496d3d15b1251c3d9d2)
- 59053e108a7f0ff8509e443e05e2eaedc8396c50e44f6699e1091796113f7adc (d288f5dbe096f54ae4e4a76467d96afdfcef86a2)
- b347469c50b8637bc6b21e2979526f87c5b733136fc23bb379bbbc3dba69c539 (ee23ab57444d273300a6637a50886da94cc7d7cc)
- 96e04b0fe76b752bee38c6d6b34f487870193acb62bd6dfd0ef2345fa78c8ac7 (c266c021a48b5849716a40053db00e0633eba4a5)
- 973a859cd62cdb1a5b629f13302dd548d977ce1642ff881ab80bfc38ca118b68 (26de910b5f21968c19e763496cb75ed8986907d0)
- 7784ff0f6abddc4bb632dac53000aca58a814a25fb5ddb3d30fc277f65b55e53 (ede72dcd9a2da33d4efd39dae2cf46d092b8ce5d)
- a9900fc6787a7d61178982ed478af258c37f6b53b51d638132c71369e8d474f0 (d497dbb2a72ebf700274dd349e9cf40339f8d3a3)
- fed11ff47a69b674088d69ad3cbf02ad916932cfd48045236441ea2fa5f4aca3 (2070b2a9dad08e9a60d5cfce79cff819bfa7057a)
- 528853586fe541cb7a9cc2b18e9965bb26fae71937321eca0d0968a9a939ee70 (e043947b799ef2a631648f0c753b74d216a4f3f2)
- 6d243064903b4002c981fcde84b2f6c3108390ecbee6effcc8801ea484a06f01 (73b2d48ead415dbfb2b9aeecbe958fcb32a9a8e9)
- a266819ff2eec99c16516a06086d75a4af7e5ca2b486e35ff9f3bcdaae0fab19 (5842c2c5eee1a85a5f59ad8d9aa92851aee938a9)
- 5c24012ca00b2fb744084de58b86d72b64565b064dfc0ba4dc56dff00e8b2b4a (a1840c7f63c23a87aa600f0a7f8fa9498f205f10)
- c2bde6b341e30c8f57ddfa43c5469e7e83cf670357e23fe8090a262d55fe5105 (b0d8c6f6176dcef1e104f81a92fd9b50cf848396)
- bb511ed69e34b7496a102e9b9655a2861206cd4a71c1d1a7876d14391f5c0e1f (6e0f588ac9221154b3d0c21478ebb012594f3a71)
- db247a02b22e899520c44569b1b9fe3265f3fec59b106b39867a36e569fb0ea1 (663aac0ab8f222c12eb2f8759ec80e4268de55cc)
- 7edf34dee4456bfaec66a7a6cbbf9bd4bff9cf731236167b7c41baab51fd160d (cc667ed403d91b9038dfe1b54045d74c35ca3d70)
- 9eada7a38905e733de123022a63c6c6f9efd69fcc3f0c14f212ac6450da00d44 (07dd47e0ff9393f83dc9822ec2bd34ab11e0e62d)
- 93eabc505e3efa3ffd1c5d8304c400dc38d070d29dcd447862581f6a60a3e280 (553124099f770566fde8fa23d7de05db18088afa)
- 0bbc1f916544adf5f759c386edb9a30b19f9777c16b185139d3e247c65ff949f (648a0980428b9ddcc6a9fe0a3416ae755c5b5aab)
- 33b8c89018abf69fe8df28039b5986652577656d6542e969f1b8be47f52ab1fa (a060cd870d343b1a8d39b7df51f16bf5488434db)
- f76bf2ef8c0fd4b8fe466175058f6d8ab8ef4511078ffd1ed563d8e6a8033ac4 (082e9e818c8e9f4878ad290dfe01cb544f77f512)
- 8869c6f8754cb73f9fd9f93bf596b9979f72d593633ede2dcfd4c1b6b693fa46 (7ec3efe4f43858917e37a9e950fe5aba3ae83b9f)
- f4ca48eb243178200861e63b960ab58b0116a5b9ff3095bc253044b0279bc4d3 (c8971a3af9c8d59ad753ddee1700e53c2e14c8eb)
- 6ab86bc2dc833c87ed39a26bda500cbb5c2cba1167eba92d91eae69d70719f36 (9cae6e41b7e0e8c6f77974b83124997138161a44)
- 7c41e8d4bd3e563131f7428e00fa47dd14a889e3c56e36f058a93a693ee60e71 (113fa2931a4f1006442693cd5dc744a0d80b9392)

Files changed (41) hide show

.ipynb_checkpoints/generation_config-checkpoint.json +14 -0
added_tokens.json +5 -0
config.json +27 -0
generation_config.json +14 -0
merges.txt +0 -0
model-00001-of-00031.safetensors +3 -0
model-00002-of-00031.safetensors +3 -0
model-00003-of-00031.safetensors +3 -0
model-00004-of-00031.safetensors +3 -0
model-00005-of-00031.safetensors +3 -0
model-00006-of-00031.safetensors +3 -0
model-00007-of-00031.safetensors +3 -0
model-00008-of-00031.safetensors +3 -0
model-00009-of-00031.safetensors +3 -0
model-00010-of-00031.safetensors +3 -0
model-00011-of-00031.safetensors +3 -0
model-00012-of-00031.safetensors +3 -0
model-00013-of-00031.safetensors +3 -0
model-00014-of-00031.safetensors +3 -0
model-00015-of-00031.safetensors +3 -0
model-00016-of-00031.safetensors +3 -0
model-00017-of-00031.safetensors +3 -0
model-00018-of-00031.safetensors +3 -0
model-00019-of-00031.safetensors +3 -0
model-00020-of-00031.safetensors +3 -0
model-00021-of-00031.safetensors +3 -0
model-00022-of-00031.safetensors +3 -0
model-00023-of-00031.safetensors +3 -0
model-00024-of-00031.safetensors +3 -0
model-00025-of-00031.safetensors +3 -0
model-00026-of-00031.safetensors +3 -0
model-00027-of-00031.safetensors +3 -0
model-00028-of-00031.safetensors +3 -0
model-00029-of-00031.safetensors +3 -0
model-00030-of-00031.safetensors +3 -0
model-00031-of-00031.safetensors +3 -0
model.safetensors.index.json +970 -0
special_tokens_map.json +20 -0
tokenizer.json +0 -0
tokenizer_config.json +43 -0
vocab.json +0 -0

.ipynb_checkpoints/generation_config-checkpoint.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "bos_token_id": 151643,
+  "do_sample": true,
+  "eos_token_id": [
+    151645,
+    151643
+  ],
+  "pad_token_id": 151643,
+  "repetition_penalty": 1.05,
+  "temperature": 0.7,
+  "top_k": 20,
+  "top_p": 0.8,
+  "transformers_version": "4.42.3"
+}

added_tokens.json ADDED Viewed

	@@ -0,0 +1,5 @@

+{
+  "<|endoftext|>": 151643,
+  "<|im_end|>": 151645,
+  "<|im_start|>": 151644
+}

config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "Qwen/Qwen2-72B-Instruct",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "eos_token_id": 151645,
+  "hidden_act": "silu",
+  "hidden_size": 8192,
+  "initializer_range": 0.02,
+  "intermediate_size": 29568,
+  "max_position_embeddings": 32768,
+  "max_window_layers": 80,
+  "model_type": "qwen2",
+  "num_attention_heads": 64,
+  "num_hidden_layers": 80,
+  "num_key_value_heads": 8,
+  "rms_norm_eps": 1e-06,
+  "rope_theta": 1000000.0,
+  "sliding_window": 131072,
+  "tie_word_embeddings": false,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.42.3",
+  "use_cache": false,
+  "use_sliding_window": false,
+  "vocab_size": 152064
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "bos_token_id": 151643,
+  "do_sample": true,
+  "eos_token_id": [
+    151645,
+    151643
+  ],
+  "pad_token_id": 151643,
+  "repetition_penalty": 1.05,
+  "temperature": 0.7,
+  "top_k": 20,
+  "top_p": 0.8,
+  "transformers_version": "4.42.3"
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model-00001-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da1676189a54576ef7cb3133bf82110d9c20f5578bfbdfe554cf85574c9a2487
+size 4548798728

model-00002-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:be9cf4c383e4bff94fa1576438e7fce7420261d1bc83b8bc00eede11e92f7706
+size 4964101384

model-00003-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9b584a3c02bbc38ae633d3e178d5bcc23dd1d74a202642c982e97859dfd11d1
+size 4781637328

model-00004-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d58a88fc38b61bdba069e77e7e9bc895674026e1bbdc619bd17ccdf2e642b9ae
+size 4781670320

model-00005-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d4a3b42f49393a0d9a8b805348c09e527c768b2d48b1d354f7e1f6f8557596b
+size 4781670360

model-00006-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6e108cd6b6856a0edf0b5b2f291def7e80b02aaedf9ae005ba0d7d4855c48195
+size 4964101416

model-00007-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c7ff591d932397ee159438e16ad6e49d16636012a67d12e2b923a5478a5faeba
+size 4781637360

model-00008-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:73184d7d9688ad24ab12d6be999ed2360595086264b263763291063e5afee178
+size 4781670360

model-00009-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0a2d7cb58893758fe3bd96d080941a986c3f411720d38e5be22543d869bddb6f
+size 4781670360

model-00010-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bfad5172da3fc2560cf0992ff659b40cc28ca98c783f9f06ada3f2b15a53762a
+size 4964101416

model-00011-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f27723581b444043c9563e324a56c12fef7ecb317ecbcbeaf5a95cda7ded2b58
+size 4781637360

model-00012-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:488dc888b07f9cb0c171c61c72a791b1429311c18cf3cf167f1a5830ce650cef
+size 4781670360

model-00013-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bbd3d5eb46de8401d9f9fc0cffc9c41636c482b7079902185381939e1a159d21
+size 4781670360

model-00014-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3d48b60cc7f307b07285dcdcf5ee7fb04730174f5b65df421636f67001c4e736
+size 4964101416

model-00015-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4fde56440327f372062ac8e438a60da29ab74a9f5616edd456622a4f0b70e3fe
+size 4781637360

model-00016-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:16aa28cfab18fc8eb3a118916f90ab437fce045156bf5d0f30b515ce11f89d80
+size 4781670360

model-00017-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ee6c50b284c22d8568688fa6e51ab607cc7d951e19013c25dff4b89367159dc
+size 4781670360

model-00018-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e14524c587e8855fbc746371cd4ec38e893040e340bbd2ec51bceee4dbab0fc5
+size 4964101416

model-00019-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f1a7f7bdfcad041766aa22acdb8b85c3821caba39b5c8de6a0467d2cd08c8c50
+size 4781637360

model-00020-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6a9317dfcb11df62f5c523d9e2dab7bb8a1af9b410a16347ad906dcaf3dc44a8
+size 4781670360

model-00021-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b834230665394ada8c3ffe0d3736075556125b511d30dfd2d4fb00ebea9b298a
+size 4781670360

model-00022-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:71f39bce1e9780b6f2213255077cb52c446cd5323f76f8a702b8ee0ff5ca3812
+size 4964101416

model-00023-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bde67aa199b74dc36825f2e2d77123bf69256ad701277eb04090d28fbaebc3ff
+size 4781637360

model-00024-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9d8f1309844f1eed8a7c5b86db1fbf034d7c30d00f6a19e9569265e3a499e66
+size 4781670360

model-00025-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:643abd98af0ae56d180798243d410722044ea98749f991a982ac58911ee29117
+size 4781670360

model-00026-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf69c39ab253f3f8c0d44c16901d2f9b3219b675aab05cbbed7dc1c8f66a212e
+size 4964101416

model-00027-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:33bc7259850b39f093b10e468670592b86dd02a2f9cf1bf2bf7299a5677dd6f4
+size 4781637360

model-00028-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:84c941fb75c0e08d7b708a55d222aa97a066628ba4f4947ec4fb7581ce30ef7d
+size 4781670360

model-00029-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:88354e95045e3bd6ea8ad2a4f32061a58d04dda86f75d0bcc2a259f58068054d
+size 4781670360

model-00030-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b44f057aef3f2d03516bdc93a3040450ee921e8455285ec2da6ddf31f4d5422a
+size 3208747032

model-00031-of-00031.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3f09a8b10be984a06c4d8118f1c0c0370ff97ccec72a584aead0d14639b1683a
+size 2491416704

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,970 @@

+{
+  "metadata": {
+    "total_size": 145412407296
+  },
+  "weight_map": {
+    "lm_head.weight": "model-00031-of-00031.safetensors",
+    "model.embed_tokens.weight": "model-00001-of-00031.safetensors",
+    "model.layers.0.input_layernorm.weight": "model-00001-of-00031.safetensors",
+    "model.layers.0.mlp.down_proj.weight": "model-00001-of-00031.safetensors",
+    "model.layers.0.mlp.gate_proj.weight": "model-00001-of-00031.safetensors",
+    "model.layers.0.mlp.up_proj.weight": "model-00001-of-00031.safetensors",
+    "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00031.safetensors",
+    "model.layers.0.self_attn.k_proj.bias": "model-00001-of-00031.safetensors",
+    "model.layers.0.self_attn.k_proj.weight": "model-00001-of-00031.safetensors",
+    "model.layers.0.self_attn.o_proj.weight": "model-00001-of-00031.safetensors",
+    "model.layers.0.self_attn.q_proj.bias": "model-00001-of-00031.safetensors",
+    "model.layers.0.self_attn.q_proj.weight": "model-00001-of-00031.safetensors",
+    "model.layers.0.self_attn.v_proj.bias": "model-00001-of-00031.safetensors",
+    "model.layers.0.self_attn.v_proj.weight": "model-00001-of-00031.safetensors",
+    "model.layers.1.input_layernorm.weight": "model-00002-of-00031.safetensors",
+    "model.layers.1.mlp.down_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.1.mlp.gate_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.1.mlp.up_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.1.post_attention_layernorm.weight": "model-00002-of-00031.safetensors",
+    "model.layers.1.self_attn.k_proj.bias": "model-00001-of-00031.safetensors",
+    "model.layers.1.self_attn.k_proj.weight": "model-00001-of-00031.safetensors",
+    "model.layers.1.self_attn.o_proj.weight": "model-00001-of-00031.safetensors",
+    "model.layers.1.self_attn.q_proj.bias": "model-00001-of-00031.safetensors",
+    "model.layers.1.self_attn.q_proj.weight": "model-00001-of-00031.safetensors",
+    "model.layers.1.self_attn.v_proj.bias": "model-00001-of-00031.safetensors",
+    "model.layers.1.self_attn.v_proj.weight": "model-00001-of-00031.safetensors",
+    "model.layers.10.input_layernorm.weight": "model-00005-of-00031.safetensors",
+    "model.layers.10.mlp.down_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.10.mlp.gate_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.10.mlp.up_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.10.post_attention_layernorm.weight": "model-00005-of-00031.safetensors",
+    "model.layers.10.self_attn.k_proj.bias": "model-00005-of-00031.safetensors",
+    "model.layers.10.self_attn.k_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.10.self_attn.o_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.10.self_attn.q_proj.bias": "model-00005-of-00031.safetensors",
+    "model.layers.10.self_attn.q_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.10.self_attn.v_proj.bias": "model-00005-of-00031.safetensors",
+    "model.layers.10.self_attn.v_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.11.input_layernorm.weight": "model-00005-of-00031.safetensors",
+    "model.layers.11.mlp.down_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.11.mlp.gate_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.11.mlp.up_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.11.post_attention_layernorm.weight": "model-00005-of-00031.safetensors",
+    "model.layers.11.self_attn.k_proj.bias": "model-00005-of-00031.safetensors",
+    "model.layers.11.self_attn.k_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.11.self_attn.o_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.11.self_attn.q_proj.bias": "model-00005-of-00031.safetensors",
+    "model.layers.11.self_attn.q_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.11.self_attn.v_proj.bias": "model-00005-of-00031.safetensors",
+    "model.layers.11.self_attn.v_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.12.input_layernorm.weight": "model-00006-of-00031.safetensors",
+    "model.layers.12.mlp.down_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.12.mlp.gate_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.12.mlp.up_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.12.post_attention_layernorm.weight": "model-00006-of-00031.safetensors",
+    "model.layers.12.self_attn.k_proj.bias": "model-00005-of-00031.safetensors",
+    "model.layers.12.self_attn.k_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.12.self_attn.o_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.12.self_attn.q_proj.bias": "model-00005-of-00031.safetensors",
+    "model.layers.12.self_attn.q_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.12.self_attn.v_proj.bias": "model-00005-of-00031.safetensors",
+    "model.layers.12.self_attn.v_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.13.input_layernorm.weight": "model-00006-of-00031.safetensors",
+    "model.layers.13.mlp.down_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.13.mlp.gate_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.13.mlp.up_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.13.post_attention_layernorm.weight": "model-00006-of-00031.safetensors",
+    "model.layers.13.self_attn.k_proj.bias": "model-00006-of-00031.safetensors",
+    "model.layers.13.self_attn.k_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.13.self_attn.o_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.13.self_attn.q_proj.bias": "model-00006-of-00031.safetensors",
+    "model.layers.13.self_attn.q_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.13.self_attn.v_proj.bias": "model-00006-of-00031.safetensors",
+    "model.layers.13.self_attn.v_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.14.input_layernorm.weight": "model-00006-of-00031.safetensors",
+    "model.layers.14.mlp.down_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.14.mlp.gate_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.14.mlp.up_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.14.post_attention_layernorm.weight": "model-00006-of-00031.safetensors",
+    "model.layers.14.self_attn.k_proj.bias": "model-00006-of-00031.safetensors",
+    "model.layers.14.self_attn.k_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.14.self_attn.o_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.14.self_attn.q_proj.bias": "model-00006-of-00031.safetensors",
+    "model.layers.14.self_attn.q_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.14.self_attn.v_proj.bias": "model-00006-of-00031.safetensors",
+    "model.layers.14.self_attn.v_proj.weight": "model-00006-of-00031.safetensors",
+    "model.layers.15.input_layernorm.weight": "model-00007-of-00031.safetensors",
+    "model.layers.15.mlp.down_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.15.mlp.gate_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.15.mlp.up_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.15.post_attention_layernorm.weight": "model-00007-of-00031.safetensors",
+    "model.layers.15.self_attn.k_proj.bias": "model-00007-of-00031.safetensors",
+    "model.layers.15.self_attn.k_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.15.self_attn.o_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.15.self_attn.q_proj.bias": "model-00007-of-00031.safetensors",
+    "model.layers.15.self_attn.q_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.15.self_attn.v_proj.bias": "model-00007-of-00031.safetensors",
+    "model.layers.15.self_attn.v_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.16.input_layernorm.weight": "model-00007-of-00031.safetensors",
+    "model.layers.16.mlp.down_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.16.mlp.gate_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.16.mlp.up_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.16.post_attention_layernorm.weight": "model-00007-of-00031.safetensors",
+    "model.layers.16.self_attn.k_proj.bias": "model-00007-of-00031.safetensors",
+    "model.layers.16.self_attn.k_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.16.self_attn.o_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.16.self_attn.q_proj.bias": "model-00007-of-00031.safetensors",
+    "model.layers.16.self_attn.q_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.16.self_attn.v_proj.bias": "model-00007-of-00031.safetensors",
+    "model.layers.16.self_attn.v_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.17.input_layernorm.weight": "model-00008-of-00031.safetensors",
+    "model.layers.17.mlp.down_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.17.mlp.gate_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.17.mlp.up_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.17.post_attention_layernorm.weight": "model-00008-of-00031.safetensors",
+    "model.layers.17.self_attn.k_proj.bias": "model-00007-of-00031.safetensors",
+    "model.layers.17.self_attn.k_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.17.self_attn.o_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.17.self_attn.q_proj.bias": "model-00007-of-00031.safetensors",
+    "model.layers.17.self_attn.q_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.17.self_attn.v_proj.bias": "model-00007-of-00031.safetensors",
+    "model.layers.17.self_attn.v_proj.weight": "model-00007-of-00031.safetensors",
+    "model.layers.18.input_layernorm.weight": "model-00008-of-00031.safetensors",
+    "model.layers.18.mlp.down_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.18.mlp.gate_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.18.mlp.up_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.18.post_attention_layernorm.weight": "model-00008-of-00031.safetensors",
+    "model.layers.18.self_attn.k_proj.bias": "model-00008-of-00031.safetensors",
+    "model.layers.18.self_attn.k_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.18.self_attn.o_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.18.self_attn.q_proj.bias": "model-00008-of-00031.safetensors",
+    "model.layers.18.self_attn.q_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.18.self_attn.v_proj.bias": "model-00008-of-00031.safetensors",
+    "model.layers.18.self_attn.v_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.19.input_layernorm.weight": "model-00008-of-00031.safetensors",
+    "model.layers.19.mlp.down_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.19.mlp.gate_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.19.mlp.up_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.19.post_attention_layernorm.weight": "model-00008-of-00031.safetensors",
+    "model.layers.19.self_attn.k_proj.bias": "model-00008-of-00031.safetensors",
+    "model.layers.19.self_attn.k_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.19.self_attn.o_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.19.self_attn.q_proj.bias": "model-00008-of-00031.safetensors",
+    "model.layers.19.self_attn.q_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.19.self_attn.v_proj.bias": "model-00008-of-00031.safetensors",
+    "model.layers.19.self_attn.v_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.2.input_layernorm.weight": "model-00002-of-00031.safetensors",
+    "model.layers.2.mlp.down_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.2.mlp.gate_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.2.mlp.up_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.2.post_attention_layernorm.weight": "model-00002-of-00031.safetensors",
+    "model.layers.2.self_attn.k_proj.bias": "model-00002-of-00031.safetensors",
+    "model.layers.2.self_attn.k_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.2.self_attn.o_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.2.self_attn.q_proj.bias": "model-00002-of-00031.safetensors",
+    "model.layers.2.self_attn.q_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.2.self_attn.v_proj.bias": "model-00002-of-00031.safetensors",
+    "model.layers.2.self_attn.v_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.20.input_layernorm.weight": "model-00009-of-00031.safetensors",
+    "model.layers.20.mlp.down_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.20.mlp.gate_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.20.mlp.up_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.20.post_attention_layernorm.weight": "model-00009-of-00031.safetensors",
+    "model.layers.20.self_attn.k_proj.bias": "model-00008-of-00031.safetensors",
+    "model.layers.20.self_attn.k_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.20.self_attn.o_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.20.self_attn.q_proj.bias": "model-00008-of-00031.safetensors",
+    "model.layers.20.self_attn.q_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.20.self_attn.v_proj.bias": "model-00008-of-00031.safetensors",
+    "model.layers.20.self_attn.v_proj.weight": "model-00008-of-00031.safetensors",
+    "model.layers.21.input_layernorm.weight": "model-00009-of-00031.safetensors",
+    "model.layers.21.mlp.down_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.21.mlp.gate_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.21.mlp.up_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.21.post_attention_layernorm.weight": "model-00009-of-00031.safetensors",
+    "model.layers.21.self_attn.k_proj.bias": "model-00009-of-00031.safetensors",
+    "model.layers.21.self_attn.k_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.21.self_attn.o_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.21.self_attn.q_proj.bias": "model-00009-of-00031.safetensors",
+    "model.layers.21.self_attn.q_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.21.self_attn.v_proj.bias": "model-00009-of-00031.safetensors",
+    "model.layers.21.self_attn.v_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.22.input_layernorm.weight": "model-00009-of-00031.safetensors",
+    "model.layers.22.mlp.down_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.22.mlp.gate_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.22.mlp.up_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.22.post_attention_layernorm.weight": "model-00009-of-00031.safetensors",
+    "model.layers.22.self_attn.k_proj.bias": "model-00009-of-00031.safetensors",
+    "model.layers.22.self_attn.k_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.22.self_attn.o_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.22.self_attn.q_proj.bias": "model-00009-of-00031.safetensors",
+    "model.layers.22.self_attn.q_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.22.self_attn.v_proj.bias": "model-00009-of-00031.safetensors",
+    "model.layers.22.self_attn.v_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.23.input_layernorm.weight": "model-00010-of-00031.safetensors",
+    "model.layers.23.mlp.down_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.23.mlp.gate_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.23.mlp.up_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.23.post_attention_layernorm.weight": "model-00010-of-00031.safetensors",
+    "model.layers.23.self_attn.k_proj.bias": "model-00009-of-00031.safetensors",
+    "model.layers.23.self_attn.k_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.23.self_attn.o_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.23.self_attn.q_proj.bias": "model-00009-of-00031.safetensors",
+    "model.layers.23.self_attn.q_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.23.self_attn.v_proj.bias": "model-00009-of-00031.safetensors",
+    "model.layers.23.self_attn.v_proj.weight": "model-00009-of-00031.safetensors",
+    "model.layers.24.input_layernorm.weight": "model-00010-of-00031.safetensors",
+    "model.layers.24.mlp.down_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.24.mlp.gate_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.24.mlp.up_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.24.post_attention_layernorm.weight": "model-00010-of-00031.safetensors",
+    "model.layers.24.self_attn.k_proj.bias": "model-00010-of-00031.safetensors",
+    "model.layers.24.self_attn.k_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.24.self_attn.o_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.24.self_attn.q_proj.bias": "model-00010-of-00031.safetensors",
+    "model.layers.24.self_attn.q_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.24.self_attn.v_proj.bias": "model-00010-of-00031.safetensors",
+    "model.layers.24.self_attn.v_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.25.input_layernorm.weight": "model-00010-of-00031.safetensors",
+    "model.layers.25.mlp.down_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.25.mlp.gate_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.25.mlp.up_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.25.post_attention_layernorm.weight": "model-00010-of-00031.safetensors",
+    "model.layers.25.self_attn.k_proj.bias": "model-00010-of-00031.safetensors",
+    "model.layers.25.self_attn.k_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.25.self_attn.o_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.25.self_attn.q_proj.bias": "model-00010-of-00031.safetensors",
+    "model.layers.25.self_attn.q_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.25.self_attn.v_proj.bias": "model-00010-of-00031.safetensors",
+    "model.layers.25.self_attn.v_proj.weight": "model-00010-of-00031.safetensors",
+    "model.layers.26.input_layernorm.weight": "model-00011-of-00031.safetensors",
+    "model.layers.26.mlp.down_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.26.mlp.gate_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.26.mlp.up_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.26.post_attention_layernorm.weight": "model-00011-of-00031.safetensors",
+    "model.layers.26.self_attn.k_proj.bias": "model-00011-of-00031.safetensors",
+    "model.layers.26.self_attn.k_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.26.self_attn.o_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.26.self_attn.q_proj.bias": "model-00011-of-00031.safetensors",
+    "model.layers.26.self_attn.q_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.26.self_attn.v_proj.bias": "model-00011-of-00031.safetensors",
+    "model.layers.26.self_attn.v_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.27.input_layernorm.weight": "model-00011-of-00031.safetensors",
+    "model.layers.27.mlp.down_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.27.mlp.gate_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.27.mlp.up_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.27.post_attention_layernorm.weight": "model-00011-of-00031.safetensors",
+    "model.layers.27.self_attn.k_proj.bias": "model-00011-of-00031.safetensors",
+    "model.layers.27.self_attn.k_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.27.self_attn.o_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.27.self_attn.q_proj.bias": "model-00011-of-00031.safetensors",
+    "model.layers.27.self_attn.q_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.27.self_attn.v_proj.bias": "model-00011-of-00031.safetensors",
+    "model.layers.27.self_attn.v_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.28.input_layernorm.weight": "model-00012-of-00031.safetensors",
+    "model.layers.28.mlp.down_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.28.mlp.gate_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.28.mlp.up_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.28.post_attention_layernorm.weight": "model-00012-of-00031.safetensors",
+    "model.layers.28.self_attn.k_proj.bias": "model-00011-of-00031.safetensors",
+    "model.layers.28.self_attn.k_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.28.self_attn.o_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.28.self_attn.q_proj.bias": "model-00011-of-00031.safetensors",
+    "model.layers.28.self_attn.q_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.28.self_attn.v_proj.bias": "model-00011-of-00031.safetensors",
+    "model.layers.28.self_attn.v_proj.weight": "model-00011-of-00031.safetensors",
+    "model.layers.29.input_layernorm.weight": "model-00012-of-00031.safetensors",
+    "model.layers.29.mlp.down_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.29.mlp.gate_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.29.mlp.up_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.29.post_attention_layernorm.weight": "model-00012-of-00031.safetensors",
+    "model.layers.29.self_attn.k_proj.bias": "model-00012-of-00031.safetensors",
+    "model.layers.29.self_attn.k_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.29.self_attn.o_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.29.self_attn.q_proj.bias": "model-00012-of-00031.safetensors",
+    "model.layers.29.self_attn.q_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.29.self_attn.v_proj.bias": "model-00012-of-00031.safetensors",
+    "model.layers.29.self_attn.v_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.3.input_layernorm.weight": "model-00002-of-00031.safetensors",
+    "model.layers.3.mlp.down_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.3.mlp.gate_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.3.mlp.up_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.3.post_attention_layernorm.weight": "model-00002-of-00031.safetensors",
+    "model.layers.3.self_attn.k_proj.bias": "model-00002-of-00031.safetensors",
+    "model.layers.3.self_attn.k_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.3.self_attn.o_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.3.self_attn.q_proj.bias": "model-00002-of-00031.safetensors",
+    "model.layers.3.self_attn.q_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.3.self_attn.v_proj.bias": "model-00002-of-00031.safetensors",
+    "model.layers.3.self_attn.v_proj.weight": "model-00002-of-00031.safetensors",
+    "model.layers.30.input_layernorm.weight": "model-00012-of-00031.safetensors",
+    "model.layers.30.mlp.down_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.30.mlp.gate_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.30.mlp.up_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.30.post_attention_layernorm.weight": "model-00012-of-00031.safetensors",
+    "model.layers.30.self_attn.k_proj.bias": "model-00012-of-00031.safetensors",
+    "model.layers.30.self_attn.k_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.30.self_attn.o_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.30.self_attn.q_proj.bias": "model-00012-of-00031.safetensors",
+    "model.layers.30.self_attn.q_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.30.self_attn.v_proj.bias": "model-00012-of-00031.safetensors",
+    "model.layers.30.self_attn.v_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.31.input_layernorm.weight": "model-00013-of-00031.safetensors",
+    "model.layers.31.mlp.down_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.31.mlp.gate_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.31.mlp.up_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.31.post_attention_layernorm.weight": "model-00013-of-00031.safetensors",
+    "model.layers.31.self_attn.k_proj.bias": "model-00012-of-00031.safetensors",
+    "model.layers.31.self_attn.k_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.31.self_attn.o_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.31.self_attn.q_proj.bias": "model-00012-of-00031.safetensors",
+    "model.layers.31.self_attn.q_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.31.self_attn.v_proj.bias": "model-00012-of-00031.safetensors",
+    "model.layers.31.self_attn.v_proj.weight": "model-00012-of-00031.safetensors",
+    "model.layers.32.input_layernorm.weight": "model-00013-of-00031.safetensors",
+    "model.layers.32.mlp.down_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.32.mlp.gate_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.32.mlp.up_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.32.post_attention_layernorm.weight": "model-00013-of-00031.safetensors",
+    "model.layers.32.self_attn.k_proj.bias": "model-00013-of-00031.safetensors",
+    "model.layers.32.self_attn.k_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.32.self_attn.o_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.32.self_attn.q_proj.bias": "model-00013-of-00031.safetensors",
+    "model.layers.32.self_attn.q_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.32.self_attn.v_proj.bias": "model-00013-of-00031.safetensors",
+    "model.layers.32.self_attn.v_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.33.input_layernorm.weight": "model-00013-of-00031.safetensors",
+    "model.layers.33.mlp.down_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.33.mlp.gate_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.33.mlp.up_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.33.post_attention_layernorm.weight": "model-00013-of-00031.safetensors",
+    "model.layers.33.self_attn.k_proj.bias": "model-00013-of-00031.safetensors",
+    "model.layers.33.self_attn.k_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.33.self_attn.o_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.33.self_attn.q_proj.bias": "model-00013-of-00031.safetensors",
+    "model.layers.33.self_attn.q_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.33.self_attn.v_proj.bias": "model-00013-of-00031.safetensors",
+    "model.layers.33.self_attn.v_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.34.input_layernorm.weight": "model-00014-of-00031.safetensors",
+    "model.layers.34.mlp.down_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.34.mlp.gate_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.34.mlp.up_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.34.post_attention_layernorm.weight": "model-00014-of-00031.safetensors",
+    "model.layers.34.self_attn.k_proj.bias": "model-00013-of-00031.safetensors",
+    "model.layers.34.self_attn.k_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.34.self_attn.o_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.34.self_attn.q_proj.bias": "model-00013-of-00031.safetensors",
+    "model.layers.34.self_attn.q_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.34.self_attn.v_proj.bias": "model-00013-of-00031.safetensors",
+    "model.layers.34.self_attn.v_proj.weight": "model-00013-of-00031.safetensors",
+    "model.layers.35.input_layernorm.weight": "model-00014-of-00031.safetensors",
+    "model.layers.35.mlp.down_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.35.mlp.gate_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.35.mlp.up_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.35.post_attention_layernorm.weight": "model-00014-of-00031.safetensors",
+    "model.layers.35.self_attn.k_proj.bias": "model-00014-of-00031.safetensors",
+    "model.layers.35.self_attn.k_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.35.self_attn.o_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.35.self_attn.q_proj.bias": "model-00014-of-00031.safetensors",
+    "model.layers.35.self_attn.q_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.35.self_attn.v_proj.bias": "model-00014-of-00031.safetensors",
+    "model.layers.35.self_attn.v_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.36.input_layernorm.weight": "model-00014-of-00031.safetensors",
+    "model.layers.36.mlp.down_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.36.mlp.gate_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.36.mlp.up_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.36.post_attention_layernorm.weight": "model-00014-of-00031.safetensors",
+    "model.layers.36.self_attn.k_proj.bias": "model-00014-of-00031.safetensors",
+    "model.layers.36.self_attn.k_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.36.self_attn.o_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.36.self_attn.q_proj.bias": "model-00014-of-00031.safetensors",
+    "model.layers.36.self_attn.q_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.36.self_attn.v_proj.bias": "model-00014-of-00031.safetensors",
+    "model.layers.36.self_attn.v_proj.weight": "model-00014-of-00031.safetensors",
+    "model.layers.37.input_layernorm.weight": "model-00015-of-00031.safetensors",
+    "model.layers.37.mlp.down_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.37.mlp.gate_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.37.mlp.up_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.37.post_attention_layernorm.weight": "model-00015-of-00031.safetensors",
+    "model.layers.37.self_attn.k_proj.bias": "model-00015-of-00031.safetensors",
+    "model.layers.37.self_attn.k_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.37.self_attn.o_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.37.self_attn.q_proj.bias": "model-00015-of-00031.safetensors",
+    "model.layers.37.self_attn.q_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.37.self_attn.v_proj.bias": "model-00015-of-00031.safetensors",
+    "model.layers.37.self_attn.v_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.38.input_layernorm.weight": "model-00015-of-00031.safetensors",
+    "model.layers.38.mlp.down_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.38.mlp.gate_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.38.mlp.up_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.38.post_attention_layernorm.weight": "model-00015-of-00031.safetensors",
+    "model.layers.38.self_attn.k_proj.bias": "model-00015-of-00031.safetensors",
+    "model.layers.38.self_attn.k_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.38.self_attn.o_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.38.self_attn.q_proj.bias": "model-00015-of-00031.safetensors",
+    "model.layers.38.self_attn.q_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.38.self_attn.v_proj.bias": "model-00015-of-00031.safetensors",
+    "model.layers.38.self_attn.v_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.39.input_layernorm.weight": "model-00016-of-00031.safetensors",
+    "model.layers.39.mlp.down_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.39.mlp.gate_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.39.mlp.up_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.39.post_attention_layernorm.weight": "model-00016-of-00031.safetensors",
+    "model.layers.39.self_attn.k_proj.bias": "model-00015-of-00031.safetensors",
+    "model.layers.39.self_attn.k_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.39.self_attn.o_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.39.self_attn.q_proj.bias": "model-00015-of-00031.safetensors",
+    "model.layers.39.self_attn.q_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.39.self_attn.v_proj.bias": "model-00015-of-00031.safetensors",
+    "model.layers.39.self_attn.v_proj.weight": "model-00015-of-00031.safetensors",
+    "model.layers.4.input_layernorm.weight": "model-00003-of-00031.safetensors",
+    "model.layers.4.mlp.down_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.4.mlp.gate_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.4.mlp.up_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.4.post_attention_layernorm.weight": "model-00003-of-00031.safetensors",
+    "model.layers.4.self_attn.k_proj.bias": "model-00003-of-00031.safetensors",
+    "model.layers.4.self_attn.k_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.4.self_attn.o_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.4.self_attn.q_proj.bias": "model-00003-of-00031.safetensors",
+    "model.layers.4.self_attn.q_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.4.self_attn.v_proj.bias": "model-00003-of-00031.safetensors",
+    "model.layers.4.self_attn.v_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.40.input_layernorm.weight": "model-00016-of-00031.safetensors",
+    "model.layers.40.mlp.down_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.40.mlp.gate_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.40.mlp.up_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.40.post_attention_layernorm.weight": "model-00016-of-00031.safetensors",
+    "model.layers.40.self_attn.k_proj.bias": "model-00016-of-00031.safetensors",
+    "model.layers.40.self_attn.k_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.40.self_attn.o_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.40.self_attn.q_proj.bias": "model-00016-of-00031.safetensors",
+    "model.layers.40.self_attn.q_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.40.self_attn.v_proj.bias": "model-00016-of-00031.safetensors",
+    "model.layers.40.self_attn.v_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.41.input_layernorm.weight": "model-00016-of-00031.safetensors",
+    "model.layers.41.mlp.down_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.41.mlp.gate_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.41.mlp.up_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.41.post_attention_layernorm.weight": "model-00016-of-00031.safetensors",
+    "model.layers.41.self_attn.k_proj.bias": "model-00016-of-00031.safetensors",
+    "model.layers.41.self_attn.k_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.41.self_attn.o_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.41.self_attn.q_proj.bias": "model-00016-of-00031.safetensors",
+    "model.layers.41.self_attn.q_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.41.self_attn.v_proj.bias": "model-00016-of-00031.safetensors",
+    "model.layers.41.self_attn.v_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.42.input_layernorm.weight": "model-00017-of-00031.safetensors",
+    "model.layers.42.mlp.down_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.42.mlp.gate_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.42.mlp.up_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.42.post_attention_layernorm.weight": "model-00017-of-00031.safetensors",
+    "model.layers.42.self_attn.k_proj.bias": "model-00016-of-00031.safetensors",
+    "model.layers.42.self_attn.k_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.42.self_attn.o_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.42.self_attn.q_proj.bias": "model-00016-of-00031.safetensors",
+    "model.layers.42.self_attn.q_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.42.self_attn.v_proj.bias": "model-00016-of-00031.safetensors",
+    "model.layers.42.self_attn.v_proj.weight": "model-00016-of-00031.safetensors",
+    "model.layers.43.input_layernorm.weight": "model-00017-of-00031.safetensors",
+    "model.layers.43.mlp.down_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.43.mlp.gate_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.43.mlp.up_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.43.post_attention_layernorm.weight": "model-00017-of-00031.safetensors",
+    "model.layers.43.self_attn.k_proj.bias": "model-00017-of-00031.safetensors",
+    "model.layers.43.self_attn.k_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.43.self_attn.o_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.43.self_attn.q_proj.bias": "model-00017-of-00031.safetensors",
+    "model.layers.43.self_attn.q_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.43.self_attn.v_proj.bias": "model-00017-of-00031.safetensors",
+    "model.layers.43.self_attn.v_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.44.input_layernorm.weight": "model-00017-of-00031.safetensors",
+    "model.layers.44.mlp.down_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.44.mlp.gate_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.44.mlp.up_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.44.post_attention_layernorm.weight": "model-00017-of-00031.safetensors",
+    "model.layers.44.self_attn.k_proj.bias": "model-00017-of-00031.safetensors",
+    "model.layers.44.self_attn.k_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.44.self_attn.o_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.44.self_attn.q_proj.bias": "model-00017-of-00031.safetensors",
+    "model.layers.44.self_attn.q_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.44.self_attn.v_proj.bias": "model-00017-of-00031.safetensors",
+    "model.layers.44.self_attn.v_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.45.input_layernorm.weight": "model-00018-of-00031.safetensors",
+    "model.layers.45.mlp.down_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.45.mlp.gate_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.45.mlp.up_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.45.post_attention_layernorm.weight": "model-00018-of-00031.safetensors",
+    "model.layers.45.self_attn.k_proj.bias": "model-00017-of-00031.safetensors",
+    "model.layers.45.self_attn.k_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.45.self_attn.o_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.45.self_attn.q_proj.bias": "model-00017-of-00031.safetensors",
+    "model.layers.45.self_attn.q_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.45.self_attn.v_proj.bias": "model-00017-of-00031.safetensors",
+    "model.layers.45.self_attn.v_proj.weight": "model-00017-of-00031.safetensors",
+    "model.layers.46.input_layernorm.weight": "model-00018-of-00031.safetensors",
+    "model.layers.46.mlp.down_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.46.mlp.gate_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.46.mlp.up_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.46.post_attention_layernorm.weight": "model-00018-of-00031.safetensors",
+    "model.layers.46.self_attn.k_proj.bias": "model-00018-of-00031.safetensors",
+    "model.layers.46.self_attn.k_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.46.self_attn.o_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.46.self_attn.q_proj.bias": "model-00018-of-00031.safetensors",
+    "model.layers.46.self_attn.q_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.46.self_attn.v_proj.bias": "model-00018-of-00031.safetensors",
+    "model.layers.46.self_attn.v_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.47.input_layernorm.weight": "model-00018-of-00031.safetensors",
+    "model.layers.47.mlp.down_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.47.mlp.gate_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.47.mlp.up_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.47.post_attention_layernorm.weight": "model-00018-of-00031.safetensors",
+    "model.layers.47.self_attn.k_proj.bias": "model-00018-of-00031.safetensors",
+    "model.layers.47.self_attn.k_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.47.self_attn.o_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.47.self_attn.q_proj.bias": "model-00018-of-00031.safetensors",
+    "model.layers.47.self_attn.q_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.47.self_attn.v_proj.bias": "model-00018-of-00031.safetensors",
+    "model.layers.47.self_attn.v_proj.weight": "model-00018-of-00031.safetensors",
+    "model.layers.48.input_layernorm.weight": "model-00019-of-00031.safetensors",
+    "model.layers.48.mlp.down_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.48.mlp.gate_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.48.mlp.up_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.48.post_attention_layernorm.weight": "model-00019-of-00031.safetensors",
+    "model.layers.48.self_attn.k_proj.bias": "model-00019-of-00031.safetensors",
+    "model.layers.48.self_attn.k_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.48.self_attn.o_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.48.self_attn.q_proj.bias": "model-00019-of-00031.safetensors",
+    "model.layers.48.self_attn.q_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.48.self_attn.v_proj.bias": "model-00019-of-00031.safetensors",
+    "model.layers.48.self_attn.v_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.49.input_layernorm.weight": "model-00019-of-00031.safetensors",
+    "model.layers.49.mlp.down_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.49.mlp.gate_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.49.mlp.up_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.49.post_attention_layernorm.weight": "model-00019-of-00031.safetensors",
+    "model.layers.49.self_attn.k_proj.bias": "model-00019-of-00031.safetensors",
+    "model.layers.49.self_attn.k_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.49.self_attn.o_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.49.self_attn.q_proj.bias": "model-00019-of-00031.safetensors",
+    "model.layers.49.self_attn.q_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.49.self_attn.v_proj.bias": "model-00019-of-00031.safetensors",
+    "model.layers.49.self_attn.v_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.5.input_layernorm.weight": "model-00003-of-00031.safetensors",
+    "model.layers.5.mlp.down_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.5.mlp.gate_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.5.mlp.up_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.5.post_attention_layernorm.weight": "model-00003-of-00031.safetensors",
+    "model.layers.5.self_attn.k_proj.bias": "model-00003-of-00031.safetensors",
+    "model.layers.5.self_attn.k_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.5.self_attn.o_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.5.self_attn.q_proj.bias": "model-00003-of-00031.safetensors",
+    "model.layers.5.self_attn.q_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.5.self_attn.v_proj.bias": "model-00003-of-00031.safetensors",
+    "model.layers.5.self_attn.v_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.50.input_layernorm.weight": "model-00020-of-00031.safetensors",
+    "model.layers.50.mlp.down_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.50.mlp.gate_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.50.mlp.up_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.50.post_attention_layernorm.weight": "model-00020-of-00031.safetensors",
+    "model.layers.50.self_attn.k_proj.bias": "model-00019-of-00031.safetensors",
+    "model.layers.50.self_attn.k_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.50.self_attn.o_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.50.self_attn.q_proj.bias": "model-00019-of-00031.safetensors",
+    "model.layers.50.self_attn.q_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.50.self_attn.v_proj.bias": "model-00019-of-00031.safetensors",
+    "model.layers.50.self_attn.v_proj.weight": "model-00019-of-00031.safetensors",
+    "model.layers.51.input_layernorm.weight": "model-00020-of-00031.safetensors",
+    "model.layers.51.mlp.down_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.51.mlp.gate_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.51.mlp.up_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.51.post_attention_layernorm.weight": "model-00020-of-00031.safetensors",
+    "model.layers.51.self_attn.k_proj.bias": "model-00020-of-00031.safetensors",
+    "model.layers.51.self_attn.k_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.51.self_attn.o_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.51.self_attn.q_proj.bias": "model-00020-of-00031.safetensors",
+    "model.layers.51.self_attn.q_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.51.self_attn.v_proj.bias": "model-00020-of-00031.safetensors",
+    "model.layers.51.self_attn.v_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.52.input_layernorm.weight": "model-00020-of-00031.safetensors",
+    "model.layers.52.mlp.down_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.52.mlp.gate_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.52.mlp.up_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.52.post_attention_layernorm.weight": "model-00020-of-00031.safetensors",
+    "model.layers.52.self_attn.k_proj.bias": "model-00020-of-00031.safetensors",
+    "model.layers.52.self_attn.k_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.52.self_attn.o_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.52.self_attn.q_proj.bias": "model-00020-of-00031.safetensors",
+    "model.layers.52.self_attn.q_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.52.self_attn.v_proj.bias": "model-00020-of-00031.safetensors",
+    "model.layers.52.self_attn.v_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.53.input_layernorm.weight": "model-00021-of-00031.safetensors",
+    "model.layers.53.mlp.down_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.53.mlp.gate_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.53.mlp.up_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.53.post_attention_layernorm.weight": "model-00021-of-00031.safetensors",
+    "model.layers.53.self_attn.k_proj.bias": "model-00020-of-00031.safetensors",
+    "model.layers.53.self_attn.k_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.53.self_attn.o_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.53.self_attn.q_proj.bias": "model-00020-of-00031.safetensors",
+    "model.layers.53.self_attn.q_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.53.self_attn.v_proj.bias": "model-00020-of-00031.safetensors",
+    "model.layers.53.self_attn.v_proj.weight": "model-00020-of-00031.safetensors",
+    "model.layers.54.input_layernorm.weight": "model-00021-of-00031.safetensors",
+    "model.layers.54.mlp.down_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.54.mlp.gate_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.54.mlp.up_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.54.post_attention_layernorm.weight": "model-00021-of-00031.safetensors",
+    "model.layers.54.self_attn.k_proj.bias": "model-00021-of-00031.safetensors",
+    "model.layers.54.self_attn.k_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.54.self_attn.o_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.54.self_attn.q_proj.bias": "model-00021-of-00031.safetensors",
+    "model.layers.54.self_attn.q_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.54.self_attn.v_proj.bias": "model-00021-of-00031.safetensors",
+    "model.layers.54.self_attn.v_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.55.input_layernorm.weight": "model-00021-of-00031.safetensors",
+    "model.layers.55.mlp.down_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.55.mlp.gate_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.55.mlp.up_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.55.post_attention_layernorm.weight": "model-00021-of-00031.safetensors",
+    "model.layers.55.self_attn.k_proj.bias": "model-00021-of-00031.safetensors",
+    "model.layers.55.self_attn.k_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.55.self_attn.o_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.55.self_attn.q_proj.bias": "model-00021-of-00031.safetensors",
+    "model.layers.55.self_attn.q_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.55.self_attn.v_proj.bias": "model-00021-of-00031.safetensors",
+    "model.layers.55.self_attn.v_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.56.input_layernorm.weight": "model-00022-of-00031.safetensors",
+    "model.layers.56.mlp.down_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.56.mlp.gate_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.56.mlp.up_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.56.post_attention_layernorm.weight": "model-00022-of-00031.safetensors",
+    "model.layers.56.self_attn.k_proj.bias": "model-00021-of-00031.safetensors",
+    "model.layers.56.self_attn.k_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.56.self_attn.o_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.56.self_attn.q_proj.bias": "model-00021-of-00031.safetensors",
+    "model.layers.56.self_attn.q_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.56.self_attn.v_proj.bias": "model-00021-of-00031.safetensors",
+    "model.layers.56.self_attn.v_proj.weight": "model-00021-of-00031.safetensors",
+    "model.layers.57.input_layernorm.weight": "model-00022-of-00031.safetensors",
+    "model.layers.57.mlp.down_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.57.mlp.gate_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.57.mlp.up_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.57.post_attention_layernorm.weight": "model-00022-of-00031.safetensors",
+    "model.layers.57.self_attn.k_proj.bias": "model-00022-of-00031.safetensors",
+    "model.layers.57.self_attn.k_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.57.self_attn.o_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.57.self_attn.q_proj.bias": "model-00022-of-00031.safetensors",
+    "model.layers.57.self_attn.q_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.57.self_attn.v_proj.bias": "model-00022-of-00031.safetensors",
+    "model.layers.57.self_attn.v_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.58.input_layernorm.weight": "model-00022-of-00031.safetensors",
+    "model.layers.58.mlp.down_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.58.mlp.gate_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.58.mlp.up_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.58.post_attention_layernorm.weight": "model-00022-of-00031.safetensors",
+    "model.layers.58.self_attn.k_proj.bias": "model-00022-of-00031.safetensors",
+    "model.layers.58.self_attn.k_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.58.self_attn.o_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.58.self_attn.q_proj.bias": "model-00022-of-00031.safetensors",
+    "model.layers.58.self_attn.q_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.58.self_attn.v_proj.bias": "model-00022-of-00031.safetensors",
+    "model.layers.58.self_attn.v_proj.weight": "model-00022-of-00031.safetensors",
+    "model.layers.59.input_layernorm.weight": "model-00023-of-00031.safetensors",
+    "model.layers.59.mlp.down_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.59.mlp.gate_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.59.mlp.up_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.59.post_attention_layernorm.weight": "model-00023-of-00031.safetensors",
+    "model.layers.59.self_attn.k_proj.bias": "model-00023-of-00031.safetensors",
+    "model.layers.59.self_attn.k_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.59.self_attn.o_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.59.self_attn.q_proj.bias": "model-00023-of-00031.safetensors",
+    "model.layers.59.self_attn.q_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.59.self_attn.v_proj.bias": "model-00023-of-00031.safetensors",
+    "model.layers.59.self_attn.v_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.6.input_layernorm.weight": "model-00004-of-00031.safetensors",
+    "model.layers.6.mlp.down_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.6.mlp.gate_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.6.mlp.up_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.6.post_attention_layernorm.weight": "model-00004-of-00031.safetensors",
+    "model.layers.6.self_attn.k_proj.bias": "model-00003-of-00031.safetensors",
+    "model.layers.6.self_attn.k_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.6.self_attn.o_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.6.self_attn.q_proj.bias": "model-00003-of-00031.safetensors",
+    "model.layers.6.self_attn.q_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.6.self_attn.v_proj.bias": "model-00003-of-00031.safetensors",
+    "model.layers.6.self_attn.v_proj.weight": "model-00003-of-00031.safetensors",
+    "model.layers.60.input_layernorm.weight": "model-00023-of-00031.safetensors",
+    "model.layers.60.mlp.down_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.60.mlp.gate_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.60.mlp.up_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.60.post_attention_layernorm.weight": "model-00023-of-00031.safetensors",
+    "model.layers.60.self_attn.k_proj.bias": "model-00023-of-00031.safetensors",
+    "model.layers.60.self_attn.k_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.60.self_attn.o_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.60.self_attn.q_proj.bias": "model-00023-of-00031.safetensors",
+    "model.layers.60.self_attn.q_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.60.self_attn.v_proj.bias": "model-00023-of-00031.safetensors",
+    "model.layers.60.self_attn.v_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.61.input_layernorm.weight": "model-00024-of-00031.safetensors",
+    "model.layers.61.mlp.down_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.61.mlp.gate_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.61.mlp.up_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.61.post_attention_layernorm.weight": "model-00024-of-00031.safetensors",
+    "model.layers.61.self_attn.k_proj.bias": "model-00023-of-00031.safetensors",
+    "model.layers.61.self_attn.k_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.61.self_attn.o_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.61.self_attn.q_proj.bias": "model-00023-of-00031.safetensors",
+    "model.layers.61.self_attn.q_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.61.self_attn.v_proj.bias": "model-00023-of-00031.safetensors",
+    "model.layers.61.self_attn.v_proj.weight": "model-00023-of-00031.safetensors",
+    "model.layers.62.input_layernorm.weight": "model-00024-of-00031.safetensors",
+    "model.layers.62.mlp.down_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.62.mlp.gate_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.62.mlp.up_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.62.post_attention_layernorm.weight": "model-00024-of-00031.safetensors",
+    "model.layers.62.self_attn.k_proj.bias": "model-00024-of-00031.safetensors",
+    "model.layers.62.self_attn.k_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.62.self_attn.o_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.62.self_attn.q_proj.bias": "model-00024-of-00031.safetensors",
+    "model.layers.62.self_attn.q_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.62.self_attn.v_proj.bias": "model-00024-of-00031.safetensors",
+    "model.layers.62.self_attn.v_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.63.input_layernorm.weight": "model-00024-of-00031.safetensors",
+    "model.layers.63.mlp.down_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.63.mlp.gate_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.63.mlp.up_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.63.post_attention_layernorm.weight": "model-00024-of-00031.safetensors",
+    "model.layers.63.self_attn.k_proj.bias": "model-00024-of-00031.safetensors",
+    "model.layers.63.self_attn.k_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.63.self_attn.o_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.63.self_attn.q_proj.bias": "model-00024-of-00031.safetensors",
+    "model.layers.63.self_attn.q_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.63.self_attn.v_proj.bias": "model-00024-of-00031.safetensors",
+    "model.layers.63.self_attn.v_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.64.input_layernorm.weight": "model-00025-of-00031.safetensors",
+    "model.layers.64.mlp.down_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.64.mlp.gate_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.64.mlp.up_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.64.post_attention_layernorm.weight": "model-00025-of-00031.safetensors",
+    "model.layers.64.self_attn.k_proj.bias": "model-00024-of-00031.safetensors",
+    "model.layers.64.self_attn.k_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.64.self_attn.o_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.64.self_attn.q_proj.bias": "model-00024-of-00031.safetensors",
+    "model.layers.64.self_attn.q_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.64.self_attn.v_proj.bias": "model-00024-of-00031.safetensors",
+    "model.layers.64.self_attn.v_proj.weight": "model-00024-of-00031.safetensors",
+    "model.layers.65.input_layernorm.weight": "model-00025-of-00031.safetensors",
+    "model.layers.65.mlp.down_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.65.mlp.gate_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.65.mlp.up_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.65.post_attention_layernorm.weight": "model-00025-of-00031.safetensors",
+    "model.layers.65.self_attn.k_proj.bias": "model-00025-of-00031.safetensors",
+    "model.layers.65.self_attn.k_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.65.self_attn.o_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.65.self_attn.q_proj.bias": "model-00025-of-00031.safetensors",
+    "model.layers.65.self_attn.q_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.65.self_attn.v_proj.bias": "model-00025-of-00031.safetensors",
+    "model.layers.65.self_attn.v_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.66.input_layernorm.weight": "model-00025-of-00031.safetensors",
+    "model.layers.66.mlp.down_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.66.mlp.gate_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.66.mlp.up_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.66.post_attention_layernorm.weight": "model-00025-of-00031.safetensors",
+    "model.layers.66.self_attn.k_proj.bias": "model-00025-of-00031.safetensors",
+    "model.layers.66.self_attn.k_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.66.self_attn.o_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.66.self_attn.q_proj.bias": "model-00025-of-00031.safetensors",
+    "model.layers.66.self_attn.q_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.66.self_attn.v_proj.bias": "model-00025-of-00031.safetensors",
+    "model.layers.66.self_attn.v_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.67.input_layernorm.weight": "model-00026-of-00031.safetensors",
+    "model.layers.67.mlp.down_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.67.mlp.gate_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.67.mlp.up_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.67.post_attention_layernorm.weight": "model-00026-of-00031.safetensors",
+    "model.layers.67.self_attn.k_proj.bias": "model-00025-of-00031.safetensors",
+    "model.layers.67.self_attn.k_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.67.self_attn.o_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.67.self_attn.q_proj.bias": "model-00025-of-00031.safetensors",
+    "model.layers.67.self_attn.q_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.67.self_attn.v_proj.bias": "model-00025-of-00031.safetensors",
+    "model.layers.67.self_attn.v_proj.weight": "model-00025-of-00031.safetensors",
+    "model.layers.68.input_layernorm.weight": "model-00026-of-00031.safetensors",
+    "model.layers.68.mlp.down_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.68.mlp.gate_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.68.mlp.up_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.68.post_attention_layernorm.weight": "model-00026-of-00031.safetensors",
+    "model.layers.68.self_attn.k_proj.bias": "model-00026-of-00031.safetensors",
+    "model.layers.68.self_attn.k_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.68.self_attn.o_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.68.self_attn.q_proj.bias": "model-00026-of-00031.safetensors",
+    "model.layers.68.self_attn.q_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.68.self_attn.v_proj.bias": "model-00026-of-00031.safetensors",
+    "model.layers.68.self_attn.v_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.69.input_layernorm.weight": "model-00026-of-00031.safetensors",
+    "model.layers.69.mlp.down_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.69.mlp.gate_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.69.mlp.up_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.69.post_attention_layernorm.weight": "model-00026-of-00031.safetensors",
+    "model.layers.69.self_attn.k_proj.bias": "model-00026-of-00031.safetensors",
+    "model.layers.69.self_attn.k_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.69.self_attn.o_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.69.self_attn.q_proj.bias": "model-00026-of-00031.safetensors",
+    "model.layers.69.self_attn.q_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.69.self_attn.v_proj.bias": "model-00026-of-00031.safetensors",
+    "model.layers.69.self_attn.v_proj.weight": "model-00026-of-00031.safetensors",
+    "model.layers.7.input_layernorm.weight": "model-00004-of-00031.safetensors",
+    "model.layers.7.mlp.down_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.7.mlp.gate_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.7.mlp.up_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.7.post_attention_layernorm.weight": "model-00004-of-00031.safetensors",
+    "model.layers.7.self_attn.k_proj.bias": "model-00004-of-00031.safetensors",
+    "model.layers.7.self_attn.k_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.7.self_attn.o_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.7.self_attn.q_proj.bias": "model-00004-of-00031.safetensors",
+    "model.layers.7.self_attn.q_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.7.self_attn.v_proj.bias": "model-00004-of-00031.safetensors",
+    "model.layers.7.self_attn.v_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.70.input_layernorm.weight": "model-00027-of-00031.safetensors",
+    "model.layers.70.mlp.down_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.70.mlp.gate_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.70.mlp.up_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.70.post_attention_layernorm.weight": "model-00027-of-00031.safetensors",
+    "model.layers.70.self_attn.k_proj.bias": "model-00027-of-00031.safetensors",
+    "model.layers.70.self_attn.k_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.70.self_attn.o_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.70.self_attn.q_proj.bias": "model-00027-of-00031.safetensors",
+    "model.layers.70.self_attn.q_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.70.self_attn.v_proj.bias": "model-00027-of-00031.safetensors",
+    "model.layers.70.self_attn.v_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.71.input_layernorm.weight": "model-00027-of-00031.safetensors",
+    "model.layers.71.mlp.down_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.71.mlp.gate_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.71.mlp.up_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.71.post_attention_layernorm.weight": "model-00027-of-00031.safetensors",
+    "model.layers.71.self_attn.k_proj.bias": "model-00027-of-00031.safetensors",
+    "model.layers.71.self_attn.k_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.71.self_attn.o_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.71.self_attn.q_proj.bias": "model-00027-of-00031.safetensors",
+    "model.layers.71.self_attn.q_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.71.self_attn.v_proj.bias": "model-00027-of-00031.safetensors",
+    "model.layers.71.self_attn.v_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.72.input_layernorm.weight": "model-00028-of-00031.safetensors",
+    "model.layers.72.mlp.down_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.72.mlp.gate_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.72.mlp.up_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.72.post_attention_layernorm.weight": "model-00028-of-00031.safetensors",
+    "model.layers.72.self_attn.k_proj.bias": "model-00027-of-00031.safetensors",
+    "model.layers.72.self_attn.k_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.72.self_attn.o_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.72.self_attn.q_proj.bias": "model-00027-of-00031.safetensors",
+    "model.layers.72.self_attn.q_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.72.self_attn.v_proj.bias": "model-00027-of-00031.safetensors",
+    "model.layers.72.self_attn.v_proj.weight": "model-00027-of-00031.safetensors",
+    "model.layers.73.input_layernorm.weight": "model-00028-of-00031.safetensors",
+    "model.layers.73.mlp.down_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.73.mlp.gate_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.73.mlp.up_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.73.post_attention_layernorm.weight": "model-00028-of-00031.safetensors",
+    "model.layers.73.self_attn.k_proj.bias": "model-00028-of-00031.safetensors",
+    "model.layers.73.self_attn.k_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.73.self_attn.o_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.73.self_attn.q_proj.bias": "model-00028-of-00031.safetensors",
+    "model.layers.73.self_attn.q_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.73.self_attn.v_proj.bias": "model-00028-of-00031.safetensors",
+    "model.layers.73.self_attn.v_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.74.input_layernorm.weight": "model-00028-of-00031.safetensors",
+    "model.layers.74.mlp.down_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.74.mlp.gate_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.74.mlp.up_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.74.post_attention_layernorm.weight": "model-00028-of-00031.safetensors",
+    "model.layers.74.self_attn.k_proj.bias": "model-00028-of-00031.safetensors",
+    "model.layers.74.self_attn.k_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.74.self_attn.o_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.74.self_attn.q_proj.bias": "model-00028-of-00031.safetensors",
+    "model.layers.74.self_attn.q_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.74.self_attn.v_proj.bias": "model-00028-of-00031.safetensors",
+    "model.layers.74.self_attn.v_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.75.input_layernorm.weight": "model-00029-of-00031.safetensors",
+    "model.layers.75.mlp.down_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.75.mlp.gate_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.75.mlp.up_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.75.post_attention_layernorm.weight": "model-00029-of-00031.safetensors",
+    "model.layers.75.self_attn.k_proj.bias": "model-00028-of-00031.safetensors",
+    "model.layers.75.self_attn.k_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.75.self_attn.o_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.75.self_attn.q_proj.bias": "model-00028-of-00031.safetensors",
+    "model.layers.75.self_attn.q_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.75.self_attn.v_proj.bias": "model-00028-of-00031.safetensors",
+    "model.layers.75.self_attn.v_proj.weight": "model-00028-of-00031.safetensors",
+    "model.layers.76.input_layernorm.weight": "model-00029-of-00031.safetensors",
+    "model.layers.76.mlp.down_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.76.mlp.gate_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.76.mlp.up_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.76.post_attention_layernorm.weight": "model-00029-of-00031.safetensors",
+    "model.layers.76.self_attn.k_proj.bias": "model-00029-of-00031.safetensors",
+    "model.layers.76.self_attn.k_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.76.self_attn.o_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.76.self_attn.q_proj.bias": "model-00029-of-00031.safetensors",
+    "model.layers.76.self_attn.q_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.76.self_attn.v_proj.bias": "model-00029-of-00031.safetensors",
+    "model.layers.76.self_attn.v_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.77.input_layernorm.weight": "model-00029-of-00031.safetensors",
+    "model.layers.77.mlp.down_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.77.mlp.gate_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.77.mlp.up_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.77.post_attention_layernorm.weight": "model-00029-of-00031.safetensors",
+    "model.layers.77.self_attn.k_proj.bias": "model-00029-of-00031.safetensors",
+    "model.layers.77.self_attn.k_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.77.self_attn.o_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.77.self_attn.q_proj.bias": "model-00029-of-00031.safetensors",
+    "model.layers.77.self_attn.q_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.77.self_attn.v_proj.bias": "model-00029-of-00031.safetensors",
+    "model.layers.77.self_attn.v_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.78.input_layernorm.weight": "model-00030-of-00031.safetensors",
+    "model.layers.78.mlp.down_proj.weight": "model-00030-of-00031.safetensors",
+    "model.layers.78.mlp.gate_proj.weight": "model-00030-of-00031.safetensors",
+    "model.layers.78.mlp.up_proj.weight": "model-00030-of-00031.safetensors",
+    "model.layers.78.post_attention_layernorm.weight": "model-00030-of-00031.safetensors",
+    "model.layers.78.self_attn.k_proj.bias": "model-00029-of-00031.safetensors",
+    "model.layers.78.self_attn.k_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.78.self_attn.o_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.78.self_attn.q_proj.bias": "model-00029-of-00031.safetensors",
+    "model.layers.78.self_attn.q_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.78.self_attn.v_proj.bias": "model-00029-of-00031.safetensors",
+    "model.layers.78.self_attn.v_proj.weight": "model-00029-of-00031.safetensors",
+    "model.layers.79.input_layernorm.weight": "model-00030-of-00031.safetensors",
+    "model.layers.79.mlp.down_proj.weight": "model-00030-of-00031.safetensors",
+    "model.layers.79.mlp.gate_proj.weight": "model-00030-of-00031.safetensors",
+    "model.layers.79.mlp.up_proj.weight": "model-00030-of-00031.safetensors",
+    "model.layers.79.post_attention_layernorm.weight": "model-00030-of-00031.safetensors",
+    "model.layers.79.self_attn.k_proj.bias": "model-00030-of-00031.safetensors",
+    "model.layers.79.self_attn.k_proj.weight": "model-00030-of-00031.safetensors",
+    "model.layers.79.self_attn.o_proj.weight": "model-00030-of-00031.safetensors",
+    "model.layers.79.self_attn.q_proj.bias": "model-00030-of-00031.safetensors",
+    "model.layers.79.self_attn.q_proj.weight": "model-00030-of-00031.safetensors",
+    "model.layers.79.self_attn.v_proj.bias": "model-00030-of-00031.safetensors",
+    "model.layers.79.self_attn.v_proj.weight": "model-00030-of-00031.safetensors",
+    "model.layers.8.input_layernorm.weight": "model-00004-of-00031.safetensors",
+    "model.layers.8.mlp.down_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.8.mlp.gate_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.8.mlp.up_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.8.post_attention_layernorm.weight": "model-00004-of-00031.safetensors",
+    "model.layers.8.self_attn.k_proj.bias": "model-00004-of-00031.safetensors",
+    "model.layers.8.self_attn.k_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.8.self_attn.o_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.8.self_attn.q_proj.bias": "model-00004-of-00031.safetensors",
+    "model.layers.8.self_attn.q_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.8.self_attn.v_proj.bias": "model-00004-of-00031.safetensors",
+    "model.layers.8.self_attn.v_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.9.input_layernorm.weight": "model-00005-of-00031.safetensors",
+    "model.layers.9.mlp.down_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.9.mlp.gate_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.9.mlp.up_proj.weight": "model-00005-of-00031.safetensors",
+    "model.layers.9.post_attention_layernorm.weight": "model-00005-of-00031.safetensors",
+    "model.layers.9.self_attn.k_proj.bias": "model-00004-of-00031.safetensors",
+    "model.layers.9.self_attn.k_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.9.self_attn.o_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.9.self_attn.q_proj.bias": "model-00004-of-00031.safetensors",
+    "model.layers.9.self_attn.q_proj.weight": "model-00004-of-00031.safetensors",
+    "model.layers.9.self_attn.v_proj.bias": "model-00004-of-00031.safetensors",
+    "model.layers.9.self_attn.v_proj.weight": "model-00004-of-00031.safetensors",
+    "model.norm.weight": "model-00030-of-00031.safetensors"
+  }
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,20 @@

+{
+  "additional_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>"
+  ],
+  "eos_token": {
+    "content": "<|im_end|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "151643": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151644": {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151645": {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>"
+  ],
+  "bos_token": null,
+  "chat_template": "{% if not add_generation_prompt is defined %}{% set add_generation_prompt = false %}{% endif %}{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|im_end|>",
+  "errors": "replace",
+  "model_max_length": 131072,
+  "pad_token": "<|endoftext|>",
+  "split_special_tokens": false,
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff