qianguo sun commited on Jun 7, 2023

Commit

e2fe3c4

1 Parent(s): 8bd2731

ziya-v1.1模型参数

Files changed (35) hide show

added_tokens.json +4 -0
config.json +23 -0
generation_config.json +7 -0
pytorch_model-00001-of-00028.bin +3 -0
pytorch_model-00002-of-00028.bin +3 -0
pytorch_model-00003-of-00028.bin +3 -0
pytorch_model-00004-of-00028.bin +3 -0
pytorch_model-00005-of-00028.bin +3 -0
pytorch_model-00006-of-00028.bin +3 -0
pytorch_model-00007-of-00028.bin +3 -0
pytorch_model-00008-of-00028.bin +3 -0
pytorch_model-00009-of-00028.bin +3 -0
pytorch_model-00010-of-00028.bin +3 -0
pytorch_model-00011-of-00028.bin +3 -0
pytorch_model-00012-of-00028.bin +3 -0
pytorch_model-00013-of-00028.bin +3 -0
pytorch_model-00014-of-00028.bin +3 -0
pytorch_model-00015-of-00028.bin +3 -0
pytorch_model-00016-of-00028.bin +3 -0
pytorch_model-00017-of-00028.bin +3 -0
pytorch_model-00018-of-00028.bin +3 -0
pytorch_model-00019-of-00028.bin +3 -0
pytorch_model-00020-of-00028.bin +3 -0
pytorch_model-00021-of-00028.bin +3 -0
pytorch_model-00022-of-00028.bin +3 -0
pytorch_model-00023-of-00028.bin +3 -0
pytorch_model-00024-of-00028.bin +3 -0
pytorch_model-00025-of-00028.bin +3 -0
pytorch_model-00026-of-00028.bin +3 -0
pytorch_model-00027-of-00028.bin +3 -0
pytorch_model-00028-of-00028.bin +3 -0
pytorch_model.bin.index.json +410 -0
special_tokens_map.json +27 -0
tokenizer.model +3 -0
tokenizer_config.json +33 -0

added_tokens.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "<bot>": 39409,
+  "<human>": 39408
+}

config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "_name_or_path": "/cognitive_comp/wanghao/models/llama_sft/llama_13B_v2_S2.2_S3_S3.1_rlhf_0601_RM13B0525_step44_hf/",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "hidden_act": "silu",
+  "hidden_size": 5120,
+  "initializer_range": 0.02,
+  "intermediate_size": 13824,
+  "max_position_embeddings": 2048,
+  "model_type": "llama",
+  "num_attention_heads": 40,
+  "num_hidden_layers": 40,
+  "pad_token_id": 0,
+  "rms_norm_eps": 1e-06,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.29.0.dev0",
+  "use_cache": true,
+  "vocab_size": 39424
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "pad_token_id": 0,
+  "transformers_version": "4.29.0.dev0"
+}

pytorch_model-00001-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d78d35589e250bad91b6987da35ac7f7f27d6e994cb2ebc737e6d57404e3237
+size 896534991

pytorch_model-00002-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e1ba40369183bf4564504d273d5c1714fad5ae32f9c9244446fcc7152975fa8
+size 985707823

pytorch_model-00003-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c138ad796ecbedf85b644ae7d9f4f4bd938ec464ef97f3c568bc284da8920b09
+size 917528001

pytorch_model-00004-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:54dcfca44f9ac0bfda7bfc2e25c9826c6881186ac18a3d2cc7996512628362c1
+size 985707823

pytorch_model-00005-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b553a8f0bbb5ae4834f1007e76a325319078a00827a5a256c063a0bd0ca442fc
+size 917528001

pytorch_model-00006-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bf0d535f65041b80696c374f948a8861cd6b561f6d471b7cb9b2b506f284a653
+size 985707823

pytorch_model-00007-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f5e8eb0ec9b9f3a65c35c87ccad214a1855287d0e9f1e405aaa7eaed55a073aa
+size 917528001

pytorch_model-00008-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8514efe195a7918cbca0e3273a85aaccb9cfe427bc9bc499a7436510846f9d5d
+size 985707823

pytorch_model-00009-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:efcfb0ed11534724b4c1ace92afad27f54f7ed434a1a5b930d8145d18fe74abd
+size 917528001

pytorch_model-00010-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6b8b4cdf6cb8953ea14aa922b7ded60211cfb1d4b0b0e9fefaf8f99e15c52298
+size 985707823

pytorch_model-00011-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24536b6511a11a24647a9e186b2b10cf9d9e5c281854204d9cb22dcec71685aa
+size 917528001

pytorch_model-00012-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:57f574a3f0467714fe292c05bdf3f5f1bab6921a3704647fcb8ae25950bcc2af
+size 985707823

pytorch_model-00013-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:41757aaf8aea91ab203d3d79e058ab31ea64b6d5deeed7264f413128db8a56d9
+size 917528001

pytorch_model-00014-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cd9a0d17f9fe75c18664abc74dd58166e7e32a39dd50d1e0231331f825e0aa43
+size 985707823

pytorch_model-00015-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a54a244d00c03e631a0dfa5301acd38e07ab59f654874ad10fbaee282ecae3b9
+size 917528001

pytorch_model-00016-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e4acf0d9320e5da2ffdbae1a045c32006933e4d14be9b7bcfae3da74c8c2e0f9
+size 985707823

pytorch_model-00017-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:804dae5572173db7ffb6e81f8875fe904174c5c46492293c554c689284be6743
+size 917528001

pytorch_model-00018-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:83c9429d501250508e587ce194e877e476a0c3674f9e1b769207d214ab42caf7
+size 985707823

pytorch_model-00019-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8c56aa1a50e7f35e46016b9500d737b1998bd1dd1f393e2e6a97cc1cd2e172c0
+size 917528001

pytorch_model-00020-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7b3894faa56d2f01862a3b6ed2722845720b35a026a2ebc1526d3bd8d7fd78b
+size 985707823

pytorch_model-00021-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3a69b190c3901db14e7856129ab6900220009e81cf068ed2d486ade4c9a906ff
+size 917528001

pytorch_model-00022-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6b9cefca3b3a7155e0a7ffe04e6c07d29c4e7a5cc16c81439c845de6c978dbed
+size 985707823

pytorch_model-00023-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9f96de3d3e2f0ddafef3899d7cb8672fc6086050e7b042acb7fa4165ac232ce8
+size 917528001

pytorch_model-00024-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9d1b573351e66777bae369d2d7e422c72d69c7ed70cf894e31990f8bebdbc3e6
+size 985707823

pytorch_model-00025-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5ab910abbff94003ea8c32628dbc184529401af6367fc937735df0e221ddf258
+size 917528001

pytorch_model-00026-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:086ae2fa7cc13f16ea25003d5df693a2f262af4ea8101b0adb77bd9fe3fa2964
+size 985707823

pytorch_model-00027-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:64f1e07dd86cc7f944bb4e1c26c9db60e3caa3a3e15c3a385c0b9e43b78446e2
+size 917528001

pytorch_model-00028-of-00028.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4fd11030c08cc0426293de186109d908efd9c5297fcb83053d12db1a20cba314
+size 545291867

pytorch_model.bin.index.json ADDED Viewed

	@@ -0,0 +1,410 @@

+{
+  "metadata": {
+    "total_size": 26183777280
+  },
+  "weight_map": {
+    "lm_head.weight": "pytorch_model-00028-of-00028.bin",
+    "model.embed_tokens.weight": "pytorch_model-00001-of-00028.bin",
+    "model.layers.0.input_layernorm.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.0.mlp.down_proj.weight": "pytorch_model-00001-of-00028.bin",
+    "model.layers.0.mlp.gate_proj.weight": "pytorch_model-00001-of-00028.bin",
+    "model.layers.0.mlp.up_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.0.post_attention_layernorm.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.0.self_attn.k_proj.weight": "pytorch_model-00001-of-00028.bin",
+    "model.layers.0.self_attn.o_proj.weight": "pytorch_model-00001-of-00028.bin",
+    "model.layers.0.self_attn.q_proj.weight": "pytorch_model-00001-of-00028.bin",
+    "model.layers.0.self_attn.rotary_emb.inv_freq": "pytorch_model-00001-of-00028.bin",
+    "model.layers.0.self_attn.v_proj.weight": "pytorch_model-00001-of-00028.bin",
+    "model.layers.1.input_layernorm.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.1.mlp.down_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.1.mlp.gate_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.1.mlp.up_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.1.post_attention_layernorm.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.1.self_attn.k_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.1.self_attn.o_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.1.self_attn.q_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.1.self_attn.rotary_emb.inv_freq": "pytorch_model-00002-of-00028.bin",
+    "model.layers.1.self_attn.v_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.10.input_layernorm.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.10.mlp.down_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.10.mlp.gate_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.10.mlp.up_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.10.post_attention_layernorm.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.10.self_attn.k_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.10.self_attn.o_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.10.self_attn.q_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.10.self_attn.rotary_emb.inv_freq": "pytorch_model-00008-of-00028.bin",
+    "model.layers.10.self_attn.v_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.11.input_layernorm.weight": "pytorch_model-00009-of-00028.bin",
+    "model.layers.11.mlp.down_proj.weight": "pytorch_model-00009-of-00028.bin",
+    "model.layers.11.mlp.gate_proj.weight": "pytorch_model-00009-of-00028.bin",
+    "model.layers.11.mlp.up_proj.weight": "pytorch_model-00009-of-00028.bin",
+    "model.layers.11.post_attention_layernorm.weight": "pytorch_model-00009-of-00028.bin",
+    "model.layers.11.self_attn.k_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.11.self_attn.o_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.11.self_attn.q_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.11.self_attn.rotary_emb.inv_freq": "pytorch_model-00008-of-00028.bin",
+    "model.layers.11.self_attn.v_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.12.input_layernorm.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.12.mlp.down_proj.weight": "pytorch_model-00009-of-00028.bin",
+    "model.layers.12.mlp.gate_proj.weight": "pytorch_model-00009-of-00028.bin",
+    "model.layers.12.mlp.up_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.12.post_attention_layernorm.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.12.self_attn.k_proj.weight": "pytorch_model-00009-of-00028.bin",
+    "model.layers.12.self_attn.o_proj.weight": "pytorch_model-00009-of-00028.bin",
+    "model.layers.12.self_attn.q_proj.weight": "pytorch_model-00009-of-00028.bin",
+    "model.layers.12.self_attn.rotary_emb.inv_freq": "pytorch_model-00009-of-00028.bin",
+    "model.layers.12.self_attn.v_proj.weight": "pytorch_model-00009-of-00028.bin",
+    "model.layers.13.input_layernorm.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.13.mlp.down_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.13.mlp.gate_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.13.mlp.up_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.13.post_attention_layernorm.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.13.self_attn.k_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.13.self_attn.o_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.13.self_attn.q_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.13.self_attn.rotary_emb.inv_freq": "pytorch_model-00010-of-00028.bin",
+    "model.layers.13.self_attn.v_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.14.input_layernorm.weight": "pytorch_model-00011-of-00028.bin",
+    "model.layers.14.mlp.down_proj.weight": "pytorch_model-00011-of-00028.bin",
+    "model.layers.14.mlp.gate_proj.weight": "pytorch_model-00011-of-00028.bin",
+    "model.layers.14.mlp.up_proj.weight": "pytorch_model-00011-of-00028.bin",
+    "model.layers.14.post_attention_layernorm.weight": "pytorch_model-00011-of-00028.bin",
+    "model.layers.14.self_attn.k_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.14.self_attn.o_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.14.self_attn.q_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.14.self_attn.rotary_emb.inv_freq": "pytorch_model-00010-of-00028.bin",
+    "model.layers.14.self_attn.v_proj.weight": "pytorch_model-00010-of-00028.bin",
+    "model.layers.15.input_layernorm.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.15.mlp.down_proj.weight": "pytorch_model-00011-of-00028.bin",
+    "model.layers.15.mlp.gate_proj.weight": "pytorch_model-00011-of-00028.bin",
+    "model.layers.15.mlp.up_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.15.post_attention_layernorm.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.15.self_attn.k_proj.weight": "pytorch_model-00011-of-00028.bin",
+    "model.layers.15.self_attn.o_proj.weight": "pytorch_model-00011-of-00028.bin",
+    "model.layers.15.self_attn.q_proj.weight": "pytorch_model-00011-of-00028.bin",
+    "model.layers.15.self_attn.rotary_emb.inv_freq": "pytorch_model-00011-of-00028.bin",
+    "model.layers.15.self_attn.v_proj.weight": "pytorch_model-00011-of-00028.bin",
+    "model.layers.16.input_layernorm.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.16.mlp.down_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.16.mlp.gate_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.16.mlp.up_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.16.post_attention_layernorm.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.16.self_attn.k_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.16.self_attn.o_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.16.self_attn.q_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.16.self_attn.rotary_emb.inv_freq": "pytorch_model-00012-of-00028.bin",
+    "model.layers.16.self_attn.v_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.17.input_layernorm.weight": "pytorch_model-00013-of-00028.bin",
+    "model.layers.17.mlp.down_proj.weight": "pytorch_model-00013-of-00028.bin",
+    "model.layers.17.mlp.gate_proj.weight": "pytorch_model-00013-of-00028.bin",
+    "model.layers.17.mlp.up_proj.weight": "pytorch_model-00013-of-00028.bin",
+    "model.layers.17.post_attention_layernorm.weight": "pytorch_model-00013-of-00028.bin",
+    "model.layers.17.self_attn.k_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.17.self_attn.o_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.17.self_attn.q_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.17.self_attn.rotary_emb.inv_freq": "pytorch_model-00012-of-00028.bin",
+    "model.layers.17.self_attn.v_proj.weight": "pytorch_model-00012-of-00028.bin",
+    "model.layers.18.input_layernorm.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.18.mlp.down_proj.weight": "pytorch_model-00013-of-00028.bin",
+    "model.layers.18.mlp.gate_proj.weight": "pytorch_model-00013-of-00028.bin",
+    "model.layers.18.mlp.up_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.18.post_attention_layernorm.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.18.self_attn.k_proj.weight": "pytorch_model-00013-of-00028.bin",
+    "model.layers.18.self_attn.o_proj.weight": "pytorch_model-00013-of-00028.bin",
+    "model.layers.18.self_attn.q_proj.weight": "pytorch_model-00013-of-00028.bin",
+    "model.layers.18.self_attn.rotary_emb.inv_freq": "pytorch_model-00013-of-00028.bin",
+    "model.layers.18.self_attn.v_proj.weight": "pytorch_model-00013-of-00028.bin",
+    "model.layers.19.input_layernorm.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.19.mlp.down_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.19.mlp.gate_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.19.mlp.up_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.19.post_attention_layernorm.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.19.self_attn.k_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.19.self_attn.o_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.19.self_attn.q_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.19.self_attn.rotary_emb.inv_freq": "pytorch_model-00014-of-00028.bin",
+    "model.layers.19.self_attn.v_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.2.input_layernorm.weight": "pytorch_model-00003-of-00028.bin",
+    "model.layers.2.mlp.down_proj.weight": "pytorch_model-00003-of-00028.bin",
+    "model.layers.2.mlp.gate_proj.weight": "pytorch_model-00003-of-00028.bin",
+    "model.layers.2.mlp.up_proj.weight": "pytorch_model-00003-of-00028.bin",
+    "model.layers.2.post_attention_layernorm.weight": "pytorch_model-00003-of-00028.bin",
+    "model.layers.2.self_attn.k_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.2.self_attn.o_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.2.self_attn.q_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.2.self_attn.rotary_emb.inv_freq": "pytorch_model-00002-of-00028.bin",
+    "model.layers.2.self_attn.v_proj.weight": "pytorch_model-00002-of-00028.bin",
+    "model.layers.20.input_layernorm.weight": "pytorch_model-00015-of-00028.bin",
+    "model.layers.20.mlp.down_proj.weight": "pytorch_model-00015-of-00028.bin",
+    "model.layers.20.mlp.gate_proj.weight": "pytorch_model-00015-of-00028.bin",
+    "model.layers.20.mlp.up_proj.weight": "pytorch_model-00015-of-00028.bin",
+    "model.layers.20.post_attention_layernorm.weight": "pytorch_model-00015-of-00028.bin",
+    "model.layers.20.self_attn.k_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.20.self_attn.o_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.20.self_attn.q_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.20.self_attn.rotary_emb.inv_freq": "pytorch_model-00014-of-00028.bin",
+    "model.layers.20.self_attn.v_proj.weight": "pytorch_model-00014-of-00028.bin",
+    "model.layers.21.input_layernorm.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.21.mlp.down_proj.weight": "pytorch_model-00015-of-00028.bin",
+    "model.layers.21.mlp.gate_proj.weight": "pytorch_model-00015-of-00028.bin",
+    "model.layers.21.mlp.up_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.21.post_attention_layernorm.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.21.self_attn.k_proj.weight": "pytorch_model-00015-of-00028.bin",
+    "model.layers.21.self_attn.o_proj.weight": "pytorch_model-00015-of-00028.bin",
+    "model.layers.21.self_attn.q_proj.weight": "pytorch_model-00015-of-00028.bin",
+    "model.layers.21.self_attn.rotary_emb.inv_freq": "pytorch_model-00015-of-00028.bin",
+    "model.layers.21.self_attn.v_proj.weight": "pytorch_model-00015-of-00028.bin",
+    "model.layers.22.input_layernorm.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.22.mlp.down_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.22.mlp.gate_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.22.mlp.up_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.22.post_attention_layernorm.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.22.self_attn.k_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.22.self_attn.o_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.22.self_attn.q_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.22.self_attn.rotary_emb.inv_freq": "pytorch_model-00016-of-00028.bin",
+    "model.layers.22.self_attn.v_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.23.input_layernorm.weight": "pytorch_model-00017-of-00028.bin",
+    "model.layers.23.mlp.down_proj.weight": "pytorch_model-00017-of-00028.bin",
+    "model.layers.23.mlp.gate_proj.weight": "pytorch_model-00017-of-00028.bin",
+    "model.layers.23.mlp.up_proj.weight": "pytorch_model-00017-of-00028.bin",
+    "model.layers.23.post_attention_layernorm.weight": "pytorch_model-00017-of-00028.bin",
+    "model.layers.23.self_attn.k_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.23.self_attn.o_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.23.self_attn.q_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.23.self_attn.rotary_emb.inv_freq": "pytorch_model-00016-of-00028.bin",
+    "model.layers.23.self_attn.v_proj.weight": "pytorch_model-00016-of-00028.bin",
+    "model.layers.24.input_layernorm.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.24.mlp.down_proj.weight": "pytorch_model-00017-of-00028.bin",
+    "model.layers.24.mlp.gate_proj.weight": "pytorch_model-00017-of-00028.bin",
+    "model.layers.24.mlp.up_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.24.post_attention_layernorm.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.24.self_attn.k_proj.weight": "pytorch_model-00017-of-00028.bin",
+    "model.layers.24.self_attn.o_proj.weight": "pytorch_model-00017-of-00028.bin",
+    "model.layers.24.self_attn.q_proj.weight": "pytorch_model-00017-of-00028.bin",
+    "model.layers.24.self_attn.rotary_emb.inv_freq": "pytorch_model-00017-of-00028.bin",
+    "model.layers.24.self_attn.v_proj.weight": "pytorch_model-00017-of-00028.bin",
+    "model.layers.25.input_layernorm.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.25.mlp.down_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.25.mlp.gate_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.25.mlp.up_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.25.post_attention_layernorm.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.25.self_attn.k_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.25.self_attn.o_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.25.self_attn.q_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.25.self_attn.rotary_emb.inv_freq": "pytorch_model-00018-of-00028.bin",
+    "model.layers.25.self_attn.v_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.26.input_layernorm.weight": "pytorch_model-00019-of-00028.bin",
+    "model.layers.26.mlp.down_proj.weight": "pytorch_model-00019-of-00028.bin",
+    "model.layers.26.mlp.gate_proj.weight": "pytorch_model-00019-of-00028.bin",
+    "model.layers.26.mlp.up_proj.weight": "pytorch_model-00019-of-00028.bin",
+    "model.layers.26.post_attention_layernorm.weight": "pytorch_model-00019-of-00028.bin",
+    "model.layers.26.self_attn.k_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.26.self_attn.o_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.26.self_attn.q_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.26.self_attn.rotary_emb.inv_freq": "pytorch_model-00018-of-00028.bin",
+    "model.layers.26.self_attn.v_proj.weight": "pytorch_model-00018-of-00028.bin",
+    "model.layers.27.input_layernorm.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.27.mlp.down_proj.weight": "pytorch_model-00019-of-00028.bin",
+    "model.layers.27.mlp.gate_proj.weight": "pytorch_model-00019-of-00028.bin",
+    "model.layers.27.mlp.up_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.27.post_attention_layernorm.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.27.self_attn.k_proj.weight": "pytorch_model-00019-of-00028.bin",
+    "model.layers.27.self_attn.o_proj.weight": "pytorch_model-00019-of-00028.bin",
+    "model.layers.27.self_attn.q_proj.weight": "pytorch_model-00019-of-00028.bin",
+    "model.layers.27.self_attn.rotary_emb.inv_freq": "pytorch_model-00019-of-00028.bin",
+    "model.layers.27.self_attn.v_proj.weight": "pytorch_model-00019-of-00028.bin",
+    "model.layers.28.input_layernorm.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.28.mlp.down_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.28.mlp.gate_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.28.mlp.up_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.28.post_attention_layernorm.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.28.self_attn.k_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.28.self_attn.o_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.28.self_attn.q_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.28.self_attn.rotary_emb.inv_freq": "pytorch_model-00020-of-00028.bin",
+    "model.layers.28.self_attn.v_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.29.input_layernorm.weight": "pytorch_model-00021-of-00028.bin",
+    "model.layers.29.mlp.down_proj.weight": "pytorch_model-00021-of-00028.bin",
+    "model.layers.29.mlp.gate_proj.weight": "pytorch_model-00021-of-00028.bin",
+    "model.layers.29.mlp.up_proj.weight": "pytorch_model-00021-of-00028.bin",
+    "model.layers.29.post_attention_layernorm.weight": "pytorch_model-00021-of-00028.bin",
+    "model.layers.29.self_attn.k_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.29.self_attn.o_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.29.self_attn.q_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.29.self_attn.rotary_emb.inv_freq": "pytorch_model-00020-of-00028.bin",
+    "model.layers.29.self_attn.v_proj.weight": "pytorch_model-00020-of-00028.bin",
+    "model.layers.3.input_layernorm.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.3.mlp.down_proj.weight": "pytorch_model-00003-of-00028.bin",
+    "model.layers.3.mlp.gate_proj.weight": "pytorch_model-00003-of-00028.bin",
+    "model.layers.3.mlp.up_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.3.post_attention_layernorm.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.3.self_attn.k_proj.weight": "pytorch_model-00003-of-00028.bin",
+    "model.layers.3.self_attn.o_proj.weight": "pytorch_model-00003-of-00028.bin",
+    "model.layers.3.self_attn.q_proj.weight": "pytorch_model-00003-of-00028.bin",
+    "model.layers.3.self_attn.rotary_emb.inv_freq": "pytorch_model-00003-of-00028.bin",
+    "model.layers.3.self_attn.v_proj.weight": "pytorch_model-00003-of-00028.bin",
+    "model.layers.30.input_layernorm.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.30.mlp.down_proj.weight": "pytorch_model-00021-of-00028.bin",
+    "model.layers.30.mlp.gate_proj.weight": "pytorch_model-00021-of-00028.bin",
+    "model.layers.30.mlp.up_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.30.post_attention_layernorm.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.30.self_attn.k_proj.weight": "pytorch_model-00021-of-00028.bin",
+    "model.layers.30.self_attn.o_proj.weight": "pytorch_model-00021-of-00028.bin",
+    "model.layers.30.self_attn.q_proj.weight": "pytorch_model-00021-of-00028.bin",
+    "model.layers.30.self_attn.rotary_emb.inv_freq": "pytorch_model-00021-of-00028.bin",
+    "model.layers.30.self_attn.v_proj.weight": "pytorch_model-00021-of-00028.bin",
+    "model.layers.31.input_layernorm.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.31.mlp.down_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.31.mlp.gate_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.31.mlp.up_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.31.post_attention_layernorm.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.31.self_attn.k_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.31.self_attn.o_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.31.self_attn.q_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.31.self_attn.rotary_emb.inv_freq": "pytorch_model-00022-of-00028.bin",
+    "model.layers.31.self_attn.v_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.32.input_layernorm.weight": "pytorch_model-00023-of-00028.bin",
+    "model.layers.32.mlp.down_proj.weight": "pytorch_model-00023-of-00028.bin",
+    "model.layers.32.mlp.gate_proj.weight": "pytorch_model-00023-of-00028.bin",
+    "model.layers.32.mlp.up_proj.weight": "pytorch_model-00023-of-00028.bin",
+    "model.layers.32.post_attention_layernorm.weight": "pytorch_model-00023-of-00028.bin",
+    "model.layers.32.self_attn.k_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.32.self_attn.o_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.32.self_attn.q_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.32.self_attn.rotary_emb.inv_freq": "pytorch_model-00022-of-00028.bin",
+    "model.layers.32.self_attn.v_proj.weight": "pytorch_model-00022-of-00028.bin",
+    "model.layers.33.input_layernorm.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.33.mlp.down_proj.weight": "pytorch_model-00023-of-00028.bin",
+    "model.layers.33.mlp.gate_proj.weight": "pytorch_model-00023-of-00028.bin",
+    "model.layers.33.mlp.up_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.33.post_attention_layernorm.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.33.self_attn.k_proj.weight": "pytorch_model-00023-of-00028.bin",
+    "model.layers.33.self_attn.o_proj.weight": "pytorch_model-00023-of-00028.bin",
+    "model.layers.33.self_attn.q_proj.weight": "pytorch_model-00023-of-00028.bin",
+    "model.layers.33.self_attn.rotary_emb.inv_freq": "pytorch_model-00023-of-00028.bin",
+    "model.layers.33.self_attn.v_proj.weight": "pytorch_model-00023-of-00028.bin",
+    "model.layers.34.input_layernorm.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.34.mlp.down_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.34.mlp.gate_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.34.mlp.up_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.34.post_attention_layernorm.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.34.self_attn.k_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.34.self_attn.o_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.34.self_attn.q_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.34.self_attn.rotary_emb.inv_freq": "pytorch_model-00024-of-00028.bin",
+    "model.layers.34.self_attn.v_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.35.input_layernorm.weight": "pytorch_model-00025-of-00028.bin",
+    "model.layers.35.mlp.down_proj.weight": "pytorch_model-00025-of-00028.bin",
+    "model.layers.35.mlp.gate_proj.weight": "pytorch_model-00025-of-00028.bin",
+    "model.layers.35.mlp.up_proj.weight": "pytorch_model-00025-of-00028.bin",
+    "model.layers.35.post_attention_layernorm.weight": "pytorch_model-00025-of-00028.bin",
+    "model.layers.35.self_attn.k_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.35.self_attn.o_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.35.self_attn.q_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.35.self_attn.rotary_emb.inv_freq": "pytorch_model-00024-of-00028.bin",
+    "model.layers.35.self_attn.v_proj.weight": "pytorch_model-00024-of-00028.bin",
+    "model.layers.36.input_layernorm.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.36.mlp.down_proj.weight": "pytorch_model-00025-of-00028.bin",
+    "model.layers.36.mlp.gate_proj.weight": "pytorch_model-00025-of-00028.bin",
+    "model.layers.36.mlp.up_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.36.post_attention_layernorm.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.36.self_attn.k_proj.weight": "pytorch_model-00025-of-00028.bin",
+    "model.layers.36.self_attn.o_proj.weight": "pytorch_model-00025-of-00028.bin",
+    "model.layers.36.self_attn.q_proj.weight": "pytorch_model-00025-of-00028.bin",
+    "model.layers.36.self_attn.rotary_emb.inv_freq": "pytorch_model-00025-of-00028.bin",
+    "model.layers.36.self_attn.v_proj.weight": "pytorch_model-00025-of-00028.bin",
+    "model.layers.37.input_layernorm.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.37.mlp.down_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.37.mlp.gate_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.37.mlp.up_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.37.post_attention_layernorm.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.37.self_attn.k_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.37.self_attn.o_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.37.self_attn.q_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.37.self_attn.rotary_emb.inv_freq": "pytorch_model-00026-of-00028.bin",
+    "model.layers.37.self_attn.v_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.38.input_layernorm.weight": "pytorch_model-00027-of-00028.bin",
+    "model.layers.38.mlp.down_proj.weight": "pytorch_model-00027-of-00028.bin",
+    "model.layers.38.mlp.gate_proj.weight": "pytorch_model-00027-of-00028.bin",
+    "model.layers.38.mlp.up_proj.weight": "pytorch_model-00027-of-00028.bin",
+    "model.layers.38.post_attention_layernorm.weight": "pytorch_model-00027-of-00028.bin",
+    "model.layers.38.self_attn.k_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.38.self_attn.o_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.38.self_attn.q_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.38.self_attn.rotary_emb.inv_freq": "pytorch_model-00026-of-00028.bin",
+    "model.layers.38.self_attn.v_proj.weight": "pytorch_model-00026-of-00028.bin",
+    "model.layers.39.input_layernorm.weight": "pytorch_model-00028-of-00028.bin",
+    "model.layers.39.mlp.down_proj.weight": "pytorch_model-00027-of-00028.bin",
+    "model.layers.39.mlp.gate_proj.weight": "pytorch_model-00027-of-00028.bin",
+    "model.layers.39.mlp.up_proj.weight": "pytorch_model-00028-of-00028.bin",
+    "model.layers.39.post_attention_layernorm.weight": "pytorch_model-00028-of-00028.bin",
+    "model.layers.39.self_attn.k_proj.weight": "pytorch_model-00027-of-00028.bin",
+    "model.layers.39.self_attn.o_proj.weight": "pytorch_model-00027-of-00028.bin",
+    "model.layers.39.self_attn.q_proj.weight": "pytorch_model-00027-of-00028.bin",
+    "model.layers.39.self_attn.rotary_emb.inv_freq": "pytorch_model-00027-of-00028.bin",
+    "model.layers.39.self_attn.v_proj.weight": "pytorch_model-00027-of-00028.bin",
+    "model.layers.4.input_layernorm.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.4.mlp.down_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.4.mlp.gate_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.4.mlp.up_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.4.post_attention_layernorm.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.4.self_attn.k_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.4.self_attn.o_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.4.self_attn.q_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.4.self_attn.rotary_emb.inv_freq": "pytorch_model-00004-of-00028.bin",
+    "model.layers.4.self_attn.v_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.5.input_layernorm.weight": "pytorch_model-00005-of-00028.bin",
+    "model.layers.5.mlp.down_proj.weight": "pytorch_model-00005-of-00028.bin",
+    "model.layers.5.mlp.gate_proj.weight": "pytorch_model-00005-of-00028.bin",
+    "model.layers.5.mlp.up_proj.weight": "pytorch_model-00005-of-00028.bin",
+    "model.layers.5.post_attention_layernorm.weight": "pytorch_model-00005-of-00028.bin",
+    "model.layers.5.self_attn.k_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.5.self_attn.o_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.5.self_attn.q_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.5.self_attn.rotary_emb.inv_freq": "pytorch_model-00004-of-00028.bin",
+    "model.layers.5.self_attn.v_proj.weight": "pytorch_model-00004-of-00028.bin",
+    "model.layers.6.input_layernorm.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.6.mlp.down_proj.weight": "pytorch_model-00005-of-00028.bin",
+    "model.layers.6.mlp.gate_proj.weight": "pytorch_model-00005-of-00028.bin",
+    "model.layers.6.mlp.up_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.6.post_attention_layernorm.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.6.self_attn.k_proj.weight": "pytorch_model-00005-of-00028.bin",
+    "model.layers.6.self_attn.o_proj.weight": "pytorch_model-00005-of-00028.bin",
+    "model.layers.6.self_attn.q_proj.weight": "pytorch_model-00005-of-00028.bin",
+    "model.layers.6.self_attn.rotary_emb.inv_freq": "pytorch_model-00005-of-00028.bin",
+    "model.layers.6.self_attn.v_proj.weight": "pytorch_model-00005-of-00028.bin",
+    "model.layers.7.input_layernorm.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.7.mlp.down_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.7.mlp.gate_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.7.mlp.up_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.7.post_attention_layernorm.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.7.self_attn.k_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.7.self_attn.o_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.7.self_attn.q_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.7.self_attn.rotary_emb.inv_freq": "pytorch_model-00006-of-00028.bin",
+    "model.layers.7.self_attn.v_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.8.input_layernorm.weight": "pytorch_model-00007-of-00028.bin",
+    "model.layers.8.mlp.down_proj.weight": "pytorch_model-00007-of-00028.bin",
+    "model.layers.8.mlp.gate_proj.weight": "pytorch_model-00007-of-00028.bin",
+    "model.layers.8.mlp.up_proj.weight": "pytorch_model-00007-of-00028.bin",
+    "model.layers.8.post_attention_layernorm.weight": "pytorch_model-00007-of-00028.bin",
+    "model.layers.8.self_attn.k_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.8.self_attn.o_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.8.self_attn.q_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.8.self_attn.rotary_emb.inv_freq": "pytorch_model-00006-of-00028.bin",
+    "model.layers.8.self_attn.v_proj.weight": "pytorch_model-00006-of-00028.bin",
+    "model.layers.9.input_layernorm.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.9.mlp.down_proj.weight": "pytorch_model-00007-of-00028.bin",
+    "model.layers.9.mlp.gate_proj.weight": "pytorch_model-00007-of-00028.bin",
+    "model.layers.9.mlp.up_proj.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.9.post_attention_layernorm.weight": "pytorch_model-00008-of-00028.bin",
+    "model.layers.9.self_attn.k_proj.weight": "pytorch_model-00007-of-00028.bin",
+    "model.layers.9.self_attn.o_proj.weight": "pytorch_model-00007-of-00028.bin",
+    "model.layers.9.self_attn.q_proj.weight": "pytorch_model-00007-of-00028.bin",
+    "model.layers.9.self_attn.rotary_emb.inv_freq": "pytorch_model-00007-of-00028.bin",
+    "model.layers.9.self_attn.v_proj.weight": "pytorch_model-00007-of-00028.bin",
+    "model.norm.weight": "pytorch_model-00028-of-00028.bin"
+  }
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "additional_special_tokens": [
+    "<human>",
+    "<bot>"
+  ],
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6fd7e445833dd0889206aba242c2a51ecbae2437fd328d1759a35475fd8c0423
+size 588619

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "add_bos_token": true,
+  "add_eos_token": false,
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "clean_up_tokenization_spaces": false,
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": null,
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}