Upload folder using huggingface_hub

Browse files

Files changed (15) hide show

added_tokens.json +0 -0
config.json +33 -0
generation_config.json +7 -0
model-00001-of-00007.safetensors +3 -0
model-00002-of-00007.safetensors +3 -0
model-00003-of-00007.safetensors +3 -0
model-00004-of-00007.safetensors +3 -0
model-00005-of-00007.safetensors +3 -0
model-00006-of-00007.safetensors +3 -0
model-00007-of-00007.safetensors +3 -0
model.safetensors.index.json +235 -0
special_tokens_map.json +38 -0
tokenizer.json +0 -0
tokenizer.model +3 -0
tokenizer_config.json +0 -0

added_tokens.json ADDED Viewed

The diff for this file is too large to render. See raw diff

config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "_name_or_path": "/root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-7b",
+  "architectures": [
+    "InternLM2ForCausalLM"
+  ],
+  "attn_implementation": "eager",
+  "auto_map": {
+    "AutoConfig": "configuration_internlm2.InternLM2Config",
+    "AutoModel": "modeling_internlm2.InternLM2ForCausalLM",
+    "AutoModelForCausalLM": "modeling_internlm2.InternLM2ForCausalLM"
+  },
+  "bias": false,
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 14336,
+  "max_position_embeddings": 32768,
+  "model_type": "internlm2",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "pad_token_id": 2,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 1000000,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float32",
+  "transformers_version": "4.39.3",
+  "use_cache": true,
+  "vocab_size": 100738
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "pad_token_id": 2,
+  "transformers_version": "4.39.3"
+}

model-00001-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bfc97d0d2a251e2fe050142fe6aadf8aeb8752985038d6db05be780a3bfbef73
+size 4905372536

model-00002-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6b93c26e2d9012e885938836b11f3b88ec4b7c7a46f52f3a641604088eac12cc
+size 4999811584

model-00003-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c5bfc1da4669471e03347056743ea641f4d820470026d46d3452a8aab27771d
+size 4999811632

model-00004-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0554941d497d6f44c08418f9b51106699a149330f55e0f4c9e77c897161c2d1f
+size 4832006256

model-00005-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d82a94ab8f4ec5dd3e7f0cd49b8ef6cc5e99238c91693ead08ad2856857317d5
+size 4999811624

model-00006-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a237a934727a7b53647ae6fe09811408c0f823168046f0bc9c26e2b5efc4216f
+size 4832055712

model-00007-of-00007.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d352051fed0404c3c552852b8451a60225a7fc62e22d4db79adb1b9fb89b7138
+size 3166732512

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,235 @@

+{
+  "metadata": {
+    "total_size": 32735576064
+  },
+  "weight_map": {
+    "model.layers.0.attention.wo.weight": "model-00001-of-00007.safetensors",
+    "model.layers.0.attention.wqkv.weight": "model-00001-of-00007.safetensors",
+    "model.layers.0.attention_norm.weight": "model-00001-of-00007.safetensors",
+    "model.layers.0.feed_forward.w1.weight": "model-00001-of-00007.safetensors",
+    "model.layers.0.feed_forward.w2.weight": "model-00001-of-00007.safetensors",
+    "model.layers.0.feed_forward.w3.weight": "model-00001-of-00007.safetensors",
+    "model.layers.0.ffn_norm.weight": "model-00001-of-00007.safetensors",
+    "model.layers.1.attention.wo.weight": "model-00001-of-00007.safetensors",
+    "model.layers.1.attention.wqkv.weight": "model-00001-of-00007.safetensors",
+    "model.layers.1.attention_norm.weight": "model-00001-of-00007.safetensors",
+    "model.layers.1.feed_forward.w1.weight": "model-00001-of-00007.safetensors",
+    "model.layers.1.feed_forward.w2.weight": "model-00001-of-00007.safetensors",
+    "model.layers.1.feed_forward.w3.weight": "model-00001-of-00007.safetensors",
+    "model.layers.1.ffn_norm.weight": "model-00001-of-00007.safetensors",
+    "model.layers.10.attention.wo.weight": "model-00003-of-00007.safetensors",
+    "model.layers.10.attention.wqkv.weight": "model-00003-of-00007.safetensors",
+    "model.layers.10.attention_norm.weight": "model-00003-of-00007.safetensors",
+    "model.layers.10.feed_forward.w1.weight": "model-00003-of-00007.safetensors",
+    "model.layers.10.feed_forward.w2.weight": "model-00003-of-00007.safetensors",
+    "model.layers.10.feed_forward.w3.weight": "model-00003-of-00007.safetensors",
+    "model.layers.10.ffn_norm.weight": "model-00003-of-00007.safetensors",
+    "model.layers.11.attention.wo.weight": "model-00003-of-00007.safetensors",
+    "model.layers.11.attention.wqkv.weight": "model-00003-of-00007.safetensors",
+    "model.layers.11.attention_norm.weight": "model-00003-of-00007.safetensors",
+    "model.layers.11.feed_forward.w1.weight": "model-00003-of-00007.safetensors",
+    "model.layers.11.feed_forward.w2.weight": "model-00003-of-00007.safetensors",
+    "model.layers.11.feed_forward.w3.weight": "model-00003-of-00007.safetensors",
+    "model.layers.11.ffn_norm.weight": "model-00003-of-00007.safetensors",
+    "model.layers.12.attention.wo.weight": "model-00003-of-00007.safetensors",
+    "model.layers.12.attention.wqkv.weight": "model-00003-of-00007.safetensors",
+    "model.layers.12.attention_norm.weight": "model-00003-of-00007.safetensors",
+    "model.layers.12.feed_forward.w1.weight": "model-00003-of-00007.safetensors",
+    "model.layers.12.feed_forward.w2.weight": "model-00003-of-00007.safetensors",
+    "model.layers.12.feed_forward.w3.weight": "model-00003-of-00007.safetensors",
+    "model.layers.12.ffn_norm.weight": "model-00003-of-00007.safetensors",
+    "model.layers.13.attention.wo.weight": "model-00003-of-00007.safetensors",
+    "model.layers.13.attention.wqkv.weight": "model-00003-of-00007.safetensors",
+    "model.layers.13.attention_norm.weight": "model-00003-of-00007.safetensors",
+    "model.layers.13.feed_forward.w1.weight": "model-00003-of-00007.safetensors",
+    "model.layers.13.feed_forward.w2.weight": "model-00003-of-00007.safetensors",
+    "model.layers.13.feed_forward.w3.weight": "model-00003-of-00007.safetensors",
+    "model.layers.13.ffn_norm.weight": "model-00003-of-00007.safetensors",
+    "model.layers.14.attention.wo.weight": "model-00003-of-00007.safetensors",
+    "model.layers.14.attention.wqkv.weight": "model-00003-of-00007.safetensors",
+    "model.layers.14.attention_norm.weight": "model-00003-of-00007.safetensors",
+    "model.layers.14.feed_forward.w1.weight": "model-00003-of-00007.safetensors",
+    "model.layers.14.feed_forward.w2.weight": "model-00003-of-00007.safetensors",
+    "model.layers.14.feed_forward.w3.weight": "model-00003-of-00007.safetensors",
+    "model.layers.14.ffn_norm.weight": "model-00003-of-00007.safetensors",
+    "model.layers.15.attention.wo.weight": "model-00003-of-00007.safetensors",
+    "model.layers.15.attention.wqkv.weight": "model-00003-of-00007.safetensors",
+    "model.layers.15.attention_norm.weight": "model-00004-of-00007.safetensors",
+    "model.layers.15.feed_forward.w1.weight": "model-00004-of-00007.safetensors",
+    "model.layers.15.feed_forward.w2.weight": "model-00004-of-00007.safetensors",
+    "model.layers.15.feed_forward.w3.weight": "model-00004-of-00007.safetensors",
+    "model.layers.15.ffn_norm.weight": "model-00004-of-00007.safetensors",
+    "model.layers.16.attention.wo.weight": "model-00004-of-00007.safetensors",
+    "model.layers.16.attention.wqkv.weight": "model-00004-of-00007.safetensors",
+    "model.layers.16.attention_norm.weight": "model-00004-of-00007.safetensors",
+    "model.layers.16.feed_forward.w1.weight": "model-00004-of-00007.safetensors",
+    "model.layers.16.feed_forward.w2.weight": "model-00004-of-00007.safetensors",
+    "model.layers.16.feed_forward.w3.weight": "model-00004-of-00007.safetensors",
+    "model.layers.16.ffn_norm.weight": "model-00004-of-00007.safetensors",
+    "model.layers.17.attention.wo.weight": "model-00004-of-00007.safetensors",
+    "model.layers.17.attention.wqkv.weight": "model-00004-of-00007.safetensors",
+    "model.layers.17.attention_norm.weight": "model-00004-of-00007.safetensors",
+    "model.layers.17.feed_forward.w1.weight": "model-00004-of-00007.safetensors",
+    "model.layers.17.feed_forward.w2.weight": "model-00004-of-00007.safetensors",
+    "model.layers.17.feed_forward.w3.weight": "model-00004-of-00007.safetensors",
+    "model.layers.17.ffn_norm.weight": "model-00004-of-00007.safetensors",
+    "model.layers.18.attention.wo.weight": "model-00004-of-00007.safetensors",
+    "model.layers.18.attention.wqkv.weight": "model-00004-of-00007.safetensors",
+    "model.layers.18.attention_norm.weight": "model-00004-of-00007.safetensors",
+    "model.layers.18.feed_forward.w1.weight": "model-00004-of-00007.safetensors",
+    "model.layers.18.feed_forward.w2.weight": "model-00004-of-00007.safetensors",
+    "model.layers.18.feed_forward.w3.weight": "model-00004-of-00007.safetensors",
+    "model.layers.18.ffn_norm.weight": "model-00004-of-00007.safetensors",
+    "model.layers.19.attention.wo.weight": "model-00004-of-00007.safetensors",
+    "model.layers.19.attention.wqkv.weight": "model-00004-of-00007.safetensors",
+    "model.layers.19.attention_norm.weight": "model-00004-of-00007.safetensors",
+    "model.layers.19.feed_forward.w1.weight": "model-00004-of-00007.safetensors",
+    "model.layers.19.feed_forward.w2.weight": "model-00004-of-00007.safetensors",
+    "model.layers.19.feed_forward.w3.weight": "model-00004-of-00007.safetensors",
+    "model.layers.19.ffn_norm.weight": "model-00004-of-00007.safetensors",
+    "model.layers.2.attention.wo.weight": "model-00001-of-00007.safetensors",
+    "model.layers.2.attention.wqkv.weight": "model-00001-of-00007.safetensors",
+    "model.layers.2.attention_norm.weight": "model-00001-of-00007.safetensors",
+    "model.layers.2.feed_forward.w1.weight": "model-00001-of-00007.safetensors",
+    "model.layers.2.feed_forward.w2.weight": "model-00001-of-00007.safetensors",
+    "model.layers.2.feed_forward.w3.weight": "model-00001-of-00007.safetensors",
+    "model.layers.2.ffn_norm.weight": "model-00001-of-00007.safetensors",
+    "model.layers.20.attention.wo.weight": "model-00004-of-00007.safetensors",
+    "model.layers.20.attention.wqkv.weight": "model-00004-of-00007.safetensors",
+    "model.layers.20.attention_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.20.feed_forward.w1.weight": "model-00004-of-00007.safetensors",
+    "model.layers.20.feed_forward.w2.weight": "model-00005-of-00007.safetensors",
+    "model.layers.20.feed_forward.w3.weight": "model-00004-of-00007.safetensors",
+    "model.layers.20.ffn_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.21.attention.wo.weight": "model-00005-of-00007.safetensors",
+    "model.layers.21.attention.wqkv.weight": "model-00005-of-00007.safetensors",
+    "model.layers.21.attention_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.21.feed_forward.w1.weight": "model-00005-of-00007.safetensors",
+    "model.layers.21.feed_forward.w2.weight": "model-00005-of-00007.safetensors",
+    "model.layers.21.feed_forward.w3.weight": "model-00005-of-00007.safetensors",
+    "model.layers.21.ffn_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.22.attention.wo.weight": "model-00005-of-00007.safetensors",
+    "model.layers.22.attention.wqkv.weight": "model-00005-of-00007.safetensors",
+    "model.layers.22.attention_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.22.feed_forward.w1.weight": "model-00005-of-00007.safetensors",
+    "model.layers.22.feed_forward.w2.weight": "model-00005-of-00007.safetensors",
+    "model.layers.22.feed_forward.w3.weight": "model-00005-of-00007.safetensors",
+    "model.layers.22.ffn_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.23.attention.wo.weight": "model-00005-of-00007.safetensors",
+    "model.layers.23.attention.wqkv.weight": "model-00005-of-00007.safetensors",
+    "model.layers.23.attention_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.23.feed_forward.w1.weight": "model-00005-of-00007.safetensors",
+    "model.layers.23.feed_forward.w2.weight": "model-00005-of-00007.safetensors",
+    "model.layers.23.feed_forward.w3.weight": "model-00005-of-00007.safetensors",
+    "model.layers.23.ffn_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.24.attention.wo.weight": "model-00005-of-00007.safetensors",
+    "model.layers.24.attention.wqkv.weight": "model-00005-of-00007.safetensors",
+    "model.layers.24.attention_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.24.feed_forward.w1.weight": "model-00005-of-00007.safetensors",
+    "model.layers.24.feed_forward.w2.weight": "model-00005-of-00007.safetensors",
+    "model.layers.24.feed_forward.w3.weight": "model-00005-of-00007.safetensors",
+    "model.layers.24.ffn_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.25.attention.wo.weight": "model-00005-of-00007.safetensors",
+    "model.layers.25.attention.wqkv.weight": "model-00005-of-00007.safetensors",
+    "model.layers.25.attention_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.25.feed_forward.w1.weight": "model-00005-of-00007.safetensors",
+    "model.layers.25.feed_forward.w2.weight": "model-00005-of-00007.safetensors",
+    "model.layers.25.feed_forward.w3.weight": "model-00005-of-00007.safetensors",
+    "model.layers.25.ffn_norm.weight": "model-00005-of-00007.safetensors",
+    "model.layers.26.attention.wo.weight": "model-00005-of-00007.safetensors",
+    "model.layers.26.attention.wqkv.weight": "model-00005-of-00007.safetensors",
+    "model.layers.26.attention_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.26.feed_forward.w1.weight": "model-00005-of-00007.safetensors",
+    "model.layers.26.feed_forward.w2.weight": "model-00006-of-00007.safetensors",
+    "model.layers.26.feed_forward.w3.weight": "model-00006-of-00007.safetensors",
+    "model.layers.26.ffn_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.27.attention.wo.weight": "model-00006-of-00007.safetensors",
+    "model.layers.27.attention.wqkv.weight": "model-00006-of-00007.safetensors",
+    "model.layers.27.attention_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.27.feed_forward.w1.weight": "model-00006-of-00007.safetensors",
+    "model.layers.27.feed_forward.w2.weight": "model-00006-of-00007.safetensors",
+    "model.layers.27.feed_forward.w3.weight": "model-00006-of-00007.safetensors",
+    "model.layers.27.ffn_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.28.attention.wo.weight": "model-00006-of-00007.safetensors",
+    "model.layers.28.attention.wqkv.weight": "model-00006-of-00007.safetensors",
+    "model.layers.28.attention_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.28.feed_forward.w1.weight": "model-00006-of-00007.safetensors",
+    "model.layers.28.feed_forward.w2.weight": "model-00006-of-00007.safetensors",
+    "model.layers.28.feed_forward.w3.weight": "model-00006-of-00007.safetensors",
+    "model.layers.28.ffn_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.29.attention.wo.weight": "model-00006-of-00007.safetensors",
+    "model.layers.29.attention.wqkv.weight": "model-00006-of-00007.safetensors",
+    "model.layers.29.attention_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.29.feed_forward.w1.weight": "model-00006-of-00007.safetensors",
+    "model.layers.29.feed_forward.w2.weight": "model-00006-of-00007.safetensors",
+    "model.layers.29.feed_forward.w3.weight": "model-00006-of-00007.safetensors",
+    "model.layers.29.ffn_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.3.attention.wo.weight": "model-00001-of-00007.safetensors",
+    "model.layers.3.attention.wqkv.weight": "model-00001-of-00007.safetensors",
+    "model.layers.3.attention_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.3.feed_forward.w1.weight": "model-00001-of-00007.safetensors",
+    "model.layers.3.feed_forward.w2.weight": "model-00002-of-00007.safetensors",
+    "model.layers.3.feed_forward.w3.weight": "model-00001-of-00007.safetensors",
+    "model.layers.3.ffn_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.30.attention.wo.weight": "model-00006-of-00007.safetensors",
+    "model.layers.30.attention.wqkv.weight": "model-00006-of-00007.safetensors",
+    "model.layers.30.attention_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.30.feed_forward.w1.weight": "model-00006-of-00007.safetensors",
+    "model.layers.30.feed_forward.w2.weight": "model-00006-of-00007.safetensors",
+    "model.layers.30.feed_forward.w3.weight": "model-00006-of-00007.safetensors",
+    "model.layers.30.ffn_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.31.attention.wo.weight": "model-00006-of-00007.safetensors",
+    "model.layers.31.attention.wqkv.weight": "model-00006-of-00007.safetensors",
+    "model.layers.31.attention_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.31.feed_forward.w1.weight": "model-00006-of-00007.safetensors",
+    "model.layers.31.feed_forward.w2.weight": "model-00006-of-00007.safetensors",
+    "model.layers.31.feed_forward.w3.weight": "model-00006-of-00007.safetensors",
+    "model.layers.31.ffn_norm.weight": "model-00006-of-00007.safetensors",
+    "model.layers.4.attention.wo.weight": "model-00002-of-00007.safetensors",
+    "model.layers.4.attention.wqkv.weight": "model-00002-of-00007.safetensors",
+    "model.layers.4.attention_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.4.feed_forward.w1.weight": "model-00002-of-00007.safetensors",
+    "model.layers.4.feed_forward.w2.weight": "model-00002-of-00007.safetensors",
+    "model.layers.4.feed_forward.w3.weight": "model-00002-of-00007.safetensors",
+    "model.layers.4.ffn_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.5.attention.wo.weight": "model-00002-of-00007.safetensors",
+    "model.layers.5.attention.wqkv.weight": "model-00002-of-00007.safetensors",
+    "model.layers.5.attention_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.5.feed_forward.w1.weight": "model-00002-of-00007.safetensors",
+    "model.layers.5.feed_forward.w2.weight": "model-00002-of-00007.safetensors",
+    "model.layers.5.feed_forward.w3.weight": "model-00002-of-00007.safetensors",
+    "model.layers.5.ffn_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.6.attention.wo.weight": "model-00002-of-00007.safetensors",
+    "model.layers.6.attention.wqkv.weight": "model-00002-of-00007.safetensors",
+    "model.layers.6.attention_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.6.feed_forward.w1.weight": "model-00002-of-00007.safetensors",
+    "model.layers.6.feed_forward.w2.weight": "model-00002-of-00007.safetensors",
+    "model.layers.6.feed_forward.w3.weight": "model-00002-of-00007.safetensors",
+    "model.layers.6.ffn_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.7.attention.wo.weight": "model-00002-of-00007.safetensors",
+    "model.layers.7.attention.wqkv.weight": "model-00002-of-00007.safetensors",
+    "model.layers.7.attention_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.7.feed_forward.w1.weight": "model-00002-of-00007.safetensors",
+    "model.layers.7.feed_forward.w2.weight": "model-00002-of-00007.safetensors",
+    "model.layers.7.feed_forward.w3.weight": "model-00002-of-00007.safetensors",
+    "model.layers.7.ffn_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.8.attention.wo.weight": "model-00002-of-00007.safetensors",
+    "model.layers.8.attention.wqkv.weight": "model-00002-of-00007.safetensors",
+    "model.layers.8.attention_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.8.feed_forward.w1.weight": "model-00002-of-00007.safetensors",
+    "model.layers.8.feed_forward.w2.weight": "model-00002-of-00007.safetensors",
+    "model.layers.8.feed_forward.w3.weight": "model-00002-of-00007.safetensors",
+    "model.layers.8.ffn_norm.weight": "model-00002-of-00007.safetensors",
+    "model.layers.9.attention.wo.weight": "model-00002-of-00007.safetensors",
+    "model.layers.9.attention.wqkv.weight": "model-00002-of-00007.safetensors",
+    "model.layers.9.attention_norm.weight": "model-00003-of-00007.safetensors",
+    "model.layers.9.feed_forward.w1.weight": "model-00002-of-00007.safetensors",
+    "model.layers.9.feed_forward.w2.weight": "model-00003-of-00007.safetensors",
+    "model.layers.9.feed_forward.w3.weight": "model-00003-of-00007.safetensors",
+    "model.layers.9.ffn_norm.weight": "model-00003-of-00007.safetensors",
+    "model.norm.weight": "model-00006-of-00007.safetensors",
+    "model.output.weight": "model-00007-of-00007.safetensors",
+    "model.tok_embeddings.weight": "model-00001-of-00007.safetensors",
+    "output.weight": "model-00007-of-00007.safetensors"
+  }
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "additional_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>",
+    "<|action_start|>",
+    "<|action_end|>",
+    "<|interpreter|>",
+    "<|plugin|>"
+  ],
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f868398fc4e05ee1e8aeba95ddf18ddcc45b8bce55d5093bead5bbf80429b48b
+size 1477754

tokenizer_config.json ADDED Viewed

The diff for this file is too large to render. See raw diff