Upload folder using huggingface_hub

Browse files

Files changed (14) hide show

config.json +46 -46
model-00001-of-00012.safetensors +2 -2
model-00002-of-00012.safetensors +2 -2
model-00003-of-00012.safetensors +2 -2
model-00004-of-00012.safetensors +2 -2
model-00005-of-00012.safetensors +2 -2
model-00006-of-00012.safetensors +2 -2
model-00007-of-00012.safetensors +2 -2
model-00008-of-00012.safetensors +2 -2
model-00009-of-00012.safetensors +2 -2
model-00010-of-00012.safetensors +2 -2
model-00011-of-00012.safetensors +2 -2
model-00012-of-00012.safetensors +2 -2
model.safetensors.index.json +0 -0

config.json CHANGED Viewed

@@ -24,65 +24,65 @@
   "num_key_value_heads": 4,
   "output_router_logits": false,
   "quantization_config": {
-    "activation_scheme": "dynamic",
     "ignored_layers": [
-      "model.layers.9.mlp.shared_expert_gate",
       "model.layers.23.mlp.gate",
       "model.layers.27.mlp.shared_expert_gate",
-      "model.layers.17.mlp.gate",
-      "model.layers.4.mlp.shared_expert_gate",
-      "model.layers.15.mlp.gate",
       "model.layers.19.mlp.gate",
       "model.layers.18.mlp.gate",
-      "model.layers.26.mlp.gate",
-      "model.layers.27.mlp.gate",
-      "model.layers.14.mlp.gate",
       "model.layers.22.mlp.shared_expert_gate",
       "model.layers.21.mlp.gate",
-      "model.layers.24.mlp.shared_expert_gate",
-      "model.layers.18.mlp.shared_expert_gate",
-      "model.layers.26.mlp.shared_expert_gate",
-      "model.layers.13.mlp.shared_expert_gate",
-      "model.layers.6.mlp.gate",
-      "model.layers.0.mlp.gate",
-      "model.layers.12.mlp.gate",
       "model.layers.2.mlp.shared_expert_gate",
-      "model.layers.17.mlp.shared_expert_gate",
       "model.layers.8.mlp.shared_expert_gate",
-      "model.layers.7.mlp.shared_expert_gate",
-      "model.layers.0.mlp.shared_expert_gate",
-      "model.layers.10.mlp.shared_expert_gate",
-      "model.layers.7.mlp.gate",
-      "model.layers.20.mlp.shared_expert_gate",
-      "model.layers.25.mlp.shared_expert_gate",
       "model.layers.8.mlp.gate",
       "model.layers.14.mlp.shared_expert_gate",
-      "model.layers.5.mlp.shared_expert_gate",
-      "model.layers.2.mlp.gate",
-      "model.layers.1.mlp.shared_expert_gate",
-      "model.layers.6.mlp.shared_expert_gate",
-      "model.layers.12.mlp.shared_expert_gate",
-      "model.layers.22.mlp.gate",
       "model.layers.16.mlp.shared_expert_gate",
-      "model.layers.13.mlp.gate",
-      "model.layers.25.mlp.gate",
-      "model.layers.19.mlp.shared_expert_gate",
-      "model.layers.23.mlp.shared_expert_gate",
-      "model.layers.3.mlp.gate",
-      "lm_head",
-      "model.layers.3.mlp.shared_expert_gate",
-      "model.layers.11.mlp.gate",
       "model.layers.1.mlp.gate",
-      "model.layers.20.mlp.gate",
-      "model.layers.4.mlp.gate",
-      "model.layers.10.mlp.gate",
-      "model.layers.21.mlp.shared_expert_gate",
-      "model.layers.11.mlp.shared_expert_gate",
-      "model.layers.15.mlp.shared_expert_gate",
-      "model.layers.9.mlp.gate",
-      "model.layers.16.mlp.gate",
-      "model.layers.5.mlp.gate",
-      "model.layers.24.mlp.gate"
     ],
     "kv_cache_scheme": "static",
     "quant_method": "fp8"

   "num_key_value_heads": 4,
   "output_router_logits": false,
   "quantization_config": {
+    "activation_scheme": "static",
     "ignored_layers": [
+      "model.layers.21.mlp.shared_expert_gate",
+      "model.layers.5.mlp.shared_expert_gate",
+      "model.layers.25.mlp.shared_expert_gate",
+      "model.layers.20.mlp.shared_expert_gate",
+      "model.layers.7.mlp.shared_expert_gate",
+      "model.layers.19.mlp.shared_expert_gate",
+      "lm_head",
+      "model.layers.14.mlp.gate",
+      "model.layers.16.mlp.gate",
+      "model.layers.15.mlp.shared_expert_gate",
+      "model.layers.17.mlp.shared_expert_gate",
+      "model.layers.5.mlp.gate",
+      "model.layers.4.mlp.gate",
+      "model.layers.10.mlp.gate",
+      "model.layers.17.mlp.gate",
       "model.layers.23.mlp.gate",
       "model.layers.27.mlp.shared_expert_gate",
+      "model.layers.0.mlp.shared_expert_gate",
+      "model.layers.27.mlp.gate",
+      "model.layers.12.mlp.gate",
+      "model.layers.3.mlp.shared_expert_gate",
+      "model.layers.7.mlp.gate",
       "model.layers.19.mlp.gate",
+      "model.layers.24.mlp.gate",
+      "model.layers.9.mlp.gate",
+      "model.layers.6.mlp.gate",
+      "model.layers.10.mlp.shared_expert_gate",
+      "model.layers.11.mlp.shared_expert_gate",
+      "model.layers.12.mlp.shared_expert_gate",
       "model.layers.18.mlp.gate",
+      "model.layers.22.mlp.gate",
       "model.layers.22.mlp.shared_expert_gate",
+      "model.layers.3.mlp.gate",
+      "model.layers.9.mlp.shared_expert_gate",
+      "model.layers.13.mlp.gate",
       "model.layers.21.mlp.gate",
       "model.layers.2.mlp.shared_expert_gate",
+      "model.layers.24.mlp.shared_expert_gate",
+      "model.layers.20.mlp.gate",
+      "model.layers.25.mlp.gate",
       "model.layers.8.mlp.shared_expert_gate",
+      "model.layers.2.mlp.gate",
+      "model.layers.13.mlp.shared_expert_gate",
+      "model.layers.23.mlp.shared_expert_gate",
+      "model.layers.15.mlp.gate",
+      "model.layers.26.mlp.shared_expert_gate",
+      "model.layers.26.mlp.gate",
       "model.layers.8.mlp.gate",
       "model.layers.14.mlp.shared_expert_gate",
       "model.layers.16.mlp.shared_expert_gate",
+      "model.layers.18.mlp.shared_expert_gate",
+      "model.layers.0.mlp.gate",
       "model.layers.1.mlp.gate",
+      "model.layers.11.mlp.gate",
+      "model.layers.6.mlp.shared_expert_gate",
+      "model.layers.1.mlp.shared_expert_gate",
+      "model.layers.4.mlp.shared_expert_gate"
     ],
     "kv_cache_scheme": "static",
     "quant_method": "fp8"

model-00001-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cebe8151c2c66e7f7350e3db42e04fddd4ffa75251dda13cb24366b7ea98431f
-size 4965667088

 version https://git-lfs.github.com/spec/v1
+oid sha256:6e38c6117c88b9c8be60ba0e20819f0142ba7b8bf61e69c693a347e44abd48a7
+size 4965711264

model-00002-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:08e8fd971f42cb6f186d3ab0aa62acc03dfd8c749ff9facc088da6b0e46bb440
-size 4998314052

 version https://git-lfs.github.com/spec/v1
+oid sha256:c080c598df03b935e9229cc85e065df508995be818694cb415fef751df90f2c8
+size 4998368852

model-00003-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a257f4554bf89c19c065eac41075669c9b783846a64cb303a5226b9843c25262
-size 4986816740

 version https://git-lfs.github.com/spec/v1
+oid sha256:5047c6d2200e6089b1dea7e65d31a620cb5a5a6a3596e2d1aef8ed22515ac3c9
+size 4986872824

model-00004-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:edcad491a8b87dcdf6bdd1e4d0dd1cd517b1ca1f7da2717a55b6584f60b85a2d
-size 4998312400

 version https://git-lfs.github.com/spec/v1
+oid sha256:ca409dc3dd756936e2a8f45d3ee6998d10fc89896ecb0cc598abf55d1302118a
+size 4998366420

model-00005-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:336635fdebfa9ea0ccf628af9925533a7b36f61b3f18527c666fd0c4c8880602
-size 4995992800

 version https://git-lfs.github.com/spec/v1
+oid sha256:251ebfad1ce1b93a9d9290a147080d0a260eafe59cef45c2643b94c6e8677719
+size 4996049392

model-00006-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:033c612a70b424b734515987d6f7f8adbc210d9c6e83061bf3a5c6bc45070def
-size 4998313376

 version https://git-lfs.github.com/spec/v1
+oid sha256:bba86a42ee4f7549df4119dca2a20d77e1dda8a76e34128d22ea1f9a3a3dae4c
+size 4998367884

model-00007-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ba23b5a20471325dcf8a4cc9006c0af3b9e9b7c3bbd183425799a42b36551abc
-size 4995993032

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0676d133c2314b3f83cb36e792586bc2370042ed13b191092732a6b5f1ea132
+size 4996049744

model-00008-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:87d76a7e7ae3fd95e87a9243bfb622fdcc0f39c52ddc7c016aa6b63eaeeaeb6e
-size 4998313368

 version https://git-lfs.github.com/spec/v1
+oid sha256:b108b7edcf8961ff9b6d6ed1125a978b7f0c22655c7de5691dfe1124fd52382a
+size 4998367876

model-00009-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e155c8e931f48454de5576843c94fac98e76e8bed626cea3e135b386b3cd72b1
-size 4995993032

 version https://git-lfs.github.com/spec/v1
+oid sha256:5f66ef7f71945785ef45c959e4ee53fb23b0fe202a9dc63c0f7e8976fe1fee7d
+size 4996049744

model-00010-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d8c3d3678cf09f212da62d5731e72ad2412a140fc1572e41ae4e3a00c704166d
-size 4998313376

 version https://git-lfs.github.com/spec/v1
+oid sha256:270f7f0097b8efaa59cc4bc4a4233d3e6851198bd04056a9077694e1720f122e
+size 4998367876

model-00011-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1711ff39fcac72f01bef20afe1b1227c47a2d6a8b914523a553ede5815873a47
-size 4995993032

 version https://git-lfs.github.com/spec/v1
+oid sha256:7c4604c1bbfd6bd284f299a6897a92c6c8e9eed0fc5c7da2488c30d6ff3a612a
+size 4996049736

model-00012-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:17f71669ec1ff4dd21c9d1250e7bce932aed4ca3174c0f6d6d584bb36c7c59a1
-size 3577922600

 version https://git-lfs.github.com/spec/v1
+oid sha256:3b02ce65e01ef81d47c1f9ed382ffcb9e2330a4132af2d7a90ff97f0ee87c2b0
+size 3577948452

model.safetensors.index.json CHANGED Viewed

The diff for this file is too large to render. See raw diff