Dracones commited on Apr 11

Commit

8f0a104

•

1 Parent(s): 9355e73

Upload folder using huggingface_hub

Browse files

Files changed (17) hide show

README.md +173 -0
config.json +39 -0
generation_config.json +7 -0
huggingface-metadata.txt +34 -0
model.safetensors.index.json +730 -0
output-00001-of-00009.safetensors +3 -0
output-00002-of-00009.safetensors +3 -0
output-00003-of-00009.safetensors +3 -0
output-00004-of-00009.safetensors +3 -0
output-00005-of-00009.safetensors +3 -0
output-00006-of-00009.safetensors +3 -0
output-00007-of-00009.safetensors +3 -0
output-00008-of-00009.safetensors +3 -0
output-00009-of-00009.safetensors +3 -0
special_tokens_map.json +30 -0
tokenizer.model +3 -0
tokenizer_config.json +42 -0

README.md ADDED Viewed

	@@ -0,0 +1,173 @@

+---
+library_name: transformers
+language:
+- en
+license: unknown
+tags:
+- exl2
+---
+# miqu-1-70b-sf - EXL2 8.0bpw
+This is a 8.0bpw EXL2 quant of [152334H/miqu-1-70b-sf](https://huggingface.co/152334H/miqu-1-70b-sf)
+Details about the model can be found at the above model page.
+## EXL2 Version
+These quants were made with exllamav2 version 0.0.18. Quants made on this version of EXL2 may not work on older versions of the exllamav2 library.
+If you have problems loading these models, please update Text Generation WebUI to the latest version.
+## Perplexity Scoring
+Below are the perplexity scores for the EXL2 models. A lower score is better.
+| Quant Level | Perplexity Score |
+|-------------|------------------|
+| 5.0 | 4.2637 |
+| 4.5 | 4.2876 |
+| 4.0 | 4.3097 |
+| 3.5 | 4.4459 |
+| 3.0 | 4.6504 |
+| 2.75 | 5.1638 |
+| 2.5 | 5.1715 |
+| 2.25 | 6.0848 |
+## EQ Bench
+Here are the EQ Bench scores for the EXL2 quants using Alpaca, ChatML, Command-R and Command-R-Plus prompt templates. A higher score is better.
+| Quant Size | Instruct Template | Score |
+|------------|-------------------|-------|
+| 5.0 | ChatML | 79.91 |
+| 5.0 | Alpaca | 81.45 |
+| 5.0 | Mistral | 81.11 |
+| 5.0 | Vicuna-v1.1 | 78.37 |
+| 5.0 | Vicuna-v0 | 76.64 |
+| 4.5 | ChatML | 80.64 |
+| 4.5 | Alpaca | 80.9 |
+| 4.5 | Mistral | 81.65 |
+| 4.5 | Vicuna-v1.1 | 77.04 |
+| 4.5 | Vicuna-v0 | 74.6 |
+| 4.0 | ChatML | 80.78 |
+| 4.0 | Alpaca | 79.53 |
+| 4.0 | Mistral | 82.78 |
+| 4.0 | Vicuna-v1.1 | 79.17 |
+| 4.0 | Vicuna-v0 | 76.41 |
+| 3.5 | ChatML | 81.11 |
+| 3.5 | Alpaca | 82.42 |
+| 3.5 | Mistral | 82.34 |
+| 3.5 | Vicuna-v1.1 | 81.04 |
+| 3.5 | Vicuna-v0 | 78.09 |
+| 3.0 | ChatML | 79.13 |
+| 3.0 | Alpaca | 77.74 |
+| 3.0 | Mistral | 80.11 |
+| 3.0 | Vicuna-v1.1 | 79.38 |
+| 3.0 | Vicuna-v0 | 77.25 |
+| 2.75 | ChatML | 79.6 |
+| 2.75 | Alpaca | 77.85 |
+| 2.75 | Mistral | 79.71 |
+| 2.75 | Vicuna-v1.1 | 76.93 |
+| 2.75 | Vicuna-v0 | 75.91 |
+| 2.5 | ChatML | 77.45 |
+| 2.5 | Alpaca | 77.0 |
+| 2.5 | Mistral | 78.4 |
+| 2.5 | Vicuna-v1.1 | 75.86 |
+| 2.5 | Vicuna-v0 | 75.25 |
+| 2.25 | ChatML | 77.18 |
+| 2.25 | Alpaca | 74.06 |
+| 2.25 | Mistral | 76.75 |
+| 2.25 | Vicuna-v1.1 | 75.56 |
+| 2.25 | Vicuna-v0 | 74.28 |
+### Perplexity Script
+This was the script used for perplexity testing.
+```bash
+#!/bin/bash
+# Activate the conda environment
+source ~/miniconda3/etc/profile.d/conda.sh
+conda activate exllamav2
+# Set the model name and bit size
+MODEL_NAME="miqu-1-70b-sf"
+BIT_PRECISIONS=(8.0 7.0 6.0 5.5 5.0 4.5 4.0 3.5 3.0 2.75 2.5 2.25)
+# Print the markdown table header
+echo "| Quant Level | Perplexity Score |"
+echo "|-------------|------------------|"
+for BIT_PRECISION in "${BIT_PRECISIONS[@]}"
+do
+  MODEL_DIR="models/${MODEL_NAME}_exl2_${BIT_PRECISION}bpw"
+  if [ -d "$MODEL_DIR" ]; then
+    output=$(python test_inference.py -m "$MODEL_DIR" -gs 22,24 -ed data/wikitext/wikitext-2-v1.parquet)
+    score=$(echo "$output" | grep -oP 'Evaluation perplexity: \K[\d.]+')
+    echo "| $BIT_PRECISION | $score |"
+  fi
+done```
+## Quant Details
+This is the script used for quantization.
+```bash
+#!/bin/bash
+# Activate the conda environment
+source ~/miniconda3/etc/profile.d/conda.sh
+conda activate exllamav2
+# Set the model name and bit size
+MODEL_NAME="miqu-1-70b-sf"
+# Define variables
+MODEL_DIR="models/152334H_miqu-1-70b-sf"
+OUTPUT_DIR="exl2_$MODEL_NAME"
+MEASUREMENT_FILE="measurements/$MODEL_NAME.json"
+# Create the measurement file if needed
+if [ ! -f "$MEASUREMENT_FILE" ]; then
+    echo "Creating $MEASUREMENT_FILE"
+    # Create directories
+    if [ -d "$OUTPUT_DIR" ]; then
+        rm -r "$OUTPUT_DIR"
+    fi
+    mkdir "$OUTPUT_DIR"
+    python convert.py -i $MODEL_DIR -o $OUTPUT_DIR -nr -om $MEASUREMENT_FILE
+fi
+# Choose one of the below. Either create a single quant for testing or a batch of them.
+# BIT_PRECISIONS=(5.0)
+BIT_PRECISIONS=(8.0 7.0 6.0 5.5 5.0 4.5 4.0 3.5 3.0 2.75 2.5 2.25)
+for BIT_PRECISION in "${BIT_PRECISIONS[@]}"
+do
+    CONVERTED_FOLDER="models/${MODEL_NAME}_exl2_${BIT_PRECISION}bpw"
+    # If it doesn't already exist, make the quant
+    if [ ! -d "$CONVERTED_FOLDER" ]; then
+        echo "Creating $CONVERTED_FOLDER"
+        # Create directories
+        if [ -d "$OUTPUT_DIR" ]; then
+            rm -r "$OUTPUT_DIR"
+        fi
+        mkdir "$OUTPUT_DIR"
+        mkdir "$CONVERTED_FOLDER"
+        # Run conversion commands
+        python convert.py -i $MODEL_DIR -o $OUTPUT_DIR -nr -m $MEASUREMENT_FILE -b $BIT_PRECISION -cf $CONVERTED_FOLDER
+    fi
+done
+```

config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+    "architectures": [
+        "LlamaForCausalLM"
+    ],
+    "attention_bias": false,
+    "attention_dropout": 0.0,
+    "bos_token_id": 1,
+    "eos_token_id": 2,
+    "hidden_act": "silu",
+    "hidden_size": 8192,
+    "initializer_range": 0.02,
+    "intermediate_size": 28672,
+    "max_position_embeddings": 32764,
+    "model_type": "llama",
+    "num_attention_heads": 64,
+    "num_hidden_layers": 80,
+    "num_key_value_heads": 8,
+    "pad_token_id": 0,
+    "pretraining_tp": 1,
+    "rms_norm_eps": 1e-05,
+    "rope_scaling": null,
+    "rope_theta": 1000000,
+    "tie_word_embeddings": false,
+    "torch_dtype": "float16",
+    "transformers_version": "4.36.0",
+    "use_cache": true,
+    "vocab_size": 32000,
+    "quantization_config": {
+        "quant_method": "exl2",
+        "version": "0.0.18",
+        "bits": 8.0,
+        "head_bits": 6,
+        "calibration": {
+            "rows": 100,
+            "length": 2048,
+            "dataset": "(default)"
+        }
+    }
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "pad_token_id": 0,
+  "transformers_version": "4.36.0"
+}

huggingface-metadata.txt ADDED Viewed

	@@ -0,0 +1,34 @@

+url: https://huggingface.co/152334H/miqu-1-70b-sf
+branch: main
+download date: 2024-02-02 21:23:11
+sha256sum:
+    e4521dba2f4fd701e024430314926b1fed04733a648c1053c2cec18a87dd6c46 model-00001-of-00029.safetensors
+    bfb0c432003d8d446450f72610922be06f416ae6f7c06a7ad89f2e85c275d0ca model-00002-of-00029.safetensors
+    92d77749c41a5377a114508208f1709c319a06fe92a5c49e61d363e3afcc3d30 model-00003-of-00029.safetensors
+    6dd121c5e17630b58bb5b7a44f08b645d0dbc3b98e4c0db4fb4ba85e952b1b9c model-00004-of-00029.safetensors
+    16dfdd5a91c8a678e8bfd2f1db5ff649bc685b0c20dc73546dff0cfc2168734d model-00005-of-00029.safetensors
+    160a2801c7e331bc3ec2f824ad7eb6a9817a81e504a6da018aea33b5a44c3ec1 model-00006-of-00029.safetensors
+    fa6b89f709c6fc87ad3931dae8b66c6d7912f79d5f9a5fa48532e19418735b82 model-00007-of-00029.safetensors
+    91db94ed795f94a48a473e76887d4af311a6f562a0d36150f7a327bd346be7cf model-00008-of-00029.safetensors
+    5747d98bbde1cd2abde773da35981cd764cccfae5e11b9a29272caa196a0b6a0 model-00009-of-00029.safetensors
+    914f5f29be7f866e503a22d977b4c5cd0e8f9585139b820e137a365c34816197 model-00010-of-00029.safetensors
+    6793971064bea26ce74ff41b22d7035317e994699b6d89dfbf57d2936455c0f3 model-00011-of-00029.safetensors
+    64d56b5a824e1ae9b3012f6d0082a76c465357f2251e9d041486e32114887d73 model-00012-of-00029.safetensors
+    874ed27bc2a6a752951edb22f4d49588a1e9d9e1ae2ecfc5180cfbd8360bdebb model-00013-of-00029.safetensors
+    157efff30be2135bbd692e5380d0ef88e775b2f1d7067199462dfd5c93e87ea0 model-00014-of-00029.safetensors
+    9686648c11044955b6c00bf08243eb01c29304d5995b83aa8a87045bbef28cb0 model-00015-of-00029.safetensors
+    31edde02fe845f115ad13646fbc160e2d965804176cdc50332cbcc847ee643b2 model-00016-of-00029.safetensors
+    b83b699790a6a507067cb56c64dc6aebc8210f56deab30dc5d47daa11fc92e12 model-00017-of-00029.safetensors
+    8118012bd63f7a7710b98ecc4fb1345283ade6c941d78f4d06b01a35272b0f2e model-00018-of-00029.safetensors
+    daace6f5d2941018315ea9dddfec3b83ac7545d8d7bcf19c35430724472537c8 model-00019-of-00029.safetensors
+    8c074463cb2495c654d1a837d166632c4256db80084b01a04dd78e69d7b5acab model-00020-of-00029.safetensors
+    02088161532e05c1312b06863e30ab9d5fec582f6fda5269d0b61fad67dcc9b1 model-00021-of-00029.safetensors
+    c389e3523c9d39c52c78b305aea14c1aa127e129f63a1e12d342d62d0b47fa74 model-00022-of-00029.safetensors
+    b250d54ed699f605c475e92611feed0dd63d25d7d130dabda7500cc4d84d2958 model-00023-of-00029.safetensors
+    094e0d8ed7809117ccab4c8bfb17b34e3aebaf5a1afa54a8399511d69106b12a model-00024-of-00029.safetensors
+    79909eb582b19001c79098e1432cff3b2c78a7db244c2dbfbdc22e4c3b1bd71e model-00025-of-00029.safetensors
+    077f127c73176214b1212c5bcc0e06d72451bb32cbbc658c03f0e37d0da17147 model-00026-of-00029.safetensors
+    0dc6626da04c767844b5d948dcd1d9ca6d0cf57f75ae502fb94447d318944dba model-00027-of-00029.safetensors
+    a7673df9dde803c39d3b8b9af0d448215fa8ae6635e9a14c4e560c6ebb08ba9a model-00028-of-00029.safetensors
+    6cc8c4e1a699bdd4e211a0e1cf7014ae5bb945ddb860b6286b0596d505c8df1b model-00029-of-00029.safetensors
+    9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347 tokenizer.model

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,730 @@

+{
+  "metadata": {
+    "total_size": 137953296384
+  },
+  "weight_map": {
+    "lm_head.weight": "model-00029-of-00029.safetensors",
+    "model.embed_tokens.weight": "model-00001-of-00029.safetensors",
+    "model.layers.0.input_layernorm.weight": "model-00001-of-00029.safetensors",
+    "model.layers.0.mlp.down_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.0.mlp.gate_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.0.mlp.up_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00029.safetensors",
+    "model.layers.0.self_attn.k_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.0.self_attn.o_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.0.self_attn.q_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.0.self_attn.v_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.1.input_layernorm.weight": "model-00001-of-00029.safetensors",
+    "model.layers.1.mlp.down_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.1.mlp.gate_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.1.mlp.up_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00029.safetensors",
+    "model.layers.1.self_attn.k_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.1.self_attn.o_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.1.self_attn.q_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.1.self_attn.v_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.10.input_layernorm.weight": "model-00004-of-00029.safetensors",
+    "model.layers.10.mlp.down_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.10.mlp.gate_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.10.mlp.up_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.10.post_attention_layernorm.weight": "model-00004-of-00029.safetensors",
+    "model.layers.10.self_attn.k_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.10.self_attn.o_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.10.self_attn.q_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.10.self_attn.v_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.11.input_layernorm.weight": "model-00005-of-00029.safetensors",
+    "model.layers.11.mlp.down_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.11.mlp.gate_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.11.mlp.up_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.11.post_attention_layernorm.weight": "model-00005-of-00029.safetensors",
+    "model.layers.11.self_attn.k_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.11.self_attn.o_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.11.self_attn.q_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.11.self_attn.v_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.12.input_layernorm.weight": "model-00005-of-00029.safetensors",
+    "model.layers.12.mlp.down_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.12.mlp.gate_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.12.mlp.up_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.12.post_attention_layernorm.weight": "model-00005-of-00029.safetensors",
+    "model.layers.12.self_attn.k_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.12.self_attn.o_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.12.self_attn.q_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.12.self_attn.v_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.13.input_layernorm.weight": "model-00006-of-00029.safetensors",
+    "model.layers.13.mlp.down_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.13.mlp.gate_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.13.mlp.up_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.13.post_attention_layernorm.weight": "model-00006-of-00029.safetensors",
+    "model.layers.13.self_attn.k_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.13.self_attn.o_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.13.self_attn.q_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.13.self_attn.v_proj.weight": "model-00005-of-00029.safetensors",
+    "model.layers.14.input_layernorm.weight": "model-00006-of-00029.safetensors",
+    "model.layers.14.mlp.down_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.14.mlp.gate_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.14.mlp.up_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.14.post_attention_layernorm.weight": "model-00006-of-00029.safetensors",
+    "model.layers.14.self_attn.k_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.14.self_attn.o_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.14.self_attn.q_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.14.self_attn.v_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.15.input_layernorm.weight": "model-00006-of-00029.safetensors",
+    "model.layers.15.mlp.down_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.15.mlp.gate_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.15.mlp.up_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.15.post_attention_layernorm.weight": "model-00006-of-00029.safetensors",
+    "model.layers.15.self_attn.k_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.15.self_attn.o_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.15.self_attn.q_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.15.self_attn.v_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.16.input_layernorm.weight": "model-00007-of-00029.safetensors",
+    "model.layers.16.mlp.down_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.16.mlp.gate_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.16.mlp.up_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.16.post_attention_layernorm.weight": "model-00007-of-00029.safetensors",
+    "model.layers.16.self_attn.k_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.16.self_attn.o_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.16.self_attn.q_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.16.self_attn.v_proj.weight": "model-00006-of-00029.safetensors",
+    "model.layers.17.input_layernorm.weight": "model-00007-of-00029.safetensors",
+    "model.layers.17.mlp.down_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.17.mlp.gate_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.17.mlp.up_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.17.post_attention_layernorm.weight": "model-00007-of-00029.safetensors",
+    "model.layers.17.self_attn.k_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.17.self_attn.o_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.17.self_attn.q_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.17.self_attn.v_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.18.input_layernorm.weight": "model-00007-of-00029.safetensors",
+    "model.layers.18.mlp.down_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.18.mlp.gate_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.18.mlp.up_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.18.post_attention_layernorm.weight": "model-00007-of-00029.safetensors",
+    "model.layers.18.self_attn.k_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.18.self_attn.o_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.18.self_attn.q_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.18.self_attn.v_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.19.input_layernorm.weight": "model-00008-of-00029.safetensors",
+    "model.layers.19.mlp.down_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.19.mlp.gate_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.19.mlp.up_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.19.post_attention_layernorm.weight": "model-00008-of-00029.safetensors",
+    "model.layers.19.self_attn.k_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.19.self_attn.o_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.19.self_attn.q_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.19.self_attn.v_proj.weight": "model-00007-of-00029.safetensors",
+    "model.layers.2.input_layernorm.weight": "model-00002-of-00029.safetensors",
+    "model.layers.2.mlp.down_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.2.mlp.gate_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.2.mlp.up_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.2.post_attention_layernorm.weight": "model-00002-of-00029.safetensors",
+    "model.layers.2.self_attn.k_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.2.self_attn.o_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.2.self_attn.q_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.2.self_attn.v_proj.weight": "model-00001-of-00029.safetensors",
+    "model.layers.20.input_layernorm.weight": "model-00008-of-00029.safetensors",
+    "model.layers.20.mlp.down_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.20.mlp.gate_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.20.mlp.up_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.20.post_attention_layernorm.weight": "model-00008-of-00029.safetensors",
+    "model.layers.20.self_attn.k_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.20.self_attn.o_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.20.self_attn.q_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.20.self_attn.v_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.21.input_layernorm.weight": "model-00008-of-00029.safetensors",
+    "model.layers.21.mlp.down_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.21.mlp.gate_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.21.mlp.up_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.21.post_attention_layernorm.weight": "model-00008-of-00029.safetensors",
+    "model.layers.21.self_attn.k_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.21.self_attn.o_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.21.self_attn.q_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.21.self_attn.v_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.22.input_layernorm.weight": "model-00009-of-00029.safetensors",
+    "model.layers.22.mlp.down_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.22.mlp.gate_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.22.mlp.up_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.22.post_attention_layernorm.weight": "model-00009-of-00029.safetensors",
+    "model.layers.22.self_attn.k_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.22.self_attn.o_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.22.self_attn.q_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.22.self_attn.v_proj.weight": "model-00008-of-00029.safetensors",
+    "model.layers.23.input_layernorm.weight": "model-00009-of-00029.safetensors",
+    "model.layers.23.mlp.down_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.23.mlp.gate_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.23.mlp.up_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.23.post_attention_layernorm.weight": "model-00009-of-00029.safetensors",
+    "model.layers.23.self_attn.k_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.23.self_attn.o_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.23.self_attn.q_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.23.self_attn.v_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.24.input_layernorm.weight": "model-00009-of-00029.safetensors",
+    "model.layers.24.mlp.down_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.24.mlp.gate_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.24.mlp.up_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.24.post_attention_layernorm.weight": "model-00009-of-00029.safetensors",
+    "model.layers.24.self_attn.k_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.24.self_attn.o_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.24.self_attn.q_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.24.self_attn.v_proj.weight": "model-00009-of-00029.safetensors",
+    "model.layers.25.input_layernorm.weight": "model-00010-of-00029.safetensors",
+    "model.layers.25.mlp.down_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.25.mlp.gate_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.25.mlp.up_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.25.post_attention_layernorm.weight": "model-00010-of-00029.safetensors",
+    "model.layers.25.self_attn.k_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.25.self_attn.o_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.25.self_attn.q_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.25.self_attn.v_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.26.input_layernorm.weight": "model-00010-of-00029.safetensors",
+    "model.layers.26.mlp.down_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.26.mlp.gate_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.26.mlp.up_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.26.post_attention_layernorm.weight": "model-00010-of-00029.safetensors",
+    "model.layers.26.self_attn.k_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.26.self_attn.o_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.26.self_attn.q_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.26.self_attn.v_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.27.input_layernorm.weight": "model-00011-of-00029.safetensors",
+    "model.layers.27.mlp.down_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.27.mlp.gate_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.27.mlp.up_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.27.post_attention_layernorm.weight": "model-00011-of-00029.safetensors",
+    "model.layers.27.self_attn.k_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.27.self_attn.o_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.27.self_attn.q_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.27.self_attn.v_proj.weight": "model-00010-of-00029.safetensors",
+    "model.layers.28.input_layernorm.weight": "model-00011-of-00029.safetensors",
+    "model.layers.28.mlp.down_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.28.mlp.gate_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.28.mlp.up_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.28.post_attention_layernorm.weight": "model-00011-of-00029.safetensors",
+    "model.layers.28.self_attn.k_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.28.self_attn.o_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.28.self_attn.q_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.28.self_attn.v_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.29.input_layernorm.weight": "model-00011-of-00029.safetensors",
+    "model.layers.29.mlp.down_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.29.mlp.gate_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.29.mlp.up_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.29.post_attention_layernorm.weight": "model-00011-of-00029.safetensors",
+    "model.layers.29.self_attn.k_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.29.self_attn.o_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.29.self_attn.q_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.29.self_attn.v_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.3.input_layernorm.weight": "model-00002-of-00029.safetensors",
+    "model.layers.3.mlp.down_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.3.mlp.gate_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.3.mlp.up_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.3.post_attention_layernorm.weight": "model-00002-of-00029.safetensors",
+    "model.layers.3.self_attn.k_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.3.self_attn.o_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.3.self_attn.q_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.3.self_attn.v_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.30.input_layernorm.weight": "model-00012-of-00029.safetensors",
+    "model.layers.30.mlp.down_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.30.mlp.gate_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.30.mlp.up_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.30.post_attention_layernorm.weight": "model-00012-of-00029.safetensors",
+    "model.layers.30.self_attn.k_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.30.self_attn.o_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.30.self_attn.q_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.30.self_attn.v_proj.weight": "model-00011-of-00029.safetensors",
+    "model.layers.31.input_layernorm.weight": "model-00012-of-00029.safetensors",
+    "model.layers.31.mlp.down_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.31.mlp.gate_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.31.mlp.up_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.31.post_attention_layernorm.weight": "model-00012-of-00029.safetensors",
+    "model.layers.31.self_attn.k_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.31.self_attn.o_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.31.self_attn.q_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.31.self_attn.v_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.32.input_layernorm.weight": "model-00012-of-00029.safetensors",
+    "model.layers.32.mlp.down_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.32.mlp.gate_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.32.mlp.up_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.32.post_attention_layernorm.weight": "model-00012-of-00029.safetensors",
+    "model.layers.32.self_attn.k_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.32.self_attn.o_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.32.self_attn.q_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.32.self_attn.v_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.33.input_layernorm.weight": "model-00013-of-00029.safetensors",
+    "model.layers.33.mlp.down_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.33.mlp.gate_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.33.mlp.up_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.33.post_attention_layernorm.weight": "model-00013-of-00029.safetensors",
+    "model.layers.33.self_attn.k_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.33.self_attn.o_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.33.self_attn.q_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.33.self_attn.v_proj.weight": "model-00012-of-00029.safetensors",
+    "model.layers.34.input_layernorm.weight": "model-00013-of-00029.safetensors",
+    "model.layers.34.mlp.down_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.34.mlp.gate_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.34.mlp.up_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.34.post_attention_layernorm.weight": "model-00013-of-00029.safetensors",
+    "model.layers.34.self_attn.k_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.34.self_attn.o_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.34.self_attn.q_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.34.self_attn.v_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.35.input_layernorm.weight": "model-00013-of-00029.safetensors",
+    "model.layers.35.mlp.down_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.35.mlp.gate_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.35.mlp.up_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.35.post_attention_layernorm.weight": "model-00013-of-00029.safetensors",
+    "model.layers.35.self_attn.k_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.35.self_attn.o_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.35.self_attn.q_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.35.self_attn.v_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.36.input_layernorm.weight": "model-00014-of-00029.safetensors",
+    "model.layers.36.mlp.down_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.36.mlp.gate_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.36.mlp.up_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.36.post_attention_layernorm.weight": "model-00014-of-00029.safetensors",
+    "model.layers.36.self_attn.k_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.36.self_attn.o_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.36.self_attn.q_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.36.self_attn.v_proj.weight": "model-00013-of-00029.safetensors",
+    "model.layers.37.input_layernorm.weight": "model-00014-of-00029.safetensors",
+    "model.layers.37.mlp.down_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.37.mlp.gate_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.37.mlp.up_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.37.post_attention_layernorm.weight": "model-00014-of-00029.safetensors",
+    "model.layers.37.self_attn.k_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.37.self_attn.o_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.37.self_attn.q_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.37.self_attn.v_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.38.input_layernorm.weight": "model-00014-of-00029.safetensors",
+    "model.layers.38.mlp.down_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.38.mlp.gate_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.38.mlp.up_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.38.post_attention_layernorm.weight": "model-00014-of-00029.safetensors",
+    "model.layers.38.self_attn.k_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.38.self_attn.o_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.38.self_attn.q_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.38.self_attn.v_proj.weight": "model-00014-of-00029.safetensors",
+    "model.layers.39.input_layernorm.weight": "model-00015-of-00029.safetensors",
+    "model.layers.39.mlp.down_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.39.mlp.gate_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.39.mlp.up_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.39.post_attention_layernorm.weight": "model-00015-of-00029.safetensors",
+    "model.layers.39.self_attn.k_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.39.self_attn.o_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.39.self_attn.q_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.39.self_attn.v_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.4.input_layernorm.weight": "model-00002-of-00029.safetensors",
+    "model.layers.4.mlp.down_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.4.mlp.gate_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.4.mlp.up_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.4.post_attention_layernorm.weight": "model-00002-of-00029.safetensors",
+    "model.layers.4.self_attn.k_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.4.self_attn.o_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.4.self_attn.q_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.4.self_attn.v_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.40.input_layernorm.weight": "model-00015-of-00029.safetensors",
+    "model.layers.40.mlp.down_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.40.mlp.gate_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.40.mlp.up_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.40.post_attention_layernorm.weight": "model-00015-of-00029.safetensors",
+    "model.layers.40.self_attn.k_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.40.self_attn.o_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.40.self_attn.q_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.40.self_attn.v_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.41.input_layernorm.weight": "model-00016-of-00029.safetensors",
+    "model.layers.41.mlp.down_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.41.mlp.gate_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.41.mlp.up_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.41.post_attention_layernorm.weight": "model-00016-of-00029.safetensors",
+    "model.layers.41.self_attn.k_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.41.self_attn.o_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.41.self_attn.q_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.41.self_attn.v_proj.weight": "model-00015-of-00029.safetensors",
+    "model.layers.42.input_layernorm.weight": "model-00016-of-00029.safetensors",
+    "model.layers.42.mlp.down_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.42.mlp.gate_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.42.mlp.up_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.42.post_attention_layernorm.weight": "model-00016-of-00029.safetensors",
+    "model.layers.42.self_attn.k_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.42.self_attn.o_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.42.self_attn.q_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.42.self_attn.v_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.43.input_layernorm.weight": "model-00016-of-00029.safetensors",
+    "model.layers.43.mlp.down_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.43.mlp.gate_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.43.mlp.up_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.43.post_attention_layernorm.weight": "model-00016-of-00029.safetensors",
+    "model.layers.43.self_attn.k_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.43.self_attn.o_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.43.self_attn.q_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.43.self_attn.v_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.44.input_layernorm.weight": "model-00017-of-00029.safetensors",
+    "model.layers.44.mlp.down_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.44.mlp.gate_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.44.mlp.up_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.44.post_attention_layernorm.weight": "model-00017-of-00029.safetensors",
+    "model.layers.44.self_attn.k_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.44.self_attn.o_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.44.self_attn.q_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.44.self_attn.v_proj.weight": "model-00016-of-00029.safetensors",
+    "model.layers.45.input_layernorm.weight": "model-00017-of-00029.safetensors",
+    "model.layers.45.mlp.down_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.45.mlp.gate_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.45.mlp.up_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.45.post_attention_layernorm.weight": "model-00017-of-00029.safetensors",
+    "model.layers.45.self_attn.k_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.45.self_attn.o_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.45.self_attn.q_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.45.self_attn.v_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.46.input_layernorm.weight": "model-00017-of-00029.safetensors",
+    "model.layers.46.mlp.down_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.46.mlp.gate_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.46.mlp.up_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.46.post_attention_layernorm.weight": "model-00017-of-00029.safetensors",
+    "model.layers.46.self_attn.k_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.46.self_attn.o_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.46.self_attn.q_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.46.self_attn.v_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.47.input_layernorm.weight": "model-00018-of-00029.safetensors",
+    "model.layers.47.mlp.down_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.47.mlp.gate_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.47.mlp.up_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.47.post_attention_layernorm.weight": "model-00018-of-00029.safetensors",
+    "model.layers.47.self_attn.k_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.47.self_attn.o_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.47.self_attn.q_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.47.self_attn.v_proj.weight": "model-00017-of-00029.safetensors",
+    "model.layers.48.input_layernorm.weight": "model-00018-of-00029.safetensors",
+    "model.layers.48.mlp.down_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.48.mlp.gate_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.48.mlp.up_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.48.post_attention_layernorm.weight": "model-00018-of-00029.safetensors",
+    "model.layers.48.self_attn.k_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.48.self_attn.o_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.48.self_attn.q_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.48.self_attn.v_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.49.input_layernorm.weight": "model-00018-of-00029.safetensors",
+    "model.layers.49.mlp.down_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.49.mlp.gate_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.49.mlp.up_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.49.post_attention_layernorm.weight": "model-00018-of-00029.safetensors",
+    "model.layers.49.self_attn.k_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.49.self_attn.o_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.49.self_attn.q_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.49.self_attn.v_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.5.input_layernorm.weight": "model-00003-of-00029.safetensors",
+    "model.layers.5.mlp.down_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.5.mlp.gate_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.5.mlp.up_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.5.post_attention_layernorm.weight": "model-00003-of-00029.safetensors",
+    "model.layers.5.self_attn.k_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.5.self_attn.o_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.5.self_attn.q_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.5.self_attn.v_proj.weight": "model-00002-of-00029.safetensors",
+    "model.layers.50.input_layernorm.weight": "model-00019-of-00029.safetensors",
+    "model.layers.50.mlp.down_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.50.mlp.gate_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.50.mlp.up_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.50.post_attention_layernorm.weight": "model-00019-of-00029.safetensors",
+    "model.layers.50.self_attn.k_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.50.self_attn.o_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.50.self_attn.q_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.50.self_attn.v_proj.weight": "model-00018-of-00029.safetensors",
+    "model.layers.51.input_layernorm.weight": "model-00019-of-00029.safetensors",
+    "model.layers.51.mlp.down_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.51.mlp.gate_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.51.mlp.up_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.51.post_attention_layernorm.weight": "model-00019-of-00029.safetensors",
+    "model.layers.51.self_attn.k_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.51.self_attn.o_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.51.self_attn.q_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.51.self_attn.v_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.52.input_layernorm.weight": "model-00019-of-00029.safetensors",
+    "model.layers.52.mlp.down_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.52.mlp.gate_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.52.mlp.up_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.52.post_attention_layernorm.weight": "model-00019-of-00029.safetensors",
+    "model.layers.52.self_attn.k_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.52.self_attn.o_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.52.self_attn.q_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.52.self_attn.v_proj.weight": "model-00019-of-00029.safetensors",
+    "model.layers.53.input_layernorm.weight": "model-00020-of-00029.safetensors",
+    "model.layers.53.mlp.down_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.53.mlp.gate_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.53.mlp.up_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.53.post_attention_layernorm.weight": "model-00020-of-00029.safetensors",
+    "model.layers.53.self_attn.k_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.53.self_attn.o_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.53.self_attn.q_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.53.self_attn.v_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.54.input_layernorm.weight": "model-00020-of-00029.safetensors",
+    "model.layers.54.mlp.down_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.54.mlp.gate_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.54.mlp.up_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.54.post_attention_layernorm.weight": "model-00020-of-00029.safetensors",
+    "model.layers.54.self_attn.k_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.54.self_attn.o_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.54.self_attn.q_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.54.self_attn.v_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.55.input_layernorm.weight": "model-00021-of-00029.safetensors",
+    "model.layers.55.mlp.down_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.55.mlp.gate_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.55.mlp.up_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.55.post_attention_layernorm.weight": "model-00021-of-00029.safetensors",
+    "model.layers.55.self_attn.k_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.55.self_attn.o_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.55.self_attn.q_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.55.self_attn.v_proj.weight": "model-00020-of-00029.safetensors",
+    "model.layers.56.input_layernorm.weight": "model-00021-of-00029.safetensors",
+    "model.layers.56.mlp.down_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.56.mlp.gate_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.56.mlp.up_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.56.post_attention_layernorm.weight": "model-00021-of-00029.safetensors",
+    "model.layers.56.self_attn.k_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.56.self_attn.o_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.56.self_attn.q_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.56.self_attn.v_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.57.input_layernorm.weight": "model-00021-of-00029.safetensors",
+    "model.layers.57.mlp.down_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.57.mlp.gate_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.57.mlp.up_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.57.post_attention_layernorm.weight": "model-00021-of-00029.safetensors",
+    "model.layers.57.self_attn.k_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.57.self_attn.o_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.57.self_attn.q_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.57.self_attn.v_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.58.input_layernorm.weight": "model-00022-of-00029.safetensors",
+    "model.layers.58.mlp.down_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.58.mlp.gate_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.58.mlp.up_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.58.post_attention_layernorm.weight": "model-00022-of-00029.safetensors",
+    "model.layers.58.self_attn.k_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.58.self_attn.o_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.58.self_attn.q_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.58.self_attn.v_proj.weight": "model-00021-of-00029.safetensors",
+    "model.layers.59.input_layernorm.weight": "model-00022-of-00029.safetensors",
+    "model.layers.59.mlp.down_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.59.mlp.gate_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.59.mlp.up_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.59.post_attention_layernorm.weight": "model-00022-of-00029.safetensors",
+    "model.layers.59.self_attn.k_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.59.self_attn.o_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.59.self_attn.q_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.59.self_attn.v_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.6.input_layernorm.weight": "model-00003-of-00029.safetensors",
+    "model.layers.6.mlp.down_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.6.mlp.gate_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.6.mlp.up_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.6.post_attention_layernorm.weight": "model-00003-of-00029.safetensors",
+    "model.layers.6.self_attn.k_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.6.self_attn.o_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.6.self_attn.q_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.6.self_attn.v_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.60.input_layernorm.weight": "model-00022-of-00029.safetensors",
+    "model.layers.60.mlp.down_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.60.mlp.gate_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.60.mlp.up_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.60.post_attention_layernorm.weight": "model-00022-of-00029.safetensors",
+    "model.layers.60.self_attn.k_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.60.self_attn.o_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.60.self_attn.q_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.60.self_attn.v_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.61.input_layernorm.weight": "model-00023-of-00029.safetensors",
+    "model.layers.61.mlp.down_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.61.mlp.gate_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.61.mlp.up_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.61.post_attention_layernorm.weight": "model-00023-of-00029.safetensors",
+    "model.layers.61.self_attn.k_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.61.self_attn.o_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.61.self_attn.q_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.61.self_attn.v_proj.weight": "model-00022-of-00029.safetensors",
+    "model.layers.62.input_layernorm.weight": "model-00023-of-00029.safetensors",
+    "model.layers.62.mlp.down_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.62.mlp.gate_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.62.mlp.up_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.62.post_attention_layernorm.weight": "model-00023-of-00029.safetensors",
+    "model.layers.62.self_attn.k_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.62.self_attn.o_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.62.self_attn.q_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.62.self_attn.v_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.63.input_layernorm.weight": "model-00023-of-00029.safetensors",
+    "model.layers.63.mlp.down_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.63.mlp.gate_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.63.mlp.up_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.63.post_attention_layernorm.weight": "model-00023-of-00029.safetensors",
+    "model.layers.63.self_attn.k_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.63.self_attn.o_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.63.self_attn.q_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.63.self_attn.v_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.64.input_layernorm.weight": "model-00024-of-00029.safetensors",
+    "model.layers.64.mlp.down_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.64.mlp.gate_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.64.mlp.up_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.64.post_attention_layernorm.weight": "model-00024-of-00029.safetensors",
+    "model.layers.64.self_attn.k_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.64.self_attn.o_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.64.self_attn.q_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.64.self_attn.v_proj.weight": "model-00023-of-00029.safetensors",
+    "model.layers.65.input_layernorm.weight": "model-00024-of-00029.safetensors",
+    "model.layers.65.mlp.down_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.65.mlp.gate_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.65.mlp.up_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.65.post_attention_layernorm.weight": "model-00024-of-00029.safetensors",
+    "model.layers.65.self_attn.k_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.65.self_attn.o_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.65.self_attn.q_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.65.self_attn.v_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.66.input_layernorm.weight": "model-00024-of-00029.safetensors",
+    "model.layers.66.mlp.down_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.66.mlp.gate_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.66.mlp.up_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.66.post_attention_layernorm.weight": "model-00024-of-00029.safetensors",
+    "model.layers.66.self_attn.k_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.66.self_attn.o_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.66.self_attn.q_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.66.self_attn.v_proj.weight": "model-00024-of-00029.safetensors",
+    "model.layers.67.input_layernorm.weight": "model-00025-of-00029.safetensors",
+    "model.layers.67.mlp.down_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.67.mlp.gate_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.67.mlp.up_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.67.post_attention_layernorm.weight": "model-00025-of-00029.safetensors",
+    "model.layers.67.self_attn.k_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.67.self_attn.o_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.67.self_attn.q_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.67.self_attn.v_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.68.input_layernorm.weight": "model-00025-of-00029.safetensors",
+    "model.layers.68.mlp.down_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.68.mlp.gate_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.68.mlp.up_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.68.post_attention_layernorm.weight": "model-00025-of-00029.safetensors",
+    "model.layers.68.self_attn.k_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.68.self_attn.o_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.68.self_attn.q_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.68.self_attn.v_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.69.input_layernorm.weight": "model-00026-of-00029.safetensors",
+    "model.layers.69.mlp.down_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.69.mlp.gate_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.69.mlp.up_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.69.post_attention_layernorm.weight": "model-00026-of-00029.safetensors",
+    "model.layers.69.self_attn.k_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.69.self_attn.o_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.69.self_attn.q_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.69.self_attn.v_proj.weight": "model-00025-of-00029.safetensors",
+    "model.layers.7.input_layernorm.weight": "model-00003-of-00029.safetensors",
+    "model.layers.7.mlp.down_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.7.mlp.gate_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.7.mlp.up_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.7.post_attention_layernorm.weight": "model-00003-of-00029.safetensors",
+    "model.layers.7.self_attn.k_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.7.self_attn.o_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.7.self_attn.q_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.7.self_attn.v_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.70.input_layernorm.weight": "model-00026-of-00029.safetensors",
+    "model.layers.70.mlp.down_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.70.mlp.gate_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.70.mlp.up_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.70.post_attention_layernorm.weight": "model-00026-of-00029.safetensors",
+    "model.layers.70.self_attn.k_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.70.self_attn.o_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.70.self_attn.q_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.70.self_attn.v_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.71.input_layernorm.weight": "model-00026-of-00029.safetensors",
+    "model.layers.71.mlp.down_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.71.mlp.gate_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.71.mlp.up_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.71.post_attention_layernorm.weight": "model-00026-of-00029.safetensors",
+    "model.layers.71.self_attn.k_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.71.self_attn.o_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.71.self_attn.q_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.71.self_attn.v_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.72.input_layernorm.weight": "model-00027-of-00029.safetensors",
+    "model.layers.72.mlp.down_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.72.mlp.gate_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.72.mlp.up_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.72.post_attention_layernorm.weight": "model-00027-of-00029.safetensors",
+    "model.layers.72.self_attn.k_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.72.self_attn.o_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.72.self_attn.q_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.72.self_attn.v_proj.weight": "model-00026-of-00029.safetensors",
+    "model.layers.73.input_layernorm.weight": "model-00027-of-00029.safetensors",
+    "model.layers.73.mlp.down_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.73.mlp.gate_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.73.mlp.up_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.73.post_attention_layernorm.weight": "model-00027-of-00029.safetensors",
+    "model.layers.73.self_attn.k_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.73.self_attn.o_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.73.self_attn.q_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.73.self_attn.v_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.74.input_layernorm.weight": "model-00027-of-00029.safetensors",
+    "model.layers.74.mlp.down_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.74.mlp.gate_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.74.mlp.up_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.74.post_attention_layernorm.weight": "model-00027-of-00029.safetensors",
+    "model.layers.74.self_attn.k_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.74.self_attn.o_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.74.self_attn.q_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.74.self_attn.v_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.75.input_layernorm.weight": "model-00028-of-00029.safetensors",
+    "model.layers.75.mlp.down_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.75.mlp.gate_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.75.mlp.up_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.75.post_attention_layernorm.weight": "model-00028-of-00029.safetensors",
+    "model.layers.75.self_attn.k_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.75.self_attn.o_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.75.self_attn.q_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.75.self_attn.v_proj.weight": "model-00027-of-00029.safetensors",
+    "model.layers.76.input_layernorm.weight": "model-00028-of-00029.safetensors",
+    "model.layers.76.mlp.down_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.76.mlp.gate_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.76.mlp.up_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.76.post_attention_layernorm.weight": "model-00028-of-00029.safetensors",
+    "model.layers.76.self_attn.k_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.76.self_attn.o_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.76.self_attn.q_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.76.self_attn.v_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.77.input_layernorm.weight": "model-00028-of-00029.safetensors",
+    "model.layers.77.mlp.down_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.77.mlp.gate_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.77.mlp.up_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.77.post_attention_layernorm.weight": "model-00028-of-00029.safetensors",
+    "model.layers.77.self_attn.k_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.77.self_attn.o_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.77.self_attn.q_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.77.self_attn.v_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.78.input_layernorm.weight": "model-00029-of-00029.safetensors",
+    "model.layers.78.mlp.down_proj.weight": "model-00029-of-00029.safetensors",
+    "model.layers.78.mlp.gate_proj.weight": "model-00029-of-00029.safetensors",
+    "model.layers.78.mlp.up_proj.weight": "model-00029-of-00029.safetensors",
+    "model.layers.78.post_attention_layernorm.weight": "model-00029-of-00029.safetensors",
+    "model.layers.78.self_attn.k_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.78.self_attn.o_proj.weight": "model-00029-of-00029.safetensors",
+    "model.layers.78.self_attn.q_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.78.self_attn.v_proj.weight": "model-00028-of-00029.safetensors",
+    "model.layers.79.input_layernorm.weight": "model-00029-of-00029.safetensors",
+    "model.layers.79.mlp.down_proj.weight": "model-00029-of-00029.safetensors",
+    "model.layers.79.mlp.gate_proj.weight": "model-00029-of-00029.safetensors",
+    "model.layers.79.mlp.up_proj.weight": "model-00029-of-00029.safetensors",
+    "model.layers.79.post_attention_layernorm.weight": "model-00029-of-00029.safetensors",
+    "model.layers.79.self_attn.k_proj.weight": "model-00029-of-00029.safetensors",
+    "model.layers.79.self_attn.o_proj.weight": "model-00029-of-00029.safetensors",
+    "model.layers.79.self_attn.q_proj.weight": "model-00029-of-00029.safetensors",
+    "model.layers.79.self_attn.v_proj.weight": "model-00029-of-00029.safetensors",
+    "model.layers.8.input_layernorm.weight": "model-00004-of-00029.safetensors",
+    "model.layers.8.mlp.down_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.8.mlp.gate_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.8.mlp.up_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.8.post_attention_layernorm.weight": "model-00004-of-00029.safetensors",
+    "model.layers.8.self_attn.k_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.8.self_attn.o_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.8.self_attn.q_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.8.self_attn.v_proj.weight": "model-00003-of-00029.safetensors",
+    "model.layers.9.input_layernorm.weight": "model-00004-of-00029.safetensors",
+    "model.layers.9.mlp.down_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.9.mlp.gate_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.9.mlp.up_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.9.post_attention_layernorm.weight": "model-00004-of-00029.safetensors",
+    "model.layers.9.self_attn.k_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.9.self_attn.o_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.9.self_attn.q_proj.weight": "model-00004-of-00029.safetensors",
+    "model.layers.9.self_attn.v_proj.weight": "model-00004-of-00029.safetensors",
+    "model.norm.weight": "model-00029-of-00029.safetensors"
+  }
+}

output-00001-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6499cb04df50915cf63fc1577b018aeca7259c9552987c6d6029b4422e7aed7c
+size 8509375344

output-00002-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ee4b3d3d775c8bb4a2eddfba46083e4b1f081940cbee94c3b14b9388e6fcdf6f
+size 8358441696

output-00003-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:635213e1f0310470d9e91e108ee2ee6a0cd06a7fceb628e87b9b21d5df3585b6
+size 8523261208

output-00004-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ae120ce504062680f5fd7c33a2fd5eaab2e7fbee310819c012753d890face123
+size 8584934136

output-00005-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:792154cd21db3242c51211f20bcfcb2cae1c4df8cd757d48e0c6511a973980cb
+size 8584934128

output-00006-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9a1dd61d751ee68f21fd88e1316bb521ad87f2ccc17d66ffbd611852a8579b0b
+size 8542991328

output-00007-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:07aba0aca72832547092b53d41444a3957fedc44c16a3cc0be685c1ad04b26b9
+size 8561106032

output-00008-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6242241a9e92099de6f6f9e877e01b6f7af30dc178a07542d2effd9012f1020d
+size 8523261208

output-00009-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8fd4092c15244845e8e34da259ba316437c621f255b2058d30798fef432c80e
+size 982627120

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,42 @@

+{
+  "add_bos_token": true,
+  "add_eos_token": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<unk>",
+  "sp_model_kwargs": {},
+  "spaces_between_special_tokens": false,
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": false,
+  "chat_template": "{{ bos_token }}{% for message in messages %}{% if (message['role'] == 'user') != (loop.index0 % 2 == 0) %}{{ raise_exception('Conversation roles must alternate user/assistant/user/assistant/...') }}{% endif %}{% if message['role'] == 'user' %}{{ '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ message['content'] + eos_token}}{% else %}{{ raise_exception('Only user and assistant roles are supported!') }}{% endif %}{% endfor %}"
+}