Upload 6 files

Browse files

Files changed (7) hide show

.gitattributes +1 -0
README.md +30 -1
pytorch_model.bin.index.json +715 -0
sentencepiece.bpe.model +3 -0
special_tokens_map.json +17 -0
tokenizer.json +3 -0
tokenizer_config.json +21 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,3 +1,32 @@
 ---
-license: unknown
 ---

 ---
+license: apache-2.0
+datasets:
+- databricks/databricks-dolly-15k
+language:
+- el
+library_name: transformers
+tags:
+- text-generation-inference
+pipeline_tag: text-generation
 ---
+# Model Card for agrimi7.5B-dolly
+<!-- Provide a quick summary of what the model is/does. -->
+This model is a finetuned (SFT) version of Facbook xglm-7.5B using a machine translated version of the dataset databricks-dolly-15k in Greek language!
+The purpose is to demonstrate the ability of the specific pretrained model to adapt to instruction following mode by using a relatively small dataset such as the databricks-dolly-15k.
+## Model Details
+### Model Description
+<!-- Provide a longer summary of what this model is. -->
+- **Developed by:** [Andreas Loupasakis](https://github.com/alup)
+- **Model type:** Causal Language Model
+- **Language(s) (NLP):** Greek (el)
+- **License:** Apache-2.0
+- **Finetuned from model:** XGLM-7.5B

pytorch_model.bin.index.json ADDED Viewed

	@@ -0,0 +1,715 @@

+{
+  "metadata": {
+    "total_size": 10645028864
+  },
+  "weight_map": {
+    "lm_head.weight": "pytorch_model-00002-of-00002.bin",
+    "model.embed_tokens.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.0.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.1.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.10.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.11.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.12.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.13.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.14.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.15.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.16.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.17.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.18.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.19.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.2.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.20.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.21.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.22.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.23.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.24.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.25.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.26.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.27.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.28.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.29.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.3.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.30.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.31.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.4.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.5.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.6.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.7.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.8.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.fc1.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.fc1.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.fc1.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.fc2.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.fc2.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.fc2.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.final_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.final_layer_norm.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.k_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.k_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.k_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.out_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.out_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.out_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.q_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.q_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.q_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.v_proj.SCB": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.v_proj.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn.v_proj.weight": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn_layer_norm.bias": "pytorch_model-00001-of-00002.bin",
+    "model.layers.9.self_attn_layer_norm.weight": "pytorch_model-00001-of-00002.bin"
+  }
+}

sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c49dc7e82c10227af764e518924cf2f9d50c00462750d184fa74697bba65eef8
+size 4920706

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "additional_special_tokens": [
+    "<madeupword0>",
+    "<madeupword1>",
+    "<madeupword2>",
+    "<madeupword3>",
+    "<madeupword4>",
+    "<madeupword5>",
+    "<madeupword6>"
+  ],
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:00d163342a36b3ad1ea2f5f608e6bb2b2ff29bd453a41c4f52525a7ebc7c4b6a
+size 17210041

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "additional_special_tokens": [
+    "<madeupword0>",
+    "<madeupword1>",
+    "<madeupword2>",
+    "<madeupword3>",
+    "<madeupword4>",
+    "<madeupword5>",
+    "<madeupword6>"
+  ],
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "XGLMTokenizer",
+  "unk_token": "<unk>"
+}