Add models

Files changed (6) hide show

.gitattributes CHANGED Viewed

@@ -14,3 +14,4 @@
 *.pb filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text

 *.pb filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
+pytorch_model.bin filter=lfs diff=lfs merge=lfs -text

config.json ADDED Viewed

+{
+  "activation_dropout": 0.0,
+  "activation_function": "gelu",
+  "architectures": [
+    "MegatronForCausalLM"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": 0.0,
+  "d_model": 3072,
+  "decoder_attention_heads": 32,
+  "decoder_ffn_dim": 18432,
+  "decoder_layerdrop": 0,
+  "decoder_layers": 72,
+  "decoder_start_token_id": 0,
+  "dropout": 0.1,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "init_std": 0.02,
+  "is_decoder": true,
+  "max_position_embeddings": 1024,
+  "model_type": "megatron",
+  "pad_token_id": 1,
+  "scale_embedding": true,
+  "transformers_version": "4.4.0.dev0",
+  "use_cache": true,
+  "vocab_size": 51200
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:09c1cde82a7fe47e0f4d45b1eef6e4d7f23f05271b3214eb1f79c537e9283104
+size 44129367544

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff