commit from hbalabin

Files changed (8) hide show

config.json ADDED Viewed

+{
+  "architectures": [
+    "STonKGsForPreTraining"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "kg_vocab_size": 174534,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.6.1",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 28996
+}

optimizer.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:a6d68527a47a07ae9fcbee87dc0a3b352fca06eec3ff75dc81e47a16dcca864e
+size 2301864773

pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:41e70145f9e18fcf47bf239eeeb05e455999d6a33c7eb5148fd5545404b8834d
+size 1584292139

rng_state.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4154253070c731ca79a490f78836ae3ac93cfc2607472624b877393862f4f9c9
+size 17756

scaler.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d16446612463af5403adf365c85c848f15cd3c997cbf3590bffcdf95903769de
+size 559

scheduler.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:67701e7ceb5f0b91364d4ea54466f40db12bb79c6938f944f6f2d9bc7ae2b047
+size 623

trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e4a14e87a5e43b8b8dc4832561f7c22c30da46e1ba02c8ca5577de0a75061aa1
+size 2479