ulyanaisaeva commited on May 30, 2022

Commit

451893a

1 Parent(s): 1718eb7

End of training

Browse files

Files changed (34) hide show

checkpoint-12838/config.json +31 -0
checkpoint-12838/optimizer.pt +3 -0
checkpoint-12838/pytorch_model.bin +3 -0
checkpoint-12838/rng_state.pth +3 -0
checkpoint-12838/scaler.pt +3 -0
checkpoint-12838/scheduler.pt +3 -0
checkpoint-12838/trainer_state.json +44 -0
checkpoint-12838/training_args.bin +3 -0
checkpoint-19257/config.json +31 -0
checkpoint-19257/optimizer.pt +3 -0
checkpoint-19257/pytorch_model.bin +3 -0
checkpoint-19257/rng_state.pth +3 -0
checkpoint-19257/scaler.pt +3 -0
checkpoint-19257/scheduler.pt +3 -0
checkpoint-19257/trainer_state.json +58 -0
checkpoint-19257/training_args.bin +3 -0
checkpoint-25676/config.json +31 -0
checkpoint-25676/optimizer.pt +3 -0
checkpoint-25676/pytorch_model.bin +3 -0
checkpoint-25676/rng_state.pth +3 -0
checkpoint-25676/scaler.pt +3 -0
checkpoint-25676/scheduler.pt +3 -0
checkpoint-25676/trainer_state.json +72 -0
checkpoint-25676/training_args.bin +3 -0
checkpoint-32095/config.json +31 -0
checkpoint-32095/optimizer.pt +3 -0
checkpoint-32095/pytorch_model.bin +3 -0
checkpoint-32095/rng_state.pth +3 -0
checkpoint-32095/scaler.pt +3 -0
checkpoint-32095/scheduler.pt +3 -0
checkpoint-32095/trainer_state.json +86 -0
checkpoint-32095/training_args.bin +3 -0
pytorch_model.bin +1 -1
runs/May30_14-29-18_9a4805da8a6d/events.out.tfevents.1653920983.9a4805da8a6d.80.3 +2 -2

checkpoint-12838/config.json ADDED Viewed

	@@ -0,0 +1,31 @@

+{
+  "_name_or_path": "/content/models/bert_modif_emb",
+  "architectures": [
+    "BertForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.19.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 32000
+}

checkpoint-12838/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9ea61bf44d61641d59103e829adc93090b8d7eb92f1505e9b815b6731dec3cbd
+size 885324121

checkpoint-12838/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3f606c8d4900a8209c79fbcf5235e936287b216774982c26f3f734d30ea91e23
+size 442675179

checkpoint-12838/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ccd73439f3d9f0a1b3501ea081c02b7b7471ec025c2fbebecd68b79e7c35bf3a
+size 14503

checkpoint-12838/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6017fdcf5f56dbcc9a92708c8c0ceded87054b03a1ffd0cd7fc66c53ff5ec716
+size 559

checkpoint-12838/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d35205cd0217c54f2c2ba9dcdf2a3d3976b059cc6222cff585d4954618b8d0c4
+size 623

checkpoint-12838/trainer_state.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 2.0,
+  "global_step": 12838,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 8.889735156655704e-06,
+      "loss": 7.3112,
+      "step": 6419
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 6.181427955627441,
+      "eval_runtime": 64.709,
+      "eval_samples_per_second": 198.396,
+      "eval_steps_per_second": 9.921,
+      "step": 6419
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 6.668513069066991e-06,
+      "loss": 5.8524,
+      "step": 12838
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 5.407498359680176,
+      "eval_runtime": 64.7053,
+      "eval_samples_per_second": 198.407,
+      "eval_steps_per_second": 9.922,
+      "step": 12838
+    }
+  ],
+  "max_steps": 32095,
+  "num_train_epochs": 5,
+  "total_flos": 1.689540838293504e+16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-12838/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc6a6e3558851af45bb5a2bf276230e5bbacabfdee3309629484b8049458d984
+size 3247

checkpoint-19257/config.json ADDED Viewed

	@@ -0,0 +1,31 @@

+{
+  "_name_or_path": "/content/models/bert_modif_emb",
+  "architectures": [
+    "BertForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.19.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 32000
+}

checkpoint-19257/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fba999c3c1a2f308f80b5d8f367693c35e7c07ebb9d0fcd2e1cc1fa51d831c77
+size 885324121

checkpoint-19257/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5e516c7051df0161c608388e3b3c76ac27ad4aa82542e5e94ec299d8824b759e
+size 442675179

checkpoint-19257/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5bb60a63e8305a0c2468f008d689d5a382029bb9705d7b6233766a7d33af3c2f
+size 14503

checkpoint-19257/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fa387421e8fe914b42d6078556cf371000d33113d1ad9297d06114cb86b119fb
+size 559

checkpoint-19257/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c1f5089926f44d1d87946b35c57b32d5688daa313074a5417b78cd3064326b65
+size 623

checkpoint-19257/trainer_state.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "global_step": 19257,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 8.889735156655704e-06,
+      "loss": 7.3112,
+      "step": 6419
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 6.181427955627441,
+      "eval_runtime": 64.709,
+      "eval_samples_per_second": 198.396,
+      "eval_steps_per_second": 9.921,
+      "step": 6419
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 6.668513069066991e-06,
+      "loss": 5.8524,
+      "step": 12838
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 5.407498359680176,
+      "eval_runtime": 64.7053,
+      "eval_samples_per_second": 198.407,
+      "eval_steps_per_second": 9.922,
+      "step": 12838
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 4.446944781028216e-06,
+      "loss": 5.3392,
+      "step": 19257
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 5.080959320068359,
+      "eval_runtime": 64.6173,
+      "eval_samples_per_second": 198.677,
+      "eval_steps_per_second": 9.935,
+      "step": 19257
+    }
+  ],
+  "max_steps": 32095,
+  "num_train_epochs": 5,
+  "total_flos": 2.534311257440256e+16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-19257/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc6a6e3558851af45bb5a2bf276230e5bbacabfdee3309629484b8049458d984
+size 3247

checkpoint-25676/config.json ADDED Viewed

	@@ -0,0 +1,31 @@

+{
+  "_name_or_path": "/content/models/bert_modif_emb",
+  "architectures": [
+    "BertForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.19.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 32000
+}

checkpoint-25676/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f1783ea3d8ddef597c36cf4796d000e8bc78b7ef67b81447dac38840f4f554da
+size 885324121

checkpoint-25676/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:34265a9a39e091e716cb212258982ed86c6fe6a820c6c01fc203b4cd63e01312
+size 442675179

checkpoint-25676/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:26102bb97204416066f0b77f4c616d6ed8a4bf9b0b9d81f125050fc47b6422af
+size 14503

checkpoint-25676/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:49785070d9351e7bf61535d02deb7a939472be3ed62e579420dd3ca01272af6b
+size 559

checkpoint-25676/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:96739ca6df7177c5a0f01b44a659f5de9f9f62a41bc1c71ede2605e338ea6225
+size 623

checkpoint-25676/trainer_state.json ADDED Viewed

	@@ -0,0 +1,72 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 4.0,
+  "global_step": 25676,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 8.889735156655704e-06,
+      "loss": 7.3112,
+      "step": 6419
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 6.181427955627441,
+      "eval_runtime": 64.709,
+      "eval_samples_per_second": 198.396,
+      "eval_steps_per_second": 9.921,
+      "step": 6419
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 6.668513069066991e-06,
+      "loss": 5.8524,
+      "step": 12838
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 5.407498359680176,
+      "eval_runtime": 64.7053,
+      "eval_samples_per_second": 198.407,
+      "eval_steps_per_second": 9.922,
+      "step": 12838
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 4.446944781028216e-06,
+      "loss": 5.3392,
+      "step": 19257
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 5.080959320068359,
+      "eval_runtime": 64.6173,
+      "eval_samples_per_second": 198.677,
+      "eval_steps_per_second": 9.935,
+      "step": 19257
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 2.2257226934395014e-06,
+      "loss": 5.0958,
+      "step": 25676
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 4.901454448699951,
+      "eval_runtime": 64.6233,
+      "eval_samples_per_second": 198.659,
+      "eval_steps_per_second": 9.934,
+      "step": 25676
+    }
+  ],
+  "max_steps": 32095,
+  "num_train_epochs": 5,
+  "total_flos": 3.379081676587008e+16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-25676/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc6a6e3558851af45bb5a2bf276230e5bbacabfdee3309629484b8049458d984
+size 3247

checkpoint-32095/config.json ADDED Viewed

	@@ -0,0 +1,31 @@

+{
+  "_name_or_path": "/content/models/bert_modif_emb",
+  "architectures": [
+    "BertForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.19.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 32000
+}

checkpoint-32095/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eaa394a7c8aec3a985b42599594f002ba9e313953930a7c953ae21adf27ef3c8
+size 885324121

checkpoint-32095/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cd771f458e46629f7fec5a86b90f3cfffb7e9b86f545ceeb7ce7499afb73ebe1
+size 442675179

checkpoint-32095/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9fdcc33a7aaa71308c29d1b50659ebc6a78284fa1a8c59733ef3edc8276bedb0
+size 14503

checkpoint-32095/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2d71b5382592d2ff7e32a0603d0e9db0a81425654dc7c7b16b5692a252cf24e3
+size 559

checkpoint-32095/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fd5ebce471016eec2f5eba2e97fee128ad5ffece685a5a95de6042eaea5877ae
+size 623

checkpoint-32095/trainer_state.json ADDED Viewed

	@@ -0,0 +1,86 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 5.0,
+  "global_step": 32095,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 8.889735156655704e-06,
+      "loss": 7.3112,
+      "step": 6419
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 6.181427955627441,
+      "eval_runtime": 64.709,
+      "eval_samples_per_second": 198.396,
+      "eval_steps_per_second": 9.921,
+      "step": 6419
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 6.668513069066991e-06,
+      "loss": 5.8524,
+      "step": 12838
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 5.407498359680176,
+      "eval_runtime": 64.7053,
+      "eval_samples_per_second": 198.407,
+      "eval_steps_per_second": 9.922,
+      "step": 12838
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 4.446944781028216e-06,
+      "loss": 5.3392,
+      "step": 19257
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 5.080959320068359,
+      "eval_runtime": 64.6173,
+      "eval_samples_per_second": 198.677,
+      "eval_steps_per_second": 9.935,
+      "step": 19257
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 2.2257226934395014e-06,
+      "loss": 5.0958,
+      "step": 25676
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 4.901454448699951,
+      "eval_runtime": 64.6233,
+      "eval_samples_per_second": 198.659,
+      "eval_steps_per_second": 9.934,
+      "step": 25676
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 4.154405400727021e-09,
+      "loss": 4.9897,
+      "step": 32095
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 4.8497138023376465,
+      "eval_runtime": 64.6531,
+      "eval_samples_per_second": 198.568,
+      "eval_steps_per_second": 9.93,
+      "step": 32095
+    }
+  ],
+  "max_steps": 32095,
+  "num_train_epochs": 5,
+  "total_flos": 4.22385209573376e+16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-32095/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc6a6e3558851af45bb5a2bf276230e5bbacabfdee3309629484b8049458d984
+size 3247

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:329903eb21f8e1e3ce9cc8e0ba643e55099c4ea5d438b8b865c431c1f0f79edd
 size 442675179

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd771f458e46629f7fec5a86b90f3cfffb7e9b86f545ceeb7ce7499afb73ebe1
 size 442675179

runs/May30_14-29-18_9a4805da8a6d/events.out.tfevents.1653920983.9a4805da8a6d.80.3 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:60b240f84ee5518bb7967f12af5ab459198f650123c185689b4f331eff03dc64
-size 4232

 version https://git-lfs.github.com/spec/v1
+oid sha256:96fe8d6bc35252e7b3d6b0d20ee5d996b6ea657f82decf53cd95ab548a54be3d
+size 6328