Training in progress, step 4000

Browse files

Files changed (12) hide show

.gitignore +1 -0
config.json +27 -0
last-checkpoint/config.json +27 -0
last-checkpoint/optimizer.pt +3 -0
last-checkpoint/pytorch_model.bin +3 -0
last-checkpoint/rng_state.pth +3 -0
last-checkpoint/scheduler.pt +3 -0
last-checkpoint/trainer_state.json +256 -0
last-checkpoint/training_args.bin +3 -0
pytorch_model.bin +3 -0
runs/Aug01_21-21-27_d65c80f9321b/events.out.tfevents.1690924906.d65c80f9321b.55503.0 +3 -0
training_args.bin +3 -0

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ checkpoint-*/

config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "roberta-large",
+  "architectures": [
+    "RobertaForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.31.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

last-checkpoint/config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "roberta-large",
+  "architectures": [
+    "RobertaForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.31.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

last-checkpoint/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:21759dc17775ea80712a72f5be66373a890694852332f65217a5e271a80aa982
+size 2843527877

last-checkpoint/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ded85f15564a0a5a73731ea9b7b377d95dd03440c4cb8928751277cd06cdc4d5
+size 1421784309

last-checkpoint/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f247690aa2cfa7f6100b86902567fbef13db5f29c3c4cf2ea061ce4d25f70dc5
+size 14575

last-checkpoint/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:82580adad7ce40c3eac45f281ebe8a7bd91b11234150f83b34c3478021e858e8
+size 627

last-checkpoint/trainer_state.json ADDED Viewed

	@@ -0,0 +1,256 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.6268609935746748,
+  "global_step": 4000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.9e-06,
+      "loss": 1.7621,
+      "step": 100
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 9.800000000000001e-06,
+      "loss": 1.7046,
+      "step": 200
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.7e-06,
+      "loss": 1.6586,
+      "step": 300
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.600000000000001e-06,
+      "loss": 1.6464,
+      "step": 400
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.5e-06,
+      "loss": 1.6461,
+      "step": 500
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.4e-06,
+      "loss": 1.5963,
+      "step": 600
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 9.3e-06,
+      "loss": 1.5513,
+      "step": 700
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 9.200000000000002e-06,
+      "loss": 1.5487,
+      "step": 800
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 9.100000000000001e-06,
+      "loss": 1.5316,
+      "step": 900
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9e-06,
+      "loss": 1.5524,
+      "step": 1000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 8.900000000000001e-06,
+      "loss": 1.5747,
+      "step": 1100
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 8.8e-06,
+      "loss": 1.5415,
+      "step": 1200
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 8.700000000000001e-06,
+      "loss": 1.5311,
+      "step": 1300
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 8.6e-06,
+      "loss": 1.4764,
+      "step": 1400
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 8.5e-06,
+      "loss": 1.5302,
+      "step": 1500
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.400000000000001e-06,
+      "loss": 1.4754,
+      "step": 1600
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 8.3e-06,
+      "loss": 1.5213,
+      "step": 1700
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 8.2e-06,
+      "loss": 1.4992,
+      "step": 1800
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 8.1e-06,
+      "loss": 1.5058,
+      "step": 1900
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 8.000000000000001e-06,
+      "loss": 1.4867,
+      "step": 2000
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 7.9e-06,
+      "loss": 1.4597,
+      "step": 2100
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.800000000000002e-06,
+      "loss": 1.4773,
+      "step": 2200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 7.7e-06,
+      "loss": 1.5115,
+      "step": 2300
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 7.600000000000001e-06,
+      "loss": 1.4982,
+      "step": 2400
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 7.500000000000001e-06,
+      "loss": 1.4828,
+      "step": 2500
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 7.4e-06,
+      "loss": 1.4614,
+      "step": 2600
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 7.3e-06,
+      "loss": 1.4542,
+      "step": 2700
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 7.2000000000000005e-06,
+      "loss": 1.4889,
+      "step": 2800
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 7.100000000000001e-06,
+      "loss": 1.4332,
+      "step": 2900
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 7e-06,
+      "loss": 1.4508,
+      "step": 3000
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 6.9e-06,
+      "loss": 1.4392,
+      "step": 3100
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 6.800000000000001e-06,
+      "loss": 1.4277,
+      "step": 3200
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 6.700000000000001e-06,
+      "loss": 1.4442,
+      "step": 3300
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 6.600000000000001e-06,
+      "loss": 1.4844,
+      "step": 3400
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 6.5000000000000004e-06,
+      "loss": 1.4491,
+      "step": 3500
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 6.4000000000000006e-06,
+      "loss": 1.4142,
+      "step": 3600
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 6.300000000000001e-06,
+      "loss": 1.4191,
+      "step": 3700
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 6.200000000000001e-06,
+      "loss": 1.4256,
+      "step": 3800
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 6.1e-06,
+      "loss": 1.4562,
+      "step": 3900
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 6e-06,
+      "loss": 1.4447,
+      "step": 4000
+    }
+  ],
+  "max_steps": 10000,
+  "num_train_epochs": 2,
+  "total_flos": 1.864171542528e+16,
+  "trial_name": null,
+  "trial_params": null
+}

last-checkpoint/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7d5a5f64d5e8175546c0528e80f594e592e6ebd660f8df135b7da5d7f7e60d45
+size 4027

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ded85f15564a0a5a73731ea9b7b377d95dd03440c4cb8928751277cd06cdc4d5
+size 1421784309

runs/Aug01_21-21-27_d65c80f9321b/events.out.tfevents.1690924906.d65c80f9321b.55503.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d021fead98bae2cf18164b27fcd4bba304b599786cd02c034eb4254c9a1922e7
+size 10363

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7d5a5f64d5e8175546c0528e80f594e592e6ebd660f8df135b7da5d7f7e60d45
+size 4027