End of training

Browse files

Files changed (6) hide show

all_results.json +16 -0
eval_results.json +11 -0
runs/Sep19_13-18-31_patrick-general-gpu/events.out.tfevents.1632057532.patrick-general-gpu.502385.0 +2 -2
runs/Sep19_13-18-31_patrick-general-gpu/events.out.tfevents.1632058180.patrick-general-gpu.502385.2 +3 -0
train_results.json +8 -0
trainer_state.json +76 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+    "epoch": 3.0,
+    "eval_combined_score": 0.8911934607933856,
+    "eval_loss": 0.48608845472335815,
+    "eval_pearson": 0.8925961944446151,
+    "eval_runtime": 15.3906,
+    "eval_samples": 1500,
+    "eval_samples_per_second": 97.462,
+    "eval_spearmanr": 0.8897907271421561,
+    "eval_steps_per_second": 12.215,
+    "train_loss": 0.5799058207759151,
+    "train_runtime": 624.1289,
+    "train_samples": 5749,
+    "train_samples_per_second": 27.634,
+    "train_steps_per_second": 1.73
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+    "epoch": 3.0,
+    "eval_combined_score": 0.8911934607933856,
+    "eval_loss": 0.48608845472335815,
+    "eval_pearson": 0.8925961944446151,
+    "eval_runtime": 15.3906,
+    "eval_samples": 1500,
+    "eval_samples_per_second": 97.462,
+    "eval_spearmanr": 0.8897907271421561,
+    "eval_steps_per_second": 12.215
+}

runs/Sep19_13-18-31_patrick-general-gpu/events.out.tfevents.1632057532.patrick-general-gpu.502385.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1f8fa42dbca16738cc0bacc6e4126c5b4f724d3f61a549777a2eec76ae11ec3
-size 4958

 version https://git-lfs.github.com/spec/v1
+oid sha256:c2aad9b117f2b5848ee75cd7edb5a2e76259f704bd52c837b78b9392b4d0d0ce
+size 5312

runs/Sep19_13-18-31_patrick-general-gpu/events.out.tfevents.1632058180.patrick-general-gpu.502385.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:29b0e18d7a46bf1019237cc31b3372617bffdea4fe949b8819aa8f73ebc32ea1
+size 473

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "train_loss": 0.5799058207759151,
+    "train_runtime": 624.1289,
+    "train_samples": 5749,
+    "train_samples_per_second": 27.634,
+    "train_steps_per_second": 1.73
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,76 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "global_step": 1080,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 1.1174,
+      "step": 360
+    },
+    {
+      "epoch": 1.0,
+      "eval_combined_score": 0.8815940360468737,
+      "eval_loss": 0.5000496506690979,
+      "eval_pearson": 0.8832304460348288,
+      "eval_runtime": 15.5329,
+      "eval_samples_per_second": 96.569,
+      "eval_spearmanr": 0.8799576260589187,
+      "eval_steps_per_second": 12.103,
+      "step": 360
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 0.3835,
+      "step": 720
+    },
+    {
+      "epoch": 2.0,
+      "eval_combined_score": 0.8901405153644659,
+      "eval_loss": 0.4672209620475769,
+      "eval_pearson": 0.8914800693934992,
+      "eval_runtime": 15.3324,
+      "eval_samples_per_second": 97.832,
+      "eval_spearmanr": 0.8888009613354327,
+      "eval_steps_per_second": 12.262,
+      "step": 720
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 0.0,
+      "loss": 0.2388,
+      "step": 1080
+    },
+    {
+      "epoch": 3.0,
+      "eval_combined_score": 0.8911934607933856,
+      "eval_loss": 0.48608845472335815,
+      "eval_pearson": 0.8925961944446151,
+      "eval_runtime": 15.3291,
+      "eval_samples_per_second": 97.853,
+      "eval_spearmanr": 0.8897907271421561,
+      "eval_steps_per_second": 12.264,
+      "step": 1080
+    },
+    {
+      "epoch": 3.0,
+      "step": 1080,
+      "total_flos": 4537835628033024.0,
+      "train_loss": 0.5799058207759151,
+      "train_runtime": 624.1289,
+      "train_samples_per_second": 27.634,
+      "train_steps_per_second": 1.73
+    }
+  ],
+  "max_steps": 1080,
+  "num_train_epochs": 3,
+  "total_flos": 4537835628033024.0,
+  "trial_name": null,
+  "trial_params": null
+}