End of training

Browse files

Files changed (2) hide show

runs/Feb26_18-06-03_952abec28ae3/events.out.tfevents.1677434769.952abec28ae3.204.0 +2 -2
trainer_state.json +95 -0

runs/Feb26_18-06-03_952abec28ae3/events.out.tfevents.1677434769.952abec28ae3.204.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:074d47f37bbb3ae2b5f3c3c5d8b59566fc96271601d18835844a2df062371dd3
-size 6580

 version https://git-lfs.github.com/spec/v1
+oid sha256:eeba39cfd6e2e4a5bfff0b3467b61ed452214c05eb49b73b16b5bf09a27d103a
+size 6934

trainer_state.json ADDED Viewed

	@@ -0,0 +1,95 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 5.0,
+  "global_step": 470,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 8e-05,
+      "loss": 3.1316,
+      "step": 94
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 2.3430750370025635,
+      "eval_runtime": 37.4569,
+      "eval_samples_per_second": 5.339,
+      "eval_steps_per_second": 0.667,
+      "step": 94
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 6e-05,
+      "loss": 2.812,
+      "step": 188
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 2.2115001678466797,
+      "eval_runtime": 37.1409,
+      "eval_samples_per_second": 5.385,
+      "eval_steps_per_second": 0.673,
+      "step": 188
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 4e-05,
+      "loss": 2.8118,
+      "step": 282
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 1.984442949295044,
+      "eval_runtime": 37.3422,
+      "eval_samples_per_second": 5.356,
+      "eval_steps_per_second": 0.669,
+      "step": 282
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 2e-05,
+      "loss": 2.5555,
+      "step": 376
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 1.9309371709823608,
+      "eval_runtime": 37.2453,
+      "eval_samples_per_second": 5.37,
+      "eval_steps_per_second": 0.671,
+      "step": 376
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 0.0,
+      "loss": 2.4803,
+      "step": 470
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 1.8790072202682495,
+      "eval_runtime": 37.0224,
+      "eval_samples_per_second": 5.402,
+      "eval_steps_per_second": 0.675,
+      "step": 470
+    },
+    {
+      "epoch": 5.0,
+      "step": 470,
+      "total_flos": 1.7920966176e+18,
+      "train_loss": 2.7582357853016957,
+      "train_runtime": 1233.6665,
+      "train_samples_per_second": 3.04,
+      "train_steps_per_second": 0.381
+    }
+  ],
+  "max_steps": 470,
+  "num_train_epochs": 5,
+  "total_flos": 1.7920966176e+18,
+  "trial_name": null,
+  "trial_params": null
+}