End of training

Browse files

Files changed (6) hide show

all_results.json +14 -0
eval_results.json +9 -0
runs/Sep23_04-38-21_patrick-general-gpu/events.out.tfevents.1632371921.patrick-general-gpu.956617.0 +2 -2
runs/Sep23_04-38-21_patrick-general-gpu/events.out.tfevents.1632372749.patrick-general-gpu.956617.2 +3 -0
train_results.json +8 -0
trainer_state.json +100 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "epoch": 5.0,
+    "eval_accuracy": 0.352112676056338,
+    "eval_loss": 0.7087209820747375,
+    "eval_runtime": 2.3558,
+    "eval_samples": 71,
+    "eval_samples_per_second": 30.138,
+    "eval_steps_per_second": 3.82,
+    "train_loss": 0.7095118300719832,
+    "train_runtime": 808.1685,
+    "train_samples": 635,
+    "train_samples_per_second": 3.929,
+    "train_steps_per_second": 0.984
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 5.0,
+    "eval_accuracy": 0.352112676056338,
+    "eval_loss": 0.7087209820747375,
+    "eval_runtime": 2.3558,
+    "eval_samples": 71,
+    "eval_samples_per_second": 30.138,
+    "eval_steps_per_second": 3.82
+}

runs/Sep23_04-38-21_patrick-general-gpu/events.out.tfevents.1632371921.patrick-general-gpu.956617.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:13ea0296a707ff907ede8a33e0a8facb9c6778135ccc7dd4e9793b9007aeb452
-size 5841

 version https://git-lfs.github.com/spec/v1
+oid sha256:8a0da1306767c96c874bd1d7aeea86e55211a4331fa593f273aaa80076dd6cbd
+size 6195

runs/Sep23_04-38-21_patrick-general-gpu/events.out.tfevents.1632372749.patrick-general-gpu.956617.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:18933365f16286c495d1ae2bcddae7788b35319295e9d6517ea967167a128ea2
+size 363

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 5.0,
+    "train_loss": 0.7095118300719832,
+    "train_runtime": 808.1685,
+    "train_samples": 635,
+    "train_samples_per_second": 3.929,
+    "train_steps_per_second": 0.984
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,100 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 5.0,
+  "global_step": 795,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 1.6000000000000003e-05,
+      "loss": 0.7114,
+      "step": 159
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5633802816901409,
+      "eval_loss": 0.6923297047615051,
+      "eval_runtime": 2.3107,
+      "eval_samples_per_second": 30.726,
+      "eval_steps_per_second": 3.895,
+      "step": 159
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 1.2e-05,
+      "loss": 0.7141,
+      "step": 318
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.5633802816901409,
+      "eval_loss": 0.6894838809967041,
+      "eval_runtime": 2.3191,
+      "eval_samples_per_second": 30.616,
+      "eval_steps_per_second": 3.881,
+      "step": 318
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 8.000000000000001e-06,
+      "loss": 0.7063,
+      "step": 477
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.5633802816901409,
+      "eval_loss": 0.6930345296859741,
+      "eval_runtime": 2.3253,
+      "eval_samples_per_second": 30.534,
+      "eval_steps_per_second": 3.87,
+      "step": 477
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 4.000000000000001e-06,
+      "loss": 0.712,
+      "step": 636
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.4507042253521127,
+      "eval_loss": 0.707716703414917,
+      "eval_runtime": 2.3283,
+      "eval_samples_per_second": 30.494,
+      "eval_steps_per_second": 3.865,
+      "step": 636
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 0.0,
+      "loss": 0.7037,
+      "step": 795
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.352112676056338,
+      "eval_loss": 0.7087209820747375,
+      "eval_runtime": 2.3213,
+      "eval_samples_per_second": 30.586,
+      "eval_steps_per_second": 3.877,
+      "step": 795
+    },
+    {
+      "epoch": 5.0,
+      "step": 795,
+      "total_flos": 2958882078566400.0,
+      "train_loss": 0.7095118300719832,
+      "train_runtime": 808.1685,
+      "train_samples_per_second": 3.929,
+      "train_steps_per_second": 0.984
+    }
+  ],
+  "max_steps": 795,
+  "num_train_epochs": 5,
+  "total_flos": 2958882078566400.0,
+  "trial_name": null,
+  "trial_params": null
+}