End of training

Files changed (5) hide show

all_results.json ADDED Viewed

+{
+    "epoch": 1.0,
+    "eval_loss": 3.0140793323516846,
+    "eval_runtime": 22.3191,
+    "eval_samples": 991,
+    "eval_samples_per_second": 44.401,
+    "eval_steps_per_second": 22.223,
+    "train_loss": 3.5130721891769254,
+    "train_runtime": 755.7574,
+    "train_samples": 3960,
+    "train_samples_per_second": 5.24,
+    "train_steps_per_second": 2.62
+}

eval_results.json ADDED Viewed

+{
+    "epoch": 1.0,
+    "eval_loss": 3.0140793323516846,
+    "eval_runtime": 22.3191,
+    "eval_samples": 991,
+    "eval_samples_per_second": 44.401,
+    "eval_steps_per_second": 22.223
+}

runs/Oct20_17-43-48_f2ba06383ef5/events.out.tfevents.1666291586.f2ba06383ef5.200.2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:406f42ce8a2c89ac5393e8f1ddab2ca9c1568194e6d903992b47d8908ccafc0d
+size 311

train_results.json ADDED Viewed

+{
+    "epoch": 1.0,
+    "train_loss": 3.5130721891769254,
+    "train_runtime": 755.7574,
+    "train_samples": 3960,
+    "train_samples_per_second": 5.24,
+    "train_steps_per_second": 2.62
+}

trainer_state.json ADDED Viewed

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 1980,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.314606741573035e-06,
+      "loss": 4.2194,
+      "step": 500
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.50561797752809e-06,
+      "loss": 3.3918,
+      "step": 1000
+    },
+    {
+      "epoch": 0.51,
+      "eval_loss": 3.1021862030029297,
+      "eval_runtime": 23.3073,
+      "eval_samples_per_second": 42.519,
+      "eval_steps_per_second": 21.281,
+      "step": 1000
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 2.696629213483146e-06,
+      "loss": 3.2545,
+      "step": 1500
+    },
+    {
+      "epoch": 1.0,
+      "step": 1980,
+      "total_flos": 306526787665920.0,
+      "train_loss": 3.5130721891769254,
+      "train_runtime": 755.7574,
+      "train_samples_per_second": 5.24,
+      "train_steps_per_second": 2.62
+    }
+  ],
+  "max_steps": 1980,
+  "num_train_epochs": 1,
+  "total_flos": 306526787665920.0,
+  "trial_name": null,
+  "trial_params": null
+}