End of training

Files changed (5) hide show

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 10.0,
-    "eval_accuracy": 0.9874,
-    "eval_loss": 0.034222181886434555,
-    "eval_runtime": 60.0131,
-    "eval_samples_per_second": 166.63,
-    "eval_steps_per_second": 5.216,
-    "total_flos": 2.23628338666187e+19,
-    "train_loss": 0.1441501469903786,
-    "train_runtime": 13283.8875,
-    "train_samples_per_second": 67.751,
-    "train_steps_per_second": 0.529
 }

 {
     "epoch": 10.0,
+    "eval_accuracy": 0.9833333333333333,
+    "eval_loss": 0.04612118750810623,
+    "eval_runtime": 108.8524,
+    "eval_samples_per_second": 275.602,
+    "eval_steps_per_second": 8.617,
+    "total_flos": 1.73991922900992e+19,
+    "train_loss": 0.15263754843139998,
+    "train_runtime": 7208.4995,
+    "train_samples_per_second": 97.108,
+    "train_steps_per_second": 0.759
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 10.0,
-    "eval_accuracy": 0.9874,
-    "eval_loss": 0.034222181886434555,
-    "eval_runtime": 60.0131,
-    "eval_samples_per_second": 166.63,
-    "eval_steps_per_second": 5.216
 }

 {
     "epoch": 10.0,
+    "eval_accuracy": 0.9833333333333333,
+    "eval_loss": 0.04612118750810623,
+    "eval_runtime": 108.8524,
+    "eval_samples_per_second": 275.602,
+    "eval_steps_per_second": 8.617
 }

runs/Apr20_16-04-35_d1e86387316e/events.out.tfevents.1713637357.d1e86387316e.395.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:7c34655e59c12c79c92ffe6760960cac4bea3b1f78b7e0abec145b3715554687
+size 411

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 10.0,
-    "total_flos": 2.23628338666187e+19,
-    "train_loss": 0.1441501469903786,
-    "train_runtime": 13283.8875,
-    "train_samples_per_second": 67.751,
-    "train_steps_per_second": 0.529
 }

 {
     "epoch": 10.0,
+    "total_flos": 1.73991922900992e+19,
+    "train_loss": 0.15263754843139998,
+    "train_runtime": 7208.4995,
+    "train_samples_per_second": 97.108,
+    "train_steps_per_second": 0.759
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff