End of training

Files changed (5) hide show

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 3.0,
-    "eval_accuracy": 0.9901,
-    "eval_loss": 0.03231855481863022,
-    "eval_runtime": 133.8531,
-    "eval_samples_per_second": 74.709,
-    "eval_steps_per_second": 4.669,
-    "total_flos": 2.091911758043834e+19,
-    "train_loss": 0.13970869080807824,
-    "train_runtime": 10165.3024,
-    "train_samples_per_second": 26.561,
-    "train_steps_per_second": 0.415
 }

 {
+    "epoch": 10.0,
+    "eval_accuracy": 0.9931,
+    "eval_loss": 0.02777969278395176,
+    "eval_runtime": 46.8321,
+    "eval_samples_per_second": 213.529,
+    "eval_steps_per_second": 13.346,
+    "total_flos": 6.9730391934794465e+19,
+    "train_loss": 0.0988586475932242,
+    "train_runtime": 11106.5671,
+    "train_samples_per_second": 81.033,
+    "train_steps_per_second": 1.266
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 3.0,
-    "eval_accuracy": 0.9901,
-    "eval_loss": 0.03231855481863022,
-    "eval_runtime": 133.8531,
-    "eval_samples_per_second": 74.709,
-    "eval_steps_per_second": 4.669
 }

 {
+    "epoch": 10.0,
+    "eval_accuracy": 0.9931,
+    "eval_loss": 0.02777969278395176,
+    "eval_runtime": 46.8321,
+    "eval_samples_per_second": 213.529,
+    "eval_steps_per_second": 13.346
 }

runs/Apr16_03-59-49_8252f766fecd/events.out.tfevents.1713251252.8252f766fecd.697.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d778641bf3daf9c895fda78c6be7594e36ddf1886466b01c5673a671e1f045b4
+size 411

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 3.0,
-    "total_flos": 2.091911758043834e+19,
-    "train_loss": 0.13970869080807824,
-    "train_runtime": 10165.3024,
-    "train_samples_per_second": 26.561,
-    "train_steps_per_second": 0.415
 }

 {
+    "epoch": 10.0,
+    "total_flos": 6.9730391934794465e+19,
+    "train_loss": 0.0988586475932242,
+    "train_runtime": 11106.5671,
+    "train_samples_per_second": 81.033,
+    "train_steps_per_second": 1.266
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff