End of training

Files changed (5) hide show

all_results.json CHANGED Viewed

@@ -2,14 +2,14 @@
     "epoch": 1.0,
     "eval_accuracy": 0.796813717099257,
     "eval_loss": 1.4686633348464966,
-    "eval_runtime": 1598.4891,
     "eval_samples": 71199,
-    "eval_samples_per_second": 44.541,
-    "eval_steps_per_second": 1.392,
     "perplexity": 4.3434255536068305,
     "train_loss": 1.455913220122233,
-    "train_runtime": 35811.6134,
     "train_samples": 1353936,
-    "train_samples_per_second": 37.807,
-    "train_steps_per_second": 1.181
 }

     "epoch": 1.0,
     "eval_accuracy": 0.796813717099257,
     "eval_loss": 1.4686633348464966,
+    "eval_runtime": 1595.6894,
     "eval_samples": 71199,
+    "eval_samples_per_second": 44.62,
+    "eval_steps_per_second": 1.394,
     "perplexity": 4.3434255536068305,
     "train_loss": 1.455913220122233,
+    "train_runtime": 36443.3148,
     "train_samples": 1353936,
+    "train_samples_per_second": 37.152,
+    "train_steps_per_second": 1.161
 }

eval_results.json CHANGED Viewed

@@ -2,9 +2,9 @@
     "epoch": 1.0,
     "eval_accuracy": 0.796813717099257,
     "eval_loss": 1.4686633348464966,
-    "eval_runtime": 1598.4891,
     "eval_samples": 71199,
-    "eval_samples_per_second": 44.541,
-    "eval_steps_per_second": 1.392,
     "perplexity": 4.3434255536068305
 }

     "epoch": 1.0,
     "eval_accuracy": 0.796813717099257,
     "eval_loss": 1.4686633348464966,
+    "eval_runtime": 1595.6894,
     "eval_samples": 71199,
+    "eval_samples_per_second": 44.62,
+    "eval_steps_per_second": 1.394,
     "perplexity": 4.3434255536068305
 }

runs/Oct21_20-37-03_hkmustamd-Super-Server/events.out.tfevents.1729553061.hkmustamd-Super-Server.3374618.2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:dda7848145c90b1626014807c75dac9bdb3a7ebdc3099c9d837f3adab67fcc12
+size 417

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
     "train_loss": 1.455913220122233,
-    "train_runtime": 35811.6134,
     "train_samples": 1353936,
-    "train_samples_per_second": 37.807,
-    "train_steps_per_second": 1.181
 }

 {
     "epoch": 1.0,
     "train_loss": 1.455913220122233,
+    "train_runtime": 36443.3148,
     "train_samples": 1353936,
+    "train_samples_per_second": 37.152,
+    "train_steps_per_second": 1.161
 }

trainer_state.json CHANGED Viewed

@@ -516,9 +516,9 @@
       "step": 42311,
       "total_flos": 4.127720706618163e+17,
       "train_loss": 1.455913220122233,
-      "train_runtime": 35811.6134,
-      "train_samples_per_second": 37.807,
-      "train_steps_per_second": 1.181
     }
   ],
   "max_steps": 42311,

       "step": 42311,
       "total_flos": 4.127720706618163e+17,
       "train_loss": 1.455913220122233,
+      "train_runtime": 36443.3148,
+      "train_samples_per_second": 37.152,
+      "train_steps_per_second": 1.161
     }
   ],
   "max_steps": 42311,