RikkiXu
/

zephyr-7b-sft-full

@@ -1,9 +1,9 @@
 {
     "epoch": 5.0,
-    "total_flos": 2420428819660800.0,
-    "train_loss": 0.44474206024387714,
-    "train_runtime": 64422.034,
     "train_samples": 83372,
-    "train_samples_per_second": 5.737,
     "train_steps_per_second": 0.045
 }

 {
     "epoch": 5.0,
+    "total_flos": 2395303260979200.0,
+    "train_loss": 0.44255039914921446,
+    "train_runtime": 63778.4258,
     "train_samples": 83372,
+    "train_samples_per_second": 5.733,
     "train_steps_per_second": 0.045
 }

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 5.0,
-    "total_flos": 2420428819660800.0,
-    "train_loss": 0.44474206024387714,
-    "train_runtime": 64422.034,
     "train_samples": 83372,
-    "train_samples_per_second": 5.737,
     "train_steps_per_second": 0.045
 }

 {
     "epoch": 5.0,
+    "total_flos": 2395303260979200.0,
+    "train_loss": 0.44255039914921446,
+    "train_runtime": 63778.4258,
     "train_samples": 83372,
+    "train_samples_per_second": 5.733,
     "train_steps_per_second": 0.045
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff