AlekseyKorshuk
/

dalio-handwritten-io-1.3b

@@ -1,7 +1,7 @@
 {
     "epoch": 1.0,
     "train_loss": 2.7618001302083335,
-    "train_runtime": 2178.1486,
     "train_samples": 156,
     "train_samples_per_second": 0.072,
     "train_steps_per_second": 0.001

 {
     "epoch": 1.0,
     "train_loss": 2.7618001302083335,
+    "train_runtime": 2178.2199,
     "train_samples": 156,
     "train_samples_per_second": 0.072,
     "train_steps_per_second": 0.001

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 1.0,
     "train_loss": 2.7618001302083335,
-    "train_runtime": 2178.1486,
     "train_samples": 156,
     "train_samples_per_second": 0.072,
     "train_steps_per_second": 0.001

 {
     "epoch": 1.0,
     "train_loss": 2.7618001302083335,
+    "train_runtime": 2178.2199,
     "train_samples": 156,
     "train_samples_per_second": 0.072,
     "train_steps_per_second": 0.001

trainer_state.json CHANGED Viewed

@@ -9,7 +9,7 @@
   "log_history": [
     {
       "epoch": 0.33,
-      "learning_rate": 0,
       "loss": 2.6917,
       "step": 1
     },
@@ -17,14 +17,14 @@
       "epoch": 0.33,
       "eval_accuracy": 0.05304531642224865,
       "eval_loss": 2.66796875,
-      "eval_runtime": 1.8653,
-      "eval_samples_per_second": 15.547,
-      "eval_steps_per_second": 0.536,
       "step": 1
     },
     {
       "epoch": 0.67,
-      "learning_rate": 0,
       "loss": 2.8435,
       "step": 2
     },
@@ -32,14 +32,14 @@
       "epoch": 0.67,
       "eval_accuracy": 0.05304531642224865,
       "eval_loss": 2.66796875,
-      "eval_runtime": 2.1123,
-      "eval_samples_per_second": 13.729,
-      "eval_steps_per_second": 0.473,
       "step": 2
     },
     {
       "epoch": 1.0,
-      "learning_rate": 0.0,
       "loss": 2.7502,
       "step": 3
     },
@@ -47,9 +47,9 @@
       "epoch": 1.0,
       "eval_accuracy": 0.055489496630994846,
       "eval_loss": 2.6171875,
-      "eval_runtime": 1.0076,
-      "eval_samples_per_second": 28.782,
-      "eval_steps_per_second": 0.992,
       "step": 3
     },
     {
@@ -57,7 +57,7 @@
       "step": 3,
       "total_flos": 303365357568.0,
       "train_loss": 2.7618001302083335,
-      "train_runtime": 2178.1486,
       "train_samples_per_second": 0.072,
       "train_steps_per_second": 0.001
     }

   "log_history": [
     {
       "epoch": 0.33,
+      "learning_rate": 3e-05,
       "loss": 2.6917,
       "step": 1
     },
       "epoch": 0.33,
       "eval_accuracy": 0.05304531642224865,
       "eval_loss": 2.66796875,
+      "eval_runtime": 1.9177,
+      "eval_samples_per_second": 15.122,
+      "eval_steps_per_second": 0.521,
       "step": 1
     },
     {
       "epoch": 0.67,
+      "learning_rate": 3e-05,
       "loss": 2.8435,
       "step": 2
     },
       "epoch": 0.67,
       "eval_accuracy": 0.05304531642224865,
       "eval_loss": 2.66796875,
+      "eval_runtime": 1.7979,
+      "eval_samples_per_second": 16.13,
+      "eval_steps_per_second": 0.556,
       "step": 2
     },
     {
       "epoch": 1.0,
+      "learning_rate": 1.9999999999999998e-05,
       "loss": 2.7502,
       "step": 3
     },
       "epoch": 1.0,
       "eval_accuracy": 0.055489496630994846,
       "eval_loss": 2.6171875,
+      "eval_runtime": 1.4088,
+      "eval_samples_per_second": 20.586,
+      "eval_steps_per_second": 0.71,
       "step": 3
     },
     {
       "step": 3,
       "total_flos": 303365357568.0,
       "train_loss": 2.7618001302083335,
+      "train_runtime": 2178.2199,
       "train_samples_per_second": 0.072,
       "train_steps_per_second": 0.001
     }