End of training

Files changed (8) hide show

.gitattributes CHANGED Viewed

@@ -26,3 +26,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+eval_nbest_predictions.json filter=lfs diff=lfs merge=lfs -text

all_results.json CHANGED Viewed

@@ -1,8 +1,11 @@
 {
     "epoch": 2.0,
     "train_loss": 1.088201597354519,
-    "train_runtime": 719.9384,
     "train_samples": 88550,
-    "train_samples_per_second": 245.993,
-    "train_steps_per_second": 1.92
 }

 {
     "epoch": 2.0,
+    "eval_exact_match": 87.01040681173131,
+    "eval_f1": 92.97352589089498,
+    "eval_samples": 10788,
     "train_loss": 1.088201597354519,
+    "train_runtime": 783.526,
     "train_samples": 88550,
+    "train_samples_per_second": 226.03,
+    "train_steps_per_second": 1.764
 }

eval_nbest_predictions.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e6db3c582affb4fc1a6cccc9f461721100b335e4094fc6f4b5708b14e49d3cd2
+size 45927734

eval_predictions.json ADDED Viewed

The diff for this file is too large to render. See raw diff

eval_results.json ADDED Viewed

+{
+    "epoch": 2.0,
+    "eval_exact_match": 87.01040681173131,
+    "eval_f1": 92.97352589089498,
+    "eval_samples": 10788
+}

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:26181949daf0a3b96f33978b8a607d3a4f8bf5308e8fb64db8072291df9a61bd
 size 277274547

 version https://git-lfs.github.com/spec/v1
+oid sha256:5c53de7a6f355194542f010b25d2591fb9ca83acda557a8734b3b17ed060f8d9
 size 277274547

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 2.0,
     "train_loss": 1.088201597354519,
-    "train_runtime": 719.9384,
     "train_samples": 88550,
-    "train_samples_per_second": 245.993,
-    "train_steps_per_second": 1.92
 }

 {
     "epoch": 2.0,
     "train_loss": 1.088201597354519,
+    "train_runtime": 783.526,
     "train_samples": 88550,
+    "train_samples_per_second": 226.03,
+    "train_steps_per_second": 1.764
 }

trainer_state.json CHANGED Viewed

@@ -840,9 +840,9 @@
       "step": 1382,
       "total_flos": 5.175834887457866e+18,
       "train_loss": 1.088201597354519,
-      "train_runtime": 719.9384,
-      "train_samples_per_second": 245.993,
-      "train_steps_per_second": 1.92
     }
   ],
   "max_steps": 1382,

       "step": 1382,
       "total_flos": 5.175834887457866e+18,
       "train_loss": 1.088201597354519,
+      "train_runtime": 783.526,
+      "train_samples_per_second": 226.03,
+      "train_steps_per_second": 1.764
     }
   ],
   "max_steps": 1382,