Training in progress, epoch 1

Browse files

Files changed (9) hide show

all_results.json +9 -9
eval_results.json +3 -3
predict_results.json +3 -3
pytorch_model.bin +1 -1
runs/Mar25_21-10-32_kogecha/events.out.tfevents.1711371554.kogecha +3 -0
runs/Mar26_15-40-21_kogecha/events.out.tfevents.1711435232.kogecha +3 -0
train_results.json +3 -3
trainer_state.json +18 -18
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -6,23 +6,23 @@
     "eval_rouge2": 3.1211,
     "eval_rougeL": 10.9379,
     "eval_rougeLsum": 15.8203,
-    "eval_runtime": 325.973,
     "eval_samples": 286,
-    "eval_samples_per_second": 0.877,
-    "eval_steps_per_second": 0.877,
     "predict_gen_len": 86.58898305084746,
     "predict_loss": 3.0853381156921387,
     "predict_rouge1": 18.1172,
     "predict_rouge2": 3.4127,
     "predict_rougeL": 11.2062,
     "predict_rougeLsum": 12.5441,
-    "predict_runtime": 230.6039,
     "predict_samples": 236,
-    "predict_samples_per_second": 1.023,
-    "predict_steps_per_second": 1.023,
     "train_loss": 0.4568321267587167,
-    "train_runtime": 2607.0463,
     "train_samples": 2025,
-    "train_samples_per_second": 3.884,
-    "train_steps_per_second": 3.884
 }

     "eval_rouge2": 3.1211,
     "eval_rougeL": 10.9379,
     "eval_rougeLsum": 15.8203,
+    "eval_runtime": 321.129,
     "eval_samples": 286,
+    "eval_samples_per_second": 0.891,
+    "eval_steps_per_second": 0.891,
     "predict_gen_len": 86.58898305084746,
     "predict_loss": 3.0853381156921387,
     "predict_rouge1": 18.1172,
     "predict_rouge2": 3.4127,
     "predict_rougeL": 11.2062,
     "predict_rougeLsum": 12.5441,
+    "predict_runtime": 225.8529,
     "predict_samples": 236,
+    "predict_samples_per_second": 1.045,
+    "predict_steps_per_second": 1.045,
     "train_loss": 0.4568321267587167,
+    "train_runtime": 2567.7496,
     "train_samples": 2025,
+    "train_samples_per_second": 3.943,
+    "train_steps_per_second": 3.943
 }

eval_results.json CHANGED Viewed

@@ -6,8 +6,8 @@
     "eval_rouge2": 3.1211,
     "eval_rougeL": 10.9379,
     "eval_rougeLsum": 15.8203,
-    "eval_runtime": 325.973,
     "eval_samples": 286,
-    "eval_samples_per_second": 0.877,
-    "eval_steps_per_second": 0.877
 }

     "eval_rouge2": 3.1211,
     "eval_rougeL": 10.9379,
     "eval_rougeLsum": 15.8203,
+    "eval_runtime": 321.129,
     "eval_samples": 286,
+    "eval_samples_per_second": 0.891,
+    "eval_steps_per_second": 0.891
 }

predict_results.json CHANGED Viewed

@@ -5,8 +5,8 @@
     "predict_rouge2": 3.4127,
     "predict_rougeL": 11.2062,
     "predict_rougeLsum": 12.5441,
-    "predict_runtime": 230.6039,
     "predict_samples": 236,
-    "predict_samples_per_second": 1.023,
-    "predict_steps_per_second": 1.023
 }

     "predict_rouge2": 3.4127,
     "predict_rougeL": 11.2062,
     "predict_rougeLsum": 12.5441,
+    "predict_runtime": 225.8529,
     "predict_samples": 236,
+    "predict_samples_per_second": 1.045,
+    "predict_steps_per_second": 1.045
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6902d1896ca8ad19f375b35d44d9e224ebd29fbc4199844044daccae0714ecc4
 size 501807853

 version https://git-lfs.github.com/spec/v1
+oid sha256:479a16662531508b9f6eeda30775691b89ca046731b6cce103ef89e37dd889c1
 size 501807853

runs/Mar25_21-10-32_kogecha/events.out.tfevents.1711371554.kogecha ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b1959bdf24bdb87157ee62a6e57719d9bec11ec5ca7920cd98b3ee9a570bb2e
+size 565

runs/Mar26_15-40-21_kogecha/events.out.tfevents.1711435232.kogecha ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5e0e85d9e8010a68e7db22ca0f54222a780cd88f4c034241da7ec79c9785fac
+size 6326

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 5.0,
     "train_loss": 0.4568321267587167,
-    "train_runtime": 2607.0463,
     "train_samples": 2025,
-    "train_samples_per_second": 3.884,
-    "train_steps_per_second": 3.884
 }

 {
     "epoch": 5.0,
     "train_loss": 0.4568321267587167,
+    "train_runtime": 2567.7496,
     "train_samples": 2025,
+    "train_samples_per_second": 3.943,
+    "train_steps_per_second": 3.943
 }

trainer_state.json CHANGED Viewed

@@ -39,9 +39,9 @@
       "eval_rouge2": 1.2888,
       "eval_rougeL": 11.0128,
       "eval_rougeLsum": 15.2802,
-      "eval_runtime": 271.0079,
-      "eval_samples_per_second": 1.055,
-      "eval_steps_per_second": 1.055,
       "step": 2025
     },
     {
@@ -76,9 +76,9 @@
       "eval_rouge2": 2.8091,
       "eval_rougeL": 10.9133,
       "eval_rougeLsum": 15.4068,
-      "eval_runtime": 323.1836,
-      "eval_samples_per_second": 0.885,
-      "eval_steps_per_second": 0.885,
       "step": 4050
     },
     {
@@ -113,9 +113,9 @@
       "eval_rouge2": 3.0026,
       "eval_rougeL": 10.272,
       "eval_rougeLsum": 14.0716,
-      "eval_runtime": 284.0477,
-      "eval_samples_per_second": 1.007,
-      "eval_steps_per_second": 1.007,
       "step": 6075
     },
     {
@@ -150,9 +150,9 @@
       "eval_rouge2": 2.9937,
       "eval_rougeL": 10.8765,
       "eval_rougeLsum": 15.6203,
-      "eval_runtime": 330.0914,
-      "eval_samples_per_second": 0.866,
-      "eval_steps_per_second": 0.866,
       "step": 8100
     },
     {
@@ -187,9 +187,9 @@
       "eval_rouge2": 3.1211,
       "eval_rougeL": 10.9379,
       "eval_rougeLsum": 15.8203,
-      "eval_runtime": 325.8967,
-      "eval_samples_per_second": 0.878,
-      "eval_steps_per_second": 0.878,
       "step": 10125
     },
     {
@@ -197,9 +197,9 @@
       "step": 10125,
       "total_flos": 1931007009669120.0,
       "train_loss": 0.4568321267587167,
-      "train_runtime": 2607.0463,
-      "train_samples_per_second": 3.884,
-      "train_steps_per_second": 3.884
     }
   ],
   "max_steps": 10125,

       "eval_rouge2": 1.2888,
       "eval_rougeL": 11.0128,
       "eval_rougeLsum": 15.2802,
+      "eval_runtime": 269.5917,
+      "eval_samples_per_second": 1.061,
+      "eval_steps_per_second": 1.061,
       "step": 2025
     },
     {
       "eval_rouge2": 2.8091,
       "eval_rougeL": 10.9133,
       "eval_rougeLsum": 15.4068,
+      "eval_runtime": 324.1284,
+      "eval_samples_per_second": 0.882,
+      "eval_steps_per_second": 0.882,
       "step": 4050
     },
     {
       "eval_rouge2": 3.0026,
       "eval_rougeL": 10.272,
       "eval_rougeLsum": 14.0716,
+      "eval_runtime": 281.1095,
+      "eval_samples_per_second": 1.017,
+      "eval_steps_per_second": 1.017,
       "step": 6075
     },
     {
       "eval_rouge2": 2.9937,
       "eval_rougeL": 10.8765,
       "eval_rougeLsum": 15.6203,
+      "eval_runtime": 326.4072,
+      "eval_samples_per_second": 0.876,
+      "eval_steps_per_second": 0.876,
       "step": 8100
     },
     {
       "eval_rouge2": 3.1211,
       "eval_rougeL": 10.9379,
       "eval_rougeLsum": 15.8203,
+      "eval_runtime": 320.7013,
+      "eval_samples_per_second": 0.892,
+      "eval_steps_per_second": 0.892,
       "step": 10125
     },
     {
       "step": 10125,
       "total_flos": 1931007009669120.0,
       "train_loss": 0.4568321267587167,
+      "train_runtime": 2567.7496,
+      "train_samples_per_second": 3.943,
+      "train_steps_per_second": 3.943
     }
   ],
   "max_steps": 10125,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8e91fdc4916eb357868104630614f50db0dcc76a3bf28942892263aca3556690
 size 4475

 version https://git-lfs.github.com/spec/v1
+oid sha256:c1f06036d74c60635455d9d063b586bccc9945de86b85390e3d282dc4ada8f2c
 size 4475