End of training

Files changed (6) hide show

all_results.json CHANGED Viewed

@@ -1,28 +1,28 @@
 {
     "epoch": 3.0,
-    "eval_gen_len": 210.0806,
-    "eval_loss": 1.6125962734222412,
-    "eval_rouge1": 47.06,
-    "eval_rouge2": 24.4723,
-    "eval_rougeL": 29.7398,
-    "eval_rougeLsum": 44.8711,
-    "eval_runtime": 793.256,
-    "eval_samples": 757,
-    "eval_samples_per_second": 0.954,
-    "eval_steps_per_second": 0.16,
-    "predict_gen_len": 210.0806,
-    "predict_loss": 1.6125962734222412,
-    "predict_rouge1": 47.06,
-    "predict_rouge2": 24.4723,
-    "predict_rougeL": 29.7398,
-    "predict_rougeLsum": 44.8711,
-    "predict_runtime": 796.6823,
-    "predict_samples": 757,
-    "predict_samples_per_second": 0.95,
-    "predict_steps_per_second": 0.159,
-    "train_loss": 1.690134874428853,
-    "train_runtime": 978.58,
-    "train_samples": 3028,
-    "train_samples_per_second": 9.283,
-    "train_steps_per_second": 1.548
 }

 {
     "epoch": 3.0,
+    "eval_gen_len": 245.1964,
+    "eval_loss": 1.4946045875549316,
+    "eval_rouge1": 53.216,
+    "eval_rouge2": 27.3466,
+    "eval_rougeL": 32.1459,
+    "eval_rougeLsum": 50.6437,
+    "eval_runtime": 1546.4204,
+    "eval_samples": 1568,
+    "eval_samples_per_second": 1.014,
+    "eval_steps_per_second": 0.043,
+    "predict_gen_len": 245.1964,
+    "predict_loss": 1.4946045875549316,
+    "predict_rouge1": 53.216,
+    "predict_rouge2": 27.3466,
+    "predict_rougeL": 32.1459,
+    "predict_rougeLsum": 50.6437,
+    "predict_runtime": 1584.3545,
+    "predict_samples": 1568,
+    "predict_samples_per_second": 0.99,
+    "predict_steps_per_second": 0.042,
+    "train_loss": 1.6920310260382014,
+    "train_runtime": 827.5296,
+    "train_samples": 6271,
+    "train_samples_per_second": 22.734,
+    "train_steps_per_second": 0.95
 }

eval_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 3.0,
-    "eval_gen_len": 210.0806,
-    "eval_loss": 1.6125962734222412,
-    "eval_rouge1": 47.06,
-    "eval_rouge2": 24.4723,
-    "eval_rougeL": 29.7398,
-    "eval_rougeLsum": 44.8711,
-    "eval_runtime": 793.256,
-    "eval_samples": 757,
-    "eval_samples_per_second": 0.954,
-    "eval_steps_per_second": 0.16
 }

 {
     "epoch": 3.0,
+    "eval_gen_len": 245.1964,
+    "eval_loss": 1.4946045875549316,
+    "eval_rouge1": 53.216,
+    "eval_rouge2": 27.3466,
+    "eval_rougeL": 32.1459,
+    "eval_rougeLsum": 50.6437,
+    "eval_runtime": 1546.4204,
+    "eval_samples": 1568,
+    "eval_samples_per_second": 1.014,
+    "eval_steps_per_second": 0.043
 }

generated_predictions.txt CHANGED Viewed

The diff for this file is too large to render. See raw diff

predict_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "predict_gen_len": 210.0806,
-    "predict_loss": 1.6125962734222412,
-    "predict_rouge1": 47.06,
-    "predict_rouge2": 24.4723,
-    "predict_rougeL": 29.7398,
-    "predict_rougeLsum": 44.8711,
-    "predict_runtime": 796.6823,
-    "predict_samples": 757,
-    "predict_samples_per_second": 0.95,
-    "predict_steps_per_second": 0.159
 }

 {
+    "predict_gen_len": 245.1964,
+    "predict_loss": 1.4946045875549316,
+    "predict_rouge1": 53.216,
+    "predict_rouge2": 27.3466,
+    "predict_rougeL": 32.1459,
+    "predict_rougeLsum": 50.6437,
+    "predict_runtime": 1584.3545,
+    "predict_samples": 1568,
+    "predict_samples_per_second": 0.99,
+    "predict_steps_per_second": 0.042
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 3.0,
-    "train_loss": 1.690134874428853,
-    "train_runtime": 978.58,
-    "train_samples": 3028,
-    "train_samples_per_second": 9.283,
-    "train_steps_per_second": 1.548
 }

 {
     "epoch": 3.0,
+    "train_loss": 1.6920310260382014,
+    "train_runtime": 827.5296,
+    "train_samples": 6271,
+    "train_samples_per_second": 22.734,
+    "train_steps_per_second": 0.95
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff