End of training

Browse files

Files changed (5) hide show

all_results.json +8 -8
eval_results.json +4 -4
runs/Dec16_20-12-50_129-146-104-29/events.out.tfevents.1671223965.129-146-104-29.144289.2 +3 -0
train_results.json +5 -5
trainer_state.json +322 -12

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
-    "epoch": 63.29,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
-    "eval_runtime": 44.5084,
     "eval_samples": 481,
-    "eval_samples_per_second": 10.807,
-    "eval_steps_per_second": 1.371,
     "eval_wer": 0.5156036834924966,
-    "train_loss": 0.05515483856201172,
-    "train_runtime": 2237.6776,
     "train_samples": 2528,
-    "train_samples_per_second": 71.503,
-    "train_steps_per_second": 2.234
 }

 {
+    "epoch": 69.62,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
+    "eval_runtime": 45.2212,
     "eval_samples": 481,
+    "eval_samples_per_second": 10.637,
+    "eval_steps_per_second": 1.349,
     "eval_wer": 0.5156036834924966,
+    "train_loss": 0.04894279766082764,
+    "train_runtime": 2118.6173,
     "train_samples": 2528,
+    "train_samples_per_second": 83.073,
+    "train_steps_per_second": 2.596
 }

eval_results.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-    "epoch": 63.29,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
-    "eval_runtime": 44.5084,
     "eval_samples": 481,
-    "eval_samples_per_second": 10.807,
-    "eval_steps_per_second": 1.371,
     "eval_wer": 0.5156036834924966
 }

 {
+    "epoch": 69.62,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
+    "eval_runtime": 45.2212,
     "eval_samples": 481,
+    "eval_samples_per_second": 10.637,
+    "eval_steps_per_second": 1.349,
     "eval_wer": 0.5156036834924966
 }

runs/Dec16_20-12-50_129-146-104-29/events.out.tfevents.1671223965.129-146-104-29.144289.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:80e8f010a29167816de5acc6dfa4ebc9166999dc4d6436f409cabb8252b3b9dc
+size 405

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 63.29,
-    "train_loss": 0.05515483856201172,
-    "train_runtime": 2237.6776,
     "train_samples": 2528,
-    "train_samples_per_second": 71.503,
-    "train_steps_per_second": 2.234
 }

 {
+    "epoch": 69.62,
+    "train_loss": 0.04894279766082764,
+    "train_runtime": 2118.6173,
     "train_samples": 2528,
+    "train_samples_per_second": 83.073,
+    "train_steps_per_second": 2.596
 }

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.9162458181381226,
   "best_model_checkpoint": "./checkpoint-4000",
-  "epoch": 63.29113924050633,
-  "global_step": 5000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3108,18 +3108,328 @@
       "step": 5000
     },
     {
-      "epoch": 63.29,
-      "step": 5000,
-      "total_flos": 5.7547597013827174e+19,
-      "train_loss": 0.05515483856201172,
-      "train_runtime": 2237.6776,
-      "train_samples_per_second": 71.503,
-      "train_steps_per_second": 2.234
     }
   ],
-  "max_steps": 5000,
-  "num_train_epochs": 64,
-  "total_flos": 5.7547597013827174e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.9162458181381226,
   "best_model_checkpoint": "./checkpoint-4000",
+  "epoch": 69.62025316455696,
+  "global_step": 5500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "step": 5000
     },
     {
+      "epoch": 63.42,
+      "learning_rate": 8.2e-06,
+      "loss": 0.5146,
+      "step": 5010
+    },
+    {
+      "epoch": 63.54,
+      "learning_rate": 8.033333333333333e-06,
+      "loss": 0.5334,
+      "step": 5020
+    },
+    {
+      "epoch": 63.67,
+      "learning_rate": 7.866666666666667e-06,
+      "loss": 0.5824,
+      "step": 5030
+    },
+    {
+      "epoch": 63.8,
+      "learning_rate": 7.699999999999999e-06,
+      "loss": 0.5354,
+      "step": 5040
+    },
+    {
+      "epoch": 63.92,
+      "learning_rate": 7.533333333333333e-06,
+      "loss": 0.5225,
+      "step": 5050
+    },
+    {
+      "epoch": 64.05,
+      "learning_rate": 7.366666666666666e-06,
+      "loss": 0.5296,
+      "step": 5060
+    },
+    {
+      "epoch": 64.18,
+      "learning_rate": 7.2e-06,
+      "loss": 0.525,
+      "step": 5070
+    },
+    {
+      "epoch": 64.3,
+      "learning_rate": 7.033333333333333e-06,
+      "loss": 0.5549,
+      "step": 5080
+    },
+    {
+      "epoch": 64.43,
+      "learning_rate": 6.8666666666666664e-06,
+      "loss": 0.5579,
+      "step": 5090
+    },
+    {
+      "epoch": 64.56,
+      "learning_rate": 6.699999999999999e-06,
+      "loss": 0.5527,
+      "step": 5100
+    },
+    {
+      "epoch": 64.68,
+      "learning_rate": 6.533333333333333e-06,
+      "loss": 0.5191,
+      "step": 5110
+    },
+    {
+      "epoch": 64.81,
+      "learning_rate": 6.366666666666666e-06,
+      "loss": 0.5591,
+      "step": 5120
+    },
+    {
+      "epoch": 64.94,
+      "learning_rate": 6.199999999999999e-06,
+      "loss": 0.5371,
+      "step": 5130
+    },
+    {
+      "epoch": 65.06,
+      "learning_rate": 6.033333333333333e-06,
+      "loss": 0.5527,
+      "step": 5140
+    },
+    {
+      "epoch": 65.19,
+      "learning_rate": 5.866666666666666e-06,
+      "loss": 0.5318,
+      "step": 5150
+    },
+    {
+      "epoch": 65.32,
+      "learning_rate": 5.7e-06,
+      "loss": 0.5684,
+      "step": 5160
+    },
+    {
+      "epoch": 65.44,
+      "learning_rate": 5.533333333333333e-06,
+      "loss": 0.528,
+      "step": 5170
+    },
+    {
+      "epoch": 65.57,
+      "learning_rate": 5.366666666666666e-06,
+      "loss": 0.5366,
+      "step": 5180
+    },
+    {
+      "epoch": 65.7,
+      "learning_rate": 5.199999999999999e-06,
+      "loss": 0.5482,
+      "step": 5190
+    },
+    {
+      "epoch": 65.82,
+      "learning_rate": 5.033333333333332e-06,
+      "loss": 0.5402,
+      "step": 5200
+    },
+    {
+      "epoch": 65.95,
+      "learning_rate": 4.866666666666666e-06,
+      "loss": 0.5568,
+      "step": 5210
+    },
+    {
+      "epoch": 66.08,
+      "learning_rate": 4.699999999999999e-06,
+      "loss": 0.5466,
+      "step": 5220
+    },
+    {
+      "epoch": 66.2,
+      "learning_rate": 4.533333333333333e-06,
+      "loss": 0.5353,
+      "step": 5230
+    },
+    {
+      "epoch": 66.33,
+      "learning_rate": 4.366666666666667e-06,
+      "loss": 0.5629,
+      "step": 5240
+    },
+    {
+      "epoch": 66.46,
+      "learning_rate": 4.2e-06,
+      "loss": 0.5227,
+      "step": 5250
+    },
+    {
+      "epoch": 66.58,
+      "learning_rate": 4.033333333333333e-06,
+      "loss": 0.5126,
+      "step": 5260
+    },
+    {
+      "epoch": 66.71,
+      "learning_rate": 3.866666666666666e-06,
+      "loss": 0.5173,
+      "step": 5270
+    },
+    {
+      "epoch": 66.84,
+      "learning_rate": 3.6999999999999997e-06,
+      "loss": 0.5773,
+      "step": 5280
+    },
+    {
+      "epoch": 66.96,
+      "learning_rate": 3.533333333333333e-06,
+      "loss": 0.5131,
+      "step": 5290
+    },
+    {
+      "epoch": 67.09,
+      "learning_rate": 3.3666666666666665e-06,
+      "loss": 0.5592,
+      "step": 5300
+    },
+    {
+      "epoch": 67.22,
+      "learning_rate": 3.1999999999999994e-06,
+      "loss": 0.5164,
+      "step": 5310
+    },
+    {
+      "epoch": 67.34,
+      "learning_rate": 3.033333333333333e-06,
+      "loss": 0.5166,
+      "step": 5320
+    },
+    {
+      "epoch": 67.47,
+      "learning_rate": 2.866666666666666e-06,
+      "loss": 0.5079,
+      "step": 5330
+    },
+    {
+      "epoch": 67.59,
+      "learning_rate": 2.6999999999999996e-06,
+      "loss": 0.547,
+      "step": 5340
+    },
+    {
+      "epoch": 67.72,
+      "learning_rate": 2.533333333333333e-06,
+      "loss": 0.5188,
+      "step": 5350
+    },
+    {
+      "epoch": 67.85,
+      "learning_rate": 2.3666666666666667e-06,
+      "loss": 0.5779,
+      "step": 5360
+    },
+    {
+      "epoch": 67.97,
+      "learning_rate": 2.1999999999999997e-06,
+      "loss": 0.5424,
+      "step": 5370
+    },
+    {
+      "epoch": 68.1,
+      "learning_rate": 2.033333333333333e-06,
+      "loss": 0.5307,
+      "step": 5380
+    },
+    {
+      "epoch": 68.23,
+      "learning_rate": 1.8666666666666664e-06,
+      "loss": 0.5353,
+      "step": 5390
+    },
+    {
+      "epoch": 68.35,
+      "learning_rate": 1.7e-06,
+      "loss": 0.5521,
+      "step": 5400
+    },
+    {
+      "epoch": 68.48,
+      "learning_rate": 1.5333333333333332e-06,
+      "loss": 0.5024,
+      "step": 5410
+    },
+    {
+      "epoch": 68.61,
+      "learning_rate": 1.3666666666666666e-06,
+      "loss": 0.5765,
+      "step": 5420
+    },
+    {
+      "epoch": 68.73,
+      "learning_rate": 1.2e-06,
+      "loss": 0.497,
+      "step": 5430
+    },
+    {
+      "epoch": 68.86,
+      "learning_rate": 1.0333333333333333e-06,
+      "loss": 0.5822,
+      "step": 5440
+    },
+    {
+      "epoch": 68.99,
+      "learning_rate": 8.666666666666666e-07,
+      "loss": 0.5189,
+      "step": 5450
+    },
+    {
+      "epoch": 69.11,
+      "learning_rate": 7e-07,
+      "loss": 0.5356,
+      "step": 5460
+    },
+    {
+      "epoch": 69.24,
+      "learning_rate": 5.333333333333333e-07,
+      "loss": 0.5289,
+      "step": 5470
+    },
+    {
+      "epoch": 69.37,
+      "learning_rate": 3.666666666666666e-07,
+      "loss": 0.5522,
+      "step": 5480
+    },
+    {
+      "epoch": 69.49,
+      "learning_rate": 1.9999999999999996e-07,
+      "loss": 0.4897,
+      "step": 5490
+    },
+    {
+      "epoch": 69.62,
+      "learning_rate": 3.3333333333333334e-08,
+      "loss": 0.5564,
+      "step": 5500
+    },
+    {
+      "epoch": 69.62,
+      "eval_cer": 0.19773618906387852,
+      "eval_loss": 0.9461079239845276,
+      "eval_runtime": 45.3275,
+      "eval_samples_per_second": 10.612,
+      "eval_steps_per_second": 1.346,
+      "eval_wer": 0.5148362892223738,
+      "step": 5500
+    },
+    {
+      "epoch": 69.62,
+      "step": 5500,
+      "total_flos": 6.33124990225071e+19,
+      "train_loss": 0.04894279766082764,
+      "train_runtime": 2118.6173,
+      "train_samples_per_second": 83.073,
+      "train_steps_per_second": 2.596
     }
   ],
+  "max_steps": 5500,
+  "num_train_epochs": 70,
+  "total_flos": 6.33124990225071e+19,
   "trial_name": null,
   "trial_params": null
 }