End of training

Browse files

Files changed (5) hide show

all_results.json +10 -10
eval_results.json +6 -6
runs/Dec27_09-55-14_srv/events.out.tfevents.1672216184.srv.1172111.2 +3 -0
train_results.json +5 -5
trainer_state.json +142 -181

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 1.0,
-    "eval_loss": 0.46010294556617737,
-    "eval_runtime": 1652.1311,
-    "eval_samples_per_second": 2.787,
-    "eval_steps_per_second": 0.349,
-    "eval_wer": 22.51334731203637,
-    "train_loss": 0.5294164781570434,
-    "train_runtime": 5156.396,
-    "train_samples_per_second": 3.103,
-    "train_steps_per_second": 0.194
 }

 {
+    "epoch": 35.02,
+    "eval_loss": 0.6532349586486816,
+    "eval_runtime": 1529.5324,
+    "eval_samples_per_second": 3.01,
+    "eval_steps_per_second": 0.188,
+    "eval_wer": 21.991788980318223,
+    "train_loss": 0.06371040197610855,
+    "train_runtime": 79589.3253,
+    "train_samples_per_second": 4.021,
+    "train_steps_per_second": 0.126
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 1.0,
-    "eval_loss": 0.46010294556617737,
-    "eval_runtime": 1652.1311,
-    "eval_samples_per_second": 2.787,
-    "eval_steps_per_second": 0.349,
-    "eval_wer": 22.51334731203637
 }

 {
+    "epoch": 35.02,
+    "eval_loss": 0.6532349586486816,
+    "eval_runtime": 1529.5324,
+    "eval_samples_per_second": 3.01,
+    "eval_steps_per_second": 0.188,
+    "eval_wer": 21.991788980318223
 }

runs/Dec27_09-55-14_srv/events.out.tfevents.1672216184.srv.1172111.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:376b9b587745cc14a971964a87d273e1eebf96fb6ea5d415eff9f0f00395a7a5
+size 358

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-    "epoch": 1.0,
-    "train_loss": 0.5294164781570434,
-    "train_runtime": 5156.396,
-    "train_samples_per_second": 3.103,
-    "train_steps_per_second": 0.194
 }

 {
+    "epoch": 35.02,
+    "train_loss": 0.06371040197610855,
+    "train_runtime": 79589.3253,
+    "train_samples_per_second": 4.021,
+    "train_steps_per_second": 0.126
 }

trainer_state.json CHANGED Viewed

@@ -1,274 +1,235 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.0,
-  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.03,
-      "learning_rate": 4.800000000000001e-06,
-      "loss": 0.7069,
-      "step": 25
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 9.800000000000001e-06,
-      "loss": 0.5962,
-      "step": 50
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 1e-05,
-      "loss": 0.4928,
-      "step": 75
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 1e-05,
-      "loss": 0.5115,
-      "step": 100
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 1e-05,
-      "loss": 0.4646,
-      "step": 125
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 1e-05,
-      "loss": 0.5159,
-      "step": 150
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 1e-05,
-      "loss": 0.4915,
-      "step": 175
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 1e-05,
-      "loss": 0.4671,
-      "step": 200
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 1e-05,
-      "loss": 0.4107,
-      "step": 225
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 1e-05,
-      "loss": 0.4238,
-      "step": 250
     },
     {
-      "epoch": 0.28,
       "learning_rate": 1e-05,
-      "loss": 0.4253,
-      "step": 275
     },
     {
-      "epoch": 0.3,
-      "learning_rate": 1e-05,
-      "loss": 0.4236,
-      "step": 300
     },
     {
-      "epoch": 0.33,
       "learning_rate": 1e-05,
-      "loss": 0.3871,
-      "step": 325
     },
     {
-      "epoch": 0.35,
       "learning_rate": 1e-05,
-      "loss": 0.4001,
-      "step": 350
     },
     {
-      "epoch": 0.38,
-      "learning_rate": 1e-05,
-      "loss": 0.3982,
-      "step": 375
     },
     {
-      "epoch": 0.4,
       "learning_rate": 1e-05,
-      "loss": 0.3953,
-      "step": 400
     },
     {
-      "epoch": 0.42,
       "learning_rate": 1e-05,
-      "loss": 0.4469,
-      "step": 425
     },
     {
-      "epoch": 0.45,
-      "learning_rate": 1e-05,
-      "loss": 0.4613,
-      "step": 450
     },
     {
-      "epoch": 0.47,
       "learning_rate": 1e-05,
-      "loss": 0.5581,
-      "step": 475
     },
     {
-      "epoch": 0.5,
       "learning_rate": 1e-05,
-      "loss": 0.5489,
-      "step": 500
     },
     {
-      "epoch": 0.53,
-      "learning_rate": 1e-05,
-      "loss": 0.5243,
-      "step": 525
     },
     {
-      "epoch": 0.55,
       "learning_rate": 1e-05,
-      "loss": 0.5691,
-      "step": 550
     },
     {
-      "epoch": 0.57,
       "learning_rate": 1e-05,
-      "loss": 0.5907,
-      "step": 575
     },
     {
-      "epoch": 0.6,
-      "learning_rate": 1e-05,
-      "loss": 0.5893,
-      "step": 600
     },
     {
-      "epoch": 0.62,
       "learning_rate": 1e-05,
-      "loss": 0.6474,
-      "step": 625
     },
     {
-      "epoch": 0.65,
       "learning_rate": 1e-05,
-      "loss": 0.6241,
-      "step": 650
     },
     {
-      "epoch": 0.68,
-      "learning_rate": 1e-05,
-      "loss": 0.6801,
-      "step": 675
     },
     {
-      "epoch": 0.7,
       "learning_rate": 1e-05,
-      "loss": 0.6744,
-      "step": 700
     },
     {
-      "epoch": 0.72,
       "learning_rate": 1e-05,
-      "loss": 0.6525,
-      "step": 725
     },
     {
-      "epoch": 0.75,
-      "learning_rate": 1e-05,
-      "loss": 0.6215,
-      "step": 750
-    },
-    {
-      "epoch": 0.78,
-      "learning_rate": 1e-05,
-      "loss": 0.6284,
-      "step": 775
     },
     {
-      "epoch": 0.8,
       "learning_rate": 1e-05,
-      "loss": 0.5778,
-      "step": 800
     },
     {
-      "epoch": 0.82,
       "learning_rate": 1e-05,
-      "loss": 0.6221,
-      "step": 825
     },
     {
-      "epoch": 0.85,
-      "learning_rate": 1e-05,
-      "loss": 0.5919,
-      "step": 850
     },
     {
-      "epoch": 0.88,
       "learning_rate": 1e-05,
-      "loss": 0.4808,
-      "step": 875
     },
     {
-      "epoch": 0.9,
       "learning_rate": 1e-05,
-      "loss": 0.5497,
-      "step": 900
     },
     {
-      "epoch": 0.93,
-      "learning_rate": 1e-05,
-      "loss": 0.4979,
-      "step": 925
     },
     {
-      "epoch": 0.95,
       "learning_rate": 1e-05,
-      "loss": 0.4988,
-      "step": 950
     },
     {
-      "epoch": 0.97,
       "learning_rate": 1e-05,
-      "loss": 0.528,
-      "step": 975
     },
     {
-      "epoch": 1.0,
-      "learning_rate": 1e-05,
-      "loss": 0.5019,
-      "step": 1000
-    },
-    {
-      "epoch": 1.0,
-      "eval_loss": 0.46010294556617737,
-      "eval_runtime": 1657.4757,
-      "eval_samples_per_second": 2.778,
-      "eval_steps_per_second": 0.348,
-      "eval_wer": 22.51334731203637,
-      "step": 1000
     },
     {
-      "epoch": 1.0,
-      "step": 1000,
-      "total_flos": 5.1887996928e+17,
-      "train_loss": 0.5294164781570434,
-      "train_runtime": 5156.396,
-      "train_samples_per_second": 3.103,
-      "train_steps_per_second": 0.194
     }
   ],
-  "max_steps": 1000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 5.1887996928e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 35.0165,
+  "global_step": 10000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 1.02,
+      "learning_rate": 9.960000000000001e-06,
+      "loss": 0.5615,
+      "step": 500
     },
     {
+      "epoch": 3.02,
       "learning_rate": 1e-05,
+      "loss": 0.3273,
+      "step": 1000
     },
     {
+      "epoch": 3.02,
+      "eval_loss": 0.4225325584411621,
+      "eval_runtime": 1489.9228,
+      "eval_samples_per_second": 3.09,
+      "eval_steps_per_second": 0.193,
+      "eval_wer": 20.82533081951615,
+      "step": 1000
     },
     {
+      "epoch": 5.01,
       "learning_rate": 1e-05,
+      "loss": 0.1859,
+      "step": 1500
     },
     {
+      "epoch": 7.0,
       "learning_rate": 1e-05,
+      "loss": 0.0923,
+      "step": 2000
     },
     {
+      "epoch": 7.0,
+      "eval_loss": 0.46434369683265686,
+      "eval_runtime": 1504.5618,
+      "eval_samples_per_second": 3.06,
+      "eval_steps_per_second": 0.191,
+      "eval_wer": 21.22002361108664,
+      "step": 2000
     },
     {
+      "epoch": 8.03,
       "learning_rate": 1e-05,
+      "loss": 0.0369,
+      "step": 2500
     },
     {
+      "epoch": 10.02,
       "learning_rate": 1e-05,
+      "loss": 0.0164,
+      "step": 3000
     },
     {
+      "epoch": 10.02,
+      "eval_loss": 0.5403426885604858,
+      "eval_runtime": 1504.7378,
+      "eval_samples_per_second": 3.06,
+      "eval_steps_per_second": 0.191,
+      "eval_wer": 22.962662766725987,
+      "step": 3000
     },
     {
+      "epoch": 12.01,
       "learning_rate": 1e-05,
+      "loss": 0.0089,
+      "step": 3500
     },
     {
+      "epoch": 14.01,
       "learning_rate": 1e-05,
+      "loss": 0.006,
+      "step": 4000
     },
     {
+      "epoch": 14.01,
+      "eval_loss": 0.5819889307022095,
+      "eval_runtime": 1478.853,
+      "eval_samples_per_second": 3.113,
+      "eval_steps_per_second": 0.195,
+      "eval_wer": 21.086109985375224,
+      "step": 4000
     },
     {
+      "epoch": 16.0,
       "learning_rate": 1e-05,
+      "loss": 0.0057,
+      "step": 4500
     },
     {
+      "epoch": 17.02,
       "learning_rate": 1e-05,
+      "loss": 0.0046,
+      "step": 5000
     },
     {
+      "epoch": 17.02,
+      "eval_loss": 0.5851565003395081,
+      "eval_runtime": 1532.3442,
+      "eval_samples_per_second": 3.005,
+      "eval_steps_per_second": 0.188,
+      "eval_wer": 22.072841964301446,
+      "step": 5000
     },
     {
+      "epoch": 19.02,
       "learning_rate": 1e-05,
+      "loss": 0.0042,
+      "step": 5500
     },
     {
+      "epoch": 21.01,
       "learning_rate": 1e-05,
+      "loss": 0.0034,
+      "step": 6000
     },
     {
+      "epoch": 21.01,
+      "eval_loss": 0.6112661361694336,
+      "eval_runtime": 1497.7325,
+      "eval_samples_per_second": 3.074,
+      "eval_steps_per_second": 0.192,
+      "eval_wer": 21.6622909802125,
+      "step": 6000
     },
     {
+      "epoch": 23.0,
       "learning_rate": 1e-05,
+      "loss": 0.004,
+      "step": 6500
     },
     {
+      "epoch": 24.03,
       "learning_rate": 1e-05,
+      "loss": 0.0028,
+      "step": 7000
     },
     {
+      "epoch": 24.03,
+      "eval_loss": 0.6582160592079163,
+      "eval_runtime": 1517.5965,
+      "eval_samples_per_second": 3.034,
+      "eval_steps_per_second": 0.19,
+      "eval_wer": 22.326573044596763,
+      "step": 7000
     },
     {
+      "epoch": 26.02,
       "learning_rate": 1e-05,
+      "loss": 0.0027,
+      "step": 7500
     },
     {
+      "epoch": 28.01,
       "learning_rate": 1e-05,
+      "loss": 0.0025,
+      "step": 8000
     },
     {
+      "epoch": 28.01,
+      "eval_loss": 0.6349595785140991,
+      "eval_runtime": 1539.4689,
+      "eval_samples_per_second": 2.991,
+      "eval_steps_per_second": 0.187,
+      "eval_wer": 22.23318591087696,
+      "step": 8000
     },
     {
+      "epoch": 30.01,
       "learning_rate": 1e-05,
+      "loss": 0.0027,
+      "step": 8500
     },
     {
+      "epoch": 32.0,
       "learning_rate": 1e-05,
+      "loss": 0.0029,
+      "step": 9000
     },
     {
+      "epoch": 32.0,
+      "eval_loss": 0.646816074848175,
+      "eval_runtime": 1531.6588,
+      "eval_samples_per_second": 3.006,
+      "eval_steps_per_second": 0.188,
+      "eval_wer": 22.10984441351118,
+      "step": 9000
     },
     {
+      "epoch": 33.02,
       "learning_rate": 1e-05,
+      "loss": 0.0021,
+      "step": 9500
     },
     {
+      "epoch": 35.02,
       "learning_rate": 1e-05,
+      "loss": 0.0014,
+      "step": 10000
     },
     {
+      "epoch": 35.02,
+      "eval_loss": 0.6532349586486816,
+      "eval_runtime": 1526.2981,
+      "eval_samples_per_second": 3.016,
+      "eval_steps_per_second": 0.189,
+      "eval_wer": 21.991788980318223,
+      "step": 10000
     },
     {
+      "epoch": 35.02,
+      "step": 10000,
+      "total_flos": 2.07052565741568e+19,
+      "train_loss": 0.06371040197610855,
+      "train_runtime": 79589.3253,
+      "train_samples_per_second": 4.021,
+      "train_steps_per_second": 0.126
     }
   ],
+  "max_steps": 10000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 2.07052565741568e+19,
   "trial_name": null,
   "trial_params": null
 }