End of training

Browse files

Files changed (5) hide show

all_results.json +8 -8
eval_results.json +5 -5
runs/Jul08_06-48-48_e43e87908b0c/events.out.tfevents.1657286607.e43e87908b0c.2948.2 +3 -0
train_results.json +3 -3
trainer_state.json +198 -198

all_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
     "epoch": 10.0,
-    "eval_loss": 0.7043963670730591,
-    "eval_runtime": 129.1286,
     "eval_samples": 532,
-    "eval_samples_per_second": 4.12,
-    "eval_steps_per_second": 0.519,
-    "eval_wer": 0.47573439609179147,
-    "train_loss": 0.8933021876547071,
-    "train_runtime": 19496.7314,
     "train_samples": 4617,
-    "train_samples_per_second": 2.368,
     "train_steps_per_second": 0.037
 }

 {
     "epoch": 10.0,
+    "eval_loss": 0.6743320226669312,
+    "eval_runtime": 128.2267,
     "eval_samples": 532,
+    "eval_samples_per_second": 4.149,
+    "eval_steps_per_second": 0.523,
+    "eval_wer": 0.4303528958025326,
+    "train_loss": 0.6841171807712979,
+    "train_runtime": 19401.0857,
     "train_samples": 4617,
+    "train_samples_per_second": 2.38,
     "train_steps_per_second": 0.037
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 10.0,
-    "eval_loss": 0.7043963670730591,
-    "eval_runtime": 129.1286,
     "eval_samples": 532,
-    "eval_samples_per_second": 4.12,
-    "eval_steps_per_second": 0.519,
-    "eval_wer": 0.47573439609179147
 }

 {
     "epoch": 10.0,
+    "eval_loss": 0.6743320226669312,
+    "eval_runtime": 128.2267,
     "eval_samples": 532,
+    "eval_samples_per_second": 4.149,
+    "eval_steps_per_second": 0.523,
+    "eval_wer": 0.4303528958025326
 }

runs/Jul08_06-48-48_e43e87908b0c/events.out.tfevents.1657286607.e43e87908b0c.2948.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:487eeb1cc60b2c1c0e78753789e82084ce7ca6137a24bc0c7a86d8d45282b609
+size 358

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 10.0,
-    "train_loss": 0.8933021876547071,
-    "train_runtime": 19496.7314,
     "train_samples": 4617,
-    "train_samples_per_second": 2.368,
     "train_steps_per_second": 0.037
 }

 {
     "epoch": 10.0,
+    "train_loss": 0.6841171807712979,
+    "train_runtime": 19401.0857,
     "train_samples": 4617,
+    "train_samples_per_second": 2.38,
     "train_steps_per_second": 0.037
 }

trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.7043963670730591,
   "best_model_checkpoint": "ai-light-dance_singing3_ft_wav2vec2-large-xlsr-53-v1/checkpoint-720",
   "epoch": 9.996539792387543,
   "global_step": 720,
@@ -9,533 +9,533 @@
   "log_history": [
     {
       "epoch": 0.14,
-      "learning_rate": 7.000000000000001e-06,
-      "loss": 1.7072,
       "step": 10
     },
     {
       "epoch": 0.28,
-      "learning_rate": 1.7000000000000003e-05,
-      "loss": 1.3169,
       "step": 20
     },
     {
       "epoch": 0.42,
-      "learning_rate": 2.7000000000000002e-05,
-      "loss": 1.1845,
       "step": 30
     },
     {
       "epoch": 0.55,
-      "learning_rate": 3.7e-05,
-      "loss": 1.1996,
       "step": 40
     },
     {
       "epoch": 0.69,
-      "learning_rate": 4.7e-05,
-      "loss": 1.0979,
       "step": 50
     },
     {
       "epoch": 0.83,
-      "learning_rate": 4.9477611940298504e-05,
-      "loss": 1.095,
       "step": 60
     },
     {
       "epoch": 0.97,
-      "learning_rate": 4.8731343283582094e-05,
-      "loss": 1.0489,
       "step": 70
     },
     {
       "epoch": 1.0,
-      "eval_loss": 0.9701907634735107,
-      "eval_runtime": 131.7628,
-      "eval_samples_per_second": 4.038,
-      "eval_steps_per_second": 0.508,
-      "eval_wer": 0.6696021083756508,
       "step": 72
     },
     {
       "epoch": 1.11,
-      "learning_rate": 4.798507462686567e-05,
-      "loss": 1.0915,
       "step": 80
     },
     {
       "epoch": 1.25,
-      "learning_rate": 4.723880597014926e-05,
-      "loss": 1.1852,
       "step": 90
     },
     {
       "epoch": 1.39,
-      "learning_rate": 4.6492537313432837e-05,
-      "loss": 1.1105,
       "step": 100
     },
     {
       "epoch": 1.53,
-      "learning_rate": 4.582089552238806e-05,
-      "loss": 1.052,
       "step": 110
     },
     {
       "epoch": 1.66,
-      "learning_rate": 4.5074626865671645e-05,
-      "loss": 1.0009,
       "step": 120
     },
     {
       "epoch": 1.8,
-      "learning_rate": 4.432835820895523e-05,
-      "loss": 1.0445,
       "step": 130
     },
     {
       "epoch": 1.94,
-      "learning_rate": 4.358208955223881e-05,
-      "loss": 0.9699,
       "step": 140
     },
     {
       "epoch": 2.0,
-      "eval_loss": 0.9321106672286987,
-      "eval_runtime": 131.1021,
-      "eval_samples_per_second": 4.058,
-      "eval_steps_per_second": 0.511,
-      "eval_wer": 0.6595744680851063,
       "step": 144
     },
     {
       "epoch": 2.08,
-      "learning_rate": 4.283582089552239e-05,
-      "loss": 1.0048,
       "step": 150
     },
     {
       "epoch": 2.22,
-      "learning_rate": 4.208955223880597e-05,
-      "loss": 0.9799,
       "step": 160
     },
     {
       "epoch": 2.36,
-      "learning_rate": 4.1343283582089554e-05,
-      "loss": 1.034,
       "step": 170
     },
     {
       "epoch": 2.5,
-      "learning_rate": 4.059701492537314e-05,
-      "loss": 0.9303,
       "step": 180
     },
     {
       "epoch": 2.64,
-      "learning_rate": 3.985074626865672e-05,
-      "loss": 0.9381,
       "step": 190
     },
     {
       "epoch": 2.78,
-      "learning_rate": 3.9104477611940296e-05,
-      "loss": 0.9386,
       "step": 200
     },
     {
       "epoch": 2.91,
-      "learning_rate": 3.8358208955223886e-05,
-      "loss": 0.9074,
       "step": 210
     },
     {
       "epoch": 3.0,
-      "eval_loss": 0.854228138923645,
-      "eval_runtime": 129.803,
-      "eval_samples_per_second": 4.099,
-      "eval_steps_per_second": 0.516,
-      "eval_wer": 0.6138715690685865,
       "step": 216
     },
     {
       "epoch": 3.06,
-      "learning_rate": 3.761194029850746e-05,
-      "loss": 0.9405,
       "step": 220
     },
     {
       "epoch": 3.19,
-      "learning_rate": 3.6865671641791046e-05,
-      "loss": 0.9118,
       "step": 230
     },
     {
       "epoch": 3.33,
-      "learning_rate": 3.611940298507463e-05,
-      "loss": 0.9953,
       "step": 240
     },
     {
       "epoch": 3.47,
-      "learning_rate": 3.537313432835821e-05,
-      "loss": 0.9019,
       "step": 250
     },
     {
       "epoch": 3.61,
-      "learning_rate": 3.4626865671641795e-05,
-      "loss": 0.8914,
       "step": 260
     },
     {
       "epoch": 3.75,
-      "learning_rate": 3.388059701492537e-05,
-      "loss": 0.9089,
       "step": 270
     },
     {
       "epoch": 3.89,
-      "learning_rate": 3.3134328358208955e-05,
-      "loss": 0.8979,
       "step": 280
     },
     {
       "epoch": 4.0,
-      "eval_loss": 0.8186684846878052,
-      "eval_runtime": 131.2574,
-      "eval_samples_per_second": 4.053,
-      "eval_steps_per_second": 0.51,
-      "eval_wer": 0.5776820723789934,
       "step": 288
     },
     {
       "epoch": 4.03,
-      "learning_rate": 3.238805970149254e-05,
-      "loss": 0.9317,
       "step": 290
     },
     {
       "epoch": 4.17,
-      "learning_rate": 3.164179104477612e-05,
-      "loss": 0.887,
       "step": 300
     },
     {
       "epoch": 4.3,
-      "learning_rate": 3.0895522388059704e-05,
-      "loss": 0.8859,
       "step": 310
     },
     {
       "epoch": 4.44,
-      "learning_rate": 3.0149253731343284e-05,
-      "loss": 0.8687,
       "step": 320
     },
     {
       "epoch": 4.58,
-      "learning_rate": 2.9402985074626864e-05,
-      "loss": 0.9075,
       "step": 330
     },
     {
       "epoch": 4.72,
-      "learning_rate": 2.865671641791045e-05,
-      "loss": 0.8513,
       "step": 340
     },
     {
       "epoch": 4.86,
-      "learning_rate": 2.791044776119403e-05,
-      "loss": 0.8585,
       "step": 350
     },
     {
       "epoch": 5.0,
-      "learning_rate": 2.716417910447761e-05,
-      "loss": 0.8363,
       "step": 360
     },
     {
       "epoch": 5.0,
-      "eval_loss": 0.7735126614570618,
-      "eval_runtime": 129.316,
-      "eval_samples_per_second": 4.114,
-      "eval_steps_per_second": 0.518,
-      "eval_wer": 0.5551198817252684,
       "step": 360
     },
     {
       "epoch": 5.14,
-      "learning_rate": 2.6417910447761197e-05,
-      "loss": 0.8316,
       "step": 370
     },
     {
       "epoch": 5.28,
-      "learning_rate": 2.5671641791044776e-05,
-      "loss": 0.8286,
       "step": 380
     },
     {
       "epoch": 5.42,
-      "learning_rate": 2.492537313432836e-05,
-      "loss": 0.8229,
       "step": 390
     },
     {
       "epoch": 5.55,
-      "learning_rate": 2.4179104477611943e-05,
-      "loss": 0.8304,
       "step": 400
     },
     {
       "epoch": 5.69,
-      "learning_rate": 2.3432835820895522e-05,
-      "loss": 0.8113,
       "step": 410
     },
     {
       "epoch": 5.83,
-      "learning_rate": 2.2686567164179106e-05,
-      "loss": 0.8642,
       "step": 420
     },
     {
       "epoch": 5.97,
-      "learning_rate": 2.1940298507462685e-05,
-      "loss": 0.802,
       "step": 430
     },
     {
       "epoch": 6.0,
-      "eval_loss": 0.7765986919403076,
-      "eval_runtime": 128.8303,
-      "eval_samples_per_second": 4.129,
-      "eval_steps_per_second": 0.52,
-      "eval_wer": 0.5402069807803561,
       "step": 432
     },
     {
       "epoch": 6.11,
-      "learning_rate": 2.119402985074627e-05,
-      "loss": 0.8724,
       "step": 440
     },
     {
       "epoch": 6.25,
-      "learning_rate": 2.0447761194029852e-05,
-      "loss": 0.7674,
       "step": 450
     },
     {
       "epoch": 6.39,
-      "learning_rate": 1.9701492537313435e-05,
-      "loss": 0.7822,
       "step": 460
     },
     {
       "epoch": 6.53,
-      "learning_rate": 1.8955223880597015e-05,
-      "loss": 0.8182,
       "step": 470
     },
     {
       "epoch": 6.66,
-      "learning_rate": 1.8208955223880598e-05,
-      "loss": 0.8082,
       "step": 480
     },
     {
       "epoch": 6.8,
-      "learning_rate": 1.746268656716418e-05,
-      "loss": 0.8026,
       "step": 490
     },
     {
       "epoch": 6.94,
-      "learning_rate": 1.6716417910447764e-05,
-      "loss": 0.7702,
       "step": 500
     },
     {
       "epoch": 7.0,
-      "eval_loss": 0.7470704317092896,
-      "eval_runtime": 130.8433,
-      "eval_samples_per_second": 4.066,
-      "eval_steps_per_second": 0.512,
-      "eval_wer": 0.49713955132737675,
       "step": 504
     },
     {
       "epoch": 7.08,
-      "learning_rate": 1.5970149253731344e-05,
-      "loss": 0.8414,
       "step": 510
     },
     {
       "epoch": 7.22,
-      "learning_rate": 1.5223880597014925e-05,
-      "loss": 0.7644,
       "step": 520
     },
     {
       "epoch": 7.36,
-      "learning_rate": 1.4477611940298509e-05,
-      "loss": 0.7924,
       "step": 530
     },
     {
       "epoch": 7.5,
-      "learning_rate": 1.373134328358209e-05,
-      "loss": 0.7678,
       "step": 540
     },
     {
       "epoch": 7.64,
-      "learning_rate": 1.2985074626865673e-05,
-      "loss": 0.7541,
       "step": 550
     },
     {
       "epoch": 7.78,
-      "learning_rate": 1.2238805970149255e-05,
-      "loss": 0.7677,
       "step": 560
     },
     {
       "epoch": 7.91,
-      "learning_rate": 1.1492537313432836e-05,
-      "loss": 0.7483,
       "step": 570
     },
     {
       "epoch": 8.0,
-      "eval_loss": 0.7225961089134216,
-      "eval_runtime": 129.9737,
-      "eval_samples_per_second": 4.093,
-      "eval_steps_per_second": 0.515,
-      "eval_wer": 0.49810374750915987,
       "step": 576
     },
     {
       "epoch": 8.06,
-      "learning_rate": 1.0746268656716418e-05,
-      "loss": 0.7906,
       "step": 580
     },
     {
       "epoch": 8.19,
-      "learning_rate": 1e-05,
-      "loss": 0.7329,
       "step": 590
     },
     {
       "epoch": 8.33,
-      "learning_rate": 9.253731343283582e-06,
-      "loss": 0.7563,
       "step": 600
     },
     {
       "epoch": 8.47,
-      "learning_rate": 8.507462686567165e-06,
-      "loss": 0.7423,
       "step": 610
     },
     {
       "epoch": 8.61,
-      "learning_rate": 7.761194029850747e-06,
-      "loss": 0.7615,
       "step": 620
     },
     {
       "epoch": 8.75,
-      "learning_rate": 7.014925373134329e-06,
-      "loss": 0.7527,
       "step": 630
     },
     {
       "epoch": 8.89,
-      "learning_rate": 6.26865671641791e-06,
-      "loss": 0.7196,
       "step": 640
     },
     {
       "epoch": 9.0,
-      "eval_loss": 0.709452748298645,
-      "eval_runtime": 130.8637,
-      "eval_samples_per_second": 4.065,
-      "eval_steps_per_second": 0.512,
-      "eval_wer": 0.4842193224914829,
       "step": 648
     },
     {
       "epoch": 9.03,
-      "learning_rate": 5.522388059701493e-06,
-      "loss": 0.7642,
       "step": 650
     },
     {
       "epoch": 9.17,
-      "learning_rate": 4.7761194029850745e-06,
-      "loss": 0.7204,
       "step": 660
     },
     {
       "epoch": 9.3,
-      "learning_rate": 4.029850746268657e-06,
-      "loss": 0.7626,
       "step": 670
     },
     {
       "epoch": 9.44,
-      "learning_rate": 3.2835820895522387e-06,
-      "loss": 0.7175,
       "step": 680
     },
     {
       "epoch": 9.58,
-      "learning_rate": 2.537313432835821e-06,
-      "loss": 0.7452,
       "step": 690
     },
     {
       "epoch": 9.72,
-      "learning_rate": 1.7910447761194032e-06,
-      "loss": 0.7173,
       "step": 700
     },
     {
       "epoch": 9.86,
-      "learning_rate": 1.0447761194029853e-06,
-      "loss": 0.743,
       "step": 710
     },
     {
       "epoch": 10.0,
-      "learning_rate": 2.9850746268656716e-07,
-      "loss": 0.731,
       "step": 720
     },
     {
       "epoch": 10.0,
-      "eval_loss": 0.7043963670730591,
-      "eval_runtime": 129.9462,
-      "eval_samples_per_second": 4.094,
-      "eval_steps_per_second": 0.516,
-      "eval_wer": 0.47573439609179147,
       "step": 720
     },
     {
       "epoch": 10.0,
       "step": 720,
       "total_flos": 2.7197958559499194e+19,
-      "train_loss": 0.8933021876547071,
-      "train_runtime": 19496.7314,
-      "train_samples_per_second": 2.368,
       "train_steps_per_second": 0.037
     }
   ],

 {
+  "best_metric": 0.6743320226669312,
   "best_model_checkpoint": "ai-light-dance_singing3_ft_wav2vec2-large-xlsr-53-v1/checkpoint-720",
   "epoch": 9.996539792387543,
   "global_step": 720,
   "log_history": [
     {
       "epoch": 0.14,
+      "learning_rate": 5e-06,
+      "loss": 0.7293,
       "step": 10
     },
     {
       "epoch": 0.28,
+      "learning_rate": 1e-05,
+      "loss": 0.7451,
       "step": 20
     },
     {
       "epoch": 0.42,
+      "learning_rate": 1.5e-05,
+      "loss": 0.7259,
       "step": 30
     },
     {
       "epoch": 0.55,
+      "learning_rate": 2e-05,
+      "loss": 0.7445,
       "step": 40
     },
     {
       "epoch": 0.69,
+      "learning_rate": 2.5e-05,
+      "loss": 0.7222,
       "step": 50
     },
     {
       "epoch": 0.83,
+      "learning_rate": 2.4626865671641793e-05,
+      "loss": 0.7336,
       "step": 60
     },
     {
       "epoch": 0.97,
+      "learning_rate": 2.4253731343283584e-05,
+      "loss": 0.7295,
       "step": 70
     },
     {
       "epoch": 1.0,
+      "eval_loss": 0.7118099927902222,
+      "eval_runtime": 130.35,
+      "eval_samples_per_second": 4.081,
+      "eval_steps_per_second": 0.514,
+      "eval_wer": 0.47457736067365175,
       "step": 72
     },
     {
       "epoch": 1.11,
+      "learning_rate": 2.3880597014925373e-05,
+      "loss": 0.767,
       "step": 80
     },
     {
       "epoch": 1.25,
+      "learning_rate": 2.3507462686567168e-05,
+      "loss": 0.729,
       "step": 90
     },
     {
       "epoch": 1.39,
+      "learning_rate": 2.3134328358208956e-05,
+      "loss": 0.7306,
       "step": 100
     },
     {
       "epoch": 1.53,
+      "learning_rate": 2.2761194029850747e-05,
+      "loss": 0.7362,
       "step": 110
     },
     {
       "epoch": 1.66,
+      "learning_rate": 2.238805970149254e-05,
+      "loss": 0.7128,
       "step": 120
     },
     {
       "epoch": 1.8,
+      "learning_rate": 2.201492537313433e-05,
+      "loss": 0.7593,
       "step": 130
     },
     {
       "epoch": 1.94,
+      "learning_rate": 2.164179104477612e-05,
+      "loss": 0.7062,
       "step": 140
     },
     {
       "epoch": 2.0,
+      "eval_loss": 0.7108114361763,
+      "eval_runtime": 129.5999,
+      "eval_samples_per_second": 4.105,
+      "eval_steps_per_second": 0.517,
+      "eval_wer": 0.4676994279102655,
       "step": 144
     },
     {
       "epoch": 2.08,
+      "learning_rate": 2.126865671641791e-05,
+      "loss": 0.7321,
       "step": 150
     },
     {
       "epoch": 2.22,
+      "learning_rate": 2.0895522388059702e-05,
+      "loss": 0.7123,
       "step": 160
     },
     {
       "epoch": 2.36,
+      "learning_rate": 2.0522388059701493e-05,
+      "loss": 0.7404,
       "step": 170
     },
     {
       "epoch": 2.5,
+      "learning_rate": 2.0149253731343285e-05,
+      "loss": 0.7048,
       "step": 180
     },
     {
       "epoch": 2.64,
+      "learning_rate": 1.9776119402985073e-05,
+      "loss": 0.7002,
       "step": 190
     },
     {
       "epoch": 2.78,
+      "learning_rate": 1.9402985074626868e-05,
+      "loss": 0.6914,
       "step": 200
     },
     {
       "epoch": 2.91,
+      "learning_rate": 1.9029850746268656e-05,
+      "loss": 0.6932,
       "step": 210
     },
     {
       "epoch": 3.0,
+      "eval_loss": 0.7351313829421997,
+      "eval_runtime": 127.3643,
+      "eval_samples_per_second": 4.177,
+      "eval_steps_per_second": 0.526,
+      "eval_wer": 0.48511923892781383,
       "step": 216
     },
     {
       "epoch": 3.06,
+      "learning_rate": 1.865671641791045e-05,
+      "loss": 0.7105,
       "step": 220
     },
     {
       "epoch": 3.19,
+      "learning_rate": 1.828358208955224e-05,
+      "loss": 0.702,
       "step": 230
     },
     {
       "epoch": 3.33,
+      "learning_rate": 1.791044776119403e-05,
+      "loss": 0.7372,
       "step": 240
     },
     {
       "epoch": 3.47,
+      "learning_rate": 1.7537313432835823e-05,
+      "loss": 0.6776,
       "step": 250
     },
     {
       "epoch": 3.61,
+      "learning_rate": 1.716417910447761e-05,
+      "loss": 0.6749,
       "step": 260
     },
     {
       "epoch": 3.75,
+      "learning_rate": 1.6791044776119406e-05,
+      "loss": 0.6834,
       "step": 270
     },
     {
       "epoch": 3.89,
+      "learning_rate": 1.6417910447761194e-05,
+      "loss": 0.6674,
       "step": 280
     },
     {
       "epoch": 4.0,
+      "eval_loss": 0.7145407795906067,
+      "eval_runtime": 127.1129,
+      "eval_samples_per_second": 4.185,
+      "eval_steps_per_second": 0.527,
+      "eval_wer": 0.4479012663109854,
       "step": 288
     },
     {
       "epoch": 4.03,
+      "learning_rate": 1.6044776119402986e-05,
+      "loss": 0.702,
       "step": 290
     },
     {
       "epoch": 4.17,
+      "learning_rate": 1.5671641791044777e-05,
+      "loss": 0.6806,
       "step": 300
     },
     {
       "epoch": 4.3,
+      "learning_rate": 1.529850746268657e-05,
+      "loss": 0.683,
       "step": 310
     },
     {
       "epoch": 4.44,
+      "learning_rate": 1.4925373134328357e-05,
+      "loss": 0.6647,
       "step": 320
     },
     {
       "epoch": 4.58,
+      "learning_rate": 1.455223880597015e-05,
+      "loss": 0.7013,
       "step": 330
     },
     {
       "epoch": 4.72,
+      "learning_rate": 1.417910447761194e-05,
+      "loss": 0.6824,
       "step": 340
     },
     {
       "epoch": 4.86,
+      "learning_rate": 1.3805970149253733e-05,
+      "loss": 0.6746,
       "step": 350
     },
     {
       "epoch": 5.0,
+      "learning_rate": 1.3432835820895523e-05,
+      "loss": 0.6784,
       "step": 360
     },
     {
       "epoch": 5.0,
+      "eval_loss": 0.7020928859710693,
+      "eval_runtime": 128.5118,
+      "eval_samples_per_second": 4.14,
+      "eval_steps_per_second": 0.521,
+      "eval_wer": 0.4596001799832873,
       "step": 360
     },
     {
       "epoch": 5.14,
+      "learning_rate": 1.3059701492537313e-05,
+      "loss": 0.6613,
       "step": 370
     },
     {
       "epoch": 5.28,
+      "learning_rate": 1.2686567164179105e-05,
+      "loss": 0.6596,
       "step": 380
     },
     {
       "epoch": 5.42,
+      "learning_rate": 1.2313432835820896e-05,
+      "loss": 0.6584,
       "step": 390
     },
     {
       "epoch": 5.55,
+      "learning_rate": 1.1940298507462686e-05,
+      "loss": 0.6721,
       "step": 400
     },
     {
       "epoch": 5.69,
+      "learning_rate": 1.1567164179104478e-05,
+      "loss": 0.679,
       "step": 410
     },
     {
       "epoch": 5.83,
+      "learning_rate": 1.119402985074627e-05,
+      "loss": 0.7022,
       "step": 420
     },
     {
       "epoch": 5.97,
+      "learning_rate": 1.082089552238806e-05,
+      "loss": 0.6493,
       "step": 430
     },
     {
       "epoch": 6.0,
+      "eval_loss": 0.7246174216270447,
+      "eval_runtime": 129.6572,
+      "eval_samples_per_second": 4.103,
+      "eval_steps_per_second": 0.517,
+      "eval_wer": 0.4651282380921772,
       "step": 432
     },
     {
       "epoch": 6.11,
+      "learning_rate": 1.0447761194029851e-05,
+      "loss": 0.7152,
       "step": 440
     },
     {
       "epoch": 6.25,
+      "learning_rate": 1.0074626865671643e-05,
+      "loss": 0.6432,
       "step": 450
     },
     {
       "epoch": 6.39,
+      "learning_rate": 9.701492537313434e-06,
+      "loss": 0.6463,
       "step": 460
     },
     {
       "epoch": 6.53,
+      "learning_rate": 9.328358208955226e-06,
+      "loss": 0.6777,
       "step": 470
     },
     {
       "epoch": 6.66,
+      "learning_rate": 8.955223880597016e-06,
+      "loss": 0.676,
       "step": 480
     },
     {
       "epoch": 6.8,
+      "learning_rate": 8.582089552238805e-06,
+      "loss": 0.6484,
       "step": 490
     },
     {
       "epoch": 6.94,
+      "learning_rate": 8.208955223880597e-06,
+      "loss": 0.6338,
       "step": 500
     },
     {
       "epoch": 7.0,
+      "eval_loss": 0.7020286917686462,
+      "eval_runtime": 128.8637,
+      "eval_samples_per_second": 4.128,
+      "eval_steps_per_second": 0.52,
+      "eval_wer": 0.44552291572925373,
       "step": 504
     },
     {
       "epoch": 7.08,
+      "learning_rate": 7.835820895522389e-06,
+      "loss": 0.6875,
       "step": 510
     },
     {
       "epoch": 7.22,
+      "learning_rate": 7.4626865671641785e-06,
+      "loss": 0.6397,
       "step": 520
     },
     {
       "epoch": 7.36,
+      "learning_rate": 7.08955223880597e-06,
+      "loss": 0.6695,
       "step": 530
     },
     {
       "epoch": 7.5,
+      "learning_rate": 6.716417910447762e-06,
+      "loss": 0.6582,
       "step": 540
     },
     {
       "epoch": 7.64,
+      "learning_rate": 6.343283582089552e-06,
+      "loss": 0.6335,
       "step": 550
     },
     {
       "epoch": 7.78,
+      "learning_rate": 5.970149253731343e-06,
+      "loss": 0.6542,
       "step": 560
     },
     {
       "epoch": 7.91,
+      "learning_rate": 5.597014925373135e-06,
+      "loss": 0.6464,
       "step": 570
     },
     {
       "epoch": 8.0,
+      "eval_loss": 0.6980531811714172,
+      "eval_runtime": 129.6171,
+      "eval_samples_per_second": 4.104,
+      "eval_steps_per_second": 0.517,
+      "eval_wer": 0.439737738638555,
       "step": 576
     },
     {
       "epoch": 8.06,
+      "learning_rate": 5.2238805970149255e-06,
+      "loss": 0.6731,
       "step": 580
     },
     {
       "epoch": 8.19,
+      "learning_rate": 4.850746268656717e-06,
+      "loss": 0.632,
       "step": 590
     },
     {
       "epoch": 8.33,
+      "learning_rate": 4.477611940298508e-06,
+      "loss": 0.644,
       "step": 600
     },
     {
       "epoch": 8.47,
+      "learning_rate": 4.1044776119402985e-06,
+      "loss": 0.6391,
       "step": 610
     },
     {
       "epoch": 8.61,
+      "learning_rate": 3.7313432835820893e-06,
+      "loss": 0.6551,
       "step": 620
     },
     {
       "epoch": 8.75,
+      "learning_rate": 3.358208955223881e-06,
+      "loss": 0.6572,
       "step": 630
     },
     {
       "epoch": 8.89,
+      "learning_rate": 2.9850746268656716e-06,
+      "loss": 0.6227,
       "step": 640
     },
     {
       "epoch": 9.0,
+      "eval_loss": 0.6833487153053284,
+      "eval_runtime": 129.1282,
+      "eval_samples_per_second": 4.12,
+      "eval_steps_per_second": 0.519,
+      "eval_wer": 0.43639519187504017,
       "step": 648
     },
     {
       "epoch": 9.03,
+      "learning_rate": 2.6119402985074627e-06,
+      "loss": 0.6722,
       "step": 650
     },
     {
       "epoch": 9.17,
+      "learning_rate": 2.238805970149254e-06,
+      "loss": 0.6375,
       "step": 660
     },
     {
       "epoch": 9.3,
+      "learning_rate": 1.8656716417910446e-06,
+      "loss": 0.6752,
       "step": 670
     },
     {
       "epoch": 9.44,
+      "learning_rate": 1.4925373134328358e-06,
+      "loss": 0.6428,
       "step": 680
     },
     {
       "epoch": 9.58,
+      "learning_rate": 1.119402985074627e-06,
+      "loss": 0.6649,
       "step": 690
     },
     {
       "epoch": 9.72,
+      "learning_rate": 7.462686567164179e-07,
+      "loss": 0.6376,
       "step": 700
     },
     {
       "epoch": 9.86,
+      "learning_rate": 3.7313432835820895e-07,
+      "loss": 0.6634,
       "step": 710
     },
     {
       "epoch": 10.0,
+      "learning_rate": 0.0,
+      "loss": 0.6627,
       "step": 720
     },
     {
       "epoch": 10.0,
+      "eval_loss": 0.6743320226669312,
+      "eval_runtime": 130.183,
+      "eval_samples_per_second": 4.087,
+      "eval_steps_per_second": 0.515,
+      "eval_wer": 0.4303528958025326,
       "step": 720
     },
     {
       "epoch": 10.0,
       "step": 720,
       "total_flos": 2.7197958559499194e+19,
+      "train_loss": 0.6841171807712979,
+      "train_runtime": 19401.0857,
+      "train_samples_per_second": 2.38,
       "train_steps_per_second": 0.037
     }
   ],