AndrewMcDowell
/

wav2vec2-xls-r-1B-german

+{
+    "epoch": 2.0,
+    "eval_loss": 0.14759068191051483,
+    "eval_runtime": 1022.7659,
+    "eval_samples": 16007,
+    "eval_samples_per_second": 15.651,
+    "eval_steps_per_second": 1.956,
+    "eval_wer": 0.16119714847590955,
+    "train_loss": 0.32739020716330625,
+    "train_runtime": 49115.8494,
+    "train_samples": 436168,
+    "train_samples_per_second": 17.761,
+    "train_steps_per_second": 0.555
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 2.0,
+    "eval_loss": 0.14759068191051483,
+    "eval_runtime": 1022.7659,
+    "eval_samples": 16007,
+    "eval_samples_per_second": 15.651,
+    "eval_steps_per_second": 1.956,
+    "eval_wer": 0.16119714847590955
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 2.0,
+    "train_loss": 0.32739020716330625,
+    "train_runtime": 49115.8494,
+    "train_samples": 436168,
+    "train_samples_per_second": 17.761,
+    "train_steps_per_second": 0.555
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,1900 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.9999816584435355,
+  "global_step": 27260,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "learning_rate": 3.675e-06,
+      "loss": 11.4989,
+      "step": 100
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 7.425e-06,
+      "loss": 3.2394,
+      "step": 200
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 1.1174999999999999e-05,
+      "loss": 3.0303,
+      "step": 300
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 1.4925e-05,
+      "loss": 2.9052,
+      "step": 400
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 1.8675e-05,
+      "loss": 2.1033,
+      "step": 500
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 2.2424999999999996e-05,
+      "loss": 1.674,
+      "step": 600
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 2.6174999999999996e-05,
+      "loss": 1.5568,
+      "step": 700
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 2.9925e-05,
+      "loss": 1.4654,
+      "step": 800
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 3.3675e-05,
+      "loss": 1.3031,
+      "step": 900
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 3.7424999999999995e-05,
+      "loss": 1.1842,
+      "step": 1000
+    },
+    {
+      "epoch": 0.07,
+      "eval_loss": 0.44609957933425903,
+      "eval_runtime": 1053.3237,
+      "eval_samples_per_second": 15.197,
+      "eval_steps_per_second": 1.9,
+      "eval_wer": 0.49177182344586473,
+      "step": 1000
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.1175e-05,
+      "loss": 1.1329,
+      "step": 1100
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.4924999999999994e-05,
+      "loss": 1.1316,
+      "step": 1200
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.8675e-05,
+      "loss": 1.1092,
+      "step": 1300
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 5.2424999999999994e-05,
+      "loss": 1.1215,
+      "step": 1400
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 5.6175e-05,
+      "loss": 1.1165,
+      "step": 1500
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 5.9925e-05,
+      "loss": 1.0946,
+      "step": 1600
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 6.367499999999999e-05,
+      "loss": 1.1189,
+      "step": 1700
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 6.7425e-05,
+      "loss": 1.1175,
+      "step": 1800
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 7.1175e-05,
+      "loss": 1.1254,
+      "step": 1900
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 7.492499999999999e-05,
+      "loss": 1.1317,
+      "step": 2000
+    },
+    {
+      "epoch": 0.15,
+      "eval_loss": 0.2668535113334656,
+      "eval_runtime": 988.5751,
+      "eval_samples_per_second": 16.192,
+      "eval_steps_per_second": 2.024,
+      "eval_wer": 0.2748006118212608,
+      "step": 2000
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 7.470902612826603e-05,
+      "loss": 1.1296,
+      "step": 2100
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 7.441211401425178e-05,
+      "loss": 1.1406,
+      "step": 2200
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 7.411520190023751e-05,
+      "loss": 1.1362,
+      "step": 2300
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 7.381828978622327e-05,
+      "loss": 1.1292,
+      "step": 2400
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 7.352137767220902e-05,
+      "loss": 1.105,
+      "step": 2500
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 7.322446555819477e-05,
+      "loss": 1.1231,
+      "step": 2600
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 7.292755344418051e-05,
+      "loss": 1.1187,
+      "step": 2700
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 7.263064133016626e-05,
+      "loss": 1.1339,
+      "step": 2800
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 7.233372921615201e-05,
+      "loss": 1.1241,
+      "step": 2900
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 7.203681710213777e-05,
+      "loss": 1.1029,
+      "step": 3000
+    },
+    {
+      "epoch": 0.22,
+      "eval_loss": 0.2638496458530426,
+      "eval_runtime": 987.5568,
+      "eval_samples_per_second": 16.209,
+      "eval_steps_per_second": 2.026,
+      "eval_wer": 0.2705875122910521,
+      "step": 3000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 7.173990498812351e-05,
+      "loss": 1.1215,
+      "step": 3100
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 7.144299287410925e-05,
+      "loss": 1.1067,
+      "step": 3200
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 7.114608076009501e-05,
+      "loss": 1.1126,
+      "step": 3300
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 7.084916864608076e-05,
+      "loss": 1.109,
+      "step": 3400
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 7.05522565320665e-05,
+      "loss": 1.1077,
+      "step": 3500
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 7.025534441805225e-05,
+      "loss": 1.1,
+      "step": 3600
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 6.9958432304038e-05,
+      "loss": 1.1061,
+      "step": 3700
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 6.966152019002374e-05,
+      "loss": 1.103,
+      "step": 3800
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 6.936460807600949e-05,
+      "loss": 1.0947,
+      "step": 3900
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 6.906769596199525e-05,
+      "loss": 1.0949,
+      "step": 4000
+    },
+    {
+      "epoch": 0.29,
+      "eval_loss": 0.25188884139060974,
+      "eval_runtime": 996.0428,
+      "eval_samples_per_second": 16.071,
+      "eval_steps_per_second": 2.009,
+      "eval_wer": 0.26274172402490986,
+      "step": 4000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 6.8770783847981e-05,
+      "loss": 1.1076,
+      "step": 4100
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 6.847387173396674e-05,
+      "loss": 1.1012,
+      "step": 4200
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 6.817695961995249e-05,
+      "loss": 1.081,
+      "step": 4300
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 6.788004750593824e-05,
+      "loss": 1.0868,
+      "step": 4400
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 6.758313539192398e-05,
+      "loss": 1.0956,
+      "step": 4500
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 6.728622327790973e-05,
+      "loss": 1.0953,
+      "step": 4600
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 6.698931116389548e-05,
+      "loss": 1.0952,
+      "step": 4700
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.669239904988122e-05,
+      "loss": 1.0968,
+      "step": 4800
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 6.639548693586698e-05,
+      "loss": 1.0827,
+      "step": 4900
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 6.609857482185273e-05,
+      "loss": 1.0923,
+      "step": 5000
+    },
+    {
+      "epoch": 0.37,
+      "eval_loss": 0.24751192331314087,
+      "eval_runtime": 984.8205,
+      "eval_samples_per_second": 16.254,
+      "eval_steps_per_second": 2.032,
+      "eval_wer": 0.25769556429585927,
+      "step": 5000
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 6.580166270783846e-05,
+      "loss": 1.0895,
+      "step": 5100
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 6.550771971496436e-05,
+      "loss": 1.0851,
+      "step": 5200
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 6.521080760095011e-05,
+      "loss": 1.1124,
+      "step": 5300
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 6.491686460807601e-05,
+      "loss": 1.0809,
+      "step": 5400
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 6.461995249406176e-05,
+      "loss": 1.0985,
+      "step": 5500
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 6.432304038004749e-05,
+      "loss": 1.086,
+      "step": 5600
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 6.402612826603325e-05,
+      "loss": 1.0823,
+      "step": 5700
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 6.3729216152019e-05,
+      "loss": 1.0732,
+      "step": 5800
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 6.343230403800475e-05,
+      "loss": 1.076,
+      "step": 5900
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 6.313539192399049e-05,
+      "loss": 1.0847,
+      "step": 6000
+    },
+    {
+      "epoch": 0.44,
+      "eval_loss": 0.24355509877204895,
+      "eval_runtime": 984.3756,
+      "eval_samples_per_second": 16.261,
+      "eval_steps_per_second": 2.033,
+      "eval_wer": 0.26121217087293785,
+      "step": 6000
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 6.283847980997624e-05,
+      "loss": 1.0748,
+      "step": 6100
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 6.254156769596199e-05,
+      "loss": 1.0836,
+      "step": 6200
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 6.224465558194773e-05,
+      "loss": 1.084,
+      "step": 6300
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 6.194774346793349e-05,
+      "loss": 1.0649,
+      "step": 6400
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 6.165083135391923e-05,
+      "loss": 1.0751,
+      "step": 6500
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 6.135391923990499e-05,
+      "loss": 1.0773,
+      "step": 6600
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 6.105700712589073e-05,
+      "loss": 1.095,
+      "step": 6700
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 6.076009501187648e-05,
+      "loss": 1.0629,
+      "step": 6800
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 6.0463182897862234e-05,
+      "loss": 1.0904,
+      "step": 6900
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 6.0166270783847974e-05,
+      "loss": 1.0667,
+      "step": 7000
+    },
+    {
+      "epoch": 0.51,
+      "eval_loss": 0.24724909663200378,
+      "eval_runtime": 983.1677,
+      "eval_samples_per_second": 16.281,
+      "eval_steps_per_second": 2.035,
+      "eval_wer": 0.26608762154484866,
+      "step": 7000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.986935866983372e-05,
+      "loss": 1.0825,
+      "step": 7100
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 5.9572446555819474e-05,
+      "loss": 1.0811,
+      "step": 7200
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 5.927553444180522e-05,
+      "loss": 1.0906,
+      "step": 7300
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 5.8978622327790975e-05,
+      "loss": 1.0784,
+      "step": 7400
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 5.8681710213776715e-05,
+      "loss": 1.0822,
+      "step": 7500
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 5.838479809976246e-05,
+      "loss": 1.0802,
+      "step": 7600
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 5.8087885985748215e-05,
+      "loss": 1.0805,
+      "step": 7700
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 5.779097387173396e-05,
+      "loss": 1.093,
+      "step": 7800
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 5.749406175771971e-05,
+      "loss": 1.0456,
+      "step": 7900
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 5.7197149643705455e-05,
+      "loss": 1.0709,
+      "step": 8000
+    },
+    {
+      "epoch": 0.59,
+      "eval_loss": 0.24887976050376892,
+      "eval_runtime": 982.4054,
+      "eval_samples_per_second": 16.294,
+      "eval_steps_per_second": 2.037,
+      "eval_wer": 0.26095269310608543,
+      "step": 8000
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 5.690023752969121e-05,
+      "loss": 1.0677,
+      "step": 8100
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 5.6603325415676956e-05,
+      "loss": 1.0659,
+      "step": 8200
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 5.630641330166271e-05,
+      "loss": 1.0788,
+      "step": 8300
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 5.600950118764845e-05,
+      "loss": 1.071,
+      "step": 8400
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 5.5712589073634196e-05,
+      "loss": 1.0669,
+      "step": 8500
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 5.541567695961995e-05,
+      "loss": 1.0728,
+      "step": 8600
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 5.512173396674584e-05,
+      "loss": 1.0652,
+      "step": 8700
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 5.482482185273159e-05,
+      "loss": 1.0632,
+      "step": 8800
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 5.452790973871733e-05,
+      "loss": 1.048,
+      "step": 8900
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 5.4230997624703083e-05,
+      "loss": 1.0472,
+      "step": 9000
+    },
+    {
+      "epoch": 0.66,
+      "eval_loss": 0.23543120920658112,
+      "eval_runtime": 985.8901,
+      "eval_samples_per_second": 16.236,
+      "eval_steps_per_second": 2.03,
+      "eval_wer": 0.24997268655085764,
+      "step": 9000
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 5.393408551068883e-05,
+      "loss": 1.0552,
+      "step": 9100
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 5.3637173396674584e-05,
+      "loss": 1.0581,
+      "step": 9200
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 5.3340261282660324e-05,
+      "loss": 1.0658,
+      "step": 9300
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 5.304334916864607e-05,
+      "loss": 1.0603,
+      "step": 9400
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 5.2746437054631824e-05,
+      "loss": 1.0661,
+      "step": 9500
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 5.244952494061757e-05,
+      "loss": 1.0554,
+      "step": 9600
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 5.2152612826603325e-05,
+      "loss": 1.0728,
+      "step": 9700
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 5.1855700712589065e-05,
+      "loss": 1.0513,
+      "step": 9800
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 5.155878859857482e-05,
+      "loss": 1.0379,
+      "step": 9900
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 5.1261876484560565e-05,
+      "loss": 1.0604,
+      "step": 10000
+    },
+    {
+      "epoch": 0.73,
+      "eval_loss": 0.23458585143089294,
+      "eval_runtime": 986.1525,
+      "eval_samples_per_second": 16.232,
+      "eval_steps_per_second": 2.029,
+      "eval_wer": 0.2485182453840271,
+      "step": 10000
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 5.096496437054632e-05,
+      "loss": 1.0632,
+      "step": 10100
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 5.0668052256532065e-05,
+      "loss": 1.0526,
+      "step": 10200
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 5.0371140142517805e-05,
+      "loss": 1.0314,
+      "step": 10300
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 5.007422802850356e-05,
+      "loss": 1.0508,
+      "step": 10400
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 4.9777315914489306e-05,
+      "loss": 1.0446,
+      "step": 10500
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 4.948040380047506e-05,
+      "loss": 1.0361,
+      "step": 10600
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 4.91834916864608e-05,
+      "loss": 1.0319,
+      "step": 10700
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 4.8886579572446546e-05,
+      "loss": 1.0178,
+      "step": 10800
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 4.85896674584323e-05,
+      "loss": 1.0301,
+      "step": 10900
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 4.8292755344418046e-05,
+      "loss": 1.0375,
+      "step": 11000
+    },
+    {
+      "epoch": 0.81,
+      "eval_loss": 0.2285824865102768,
+      "eval_runtime": 979.8277,
+      "eval_samples_per_second": 16.337,
+      "eval_steps_per_second": 2.042,
+      "eval_wer": 0.23898585163334427,
+      "step": 11000
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 4.79958432304038e-05,
+      "loss": 1.0398,
+      "step": 11100
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 4.769893111638954e-05,
+      "loss": 1.0308,
+      "step": 11200
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 4.7402019002375294e-05,
+      "loss": 1.0309,
+      "step": 11300
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 4.710510688836104e-05,
+      "loss": 1.0287,
+      "step": 11400
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 4.6808194774346794e-05,
+      "loss": 1.0195,
+      "step": 11500
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 4.651128266033254e-05,
+      "loss": 1.0292,
+      "step": 11600
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 4.621437054631828e-05,
+      "loss": 1.0147,
+      "step": 11700
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 4.5917458432304034e-05,
+      "loss": 1.0242,
+      "step": 11800
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 4.562054631828978e-05,
+      "loss": 1.029,
+      "step": 11900
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 4.5326603325415675e-05,
+      "loss": 1.0193,
+      "step": 12000
+    },
+    {
+      "epoch": 0.88,
+      "eval_loss": 0.22122837603092194,
+      "eval_runtime": 981.4673,
+      "eval_samples_per_second": 16.309,
+      "eval_steps_per_second": 2.039,
+      "eval_wer": 0.23376215448486834,
+      "step": 12000
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 4.502969121140143e-05,
+      "loss": 1.0249,
+      "step": 12100
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 4.473277909738717e-05,
+      "loss": 1.0165,
+      "step": 12200
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 4.4435866983372915e-05,
+      "loss": 1.0303,
+      "step": 12300
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 4.413895486935867e-05,
+      "loss": 1.0295,
+      "step": 12400
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 4.3842042755344415e-05,
+      "loss": 1.0112,
+      "step": 12500
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 4.35480997624703e-05,
+      "loss": 1.0056,
+      "step": 12600
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 4.325118764845605e-05,
+      "loss": 1.0108,
+      "step": 12700
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 4.29542755344418e-05,
+      "loss": 1.0133,
+      "step": 12800
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 4.265736342042755e-05,
+      "loss": 1.0063,
+      "step": 12900
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 4.23604513064133e-05,
+      "loss": 1.0077,
+      "step": 13000
+    },
+    {
+      "epoch": 0.95,
+      "eval_loss": 0.21520280838012695,
+      "eval_runtime": 983.9086,
+      "eval_samples_per_second": 16.269,
+      "eval_steps_per_second": 2.034,
+      "eval_wer": 0.22689282202556538,
+      "step": 13000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 4.206353919239904e-05,
+      "loss": 1.0085,
+      "step": 13100
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 4.176662707838479e-05,
+      "loss": 1.011,
+      "step": 13200
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 4.146971496437054e-05,
+      "loss": 1.0131,
+      "step": 13300
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 4.117280285035629e-05,
+      "loss": 0.998,
+      "step": 13400
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 4.0875890736342043e-05,
+      "loss": 1.0002,
+      "step": 13500
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 4.0578978622327783e-05,
+      "loss": 0.9916,
+      "step": 13600
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.028206650831354e-05,
+      "loss": 0.9662,
+      "step": 13700
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 3.9985154394299284e-05,
+      "loss": 0.9758,
+      "step": 13800
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 3.968824228028504e-05,
+      "loss": 1.013,
+      "step": 13900
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 3.939133016627078e-05,
+      "loss": 1.0004,
+      "step": 14000
+    },
+    {
+      "epoch": 1.03,
+      "eval_loss": 0.2093251347541809,
+      "eval_runtime": 986.9604,
+      "eval_samples_per_second": 16.218,
+      "eval_steps_per_second": 2.027,
+      "eval_wer": 0.22069949743253578,
+      "step": 14000
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 3.9094418052256524e-05,
+      "loss": 0.9852,
+      "step": 14100
+    },
+    {
+      "epoch": 1.04,
+      "learning_rate": 3.879750593824228e-05,
+      "loss": 0.9765,
+      "step": 14200
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 3.8500593824228025e-05,
+      "loss": 0.9978,
+      "step": 14300
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 3.820368171021378e-05,
+      "loss": 0.9807,
+      "step": 14400
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 3.790676959619952e-05,
+      "loss": 0.9988,
+      "step": 14500
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 3.7609857482185265e-05,
+      "loss": 0.977,
+      "step": 14600
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 3.731294536817102e-05,
+      "loss": 0.9735,
+      "step": 14700
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 3.7016033254156765e-05,
+      "loss": 0.9767,
+      "step": 14800
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 3.671912114014251e-05,
+      "loss": 0.9555,
+      "step": 14900
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 3.6422209026128266e-05,
+      "loss": 0.9649,
+      "step": 15000
+    },
+    {
+      "epoch": 1.1,
+      "eval_loss": 0.19932541251182556,
+      "eval_runtime": 986.5773,
+      "eval_samples_per_second": 16.225,
+      "eval_steps_per_second": 2.028,
+      "eval_wer": 0.21130367092756475,
+      "step": 15000
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 3.612529691211401e-05,
+      "loss": 0.9608,
+      "step": 15100
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 3.582838479809976e-05,
+      "loss": 0.9549,
+      "step": 15200
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 3.5531472684085506e-05,
+      "loss": 0.9636,
+      "step": 15300
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 3.523456057007125e-05,
+      "loss": 0.9605,
+      "step": 15400
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 3.4937648456057006e-05,
+      "loss": 0.962,
+      "step": 15500
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 3.464073634204275e-05,
+      "loss": 0.9565,
+      "step": 15600
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 3.43438242280285e-05,
+      "loss": 0.9609,
+      "step": 15700
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 3.404691211401425e-05,
+      "loss": 0.9552,
+      "step": 15800
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 3.375e-05,
+      "loss": 0.9503,
+      "step": 15900
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 3.345308788598574e-05,
+      "loss": 0.9509,
+      "step": 16000
+    },
+    {
+      "epoch": 1.17,
+      "eval_loss": 0.19342663884162903,
+      "eval_runtime": 984.1094,
+      "eval_samples_per_second": 16.265,
+      "eval_steps_per_second": 2.033,
+      "eval_wer": 0.20888643067846607,
+      "step": 16000
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 3.3156175771971494e-05,
+      "loss": 0.9369,
+      "step": 16100
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 3.285926365795724e-05,
+      "loss": 0.9549,
+      "step": 16200
+    },
+    {
+      "epoch": 1.2,
+      "learning_rate": 3.256235154394299e-05,
+      "loss": 0.9503,
+      "step": 16300
+    },
+    {
+      "epoch": 1.2,
+      "learning_rate": 3.226543942992874e-05,
+      "loss": 0.9553,
+      "step": 16400
+    },
+    {
+      "epoch": 1.21,
+      "learning_rate": 3.196852731591449e-05,
+      "loss": 0.9508,
+      "step": 16500
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 3.1671615201900235e-05,
+      "loss": 0.9411,
+      "step": 16600
+    },
+    {
+      "epoch": 1.23,
+      "learning_rate": 3.137470308788598e-05,
+      "loss": 0.9435,
+      "step": 16700
+    },
+    {
+      "epoch": 1.23,
+      "learning_rate": 3.107779097387173e-05,
+      "loss": 0.9439,
+      "step": 16800
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 3.078087885985748e-05,
+      "loss": 0.946,
+      "step": 16900
+    },
+    {
+      "epoch": 1.25,
+      "learning_rate": 3.048396674584323e-05,
+      "loss": 0.9533,
+      "step": 17000
+    },
+    {
+      "epoch": 1.25,
+      "eval_loss": 0.18736572563648224,
+      "eval_runtime": 984.7341,
+      "eval_samples_per_second": 16.255,
+      "eval_steps_per_second": 2.032,
+      "eval_wer": 0.20231071779744347,
+      "step": 17000
+    },
+    {
+      "epoch": 1.25,
+      "learning_rate": 3.018705463182898e-05,
+      "loss": 0.9322,
+      "step": 17100
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 2.9890142517814722e-05,
+      "loss": 0.94,
+      "step": 17200
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 2.9593230403800473e-05,
+      "loss": 0.9373,
+      "step": 17300
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 2.9299287410926363e-05,
+      "loss": 0.924,
+      "step": 17400
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 2.9005344418052253e-05,
+      "loss": 0.9357,
+      "step": 17500
+    },
+    {
+      "epoch": 1.29,
+      "learning_rate": 2.8708432304038003e-05,
+      "loss": 0.9351,
+      "step": 17600
+    },
+    {
+      "epoch": 1.3,
+      "learning_rate": 2.841152019002375e-05,
+      "loss": 0.9371,
+      "step": 17700
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 2.81146080760095e-05,
+      "loss": 0.9253,
+      "step": 17800
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 2.7817695961995246e-05,
+      "loss": 0.9264,
+      "step": 17900
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 2.7520783847980997e-05,
+      "loss": 0.9248,
+      "step": 18000
+    },
+    {
+      "epoch": 1.32,
+      "eval_loss": 0.1818237155675888,
+      "eval_runtime": 1114.2718,
+      "eval_samples_per_second": 14.365,
+      "eval_steps_per_second": 1.796,
+      "eval_wer": 0.19742843876324703,
+      "step": 18000
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 2.722387173396674e-05,
+      "loss": 0.9448,
+      "step": 18100
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 2.692695961995249e-05,
+      "loss": 0.9284,
+      "step": 18200
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 2.663004750593824e-05,
+      "loss": 0.9141,
+      "step": 18300
+    },
+    {
+      "epoch": 1.35,
+      "learning_rate": 2.6333135391923987e-05,
+      "loss": 0.9117,
+      "step": 18400
+    },
+    {
+      "epoch": 1.36,
+      "learning_rate": 2.6036223277909737e-05,
+      "loss": 0.917,
+      "step": 18500
+    },
+    {
+      "epoch": 1.36,
+      "learning_rate": 2.5739311163895484e-05,
+      "loss": 0.9165,
+      "step": 18600
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 2.5442399049881234e-05,
+      "loss": 0.9099,
+      "step": 18700
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 2.5145486935866978e-05,
+      "loss": 0.9022,
+      "step": 18800
+    },
+    {
+      "epoch": 1.39,
+      "learning_rate": 2.4848574821852728e-05,
+      "loss": 0.9246,
+      "step": 18900
+    },
+    {
+      "epoch": 1.39,
+      "learning_rate": 2.4551662707838478e-05,
+      "loss": 0.9216,
+      "step": 19000
+    },
+    {
+      "epoch": 1.39,
+      "eval_loss": 0.17756715416908264,
+      "eval_runtime": 1032.2412,
+      "eval_samples_per_second": 15.507,
+      "eval_steps_per_second": 1.939,
+      "eval_wer": 0.19256664481590735,
+      "step": 19000
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 2.4254750593824225e-05,
+      "loss": 0.9142,
+      "step": 19100
+    },
+    {
+      "epoch": 1.41,
+      "learning_rate": 2.3957838479809975e-05,
+      "loss": 0.9275,
+      "step": 19200
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 2.3660926365795722e-05,
+      "loss": 0.9132,
+      "step": 19300
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 2.3364014251781472e-05,
+      "loss": 0.9111,
+      "step": 19400
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 2.3067102137767216e-05,
+      "loss": 0.8974,
+      "step": 19500
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 2.2770190023752966e-05,
+      "loss": 0.9013,
+      "step": 19600
+    },
+    {
+      "epoch": 1.45,
+      "learning_rate": 2.2473277909738716e-05,
+      "loss": 0.9093,
+      "step": 19700
+    },
+    {
+      "epoch": 1.45,
+      "learning_rate": 2.2176365795724463e-05,
+      "loss": 0.8926,
+      "step": 19800
+    },
+    {
+      "epoch": 1.46,
+      "learning_rate": 2.1879453681710213e-05,
+      "loss": 0.9026,
+      "step": 19900
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 2.158254156769596e-05,
+      "loss": 0.8964,
+      "step": 20000
+    },
+    {
+      "epoch": 1.47,
+      "eval_loss": 0.1722368746995926,
+      "eval_runtime": 1019.2936,
+      "eval_samples_per_second": 15.704,
+      "eval_steps_per_second": 1.963,
+      "eval_wer": 0.19043619578280346,
+      "step": 20000
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 2.128859857482185e-05,
+      "loss": 0.8906,
+      "step": 20100
+    },
+    {
+      "epoch": 1.48,
+      "learning_rate": 2.09916864608076e-05,
+      "loss": 0.8878,
+      "step": 20200
+    },
+    {
+      "epoch": 1.49,
+      "learning_rate": 2.0694774346793347e-05,
+      "loss": 0.9024,
+      "step": 20300
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 2.0397862232779097e-05,
+      "loss": 0.8903,
+      "step": 20400
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 2.0100950118764844e-05,
+      "loss": 0.8843,
+      "step": 20500
+    },
+    {
+      "epoch": 1.51,
+      "learning_rate": 1.9804038004750594e-05,
+      "loss": 0.8911,
+      "step": 20600
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 1.9507125890736337e-05,
+      "loss": 0.8795,
+      "step": 20700
+    },
+    {
+      "epoch": 1.53,
+      "learning_rate": 1.9210213776722087e-05,
+      "loss": 0.8777,
+      "step": 20800
+    },
+    {
+      "epoch": 1.53,
+      "learning_rate": 1.8913301662707838e-05,
+      "loss": 0.889,
+      "step": 20900
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 1.8616389548693584e-05,
+      "loss": 0.8941,
+      "step": 21000
+    },
+    {
+      "epoch": 1.54,
+      "eval_loss": 0.16895848512649536,
+      "eval_runtime": 1022.9987,
+      "eval_samples_per_second": 15.647,
+      "eval_steps_per_second": 1.956,
+      "eval_wer": 0.18521932699661314,
+      "step": 21000
+    },
+    {
+      "epoch": 1.55,
+      "learning_rate": 1.831947743467933e-05,
+      "loss": 0.882,
+      "step": 21100
+    },
+    {
+      "epoch": 1.56,
+      "learning_rate": 1.802256532066508e-05,
+      "loss": 0.8801,
+      "step": 21200
+    },
+    {
+      "epoch": 1.56,
+      "learning_rate": 1.772565320665083e-05,
+      "loss": 0.8718,
+      "step": 21300
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 1.742874109263658e-05,
+      "loss": 0.8904,
+      "step": 21400
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 1.7131828978622325e-05,
+      "loss": 0.8729,
+      "step": 21500
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 1.6834916864608075e-05,
+      "loss": 0.8722,
+      "step": 21600
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 1.6538004750593822e-05,
+      "loss": 0.8739,
+      "step": 21700
+    },
+    {
+      "epoch": 1.6,
+      "learning_rate": 1.624109263657957e-05,
+      "loss": 0.8635,
+      "step": 21800
+    },
+    {
+      "epoch": 1.61,
+      "learning_rate": 1.594418052256532e-05,
+      "loss": 0.8767,
+      "step": 21900
+    },
+    {
+      "epoch": 1.61,
+      "learning_rate": 1.564726840855107e-05,
+      "loss": 0.871,
+      "step": 22000
+    },
+    {
+      "epoch": 1.61,
+      "eval_loss": 0.16269078850746155,
+      "eval_runtime": 1042.6643,
+      "eval_samples_per_second": 15.352,
+      "eval_steps_per_second": 1.919,
+      "eval_wer": 0.17805637495902982,
+      "step": 22000
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 1.5350356294536816e-05,
+      "loss": 0.8663,
+      "step": 22100
+    },
+    {
+      "epoch": 1.63,
+      "learning_rate": 1.5056413301662706e-05,
+      "loss": 0.8732,
+      "step": 22200
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 1.4759501187648455e-05,
+      "loss": 0.8625,
+      "step": 22300
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 1.4462589073634203e-05,
+      "loss": 0.854,
+      "step": 22400
+    },
+    {
+      "epoch": 1.65,
+      "learning_rate": 1.416567695961995e-05,
+      "loss": 0.8692,
+      "step": 22500
+    },
+    {
+      "epoch": 1.66,
+      "learning_rate": 1.38687648456057e-05,
+      "loss": 0.8477,
+      "step": 22600
+    },
+    {
+      "epoch": 1.67,
+      "learning_rate": 1.3571852731591449e-05,
+      "loss": 0.8494,
+      "step": 22700
+    },
+    {
+      "epoch": 1.67,
+      "learning_rate": 1.3277909738717339e-05,
+      "loss": 0.8599,
+      "step": 22800
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 1.2980997624703087e-05,
+      "loss": 0.863,
+      "step": 22900
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 1.2684085510688834e-05,
+      "loss": 0.847,
+      "step": 23000
+    },
+    {
+      "epoch": 1.69,
+      "eval_loss": 0.15907420217990875,
+      "eval_runtime": 1036.4519,
+      "eval_samples_per_second": 15.444,
+      "eval_steps_per_second": 1.931,
+      "eval_wer": 0.17514066426308314,
+      "step": 23000
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 1.2387173396674582e-05,
+      "loss": 0.8487,
+      "step": 23100
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 1.2090261282660333e-05,
+      "loss": 0.8637,
+      "step": 23200
+    },
+    {
+      "epoch": 1.71,
+      "learning_rate": 1.1793349168646081e-05,
+      "loss": 0.8456,
+      "step": 23300
+    },
+    {
+      "epoch": 1.72,
+      "learning_rate": 1.1496437054631828e-05,
+      "loss": 0.8518,
+      "step": 23400
+    },
+    {
+      "epoch": 1.72,
+      "learning_rate": 1.1199524940617576e-05,
+      "loss": 0.8456,
+      "step": 23500
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 1.0902612826603325e-05,
+      "loss": 0.8349,
+      "step": 23600
+    },
+    {
+      "epoch": 1.74,
+      "learning_rate": 1.0605700712589072e-05,
+      "loss": 0.8426,
+      "step": 23700
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 1.030878859857482e-05,
+      "loss": 0.8503,
+      "step": 23800
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 1.001187648456057e-05,
+      "loss": 0.844,
+      "step": 23900
+    },
+    {
+      "epoch": 1.76,
+      "learning_rate": 9.714964370546319e-06,
+      "loss": 0.822,
+      "step": 24000
+    },
+    {
+      "epoch": 1.76,
+      "eval_loss": 0.1550702005624771,
+      "eval_runtime": 1027.8442,
+      "eval_samples_per_second": 15.573,
+      "eval_steps_per_second": 1.947,
+      "eval_wer": 0.17010133289631815,
+      "step": 24000
+    },
+    {
+      "epoch": 1.77,
+      "learning_rate": 9.418052256532066e-06,
+      "loss": 0.8452,
+      "step": 24100
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 9.121140142517814e-06,
+      "loss": 0.843,
+      "step": 24200
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 8.824228028503563e-06,
+      "loss": 0.8429,
+      "step": 24300
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 8.527315914489311e-06,
+      "loss": 0.8513,
+      "step": 24400
+    },
+    {
+      "epoch": 1.8,
+      "learning_rate": 8.23040380047506e-06,
+      "loss": 0.834,
+      "step": 24500
+    },
+    {
+      "epoch": 1.8,
+      "learning_rate": 7.933491686460806e-06,
+      "loss": 0.8383,
+      "step": 24600
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 7.636579572446555e-06,
+      "loss": 0.8294,
+      "step": 24700
+    },
+    {
+      "epoch": 1.82,
+      "learning_rate": 7.339667458432303e-06,
+      "loss": 0.8335,
+      "step": 24800
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 7.042755344418052e-06,
+      "loss": 0.8207,
+      "step": 24900
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 6.745843230403799e-06,
+      "loss": 0.8188,
+      "step": 25000
+    },
+    {
+      "epoch": 1.83,
+      "eval_loss": 0.1527515947818756,
+      "eval_runtime": 1034.5359,
+      "eval_samples_per_second": 15.473,
+      "eval_steps_per_second": 1.934,
+      "eval_wer": 0.16672812192723696,
+      "step": 25000
+    },
+    {
+      "epoch": 1.84,
+      "learning_rate": 6.448931116389549e-06,
+      "loss": 0.8289,
+      "step": 25100
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 6.152019002375296e-06,
+      "loss": 0.8306,
+      "step": 25200
+    },
+    {
+      "epoch": 1.86,
+      "learning_rate": 5.855106888361045e-06,
+      "loss": 0.8335,
+      "step": 25300
+    },
+    {
+      "epoch": 1.86,
+      "learning_rate": 5.5581947743467925e-06,
+      "loss": 0.8291,
+      "step": 25400
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 5.261282660332541e-06,
+      "loss": 0.8206,
+      "step": 25500
+    },
+    {
+      "epoch": 1.88,
+      "learning_rate": 4.9643705463182895e-06,
+      "loss": 0.8242,
+      "step": 25600
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 4.667458432304038e-06,
+      "loss": 0.8189,
+      "step": 25700
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 4.370546318289786e-06,
+      "loss": 0.8275,
+      "step": 25800
+    },
+    {
+      "epoch": 1.9,
+      "learning_rate": 4.073634204275534e-06,
+      "loss": 0.8142,
+      "step": 25900
+    },
+    {
+      "epoch": 1.91,
+      "learning_rate": 3.776722090261282e-06,
+      "loss": 0.8305,
+      "step": 26000
+    },
+    {
+      "epoch": 1.91,
+      "eval_loss": 0.14921718835830688,
+      "eval_runtime": 1026.6478,
+      "eval_samples_per_second": 15.592,
+      "eval_steps_per_second": 1.949,
+      "eval_wer": 0.16312957500273134,
+      "step": 26000
+    },
+    {
+      "epoch": 1.91,
+      "learning_rate": 3.4798099762470307e-06,
+      "loss": 0.833,
+      "step": 26100
+    },
+    {
+      "epoch": 1.92,
+      "learning_rate": 3.1828978622327788e-06,
+      "loss": 0.8175,
+      "step": 26200
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 2.888954869358669e-06,
+      "loss": 0.8259,
+      "step": 26300
+    },
+    {
+      "epoch": 1.94,
+      "learning_rate": 2.5920427553444177e-06,
+      "loss": 0.8262,
+      "step": 26400
+    },
+    {
+      "epoch": 1.94,
+      "learning_rate": 2.295130641330166e-06,
+      "loss": 0.8223,
+      "step": 26500
+    },
+    {
+      "epoch": 1.95,
+      "learning_rate": 1.9982185273159142e-06,
+      "loss": 0.8285,
+      "step": 26600
+    },
+    {
+      "epoch": 1.96,
+      "learning_rate": 1.7013064133016625e-06,
+      "loss": 0.8226,
+      "step": 26700
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 1.404394299287411e-06,
+      "loss": 0.8154,
+      "step": 26800
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 1.107482185273159e-06,
+      "loss": 0.8176,
+      "step": 26900
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 8.105700712589074e-07,
+      "loss": 0.8122,
+      "step": 27000
+    },
+    {
+      "epoch": 1.98,
+      "eval_loss": 0.14789555966854095,
+      "eval_runtime": 1030.7995,
+      "eval_samples_per_second": 15.529,
+      "eval_steps_per_second": 1.941,
+      "eval_wer": 0.16106740959248333,
+      "step": 27000
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 5.136579572446555e-07,
+      "loss": 0.818,
+      "step": 27100
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 2.167458432304038e-07,
+      "loss": 0.8284,
+      "step": 27200
+    },
+    {
+      "epoch": 2.0,
+      "step": 27260,
+      "total_flos": 4.0396309180498005e+20,
+      "train_loss": 0.32739020716330625,
+      "train_runtime": 49115.8494,
+      "train_samples_per_second": 17.761,
+      "train_steps_per_second": 0.555
+    }
+  ],
+  "max_steps": 27260,
+  "num_train_epochs": 2,
+  "total_flos": 4.0396309180498005e+20,
+  "trial_name": null,
+  "trial_params": null
+}