End of training

Browse files

Files changed (6) hide show

all_results.json +15 -0
eval_results.json +10 -0
nohup.out +23 -0
runs/Jan31_07-15-59_job-2c68f48a-2d5d-4013-9043-3f2cb25f3ff6/events.out.tfevents.1643727998.job-2c68f48a-2d5d-4013-9043-3f2cb25f3ff6.1151936.2 +3 -0
train_results.json +8 -0
trainer_state.json +2797 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+    "epoch": 50.0,
+    "eval_cer": 0.09533931664304834,
+    "eval_loss": 0.20887407660484314,
+    "eval_runtime": 41.7123,
+    "eval_samples": 456,
+    "eval_samples_per_second": 10.932,
+    "eval_steps_per_second": 1.367,
+    "eval_wer": 0.2953790395650861,
+    "train_loss": 2.2316733406121783,
+    "train_runtime": 114311.9751,
+    "train_samples": 22262,
+    "train_samples_per_second": 9.737,
+    "train_steps_per_second": 0.304
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "epoch": 50.0,
+    "eval_cer": 0.09533931664304834,
+    "eval_loss": 0.20887407660484314,
+    "eval_runtime": 41.7123,
+    "eval_samples": 456,
+    "eval_samples_per_second": 10.932,
+    "eval_steps_per_second": 1.367,
+    "eval_wer": 0.2953790395650861
+}

nohup.out CHANGED Viewed

@@ -5718,3 +5718,26 @@ The progress bars may be unreliable.
 Dropping the following result as it does not have all the necessary fields:
 {'dataset': {'name': 'zeroth_korean_asr', 'type': 'zeroth_korean_asr', 'args': 'clean'}}
  0%|          | 0/57 [00:00<?, ?it/s]
  4%|▎         | 2/57 [00:00<00:20,  2.74it/s]
  5%|▌         | 3/57 [00:01<00:25,  2.08it/s]
  7%|▋         | 4/57 [00:02<00:29,  1.81it/s]
  9%|▉         | 5/57 [00:02<00:28,  1.83it/s]
 11%|█         | 6/57 [00:03<00:29,  1.75it/s]
 12%|█▏        | 7/57 [00:03<00:28,  1.74it/s]
 14%|█▍        | 8/57 [00:04<00:28,  1.70it/s]
 16%|█▌        | 9/57 [00:04<00:27,  1.72it/s]
 18%|█▊        | 10/57 [00:05<00:27,  1.73it/s]
 19%|█▉        | 11/57 [00:06<00:27,  1.66it/s]
 21%|██        | 12/57 [00:06<00:29,  1.53it/s]
 23%|██▎       | 13/57 [00:07<00:30,  1.42it/s]
 25%|██▍       | 14/57 [00:08<00:29,  1.45it/s]
 26%|██▋       | 15/57 [00:09<00:31,  1.35it/s]
 28%|██▊       | 16/57 [00:09<00:28,  1.44it/s]
 30%|██▉       | 17/57 [00:10<00:26,  1.52it/s]
 32%|███▏      | 18/57 [00:11<00:24,  1.60it/s]
 33%|███▎      | 19/57 [00:11<00:22,  1.66it/s]
 35%|███▌      | 20/57 [00:12<00:22,  1.65it/s]
 37%|███▋      | 21/57 [00:12<00:21,  1.64it/s]
 39%|███▊      | 22/57 [00:13<00:23,  1.52it/s]
 40%|████      | 23/57 [00:14<00:24,  1.40it/s]
 42%|████▏     | 24/57 [00:15<00:23,  1.41it/s]
 44%|████▍     | 25/57 [00:15<00:21,  1.46it/s]
 46%|████▌     | 26/57 [00:16<00:20,  1.54it/s]
 47%|████▋     | 27/57 [00:16<00:18,  1.64it/s]
 49%|████▉     | 28/57 [00:17<00:18,  1.57it/s]
 51%|█████     | 29/57 [00:18<00:18,  1.54it/s]
 53%|█████▎    | 30/57 [00:18<00:16,  1.67it/s]
 54%|█████▍    | 31/57 [00:19<00:14,  1.81it/s]
 56%|█████▌    | 32/57 [00:19<00:14,  1.76it/s]
 58%|█████▊    | 33/57 [00:20<00:14,  1.65it/s]
 60%|█████▉    | 34/57 [00:21<00:14,  1.62it/s]
 61%|██████▏   | 35/57 [00:21<00:14,  1.56it/s]
 63%|██████▎   | 36/57 [00:22<00:13,  1.57it/s]
 65%|██████▍   | 37/57 [00:23<00:13,  1.54it/s]
 67%|██████▋   | 38/57 [00:23<00:12,  1.48it/s]
 68%|██████▊   | 39/57 [00:24<00:12,  1.45it/s]
 70%|███████   | 40/57 [00:25<00:11,  1.43it/s]
 72%|███████▏  | 41/57 [00:26<00:11,  1.39it/s]
 74%|███████▎  | 42/57 [00:26<00:11,  1.36it/s]
 75%|███████▌  | 43/57 [00:27<00:09,  1.40it/s]
 77%|███████▋  | 44/57 [00:28<00:09,  1.37it/s]
 79%|███████▉  | 45/57 [00:28<00:07,  1.53it/s]
 81%|████████  | 46/57 [00:29<00:06,  1.58it/s]
 82%|████████▏ | 47/57 [00:30<00:06,  1.52it/s]
 84%|████████▍ | 48/57 [00:30<00:05,  1.60it/s]
 86%|████████▌ | 49/57 [00:31<00:04,  1.64it/s]
 88%|████████▊ | 50/57 [00:31<00:04,  1.64it/s]
 89%|████████▉ | 51/57 [00:32<00:03,  1.65it/s]
 91%|█████████ | 52/57 [00:32<00:02,  1.67it/s]
 93%|█████████▎| 53/57 [00:33<00:02,  1.79it/s]
 95%|█████████▍| 54/57 [00:33<00:01,  1.75it/s]
 96%|█████████▋| 55/57 [00:34<00:01,  1.58it/s]
 98%|█████████▊| 56/57 [00:35<00:00,  1.55it/s]

 Dropping the following result as it does not have all the necessary fields:
 {'dataset': {'name': 'zeroth_korean_asr', 'type': 'zeroth_korean_asr', 'args': 'clean'}}
+To https://huggingface.co/w11wo/wav2vec2-xls-r-300m-korean
+   024e2da..2be5bf6  main -> main
+02/01/2022 15:05:53 - WARNING - huggingface_hub.repository - To https://huggingface.co/w11wo/wav2vec2-xls-r-300m-korean
+   024e2da..2be5bf6  main -> main
+***** train metrics *****
+  epoch                    =              50.0
+  train_loss               =            2.2317
+  train_runtime            = 1 day, 7:45:11.97
+  train_samples            =             22262
+  train_samples_per_second =             9.737
+  train_steps_per_second   =             0.304
+02/01/2022 15:05:56 - INFO - __main__ - *** Evaluate ***
+The following columns in the evaluation set  don't have a corresponding argument in `Wav2Vec2ForCTC.forward` and have been ignored: input_length.
+***** Running Evaluation *****
+  Num examples = 456
+  Batch size = 8
  0%|          | 0/57 [00:00<?, ?it/s]
  4%|▎         | 2/57 [00:00<00:20,  2.74it/s]
  5%|▌         | 3/57 [00:01<00:25,  2.08it/s]
  7%|▋         | 4/57 [00:02<00:29,  1.81it/s]
  9%|▉         | 5/57 [00:02<00:28,  1.83it/s]
 11%|█         | 6/57 [00:03<00:29,  1.75it/s]
 12%|█▏        | 7/57 [00:03<00:28,  1.74it/s]
 14%|█▍        | 8/57 [00:04<00:28,  1.70it/s]
 16%|█▌        | 9/57 [00:04<00:27,  1.72it/s]
 18%|█▊        | 10/57 [00:05<00:27,  1.73it/s]
 19%|█▉        | 11/57 [00:06<00:27,  1.66it/s]
 21%|██        | 12/57 [00:06<00:29,  1.53it/s]
 23%|██▎       | 13/57 [00:07<00:30,  1.42it/s]
 25%|██▍       | 14/57 [00:08<00:29,  1.45it/s]
 26%|██▋       | 15/57 [00:09<00:31,  1.35it/s]
 28%|██▊       | 16/57 [00:09<00:28,  1.44it/s]
 30%|██▉       | 17/57 [00:10<00:26,  1.52it/s]
 32%|███▏      | 18/57 [00:11<00:24,  1.60it/s]
 33%|███▎      | 19/57 [00:11<00:22,  1.66it/s]
 35%|███▌      | 20/57 [00:12<00:22,  1.65it/s]
 37%|███▋      | 21/57 [00:12<00:21,  1.64it/s]
 39%|███▊      | 22/57 [00:13<00:23,  1.52it/s]
 40%|████      | 23/57 [00:14<00:24,  1.40it/s]
 42%|████▏     | 24/57 [00:15<00:23,  1.41it/s]
 44%|████▍     | 25/57 [00:15<00:21,  1.46it/s]
 46%|████▌     | 26/57 [00:16<00:20,  1.54it/s]
 47%|████▋     | 27/57 [00:16<00:18,  1.64it/s]
 49%|████▉     | 28/57 [00:17<00:18,  1.57it/s]
 51%|█████     | 29/57 [00:18<00:18,  1.54it/s]
 53%|█████▎    | 30/57 [00:18<00:16,  1.67it/s]
 54%|█████▍    | 31/57 [00:19<00:14,  1.81it/s]
 56%|█████▌    | 32/57 [00:19<00:14,  1.76it/s]
 58%|█████▊    | 33/57 [00:20<00:14,  1.65it/s]
 60%|█████▉    | 34/57 [00:21<00:14,  1.62it/s]
 61%|██████▏   | 35/57 [00:21<00:14,  1.56it/s]
 63%|██████▎   | 36/57 [00:22<00:13,  1.57it/s]
 65%|██████▍   | 37/57 [00:23<00:13,  1.54it/s]
 67%|██████▋   | 38/57 [00:23<00:12,  1.48it/s]
 68%|██████▊   | 39/57 [00:24<00:12,  1.45it/s]
 70%|███████   | 40/57 [00:25<00:11,  1.43it/s]
 72%|███████▏  | 41/57 [00:26<00:11,  1.39it/s]
 74%|███████▎  | 42/57 [00:26<00:11,  1.36it/s]
 75%|███████▌  | 43/57 [00:27<00:09,  1.40it/s]
 77%|███████▋  | 44/57 [00:28<00:09,  1.37it/s]
 79%|███████▉  | 45/57 [00:28<00:07,  1.53it/s]
 81%|████████  | 46/57 [00:29<00:06,  1.58it/s]
 82%|████████▏ | 47/57 [00:30<00:06,  1.52it/s]
 84%|████████▍ | 48/57 [00:30<00:05,  1.60it/s]
 86%|████████▌ | 49/57 [00:31<00:04,  1.64it/s]
 88%|████████▊ | 50/57 [00:31<00:04,  1.64it/s]
 89%|████████▉ | 51/57 [00:32<00:03,  1.65it/s]
 91%|█████████ | 52/57 [00:32<00:02,  1.67it/s]
 93%|█████████▎| 53/57 [00:33<00:02,  1.79it/s]
 95%|█████████▍| 54/57 [00:33<00:01,  1.75it/s]
 96%|█████████▋| 55/57 [00:34<00:01,  1.58it/s]
 98%|█████████▊| 56/57 [00:35<00:00,  1.55it/s]
+Saving model checkpoint to ./
+Configuration saved in ./config.json
+Model weights saved in ./pytorch_model.bin
+Configuration saved in ./preprocessor_config.json

runs/Jan31_07-15-59_job-2c68f48a-2d5d-4013-9043-3f2cb25f3ff6/events.out.tfevents.1643727998.job-2c68f48a-2d5d-4013-9043-3f2cb25f3ff6.1151936.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4fcf7744c50287e982c2028e14e51bc27110121c60f9a7d4ec7fc26a06f86232
+size 412

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 50.0,
+    "train_loss": 2.2316733406121783,
+    "train_runtime": 114311.9751,
+    "train_samples": 22262,
+    "train_samples_per_second": 9.737,
+    "train_steps_per_second": 0.304
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,2797 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 49.99892202659001,
+  "global_step": 34750,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.14,
+      "learning_rate": 3.675e-06,
+      "loss": 47.2908,
+      "step": 100
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 7.425e-06,
+      "loss": 33.9125,
+      "step": 200
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 1.1174999999999999e-05,
+      "loss": 26.6068,
+      "step": 300
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 1.4925e-05,
+      "loss": 23.2775,
+      "step": 400
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 1.8675e-05,
+      "loss": 19.7138,
+      "step": 500
+    },
+    {
+      "epoch": 0.72,
+      "eval_cer": 1.0,
+      "eval_loss": 19.642736434936523,
+      "eval_runtime": 41.3907,
+      "eval_samples_per_second": 11.017,
+      "eval_steps_per_second": 1.377,
+      "eval_wer": 1.0,
+      "step": 500
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 2.2424999999999996e-05,
+      "loss": 15.7715,
+      "step": 600
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 2.6174999999999996e-05,
+      "loss": 11.4061,
+      "step": 700
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 2.9925e-05,
+      "loss": 7.4329,
+      "step": 800
+    },
+    {
+      "epoch": 1.29,
+      "learning_rate": 3.3675e-05,
+      "loss": 5.3081,
+      "step": 900
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 3.7424999999999995e-05,
+      "loss": 4.8039,
+      "step": 1000
+    },
+    {
+      "epoch": 1.44,
+      "eval_cer": 1.0,
+      "eval_loss": 4.784187316894531,
+      "eval_runtime": 42.2256,
+      "eval_samples_per_second": 10.799,
+      "eval_steps_per_second": 1.35,
+      "eval_wer": 1.0,
+      "step": 1000
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 4.1175e-05,
+      "loss": 4.762,
+      "step": 1100
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 4.4924999999999994e-05,
+      "loss": 4.6928,
+      "step": 1200
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 4.8675e-05,
+      "loss": 4.6292,
+      "step": 1300
+    },
+    {
+      "epoch": 2.01,
+      "learning_rate": 5.2424999999999994e-05,
+      "loss": 4.6321,
+      "step": 1400
+    },
+    {
+      "epoch": 2.16,
+      "learning_rate": 5.6175e-05,
+      "loss": 4.5619,
+      "step": 1500
+    },
+    {
+      "epoch": 2.16,
+      "eval_cer": 0.9598094788222327,
+      "eval_loss": 4.560794830322266,
+      "eval_runtime": 41.0352,
+      "eval_samples_per_second": 11.112,
+      "eval_steps_per_second": 1.389,
+      "eval_wer": 0.9992449411054062,
+      "step": 1500
+    },
+    {
+      "epoch": 2.3,
+      "learning_rate": 5.9925e-05,
+      "loss": 4.4704,
+      "step": 1600
+    },
+    {
+      "epoch": 2.45,
+      "learning_rate": 6.367499999999999e-05,
+      "loss": 4.3806,
+      "step": 1700
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 6.7425e-05,
+      "loss": 4.3092,
+      "step": 1800
+    },
+    {
+      "epoch": 2.73,
+      "learning_rate": 7.1175e-05,
+      "loss": 4.2794,
+      "step": 1900
+    },
+    {
+      "epoch": 2.88,
+      "learning_rate": 7.492499999999999e-05,
+      "loss": 4.254,
+      "step": 2000
+    },
+    {
+      "epoch": 2.88,
+      "eval_cer": 0.906274602424815,
+      "eval_loss": 4.272861003875732,
+      "eval_runtime": 40.8387,
+      "eval_samples_per_second": 11.166,
+      "eval_steps_per_second": 1.396,
+      "eval_wer": 0.9954696466324373,
+      "step": 2000
+    },
+    {
+      "epoch": 3.02,
+      "learning_rate": 7.477557251908395e-05,
+      "loss": 4.2616,
+      "step": 2100
+    },
+    {
+      "epoch": 3.17,
+      "learning_rate": 7.454656488549618e-05,
+      "loss": 4.2184,
+      "step": 2200
+    },
+    {
+      "epoch": 3.31,
+      "learning_rate": 7.43175572519084e-05,
+      "loss": 4.227,
+      "step": 2300
+    },
+    {
+      "epoch": 3.45,
+      "learning_rate": 7.408854961832061e-05,
+      "loss": 4.1985,
+      "step": 2400
+    },
+    {
+      "epoch": 3.6,
+      "learning_rate": 7.385954198473281e-05,
+      "loss": 4.1905,
+      "step": 2500
+    },
+    {
+      "epoch": 3.6,
+      "eval_cer": 0.8758463234136357,
+      "eval_loss": 4.225706100463867,
+      "eval_runtime": 40.6017,
+      "eval_samples_per_second": 11.231,
+      "eval_steps_per_second": 1.404,
+      "eval_wer": 0.9903352461491997,
+      "step": 2500
+    },
+    {
+      "epoch": 3.74,
+      "learning_rate": 7.36328244274809e-05,
+      "loss": 4.1873,
+      "step": 2600
+    },
+    {
+      "epoch": 3.88,
+      "learning_rate": 7.340381679389312e-05,
+      "loss": 4.1615,
+      "step": 2700
+    },
+    {
+      "epoch": 4.03,
+      "learning_rate": 7.317480916030534e-05,
+      "loss": 4.157,
+      "step": 2800
+    },
+    {
+      "epoch": 4.17,
+      "learning_rate": 7.294580152671756e-05,
+      "loss": 4.1124,
+      "step": 2900
+    },
+    {
+      "epoch": 4.32,
+      "learning_rate": 7.271679389312976e-05,
+      "loss": 4.0683,
+      "step": 3000
+    },
+    {
+      "epoch": 4.32,
+      "eval_cer": 0.7911352542906629,
+      "eval_loss": 3.929443120956421,
+      "eval_runtime": 41.2715,
+      "eval_samples_per_second": 11.049,
+      "eval_steps_per_second": 1.381,
+      "eval_wer": 0.9936575052854123,
+      "step": 3000
+    },
+    {
+      "epoch": 4.46,
+      "learning_rate": 7.248778625954197e-05,
+      "loss": 4.0704,
+      "step": 3100
+    },
+    {
+      "epoch": 4.6,
+      "learning_rate": 7.22587786259542e-05,
+      "loss": 3.9616,
+      "step": 3200
+    },
+    {
+      "epoch": 4.75,
+      "learning_rate": 7.202977099236641e-05,
+      "loss": 3.7798,
+      "step": 3300
+    },
+    {
+      "epoch": 4.89,
+      "learning_rate": 7.180076335877862e-05,
+      "loss": 3.6123,
+      "step": 3400
+    },
+    {
+      "epoch": 5.04,
+      "learning_rate": 7.15740458015267e-05,
+      "loss": 3.486,
+      "step": 3500
+    },
+    {
+      "epoch": 5.04,
+      "eval_cer": 0.5933711226578492,
+      "eval_loss": 2.704545497894287,
+      "eval_runtime": 40.8408,
+      "eval_samples_per_second": 11.165,
+      "eval_steps_per_second": 1.396,
+      "eval_wer": 1.0012080942313502,
+      "step": 3500
+    },
+    {
+      "epoch": 5.18,
+      "learning_rate": 7.134503816793892e-05,
+      "loss": 3.3283,
+      "step": 3600
+    },
+    {
+      "epoch": 5.32,
+      "learning_rate": 7.111603053435114e-05,
+      "loss": 3.2091,
+      "step": 3700
+    },
+    {
+      "epoch": 5.47,
+      "learning_rate": 7.088931297709923e-05,
+      "loss": 3.1158,
+      "step": 3800
+    },
+    {
+      "epoch": 5.61,
+      "learning_rate": 7.066030534351145e-05,
+      "loss": 2.9983,
+      "step": 3900
+    },
+    {
+      "epoch": 5.75,
+      "learning_rate": 7.043129770992365e-05,
+      "loss": 2.946,
+      "step": 4000
+    },
+    {
+      "epoch": 5.75,
+      "eval_cer": 0.4634309557549992,
+      "eval_loss": 1.9690674543380737,
+      "eval_runtime": 40.879,
+      "eval_samples_per_second": 11.155,
+      "eval_steps_per_second": 1.394,
+      "eval_wer": 0.942464512231954,
+      "step": 4000
+    },
+    {
+      "epoch": 5.9,
+      "learning_rate": 7.020229007633587e-05,
+      "loss": 2.8545,
+      "step": 4100
+    },
+    {
+      "epoch": 6.04,
+      "learning_rate": 6.997328244274808e-05,
+      "loss": 2.8092,
+      "step": 4200
+    },
+    {
+      "epoch": 6.19,
+      "learning_rate": 6.97442748091603e-05,
+      "loss": 2.7229,
+      "step": 4300
+    },
+    {
+      "epoch": 6.33,
+      "learning_rate": 6.951526717557252e-05,
+      "loss": 2.7053,
+      "step": 4400
+    },
+    {
+      "epoch": 6.47,
+      "learning_rate": 6.928625954198472e-05,
+      "loss": 2.634,
+      "step": 4500
+    },
+    {
+      "epoch": 6.47,
+      "eval_cer": 0.38501810738466385,
+      "eval_loss": 1.521231770515442,
+      "eval_runtime": 41.5435,
+      "eval_samples_per_second": 10.976,
+      "eval_steps_per_second": 1.372,
+      "eval_wer": 0.880700694654183,
+      "step": 4500
+    },
+    {
+      "epoch": 6.62,
+      "learning_rate": 6.905725190839693e-05,
+      "loss": 2.5996,
+      "step": 4600
+    },
+    {
+      "epoch": 6.76,
+      "learning_rate": 6.882824427480916e-05,
+      "loss": 2.5472,
+      "step": 4700
+    },
+    {
+      "epoch": 6.91,
+      "learning_rate": 6.859923664122137e-05,
+      "loss": 2.4959,
+      "step": 4800
+    },
+    {
+      "epoch": 7.05,
+      "learning_rate": 6.837022900763359e-05,
+      "loss": 2.4554,
+      "step": 4900
+    },
+    {
+      "epoch": 7.19,
+      "learning_rate": 6.814122137404579e-05,
+      "loss": 2.4066,
+      "step": 5000
+    },
+    {
+      "epoch": 7.19,
+      "eval_cer": 0.36014013541174617,
+      "eval_loss": 1.2550952434539795,
+      "eval_runtime": 41.0408,
+      "eval_samples_per_second": 11.111,
+      "eval_steps_per_second": 1.389,
+      "eval_wer": 0.8177287828450619,
+      "step": 5000
+    },
+    {
+      "epoch": 7.34,
+      "learning_rate": 6.791221374045801e-05,
+      "loss": 2.3768,
+      "step": 5100
+    },
+    {
+      "epoch": 7.48,
+      "learning_rate": 6.768320610687023e-05,
+      "loss": 2.3557,
+      "step": 5200
+    },
+    {
+      "epoch": 7.63,
+      "learning_rate": 6.745419847328244e-05,
+      "loss": 2.3109,
+      "step": 5300
+    },
+    {
+      "epoch": 7.77,
+      "learning_rate": 6.722519083969465e-05,
+      "loss": 2.2953,
+      "step": 5400
+    },
+    {
+      "epoch": 7.91,
+      "learning_rate": 6.699618320610687e-05,
+      "loss": 2.2651,
+      "step": 5500
+    },
+    {
+      "epoch": 7.91,
+      "eval_cer": 0.30392851519445757,
+      "eval_loss": 1.0423332452774048,
+      "eval_runtime": 40.9098,
+      "eval_samples_per_second": 11.146,
+      "eval_steps_per_second": 1.393,
+      "eval_wer": 0.7650256720024162,
+      "step": 5500
+    },
+    {
+      "epoch": 8.06,
+      "learning_rate": 6.676717557251908e-05,
+      "loss": 2.2589,
+      "step": 5600
+    },
+    {
+      "epoch": 8.2,
+      "learning_rate": 6.654045801526718e-05,
+      "loss": 2.2122,
+      "step": 5700
+    },
+    {
+      "epoch": 8.34,
+      "learning_rate": 6.631145038167939e-05,
+      "loss": 2.2017,
+      "step": 5800
+    },
+    {
+      "epoch": 8.49,
+      "learning_rate": 6.60824427480916e-05,
+      "loss": 2.1814,
+      "step": 5900
+    },
+    {
+      "epoch": 8.63,
+      "learning_rate": 6.58534351145038e-05,
+      "loss": 2.1828,
+      "step": 6000
+    },
+    {
+      "epoch": 8.63,
+      "eval_cer": 0.3106203747441348,
+      "eval_loss": 0.9598844051361084,
+      "eval_runtime": 41.4743,
+      "eval_samples_per_second": 10.995,
+      "eval_steps_per_second": 1.374,
+      "eval_wer": 0.7272727272727273,
+      "step": 6000
+    },
+    {
+      "epoch": 8.78,
+      "learning_rate": 6.562442748091603e-05,
+      "loss": 2.1714,
+      "step": 6100
+    },
+    {
+      "epoch": 8.92,
+      "learning_rate": 6.539541984732824e-05,
+      "loss": 2.1422,
+      "step": 6200
+    },
+    {
+      "epoch": 9.06,
+      "learning_rate": 6.516641221374046e-05,
+      "loss": 2.1546,
+      "step": 6300
+    },
+    {
+      "epoch": 9.21,
+      "learning_rate": 6.493740458015267e-05,
+      "loss": 2.12,
+      "step": 6400
+    },
+    {
+      "epoch": 9.35,
+      "learning_rate": 6.470839694656488e-05,
+      "loss": 2.1023,
+      "step": 6500
+    },
+    {
+      "epoch": 9.35,
+      "eval_cer": 0.30632971185640057,
+      "eval_loss": 0.9481843113899231,
+      "eval_runtime": 41.1867,
+      "eval_samples_per_second": 11.072,
+      "eval_steps_per_second": 1.384,
+      "eval_wer": 0.7160978556327393,
+      "step": 6500
+    },
+    {
+      "epoch": 9.5,
+      "learning_rate": 6.44793893129771e-05,
+      "loss": 2.1104,
+      "step": 6600
+    },
+    {
+      "epoch": 9.64,
+      "learning_rate": 6.425038167938931e-05,
+      "loss": 2.0879,
+      "step": 6700
+    },
+    {
+      "epoch": 9.78,
+      "learning_rate": 6.402137404580152e-05,
+      "loss": 2.0724,
+      "step": 6800
+    },
+    {
+      "epoch": 9.93,
+      "learning_rate": 6.379236641221374e-05,
+      "loss": 2.0622,
+      "step": 6900
+    },
+    {
+      "epoch": 10.07,
+      "learning_rate": 6.356335877862595e-05,
+      "loss": 2.0536,
+      "step": 7000
+    },
+    {
+      "epoch": 10.07,
+      "eval_cer": 0.28597858604944104,
+      "eval_loss": 0.8241907954216003,
+      "eval_runtime": 41.2837,
+      "eval_samples_per_second": 11.046,
+      "eval_steps_per_second": 1.381,
+      "eval_wer": 0.6766837813349441,
+      "step": 7000
+    },
+    {
+      "epoch": 10.22,
+      "learning_rate": 6.333435114503816e-05,
+      "loss": 2.0258,
+      "step": 7100
+    },
+    {
+      "epoch": 10.36,
+      "learning_rate": 6.310534351145038e-05,
+      "loss": 2.038,
+      "step": 7200
+    },
+    {
+      "epoch": 10.5,
+      "learning_rate": 6.287633587786259e-05,
+      "loss": 2.0093,
+      "step": 7300
+    },
+    {
+      "epoch": 10.65,
+      "learning_rate": 6.26473282442748e-05,
+      "loss": 1.9839,
+      "step": 7400
+    },
+    {
+      "epoch": 10.79,
+      "learning_rate": 6.241832061068702e-05,
+      "loss": 1.9803,
+      "step": 7500
+    },
+    {
+      "epoch": 10.79,
+      "eval_cer": 0.2636592662572823,
+      "eval_loss": 0.7643126845359802,
+      "eval_runtime": 41.3574,
+      "eval_samples_per_second": 11.026,
+      "eval_steps_per_second": 1.378,
+      "eval_wer": 0.6562971911809121,
+      "step": 7500
+    },
+    {
+      "epoch": 10.93,
+      "learning_rate": 6.218931297709923e-05,
+      "loss": 1.9704,
+      "step": 7600
+    },
+    {
+      "epoch": 11.08,
+      "learning_rate": 6.196030534351144e-05,
+      "loss": 1.9923,
+      "step": 7700
+    },
+    {
+      "epoch": 11.22,
+      "learning_rate": 6.173129770992366e-05,
+      "loss": 1.9549,
+      "step": 7800
+    },
+    {
+      "epoch": 11.37,
+      "learning_rate": 6.150229007633587e-05,
+      "loss": 1.9339,
+      "step": 7900
+    },
+    {
+      "epoch": 11.51,
+      "learning_rate": 6.127328244274808e-05,
+      "loss": 1.9468,
+      "step": 8000
+    },
+    {
+      "epoch": 11.51,
+      "eval_cer": 0.25051173043615177,
+      "eval_loss": 0.7318933606147766,
+      "eval_runtime": 40.8808,
+      "eval_samples_per_second": 11.154,
+      "eval_steps_per_second": 1.394,
+      "eval_wer": 0.644065237088493,
+      "step": 8000
+    },
+    {
+      "epoch": 11.65,
+      "learning_rate": 6.10442748091603e-05,
+      "loss": 1.9691,
+      "step": 8100
+    },
+    {
+      "epoch": 11.8,
+      "learning_rate": 6.081526717557252e-05,
+      "loss": 1.9845,
+      "step": 8200
+    },
+    {
+      "epoch": 11.94,
+      "learning_rate": 6.0586259541984725e-05,
+      "loss": 1.9561,
+      "step": 8300
+    },
+    {
+      "epoch": 12.09,
+      "learning_rate": 6.035725190839694e-05,
+      "loss": 1.9486,
+      "step": 8400
+    },
+    {
+      "epoch": 12.23,
+      "learning_rate": 6.012824427480916e-05,
+      "loss": 1.9178,
+      "step": 8500
+    },
+    {
+      "epoch": 12.23,
+      "eval_cer": 0.24893717524799244,
+      "eval_loss": 0.6936821937561035,
+      "eval_runtime": 41.1829,
+      "eval_samples_per_second": 11.073,
+      "eval_steps_per_second": 1.384,
+      "eval_wer": 0.6319842947749924,
+      "step": 8500
+    },
+    {
+      "epoch": 12.37,
+      "learning_rate": 5.989923664122137e-05,
+      "loss": 1.9133,
+      "step": 8600
+    },
+    {
+      "epoch": 12.52,
+      "learning_rate": 5.9670229007633586e-05,
+      "loss": 1.9327,
+      "step": 8700
+    },
+    {
+      "epoch": 12.66,
+      "learning_rate": 5.944122137404579e-05,
+      "loss": 1.8749,
+      "step": 8800
+    },
+    {
+      "epoch": 12.8,
+      "learning_rate": 5.9212213740458006e-05,
+      "loss": 1.8775,
+      "step": 8900
+    },
+    {
+      "epoch": 12.95,
+      "learning_rate": 5.8983206106870226e-05,
+      "loss": 1.8515,
+      "step": 9000
+    },
+    {
+      "epoch": 12.95,
+      "eval_cer": 0.21961108486852465,
+      "eval_loss": 0.6443303823471069,
+      "eval_runtime": 40.5279,
+      "eval_samples_per_second": 11.252,
+      "eval_steps_per_second": 1.406,
+      "eval_wer": 0.6052552099063727,
+      "step": 9000
+    },
+    {
+      "epoch": 13.09,
+      "learning_rate": 5.875419847328244e-05,
+      "loss": 1.8554,
+      "step": 9100
+    },
+    {
+      "epoch": 13.24,
+      "learning_rate": 5.852519083969465e-05,
+      "loss": 1.8568,
+      "step": 9200
+    },
+    {
+      "epoch": 13.38,
+      "learning_rate": 5.829618320610686e-05,
+      "loss": 1.8477,
+      "step": 9300
+    },
+    {
+      "epoch": 13.52,
+      "learning_rate": 5.806717557251908e-05,
+      "loss": 1.8328,
+      "step": 9400
+    },
+    {
+      "epoch": 13.67,
+      "learning_rate": 5.783816793893129e-05,
+      "loss": 1.8083,
+      "step": 9500
+    },
+    {
+      "epoch": 13.67,
+      "eval_cer": 0.21484805542434263,
+      "eval_loss": 0.6285760402679443,
+      "eval_runtime": 41.6653,
+      "eval_samples_per_second": 10.944,
+      "eval_steps_per_second": 1.368,
+      "eval_wer": 0.6122017517366355,
+      "step": 9500
+    },
+    {
+      "epoch": 13.81,
+      "learning_rate": 5.760916030534351e-05,
+      "loss": 1.8236,
+      "step": 9600
+    },
+    {
+      "epoch": 13.96,
+      "learning_rate": 5.738015267175571e-05,
+      "loss": 1.8199,
+      "step": 9700
+    },
+    {
+      "epoch": 14.1,
+      "learning_rate": 5.7151145038167934e-05,
+      "loss": 1.8285,
+      "step": 9800
+    },
+    {
+      "epoch": 14.24,
+      "learning_rate": 5.692213740458015e-05,
+      "loss": 1.817,
+      "step": 9900
+    },
+    {
+      "epoch": 14.39,
+      "learning_rate": 5.669312977099236e-05,
+      "loss": 1.819,
+      "step": 10000
+    },
+    {
+      "epoch": 14.39,
+      "eval_cer": 0.2074476460399937,
+      "eval_loss": 0.6015097498893738,
+      "eval_runtime": 41.6458,
+      "eval_samples_per_second": 10.949,
+      "eval_steps_per_second": 1.369,
+      "eval_wer": 0.5986106916339474,
+      "step": 10000
+    },
+    {
+      "epoch": 14.53,
+      "learning_rate": 5.6466412213740455e-05,
+      "loss": 1.7952,
+      "step": 10100
+    },
+    {
+      "epoch": 14.68,
+      "learning_rate": 5.623740458015266e-05,
+      "loss": 1.7955,
+      "step": 10200
+    },
+    {
+      "epoch": 14.82,
+      "learning_rate": 5.600839694656488e-05,
+      "loss": 1.7878,
+      "step": 10300
+    },
+    {
+      "epoch": 14.96,
+      "learning_rate": 5.5779389312977095e-05,
+      "loss": 1.769,
+      "step": 10400
+    },
+    {
+      "epoch": 15.11,
+      "learning_rate": 5.555267175572519e-05,
+      "loss": 1.7684,
+      "step": 10500
+    },
+    {
+      "epoch": 15.11,
+      "eval_cer": 0.19815777042985355,
+      "eval_loss": 0.5682193636894226,
+      "eval_runtime": 41.2484,
+      "eval_samples_per_second": 11.055,
+      "eval_steps_per_second": 1.382,
+      "eval_wer": 0.5741467834491091,
+      "step": 10500
+    },
+    {
+      "epoch": 15.25,
+      "learning_rate": 5.53236641221374e-05,
+      "loss": 1.7626,
+      "step": 10600
+    },
+    {
+      "epoch": 15.4,
+      "learning_rate": 5.5094656488549616e-05,
+      "loss": 1.7582,
+      "step": 10700
+    },
+    {
+      "epoch": 15.54,
+      "learning_rate": 5.486564885496182e-05,
+      "loss": 1.75,
+      "step": 10800
+    },
+    {
+      "epoch": 15.68,
+      "learning_rate": 5.463664122137404e-05,
+      "loss": 1.735,
+      "step": 10900
+    },
+    {
+      "epoch": 15.83,
+      "learning_rate": 5.4407633587786256e-05,
+      "loss": 1.7195,
+      "step": 11000
+    },
+    {
+      "epoch": 15.83,
+      "eval_cer": 0.20067705873090852,
+      "eval_loss": 0.5385124683380127,
+      "eval_runtime": 41.6481,
+      "eval_samples_per_second": 10.949,
+      "eval_steps_per_second": 1.369,
+      "eval_wer": 0.5591966173361522,
+      "step": 11000
+    },
+    {
+      "epoch": 15.97,
+      "learning_rate": 5.417862595419847e-05,
+      "loss": 1.7274,
+      "step": 11100
+    },
+    {
+      "epoch": 16.11,
+      "learning_rate": 5.3949618320610677e-05,
+      "loss": 1.7183,
+      "step": 11200
+    },
+    {
+      "epoch": 16.26,
+      "learning_rate": 5.37206106870229e-05,
+      "loss": 1.7117,
+      "step": 11300
+    },
+    {
+      "epoch": 16.4,
+      "learning_rate": 5.349160305343511e-05,
+      "loss": 1.6918,
+      "step": 11400
+    },
+    {
+      "epoch": 16.55,
+      "learning_rate": 5.3262595419847324e-05,
+      "loss": 1.7044,
+      "step": 11500
+    },
+    {
+      "epoch": 16.55,
+      "eval_cer": 0.20965202330341678,
+      "eval_loss": 0.5361923575401306,
+      "eval_runtime": 41.5242,
+      "eval_samples_per_second": 10.982,
+      "eval_steps_per_second": 1.373,
+      "eval_wer": 0.5524010872848082,
+      "step": 11500
+    },
+    {
+      "epoch": 16.69,
+      "learning_rate": 5.303358778625954e-05,
+      "loss": 1.7134,
+      "step": 11600
+    },
+    {
+      "epoch": 16.83,
+      "learning_rate": 5.280458015267176e-05,
+      "loss": 1.7016,
+      "step": 11700
+    },
+    {
+      "epoch": 16.98,
+      "learning_rate": 5.2575572519083964e-05,
+      "loss": 1.7069,
+      "step": 11800
+    },
+    {
+      "epoch": 17.12,
+      "learning_rate": 5.234656488549618e-05,
+      "loss": 1.7046,
+      "step": 11900
+    },
+    {
+      "epoch": 17.27,
+      "learning_rate": 5.211755725190839e-05,
+      "loss": 1.6879,
+      "step": 12000
+    },
+    {
+      "epoch": 17.27,
+      "eval_cer": 0.20831365139348135,
+      "eval_loss": 0.5119141936302185,
+      "eval_runtime": 40.4618,
+      "eval_samples_per_second": 11.27,
+      "eval_steps_per_second": 1.409,
+      "eval_wer": 0.5489278163696768,
+      "step": 12000
+    },
+    {
+      "epoch": 17.41,
+      "learning_rate": 5.188854961832061e-05,
+      "loss": 1.681,
+      "step": 12100
+    },
+    {
+      "epoch": 17.55,
+      "learning_rate": 5.1659541984732825e-05,
+      "loss": 1.6683,
+      "step": 12200
+    },
+    {
+      "epoch": 17.7,
+      "learning_rate": 5.143053435114503e-05,
+      "loss": 1.655,
+      "step": 12300
+    },
+    {
+      "epoch": 17.84,
+      "learning_rate": 5.1201526717557245e-05,
+      "loss": 1.6604,
+      "step": 12400
+    },
+    {
+      "epoch": 17.98,
+      "learning_rate": 5.0972519083969465e-05,
+      "loss": 1.656,
+      "step": 12500
+    },
+    {
+      "epoch": 17.98,
+      "eval_cer": 0.19678003464021415,
+      "eval_loss": 0.4990406930446625,
+      "eval_runtime": 40.5826,
+      "eval_samples_per_second": 11.236,
+      "eval_steps_per_second": 1.405,
+      "eval_wer": 0.5362428269405014,
+      "step": 12500
+    },
+    {
+      "epoch": 18.13,
+      "learning_rate": 5.074351145038168e-05,
+      "loss": 1.6645,
+      "step": 12600
+    },
+    {
+      "epoch": 18.27,
+      "learning_rate": 5.051450381679389e-05,
+      "loss": 1.6269,
+      "step": 12700
+    },
+    {
+      "epoch": 18.42,
+      "learning_rate": 5.02854961832061e-05,
+      "loss": 1.6306,
+      "step": 12800
+    },
+    {
+      "epoch": 18.56,
+      "learning_rate": 5.005877862595419e-05,
+      "loss": 1.6191,
+      "step": 12900
+    },
+    {
+      "epoch": 18.7,
+      "learning_rate": 4.9829770992366406e-05,
+      "loss": 1.6122,
+      "step": 13000
+    },
+    {
+      "epoch": 18.7,
+      "eval_cer": 0.18997008345142496,
+      "eval_loss": 0.45614466071128845,
+      "eval_runtime": 41.2927,
+      "eval_samples_per_second": 11.043,
+      "eval_steps_per_second": 1.38,
+      "eval_wer": 0.5092117185140441,
+      "step": 13000
+    },
+    {
+      "epoch": 18.85,
+      "learning_rate": 4.9600763358778626e-05,
+      "loss": 1.622,
+      "step": 13100
+    },
+    {
+      "epoch": 18.99,
+      "learning_rate": 4.937175572519084e-05,
+      "loss": 1.6305,
+      "step": 13200
+    },
+    {
+      "epoch": 19.14,
+      "learning_rate": 4.9142748091603046e-05,
+      "loss": 1.6134,
+      "step": 13300
+    },
+    {
+      "epoch": 19.28,
+      "learning_rate": 4.891374045801526e-05,
+      "loss": 1.6044,
+      "step": 13400
+    },
+    {
+      "epoch": 19.42,
+      "learning_rate": 4.868473282442748e-05,
+      "loss": 1.5919,
+      "step": 13500
+    },
+    {
+      "epoch": 19.42,
+      "eval_cer": 0.19752794835458984,
+      "eval_loss": 0.47778981924057007,
+      "eval_runtime": 41.5758,
+      "eval_samples_per_second": 10.968,
+      "eval_steps_per_second": 1.371,
+      "eval_wer": 0.5225007550588946,
+      "step": 13500
+    },
+    {
+      "epoch": 19.57,
+      "learning_rate": 4.8455725190839694e-05,
+      "loss": 1.595,
+      "step": 13600
+    },
+    {
+      "epoch": 19.71,
+      "learning_rate": 4.822671755725191e-05,
+      "loss": 1.5959,
+      "step": 13700
+    },
+    {
+      "epoch": 19.86,
+      "learning_rate": 4.7997709923664114e-05,
+      "loss": 1.6006,
+      "step": 13800
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 4.7768702290076334e-05,
+      "loss": 1.5913,
+      "step": 13900
+    },
+    {
+      "epoch": 20.14,
+      "learning_rate": 4.753969465648855e-05,
+      "loss": 1.5896,
+      "step": 14000
+    },
+    {
+      "epoch": 20.14,
+      "eval_cer": 0.18591560384191466,
+      "eval_loss": 0.4563109278678894,
+      "eval_runtime": 40.8794,
+      "eval_samples_per_second": 11.155,
+      "eval_steps_per_second": 1.394,
+      "eval_wer": 0.5098157656297191,
+      "step": 14000
+    },
+    {
+      "epoch": 20.29,
+      "learning_rate": 4.731068702290076e-05,
+      "loss": 1.5823,
+      "step": 14100
+    },
+    {
+      "epoch": 20.43,
+      "learning_rate": 4.708167938931297e-05,
+      "loss": 1.5634,
+      "step": 14200
+    },
+    {
+      "epoch": 20.57,
+      "learning_rate": 4.685267175572519e-05,
+      "loss": 1.5573,
+      "step": 14300
+    },
+    {
+      "epoch": 20.72,
+      "learning_rate": 4.66236641221374e-05,
+      "loss": 1.5689,
+      "step": 14400
+    },
+    {
+      "epoch": 20.86,
+      "learning_rate": 4.6394656488549615e-05,
+      "loss": 1.5589,
+      "step": 14500
+    },
+    {
+      "epoch": 20.86,
+      "eval_cer": 0.17249252086285624,
+      "eval_loss": 0.43622052669525146,
+      "eval_runtime": 41.7277,
+      "eval_samples_per_second": 10.928,
+      "eval_steps_per_second": 1.366,
+      "eval_wer": 0.4939595288432498,
+      "step": 14500
+    },
+    {
+      "epoch": 21.01,
+      "learning_rate": 4.616564885496183e-05,
+      "loss": 1.5697,
+      "step": 14600
+    },
+    {
+      "epoch": 21.15,
+      "learning_rate": 4.593664122137405e-05,
+      "loss": 1.5336,
+      "step": 14700
+    },
+    {
+      "epoch": 21.29,
+      "learning_rate": 4.5707633587786255e-05,
+      "loss": 1.5425,
+      "step": 14800
+    },
+    {
+      "epoch": 21.44,
+      "learning_rate": 4.547862595419847e-05,
+      "loss": 1.5461,
+      "step": 14900
+    },
+    {
+      "epoch": 21.58,
+      "learning_rate": 4.524961832061068e-05,
+      "loss": 1.5353,
+      "step": 15000
+    },
+    {
+      "epoch": 21.58,
+      "eval_cer": 0.15804597701149425,
+      "eval_loss": 0.41395294666290283,
+      "eval_runtime": 40.5257,
+      "eval_samples_per_second": 11.252,
+      "eval_steps_per_second": 1.407,
+      "eval_wer": 0.4826336454243431,
+      "step": 15000
+    },
+    {
+      "epoch": 21.73,
+      "learning_rate": 4.5020610687022895e-05,
+      "loss": 1.5348,
+      "step": 15100
+    },
+    {
+      "epoch": 21.87,
+      "learning_rate": 4.4791603053435116e-05,
+      "loss": 1.5279,
+      "step": 15200
+    },
+    {
+      "epoch": 22.01,
+      "learning_rate": 4.456259541984732e-05,
+      "loss": 1.5492,
+      "step": 15300
+    },
+    {
+      "epoch": 22.16,
+      "learning_rate": 4.4333587786259536e-05,
+      "loss": 1.5291,
+      "step": 15400
+    },
+    {
+      "epoch": 22.3,
+      "learning_rate": 4.410458015267175e-05,
+      "loss": 1.5441,
+      "step": 15500
+    },
+    {
+      "epoch": 22.3,
+      "eval_cer": 0.15501495827428752,
+      "eval_loss": 0.40313535928726196,
+      "eval_runtime": 41.0848,
+      "eval_samples_per_second": 11.099,
+      "eval_steps_per_second": 1.387,
+      "eval_wer": 0.47417698580489276,
+      "step": 15500
+    },
+    {
+      "epoch": 22.45,
+      "learning_rate": 4.387557251908397e-05,
+      "loss": 1.518,
+      "step": 15600
+    },
+    {
+      "epoch": 22.59,
+      "learning_rate": 4.364656488549618e-05,
+      "loss": 1.5081,
+      "step": 15700
+    },
+    {
+      "epoch": 22.73,
+      "learning_rate": 4.341755725190839e-05,
+      "loss": 1.4959,
+      "step": 15800
+    },
+    {
+      "epoch": 22.88,
+      "learning_rate": 4.31885496183206e-05,
+      "loss": 1.5097,
+      "step": 15900
+    },
+    {
+      "epoch": 23.02,
+      "learning_rate": 4.295954198473282e-05,
+      "loss": 1.5116,
+      "step": 16000
+    },
+    {
+      "epoch": 23.02,
+      "eval_cer": 0.15450322783813572,
+      "eval_loss": 0.39162585139274597,
+      "eval_runtime": 40.7373,
+      "eval_samples_per_second": 11.194,
+      "eval_steps_per_second": 1.399,
+      "eval_wer": 0.4747810329205678,
+      "step": 16000
+    },
+    {
+      "epoch": 23.17,
+      "learning_rate": 4.273053435114504e-05,
+      "loss": 1.4951,
+      "step": 16100
+    },
+    {
+      "epoch": 23.31,
+      "learning_rate": 4.250152671755724e-05,
+      "loss": 1.4974,
+      "step": 16200
+    },
+    {
+      "epoch": 23.45,
+      "learning_rate": 4.227480916030534e-05,
+      "loss": 1.5045,
+      "step": 16300
+    },
+    {
+      "epoch": 23.6,
+      "learning_rate": 4.204580152671755e-05,
+      "loss": 1.4944,
+      "step": 16400
+    },
+    {
+      "epoch": 23.74,
+      "learning_rate": 4.181679389312977e-05,
+      "loss": 1.4731,
+      "step": 16500
+    },
+    {
+      "epoch": 23.74,
+      "eval_cer": 0.15422768068020784,
+      "eval_loss": 0.3840835392475128,
+      "eval_runtime": 40.8763,
+      "eval_samples_per_second": 11.156,
+      "eval_steps_per_second": 1.394,
+      "eval_wer": 0.4809725158562368,
+      "step": 16500
+    },
+    {
+      "epoch": 23.88,
+      "learning_rate": 4.1587786259541985e-05,
+      "loss": 1.472,
+      "step": 16600
+    },
+    {
+      "epoch": 24.03,
+      "learning_rate": 4.13587786259542e-05,
+      "loss": 1.4847,
+      "step": 16700
+    },
+    {
+      "epoch": 24.17,
+      "learning_rate": 4.1129770992366405e-05,
+      "loss": 1.4603,
+      "step": 16800
+    },
+    {
+      "epoch": 24.32,
+      "learning_rate": 4.090076335877862e-05,
+      "loss": 1.4563,
+      "step": 16900
+    },
+    {
+      "epoch": 24.46,
+      "learning_rate": 4.067175572519084e-05,
+      "loss": 1.4647,
+      "step": 17000
+    },
+    {
+      "epoch": 24.46,
+      "eval_cer": 0.14753582113053063,
+      "eval_loss": 0.37518319487571716,
+      "eval_runtime": 41.0205,
+      "eval_samples_per_second": 11.116,
+      "eval_steps_per_second": 1.39,
+      "eval_wer": 0.452431289640592,
+      "step": 17000
+    },
+    {
+      "epoch": 24.6,
+      "learning_rate": 4.044274809160305e-05,
+      "loss": 1.4585,
+      "step": 17100
+    },
+    {
+      "epoch": 24.75,
+      "learning_rate": 4.021374045801526e-05,
+      "loss": 1.4692,
+      "step": 17200
+    },
+    {
+      "epoch": 24.89,
+      "learning_rate": 3.998473282442747e-05,
+      "loss": 1.444,
+      "step": 17300
+    },
+    {
+      "epoch": 25.04,
+      "learning_rate": 3.975572519083969e-05,
+      "loss": 1.4717,
+      "step": 17400
+    },
+    {
+      "epoch": 25.18,
+      "learning_rate": 3.9526717557251906e-05,
+      "loss": 1.4328,
+      "step": 17500
+    },
+    {
+      "epoch": 25.18,
+      "eval_cer": 0.1461187214611872,
+      "eval_loss": 0.35870596766471863,
+      "eval_runtime": 40.6723,
+      "eval_samples_per_second": 11.212,
+      "eval_steps_per_second": 1.401,
+      "eval_wer": 0.4475989127151918,
+      "step": 17500
+    },
+    {
+      "epoch": 25.32,
+      "learning_rate": 3.929770992366412e-05,
+      "loss": 1.4329,
+      "step": 17600
+    },
+    {
+      "epoch": 25.47,
+      "learning_rate": 3.9068702290076326e-05,
+      "loss": 1.4209,
+      "step": 17700
+    },
+    {
+      "epoch": 25.61,
+      "learning_rate": 3.884198473282442e-05,
+      "loss": 1.4188,
+      "step": 17800
+    },
+    {
+      "epoch": 25.75,
+      "learning_rate": 3.861297709923664e-05,
+      "loss": 1.4301,
+      "step": 17900
+    },
+    {
+      "epoch": 25.9,
+      "learning_rate": 3.8383969465648854e-05,
+      "loss": 1.4129,
+      "step": 18000
+    },
+    {
+      "epoch": 25.9,
+      "eval_cer": 0.13663202645252717,
+      "eval_loss": 0.3428773581981659,
+      "eval_runtime": 42.0192,
+      "eval_samples_per_second": 10.852,
+      "eval_steps_per_second": 1.357,
+      "eval_wer": 0.42419208698278466,
+      "step": 18000
+    },
+    {
+      "epoch": 26.04,
+      "learning_rate": 3.815496183206107e-05,
+      "loss": 1.4266,
+      "step": 18100
+    },
+    {
+      "epoch": 26.19,
+      "learning_rate": 3.7925954198473274e-05,
+      "loss": 1.4166,
+      "step": 18200
+    },
+    {
+      "epoch": 26.33,
+      "learning_rate": 3.7696946564885494e-05,
+      "loss": 1.4157,
+      "step": 18300
+    },
+    {
+      "epoch": 26.47,
+      "learning_rate": 3.746793893129771e-05,
+      "loss": 1.4285,
+      "step": 18400
+    },
+    {
+      "epoch": 26.62,
+      "learning_rate": 3.723893129770992e-05,
+      "loss": 1.4062,
+      "step": 18500
+    },
+    {
+      "epoch": 26.62,
+      "eval_cer": 0.13549047394111163,
+      "eval_loss": 0.34499478340148926,
+      "eval_runtime": 41.0336,
+      "eval_samples_per_second": 11.113,
+      "eval_steps_per_second": 1.389,
+      "eval_wer": 0.4250981576562972,
+      "step": 18500
+    },
+    {
+      "epoch": 26.76,
+      "learning_rate": 3.7009923664122134e-05,
+      "loss": 1.4163,
+      "step": 18600
+    },
+    {
+      "epoch": 26.91,
+      "learning_rate": 3.678091603053435e-05,
+      "loss": 1.404,
+      "step": 18700
+    },
+    {
+      "epoch": 27.05,
+      "learning_rate": 3.655190839694656e-05,
+      "loss": 1.4134,
+      "step": 18800
+    },
+    {
+      "epoch": 27.19,
+      "learning_rate": 3.6322900763358775e-05,
+      "loss": 1.4001,
+      "step": 18900
+    },
+    {
+      "epoch": 27.34,
+      "learning_rate": 3.609389312977099e-05,
+      "loss": 1.3928,
+      "step": 19000
+    },
+    {
+      "epoch": 27.34,
+      "eval_cer": 0.13218390804597702,
+      "eval_loss": 0.32969579100608826,
+      "eval_runtime": 41.0801,
+      "eval_samples_per_second": 11.1,
+      "eval_steps_per_second": 1.388,
+      "eval_wer": 0.4145273331319843,
+      "step": 19000
+    },
+    {
+      "epoch": 27.48,
+      "learning_rate": 3.58648854961832e-05,
+      "loss": 1.3979,
+      "step": 19100
+    },
+    {
+      "epoch": 27.63,
+      "learning_rate": 3.5635877862595415e-05,
+      "loss": 1.3971,
+      "step": 19200
+    },
+    {
+      "epoch": 27.77,
+      "learning_rate": 3.540687022900763e-05,
+      "loss": 1.3934,
+      "step": 19300
+    },
+    {
+      "epoch": 27.91,
+      "learning_rate": 3.517786259541984e-05,
+      "loss": 1.3866,
+      "step": 19400
+    },
+    {
+      "epoch": 28.06,
+      "learning_rate": 3.4948854961832055e-05,
+      "loss": 1.3906,
+      "step": 19500
+    },
+    {
+      "epoch": 28.06,
+      "eval_cer": 0.1336403715950244,
+      "eval_loss": 0.32101842761039734,
+      "eval_runtime": 41.0367,
+      "eval_samples_per_second": 11.112,
+      "eval_steps_per_second": 1.389,
+      "eval_wer": 0.4184536393838719,
+      "step": 19500
+    },
+    {
+      "epoch": 28.2,
+      "learning_rate": 3.471984732824427e-05,
+      "loss": 1.3689,
+      "step": 19600
+    },
+    {
+      "epoch": 28.34,
+      "learning_rate": 3.449083969465649e-05,
+      "loss": 1.3715,
+      "step": 19700
+    },
+    {
+      "epoch": 28.49,
+      "learning_rate": 3.4261832061068696e-05,
+      "loss": 1.3527,
+      "step": 19800
+    },
+    {
+      "epoch": 28.63,
+      "learning_rate": 3.4032824427480916e-05,
+      "loss": 1.3532,
+      "step": 19900
+    },
+    {
+      "epoch": 28.78,
+      "learning_rate": 3.380381679389312e-05,
+      "loss": 1.358,
+      "step": 20000
+    },
+    {
+      "epoch": 28.78,
+      "eval_cer": 0.12753897024090693,
+      "eval_loss": 0.31306591629981995,
+      "eval_runtime": 41.2359,
+      "eval_samples_per_second": 11.058,
+      "eval_steps_per_second": 1.382,
+      "eval_wer": 0.39700996677740863,
+      "step": 20000
+    },
+    {
+      "epoch": 28.92,
+      "learning_rate": 3.357480916030534e-05,
+      "loss": 1.3582,
+      "step": 20100
+    },
+    {
+      "epoch": 29.06,
+      "learning_rate": 3.334580152671755e-05,
+      "loss": 1.3587,
+      "step": 20200
+    },
+    {
+      "epoch": 29.21,
+      "learning_rate": 3.311679389312977e-05,
+      "loss": 1.3392,
+      "step": 20300
+    },
+    {
+      "epoch": 29.35,
+      "learning_rate": 3.288778625954198e-05,
+      "loss": 1.3486,
+      "step": 20400
+    },
+    {
+      "epoch": 29.5,
+      "learning_rate": 3.26587786259542e-05,
+      "loss": 1.3445,
+      "step": 20500
+    },
+    {
+      "epoch": 29.5,
+      "eval_cer": 0.12761769800031492,
+      "eval_loss": 0.3069218099117279,
+      "eval_runtime": 41.0687,
+      "eval_samples_per_second": 11.103,
+      "eval_steps_per_second": 1.388,
+      "eval_wer": 0.3920265780730897,
+      "step": 20500
+    },
+    {
+      "epoch": 29.64,
+      "learning_rate": 3.242977099236641e-05,
+      "loss": 1.3354,
+      "step": 20600
+    },
+    {
+      "epoch": 29.78,
+      "learning_rate": 3.2200763358778624e-05,
+      "loss": 1.3334,
+      "step": 20700
+    },
+    {
+      "epoch": 29.93,
+      "learning_rate": 3.197175572519084e-05,
+      "loss": 1.3305,
+      "step": 20800
+    },
+    {
+      "epoch": 30.07,
+      "learning_rate": 3.174274809160305e-05,
+      "loss": 1.3354,
+      "step": 20900
+    },
+    {
+      "epoch": 30.22,
+      "learning_rate": 3.1513740458015264e-05,
+      "loss": 1.3159,
+      "step": 21000
+    },
+    {
+      "epoch": 30.22,
+      "eval_cer": 0.1254920484962998,
+      "eval_loss": 0.30346596240997314,
+      "eval_runtime": 41.0784,
+      "eval_samples_per_second": 11.101,
+      "eval_steps_per_second": 1.388,
+      "eval_wer": 0.3961038961038961,
+      "step": 21000
+    },
+    {
+      "epoch": 30.36,
+      "learning_rate": 3.128473282442748e-05,
+      "loss": 1.3376,
+      "step": 21100
+    },
+    {
+      "epoch": 30.5,
+      "learning_rate": 3.105572519083969e-05,
+      "loss": 1.324,
+      "step": 21200
+    },
+    {
+      "epoch": 30.65,
+      "learning_rate": 3.0826717557251904e-05,
+      "loss": 1.3091,
+      "step": 21300
+    },
+    {
+      "epoch": 30.79,
+      "learning_rate": 3.059770992366412e-05,
+      "loss": 1.3213,
+      "step": 21400
+    },
+    {
+      "epoch": 30.93,
+      "learning_rate": 3.0368702290076335e-05,
+      "loss": 1.3044,
+      "step": 21500
+    },
+    {
+      "epoch": 30.93,
+      "eval_cer": 0.12423240434577232,
+      "eval_loss": 0.29519879817962646,
+      "eval_runtime": 41.1753,
+      "eval_samples_per_second": 11.075,
+      "eval_steps_per_second": 1.384,
+      "eval_wer": 0.3853820598006645,
+      "step": 21500
+    },
+    {
+      "epoch": 31.08,
+      "learning_rate": 3.0139694656488545e-05,
+      "loss": 1.3033,
+      "step": 21600
+    },
+    {
+      "epoch": 31.22,
+      "learning_rate": 2.991068702290076e-05,
+      "loss": 1.2995,
+      "step": 21700
+    },
+    {
+      "epoch": 31.37,
+      "learning_rate": 2.9681679389312975e-05,
+      "loss": 1.3101,
+      "step": 21800
+    },
+    {
+      "epoch": 31.51,
+      "learning_rate": 2.945267175572519e-05,
+      "loss": 1.304,
+      "step": 21900
+    },
+    {
+      "epoch": 31.65,
+      "learning_rate": 2.9223664122137402e-05,
+      "loss": 1.3034,
+      "step": 22000
+    },
+    {
+      "epoch": 31.65,
+      "eval_cer": 0.12273657691702095,
+      "eval_loss": 0.29660850763320923,
+      "eval_runtime": 41.8912,
+      "eval_samples_per_second": 10.885,
+      "eval_steps_per_second": 1.361,
+      "eval_wer": 0.37722742373905166,
+      "step": 22000
+    },
+    {
+      "epoch": 31.8,
+      "learning_rate": 2.8994656488549615e-05,
+      "loss": 1.2912,
+      "step": 22100
+    },
+    {
+      "epoch": 31.94,
+      "learning_rate": 2.876564885496183e-05,
+      "loss": 1.299,
+      "step": 22200
+    },
+    {
+      "epoch": 32.09,
+      "learning_rate": 2.8536641221374046e-05,
+      "loss": 1.3042,
+      "step": 22300
+    },
+    {
+      "epoch": 32.23,
+      "learning_rate": 2.8307633587786256e-05,
+      "loss": 1.294,
+      "step": 22400
+    },
+    {
+      "epoch": 32.37,
+      "learning_rate": 2.8078625954198472e-05,
+      "loss": 1.2963,
+      "step": 22500
+    },
+    {
+      "epoch": 32.37,
+      "eval_cer": 0.12080774681152574,
+      "eval_loss": 0.2843906879425049,
+      "eval_runtime": 41.7644,
+      "eval_samples_per_second": 10.918,
+      "eval_steps_per_second": 1.365,
+      "eval_wer": 0.3705829054666264,
+      "step": 22500
+    },
+    {
+      "epoch": 32.52,
+      "learning_rate": 2.7849618320610682e-05,
+      "loss": 1.2769,
+      "step": 22600
+    },
+    {
+      "epoch": 32.66,
+      "learning_rate": 2.76206106870229e-05,
+      "loss": 1.2812,
+      "step": 22700
+    },
+    {
+      "epoch": 32.8,
+      "learning_rate": 2.7391603053435113e-05,
+      "loss": 1.2827,
+      "step": 22800
+    },
+    {
+      "epoch": 32.95,
+      "learning_rate": 2.7162595419847326e-05,
+      "loss": 1.2747,
+      "step": 22900
+    },
+    {
+      "epoch": 33.09,
+      "learning_rate": 2.6935877862595417e-05,
+      "loss": 1.2765,
+      "step": 23000
+    },
+    {
+      "epoch": 33.09,
+      "eval_cer": 0.11726499763816722,
+      "eval_loss": 0.28407707810401917,
+      "eval_runtime": 40.9894,
+      "eval_samples_per_second": 11.125,
+      "eval_steps_per_second": 1.391,
+      "eval_wer": 0.35668982180610087,
+      "step": 23000
+    },
+    {
+      "epoch": 33.24,
+      "learning_rate": 2.670687022900763e-05,
+      "loss": 1.2785,
+      "step": 23100
+    },
+    {
+      "epoch": 33.38,
+      "learning_rate": 2.6477862595419844e-05,
+      "loss": 1.2644,
+      "step": 23200
+    },
+    {
+      "epoch": 33.52,
+      "learning_rate": 2.624885496183206e-05,
+      "loss": 1.2724,
+      "step": 23300
+    },
+    {
+      "epoch": 33.67,
+      "learning_rate": 2.601984732824427e-05,
+      "loss": 1.2551,
+      "step": 23400
+    },
+    {
+      "epoch": 33.81,
+      "learning_rate": 2.5790839694656488e-05,
+      "loss": 1.2438,
+      "step": 23500
+    },
+    {
+      "epoch": 33.81,
+      "eval_cer": 0.11372224846480869,
+      "eval_loss": 0.2734295129776001,
+      "eval_runtime": 41.7199,
+      "eval_samples_per_second": 10.93,
+      "eval_steps_per_second": 1.366,
+      "eval_wer": 0.35517970401691334,
+      "step": 23500
+    },
+    {
+      "epoch": 33.96,
+      "learning_rate": 2.5561832061068698e-05,
+      "loss": 1.2491,
+      "step": 23600
+    },
+    {
+      "epoch": 34.1,
+      "learning_rate": 2.5332824427480915e-05,
+      "loss": 1.252,
+      "step": 23700
+    },
+    {
+      "epoch": 34.24,
+      "learning_rate": 2.5103816793893128e-05,
+      "loss": 1.2467,
+      "step": 23800
+    },
+    {
+      "epoch": 34.39,
+      "learning_rate": 2.487480916030534e-05,
+      "loss": 1.2406,
+      "step": 23900
+    },
+    {
+      "epoch": 34.53,
+      "learning_rate": 2.4645801526717555e-05,
+      "loss": 1.2487,
+      "step": 24000
+    },
+    {
+      "epoch": 34.53,
+      "eval_cer": 0.11179341835931349,
+      "eval_loss": 0.2702818512916565,
+      "eval_runtime": 41.8515,
+      "eval_samples_per_second": 10.896,
+      "eval_steps_per_second": 1.362,
+      "eval_wer": 0.3501963153125944,
+      "step": 24000
+    },
+    {
+      "epoch": 34.68,
+      "learning_rate": 2.441679389312977e-05,
+      "loss": 1.2504,
+      "step": 24100
+    },
+    {
+      "epoch": 34.82,
+      "learning_rate": 2.4187786259541982e-05,
+      "loss": 1.2341,
+      "step": 24200
+    },
+    {
+      "epoch": 34.96,
+      "learning_rate": 2.39587786259542e-05,
+      "loss": 1.2477,
+      "step": 24300
+    },
+    {
+      "epoch": 35.11,
+      "learning_rate": 2.372977099236641e-05,
+      "loss": 1.2427,
+      "step": 24400
+    },
+    {
+      "epoch": 35.25,
+      "learning_rate": 2.3500763358778626e-05,
+      "loss": 1.2249,
+      "step": 24500
+    },
+    {
+      "epoch": 35.25,
+      "eval_cer": 0.11423397890096047,
+      "eval_loss": 0.2650163471698761,
+      "eval_runtime": 41.2103,
+      "eval_samples_per_second": 11.065,
+      "eval_steps_per_second": 1.383,
+      "eval_wer": 0.3483841739655693,
+      "step": 24500
+    },
+    {
+      "epoch": 35.4,
+      "learning_rate": 2.3271755725190836e-05,
+      "loss": 1.2265,
+      "step": 24600
+    },
+    {
+      "epoch": 35.54,
+      "learning_rate": 2.3042748091603052e-05,
+      "loss": 1.2276,
+      "step": 24700
+    },
+    {
+      "epoch": 35.68,
+      "learning_rate": 2.2816030534351143e-05,
+      "loss": 1.2332,
+      "step": 24800
+    },
+    {
+      "epoch": 35.83,
+      "learning_rate": 2.2587022900763357e-05,
+      "loss": 1.2249,
+      "step": 24900
+    },
+    {
+      "epoch": 35.97,
+      "learning_rate": 2.235801526717557e-05,
+      "loss": 1.2229,
+      "step": 25000
+    },
+    {
+      "epoch": 35.97,
+      "eval_cer": 0.10970713273500236,
+      "eval_loss": 0.25843024253845215,
+      "eval_runtime": 42.815,
+      "eval_samples_per_second": 10.65,
+      "eval_steps_per_second": 1.331,
+      "eval_wer": 0.3373603141045001,
+      "step": 25000
+    },
+    {
+      "epoch": 36.11,
+      "learning_rate": 2.2129007633587784e-05,
+      "loss": 1.2412,
+      "step": 25100
+    },
+    {
+      "epoch": 36.26,
+      "learning_rate": 2.1899999999999997e-05,
+      "loss": 1.212,
+      "step": 25200
+    },
+    {
+      "epoch": 36.4,
+      "learning_rate": 2.1670992366412214e-05,
+      "loss": 1.2151,
+      "step": 25300
+    },
+    {
+      "epoch": 36.55,
+      "learning_rate": 2.1441984732824424e-05,
+      "loss": 1.2303,
+      "step": 25400
+    },
+    {
+      "epoch": 36.69,
+      "learning_rate": 2.121297709923664e-05,
+      "loss": 1.2374,
+      "step": 25500
+    },
+    {
+      "epoch": 36.69,
+      "eval_cer": 0.10951031333648244,
+      "eval_loss": 0.2568279504776001,
+      "eval_runtime": 41.6839,
+      "eval_samples_per_second": 10.939,
+      "eval_steps_per_second": 1.367,
+      "eval_wer": 0.33373603141045,
+      "step": 25500
+    },
+    {
+      "epoch": 36.83,
+      "learning_rate": 2.098396946564885e-05,
+      "loss": 1.2152,
+      "step": 25600
+    },
+    {
+      "epoch": 36.98,
+      "learning_rate": 2.0754961832061068e-05,
+      "loss": 1.2089,
+      "step": 25700
+    },
+    {
+      "epoch": 37.12,
+      "learning_rate": 2.052595419847328e-05,
+      "loss": 1.2201,
+      "step": 25800
+    },
+    {
+      "epoch": 37.27,
+      "learning_rate": 2.0296946564885495e-05,
+      "loss": 1.2006,
+      "step": 25900
+    },
+    {
+      "epoch": 37.41,
+      "learning_rate": 2.0067938931297708e-05,
+      "loss": 1.2153,
+      "step": 26000
+    },
+    {
+      "epoch": 37.41,
+      "eval_cer": 0.10710911667453944,
+      "eval_loss": 0.24941784143447876,
+      "eval_runtime": 41.3494,
+      "eval_samples_per_second": 11.028,
+      "eval_steps_per_second": 1.378,
+      "eval_wer": 0.33267894895801875,
+      "step": 26000
+    },
+    {
+      "epoch": 37.55,
+      "learning_rate": 1.983893129770992e-05,
+      "loss": 1.2071,
+      "step": 26100
+    },
+    {
+      "epoch": 37.7,
+      "learning_rate": 1.9609923664122135e-05,
+      "loss": 1.2042,
+      "step": 26200
+    },
+    {
+      "epoch": 37.84,
+      "learning_rate": 1.9380916030534352e-05,
+      "loss": 1.2037,
+      "step": 26300
+    },
+    {
+      "epoch": 37.98,
+      "learning_rate": 1.9151908396946562e-05,
+      "loss": 1.1962,
+      "step": 26400
+    },
+    {
+      "epoch": 38.13,
+      "learning_rate": 1.892290076335878e-05,
+      "loss": 1.1925,
+      "step": 26500
+    },
+    {
+      "epoch": 38.13,
+      "eval_cer": 0.1076995748700992,
+      "eval_loss": 0.2518324553966522,
+      "eval_runtime": 40.748,
+      "eval_samples_per_second": 11.191,
+      "eval_steps_per_second": 1.399,
+      "eval_wer": 0.33660525520990636,
+      "step": 26500
+    },
+    {
+      "epoch": 38.27,
+      "learning_rate": 1.869389312977099e-05,
+      "loss": 1.1969,
+      "step": 26600
+    },
+    {
+      "epoch": 38.42,
+      "learning_rate": 1.8464885496183202e-05,
+      "loss": 1.1947,
+      "step": 26700
+    },
+    {
+      "epoch": 38.56,
+      "learning_rate": 1.823587786259542e-05,
+      "loss": 1.2005,
+      "step": 26800
+    },
+    {
+      "epoch": 38.7,
+      "learning_rate": 1.8006870229007632e-05,
+      "loss": 1.1961,
+      "step": 26900
+    },
+    {
+      "epoch": 38.85,
+      "learning_rate": 1.7777862595419846e-05,
+      "loss": 1.1908,
+      "step": 27000
+    },
+    {
+      "epoch": 38.85,
+      "eval_cer": 0.10565265312549205,
+      "eval_loss": 0.24367305636405945,
+      "eval_runtime": 41.2308,
+      "eval_samples_per_second": 11.06,
+      "eval_steps_per_second": 1.382,
+      "eval_wer": 0.3272425249169435,
+      "step": 27000
+    },
+    {
+      "epoch": 38.99,
+      "learning_rate": 1.754885496183206e-05,
+      "loss": 1.1762,
+      "step": 27100
+    },
+    {
+      "epoch": 39.14,
+      "learning_rate": 1.7319847328244273e-05,
+      "loss": 1.2018,
+      "step": 27200
+    },
+    {
+      "epoch": 39.28,
+      "learning_rate": 1.7090839694656486e-05,
+      "loss": 1.1822,
+      "step": 27300
+    },
+    {
+      "epoch": 39.42,
+      "learning_rate": 1.68618320610687e-05,
+      "loss": 1.1745,
+      "step": 27400
+    },
+    {
+      "epoch": 39.57,
+      "learning_rate": 1.6632824427480913e-05,
+      "loss": 1.1858,
+      "step": 27500
+    },
+    {
+      "epoch": 39.57,
+      "eval_cer": 0.10443237285466855,
+      "eval_loss": 0.23960824310779572,
+      "eval_runtime": 42.517,
+      "eval_samples_per_second": 10.725,
+      "eval_steps_per_second": 1.341,
+      "eval_wer": 0.32648746602234974,
+      "step": 27500
+    },
+    {
+      "epoch": 39.71,
+      "learning_rate": 1.6403816793893127e-05,
+      "loss": 1.1866,
+      "step": 27600
+    },
+    {
+      "epoch": 39.86,
+      "learning_rate": 1.617480916030534e-05,
+      "loss": 1.1878,
+      "step": 27700
+    },
+    {
+      "epoch": 40.0,
+      "learning_rate": 1.5945801526717557e-05,
+      "loss": 1.1817,
+      "step": 27800
+    },
+    {
+      "epoch": 40.14,
+      "learning_rate": 1.571679389312977e-05,
+      "loss": 1.1851,
+      "step": 27900
+    },
+    {
+      "epoch": 40.29,
+      "learning_rate": 1.5487786259541984e-05,
+      "loss": 1.1808,
+      "step": 28000
+    },
+    {
+      "epoch": 40.29,
+      "eval_cer": 0.10277908990710125,
+      "eval_loss": 0.2373325228691101,
+      "eval_runtime": 41.3513,
+      "eval_samples_per_second": 11.027,
+      "eval_steps_per_second": 1.378,
+      "eval_wer": 0.31561461794019935,
+      "step": 28000
+    },
+    {
+      "epoch": 40.43,
+      "learning_rate": 1.5258778625954197e-05,
+      "loss": 1.1558,
+      "step": 28100
+    },
+    {
+      "epoch": 40.57,
+      "learning_rate": 1.502977099236641e-05,
+      "loss": 1.1804,
+      "step": 28200
+    },
+    {
+      "epoch": 40.72,
+      "learning_rate": 1.4800763358778624e-05,
+      "loss": 1.1736,
+      "step": 28300
+    },
+    {
+      "epoch": 40.86,
+      "learning_rate": 1.4571755725190838e-05,
+      "loss": 1.1782,
+      "step": 28400
+    },
+    {
+      "epoch": 41.01,
+      "learning_rate": 1.4342748091603053e-05,
+      "loss": 1.1842,
+      "step": 28500
+    },
+    {
+      "epoch": 41.01,
+      "eval_cer": 0.10258227050858132,
+      "eval_loss": 0.23562349379062653,
+      "eval_runtime": 40.492,
+      "eval_samples_per_second": 11.261,
+      "eval_steps_per_second": 1.408,
+      "eval_wer": 0.31516158260344307,
+      "step": 28500
+    },
+    {
+      "epoch": 41.15,
+      "learning_rate": 1.4113740458015266e-05,
+      "loss": 1.1595,
+      "step": 28600
+    },
+    {
+      "epoch": 41.29,
+      "learning_rate": 1.388473282442748e-05,
+      "loss": 1.1527,
+      "step": 28700
+    },
+    {
+      "epoch": 41.44,
+      "learning_rate": 1.3655725190839693e-05,
+      "loss": 1.1517,
+      "step": 28800
+    },
+    {
+      "epoch": 41.58,
+      "learning_rate": 1.3426717557251907e-05,
+      "loss": 1.1609,
+      "step": 28900
+    },
+    {
+      "epoch": 41.73,
+      "learning_rate": 1.3197709923664122e-05,
+      "loss": 1.1668,
+      "step": 29000
+    },
+    {
+      "epoch": 41.73,
+      "eval_cer": 0.10246417886946937,
+      "eval_loss": 0.23187227547168732,
+      "eval_runtime": 40.5813,
+      "eval_samples_per_second": 11.237,
+      "eval_steps_per_second": 1.405,
+      "eval_wer": 0.3187858652974932,
+      "step": 29000
+    },
+    {
+      "epoch": 41.87,
+      "learning_rate": 1.2968702290076335e-05,
+      "loss": 1.1536,
+      "step": 29100
+    },
+    {
+      "epoch": 42.01,
+      "learning_rate": 1.2739694656488549e-05,
+      "loss": 1.1649,
+      "step": 29200
+    },
+    {
+      "epoch": 42.16,
+      "learning_rate": 1.2510687022900762e-05,
+      "loss": 1.1459,
+      "step": 29300
+    },
+    {
+      "epoch": 42.3,
+      "learning_rate": 1.2281679389312975e-05,
+      "loss": 1.1495,
+      "step": 29400
+    },
+    {
+      "epoch": 42.45,
+      "learning_rate": 1.205267175572519e-05,
+      "loss": 1.1448,
+      "step": 29500
+    },
+    {
+      "epoch": 42.45,
+      "eval_cer": 0.09947252401196661,
+      "eval_loss": 0.2292834371328354,
+      "eval_runtime": 41.732,
+      "eval_samples_per_second": 10.927,
+      "eval_steps_per_second": 1.366,
+      "eval_wer": 0.3098761703412866,
+      "step": 29500
+    },
+    {
+      "epoch": 42.59,
+      "learning_rate": 1.1823664122137404e-05,
+      "loss": 1.1408,
+      "step": 29600
+    },
+    {
+      "epoch": 42.73,
+      "learning_rate": 1.1594656488549618e-05,
+      "loss": 1.1458,
+      "step": 29700
+    },
+    {
+      "epoch": 42.88,
+      "learning_rate": 1.1365648854961831e-05,
+      "loss": 1.1358,
+      "step": 29800
+    },
+    {
+      "epoch": 43.02,
+      "learning_rate": 1.1136641221374044e-05,
+      "loss": 1.1519,
+      "step": 29900
+    },
+    {
+      "epoch": 43.17,
+      "learning_rate": 1.0909923664122137e-05,
+      "loss": 1.1327,
+      "step": 30000
+    },
+    {
+      "epoch": 43.17,
+      "eval_cer": 0.09793733270351125,
+      "eval_loss": 0.2265164852142334,
+      "eval_runtime": 40.9338,
+      "eval_samples_per_second": 11.14,
+      "eval_steps_per_second": 1.392,
+      "eval_wer": 0.3047417698580489,
+      "step": 30000
+    },
+    {
+      "epoch": 43.31,
+      "learning_rate": 1.068091603053435e-05,
+      "loss": 1.1322,
+      "step": 30100
+    },
+    {
+      "epoch": 43.45,
+      "learning_rate": 1.0451908396946564e-05,
+      "loss": 1.1392,
+      "step": 30200
+    },
+    {
+      "epoch": 43.6,
+      "learning_rate": 1.0222900763358777e-05,
+      "loss": 1.1318,
+      "step": 30300
+    },
+    {
+      "epoch": 43.74,
+      "learning_rate": 9.99389312977099e-06,
+      "loss": 1.1321,
+      "step": 30400
+    },
+    {
+      "epoch": 43.88,
+      "learning_rate": 9.764885496183206e-06,
+      "loss": 1.1307,
+      "step": 30500
+    },
+    {
+      "epoch": 43.88,
+      "eval_cer": 0.09888206581640686,
+      "eval_loss": 0.22221311926841736,
+      "eval_runtime": 40.9097,
+      "eval_samples_per_second": 11.147,
+      "eval_steps_per_second": 1.393,
+      "eval_wer": 0.30776200543642407,
+      "step": 30500
+    },
+    {
+      "epoch": 44.03,
+      "learning_rate": 9.53587786259542e-06,
+      "loss": 1.1358,
+      "step": 30600
+    },
+    {
+      "epoch": 44.17,
+      "learning_rate": 9.306870229007633e-06,
+      "loss": 1.1342,
+      "step": 30700
+    },
+    {
+      "epoch": 44.32,
+      "learning_rate": 9.077862595419846e-06,
+      "loss": 1.1348,
+      "step": 30800
+    },
+    {
+      "epoch": 44.46,
+      "learning_rate": 8.84885496183206e-06,
+      "loss": 1.1294,
+      "step": 30900
+    },
+    {
+      "epoch": 44.6,
+      "learning_rate": 8.619847328244275e-06,
+      "loss": 1.1419,
+      "step": 31000
+    },
+    {
+      "epoch": 44.6,
+      "eval_cer": 0.09813415210203118,
+      "eval_loss": 0.22149430215358734,
+      "eval_runtime": 40.8027,
+      "eval_samples_per_second": 11.176,
+      "eval_steps_per_second": 1.397,
+      "eval_wer": 0.3038356991845364,
+      "step": 31000
+    },
+    {
+      "epoch": 44.75,
+      "learning_rate": 8.390839694656488e-06,
+      "loss": 1.1191,
+      "step": 31100
+    },
+    {
+      "epoch": 44.89,
+      "learning_rate": 8.161832061068702e-06,
+      "loss": 1.1223,
+      "step": 31200
+    },
+    {
+      "epoch": 45.04,
+      "learning_rate": 7.932824427480915e-06,
+      "loss": 1.1393,
+      "step": 31300
+    },
+    {
+      "epoch": 45.18,
+      "learning_rate": 7.703816793893129e-06,
+      "loss": 1.1172,
+      "step": 31400
+    },
+    {
+      "epoch": 45.32,
+      "learning_rate": 7.474809160305343e-06,
+      "loss": 1.1231,
+      "step": 31500
+    },
+    {
+      "epoch": 45.32,
+      "eval_cer": 0.09722878286883956,
+      "eval_loss": 0.2193477302789688,
+      "eval_runtime": 40.6396,
+      "eval_samples_per_second": 11.221,
+      "eval_steps_per_second": 1.403,
+      "eval_wer": 0.3012684989429176,
+      "step": 31500
+    },
+    {
+      "epoch": 45.47,
+      "learning_rate": 7.245801526717557e-06,
+      "loss": 1.1289,
+      "step": 31600
+    },
+    {
+      "epoch": 45.61,
+      "learning_rate": 7.016793893129771e-06,
+      "loss": 1.1083,
+      "step": 31700
+    },
+    {
+      "epoch": 45.75,
+      "learning_rate": 6.787786259541984e-06,
+      "loss": 1.109,
+      "step": 31800
+    },
+    {
+      "epoch": 45.9,
+      "learning_rate": 6.558778625954198e-06,
+      "loss": 1.1218,
+      "step": 31900
+    },
+    {
+      "epoch": 46.04,
+      "learning_rate": 6.329770992366412e-06,
+      "loss": 1.139,
+      "step": 32000
+    },
+    {
+      "epoch": 46.04,
+      "eval_cer": 0.09683514407179972,
+      "eval_loss": 0.2162453532218933,
+      "eval_runtime": 41.1951,
+      "eval_samples_per_second": 11.069,
+      "eval_steps_per_second": 1.384,
+      "eval_wer": 0.30066445182724255,
+      "step": 32000
+    },
+    {
+      "epoch": 46.19,
+      "learning_rate": 6.100763358778626e-06,
+      "loss": 1.1155,
+      "step": 32100
+    },
+    {
+      "epoch": 46.33,
+      "learning_rate": 5.8717557251908395e-06,
+      "loss": 1.1212,
+      "step": 32200
+    },
+    {
+      "epoch": 46.47,
+      "learning_rate": 5.642748091603053e-06,
+      "loss": 1.1149,
+      "step": 32300
+    },
+    {
+      "epoch": 46.62,
+      "learning_rate": 5.413740458015267e-06,
+      "loss": 1.1183,
+      "step": 32400
+    },
+    {
+      "epoch": 46.76,
+      "learning_rate": 5.184732824427481e-06,
+      "loss": 1.1114,
+      "step": 32500
+    },
+    {
+      "epoch": 46.76,
+      "eval_cer": 0.09596913871831207,
+      "eval_loss": 0.2121613770723343,
+      "eval_runtime": 40.6982,
+      "eval_samples_per_second": 11.204,
+      "eval_steps_per_second": 1.401,
+      "eval_wer": 0.2982482633645424,
+      "step": 32500
+    },
+    {
+      "epoch": 46.91,
+      "learning_rate": 4.955725190839695e-06,
+      "loss": 1.1091,
+      "step": 32600
+    },
+    {
+      "epoch": 47.05,
+      "learning_rate": 4.726717557251908e-06,
+      "loss": 1.1148,
+      "step": 32700
+    },
+    {
+      "epoch": 47.19,
+      "learning_rate": 4.497709923664122e-06,
+      "loss": 1.0962,
+      "step": 32800
+    },
+    {
+      "epoch": 47.34,
+      "learning_rate": 4.268702290076335e-06,
+      "loss": 1.0984,
+      "step": 32900
+    },
+    {
+      "epoch": 47.48,
+      "learning_rate": 4.03969465648855e-06,
+      "loss": 1.111,
+      "step": 33000
+    },
+    {
+      "epoch": 47.48,
+      "eval_cer": 0.09482758620689655,
+      "eval_loss": 0.21248506009578705,
+      "eval_runtime": 40.6368,
+      "eval_samples_per_second": 11.221,
+      "eval_steps_per_second": 1.403,
+      "eval_wer": 0.2946239806704923,
+      "step": 33000
+    },
+    {
+      "epoch": 47.63,
+      "learning_rate": 3.810687022900763e-06,
+      "loss": 1.1031,
+      "step": 33100
+    },
+    {
+      "epoch": 47.77,
+      "learning_rate": 3.581679389312977e-06,
+      "loss": 1.1159,
+      "step": 33200
+    },
+    {
+      "epoch": 47.91,
+      "learning_rate": 3.352671755725191e-06,
+      "loss": 1.0905,
+      "step": 33300
+    },
+    {
+      "epoch": 48.06,
+      "learning_rate": 3.1236641221374048e-06,
+      "loss": 1.1087,
+      "step": 33400
+    },
+    {
+      "epoch": 48.2,
+      "learning_rate": 2.894656488549618e-06,
+      "loss": 1.0982,
+      "step": 33500
+    },
+    {
+      "epoch": 48.2,
+      "eval_cer": 0.09533931664304834,
+      "eval_loss": 0.2098563313484192,
+      "eval_runtime": 40.5946,
+      "eval_samples_per_second": 11.233,
+      "eval_steps_per_second": 1.404,
+      "eval_wer": 0.2956810631229236,
+      "step": 33500
+    },
+    {
+      "epoch": 48.34,
+      "learning_rate": 2.66793893129771e-06,
+      "loss": 1.0947,
+      "step": 33600
+    },
+    {
+      "epoch": 48.49,
+      "learning_rate": 2.4389312977099237e-06,
+      "loss": 1.1102,
+      "step": 33700
+    },
+    {
+      "epoch": 48.63,
+      "learning_rate": 2.209923664122137e-06,
+      "loss": 1.0891,
+      "step": 33800
+    },
+    {
+      "epoch": 48.78,
+      "learning_rate": 1.980916030534351e-06,
+      "loss": 1.0937,
+      "step": 33900
+    },
+    {
+      "epoch": 48.92,
+      "learning_rate": 1.7519083969465647e-06,
+      "loss": 1.109,
+      "step": 34000
+    },
+    {
+      "epoch": 48.92,
+      "eval_cer": 0.09545740828216029,
+      "eval_loss": 0.20918497443199158,
+      "eval_runtime": 40.877,
+      "eval_samples_per_second": 11.155,
+      "eval_steps_per_second": 1.394,
+      "eval_wer": 0.29553005134400484,
+      "step": 34000
+    },
+    {
+      "epoch": 49.06,
+      "learning_rate": 1.5229007633587786e-06,
+      "loss": 1.097,
+      "step": 34100
+    },
+    {
+      "epoch": 49.21,
+      "learning_rate": 1.2938931297709922e-06,
+      "loss": 1.0909,
+      "step": 34200
+    },
+    {
+      "epoch": 49.35,
+      "learning_rate": 1.0648854961832059e-06,
+      "loss": 1.1008,
+      "step": 34300
+    },
+    {
+      "epoch": 49.5,
+      "learning_rate": 8.358778625954198e-07,
+      "loss": 1.0904,
+      "step": 34400
+    },
+    {
+      "epoch": 49.64,
+      "learning_rate": 6.068702290076335e-07,
+      "loss": 1.0905,
+      "step": 34500
+    },
+    {
+      "epoch": 49.64,
+      "eval_cer": 0.09526058888364038,
+      "eval_loss": 0.20883652567863464,
+      "eval_runtime": 40.602,
+      "eval_samples_per_second": 11.231,
+      "eval_steps_per_second": 1.404,
+      "eval_wer": 0.2953790395650861,
+      "step": 34500
+    },
+    {
+      "epoch": 49.78,
+      "learning_rate": 3.778625954198473e-07,
+      "loss": 1.0961,
+      "step": 34600
+    },
+    {
+      "epoch": 49.93,
+      "learning_rate": 1.4885496183206107e-07,
+      "loss": 1.095,
+      "step": 34700
+    },
+    {
+      "epoch": 50.0,
+      "step": 34750,
+      "total_flos": 2.8392187465644065e+20,
+      "train_loss": 2.2316733406121783,
+      "train_runtime": 114311.9751,
+      "train_samples_per_second": 9.737,
+      "train_steps_per_second": 0.304
+    }
+  ],
+  "max_steps": 34750,
+  "num_train_epochs": 50,
+  "total_flos": 2.8392187465644065e+20,
+  "trial_name": null,
+  "trial_params": null
+}