{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 5.807200929152149,
  "eval_steps": 100,
  "global_step": 30000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.019357336430507164,
      "eval_loss": 3.567659854888916,
      "eval_runtime": 160.9588,
      "eval_samples_per_second": 35.139,
      "eval_steps_per_second": 4.392,
      "eval_wer": 1.0,
      "step": 100
    },
    {
      "epoch": 0.03871467286101433,
      "eval_loss": 3.0471677780151367,
      "eval_runtime": 158.7973,
      "eval_samples_per_second": 35.618,
      "eval_steps_per_second": 4.452,
      "eval_wer": 1.0,
      "step": 200
    },
    {
      "epoch": 0.05807200929152149,
      "eval_loss": 2.9665186405181885,
      "eval_runtime": 159.308,
      "eval_samples_per_second": 35.504,
      "eval_steps_per_second": 4.438,
      "eval_wer": 1.0,
      "step": 300
    },
    {
      "epoch": 0.07742934572202866,
      "eval_loss": 2.464332103729248,
      "eval_runtime": 159.8297,
      "eval_samples_per_second": 35.388,
      "eval_steps_per_second": 4.423,
      "eval_wer": 0.9813195101988413,
      "step": 400
    },
    {
      "epoch": 0.09678668215253582,
      "grad_norm": 6.005111217498779,
      "learning_rate": 0.00029759999999999997,
      "loss": 4.1279,
      "step": 500
    },
    {
      "epoch": 0.09678668215253582,
      "eval_loss": 1.625333547592163,
      "eval_runtime": 160.6655,
      "eval_samples_per_second": 35.204,
      "eval_steps_per_second": 4.4,
      "eval_wer": 0.9345380430421595,
      "step": 500
    },
    {
      "epoch": 0.11614401858304298,
      "eval_loss": 1.24808931350708,
      "eval_runtime": 160.4402,
      "eval_samples_per_second": 35.253,
      "eval_steps_per_second": 4.407,
      "eval_wer": 0.8190528157147213,
      "step": 600
    },
    {
      "epoch": 0.13550135501355012,
      "eval_loss": 1.0997203588485718,
      "eval_runtime": 161.1872,
      "eval_samples_per_second": 35.09,
      "eval_steps_per_second": 4.386,
      "eval_wer": 0.7769735680698432,
      "step": 700
    },
    {
      "epoch": 0.1548586914440573,
      "eval_loss": 1.0475263595581055,
      "eval_runtime": 161.0626,
      "eval_samples_per_second": 35.117,
      "eval_steps_per_second": 4.39,
      "eval_wer": 0.7339795541718156,
      "step": 800
    },
    {
      "epoch": 0.17421602787456447,
      "eval_loss": 0.9692754149436951,
      "eval_runtime": 161.3683,
      "eval_samples_per_second": 35.05,
      "eval_steps_per_second": 4.381,
      "eval_wer": 0.7012565999582738,
      "step": 900
    },
    {
      "epoch": 0.19357336430507163,
      "grad_norm": 2.414348602294922,
      "learning_rate": 0.0002949762711864406,
      "loss": 1.0598,
      "step": 1000
    },
    {
      "epoch": 0.19357336430507163,
      "eval_loss": 0.911480724811554,
      "eval_runtime": 162.0835,
      "eval_samples_per_second": 34.896,
      "eval_steps_per_second": 4.362,
      "eval_wer": 0.6749049124552647,
      "step": 1000
    },
    {
      "epoch": 0.2129307007355788,
      "eval_loss": 0.8823792338371277,
      "eval_runtime": 161.5426,
      "eval_samples_per_second": 35.012,
      "eval_steps_per_second": 4.377,
      "eval_wer": 0.65625651971562,
      "step": 1100
    },
    {
      "epoch": 0.23228803716608595,
      "eval_loss": 0.8609552383422852,
      "eval_runtime": 161.6778,
      "eval_samples_per_second": 34.983,
      "eval_steps_per_second": 4.373,
      "eval_wer": 0.6431288215563865,
      "step": 1200
    },
    {
      "epoch": 0.2516453735965931,
      "eval_loss": 0.8330459594726562,
      "eval_runtime": 161.7974,
      "eval_samples_per_second": 34.957,
      "eval_steps_per_second": 4.37,
      "eval_wer": 0.6114169247805363,
      "step": 1300
    },
    {
      "epoch": 0.27100271002710025,
      "eval_loss": 0.8172780871391296,
      "eval_runtime": 161.4977,
      "eval_samples_per_second": 35.022,
      "eval_steps_per_second": 4.378,
      "eval_wer": 0.6017396607340598,
      "step": 1400
    },
    {
      "epoch": 0.29036004645760743,
      "grad_norm": 4.460846424102783,
      "learning_rate": 0.0002898915254237288,
      "loss": 0.8546,
      "step": 1500
    },
    {
      "epoch": 0.29036004645760743,
      "eval_loss": 0.8102588653564453,
      "eval_runtime": 161.397,
      "eval_samples_per_second": 35.044,
      "eval_steps_per_second": 4.381,
      "eval_wer": 0.6139204955786298,
      "step": 1500
    },
    {
      "epoch": 0.3097173828881146,
      "eval_loss": 0.7860382795333862,
      "eval_runtime": 162.0586,
      "eval_samples_per_second": 34.901,
      "eval_steps_per_second": 4.363,
      "eval_wer": 0.6077739082986953,
      "step": 1600
    },
    {
      "epoch": 0.32907471931862176,
      "eval_loss": 0.857550323009491,
      "eval_runtime": 161.2906,
      "eval_samples_per_second": 35.067,
      "eval_steps_per_second": 4.383,
      "eval_wer": 0.5990114105053682,
      "step": 1700
    },
    {
      "epoch": 0.34843205574912894,
      "eval_loss": 0.7555657029151917,
      "eval_runtime": 161.7718,
      "eval_samples_per_second": 34.963,
      "eval_steps_per_second": 4.37,
      "eval_wer": 0.5773298454526488,
      "step": 1800
    },
    {
      "epoch": 0.3677893921796361,
      "eval_loss": 0.7365372180938721,
      "eval_runtime": 162.1133,
      "eval_samples_per_second": 34.889,
      "eval_steps_per_second": 4.361,
      "eval_wer": 0.5825777150101908,
      "step": 1900
    },
    {
      "epoch": 0.38714672861014326,
      "grad_norm": 3.4646999835968018,
      "learning_rate": 0.0002848067796610169,
      "loss": 0.7776,
      "step": 2000
    },
    {
      "epoch": 0.38714672861014326,
      "eval_loss": 0.7291606068611145,
      "eval_runtime": 162.354,
      "eval_samples_per_second": 34.837,
      "eval_steps_per_second": 4.355,
      "eval_wer": 0.5551989215387332,
      "step": 2000
    },
    {
      "epoch": 0.4065040650406504,
      "eval_loss": 0.716595470905304,
      "eval_runtime": 162.461,
      "eval_samples_per_second": 34.815,
      "eval_steps_per_second": 4.352,
      "eval_wer": 0.5385726436744716,
      "step": 2100
    },
    {
      "epoch": 0.4258614014711576,
      "eval_loss": 0.7117305397987366,
      "eval_runtime": 161.9033,
      "eval_samples_per_second": 34.934,
      "eval_steps_per_second": 4.367,
      "eval_wer": 0.5401774967501726,
      "step": 2200
    },
    {
      "epoch": 0.4452187379016647,
      "eval_loss": 0.7060667872428894,
      "eval_runtime": 162.0901,
      "eval_samples_per_second": 34.894,
      "eval_steps_per_second": 4.362,
      "eval_wer": 0.5388294201665838,
      "step": 2300
    },
    {
      "epoch": 0.4645760743321719,
      "eval_loss": 0.7044907212257385,
      "eval_runtime": 162.5576,
      "eval_samples_per_second": 34.794,
      "eval_steps_per_second": 4.349,
      "eval_wer": 0.5364060920222754,
      "step": 2400
    },
    {
      "epoch": 0.48393341076267904,
      "grad_norm": 2.70296573638916,
      "learning_rate": 0.00027972203389830505,
      "loss": 0.706,
      "step": 2500
    },
    {
      "epoch": 0.48393341076267904,
      "eval_loss": 0.7062936425209045,
      "eval_runtime": 162.4753,
      "eval_samples_per_second": 34.811,
      "eval_steps_per_second": 4.351,
      "eval_wer": 0.5428736499173501,
      "step": 2500
    },
    {
      "epoch": 0.5032907471931862,
      "eval_loss": 0.6941363215446472,
      "eval_runtime": 162.6699,
      "eval_samples_per_second": 34.77,
      "eval_steps_per_second": 4.346,
      "eval_wer": 0.5433872029015744,
      "step": 2600
    },
    {
      "epoch": 0.5226480836236934,
      "eval_loss": 0.6840428113937378,
      "eval_runtime": 162.5617,
      "eval_samples_per_second": 34.793,
      "eval_steps_per_second": 4.349,
      "eval_wer": 0.5203094156729952,
      "step": 2700
    },
    {
      "epoch": 0.5420054200542005,
      "eval_loss": 0.6902298331260681,
      "eval_runtime": 162.7532,
      "eval_samples_per_second": 34.752,
      "eval_steps_per_second": 4.344,
      "eval_wer": 0.5593715395355555,
      "step": 2800
    },
    {
      "epoch": 0.5613627564847077,
      "eval_loss": 0.6594961881637573,
      "eval_runtime": 163.1259,
      "eval_samples_per_second": 34.673,
      "eval_steps_per_second": 4.334,
      "eval_wer": 0.5149171093386401,
      "step": 2900
    },
    {
      "epoch": 0.5807200929152149,
      "grad_norm": 4.962900161743164,
      "learning_rate": 0.0002746372881355932,
      "loss": 0.7002,
      "step": 3000
    },
    {
      "epoch": 0.5807200929152149,
      "eval_loss": 0.6767885088920593,
      "eval_runtime": 162.9945,
      "eval_samples_per_second": 34.701,
      "eval_steps_per_second": 4.338,
      "eval_wer": 0.525284460207668,
      "step": 3000
    },
    {
      "epoch": 0.6000774293457221,
      "eval_loss": 0.6656874418258667,
      "eval_runtime": 163.0572,
      "eval_samples_per_second": 34.687,
      "eval_steps_per_second": 4.336,
      "eval_wer": 0.5063953395066682,
      "step": 3100
    },
    {
      "epoch": 0.6194347657762292,
      "eval_loss": 0.6758668422698975,
      "eval_runtime": 163.796,
      "eval_samples_per_second": 34.531,
      "eval_steps_per_second": 4.316,
      "eval_wer": 0.5409478262265089,
      "step": 3200
    },
    {
      "epoch": 0.6387921022067363,
      "eval_loss": 0.6709346175193787,
      "eval_runtime": 162.7448,
      "eval_samples_per_second": 34.754,
      "eval_steps_per_second": 4.344,
      "eval_wer": 0.5090914926738457,
      "step": 3300
    },
    {
      "epoch": 0.6581494386372435,
      "eval_loss": 0.6478992104530334,
      "eval_runtime": 163.2374,
      "eval_samples_per_second": 34.649,
      "eval_steps_per_second": 4.331,
      "eval_wer": 0.5037473319317617,
      "step": 3400
    },
    {
      "epoch": 0.6775067750677507,
      "grad_norm": 3.27418851852417,
      "learning_rate": 0.0002695525423728813,
      "loss": 0.685,
      "step": 3500
    },
    {
      "epoch": 0.6775067750677507,
      "eval_loss": 0.6378278136253357,
      "eval_runtime": 162.9066,
      "eval_samples_per_second": 34.719,
      "eval_steps_per_second": 4.34,
      "eval_wer": 0.5033782157243505,
      "step": 3500
    },
    {
      "epoch": 0.6968641114982579,
      "eval_loss": 0.6492822170257568,
      "eval_runtime": 162.8688,
      "eval_samples_per_second": 34.727,
      "eval_steps_per_second": 4.341,
      "eval_wer": 0.49883648152011684,
      "step": 3600
    },
    {
      "epoch": 0.716221447928765,
      "eval_loss": 0.6340391635894775,
      "eval_runtime": 163.0198,
      "eval_samples_per_second": 34.695,
      "eval_steps_per_second": 4.337,
      "eval_wer": 0.4832694066858179,
      "step": 3700
    },
    {
      "epoch": 0.7355787843592722,
      "eval_loss": 0.6226627826690674,
      "eval_runtime": 164.0506,
      "eval_samples_per_second": 34.477,
      "eval_steps_per_second": 4.31,
      "eval_wer": 0.47354399704707034,
      "step": 3800
    },
    {
      "epoch": 0.7549361207897793,
      "eval_loss": 0.6257476210594177,
      "eval_runtime": 167.0907,
      "eval_samples_per_second": 33.85,
      "eval_steps_per_second": 4.231,
      "eval_wer": 0.49068382789555615,
      "step": 3900
    },
    {
      "epoch": 0.7742934572202865,
      "grad_norm": 5.494376182556152,
      "learning_rate": 0.0002644677966101695,
      "loss": 0.6655,
      "step": 4000
    },
    {
      "epoch": 0.7742934572202865,
      "eval_loss": 0.6420141458511353,
      "eval_runtime": 163.4141,
      "eval_samples_per_second": 34.611,
      "eval_steps_per_second": 4.326,
      "eval_wer": 0.49987963601932245,
      "step": 4000
    },
    {
      "epoch": 0.7936507936507936,
      "eval_loss": 0.6111469268798828,
      "eval_runtime": 163.5321,
      "eval_samples_per_second": 34.586,
      "eval_steps_per_second": 4.323,
      "eval_wer": 0.4790646916274815,
      "step": 4100
    },
    {
      "epoch": 0.8130081300813008,
      "eval_loss": 0.6136205196380615,
      "eval_runtime": 163.9442,
      "eval_samples_per_second": 34.5,
      "eval_steps_per_second": 4.312,
      "eval_wer": 0.48073373882621045,
      "step": 4200
    },
    {
      "epoch": 0.832365466511808,
      "eval_loss": 0.6218396425247192,
      "eval_runtime": 163.3391,
      "eval_samples_per_second": 34.627,
      "eval_steps_per_second": 4.328,
      "eval_wer": 0.48596555985299544,
      "step": 4300
    },
    {
      "epoch": 0.8517228029423152,
      "eval_loss": 0.6084252595901489,
      "eval_runtime": 162.8945,
      "eval_samples_per_second": 34.722,
      "eval_steps_per_second": 4.34,
      "eval_wer": 0.4585386207892667,
      "step": 4400
    },
    {
      "epoch": 0.8710801393728222,
      "grad_norm": 3.0379676818847656,
      "learning_rate": 0.0002593830508474576,
      "loss": 0.6431,
      "step": 4500
    },
    {
      "epoch": 0.8710801393728222,
      "eval_loss": 0.6008957624435425,
      "eval_runtime": 163.8125,
      "eval_samples_per_second": 34.527,
      "eval_steps_per_second": 4.316,
      "eval_wer": 0.4627593843783602,
      "step": 4500
    },
    {
      "epoch": 0.8904374758033294,
      "eval_loss": 0.6009930968284607,
      "eval_runtime": 163.1039,
      "eval_samples_per_second": 34.677,
      "eval_steps_per_second": 4.335,
      "eval_wer": 0.46295196674744427,
      "step": 4600
    },
    {
      "epoch": 0.9097948122338366,
      "eval_loss": 0.5823432207107544,
      "eval_runtime": 163.3804,
      "eval_samples_per_second": 34.619,
      "eval_steps_per_second": 4.327,
      "eval_wer": 0.45035387010319206,
      "step": 4700
    },
    {
      "epoch": 0.9291521486643438,
      "eval_loss": 0.6118789315223694,
      "eval_runtime": 163.7255,
      "eval_samples_per_second": 34.546,
      "eval_steps_per_second": 4.318,
      "eval_wer": 0.4630001123397153,
      "step": 4800
    },
    {
      "epoch": 0.948509485094851,
      "eval_loss": 0.6001989245414734,
      "eval_runtime": 163.3492,
      "eval_samples_per_second": 34.625,
      "eval_steps_per_second": 4.328,
      "eval_wer": 0.4600150856189116,
      "step": 4900
    },
    {
      "epoch": 0.9678668215253581,
      "grad_norm": 3.1605985164642334,
      "learning_rate": 0.00025430847457627115,
      "loss": 0.6235,
      "step": 5000
    },
    {
      "epoch": 0.9678668215253581,
      "eval_loss": 0.5892329216003418,
      "eval_runtime": 163.5255,
      "eval_samples_per_second": 34.588,
      "eval_steps_per_second": 4.323,
      "eval_wer": 0.4551844778610518,
      "step": 5000
    },
    {
      "epoch": 0.9872241579558653,
      "eval_loss": 0.5673592686653137,
      "eval_runtime": 163.343,
      "eval_samples_per_second": 34.627,
      "eval_steps_per_second": 4.328,
      "eval_wer": 0.44889345380430423,
      "step": 5100
    },
    {
      "epoch": 1.0065814943863725,
      "eval_loss": 0.5792257785797119,
      "eval_runtime": 162.8592,
      "eval_samples_per_second": 34.729,
      "eval_steps_per_second": 4.341,
      "eval_wer": 0.43167338030203334,
      "step": 5200
    },
    {
      "epoch": 1.0259388308168795,
      "eval_loss": 0.5752869844436646,
      "eval_runtime": 162.7856,
      "eval_samples_per_second": 34.745,
      "eval_steps_per_second": 4.343,
      "eval_wer": 0.43331033043924827,
      "step": 5300
    },
    {
      "epoch": 1.0452961672473868,
      "eval_loss": 0.5698733925819397,
      "eval_runtime": 161.9949,
      "eval_samples_per_second": 34.915,
      "eval_steps_per_second": 4.364,
      "eval_wer": 0.44619730063712665,
      "step": 5400
    },
    {
      "epoch": 1.064653503677894,
      "grad_norm": 0.8791279792785645,
      "learning_rate": 0.0002492338983050847,
      "loss": 0.5527,
      "step": 5500
    },
    {
      "epoch": 1.064653503677894,
      "eval_loss": 0.5666691660881042,
      "eval_runtime": 162.0517,
      "eval_samples_per_second": 34.902,
      "eval_steps_per_second": 4.363,
      "eval_wer": 0.43639164834459404,
      "step": 5500
    },
    {
      "epoch": 1.084010840108401,
      "eval_loss": 0.5558171272277832,
      "eval_runtime": 161.9847,
      "eval_samples_per_second": 34.917,
      "eval_steps_per_second": 4.365,
      "eval_wer": 0.42945868305756607,
      "step": 5600
    },
    {
      "epoch": 1.1033681765389083,
      "eval_loss": 0.5602455139160156,
      "eval_runtime": 162.701,
      "eval_samples_per_second": 34.763,
      "eval_steps_per_second": 4.345,
      "eval_wer": 0.422349183932211,
      "step": 5700
    },
    {
      "epoch": 1.1227255129694154,
      "eval_loss": 0.559140145778656,
      "eval_runtime": 162.4402,
      "eval_samples_per_second": 34.819,
      "eval_steps_per_second": 4.352,
      "eval_wer": 0.41942835133443535,
      "step": 5800
    },
    {
      "epoch": 1.1420828493999227,
      "eval_loss": 0.5399234890937805,
      "eval_runtime": 162.3316,
      "eval_samples_per_second": 34.842,
      "eval_steps_per_second": 4.355,
      "eval_wer": 0.418818507165669,
      "step": 5900
    },
    {
      "epoch": 1.1614401858304297,
      "grad_norm": 0.9803772568702698,
      "learning_rate": 0.00024414915254237287,
      "loss": 0.533,
      "step": 6000
    },
    {
      "epoch": 1.1614401858304297,
      "eval_loss": 0.545900821685791,
      "eval_runtime": 161.6822,
      "eval_samples_per_second": 34.982,
      "eval_steps_per_second": 4.373,
      "eval_wer": 0.431063536133267,
      "step": 6000
    },
    {
      "epoch": 1.1807975222609368,
      "eval_loss": 0.5347985625267029,
      "eval_runtime": 161.8121,
      "eval_samples_per_second": 34.954,
      "eval_steps_per_second": 4.369,
      "eval_wer": 0.41183739628637,
      "step": 6100
    },
    {
      "epoch": 1.2001548586914441,
      "eval_loss": 0.5453631281852722,
      "eval_runtime": 161.8802,
      "eval_samples_per_second": 34.939,
      "eval_steps_per_second": 4.367,
      "eval_wer": 0.4176309158896503,
      "step": 6200
    },
    {
      "epoch": 1.2195121951219512,
      "eval_loss": 0.5442932844161987,
      "eval_runtime": 162.1767,
      "eval_samples_per_second": 34.876,
      "eval_steps_per_second": 4.359,
      "eval_wer": 0.42157885445587456,
      "step": 6300
    },
    {
      "epoch": 1.2388695315524583,
      "eval_loss": 0.5382806658744812,
      "eval_runtime": 161.5364,
      "eval_samples_per_second": 35.014,
      "eval_steps_per_second": 4.377,
      "eval_wer": 0.40962269904190274,
      "step": 6400
    },
    {
      "epoch": 1.2582268679829656,
      "grad_norm": 2.7026009559631348,
      "learning_rate": 0.00023906440677966102,
      "loss": 0.5228,
      "step": 6500
    },
    {
      "epoch": 1.2582268679829656,
      "eval_loss": 0.540704071521759,
      "eval_runtime": 161.6157,
      "eval_samples_per_second": 34.997,
      "eval_steps_per_second": 4.375,
      "eval_wer": 0.41260772576270643,
      "step": 6500
    },
    {
      "epoch": 1.2775842044134726,
      "eval_loss": 0.5527251362800598,
      "eval_runtime": 161.6568,
      "eval_samples_per_second": 34.988,
      "eval_steps_per_second": 4.373,
      "eval_wer": 0.41426072443067835,
      "step": 6600
    },
    {
      "epoch": 1.29694154084398,
      "eval_loss": 0.5312824845314026,
      "eval_runtime": 161.7821,
      "eval_samples_per_second": 34.961,
      "eval_steps_per_second": 4.37,
      "eval_wer": 0.40811413715074385,
      "step": 6700
    },
    {
      "epoch": 1.316298877274487,
      "eval_loss": 0.533909797668457,
      "eval_runtime": 161.8361,
      "eval_samples_per_second": 34.949,
      "eval_steps_per_second": 4.369,
      "eval_wer": 0.4150471024377718,
      "step": 6800
    },
    {
      "epoch": 1.3356562137049943,
      "eval_loss": 0.523649275302887,
      "eval_runtime": 161.5476,
      "eval_samples_per_second": 35.011,
      "eval_steps_per_second": 4.376,
      "eval_wer": 0.4120781242477251,
      "step": 6900
    },
    {
      "epoch": 1.3550135501355014,
      "grad_norm": 0.709751546382904,
      "learning_rate": 0.00023397966101694912,
      "loss": 0.5204,
      "step": 7000
    },
    {
      "epoch": 1.3550135501355014,
      "eval_loss": 0.5527586340904236,
      "eval_runtime": 162.1137,
      "eval_samples_per_second": 34.889,
      "eval_steps_per_second": 4.361,
      "eval_wer": 0.4165877613904447,
      "step": 7000
    },
    {
      "epoch": 1.3743708865660085,
      "eval_loss": 0.5330629944801331,
      "eval_runtime": 161.681,
      "eval_samples_per_second": 34.982,
      "eval_steps_per_second": 4.373,
      "eval_wer": 0.40559451782189343,
      "step": 7100
    },
    {
      "epoch": 1.3937282229965158,
      "eval_loss": 0.5242415070533752,
      "eval_runtime": 162.2742,
      "eval_samples_per_second": 34.855,
      "eval_steps_per_second": 4.357,
      "eval_wer": 0.4058833913755196,
      "step": 7200
    },
    {
      "epoch": 1.4130855594270229,
      "eval_loss": 0.5309507250785828,
      "eval_runtime": 163.2224,
      "eval_samples_per_second": 34.652,
      "eval_steps_per_second": 4.332,
      "eval_wer": 0.4092856798960055,
      "step": 7300
    },
    {
      "epoch": 1.43244289585753,
      "eval_loss": 0.5278186798095703,
      "eval_runtime": 162.9755,
      "eval_samples_per_second": 34.705,
      "eval_steps_per_second": 4.338,
      "eval_wer": 0.4063006531752018,
      "step": 7400
    },
    {
      "epoch": 1.4518002322880372,
      "grad_norm": 0.9905166029930115,
      "learning_rate": 0.00022889491525423728,
      "loss": 0.5199,
      "step": 7500
    },
    {
      "epoch": 1.4518002322880372,
      "eval_loss": 0.5168124437332153,
      "eval_runtime": 162.1336,
      "eval_samples_per_second": 34.885,
      "eval_steps_per_second": 4.361,
      "eval_wer": 0.3955802346295197,
      "step": 7500
    },
    {
      "epoch": 1.4711575687185443,
      "eval_loss": 0.5236623287200928,
      "eval_runtime": 161.1426,
      "eval_samples_per_second": 35.099,
      "eval_steps_per_second": 4.387,
      "eval_wer": 0.40235271460897754,
      "step": 7600
    },
    {
      "epoch": 1.4905149051490514,
      "eval_loss": 0.5316073894500732,
      "eval_runtime": 162.1382,
      "eval_samples_per_second": 34.884,
      "eval_steps_per_second": 4.36,
      "eval_wer": 0.4179358379740335,
      "step": 7700
    },
    {
      "epoch": 1.5098722415795587,
      "eval_loss": 0.5182381868362427,
      "eval_runtime": 161.7911,
      "eval_samples_per_second": 34.959,
      "eval_steps_per_second": 4.37,
      "eval_wer": 0.40326748086212705,
      "step": 7800
    },
    {
      "epoch": 1.5292295780100658,
      "eval_loss": 0.5175392627716064,
      "eval_runtime": 161.5725,
      "eval_samples_per_second": 35.006,
      "eval_steps_per_second": 4.376,
      "eval_wer": 0.3983887275119963,
      "step": 7900
    },
    {
      "epoch": 1.5485869144405728,
      "grad_norm": 0.8261615037918091,
      "learning_rate": 0.00022382033898305084,
      "loss": 0.5066,
      "step": 8000
    },
    {
      "epoch": 1.5485869144405728,
      "eval_loss": 0.5138476490974426,
      "eval_runtime": 162.4044,
      "eval_samples_per_second": 34.827,
      "eval_steps_per_second": 4.353,
      "eval_wer": 0.39492224486848226,
      "step": 8000
    },
    {
      "epoch": 1.5679442508710801,
      "eval_loss": 0.515566885471344,
      "eval_runtime": 162.5299,
      "eval_samples_per_second": 34.8,
      "eval_steps_per_second": 4.35,
      "eval_wer": 0.4016305307249121,
      "step": 8100
    },
    {
      "epoch": 1.5873015873015874,
      "eval_loss": 0.5131089091300964,
      "eval_runtime": 162.835,
      "eval_samples_per_second": 34.735,
      "eval_steps_per_second": 4.342,
      "eval_wer": 0.39793936865080004,
      "step": 8200
    },
    {
      "epoch": 1.6066589237320945,
      "eval_loss": 0.5139849185943604,
      "eval_runtime": 162.5015,
      "eval_samples_per_second": 34.806,
      "eval_steps_per_second": 4.351,
      "eval_wer": 0.39413586686138885,
      "step": 8300
    },
    {
      "epoch": 1.6260162601626016,
      "eval_loss": 0.5224258303642273,
      "eval_runtime": 162.1349,
      "eval_samples_per_second": 34.885,
      "eval_steps_per_second": 4.361,
      "eval_wer": 0.39853316428880936,
      "step": 8400
    },
    {
      "epoch": 1.645373596593109,
      "grad_norm": 1.0760446786880493,
      "learning_rate": 0.00021873559322033897,
      "loss": 0.502,
      "step": 8500
    },
    {
      "epoch": 1.645373596593109,
      "eval_loss": 0.5274536609649658,
      "eval_runtime": 162.3162,
      "eval_samples_per_second": 34.846,
      "eval_steps_per_second": 4.356,
      "eval_wer": 0.40023430854905234,
      "step": 8500
    },
    {
      "epoch": 1.664730933023616,
      "eval_loss": 0.5054244995117188,
      "eval_runtime": 162.7623,
      "eval_samples_per_second": 34.75,
      "eval_steps_per_second": 4.344,
      "eval_wer": 0.3860955529521272,
      "step": 8600
    },
    {
      "epoch": 1.684088269454123,
      "eval_loss": 0.5144466161727905,
      "eval_runtime": 162.1114,
      "eval_samples_per_second": 34.89,
      "eval_steps_per_second": 4.361,
      "eval_wer": 0.3912631798558842,
      "step": 8700
    },
    {
      "epoch": 1.7034456058846303,
      "eval_loss": 0.5017980933189392,
      "eval_runtime": 162.1144,
      "eval_samples_per_second": 34.889,
      "eval_steps_per_second": 4.361,
      "eval_wer": 0.3860955529521272,
      "step": 8800
    },
    {
      "epoch": 1.7228029423151374,
      "eval_loss": 0.5001707673072815,
      "eval_runtime": 162.7958,
      "eval_samples_per_second": 34.743,
      "eval_steps_per_second": 4.343,
      "eval_wer": 0.39978494968785605,
      "step": 8900
    },
    {
      "epoch": 1.7421602787456445,
      "grad_norm": 2.3791110515594482,
      "learning_rate": 0.00021366101694915253,
      "loss": 0.4965,
      "step": 9000
    },
    {
      "epoch": 1.7421602787456445,
      "eval_loss": 0.5074877142906189,
      "eval_runtime": 162.5487,
      "eval_samples_per_second": 34.796,
      "eval_steps_per_second": 4.349,
      "eval_wer": 0.38896823995763186,
      "step": 9000
    },
    {
      "epoch": 1.7615176151761518,
      "eval_loss": 0.4928957521915436,
      "eval_runtime": 162.2035,
      "eval_samples_per_second": 34.87,
      "eval_steps_per_second": 4.359,
      "eval_wer": 0.3865449118133235,
      "step": 9100
    },
    {
      "epoch": 1.7808749516066589,
      "eval_loss": 0.49622705578804016,
      "eval_runtime": 162.8808,
      "eval_samples_per_second": 34.725,
      "eval_steps_per_second": 4.341,
      "eval_wer": 0.38559804849866,
      "step": 9200
    },
    {
      "epoch": 1.800232288037166,
      "eval_loss": 0.49036508798599243,
      "eval_runtime": 162.3886,
      "eval_samples_per_second": 34.83,
      "eval_steps_per_second": 4.354,
      "eval_wer": 0.3759689300444544,
      "step": 9300
    },
    {
      "epoch": 1.8195896244676733,
      "eval_loss": 0.49964088201522827,
      "eval_runtime": 162.526,
      "eval_samples_per_second": 34.801,
      "eval_steps_per_second": 4.35,
      "eval_wer": 0.3901237341721365,
      "step": 9400
    },
    {
      "epoch": 1.8389469608981805,
      "grad_norm": 1.2548748254776,
      "learning_rate": 0.00020857627118644066,
      "loss": 0.4776,
      "step": 9500
    },
    {
      "epoch": 1.8389469608981805,
      "eval_loss": 0.4899130165576935,
      "eval_runtime": 162.5723,
      "eval_samples_per_second": 34.791,
      "eval_steps_per_second": 4.349,
      "eval_wer": 0.37616151241353857,
      "step": 9500
    },
    {
      "epoch": 1.8583042973286876,
      "eval_loss": 0.4918155074119568,
      "eval_runtime": 162.1914,
      "eval_samples_per_second": 34.872,
      "eval_steps_per_second": 4.359,
      "eval_wer": 0.37948355828023944,
      "step": 9600
    },
    {
      "epoch": 1.8776616337591947,
      "eval_loss": 0.49148374795913696,
      "eval_runtime": 162.2813,
      "eval_samples_per_second": 34.853,
      "eval_steps_per_second": 4.357,
      "eval_wer": 0.37980452889537963,
      "step": 9700
    },
    {
      "epoch": 1.897018970189702,
      "eval_loss": 0.4841060936450958,
      "eval_runtime": 162.2556,
      "eval_samples_per_second": 34.859,
      "eval_steps_per_second": 4.357,
      "eval_wer": 0.37060872077161333,
      "step": 9800
    },
    {
      "epoch": 1.916376306620209,
      "eval_loss": 0.4834117293357849,
      "eval_runtime": 163.5813,
      "eval_samples_per_second": 34.576,
      "eval_steps_per_second": 4.322,
      "eval_wer": 0.37728490956652916,
      "step": 9900
    },
    {
      "epoch": 1.9357336430507162,
      "grad_norm": 1.011767029762268,
      "learning_rate": 0.00020349152542372878,
      "loss": 0.4752,
      "step": 10000
    },
    {
      "epoch": 1.9357336430507162,
      "eval_loss": 0.4831894338130951,
      "eval_runtime": 162.4305,
      "eval_samples_per_second": 34.821,
      "eval_steps_per_second": 4.353,
      "eval_wer": 0.3711704193481087,
      "step": 10000
    },
    {
      "epoch": 1.9550909794812235,
      "eval_loss": 0.4890592396259308,
      "eval_runtime": 162.3568,
      "eval_samples_per_second": 34.837,
      "eval_steps_per_second": 4.355,
      "eval_wer": 0.37829596700422075,
      "step": 10100
    },
    {
      "epoch": 1.9744483159117305,
      "eval_loss": 0.4786697328090668,
      "eval_runtime": 163.1452,
      "eval_samples_per_second": 34.669,
      "eval_steps_per_second": 4.334,
      "eval_wer": 0.3783441125964918,
      "step": 10200
    },
    {
      "epoch": 1.9938056523422376,
      "eval_loss": 0.4726457893848419,
      "eval_runtime": 162.2371,
      "eval_samples_per_second": 34.863,
      "eval_steps_per_second": 4.358,
      "eval_wer": 0.37141114730946384,
      "step": 10300
    },
    {
      "epoch": 2.013162988772745,
      "eval_loss": 0.49166908860206604,
      "eval_runtime": 162.2356,
      "eval_samples_per_second": 34.863,
      "eval_steps_per_second": 4.358,
      "eval_wer": 0.37320858275424884,
      "step": 10400
    },
    {
      "epoch": 2.032520325203252,
      "grad_norm": 0.9389815926551819,
      "learning_rate": 0.00019840677966101694,
      "loss": 0.4587,
      "step": 10500
    },
    {
      "epoch": 2.032520325203252,
      "eval_loss": 0.48015162348747253,
      "eval_runtime": 162.7857,
      "eval_samples_per_second": 34.745,
      "eval_steps_per_second": 4.343,
      "eval_wer": 0.37264688417775355,
      "step": 10500
    },
    {
      "epoch": 2.051877661633759,
      "eval_loss": 0.4883776903152466,
      "eval_runtime": 162.7407,
      "eval_samples_per_second": 34.755,
      "eval_steps_per_second": 4.344,
      "eval_wer": 0.3825327791240712,
      "step": 10600
    },
    {
      "epoch": 2.0712349980642664,
      "eval_loss": 0.4841337502002716,
      "eval_runtime": 162.7772,
      "eval_samples_per_second": 34.747,
      "eval_steps_per_second": 4.343,
      "eval_wer": 0.37845645231179087,
      "step": 10700
    },
    {
      "epoch": 2.0905923344947737,
      "eval_loss": 0.4809282422065735,
      "eval_runtime": 162.8688,
      "eval_samples_per_second": 34.727,
      "eval_steps_per_second": 4.341,
      "eval_wer": 0.3738184269230152,
      "step": 10800
    },
    {
      "epoch": 2.1099496709252805,
      "eval_loss": 0.47966596484184265,
      "eval_runtime": 163.5921,
      "eval_samples_per_second": 34.574,
      "eval_steps_per_second": 4.322,
      "eval_wer": 0.3713469531864358,
      "step": 10900
    },
    {
      "epoch": 2.129307007355788,
      "grad_norm": 0.6634272933006287,
      "learning_rate": 0.0001933220338983051,
      "loss": 0.3967,
      "step": 11000
    },
    {
      "epoch": 2.129307007355788,
      "eval_loss": 0.4866289794445038,
      "eval_runtime": 162.8573,
      "eval_samples_per_second": 34.73,
      "eval_steps_per_second": 4.341,
      "eval_wer": 0.37497392113751987,
      "step": 11000
    },
    {
      "epoch": 2.148664343786295,
      "eval_loss": 0.4938376843929291,
      "eval_runtime": 163.5145,
      "eval_samples_per_second": 34.59,
      "eval_steps_per_second": 4.324,
      "eval_wer": 0.3749097270144918,
      "step": 11100
    },
    {
      "epoch": 2.168021680216802,
      "eval_loss": 0.48603999614715576,
      "eval_runtime": 162.8433,
      "eval_samples_per_second": 34.733,
      "eval_steps_per_second": 4.342,
      "eval_wer": 0.36796071319670687,
      "step": 11200
    },
    {
      "epoch": 2.1873790166473093,
      "eval_loss": 0.4849016070365906,
      "eval_runtime": 162.5249,
      "eval_samples_per_second": 34.801,
      "eval_steps_per_second": 4.35,
      "eval_wer": 0.369966779541333,
      "step": 11300
    },
    {
      "epoch": 2.2067363530778166,
      "eval_loss": 0.49077799916267395,
      "eval_runtime": 162.3783,
      "eval_samples_per_second": 34.832,
      "eval_steps_per_second": 4.354,
      "eval_wer": 0.36377204666912744,
      "step": 11400
    },
    {
      "epoch": 2.226093689508324,
      "grad_norm": 0.9132543206214905,
      "learning_rate": 0.0001882372881355932,
      "loss": 0.406,
      "step": 11500
    },
    {
      "epoch": 2.226093689508324,
      "eval_loss": 0.4797042906284332,
      "eval_runtime": 162.1749,
      "eval_samples_per_second": 34.876,
      "eval_steps_per_second": 4.359,
      "eval_wer": 0.3678644220121648,
      "step": 11500
    },
    {
      "epoch": 2.2454510259388307,
      "eval_loss": 0.48121991753578186,
      "eval_runtime": 161.7765,
      "eval_samples_per_second": 34.962,
      "eval_steps_per_second": 4.37,
      "eval_wer": 0.37585659032915536,
      "step": 11600
    },
    {
      "epoch": 2.264808362369338,
      "eval_loss": 0.47043049335479736,
      "eval_runtime": 163.1227,
      "eval_samples_per_second": 34.673,
      "eval_steps_per_second": 4.334,
      "eval_wer": 0.361268475871034,
      "step": 11700
    },
    {
      "epoch": 2.2841656987998453,
      "eval_loss": 0.4715932607650757,
      "eval_runtime": 163.2336,
      "eval_samples_per_second": 34.65,
      "eval_steps_per_second": 4.331,
      "eval_wer": 0.36345107605398724,
      "step": 11800
    },
    {
      "epoch": 2.303523035230352,
      "eval_loss": 0.4676753580570221,
      "eval_runtime": 163.378,
      "eval_samples_per_second": 34.619,
      "eval_steps_per_second": 4.327,
      "eval_wer": 0.3635473672385293,
      "step": 11900
    },
    {
      "epoch": 2.3228803716608595,
      "grad_norm": 0.6134137511253357,
      "learning_rate": 0.00018315254237288135,
      "loss": 0.4088,
      "step": 12000
    },
    {
      "epoch": 2.3228803716608595,
      "eval_loss": 0.47054949402809143,
      "eval_runtime": 162.7912,
      "eval_samples_per_second": 34.744,
      "eval_steps_per_second": 4.343,
      "eval_wer": 0.36399672609972555,
      "step": 12000
    },
    {
      "epoch": 2.3422377080913668,
      "eval_loss": 0.4782082140445709,
      "eval_runtime": 162.8776,
      "eval_samples_per_second": 34.725,
      "eval_steps_per_second": 4.341,
      "eval_wer": 0.35905377862656673,
      "step": 12100
    },
    {
      "epoch": 2.3615950445218736,
      "eval_loss": 0.4795554578304291,
      "eval_runtime": 163.357,
      "eval_samples_per_second": 34.624,
      "eval_steps_per_second": 4.328,
      "eval_wer": 0.36128452440179104,
      "step": 12200
    },
    {
      "epoch": 2.380952380952381,
      "eval_loss": 0.47130346298217773,
      "eval_runtime": 163.1765,
      "eval_samples_per_second": 34.662,
      "eval_steps_per_second": 4.333,
      "eval_wer": 0.3558119754136509,
      "step": 12300
    },
    {
      "epoch": 2.4003097173828882,
      "eval_loss": 0.47632816433906555,
      "eval_runtime": 163.2851,
      "eval_samples_per_second": 34.639,
      "eval_steps_per_second": 4.33,
      "eval_wer": 0.3588772447882396,
      "step": 12400
    },
    {
      "epoch": 2.419667053813395,
      "grad_norm": 0.6301820874214172,
      "learning_rate": 0.0001780779661016949,
      "loss": 0.407,
      "step": 12500
    },
    {
      "epoch": 2.419667053813395,
      "eval_loss": 0.46899136900901794,
      "eval_runtime": 163.5219,
      "eval_samples_per_second": 34.589,
      "eval_steps_per_second": 4.324,
      "eval_wer": 0.3565181107669593,
      "step": 12500
    },
    {
      "epoch": 2.4390243902439024,
      "eval_loss": 0.4686334431171417,
      "eval_runtime": 163.9109,
      "eval_samples_per_second": 34.507,
      "eval_steps_per_second": 4.313,
      "eval_wer": 0.35767360498146394,
      "step": 12600
    },
    {
      "epoch": 2.4583817266744097,
      "eval_loss": 0.467680424451828,
      "eval_runtime": 163.7544,
      "eval_samples_per_second": 34.54,
      "eval_steps_per_second": 4.317,
      "eval_wer": 0.3584278859270434,
      "step": 12700
    },
    {
      "epoch": 2.4777390631049165,
      "eval_loss": 0.46144554018974304,
      "eval_runtime": 163.8198,
      "eval_samples_per_second": 34.526,
      "eval_steps_per_second": 4.316,
      "eval_wer": 0.35765755645070696,
      "step": 12800
    },
    {
      "epoch": 2.497096399535424,
      "eval_loss": 0.455834299325943,
      "eval_runtime": 163.2394,
      "eval_samples_per_second": 34.649,
      "eval_steps_per_second": 4.331,
      "eval_wer": 0.35992039928744524,
      "step": 12900
    },
    {
      "epoch": 2.516453735965931,
      "grad_norm": 0.41953468322753906,
      "learning_rate": 0.00017299322033898304,
      "loss": 0.3855,
      "step": 13000
    },
    {
      "epoch": 2.516453735965931,
      "eval_loss": 0.4555678367614746,
      "eval_runtime": 164.8785,
      "eval_samples_per_second": 34.304,
      "eval_steps_per_second": 4.288,
      "eval_wer": 0.3565341592977163,
      "step": 13000
    },
    {
      "epoch": 2.535811072396438,
      "eval_loss": 0.4600988030433655,
      "eval_runtime": 163.6778,
      "eval_samples_per_second": 34.556,
      "eval_steps_per_second": 4.319,
      "eval_wer": 0.3558280239444079,
      "step": 13100
    },
    {
      "epoch": 2.5551684088269453,
      "eval_loss": 0.4650043547153473,
      "eval_runtime": 163.58,
      "eval_samples_per_second": 34.576,
      "eval_steps_per_second": 4.322,
      "eval_wer": 0.354303413522492,
      "step": 13200
    },
    {
      "epoch": 2.5745257452574526,
      "eval_loss": 0.4737236201763153,
      "eval_runtime": 163.9532,
      "eval_samples_per_second": 34.498,
      "eval_steps_per_second": 4.312,
      "eval_wer": 0.35483301503747333,
      "step": 13300
    },
    {
      "epoch": 2.59388308168796,
      "eval_loss": 0.45056912302970886,
      "eval_runtime": 163.6462,
      "eval_samples_per_second": 34.562,
      "eval_steps_per_second": 4.32,
      "eval_wer": 0.3534367928616135,
      "step": 13400
    },
    {
      "epoch": 2.6132404181184667,
      "grad_norm": 1.5978127717971802,
      "learning_rate": 0.0001679186440677966,
      "loss": 0.3748,
      "step": 13500
    },
    {
      "epoch": 2.6132404181184667,
      "eval_loss": 0.4606887698173523,
      "eval_runtime": 163.0481,
      "eval_samples_per_second": 34.689,
      "eval_steps_per_second": 4.336,
      "eval_wer": 0.3589253903805107,
      "step": 13500
    },
    {
      "epoch": 2.632597754548974,
      "eval_loss": 0.45494645833969116,
      "eval_runtime": 162.9584,
      "eval_samples_per_second": 34.708,
      "eval_steps_per_second": 4.339,
      "eval_wer": 0.35372566641523967,
      "step": 13600
    },
    {
      "epoch": 2.6519550909794813,
      "eval_loss": 0.4562608301639557,
      "eval_runtime": 164.1384,
      "eval_samples_per_second": 34.459,
      "eval_steps_per_second": 4.307,
      "eval_wer": 0.36409301728426763,
      "step": 13700
    },
    {
      "epoch": 2.6713124274099886,
      "eval_loss": 0.44666969776153564,
      "eval_runtime": 163.7423,
      "eval_samples_per_second": 34.542,
      "eval_steps_per_second": 4.318,
      "eval_wer": 0.34369533469210894,
      "step": 13800
    },
    {
      "epoch": 2.6906697638404955,
      "eval_loss": 0.4536294639110565,
      "eval_runtime": 163.3892,
      "eval_samples_per_second": 34.617,
      "eval_steps_per_second": 4.327,
      "eval_wer": 0.35446389883006213,
      "step": 13900
    },
    {
      "epoch": 2.710027100271003,
      "grad_norm": 0.6591352224349976,
      "learning_rate": 0.00016283389830508475,
      "loss": 0.3888,
      "step": 14000
    },
    {
      "epoch": 2.710027100271003,
      "eval_loss": 0.4504217505455017,
      "eval_runtime": 163.3199,
      "eval_samples_per_second": 34.631,
      "eval_steps_per_second": 4.329,
      "eval_wer": 0.3509653191250341,
      "step": 14000
    },
    {
      "epoch": 2.72938443670151,
      "eval_loss": 0.44697660207748413,
      "eval_runtime": 163.5943,
      "eval_samples_per_second": 34.573,
      "eval_steps_per_second": 4.322,
      "eval_wer": 0.3602092728410714,
      "step": 14100
    },
    {
      "epoch": 2.748741773132017,
      "eval_loss": 0.45640549063682556,
      "eval_runtime": 163.6363,
      "eval_samples_per_second": 34.564,
      "eval_steps_per_second": 4.321,
      "eval_wer": 0.3539022002535668,
      "step": 14200
    },
    {
      "epoch": 2.7680991095625243,
      "eval_loss": 0.45214343070983887,
      "eval_runtime": 164.011,
      "eval_samples_per_second": 34.485,
      "eval_steps_per_second": 4.311,
      "eval_wer": 0.3561971401518191,
      "step": 14300
    },
    {
      "epoch": 2.7874564459930316,
      "eval_loss": 0.4452911913394928,
      "eval_runtime": 163.9028,
      "eval_samples_per_second": 34.508,
      "eval_steps_per_second": 4.314,
      "eval_wer": 0.35221710452408084,
      "step": 14400
    },
    {
      "epoch": 2.8068137824235384,
      "grad_norm": 0.6879103779792786,
      "learning_rate": 0.00015774915254237285,
      "loss": 0.376,
      "step": 14500
    },
    {
      "epoch": 2.8068137824235384,
      "eval_loss": 0.45518526434898376,
      "eval_runtime": 164.0636,
      "eval_samples_per_second": 34.474,
      "eval_steps_per_second": 4.309,
      "eval_wer": 0.35170355153985655,
      "step": 14500
    },
    {
      "epoch": 2.8261711188540457,
      "eval_loss": 0.45344606041908264,
      "eval_runtime": 163.5444,
      "eval_samples_per_second": 34.584,
      "eval_steps_per_second": 4.323,
      "eval_wer": 0.3549774518142864,
      "step": 14600
    },
    {
      "epoch": 2.845528455284553,
      "eval_loss": 0.45520055294036865,
      "eval_runtime": 163.3824,
      "eval_samples_per_second": 34.618,
      "eval_steps_per_second": 4.327,
      "eval_wer": 0.3405016770714641,
      "step": 14700
    },
    {
      "epoch": 2.86488579171506,
      "eval_loss": 0.45560306310653687,
      "eval_runtime": 164.0292,
      "eval_samples_per_second": 34.482,
      "eval_steps_per_second": 4.31,
      "eval_wer": 0.35138258092471636,
      "step": 14800
    },
    {
      "epoch": 2.884243128145567,
      "eval_loss": 0.44232824444770813,
      "eval_runtime": 164.3662,
      "eval_samples_per_second": 34.411,
      "eval_steps_per_second": 4.301,
      "eval_wer": 0.3467606040666977,
      "step": 14900
    },
    {
      "epoch": 2.9036004645760745,
      "grad_norm": 0.5280432105064392,
      "learning_rate": 0.00015267457627118642,
      "loss": 0.379,
      "step": 15000
    },
    {
      "epoch": 2.9036004645760745,
      "eval_loss": 0.43873003125190735,
      "eval_runtime": 163.5232,
      "eval_samples_per_second": 34.588,
      "eval_steps_per_second": 4.324,
      "eval_wer": 0.34268427725441736,
      "step": 15000
    },
    {
      "epoch": 2.9229578010065813,
      "eval_loss": 0.4372723400592804,
      "eval_runtime": 163.4018,
      "eval_samples_per_second": 34.614,
      "eval_steps_per_second": 4.327,
      "eval_wer": 0.34364718909983794,
      "step": 15100
    },
    {
      "epoch": 2.9423151374370886,
      "eval_loss": 0.4399470090866089,
      "eval_runtime": 164.335,
      "eval_samples_per_second": 34.418,
      "eval_steps_per_second": 4.302,
      "eval_wer": 0.33870424162667906,
      "step": 15200
    },
    {
      "epoch": 2.961672473867596,
      "eval_loss": 0.44378861784935,
      "eval_runtime": 164.0477,
      "eval_samples_per_second": 34.478,
      "eval_steps_per_second": 4.31,
      "eval_wer": 0.3380462518656417,
      "step": 15300
    },
    {
      "epoch": 2.9810298102981028,
      "eval_loss": 0.436974436044693,
      "eval_runtime": 163.6525,
      "eval_samples_per_second": 34.561,
      "eval_steps_per_second": 4.32,
      "eval_wer": 0.3430694419925856,
      "step": 15400
    },
    {
      "epoch": 3.00038714672861,
      "grad_norm": 0.660970151424408,
      "learning_rate": 0.00014758983050847457,
      "loss": 0.3731,
      "step": 15500
    },
    {
      "epoch": 3.00038714672861,
      "eval_loss": 0.43810611963272095,
      "eval_runtime": 162.9215,
      "eval_samples_per_second": 34.716,
      "eval_steps_per_second": 4.34,
      "eval_wer": 0.33413041036093144,
      "step": 15500
    },
    {
      "epoch": 3.0197444831591174,
      "eval_loss": 0.45139721035957336,
      "eval_runtime": 164.2748,
      "eval_samples_per_second": 34.43,
      "eval_steps_per_second": 4.304,
      "eval_wer": 0.3286418128420343,
      "step": 15600
    },
    {
      "epoch": 3.0391018195896247,
      "eval_loss": 0.43782538175582886,
      "eval_runtime": 164.2188,
      "eval_samples_per_second": 34.442,
      "eval_steps_per_second": 4.305,
      "eval_wer": 0.3340180706456324,
      "step": 15700
    },
    {
      "epoch": 3.0584591560201315,
      "eval_loss": 0.44340020418167114,
      "eval_runtime": 163.4459,
      "eval_samples_per_second": 34.605,
      "eval_steps_per_second": 4.326,
      "eval_wer": 0.3441446935533052,
      "step": 15800
    },
    {
      "epoch": 3.077816492450639,
      "eval_loss": 0.44192126393318176,
      "eval_runtime": 164.2009,
      "eval_samples_per_second": 34.446,
      "eval_steps_per_second": 4.306,
      "eval_wer": 0.3399239299642118,
      "step": 15900
    },
    {
      "epoch": 3.097173828881146,
      "grad_norm": 0.6999391913414001,
      "learning_rate": 0.0001425050847457627,
      "loss": 0.3176,
      "step": 16000
    },
    {
      "epoch": 3.097173828881146,
      "eval_loss": 0.4407601058483124,
      "eval_runtime": 164.7219,
      "eval_samples_per_second": 34.337,
      "eval_steps_per_second": 4.292,
      "eval_wer": 0.3335366147229221,
      "step": 16000
    },
    {
      "epoch": 3.116531165311653,
      "eval_loss": 0.436761736869812,
      "eval_runtime": 164.2581,
      "eval_samples_per_second": 34.434,
      "eval_steps_per_second": 4.304,
      "eval_wer": 0.33584760315193146,
      "step": 16100
    },
    {
      "epoch": 3.1358885017421603,
      "eval_loss": 0.4477560520172119,
      "eval_runtime": 163.8979,
      "eval_samples_per_second": 34.509,
      "eval_steps_per_second": 4.314,
      "eval_wer": 0.3400523182102678,
      "step": 16200
    },
    {
      "epoch": 3.1552458381726676,
      "eval_loss": 0.4414171576499939,
      "eval_runtime": 164.4332,
      "eval_samples_per_second": 34.397,
      "eval_steps_per_second": 4.3,
      "eval_wer": 0.3373882621046043,
      "step": 16300
    },
    {
      "epoch": 3.1746031746031744,
      "eval_loss": 0.4476623833179474,
      "eval_runtime": 163.6322,
      "eval_samples_per_second": 34.565,
      "eval_steps_per_second": 4.321,
      "eval_wer": 0.335013079552567,
      "step": 16400
    },
    {
      "epoch": 3.1939605110336817,
      "grad_norm": 0.5408484935760498,
      "learning_rate": 0.00013742033898305083,
      "loss": 0.3201,
      "step": 16500
    },
    {
      "epoch": 3.1939605110336817,
      "eval_loss": 0.4305751919746399,
      "eval_runtime": 163.8253,
      "eval_samples_per_second": 34.525,
      "eval_steps_per_second": 4.316,
      "eval_wer": 0.32917141435701563,
      "step": 16500
    },
    {
      "epoch": 3.213317847464189,
      "eval_loss": 0.4534677267074585,
      "eval_runtime": 163.8666,
      "eval_samples_per_second": 34.516,
      "eval_steps_per_second": 4.314,
      "eval_wer": 0.32941214231837074,
      "step": 16600
    },
    {
      "epoch": 3.2326751838946963,
      "eval_loss": 0.4379562437534332,
      "eval_runtime": 164.1184,
      "eval_samples_per_second": 34.463,
      "eval_steps_per_second": 4.308,
      "eval_wer": 0.33408226476866043,
      "step": 16700
    },
    {
      "epoch": 3.252032520325203,
      "eval_loss": 0.43677663803100586,
      "eval_runtime": 163.6899,
      "eval_samples_per_second": 34.553,
      "eval_steps_per_second": 4.319,
      "eval_wer": 0.33252555728523053,
      "step": 16800
    },
    {
      "epoch": 3.2713898567557105,
      "eval_loss": 0.4359833598136902,
      "eval_runtime": 164.1551,
      "eval_samples_per_second": 34.455,
      "eval_steps_per_second": 4.307,
      "eval_wer": 0.33043924828681936,
      "step": 16900
    },
    {
      "epoch": 3.290747193186218,
      "grad_norm": 0.5537161231040955,
      "learning_rate": 0.00013233559322033898,
      "loss": 0.3101,
      "step": 17000
    },
    {
      "epoch": 3.290747193186218,
      "eval_loss": 0.4347226917743683,
      "eval_runtime": 164.2964,
      "eval_samples_per_second": 34.426,
      "eval_steps_per_second": 4.303,
      "eval_wer": 0.32812825985781,
      "step": 17000
    },
    {
      "epoch": 3.3101045296167246,
      "eval_loss": 0.4375491738319397,
      "eval_runtime": 162.8938,
      "eval_samples_per_second": 34.722,
      "eval_steps_per_second": 4.34,
      "eval_wer": 0.3284973760652212,
      "step": 17100
    },
    {
      "epoch": 3.329461866047232,
      "eval_loss": 0.4491961896419525,
      "eval_runtime": 163.5698,
      "eval_samples_per_second": 34.579,
      "eval_steps_per_second": 4.322,
      "eval_wer": 0.33032690857152025,
      "step": 17200
    },
    {
      "epoch": 3.3488192024777392,
      "eval_loss": 0.4268127977848053,
      "eval_runtime": 164.9468,
      "eval_samples_per_second": 34.29,
      "eval_steps_per_second": 4.286,
      "eval_wer": 0.3284652790037072,
      "step": 17300
    },
    {
      "epoch": 3.368176538908246,
      "eval_loss": 0.4377237558364868,
      "eval_runtime": 164.0847,
      "eval_samples_per_second": 34.47,
      "eval_steps_per_second": 4.309,
      "eval_wer": 0.3269888141740624,
      "step": 17400
    },
    {
      "epoch": 3.3875338753387534,
      "grad_norm": 0.5330023765563965,
      "learning_rate": 0.00012726101694915254,
      "loss": 0.2963,
      "step": 17500
    },
    {
      "epoch": 3.3875338753387534,
      "eval_loss": 0.42494186758995056,
      "eval_runtime": 163.0698,
      "eval_samples_per_second": 34.685,
      "eval_steps_per_second": 4.336,
      "eval_wer": 0.3322527322623614,
      "step": 17500
    },
    {
      "epoch": 3.4068912117692607,
      "eval_loss": 0.4404699206352234,
      "eval_runtime": 164.4408,
      "eval_samples_per_second": 34.395,
      "eval_steps_per_second": 4.299,
      "eval_wer": 0.3338736338688193,
      "step": 17600
    },
    {
      "epoch": 3.4262485481997675,
      "eval_loss": 0.43636277318000793,
      "eval_runtime": 163.9679,
      "eval_samples_per_second": 34.495,
      "eval_steps_per_second": 4.312,
      "eval_wer": 0.3285615701882493,
      "step": 17700
    },
    {
      "epoch": 3.445605884630275,
      "eval_loss": 0.4350505769252777,
      "eval_runtime": 163.6477,
      "eval_samples_per_second": 34.562,
      "eval_steps_per_second": 4.32,
      "eval_wer": 0.3309207042095296,
      "step": 17800
    },
    {
      "epoch": 3.464963221060782,
      "eval_loss": 0.42997920513153076,
      "eval_runtime": 163.7592,
      "eval_samples_per_second": 34.539,
      "eval_steps_per_second": 4.317,
      "eval_wer": 0.322880390300268,
      "step": 17900
    },
    {
      "epoch": 3.484320557491289,
      "grad_norm": 0.31616127490997314,
      "learning_rate": 0.00012217627118644067,
      "loss": 0.3062,
      "step": 18000
    },
    {
      "epoch": 3.484320557491289,
      "eval_loss": 0.42307358980178833,
      "eval_runtime": 164.6469,
      "eval_samples_per_second": 34.352,
      "eval_steps_per_second": 4.294,
      "eval_wer": 0.32523952432154835,
      "step": 18000
    },
    {
      "epoch": 3.5036778939217963,
      "eval_loss": 0.4325993061065674,
      "eval_runtime": 164.1143,
      "eval_samples_per_second": 34.464,
      "eval_steps_per_second": 4.308,
      "eval_wer": 0.32326555503843624,
      "step": 18100
    },
    {
      "epoch": 3.5230352303523036,
      "eval_loss": 0.43141353130340576,
      "eval_runtime": 163.522,
      "eval_samples_per_second": 34.589,
      "eval_steps_per_second": 4.324,
      "eval_wer": 0.3282405995731091,
      "step": 18200
    },
    {
      "epoch": 3.5423925667828104,
      "eval_loss": 0.4343957006931305,
      "eval_runtime": 163.8089,
      "eval_samples_per_second": 34.528,
      "eval_steps_per_second": 4.316,
      "eval_wer": 0.32894673492641746,
      "step": 18300
    },
    {
      "epoch": 3.5617499032133177,
      "eval_loss": 0.42664915323257446,
      "eval_runtime": 166.5849,
      "eval_samples_per_second": 33.953,
      "eval_steps_per_second": 4.244,
      "eval_wer": 0.32207796376241754,
      "step": 18400
    },
    {
      "epoch": 3.581107239643825,
      "grad_norm": 0.40817028284072876,
      "learning_rate": 0.00011710169491525424,
      "loss": 0.2968,
      "step": 18500
    },
    {
      "epoch": 3.581107239643825,
      "eval_loss": 0.4305819571018219,
      "eval_runtime": 164.3676,
      "eval_samples_per_second": 34.411,
      "eval_steps_per_second": 4.301,
      "eval_wer": 0.32161255637046426,
      "step": 18500
    },
    {
      "epoch": 3.600464576074332,
      "eval_loss": 0.4318545460700989,
      "eval_runtime": 166.4377,
      "eval_samples_per_second": 33.983,
      "eval_steps_per_second": 4.248,
      "eval_wer": 0.3238914477379596,
      "step": 18600
    },
    {
      "epoch": 3.619821912504839,
      "eval_loss": 0.4271145164966583,
      "eval_runtime": 166.5812,
      "eval_samples_per_second": 33.953,
      "eval_steps_per_second": 4.244,
      "eval_wer": 0.3232013609154082,
      "step": 18700
    },
    {
      "epoch": 3.6391792489353465,
      "eval_loss": 0.41837719082832336,
      "eval_runtime": 164.5624,
      "eval_samples_per_second": 34.37,
      "eval_steps_per_second": 4.296,
      "eval_wer": 0.32641106706681006,
      "step": 18800
    },
    {
      "epoch": 3.658536585365854,
      "eval_loss": 0.4237981140613556,
      "eval_runtime": 165.5252,
      "eval_samples_per_second": 34.17,
      "eval_steps_per_second": 4.271,
      "eval_wer": 0.31997560623324933,
      "step": 18900
    },
    {
      "epoch": 3.6778939217963607,
      "grad_norm": 0.9548519253730774,
      "learning_rate": 0.00011201694915254236,
      "loss": 0.3191,
      "step": 19000
    },
    {
      "epoch": 3.6778939217963607,
      "eval_loss": 0.41389960050582886,
      "eval_runtime": 163.7093,
      "eval_samples_per_second": 34.549,
      "eval_steps_per_second": 4.319,
      "eval_wer": 0.3225915167466418,
      "step": 19000
    },
    {
      "epoch": 3.697251258226868,
      "eval_loss": 0.42384064197540283,
      "eval_runtime": 164.2841,
      "eval_samples_per_second": 34.428,
      "eval_steps_per_second": 4.304,
      "eval_wer": 0.3159955706055111,
      "step": 19100
    },
    {
      "epoch": 3.7166085946573753,
      "eval_loss": 0.4176156520843506,
      "eval_runtime": 163.8287,
      "eval_samples_per_second": 34.524,
      "eval_steps_per_second": 4.315,
      "eval_wer": 0.319301567941455,
      "step": 19200
    },
    {
      "epoch": 3.7359659310878826,
      "eval_loss": 0.4196203351020813,
      "eval_runtime": 165.0023,
      "eval_samples_per_second": 34.278,
      "eval_steps_per_second": 4.285,
      "eval_wer": 0.3202644797868755,
      "step": 19300
    },
    {
      "epoch": 3.7553232675183894,
      "eval_loss": 0.409524530172348,
      "eval_runtime": 164.4937,
      "eval_samples_per_second": 34.384,
      "eval_steps_per_second": 4.298,
      "eval_wer": 0.3181621222577073,
      "step": 19400
    },
    {
      "epoch": 3.7746806039488967,
      "grad_norm": 0.43373510241508484,
      "learning_rate": 0.00010693220338983049,
      "loss": 0.2921,
      "step": 19500
    },
    {
      "epoch": 3.7746806039488967,
      "eval_loss": 0.41209807991981506,
      "eval_runtime": 164.8329,
      "eval_samples_per_second": 34.314,
      "eval_steps_per_second": 4.289,
      "eval_wer": 0.31665356036654846,
      "step": 19500
    },
    {
      "epoch": 3.794037940379404,
      "eval_loss": 0.4112759530544281,
      "eval_runtime": 164.1863,
      "eval_samples_per_second": 34.449,
      "eval_steps_per_second": 4.306,
      "eval_wer": 0.31455120283738025,
      "step": 19600
    },
    {
      "epoch": 3.813395276809911,
      "eval_loss": 0.4094259738922119,
      "eval_runtime": 164.4841,
      "eval_samples_per_second": 34.386,
      "eval_steps_per_second": 4.298,
      "eval_wer": 0.3160758132592961,
      "step": 19700
    },
    {
      "epoch": 3.832752613240418,
      "eval_loss": 0.40931811928749084,
      "eval_runtime": 164.2911,
      "eval_samples_per_second": 34.427,
      "eval_steps_per_second": 4.303,
      "eval_wer": 0.31386111601482886,
      "step": 19800
    },
    {
      "epoch": 3.8521099496709255,
      "eval_loss": 0.41117748618125916,
      "eval_runtime": 165.1732,
      "eval_samples_per_second": 34.243,
      "eval_steps_per_second": 4.28,
      "eval_wer": 0.31731155012758583,
      "step": 19900
    },
    {
      "epoch": 3.8714672861014323,
      "grad_norm": 0.5022397637367249,
      "learning_rate": 0.00010184745762711863,
      "loss": 0.3007,
      "step": 20000
    },
    {
      "epoch": 3.8714672861014323,
      "eval_loss": 0.4092504680156708,
      "eval_runtime": 163.9434,
      "eval_samples_per_second": 34.5,
      "eval_steps_per_second": 4.312,
      "eval_wer": 0.31593137648248304,
      "step": 20000
    },
    {
      "epoch": 3.8908246225319396,
      "eval_loss": 0.4147598147392273,
      "eval_runtime": 164.6303,
      "eval_samples_per_second": 34.356,
      "eval_steps_per_second": 4.294,
      "eval_wer": 0.31565855145961386,
      "step": 20100
    },
    {
      "epoch": 3.910181958962447,
      "eval_loss": 0.41137251257896423,
      "eval_runtime": 164.6634,
      "eval_samples_per_second": 34.349,
      "eval_steps_per_second": 4.294,
      "eval_wer": 0.3150326587600905,
      "step": 20200
    },
    {
      "epoch": 3.9295392953929538,
      "eval_loss": 0.4155375361442566,
      "eval_runtime": 164.3406,
      "eval_samples_per_second": 34.416,
      "eval_steps_per_second": 4.302,
      "eval_wer": 0.31456725136813724,
      "step": 20300
    },
    {
      "epoch": 3.948896631823461,
      "eval_loss": 0.4075925648212433,
      "eval_runtime": 164.3692,
      "eval_samples_per_second": 34.41,
      "eval_steps_per_second": 4.301,
      "eval_wer": 0.3135722424612027,
      "step": 20400
    },
    {
      "epoch": 3.9682539682539684,
      "grad_norm": 0.6109060049057007,
      "learning_rate": 9.67728813559322e-05,
      "loss": 0.296,
      "step": 20500
    },
    {
      "epoch": 3.9682539682539684,
      "eval_loss": 0.4066578149795532,
      "eval_runtime": 164.7852,
      "eval_samples_per_second": 34.323,
      "eval_steps_per_second": 4.29,
      "eval_wer": 0.3125611850235111,
      "step": 20500
    },
    {
      "epoch": 3.987611304684475,
      "eval_loss": 0.40839362144470215,
      "eval_runtime": 164.8883,
      "eval_samples_per_second": 34.302,
      "eval_steps_per_second": 4.288,
      "eval_wer": 0.3150487072908475,
      "step": 20600
    },
    {
      "epoch": 4.006968641114983,
      "eval_loss": 0.4150494635105133,
      "eval_runtime": 164.1525,
      "eval_samples_per_second": 34.456,
      "eval_steps_per_second": 4.307,
      "eval_wer": 0.312432796777455,
      "step": 20700
    },
    {
      "epoch": 4.02632597754549,
      "eval_loss": 0.41322341561317444,
      "eval_runtime": 164.6726,
      "eval_samples_per_second": 34.347,
      "eval_steps_per_second": 4.293,
      "eval_wer": 0.3132512718460625,
      "step": 20800
    },
    {
      "epoch": 4.045683313975997,
      "eval_loss": 0.4182606339454651,
      "eval_runtime": 164.9667,
      "eval_samples_per_second": 34.286,
      "eval_steps_per_second": 4.286,
      "eval_wer": 0.31464749402192227,
      "step": 20900
    },
    {
      "epoch": 4.065040650406504,
      "grad_norm": 0.9771650433540344,
      "learning_rate": 9.168813559322032e-05,
      "loss": 0.2611,
      "step": 21000
    },
    {
      "epoch": 4.065040650406504,
      "eval_loss": 0.41840454936027527,
      "eval_runtime": 164.8893,
      "eval_samples_per_second": 34.302,
      "eval_steps_per_second": 4.288,
      "eval_wer": 0.30952801271043634,
      "step": 21000
    },
    {
      "epoch": 4.084397986837011,
      "eval_loss": 0.4167742431163788,
      "eval_runtime": 165.1089,
      "eval_samples_per_second": 34.256,
      "eval_steps_per_second": 4.282,
      "eval_wer": 0.30845276114971676,
      "step": 21100
    },
    {
      "epoch": 4.103755323267518,
      "eval_loss": 0.42244288325309753,
      "eval_runtime": 164.9167,
      "eval_samples_per_second": 34.296,
      "eval_steps_per_second": 4.287,
      "eval_wer": 0.31015390540995974,
      "step": 21200
    },
    {
      "epoch": 4.123112659698026,
      "eval_loss": 0.4187394678592682,
      "eval_runtime": 164.7166,
      "eval_samples_per_second": 34.338,
      "eval_steps_per_second": 4.292,
      "eval_wer": 0.30456901670652053,
      "step": 21300
    },
    {
      "epoch": 4.142469996128533,
      "eval_loss": 0.41454723477363586,
      "eval_runtime": 164.38,
      "eval_samples_per_second": 34.408,
      "eval_steps_per_second": 4.301,
      "eval_wer": 0.3110044775400812,
      "step": 21400
    },
    {
      "epoch": 4.16182733255904,
      "grad_norm": 0.8976078629493713,
      "learning_rate": 8.660338983050847e-05,
      "loss": 0.2431,
      "step": 21500
    },
    {
      "epoch": 4.16182733255904,
      "eval_loss": 0.42720434069633484,
      "eval_runtime": 165.0533,
      "eval_samples_per_second": 34.268,
      "eval_steps_per_second": 4.283,
      "eval_wer": 0.31071560398645504,
      "step": 21500
    },
    {
      "epoch": 4.181184668989547,
      "eval_loss": 0.41736435890197754,
      "eval_runtime": 164.6627,
      "eval_samples_per_second": 34.349,
      "eval_steps_per_second": 4.294,
      "eval_wer": 0.3069923448508289,
      "step": 21600
    },
    {
      "epoch": 4.200542005420054,
      "eval_loss": 0.41904589533805847,
      "eval_runtime": 165.6169,
      "eval_samples_per_second": 34.151,
      "eval_steps_per_second": 4.269,
      "eval_wer": 0.3085811493957728,
      "step": 21700
    },
    {
      "epoch": 4.219899341850561,
      "eval_loss": 0.41643446683883667,
      "eval_runtime": 165.1417,
      "eval_samples_per_second": 34.249,
      "eval_steps_per_second": 4.281,
      "eval_wer": 0.3050825696907448,
      "step": 21800
    },
    {
      "epoch": 4.239256678281069,
      "eval_loss": 0.41955476999282837,
      "eval_runtime": 165.2591,
      "eval_samples_per_second": 34.225,
      "eval_steps_per_second": 4.278,
      "eval_wer": 0.30777872285792235,
      "step": 21900
    },
    {
      "epoch": 4.258614014711576,
      "grad_norm": 1.5854851007461548,
      "learning_rate": 8.15186440677966e-05,
      "loss": 0.2453,
      "step": 22000
    },
    {
      "epoch": 4.258614014711576,
      "eval_loss": 0.42485129833221436,
      "eval_runtime": 164.7312,
      "eval_samples_per_second": 34.335,
      "eval_steps_per_second": 4.292,
      "eval_wer": 0.30915889650302514,
      "step": 22000
    },
    {
      "epoch": 4.2779713511420825,
      "eval_loss": 0.4246067404747009,
      "eval_runtime": 164.9099,
      "eval_samples_per_second": 34.298,
      "eval_steps_per_second": 4.287,
      "eval_wer": 0.30736146105824014,
      "step": 22100
    },
    {
      "epoch": 4.29732868757259,
      "eval_loss": 0.4166228771209717,
      "eval_runtime": 164.9564,
      "eval_samples_per_second": 34.288,
      "eval_steps_per_second": 4.286,
      "eval_wer": 0.30740960665051115,
      "step": 22200
    },
    {
      "epoch": 4.316686024003097,
      "eval_loss": 0.4192067086696625,
      "eval_runtime": 165.6591,
      "eval_samples_per_second": 34.142,
      "eval_steps_per_second": 4.268,
      "eval_wer": 0.3027555327309785,
      "step": 22300
    },
    {
      "epoch": 4.336043360433604,
      "eval_loss": 0.41863906383514404,
      "eval_runtime": 164.9558,
      "eval_samples_per_second": 34.288,
      "eval_steps_per_second": 4.286,
      "eval_wer": 0.3020975429699411,
      "step": 22400
    },
    {
      "epoch": 4.355400696864112,
      "grad_norm": 1.1900339126586914,
      "learning_rate": 7.645423728813559e-05,
      "loss": 0.2336,
      "step": 22500
    },
    {
      "epoch": 4.355400696864112,
      "eval_loss": 0.4268459677696228,
      "eval_runtime": 166.7137,
      "eval_samples_per_second": 33.926,
      "eval_steps_per_second": 4.241,
      "eval_wer": 0.3083885670266887,
      "step": 22500
    },
    {
      "epoch": 4.3747580332946185,
      "eval_loss": 0.4346672296524048,
      "eval_runtime": 170.3751,
      "eval_samples_per_second": 33.197,
      "eval_steps_per_second": 4.15,
      "eval_wer": 0.307104684566128,
      "step": 22600
    },
    {
      "epoch": 4.394115369725126,
      "eval_loss": 0.47525468468666077,
      "eval_runtime": 164.9807,
      "eval_samples_per_second": 34.283,
      "eval_steps_per_second": 4.285,
      "eval_wer": 0.3208582754248849,
      "step": 22700
    },
    {
      "epoch": 4.413472706155633,
      "eval_loss": 0.582381546497345,
      "eval_runtime": 165.1397,
      "eval_samples_per_second": 34.25,
      "eval_steps_per_second": 4.281,
      "eval_wer": 0.415416218645183,
      "step": 22800
    },
    {
      "epoch": 4.43283004258614,
      "eval_loss": 0.5073803067207336,
      "eval_runtime": 165.3352,
      "eval_samples_per_second": 34.209,
      "eval_steps_per_second": 4.276,
      "eval_wer": 0.3415448315706697,
      "step": 22900
    },
    {
      "epoch": 4.452187379016648,
      "grad_norm": 1.5807456970214844,
      "learning_rate": 7.136949152542373e-05,
      "loss": 0.3426,
      "step": 23000
    },
    {
      "epoch": 4.452187379016648,
      "eval_loss": 0.6242379546165466,
      "eval_runtime": 164.8642,
      "eval_samples_per_second": 34.307,
      "eval_steps_per_second": 4.288,
      "eval_wer": 0.41979746754184655,
      "step": 23000
    },
    {
      "epoch": 4.471544715447155,
      "eval_loss": 0.5862211585044861,
      "eval_runtime": 164.8283,
      "eval_samples_per_second": 34.314,
      "eval_steps_per_second": 4.289,
      "eval_wer": 0.4200702925647157,
      "step": 23100
    },
    {
      "epoch": 4.4909020518776614,
      "eval_loss": 0.6151086091995239,
      "eval_runtime": 165.0995,
      "eval_samples_per_second": 34.258,
      "eval_steps_per_second": 4.282,
      "eval_wer": 0.39638266116737014,
      "step": 23200
    },
    {
      "epoch": 4.510259388308169,
      "eval_loss": 0.5640283226966858,
      "eval_runtime": 164.849,
      "eval_samples_per_second": 34.31,
      "eval_steps_per_second": 4.289,
      "eval_wer": 0.3685705573654732,
      "step": 23300
    },
    {
      "epoch": 4.529616724738676,
      "eval_loss": 0.6589744091033936,
      "eval_runtime": 164.8194,
      "eval_samples_per_second": 34.316,
      "eval_steps_per_second": 4.29,
      "eval_wer": 0.4647494021922293,
      "step": 23400
    },
    {
      "epoch": 4.548974061169183,
      "grad_norm": 1.0218427181243896,
      "learning_rate": 6.628474576271186e-05,
      "loss": 0.4541,
      "step": 23500
    },
    {
      "epoch": 4.548974061169183,
      "eval_loss": 0.6010532975196838,
      "eval_runtime": 165.0253,
      "eval_samples_per_second": 34.274,
      "eval_steps_per_second": 4.284,
      "eval_wer": 0.3959974964292019,
      "step": 23500
    },
    {
      "epoch": 4.568331397599691,
      "eval_loss": 0.5802894830703735,
      "eval_runtime": 166.0838,
      "eval_samples_per_second": 34.055,
      "eval_steps_per_second": 4.257,
      "eval_wer": 0.39505063311453836,
      "step": 23600
    },
    {
      "epoch": 4.5876887340301975,
      "eval_loss": 0.5762883424758911,
      "eval_runtime": 165.1308,
      "eval_samples_per_second": 34.252,
      "eval_steps_per_second": 4.281,
      "eval_wer": 0.3910545489560431,
      "step": 23700
    },
    {
      "epoch": 4.607046070460704,
      "eval_loss": 0.5418487787246704,
      "eval_runtime": 165.1407,
      "eval_samples_per_second": 34.25,
      "eval_steps_per_second": 4.281,
      "eval_wer": 0.36550528799088444,
      "step": 23800
    },
    {
      "epoch": 4.626403406891212,
      "eval_loss": 0.5546759366989136,
      "eval_runtime": 165.8678,
      "eval_samples_per_second": 34.099,
      "eval_steps_per_second": 4.262,
      "eval_wer": 0.38877565758854776,
      "step": 23900
    },
    {
      "epoch": 4.645760743321719,
      "grad_norm": 32.50680923461914,
      "learning_rate": 6.12e-05,
      "loss": 0.4145,
      "step": 24000
    },
    {
      "epoch": 4.645760743321719,
      "eval_loss": 0.5300523638725281,
      "eval_runtime": 164.9724,
      "eval_samples_per_second": 34.285,
      "eval_steps_per_second": 4.286,
      "eval_wer": 0.3608030684790807,
      "step": 24000
    },
    {
      "epoch": 4.665118079752226,
      "eval_loss": 0.573882520198822,
      "eval_runtime": 165.2226,
      "eval_samples_per_second": 34.233,
      "eval_steps_per_second": 4.279,
      "eval_wer": 0.39927139670363176,
      "step": 24100
    },
    {
      "epoch": 4.6844754161827336,
      "eval_loss": 0.5775899887084961,
      "eval_runtime": 165.3691,
      "eval_samples_per_second": 34.202,
      "eval_steps_per_second": 4.275,
      "eval_wer": 0.39816404808139816,
      "step": 24200
    },
    {
      "epoch": 4.70383275261324,
      "eval_loss": 0.5412492156028748,
      "eval_runtime": 164.9818,
      "eval_samples_per_second": 34.283,
      "eval_steps_per_second": 4.285,
      "eval_wer": 0.37078525460994044,
      "step": 24300
    },
    {
      "epoch": 4.723190089043747,
      "eval_loss": 0.5329325199127197,
      "eval_runtime": 165.8065,
      "eval_samples_per_second": 34.112,
      "eval_steps_per_second": 4.264,
      "eval_wer": 0.37044823546404326,
      "step": 24400
    },
    {
      "epoch": 4.742547425474255,
      "grad_norm": 1.8765805959701538,
      "learning_rate": 5.611525423728813e-05,
      "loss": 0.3834,
      "step": 24500
    },
    {
      "epoch": 4.742547425474255,
      "eval_loss": 0.5299070477485657,
      "eval_runtime": 165.3917,
      "eval_samples_per_second": 34.198,
      "eval_steps_per_second": 4.275,
      "eval_wer": 0.3732246312850059,
      "step": 24500
    },
    {
      "epoch": 4.761904761904762,
      "eval_loss": 0.5424681901931763,
      "eval_runtime": 165.4071,
      "eval_samples_per_second": 34.194,
      "eval_steps_per_second": 4.274,
      "eval_wer": 0.3928519844008281,
      "step": 24600
    },
    {
      "epoch": 4.781262098335269,
      "eval_loss": 0.5111268758773804,
      "eval_runtime": 165.4914,
      "eval_samples_per_second": 34.177,
      "eval_steps_per_second": 4.272,
      "eval_wer": 0.3585241771115854,
      "step": 24700
    },
    {
      "epoch": 4.8006194347657765,
      "eval_loss": 0.5076457858085632,
      "eval_runtime": 165.6732,
      "eval_samples_per_second": 34.14,
      "eval_steps_per_second": 4.267,
      "eval_wer": 0.35033942642551075,
      "step": 24800
    },
    {
      "epoch": 4.819976771196283,
      "eval_loss": 0.5261921882629395,
      "eval_runtime": 165.2946,
      "eval_samples_per_second": 34.218,
      "eval_steps_per_second": 4.277,
      "eval_wer": 0.3681372470350339,
      "step": 24900
    },
    {
      "epoch": 4.83933410762679,
      "grad_norm": 5.934371471405029,
      "learning_rate": 5.1030508474576264e-05,
      "loss": 0.3719,
      "step": 25000
    },
    {
      "epoch": 4.83933410762679,
      "eval_loss": 0.547415018081665,
      "eval_runtime": 165.6997,
      "eval_samples_per_second": 34.134,
      "eval_steps_per_second": 4.267,
      "eval_wer": 0.3833031086004076,
      "step": 25000
    },
    {
      "epoch": 4.858691444057298,
      "eval_loss": 0.5746738910675049,
      "eval_runtime": 165.8407,
      "eval_samples_per_second": 34.105,
      "eval_steps_per_second": 4.263,
      "eval_wer": 0.40389337356165045,
      "step": 25100
    },
    {
      "epoch": 4.878048780487805,
      "eval_loss": 0.5188133120536804,
      "eval_runtime": 165.5746,
      "eval_samples_per_second": 34.16,
      "eval_steps_per_second": 4.27,
      "eval_wer": 0.3503073293639967,
      "step": 25200
    },
    {
      "epoch": 4.897406116918312,
      "eval_loss": 0.5522667169570923,
      "eval_runtime": 165.1011,
      "eval_samples_per_second": 34.258,
      "eval_steps_per_second": 4.282,
      "eval_wer": 0.3865609603440805,
      "step": 25300
    },
    {
      "epoch": 4.916763453348819,
      "eval_loss": 0.5302358865737915,
      "eval_runtime": 165.871,
      "eval_samples_per_second": 34.099,
      "eval_steps_per_second": 4.262,
      "eval_wer": 0.36446213349167883,
      "step": 25400
    },
    {
      "epoch": 4.936120789779326,
      "grad_norm": 1.1752023696899414,
      "learning_rate": 4.595593220338983e-05,
      "loss": 0.3798,
      "step": 25500
    },
    {
      "epoch": 4.936120789779326,
      "eval_loss": 0.5099266767501831,
      "eval_runtime": 165.9652,
      "eval_samples_per_second": 34.079,
      "eval_steps_per_second": 4.26,
      "eval_wer": 0.3499542616873425,
      "step": 25500
    },
    {
      "epoch": 4.955478126209833,
      "eval_loss": 0.4823363125324249,
      "eval_runtime": 164.8602,
      "eval_samples_per_second": 34.308,
      "eval_steps_per_second": 4.288,
      "eval_wer": 0.33761294153520244,
      "step": 25600
    },
    {
      "epoch": 4.974835462640341,
      "eval_loss": 0.4805842936038971,
      "eval_runtime": 166.8028,
      "eval_samples_per_second": 33.908,
      "eval_steps_per_second": 4.239,
      "eval_wer": 0.3357352634366324,
      "step": 25700
    },
    {
      "epoch": 4.994192799070848,
      "eval_loss": 0.4942820370197296,
      "eval_runtime": 165.4552,
      "eval_samples_per_second": 34.184,
      "eval_steps_per_second": 4.273,
      "eval_wer": 0.35093322206352007,
      "step": 25800
    },
    {
      "epoch": 5.013550135501355,
      "eval_loss": 0.49528568983078003,
      "eval_runtime": 165.947,
      "eval_samples_per_second": 34.083,
      "eval_steps_per_second": 4.26,
      "eval_wer": 0.35245783248543594,
      "step": 25900
    },
    {
      "epoch": 5.032907471931862,
      "grad_norm": 27.542322158813477,
      "learning_rate": 4.087118644067796e-05,
      "loss": 0.3158,
      "step": 26000
    },
    {
      "epoch": 5.032907471931862,
      "eval_loss": 0.485315203666687,
      "eval_runtime": 165.2844,
      "eval_samples_per_second": 34.22,
      "eval_steps_per_second": 4.277,
      "eval_wer": 0.34703342908956686,
      "step": 26000
    },
    {
      "epoch": 5.052264808362369,
      "eval_loss": 0.5204781293869019,
      "eval_runtime": 165.773,
      "eval_samples_per_second": 34.119,
      "eval_steps_per_second": 4.265,
      "eval_wer": 0.36183017444752935,
      "step": 26100
    },
    {
      "epoch": 5.071622144792877,
      "eval_loss": 0.5013459920883179,
      "eval_runtime": 165.057,
      "eval_samples_per_second": 34.267,
      "eval_steps_per_second": 4.283,
      "eval_wer": 0.3510455617788191,
      "step": 26200
    },
    {
      "epoch": 5.090979481223384,
      "eval_loss": 0.4863474667072296,
      "eval_runtime": 165.6964,
      "eval_samples_per_second": 34.135,
      "eval_steps_per_second": 4.267,
      "eval_wer": 0.3396511049413426,
      "step": 26300
    },
    {
      "epoch": 5.110336817653891,
      "eval_loss": 0.47152572870254517,
      "eval_runtime": 166.0563,
      "eval_samples_per_second": 34.061,
      "eval_steps_per_second": 4.258,
      "eval_wer": 0.32851342459597827,
      "step": 26400
    },
    {
      "epoch": 5.129694154084398,
      "grad_norm": 0.8464019894599915,
      "learning_rate": 3.5786440677966095e-05,
      "loss": 0.2993,
      "step": 26500
    },
    {
      "epoch": 5.129694154084398,
      "eval_loss": 0.4816218912601471,
      "eval_runtime": 165.4176,
      "eval_samples_per_second": 34.192,
      "eval_steps_per_second": 4.274,
      "eval_wer": 0.33273418818507167,
      "step": 26500
    },
    {
      "epoch": 5.149051490514905,
      "eval_loss": 0.48058804869651794,
      "eval_runtime": 166.4075,
      "eval_samples_per_second": 33.989,
      "eval_steps_per_second": 4.249,
      "eval_wer": 0.33811044598866974,
      "step": 26600
    },
    {
      "epoch": 5.168408826945412,
      "eval_loss": 0.4854019284248352,
      "eval_runtime": 165.1934,
      "eval_samples_per_second": 34.239,
      "eval_steps_per_second": 4.28,
      "eval_wer": 0.33416250742244547,
      "step": 26700
    },
    {
      "epoch": 5.18776616337592,
      "eval_loss": 0.49545472860336304,
      "eval_runtime": 165.6735,
      "eval_samples_per_second": 34.139,
      "eval_steps_per_second": 4.267,
      "eval_wer": 0.3433422670154547,
      "step": 26800
    },
    {
      "epoch": 5.207123499806427,
      "eval_loss": 0.4862872064113617,
      "eval_runtime": 165.5277,
      "eval_samples_per_second": 34.17,
      "eval_steps_per_second": 4.271,
      "eval_wer": 0.34337436407696875,
      "step": 26900
    },
    {
      "epoch": 5.2264808362369335,
      "grad_norm": 10.611580848693848,
      "learning_rate": 3.0701694915254236e-05,
      "loss": 0.2902,
      "step": 27000
    },
    {
      "epoch": 5.2264808362369335,
      "eval_loss": 0.48670876026153564,
      "eval_runtime": 165.4986,
      "eval_samples_per_second": 34.176,
      "eval_steps_per_second": 4.272,
      "eval_wer": 0.3448508289066136,
      "step": 27000
    },
    {
      "epoch": 5.245838172667441,
      "eval_loss": 0.4787338674068451,
      "eval_runtime": 165.461,
      "eval_samples_per_second": 34.183,
      "eval_steps_per_second": 4.273,
      "eval_wer": 0.33778947537352955,
      "step": 27100
    },
    {
      "epoch": 5.265195509097948,
      "eval_loss": 0.4861724376678467,
      "eval_runtime": 165.3459,
      "eval_samples_per_second": 34.207,
      "eval_steps_per_second": 4.276,
      "eval_wer": 0.33793391215034263,
      "step": 27200
    },
    {
      "epoch": 5.284552845528455,
      "eval_loss": 0.4954308271408081,
      "eval_runtime": 165.6637,
      "eval_samples_per_second": 34.141,
      "eval_steps_per_second": 4.268,
      "eval_wer": 0.3467927011282117,
      "step": 27300
    },
    {
      "epoch": 5.303910181958963,
      "eval_loss": 0.572640061378479,
      "eval_runtime": 165.6804,
      "eval_samples_per_second": 34.138,
      "eval_steps_per_second": 4.267,
      "eval_wer": 0.41416443324613633,
      "step": 27400
    },
    {
      "epoch": 5.3232675183894695,
      "grad_norm": 1.2211335897445679,
      "learning_rate": 2.5627118644067793e-05,
      "loss": 0.305,
      "step": 27500
    },
    {
      "epoch": 5.3232675183894695,
      "eval_loss": 0.5179979205131531,
      "eval_runtime": 165.6208,
      "eval_samples_per_second": 34.15,
      "eval_steps_per_second": 4.269,
      "eval_wer": 0.35735263436632375,
      "step": 27500
    },
    {
      "epoch": 5.342624854819976,
      "eval_loss": 0.4996646046638489,
      "eval_runtime": 164.9613,
      "eval_samples_per_second": 34.287,
      "eval_steps_per_second": 4.286,
      "eval_wer": 0.3452038965832678,
      "step": 27600
    },
    {
      "epoch": 5.361982191250484,
      "eval_loss": 0.4949517846107483,
      "eval_runtime": 165.643,
      "eval_samples_per_second": 34.146,
      "eval_steps_per_second": 4.268,
      "eval_wer": 0.34130410360931457,
      "step": 27700
    },
    {
      "epoch": 5.381339527680991,
      "eval_loss": 0.5071349143981934,
      "eval_runtime": 166.3001,
      "eval_samples_per_second": 34.011,
      "eval_steps_per_second": 4.251,
      "eval_wer": 0.3491999807417631,
      "step": 27800
    },
    {
      "epoch": 5.400696864111498,
      "eval_loss": 0.5095939040184021,
      "eval_runtime": 165.4785,
      "eval_samples_per_second": 34.18,
      "eval_steps_per_second": 4.272,
      "eval_wer": 0.3544799473608191,
      "step": 27900
    },
    {
      "epoch": 5.420054200542006,
      "grad_norm": 15.024033546447754,
      "learning_rate": 2.054237288135593e-05,
      "loss": 0.3163,
      "step": 28000
    },
    {
      "epoch": 5.420054200542006,
      "eval_loss": 0.5129156112670898,
      "eval_runtime": 166.1505,
      "eval_samples_per_second": 34.041,
      "eval_steps_per_second": 4.255,
      "eval_wer": 0.3565983534207443,
      "step": 28000
    },
    {
      "epoch": 5.4394115369725125,
      "eval_loss": 0.5067318677902222,
      "eval_runtime": 165.9899,
      "eval_samples_per_second": 34.074,
      "eval_steps_per_second": 4.259,
      "eval_wer": 0.3506122514483799,
      "step": 28100
    },
    {
      "epoch": 5.45876887340302,
      "eval_loss": 0.5053198337554932,
      "eval_runtime": 165.3351,
      "eval_samples_per_second": 34.209,
      "eval_steps_per_second": 4.276,
      "eval_wer": 0.35000240727961357,
      "step": 28200
    },
    {
      "epoch": 5.478126209833527,
      "eval_loss": 0.5077947974205017,
      "eval_runtime": 165.3012,
      "eval_samples_per_second": 34.216,
      "eval_steps_per_second": 4.277,
      "eval_wer": 0.3518640368474266,
      "step": 28300
    },
    {
      "epoch": 5.497483546264034,
      "eval_loss": 0.48453789949417114,
      "eval_runtime": 165.2767,
      "eval_samples_per_second": 34.221,
      "eval_steps_per_second": 4.278,
      "eval_wer": 0.3375166503506604,
      "step": 28400
    },
    {
      "epoch": 5.516840882694542,
      "grad_norm": 0.43120303750038147,
      "learning_rate": 1.5457627118644067e-05,
      "loss": 0.3136,
      "step": 28500
    },
    {
      "epoch": 5.516840882694542,
      "eval_loss": 0.4930485486984253,
      "eval_runtime": 165.9777,
      "eval_samples_per_second": 34.077,
      "eval_steps_per_second": 4.26,
      "eval_wer": 0.3439842082457351,
      "step": 28500
    },
    {
      "epoch": 5.5361982191250485,
      "eval_loss": 0.5025920271873474,
      "eval_runtime": 165.742,
      "eval_samples_per_second": 34.125,
      "eval_steps_per_second": 4.266,
      "eval_wer": 0.35122209561714623,
      "step": 28600
    },
    {
      "epoch": 5.555555555555555,
      "eval_loss": 0.5056036710739136,
      "eval_runtime": 165.717,
      "eval_samples_per_second": 34.13,
      "eval_steps_per_second": 4.266,
      "eval_wer": 0.3518800853781836,
      "step": 28700
    },
    {
      "epoch": 5.574912891986063,
      "eval_loss": 0.5090658068656921,
      "eval_runtime": 165.5604,
      "eval_samples_per_second": 34.163,
      "eval_steps_per_second": 4.27,
      "eval_wer": 0.3546404326683892,
      "step": 28800
    },
    {
      "epoch": 5.59427022841657,
      "eval_loss": 0.5027741193771362,
      "eval_runtime": 170.2845,
      "eval_samples_per_second": 33.215,
      "eval_steps_per_second": 4.152,
      "eval_wer": 0.34952095135690325,
      "step": 28900
    },
    {
      "epoch": 5.613627564847077,
      "grad_norm": 1.859834909439087,
      "learning_rate": 1.0372881355932203e-05,
      "loss": 0.3092,
      "step": 29000
    },
    {
      "epoch": 5.613627564847077,
      "eval_loss": 0.505651593208313,
      "eval_runtime": 164.9869,
      "eval_samples_per_second": 34.282,
      "eval_steps_per_second": 4.285,
      "eval_wer": 0.3509974161865481,
      "step": 29000
    },
    {
      "epoch": 5.6329849012775846,
      "eval_loss": 0.5085631608963013,
      "eval_runtime": 165.6325,
      "eval_samples_per_second": 34.148,
      "eval_steps_per_second": 4.268,
      "eval_wer": 0.3532923560848004,
      "step": 29100
    },
    {
      "epoch": 5.652342237708091,
      "eval_loss": 0.5055486559867859,
      "eval_runtime": 165.6348,
      "eval_samples_per_second": 34.147,
      "eval_steps_per_second": 4.268,
      "eval_wer": 0.35144677504774435,
      "step": 29200
    },
    {
      "epoch": 5.671699574138598,
      "eval_loss": 0.5133376717567444,
      "eval_runtime": 166.8503,
      "eval_samples_per_second": 33.899,
      "eval_steps_per_second": 4.237,
      "eval_wer": 0.35765755645070696,
      "step": 29300
    },
    {
      "epoch": 5.691056910569106,
      "eval_loss": 0.5129527449607849,
      "eval_runtime": 165.063,
      "eval_samples_per_second": 34.266,
      "eval_steps_per_second": 4.283,
      "eval_wer": 0.35703166375118356,
      "step": 29400
    },
    {
      "epoch": 5.710414246999613,
      "grad_norm": 1.5260862112045288,
      "learning_rate": 5.288135593220339e-06,
      "loss": 0.3152,
      "step": 29500
    },
    {
      "epoch": 5.710414246999613,
      "eval_loss": 0.5147610902786255,
      "eval_runtime": 165.1582,
      "eval_samples_per_second": 34.246,
      "eval_steps_per_second": 4.281,
      "eval_wer": 0.3581390123734172,
      "step": 29500
    },
    {
      "epoch": 5.72977158343012,
      "eval_loss": 0.5114809274673462,
      "eval_runtime": 165.7617,
      "eval_samples_per_second": 34.121,
      "eval_steps_per_second": 4.265,
      "eval_wer": 0.3554589077369967,
      "step": 29600
    },
    {
      "epoch": 5.7491289198606275,
      "eval_loss": 0.5053985714912415,
      "eval_runtime": 165.7121,
      "eval_samples_per_second": 34.131,
      "eval_steps_per_second": 4.266,
      "eval_wer": 0.35263436632376305,
      "step": 29700
    },
    {
      "epoch": 5.768486256291134,
      "eval_loss": 0.5080947279930115,
      "eval_runtime": 165.6502,
      "eval_samples_per_second": 34.144,
      "eval_steps_per_second": 4.268,
      "eval_wer": 0.3535651811076696,
      "step": 29800
    },
    {
      "epoch": 5.787843592721641,
      "eval_loss": 0.5076740384101868,
      "eval_runtime": 164.8589,
      "eval_samples_per_second": 34.308,
      "eval_steps_per_second": 4.289,
      "eval_wer": 0.35348493845388457,
      "step": 29900
    },
    {
      "epoch": 5.807200929152149,
      "grad_norm": 24.957311630249023,
      "learning_rate": 2.0338983050847458e-07,
      "loss": 0.3085,
      "step": 30000
    },
    {
      "epoch": 5.807200929152149,
      "eval_loss": 0.5066753029823303,
      "eval_runtime": 165.8811,
      "eval_samples_per_second": 34.097,
      "eval_steps_per_second": 4.262,
      "eval_wer": 0.35224920158559486,
      "step": 30000
    },
    {
      "epoch": 5.807200929152149,
      "step": 30000,
      "total_flos": 3.3745707679449666e+19,
      "train_loss": 0.49102539647420246,
      "train_runtime": 61359.0363,
      "train_samples_per_second": 3.911,
      "train_steps_per_second": 0.489
    }
  ],
  "logging_steps": 500,
  "max_steps": 30000,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 6,
  "save_steps": 400,
  "total_flos": 3.3745707679449666e+19,
  "train_batch_size": 8,
  "trial_name": null,
  "trial_params": null
}