{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 14.999677731227845,
  "global_step": 23265,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.06,
      "learning_rate": 4.800000000000001e-06,
      "loss": 5.4592,
      "step": 100
    },
    {
      "epoch": 0.13,
      "learning_rate": 9.800000000000001e-06,
      "loss": 2.9124,
      "step": 200
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.48e-05,
      "loss": 2.3526,
      "step": 300
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.9800000000000004e-05,
      "loss": 1.1889,
      "step": 400
    },
    {
      "epoch": 0.32,
      "learning_rate": 2.48e-05,
      "loss": 0.8361,
      "step": 500
    },
    {
      "epoch": 0.32,
      "eval_loss": 0.6304140686988831,
      "eval_runtime": 553.4275,
      "eval_samples_per_second": 9.824,
      "eval_steps_per_second": 0.614,
      "eval_wer": 0.4970241305264396,
      "step": 500
    },
    {
      "epoch": 0.39,
      "learning_rate": 2.98e-05,
      "loss": 0.6758,
      "step": 600
    },
    {
      "epoch": 0.45,
      "learning_rate": 3.48e-05,
      "loss": 0.6902,
      "step": 700
    },
    {
      "epoch": 0.52,
      "learning_rate": 3.9800000000000005e-05,
      "loss": 0.6335,
      "step": 800
    },
    {
      "epoch": 0.58,
      "learning_rate": 4.4800000000000005e-05,
      "loss": 0.5867,
      "step": 900
    },
    {
      "epoch": 0.64,
      "learning_rate": 4.9800000000000004e-05,
      "loss": 0.5703,
      "step": 1000
    },
    {
      "epoch": 0.64,
      "eval_loss": 0.3195364475250244,
      "eval_runtime": 552.5688,
      "eval_samples_per_second": 9.839,
      "eval_steps_per_second": 0.615,
      "eval_wer": 0.27750595664153277,
      "step": 1000
    },
    {
      "epoch": 0.71,
      "learning_rate": 5.4800000000000004e-05,
      "loss": 0.5762,
      "step": 1100
    },
    {
      "epoch": 0.77,
      "learning_rate": 5.9800000000000003e-05,
      "loss": 0.5656,
      "step": 1200
    },
    {
      "epoch": 0.84,
      "learning_rate": 6.48e-05,
      "loss": 0.5864,
      "step": 1300
    },
    {
      "epoch": 0.9,
      "learning_rate": 6.975e-05,
      "loss": 0.5116,
      "step": 1400
    },
    {
      "epoch": 0.97,
      "learning_rate": 7.475000000000001e-05,
      "loss": 0.5451,
      "step": 1500
    },
    {
      "epoch": 0.97,
      "eval_loss": 0.2699669599533081,
      "eval_runtime": 552.0028,
      "eval_samples_per_second": 9.85,
      "eval_steps_per_second": 0.616,
      "eval_wer": 0.2246070577622638,
      "step": 1500
    },
    {
      "epoch": 1.03,
      "learning_rate": 7.975e-05,
      "loss": 0.5134,
      "step": 1600
    },
    {
      "epoch": 1.1,
      "learning_rate": 8.475000000000001e-05,
      "loss": 0.467,
      "step": 1700
    },
    {
      "epoch": 1.16,
      "learning_rate": 8.975e-05,
      "loss": 0.4769,
      "step": 1800
    },
    {
      "epoch": 1.22,
      "learning_rate": 9.47e-05,
      "loss": 0.461,
      "step": 1900
    },
    {
      "epoch": 1.29,
      "learning_rate": 9.970000000000001e-05,
      "loss": 0.47,
      "step": 2000
    },
    {
      "epoch": 1.29,
      "eval_loss": 0.25637131929397583,
      "eval_runtime": 552.4533,
      "eval_samples_per_second": 9.842,
      "eval_steps_per_second": 0.615,
      "eval_wer": 0.23294145332248228,
      "step": 2000
    },
    {
      "epoch": 1.35,
      "learning_rate": 9.955795908770281e-05,
      "loss": 0.4506,
      "step": 2100
    },
    {
      "epoch": 1.42,
      "learning_rate": 9.908770279802493e-05,
      "loss": 0.4154,
      "step": 2200
    },
    {
      "epoch": 1.48,
      "learning_rate": 9.861744650834705e-05,
      "loss": 0.4377,
      "step": 2300
    },
    {
      "epoch": 1.55,
      "learning_rate": 9.814719021866918e-05,
      "loss": 0.4723,
      "step": 2400
    },
    {
      "epoch": 1.61,
      "learning_rate": 9.767693392899132e-05,
      "loss": 0.4063,
      "step": 2500
    },
    {
      "epoch": 1.61,
      "eval_loss": 0.2459278106689453,
      "eval_runtime": 552.824,
      "eval_samples_per_second": 9.835,
      "eval_steps_per_second": 0.615,
      "eval_wer": 0.20988949572004276,
      "step": 2500
    },
    {
      "epoch": 1.68,
      "learning_rate": 9.720667763931343e-05,
      "loss": 0.3807,
      "step": 2600
    },
    {
      "epoch": 1.74,
      "learning_rate": 9.673642134963555e-05,
      "loss": 0.4094,
      "step": 2700
    },
    {
      "epoch": 1.81,
      "learning_rate": 9.626616505995768e-05,
      "loss": 0.401,
      "step": 2800
    },
    {
      "epoch": 1.87,
      "learning_rate": 9.579590877027981e-05,
      "loss": 0.3849,
      "step": 2900
    },
    {
      "epoch": 1.93,
      "learning_rate": 9.532565248060194e-05,
      "loss": 0.374,
      "step": 3000
    },
    {
      "epoch": 1.93,
      "eval_loss": 0.21745240688323975,
      "eval_runtime": 553.0877,
      "eval_samples_per_second": 9.83,
      "eval_steps_per_second": 0.615,
      "eval_wer": 0.18940649298439996,
      "step": 3000
    },
    {
      "epoch": 2.0,
      "learning_rate": 9.485539619092406e-05,
      "loss": 0.3684,
      "step": 3100
    },
    {
      "epoch": 2.06,
      "learning_rate": 9.438513990124619e-05,
      "loss": 0.3658,
      "step": 3200
    },
    {
      "epoch": 2.13,
      "learning_rate": 9.391488361156831e-05,
      "loss": 0.3432,
      "step": 3300
    },
    {
      "epoch": 2.19,
      "learning_rate": 9.344462732189043e-05,
      "loss": 0.336,
      "step": 3400
    },
    {
      "epoch": 2.26,
      "learning_rate": 9.297437103221256e-05,
      "loss": 0.3297,
      "step": 3500
    },
    {
      "epoch": 2.26,
      "eval_loss": 0.20356999337673187,
      "eval_runtime": 553.8668,
      "eval_samples_per_second": 9.816,
      "eval_steps_per_second": 0.614,
      "eval_wer": 0.17550276015570612,
      "step": 3500
    },
    {
      "epoch": 2.32,
      "learning_rate": 9.250411474253468e-05,
      "loss": 0.3177,
      "step": 3600
    },
    {
      "epoch": 2.39,
      "learning_rate": 9.203385845285682e-05,
      "loss": 0.3111,
      "step": 3700
    },
    {
      "epoch": 2.45,
      "learning_rate": 9.156360216317894e-05,
      "loss": 0.3209,
      "step": 3800
    },
    {
      "epoch": 2.51,
      "learning_rate": 9.109334587350105e-05,
      "loss": 0.3439,
      "step": 3900
    },
    {
      "epoch": 2.58,
      "learning_rate": 9.062308958382318e-05,
      "loss": 0.3145,
      "step": 4000
    },
    {
      "epoch": 2.58,
      "eval_loss": 0.1957111805677414,
      "eval_runtime": 553.0089,
      "eval_samples_per_second": 9.832,
      "eval_steps_per_second": 0.615,
      "eval_wer": 0.1757282790943944,
      "step": 4000
    },
    {
      "epoch": 2.64,
      "learning_rate": 9.01575358570421e-05,
      "loss": 0.3077,
      "step": 4100
    },
    {
      "epoch": 2.71,
      "learning_rate": 8.968727956736421e-05,
      "loss": 0.3147,
      "step": 4200
    },
    {
      "epoch": 2.77,
      "learning_rate": 8.921702327768633e-05,
      "loss": 0.3232,
      "step": 4300
    },
    {
      "epoch": 2.84,
      "learning_rate": 8.874676698800847e-05,
      "loss": 0.3195,
      "step": 4400
    },
    {
      "epoch": 2.9,
      "learning_rate": 8.82765106983306e-05,
      "loss": 0.3989,
      "step": 4500
    },
    {
      "epoch": 2.9,
      "eval_loss": 0.19227643311023712,
      "eval_runtime": 554.5698,
      "eval_samples_per_second": 9.804,
      "eval_steps_per_second": 0.613,
      "eval_wer": 0.17229646915783384,
      "step": 4500
    },
    {
      "epoch": 2.97,
      "learning_rate": 8.780625440865272e-05,
      "loss": 0.3035,
      "step": 4600
    },
    {
      "epoch": 3.03,
      "learning_rate": 8.733599811897484e-05,
      "loss": 0.2997,
      "step": 4700
    },
    {
      "epoch": 3.09,
      "learning_rate": 8.686574182929698e-05,
      "loss": 0.2798,
      "step": 4800
    },
    {
      "epoch": 3.16,
      "learning_rate": 8.639548553961909e-05,
      "loss": 0.274,
      "step": 4900
    },
    {
      "epoch": 3.22,
      "learning_rate": 8.592522924994122e-05,
      "loss": 0.271,
      "step": 5000
    },
    {
      "epoch": 3.22,
      "eval_loss": 0.18889272212982178,
      "eval_runtime": 553.6667,
      "eval_samples_per_second": 9.82,
      "eval_steps_per_second": 0.614,
      "eval_wer": 0.16491317520860502,
      "step": 5000
    },
    {
      "epoch": 3.29,
      "learning_rate": 8.545497296026334e-05,
      "loss": 0.2726,
      "step": 5100
    },
    {
      "epoch": 3.35,
      "learning_rate": 8.498471667058548e-05,
      "loss": 0.283,
      "step": 5200
    },
    {
      "epoch": 3.42,
      "learning_rate": 8.45144603809076e-05,
      "loss": 0.2837,
      "step": 5300
    },
    {
      "epoch": 3.48,
      "learning_rate": 8.404420409122973e-05,
      "loss": 0.2915,
      "step": 5400
    },
    {
      "epoch": 3.55,
      "learning_rate": 8.357394780155185e-05,
      "loss": 0.2758,
      "step": 5500
    },
    {
      "epoch": 3.55,
      "eval_loss": 0.17681501805782318,
      "eval_runtime": 557.2307,
      "eval_samples_per_second": 9.757,
      "eval_steps_per_second": 0.61,
      "eval_wer": 0.15884377420651652,
      "step": 5500
    },
    {
      "epoch": 3.61,
      "learning_rate": 8.310369151187397e-05,
      "loss": 0.2699,
      "step": 5600
    },
    {
      "epoch": 3.67,
      "learning_rate": 8.26334352221961e-05,
      "loss": 0.2659,
      "step": 5700
    },
    {
      "epoch": 3.74,
      "learning_rate": 8.216317893251822e-05,
      "loss": 0.2759,
      "step": 5800
    },
    {
      "epoch": 3.8,
      "learning_rate": 8.169292264284035e-05,
      "loss": 0.2632,
      "step": 5900
    },
    {
      "epoch": 3.87,
      "learning_rate": 8.122736891605925e-05,
      "loss": 0.2683,
      "step": 6000
    },
    {
      "epoch": 3.87,
      "eval_loss": 0.17198732495307922,
      "eval_runtime": 555.6592,
      "eval_samples_per_second": 9.785,
      "eval_steps_per_second": 0.612,
      "eval_wer": 0.1533822938217616,
      "step": 6000
    },
    {
      "epoch": 3.93,
      "learning_rate": 8.075711262638138e-05,
      "loss": 0.2628,
      "step": 6100
    },
    {
      "epoch": 4.0,
      "learning_rate": 8.02868563367035e-05,
      "loss": 0.3404,
      "step": 6200
    },
    {
      "epoch": 4.06,
      "learning_rate": 7.981660004702564e-05,
      "loss": 0.2964,
      "step": 6300
    },
    {
      "epoch": 4.13,
      "learning_rate": 7.934634375734776e-05,
      "loss": 0.2458,
      "step": 6400
    },
    {
      "epoch": 4.19,
      "learning_rate": 7.887608746766987e-05,
      "loss": 0.2341,
      "step": 6500
    },
    {
      "epoch": 4.19,
      "eval_loss": 0.16891594231128693,
      "eval_runtime": 553.369,
      "eval_samples_per_second": 9.825,
      "eval_steps_per_second": 0.614,
      "eval_wer": 0.1470775687097375,
      "step": 6500
    },
    {
      "epoch": 4.26,
      "learning_rate": 7.840583117799201e-05,
      "loss": 0.2353,
      "step": 6600
    },
    {
      "epoch": 4.32,
      "learning_rate": 7.794027745121092e-05,
      "loss": 0.2433,
      "step": 6700
    },
    {
      "epoch": 4.38,
      "learning_rate": 7.747002116153303e-05,
      "loss": 0.2467,
      "step": 6800
    },
    {
      "epoch": 4.45,
      "learning_rate": 7.699976487185517e-05,
      "loss": 0.2423,
      "step": 6900
    },
    {
      "epoch": 4.51,
      "learning_rate": 7.652950858217729e-05,
      "loss": 0.2316,
      "step": 7000
    },
    {
      "epoch": 4.51,
      "eval_loss": 0.1705636978149414,
      "eval_runtime": 555.4457,
      "eval_samples_per_second": 9.789,
      "eval_steps_per_second": 0.612,
      "eval_wer": 0.14053751948777785,
      "step": 7000
    },
    {
      "epoch": 4.58,
      "learning_rate": 7.605925229249942e-05,
      "loss": 0.2239,
      "step": 7100
    },
    {
      "epoch": 4.64,
      "learning_rate": 7.558899600282154e-05,
      "loss": 0.2305,
      "step": 7200
    },
    {
      "epoch": 4.71,
      "learning_rate": 7.511873971314367e-05,
      "loss": 0.2291,
      "step": 7300
    },
    {
      "epoch": 4.77,
      "learning_rate": 7.464848342346579e-05,
      "loss": 0.2411,
      "step": 7400
    },
    {
      "epoch": 4.84,
      "learning_rate": 7.417822713378791e-05,
      "loss": 0.2383,
      "step": 7500
    },
    {
      "epoch": 4.84,
      "eval_loss": 0.16366632282733917,
      "eval_runtime": 555.2596,
      "eval_samples_per_second": 9.792,
      "eval_steps_per_second": 0.612,
      "eval_wer": 0.1426064106209615,
      "step": 7500
    },
    {
      "epoch": 4.9,
      "learning_rate": 7.370797084411004e-05,
      "loss": 0.2328,
      "step": 7600
    },
    {
      "epoch": 4.96,
      "learning_rate": 7.323771455443218e-05,
      "loss": 0.2575,
      "step": 7700
    },
    {
      "epoch": 5.03,
      "learning_rate": 7.27674582647543e-05,
      "loss": 0.2183,
      "step": 7800
    },
    {
      "epoch": 5.09,
      "learning_rate": 7.229720197507642e-05,
      "loss": 0.2254,
      "step": 7900
    },
    {
      "epoch": 5.16,
      "learning_rate": 7.182694568539855e-05,
      "loss": 0.2148,
      "step": 8000
    },
    {
      "epoch": 5.16,
      "eval_loss": 0.1583578884601593,
      "eval_runtime": 555.4598,
      "eval_samples_per_second": 9.788,
      "eval_steps_per_second": 0.612,
      "eval_wer": 0.1347328581093669,
      "step": 8000
    },
    {
      "epoch": 5.22,
      "learning_rate": 7.135668939572067e-05,
      "loss": 0.2096,
      "step": 8100
    },
    {
      "epoch": 5.29,
      "learning_rate": 7.08864331060428e-05,
      "loss": 0.2142,
      "step": 8200
    },
    {
      "epoch": 5.35,
      "learning_rate": 7.041617681636492e-05,
      "loss": 0.2113,
      "step": 8300
    },
    {
      "epoch": 5.42,
      "learning_rate": 6.994592052668704e-05,
      "loss": 0.2177,
      "step": 8400
    },
    {
      "epoch": 5.48,
      "learning_rate": 6.947566423700918e-05,
      "loss": 0.2085,
      "step": 8500
    },
    {
      "epoch": 5.48,
      "eval_loss": 0.16014662384986877,
      "eval_runtime": 556.0462,
      "eval_samples_per_second": 9.778,
      "eval_steps_per_second": 0.611,
      "eval_wer": 0.13866473177954053,
      "step": 8500
    },
    {
      "epoch": 5.54,
      "learning_rate": 6.90054079473313e-05,
      "loss": 0.2112,
      "step": 8600
    },
    {
      "epoch": 5.61,
      "learning_rate": 6.853515165765343e-05,
      "loss": 0.2051,
      "step": 8700
    },
    {
      "epoch": 5.67,
      "learning_rate": 6.806489536797554e-05,
      "loss": 0.2214,
      "step": 8800
    },
    {
      "epoch": 5.74,
      "learning_rate": 6.759463907829768e-05,
      "loss": 0.2155,
      "step": 8900
    },
    {
      "epoch": 5.8,
      "learning_rate": 6.71243827886198e-05,
      "loss": 0.2944,
      "step": 9000
    },
    {
      "epoch": 5.8,
      "eval_loss": 0.1565837264060974,
      "eval_runtime": 556.6846,
      "eval_samples_per_second": 9.767,
      "eval_steps_per_second": 0.611,
      "eval_wer": 0.1293596242658378,
      "step": 9000
    },
    {
      "epoch": 5.87,
      "learning_rate": 6.665412649894193e-05,
      "loss": 0.2048,
      "step": 9100
    },
    {
      "epoch": 5.93,
      "learning_rate": 6.618387020926405e-05,
      "loss": 0.2089,
      "step": 9200
    },
    {
      "epoch": 6.0,
      "learning_rate": 6.571831648248296e-05,
      "loss": 0.1928,
      "step": 9300
    },
    {
      "epoch": 6.06,
      "learning_rate": 6.524806019280508e-05,
      "loss": 0.2435,
      "step": 9400
    },
    {
      "epoch": 6.13,
      "learning_rate": 6.47778039031272e-05,
      "loss": 0.1944,
      "step": 9500
    },
    {
      "epoch": 6.13,
      "eval_loss": 0.14938245713710785,
      "eval_runtime": 556.2024,
      "eval_samples_per_second": 9.775,
      "eval_steps_per_second": 0.611,
      "eval_wer": 0.12710443487895517,
      "step": 9500
    },
    {
      "epoch": 6.19,
      "learning_rate": 6.430754761344934e-05,
      "loss": 0.1952,
      "step": 9600
    },
    {
      "epoch": 6.25,
      "learning_rate": 6.383729132377145e-05,
      "loss": 0.1923,
      "step": 9700
    },
    {
      "epoch": 6.32,
      "learning_rate": 6.336703503409358e-05,
      "loss": 0.1796,
      "step": 9800
    },
    {
      "epoch": 6.38,
      "learning_rate": 6.28967787444157e-05,
      "loss": 0.1851,
      "step": 9900
    },
    {
      "epoch": 6.45,
      "learning_rate": 6.242652245473784e-05,
      "loss": 0.1853,
      "step": 10000
    },
    {
      "epoch": 6.45,
      "eval_loss": 0.1561189442873001,
      "eval_runtime": 554.459,
      "eval_samples_per_second": 9.806,
      "eval_steps_per_second": 0.613,
      "eval_wer": 0.12469236275211547,
      "step": 10000
    },
    {
      "epoch": 6.51,
      "learning_rate": 6.195626616505996e-05,
      "loss": 0.1918,
      "step": 10100
    },
    {
      "epoch": 6.58,
      "learning_rate": 6.148600987538209e-05,
      "loss": 0.1743,
      "step": 10200
    },
    {
      "epoch": 6.64,
      "learning_rate": 6.101575358570422e-05,
      "loss": 0.1967,
      "step": 10300
    },
    {
      "epoch": 6.71,
      "learning_rate": 6.054549729602633e-05,
      "loss": 0.1922,
      "step": 10400
    },
    {
      "epoch": 6.77,
      "learning_rate": 6.0079943569245244e-05,
      "loss": 0.235,
      "step": 10500
    },
    {
      "epoch": 6.77,
      "eval_loss": 0.14610491693019867,
      "eval_runtime": 555.3804,
      "eval_samples_per_second": 9.79,
      "eval_steps_per_second": 0.612,
      "eval_wer": 0.1214958769254905,
      "step": 10500
    },
    {
      "epoch": 6.83,
      "learning_rate": 5.9609687279567375e-05,
      "loss": 0.1934,
      "step": 10600
    },
    {
      "epoch": 6.9,
      "learning_rate": 5.9139430989889486e-05,
      "loss": 0.1913,
      "step": 10700
    },
    {
      "epoch": 6.96,
      "learning_rate": 5.866917470021162e-05,
      "loss": 0.1801,
      "step": 10800
    },
    {
      "epoch": 7.03,
      "learning_rate": 5.819891841053374e-05,
      "loss": 0.1829,
      "step": 10900
    },
    {
      "epoch": 7.09,
      "learning_rate": 5.772866212085587e-05,
      "loss": 0.2286,
      "step": 11000
    },
    {
      "epoch": 7.09,
      "eval_loss": 0.1447422057390213,
      "eval_runtime": 557.5344,
      "eval_samples_per_second": 9.752,
      "eval_steps_per_second": 0.61,
      "eval_wer": 0.11670114818555306,
      "step": 11000
    },
    {
      "epoch": 7.16,
      "learning_rate": 5.7258405831177996e-05,
      "loss": 0.1764,
      "step": 11100
    },
    {
      "epoch": 7.22,
      "learning_rate": 5.6788149541500127e-05,
      "loss": 0.1775,
      "step": 11200
    },
    {
      "epoch": 7.29,
      "learning_rate": 5.631789325182225e-05,
      "loss": 0.1602,
      "step": 11300
    },
    {
      "epoch": 7.35,
      "learning_rate": 5.584763696214437e-05,
      "loss": 0.1748,
      "step": 11400
    },
    {
      "epoch": 7.41,
      "learning_rate": 5.537738067246649e-05,
      "loss": 0.1781,
      "step": 11500
    },
    {
      "epoch": 7.41,
      "eval_loss": 0.15018154680728912,
      "eval_runtime": 554.8903,
      "eval_samples_per_second": 9.798,
      "eval_steps_per_second": 0.613,
      "eval_wer": 0.11993685469716729,
      "step": 11500
    },
    {
      "epoch": 7.48,
      "learning_rate": 5.490712438278862e-05,
      "loss": 0.1682,
      "step": 11600
    },
    {
      "epoch": 7.54,
      "learning_rate": 5.443686809311075e-05,
      "loss": 0.1706,
      "step": 11700
    },
    {
      "epoch": 7.61,
      "learning_rate": 5.397131436632965e-05,
      "loss": 0.1554,
      "step": 11800
    },
    {
      "epoch": 7.67,
      "learning_rate": 5.350105807665178e-05,
      "loss": 0.1612,
      "step": 11900
    },
    {
      "epoch": 7.74,
      "learning_rate": 5.30308017869739e-05,
      "loss": 0.1714,
      "step": 12000
    },
    {
      "epoch": 7.74,
      "eval_loss": 0.14246602356433868,
      "eval_runtime": 557.0268,
      "eval_samples_per_second": 9.761,
      "eval_steps_per_second": 0.61,
      "eval_wer": 0.11787776873523097,
      "step": 12000
    },
    {
      "epoch": 7.8,
      "learning_rate": 5.2560545497296034e-05,
      "loss": 0.1719,
      "step": 12100
    },
    {
      "epoch": 7.87,
      "learning_rate": 5.209028920761816e-05,
      "loss": 0.1663,
      "step": 12200
    },
    {
      "epoch": 7.93,
      "learning_rate": 5.1620032917940275e-05,
      "loss": 0.1597,
      "step": 12300
    },
    {
      "epoch": 7.99,
      "learning_rate": 5.11497766282624e-05,
      "loss": 0.1622,
      "step": 12400
    },
    {
      "epoch": 8.06,
      "learning_rate": 5.067952033858453e-05,
      "loss": 0.1725,
      "step": 12500
    },
    {
      "epoch": 8.06,
      "eval_loss": 0.1426704078912735,
      "eval_runtime": 554.3005,
      "eval_samples_per_second": 9.809,
      "eval_steps_per_second": 0.613,
      "eval_wer": 0.11733848431662859,
      "step": 12500
    },
    {
      "epoch": 8.12,
      "learning_rate": 5.0209264048906654e-05,
      "loss": 0.1545,
      "step": 12600
    },
    {
      "epoch": 8.19,
      "learning_rate": 4.9739007759228785e-05,
      "loss": 0.1531,
      "step": 12700
    },
    {
      "epoch": 8.25,
      "learning_rate": 4.92687514695509e-05,
      "loss": 0.1546,
      "step": 12800
    },
    {
      "epoch": 8.32,
      "learning_rate": 4.8798495179873033e-05,
      "loss": 0.151,
      "step": 12900
    },
    {
      "epoch": 8.38,
      "learning_rate": 4.832823889019516e-05,
      "loss": 0.143,
      "step": 13000
    },
    {
      "epoch": 8.38,
      "eval_loss": 0.1447545289993286,
      "eval_runtime": 556.1274,
      "eval_samples_per_second": 9.777,
      "eval_steps_per_second": 0.611,
      "eval_wer": 0.11421063468873484,
      "step": 13000
    },
    {
      "epoch": 8.45,
      "learning_rate": 4.785798260051728e-05,
      "loss": 0.1568,
      "step": 13100
    },
    {
      "epoch": 8.51,
      "learning_rate": 4.7387726310839406e-05,
      "loss": 0.1565,
      "step": 13200
    },
    {
      "epoch": 8.57,
      "learning_rate": 4.6917470021161537e-05,
      "loss": 0.1515,
      "step": 13300
    },
    {
      "epoch": 8.64,
      "learning_rate": 4.644721373148366e-05,
      "loss": 0.2059,
      "step": 13400
    },
    {
      "epoch": 8.7,
      "learning_rate": 4.5976957441805785e-05,
      "loss": 0.154,
      "step": 13500
    },
    {
      "epoch": 8.7,
      "eval_loss": 0.13924145698547363,
      "eval_runtime": 554.6978,
      "eval_samples_per_second": 9.802,
      "eval_steps_per_second": 0.613,
      "eval_wer": 0.11040622824477629,
      "step": 13500
    },
    {
      "epoch": 8.77,
      "learning_rate": 4.550670115212791e-05,
      "loss": 0.1606,
      "step": 13600
    },
    {
      "epoch": 8.83,
      "learning_rate": 4.504114742534681e-05,
      "loss": 0.1532,
      "step": 13700
    },
    {
      "epoch": 8.9,
      "learning_rate": 4.457089113566894e-05,
      "loss": 0.1509,
      "step": 13800
    },
    {
      "epoch": 8.96,
      "learning_rate": 4.4100634845991065e-05,
      "loss": 0.1538,
      "step": 13900
    },
    {
      "epoch": 9.03,
      "learning_rate": 4.3630378556313196e-05,
      "loss": 0.1447,
      "step": 14000
    },
    {
      "epoch": 9.03,
      "eval_loss": 0.1403558999300003,
      "eval_runtime": 554.9504,
      "eval_samples_per_second": 9.797,
      "eval_steps_per_second": 0.613,
      "eval_wer": 0.1094159059487974,
      "step": 14000
    },
    {
      "epoch": 9.09,
      "learning_rate": 4.316012226663532e-05,
      "loss": 0.1445,
      "step": 14100
    },
    {
      "epoch": 9.16,
      "learning_rate": 4.2689865976957444e-05,
      "loss": 0.1641,
      "step": 14200
    },
    {
      "epoch": 9.22,
      "learning_rate": 4.221960968727957e-05,
      "loss": 0.1448,
      "step": 14300
    },
    {
      "epoch": 9.28,
      "learning_rate": 4.174935339760169e-05,
      "loss": 0.1386,
      "step": 14400
    },
    {
      "epoch": 9.35,
      "learning_rate": 4.127909710792382e-05,
      "loss": 0.1471,
      "step": 14500
    },
    {
      "epoch": 9.35,
      "eval_loss": 0.14039234817028046,
      "eval_runtime": 559.6371,
      "eval_samples_per_second": 9.715,
      "eval_steps_per_second": 0.608,
      "eval_wer": 0.10880798533146381,
      "step": 14500
    },
    {
      "epoch": 9.41,
      "learning_rate": 4.080884081824595e-05,
      "loss": 0.1514,
      "step": 14600
    },
    {
      "epoch": 9.48,
      "learning_rate": 4.033858452856807e-05,
      "loss": 0.148,
      "step": 14700
    },
    {
      "epoch": 9.54,
      "learning_rate": 3.9868328238890195e-05,
      "loss": 0.1463,
      "step": 14800
    },
    {
      "epoch": 9.61,
      "learning_rate": 3.9398071949212326e-05,
      "loss": 0.1412,
      "step": 14900
    },
    {
      "epoch": 9.67,
      "learning_rate": 3.892781565953445e-05,
      "loss": 0.1479,
      "step": 15000
    },
    {
      "epoch": 9.67,
      "eval_loss": 0.14136268198490143,
      "eval_runtime": 556.7019,
      "eval_samples_per_second": 9.766,
      "eval_steps_per_second": 0.611,
      "eval_wer": 0.11328894859148715,
      "step": 15000
    },
    {
      "epoch": 9.74,
      "learning_rate": 3.8457559369856574e-05,
      "loss": 0.1541,
      "step": 15100
    },
    {
      "epoch": 9.8,
      "learning_rate": 3.79873030801787e-05,
      "loss": 0.1482,
      "step": 15200
    },
    {
      "epoch": 9.86,
      "learning_rate": 3.751704679050083e-05,
      "loss": 0.1462,
      "step": 15300
    },
    {
      "epoch": 9.93,
      "learning_rate": 3.705149306371973e-05,
      "loss": 0.1513,
      "step": 15400
    },
    {
      "epoch": 9.99,
      "learning_rate": 3.6581236774041855e-05,
      "loss": 0.1607,
      "step": 15500
    },
    {
      "epoch": 9.99,
      "eval_loss": 0.14584468305110931,
      "eval_runtime": 555.5836,
      "eval_samples_per_second": 9.786,
      "eval_steps_per_second": 0.612,
      "eval_wer": 0.11712277054918764,
      "step": 15500
    },
    {
      "epoch": 10.06,
      "learning_rate": 3.611098048436398e-05,
      "loss": 0.1589,
      "step": 15600
    },
    {
      "epoch": 10.12,
      "learning_rate": 3.56407241946861e-05,
      "loss": 0.1588,
      "step": 15700
    },
    {
      "epoch": 10.19,
      "learning_rate": 3.5170467905008234e-05,
      "loss": 0.1646,
      "step": 15800
    },
    {
      "epoch": 10.25,
      "learning_rate": 3.470021161533036e-05,
      "loss": 0.17,
      "step": 15900
    },
    {
      "epoch": 10.32,
      "learning_rate": 3.422995532565248e-05,
      "loss": 0.166,
      "step": 16000
    },
    {
      "epoch": 10.32,
      "eval_loss": 0.16516457498073578,
      "eval_runtime": 557.4495,
      "eval_samples_per_second": 9.753,
      "eval_steps_per_second": 0.61,
      "eval_wer": 0.12636904703540647,
      "step": 16000
    },
    {
      "epoch": 10.38,
      "learning_rate": 3.3759699035974606e-05,
      "loss": 0.1784,
      "step": 16100
    },
    {
      "epoch": 10.44,
      "learning_rate": 3.328944274629674e-05,
      "loss": 0.1678,
      "step": 16200
    },
    {
      "epoch": 10.51,
      "learning_rate": 3.281918645661886e-05,
      "loss": 0.1771,
      "step": 16300
    },
    {
      "epoch": 10.57,
      "learning_rate": 3.235363272983776e-05,
      "loss": 0.1885,
      "step": 16400
    },
    {
      "epoch": 10.64,
      "learning_rate": 3.188337644015989e-05,
      "loss": 0.188,
      "step": 16500
    },
    {
      "epoch": 10.64,
      "eval_loss": 0.17125311493873596,
      "eval_runtime": 557.8968,
      "eval_samples_per_second": 9.746,
      "eval_steps_per_second": 0.609,
      "eval_wer": 0.13218351358506478,
      "step": 16500
    },
    {
      "epoch": 10.7,
      "learning_rate": 3.141312015048201e-05,
      "loss": 0.1847,
      "step": 16600
    },
    {
      "epoch": 10.77,
      "learning_rate": 3.094286386080414e-05,
      "loss": 0.2217,
      "step": 16700
    },
    {
      "epoch": 10.83,
      "learning_rate": 3.0472607571126265e-05,
      "loss": 0.1662,
      "step": 16800
    },
    {
      "epoch": 10.9,
      "learning_rate": 3.0002351281448393e-05,
      "loss": 0.1461,
      "step": 16900
    },
    {
      "epoch": 10.96,
      "learning_rate": 2.9532094991770514e-05,
      "loss": 0.1461,
      "step": 17000
    },
    {
      "epoch": 10.96,
      "eval_loss": 0.14227142930030823,
      "eval_runtime": 556.6368,
      "eval_samples_per_second": 9.768,
      "eval_steps_per_second": 0.611,
      "eval_wer": 0.11110239540333572,
      "step": 17000
    },
    {
      "epoch": 11.03,
      "learning_rate": 2.906183870209264e-05,
      "loss": 0.1583,
      "step": 17100
    },
    {
      "epoch": 11.09,
      "learning_rate": 2.859158241241477e-05,
      "loss": 0.1221,
      "step": 17200
    },
    {
      "epoch": 11.15,
      "learning_rate": 2.812132612273689e-05,
      "loss": 0.138,
      "step": 17300
    },
    {
      "epoch": 11.22,
      "learning_rate": 2.7651069833059017e-05,
      "loss": 0.1269,
      "step": 17400
    },
    {
      "epoch": 11.28,
      "learning_rate": 2.7180813543381144e-05,
      "loss": 0.1289,
      "step": 17500
    },
    {
      "epoch": 11.28,
      "eval_loss": 0.13876527547836304,
      "eval_runtime": 555.2154,
      "eval_samples_per_second": 9.793,
      "eval_steps_per_second": 0.612,
      "eval_wer": 0.10974928177120613,
      "step": 17500
    },
    {
      "epoch": 11.35,
      "learning_rate": 2.671055725370327e-05,
      "loss": 0.1395,
      "step": 17600
    },
    {
      "epoch": 11.41,
      "learning_rate": 2.6240300964025392e-05,
      "loss": 0.1397,
      "step": 17700
    },
    {
      "epoch": 11.48,
      "learning_rate": 2.577004467434752e-05,
      "loss": 0.123,
      "step": 17800
    },
    {
      "epoch": 11.54,
      "learning_rate": 2.5299788384669647e-05,
      "loss": 0.1486,
      "step": 17900
    },
    {
      "epoch": 11.61,
      "learning_rate": 2.482953209499177e-05,
      "loss": 0.1273,
      "step": 18000
    },
    {
      "epoch": 11.61,
      "eval_loss": 0.1438097506761551,
      "eval_runtime": 554.8582,
      "eval_samples_per_second": 9.799,
      "eval_steps_per_second": 0.613,
      "eval_wer": 0.10742545618559228,
      "step": 18000
    },
    {
      "epoch": 11.67,
      "learning_rate": 2.4363978368210676e-05,
      "loss": 0.1313,
      "step": 18100
    },
    {
      "epoch": 11.73,
      "learning_rate": 2.38937220785328e-05,
      "loss": 0.1365,
      "step": 18200
    },
    {
      "epoch": 11.8,
      "learning_rate": 2.3423465788854924e-05,
      "loss": 0.1335,
      "step": 18300
    },
    {
      "epoch": 11.86,
      "learning_rate": 2.295320949917705e-05,
      "loss": 0.1321,
      "step": 18400
    },
    {
      "epoch": 11.93,
      "learning_rate": 2.2482953209499176e-05,
      "loss": 0.1317,
      "step": 18500
    },
    {
      "epoch": 11.93,
      "eval_loss": 0.13120408356189728,
      "eval_runtime": 555.4622,
      "eval_samples_per_second": 9.788,
      "eval_steps_per_second": 0.612,
      "eval_wer": 0.10656260111582849,
      "step": 18500
    },
    {
      "epoch": 11.99,
      "learning_rate": 2.2012696919821303e-05,
      "loss": 0.137,
      "step": 18600
    },
    {
      "epoch": 12.06,
      "learning_rate": 2.154244063014343e-05,
      "loss": 0.1224,
      "step": 18700
    },
    {
      "epoch": 12.12,
      "learning_rate": 2.1072184340465555e-05,
      "loss": 0.1293,
      "step": 18800
    },
    {
      "epoch": 12.19,
      "learning_rate": 2.0606630613684456e-05,
      "loss": 0.1245,
      "step": 18900
    },
    {
      "epoch": 12.25,
      "learning_rate": 2.0136374324006584e-05,
      "loss": 0.1448,
      "step": 19000
    },
    {
      "epoch": 12.25,
      "eval_loss": 0.1446371227502823,
      "eval_runtime": 558.424,
      "eval_samples_per_second": 9.736,
      "eval_steps_per_second": 0.609,
      "eval_wer": 0.10419955484522538,
      "step": 19000
    },
    {
      "epoch": 12.31,
      "learning_rate": 1.9666118034328708e-05,
      "loss": 0.1472,
      "step": 19100
    },
    {
      "epoch": 12.38,
      "learning_rate": 1.9195861744650835e-05,
      "loss": 0.15,
      "step": 19200
    },
    {
      "epoch": 12.44,
      "learning_rate": 1.8725605454972963e-05,
      "loss": 0.1434,
      "step": 19300
    },
    {
      "epoch": 12.51,
      "learning_rate": 1.8255349165295087e-05,
      "loss": 0.1439,
      "step": 19400
    },
    {
      "epoch": 12.57,
      "learning_rate": 1.7785092875617214e-05,
      "loss": 0.1424,
      "step": 19500
    },
    {
      "epoch": 12.57,
      "eval_loss": 0.13855019211769104,
      "eval_runtime": 555.0962,
      "eval_samples_per_second": 9.795,
      "eval_steps_per_second": 0.613,
      "eval_wer": 0.10152274309470814,
      "step": 19500
    },
    {
      "epoch": 12.64,
      "learning_rate": 1.7314836585939338e-05,
      "loss": 0.1422,
      "step": 19600
    },
    {
      "epoch": 12.7,
      "learning_rate": 1.6844580296261466e-05,
      "loss": 0.1426,
      "step": 19700
    },
    {
      "epoch": 12.77,
      "learning_rate": 1.637432400658359e-05,
      "loss": 0.1395,
      "step": 19800
    },
    {
      "epoch": 12.83,
      "learning_rate": 1.5904067716905717e-05,
      "loss": 0.1363,
      "step": 19900
    },
    {
      "epoch": 12.89,
      "learning_rate": 1.543381142722784e-05,
      "loss": 0.1392,
      "step": 20000
    },
    {
      "epoch": 12.89,
      "eval_loss": 0.13786287605762482,
      "eval_runtime": 553.5953,
      "eval_samples_per_second": 9.821,
      "eval_steps_per_second": 0.614,
      "eval_wer": 0.10046378459999804,
      "step": 20000
    },
    {
      "epoch": 12.96,
      "learning_rate": 1.4963555137549964e-05,
      "loss": 0.1387,
      "step": 20100
    },
    {
      "epoch": 13.02,
      "learning_rate": 1.4493298847872091e-05,
      "loss": 0.1388,
      "step": 20200
    },
    {
      "epoch": 13.09,
      "learning_rate": 1.4023042558194215e-05,
      "loss": 0.1259,
      "step": 20300
    },
    {
      "epoch": 13.15,
      "learning_rate": 1.3552786268516343e-05,
      "loss": 0.1475,
      "step": 20400
    },
    {
      "epoch": 13.22,
      "learning_rate": 1.3082529978838467e-05,
      "loss": 0.1408,
      "step": 20500
    },
    {
      "epoch": 13.22,
      "eval_loss": 0.1407657265663147,
      "eval_runtime": 557.4847,
      "eval_samples_per_second": 9.753,
      "eval_steps_per_second": 0.61,
      "eval_wer": 0.09921852785158893,
      "step": 20500
    },
    {
      "epoch": 13.28,
      "learning_rate": 1.2612273689160592e-05,
      "loss": 0.1444,
      "step": 20600
    },
    {
      "epoch": 13.35,
      "learning_rate": 1.214201739948272e-05,
      "loss": 0.1324,
      "step": 20700
    },
    {
      "epoch": 13.41,
      "learning_rate": 1.1671761109804846e-05,
      "loss": 0.1397,
      "step": 20800
    },
    {
      "epoch": 13.48,
      "learning_rate": 1.120150482012697e-05,
      "loss": 0.1382,
      "step": 20900
    },
    {
      "epoch": 13.54,
      "learning_rate": 1.0731248530449096e-05,
      "loss": 0.1239,
      "step": 21000
    },
    {
      "epoch": 13.54,
      "eval_loss": 0.13379834592342377,
      "eval_runtime": 553.3736,
      "eval_samples_per_second": 9.825,
      "eval_steps_per_second": 0.614,
      "eval_wer": 0.09677704021100729,
      "step": 21000
    },
    {
      "epoch": 13.6,
      "learning_rate": 1.0260992240771221e-05,
      "loss": 0.122,
      "step": 21100
    },
    {
      "epoch": 13.67,
      "learning_rate": 9.790735951093347e-06,
      "loss": 0.1209,
      "step": 21200
    },
    {
      "epoch": 13.73,
      "learning_rate": 9.320479661415473e-06,
      "loss": 0.1248,
      "step": 21300
    },
    {
      "epoch": 13.8,
      "learning_rate": 8.850223371737597e-06,
      "loss": 0.1198,
      "step": 21400
    },
    {
      "epoch": 13.86,
      "learning_rate": 8.379967082059723e-06,
      "loss": 0.1244,
      "step": 21500
    },
    {
      "epoch": 13.86,
      "eval_loss": 0.1335345059633255,
      "eval_runtime": 554.5112,
      "eval_samples_per_second": 9.805,
      "eval_steps_per_second": 0.613,
      "eval_wer": 0.09565925068881329,
      "step": 21500
    },
    {
      "epoch": 13.93,
      "learning_rate": 7.914413355278628e-06,
      "loss": 0.1235,
      "step": 21600
    },
    {
      "epoch": 13.99,
      "learning_rate": 7.444157065600752e-06,
      "loss": 0.1367,
      "step": 21700
    },
    {
      "epoch": 14.06,
      "learning_rate": 6.973900775922878e-06,
      "loss": 0.1288,
      "step": 21800
    },
    {
      "epoch": 14.12,
      "learning_rate": 6.503644486245005e-06,
      "loss": 0.1358,
      "step": 21900
    },
    {
      "epoch": 14.18,
      "learning_rate": 6.03338819656713e-06,
      "loss": 0.1254,
      "step": 22000
    },
    {
      "epoch": 14.18,
      "eval_loss": 0.13817058503627777,
      "eval_runtime": 555.1553,
      "eval_samples_per_second": 9.794,
      "eval_steps_per_second": 0.612,
      "eval_wer": 0.09503171972898507,
      "step": 22000
    },
    {
      "epoch": 14.25,
      "learning_rate": 5.5631319068892555e-06,
      "loss": 0.1343,
      "step": 22100
    },
    {
      "epoch": 14.31,
      "learning_rate": 5.097578180108159e-06,
      "loss": 0.131,
      "step": 22200
    },
    {
      "epoch": 14.38,
      "learning_rate": 4.627321890430284e-06,
      "loss": 0.1503,
      "step": 22300
    },
    {
      "epoch": 14.44,
      "learning_rate": 4.15706560075241e-06,
      "loss": 0.1543,
      "step": 22400
    },
    {
      "epoch": 14.51,
      "learning_rate": 3.6868093110745355e-06,
      "loss": 0.1597,
      "step": 22500
    },
    {
      "epoch": 14.51,
      "eval_loss": 0.15444068610668182,
      "eval_runtime": 553.9922,
      "eval_samples_per_second": 9.814,
      "eval_steps_per_second": 0.614,
      "eval_wer": 0.09704177983468482,
      "step": 22500
    },
    {
      "epoch": 14.57,
      "learning_rate": 3.2165530213966613e-06,
      "loss": 0.1588,
      "step": 22600
    },
    {
      "epoch": 14.64,
      "learning_rate": 2.746296731718787e-06,
      "loss": 0.1616,
      "step": 22700
    },
    {
      "epoch": 14.7,
      "learning_rate": 2.2760404420409124e-06,
      "loss": 0.1701,
      "step": 22800
    },
    {
      "epoch": 14.76,
      "learning_rate": 1.8057841523630381e-06,
      "loss": 0.1569,
      "step": 22900
    },
    {
      "epoch": 14.83,
      "learning_rate": 1.3355278626851635e-06,
      "loss": 0.1566,
      "step": 23000
    },
    {
      "epoch": 14.83,
      "eval_loss": 0.1588866114616394,
      "eval_runtime": 554.1492,
      "eval_samples_per_second": 9.811,
      "eval_steps_per_second": 0.614,
      "eval_wer": 0.09631619716238345,
      "step": 23000
    },
    {
      "epoch": 14.89,
      "learning_rate": 8.652715730072889e-07,
      "loss": 0.1645,
      "step": 23100
    },
    {
      "epoch": 14.96,
      "learning_rate": 3.950152833294146e-07,
      "loss": 0.1684,
      "step": 23200
    },
    {
      "epoch": 15.0,
      "step": 23265,
      "total_flos": 4.936819874574462e+20,
      "train_loss": 0.2744614067626927,
      "train_runtime": 128452.941,
      "train_samples_per_second": 5.797,
      "train_steps_per_second": 0.181
    }
  ],
  "max_steps": 23265,
  "num_train_epochs": 15,
  "total_flos": 4.936819874574462e+20,
  "trial_name": null,
  "trial_params": null
}