{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 31.99304865938431,
  "global_step": 4000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.79,
      "learning_rate": 0.0001,
      "loss": 0.0392,
      "step": 100
    },
    {
      "epoch": 0.79,
      "eval_loss": 0.23765751719474792,
      "eval_runtime": 220.5891,
      "eval_samples_per_second": 16.297,
      "eval_steps_per_second": 2.04,
      "eval_wer": 0.21887876816308827,
      "step": 100
    },
    {
      "epoch": 1.6,
      "learning_rate": 9.991993594875901e-05,
      "loss": 0.0336,
      "step": 200
    },
    {
      "epoch": 1.6,
      "eval_loss": 0.26165521144866943,
      "eval_runtime": 157.9726,
      "eval_samples_per_second": 22.757,
      "eval_steps_per_second": 2.849,
      "eval_wer": 0.21649316851008457,
      "step": 200
    },
    {
      "epoch": 2.4,
      "learning_rate": 9.983987189751803e-05,
      "loss": 0.0293,
      "step": 300
    },
    {
      "epoch": 2.4,
      "eval_loss": 0.28323182463645935,
      "eval_runtime": 169.3448,
      "eval_samples_per_second": 21.229,
      "eval_steps_per_second": 2.657,
      "eval_wer": 0.2197462589459987,
      "step": 300
    },
    {
      "epoch": 3.2,
      "learning_rate": 9.975980784627703e-05,
      "loss": 0.0283,
      "step": 400
    },
    {
      "epoch": 3.2,
      "eval_loss": 0.29311421513557434,
      "eval_runtime": 175.6178,
      "eval_samples_per_second": 20.471,
      "eval_steps_per_second": 2.562,
      "eval_wer": 0.21508349598785512,
      "step": 400
    },
    {
      "epoch": 3.99,
      "learning_rate": 9.967974379503603e-05,
      "loss": 0.0274,
      "step": 500
    },
    {
      "epoch": 3.99,
      "eval_loss": 0.30566948652267456,
      "eval_runtime": 182.1945,
      "eval_samples_per_second": 19.732,
      "eval_steps_per_second": 2.47,
      "eval_wer": 0.21828236824983735,
      "step": 500
    },
    {
      "epoch": 4.79,
      "learning_rate": 9.959967974379504e-05,
      "loss": 0.0264,
      "step": 600
    },
    {
      "epoch": 4.79,
      "eval_loss": 0.30197781324386597,
      "eval_runtime": 174.7969,
      "eval_samples_per_second": 20.567,
      "eval_steps_per_second": 2.574,
      "eval_wer": 0.2171437865972674,
      "step": 600
    },
    {
      "epoch": 5.6,
      "learning_rate": 9.951961569255405e-05,
      "loss": 0.0259,
      "step": 700
    },
    {
      "epoch": 5.6,
      "eval_loss": 0.3002428412437439,
      "eval_runtime": 191.2838,
      "eval_samples_per_second": 18.794,
      "eval_steps_per_second": 2.353,
      "eval_wer": 0.21725222294513122,
      "step": 700
    },
    {
      "epoch": 6.4,
      "learning_rate": 9.943955164131305e-05,
      "loss": 0.0254,
      "step": 800
    },
    {
      "epoch": 6.4,
      "eval_loss": 0.3097267746925354,
      "eval_runtime": 183.9687,
      "eval_samples_per_second": 19.541,
      "eval_steps_per_second": 2.446,
      "eval_wer": 0.21752331381479073,
      "step": 800
    },
    {
      "epoch": 7.2,
      "learning_rate": 9.936028823058447e-05,
      "loss": 0.0252,
      "step": 900
    },
    {
      "epoch": 7.2,
      "eval_loss": 0.2970833480358124,
      "eval_runtime": 182.1563,
      "eval_samples_per_second": 19.736,
      "eval_steps_per_second": 2.47,
      "eval_wer": 0.2170353502494036,
      "step": 900
    },
    {
      "epoch": 7.99,
      "learning_rate": 9.928022417934349e-05,
      "loss": 0.0234,
      "step": 1000
    },
    {
      "epoch": 7.99,
      "eval_loss": 0.31429246068000793,
      "eval_runtime": 193.7999,
      "eval_samples_per_second": 18.55,
      "eval_steps_per_second": 2.322,
      "eval_wer": 0.21405335068314899,
      "step": 1000
    },
    {
      "epoch": 8.79,
      "learning_rate": 9.920016012810248e-05,
      "loss": 0.0228,
      "step": 1100
    },
    {
      "epoch": 8.79,
      "eval_loss": 0.32985326647758484,
      "eval_runtime": 194.3544,
      "eval_samples_per_second": 18.497,
      "eval_steps_per_second": 2.315,
      "eval_wer": 0.2142702233788766,
      "step": 1100
    },
    {
      "epoch": 9.6,
      "learning_rate": 9.912009607686149e-05,
      "loss": 0.0236,
      "step": 1200
    },
    {
      "epoch": 9.6,
      "eval_loss": 0.3165593147277832,
      "eval_runtime": 185.0001,
      "eval_samples_per_second": 19.432,
      "eval_steps_per_second": 2.432,
      "eval_wer": 0.21833658642376924,
      "step": 1200
    },
    {
      "epoch": 10.4,
      "learning_rate": 9.90400320256205e-05,
      "loss": 0.0241,
      "step": 1300
    },
    {
      "epoch": 10.4,
      "eval_loss": 0.3285478949546814,
      "eval_runtime": 181.9532,
      "eval_samples_per_second": 19.758,
      "eval_steps_per_second": 2.473,
      "eval_wer": 0.2192582953806116,
      "step": 1300
    },
    {
      "epoch": 11.2,
      "learning_rate": 9.895996797437951e-05,
      "loss": 0.0243,
      "step": 1400
    },
    {
      "epoch": 11.2,
      "eval_loss": 0.3187803626060486,
      "eval_runtime": 200.4409,
      "eval_samples_per_second": 17.935,
      "eval_steps_per_second": 2.245,
      "eval_wer": 0.22099327694643245,
      "step": 1400
    },
    {
      "epoch": 11.99,
      "learning_rate": 9.887990392313852e-05,
      "loss": 0.026,
      "step": 1500
    },
    {
      "epoch": 11.99,
      "eval_loss": 0.32988375425338745,
      "eval_runtime": 199.5224,
      "eval_samples_per_second": 18.018,
      "eval_steps_per_second": 2.255,
      "eval_wer": 0.22375840381695944,
      "step": 1500
    },
    {
      "epoch": 12.79,
      "learning_rate": 9.879983987189752e-05,
      "loss": 0.0259,
      "step": 1600
    },
    {
      "epoch": 12.79,
      "eval_loss": 0.3099309206008911,
      "eval_runtime": 198.0592,
      "eval_samples_per_second": 18.151,
      "eval_steps_per_second": 2.272,
      "eval_wer": 0.22045109520711342,
      "step": 1600
    },
    {
      "epoch": 13.6,
      "learning_rate": 9.871977582065654e-05,
      "loss": 0.0255,
      "step": 1700
    },
    {
      "epoch": 13.6,
      "eval_loss": 0.30543622374534607,
      "eval_runtime": 202.823,
      "eval_samples_per_second": 17.725,
      "eval_steps_per_second": 2.219,
      "eval_wer": 0.22402949468661895,
      "step": 1700
    },
    {
      "epoch": 14.4,
      "learning_rate": 9.863971176941553e-05,
      "loss": 0.0253,
      "step": 1800
    },
    {
      "epoch": 14.4,
      "eval_loss": 0.31324318051338196,
      "eval_runtime": 199.664,
      "eval_samples_per_second": 18.005,
      "eval_steps_per_second": 2.254,
      "eval_wer": 0.21779440468445022,
      "step": 1800
    },
    {
      "epoch": 15.2,
      "learning_rate": 9.855964771817454e-05,
      "loss": 0.0244,
      "step": 1900
    },
    {
      "epoch": 15.2,
      "eval_loss": 0.33187857270240784,
      "eval_runtime": 197.0859,
      "eval_samples_per_second": 18.241,
      "eval_steps_per_second": 2.283,
      "eval_wer": 0.22121014964216004,
      "step": 1900
    },
    {
      "epoch": 15.99,
      "learning_rate": 9.847958366693355e-05,
      "loss": 0.0231,
      "step": 2000
    },
    {
      "epoch": 15.99,
      "eval_loss": 0.33831512928009033,
      "eval_runtime": 200.252,
      "eval_samples_per_second": 17.952,
      "eval_steps_per_second": 2.247,
      "eval_wer": 0.21920407720667967,
      "step": 2000
    },
    {
      "epoch": 16.79,
      "learning_rate": 9.839951961569256e-05,
      "loss": 0.0235,
      "step": 2100
    },
    {
      "epoch": 16.79,
      "eval_loss": 0.31389620900154114,
      "eval_runtime": 198.2191,
      "eval_samples_per_second": 18.136,
      "eval_steps_per_second": 2.27,
      "eval_wer": 0.21622207764042506,
      "step": 2100
    },
    {
      "epoch": 17.6,
      "learning_rate": 9.831945556445156e-05,
      "loss": 0.0227,
      "step": 2200
    },
    {
      "epoch": 17.6,
      "eval_loss": 0.32037118077278137,
      "eval_runtime": 202.9198,
      "eval_samples_per_second": 17.716,
      "eval_steps_per_second": 2.218,
      "eval_wer": 0.217360659292995,
      "step": 2200
    },
    {
      "epoch": 18.4,
      "learning_rate": 9.823939151321058e-05,
      "loss": 0.0228,
      "step": 2300
    },
    {
      "epoch": 18.4,
      "eval_loss": 0.32169201970100403,
      "eval_runtime": 193.9,
      "eval_samples_per_second": 18.54,
      "eval_steps_per_second": 2.321,
      "eval_wer": 0.21757753198872262,
      "step": 2300
    },
    {
      "epoch": 19.2,
      "learning_rate": 9.815932746196959e-05,
      "loss": 0.0217,
      "step": 2400
    },
    {
      "epoch": 19.2,
      "eval_loss": 0.3112569749355316,
      "eval_runtime": 198.2135,
      "eval_samples_per_second": 18.137,
      "eval_steps_per_second": 2.27,
      "eval_wer": 0.2170895684233355,
      "step": 2400
    },
    {
      "epoch": 19.99,
      "learning_rate": 9.807926341072858e-05,
      "loss": 0.0212,
      "step": 2500
    },
    {
      "epoch": 19.99,
      "eval_loss": 0.31596991419792175,
      "eval_runtime": 199.2987,
      "eval_samples_per_second": 18.038,
      "eval_steps_per_second": 2.258,
      "eval_wer": 0.21351116894382996,
      "step": 2500
    },
    {
      "epoch": 20.79,
      "learning_rate": 9.79991993594876e-05,
      "loss": 0.0216,
      "step": 2600
    },
    {
      "epoch": 20.79,
      "eval_loss": 0.3226161003112793,
      "eval_runtime": 199.747,
      "eval_samples_per_second": 17.998,
      "eval_steps_per_second": 2.253,
      "eval_wer": 0.21378225981348947,
      "step": 2600
    },
    {
      "epoch": 21.6,
      "learning_rate": 9.79191353082466e-05,
      "loss": 0.0242,
      "step": 2700
    },
    {
      "epoch": 21.6,
      "eval_loss": 0.3281223177909851,
      "eval_runtime": 197.1976,
      "eval_samples_per_second": 18.23,
      "eval_steps_per_second": 2.282,
      "eval_wer": 0.2169269139015398,
      "step": 2700
    },
    {
      "epoch": 22.4,
      "learning_rate": 9.783907125700561e-05,
      "loss": 0.0245,
      "step": 2800
    },
    {
      "epoch": 22.4,
      "eval_loss": 0.3078162968158722,
      "eval_runtime": 198.6659,
      "eval_samples_per_second": 18.096,
      "eval_steps_per_second": 2.265,
      "eval_wer": 0.2176317501626545,
      "step": 2800
    },
    {
      "epoch": 23.2,
      "learning_rate": 9.775900720576461e-05,
      "loss": 0.0229,
      "step": 2900
    },
    {
      "epoch": 23.2,
      "eval_loss": 0.31995320320129395,
      "eval_runtime": 204.328,
      "eval_samples_per_second": 17.594,
      "eval_steps_per_second": 2.202,
      "eval_wer": 0.22045109520711342,
      "step": 2900
    },
    {
      "epoch": 23.99,
      "learning_rate": 9.767894315452363e-05,
      "loss": 0.0226,
      "step": 3000
    },
    {
      "epoch": 23.99,
      "eval_loss": 0.33075791597366333,
      "eval_runtime": 205.0698,
      "eval_samples_per_second": 17.531,
      "eval_steps_per_second": 2.194,
      "eval_wer": 0.2171437865972674,
      "step": 3000
    },
    {
      "epoch": 24.79,
      "learning_rate": 9.759887910328262e-05,
      "loss": 0.0213,
      "step": 3100
    },
    {
      "epoch": 24.79,
      "eval_loss": 0.3419627845287323,
      "eval_runtime": 206.2312,
      "eval_samples_per_second": 17.432,
      "eval_steps_per_second": 2.182,
      "eval_wer": 0.21936673172847537,
      "step": 3100
    },
    {
      "epoch": 25.6,
      "learning_rate": 9.751881505204163e-05,
      "loss": 0.0212,
      "step": 3200
    },
    {
      "epoch": 25.6,
      "eval_loss": 0.3389272093772888,
      "eval_runtime": 205.5665,
      "eval_samples_per_second": 17.488,
      "eval_steps_per_second": 2.189,
      "eval_wer": 0.21519193233571893,
      "step": 3200
    },
    {
      "epoch": 26.4,
      "learning_rate": 9.743875100080065e-05,
      "loss": 0.0208,
      "step": 3300
    },
    {
      "epoch": 26.4,
      "eval_loss": 0.32781022787094116,
      "eval_runtime": 208.0862,
      "eval_samples_per_second": 17.276,
      "eval_steps_per_second": 2.163,
      "eval_wer": 0.21275211450878334,
      "step": 3300
    },
    {
      "epoch": 27.2,
      "learning_rate": 9.735868694955965e-05,
      "loss": 0.0212,
      "step": 3400
    },
    {
      "epoch": 27.2,
      "eval_loss": 0.3169388771057129,
      "eval_runtime": 206.029,
      "eval_samples_per_second": 17.449,
      "eval_steps_per_second": 2.184,
      "eval_wer": 0.21497505963999133,
      "step": 3400
    },
    {
      "epoch": 27.99,
      "learning_rate": 9.727862289831866e-05,
      "loss": 0.0213,
      "step": 3500
    },
    {
      "epoch": 27.99,
      "eval_loss": 0.31786179542541504,
      "eval_runtime": 198.632,
      "eval_samples_per_second": 18.099,
      "eval_steps_per_second": 2.265,
      "eval_wer": 0.21757753198872262,
      "step": 3500
    },
    {
      "epoch": 28.79,
      "learning_rate": 9.719855884707766e-05,
      "loss": 0.0213,
      "step": 3600
    },
    {
      "epoch": 28.79,
      "eval_loss": 0.32053136825561523,
      "eval_runtime": 201.1109,
      "eval_samples_per_second": 17.876,
      "eval_steps_per_second": 2.238,
      "eval_wer": 0.2203426588592496,
      "step": 3600
    },
    {
      "epoch": 29.6,
      "learning_rate": 9.711849479583668e-05,
      "loss": 0.0217,
      "step": 3700
    },
    {
      "epoch": 29.6,
      "eval_loss": 0.33174052834510803,
      "eval_runtime": 191.0157,
      "eval_samples_per_second": 18.82,
      "eval_steps_per_second": 2.356,
      "eval_wer": 0.2168726957276079,
      "step": 3700
    },
    {
      "epoch": 30.4,
      "learning_rate": 9.703843074459567e-05,
      "loss": 0.0221,
      "step": 3800
    },
    {
      "epoch": 30.4,
      "eval_loss": 0.3100583255290985,
      "eval_runtime": 190.6873,
      "eval_samples_per_second": 18.853,
      "eval_steps_per_second": 2.36,
      "eval_wer": 0.21774018651051832,
      "step": 3800
    },
    {
      "epoch": 31.2,
      "learning_rate": 9.695836669335468e-05,
      "loss": 0.021,
      "step": 3900
    },
    {
      "epoch": 31.2,
      "eval_loss": 0.33132240176200867,
      "eval_runtime": 187.5625,
      "eval_samples_per_second": 19.167,
      "eval_steps_per_second": 2.399,
      "eval_wer": 0.21741487746692692,
      "step": 3900
    },
    {
      "epoch": 31.99,
      "learning_rate": 9.68783026421137e-05,
      "loss": 0.0212,
      "step": 4000
    },
    {
      "epoch": 31.99,
      "eval_loss": 0.32063281536102295,
      "eval_runtime": 192.7124,
      "eval_samples_per_second": 18.655,
      "eval_steps_per_second": 2.335,
      "eval_wer": 0.21340273259596618,
      "step": 4000
    }
  ],
  "max_steps": 125000,
  "num_train_epochs": 1000,
  "total_flos": 9.112861160368682e+19,
  "trial_name": null,
  "trial_params": null
}