{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 1.0,
  "global_step": 3338128,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.0,
      "learning_rate": 4.9925557078698005e-05,
      "loss": 5.3279,
      "step": 5000
    },
    {
      "epoch": 0.0,
      "eval_accuracy": 0.31327971235572855,
      "eval_loss": 3.994140625,
      "eval_runtime": 39.5933,
      "eval_samples_per_second": 90.116,
      "eval_steps_per_second": 11.265,
      "step": 5000
    },
    {
      "epoch": 0.0,
      "learning_rate": 4.985067978220128e-05,
      "loss": 3.5754,
      "step": 10000
    },
    {
      "epoch": 0.0,
      "eval_accuracy": 0.3823957607318666,
      "eval_loss": 3.310546875,
      "eval_runtime": 39.5685,
      "eval_samples_per_second": 90.173,
      "eval_steps_per_second": 11.272,
      "step": 10000
    },
    {
      "epoch": 0.0,
      "learning_rate": 4.9775862399524525e-05,
      "loss": 3.6102,
      "step": 15000
    },
    {
      "epoch": 0.0,
      "eval_accuracy": 0.39768097216925513,
      "eval_loss": 3.166015625,
      "eval_runtime": 39.5825,
      "eval_samples_per_second": 90.141,
      "eval_steps_per_second": 11.268,
      "step": 15000
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.970101505993779e-05,
      "loss": 3.0639,
      "step": 20000
    },
    {
      "epoch": 0.01,
      "eval_accuracy": 0.41336891627105715,
      "eval_loss": 3.021484375,
      "eval_runtime": 39.5961,
      "eval_samples_per_second": 90.11,
      "eval_steps_per_second": 11.264,
      "step": 20000
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.962618269880604e-05,
      "loss": 2.9477,
      "step": 25000
    },
    {
      "epoch": 0.01,
      "eval_accuracy": 0.425242680676284,
      "eval_loss": 2.919921875,
      "eval_runtime": 39.6071,
      "eval_samples_per_second": 90.085,
      "eval_steps_per_second": 11.261,
      "step": 25000
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.9551335359219304e-05,
      "loss": 2.8589,
      "step": 30000
    },
    {
      "epoch": 0.01,
      "eval_accuracy": 0.4315466797294513,
      "eval_loss": 2.8671875,
      "eval_runtime": 39.6079,
      "eval_samples_per_second": 90.083,
      "eval_steps_per_second": 11.26,
      "step": 30000
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.947647304117757e-05,
      "loss": 2.8063,
      "step": 35000
    },
    {
      "epoch": 0.01,
      "eval_accuracy": 0.43875449855125825,
      "eval_loss": 2.802734375,
      "eval_runtime": 39.6873,
      "eval_samples_per_second": 89.903,
      "eval_steps_per_second": 11.238,
      "step": 35000
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.940162570159084e-05,
      "loss": 2.7646,
      "step": 40000
    },
    {
      "epoch": 0.01,
      "eval_accuracy": 0.44185690990623727,
      "eval_loss": 2.771484375,
      "eval_runtime": 39.6738,
      "eval_samples_per_second": 89.933,
      "eval_steps_per_second": 11.242,
      "step": 40000
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.932679334045909e-05,
      "loss": 2.7306,
      "step": 45000
    },
    {
      "epoch": 0.01,
      "eval_accuracy": 0.4467244957896629,
      "eval_loss": 2.736328125,
      "eval_runtime": 39.7305,
      "eval_samples_per_second": 89.805,
      "eval_steps_per_second": 11.226,
      "step": 45000
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.9251960979327336e-05,
      "loss": 2.7106,
      "step": 50000
    },
    {
      "epoch": 0.01,
      "eval_accuracy": 0.4492548623804952,
      "eval_loss": 2.712890625,
      "eval_runtime": 39.6605,
      "eval_samples_per_second": 89.964,
      "eval_steps_per_second": 11.245,
      "step": 50000
    },
    {
      "epoch": 0.02,
      "learning_rate": 4.917712861819559e-05,
      "loss": 2.6829,
      "step": 55000
    },
    {
      "epoch": 0.02,
      "eval_accuracy": 0.45224302916332426,
      "eval_loss": 2.689453125,
      "eval_runtime": 39.6345,
      "eval_samples_per_second": 90.023,
      "eval_steps_per_second": 11.253,
      "step": 55000
    },
    {
      "epoch": 0.02,
      "learning_rate": 4.9102311235518835e-05,
      "loss": 2.6703,
      "step": 60000
    },
    {
      "epoch": 0.02,
      "eval_accuracy": 0.45370464737056665,
      "eval_loss": 2.67578125,
      "eval_runtime": 39.6085,
      "eval_samples_per_second": 90.082,
      "eval_steps_per_second": 11.26,
      "step": 60000
    },
    {
      "epoch": 0.02,
      "learning_rate": 4.90274489174771e-05,
      "loss": 2.6522,
      "step": 65000
    },
    {
      "epoch": 0.02,
      "eval_accuracy": 0.4559714569388372,
      "eval_loss": 2.66015625,
      "eval_runtime": 39.7158,
      "eval_samples_per_second": 89.838,
      "eval_steps_per_second": 11.23,
      "step": 65000
    },
    {
      "epoch": 0.02,
      "learning_rate": 4.895260157789037e-05,
      "loss": 2.6377,
      "step": 70000
    },
    {
      "epoch": 0.02,
      "eval_accuracy": 0.4573840349100728,
      "eval_loss": 2.6484375,
      "eval_runtime": 40.0228,
      "eval_samples_per_second": 89.149,
      "eval_steps_per_second": 11.144,
      "step": 70000
    },
    {
      "epoch": 0.02,
      "learning_rate": 4.8877769216758615e-05,
      "loss": 2.6241,
      "step": 75000
    },
    {
      "epoch": 0.02,
      "eval_accuracy": 0.4586505880444836,
      "eval_loss": 2.634765625,
      "eval_runtime": 39.747,
      "eval_samples_per_second": 89.768,
      "eval_steps_per_second": 11.221,
      "step": 75000
    },
    {
      "epoch": 0.02,
      "learning_rate": 4.880295183408186e-05,
      "loss": 2.6159,
      "step": 80000
    },
    {
      "epoch": 0.02,
      "eval_accuracy": 0.46040042037619067,
      "eval_loss": 2.625,
      "eval_runtime": 39.8297,
      "eval_samples_per_second": 89.581,
      "eval_steps_per_second": 11.198,
      "step": 80000
    },
    {
      "epoch": 0.03,
      "learning_rate": 4.872807453758514e-05,
      "loss": 2.5959,
      "step": 85000
    },
    {
      "epoch": 0.03,
      "eval_accuracy": 0.4612864322379005,
      "eval_loss": 2.61328125,
      "eval_runtime": 39.842,
      "eval_samples_per_second": 89.554,
      "eval_steps_per_second": 11.194,
      "step": 85000
    },
    {
      "epoch": 0.03,
      "learning_rate": 4.86532271979984e-05,
      "loss": 2.5877,
      "step": 90000
    },
    {
      "epoch": 0.03,
      "eval_accuracy": 0.4624083303744811,
      "eval_loss": 2.603515625,
      "eval_runtime": 39.7194,
      "eval_samples_per_second": 89.83,
      "eval_steps_per_second": 11.229,
      "step": 90000
    },
    {
      "epoch": 0.03,
      "learning_rate": 4.857840981532165e-05,
      "loss": 2.5832,
      "step": 95000
    },
    {
      "epoch": 0.03,
      "eval_accuracy": 0.46323187757803697,
      "eval_loss": 2.599609375,
      "eval_runtime": 40.0969,
      "eval_samples_per_second": 88.984,
      "eval_steps_per_second": 11.123,
      "step": 95000
    },
    {
      "epoch": 0.03,
      "learning_rate": 4.8503562475734907e-05,
      "loss": 2.5726,
      "step": 100000
    },
    {
      "epoch": 0.03,
      "eval_accuracy": 0.46476143979941176,
      "eval_loss": 2.5859375,
      "eval_runtime": 39.6873,
      "eval_samples_per_second": 89.903,
      "eval_steps_per_second": 11.238,
      "step": 100000
    },
    {
      "epoch": 0.03,
      "learning_rate": 4.8428775049968125e-05,
      "loss": 2.5723,
      "step": 105000
    },
    {
      "epoch": 0.03,
      "eval_accuracy": 0.46553211121777593,
      "eval_loss": 2.580078125,
      "eval_runtime": 39.7946,
      "eval_samples_per_second": 89.66,
      "eval_steps_per_second": 11.208,
      "step": 105000
    },
    {
      "epoch": 0.03,
      "learning_rate": 4.83539127319264e-05,
      "loss": 2.5584,
      "step": 110000
    },
    {
      "epoch": 0.03,
      "eval_accuracy": 0.46414501225183996,
      "eval_loss": 2.59375,
      "eval_runtime": 39.8172,
      "eval_samples_per_second": 89.61,
      "eval_steps_per_second": 11.201,
      "step": 110000
    },
    {
      "epoch": 0.03,
      "learning_rate": 4.827905041388467e-05,
      "loss": 2.5541,
      "step": 115000
    },
    {
      "epoch": 0.03,
      "eval_accuracy": 0.4673400247228542,
      "eval_loss": 2.56640625,
      "eval_runtime": 39.875,
      "eval_samples_per_second": 89.48,
      "eval_steps_per_second": 11.185,
      "step": 115000
    },
    {
      "epoch": 0.04,
      "learning_rate": 4.820423303120791e-05,
      "loss": 2.541,
      "step": 120000
    },
    {
      "epoch": 0.04,
      "eval_accuracy": 0.46835206177206756,
      "eval_loss": 2.55859375,
      "eval_runtime": 39.7895,
      "eval_samples_per_second": 89.672,
      "eval_steps_per_second": 11.209,
      "step": 120000
    },
    {
      "epoch": 0.04,
      "learning_rate": 4.812941564853116e-05,
      "loss": 2.5359,
      "step": 125000
    },
    {
      "epoch": 0.04,
      "eval_accuracy": 0.4673909827334534,
      "eval_loss": 2.564453125,
      "eval_runtime": 39.8856,
      "eval_samples_per_second": 89.456,
      "eval_steps_per_second": 11.182,
      "step": 125000
    },
    {
      "epoch": 0.04,
      "learning_rate": 4.805458328739941e-05,
      "loss": 2.5298,
      "step": 130000
    },
    {
      "epoch": 0.04,
      "eval_accuracy": 0.4699054591919484,
      "eval_loss": 2.544921875,
      "eval_runtime": 39.8462,
      "eval_samples_per_second": 89.544,
      "eval_steps_per_second": 11.193,
      "step": 130000
    },
    {
      "epoch": 0.04,
      "learning_rate": 4.797972096935768e-05,
      "loss": 2.5258,
      "step": 135000
    },
    {
      "epoch": 0.04,
      "eval_accuracy": 0.47030819185636197,
      "eval_loss": 2.541015625,
      "eval_runtime": 39.8831,
      "eval_samples_per_second": 89.461,
      "eval_steps_per_second": 11.183,
      "step": 135000
    },
    {
      "epoch": 0.04,
      "learning_rate": 4.790488860822593e-05,
      "loss": 2.5207,
      "step": 140000
    },
    {
      "epoch": 0.04,
      "eval_accuracy": 0.47090352388341683,
      "eval_loss": 2.537109375,
      "eval_runtime": 40.0239,
      "eval_samples_per_second": 89.147,
      "eval_steps_per_second": 11.143,
      "step": 140000
    },
    {
      "epoch": 0.04,
      "learning_rate": 4.783005624709418e-05,
      "loss": 2.5167,
      "step": 145000
    },
    {
      "epoch": 0.04,
      "eval_accuracy": 0.47193419074295684,
      "eval_loss": 2.53125,
      "eval_runtime": 39.9144,
      "eval_samples_per_second": 89.391,
      "eval_steps_per_second": 11.174,
      "step": 145000
    },
    {
      "epoch": 0.04,
      "learning_rate": 4.7755223885962435e-05,
      "loss": 2.5101,
      "step": 150000
    },
    {
      "epoch": 0.04,
      "eval_accuracy": 0.4701947691876088,
      "eval_loss": 2.544921875,
      "eval_runtime": 40.0269,
      "eval_samples_per_second": 89.14,
      "eval_steps_per_second": 11.143,
      "step": 150000
    },
    {
      "epoch": 0.05,
      "learning_rate": 4.768039152483069e-05,
      "loss": 2.5058,
      "step": 155000
    },
    {
      "epoch": 0.05,
      "eval_accuracy": 0.4730330755844281,
      "eval_loss": 2.521484375,
      "eval_runtime": 39.9333,
      "eval_samples_per_second": 89.349,
      "eval_steps_per_second": 11.169,
      "step": 155000
    },
    {
      "epoch": 0.05,
      "learning_rate": 4.760554418524395e-05,
      "loss": 2.5021,
      "step": 160000
    },
    {
      "epoch": 0.05,
      "eval_accuracy": 0.473403480048569,
      "eval_loss": 2.51953125,
      "eval_runtime": 40.0331,
      "eval_samples_per_second": 89.126,
      "eval_steps_per_second": 11.141,
      "step": 160000
    },
    {
      "epoch": 0.05,
      "learning_rate": 4.753084663020711e-05,
      "loss": 2.8135,
      "step": 165000
    },
    {
      "epoch": 0.05,
      "eval_accuracy": 0.4317466762226635,
      "eval_loss": 2.83203125,
      "eval_runtime": 40.0127,
      "eval_samples_per_second": 89.172,
      "eval_steps_per_second": 11.146,
      "step": 165000
    },
    {
      "epoch": 0.05,
      "learning_rate": 4.7455954355255405e-05,
      "loss": 2.7932,
      "step": 170000
    },
    {
      "epoch": 0.05,
      "eval_accuracy": 0.4729974597705684,
      "eval_loss": 2.521484375,
      "eval_runtime": 39.9612,
      "eval_samples_per_second": 89.287,
      "eval_steps_per_second": 11.161,
      "step": 170000
    },
    {
      "epoch": 0.05,
      "learning_rate": 4.7381077058758686e-05,
      "loss": 2.4914,
      "step": 175000
    },
    {
      "epoch": 0.05,
      "eval_accuracy": 0.4751818050313638,
      "eval_loss": 2.505859375,
      "eval_runtime": 40.3867,
      "eval_samples_per_second": 88.346,
      "eval_steps_per_second": 11.043,
      "step": 175000
    },
    {
      "epoch": 0.05,
      "learning_rate": 4.730621474071695e-05,
      "loss": 2.487,
      "step": 180000
    },
    {
      "epoch": 0.05,
      "eval_accuracy": 0.4753875548483533,
      "eval_loss": 2.50390625,
      "eval_runtime": 40.0145,
      "eval_samples_per_second": 89.168,
      "eval_steps_per_second": 11.146,
      "step": 180000
    },
    {
      "epoch": 0.06,
      "learning_rate": 4.723138237958521e-05,
      "loss": 2.4829,
      "step": 185000
    },
    {
      "epoch": 0.06,
      "eval_accuracy": 0.47510947753244875,
      "eval_loss": 2.50390625,
      "eval_runtime": 40.0338,
      "eval_samples_per_second": 89.125,
      "eval_steps_per_second": 11.141,
      "step": 185000
    },
    {
      "epoch": 0.06,
      "learning_rate": 4.7156505083088486e-05,
      "loss": 2.4778,
      "step": 190000
    },
    {
      "epoch": 0.06,
      "eval_accuracy": 0.47625877244892145,
      "eval_loss": 2.49609375,
      "eval_runtime": 40.0473,
      "eval_samples_per_second": 89.095,
      "eval_steps_per_second": 11.137,
      "step": 190000
    },
    {
      "epoch": 0.06,
      "learning_rate": 4.708170267886672e-05,
      "loss": 2.4779,
      "step": 195000
    },
    {
      "epoch": 0.06,
      "eval_accuracy": 0.4770064305721763,
      "eval_loss": 2.4921875,
      "eval_runtime": 40.1061,
      "eval_samples_per_second": 88.964,
      "eval_steps_per_second": 11.121,
      "step": 195000
    },
    {
      "epoch": 0.06,
      "learning_rate": 4.700687031773498e-05,
      "loss": 2.4685,
      "step": 200000
    },
    {
      "epoch": 0.06,
      "eval_accuracy": 0.4765894515822188,
      "eval_loss": 2.494140625,
      "eval_runtime": 40.1514,
      "eval_samples_per_second": 88.864,
      "eval_steps_per_second": 11.108,
      "step": 200000
    },
    {
      "epoch": 0.06,
      "learning_rate": 4.693202297814823e-05,
      "loss": 2.4661,
      "step": 205000
    },
    {
      "epoch": 0.06,
      "eval_accuracy": 0.47763491270290054,
      "eval_loss": 2.484375,
      "eval_runtime": 40.1854,
      "eval_samples_per_second": 88.788,
      "eval_steps_per_second": 11.099,
      "step": 205000
    },
    {
      "epoch": 0.06,
      "learning_rate": 4.6857190617016483e-05,
      "loss": 2.4579,
      "step": 210000
    },
    {
      "epoch": 0.06,
      "eval_accuracy": 0.47826366880142374,
      "eval_loss": 2.48046875,
      "eval_runtime": 40.1794,
      "eval_samples_per_second": 88.802,
      "eval_steps_per_second": 11.1,
      "step": 210000
    },
    {
      "epoch": 0.06,
      "learning_rate": 4.6782358255884736e-05,
      "loss": 2.4589,
      "step": 215000
    },
    {
      "epoch": 0.06,
      "eval_accuracy": 0.4787937964923355,
      "eval_loss": 2.478515625,
      "eval_runtime": 40.1613,
      "eval_samples_per_second": 88.842,
      "eval_steps_per_second": 11.105,
      "step": 215000
    },
    {
      "epoch": 0.07,
      "learning_rate": 4.6707540873207975e-05,
      "loss": 2.4571,
      "step": 220000
    },
    {
      "epoch": 0.07,
      "eval_accuracy": 0.47927871949642525,
      "eval_loss": 2.474609375,
      "eval_runtime": 40.1097,
      "eval_samples_per_second": 88.956,
      "eval_steps_per_second": 11.119,
      "step": 220000
    },
    {
      "epoch": 0.07,
      "learning_rate": 4.663269353362124e-05,
      "loss": 2.4504,
      "step": 225000
    },
    {
      "epoch": 0.07,
      "eval_accuracy": 0.47965542521994137,
      "eval_loss": 2.47265625,
      "eval_runtime": 40.1284,
      "eval_samples_per_second": 88.915,
      "eval_steps_per_second": 11.114,
      "step": 225000
    },
    {
      "epoch": 0.07,
      "learning_rate": 4.65578461940345e-05,
      "loss": 2.4538,
      "step": 230000
    },
    {
      "epoch": 0.07,
      "eval_accuracy": 0.47995733773435206,
      "eval_loss": 2.46875,
      "eval_runtime": 40.2242,
      "eval_samples_per_second": 88.703,
      "eval_steps_per_second": 11.088,
      "step": 230000
    },
    {
      "epoch": 0.07,
      "learning_rate": 4.6483013832902755e-05,
      "loss": 2.4481,
      "step": 235000
    },
    {
      "epoch": 0.07,
      "eval_accuracy": 0.4806011620618159,
      "eval_loss": 2.466796875,
      "eval_runtime": 40.1909,
      "eval_samples_per_second": 88.776,
      "eval_steps_per_second": 11.097,
      "step": 235000
    },
    {
      "epoch": 0.07,
      "learning_rate": 4.640815151486103e-05,
      "loss": 2.4454,
      "step": 240000
    },
    {
      "epoch": 0.07,
      "eval_accuracy": 0.4809529367156302,
      "eval_loss": 2.4609375,
      "eval_runtime": 40.319,
      "eval_samples_per_second": 88.494,
      "eval_steps_per_second": 11.062,
      "step": 240000
    },
    {
      "epoch": 0.07,
      "learning_rate": 4.6333319153729274e-05,
      "loss": 2.44,
      "step": 245000
    },
    {
      "epoch": 0.07,
      "eval_accuracy": 0.4811408786256898,
      "eval_loss": 2.458984375,
      "eval_runtime": 40.235,
      "eval_samples_per_second": 88.679,
      "eval_steps_per_second": 11.085,
      "step": 245000
    },
    {
      "epoch": 0.07,
      "learning_rate": 4.625850177105252e-05,
      "loss": 2.4392,
      "step": 250000
    },
    {
      "epoch": 0.07,
      "eval_accuracy": 0.4810606060606061,
      "eval_loss": 2.458984375,
      "eval_runtime": 40.2635,
      "eval_samples_per_second": 88.616,
      "eval_steps_per_second": 11.077,
      "step": 250000
    },
    {
      "epoch": 0.08,
      "learning_rate": 4.618366940992077e-05,
      "loss": 2.431,
      "step": 255000
    },
    {
      "epoch": 0.08,
      "eval_accuracy": 0.48131512214580346,
      "eval_loss": 2.45703125,
      "eval_runtime": 40.2108,
      "eval_samples_per_second": 88.732,
      "eval_steps_per_second": 11.092,
      "step": 255000
    },
    {
      "epoch": 0.08,
      "learning_rate": 4.610885202724401e-05,
      "loss": 2.4377,
      "step": 260000
    },
    {
      "epoch": 0.08,
      "eval_accuracy": 0.482264420569064,
      "eval_loss": 2.451171875,
      "eval_runtime": 40.1835,
      "eval_samples_per_second": 88.793,
      "eval_steps_per_second": 11.099,
      "step": 260000
    },
    {
      "epoch": 0.08,
      "learning_rate": 4.6033959752292307e-05,
      "loss": 2.4299,
      "step": 265000
    },
    {
      "epoch": 0.08,
      "eval_accuracy": 0.4825972914447528,
      "eval_loss": 2.447265625,
      "eval_runtime": 40.2876,
      "eval_samples_per_second": 88.563,
      "eval_steps_per_second": 11.07,
      "step": 265000
    },
    {
      "epoch": 0.08,
      "learning_rate": 4.5959142369615546e-05,
      "loss": 2.4283,
      "step": 270000
    },
    {
      "epoch": 0.08,
      "eval_accuracy": 0.482810712360112,
      "eval_loss": 2.447265625,
      "eval_runtime": 40.3402,
      "eval_samples_per_second": 88.448,
      "eval_steps_per_second": 11.056,
      "step": 270000
    },
    {
      "epoch": 0.08,
      "learning_rate": 4.5884295030028805e-05,
      "loss": 2.4256,
      "step": 275000
    },
    {
      "epoch": 0.08,
      "eval_accuracy": 0.48325371829096697,
      "eval_loss": 2.443359375,
      "eval_runtime": 40.3191,
      "eval_samples_per_second": 88.494,
      "eval_steps_per_second": 11.062,
      "step": 275000
    },
    {
      "epoch": 0.08,
      "learning_rate": 4.5809462668897065e-05,
      "loss": 2.4198,
      "step": 280000
    },
    {
      "epoch": 0.08,
      "eval_accuracy": 0.48383589986367365,
      "eval_loss": 2.44140625,
      "eval_runtime": 40.3148,
      "eval_samples_per_second": 88.503,
      "eval_steps_per_second": 11.063,
      "step": 280000
    },
    {
      "epoch": 0.09,
      "learning_rate": 4.573461532931032e-05,
      "loss": 2.4174,
      "step": 285000
    },
    {
      "epoch": 0.09,
      "eval_accuracy": 0.4840175405143581,
      "eval_loss": 2.44140625,
      "eval_runtime": 40.703,
      "eval_samples_per_second": 87.659,
      "eval_steps_per_second": 10.957,
      "step": 285000
    },
    {
      "epoch": 0.09,
      "learning_rate": 4.565978296817857e-05,
      "loss": 2.4151,
      "step": 290000
    },
    {
      "epoch": 0.09,
      "eval_accuracy": 0.4844402728280929,
      "eval_loss": 2.435546875,
      "eval_runtime": 41.2392,
      "eval_samples_per_second": 86.52,
      "eval_steps_per_second": 10.815,
      "step": 290000
    },
    {
      "epoch": 0.09,
      "learning_rate": 4.558493562859184e-05,
      "loss": 2.4191,
      "step": 295000
    },
    {
      "epoch": 0.09,
      "eval_accuracy": 0.4847421853425036,
      "eval_loss": 2.43359375,
      "eval_runtime": 40.6977,
      "eval_samples_per_second": 87.671,
      "eval_steps_per_second": 10.959,
      "step": 295000
    },
    {
      "epoch": 0.09,
      "learning_rate": 4.55100882890051e-05,
      "loss": 2.4071,
      "step": 300000
    },
    {
      "epoch": 0.09,
      "eval_accuracy": 0.4848361562975334,
      "eval_loss": 2.431640625,
      "eval_runtime": 40.2058,
      "eval_samples_per_second": 88.744,
      "eval_steps_per_second": 11.093,
      "step": 300000
    },
    {
      "epoch": 0.09,
      "learning_rate": 4.543524094941836e-05,
      "loss": 2.4126,
      "step": 305000
    },
    {
      "epoch": 0.09,
      "eval_accuracy": 0.48549011743355736,
      "eval_loss": 2.427734375,
      "eval_runtime": 40.4122,
      "eval_samples_per_second": 88.29,
      "eval_steps_per_second": 11.036,
      "step": 305000
    },
    {
      "epoch": 0.09,
      "learning_rate": 4.536045352365158e-05,
      "loss": 2.4053,
      "step": 310000
    },
    {
      "epoch": 0.09,
      "eval_accuracy": 0.48513834277974305,
      "eval_loss": 2.4296875,
      "eval_runtime": 40.2632,
      "eval_samples_per_second": 88.617,
      "eval_steps_per_second": 11.077,
      "step": 310000
    },
    {
      "epoch": 0.09,
      "learning_rate": 4.528559120560985e-05,
      "loss": 2.4071,
      "step": 315000
    },
    {
      "epoch": 0.09,
      "eval_accuracy": 0.4857840848817993,
      "eval_loss": 2.42578125,
      "eval_runtime": 40.3587,
      "eval_samples_per_second": 88.407,
      "eval_steps_per_second": 11.051,
      "step": 315000
    },
    {
      "epoch": 0.1,
      "learning_rate": 4.5210743866023116e-05,
      "loss": 2.4027,
      "step": 320000
    },
    {
      "epoch": 0.1,
      "eval_accuracy": 0.486615303183725,
      "eval_loss": 2.421875,
      "eval_runtime": 40.2594,
      "eval_samples_per_second": 88.625,
      "eval_steps_per_second": 11.078,
      "step": 320000
    },
    {
      "epoch": 0.1,
      "learning_rate": 4.513591150489136e-05,
      "loss": 2.4013,
      "step": 325000
    },
    {
      "epoch": 0.1,
      "eval_accuracy": 0.4867040687505753,
      "eval_loss": 2.41796875,
      "eval_runtime": 40.2109,
      "eval_samples_per_second": 88.732,
      "eval_steps_per_second": 11.092,
      "step": 325000
    },
    {
      "epoch": 0.1,
      "learning_rate": 4.5061049186849636e-05,
      "loss": 2.4032,
      "step": 330000
    },
    {
      "epoch": 0.1,
      "eval_accuracy": 0.4866416040924214,
      "eval_loss": 2.41796875,
      "eval_runtime": 40.2756,
      "eval_samples_per_second": 88.59,
      "eval_steps_per_second": 11.074,
      "step": 330000
    },
    {
      "epoch": 0.1,
      "learning_rate": 4.498621682571789e-05,
      "loss": 2.3919,
      "step": 335000
    },
    {
      "epoch": 0.1,
      "eval_accuracy": 0.4870514599196069,
      "eval_loss": 2.416015625,
      "eval_runtime": 40.3049,
      "eval_samples_per_second": 88.525,
      "eval_steps_per_second": 11.066,
      "step": 335000
    },
    {
      "epoch": 0.1,
      "learning_rate": 4.491136948613115e-05,
      "loss": 2.3936,
      "step": 340000
    },
    {
      "epoch": 0.1,
      "eval_accuracy": 0.4872848804842874,
      "eval_loss": 2.4140625,
      "eval_runtime": 40.3719,
      "eval_samples_per_second": 88.378,
      "eval_steps_per_second": 11.047,
      "step": 340000
    },
    {
      "epoch": 0.1,
      "learning_rate": 4.48365371249994e-05,
      "loss": 2.3905,
      "step": 345000
    },
    {
      "epoch": 0.1,
      "eval_accuracy": 0.48784870621446635,
      "eval_loss": 2.41015625,
      "eval_runtime": 40.4162,
      "eval_samples_per_second": 88.281,
      "eval_steps_per_second": 11.035,
      "step": 345000
    },
    {
      "epoch": 0.1,
      "learning_rate": 4.4761704763867654e-05,
      "loss": 2.3889,
      "step": 350000
    },
    {
      "epoch": 0.1,
      "eval_accuracy": 0.4881240438523818,
      "eval_loss": 2.41015625,
      "eval_runtime": 40.2942,
      "eval_samples_per_second": 88.549,
      "eval_steps_per_second": 11.069,
      "step": 350000
    },
    {
      "epoch": 0.11,
      "learning_rate": 4.468688738119089e-05,
      "loss": 2.3866,
      "step": 355000
    },
    {
      "epoch": 0.11,
      "eval_accuracy": 0.48837801200198133,
      "eval_loss": 2.408203125,
      "eval_runtime": 40.2476,
      "eval_samples_per_second": 88.651,
      "eval_steps_per_second": 11.081,
      "step": 355000
    },
    {
      "epoch": 0.11,
      "learning_rate": 4.4612025063149173e-05,
      "loss": 2.3823,
      "step": 360000
    },
    {
      "epoch": 0.11,
      "eval_accuracy": 0.48875663550008985,
      "eval_loss": 2.40625,
      "eval_runtime": 40.3148,
      "eval_samples_per_second": 88.504,
      "eval_steps_per_second": 11.063,
      "step": 360000
    },
    {
      "epoch": 0.11,
      "learning_rate": 4.4537177723562427e-05,
      "loss": 2.3828,
      "step": 365000
    },
    {
      "epoch": 0.11,
      "eval_accuracy": 0.48881882619044487,
      "eval_loss": 2.40234375,
      "eval_runtime": 40.2734,
      "eval_samples_per_second": 88.594,
      "eval_steps_per_second": 11.074,
      "step": 365000
    },
    {
      "epoch": 0.11,
      "learning_rate": 4.446233038397569e-05,
      "loss": 2.3795,
      "step": 370000
    },
    {
      "epoch": 0.11,
      "eval_accuracy": 0.48893718027957866,
      "eval_loss": 2.400390625,
      "eval_runtime": 40.2791,
      "eval_samples_per_second": 88.582,
      "eval_steps_per_second": 11.073,
      "step": 370000
    },
    {
      "epoch": 0.11,
      "learning_rate": 4.43875729151189e-05,
      "loss": 2.3812,
      "step": 375000
    },
    {
      "epoch": 0.11,
      "eval_accuracy": 0.48680735461076846,
      "eval_loss": 2.416015625,
      "eval_runtime": 40.6108,
      "eval_samples_per_second": 87.858,
      "eval_steps_per_second": 10.982,
      "step": 375000
    },
    {
      "epoch": 0.11,
      "learning_rate": 4.431269561862217e-05,
      "loss": 2.3789,
      "step": 380000
    },
    {
      "epoch": 0.11,
      "eval_accuracy": 0.4895744293798684,
      "eval_loss": 2.396484375,
      "eval_runtime": 40.2591,
      "eval_samples_per_second": 88.626,
      "eval_steps_per_second": 11.078,
      "step": 380000
    },
    {
      "epoch": 0.12,
      "learning_rate": 4.423786325749043e-05,
      "loss": 2.372,
      "step": 385000
    },
    {
      "epoch": 0.12,
      "eval_accuracy": 0.48950730726913283,
      "eval_loss": 2.396484375,
      "eval_runtime": 40.2108,
      "eval_samples_per_second": 88.732,
      "eval_steps_per_second": 11.092,
      "step": 385000
    },
    {
      "epoch": 0.12,
      "learning_rate": 4.41630009394487e-05,
      "loss": 2.3732,
      "step": 390000
    },
    {
      "epoch": 0.12,
      "eval_accuracy": 0.4898645612789255,
      "eval_loss": 2.396484375,
      "eval_runtime": 40.4903,
      "eval_samples_per_second": 88.12,
      "eval_steps_per_second": 11.015,
      "step": 390000
    },
    {
      "epoch": 0.12,
      "learning_rate": 4.408815359986196e-05,
      "loss": 2.3725,
      "step": 395000
    },
    {
      "epoch": 0.12,
      "eval_accuracy": 0.4903272928913027,
      "eval_loss": 2.392578125,
      "eval_runtime": 40.3547,
      "eval_samples_per_second": 88.416,
      "eval_steps_per_second": 11.052,
      "step": 395000
    },
    {
      "epoch": 0.12,
      "learning_rate": 4.401332123873022e-05,
      "loss": 2.3716,
      "step": 400000
    },
    {
      "epoch": 0.12,
      "eval_accuracy": 0.49036948393233654,
      "eval_loss": 2.390625,
      "eval_runtime": 40.3654,
      "eval_samples_per_second": 88.392,
      "eval_steps_per_second": 11.049,
      "step": 400000
    },
    {
      "epoch": 0.12,
      "learning_rate": 4.393848887759846e-05,
      "loss": 2.3709,
      "step": 405000
    },
    {
      "epoch": 0.12,
      "eval_accuracy": 0.49040482577839734,
      "eval_loss": 2.390625,
      "eval_runtime": 40.3034,
      "eval_samples_per_second": 88.529,
      "eval_steps_per_second": 11.066,
      "step": 405000
    },
    {
      "epoch": 0.12,
      "learning_rate": 4.3863656516466716e-05,
      "loss": 2.3619,
      "step": 410000
    },
    {
      "epoch": 0.12,
      "eval_accuracy": 0.4906423558600616,
      "eval_loss": 2.388671875,
      "eval_runtime": 40.362,
      "eval_samples_per_second": 88.4,
      "eval_steps_per_second": 11.05,
      "step": 410000
    },
    {
      "epoch": 0.12,
      "learning_rate": 4.378877921997e-05,
      "loss": 2.367,
      "step": 415000
    },
    {
      "epoch": 0.12,
      "eval_accuracy": 0.49115138803045644,
      "eval_loss": 2.38671875,
      "eval_runtime": 40.2804,
      "eval_samples_per_second": 88.579,
      "eval_steps_per_second": 11.072,
      "step": 415000
    },
    {
      "epoch": 0.13,
      "learning_rate": 4.3713961837293236e-05,
      "loss": 2.3639,
      "step": 420000
    },
    {
      "epoch": 0.13,
      "eval_accuracy": 0.49116152483901654,
      "eval_loss": 2.384765625,
      "eval_runtime": 40.3366,
      "eval_samples_per_second": 88.456,
      "eval_steps_per_second": 11.057,
      "step": 420000
    },
    {
      "epoch": 0.13,
      "learning_rate": 4.363914445461648e-05,
      "loss": 2.3621,
      "step": 425000
    },
    {
      "epoch": 0.13,
      "eval_accuracy": 0.4918730192128138,
      "eval_loss": 2.3828125,
      "eval_runtime": 40.2687,
      "eval_samples_per_second": 88.605,
      "eval_steps_per_second": 11.076,
      "step": 425000
    },
    {
      "epoch": 0.13,
      "learning_rate": 4.3564282136574755e-05,
      "loss": 2.3578,
      "step": 430000
    },
    {
      "epoch": 0.13,
      "eval_accuracy": 0.4919609628762674,
      "eval_loss": 2.380859375,
      "eval_runtime": 40.2478,
      "eval_samples_per_second": 88.651,
      "eval_steps_per_second": 11.081,
      "step": 430000
    },
    {
      "epoch": 0.13,
      "learning_rate": 4.3489449775443e-05,
      "loss": 2.3608,
      "step": 435000
    },
    {
      "epoch": 0.13,
      "eval_accuracy": 0.4921738358560288,
      "eval_loss": 2.37890625,
      "eval_runtime": 40.4074,
      "eval_samples_per_second": 88.301,
      "eval_steps_per_second": 11.038,
      "step": 435000
    },
    {
      "epoch": 0.13,
      "learning_rate": 4.341461741431126e-05,
      "loss": 2.3541,
      "step": 440000
    },
    {
      "epoch": 0.13,
      "eval_accuracy": 0.4923423260523651,
      "eval_loss": 2.376953125,
      "eval_runtime": 40.2757,
      "eval_samples_per_second": 88.589,
      "eval_steps_per_second": 11.074,
      "step": 440000
    },
    {
      "epoch": 0.13,
      "learning_rate": 4.333978505317951e-05,
      "loss": 2.3556,
      "step": 445000
    },
    {
      "epoch": 0.13,
      "eval_accuracy": 0.4925938284917744,
      "eval_loss": 2.376953125,
      "eval_runtime": 40.292,
      "eval_samples_per_second": 88.553,
      "eval_steps_per_second": 11.069,
      "step": 445000
    },
    {
      "epoch": 0.13,
      "learning_rate": 4.326493771359277e-05,
      "loss": 2.3562,
      "step": 450000
    },
    {
      "epoch": 0.13,
      "eval_accuracy": 0.49278067453063834,
      "eval_loss": 2.376953125,
      "eval_runtime": 40.1882,
      "eval_samples_per_second": 88.782,
      "eval_steps_per_second": 11.098,
      "step": 450000
    },
    {
      "epoch": 0.14,
      "learning_rate": 4.9925197595778234e-05,
      "loss": 2.3641,
      "step": 455000
    },
    {
      "epoch": 0.14,
      "eval_accuracy": 0.4910004317732511,
      "eval_loss": 2.38671875,
      "eval_runtime": 39.6555,
      "eval_samples_per_second": 89.975,
      "eval_steps_per_second": 11.247,
      "step": 455000
    },
    {
      "epoch": 0.14,
      "learning_rate": 4.985036523464649e-05,
      "loss": 2.3641,
      "step": 460000
    },
    {
      "epoch": 0.14,
      "eval_accuracy": 0.4911015258910529,
      "eval_loss": 2.38671875,
      "eval_runtime": 39.5455,
      "eval_samples_per_second": 90.225,
      "eval_steps_per_second": 11.278,
      "step": 460000
    },
    {
      "epoch": 0.14,
      "learning_rate": 4.977551789505975e-05,
      "loss": 2.3646,
      "step": 465000
    },
    {
      "epoch": 0.14,
      "eval_accuracy": 0.4910639923026007,
      "eval_loss": 2.38671875,
      "eval_runtime": 39.4635,
      "eval_samples_per_second": 90.413,
      "eval_steps_per_second": 11.302,
      "step": 465000
    },
    {
      "epoch": 0.14,
      "learning_rate": 4.970071549083798e-05,
      "loss": 2.3629,
      "step": 470000
    },
    {
      "epoch": 0.14,
      "eval_accuracy": 0.4911439908998856,
      "eval_loss": 2.384765625,
      "eval_runtime": 39.5626,
      "eval_samples_per_second": 90.186,
      "eval_steps_per_second": 11.273,
      "step": 470000
    },
    {
      "epoch": 0.14,
      "learning_rate": 4.9625868151251246e-05,
      "loss": 2.3659,
      "step": 475000
    },
    {
      "epoch": 0.14,
      "eval_accuracy": 0.4913645349780168,
      "eval_loss": 2.3828125,
      "eval_runtime": 39.4888,
      "eval_samples_per_second": 90.355,
      "eval_steps_per_second": 11.294,
      "step": 475000
    },
    {
      "epoch": 0.14,
      "learning_rate": 4.9551020811664506e-05,
      "loss": 2.3651,
      "step": 480000
    },
    {
      "epoch": 0.14,
      "eval_accuracy": 0.4916360370667473,
      "eval_loss": 2.3828125,
      "eval_runtime": 38.5403,
      "eval_samples_per_second": 92.578,
      "eval_steps_per_second": 11.572,
      "step": 480000
    },
    {
      "epoch": 0.15,
      "learning_rate": 4.9476173472077765e-05,
      "loss": 2.3608,
      "step": 485000
    },
    {
      "epoch": 0.15,
      "eval_accuracy": 0.4917579527372671,
      "eval_loss": 2.380859375,
      "eval_runtime": 39.5737,
      "eval_samples_per_second": 90.161,
      "eval_steps_per_second": 11.27,
      "step": 485000
    },
    {
      "epoch": 0.15,
      "learning_rate": 4.9401356089401005e-05,
      "loss": 2.3612,
      "step": 490000
    },
    {
      "epoch": 0.15,
      "eval_accuracy": 0.49203685195656843,
      "eval_loss": 2.380859375,
      "eval_runtime": 38.5594,
      "eval_samples_per_second": 92.533,
      "eval_steps_per_second": 11.567,
      "step": 490000
    },
    {
      "epoch": 0.15,
      "learning_rate": 4.932649377135928e-05,
      "loss": 2.3569,
      "step": 495000
    },
    {
      "epoch": 0.15,
      "eval_accuracy": 0.49215328827110977,
      "eval_loss": 2.37890625,
      "eval_runtime": 39.5649,
      "eval_samples_per_second": 90.181,
      "eval_steps_per_second": 11.273,
      "step": 495000
    },
    {
      "epoch": 0.15,
      "learning_rate": 4.9251676388682524e-05,
      "loss": 2.3557,
      "step": 500000
    },
    {
      "epoch": 0.15,
      "eval_accuracy": 0.4923439698591586,
      "eval_loss": 2.37890625,
      "eval_runtime": 39.6114,
      "eval_samples_per_second": 90.075,
      "eval_steps_per_second": 11.259,
      "step": 500000
    },
    {
      "epoch": 0.15,
      "learning_rate": 4.9176829049095784e-05,
      "loss": 2.3541,
      "step": 505000
    },
    {
      "epoch": 0.15,
      "eval_accuracy": 0.49218726027817594,
      "eval_loss": 2.376953125,
      "eval_runtime": 39.5989,
      "eval_samples_per_second": 90.104,
      "eval_steps_per_second": 11.263,
      "step": 505000
    },
    {
      "epoch": 0.15,
      "learning_rate": 4.910196673105406e-05,
      "loss": 2.351,
      "step": 510000
    },
    {
      "epoch": 0.15,
      "eval_accuracy": 0.49274588062017544,
      "eval_loss": 2.375,
      "eval_runtime": 38.6221,
      "eval_samples_per_second": 92.382,
      "eval_steps_per_second": 11.548,
      "step": 510000
    },
    {
      "epoch": 0.15,
      "learning_rate": 4.9027134369922304e-05,
      "loss": 2.3504,
      "step": 515000
    },
    {
      "epoch": 0.15,
      "eval_accuracy": 0.49260917068851395,
      "eval_loss": 2.375,
      "eval_runtime": 39.6516,
      "eval_samples_per_second": 89.984,
      "eval_steps_per_second": 11.248,
      "step": 515000
    },
    {
      "epoch": 0.16,
      "learning_rate": 4.895231698724555e-05,
      "loss": 2.3479,
      "step": 520000
    },
    {
      "epoch": 0.16,
      "eval_accuracy": 0.492896014973984,
      "eval_loss": 2.373046875,
      "eval_runtime": 39.6699,
      "eval_samples_per_second": 89.942,
      "eval_steps_per_second": 11.243,
      "step": 520000
    },
    {
      "epoch": 0.16,
      "learning_rate": 4.887745466920382e-05,
      "loss": 2.3451,
      "step": 525000
    },
    {
      "epoch": 0.16,
      "eval_accuracy": 0.4929382060150178,
      "eval_loss": 2.37109375,
      "eval_runtime": 39.6216,
      "eval_samples_per_second": 90.052,
      "eval_steps_per_second": 11.256,
      "step": 525000
    },
    {
      "epoch": 0.16,
      "learning_rate": 4.880262230807207e-05,
      "loss": 2.3505,
      "step": 530000
    },
    {
      "epoch": 0.16,
      "eval_accuracy": 0.49343929311924395,
      "eval_loss": 2.369140625,
      "eval_runtime": 39.6785,
      "eval_samples_per_second": 89.923,
      "eval_steps_per_second": 11.24,
      "step": 530000
    },
    {
      "epoch": 0.16,
      "learning_rate": 4.8727804925395315e-05,
      "loss": 2.3457,
      "step": 535000
    },
    {
      "epoch": 0.16,
      "eval_accuracy": 0.4933929925612263,
      "eval_loss": 2.369140625,
      "eval_runtime": 39.6502,
      "eval_samples_per_second": 89.987,
      "eval_steps_per_second": 11.248,
      "step": 535000
    },
    {
      "epoch": 0.16,
      "learning_rate": 4.865297256426357e-05,
      "loss": 2.3479,
      "step": 540000
    },
    {
      "epoch": 0.16,
      "eval_accuracy": 0.4937496986354212,
      "eval_loss": 2.369140625,
      "eval_runtime": 39.6648,
      "eval_samples_per_second": 89.954,
      "eval_steps_per_second": 11.244,
      "step": 540000
    },
    {
      "epoch": 0.16,
      "learning_rate": 4.8578110246221835e-05,
      "loss": 2.3421,
      "step": 545000
    },
    {
      "epoch": 0.16,
      "eval_accuracy": 0.4935861398594655,
      "eval_loss": 2.3671875,
      "eval_runtime": 39.7026,
      "eval_samples_per_second": 89.868,
      "eval_steps_per_second": 11.234,
      "step": 545000
    },
    {
      "epoch": 0.16,
      "learning_rate": 4.850327788509009e-05,
      "loss": 2.3433,
      "step": 550000
    },
    {
      "epoch": 0.16,
      "eval_accuracy": 0.4937406576980568,
      "eval_loss": 2.3671875,
      "eval_runtime": 39.7646,
      "eval_samples_per_second": 89.728,
      "eval_steps_per_second": 11.216,
      "step": 550000
    },
    {
      "epoch": 0.17,
      "learning_rate": 4.842846050241333e-05,
      "loss": 2.3425,
      "step": 555000
    },
    {
      "epoch": 0.17,
      "eval_accuracy": 0.4939384624488776,
      "eval_loss": 2.365234375,
      "eval_runtime": 39.7934,
      "eval_samples_per_second": 89.663,
      "eval_steps_per_second": 11.208,
      "step": 555000
    },
    {
      "epoch": 0.17,
      "learning_rate": 4.835361316282659e-05,
      "loss": 2.3403,
      "step": 560000
    },
    {
      "epoch": 0.17,
      "eval_accuracy": 0.49420284137483617,
      "eval_loss": 2.36328125,
      "eval_runtime": 39.7702,
      "eval_samples_per_second": 89.715,
      "eval_steps_per_second": 11.214,
      "step": 560000
    },
    {
      "epoch": 0.17,
      "learning_rate": 4.827876582323985e-05,
      "loss": 2.3417,
      "step": 565000
    },
    {
      "epoch": 0.17,
      "eval_accuracy": 0.49440420770704296,
      "eval_loss": 2.361328125,
      "eval_runtime": 40.0918,
      "eval_samples_per_second": 88.996,
      "eval_steps_per_second": 11.124,
      "step": 565000
    },
    {
      "epoch": 0.17,
      "learning_rate": 4.82039484405631e-05,
      "loss": 2.3382,
      "step": 570000
    },
    {
      "epoch": 0.17,
      "eval_accuracy": 0.4947474893590907,
      "eval_loss": 2.361328125,
      "eval_runtime": 39.7167,
      "eval_samples_per_second": 89.836,
      "eval_steps_per_second": 11.23,
      "step": 570000
    },
    {
      "epoch": 0.17,
      "learning_rate": 4.812913105788634e-05,
      "loss": 2.3354,
      "step": 575000
    },
    {
      "epoch": 0.17,
      "eval_accuracy": 0.4949266642995849,
      "eval_loss": 2.359375,
      "eval_runtime": 39.8562,
      "eval_samples_per_second": 89.522,
      "eval_steps_per_second": 11.19,
      "step": 575000
    },
    {
      "epoch": 0.17,
      "learning_rate": 4.805425376138962e-05,
      "loss": 2.3366,
      "step": 580000
    },
    {
      "epoch": 0.17,
      "eval_accuracy": 0.4946513266616695,
      "eval_loss": 2.359375,
      "eval_runtime": 38.7841,
      "eval_samples_per_second": 91.997,
      "eval_steps_per_second": 11.5,
      "step": 580000
    },
    {
      "epoch": 0.18,
      "learning_rate": 4.797942140025787e-05,
      "loss": 2.3373,
      "step": 585000
    },
    {
      "epoch": 0.18,
      "eval_accuracy": 0.49454119160650334,
      "eval_loss": 2.359375,
      "eval_runtime": 38.7732,
      "eval_samples_per_second": 92.022,
      "eval_steps_per_second": 11.503,
      "step": 585000
    },
    {
      "epoch": 0.18,
      "learning_rate": 4.790460401758111e-05,
      "loss": 2.3365,
      "step": 590000
    },
    {
      "epoch": 0.18,
      "eval_accuracy": 0.49488255548395865,
      "eval_loss": 2.359375,
      "eval_runtime": 39.8158,
      "eval_samples_per_second": 89.613,
      "eval_steps_per_second": 11.202,
      "step": 590000
    },
    {
      "epoch": 0.18,
      "learning_rate": 4.782975667799438e-05,
      "loss": 2.3318,
      "step": 595000
    },
    {
      "epoch": 0.18,
      "eval_accuracy": 0.49525295994809954,
      "eval_loss": 2.35546875,
      "eval_runtime": 39.8567,
      "eval_samples_per_second": 89.521,
      "eval_steps_per_second": 11.19,
      "step": 595000
    },
    {
      "epoch": 0.18,
      "learning_rate": 4.7754894359952644e-05,
      "loss": 2.3278,
      "step": 600000
    },
    {
      "epoch": 0.18,
      "eval_accuracy": 0.4957521292777332,
      "eval_loss": 2.353515625,
      "eval_runtime": 39.8687,
      "eval_samples_per_second": 89.494,
      "eval_steps_per_second": 11.187,
      "step": 600000
    },
    {
      "epoch": 0.18,
      "learning_rate": 4.768004702036591e-05,
      "loss": 2.3277,
      "step": 605000
    },
    {
      "epoch": 0.18,
      "eval_accuracy": 0.4959060991807267,
      "eval_loss": 2.3515625,
      "eval_runtime": 40.0704,
      "eval_samples_per_second": 89.043,
      "eval_steps_per_second": 11.13,
      "step": 605000
    },
    {
      "epoch": 0.18,
      "learning_rate": 4.7605214659234157e-05,
      "loss": 2.326,
      "step": 610000
    },
    {
      "epoch": 0.18,
      "eval_accuracy": 0.49614417719798887,
      "eval_loss": 2.3515625,
      "eval_runtime": 39.9671,
      "eval_samples_per_second": 89.273,
      "eval_steps_per_second": 11.159,
      "step": 610000
    },
    {
      "epoch": 0.18,
      "learning_rate": 4.753036731964742e-05,
      "loss": 2.3273,
      "step": 615000
    },
    {
      "epoch": 0.18,
      "eval_accuracy": 0.49605705543793205,
      "eval_loss": 2.3515625,
      "eval_runtime": 39.9201,
      "eval_samples_per_second": 89.378,
      "eval_steps_per_second": 11.172,
      "step": 615000
    },
    {
      "epoch": 0.19,
      "learning_rate": 4.745551998006068e-05,
      "loss": 2.3284,
      "step": 620000
    },
    {
      "epoch": 0.19,
      "eval_accuracy": 0.49654992350819055,
      "eval_loss": 2.349609375,
      "eval_runtime": 39.956,
      "eval_samples_per_second": 89.298,
      "eval_steps_per_second": 11.162,
      "step": 620000
    },
    {
      "epoch": 0.19,
      "learning_rate": 4.7380687618928936e-05,
      "loss": 2.3276,
      "step": 625000
    },
    {
      "epoch": 0.19,
      "eval_accuracy": 0.49658115583726753,
      "eval_loss": 2.34765625,
      "eval_runtime": 39.9741,
      "eval_samples_per_second": 89.258,
      "eval_steps_per_second": 11.157,
      "step": 625000
    },
    {
      "epoch": 0.19,
      "learning_rate": 4.7305840279342196e-05,
      "loss": 2.3228,
      "step": 630000
    },
    {
      "epoch": 0.19,
      "eval_accuracy": 0.4966945785060207,
      "eval_loss": 2.345703125,
      "eval_runtime": 39.9089,
      "eval_samples_per_second": 89.404,
      "eval_steps_per_second": 11.175,
      "step": 630000
    },
    {
      "epoch": 0.19,
      "learning_rate": 4.723103787512043e-05,
      "loss": 2.3219,
      "step": 635000
    },
    {
      "epoch": 0.19,
      "eval_accuracy": 0.49684580873102496,
      "eval_loss": 2.345703125,
      "eval_runtime": 39.9108,
      "eval_samples_per_second": 89.399,
      "eval_steps_per_second": 11.175,
      "step": 635000
    },
    {
      "epoch": 0.19,
      "learning_rate": 4.715619053553369e-05,
      "loss": 2.326,
      "step": 640000
    },
    {
      "epoch": 0.19,
      "eval_accuracy": 0.49703155889869327,
      "eval_loss": 2.34375,
      "eval_runtime": 40.0352,
      "eval_samples_per_second": 89.122,
      "eval_steps_per_second": 11.14,
      "step": 640000
    },
    {
      "epoch": 0.19,
      "learning_rate": 4.708135817440194e-05,
      "loss": 2.3191,
      "step": 645000
    },
    {
      "epoch": 0.19,
      "eval_accuracy": 0.4972345690376936,
      "eval_loss": 2.341796875,
      "eval_runtime": 40.0269,
      "eval_samples_per_second": 89.14,
      "eval_steps_per_second": 11.143,
      "step": 645000
    },
    {
      "epoch": 0.19,
      "learning_rate": 4.70065258132702e-05,
      "loss": 2.3167,
      "step": 650000
    },
    {
      "epoch": 0.19,
      "eval_accuracy": 0.4972822394347058,
      "eval_loss": 2.34375,
      "eval_runtime": 40.0234,
      "eval_samples_per_second": 89.148,
      "eval_steps_per_second": 11.143,
      "step": 650000
    },
    {
      "epoch": 0.2,
      "learning_rate": 4.693166349522847e-05,
      "loss": 2.3172,
      "step": 655000
    },
    {
      "epoch": 0.2,
      "eval_accuracy": 0.4974205931731608,
      "eval_loss": 2.341796875,
      "eval_runtime": 40.0416,
      "eval_samples_per_second": 89.107,
      "eval_steps_per_second": 11.138,
      "step": 655000
    },
    {
      "epoch": 0.2,
      "learning_rate": 4.685683113409672e-05,
      "loss": 2.3194,
      "step": 660000
    },
    {
      "epoch": 0.2,
      "eval_accuracy": 0.4977205879129791,
      "eval_loss": 2.337890625,
      "eval_runtime": 40.5115,
      "eval_samples_per_second": 88.074,
      "eval_steps_per_second": 11.009,
      "step": 660000
    },
    {
      "epoch": 0.2,
      "learning_rate": 4.678198379450998e-05,
      "loss": 2.3204,
      "step": 665000
    },
    {
      "epoch": 0.2,
      "eval_accuracy": 0.49760332969504095,
      "eval_loss": 2.33984375,
      "eval_runtime": 40.059,
      "eval_samples_per_second": 89.069,
      "eval_steps_per_second": 11.134,
      "step": 665000
    },
    {
      "epoch": 0.2,
      "learning_rate": 4.670716641183322e-05,
      "loss": 2.309,
      "step": 670000
    },
    {
      "epoch": 0.2,
      "eval_accuracy": 0.49802085662059625,
      "eval_loss": 2.3359375,
      "eval_runtime": 40.172,
      "eval_samples_per_second": 88.818,
      "eval_steps_per_second": 11.102,
      "step": 670000
    },
    {
      "epoch": 0.2,
      "learning_rate": 4.663233405070147e-05,
      "loss": 2.3147,
      "step": 675000
    },
    {
      "epoch": 0.2,
      "eval_accuracy": 0.49805729433785273,
      "eval_loss": 2.337890625,
      "eval_runtime": 40.0906,
      "eval_samples_per_second": 88.999,
      "eval_steps_per_second": 11.125,
      "step": 675000
    },
    {
      "epoch": 0.2,
      "learning_rate": 4.655745675420475e-05,
      "loss": 2.3122,
      "step": 680000
    },
    {
      "epoch": 0.2,
      "eval_accuracy": 0.4980255140731779,
      "eval_loss": 2.3359375,
      "eval_runtime": 40.0778,
      "eval_samples_per_second": 89.027,
      "eval_steps_per_second": 11.128,
      "step": 680000
    },
    {
      "epoch": 0.21,
      "learning_rate": 4.6482624393073005e-05,
      "loss": 2.3096,
      "step": 685000
    },
    {
      "epoch": 0.21,
      "eval_accuracy": 0.4984096169272648,
      "eval_loss": 2.333984375,
      "eval_runtime": 40.3028,
      "eval_samples_per_second": 88.53,
      "eval_steps_per_second": 11.066,
      "step": 685000
    },
    {
      "epoch": 0.21,
      "learning_rate": 4.640780701039625e-05,
      "loss": 2.3093,
      "step": 690000
    },
    {
      "epoch": 0.21,
      "eval_accuracy": 0.49861701055104785,
      "eval_loss": 2.333984375,
      "eval_runtime": 40.1409,
      "eval_samples_per_second": 88.887,
      "eval_steps_per_second": 11.111,
      "step": 690000
    },
    {
      "epoch": 0.21,
      "learning_rate": 4.633295967080951e-05,
      "loss": 2.3048,
      "step": 695000
    },
    {
      "epoch": 0.21,
      "eval_accuracy": 0.498526601177404,
      "eval_loss": 2.33203125,
      "eval_runtime": 40.2295,
      "eval_samples_per_second": 88.691,
      "eval_steps_per_second": 11.086,
      "step": 695000
    },
    {
      "epoch": 0.21,
      "learning_rate": 4.6258127309677764e-05,
      "loss": 2.3111,
      "step": 700000
    },
    {
      "epoch": 0.21,
      "eval_accuracy": 0.4988186508510536,
      "eval_loss": 2.330078125,
      "eval_runtime": 40.2382,
      "eval_samples_per_second": 88.672,
      "eval_steps_per_second": 11.084,
      "step": 700000
    },
    {
      "epoch": 0.21,
      "learning_rate": 4.6183279970091023e-05,
      "loss": 2.3074,
      "step": 705000
    },
    {
      "epoch": 0.21,
      "eval_accuracy": 0.4989449500063561,
      "eval_loss": 2.330078125,
      "eval_runtime": 40.2221,
      "eval_samples_per_second": 88.707,
      "eval_steps_per_second": 11.088,
      "step": 705000
    },
    {
      "epoch": 0.21,
      "learning_rate": 4.610843263050428e-05,
      "loss": 2.3082,
      "step": 710000
    },
    {
      "epoch": 0.21,
      "eval_accuracy": 0.49918768547619985,
      "eval_loss": 2.330078125,
      "eval_runtime": 40.2424,
      "eval_samples_per_second": 88.663,
      "eval_steps_per_second": 11.083,
      "step": 710000
    },
    {
      "epoch": 0.21,
      "learning_rate": 4.603357031246256e-05,
      "loss": 2.3093,
      "step": 715000
    },
    {
      "epoch": 0.21,
      "eval_accuracy": 0.4993685042234876,
      "eval_loss": 2.328125,
      "eval_runtime": 39.2194,
      "eval_samples_per_second": 90.975,
      "eval_steps_per_second": 11.372,
      "step": 715000
    },
    {
      "epoch": 0.22,
      "learning_rate": 4.595873795133081e-05,
      "loss": 2.3011,
      "step": 720000
    },
    {
      "epoch": 0.22,
      "eval_accuracy": 0.4995095976399318,
      "eval_loss": 2.328125,
      "eval_runtime": 40.3274,
      "eval_samples_per_second": 88.476,
      "eval_steps_per_second": 11.059,
      "step": 720000
    },
    {
      "epoch": 0.22,
      "learning_rate": 4.588390559019906e-05,
      "loss": 2.2998,
      "step": 725000
    },
    {
      "epoch": 0.22,
      "eval_accuracy": 0.4994558999513433,
      "eval_loss": 2.326171875,
      "eval_runtime": 40.2634,
      "eval_samples_per_second": 88.616,
      "eval_steps_per_second": 11.077,
      "step": 725000
    },
    {
      "epoch": 0.22,
      "learning_rate": 4.580907322906731e-05,
      "loss": 2.3012,
      "step": 730000
    },
    {
      "epoch": 0.22,
      "eval_accuracy": 0.49959206194740696,
      "eval_loss": 2.326171875,
      "eval_runtime": 40.2894,
      "eval_samples_per_second": 88.559,
      "eval_steps_per_second": 11.07,
      "step": 730000
    },
    {
      "epoch": 0.22,
      "learning_rate": 4.573421091102558e-05,
      "loss": 2.3002,
      "step": 735000
    },
    {
      "epoch": 0.22,
      "eval_accuracy": 0.4997052106483612,
      "eval_loss": 2.32421875,
      "eval_runtime": 40.3059,
      "eval_samples_per_second": 88.523,
      "eval_steps_per_second": 11.065,
      "step": 735000
    },
    {
      "epoch": 0.22,
      "learning_rate": 4.5659378549893835e-05,
      "loss": 2.2994,
      "step": 740000
    },
    {
      "epoch": 0.22,
      "eval_accuracy": 0.5000197256815223,
      "eval_loss": 2.32421875,
      "eval_runtime": 40.7124,
      "eval_samples_per_second": 87.639,
      "eval_steps_per_second": 10.955,
      "step": 740000
    },
    {
      "epoch": 0.22,
      "learning_rate": 4.558454618876209e-05,
      "loss": 2.299,
      "step": 745000
    },
    {
      "epoch": 0.22,
      "eval_accuracy": 0.5000953407940244,
      "eval_loss": 2.322265625,
      "eval_runtime": 40.3194,
      "eval_samples_per_second": 88.493,
      "eval_steps_per_second": 11.062,
      "step": 745000
    },
    {
      "epoch": 0.22,
      "learning_rate": 4.550971382763034e-05,
      "loss": 2.2969,
      "step": 750000
    },
    {
      "epoch": 0.22,
      "eval_accuracy": 0.5002605433767736,
      "eval_loss": 2.322265625,
      "eval_runtime": 40.3665,
      "eval_samples_per_second": 88.39,
      "eval_steps_per_second": 11.049,
      "step": 750000
    },
    {
      "epoch": 0.23,
      "learning_rate": 4.543489644495358e-05,
      "loss": 2.2934,
      "step": 755000
    },
    {
      "epoch": 0.23,
      "eval_accuracy": 0.5003739660455269,
      "eval_loss": 2.3203125,
      "eval_runtime": 40.3284,
      "eval_samples_per_second": 88.474,
      "eval_steps_per_second": 11.059,
      "step": 755000
    },
    {
      "epoch": 0.23,
      "learning_rate": 4.536004910536684e-05,
      "loss": 2.2988,
      "step": 760000
    },
    {
      "epoch": 0.23,
      "eval_accuracy": 0.5004895804566715,
      "eval_loss": 2.318359375,
      "eval_runtime": 40.3305,
      "eval_samples_per_second": 88.469,
      "eval_steps_per_second": 11.059,
      "step": 760000
    },
    {
      "epoch": 0.23,
      "learning_rate": 4.5285186787325113e-05,
      "loss": 2.2911,
      "step": 765000
    },
    {
      "epoch": 0.23,
      "eval_accuracy": 0.5007449184452656,
      "eval_loss": 2.318359375,
      "eval_runtime": 39.3805,
      "eval_samples_per_second": 90.603,
      "eval_steps_per_second": 11.325,
      "step": 765000
    },
    {
      "epoch": 0.23,
      "learning_rate": 4.5210354426193366e-05,
      "loss": 2.2929,
      "step": 770000
    },
    {
      "epoch": 0.23,
      "eval_accuracy": 0.5008427249494803,
      "eval_loss": 2.318359375,
      "eval_runtime": 40.4207,
      "eval_samples_per_second": 88.272,
      "eval_steps_per_second": 11.034,
      "step": 770000
    },
    {
      "epoch": 0.23,
      "learning_rate": 4.5135567000426584e-05,
      "loss": 2.2926,
      "step": 775000
    },
    {
      "epoch": 0.23,
      "eval_accuracy": 0.5008994362838569,
      "eval_loss": 2.31640625,
      "eval_runtime": 40.4103,
      "eval_samples_per_second": 88.294,
      "eval_steps_per_second": 11.037,
      "step": 775000
    },
    {
      "epoch": 0.23,
      "learning_rate": 4.506070468238486e-05,
      "loss": 2.292,
      "step": 780000
    },
    {
      "epoch": 0.23,
      "eval_accuracy": 0.5011701164691906,
      "eval_loss": 2.31640625,
      "eval_runtime": 40.3936,
      "eval_samples_per_second": 88.331,
      "eval_steps_per_second": 11.041,
      "step": 780000
    },
    {
      "epoch": 0.24,
      "learning_rate": 4.498587232125311e-05,
      "loss": 2.2932,
      "step": 785000
    },
    {
      "epoch": 0.24,
      "eval_accuracy": 0.5014183312950129,
      "eval_loss": 2.314453125,
      "eval_runtime": 40.4142,
      "eval_samples_per_second": 88.286,
      "eval_steps_per_second": 11.036,
      "step": 785000
    },
    {
      "epoch": 0.24,
      "learning_rate": 4.4911039960121364e-05,
      "loss": 2.2903,
      "step": 790000
    },
    {
      "epoch": 0.24,
      "eval_accuracy": 0.5013958659355015,
      "eval_loss": 2.314453125,
      "eval_runtime": 40.3913,
      "eval_samples_per_second": 88.336,
      "eval_steps_per_second": 11.042,
      "step": 790000
    },
    {
      "epoch": 0.24,
      "learning_rate": 4.483620759898962e-05,
      "loss": 2.2886,
      "step": 795000
    },
    {
      "epoch": 0.24,
      "eval_accuracy": 0.5015205212840104,
      "eval_loss": 2.3125,
      "eval_runtime": 40.3641,
      "eval_samples_per_second": 88.395,
      "eval_steps_per_second": 11.049,
      "step": 795000
    },
    {
      "epoch": 0.24,
      "learning_rate": 4.476137523785787e-05,
      "loss": 2.2924,
      "step": 800000
    },
    {
      "epoch": 0.24,
      "eval_accuracy": 0.5014750426293895,
      "eval_loss": 2.3125,
      "eval_runtime": 40.359,
      "eval_samples_per_second": 88.407,
      "eval_steps_per_second": 11.051,
      "step": 800000
    },
    {
      "epoch": 0.24,
      "learning_rate": 4.468652789827113e-05,
      "loss": 2.2891,
      "step": 805000
    },
    {
      "epoch": 0.24,
      "eval_accuracy": 0.5018673645174441,
      "eval_loss": 2.310546875,
      "eval_runtime": 40.4253,
      "eval_samples_per_second": 88.261,
      "eval_steps_per_second": 11.033,
      "step": 805000
    },
    {
      "epoch": 0.24,
      "learning_rate": 4.461168055868439e-05,
      "loss": 2.2862,
      "step": 810000
    },
    {
      "epoch": 0.24,
      "eval_accuracy": 0.5019873624133714,
      "eval_loss": 2.30859375,
      "eval_runtime": 40.3854,
      "eval_samples_per_second": 88.349,
      "eval_steps_per_second": 11.044,
      "step": 810000
    },
    {
      "epoch": 0.24,
      "learning_rate": 4.453686317600763e-05,
      "loss": 2.2858,
      "step": 815000
    },
    {
      "epoch": 0.24,
      "eval_accuracy": 0.5021665373538656,
      "eval_loss": 2.30859375,
      "eval_runtime": 40.4075,
      "eval_samples_per_second": 88.301,
      "eval_steps_per_second": 11.038,
      "step": 815000
    },
    {
      "epoch": 0.25,
      "learning_rate": 4.44620008579659e-05,
      "loss": 2.2841,
      "step": 820000
    },
    {
      "epoch": 0.25,
      "eval_accuracy": 0.502265439729276,
      "eval_loss": 2.306640625,
      "eval_runtime": 40.4403,
      "eval_samples_per_second": 88.229,
      "eval_steps_per_second": 11.029,
      "step": 820000
    },
    {
      "epoch": 0.25,
      "learning_rate": 4.438718347528915e-05,
      "loss": 2.2843,
      "step": 825000
    },
    {
      "epoch": 0.25,
      "eval_accuracy": 0.5022361251747914,
      "eval_loss": 2.30859375,
      "eval_runtime": 40.4536,
      "eval_samples_per_second": 88.2,
      "eval_steps_per_second": 11.025,
      "step": 825000
    },
    {
      "epoch": 0.25,
      "learning_rate": 4.431233613570241e-05,
      "loss": 2.2832,
      "step": 830000
    },
    {
      "epoch": 0.25,
      "eval_accuracy": 0.5024813263548256,
      "eval_loss": 2.306640625,
      "eval_runtime": 40.4096,
      "eval_samples_per_second": 88.296,
      "eval_steps_per_second": 11.037,
      "step": 830000
    },
    {
      "epoch": 0.25,
      "learning_rate": 4.423756368839062e-05,
      "loss": 2.2846,
      "step": 835000
    },
    {
      "epoch": 0.25,
      "eval_accuracy": 0.502600776315155,
      "eval_loss": 2.306640625,
      "eval_runtime": 39.3247,
      "eval_samples_per_second": 90.732,
      "eval_steps_per_second": 11.341,
      "step": 835000
    },
    {
      "epoch": 0.25,
      "learning_rate": 4.416267141343891e-05,
      "loss": 2.2784,
      "step": 840000
    },
    {
      "epoch": 0.25,
      "eval_accuracy": 0.5026766653954561,
      "eval_loss": 2.3046875,
      "eval_runtime": 40.3768,
      "eval_samples_per_second": 88.367,
      "eval_steps_per_second": 11.046,
      "step": 840000
    },
    {
      "epoch": 0.25,
      "learning_rate": 4.408782407385217e-05,
      "loss": 2.277,
      "step": 845000
    },
    {
      "epoch": 0.25,
      "eval_accuracy": 0.5028424159138032,
      "eval_loss": 2.302734375,
      "eval_runtime": 40.4265,
      "eval_samples_per_second": 88.259,
      "eval_steps_per_second": 11.032,
      "step": 845000
    },
    {
      "epoch": 0.25,
      "learning_rate": 4.4013021669630405e-05,
      "loss": 2.276,
      "step": 850000
    },
    {
      "epoch": 0.25,
      "eval_accuracy": 0.5025583113063223,
      "eval_loss": 2.306640625,
      "eval_runtime": 40.7923,
      "eval_samples_per_second": 87.468,
      "eval_steps_per_second": 10.933,
      "step": 850000
    },
    {
      "epoch": 0.26,
      "learning_rate": 4.393818930849866e-05,
      "loss": 2.2802,
      "step": 855000
    },
    {
      "epoch": 0.26,
      "eval_accuracy": 0.5031032332583757,
      "eval_loss": 2.302734375,
      "eval_runtime": 40.3592,
      "eval_samples_per_second": 88.406,
      "eval_steps_per_second": 11.051,
      "step": 855000
    },
    {
      "epoch": 0.26,
      "learning_rate": 4.3863356947366904e-05,
      "loss": 2.2781,
      "step": 860000
    },
    {
      "epoch": 0.26,
      "eval_accuracy": 0.5032018616659872,
      "eval_loss": 2.30078125,
      "eval_runtime": 40.4036,
      "eval_samples_per_second": 88.309,
      "eval_steps_per_second": 11.039,
      "step": 860000
    },
    {
      "epoch": 0.26,
      "learning_rate": 4.378850960778017e-05,
      "loss": 2.2749,
      "step": 865000
    },
    {
      "epoch": 0.26,
      "eval_accuracy": 0.5038193850847547,
      "eval_loss": 2.298828125,
      "eval_runtime": 40.3881,
      "eval_samples_per_second": 88.343,
      "eval_steps_per_second": 11.043,
      "step": 865000
    },
    {
      "epoch": 0.26,
      "learning_rate": 4.371366226819343e-05,
      "loss": 2.2729,
      "step": 870000
    },
    {
      "epoch": 0.26,
      "eval_accuracy": 0.5037152773211648,
      "eval_loss": 2.296875,
      "eval_runtime": 40.4456,
      "eval_samples_per_second": 88.217,
      "eval_steps_per_second": 11.027,
      "step": 870000
    },
    {
      "epoch": 0.26,
      "learning_rate": 4.363882990706168e-05,
      "loss": 2.2708,
      "step": 875000
    },
    {
      "epoch": 0.26,
      "eval_accuracy": 0.5038993836820396,
      "eval_loss": 2.296875,
      "eval_runtime": 40.4095,
      "eval_samples_per_second": 88.296,
      "eval_steps_per_second": 11.037,
      "step": 875000
    },
    {
      "epoch": 0.26,
      "learning_rate": 4.3563997545929936e-05,
      "loss": 2.2754,
      "step": 880000
    },
    {
      "epoch": 0.26,
      "eval_accuracy": 0.5038591104155982,
      "eval_loss": 2.296875,
      "eval_runtime": 40.397,
      "eval_samples_per_second": 88.323,
      "eval_steps_per_second": 11.04,
      "step": 880000
    },
    {
      "epoch": 0.27,
      "learning_rate": 4.3489150206343196e-05,
      "loss": 2.2761,
      "step": 885000
    },
    {
      "epoch": 0.27,
      "eval_accuracy": 0.5040640383291909,
      "eval_loss": 2.294921875,
      "eval_runtime": 40.3166,
      "eval_samples_per_second": 88.499,
      "eval_steps_per_second": 11.062,
      "step": 885000
    },
    {
      "epoch": 0.27,
      "learning_rate": 4.341434780212143e-05,
      "loss": 2.2742,
      "step": 890000
    },
    {
      "epoch": 0.27,
      "eval_accuracy": 0.5041032157244366,
      "eval_loss": 2.294921875,
      "eval_runtime": 40.3381,
      "eval_samples_per_second": 88.452,
      "eval_steps_per_second": 11.057,
      "step": 890000
    },
    {
      "epoch": 0.27,
      "learning_rate": 4.3339470505624715e-05,
      "loss": 2.2734,
      "step": 895000
    },
    {
      "epoch": 0.27,
      "eval_accuracy": 0.5040837640107132,
      "eval_loss": 2.294921875,
      "eval_runtime": 40.3833,
      "eval_samples_per_second": 88.353,
      "eval_steps_per_second": 11.044,
      "step": 895000
    },
    {
      "epoch": 0.27,
      "learning_rate": 4.326463814449296e-05,
      "loss": 2.2682,
      "step": 900000
    },
    {
      "epoch": 0.27,
      "eval_accuracy": 0.5043944434946894,
      "eval_loss": 2.29296875,
      "eval_runtime": 40.4818,
      "eval_samples_per_second": 88.138,
      "eval_steps_per_second": 11.017,
      "step": 900000
    },
    {
      "epoch": 0.27,
      "learning_rate": 4.318982076181621e-05,
      "loss": 2.2667,
      "step": 905000
    },
    {
      "epoch": 0.27,
      "eval_accuracy": 0.5045489613332808,
      "eval_loss": 2.29296875,
      "eval_runtime": 40.3614,
      "eval_samples_per_second": 88.401,
      "eval_steps_per_second": 11.05,
      "step": 905000
    },
    {
      "epoch": 0.27,
      "learning_rate": 4.311498840068446e-05,
      "loss": 2.2676,
      "step": 910000
    },
    {
      "epoch": 0.27,
      "eval_accuracy": 0.5045801936623577,
      "eval_loss": 2.29296875,
      "eval_runtime": 40.4147,
      "eval_samples_per_second": 88.285,
      "eval_steps_per_second": 11.036,
      "step": 910000
    },
    {
      "epoch": 0.27,
      "learning_rate": 4.304012608264273e-05,
      "loss": 2.2707,
      "step": 915000
    },
    {
      "epoch": 0.27,
      "eval_accuracy": 0.5046547129036641,
      "eval_loss": 2.291015625,
      "eval_runtime": 40.4009,
      "eval_samples_per_second": 88.315,
      "eval_steps_per_second": 11.039,
      "step": 915000
    },
    {
      "epoch": 0.28,
      "learning_rate": 4.296529372151098e-05,
      "loss": 2.265,
      "step": 920000
    },
    {
      "epoch": 0.28,
      "eval_accuracy": 0.5047700533470098,
      "eval_loss": 2.291015625,
      "eval_runtime": 40.3704,
      "eval_samples_per_second": 88.382,
      "eval_steps_per_second": 11.048,
      "step": 920000
    },
    {
      "epoch": 0.28,
      "learning_rate": 4.289046136037923e-05,
      "loss": 2.2676,
      "step": 925000
    },
    {
      "epoch": 0.28,
      "eval_accuracy": 0.5046149875728206,
      "eval_loss": 2.291015625,
      "eval_runtime": 40.3019,
      "eval_samples_per_second": 88.532,
      "eval_steps_per_second": 11.066,
      "step": 925000
    },
    {
      "epoch": 0.28,
      "learning_rate": 4.281564397770247e-05,
      "loss": 2.2662,
      "step": 930000
    },
    {
      "epoch": 0.28,
      "eval_accuracy": 0.5051503206519119,
      "eval_loss": 2.2890625,
      "eval_runtime": 40.3203,
      "eval_samples_per_second": 88.491,
      "eval_steps_per_second": 11.061,
      "step": 930000
    },
    {
      "epoch": 0.28,
      "learning_rate": 4.274079663811574e-05,
      "loss": 2.2706,
      "step": 935000
    },
    {
      "epoch": 0.28,
      "eval_accuracy": 0.5050968969311223,
      "eval_loss": 2.2890625,
      "eval_runtime": 40.3497,
      "eval_samples_per_second": 88.427,
      "eval_steps_per_second": 11.053,
      "step": 935000
    },
    {
      "epoch": 0.28,
      "learning_rate": 4.2665949298529e-05,
      "loss": 2.2657,
      "step": 940000
    },
    {
      "epoch": 0.28,
      "eval_accuracy": 0.5048788185631814,
      "eval_loss": 2.2890625,
      "eval_runtime": 40.7581,
      "eval_samples_per_second": 87.541,
      "eval_steps_per_second": 10.943,
      "step": 940000
    },
    {
      "epoch": 0.28,
      "learning_rate": 4.259110195894226e-05,
      "loss": 2.2672,
      "step": 945000
    },
    {
      "epoch": 0.28,
      "eval_accuracy": 0.5050453909849252,
      "eval_loss": 2.287109375,
      "eval_runtime": 40.3332,
      "eval_samples_per_second": 88.463,
      "eval_steps_per_second": 11.058,
      "step": 945000
    },
    {
      "epoch": 0.28,
      "learning_rate": 4.9925167638868255e-05,
      "loss": 2.2716,
      "step": 950000
    },
    {
      "epoch": 0.28,
      "eval_accuracy": 0.5037065103515993,
      "eval_loss": 2.296875,
      "eval_runtime": 38.5412,
      "eval_samples_per_second": 92.576,
      "eval_steps_per_second": 11.572,
      "step": 950000
    },
    {
      "epoch": 0.29,
      "learning_rate": 4.9850290342371536e-05,
      "loss": 2.2702,
      "step": 955000
    },
    {
      "epoch": 0.29,
      "eval_accuracy": 0.5036908941870608,
      "eval_loss": 2.298828125,
      "eval_runtime": 39.4253,
      "eval_samples_per_second": 90.5,
      "eval_steps_per_second": 11.313,
      "step": 955000
    },
    {
      "epoch": 0.29,
      "learning_rate": 4.977548793814977e-05,
      "loss": 2.2708,
      "step": 960000
    },
    {
      "epoch": 0.29,
      "eval_accuracy": 0.5035029522770011,
      "eval_loss": 2.298828125,
      "eval_runtime": 39.5074,
      "eval_samples_per_second": 90.312,
      "eval_steps_per_second": 11.289,
      "step": 960000
    },
    {
      "epoch": 0.29,
      "learning_rate": 4.970064059856303e-05,
      "loss": 2.2738,
      "step": 965000
    },
    {
      "epoch": 0.29,
      "eval_accuracy": 0.5035369242840674,
      "eval_loss": 2.298828125,
      "eval_runtime": 39.5917,
      "eval_samples_per_second": 90.12,
      "eval_steps_per_second": 11.265,
      "step": 965000
    },
    {
      "epoch": 0.29,
      "learning_rate": 4.962582321588627e-05,
      "loss": 2.2737,
      "step": 970000
    },
    {
      "epoch": 0.29,
      "eval_accuracy": 0.5035577458367854,
      "eval_loss": 2.298828125,
      "eval_runtime": 39.4627,
      "eval_samples_per_second": 90.415,
      "eval_steps_per_second": 11.302,
      "step": 970000
    },
    {
      "epoch": 0.29,
      "learning_rate": 4.9550990854754526e-05,
      "loss": 2.2763,
      "step": 975000
    },
    {
      "epoch": 0.29,
      "eval_accuracy": 0.49873289892999134,
      "eval_loss": 2.330078125,
      "eval_runtime": 39.5211,
      "eval_samples_per_second": 90.281,
      "eval_steps_per_second": 11.285,
      "step": 975000
    },
    {
      "epoch": 0.29,
      "learning_rate": 4.9476143515167786e-05,
      "loss": 2.2738,
      "step": 980000
    },
    {
      "epoch": 0.29,
      "eval_accuracy": 0.5034662405919458,
      "eval_loss": 2.296875,
      "eval_runtime": 39.4696,
      "eval_samples_per_second": 90.399,
      "eval_steps_per_second": 11.3,
      "step": 980000
    },
    {
      "epoch": 0.3,
      "learning_rate": 4.9401296175581046e-05,
      "loss": 2.2737,
      "step": 985000
    },
    {
      "epoch": 0.3,
      "eval_accuracy": 0.5036182927203469,
      "eval_loss": 2.296875,
      "eval_runtime": 39.6371,
      "eval_samples_per_second": 90.017,
      "eval_steps_per_second": 11.252,
      "step": 985000
    },
    {
      "epoch": 0.3,
      "learning_rate": 4.932644883599431e-05,
      "loss": 2.2748,
      "step": 990000
    },
    {
      "epoch": 0.3,
      "eval_accuracy": 0.5036056902015965,
      "eval_loss": 2.296875,
      "eval_runtime": 39.6139,
      "eval_samples_per_second": 90.069,
      "eval_steps_per_second": 11.259,
      "step": 990000
    },
    {
      "epoch": 0.3,
      "learning_rate": 4.9251631453317545e-05,
      "loss": 2.2724,
      "step": 995000
    },
    {
      "epoch": 0.3,
      "eval_accuracy": 0.5038232206339396,
      "eval_loss": 2.296875,
      "eval_runtime": 39.4746,
      "eval_samples_per_second": 90.387,
      "eval_steps_per_second": 11.298,
      "step": 995000
    },
    {
      "epoch": 0.3,
      "learning_rate": 4.917678411373081e-05,
      "loss": 2.2744,
      "step": 1000000
    },
    {
      "epoch": 0.3,
      "eval_accuracy": 0.5032999421380009,
      "eval_loss": 2.298828125,
      "eval_runtime": 39.6576,
      "eval_samples_per_second": 89.97,
      "eval_steps_per_second": 11.246,
      "step": 1000000
    },
    {
      "epoch": 0.3,
      "learning_rate": 4.9101951752599065e-05,
      "loss": 2.2694,
      "step": 1005000
    },
    {
      "epoch": 0.3,
      "eval_accuracy": 0.5033465166638174,
      "eval_loss": 2.298828125,
      "eval_runtime": 39.6623,
      "eval_samples_per_second": 89.959,
      "eval_steps_per_second": 11.245,
      "step": 1005000
    },
    {
      "epoch": 0.3,
      "learning_rate": 4.9027104413012324e-05,
      "loss": 2.2684,
      "step": 1010000
    },
    {
      "epoch": 0.3,
      "eval_accuracy": 0.5039421226586712,
      "eval_loss": 2.294921875,
      "eval_runtime": 39.6275,
      "eval_samples_per_second": 90.039,
      "eval_steps_per_second": 11.255,
      "step": 1010000
    },
    {
      "epoch": 0.3,
      "learning_rate": 4.895231698724555e-05,
      "loss": 2.2731,
      "step": 1015000
    },
    {
      "epoch": 0.3,
      "eval_accuracy": 0.5039547251774216,
      "eval_loss": 2.294921875,
      "eval_runtime": 39.6334,
      "eval_samples_per_second": 90.025,
      "eval_steps_per_second": 11.253,
      "step": 1015000
    },
    {
      "epoch": 0.31,
      "learning_rate": 4.887746964765881e-05,
      "loss": 2.2714,
      "step": 1020000
    },
    {
      "epoch": 0.31,
      "eval_accuracy": 0.5042445831086797,
      "eval_loss": 2.294921875,
      "eval_runtime": 39.6384,
      "eval_samples_per_second": 90.014,
      "eval_steps_per_second": 11.252,
      "step": 1020000
    },
    {
      "epoch": 0.31,
      "learning_rate": 4.880263728652706e-05,
      "loss": 2.2687,
      "step": 1025000
    },
    {
      "epoch": 0.31,
      "eval_accuracy": 0.5045218385211876,
      "eval_loss": 2.29296875,
      "eval_runtime": 39.6654,
      "eval_samples_per_second": 89.952,
      "eval_steps_per_second": 11.244,
      "step": 1025000
    },
    {
      "epoch": 0.31,
      "learning_rate": 4.872778994694032e-05,
      "loss": 2.2673,
      "step": 1030000
    },
    {
      "epoch": 0.31,
      "eval_accuracy": 0.5046215627999947,
      "eval_loss": 2.29296875,
      "eval_runtime": 39.7655,
      "eval_samples_per_second": 89.726,
      "eval_steps_per_second": 11.216,
      "step": 1030000
    },
    {
      "epoch": 0.31,
      "learning_rate": 4.8652957585808575e-05,
      "loss": 2.2677,
      "step": 1035000
    },
    {
      "epoch": 0.31,
      "eval_accuracy": 0.5044056761744452,
      "eval_loss": 2.29296875,
      "eval_runtime": 39.7885,
      "eval_samples_per_second": 89.674,
      "eval_steps_per_second": 11.209,
      "step": 1035000
    },
    {
      "epoch": 0.31,
      "learning_rate": 4.8578110246221835e-05,
      "loss": 2.265,
      "step": 1040000
    },
    {
      "epoch": 0.31,
      "eval_accuracy": 0.5046538910002674,
      "eval_loss": 2.291015625,
      "eval_runtime": 39.7963,
      "eval_samples_per_second": 89.657,
      "eval_steps_per_second": 11.207,
      "step": 1040000
    },
    {
      "epoch": 0.31,
      "learning_rate": 4.850327788509009e-05,
      "loss": 2.2659,
      "step": 1045000
    },
    {
      "epoch": 0.31,
      "eval_accuracy": 0.504468688768197,
      "eval_loss": 2.291015625,
      "eval_runtime": 40.1905,
      "eval_samples_per_second": 88.777,
      "eval_steps_per_second": 11.097,
      "step": 1045000
    },
    {
      "epoch": 0.31,
      "learning_rate": 4.842849045932331e-05,
      "loss": 2.2633,
      "step": 1050000
    },
    {
      "epoch": 0.31,
      "eval_accuracy": 0.5042100631660157,
      "eval_loss": 2.294921875,
      "eval_runtime": 39.7629,
      "eval_samples_per_second": 89.732,
      "eval_steps_per_second": 11.216,
      "step": 1050000
    },
    {
      "epoch": 0.32,
      "learning_rate": 4.835361316282659e-05,
      "loss": 2.2689,
      "step": 1055000
    },
    {
      "epoch": 0.32,
      "eval_accuracy": 0.5049952548777227,
      "eval_loss": 2.2890625,
      "eval_runtime": 39.8901,
      "eval_samples_per_second": 89.446,
      "eval_steps_per_second": 11.181,
      "step": 1055000
    },
    {
      "epoch": 0.32,
      "learning_rate": 4.827876582323985e-05,
      "loss": 2.2617,
      "step": 1060000
    },
    {
      "epoch": 0.32,
      "eval_accuracy": 0.5049081331176659,
      "eval_loss": 2.2890625,
      "eval_runtime": 39.8913,
      "eval_samples_per_second": 89.443,
      "eval_steps_per_second": 11.18,
      "step": 1060000
    },
    {
      "epoch": 0.32,
      "learning_rate": 4.820390350519813e-05,
      "loss": 2.2613,
      "step": 1065000
    },
    {
      "epoch": 0.32,
      "eval_accuracy": 0.5052440176391427,
      "eval_loss": 2.287109375,
      "eval_runtime": 39.9185,
      "eval_samples_per_second": 89.382,
      "eval_steps_per_second": 11.173,
      "step": 1065000
    },
    {
      "epoch": 0.32,
      "learning_rate": 4.8129086122521366e-05,
      "loss": 2.2649,
      "step": 1070000
    },
    {
      "epoch": 0.32,
      "eval_accuracy": 0.5047081366244537,
      "eval_loss": 2.2890625,
      "eval_runtime": 39.8452,
      "eval_samples_per_second": 89.547,
      "eval_steps_per_second": 11.193,
      "step": 1070000
    },
    {
      "epoch": 0.32,
      "learning_rate": 4.805422380447964e-05,
      "loss": 2.2587,
      "step": 1075000
    },
    {
      "epoch": 0.32,
      "eval_accuracy": 0.505284564873383,
      "eval_loss": 2.287109375,
      "eval_runtime": 39.8746,
      "eval_samples_per_second": 89.481,
      "eval_steps_per_second": 11.185,
      "step": 1075000
    },
    {
      "epoch": 0.32,
      "learning_rate": 4.797939144334789e-05,
      "loss": 2.2641,
      "step": 1080000
    },
    {
      "epoch": 0.32,
      "eval_accuracy": 0.5054223706762402,
      "eval_loss": 2.28515625,
      "eval_runtime": 39.914,
      "eval_samples_per_second": 89.392,
      "eval_steps_per_second": 11.174,
      "step": 1080000
    },
    {
      "epoch": 0.33,
      "learning_rate": 4.7904559082216145e-05,
      "loss": 2.2634,
      "step": 1085000
    },
    {
      "epoch": 0.33,
      "eval_accuracy": 0.5056552433053229,
      "eval_loss": 2.28515625,
      "eval_runtime": 39.8319,
      "eval_samples_per_second": 89.576,
      "eval_steps_per_second": 11.197,
      "step": 1085000
    },
    {
      "epoch": 0.33,
      "learning_rate": 4.7829741699539384e-05,
      "loss": 2.2597,
      "step": 1090000
    },
    {
      "epoch": 0.33,
      "eval_accuracy": 0.5057451047433689,
      "eval_loss": 2.283203125,
      "eval_runtime": 39.976,
      "eval_samples_per_second": 89.254,
      "eval_steps_per_second": 11.157,
      "step": 1090000
    },
    {
      "epoch": 0.33,
      "learning_rate": 4.775487938149766e-05,
      "loss": 2.2572,
      "step": 1095000
    },
    {
      "epoch": 0.33,
      "eval_accuracy": 0.5059667446926958,
      "eval_loss": 2.283203125,
      "eval_runtime": 40.0116,
      "eval_samples_per_second": 89.174,
      "eval_steps_per_second": 11.147,
      "step": 1095000
    },
    {
      "epoch": 0.33,
      "learning_rate": 4.768003204191092e-05,
      "loss": 2.2566,
      "step": 1100000
    },
    {
      "epoch": 0.33,
      "eval_accuracy": 0.5055771624826304,
      "eval_loss": 2.283203125,
      "eval_runtime": 39.963,
      "eval_samples_per_second": 89.283,
      "eval_steps_per_second": 11.16,
      "step": 1100000
    },
    {
      "epoch": 0.33,
      "learning_rate": 4.760524461614414e-05,
      "loss": 2.2576,
      "step": 1105000
    },
    {
      "epoch": 0.33,
      "eval_accuracy": 0.5055905869047775,
      "eval_loss": 2.283203125,
      "eval_runtime": 39.8683,
      "eval_samples_per_second": 89.495,
      "eval_steps_per_second": 11.187,
      "step": 1105000
    },
    {
      "epoch": 0.33,
      "learning_rate": 4.753038229810241e-05,
      "loss": 2.2612,
      "step": 1110000
    },
    {
      "epoch": 0.33,
      "eval_accuracy": 0.505675790890242,
      "eval_loss": 2.283203125,
      "eval_runtime": 39.9091,
      "eval_samples_per_second": 89.403,
      "eval_steps_per_second": 11.175,
      "step": 1110000
    },
    {
      "epoch": 0.33,
      "learning_rate": 4.7455534958515676e-05,
      "loss": 2.2585,
      "step": 1115000
    },
    {
      "epoch": 0.33,
      "eval_accuracy": 0.505924553651662,
      "eval_loss": 2.28125,
      "eval_runtime": 39.8428,
      "eval_samples_per_second": 89.552,
      "eval_steps_per_second": 11.194,
      "step": 1115000
    },
    {
      "epoch": 0.34,
      "learning_rate": 4.738073255429391e-05,
      "loss": 2.2528,
      "step": 1120000
    },
    {
      "epoch": 0.34,
      "eval_accuracy": 0.5059566078841358,
      "eval_loss": 2.28125,
      "eval_runtime": 40.0018,
      "eval_samples_per_second": 89.196,
      "eval_steps_per_second": 11.149,
      "step": 1120000
    },
    {
      "epoch": 0.34,
      "learning_rate": 4.730588521470717e-05,
      "loss": 2.2599,
      "step": 1125000
    },
    {
      "epoch": 0.34,
      "eval_accuracy": 0.5059996208285663,
      "eval_loss": 2.28125,
      "eval_runtime": 39.9769,
      "eval_samples_per_second": 89.251,
      "eval_steps_per_second": 11.156,
      "step": 1125000
    },
    {
      "epoch": 0.34,
      "learning_rate": 4.723105285357542e-05,
      "loss": 2.2556,
      "step": 1130000
    },
    {
      "epoch": 0.34,
      "eval_accuracy": 0.5065730354317075,
      "eval_loss": 2.27734375,
      "eval_runtime": 39.975,
      "eval_samples_per_second": 89.256,
      "eval_steps_per_second": 11.157,
      "step": 1130000
    },
    {
      "epoch": 0.34,
      "learning_rate": 4.715619053553369e-05,
      "loss": 2.2519,
      "step": 1135000
    },
    {
      "epoch": 0.34,
      "eval_accuracy": 0.5063790662300716,
      "eval_loss": 2.279296875,
      "eval_runtime": 40.0596,
      "eval_samples_per_second": 89.067,
      "eval_steps_per_second": 11.133,
      "step": 1135000
    },
    {
      "epoch": 0.34,
      "learning_rate": 4.708135817440194e-05,
      "loss": 2.2567,
      "step": 1140000
    },
    {
      "epoch": 0.34,
      "eval_accuracy": 0.5067524843400006,
      "eval_loss": 2.27734375,
      "eval_runtime": 40.0409,
      "eval_samples_per_second": 89.109,
      "eval_steps_per_second": 11.139,
      "step": 1140000
    },
    {
      "epoch": 0.34,
      "learning_rate": 4.700651083481521e-05,
      "loss": 2.2516,
      "step": 1145000
    },
    {
      "epoch": 0.34,
      "eval_accuracy": 0.506862071459569,
      "eval_loss": 2.275390625,
      "eval_runtime": 39.8652,
      "eval_samples_per_second": 89.502,
      "eval_steps_per_second": 11.188,
      "step": 1145000
    },
    {
      "epoch": 0.34,
      "learning_rate": 4.693166349522847e-05,
      "loss": 2.2533,
      "step": 1150000
    },
    {
      "epoch": 0.34,
      "eval_accuracy": 0.5067752236673111,
      "eval_loss": 2.275390625,
      "eval_runtime": 39.9361,
      "eval_samples_per_second": 89.343,
      "eval_steps_per_second": 11.168,
      "step": 1150000
    },
    {
      "epoch": 0.35,
      "learning_rate": 4.6856846112551706e-05,
      "loss": 2.2532,
      "step": 1155000
    },
    {
      "epoch": 0.35,
      "eval_accuracy": 0.5069639874807674,
      "eval_loss": 2.275390625,
      "eval_runtime": 40.0505,
      "eval_samples_per_second": 89.088,
      "eval_steps_per_second": 11.136,
      "step": 1155000
    },
    {
      "epoch": 0.35,
      "learning_rate": 4.6781998772964966e-05,
      "loss": 2.2572,
      "step": 1160000
    },
    {
      "epoch": 0.35,
      "eval_accuracy": 0.5063629021299353,
      "eval_loss": 2.279296875,
      "eval_runtime": 40.0931,
      "eval_samples_per_second": 88.993,
      "eval_steps_per_second": 11.124,
      "step": 1160000
    },
    {
      "epoch": 0.35,
      "learning_rate": 4.670712147646825e-05,
      "loss": 2.2514,
      "step": 1165000
    },
    {
      "epoch": 0.35,
      "eval_accuracy": 0.5071686414265613,
      "eval_loss": 2.2734375,
      "eval_runtime": 40.4455,
      "eval_samples_per_second": 88.217,
      "eval_steps_per_second": 11.027,
      "step": 1165000
    },
    {
      "epoch": 0.35,
      "learning_rate": 4.66322891153365e-05,
      "loss": 2.2471,
      "step": 1170000
    },
    {
      "epoch": 0.35,
      "eval_accuracy": 0.5073409671720824,
      "eval_loss": 2.2734375,
      "eval_runtime": 40.0562,
      "eval_samples_per_second": 89.075,
      "eval_steps_per_second": 11.134,
      "step": 1170000
    },
    {
      "epoch": 0.35,
      "learning_rate": 4.655745675420475e-05,
      "loss": 2.2524,
      "step": 1175000
    },
    {
      "epoch": 0.35,
      "eval_accuracy": 0.50760562006584,
      "eval_loss": 2.271484375,
      "eval_runtime": 40.09,
      "eval_samples_per_second": 89.0,
      "eval_steps_per_second": 11.125,
      "step": 1175000
    },
    {
      "epoch": 0.35,
      "learning_rate": 4.648260941461802e-05,
      "loss": 2.247,
      "step": 1180000
    },
    {
      "epoch": 0.35,
      "eval_accuracy": 0.5072979542276519,
      "eval_loss": 2.271484375,
      "eval_runtime": 40.3075,
      "eval_samples_per_second": 88.52,
      "eval_steps_per_second": 11.065,
      "step": 1180000
    },
    {
      "epoch": 0.35,
      "learning_rate": 4.640780701039625e-05,
      "loss": 2.2491,
      "step": 1185000
    },
    {
      "epoch": 0.35,
      "eval_accuracy": 0.5076653450460047,
      "eval_loss": 2.271484375,
      "eval_runtime": 40.1522,
      "eval_samples_per_second": 88.862,
      "eval_steps_per_second": 11.108,
      "step": 1185000
    },
    {
      "epoch": 0.36,
      "learning_rate": 4.63329746492645e-05,
      "loss": 2.2481,
      "step": 1190000
    },
    {
      "epoch": 0.36,
      "eval_accuracy": 0.5078031508488619,
      "eval_loss": 2.26953125,
      "eval_runtime": 40.1488,
      "eval_samples_per_second": 88.869,
      "eval_steps_per_second": 11.109,
      "step": 1190000
    },
    {
      "epoch": 0.36,
      "learning_rate": 4.992515266041327e-05,
      "loss": 2.2465,
      "step": 1195000
    },
    {
      "epoch": 0.36,
      "eval_accuracy": 0.5069333030872883,
      "eval_loss": 2.2734375,
      "eval_runtime": 39.5233,
      "eval_samples_per_second": 90.276,
      "eval_steps_per_second": 11.284,
      "step": 1195000
    },
    {
      "epoch": 0.36,
      "learning_rate": 4.985030532082652e-05,
      "loss": 2.2494,
      "step": 1200000
    },
    {
      "epoch": 0.36,
      "eval_accuracy": 0.5067053618785863,
      "eval_loss": 2.279296875,
      "eval_runtime": 38.5856,
      "eval_samples_per_second": 92.47,
      "eval_steps_per_second": 11.559,
      "step": 1200000
    },
    {
      "epoch": 0.36,
      "learning_rate": 4.977545798123979e-05,
      "loss": 2.2541,
      "step": 1205000
    },
    {
      "epoch": 0.36,
      "eval_accuracy": 0.5068631673307646,
      "eval_loss": 2.275390625,
      "eval_runtime": 39.5375,
      "eval_samples_per_second": 90.244,
      "eval_steps_per_second": 11.28,
      "step": 1205000
    },
    {
      "epoch": 0.36,
      "learning_rate": 4.9700625620108035e-05,
      "loss": 2.25,
      "step": 1210000
    },
    {
      "epoch": 0.36,
      "eval_accuracy": 0.5067459091128265,
      "eval_loss": 2.275390625,
      "eval_runtime": 39.4824,
      "eval_samples_per_second": 90.369,
      "eval_steps_per_second": 11.296,
      "step": 1210000
    },
    {
      "epoch": 0.36,
      "learning_rate": 4.962582321588627e-05,
      "loss": 2.25,
      "step": 1215000
    },
    {
      "epoch": 0.36,
      "eval_accuracy": 0.5064313940796654,
      "eval_loss": 2.279296875,
      "eval_runtime": 39.3855,
      "eval_samples_per_second": 90.592,
      "eval_steps_per_second": 11.324,
      "step": 1215000
    },
    {
      "epoch": 0.37,
      "learning_rate": 4.955096089784455e-05,
      "loss": 2.2508,
      "step": 1220000
    },
    {
      "epoch": 0.37,
      "eval_accuracy": 0.507028095945715,
      "eval_loss": 2.2734375,
      "eval_runtime": 39.5116,
      "eval_samples_per_second": 90.303,
      "eval_steps_per_second": 11.288,
      "step": 1220000
    },
    {
      "epoch": 0.37,
      "learning_rate": 4.947612853671279e-05,
      "loss": 2.2496,
      "step": 1225000
    },
    {
      "epoch": 0.37,
      "eval_accuracy": 0.507010562006584,
      "eval_loss": 2.2734375,
      "eval_runtime": 39.5165,
      "eval_samples_per_second": 90.291,
      "eval_steps_per_second": 11.286,
      "step": 1225000
    },
    {
      "epoch": 0.37,
      "learning_rate": 4.940131115403604e-05,
      "loss": 2.2499,
      "step": 1230000
    },
    {
      "epoch": 0.37,
      "eval_accuracy": 0.5073475423992566,
      "eval_loss": 2.2734375,
      "eval_runtime": 39.4273,
      "eval_samples_per_second": 90.496,
      "eval_steps_per_second": 11.312,
      "step": 1230000
    },
    {
      "epoch": 0.37,
      "learning_rate": 4.932647879290429e-05,
      "loss": 2.2467,
      "step": 1235000
    },
    {
      "epoch": 0.37,
      "eval_accuracy": 0.5075538401518439,
      "eval_loss": 2.271484375,
      "eval_runtime": 39.5247,
      "eval_samples_per_second": 90.273,
      "eval_steps_per_second": 11.284,
      "step": 1235000
    },
    {
      "epoch": 0.37,
      "learning_rate": 4.925164643177254e-05,
      "loss": 2.2497,
      "step": 1240000
    },
    {
      "epoch": 0.37,
      "eval_accuracy": 0.5073163100701796,
      "eval_loss": 2.271484375,
      "eval_runtime": 38.6276,
      "eval_samples_per_second": 92.369,
      "eval_steps_per_second": 11.546,
      "step": 1240000
    },
    {
      "epoch": 0.37,
      "learning_rate": 4.917678411373081e-05,
      "loss": 2.2463,
      "step": 1245000
    },
    {
      "epoch": 0.37,
      "eval_accuracy": 0.5073409671720824,
      "eval_loss": 2.271484375,
      "eval_runtime": 39.5689,
      "eval_samples_per_second": 90.172,
      "eval_steps_per_second": 11.271,
      "step": 1245000
    },
    {
      "epoch": 0.37,
      "learning_rate": 4.910196673105406e-05,
      "loss": 2.2479,
      "step": 1250000
    },
    {
      "epoch": 0.37,
      "eval_accuracy": 0.5077573982264421,
      "eval_loss": 2.26953125,
      "eval_runtime": 39.6608,
      "eval_samples_per_second": 89.963,
      "eval_steps_per_second": 11.245,
      "step": 1250000
    },
    {
      "epoch": 0.38,
      "learning_rate": 4.902711939146731e-05,
      "loss": 2.2445,
      "step": 1255000
    },
    {
      "epoch": 0.38,
      "eval_accuracy": 0.5078749304121791,
      "eval_loss": 2.26953125,
      "eval_runtime": 39.6577,
      "eval_samples_per_second": 89.97,
      "eval_steps_per_second": 11.246,
      "step": 1255000
    },
    {
      "epoch": 0.38,
      "learning_rate": 4.89522420949706e-05,
      "loss": 2.247,
      "step": 1260000
    },
    {
      "epoch": 0.38,
      "eval_accuracy": 0.5078483555356837,
      "eval_loss": 2.26953125,
      "eval_runtime": 39.6203,
      "eval_samples_per_second": 90.055,
      "eval_steps_per_second": 11.257,
      "step": 1260000
    },
    {
      "epoch": 0.38,
      "learning_rate": 4.887743969074883e-05,
      "loss": 2.2443,
      "step": 1265000
    },
    {
      "epoch": 0.38,
      "eval_accuracy": 0.5078826015105489,
      "eval_loss": 2.267578125,
      "eval_runtime": 39.6508,
      "eval_samples_per_second": 89.986,
      "eval_steps_per_second": 11.248,
      "step": 1265000
    },
    {
      "epoch": 0.38,
      "learning_rate": 4.880262230807207e-05,
      "loss": 2.243,
      "step": 1270000
    },
    {
      "epoch": 0.38,
      "eval_accuracy": 0.5080672558070215,
      "eval_loss": 2.267578125,
      "eval_runtime": 39.6639,
      "eval_samples_per_second": 89.956,
      "eval_steps_per_second": 11.244,
      "step": 1270000
    },
    {
      "epoch": 0.38,
      "learning_rate": 4.8727804925395315e-05,
      "loss": 2.2454,
      "step": 1275000
    },
    {
      "epoch": 0.38,
      "eval_accuracy": 0.5076889062767118,
      "eval_loss": 2.271484375,
      "eval_runtime": 39.6373,
      "eval_samples_per_second": 90.016,
      "eval_steps_per_second": 11.252,
      "step": 1275000
    },
    {
      "epoch": 0.38,
      "learning_rate": 4.86529126504436e-05,
      "loss": 2.2451,
      "step": 1280000
    },
    {
      "epoch": 0.38,
      "eval_accuracy": 0.5080541053526733,
      "eval_loss": 2.26953125,
      "eval_runtime": 39.7457,
      "eval_samples_per_second": 89.771,
      "eval_steps_per_second": 11.221,
      "step": 1280000
    },
    {
      "epoch": 0.38,
      "learning_rate": 4.8578080289311855e-05,
      "loss": 2.2455,
      "step": 1285000
    },
    {
      "epoch": 0.38,
      "eval_accuracy": 0.5083853324215685,
      "eval_loss": 2.265625,
      "eval_runtime": 39.6403,
      "eval_samples_per_second": 90.009,
      "eval_steps_per_second": 11.251,
      "step": 1285000
    },
    {
      "epoch": 0.39,
      "learning_rate": 4.850324792818011e-05,
      "loss": 2.241,
      "step": 1290000
    },
    {
      "epoch": 0.39,
      "eval_accuracy": 0.508259307234065,
      "eval_loss": 2.267578125,
      "eval_runtime": 40.1652,
      "eval_samples_per_second": 88.833,
      "eval_steps_per_second": 11.104,
      "step": 1290000
    },
    {
      "epoch": 0.39,
      "learning_rate": 4.8428415567048354e-05,
      "loss": 2.243,
      "step": 1295000
    },
    {
      "epoch": 0.39,
      "eval_accuracy": 0.5085801235266012,
      "eval_loss": 2.263671875,
      "eval_runtime": 39.68,
      "eval_samples_per_second": 89.919,
      "eval_steps_per_second": 11.24,
      "step": 1295000
    },
    {
      "epoch": 0.39,
      "learning_rate": 4.8353553249006635e-05,
      "loss": 2.2408,
      "step": 1300000
    },
    {
      "epoch": 0.39,
      "eval_accuracy": 0.5084371123355645,
      "eval_loss": 2.263671875,
      "eval_runtime": 39.9223,
      "eval_samples_per_second": 89.374,
      "eval_steps_per_second": 11.172,
      "step": 1300000
    },
    {
      "epoch": 0.39,
      "learning_rate": 4.827876582323985e-05,
      "loss": 2.2508,
      "step": 1305000
    },
    {
      "epoch": 0.39,
      "eval_accuracy": 0.5063459161264021,
      "eval_loss": 2.279296875,
      "eval_runtime": 39.7588,
      "eval_samples_per_second": 89.741,
      "eval_steps_per_second": 11.218,
      "step": 1305000
    },
    {
      "epoch": 0.39,
      "learning_rate": 4.820396341901809e-05,
      "loss": 2.252,
      "step": 1310000
    },
    {
      "epoch": 0.39,
      "eval_accuracy": 0.504651699257876,
      "eval_loss": 2.291015625,
      "eval_runtime": 39.8037,
      "eval_samples_per_second": 89.64,
      "eval_steps_per_second": 11.205,
      "step": 1310000
    },
    {
      "epoch": 0.39,
      "learning_rate": 4.8129146036341324e-05,
      "loss": 2.7482,
      "step": 1315000
    },
    {
      "epoch": 0.39,
      "eval_accuracy": 0.4505951128528157,
      "eval_loss": 2.646484375,
      "eval_runtime": 39.8831,
      "eval_samples_per_second": 89.462,
      "eval_steps_per_second": 11.183,
      "step": 1315000
    },
    {
      "epoch": 0.4,
      "learning_rate": 4.805426873984461e-05,
      "loss": 2.4189,
      "step": 1320000
    },
    {
      "epoch": 0.4,
      "eval_accuracy": 0.5070354930762858,
      "eval_loss": 2.275390625,
      "eval_runtime": 39.9021,
      "eval_samples_per_second": 89.419,
      "eval_steps_per_second": 11.177,
      "step": 1320000
    },
    {
      "epoch": 0.4,
      "learning_rate": 4.797939144334789e-05,
      "loss": 2.2446,
      "step": 1325000
    },
    {
      "epoch": 0.4,
      "eval_accuracy": 0.5081412271127301,
      "eval_loss": 2.267578125,
      "eval_runtime": 39.8679,
      "eval_samples_per_second": 89.495,
      "eval_steps_per_second": 11.187,
      "step": 1325000
    },
    {
      "epoch": 0.4,
      "learning_rate": 4.790457406067113e-05,
      "loss": 2.2416,
      "step": 1330000
    },
    {
      "epoch": 0.4,
      "eval_accuracy": 0.5086858750969846,
      "eval_loss": 2.263671875,
      "eval_runtime": 39.8423,
      "eval_samples_per_second": 89.553,
      "eval_steps_per_second": 11.194,
      "step": 1330000
    },
    {
      "epoch": 0.4,
      "learning_rate": 4.78297267210844e-05,
      "loss": 2.2421,
      "step": 1335000
    },
    {
      "epoch": 0.4,
      "eval_accuracy": 0.5087765584384274,
      "eval_loss": 2.26171875,
      "eval_runtime": 39.9585,
      "eval_samples_per_second": 89.293,
      "eval_steps_per_second": 11.162,
      "step": 1335000
    },
    {
      "epoch": 0.4,
      "learning_rate": 4.775487938149766e-05,
      "loss": 2.2367,
      "step": 1340000
    },
    {
      "epoch": 0.4,
      "eval_accuracy": 0.509168606358683,
      "eval_loss": 2.26171875,
      "eval_runtime": 39.8472,
      "eval_samples_per_second": 89.542,
      "eval_steps_per_second": 11.193,
      "step": 1340000
    },
    {
      "epoch": 0.4,
      "learning_rate": 4.768001706345593e-05,
      "loss": 2.2355,
      "step": 1345000
    },
    {
      "epoch": 0.4,
      "eval_accuracy": 0.5090864160190068,
      "eval_loss": 2.259765625,
      "eval_runtime": 39.8651,
      "eval_samples_per_second": 89.502,
      "eval_steps_per_second": 11.188,
      "step": 1345000
    },
    {
      "epoch": 0.4,
      "learning_rate": 4.760518470232418e-05,
      "loss": 2.2379,
      "step": 1350000
    },
    {
      "epoch": 0.4,
      "eval_accuracy": 0.5093981913741786,
      "eval_loss": 2.259765625,
      "eval_runtime": 39.8769,
      "eval_samples_per_second": 89.475,
      "eval_steps_per_second": 11.184,
      "step": 1350000
    },
    {
      "epoch": 0.41,
      "learning_rate": 4.7530337362737444e-05,
      "loss": 2.2365,
      "step": 1355000
    },
    {
      "epoch": 0.41,
      "eval_accuracy": 0.509393259953798,
      "eval_loss": 2.259765625,
      "eval_runtime": 39.8496,
      "eval_samples_per_second": 89.537,
      "eval_steps_per_second": 11.192,
      "step": 1355000
    },
    {
      "epoch": 0.41,
      "learning_rate": 4.745550500160569e-05,
      "loss": 2.2379,
      "step": 1360000
    },
    {
      "epoch": 0.41,
      "eval_accuracy": 0.5091491546449597,
      "eval_loss": 2.2578125,
      "eval_runtime": 39.8235,
      "eval_samples_per_second": 89.595,
      "eval_steps_per_second": 11.199,
      "step": 1360000
    },
    {
      "epoch": 0.41,
      "learning_rate": 4.738067264047394e-05,
      "loss": 2.235,
      "step": 1365000
    },
    {
      "epoch": 0.41,
      "eval_accuracy": 0.5094527109661638,
      "eval_loss": 2.2578125,
      "eval_runtime": 38.8651,
      "eval_samples_per_second": 91.805,
      "eval_steps_per_second": 11.476,
      "step": 1365000
    },
    {
      "epoch": 0.41,
      "learning_rate": 4.730582530088721e-05,
      "loss": 2.236,
      "step": 1370000
    },
    {
      "epoch": 0.41,
      "eval_accuracy": 0.5093398362330085,
      "eval_loss": 2.2578125,
      "eval_runtime": 40.9049,
      "eval_samples_per_second": 87.227,
      "eval_steps_per_second": 10.903,
      "step": 1370000
    },
    {
      "epoch": 0.41,
      "learning_rate": 4.7230992939755456e-05,
      "loss": 2.2344,
      "step": 1375000
    },
    {
      "epoch": 0.41,
      "eval_accuracy": 0.5095472298567916,
      "eval_loss": 2.2578125,
      "eval_runtime": 39.9487,
      "eval_samples_per_second": 89.314,
      "eval_steps_per_second": 11.164,
      "step": 1375000
    },
    {
      "epoch": 0.41,
      "learning_rate": 4.715614560016872e-05,
      "loss": 2.2348,
      "step": 1380000
    },
    {
      "epoch": 0.41,
      "eval_accuracy": 0.5095688733129063,
      "eval_loss": 2.255859375,
      "eval_runtime": 39.951,
      "eval_samples_per_second": 89.309,
      "eval_steps_per_second": 11.164,
      "step": 1380000
    },
    {
      "epoch": 0.41,
      "learning_rate": 4.7081313239036975e-05,
      "loss": 2.2306,
      "step": 1385000
    },
    {
      "epoch": 0.41,
      "eval_accuracy": 0.5097368155736447,
      "eval_loss": 2.255859375,
      "eval_runtime": 40.0156,
      "eval_samples_per_second": 89.165,
      "eval_steps_per_second": 11.146,
      "step": 1385000
    },
    {
      "epoch": 0.42,
      "learning_rate": 4.7006495856360214e-05,
      "loss": 2.2293,
      "step": 1390000
    },
    {
      "epoch": 0.42,
      "eval_accuracy": 0.5097521577703843,
      "eval_loss": 2.255859375,
      "eval_runtime": 40.0042,
      "eval_samples_per_second": 89.191,
      "eval_steps_per_second": 11.149,
      "step": 1390000
    },
    {
      "epoch": 0.42,
      "learning_rate": 4.693166349522847e-05,
      "loss": 2.2311,
      "step": 1395000
    },
    {
      "epoch": 0.42,
      "eval_accuracy": 0.510102562585204,
      "eval_loss": 2.25390625,
      "eval_runtime": 39.9554,
      "eval_samples_per_second": 89.3,
      "eval_steps_per_second": 11.162,
      "step": 1395000
    },
    {
      "epoch": 0.42,
      "learning_rate": 4.685683113409672e-05,
      "loss": 2.231,
      "step": 1400000
    },
    {
      "epoch": 0.42,
      "eval_accuracy": 0.5101116035225683,
      "eval_loss": 2.25390625,
      "eval_runtime": 39.9882,
      "eval_samples_per_second": 89.226,
      "eval_steps_per_second": 11.153,
      "step": 1400000
    },
    {
      "epoch": 0.42,
      "learning_rate": 4.678201375141996e-05,
      "loss": 2.2272,
      "step": 1405000
    },
    {
      "epoch": 0.42,
      "eval_accuracy": 0.5102126976403701,
      "eval_loss": 2.251953125,
      "eval_runtime": 40.3186,
      "eval_samples_per_second": 88.495,
      "eval_steps_per_second": 11.062,
      "step": 1405000
    },
    {
      "epoch": 0.42,
      "learning_rate": 4.670718139028821e-05,
      "loss": 2.2264,
      "step": 1410000
    },
    {
      "epoch": 0.42,
      "eval_accuracy": 0.5102436560016482,
      "eval_loss": 2.25390625,
      "eval_runtime": 40.0007,
      "eval_samples_per_second": 89.198,
      "eval_steps_per_second": 11.15,
      "step": 1410000
    },
    {
      "epoch": 0.42,
      "learning_rate": 4.6632349029156465e-05,
      "loss": 2.2295,
      "step": 1415000
    },
    {
      "epoch": 0.42,
      "eval_accuracy": 0.5104469401084474,
      "eval_loss": 2.251953125,
      "eval_runtime": 40.1353,
      "eval_samples_per_second": 88.899,
      "eval_steps_per_second": 11.112,
      "step": 1415000
    },
    {
      "epoch": 0.43,
      "learning_rate": 4.655753164647971e-05,
      "loss": 2.2281,
      "step": 1420000
    },
    {
      "epoch": 0.43,
      "eval_accuracy": 0.5103937903554567,
      "eval_loss": 2.251953125,
      "eval_runtime": 40.0088,
      "eval_samples_per_second": 89.18,
      "eval_steps_per_second": 11.148,
      "step": 1420000
    },
    {
      "epoch": 0.43,
      "learning_rate": 4.6482699285347956e-05,
      "loss": 2.2234,
      "step": 1425000
    },
    {
      "epoch": 0.43,
      "eval_accuracy": 0.5106672102187797,
      "eval_loss": 2.25,
      "eval_runtime": 40.1918,
      "eval_samples_per_second": 88.774,
      "eval_steps_per_second": 11.097,
      "step": 1425000
    },
    {
      "epoch": 0.43,
      "learning_rate": 4.64078819026712e-05,
      "loss": 2.2293,
      "step": 1430000
    },
    {
      "epoch": 0.43,
      "eval_accuracy": 0.5107220037785639,
      "eval_loss": 2.25,
      "eval_runtime": 40.1338,
      "eval_samples_per_second": 88.903,
      "eval_steps_per_second": 11.113,
      "step": 1430000
    },
    {
      "epoch": 0.43,
      "learning_rate": 4.633306451999444e-05,
      "loss": 2.2256,
      "step": 1435000
    },
    {
      "epoch": 0.43,
      "eval_accuracy": 0.5108652889373995,
      "eval_loss": 2.25,
      "eval_runtime": 40.1228,
      "eval_samples_per_second": 88.927,
      "eval_steps_per_second": 11.116,
      "step": 1435000
    },
    {
      "epoch": 0.43,
      "learning_rate": 4.6258232158862694e-05,
      "loss": 2.2247,
      "step": 1440000
    },
    {
      "epoch": 0.43,
      "eval_accuracy": 0.5107954271486747,
      "eval_loss": 2.25,
      "eval_runtime": 40.0563,
      "eval_samples_per_second": 89.075,
      "eval_steps_per_second": 11.134,
      "step": 1440000
    },
    {
      "epoch": 0.43,
      "learning_rate": 4.6183384819275954e-05,
      "loss": 2.222,
      "step": 1445000
    },
    {
      "epoch": 0.43,
      "eval_accuracy": 0.510766386561989,
      "eval_loss": 2.25,
      "eval_runtime": 40.2217,
      "eval_samples_per_second": 88.708,
      "eval_steps_per_second": 11.089,
      "step": 1445000
    },
    {
      "epoch": 0.43,
      "learning_rate": 4.61085674365992e-05,
      "loss": 2.2228,
      "step": 1450000
    },
    {
      "epoch": 0.43,
      "eval_accuracy": 0.5106184439505719,
      "eval_loss": 2.248046875,
      "eval_runtime": 40.5305,
      "eval_samples_per_second": 88.032,
      "eval_steps_per_second": 11.004,
      "step": 1450000
    },
    {
      "epoch": 0.44,
      "learning_rate": 4.603372009701246e-05,
      "loss": 2.2241,
      "step": 1455000
    },
    {
      "epoch": 0.44,
      "eval_accuracy": 0.5110554225898505,
      "eval_loss": 2.248046875,
      "eval_runtime": 40.2413,
      "eval_samples_per_second": 88.665,
      "eval_steps_per_second": 11.083,
      "step": 1455000
    },
    {
      "epoch": 0.44,
      "learning_rate": 4.595891769279069e-05,
      "loss": 2.2219,
      "step": 1460000
    },
    {
      "epoch": 0.44,
      "eval_accuracy": 0.511077613981563,
      "eval_loss": 2.24609375,
      "eval_runtime": 40.2762,
      "eval_samples_per_second": 88.588,
      "eval_steps_per_second": 11.074,
      "step": 1460000
    },
    {
      "epoch": 0.44,
      "learning_rate": 4.5884085331658944e-05,
      "loss": 2.2219,
      "step": 1465000
    },
    {
      "epoch": 0.44,
      "eval_accuracy": 0.5112833637985525,
      "eval_loss": 2.24609375,
      "eval_runtime": 40.2334,
      "eval_samples_per_second": 88.682,
      "eval_steps_per_second": 11.085,
      "step": 1465000
    },
    {
      "epoch": 0.44,
      "learning_rate": 4.58092529705272e-05,
      "loss": 2.2215,
      "step": 1470000
    },
    {
      "epoch": 0.44,
      "eval_accuracy": 0.5112595286000464,
      "eval_loss": 2.24609375,
      "eval_runtime": 40.2987,
      "eval_samples_per_second": 88.539,
      "eval_steps_per_second": 11.067,
      "step": 1470000
    },
    {
      "epoch": 0.44,
      "learning_rate": 4.573445056630543e-05,
      "loss": 2.2193,
      "step": 1475000
    },
    {
      "epoch": 0.44,
      "eval_accuracy": 0.5116091115114694,
      "eval_loss": 2.244140625,
      "eval_runtime": 40.1594,
      "eval_samples_per_second": 88.846,
      "eval_steps_per_second": 11.106,
      "step": 1475000
    },
    {
      "epoch": 0.44,
      "learning_rate": 4.56595882482637e-05,
      "loss": 2.2183,
      "step": 1480000
    },
    {
      "epoch": 0.44,
      "eval_accuracy": 0.5114707577730144,
      "eval_loss": 2.244140625,
      "eval_runtime": 40.9626,
      "eval_samples_per_second": 87.104,
      "eval_steps_per_second": 10.888,
      "step": 1480000
    },
    {
      "epoch": 0.44,
      "learning_rate": 4.5584755887131956e-05,
      "loss": 2.2177,
      "step": 1485000
    },
    {
      "epoch": 0.44,
      "eval_accuracy": 0.5116211660946219,
      "eval_loss": 2.244140625,
      "eval_runtime": 40.3714,
      "eval_samples_per_second": 88.379,
      "eval_steps_per_second": 11.047,
      "step": 1485000
    },
    {
      "epoch": 0.45,
      "learning_rate": 4.55099235260002e-05,
      "loss": 2.2211,
      "step": 1490000
    },
    {
      "epoch": 0.45,
      "eval_accuracy": 0.5115852763129632,
      "eval_loss": 2.2421875,
      "eval_runtime": 40.2564,
      "eval_samples_per_second": 88.632,
      "eval_steps_per_second": 11.079,
      "step": 1490000
    },
    {
      "epoch": 0.45,
      "learning_rate": 4.5435091164868455e-05,
      "loss": 2.2183,
      "step": 1495000
    },
    {
      "epoch": 0.45,
      "eval_accuracy": 0.5118184229098449,
      "eval_loss": 2.2421875,
      "eval_runtime": 40.2315,
      "eval_samples_per_second": 88.687,
      "eval_steps_per_second": 11.086,
      "step": 1495000
    },
    {
      "epoch": 0.45,
      "learning_rate": 4.5360243825281715e-05,
      "loss": 2.2182,
      "step": 1500000
    },
    {
      "epoch": 0.45,
      "eval_accuracy": 0.5120186933708559,
      "eval_loss": 2.240234375,
      "eval_runtime": 40.3125,
      "eval_samples_per_second": 88.509,
      "eval_steps_per_second": 11.064,
      "step": 1500000
    },
    {
      "epoch": 0.45,
      "learning_rate": 4.528539648569498e-05,
      "loss": 2.2148,
      "step": 1505000
    },
    {
      "epoch": 0.45,
      "eval_accuracy": 0.5121849918248009,
      "eval_loss": 2.240234375,
      "eval_runtime": 40.3172,
      "eval_samples_per_second": 88.498,
      "eval_steps_per_second": 11.062,
      "step": 1505000
    },
    {
      "epoch": 0.45,
      "learning_rate": 4.521059408147321e-05,
      "loss": 2.2217,
      "step": 1510000
    },
    {
      "epoch": 0.45,
      "eval_accuracy": 0.5122685520034718,
      "eval_loss": 2.240234375,
      "eval_runtime": 40.2766,
      "eval_samples_per_second": 88.587,
      "eval_steps_per_second": 11.073,
      "step": 1510000
    },
    {
      "epoch": 0.45,
      "learning_rate": 4.5135761720341466e-05,
      "loss": 2.2117,
      "step": 1515000
    },
    {
      "epoch": 0.45,
      "eval_accuracy": 0.5123701940568713,
      "eval_loss": 2.23828125,
      "eval_runtime": 40.4763,
      "eval_samples_per_second": 88.15,
      "eval_steps_per_second": 11.019,
      "step": 1515000
    },
    {
      "epoch": 0.46,
      "learning_rate": 4.5060944337664705e-05,
      "loss": 2.2152,
      "step": 1520000
    },
    {
      "epoch": 0.46,
      "eval_accuracy": 0.5123003322681465,
      "eval_loss": 2.23828125,
      "eval_runtime": 40.309,
      "eval_samples_per_second": 88.516,
      "eval_steps_per_second": 11.065,
      "step": 1520000
    },
    {
      "epoch": 0.46,
      "learning_rate": 4.4986096998077965e-05,
      "loss": 2.2148,
      "step": 1525000
    },
    {
      "epoch": 0.46,
      "eval_accuracy": 0.5124967671799727,
      "eval_loss": 2.23828125,
      "eval_runtime": 40.2971,
      "eval_samples_per_second": 88.542,
      "eval_steps_per_second": 11.068,
      "step": 1525000
    },
    {
      "epoch": 0.46,
      "learning_rate": 4.491127961540121e-05,
      "loss": 2.2151,
      "step": 1530000
    },
    {
      "epoch": 0.46,
      "eval_accuracy": 0.5127488175549798,
      "eval_loss": 2.236328125,
      "eval_runtime": 40.3675,
      "eval_samples_per_second": 88.388,
      "eval_steps_per_second": 11.049,
      "step": 1530000
    },
    {
      "epoch": 0.46,
      "learning_rate": 4.483646223272445e-05,
      "loss": 2.2129,
      "step": 1535000
    },
    {
      "epoch": 0.46,
      "eval_accuracy": 0.5127022430291633,
      "eval_loss": 2.236328125,
      "eval_runtime": 40.4605,
      "eval_samples_per_second": 88.185,
      "eval_steps_per_second": 11.023,
      "step": 1535000
    },
    {
      "epoch": 0.46,
      "learning_rate": 4.47616298715927e-05,
      "loss": 2.2145,
      "step": 1540000
    },
    {
      "epoch": 0.46,
      "eval_accuracy": 0.5127690911721,
      "eval_loss": 2.236328125,
      "eval_runtime": 40.376,
      "eval_samples_per_second": 88.369,
      "eval_steps_per_second": 11.046,
      "step": 1540000
    },
    {
      "epoch": 0.46,
      "learning_rate": 4.468681248891595e-05,
      "loss": 2.2099,
      "step": 1545000
    },
    {
      "epoch": 0.46,
      "eval_accuracy": 0.5128871712934349,
      "eval_loss": 2.236328125,
      "eval_runtime": 40.3585,
      "eval_samples_per_second": 88.408,
      "eval_steps_per_second": 11.051,
      "step": 1545000
    },
    {
      "epoch": 0.46,
      "learning_rate": 4.46119651493292e-05,
      "loss": 2.2125,
      "step": 1550000
    },
    {
      "epoch": 0.46,
      "eval_accuracy": 0.5131964809384164,
      "eval_loss": 2.234375,
      "eval_runtime": 40.3163,
      "eval_samples_per_second": 88.5,
      "eval_steps_per_second": 11.063,
      "step": 1550000
    },
    {
      "epoch": 0.47,
      "learning_rate": 4.453713278819746e-05,
      "loss": 2.2101,
      "step": 1555000
    },
    {
      "epoch": 0.47,
      "eval_accuracy": 0.5130504561015916,
      "eval_loss": 2.234375,
      "eval_runtime": 40.2993,
      "eval_samples_per_second": 88.537,
      "eval_steps_per_second": 11.067,
      "step": 1555000
    },
    {
      "epoch": 0.47,
      "learning_rate": 4.4462300427065714e-05,
      "loss": 2.211,
      "step": 1560000
    },
    {
      "epoch": 0.47,
      "eval_accuracy": 0.5132159326521398,
      "eval_loss": 2.234375,
      "eval_runtime": 40.3465,
      "eval_samples_per_second": 88.434,
      "eval_steps_per_second": 11.054,
      "step": 1560000
    },
    {
      "epoch": 0.47,
      "learning_rate": 4.438743810902398e-05,
      "loss": 2.2086,
      "step": 1565000
    },
    {
      "epoch": 0.47,
      "eval_accuracy": 0.5131567556075729,
      "eval_loss": 2.234375,
      "eval_runtime": 40.256,
      "eval_samples_per_second": 88.633,
      "eval_steps_per_second": 11.079,
      "step": 1565000
    },
    {
      "epoch": 0.47,
      "learning_rate": 4.4312605747892234e-05,
      "loss": 2.2137,
      "step": 1570000
    },
    {
      "epoch": 0.47,
      "eval_accuracy": 0.5131545638651815,
      "eval_loss": 2.232421875,
      "eval_runtime": 40.2935,
      "eval_samples_per_second": 88.55,
      "eval_steps_per_second": 11.069,
      "step": 1570000
    },
    {
      "epoch": 0.47,
      "learning_rate": 4.423778836521548e-05,
      "loss": 2.2122,
      "step": 1575000
    },
    {
      "epoch": 0.47,
      "eval_accuracy": 0.5134236002437218,
      "eval_loss": 2.232421875,
      "eval_runtime": 40.3698,
      "eval_samples_per_second": 88.383,
      "eval_steps_per_second": 11.048,
      "step": 1575000
    },
    {
      "epoch": 0.47,
      "learning_rate": 4.416297098253872e-05,
      "loss": 2.2053,
      "step": 1580000
    },
    {
      "epoch": 0.47,
      "eval_accuracy": 0.5133767517501063,
      "eval_loss": 2.232421875,
      "eval_runtime": 40.3058,
      "eval_samples_per_second": 88.523,
      "eval_steps_per_second": 11.065,
      "step": 1580000
    },
    {
      "epoch": 0.47,
      "learning_rate": 4.408813862140697e-05,
      "loss": 2.208,
      "step": 1585000
    },
    {
      "epoch": 0.47,
      "eval_accuracy": 0.513388258397661,
      "eval_loss": 2.23046875,
      "eval_runtime": 40.3539,
      "eval_samples_per_second": 88.418,
      "eval_steps_per_second": 11.052,
      "step": 1585000
    },
    {
      "epoch": 0.48,
      "learning_rate": 4.401329128182023e-05,
      "loss": 2.2081,
      "step": 1590000
    },
    {
      "epoch": 0.48,
      "eval_accuracy": 0.5135512692380189,
      "eval_loss": 2.23046875,
      "eval_runtime": 42.8555,
      "eval_samples_per_second": 83.257,
      "eval_steps_per_second": 10.407,
      "step": 1590000
    },
    {
      "epoch": 0.48,
      "learning_rate": 4.3938458920688484e-05,
      "loss": 2.2077,
      "step": 1595000
    },
    {
      "epoch": 0.48,
      "eval_accuracy": 0.5137540054092202,
      "eval_loss": 2.23046875,
      "eval_runtime": 40.2657,
      "eval_samples_per_second": 88.611,
      "eval_steps_per_second": 11.076,
      "step": 1595000
    },
    {
      "epoch": 0.48,
      "learning_rate": 4.3863611581101744e-05,
      "loss": 2.2061,
      "step": 1600000
    },
    {
      "epoch": 0.48,
      "eval_accuracy": 0.5135893507620688,
      "eval_loss": 2.23046875,
      "eval_runtime": 41.6767,
      "eval_samples_per_second": 85.611,
      "eval_steps_per_second": 10.701,
      "step": 1600000
    },
    {
      "epoch": 0.48,
      "learning_rate": 4.378880917687998e-05,
      "loss": 2.2055,
      "step": 1605000
    },
    {
      "epoch": 0.48,
      "eval_accuracy": 0.5138961946968601,
      "eval_loss": 2.228515625,
      "eval_runtime": 40.3609,
      "eval_samples_per_second": 88.402,
      "eval_steps_per_second": 11.05,
      "step": 1605000
    },
    {
      "epoch": 0.48,
      "learning_rate": 4.371397681574823e-05,
      "loss": 2.2065,
      "step": 1610000
    },
    {
      "epoch": 0.48,
      "eval_accuracy": 0.5138923591476752,
      "eval_loss": 2.228515625,
      "eval_runtime": 40.453,
      "eval_samples_per_second": 88.201,
      "eval_steps_per_second": 11.025,
      "step": 1610000
    },
    {
      "epoch": 0.48,
      "learning_rate": 4.363914445461648e-05,
      "loss": 2.2054,
      "step": 1615000
    },
    {
      "epoch": 0.48,
      "eval_accuracy": 0.5138997562782461,
      "eval_loss": 2.228515625,
      "eval_runtime": 41.6251,
      "eval_samples_per_second": 85.718,
      "eval_steps_per_second": 10.715,
      "step": 1615000
    },
    {
      "epoch": 0.49,
      "learning_rate": 4.356432707193973e-05,
      "loss": 2.2035,
      "step": 1620000
    },
    {
      "epoch": 0.49,
      "eval_accuracy": 0.5140274252725432,
      "eval_loss": 2.228515625,
      "eval_runtime": 40.4365,
      "eval_samples_per_second": 88.237,
      "eval_steps_per_second": 11.03,
      "step": 1620000
    },
    {
      "epoch": 0.49,
      "learning_rate": 4.348947973235298e-05,
      "loss": 2.2021,
      "step": 1625000
    },
    {
      "epoch": 0.49,
      "eval_accuracy": 0.5139844123281126,
      "eval_loss": 2.228515625,
      "eval_runtime": 40.3492,
      "eval_samples_per_second": 88.428,
      "eval_steps_per_second": 11.054,
      "step": 1625000
    },
    {
      "epoch": 0.49,
      "learning_rate": 4.3414662349676226e-05,
      "loss": 2.2036,
      "step": 1630000
    },
    {
      "epoch": 0.49,
      "eval_accuracy": 0.5138233192623471,
      "eval_loss": 2.228515625,
      "eval_runtime": 40.3662,
      "eval_samples_per_second": 88.391,
      "eval_steps_per_second": 11.049,
      "step": 1630000
    },
    {
      "epoch": 0.49,
      "learning_rate": 4.333981501008949e-05,
      "loss": 2.204,
      "step": 1635000
    },
    {
      "epoch": 0.49,
      "eval_accuracy": 0.5139803028111288,
      "eval_loss": 2.2265625,
      "eval_runtime": 40.2896,
      "eval_samples_per_second": 88.559,
      "eval_steps_per_second": 11.07,
      "step": 1635000
    },
    {
      "epoch": 0.49,
      "learning_rate": 4.3264967670502746e-05,
      "loss": 2.2042,
      "step": 1640000
    },
    {
      "epoch": 0.49,
      "eval_accuracy": 0.5140860543815122,
      "eval_loss": 2.2265625,
      "eval_runtime": 42.4068,
      "eval_samples_per_second": 84.137,
      "eval_steps_per_second": 10.517,
      "step": 1640000
    },
    {
      "epoch": 0.49,
      "learning_rate": 4.3190135309371006e-05,
      "loss": 2.2024,
      "step": 1645000
    },
    {
      "epoch": 0.49,
      "eval_accuracy": 0.514173450109368,
      "eval_loss": 2.2265625,
      "eval_runtime": 40.3018,
      "eval_samples_per_second": 88.532,
      "eval_steps_per_second": 11.067,
      "step": 1645000
    },
    {
      "epoch": 0.49,
      "learning_rate": 4.311530294823926e-05,
      "loss": 2.2023,
      "step": 1650000
    },
    {
      "epoch": 0.49,
      "eval_accuracy": 0.5144172814504074,
      "eval_loss": 2.2265625,
      "eval_runtime": 40.2694,
      "eval_samples_per_second": 88.603,
      "eval_steps_per_second": 11.075,
      "step": 1650000
    },
    {
      "epoch": 0.5,
      "learning_rate": 4.30404855655625e-05,
      "loss": 2.1976,
      "step": 1655000
    },
    {
      "epoch": 0.5,
      "eval_accuracy": 0.5145805662585642,
      "eval_loss": 2.224609375,
      "eval_runtime": 40.3729,
      "eval_samples_per_second": 88.376,
      "eval_steps_per_second": 11.047,
      "step": 1655000
    },
    {
      "epoch": 0.5,
      "learning_rate": 4.296565320443075e-05,
      "loss": 2.2028,
      "step": 1660000
    },
    {
      "epoch": 0.5,
      "eval_accuracy": 0.5147172761902257,
      "eval_loss": 2.224609375,
      "eval_runtime": 40.282,
      "eval_samples_per_second": 88.576,
      "eval_steps_per_second": 11.072,
      "step": 1660000
    },
    {
      "epoch": 0.5,
      "learning_rate": 4.289080586484401e-05,
      "loss": 2.1971,
      "step": 1665000
    },
    {
      "epoch": 0.5,
      "eval_accuracy": 0.5146457705947074,
      "eval_loss": 2.224609375,
      "eval_runtime": 40.4909,
      "eval_samples_per_second": 88.119,
      "eval_steps_per_second": 11.015,
      "step": 1665000
    },
    {
      "epoch": 0.5,
      "learning_rate": 4.281595852525727e-05,
      "loss": 2.1978,
      "step": 1670000
    },
    {
      "epoch": 0.5,
      "eval_accuracy": 0.5146065931994617,
      "eval_loss": 2.224609375,
      "eval_runtime": 40.3534,
      "eval_samples_per_second": 88.419,
      "eval_steps_per_second": 11.052,
      "step": 1670000
    },
    {
      "epoch": 0.5,
      "learning_rate": 4.27411561210355e-05,
      "loss": 2.1955,
      "step": 1675000
    },
    {
      "epoch": 0.5,
      "eval_accuracy": 0.5148249455352015,
      "eval_loss": 2.22265625,
      "eval_runtime": 39.3164,
      "eval_samples_per_second": 90.751,
      "eval_steps_per_second": 11.344,
      "step": 1675000
    },
    {
      "epoch": 0.5,
      "learning_rate": 4.266630878144877e-05,
      "loss": 2.1967,
      "step": 1680000
    },
    {
      "epoch": 0.5,
      "eval_accuracy": 0.5146874137001434,
      "eval_loss": 2.22265625,
      "eval_runtime": 40.3287,
      "eval_samples_per_second": 88.473,
      "eval_steps_per_second": 11.059,
      "step": 1680000
    },
    {
      "epoch": 0.5,
      "learning_rate": 4.259149139877201e-05,
      "loss": 2.1975,
      "step": 1685000
    },
    {
      "epoch": 0.5,
      "eval_accuracy": 0.5151745284466245,
      "eval_loss": 2.22265625,
      "eval_runtime": 40.2734,
      "eval_samples_per_second": 88.594,
      "eval_steps_per_second": 11.074,
      "step": 1685000
    },
    {
      "epoch": 0.51,
      "learning_rate": 4.251668899455024e-05,
      "loss": 2.1972,
      "step": 1690000
    },
    {
      "epoch": 0.51,
      "eval_accuracy": 0.5148622051558548,
      "eval_loss": 2.220703125,
      "eval_runtime": 40.2657,
      "eval_samples_per_second": 88.611,
      "eval_steps_per_second": 11.076,
      "step": 1690000
    },
    {
      "epoch": 0.51,
      "learning_rate": 4.2441841654963506e-05,
      "loss": 2.1967,
      "step": 1695000
    },
    {
      "epoch": 0.51,
      "eval_accuracy": 0.5150745302000184,
      "eval_loss": 2.220703125,
      "eval_runtime": 40.2491,
      "eval_samples_per_second": 88.648,
      "eval_steps_per_second": 11.081,
      "step": 1695000
    },
    {
      "epoch": 0.51,
      "learning_rate": 4.236699431537676e-05,
      "loss": 2.194,
      "step": 1700000
    },
    {
      "epoch": 0.51,
      "eval_accuracy": 0.5150706946508335,
      "eval_loss": 2.220703125,
      "eval_runtime": 40.3323,
      "eval_samples_per_second": 88.465,
      "eval_steps_per_second": 11.058,
      "step": 1700000
    },
    {
      "epoch": 0.51,
      "learning_rate": 4.9925167638868255e-05,
      "loss": 2.2009,
      "step": 1705000
    },
    {
      "epoch": 0.51,
      "eval_accuracy": 0.5139096191190072,
      "eval_loss": 2.228515625,
      "eval_runtime": 39.4304,
      "eval_samples_per_second": 90.489,
      "eval_steps_per_second": 11.311,
      "step": 1705000
    },
    {
      "epoch": 0.51,
      "learning_rate": 4.9850350256191494e-05,
      "loss": 2.2085,
      "step": 1710000
    },
    {
      "epoch": 0.51,
      "eval_accuracy": 0.5136279802217166,
      "eval_loss": 2.23046875,
      "eval_runtime": 39.2325,
      "eval_samples_per_second": 90.945,
      "eval_steps_per_second": 11.368,
      "step": 1710000
    },
    {
      "epoch": 0.51,
      "learning_rate": 4.977551789505975e-05,
      "loss": 2.2077,
      "step": 1715000
    },
    {
      "epoch": 0.51,
      "eval_accuracy": 0.5136983899460393,
      "eval_loss": 2.23046875,
      "eval_runtime": 39.2977,
      "eval_samples_per_second": 90.794,
      "eval_steps_per_second": 11.349,
      "step": 1715000
    },
    {
      "epoch": 0.52,
      "learning_rate": 4.9700670555473014e-05,
      "loss": 2.205,
      "step": 1720000
    },
    {
      "epoch": 0.52,
      "eval_accuracy": 0.51339866917402,
      "eval_loss": 2.23046875,
      "eval_runtime": 39.3375,
      "eval_samples_per_second": 90.702,
      "eval_steps_per_second": 11.338,
      "step": 1720000
    },
    {
      "epoch": 0.52,
      "learning_rate": 4.962583819434126e-05,
      "loss": 2.2063,
      "step": 1725000
    },
    {
      "epoch": 0.52,
      "eval_accuracy": 0.5134490792490214,
      "eval_loss": 2.23046875,
      "eval_runtime": 39.3134,
      "eval_samples_per_second": 90.758,
      "eval_steps_per_second": 11.345,
      "step": 1725000
    },
    {
      "epoch": 0.52,
      "learning_rate": 4.9551020811664506e-05,
      "loss": 2.2076,
      "step": 1730000
    },
    {
      "epoch": 0.52,
      "eval_accuracy": 0.5134718185763318,
      "eval_loss": 2.23046875,
      "eval_runtime": 39.2618,
      "eval_samples_per_second": 90.877,
      "eval_steps_per_second": 11.36,
      "step": 1730000
    },
    {
      "epoch": 0.52,
      "learning_rate": 4.9476173472077765e-05,
      "loss": 2.2036,
      "step": 1735000
    },
    {
      "epoch": 0.52,
      "eval_accuracy": 0.5133134651885556,
      "eval_loss": 2.23046875,
      "eval_runtime": 39.3642,
      "eval_samples_per_second": 90.641,
      "eval_steps_per_second": 11.33,
      "step": 1735000
    },
    {
      "epoch": 0.52,
      "learning_rate": 4.9401356089401005e-05,
      "loss": 2.2064,
      "step": 1740000
    },
    {
      "epoch": 0.52,
      "eval_accuracy": 0.5138024977096292,
      "eval_loss": 2.23046875,
      "eval_runtime": 39.4343,
      "eval_samples_per_second": 90.48,
      "eval_steps_per_second": 11.31,
      "step": 1740000
    },
    {
      "epoch": 0.52,
      "learning_rate": 4.932650874981427e-05,
      "loss": 2.2053,
      "step": 1745000
    },
    {
      "epoch": 0.52,
      "eval_accuracy": 0.5136904448798706,
      "eval_loss": 2.23046875,
      "eval_runtime": 39.4148,
      "eval_samples_per_second": 90.524,
      "eval_steps_per_second": 11.316,
      "step": 1745000
    },
    {
      "epoch": 0.52,
      "learning_rate": 4.9251676388682524e-05,
      "loss": 2.2048,
      "step": 1750000
    },
    {
      "epoch": 0.52,
      "eval_accuracy": 0.5138953727934633,
      "eval_loss": 2.23046875,
      "eval_runtime": 39.3715,
      "eval_samples_per_second": 90.624,
      "eval_steps_per_second": 11.328,
      "step": 1750000
    },
    {
      "epoch": 0.53,
      "learning_rate": 4.917684402755077e-05,
      "loss": 2.2075,
      "step": 1755000
    },
    {
      "epoch": 0.53,
      "eval_accuracy": 0.5137868815450907,
      "eval_loss": 2.23046875,
      "eval_runtime": 39.4167,
      "eval_samples_per_second": 90.52,
      "eval_steps_per_second": 11.315,
      "step": 1755000
    },
    {
      "epoch": 0.53,
      "learning_rate": 4.910201166641902e-05,
      "loss": 2.2041,
      "step": 1760000
    },
    {
      "epoch": 0.53,
      "eval_accuracy": 0.5136414046438638,
      "eval_loss": 2.228515625,
      "eval_runtime": 39.46,
      "eval_samples_per_second": 90.421,
      "eval_steps_per_second": 11.303,
      "step": 1760000
    },
    {
      "epoch": 0.53,
      "learning_rate": 4.902716432683229e-05,
      "loss": 2.2057,
      "step": 1765000
    },
    {
      "epoch": 0.53,
      "eval_accuracy": 0.5138789347255281,
      "eval_loss": 2.228515625,
      "eval_runtime": 39.4616,
      "eval_samples_per_second": 90.417,
      "eval_steps_per_second": 11.302,
      "step": 1765000
    },
    {
      "epoch": 0.53,
      "learning_rate": 4.8952331965700536e-05,
      "loss": 2.2054,
      "step": 1770000
    },
    {
      "epoch": 0.53,
      "eval_accuracy": 0.5138929070832731,
      "eval_loss": 2.228515625,
      "eval_runtime": 39.5693,
      "eval_samples_per_second": 90.171,
      "eval_steps_per_second": 11.271,
      "step": 1770000
    },
    {
      "epoch": 0.53,
      "learning_rate": 4.887752956147877e-05,
      "loss": 2.2085,
      "step": 1775000
    },
    {
      "epoch": 0.53,
      "eval_accuracy": 0.5139266051225403,
      "eval_loss": 2.228515625,
      "eval_runtime": 39.4709,
      "eval_samples_per_second": 90.396,
      "eval_steps_per_second": 11.299,
      "step": 1775000
    },
    {
      "epoch": 0.53,
      "learning_rate": 4.880269720034703e-05,
      "loss": 2.2051,
      "step": 1780000
    },
    {
      "epoch": 0.53,
      "eval_accuracy": 0.5141471492006715,
      "eval_loss": 2.2265625,
      "eval_runtime": 39.4552,
      "eval_samples_per_second": 90.432,
      "eval_steps_per_second": 11.304,
      "step": 1780000
    },
    {
      "epoch": 0.53,
      "learning_rate": 4.872786483921527e-05,
      "loss": 2.2023,
      "step": 1785000
    },
    {
      "epoch": 0.53,
      "eval_accuracy": 0.5139211257665619,
      "eval_loss": 2.2265625,
      "eval_runtime": 39.5212,
      "eval_samples_per_second": 90.281,
      "eval_steps_per_second": 11.285,
      "step": 1785000
    },
    {
      "epoch": 0.54,
      "learning_rate": 4.8653032478083526e-05,
      "loss": 2.205,
      "step": 1790000
    },
    {
      "epoch": 0.54,
      "eval_accuracy": 0.5140561918914298,
      "eval_loss": 2.2265625,
      "eval_runtime": 39.4725,
      "eval_samples_per_second": 90.392,
      "eval_steps_per_second": 11.299,
      "step": 1790000
    },
    {
      "epoch": 0.54,
      "learning_rate": 4.857818513849679e-05,
      "loss": 2.2009,
      "step": 1795000
    },
    {
      "epoch": 0.54,
      "eval_accuracy": 0.5141463272972748,
      "eval_loss": 2.2265625,
      "eval_runtime": 39.6114,
      "eval_samples_per_second": 90.075,
      "eval_steps_per_second": 11.259,
      "step": 1795000
    },
    {
      "epoch": 0.54,
      "learning_rate": 4.850335277736504e-05,
      "loss": 2.1998,
      "step": 1800000
    },
    {
      "epoch": 0.54,
      "eval_accuracy": 0.5143134476546165,
      "eval_loss": 2.2265625,
      "eval_runtime": 39.8498,
      "eval_samples_per_second": 89.536,
      "eval_steps_per_second": 11.192,
      "step": 1800000
    },
    {
      "epoch": 0.54,
      "learning_rate": 4.8428505437778305e-05,
      "loss": 2.2009,
      "step": 1805000
    },
    {
      "epoch": 0.54,
      "eval_accuracy": 0.5143608440838298,
      "eval_loss": 2.224609375,
      "eval_runtime": 38.3896,
      "eval_samples_per_second": 92.942,
      "eval_steps_per_second": 11.618,
      "step": 1805000
    },
    {
      "epoch": 0.54,
      "learning_rate": 4.8353688055101544e-05,
      "loss": 2.2027,
      "step": 1810000
    },
    {
      "epoch": 0.54,
      "eval_accuracy": 0.5143013930714639,
      "eval_loss": 2.2265625,
      "eval_runtime": 39.6231,
      "eval_samples_per_second": 90.048,
      "eval_steps_per_second": 11.256,
      "step": 1810000
    },
    {
      "epoch": 0.54,
      "learning_rate": 4.8278840715514804e-05,
      "loss": 2.2007,
      "step": 1815000
    },
    {
      "epoch": 0.54,
      "eval_accuracy": 0.5145857716467437,
      "eval_loss": 2.224609375,
      "eval_runtime": 39.6832,
      "eval_samples_per_second": 89.912,
      "eval_steps_per_second": 11.239,
      "step": 1815000
    },
    {
      "epoch": 0.55,
      "learning_rate": 4.820402333283805e-05,
      "loss": 2.1978,
      "step": 1820000
    },
    {
      "epoch": 0.55,
      "eval_accuracy": 0.5144972800476924,
      "eval_loss": 2.224609375,
      "eval_runtime": 39.721,
      "eval_samples_per_second": 89.827,
      "eval_steps_per_second": 11.228,
      "step": 1820000
    },
    {
      "epoch": 0.55,
      "learning_rate": 4.812920595016129e-05,
      "loss": 2.1999,
      "step": 1825000
    },
    {
      "epoch": 0.55,
      "eval_accuracy": 0.5145970043264995,
      "eval_loss": 2.22265625,
      "eval_runtime": 39.6521,
      "eval_samples_per_second": 89.983,
      "eval_steps_per_second": 11.248,
      "step": 1825000
    },
    {
      "epoch": 0.55,
      "learning_rate": 4.8054388567484535e-05,
      "loss": 2.1978,
      "step": 1830000
    },
    {
      "epoch": 0.55,
      "eval_accuracy": 0.5148150826944404,
      "eval_loss": 2.22265625,
      "eval_runtime": 39.5596,
      "eval_samples_per_second": 90.193,
      "eval_steps_per_second": 11.274,
      "step": 1830000
    },
    {
      "epoch": 0.55,
      "learning_rate": 4.79795262494428e-05,
      "loss": 2.1989,
      "step": 1835000
    },
    {
      "epoch": 0.55,
      "eval_accuracy": 0.5147271390309869,
      "eval_loss": 2.22265625,
      "eval_runtime": 39.6103,
      "eval_samples_per_second": 90.077,
      "eval_steps_per_second": 11.26,
      "step": 1835000
    },
    {
      "epoch": 0.55,
      "learning_rate": 4.790467890985607e-05,
      "loss": 2.1989,
      "step": 1840000
    },
    {
      "epoch": 0.55,
      "eval_accuracy": 0.5147980966909074,
      "eval_loss": 2.22265625,
      "eval_runtime": 39.6511,
      "eval_samples_per_second": 89.985,
      "eval_steps_per_second": 11.248,
      "step": 1840000
    },
    {
      "epoch": 0.55,
      "learning_rate": 4.7829876505634294e-05,
      "loss": 2.1982,
      "step": 1845000
    },
    {
      "epoch": 0.55,
      "eval_accuracy": 0.5149764497280047,
      "eval_loss": 2.220703125,
      "eval_runtime": 39.6684,
      "eval_samples_per_second": 89.946,
      "eval_steps_per_second": 11.243,
      "step": 1845000
    },
    {
      "epoch": 0.55,
      "learning_rate": 4.775501418759257e-05,
      "loss": 2.1974,
      "step": 1850000
    },
    {
      "epoch": 0.55,
      "eval_accuracy": 0.515062201649067,
      "eval_loss": 2.220703125,
      "eval_runtime": 39.5826,
      "eval_samples_per_second": 90.141,
      "eval_steps_per_second": 11.268,
      "step": 1850000
    },
    {
      "epoch": 0.56,
      "learning_rate": 4.768016684800583e-05,
      "loss": 2.1972,
      "step": 1855000
    },
    {
      "epoch": 0.56,
      "eval_accuracy": 0.5151389126327648,
      "eval_loss": 2.220703125,
      "eval_runtime": 39.774,
      "eval_samples_per_second": 89.707,
      "eval_steps_per_second": 11.213,
      "step": 1855000
    },
    {
      "epoch": 0.56,
      "learning_rate": 4.760533448687408e-05,
      "loss": 2.1966,
      "step": 1860000
    },
    {
      "epoch": 0.56,
      "eval_accuracy": 0.515106858400291,
      "eval_loss": 2.220703125,
      "eval_runtime": 39.7218,
      "eval_samples_per_second": 89.825,
      "eval_steps_per_second": 11.228,
      "step": 1860000
    },
    {
      "epoch": 0.56,
      "learning_rate": 4.753050212574233e-05,
      "loss": 2.198,
      "step": 1865000
    },
    {
      "epoch": 0.56,
      "eval_accuracy": 0.5150282296420008,
      "eval_loss": 2.220703125,
      "eval_runtime": 39.6783,
      "eval_samples_per_second": 89.923,
      "eval_steps_per_second": 11.24,
      "step": 1865000
    },
    {
      "epoch": 0.56,
      "learning_rate": 4.7455669764610586e-05,
      "loss": 2.1978,
      "step": 1870000
    },
    {
      "epoch": 0.56,
      "eval_accuracy": 0.5151887747721684,
      "eval_loss": 2.220703125,
      "eval_runtime": 39.753,
      "eval_samples_per_second": 89.754,
      "eval_steps_per_second": 11.219,
      "step": 1870000
    },
    {
      "epoch": 0.56,
      "learning_rate": 4.738083740347884e-05,
      "loss": 2.1938,
      "step": 1875000
    },
    {
      "epoch": 0.56,
      "eval_accuracy": 0.5152000074519242,
      "eval_loss": 2.220703125,
      "eval_runtime": 39.7549,
      "eval_samples_per_second": 89.75,
      "eval_steps_per_second": 11.219,
      "step": 1875000
    },
    {
      "epoch": 0.56,
      "learning_rate": 4.730600504234709e-05,
      "loss": 2.1908,
      "step": 1880000
    },
    {
      "epoch": 0.56,
      "eval_accuracy": 0.5152191851978486,
      "eval_loss": 2.21875,
      "eval_runtime": 39.6445,
      "eval_samples_per_second": 90.0,
      "eval_steps_per_second": 11.25,
      "step": 1880000
    },
    {
      "epoch": 0.56,
      "learning_rate": 4.723118765967034e-05,
      "loss": 2.1899,
      "step": 1885000
    },
    {
      "epoch": 0.56,
      "eval_accuracy": 0.5151602821210807,
      "eval_loss": 2.21875,
      "eval_runtime": 39.7932,
      "eval_samples_per_second": 89.664,
      "eval_steps_per_second": 11.208,
      "step": 1885000
    },
    {
      "epoch": 0.57,
      "learning_rate": 4.715634032008359e-05,
      "loss": 2.1938,
      "step": 1890000
    },
    {
      "epoch": 0.57,
      "eval_accuracy": 0.5151682271872493,
      "eval_loss": 2.21875,
      "eval_runtime": 39.7818,
      "eval_samples_per_second": 89.689,
      "eval_steps_per_second": 11.211,
      "step": 1890000
    },
    {
      "epoch": 0.57,
      "learning_rate": 4.708150795895185e-05,
      "loss": 2.1909,
      "step": 1895000
    },
    {
      "epoch": 0.57,
      "eval_accuracy": 0.5153520595803252,
      "eval_loss": 2.21875,
      "eval_runtime": 39.8181,
      "eval_samples_per_second": 89.607,
      "eval_steps_per_second": 11.201,
      "step": 1895000
    },
    {
      "epoch": 0.57,
      "learning_rate": 4.700669057627509e-05,
      "loss": 2.1921,
      "step": 1900000
    },
    {
      "epoch": 0.57,
      "eval_accuracy": 0.5155320564242162,
      "eval_loss": 2.21875,
      "eval_runtime": 40.2538,
      "eval_samples_per_second": 88.638,
      "eval_steps_per_second": 11.08,
      "step": 1900000
    },
    {
      "epoch": 0.57,
      "learning_rate": 4.693187319359833e-05,
      "loss": 2.1926,
      "step": 1905000
    },
    {
      "epoch": 0.57,
      "eval_accuracy": 0.5155928772755766,
      "eval_loss": 2.216796875,
      "eval_runtime": 39.9117,
      "eval_samples_per_second": 89.397,
      "eval_steps_per_second": 11.175,
      "step": 1905000
    },
    {
      "epoch": 0.57,
      "learning_rate": 4.685704083246658e-05,
      "loss": 2.194,
      "step": 1910000
    },
    {
      "epoch": 0.57,
      "eval_accuracy": 0.5154164420130716,
      "eval_loss": 2.216796875,
      "eval_runtime": 39.9039,
      "eval_samples_per_second": 89.415,
      "eval_steps_per_second": 11.177,
      "step": 1910000
    },
    {
      "epoch": 0.57,
      "learning_rate": 4.992518261732325e-05,
      "loss": 2.1942,
      "step": 1915000
    },
    {
      "epoch": 0.57,
      "eval_accuracy": 0.5151652135414612,
      "eval_loss": 2.21875,
      "eval_runtime": 39.5459,
      "eval_samples_per_second": 90.224,
      "eval_steps_per_second": 11.278,
      "step": 1915000
    },
    {
      "epoch": 0.58,
      "learning_rate": 4.985036523464649e-05,
      "loss": 2.1947,
      "step": 1920000
    },
    {
      "epoch": 0.58,
      "eval_accuracy": 0.5150559003896918,
      "eval_loss": 2.21875,
      "eval_runtime": 39.6198,
      "eval_samples_per_second": 90.056,
      "eval_steps_per_second": 11.257,
      "step": 1920000
    },
    {
      "epoch": 0.58,
      "learning_rate": 4.977553287351474e-05,
      "loss": 2.1941,
      "step": 1925000
    },
    {
      "epoch": 0.58,
      "eval_accuracy": 0.5150868587509698,
      "eval_loss": 2.220703125,
      "eval_runtime": 39.5078,
      "eval_samples_per_second": 90.311,
      "eval_steps_per_second": 11.289,
      "step": 1925000
    },
    {
      "epoch": 0.58,
      "learning_rate": 4.970071549083798e-05,
      "loss": 2.1984,
      "step": 1930000
    },
    {
      "epoch": 0.58,
      "eval_accuracy": 0.5151849392229835,
      "eval_loss": 2.220703125,
      "eval_runtime": 39.6089,
      "eval_samples_per_second": 90.081,
      "eval_steps_per_second": 11.26,
      "step": 1930000
    },
    {
      "epoch": 0.58,
      "learning_rate": 4.9625868151251246e-05,
      "loss": 2.1929,
      "step": 1935000
    },
    {
      "epoch": 0.58,
      "eval_accuracy": 0.5150846670085785,
      "eval_loss": 2.220703125,
      "eval_runtime": 39.574,
      "eval_samples_per_second": 90.16,
      "eval_steps_per_second": 11.27,
      "step": 1935000
    },
    {
      "epoch": 0.58,
      "learning_rate": 4.955106574702947e-05,
      "loss": 2.1921,
      "step": 1940000
    },
    {
      "epoch": 0.58,
      "eval_accuracy": 0.515442742921768,
      "eval_loss": 2.21875,
      "eval_runtime": 39.6485,
      "eval_samples_per_second": 89.991,
      "eval_steps_per_second": 11.249,
      "step": 1940000
    },
    {
      "epoch": 0.58,
      "learning_rate": 4.947621840744274e-05,
      "loss": 2.1932,
      "step": 1945000
    },
    {
      "epoch": 0.58,
      "eval_accuracy": 0.5153391830937759,
      "eval_loss": 2.21875,
      "eval_runtime": 39.6644,
      "eval_samples_per_second": 89.955,
      "eval_steps_per_second": 11.244,
      "step": 1945000
    },
    {
      "epoch": 0.58,
      "learning_rate": 4.940138604631099e-05,
      "loss": 2.1959,
      "step": 1950000
    },
    {
      "epoch": 0.58,
      "eval_accuracy": 0.5154117845604899,
      "eval_loss": 2.21875,
      "eval_runtime": 39.6108,
      "eval_samples_per_second": 90.077,
      "eval_steps_per_second": 11.26,
      "step": 1950000
    },
    {
      "epoch": 0.59,
      "learning_rate": 4.932656866363423e-05,
      "loss": 2.1927,
      "step": 1955000
    },
    {
      "epoch": 0.59,
      "eval_accuracy": 0.5153761687466302,
      "eval_loss": 2.21875,
      "eval_runtime": 39.6613,
      "eval_samples_per_second": 89.962,
      "eval_steps_per_second": 11.245,
      "step": 1955000
    },
    {
      "epoch": 0.59,
      "learning_rate": 4.9251751280957475e-05,
      "loss": 2.1949,
      "step": 1960000
    },
    {
      "epoch": 0.59,
      "eval_accuracy": 0.5154917831577748,
      "eval_loss": 2.21875,
      "eval_runtime": 39.8742,
      "eval_samples_per_second": 89.481,
      "eval_steps_per_second": 11.185,
      "step": 1960000
    },
    {
      "epoch": 0.59,
      "learning_rate": 4.9176933898280714e-05,
      "loss": 2.1918,
      "step": 1965000
    },
    {
      "epoch": 0.59,
      "eval_accuracy": 0.5153786344568205,
      "eval_loss": 2.216796875,
      "eval_runtime": 39.9956,
      "eval_samples_per_second": 89.21,
      "eval_steps_per_second": 11.151,
      "step": 1965000
    },
    {
      "epoch": 0.59,
      "learning_rate": 4.910210153714897e-05,
      "loss": 2.1957,
      "step": 1970000
    },
    {
      "epoch": 0.59,
      "eval_accuracy": 0.5154745231864427,
      "eval_loss": 2.216796875,
      "eval_runtime": 39.6981,
      "eval_samples_per_second": 89.878,
      "eval_steps_per_second": 11.235,
      "step": 1970000
    },
    {
      "epoch": 0.59,
      "learning_rate": 4.902726917601722e-05,
      "loss": 2.1884,
      "step": 1975000
    },
    {
      "epoch": 0.59,
      "eval_accuracy": 0.51571890246308,
      "eval_loss": 2.216796875,
      "eval_runtime": 39.9761,
      "eval_samples_per_second": 89.253,
      "eval_steps_per_second": 11.157,
      "step": 1975000
    },
    {
      "epoch": 0.59,
      "learning_rate": 4.895245179334046e-05,
      "loss": 2.1942,
      "step": 1980000
    },
    {
      "epoch": 0.59,
      "eval_accuracy": 0.5156073975689194,
      "eval_loss": 2.21484375,
      "eval_runtime": 39.9647,
      "eval_samples_per_second": 89.279,
      "eval_steps_per_second": 11.16,
      "step": 1980000
    },
    {
      "epoch": 0.59,
      "learning_rate": 4.8877604453753726e-05,
      "loss": 2.1938,
      "step": 1985000
    },
    {
      "epoch": 0.59,
      "eval_accuracy": 0.5155802747568262,
      "eval_loss": 2.216796875,
      "eval_runtime": 39.7886,
      "eval_samples_per_second": 89.674,
      "eval_steps_per_second": 11.209,
      "step": 1985000
    },
    {
      "epoch": 0.6,
      "learning_rate": 4.8802787071076965e-05,
      "loss": 2.1935,
      "step": 1990000
    },
    {
      "epoch": 0.6,
      "eval_accuracy": 0.5160071165875447,
      "eval_loss": 2.21484375,
      "eval_runtime": 40.1621,
      "eval_samples_per_second": 88.84,
      "eval_steps_per_second": 11.105,
      "step": 1990000
    },
    {
      "epoch": 0.6,
      "learning_rate": 4.872795470994522e-05,
      "loss": 2.1902,
      "step": 1995000
    },
    {
      "epoch": 0.6,
      "eval_accuracy": 0.5157413678225916,
      "eval_loss": 2.21484375,
      "eval_runtime": 39.8406,
      "eval_samples_per_second": 89.557,
      "eval_steps_per_second": 11.195,
      "step": 1995000
    },
    {
      "epoch": 0.6,
      "learning_rate": 4.865310737035848e-05,
      "loss": 2.188,
      "step": 2000000
    },
    {
      "epoch": 0.6,
      "eval_accuracy": 0.5158473933607739,
      "eval_loss": 2.21484375,
      "eval_runtime": 39.7424,
      "eval_samples_per_second": 89.778,
      "eval_steps_per_second": 11.222,
      "step": 2000000
    },
    {
      "epoch": 0.6,
      "learning_rate": 4.8578289987681716e-05,
      "loss": 2.1862,
      "step": 2005000
    },
    {
      "epoch": 0.6,
      "eval_accuracy": 0.5159235564088739,
      "eval_loss": 2.212890625,
      "eval_runtime": 39.7499,
      "eval_samples_per_second": 89.761,
      "eval_steps_per_second": 11.22,
      "step": 2005000
    },
    {
      "epoch": 0.6,
      "learning_rate": 4.850347260500496e-05,
      "loss": 2.1886,
      "step": 2010000
    },
    {
      "epoch": 0.6,
      "eval_accuracy": 0.5160695812456987,
      "eval_loss": 2.212890625,
      "eval_runtime": 40.1441,
      "eval_samples_per_second": 88.88,
      "eval_steps_per_second": 11.11,
      "step": 2010000
    },
    {
      "epoch": 0.6,
      "learning_rate": 4.8428610286963236e-05,
      "loss": 2.1811,
      "step": 2015000
    },
    {
      "epoch": 0.6,
      "eval_accuracy": 0.516141360809016,
      "eval_loss": 2.212890625,
      "eval_runtime": 40.0164,
      "eval_samples_per_second": 89.163,
      "eval_steps_per_second": 11.145,
      "step": 2015000
    },
    {
      "epoch": 0.61,
      "learning_rate": 4.835377792583148e-05,
      "loss": 2.19,
      "step": 2020000
    },
    {
      "epoch": 0.61,
      "eval_accuracy": 0.5160435543048012,
      "eval_loss": 2.212890625,
      "eval_runtime": 39.7821,
      "eval_samples_per_second": 89.689,
      "eval_steps_per_second": 11.211,
      "step": 2020000
    },
    {
      "epoch": 0.61,
      "learning_rate": 4.827893058624475e-05,
      "loss": 2.1895,
      "step": 2025000
    },
    {
      "epoch": 0.61,
      "eval_accuracy": 0.5164950532374227,
      "eval_loss": 2.212890625,
      "eval_runtime": 39.7945,
      "eval_samples_per_second": 89.661,
      "eval_steps_per_second": 11.208,
      "step": 2025000
    },
    {
      "epoch": 0.61,
      "learning_rate": 4.820411320356799e-05,
      "loss": 2.1904,
      "step": 2030000
    },
    {
      "epoch": 0.61,
      "eval_accuracy": 0.516082457732248,
      "eval_loss": 2.212890625,
      "eval_runtime": 39.8538,
      "eval_samples_per_second": 89.527,
      "eval_steps_per_second": 11.191,
      "step": 2030000
    },
    {
      "epoch": 0.61,
      "learning_rate": 4.812928084243624e-05,
      "loss": 2.1854,
      "step": 2035000
    },
    {
      "epoch": 0.61,
      "eval_accuracy": 0.516504368142586,
      "eval_loss": 2.212890625,
      "eval_runtime": 39.7999,
      "eval_samples_per_second": 89.649,
      "eval_steps_per_second": 11.206,
      "step": 2035000
    },
    {
      "epoch": 0.61,
      "learning_rate": 4.805447843821447e-05,
      "loss": 2.1883,
      "step": 2040000
    },
    {
      "epoch": 0.61,
      "eval_accuracy": 0.51652875127669,
      "eval_loss": 2.2109375,
      "eval_runtime": 39.8414,
      "eval_samples_per_second": 89.555,
      "eval_steps_per_second": 11.194,
      "step": 2040000
    },
    {
      "epoch": 0.61,
      "learning_rate": 4.7979646077082725e-05,
      "loss": 2.1859,
      "step": 2045000
    },
    {
      "epoch": 0.61,
      "eval_accuracy": 0.5165314909546791,
      "eval_loss": 2.2109375,
      "eval_runtime": 39.9091,
      "eval_samples_per_second": 89.403,
      "eval_steps_per_second": 11.175,
      "step": 2045000
    },
    {
      "epoch": 0.61,
      "learning_rate": 4.790481371595098e-05,
      "loss": 2.1849,
      "step": 2050000
    },
    {
      "epoch": 0.61,
      "eval_accuracy": 0.5167750483279198,
      "eval_loss": 2.208984375,
      "eval_runtime": 39.8945,
      "eval_samples_per_second": 89.436,
      "eval_steps_per_second": 11.179,
      "step": 2050000
    },
    {
      "epoch": 0.62,
      "learning_rate": 4.782996637636424e-05,
      "loss": 2.1844,
      "step": 2055000
    },
    {
      "epoch": 0.62,
      "eval_accuracy": 0.5167309395122934,
      "eval_loss": 2.2109375,
      "eval_runtime": 39.9417,
      "eval_samples_per_second": 89.33,
      "eval_steps_per_second": 11.166,
      "step": 2055000
    },
    {
      "epoch": 0.62,
      "learning_rate": 4.7755148993687484e-05,
      "loss": 2.1866,
      "step": 2060000
    },
    {
      "epoch": 0.62,
      "eval_accuracy": 0.5166953236984337,
      "eval_loss": 2.208984375,
      "eval_runtime": 39.9499,
      "eval_samples_per_second": 89.312,
      "eval_steps_per_second": 11.164,
      "step": 2060000
    },
    {
      "epoch": 0.62,
      "learning_rate": 4.768031663255573e-05,
      "loss": 2.1865,
      "step": 2065000
    },
    {
      "epoch": 0.62,
      "eval_accuracy": 0.5167821714906917,
      "eval_loss": 2.208984375,
      "eval_runtime": 39.8531,
      "eval_samples_per_second": 89.529,
      "eval_steps_per_second": 11.191,
      "step": 2065000
    },
    {
      "epoch": 0.62,
      "learning_rate": 4.7605499249878976e-05,
      "loss": 2.1846,
      "step": 2070000
    },
    {
      "epoch": 0.62,
      "eval_accuracy": 0.5171333982089081,
      "eval_loss": 2.20703125,
      "eval_runtime": 39.9613,
      "eval_samples_per_second": 89.286,
      "eval_steps_per_second": 11.161,
      "step": 2070000
    },
    {
      "epoch": 0.62,
      "learning_rate": 4.753066688874723e-05,
      "loss": 2.1821,
      "step": 2075000
    },
    {
      "epoch": 0.62,
      "eval_accuracy": 0.5169824419517027,
      "eval_loss": 2.20703125,
      "eval_runtime": 39.9564,
      "eval_samples_per_second": 89.297,
      "eval_steps_per_second": 11.162,
      "step": 2075000
    },
    {
      "epoch": 0.62,
      "learning_rate": 4.7455849506070474e-05,
      "loss": 2.184,
      "step": 2080000
    },
    {
      "epoch": 0.62,
      "eval_accuracy": 0.5170257288639323,
      "eval_loss": 2.20703125,
      "eval_runtime": 41.0867,
      "eval_samples_per_second": 86.841,
      "eval_steps_per_second": 10.855,
      "step": 2080000
    },
    {
      "epoch": 0.62,
      "learning_rate": 4.738101714493872e-05,
      "loss": 2.1847,
      "step": 2085000
    },
    {
      "epoch": 0.62,
      "eval_accuracy": 0.5173227099579624,
      "eval_loss": 2.205078125,
      "eval_runtime": 39.9314,
      "eval_samples_per_second": 89.353,
      "eval_steps_per_second": 11.169,
      "step": 2085000
    },
    {
      "epoch": 0.63,
      "learning_rate": 4.730618478380697e-05,
      "loss": 2.1836,
      "step": 2090000
    },
    {
      "epoch": 0.63,
      "eval_accuracy": 0.5173509286412512,
      "eval_loss": 2.205078125,
      "eval_runtime": 40.0844,
      "eval_samples_per_second": 89.012,
      "eval_steps_per_second": 11.127,
      "step": 2090000
    },
    {
      "epoch": 0.63,
      "learning_rate": 4.723136740113022e-05,
      "loss": 2.1791,
      "step": 2095000
    },
    {
      "epoch": 0.63,
      "eval_accuracy": 0.5174243520113619,
      "eval_loss": 2.205078125,
      "eval_runtime": 39.9803,
      "eval_samples_per_second": 89.244,
      "eval_steps_per_second": 11.156,
      "step": 2095000
    },
    {
      "epoch": 0.63,
      "learning_rate": 4.715652006154348e-05,
      "loss": 2.1812,
      "step": 2100000
    },
    {
      "epoch": 0.63,
      "eval_accuracy": 0.5173136690205979,
      "eval_loss": 2.205078125,
      "eval_runtime": 40.0609,
      "eval_samples_per_second": 89.064,
      "eval_steps_per_second": 11.133,
      "step": 2100000
    },
    {
      "epoch": 0.63,
      "learning_rate": 4.708168770041173e-05,
      "loss": 2.1835,
      "step": 2105000
    },
    {
      "epoch": 0.63,
      "eval_accuracy": 0.5175572263938386,
      "eval_loss": 2.205078125,
      "eval_runtime": 40.0398,
      "eval_samples_per_second": 89.111,
      "eval_steps_per_second": 11.139,
      "step": 2105000
    },
    {
      "epoch": 0.63,
      "learning_rate": 4.700687031773498e-05,
      "loss": 2.1806,
      "step": 2110000
    },
    {
      "epoch": 0.63,
      "eval_accuracy": 0.517552294973458,
      "eval_loss": 2.205078125,
      "eval_runtime": 40.3766,
      "eval_samples_per_second": 88.368,
      "eval_steps_per_second": 11.046,
      "step": 2110000
    },
    {
      "epoch": 0.63,
      "learning_rate": 4.6932037956603224e-05,
      "loss": 2.1832,
      "step": 2115000
    },
    {
      "epoch": 0.63,
      "eval_accuracy": 0.5174777757321516,
      "eval_loss": 2.205078125,
      "eval_runtime": 41.019,
      "eval_samples_per_second": 86.984,
      "eval_steps_per_second": 10.873,
      "step": 2115000
    },
    {
      "epoch": 0.64,
      "learning_rate": 4.6857205595471476e-05,
      "loss": 2.1766,
      "step": 2120000
    },
    {
      "epoch": 0.64,
      "eval_accuracy": 0.5177577708226486,
      "eval_loss": 2.203125,
      "eval_runtime": 40.432,
      "eval_samples_per_second": 88.247,
      "eval_steps_per_second": 11.031,
      "step": 2120000
    },
    {
      "epoch": 0.64,
      "learning_rate": 4.678237323433973e-05,
      "loss": 2.1775,
      "step": 2125000
    },
    {
      "epoch": 0.64,
      "eval_accuracy": 0.5178353037097432,
      "eval_loss": 2.203125,
      "eval_runtime": 41.1107,
      "eval_samples_per_second": 86.79,
      "eval_steps_per_second": 10.849,
      "step": 2125000
    },
    {
      "epoch": 0.64,
      "learning_rate": 4.6707540873207975e-05,
      "loss": 2.1801,
      "step": 2130000
    },
    {
      "epoch": 0.64,
      "eval_accuracy": 0.5176514713166673,
      "eval_loss": 2.203125,
      "eval_runtime": 41.0472,
      "eval_samples_per_second": 86.924,
      "eval_steps_per_second": 10.866,
      "step": 2130000
    },
    {
      "epoch": 0.64,
      "learning_rate": 4.6632708512076235e-05,
      "loss": 2.1789,
      "step": 2135000
    },
    {
      "epoch": 0.64,
      "eval_accuracy": 0.5177799622143612,
      "eval_loss": 2.203125,
      "eval_runtime": 41.4469,
      "eval_samples_per_second": 86.086,
      "eval_steps_per_second": 10.761,
      "step": 2135000
    },
    {
      "epoch": 0.64,
      "learning_rate": 4.655787615094449e-05,
      "loss": 2.1794,
      "step": 2140000
    },
    {
      "epoch": 0.64,
      "eval_accuracy": 0.5178131123180306,
      "eval_loss": 2.203125,
      "eval_runtime": 40.4764,
      "eval_samples_per_second": 88.15,
      "eval_steps_per_second": 11.019,
      "step": 2140000
    },
    {
      "epoch": 0.64,
      "learning_rate": 4.6483043789812734e-05,
      "loss": 2.1799,
      "step": 2145000
    },
    {
      "epoch": 0.64,
      "eval_accuracy": 0.5178917410763209,
      "eval_loss": 2.201171875,
      "eval_runtime": 40.376,
      "eval_samples_per_second": 88.369,
      "eval_steps_per_second": 11.046,
      "step": 2145000
    },
    {
      "epoch": 0.64,
      "learning_rate": 4.6408196450226e-05,
      "loss": 2.1746,
      "step": 2150000
    },
    {
      "epoch": 0.64,
      "eval_accuracy": 0.5180391357521402,
      "eval_loss": 2.201171875,
      "eval_runtime": 40.5387,
      "eval_samples_per_second": 88.015,
      "eval_steps_per_second": 11.002,
      "step": 2150000
    },
    {
      "epoch": 0.65,
      "learning_rate": 4.633336408909425e-05,
      "loss": 2.1766,
      "step": 2155000
    },
    {
      "epoch": 0.65,
      "eval_accuracy": 0.5178873575915381,
      "eval_loss": 2.201171875,
      "eval_runtime": 40.514,
      "eval_samples_per_second": 88.068,
      "eval_steps_per_second": 11.009,
      "step": 2155000
    },
    {
      "epoch": 0.65,
      "learning_rate": 4.62585317279625e-05,
      "loss": 2.1754,
      "step": 2160000
    },
    {
      "epoch": 0.65,
      "eval_accuracy": 0.5177369492699306,
      "eval_loss": 2.201171875,
      "eval_runtime": 42.6971,
      "eval_samples_per_second": 83.565,
      "eval_steps_per_second": 10.446,
      "step": 2160000
    },
    {
      "epoch": 0.65,
      "learning_rate": 4.618369936683075e-05,
      "loss": 2.1764,
      "step": 2165000
    },
    {
      "epoch": 0.65,
      "eval_accuracy": 0.5177405108513166,
      "eval_loss": 2.201171875,
      "eval_runtime": 40.5808,
      "eval_samples_per_second": 87.923,
      "eval_steps_per_second": 10.99,
      "step": 2165000
    },
    {
      "epoch": 0.65,
      "learning_rate": 4.6108881984154e-05,
      "loss": 2.1745,
      "step": 2170000
    },
    {
      "epoch": 0.65,
      "eval_accuracy": 0.51831337751886,
      "eval_loss": 2.19921875,
      "eval_runtime": 42.1403,
      "eval_samples_per_second": 84.67,
      "eval_steps_per_second": 10.584,
      "step": 2170000
    },
    {
      "epoch": 0.65,
      "learning_rate": 4.6034049623022244e-05,
      "loss": 2.1735,
      "step": 2175000
    },
    {
      "epoch": 0.65,
      "eval_accuracy": 0.5180128348434438,
      "eval_loss": 2.19921875,
      "eval_runtime": 40.2519,
      "eval_samples_per_second": 88.642,
      "eval_steps_per_second": 11.08,
      "step": 2175000
    },
    {
      "epoch": 0.65,
      "learning_rate": 4.59592172618905e-05,
      "loss": 2.1778,
      "step": 2180000
    },
    {
      "epoch": 0.65,
      "eval_accuracy": 0.5180588614336625,
      "eval_loss": 2.19921875,
      "eval_runtime": 42.4462,
      "eval_samples_per_second": 84.059,
      "eval_steps_per_second": 10.507,
      "step": 2180000
    },
    {
      "epoch": 0.65,
      "learning_rate": 4.5884384900758757e-05,
      "loss": 2.1717,
      "step": 2185000
    },
    {
      "epoch": 0.65,
      "eval_accuracy": 0.5183484453971218,
      "eval_loss": 2.19921875,
      "eval_runtime": 41.2843,
      "eval_samples_per_second": 86.425,
      "eval_steps_per_second": 10.803,
      "step": 2185000
    },
    {
      "epoch": 0.66,
      "learning_rate": 4.580953756117201e-05,
      "loss": 2.1752,
      "step": 2190000
    },
    {
      "epoch": 0.66,
      "eval_accuracy": 0.518520497174844,
      "eval_loss": 2.197265625,
      "eval_runtime": 40.4537,
      "eval_samples_per_second": 88.2,
      "eval_steps_per_second": 11.025,
      "step": 2190000
    },
    {
      "epoch": 0.66,
      "learning_rate": 4.5734720178495255e-05,
      "loss": 2.1747,
      "step": 2195000
    },
    {
      "epoch": 0.66,
      "eval_accuracy": 0.5184799499406038,
      "eval_loss": 2.197265625,
      "eval_runtime": 43.6458,
      "eval_samples_per_second": 81.749,
      "eval_steps_per_second": 10.219,
      "step": 2195000
    },
    {
      "epoch": 0.66,
      "learning_rate": 4.56599027958185e-05,
      "loss": 2.1754,
      "step": 2200000
    },
    {
      "epoch": 0.66,
      "eval_accuracy": 0.5186040573535149,
      "eval_loss": 2.197265625,
      "eval_runtime": 41.0029,
      "eval_samples_per_second": 87.018,
      "eval_steps_per_second": 10.877,
      "step": 2200000
    },
    {
      "epoch": 0.66,
      "learning_rate": 4.558508541314174e-05,
      "loss": 2.1728,
      "step": 2205000
    },
    {
      "epoch": 0.66,
      "eval_accuracy": 0.5187728215176501,
      "eval_loss": 2.197265625,
      "eval_runtime": 40.4446,
      "eval_samples_per_second": 88.22,
      "eval_steps_per_second": 11.027,
      "step": 2205000
    },
    {
      "epoch": 0.66,
      "learning_rate": 4.551025305200999e-05,
      "loss": 2.1684,
      "step": 2210000
    },
    {
      "epoch": 0.66,
      "eval_accuracy": 0.5185736469278347,
      "eval_loss": 2.197265625,
      "eval_runtime": 40.6605,
      "eval_samples_per_second": 87.751,
      "eval_steps_per_second": 10.969,
      "step": 2210000
    },
    {
      "epoch": 0.66,
      "learning_rate": 4.543540571242325e-05,
      "loss": 2.1722,
      "step": 2215000
    },
    {
      "epoch": 0.66,
      "eval_accuracy": 0.5188199439790645,
      "eval_loss": 2.1953125,
      "eval_runtime": 40.5747,
      "eval_samples_per_second": 87.937,
      "eval_steps_per_second": 10.992,
      "step": 2215000
    },
    {
      "epoch": 0.67,
      "learning_rate": 4.536058832974649e-05,
      "loss": 2.1692,
      "step": 2220000
    },
    {
      "epoch": 0.67,
      "eval_accuracy": 0.519004872243336,
      "eval_loss": 2.1953125,
      "eval_runtime": 41.1424,
      "eval_samples_per_second": 86.723,
      "eval_steps_per_second": 10.84,
      "step": 2220000
    },
    {
      "epoch": 0.67,
      "learning_rate": 4.528577094706974e-05,
      "loss": 2.176,
      "step": 2225000
    },
    {
      "epoch": 0.67,
      "eval_accuracy": 0.519122404429073,
      "eval_loss": 2.1953125,
      "eval_runtime": 42.7268,
      "eval_samples_per_second": 83.507,
      "eval_steps_per_second": 10.438,
      "step": 2225000
    },
    {
      "epoch": 0.67,
      "learning_rate": 4.5210923607483e-05,
      "loss": 2.1697,
      "step": 2230000
    },
    {
      "epoch": 0.67,
      "eval_accuracy": 0.5190202144400756,
      "eval_loss": 2.1953125,
      "eval_runtime": 40.4249,
      "eval_samples_per_second": 88.262,
      "eval_steps_per_second": 11.033,
      "step": 2230000
    },
    {
      "epoch": 0.67,
      "learning_rate": 4.5136106224806244e-05,
      "loss": 2.1731,
      "step": 2235000
    },
    {
      "epoch": 0.67,
      "eval_accuracy": 0.5190837749694251,
      "eval_loss": 2.1953125,
      "eval_runtime": 42.0959,
      "eval_samples_per_second": 84.759,
      "eval_steps_per_second": 10.595,
      "step": 2235000
    },
    {
      "epoch": 0.67,
      "learning_rate": 4.506124390676451e-05,
      "loss": 2.173,
      "step": 2240000
    },
    {
      "epoch": 0.67,
      "eval_accuracy": 0.5191125415883119,
      "eval_loss": 2.193359375,
      "eval_runtime": 40.9494,
      "eval_samples_per_second": 87.132,
      "eval_steps_per_second": 10.892,
      "step": 2240000
    },
    {
      "epoch": 0.67,
      "learning_rate": 4.498644150254274e-05,
      "loss": 2.1714,
      "step": 2245000
    },
    {
      "epoch": 0.67,
      "eval_accuracy": 0.5192900727220126,
      "eval_loss": 2.193359375,
      "eval_runtime": 40.4515,
      "eval_samples_per_second": 88.204,
      "eval_steps_per_second": 11.026,
      "step": 2245000
    },
    {
      "epoch": 0.67,
      "learning_rate": 4.4911594162956e-05,
      "loss": 2.1719,
      "step": 2250000
    },
    {
      "epoch": 0.67,
      "eval_accuracy": 0.5192147315773094,
      "eval_loss": 2.193359375,
      "eval_runtime": 40.7422,
      "eval_samples_per_second": 87.575,
      "eval_steps_per_second": 10.947,
      "step": 2250000
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.483674682336927e-05,
      "loss": 2.1667,
      "step": 2255000
    },
    {
      "epoch": 0.68,
      "eval_accuracy": 0.5189793932380363,
      "eval_loss": 2.193359375,
      "eval_runtime": 40.4467,
      "eval_samples_per_second": 88.215,
      "eval_steps_per_second": 11.027,
      "step": 2255000
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.476191446223752e-05,
      "loss": 2.1653,
      "step": 2260000
    },
    {
      "epoch": 0.68,
      "eval_accuracy": 0.5191834992482324,
      "eval_loss": 2.193359375,
      "eval_runtime": 40.3493,
      "eval_samples_per_second": 88.428,
      "eval_steps_per_second": 11.053,
      "step": 2260000
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.468709707956076e-05,
      "loss": 2.1656,
      "step": 2265000
    },
    {
      "epoch": 0.68,
      "eval_accuracy": 0.5193434964428021,
      "eval_loss": 2.19140625,
      "eval_runtime": 44.129,
      "eval_samples_per_second": 80.854,
      "eval_steps_per_second": 10.107,
      "step": 2265000
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.4612264718429014e-05,
      "loss": 2.1695,
      "step": 2270000
    },
    {
      "epoch": 0.68,
      "eval_accuracy": 0.5194328099452503,
      "eval_loss": 2.19140625,
      "eval_runtime": 42.07,
      "eval_samples_per_second": 84.811,
      "eval_steps_per_second": 10.601,
      "step": 2270000
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.453744733575226e-05,
      "loss": 2.17,
      "step": 2275000
    },
    {
      "epoch": 0.68,
      "eval_accuracy": 0.5195643144887323,
      "eval_loss": 2.19140625,
      "eval_runtime": 40.4092,
      "eval_samples_per_second": 88.297,
      "eval_steps_per_second": 11.037,
      "step": 2275000
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.44626299530755e-05,
      "loss": 2.1628,
      "step": 2280000
    },
    {
      "epoch": 0.68,
      "eval_accuracy": 0.5197062298085732,
      "eval_loss": 2.19140625,
      "eval_runtime": 40.3663,
      "eval_samples_per_second": 88.391,
      "eval_steps_per_second": 11.049,
      "step": 2280000
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.438779759194375e-05,
      "loss": 2.1648,
      "step": 2285000
    },
    {
      "epoch": 0.68,
      "eval_accuracy": 0.5196210258231089,
      "eval_loss": 2.189453125,
      "eval_runtime": 41.4265,
      "eval_samples_per_second": 86.128,
      "eval_steps_per_second": 10.766,
      "step": 2285000
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.431298020926699e-05,
      "loss": 2.1647,
      "step": 2290000
    },
    {
      "epoch": 0.69,
      "eval_accuracy": 0.5199106097865681,
      "eval_loss": 2.189453125,
      "eval_runtime": 43.7368,
      "eval_samples_per_second": 81.579,
      "eval_steps_per_second": 10.197,
      "step": 2290000
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.423813286968026e-05,
      "loss": 2.1648,
      "step": 2295000
    },
    {
      "epoch": 0.69,
      "eval_accuracy": 0.5198015706025977,
      "eval_loss": 2.189453125,
      "eval_runtime": 40.3741,
      "eval_samples_per_second": 88.374,
      "eval_steps_per_second": 11.047,
      "step": 2295000
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.4163315487003496e-05,
      "loss": 2.168,
      "step": 2300000
    },
    {
      "epoch": 0.69,
      "eval_accuracy": 0.5196733536727027,
      "eval_loss": 2.189453125,
      "eval_runtime": 40.4104,
      "eval_samples_per_second": 88.294,
      "eval_steps_per_second": 11.037,
      "step": 2300000
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.4088498104326735e-05,
      "loss": 2.1607,
      "step": 2305000
    },
    {
      "epoch": 0.69,
      "eval_accuracy": 0.5197840366634667,
      "eval_loss": 2.189453125,
      "eval_runtime": 40.7993,
      "eval_samples_per_second": 87.452,
      "eval_steps_per_second": 10.932,
      "step": 2305000
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.401365076474e-05,
      "loss": 2.1674,
      "step": 2310000
    },
    {
      "epoch": 0.69,
      "eval_accuracy": 0.5199684169921404,
      "eval_loss": 2.1875,
      "eval_runtime": 40.3824,
      "eval_samples_per_second": 88.355,
      "eval_steps_per_second": 11.044,
      "step": 2310000
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.393881840360825e-05,
      "loss": 2.1656,
      "step": 2315000
    },
    {
      "epoch": 0.69,
      "eval_accuracy": 0.5199689649277383,
      "eval_loss": 2.1875,
      "eval_runtime": 40.7535,
      "eval_samples_per_second": 87.551,
      "eval_steps_per_second": 10.944,
      "step": 2315000
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.38639860424765e-05,
      "loss": 2.1637,
      "step": 2320000
    },
    {
      "epoch": 0.7,
      "eval_accuracy": 0.5201547150954066,
      "eval_loss": 2.1875,
      "eval_runtime": 40.6083,
      "eval_samples_per_second": 87.864,
      "eval_steps_per_second": 10.983,
      "step": 2320000
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.3789168659799746e-05,
      "loss": 2.1649,
      "step": 2325000
    },
    {
      "epoch": 0.7,
      "eval_accuracy": 0.5201152637323619,
      "eval_loss": 2.1875,
      "eval_runtime": 41.4342,
      "eval_samples_per_second": 86.112,
      "eval_steps_per_second": 10.764,
      "step": 2325000
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.371436625557798e-05,
      "loss": 2.1625,
      "step": 2330000
    },
    {
      "epoch": 0.7,
      "eval_accuracy": 0.5200544428810016,
      "eval_loss": 2.1875,
      "eval_runtime": 44.1316,
      "eval_samples_per_second": 80.849,
      "eval_steps_per_second": 10.106,
      "step": 2330000
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.363950393753625e-05,
      "loss": 2.1627,
      "step": 2335000
    },
    {
      "epoch": 0.7,
      "eval_accuracy": 0.5202593707945943,
      "eval_loss": 2.1875,
      "eval_runtime": 42.6548,
      "eval_samples_per_second": 83.648,
      "eval_steps_per_second": 10.456,
      "step": 2335000
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.356468655485949e-05,
      "loss": 2.1598,
      "step": 2340000
    },
    {
      "epoch": 0.7,
      "eval_accuracy": 0.5203048494492152,
      "eval_loss": 2.185546875,
      "eval_runtime": 43.9859,
      "eval_samples_per_second": 81.117,
      "eval_steps_per_second": 10.14,
      "step": 2340000
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.348982423681776e-05,
      "loss": 2.1638,
      "step": 2345000
    },
    {
      "epoch": 0.7,
      "eval_accuracy": 0.5201473179648357,
      "eval_loss": 2.1875,
      "eval_runtime": 44.5632,
      "eval_samples_per_second": 80.066,
      "eval_steps_per_second": 10.008,
      "step": 2345000
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.341499187568602e-05,
      "loss": 2.1588,
      "step": 2350000
    },
    {
      "epoch": 0.7,
      "eval_accuracy": 0.5204785450337309,
      "eval_loss": 2.185546875,
      "eval_runtime": 41.6749,
      "eval_samples_per_second": 85.615,
      "eval_steps_per_second": 10.702,
      "step": 2350000
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.334015951455427e-05,
      "loss": 2.1633,
      "step": 2355000
    },
    {
      "epoch": 0.71,
      "eval_accuracy": 0.5204648466437849,
      "eval_loss": 2.185546875,
      "eval_runtime": 40.4241,
      "eval_samples_per_second": 88.264,
      "eval_steps_per_second": 11.033,
      "step": 2355000
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.326534213187751e-05,
      "loss": 2.1621,
      "step": 2360000
    },
    {
      "epoch": 0.71,
      "eval_accuracy": 0.5205470369834612,
      "eval_loss": 2.185546875,
      "eval_runtime": 40.3566,
      "eval_samples_per_second": 88.412,
      "eval_steps_per_second": 11.051,
      "step": 2360000
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.319049479229077e-05,
      "loss": 2.165,
      "step": 2365000
    },
    {
      "epoch": 0.71,
      "eval_accuracy": 0.5207188147933844,
      "eval_loss": 2.18359375,
      "eval_runtime": 40.8467,
      "eval_samples_per_second": 87.351,
      "eval_steps_per_second": 10.919,
      "step": 2365000
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.311566243115902e-05,
      "loss": 2.159,
      "step": 2370000
    },
    {
      "epoch": 0.71,
      "eval_accuracy": 0.52062347399936,
      "eval_loss": 2.18359375,
      "eval_runtime": 43.216,
      "eval_samples_per_second": 82.562,
      "eval_steps_per_second": 10.32,
      "step": 2370000
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.3040830070027275e-05,
      "loss": 2.1573,
      "step": 2375000
    },
    {
      "epoch": 0.71,
      "eval_accuracy": 0.5207314173121348,
      "eval_loss": 2.18359375,
      "eval_runtime": 44.6428,
      "eval_samples_per_second": 79.923,
      "eval_steps_per_second": 9.99,
      "step": 2375000
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.2966012687350514e-05,
      "loss": 2.1556,
      "step": 2380000
    },
    {
      "epoch": 0.71,
      "eval_accuracy": 0.520848401562274,
      "eval_loss": 2.18359375,
      "eval_runtime": 40.6164,
      "eval_samples_per_second": 87.846,
      "eval_steps_per_second": 10.981,
      "step": 2380000
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.289119530467376e-05,
      "loss": 2.1562,
      "step": 2385000
    },
    {
      "epoch": 0.71,
      "eval_accuracy": 0.5209563448750487,
      "eval_loss": 2.18359375,
      "eval_runtime": 40.356,
      "eval_samples_per_second": 88.413,
      "eval_steps_per_second": 11.052,
      "step": 2385000
    },
    {
      "epoch": 0.72,
      "learning_rate": 4.281636294354201e-05,
      "loss": 2.1572,
      "step": 2390000
    },
    {
      "epoch": 0.72,
      "eval_accuracy": 0.5209188112865967,
      "eval_loss": 2.18359375,
      "eval_runtime": 44.3639,
      "eval_samples_per_second": 80.426,
      "eval_steps_per_second": 10.053,
      "step": 2390000
    },
    {
      "epoch": 0.72,
      "learning_rate": 4.274154556086525e-05,
      "loss": 2.1577,
      "step": 2395000
    },
    {
      "epoch": 0.72,
      "eval_accuracy": 0.5208686751793942,
      "eval_loss": 2.181640625,
      "eval_runtime": 42.2402,
      "eval_samples_per_second": 84.469,
      "eval_steps_per_second": 10.559,
      "step": 2395000
    },
    {
      "epoch": 0.72,
      "learning_rate": 4.2666713199733505e-05,
      "loss": 2.1529,
      "step": 2400000
    },
    {
      "epoch": 0.72,
      "eval_accuracy": 0.5209933305279031,
      "eval_loss": 2.181640625,
      "eval_runtime": 42.0012,
      "eval_samples_per_second": 84.95,
      "eval_steps_per_second": 10.619,
      "step": 2400000
    },
    {
      "epoch": 0.72,
      "learning_rate": 4.259188083860176e-05,
      "loss": 2.1636,
      "step": 2405000
    },
    {
      "epoch": 0.72,
      "eval_accuracy": 0.5210516856690732,
      "eval_loss": 2.181640625,
      "eval_runtime": 40.8766,
      "eval_samples_per_second": 87.287,
      "eval_steps_per_second": 10.911,
      "step": 2405000
    },
    {
      "epoch": 0.72,
      "learning_rate": 4.2517063455924996e-05,
      "loss": 2.1521,
      "step": 2410000
    },
    {
      "epoch": 0.72,
      "eval_accuracy": 0.5212941471711181,
      "eval_loss": 2.181640625,
      "eval_runtime": 44.8987,
      "eval_samples_per_second": 79.468,
      "eval_steps_per_second": 9.933,
      "step": 2410000
    },
    {
      "epoch": 0.72,
      "learning_rate": 4.244221611633826e-05,
      "loss": 2.1574,
      "step": 2415000
    },
    {
      "epoch": 0.72,
      "eval_accuracy": 0.5213697622836202,
      "eval_loss": 2.181640625,
      "eval_runtime": 40.8755,
      "eval_samples_per_second": 87.289,
      "eval_steps_per_second": 10.911,
      "step": 2415000
    },
    {
      "epoch": 0.72,
      "learning_rate": 4.236736877675152e-05,
      "loss": 2.1546,
      "step": 2420000
    },
    {
      "epoch": 0.72,
      "eval_accuracy": 0.5213067496898685,
      "eval_loss": 2.1796875,
      "eval_runtime": 43.2862,
      "eval_samples_per_second": 82.428,
      "eval_steps_per_second": 10.304,
      "step": 2420000
    },
    {
      "epoch": 0.73,
      "learning_rate": 4.2292536415619776e-05,
      "loss": 2.1572,
      "step": 2425000
    },
    {
      "epoch": 0.73,
      "eval_accuracy": 0.521194148924512,
      "eval_loss": 2.1796875,
      "eval_runtime": 42.5113,
      "eval_samples_per_second": 83.931,
      "eval_steps_per_second": 10.491,
      "step": 2425000
    },
    {
      "epoch": 0.73,
      "learning_rate": 4.2217719032943015e-05,
      "loss": 2.1544,
      "step": 2430000
    },
    {
      "epoch": 0.73,
      "eval_accuracy": 0.5212160663484257,
      "eval_loss": 2.1796875,
      "eval_runtime": 42.4347,
      "eval_samples_per_second": 84.082,
      "eval_steps_per_second": 10.51,
      "step": 2430000
    },
    {
      "epoch": 0.73,
      "learning_rate": 4.214290165026626e-05,
      "loss": 2.15,
      "step": 2435000
    },
    {
      "epoch": 0.73,
      "eval_accuracy": 0.5213122290458468,
      "eval_loss": 2.1796875,
      "eval_runtime": 41.657,
      "eval_samples_per_second": 85.652,
      "eval_steps_per_second": 10.706,
      "step": 2435000
    },
    {
      "epoch": 0.73,
      "learning_rate": 4.206805431067952e-05,
      "loss": 2.1537,
      "step": 2440000
    },
    {
      "epoch": 0.73,
      "eval_accuracy": 0.5217242766154238,
      "eval_loss": 2.177734375,
      "eval_runtime": 45.9893,
      "eval_samples_per_second": 77.583,
      "eval_steps_per_second": 9.698,
      "step": 2440000
    },
    {
      "epoch": 0.73,
      "learning_rate": 4.199322194954777e-05,
      "loss": 2.1552,
      "step": 2445000
    },
    {
      "epoch": 0.73,
      "eval_accuracy": 0.5215689368734356,
      "eval_loss": 2.177734375,
      "eval_runtime": 43.8458,
      "eval_samples_per_second": 81.376,
      "eval_steps_per_second": 10.172,
      "step": 2445000
    },
    {
      "epoch": 0.73,
      "learning_rate": 4.1918389588416026e-05,
      "loss": 2.1522,
      "step": 2450000
    },
    {
      "epoch": 0.73,
      "eval_accuracy": 0.5215245540900105,
      "eval_loss": 2.177734375,
      "eval_runtime": 45.304,
      "eval_samples_per_second": 78.757,
      "eval_steps_per_second": 9.845,
      "step": 2450000
    },
    {
      "epoch": 0.74,
      "learning_rate": 4.1843542248829286e-05,
      "loss": 2.1487,
      "step": 2455000
    },
    {
      "epoch": 0.74,
      "eval_accuracy": 0.5214875684371562,
      "eval_loss": 2.177734375,
      "eval_runtime": 41.9232,
      "eval_samples_per_second": 85.108,
      "eval_steps_per_second": 10.639,
      "step": 2455000
    },
    {
      "epoch": 0.74,
      "learning_rate": 4.176870988769754e-05,
      "loss": 2.1582,
      "step": 2460000
    },
    {
      "epoch": 0.74,
      "eval_accuracy": 0.52146373323865,
      "eval_loss": 2.177734375,
      "eval_runtime": 44.2104,
      "eval_samples_per_second": 80.705,
      "eval_steps_per_second": 10.088,
      "step": 2460000
    },
    {
      "epoch": 0.74,
      "learning_rate": 4.169390748347577e-05,
      "loss": 2.1582,
      "step": 2465000
    },
    {
      "epoch": 0.74,
      "eval_accuracy": 0.5218020834703172,
      "eval_loss": 2.177734375,
      "eval_runtime": 43.1549,
      "eval_samples_per_second": 82.679,
      "eval_steps_per_second": 10.335,
      "step": 2465000
    },
    {
      "epoch": 0.74,
      "learning_rate": 4.161907512234402e-05,
      "loss": 2.1529,
      "step": 2470000
    },
    {
      "epoch": 0.74,
      "eval_accuracy": 0.5217976999855345,
      "eval_loss": 2.177734375,
      "eval_runtime": 45.1081,
      "eval_samples_per_second": 79.099,
      "eval_steps_per_second": 9.887,
      "step": 2470000
    },
    {
      "epoch": 0.74,
      "learning_rate": 4.1544242761212276e-05,
      "loss": 2.1549,
      "step": 2475000
    },
    {
      "epoch": 0.74,
      "eval_accuracy": 0.5219418070477668,
      "eval_loss": 2.17578125,
      "eval_runtime": 40.8292,
      "eval_samples_per_second": 87.388,
      "eval_steps_per_second": 10.924,
      "step": 2475000
    },
    {
      "epoch": 0.74,
      "learning_rate": 4.1469425378535516e-05,
      "loss": 2.1525,
      "step": 2480000
    },
    {
      "epoch": 0.74,
      "eval_accuracy": 0.521930574368011,
      "eval_loss": 2.17578125,
      "eval_runtime": 43.1177,
      "eval_samples_per_second": 82.75,
      "eval_steps_per_second": 10.344,
      "step": 2480000
    },
    {
      "epoch": 0.74,
      "learning_rate": 4.139459301740377e-05,
      "loss": 2.1478,
      "step": 2485000
    },
    {
      "epoch": 0.74,
      "eval_accuracy": 0.5221272832476362,
      "eval_loss": 2.17578125,
      "eval_runtime": 44.4519,
      "eval_samples_per_second": 80.266,
      "eval_steps_per_second": 10.033,
      "step": 2485000
    },
    {
      "epoch": 0.75,
      "learning_rate": 4.131977563472701e-05,
      "loss": 2.1524,
      "step": 2490000
    },
    {
      "epoch": 0.75,
      "eval_accuracy": 0.5219949568007575,
      "eval_loss": 2.17578125,
      "eval_runtime": 43.8567,
      "eval_samples_per_second": 81.356,
      "eval_steps_per_second": 10.169,
      "step": 2490000
    },
    {
      "epoch": 0.75,
      "learning_rate": 4.124494327359526e-05,
      "loss": 2.1477,
      "step": 2495000
    },
    {
      "epoch": 0.75,
      "eval_accuracy": 0.5220256411942366,
      "eval_loss": 2.173828125,
      "eval_runtime": 40.3311,
      "eval_samples_per_second": 88.468,
      "eval_steps_per_second": 11.058,
      "step": 2495000
    },
    {
      "epoch": 0.75,
      "learning_rate": 4.117011091246352e-05,
      "loss": 2.1524,
      "step": 2500000
    },
    {
      "epoch": 0.75,
      "eval_accuracy": 0.5221511184461423,
      "eval_loss": 2.173828125,
      "eval_runtime": 42.2823,
      "eval_samples_per_second": 84.385,
      "eval_steps_per_second": 10.548,
      "step": 2500000
    },
    {
      "epoch": 0.75,
      "learning_rate": 4.1095278551331766e-05,
      "loss": 2.147,
      "step": 2505000
    },
    {
      "epoch": 0.75,
      "eval_accuracy": 0.5221815288718226,
      "eval_loss": 2.173828125,
      "eval_runtime": 40.7144,
      "eval_samples_per_second": 87.635,
      "eval_steps_per_second": 10.954,
      "step": 2505000
    },
    {
      "epoch": 0.75,
      "learning_rate": 4.102046116865501e-05,
      "loss": 2.1481,
      "step": 2510000
    },
    {
      "epoch": 0.75,
      "eval_accuracy": 0.5222954994761736,
      "eval_loss": 2.173828125,
      "eval_runtime": 42.7002,
      "eval_samples_per_second": 83.559,
      "eval_steps_per_second": 10.445,
      "step": 2510000
    },
    {
      "epoch": 0.75,
      "learning_rate": 4.094559885061328e-05,
      "loss": 2.1494,
      "step": 2515000
    },
    {
      "epoch": 0.75,
      "eval_accuracy": 0.5222659109538901,
      "eval_loss": 2.173828125,
      "eval_runtime": 42.0725,
      "eval_samples_per_second": 84.806,
      "eval_steps_per_second": 10.601,
      "step": 2515000
    },
    {
      "epoch": 0.75,
      "learning_rate": 4.087078146793652e-05,
      "loss": 2.1484,
      "step": 2520000
    },
    {
      "epoch": 0.75,
      "eval_accuracy": 0.5222675547606836,
      "eval_loss": 2.173828125,
      "eval_runtime": 44.1957,
      "eval_samples_per_second": 80.732,
      "eval_steps_per_second": 10.091,
      "step": 2520000
    },
    {
      "epoch": 0.76,
      "learning_rate": 4.079594910680478e-05,
      "loss": 2.1474,
      "step": 2525000
    },
    {
      "epoch": 0.76,
      "eval_accuracy": 0.5223297454510387,
      "eval_loss": 2.173828125,
      "eval_runtime": 43.3427,
      "eval_samples_per_second": 82.321,
      "eval_steps_per_second": 10.29,
      "step": 2525000
    },
    {
      "epoch": 0.76,
      "learning_rate": 4.072110176721804e-05,
      "loss": 2.1487,
      "step": 2530000
    },
    {
      "epoch": 0.76,
      "eval_accuracy": 0.5222724861810643,
      "eval_loss": 2.173828125,
      "eval_runtime": 44.0468,
      "eval_samples_per_second": 81.005,
      "eval_steps_per_second": 10.126,
      "step": 2530000
    },
    {
      "epoch": 0.76,
      "learning_rate": 4.064626940608628e-05,
      "loss": 2.1465,
      "step": 2535000
    },
    {
      "epoch": 0.76,
      "eval_accuracy": 0.5224768661590591,
      "eval_loss": 2.171875,
      "eval_runtime": 40.4028,
      "eval_samples_per_second": 88.311,
      "eval_steps_per_second": 11.039,
      "step": 2535000
    },
    {
      "epoch": 0.76,
      "learning_rate": 4.057145202340953e-05,
      "loss": 2.1456,
      "step": 2540000
    },
    {
      "epoch": 0.76,
      "eval_accuracy": 0.5226201513178947,
      "eval_loss": 2.171875,
      "eval_runtime": 42.5959,
      "eval_samples_per_second": 83.764,
      "eval_steps_per_second": 10.47,
      "step": 2540000
    },
    {
      "epoch": 0.76,
      "learning_rate": 4.049661966227778e-05,
      "loss": 2.1482,
      "step": 2545000
    },
    {
      "epoch": 0.76,
      "eval_accuracy": 0.5223516628749524,
      "eval_loss": 2.171875,
      "eval_runtime": 43.342,
      "eval_samples_per_second": 82.322,
      "eval_steps_per_second": 10.29,
      "step": 2545000
    },
    {
      "epoch": 0.76,
      "learning_rate": 4.042180227960102e-05,
      "loss": 2.1451,
      "step": 2550000
    },
    {
      "epoch": 0.76,
      "eval_accuracy": 0.5226286443196613,
      "eval_loss": 2.171875,
      "eval_runtime": 42.1401,
      "eval_samples_per_second": 84.67,
      "eval_steps_per_second": 10.584,
      "step": 2550000
    },
    {
      "epoch": 0.77,
      "learning_rate": 4.0346969918469274e-05,
      "loss": 2.143,
      "step": 2555000
    },
    {
      "epoch": 0.77,
      "eval_accuracy": 0.5225609742733278,
      "eval_loss": 2.171875,
      "eval_runtime": 44.8351,
      "eval_samples_per_second": 79.581,
      "eval_steps_per_second": 9.948,
      "step": 2555000
    },
    {
      "epoch": 0.77,
      "learning_rate": 4.027210760042755e-05,
      "loss": 2.1463,
      "step": 2560000
    },
    {
      "epoch": 0.77,
      "eval_accuracy": 0.5225061807135436,
      "eval_loss": 2.171875,
      "eval_runtime": 42.3643,
      "eval_samples_per_second": 84.222,
      "eval_steps_per_second": 10.528,
      "step": 2560000
    },
    {
      "epoch": 0.77,
      "learning_rate": 4.0197290217750786e-05,
      "loss": 2.1466,
      "step": 2565000
    },
    {
      "epoch": 0.77,
      "eval_accuracy": 0.5227820662870569,
      "eval_loss": 2.169921875,
      "eval_runtime": 44.9199,
      "eval_samples_per_second": 79.43,
      "eval_steps_per_second": 9.929,
      "step": 2565000
    },
    {
      "epoch": 0.77,
      "learning_rate": 4.012247283507403e-05,
      "loss": 2.1423,
      "step": 2570000
    },
    {
      "epoch": 0.77,
      "eval_accuracy": 0.5229272692204849,
      "eval_loss": 2.169921875,
      "eval_runtime": 43.6123,
      "eval_samples_per_second": 81.812,
      "eval_steps_per_second": 10.226,
      "step": 2570000
    },
    {
      "epoch": 0.77,
      "learning_rate": 4.004765545239728e-05,
      "loss": 2.1423,
      "step": 2575000
    },
    {
      "epoch": 0.77,
      "eval_accuracy": 0.5230557601181788,
      "eval_loss": 2.169921875,
      "eval_runtime": 44.819,
      "eval_samples_per_second": 79.609,
      "eval_steps_per_second": 9.951,
      "step": 2575000
    },
    {
      "epoch": 0.77,
      "learning_rate": 3.997283806972052e-05,
      "loss": 2.1444,
      "step": 2580000
    },
    {
      "epoch": 0.77,
      "eval_accuracy": 0.5230245277891018,
      "eval_loss": 2.169921875,
      "eval_runtime": 42.2873,
      "eval_samples_per_second": 84.375,
      "eval_steps_per_second": 10.547,
      "step": 2580000
    },
    {
      "epoch": 0.77,
      "learning_rate": 3.9898020687043756e-05,
      "loss": 2.1402,
      "step": 2585000
    },
    {
      "epoch": 0.77,
      "eval_accuracy": 0.5230417877604338,
      "eval_loss": 2.16796875,
      "eval_runtime": 44.6974,
      "eval_samples_per_second": 79.826,
      "eval_steps_per_second": 9.978,
      "step": 2585000
    },
    {
      "epoch": 0.78,
      "learning_rate": 3.9823203304367e-05,
      "loss": 2.1376,
      "step": 2590000
    },
    {
      "epoch": 0.78,
      "eval_accuracy": 0.5230924718032341,
      "eval_loss": 2.16796875,
      "eval_runtime": 43.4573,
      "eval_samples_per_second": 82.104,
      "eval_steps_per_second": 10.263,
      "step": 2590000
    },
    {
      "epoch": 0.78,
      "learning_rate": 3.974838592169024e-05,
      "loss": 2.1395,
      "step": 2595000
    },
    {
      "epoch": 0.78,
      "eval_accuracy": 0.5231894564040521,
      "eval_loss": 2.16796875,
      "eval_runtime": 43.8137,
      "eval_samples_per_second": 81.436,
      "eval_steps_per_second": 10.179,
      "step": 2595000
    },
    {
      "epoch": 0.78,
      "learning_rate": 3.9673553560558494e-05,
      "loss": 2.1399,
      "step": 2600000
    },
    {
      "epoch": 0.78,
      "eval_accuracy": 0.5232801397454949,
      "eval_loss": 2.16796875,
      "eval_runtime": 41.9685,
      "eval_samples_per_second": 85.016,
      "eval_steps_per_second": 10.627,
      "step": 2600000
    },
    {
      "epoch": 0.78,
      "learning_rate": 3.9598721199426747e-05,
      "loss": 2.1379,
      "step": 2605000
    },
    {
      "epoch": 0.78,
      "eval_accuracy": 0.5230908279964406,
      "eval_loss": 2.16796875,
      "eval_runtime": 42.9652,
      "eval_samples_per_second": 83.044,
      "eval_steps_per_second": 10.38,
      "step": 2605000
    },
    {
      "epoch": 0.78,
      "learning_rate": 3.952390381674999e-05,
      "loss": 2.1411,
      "step": 2610000
    },
    {
      "epoch": 0.78,
      "eval_accuracy": 0.5233708230869376,
      "eval_loss": 2.166015625,
      "eval_runtime": 41.4989,
      "eval_samples_per_second": 85.978,
      "eval_steps_per_second": 10.747,
      "step": 2610000
    },
    {
      "epoch": 0.78,
      "learning_rate": 3.944908643407323e-05,
      "loss": 2.1421,
      "step": 2615000
    },
    {
      "epoch": 0.78,
      "eval_accuracy": 0.5232478115452223,
      "eval_loss": 2.166015625,
      "eval_runtime": 41.1264,
      "eval_samples_per_second": 86.757,
      "eval_steps_per_second": 10.845,
      "step": 2615000
    },
    {
      "epoch": 0.78,
      "learning_rate": 3.9374254072941484e-05,
      "loss": 2.1412,
      "step": 2620000
    },
    {
      "epoch": 0.78,
      "eval_accuracy": 0.5236650645029786,
      "eval_loss": 2.166015625,
      "eval_runtime": 43.7159,
      "eval_samples_per_second": 81.618,
      "eval_steps_per_second": 10.202,
      "step": 2620000
    },
    {
      "epoch": 0.79,
      "learning_rate": 3.929942171180974e-05,
      "loss": 2.1381,
      "step": 2625000
    },
    {
      "epoch": 0.79,
      "eval_accuracy": 0.5235886274870797,
      "eval_loss": 2.166015625,
      "eval_runtime": 43.6678,
      "eval_samples_per_second": 81.708,
      "eval_steps_per_second": 10.213,
      "step": 2625000
    },
    {
      "epoch": 0.79,
      "learning_rate": 3.922458935067799e-05,
      "loss": 2.142,
      "step": 2630000
    },
    {
      "epoch": 0.79,
      "eval_accuracy": 0.523625339172135,
      "eval_loss": 2.166015625,
      "eval_runtime": 42.3354,
      "eval_samples_per_second": 84.279,
      "eval_steps_per_second": 10.535,
      "step": 2630000
    },
    {
      "epoch": 0.79,
      "learning_rate": 3.9149756989546236e-05,
      "loss": 2.1394,
      "step": 2635000
    },
    {
      "epoch": 0.79,
      "eval_accuracy": 0.5236212296551512,
      "eval_loss": 2.1640625,
      "eval_runtime": 42.9131,
      "eval_samples_per_second": 83.145,
      "eval_steps_per_second": 10.393,
      "step": 2635000
    },
    {
      "epoch": 0.79,
      "learning_rate": 3.907493960686948e-05,
      "loss": 2.1384,
      "step": 2640000
    },
    {
      "epoch": 0.79,
      "eval_accuracy": 0.5233793160887042,
      "eval_loss": 2.1640625,
      "eval_runtime": 40.2525,
      "eval_samples_per_second": 88.64,
      "eval_steps_per_second": 11.08,
      "step": 2640000
    },
    {
      "epoch": 0.79,
      "learning_rate": 3.900012222419273e-05,
      "loss": 2.138,
      "step": 2645000
    },
    {
      "epoch": 0.79,
      "eval_accuracy": 0.5235653402241714,
      "eval_loss": 2.1640625,
      "eval_runtime": 43.9803,
      "eval_samples_per_second": 81.127,
      "eval_steps_per_second": 10.141,
      "step": 2645000
    },
    {
      "epoch": 0.79,
      "learning_rate": 3.892530484151597e-05,
      "loss": 2.1346,
      "step": 2650000
    },
    {
      "epoch": 0.79,
      "eval_accuracy": 0.523867526706381,
      "eval_loss": 2.1640625,
      "eval_runtime": 44.5226,
      "eval_samples_per_second": 80.139,
      "eval_steps_per_second": 10.017,
      "step": 2650000
    },
    {
      "epoch": 0.8,
      "learning_rate": 3.885047248038421e-05,
      "loss": 2.1376,
      "step": 2655000
    },
    {
      "epoch": 0.8,
      "eval_accuracy": 0.5239204024915728,
      "eval_loss": 2.1640625,
      "eval_runtime": 42.646,
      "eval_samples_per_second": 83.666,
      "eval_steps_per_second": 10.458,
      "step": 2655000
    },
    {
      "epoch": 0.8,
      "learning_rate": 3.877564011925247e-05,
      "loss": 2.1409,
      "step": 2660000
    },
    {
      "epoch": 0.8,
      "eval_accuracy": 0.5239705385987753,
      "eval_loss": 2.1640625,
      "eval_runtime": 40.3234,
      "eval_samples_per_second": 88.485,
      "eval_steps_per_second": 11.061,
      "step": 2660000
    },
    {
      "epoch": 0.8,
      "learning_rate": 3.8700807758120725e-05,
      "loss": 2.1343,
      "step": 2665000
    },
    {
      "epoch": 0.8,
      "eval_accuracy": 0.5239877985701072,
      "eval_loss": 2.1640625,
      "eval_runtime": 42.9773,
      "eval_samples_per_second": 83.021,
      "eval_steps_per_second": 10.378,
      "step": 2665000
    },
    {
      "epoch": 0.8,
      "learning_rate": 3.862597539698897e-05,
      "loss": 2.1363,
      "step": 2670000
    },
    {
      "epoch": 0.8,
      "eval_accuracy": 0.5240447838722828,
      "eval_loss": 2.162109375,
      "eval_runtime": 44.9261,
      "eval_samples_per_second": 79.419,
      "eval_steps_per_second": 9.927,
      "step": 2670000
    },
    {
      "epoch": 0.8,
      "learning_rate": 3.855112805740224e-05,
      "loss": 2.1343,
      "step": 2675000
    },
    {
      "epoch": 0.8,
      "eval_accuracy": 0.5241869731599227,
      "eval_loss": 2.162109375,
      "eval_runtime": 43.4218,
      "eval_samples_per_second": 82.171,
      "eval_steps_per_second": 10.271,
      "step": 2675000
    },
    {
      "epoch": 0.8,
      "learning_rate": 3.847631067472548e-05,
      "loss": 2.1381,
      "step": 2680000
    },
    {
      "epoch": 0.8,
      "eval_accuracy": 0.5243439567087043,
      "eval_loss": 2.162109375,
      "eval_runtime": 43.0405,
      "eval_samples_per_second": 82.899,
      "eval_steps_per_second": 10.362,
      "step": 2680000
    },
    {
      "epoch": 0.8,
      "learning_rate": 3.840147831359373e-05,
      "loss": 2.1355,
      "step": 2685000
    },
    {
      "epoch": 0.8,
      "eval_accuracy": 0.5241456040222856,
      "eval_loss": 2.162109375,
      "eval_runtime": 43.7247,
      "eval_samples_per_second": 81.601,
      "eval_steps_per_second": 10.2,
      "step": 2685000
    },
    {
      "epoch": 0.81,
      "learning_rate": 3.8326615995552e-05,
      "loss": 2.1394,
      "step": 2690000
    },
    {
      "epoch": 0.81,
      "eval_accuracy": 0.5242305340399511,
      "eval_loss": 2.16015625,
      "eval_runtime": 40.8207,
      "eval_samples_per_second": 87.407,
      "eval_steps_per_second": 10.926,
      "step": 2690000
    },
    {
      "epoch": 0.81,
      "learning_rate": 3.825179861287524e-05,
      "loss": 2.1359,
      "step": 2695000
    },
    {
      "epoch": 0.81,
      "eval_accuracy": 0.5244875158353388,
      "eval_loss": 2.16015625,
      "eval_runtime": 44.3125,
      "eval_samples_per_second": 80.519,
      "eval_steps_per_second": 10.065,
      "step": 2695000
    },
    {
      "epoch": 0.81,
      "learning_rate": 3.817698123019848e-05,
      "loss": 2.1365,
      "step": 2700000
    },
    {
      "epoch": 0.81,
      "eval_accuracy": 0.524362312551232,
      "eval_loss": 2.16015625,
      "eval_runtime": 42.9757,
      "eval_samples_per_second": 83.024,
      "eval_steps_per_second": 10.378,
      "step": 2700000
    },
    {
      "epoch": 0.81,
      "learning_rate": 3.810216384752173e-05,
      "loss": 2.131,
      "step": 2705000
    },
    {
      "epoch": 0.81,
      "eval_accuracy": 0.5244225854669946,
      "eval_loss": 2.16015625,
      "eval_runtime": 44.5469,
      "eval_samples_per_second": 80.095,
      "eval_steps_per_second": 10.012,
      "step": 2705000
    },
    {
      "epoch": 0.81,
      "learning_rate": 3.802731650793499e-05,
      "loss": 2.1337,
      "step": 2710000
    },
    {
      "epoch": 0.81,
      "eval_accuracy": 0.5244025858176733,
      "eval_loss": 2.16015625,
      "eval_runtime": 43.6203,
      "eval_samples_per_second": 81.797,
      "eval_steps_per_second": 10.225,
      "step": 2710000
    },
    {
      "epoch": 0.81,
      "learning_rate": 3.7952499125258226e-05,
      "loss": 2.1307,
      "step": 2715000
    },
    {
      "epoch": 0.81,
      "eval_accuracy": 0.5245954591481136,
      "eval_loss": 2.158203125,
      "eval_runtime": 43.7473,
      "eval_samples_per_second": 81.559,
      "eval_steps_per_second": 10.195,
      "step": 2715000
    },
    {
      "epoch": 0.81,
      "learning_rate": 3.787765178567149e-05,
      "loss": 2.1333,
      "step": 2720000
    },
    {
      "epoch": 0.81,
      "eval_accuracy": 0.524749429051107,
      "eval_loss": 2.158203125,
      "eval_runtime": 43.6989,
      "eval_samples_per_second": 81.65,
      "eval_steps_per_second": 10.206,
      "step": 2720000
    },
    {
      "epoch": 0.82,
      "learning_rate": 3.780283440299474e-05,
      "loss": 2.1354,
      "step": 2725000
    },
    {
      "epoch": 0.82,
      "eval_accuracy": 0.5246316228975711,
      "eval_loss": 2.158203125,
      "eval_runtime": 43.001,
      "eval_samples_per_second": 82.975,
      "eval_steps_per_second": 10.372,
      "step": 2725000
    },
    {
      "epoch": 0.82,
      "learning_rate": 3.7728002041862985e-05,
      "loss": 2.1372,
      "step": 2730000
    },
    {
      "epoch": 0.82,
      "eval_accuracy": 0.5248077841922771,
      "eval_loss": 2.158203125,
      "eval_runtime": 41.555,
      "eval_samples_per_second": 85.862,
      "eval_steps_per_second": 10.733,
      "step": 2730000
    },
    {
      "epoch": 0.82,
      "learning_rate": 3.765316968073124e-05,
      "loss": 2.1323,
      "step": 2735000
    },
    {
      "epoch": 0.82,
      "eval_accuracy": 0.5248480574587185,
      "eval_loss": 2.158203125,
      "eval_runtime": 41.1337,
      "eval_samples_per_second": 86.742,
      "eval_steps_per_second": 10.843,
      "step": 2735000
    },
    {
      "epoch": 0.82,
      "learning_rate": 3.757835229805448e-05,
      "loss": 2.1315,
      "step": 2740000
    },
    {
      "epoch": 0.82,
      "eval_accuracy": 0.5249064125998887,
      "eval_loss": 2.15625,
      "eval_runtime": 43.6977,
      "eval_samples_per_second": 81.652,
      "eval_steps_per_second": 10.206,
      "step": 2740000
    },
    {
      "epoch": 0.82,
      "learning_rate": 3.750351993692273e-05,
      "loss": 2.1341,
      "step": 2745000
    },
    {
      "epoch": 0.82,
      "eval_accuracy": 0.5249143576660573,
      "eval_loss": 2.15625,
      "eval_runtime": 44.5031,
      "eval_samples_per_second": 80.174,
      "eval_steps_per_second": 10.022,
      "step": 2745000
    },
    {
      "epoch": 0.82,
      "learning_rate": 3.7428702554245975e-05,
      "loss": 2.132,
      "step": 2750000
    },
    {
      "epoch": 0.82,
      "eval_accuracy": 0.5249768223242113,
      "eval_loss": 2.15625,
      "eval_runtime": 40.671,
      "eval_samples_per_second": 87.728,
      "eval_steps_per_second": 10.966,
      "step": 2750000
    },
    {
      "epoch": 0.83,
      "learning_rate": 3.7353885171569214e-05,
      "loss": 2.1322,
      "step": 2755000
    },
    {
      "epoch": 0.83,
      "eval_accuracy": 0.5251954486277501,
      "eval_loss": 2.15625,
      "eval_runtime": 43.2998,
      "eval_samples_per_second": 82.402,
      "eval_steps_per_second": 10.3,
      "step": 2755000
    },
    {
      "epoch": 0.83,
      "learning_rate": 3.727906778889246e-05,
      "loss": 2.1298,
      "step": 2760000
    },
    {
      "epoch": 0.83,
      "eval_accuracy": 0.5252044895651145,
      "eval_loss": 2.15625,
      "eval_runtime": 44.6651,
      "eval_samples_per_second": 79.883,
      "eval_steps_per_second": 9.985,
      "step": 2760000
    },
    {
      "epoch": 0.83,
      "learning_rate": 3.720422044930572e-05,
      "loss": 2.1285,
      "step": 2765000
    },
    {
      "epoch": 0.83,
      "eval_accuracy": 0.5252362698297893,
      "eval_loss": 2.154296875,
      "eval_runtime": 43.7277,
      "eval_samples_per_second": 81.596,
      "eval_steps_per_second": 10.199,
      "step": 2765000
    },
    {
      "epoch": 0.83,
      "learning_rate": 3.7129403066628966e-05,
      "loss": 2.1299,
      "step": 2770000
    },
    {
      "epoch": 0.83,
      "eval_accuracy": 0.5251601067816893,
      "eval_loss": 2.15625,
      "eval_runtime": 43.8556,
      "eval_samples_per_second": 81.358,
      "eval_steps_per_second": 10.17,
      "step": 2770000
    },
    {
      "epoch": 0.83,
      "learning_rate": 3.7054585683952205e-05,
      "loss": 2.1304,
      "step": 2775000
    },
    {
      "epoch": 0.83,
      "eval_accuracy": 0.5252631186740835,
      "eval_loss": 2.154296875,
      "eval_runtime": 44.0024,
      "eval_samples_per_second": 81.086,
      "eval_steps_per_second": 10.136,
      "step": 2775000
    },
    {
      "epoch": 0.83,
      "learning_rate": 3.6979768301275444e-05,
      "loss": 2.1288,
      "step": 2780000
    },
    {
      "epoch": 0.83,
      "eval_accuracy": 0.5254154447702835,
      "eval_loss": 2.154296875,
      "eval_runtime": 43.1187,
      "eval_samples_per_second": 82.748,
      "eval_steps_per_second": 10.344,
      "step": 2780000
    },
    {
      "epoch": 0.83,
      "learning_rate": 3.6904935940143697e-05,
      "loss": 2.1295,
      "step": 2785000
    },
    {
      "epoch": 0.83,
      "eval_accuracy": 0.5253255833322374,
      "eval_loss": 2.154296875,
      "eval_runtime": 44.6338,
      "eval_samples_per_second": 79.939,
      "eval_steps_per_second": 9.992,
      "step": 2785000
    },
    {
      "epoch": 0.84,
      "learning_rate": 3.683010357901195e-05,
      "loss": 2.129,
      "step": 2790000
    },
    {
      "epoch": 0.84,
      "eval_accuracy": 0.5255368125052053,
      "eval_loss": 2.154296875,
      "eval_runtime": 44.4544,
      "eval_samples_per_second": 80.262,
      "eval_steps_per_second": 10.033,
      "step": 2790000
    },
    {
      "epoch": 0.84,
      "learning_rate": 3.6755286196335195e-05,
      "loss": 2.1285,
      "step": 2795000
    },
    {
      "epoch": 0.84,
      "eval_accuracy": 0.5253598293071026,
      "eval_loss": 2.154296875,
      "eval_runtime": 44.2524,
      "eval_samples_per_second": 80.628,
      "eval_steps_per_second": 10.079,
      "step": 2795000
    },
    {
      "epoch": 0.84,
      "learning_rate": 3.668045383520344e-05,
      "loss": 2.1292,
      "step": 2800000
    },
    {
      "epoch": 0.84,
      "eval_accuracy": 0.5252880497437853,
      "eval_loss": 2.154296875,
      "eval_runtime": 40.6928,
      "eval_samples_per_second": 87.681,
      "eval_steps_per_second": 10.96,
      "step": 2800000
    },
    {
      "epoch": 0.84,
      "learning_rate": 3.660563645252669e-05,
      "loss": 2.1278,
      "step": 2805000
    },
    {
      "epoch": 0.84,
      "eval_accuracy": 0.5256472215281704,
      "eval_loss": 2.15234375,
      "eval_runtime": 43.3931,
      "eval_samples_per_second": 82.225,
      "eval_steps_per_second": 10.278,
      "step": 2805000
    },
    {
      "epoch": 0.84,
      "learning_rate": 3.653080409139494e-05,
      "loss": 2.1239,
      "step": 2810000
    },
    {
      "epoch": 0.84,
      "eval_accuracy": 0.5255110595321069,
      "eval_loss": 2.15234375,
      "eval_runtime": 42.2966,
      "eval_samples_per_second": 84.357,
      "eval_steps_per_second": 10.545,
      "step": 2810000
    },
    {
      "epoch": 0.84,
      "learning_rate": 3.645598670871818e-05,
      "loss": 2.1241,
      "step": 2815000
    },
    {
      "epoch": 0.84,
      "eval_accuracy": 0.5259063950659495,
      "eval_loss": 2.15234375,
      "eval_runtime": 42.6516,
      "eval_samples_per_second": 83.655,
      "eval_steps_per_second": 10.457,
      "step": 2815000
    },
    {
      "epoch": 0.84,
      "learning_rate": 3.638115434758643e-05,
      "loss": 2.1232,
      "step": 2820000
    },
    {
      "epoch": 0.84,
      "eval_accuracy": 0.5256781798894485,
      "eval_loss": 2.15234375,
      "eval_runtime": 46.2947,
      "eval_samples_per_second": 77.071,
      "eval_steps_per_second": 9.634,
      "step": 2820000
    },
    {
      "epoch": 0.85,
      "learning_rate": 3.6306321986454685e-05,
      "loss": 2.1241,
      "step": 2825000
    },
    {
      "epoch": 0.85,
      "eval_accuracy": 0.525697357635373,
      "eval_loss": 2.150390625,
      "eval_runtime": 43.287,
      "eval_samples_per_second": 82.427,
      "eval_steps_per_second": 10.303,
      "step": 2825000
    },
    {
      "epoch": 0.85,
      "learning_rate": 3.623148962532294e-05,
      "loss": 2.1236,
      "step": 2830000
    },
    {
      "epoch": 0.85,
      "eval_accuracy": 0.5259439286544016,
      "eval_loss": 2.150390625,
      "eval_runtime": 43.0484,
      "eval_samples_per_second": 82.884,
      "eval_steps_per_second": 10.36,
      "step": 2830000
    },
    {
      "epoch": 0.85,
      "learning_rate": 3.6156672242646177e-05,
      "loss": 2.1272,
      "step": 2835000
    },
    {
      "epoch": 0.85,
      "eval_accuracy": 0.5259442026222007,
      "eval_loss": 2.150390625,
      "eval_runtime": 42.9436,
      "eval_samples_per_second": 83.086,
      "eval_steps_per_second": 10.386,
      "step": 2835000
    },
    {
      "epoch": 0.85,
      "learning_rate": 3.608183988151443e-05,
      "loss": 2.1271,
      "step": 2840000
    },
    {
      "epoch": 0.85,
      "eval_accuracy": 0.5260592690977474,
      "eval_loss": 2.150390625,
      "eval_runtime": 40.596,
      "eval_samples_per_second": 87.89,
      "eval_steps_per_second": 10.986,
      "step": 2840000
    },
    {
      "epoch": 0.85,
      "learning_rate": 3.6007022498837675e-05,
      "loss": 2.1249,
      "step": 2845000
    },
    {
      "epoch": 0.85,
      "eval_accuracy": 0.52616776034612,
      "eval_loss": 2.1484375,
      "eval_runtime": 43.4159,
      "eval_samples_per_second": 82.182,
      "eval_steps_per_second": 10.273,
      "step": 2845000
    },
    {
      "epoch": 0.85,
      "learning_rate": 3.5932175159250935e-05,
      "loss": 2.1245,
      "step": 2850000
    },
    {
      "epoch": 0.85,
      "eval_accuracy": 0.5260307764466595,
      "eval_loss": 2.1484375,
      "eval_runtime": 43.8356,
      "eval_samples_per_second": 81.395,
      "eval_steps_per_second": 10.174,
      "step": 2850000
    },
    {
      "epoch": 0.86,
      "learning_rate": 3.585735777657418e-05,
      "loss": 2.1222,
      "step": 2855000
    },
    {
      "epoch": 0.86,
      "eval_accuracy": 0.5261137886897326,
      "eval_loss": 2.1484375,
      "eval_runtime": 43.0232,
      "eval_samples_per_second": 82.932,
      "eval_steps_per_second": 10.367,
      "step": 2855000
    },
    {
      "epoch": 0.86,
      "learning_rate": 3.5782525415442434e-05,
      "loss": 2.125,
      "step": 2860000
    },
    {
      "epoch": 0.86,
      "eval_accuracy": 0.5263050182133793,
      "eval_loss": 2.1484375,
      "eval_runtime": 43.0096,
      "eval_samples_per_second": 82.958,
      "eval_steps_per_second": 10.37,
      "step": 2860000
    },
    {
      "epoch": 0.86,
      "learning_rate": 3.570770803276567e-05,
      "loss": 2.1261,
      "step": 2865000
    },
    {
      "epoch": 0.86,
      "eval_accuracy": 0.5260803646182642,
      "eval_loss": 2.1484375,
      "eval_runtime": 40.5259,
      "eval_samples_per_second": 88.042,
      "eval_steps_per_second": 11.005,
      "step": 2865000
    },
    {
      "epoch": 0.86,
      "learning_rate": 3.563289065008891e-05,
      "loss": 2.1247,
      "step": 2870000
    },
    {
      "epoch": 0.86,
      "eval_accuracy": 0.5262392659416383,
      "eval_loss": 2.1484375,
      "eval_runtime": 46.7614,
      "eval_samples_per_second": 76.302,
      "eval_steps_per_second": 9.538,
      "step": 2870000
    },
    {
      "epoch": 0.86,
      "learning_rate": 3.5558028332047185e-05,
      "loss": 2.1225,
      "step": 2875000
    },
    {
      "epoch": 0.86,
      "eval_accuracy": 0.5263167988287328,
      "eval_loss": 2.1484375,
      "eval_runtime": 43.7319,
      "eval_samples_per_second": 81.588,
      "eval_steps_per_second": 10.199,
      "step": 2875000
    },
    {
      "epoch": 0.86,
      "learning_rate": 3.5483210949370424e-05,
      "loss": 2.122,
      "step": 2880000
    },
    {
      "epoch": 0.86,
      "eval_accuracy": 0.5261085833015531,
      "eval_loss": 2.1484375,
      "eval_runtime": 46.8934,
      "eval_samples_per_second": 76.087,
      "eval_steps_per_second": 9.511,
      "step": 2880000
    },
    {
      "epoch": 0.86,
      "learning_rate": 3.540839356669367e-05,
      "loss": 2.1237,
      "step": 2885000
    },
    {
      "epoch": 0.86,
      "eval_accuracy": 0.5261107750439444,
      "eval_loss": 2.146484375,
      "eval_runtime": 42.8485,
      "eval_samples_per_second": 83.27,
      "eval_steps_per_second": 10.409,
      "step": 2885000
    },
    {
      "epoch": 0.87,
      "learning_rate": 3.533356120556192e-05,
      "loss": 2.1219,
      "step": 2890000
    },
    {
      "epoch": 0.87,
      "eval_accuracy": 0.5261825546072617,
      "eval_loss": 2.146484375,
      "eval_runtime": 44.3826,
      "eval_samples_per_second": 80.392,
      "eval_steps_per_second": 10.049,
      "step": 2890000
    },
    {
      "epoch": 0.87,
      "learning_rate": 3.525874382288516e-05,
      "loss": 2.1248,
      "step": 2895000
    },
    {
      "epoch": 0.87,
      "eval_accuracy": 0.526191595544626,
      "eval_loss": 2.146484375,
      "eval_runtime": 40.9038,
      "eval_samples_per_second": 87.229,
      "eval_steps_per_second": 10.904,
      "step": 2895000
    },
    {
      "epoch": 0.87,
      "learning_rate": 3.51839264402084e-05,
      "loss": 2.1191,
      "step": 2900000
    },
    {
      "epoch": 0.87,
      "eval_accuracy": 0.526354332417185,
      "eval_loss": 2.146484375,
      "eval_runtime": 44.4026,
      "eval_samples_per_second": 80.356,
      "eval_steps_per_second": 10.044,
      "step": 2900000
    },
    {
      "epoch": 0.87,
      "learning_rate": 3.510909407907666e-05,
      "loss": 2.1181,
      "step": 2905000
    },
    {
      "epoch": 0.87,
      "eval_accuracy": 0.5264343310144699,
      "eval_loss": 2.146484375,
      "eval_runtime": 43.5492,
      "eval_samples_per_second": 81.93,
      "eval_steps_per_second": 10.241,
      "step": 2905000
    },
    {
      "epoch": 0.87,
      "learning_rate": 3.50342766963999e-05,
      "loss": 2.1176,
      "step": 2910000
    },
    {
      "epoch": 0.87,
      "eval_accuracy": 0.5263020045675911,
      "eval_loss": 2.146484375,
      "eval_runtime": 46.4423,
      "eval_samples_per_second": 76.827,
      "eval_steps_per_second": 9.603,
      "step": 2910000
    },
    {
      "epoch": 0.87,
      "learning_rate": 3.495944433526815e-05,
      "loss": 2.1191,
      "step": 2915000
    },
    {
      "epoch": 0.87,
      "eval_accuracy": 0.5266524093824109,
      "eval_loss": 2.146484375,
      "eval_runtime": 42.6675,
      "eval_samples_per_second": 83.623,
      "eval_steps_per_second": 10.453,
      "step": 2915000
    },
    {
      "epoch": 0.87,
      "learning_rate": 3.488462695259139e-05,
      "loss": 2.1206,
      "step": 2920000
    },
    {
      "epoch": 0.87,
      "eval_accuracy": 0.5267954205734475,
      "eval_loss": 2.14453125,
      "eval_runtime": 42.9737,
      "eval_samples_per_second": 83.028,
      "eval_steps_per_second": 10.378,
      "step": 2920000
    },
    {
      "epoch": 0.88,
      "learning_rate": 3.4809794591459645e-05,
      "loss": 2.1148,
      "step": 2925000
    },
    {
      "epoch": 0.88,
      "eval_accuracy": 0.5267219972033367,
      "eval_loss": 2.14453125,
      "eval_runtime": 44.1462,
      "eval_samples_per_second": 80.822,
      "eval_steps_per_second": 10.103,
      "step": 2925000
    },
    {
      "epoch": 0.88,
      "learning_rate": 3.473497720878289e-05,
      "loss": 2.1188,
      "step": 2930000
    },
    {
      "epoch": 0.88,
      "eval_accuracy": 0.5270244576533453,
      "eval_loss": 2.14453125,
      "eval_runtime": 44.0298,
      "eval_samples_per_second": 81.036,
      "eval_steps_per_second": 10.129,
      "step": 2930000
    },
    {
      "epoch": 0.88,
      "learning_rate": 3.466015982610613e-05,
      "loss": 2.1118,
      "step": 2935000
    },
    {
      "epoch": 0.88,
      "eval_accuracy": 0.5270036361006273,
      "eval_loss": 2.14453125,
      "eval_runtime": 41.5147,
      "eval_samples_per_second": 85.945,
      "eval_steps_per_second": 10.743,
      "step": 2935000
    },
    {
      "epoch": 0.88,
      "learning_rate": 4.992518261732325e-05,
      "loss": 2.1283,
      "step": 2940000
    },
    {
      "epoch": 0.88,
      "eval_accuracy": 0.5243740931665856,
      "eval_loss": 2.158203125,
      "eval_runtime": 39.6741,
      "eval_samples_per_second": 89.933,
      "eval_steps_per_second": 11.242,
      "step": 2940000
    },
    {
      "epoch": 0.88,
      "learning_rate": 4.9850350256191494e-05,
      "loss": 2.1336,
      "step": 2945000
    },
    {
      "epoch": 0.88,
      "eval_accuracy": 0.5240346470637227,
      "eval_loss": 2.162109375,
      "eval_runtime": 39.6588,
      "eval_samples_per_second": 89.967,
      "eval_steps_per_second": 11.246,
      "step": 2945000
    },
    {
      "epoch": 0.88,
      "learning_rate": 4.977551789505975e-05,
      "loss": 2.1311,
      "step": 2950000
    },
    {
      "epoch": 0.88,
      "eval_accuracy": 0.5237494465850462,
      "eval_loss": 2.162109375,
      "eval_runtime": 39.7632,
      "eval_samples_per_second": 89.731,
      "eval_steps_per_second": 11.216,
      "step": 2950000
    },
    {
      "epoch": 0.89,
      "learning_rate": 4.970070051238299e-05,
      "loss": 2.1377,
      "step": 2955000
    },
    {
      "epoch": 0.89,
      "eval_accuracy": 0.523618763944961,
      "eval_loss": 2.1640625,
      "eval_runtime": 39.7355,
      "eval_samples_per_second": 89.794,
      "eval_steps_per_second": 11.224,
      "step": 2955000
    },
    {
      "epoch": 0.89,
      "learning_rate": 4.962588312970624e-05,
      "loss": 2.136,
      "step": 2960000
    },
    {
      "epoch": 0.89,
      "eval_accuracy": 0.523584244002297,
      "eval_loss": 2.1640625,
      "eval_runtime": 39.6172,
      "eval_samples_per_second": 90.062,
      "eval_steps_per_second": 11.258,
      "step": 2960000
    },
    {
      "epoch": 0.89,
      "learning_rate": 4.955103579011949e-05,
      "loss": 2.1394,
      "step": 2965000
    },
    {
      "epoch": 0.89,
      "eval_accuracy": 0.5233458920172359,
      "eval_loss": 2.1640625,
      "eval_runtime": 39.7138,
      "eval_samples_per_second": 89.843,
      "eval_steps_per_second": 11.23,
      "step": 2965000
    },
    {
      "epoch": 0.89,
      "learning_rate": 4.947621840744274e-05,
      "loss": 2.1405,
      "step": 2970000
    },
    {
      "epoch": 0.89,
      "eval_accuracy": 0.5233305498204963,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.7403,
      "eval_samples_per_second": 89.783,
      "eval_steps_per_second": 11.223,
      "step": 2970000
    },
    {
      "epoch": 0.89,
      "learning_rate": 4.9401401024765983e-05,
      "loss": 2.1391,
      "step": 2975000
    },
    {
      "epoch": 0.89,
      "eval_accuracy": 0.5235795865497153,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.791,
      "eval_samples_per_second": 89.668,
      "eval_steps_per_second": 11.209,
      "step": 2975000
    },
    {
      "epoch": 0.89,
      "learning_rate": 4.9326553685179237e-05,
      "loss": 2.1353,
      "step": 2980000
    },
    {
      "epoch": 0.89,
      "eval_accuracy": 0.5233823297344923,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.6943,
      "eval_samples_per_second": 89.887,
      "eval_steps_per_second": 11.236,
      "step": 2980000
    },
    {
      "epoch": 0.89,
      "learning_rate": 4.925173630250248e-05,
      "loss": 2.1392,
      "step": 2985000
    },
    {
      "epoch": 0.89,
      "eval_accuracy": 0.5233889049616665,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.7244,
      "eval_samples_per_second": 89.819,
      "eval_steps_per_second": 11.227,
      "step": 2985000
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.917691891982573e-05,
      "loss": 2.1384,
      "step": 2990000
    },
    {
      "epoch": 0.9,
      "eval_accuracy": 0.5235058892118056,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.7383,
      "eval_samples_per_second": 89.787,
      "eval_steps_per_second": 11.223,
      "step": 2990000
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.910210153714897e-05,
      "loss": 2.1373,
      "step": 2995000
    },
    {
      "epoch": 0.9,
      "eval_accuracy": 0.523321234915333,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.8394,
      "eval_samples_per_second": 89.56,
      "eval_steps_per_second": 11.195,
      "step": 2995000
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.9027284154472206e-05,
      "loss": 2.1346,
      "step": 3000000
    },
    {
      "epoch": 0.9,
      "eval_accuracy": 0.523394110349846,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.7248,
      "eval_samples_per_second": 89.818,
      "eval_steps_per_second": 11.227,
      "step": 3000000
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.895246677179545e-05,
      "loss": 2.1368,
      "step": 3005000
    },
    {
      "epoch": 0.9,
      "eval_accuracy": 0.523494108596452,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.8116,
      "eval_samples_per_second": 89.622,
      "eval_steps_per_second": 11.203,
      "step": 3005000
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.8877634410663705e-05,
      "loss": 2.1383,
      "step": 3010000
    },
    {
      "epoch": 0.9,
      "eval_accuracy": 0.5232738384861197,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.8277,
      "eval_samples_per_second": 89.586,
      "eval_steps_per_second": 11.198,
      "step": 3010000
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.880280204953195e-05,
      "loss": 2.1447,
      "step": 3015000
    },
    {
      "epoch": 0.9,
      "eval_accuracy": 0.5233116460423708,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.9037,
      "eval_samples_per_second": 89.415,
      "eval_steps_per_second": 11.177,
      "step": 3015000
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.87279846668552e-05,
      "loss": 2.1392,
      "step": 3020000
    },
    {
      "epoch": 0.9,
      "eval_accuracy": 0.5234119182567758,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.8551,
      "eval_samples_per_second": 89.524,
      "eval_steps_per_second": 11.191,
      "step": 3020000
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.865315230572345e-05,
      "loss": 2.1359,
      "step": 3025000
    },
    {
      "epoch": 0.91,
      "eval_accuracy": 0.5233072625575881,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.8861,
      "eval_samples_per_second": 89.455,
      "eval_steps_per_second": 11.182,
      "step": 3025000
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.8578334923046695e-05,
      "loss": 2.1408,
      "step": 3030000
    },
    {
      "epoch": 0.91,
      "eval_accuracy": 0.5233184952373438,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.8536,
      "eval_samples_per_second": 89.528,
      "eval_steps_per_second": 11.191,
      "step": 3030000
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.850350256191494e-05,
      "loss": 2.1437,
      "step": 3035000
    },
    {
      "epoch": 0.91,
      "eval_accuracy": 0.5232642496131574,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.8602,
      "eval_samples_per_second": 89.513,
      "eval_steps_per_second": 11.189,
      "step": 3035000
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.8428715136148166e-05,
      "loss": 2.1354,
      "step": 3040000
    },
    {
      "epoch": 0.91,
      "eval_accuracy": 0.5233253444323168,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.8447,
      "eval_samples_per_second": 89.548,
      "eval_steps_per_second": 11.193,
      "step": 3040000
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.835383783965145e-05,
      "loss": 2.1371,
      "step": 3045000
    },
    {
      "epoch": 0.91,
      "eval_accuracy": 0.5234626022995761,
      "eval_loss": 2.166015625,
      "eval_runtime": 40.0007,
      "eval_samples_per_second": 89.199,
      "eval_steps_per_second": 11.15,
      "step": 3045000
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.82790054785197e-05,
      "loss": 2.1399,
      "step": 3050000
    },
    {
      "epoch": 0.91,
      "eval_accuracy": 0.5233957541566394,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.8876,
      "eval_samples_per_second": 89.451,
      "eval_steps_per_second": 11.181,
      "step": 3050000
    },
    {
      "epoch": 0.92,
      "learning_rate": 4.820420307429793e-05,
      "loss": 2.1387,
      "step": 3055000
    },
    {
      "epoch": 0.92,
      "eval_accuracy": 0.5234242468077273,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.9685,
      "eval_samples_per_second": 89.27,
      "eval_steps_per_second": 11.159,
      "step": 3055000
    },
    {
      "epoch": 0.92,
      "learning_rate": 4.8129340756256206e-05,
      "loss": 2.1406,
      "step": 3060000
    },
    {
      "epoch": 0.92,
      "eval_accuracy": 0.5232119217635636,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.9746,
      "eval_samples_per_second": 89.257,
      "eval_steps_per_second": 11.157,
      "step": 3060000
    },
    {
      "epoch": 0.92,
      "learning_rate": 4.805450839512445e-05,
      "loss": 2.1387,
      "step": 3065000
    },
    {
      "epoch": 0.92,
      "eval_accuracy": 0.5234650680097664,
      "eval_loss": 2.166015625,
      "eval_runtime": 40.0463,
      "eval_samples_per_second": 89.097,
      "eval_steps_per_second": 11.137,
      "step": 3065000
    },
    {
      "epoch": 0.92,
      "learning_rate": 4.797966105553772e-05,
      "loss": 2.1413,
      "step": 3070000
    },
    {
      "epoch": 0.92,
      "eval_accuracy": 0.5234842457556909,
      "eval_loss": 2.166015625,
      "eval_runtime": 39.9277,
      "eval_samples_per_second": 89.362,
      "eval_steps_per_second": 11.17,
      "step": 3070000
    },
    {
      "epoch": 0.92,
      "learning_rate": 4.790484367286096e-05,
      "loss": 2.1371,
      "step": 3075000
    },
    {
      "epoch": 0.92,
      "eval_accuracy": 0.523473561011533,
      "eval_loss": 2.1640625,
      "eval_runtime": 39.9812,
      "eval_samples_per_second": 89.242,
      "eval_steps_per_second": 11.155,
      "step": 3075000
    },
    {
      "epoch": 0.92,
      "learning_rate": 4.782999633327422e-05,
      "loss": 2.138,
      "step": 3080000
    },
    {
      "epoch": 0.92,
      "eval_accuracy": 0.5234982181134358,
      "eval_loss": 2.1640625,
      "eval_runtime": 39.9703,
      "eval_samples_per_second": 89.266,
      "eval_steps_per_second": 11.158,
      "step": 3080000
    },
    {
      "epoch": 0.92,
      "learning_rate": 4.7755148993687484e-05,
      "loss": 2.1385,
      "step": 3085000
    },
    {
      "epoch": 0.92,
      "eval_accuracy": 0.5236360239162929,
      "eval_loss": 2.1640625,
      "eval_runtime": 40.1115,
      "eval_samples_per_second": 88.952,
      "eval_steps_per_second": 11.119,
      "step": 3085000
    },
    {
      "epoch": 0.93,
      "learning_rate": 4.768031663255573e-05,
      "loss": 2.135,
      "step": 3090000
    },
    {
      "epoch": 0.93,
      "eval_accuracy": 0.5233746586361225,
      "eval_loss": 2.166015625,
      "eval_runtime": 40.1304,
      "eval_samples_per_second": 88.91,
      "eval_steps_per_second": 11.114,
      "step": 3090000
    },
    {
      "epoch": 0.93,
      "learning_rate": 4.760548427142398e-05,
      "loss": 2.1401,
      "step": 3095000
    },
    {
      "epoch": 0.93,
      "eval_accuracy": 0.5235689018055574,
      "eval_loss": 2.1640625,
      "eval_runtime": 40.1365,
      "eval_samples_per_second": 88.897,
      "eval_steps_per_second": 11.112,
      "step": 3095000
    },
    {
      "epoch": 0.93,
      "learning_rate": 4.753066688874723e-05,
      "loss": 2.1374,
      "step": 3100000
    },
    {
      "epoch": 0.93,
      "eval_accuracy": 0.5235552034156113,
      "eval_loss": 2.1640625,
      "eval_runtime": 40.133,
      "eval_samples_per_second": 88.904,
      "eval_steps_per_second": 11.113,
      "step": 3100000
    },
    {
      "epoch": 0.93,
      "learning_rate": 4.745586448452546e-05,
      "loss": 2.1358,
      "step": 3105000
    },
    {
      "epoch": 0.93,
      "eval_accuracy": 0.5237198580627628,
      "eval_loss": 2.1640625,
      "eval_runtime": 40.0267,
      "eval_samples_per_second": 89.141,
      "eval_steps_per_second": 11.143,
      "step": 3105000
    },
    {
      "epoch": 0.93,
      "learning_rate": 4.7381032123393713e-05,
      "loss": 2.1344,
      "step": 3110000
    },
    {
      "epoch": 0.93,
      "eval_accuracy": 0.5239288954933393,
      "eval_loss": 2.162109375,
      "eval_runtime": 40.1156,
      "eval_samples_per_second": 88.943,
      "eval_steps_per_second": 11.118,
      "step": 3110000
    },
    {
      "epoch": 0.93,
      "learning_rate": 4.730621474071695e-05,
      "loss": 2.1368,
      "step": 3115000
    },
    {
      "epoch": 0.93,
      "eval_accuracy": 0.5238793073217346,
      "eval_loss": 2.162109375,
      "eval_runtime": 40.1212,
      "eval_samples_per_second": 88.93,
      "eval_steps_per_second": 11.116,
      "step": 3115000
    },
    {
      "epoch": 0.93,
      "learning_rate": 4.723136740113022e-05,
      "loss": 2.1345,
      "step": 3120000
    },
    {
      "epoch": 0.93,
      "eval_accuracy": 0.5236836943133052,
      "eval_loss": 2.162109375,
      "eval_runtime": 40.203,
      "eval_samples_per_second": 88.75,
      "eval_steps_per_second": 11.094,
      "step": 3120000
    },
    {
      "epoch": 0.94,
      "learning_rate": 4.7156535039998465e-05,
      "loss": 2.1358,
      "step": 3125000
    },
    {
      "epoch": 0.94,
      "eval_accuracy": 0.5238979371320612,
      "eval_loss": 2.162109375,
      "eval_runtime": 40.2344,
      "eval_samples_per_second": 88.68,
      "eval_steps_per_second": 11.085,
      "step": 3125000
    },
    {
      "epoch": 0.94,
      "learning_rate": 4.708171765732171e-05,
      "loss": 2.1395,
      "step": 3130000
    },
    {
      "epoch": 0.94,
      "eval_accuracy": 0.5239330050103231,
      "eval_loss": 2.162109375,
      "eval_runtime": 40.4542,
      "eval_samples_per_second": 88.199,
      "eval_steps_per_second": 11.025,
      "step": 3130000
    },
    {
      "epoch": 0.94,
      "learning_rate": 4.700690027464496e-05,
      "loss": 2.1359,
      "step": 3135000
    },
    {
      "epoch": 0.94,
      "eval_accuracy": 0.5242872453743277,
      "eval_loss": 2.162109375,
      "eval_runtime": 40.3355,
      "eval_samples_per_second": 88.458,
      "eval_steps_per_second": 11.057,
      "step": 3135000
    },
    {
      "epoch": 0.94,
      "learning_rate": 4.693205293505821e-05,
      "loss": 2.1373,
      "step": 3140000
    },
    {
      "epoch": 0.94,
      "eval_accuracy": 0.5241631379614166,
      "eval_loss": 2.16015625,
      "eval_runtime": 40.2137,
      "eval_samples_per_second": 88.726,
      "eval_steps_per_second": 11.091,
      "step": 3140000
    },
    {
      "epoch": 0.94,
      "learning_rate": 4.6857235552381456e-05,
      "loss": 2.1357,
      "step": 3145000
    },
    {
      "epoch": 0.94,
      "eval_accuracy": 0.5243412170307151,
      "eval_loss": 2.16015625,
      "eval_runtime": 40.3184,
      "eval_samples_per_second": 88.496,
      "eval_steps_per_second": 11.062,
      "step": 3145000
    },
    {
      "epoch": 0.94,
      "learning_rate": 4.67824181697047e-05,
      "loss": 2.1354,
      "step": 3150000
    },
    {
      "epoch": 0.94,
      "eval_accuracy": 0.5243636823902266,
      "eval_loss": 2.16015625,
      "eval_runtime": 40.1892,
      "eval_samples_per_second": 88.78,
      "eval_steps_per_second": 11.098,
      "step": 3150000
    },
    {
      "epoch": 0.95,
      "learning_rate": 4.670757083011796e-05,
      "loss": 2.1323,
      "step": 3155000
    },
    {
      "epoch": 0.95,
      "eval_accuracy": 0.5243839560073468,
      "eval_loss": 2.16015625,
      "eval_runtime": 40.3635,
      "eval_samples_per_second": 88.397,
      "eval_steps_per_second": 11.05,
      "step": 3155000
    },
    {
      "epoch": 0.95,
      "learning_rate": 4.66327534474412e-05,
      "loss": 2.133,
      "step": 3160000
    },
    {
      "epoch": 0.95,
      "eval_accuracy": 0.5242327257823425,
      "eval_loss": 2.16015625,
      "eval_runtime": 41.1497,
      "eval_samples_per_second": 86.708,
      "eval_steps_per_second": 10.838,
      "step": 3160000
    },
    {
      "epoch": 0.95,
      "learning_rate": 4.655790610785447e-05,
      "loss": 2.1315,
      "step": 3165000
    },
    {
      "epoch": 0.95,
      "eval_accuracy": 0.524407243270255,
      "eval_loss": 2.16015625,
      "eval_runtime": 41.4927,
      "eval_samples_per_second": 85.991,
      "eval_steps_per_second": 10.749,
      "step": 3165000
    },
    {
      "epoch": 0.95,
      "learning_rate": 4.6483088725177706e-05,
      "loss": 2.1363,
      "step": 3170000
    },
    {
      "epoch": 0.95,
      "eval_accuracy": 0.5242845056963384,
      "eval_loss": 2.16015625,
      "eval_runtime": 43.5552,
      "eval_samples_per_second": 81.919,
      "eval_steps_per_second": 10.24,
      "step": 3170000
    },
    {
      "epoch": 0.95,
      "learning_rate": 4.640825636404596e-05,
      "loss": 2.1349,
      "step": 3175000
    },
    {
      "epoch": 0.95,
      "eval_accuracy": 0.5245045018388719,
      "eval_loss": 2.16015625,
      "eval_runtime": 41.5498,
      "eval_samples_per_second": 85.873,
      "eval_steps_per_second": 10.734,
      "step": 3175000
    },
    {
      "epoch": 0.95,
      "learning_rate": 4.633342400291421e-05,
      "loss": 2.1336,
      "step": 3180000
    },
    {
      "epoch": 0.95,
      "eval_accuracy": 0.524365600164819,
      "eval_loss": 2.16015625,
      "eval_runtime": 45.093,
      "eval_samples_per_second": 79.125,
      "eval_steps_per_second": 9.891,
      "step": 3180000
    },
    {
      "epoch": 0.95,
      "learning_rate": 4.625860662023746e-05,
      "loss": 2.1364,
      "step": 3185000
    },
    {
      "epoch": 0.95,
      "eval_accuracy": 0.5243612166800363,
      "eval_loss": 2.158203125,
      "eval_runtime": 42.4027,
      "eval_samples_per_second": 84.146,
      "eval_steps_per_second": 10.518,
      "step": 3185000
    },
    {
      "epoch": 0.96,
      "learning_rate": 4.618375928065071e-05,
      "loss": 2.133,
      "step": 3190000
    },
    {
      "epoch": 0.96,
      "eval_accuracy": 0.5243256008661766,
      "eval_loss": 2.158203125,
      "eval_runtime": 40.6817,
      "eval_samples_per_second": 87.705,
      "eval_steps_per_second": 10.963,
      "step": 3190000
    },
    {
      "epoch": 0.96,
      "learning_rate": 4.6108941897973956e-05,
      "loss": 2.1349,
      "step": 3195000
    },
    {
      "epoch": 0.96,
      "eval_accuracy": 0.5245045018388719,
      "eval_loss": 2.158203125,
      "eval_runtime": 42.2213,
      "eval_samples_per_second": 84.507,
      "eval_steps_per_second": 10.563,
      "step": 3195000
    },
    {
      "epoch": 0.96,
      "learning_rate": 4.60341245152972e-05,
      "loss": 2.134,
      "step": 3200000
    },
    {
      "epoch": 0.96,
      "eval_accuracy": 0.5245702541106129,
      "eval_loss": 2.158203125,
      "eval_runtime": 41.8771,
      "eval_samples_per_second": 85.202,
      "eval_steps_per_second": 10.65,
      "step": 3200000
    },
    {
      "epoch": 0.96,
      "learning_rate": 4.5959277175710455e-05,
      "loss": 2.1308,
      "step": 3205000
    },
    {
      "epoch": 0.96,
      "eval_accuracy": 0.5249423023815473,
      "eval_loss": 2.15625,
      "eval_runtime": 42.7291,
      "eval_samples_per_second": 83.503,
      "eval_steps_per_second": 10.438,
      "step": 3205000
    },
    {
      "epoch": 0.96,
      "learning_rate": 4.5884444814578715e-05,
      "loss": 2.1302,
      "step": 3210000
    },
    {
      "epoch": 0.96,
      "eval_accuracy": 0.5246628552266481,
      "eval_loss": 2.15625,
      "eval_runtime": 41.7473,
      "eval_samples_per_second": 85.467,
      "eval_steps_per_second": 10.683,
      "step": 3210000
    },
    {
      "epoch": 0.96,
      "learning_rate": 4.580964241035695e-05,
      "loss": 2.1302,
      "step": 3215000
    },
    {
      "epoch": 0.96,
      "eval_accuracy": 0.5246708002928168,
      "eval_loss": 2.15625,
      "eval_runtime": 43.5638,
      "eval_samples_per_second": 81.903,
      "eval_steps_per_second": 10.238,
      "step": 3215000
    },
    {
      "epoch": 0.96,
      "learning_rate": 4.5734825027680186e-05,
      "loss": 2.1331,
      "step": 3220000
    },
    {
      "epoch": 0.96,
      "eval_accuracy": 0.5247650452156455,
      "eval_loss": 2.15625,
      "eval_runtime": 42.8533,
      "eval_samples_per_second": 83.261,
      "eval_steps_per_second": 10.408,
      "step": 3220000
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.565999266654844e-05,
      "loss": 2.1273,
      "step": 3225000
    },
    {
      "epoch": 0.97,
      "eval_accuracy": 0.5247250459170031,
      "eval_loss": 2.15625,
      "eval_runtime": 42.4534,
      "eval_samples_per_second": 84.045,
      "eval_steps_per_second": 10.506,
      "step": 3225000
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.5585175283871685e-05,
      "loss": 2.1286,
      "step": 3230000
    },
    {
      "epoch": 0.97,
      "eval_accuracy": 0.5249765483564124,
      "eval_loss": 2.15625,
      "eval_runtime": 43.0626,
      "eval_samples_per_second": 82.856,
      "eval_steps_per_second": 10.357,
      "step": 3230000
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.551034292273994e-05,
      "loss": 2.1282,
      "step": 3235000
    },
    {
      "epoch": 0.97,
      "eval_accuracy": 0.525047232048534,
      "eval_loss": 2.154296875,
      "eval_runtime": 42.4424,
      "eval_samples_per_second": 84.067,
      "eval_steps_per_second": 10.508,
      "step": 3235000
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.543552554006317e-05,
      "loss": 2.1309,
      "step": 3240000
    },
    {
      "epoch": 0.97,
      "eval_accuracy": 0.5250951764133451,
      "eval_loss": 2.154296875,
      "eval_runtime": 44.2507,
      "eval_samples_per_second": 80.631,
      "eval_steps_per_second": 10.079,
      "step": 3240000
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.5360708157386415e-05,
      "loss": 2.1295,
      "step": 3245000
    },
    {
      "epoch": 0.97,
      "eval_accuracy": 0.5253592813715047,
      "eval_loss": 2.154296875,
      "eval_runtime": 44.2616,
      "eval_samples_per_second": 80.612,
      "eval_steps_per_second": 10.076,
      "step": 3245000
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.528589077470966e-05,
      "loss": 2.1275,
      "step": 3250000
    },
    {
      "epoch": 0.97,
      "eval_accuracy": 0.5253707880190593,
      "eval_loss": 2.154296875,
      "eval_runtime": 43.0103,
      "eval_samples_per_second": 82.957,
      "eval_steps_per_second": 10.37,
      "step": 3250000
    },
    {
      "epoch": 0.98,
      "learning_rate": 4.5211058413577914e-05,
      "loss": 2.133,
      "step": 3255000
    },
    {
      "epoch": 0.98,
      "eval_accuracy": 0.5253924314751741,
      "eval_loss": 2.154296875,
      "eval_runtime": 41.4169,
      "eval_samples_per_second": 86.148,
      "eval_steps_per_second": 10.769,
      "step": 3255000
    },
    {
      "epoch": 0.98,
      "learning_rate": 4.513622605244616e-05,
      "loss": 2.1301,
      "step": 3260000
    },
    {
      "epoch": 0.98,
      "eval_accuracy": 0.5251132582880739,
      "eval_loss": 2.154296875,
      "eval_runtime": 42.1862,
      "eval_samples_per_second": 84.577,
      "eval_steps_per_second": 10.572,
      "step": 3260000
    },
    {
      "epoch": 0.98,
      "learning_rate": 4.5061408669769406e-05,
      "loss": 2.1314,
      "step": 3265000
    },
    {
      "epoch": 0.98,
      "eval_accuracy": 0.5253096931999001,
      "eval_loss": 2.15234375,
      "eval_runtime": 43.9727,
      "eval_samples_per_second": 81.141,
      "eval_steps_per_second": 10.143,
      "step": 3265000
    },
    {
      "epoch": 0.98,
      "learning_rate": 4.498656133018267e-05,
      "loss": 2.1258,
      "step": 3270000
    },
    {
      "epoch": 0.98,
      "eval_accuracy": 0.5254751697504482,
      "eval_loss": 2.15234375,
      "eval_runtime": 42.0779,
      "eval_samples_per_second": 84.795,
      "eval_steps_per_second": 10.599,
      "step": 3270000
    },
    {
      "epoch": 0.98,
      "learning_rate": 4.491172896905092e-05,
      "loss": 2.1286,
      "step": 3275000
    },
    {
      "epoch": 0.98,
      "eval_accuracy": 0.525354897886722,
      "eval_loss": 2.15234375,
      "eval_runtime": 41.8893,
      "eval_samples_per_second": 85.177,
      "eval_steps_per_second": 10.647,
      "step": 3275000
    },
    {
      "epoch": 0.98,
      "learning_rate": 4.4836911586374165e-05,
      "loss": 2.1267,
      "step": 3280000
    },
    {
      "epoch": 0.98,
      "eval_accuracy": 0.5253622950172928,
      "eval_loss": 2.15234375,
      "eval_runtime": 42.0241,
      "eval_samples_per_second": 84.904,
      "eval_steps_per_second": 10.613,
      "step": 3280000
    },
    {
      "epoch": 0.98,
      "learning_rate": 4.476207922524242e-05,
      "loss": 2.13,
      "step": 3285000
    },
    {
      "epoch": 0.98,
      "eval_accuracy": 0.5254332526772133,
      "eval_loss": 2.15234375,
      "eval_runtime": 43.4043,
      "eval_samples_per_second": 82.204,
      "eval_steps_per_second": 10.275,
      "step": 3285000
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.4687246864110663e-05,
      "loss": 2.1284,
      "step": 3290000
    },
    {
      "epoch": 0.99,
      "eval_accuracy": 0.5254976351099597,
      "eval_loss": 2.15234375,
      "eval_runtime": 43.4747,
      "eval_samples_per_second": 82.071,
      "eval_steps_per_second": 10.259,
      "step": 3290000
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.461242948143391e-05,
      "loss": 2.1295,
      "step": 3295000
    },
    {
      "epoch": 0.99,
      "eval_accuracy": 0.5254190063516695,
      "eval_loss": 2.15234375,
      "eval_runtime": 44.0831,
      "eval_samples_per_second": 80.938,
      "eval_steps_per_second": 10.117,
      "step": 3295000
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.453759712030216e-05,
      "loss": 2.1241,
      "step": 3300000
    },
    {
      "epoch": 0.99,
      "eval_accuracy": 0.5255573600901244,
      "eval_loss": 2.15234375,
      "eval_runtime": 43.4229,
      "eval_samples_per_second": 82.169,
      "eval_steps_per_second": 10.271,
      "step": 3300000
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.446276475917041e-05,
      "loss": 2.1297,
      "step": 3305000
    },
    {
      "epoch": 0.99,
      "eval_accuracy": 0.5257825616208374,
      "eval_loss": 2.15234375,
      "eval_runtime": 41.6675,
      "eval_samples_per_second": 85.63,
      "eval_steps_per_second": 10.704,
      "step": 3305000
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.4387947376493654e-05,
      "loss": 2.126,
      "step": 3310000
    },
    {
      "epoch": 0.99,
      "eval_accuracy": 0.5256425640755888,
      "eval_loss": 2.150390625,
      "eval_runtime": 43.5829,
      "eval_samples_per_second": 81.867,
      "eval_steps_per_second": 10.233,
      "step": 3310000
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.43131299938169e-05,
      "loss": 2.1263,
      "step": 3315000
    },
    {
      "epoch": 0.99,
      "eval_accuracy": 0.5255672229308856,
      "eval_loss": 2.150390625,
      "eval_runtime": 40.6138,
      "eval_samples_per_second": 87.852,
      "eval_steps_per_second": 10.981,
      "step": 3315000
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.423828265423016e-05,
      "loss": 2.1273,
      "step": 3320000
    },
    {
      "epoch": 0.99,
      "eval_accuracy": 0.525589962258196,
      "eval_loss": 2.150390625,
      "eval_runtime": 41.1643,
      "eval_samples_per_second": 86.677,
      "eval_steps_per_second": 10.835,
      "step": 3320000
    },
    {
      "epoch": 1.0,
      "learning_rate": 4.4163450293098406e-05,
      "loss": 2.1214,
      "step": 3325000
    },
    {
      "epoch": 1.0,
      "eval_accuracy": 0.5255433877323795,
      "eval_loss": 2.150390625,
      "eval_runtime": 40.8274,
      "eval_samples_per_second": 87.392,
      "eval_steps_per_second": 10.924,
      "step": 3325000
    },
    {
      "epoch": 1.0,
      "learning_rate": 4.408863291042165e-05,
      "loss": 2.1275,
      "step": 3330000
    },
    {
      "epoch": 1.0,
      "eval_accuracy": 0.5255872225802068,
      "eval_loss": 2.150390625,
      "eval_runtime": 42.63,
      "eval_samples_per_second": 83.697,
      "eval_steps_per_second": 10.462,
      "step": 3330000
    },
    {
      "epoch": 1.0,
      "learning_rate": 4.40138155277449e-05,
      "loss": 2.1227,
      "step": 3335000
    },
    {
      "epoch": 1.0,
      "eval_accuracy": 0.5258348894704312,
      "eval_loss": 2.150390625,
      "eval_runtime": 42.4569,
      "eval_samples_per_second": 84.038,
      "eval_steps_per_second": 10.505,
      "step": 3335000
    },
    {
      "epoch": 1.0,
      "step": 3338128,
      "total_flos": 1.0872066371139498e+21,
      "train_loss": 0.2576859601399347,
      "train_runtime": 150388.7494,
      "train_samples_per_second": 177.573,
      "train_steps_per_second": 22.197
    }
  ],
  "max_steps": 3338128,
  "num_train_epochs": 1,
  "total_flos": 1.0872066371139498e+21,
  "trial_name": null,
  "trial_params": null
}