{
  "best_metric": 4.523245334625244,
  "best_model_checkpoint": "215_mushroom_types_image_detection/checkpoint-4300",
  "epoch": 100.0,
  "eval_steps": 500,
  "global_step": 4300,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 1.0,
      "eval_accuracy": 0.005813953488372093,
      "eval_loss": 5.373682975769043,
      "eval_runtime": 15.7082,
      "eval_samples_per_second": 43.799,
      "eval_steps_per_second": 1.401,
      "step": 43
    },
    {
      "epoch": 2.0,
      "eval_accuracy": 0.00436046511627907,
      "eval_loss": 5.360568046569824,
      "eval_runtime": 15.934,
      "eval_samples_per_second": 43.178,
      "eval_steps_per_second": 1.381,
      "step": 86
    },
    {
      "epoch": 3.0,
      "eval_accuracy": 0.00872093023255814,
      "eval_loss": 5.345941543579102,
      "eval_runtime": 16.0551,
      "eval_samples_per_second": 42.852,
      "eval_steps_per_second": 1.37,
      "step": 129
    },
    {
      "epoch": 4.0,
      "eval_accuracy": 0.011627906976744186,
      "eval_loss": 5.329922676086426,
      "eval_runtime": 15.6535,
      "eval_samples_per_second": 43.952,
      "eval_steps_per_second": 1.405,
      "step": 172
    },
    {
      "epoch": 5.0,
      "eval_accuracy": 0.014534883720930232,
      "eval_loss": 5.313205718994141,
      "eval_runtime": 15.6714,
      "eval_samples_per_second": 43.901,
      "eval_steps_per_second": 1.404,
      "step": 215
    },
    {
      "epoch": 6.0,
      "eval_accuracy": 0.03488372093023256,
      "eval_loss": 5.296387672424316,
      "eval_runtime": 15.6601,
      "eval_samples_per_second": 43.933,
      "eval_steps_per_second": 1.405,
      "step": 258
    },
    {
      "epoch": 7.0,
      "eval_accuracy": 0.04941860465116279,
      "eval_loss": 5.279979228973389,
      "eval_runtime": 15.7557,
      "eval_samples_per_second": 43.667,
      "eval_steps_per_second": 1.396,
      "step": 301
    },
    {
      "epoch": 8.0,
      "eval_accuracy": 0.055232558139534885,
      "eval_loss": 5.263515949249268,
      "eval_runtime": 15.8712,
      "eval_samples_per_second": 43.349,
      "eval_steps_per_second": 1.386,
      "step": 344
    },
    {
      "epoch": 9.0,
      "eval_accuracy": 0.06976744186046512,
      "eval_loss": 5.247329235076904,
      "eval_runtime": 15.7302,
      "eval_samples_per_second": 43.738,
      "eval_steps_per_second": 1.399,
      "step": 387
    },
    {
      "epoch": 10.0,
      "eval_accuracy": 0.09593023255813954,
      "eval_loss": 5.230611324310303,
      "eval_runtime": 15.6724,
      "eval_samples_per_second": 43.899,
      "eval_steps_per_second": 1.404,
      "step": 430
    },
    {
      "epoch": 11.0,
      "eval_accuracy": 0.11337209302325581,
      "eval_loss": 5.214414596557617,
      "eval_runtime": 15.6286,
      "eval_samples_per_second": 44.022,
      "eval_steps_per_second": 1.408,
      "step": 473
    },
    {
      "epoch": 11.63,
      "learning_rate": 4.4705882352941184e-06,
      "loss": 5.2624,
      "step": 500
    },
    {
      "epoch": 12.0,
      "eval_accuracy": 0.14534883720930233,
      "eval_loss": 5.198253631591797,
      "eval_runtime": 15.6928,
      "eval_samples_per_second": 43.842,
      "eval_steps_per_second": 1.402,
      "step": 516
    },
    {
      "epoch": 13.0,
      "eval_accuracy": 0.16569767441860464,
      "eval_loss": 5.182290077209473,
      "eval_runtime": 15.659,
      "eval_samples_per_second": 43.936,
      "eval_steps_per_second": 1.405,
      "step": 559
    },
    {
      "epoch": 14.0,
      "eval_accuracy": 0.19912790697674418,
      "eval_loss": 5.167093753814697,
      "eval_runtime": 15.6325,
      "eval_samples_per_second": 44.011,
      "eval_steps_per_second": 1.407,
      "step": 602
    },
    {
      "epoch": 15.0,
      "eval_accuracy": 0.22965116279069767,
      "eval_loss": 5.1504926681518555,
      "eval_runtime": 15.693,
      "eval_samples_per_second": 43.841,
      "eval_steps_per_second": 1.402,
      "step": 645
    },
    {
      "epoch": 16.0,
      "eval_accuracy": 0.25290697674418605,
      "eval_loss": 5.135602951049805,
      "eval_runtime": 15.7377,
      "eval_samples_per_second": 43.717,
      "eval_steps_per_second": 1.398,
      "step": 688
    },
    {
      "epoch": 17.0,
      "eval_accuracy": 0.27180232558139533,
      "eval_loss": 5.120057582855225,
      "eval_runtime": 15.768,
      "eval_samples_per_second": 43.633,
      "eval_steps_per_second": 1.395,
      "step": 731
    },
    {
      "epoch": 18.0,
      "eval_accuracy": 0.29941860465116277,
      "eval_loss": 5.104465961456299,
      "eval_runtime": 15.7336,
      "eval_samples_per_second": 43.728,
      "eval_steps_per_second": 1.398,
      "step": 774
    },
    {
      "epoch": 19.0,
      "eval_accuracy": 0.31540697674418605,
      "eval_loss": 5.0898261070251465,
      "eval_runtime": 15.7463,
      "eval_samples_per_second": 43.693,
      "eval_steps_per_second": 1.397,
      "step": 817
    },
    {
      "epoch": 20.0,
      "eval_accuracy": 0.33575581395348836,
      "eval_loss": 5.075623035430908,
      "eval_runtime": 15.8453,
      "eval_samples_per_second": 43.42,
      "eval_steps_per_second": 1.388,
      "step": 860
    },
    {
      "epoch": 21.0,
      "eval_accuracy": 0.3488372093023256,
      "eval_loss": 5.061192512512207,
      "eval_runtime": 15.8649,
      "eval_samples_per_second": 43.366,
      "eval_steps_per_second": 1.387,
      "step": 903
    },
    {
      "epoch": 22.0,
      "eval_accuracy": 0.36627906976744184,
      "eval_loss": 5.046968460083008,
      "eval_runtime": 15.9059,
      "eval_samples_per_second": 43.254,
      "eval_steps_per_second": 1.383,
      "step": 946
    },
    {
      "epoch": 23.0,
      "eval_accuracy": 0.38226744186046513,
      "eval_loss": 5.032783031463623,
      "eval_runtime": 16.0027,
      "eval_samples_per_second": 42.993,
      "eval_steps_per_second": 1.375,
      "step": 989
    },
    {
      "epoch": 23.26,
      "learning_rate": 3.882352941176471e-06,
      "loss": 5.0055,
      "step": 1000
    },
    {
      "epoch": 24.0,
      "eval_accuracy": 0.4055232558139535,
      "eval_loss": 5.01801872253418,
      "eval_runtime": 16.1282,
      "eval_samples_per_second": 42.658,
      "eval_steps_per_second": 1.364,
      "step": 1032
    },
    {
      "epoch": 25.0,
      "eval_accuracy": 0.42151162790697677,
      "eval_loss": 5.004476547241211,
      "eval_runtime": 15.7815,
      "eval_samples_per_second": 43.595,
      "eval_steps_per_second": 1.394,
      "step": 1075
    },
    {
      "epoch": 26.0,
      "eval_accuracy": 0.4273255813953488,
      "eval_loss": 4.991031169891357,
      "eval_runtime": 15.7324,
      "eval_samples_per_second": 43.731,
      "eval_steps_per_second": 1.398,
      "step": 1118
    },
    {
      "epoch": 27.0,
      "eval_accuracy": 0.438953488372093,
      "eval_loss": 4.977335453033447,
      "eval_runtime": 15.8322,
      "eval_samples_per_second": 43.456,
      "eval_steps_per_second": 1.39,
      "step": 1161
    },
    {
      "epoch": 28.0,
      "eval_accuracy": 0.4476744186046512,
      "eval_loss": 4.963772773742676,
      "eval_runtime": 15.5675,
      "eval_samples_per_second": 44.195,
      "eval_steps_per_second": 1.413,
      "step": 1204
    },
    {
      "epoch": 29.0,
      "eval_accuracy": 0.4563953488372093,
      "eval_loss": 4.951737403869629,
      "eval_runtime": 15.659,
      "eval_samples_per_second": 43.936,
      "eval_steps_per_second": 1.405,
      "step": 1247
    },
    {
      "epoch": 30.0,
      "eval_accuracy": 0.46656976744186046,
      "eval_loss": 4.93776273727417,
      "eval_runtime": 15.6493,
      "eval_samples_per_second": 43.964,
      "eval_steps_per_second": 1.406,
      "step": 1290
    },
    {
      "epoch": 31.0,
      "eval_accuracy": 0.4796511627906977,
      "eval_loss": 4.924755573272705,
      "eval_runtime": 15.6796,
      "eval_samples_per_second": 43.879,
      "eval_steps_per_second": 1.403,
      "step": 1333
    },
    {
      "epoch": 32.0,
      "eval_accuracy": 0.4883720930232558,
      "eval_loss": 4.913003921508789,
      "eval_runtime": 15.7025,
      "eval_samples_per_second": 43.815,
      "eval_steps_per_second": 1.401,
      "step": 1376
    },
    {
      "epoch": 33.0,
      "eval_accuracy": 0.4956395348837209,
      "eval_loss": 4.901313781738281,
      "eval_runtime": 15.8391,
      "eval_samples_per_second": 43.437,
      "eval_steps_per_second": 1.389,
      "step": 1419
    },
    {
      "epoch": 34.0,
      "eval_accuracy": 0.502906976744186,
      "eval_loss": 4.888450622558594,
      "eval_runtime": 15.7559,
      "eval_samples_per_second": 43.666,
      "eval_steps_per_second": 1.396,
      "step": 1462
    },
    {
      "epoch": 34.88,
      "learning_rate": 3.2941176470588236e-06,
      "loss": 4.7782,
      "step": 1500
    },
    {
      "epoch": 35.0,
      "eval_accuracy": 0.5087209302325582,
      "eval_loss": 4.876810550689697,
      "eval_runtime": 15.68,
      "eval_samples_per_second": 43.878,
      "eval_steps_per_second": 1.403,
      "step": 1505
    },
    {
      "epoch": 36.0,
      "eval_accuracy": 0.5145348837209303,
      "eval_loss": 4.8660688400268555,
      "eval_runtime": 15.6853,
      "eval_samples_per_second": 43.863,
      "eval_steps_per_second": 1.403,
      "step": 1548
    },
    {
      "epoch": 37.0,
      "eval_accuracy": 0.5290697674418605,
      "eval_loss": 4.854226112365723,
      "eval_runtime": 15.6339,
      "eval_samples_per_second": 44.007,
      "eval_steps_per_second": 1.407,
      "step": 1591
    },
    {
      "epoch": 38.0,
      "eval_accuracy": 0.5363372093023255,
      "eval_loss": 4.843025207519531,
      "eval_runtime": 15.5726,
      "eval_samples_per_second": 44.18,
      "eval_steps_per_second": 1.413,
      "step": 1634
    },
    {
      "epoch": 39.0,
      "eval_accuracy": 0.5334302325581395,
      "eval_loss": 4.832670211791992,
      "eval_runtime": 15.6463,
      "eval_samples_per_second": 43.972,
      "eval_steps_per_second": 1.406,
      "step": 1677
    },
    {
      "epoch": 40.0,
      "eval_accuracy": 0.5436046511627907,
      "eval_loss": 4.821949005126953,
      "eval_runtime": 16.3442,
      "eval_samples_per_second": 42.095,
      "eval_steps_per_second": 1.346,
      "step": 1720
    },
    {
      "epoch": 41.0,
      "eval_accuracy": 0.5450581395348837,
      "eval_loss": 4.811717510223389,
      "eval_runtime": 15.7455,
      "eval_samples_per_second": 43.695,
      "eval_steps_per_second": 1.397,
      "step": 1763
    },
    {
      "epoch": 42.0,
      "eval_accuracy": 0.5479651162790697,
      "eval_loss": 4.801333904266357,
      "eval_runtime": 15.8685,
      "eval_samples_per_second": 43.356,
      "eval_steps_per_second": 1.386,
      "step": 1806
    },
    {
      "epoch": 43.0,
      "eval_accuracy": 0.5523255813953488,
      "eval_loss": 4.791117191314697,
      "eval_runtime": 15.6258,
      "eval_samples_per_second": 44.03,
      "eval_steps_per_second": 1.408,
      "step": 1849
    },
    {
      "epoch": 44.0,
      "eval_accuracy": 0.559593023255814,
      "eval_loss": 4.7813591957092285,
      "eval_runtime": 15.5872,
      "eval_samples_per_second": 44.139,
      "eval_steps_per_second": 1.411,
      "step": 1892
    },
    {
      "epoch": 45.0,
      "eval_accuracy": 0.563953488372093,
      "eval_loss": 4.771790981292725,
      "eval_runtime": 15.6647,
      "eval_samples_per_second": 43.92,
      "eval_steps_per_second": 1.404,
      "step": 1935
    },
    {
      "epoch": 46.0,
      "eval_accuracy": 0.5581395348837209,
      "eval_loss": 4.763011455535889,
      "eval_runtime": 15.804,
      "eval_samples_per_second": 43.533,
      "eval_steps_per_second": 1.392,
      "step": 1978
    },
    {
      "epoch": 46.51,
      "learning_rate": 2.7058823529411766e-06,
      "loss": 4.5898,
      "step": 2000
    },
    {
      "epoch": 47.0,
      "eval_accuracy": 0.5668604651162791,
      "eval_loss": 4.754226207733154,
      "eval_runtime": 15.7807,
      "eval_samples_per_second": 43.598,
      "eval_steps_per_second": 1.394,
      "step": 2021
    },
    {
      "epoch": 48.0,
      "eval_accuracy": 0.5726744186046512,
      "eval_loss": 4.744999885559082,
      "eval_runtime": 15.9972,
      "eval_samples_per_second": 43.007,
      "eval_steps_per_second": 1.375,
      "step": 2064
    },
    {
      "epoch": 49.0,
      "eval_accuracy": 0.5755813953488372,
      "eval_loss": 4.736135005950928,
      "eval_runtime": 15.8956,
      "eval_samples_per_second": 43.282,
      "eval_steps_per_second": 1.384,
      "step": 2107
    },
    {
      "epoch": 50.0,
      "eval_accuracy": 0.5784883720930233,
      "eval_loss": 4.727856636047363,
      "eval_runtime": 15.9158,
      "eval_samples_per_second": 43.228,
      "eval_steps_per_second": 1.382,
      "step": 2150
    },
    {
      "epoch": 51.0,
      "eval_accuracy": 0.5901162790697675,
      "eval_loss": 4.718968391418457,
      "eval_runtime": 15.9016,
      "eval_samples_per_second": 43.266,
      "eval_steps_per_second": 1.384,
      "step": 2193
    },
    {
      "epoch": 52.0,
      "eval_accuracy": 0.5857558139534884,
      "eval_loss": 4.711625576019287,
      "eval_runtime": 16.0048,
      "eval_samples_per_second": 42.987,
      "eval_steps_per_second": 1.375,
      "step": 2236
    },
    {
      "epoch": 53.0,
      "eval_accuracy": 0.5944767441860465,
      "eval_loss": 4.702500343322754,
      "eval_runtime": 15.8927,
      "eval_samples_per_second": 43.29,
      "eval_steps_per_second": 1.384,
      "step": 2279
    },
    {
      "epoch": 54.0,
      "eval_accuracy": 0.5930232558139535,
      "eval_loss": 4.695010662078857,
      "eval_runtime": 15.99,
      "eval_samples_per_second": 43.027,
      "eval_steps_per_second": 1.376,
      "step": 2322
    },
    {
      "epoch": 55.0,
      "eval_accuracy": 0.5959302325581395,
      "eval_loss": 4.687701225280762,
      "eval_runtime": 15.9346,
      "eval_samples_per_second": 43.177,
      "eval_steps_per_second": 1.381,
      "step": 2365
    },
    {
      "epoch": 56.0,
      "eval_accuracy": 0.6017441860465116,
      "eval_loss": 4.67971658706665,
      "eval_runtime": 15.9361,
      "eval_samples_per_second": 43.172,
      "eval_steps_per_second": 1.381,
      "step": 2408
    },
    {
      "epoch": 57.0,
      "eval_accuracy": 0.6104651162790697,
      "eval_loss": 4.672912120819092,
      "eval_runtime": 15.8902,
      "eval_samples_per_second": 43.297,
      "eval_steps_per_second": 1.384,
      "step": 2451
    },
    {
      "epoch": 58.0,
      "eval_accuracy": 0.6148255813953488,
      "eval_loss": 4.666042804718018,
      "eval_runtime": 15.9677,
      "eval_samples_per_second": 43.087,
      "eval_steps_per_second": 1.378,
      "step": 2494
    },
    {
      "epoch": 58.14,
      "learning_rate": 2.1176470588235296e-06,
      "loss": 4.4404,
      "step": 2500
    },
    {
      "epoch": 59.0,
      "eval_accuracy": 0.6119186046511628,
      "eval_loss": 4.660353183746338,
      "eval_runtime": 16.0444,
      "eval_samples_per_second": 42.881,
      "eval_steps_per_second": 1.371,
      "step": 2537
    },
    {
      "epoch": 60.0,
      "eval_accuracy": 0.6177325581395349,
      "eval_loss": 4.652705192565918,
      "eval_runtime": 16.2032,
      "eval_samples_per_second": 42.461,
      "eval_steps_per_second": 1.358,
      "step": 2580
    },
    {
      "epoch": 61.0,
      "eval_accuracy": 0.6191860465116279,
      "eval_loss": 4.646444797515869,
      "eval_runtime": 15.8748,
      "eval_samples_per_second": 43.339,
      "eval_steps_per_second": 1.386,
      "step": 2623
    },
    {
      "epoch": 62.0,
      "eval_accuracy": 0.6206395348837209,
      "eval_loss": 4.640020847320557,
      "eval_runtime": 15.7336,
      "eval_samples_per_second": 43.728,
      "eval_steps_per_second": 1.398,
      "step": 2666
    },
    {
      "epoch": 63.0,
      "eval_accuracy": 0.622093023255814,
      "eval_loss": 4.633713245391846,
      "eval_runtime": 15.7798,
      "eval_samples_per_second": 43.6,
      "eval_steps_per_second": 1.394,
      "step": 2709
    },
    {
      "epoch": 64.0,
      "eval_accuracy": 0.622093023255814,
      "eval_loss": 4.628097057342529,
      "eval_runtime": 15.7559,
      "eval_samples_per_second": 43.666,
      "eval_steps_per_second": 1.396,
      "step": 2752
    },
    {
      "epoch": 65.0,
      "eval_accuracy": 0.623546511627907,
      "eval_loss": 4.621662139892578,
      "eval_runtime": 15.9988,
      "eval_samples_per_second": 43.003,
      "eval_steps_per_second": 1.375,
      "step": 2795
    },
    {
      "epoch": 66.0,
      "eval_accuracy": 0.623546511627907,
      "eval_loss": 4.61560583114624,
      "eval_runtime": 15.8935,
      "eval_samples_per_second": 43.288,
      "eval_steps_per_second": 1.384,
      "step": 2838
    },
    {
      "epoch": 67.0,
      "eval_accuracy": 0.626453488372093,
      "eval_loss": 4.611085891723633,
      "eval_runtime": 15.8461,
      "eval_samples_per_second": 43.418,
      "eval_steps_per_second": 1.388,
      "step": 2881
    },
    {
      "epoch": 68.0,
      "eval_accuracy": 0.6308139534883721,
      "eval_loss": 4.6055908203125,
      "eval_runtime": 15.8898,
      "eval_samples_per_second": 43.298,
      "eval_steps_per_second": 1.385,
      "step": 2924
    },
    {
      "epoch": 69.0,
      "eval_accuracy": 0.625,
      "eval_loss": 4.599771022796631,
      "eval_runtime": 15.9264,
      "eval_samples_per_second": 43.199,
      "eval_steps_per_second": 1.381,
      "step": 2967
    },
    {
      "epoch": 69.77,
      "learning_rate": 1.5294117647058826e-06,
      "loss": 4.3259,
      "step": 3000
    },
    {
      "epoch": 70.0,
      "eval_accuracy": 0.627906976744186,
      "eval_loss": 4.595685958862305,
      "eval_runtime": 15.7623,
      "eval_samples_per_second": 43.648,
      "eval_steps_per_second": 1.396,
      "step": 3010
    },
    {
      "epoch": 71.0,
      "eval_accuracy": 0.6337209302325582,
      "eval_loss": 4.590473175048828,
      "eval_runtime": 15.7366,
      "eval_samples_per_second": 43.72,
      "eval_steps_per_second": 1.398,
      "step": 3053
    },
    {
      "epoch": 72.0,
      "eval_accuracy": 0.6351744186046512,
      "eval_loss": 4.586112976074219,
      "eval_runtime": 15.9071,
      "eval_samples_per_second": 43.251,
      "eval_steps_per_second": 1.383,
      "step": 3096
    },
    {
      "epoch": 73.0,
      "eval_accuracy": 0.6308139534883721,
      "eval_loss": 4.581954002380371,
      "eval_runtime": 15.7714,
      "eval_samples_per_second": 43.623,
      "eval_steps_per_second": 1.395,
      "step": 3139
    },
    {
      "epoch": 74.0,
      "eval_accuracy": 0.6337209302325582,
      "eval_loss": 4.5774431228637695,
      "eval_runtime": 15.8605,
      "eval_samples_per_second": 43.378,
      "eval_steps_per_second": 1.387,
      "step": 3182
    },
    {
      "epoch": 75.0,
      "eval_accuracy": 0.6337209302325582,
      "eval_loss": 4.5734992027282715,
      "eval_runtime": 15.9572,
      "eval_samples_per_second": 43.115,
      "eval_steps_per_second": 1.379,
      "step": 3225
    },
    {
      "epoch": 76.0,
      "eval_accuracy": 0.6322674418604651,
      "eval_loss": 4.569574356079102,
      "eval_runtime": 15.8334,
      "eval_samples_per_second": 43.452,
      "eval_steps_per_second": 1.389,
      "step": 3268
    },
    {
      "epoch": 77.0,
      "eval_accuracy": 0.6395348837209303,
      "eval_loss": 4.5653791427612305,
      "eval_runtime": 15.6763,
      "eval_samples_per_second": 43.888,
      "eval_steps_per_second": 1.403,
      "step": 3311
    },
    {
      "epoch": 78.0,
      "eval_accuracy": 0.6409883720930233,
      "eval_loss": 4.561344623565674,
      "eval_runtime": 15.8047,
      "eval_samples_per_second": 43.531,
      "eval_steps_per_second": 1.392,
      "step": 3354
    },
    {
      "epoch": 79.0,
      "eval_accuracy": 0.6424418604651163,
      "eval_loss": 4.5583977699279785,
      "eval_runtime": 15.7966,
      "eval_samples_per_second": 43.554,
      "eval_steps_per_second": 1.393,
      "step": 3397
    },
    {
      "epoch": 80.0,
      "eval_accuracy": 0.6424418604651163,
      "eval_loss": 4.555388927459717,
      "eval_runtime": 15.5869,
      "eval_samples_per_second": 44.14,
      "eval_steps_per_second": 1.411,
      "step": 3440
    },
    {
      "epoch": 81.0,
      "eval_accuracy": 0.6424418604651163,
      "eval_loss": 4.552060127258301,
      "eval_runtime": 15.7092,
      "eval_samples_per_second": 43.796,
      "eval_steps_per_second": 1.4,
      "step": 3483
    },
    {
      "epoch": 81.4,
      "learning_rate": 9.411764705882353e-07,
      "loss": 4.2447,
      "step": 3500
    },
    {
      "epoch": 82.0,
      "eval_accuracy": 0.6438953488372093,
      "eval_loss": 4.5491437911987305,
      "eval_runtime": 15.6587,
      "eval_samples_per_second": 43.937,
      "eval_steps_per_second": 1.405,
      "step": 3526
    },
    {
      "epoch": 83.0,
      "eval_accuracy": 0.6424418604651163,
      "eval_loss": 4.546697616577148,
      "eval_runtime": 15.6915,
      "eval_samples_per_second": 43.845,
      "eval_steps_per_second": 1.402,
      "step": 3569
    },
    {
      "epoch": 84.0,
      "eval_accuracy": 0.6453488372093024,
      "eval_loss": 4.543824672698975,
      "eval_runtime": 15.6742,
      "eval_samples_per_second": 43.894,
      "eval_steps_per_second": 1.404,
      "step": 3612
    },
    {
      "epoch": 85.0,
      "eval_accuracy": 0.6453488372093024,
      "eval_loss": 4.541160583496094,
      "eval_runtime": 15.7858,
      "eval_samples_per_second": 43.583,
      "eval_steps_per_second": 1.394,
      "step": 3655
    },
    {
      "epoch": 86.0,
      "eval_accuracy": 0.6453488372093024,
      "eval_loss": 4.538578033447266,
      "eval_runtime": 15.6025,
      "eval_samples_per_second": 44.096,
      "eval_steps_per_second": 1.41,
      "step": 3698
    },
    {
      "epoch": 87.0,
      "eval_accuracy": 0.6482558139534884,
      "eval_loss": 4.536581516265869,
      "eval_runtime": 15.7318,
      "eval_samples_per_second": 43.733,
      "eval_steps_per_second": 1.398,
      "step": 3741
    },
    {
      "epoch": 88.0,
      "eval_accuracy": 0.6482558139534884,
      "eval_loss": 4.53483247756958,
      "eval_runtime": 15.6791,
      "eval_samples_per_second": 43.88,
      "eval_steps_per_second": 1.403,
      "step": 3784
    },
    {
      "epoch": 89.0,
      "eval_accuracy": 0.6497093023255814,
      "eval_loss": 4.532886028289795,
      "eval_runtime": 15.7182,
      "eval_samples_per_second": 43.771,
      "eval_steps_per_second": 1.4,
      "step": 3827
    },
    {
      "epoch": 90.0,
      "eval_accuracy": 0.6497093023255814,
      "eval_loss": 4.531368732452393,
      "eval_runtime": 15.6379,
      "eval_samples_per_second": 43.996,
      "eval_steps_per_second": 1.407,
      "step": 3870
    },
    {
      "epoch": 91.0,
      "eval_accuracy": 0.6511627906976745,
      "eval_loss": 4.529922962188721,
      "eval_runtime": 15.6215,
      "eval_samples_per_second": 44.042,
      "eval_steps_per_second": 1.408,
      "step": 3913
    },
    {
      "epoch": 92.0,
      "eval_accuracy": 0.6511627906976745,
      "eval_loss": 4.5283308029174805,
      "eval_runtime": 15.5434,
      "eval_samples_per_second": 44.263,
      "eval_steps_per_second": 1.415,
      "step": 3956
    },
    {
      "epoch": 93.0,
      "eval_accuracy": 0.6511627906976745,
      "eval_loss": 4.5273118019104,
      "eval_runtime": 15.6797,
      "eval_samples_per_second": 43.878,
      "eval_steps_per_second": 1.403,
      "step": 3999
    },
    {
      "epoch": 93.02,
      "learning_rate": 3.529411764705883e-07,
      "loss": 4.1939,
      "step": 4000
    },
    {
      "epoch": 94.0,
      "eval_accuracy": 0.6526162790697675,
      "eval_loss": 4.526012897491455,
      "eval_runtime": 15.8081,
      "eval_samples_per_second": 43.522,
      "eval_steps_per_second": 1.392,
      "step": 4042
    },
    {
      "epoch": 95.0,
      "eval_accuracy": 0.6526162790697675,
      "eval_loss": 4.525457859039307,
      "eval_runtime": 15.5832,
      "eval_samples_per_second": 44.15,
      "eval_steps_per_second": 1.412,
      "step": 4085
    },
    {
      "epoch": 96.0,
      "eval_accuracy": 0.6526162790697675,
      "eval_loss": 4.524611473083496,
      "eval_runtime": 15.7099,
      "eval_samples_per_second": 43.794,
      "eval_steps_per_second": 1.4,
      "step": 4128
    },
    {
      "epoch": 97.0,
      "eval_accuracy": 0.6526162790697675,
      "eval_loss": 4.5239996910095215,
      "eval_runtime": 15.7058,
      "eval_samples_per_second": 43.805,
      "eval_steps_per_second": 1.401,
      "step": 4171
    },
    {
      "epoch": 98.0,
      "eval_accuracy": 0.6526162790697675,
      "eval_loss": 4.523560047149658,
      "eval_runtime": 15.7511,
      "eval_samples_per_second": 43.679,
      "eval_steps_per_second": 1.397,
      "step": 4214
    },
    {
      "epoch": 99.0,
      "eval_accuracy": 0.6526162790697675,
      "eval_loss": 4.523342609405518,
      "eval_runtime": 15.7896,
      "eval_samples_per_second": 43.573,
      "eval_steps_per_second": 1.393,
      "step": 4257
    },
    {
      "epoch": 100.0,
      "eval_accuracy": 0.6526162790697675,
      "eval_loss": 4.523245334625244,
      "eval_runtime": 15.8689,
      "eval_samples_per_second": 43.355,
      "eval_steps_per_second": 1.386,
      "step": 4300
    }
  ],
  "logging_steps": 500,
  "max_steps": 4300,
  "num_train_epochs": 100,
  "save_steps": 500,
  "total_flos": 2.1366507586623898e+19,
  "trial_name": null,
  "trial_params": null
}