{
  "best_metric": 0.6788413098236775,
  "best_model_checkpoint": "trained_models/wnut_17/checkpoint-9000",
  "epoch": 21.176470588235293,
  "global_step": 9000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.24,
      "eval_accuracy_score": 0.9205491641772071,
      "eval_f1": 0.0,
      "eval_loss": 0.5049907565116882,
      "eval_precision": 0.0,
      "eval_recall": 0.0,
      "eval_runtime": 6.761,
      "eval_samples_per_second": 149.239,
      "eval_steps_per_second": 18.784,
      "step": 100
    },
    {
      "epoch": 0.47,
      "eval_accuracy_score": 0.9205491641772071,
      "eval_f1": 0.0,
      "eval_loss": 0.48477333784103394,
      "eval_precision": 0.0,
      "eval_recall": 0.0,
      "eval_runtime": 6.7798,
      "eval_samples_per_second": 148.825,
      "eval_steps_per_second": 18.732,
      "step": 200
    },
    {
      "epoch": 0.71,
      "eval_accuracy_score": 0.9205491641772071,
      "eval_f1": 0.0,
      "eval_loss": 0.3834511935710907,
      "eval_precision": 0.0,
      "eval_recall": 0.0,
      "eval_runtime": 6.7494,
      "eval_samples_per_second": 149.494,
      "eval_steps_per_second": 18.816,
      "step": 300
    },
    {
      "epoch": 0.94,
      "eval_accuracy_score": 0.9218203775503718,
      "eval_f1": 0.016241299303944315,
      "eval_loss": 0.3428375720977783,
      "eval_precision": 0.2692307692307692,
      "eval_recall": 0.008373205741626795,
      "eval_runtime": 6.7397,
      "eval_samples_per_second": 149.711,
      "eval_steps_per_second": 18.844,
      "step": 400
    },
    {
      "epoch": 1.18,
      "learning_rate": 4.803921568627452e-06,
      "loss": 0.4388,
      "step": 500
    },
    {
      "epoch": 1.18,
      "eval_accuracy_score": 0.9387275154134621,
      "eval_f1": 0.3550877192982456,
      "eval_loss": 0.31836700439453125,
      "eval_precision": 0.4295415959252971,
      "eval_recall": 0.3026315789473684,
      "eval_runtime": 6.749,
      "eval_samples_per_second": 149.504,
      "eval_steps_per_second": 18.818,
      "step": 500
    },
    {
      "epoch": 1.41,
      "eval_accuracy_score": 0.9413335028284497,
      "eval_f1": 0.40223463687150846,
      "eval_loss": 0.3077085316181183,
      "eval_precision": 0.48322147651006714,
      "eval_recall": 0.3444976076555024,
      "eval_runtime": 7.2416,
      "eval_samples_per_second": 139.333,
      "eval_steps_per_second": 17.537,
      "step": 600
    },
    {
      "epoch": 1.65,
      "eval_accuracy_score": 0.9449564609419691,
      "eval_f1": 0.46935933147632314,
      "eval_loss": 0.29629671573638916,
      "eval_precision": 0.5616666666666666,
      "eval_recall": 0.40311004784689,
      "eval_runtime": 6.7314,
      "eval_samples_per_second": 149.895,
      "eval_steps_per_second": 18.867,
      "step": 700
    },
    {
      "epoch": 1.88,
      "eval_accuracy_score": 0.9471810843450074,
      "eval_f1": 0.5139186295503213,
      "eval_loss": 0.2875679135322571,
      "eval_precision": 0.6371681415929203,
      "eval_recall": 0.430622009569378,
      "eval_runtime": 6.7537,
      "eval_samples_per_second": 149.401,
      "eval_steps_per_second": 18.805,
      "step": 800
    },
    {
      "epoch": 2.12,
      "eval_accuracy_score": 0.949278586410729,
      "eval_f1": 0.5329849771391247,
      "eval_loss": 0.27145618200302124,
      "eval_precision": 0.5870503597122302,
      "eval_recall": 0.4880382775119617,
      "eval_runtime": 6.7363,
      "eval_samples_per_second": 149.786,
      "eval_steps_per_second": 18.853,
      "step": 900
    },
    {
      "epoch": 2.35,
      "learning_rate": 4.607843137254902e-06,
      "loss": 0.1974,
      "step": 1000
    },
    {
      "epoch": 2.35,
      "eval_accuracy_score": 0.9492150257420708,
      "eval_f1": 0.5209424083769634,
      "eval_loss": 0.2602783441543579,
      "eval_precision": 0.5751445086705202,
      "eval_recall": 0.47607655502392343,
      "eval_runtime": 6.736,
      "eval_samples_per_second": 149.792,
      "eval_steps_per_second": 18.854,
      "step": 1000
    },
    {
      "epoch": 2.59,
      "eval_accuracy_score": 0.9504862391152354,
      "eval_f1": 0.5558510638297872,
      "eval_loss": 0.24513839185237885,
      "eval_precision": 0.625748502994012,
      "eval_recall": 0.5,
      "eval_runtime": 7.332,
      "eval_samples_per_second": 137.616,
      "eval_steps_per_second": 17.321,
      "step": 1100
    },
    {
      "epoch": 2.82,
      "eval_accuracy_score": 0.9520116951630331,
      "eval_f1": 0.5626566416040101,
      "eval_loss": 0.23386946320533752,
      "eval_precision": 0.5907894736842105,
      "eval_recall": 0.5370813397129187,
      "eval_runtime": 6.737,
      "eval_samples_per_second": 149.771,
      "eval_steps_per_second": 18.851,
      "step": 1200
    },
    {
      "epoch": 3.06,
      "eval_accuracy_score": 0.9529651051929067,
      "eval_f1": 0.5635782747603835,
      "eval_loss": 0.23247480392456055,
      "eval_precision": 0.6049382716049383,
      "eval_recall": 0.527511961722488,
      "eval_runtime": 6.7326,
      "eval_samples_per_second": 149.868,
      "eval_steps_per_second": 18.864,
      "step": 1300
    },
    {
      "epoch": 3.29,
      "eval_accuracy_score": 0.9557617746138689,
      "eval_f1": 0.5892526250772081,
      "eval_loss": 0.2185893952846527,
      "eval_precision": 0.6091954022988506,
      "eval_recall": 0.5705741626794258,
      "eval_runtime": 6.7427,
      "eval_samples_per_second": 149.643,
      "eval_steps_per_second": 18.835,
      "step": 1400
    },
    {
      "epoch": 3.53,
      "learning_rate": 4.411764705882353e-06,
      "loss": 0.1395,
      "step": 1500
    },
    {
      "epoch": 3.53,
      "eval_accuracy_score": 0.9572236699930083,
      "eval_f1": 0.6000000000000001,
      "eval_loss": 0.2226746827363968,
      "eval_precision": 0.6464088397790055,
      "eval_recall": 0.5598086124401914,
      "eval_runtime": 6.7181,
      "eval_samples_per_second": 150.191,
      "eval_steps_per_second": 18.904,
      "step": 1500
    },
    {
      "epoch": 3.76,
      "eval_accuracy_score": 0.9590033687154389,
      "eval_f1": 0.598405885959534,
      "eval_loss": 0.21203213930130005,
      "eval_precision": 0.6138364779874214,
      "eval_recall": 0.583732057416268,
      "eval_runtime": 6.7595,
      "eval_samples_per_second": 149.27,
      "eval_steps_per_second": 18.788,
      "step": 1600
    },
    {
      "epoch": 4.0,
      "eval_accuracy_score": 0.9586855653721477,
      "eval_f1": 0.618421052631579,
      "eval_loss": 0.22468985617160797,
      "eval_precision": 0.6871345029239766,
      "eval_recall": 0.562200956937799,
      "eval_runtime": 6.7215,
      "eval_samples_per_second": 150.115,
      "eval_steps_per_second": 18.895,
      "step": 1700
    },
    {
      "epoch": 4.24,
      "eval_accuracy_score": 0.9599567787453124,
      "eval_f1": 0.6330749354005167,
      "eval_loss": 0.2214759886264801,
      "eval_precision": 0.6882022471910112,
      "eval_recall": 0.5861244019138756,
      "eval_runtime": 6.7281,
      "eval_samples_per_second": 149.969,
      "eval_steps_per_second": 18.876,
      "step": 1800
    },
    {
      "epoch": 4.47,
      "eval_accuracy_score": 0.96148223479311,
      "eval_f1": 0.6507115135834413,
      "eval_loss": 0.21751971542835236,
      "eval_precision": 0.7084507042253522,
      "eval_recall": 0.6016746411483254,
      "eval_runtime": 6.7505,
      "eval_samples_per_second": 149.471,
      "eval_steps_per_second": 18.813,
      "step": 1900
    },
    {
      "epoch": 4.71,
      "learning_rate": 4.215686274509805e-06,
      "loss": 0.1057,
      "step": 2000
    },
    {
      "epoch": 4.71,
      "eval_accuracy_score": 0.9605923854318947,
      "eval_f1": 0.6401062416998671,
      "eval_loss": 0.22828274965286255,
      "eval_precision": 0.7194029850746269,
      "eval_recall": 0.5765550239234449,
      "eval_runtime": 6.7552,
      "eval_samples_per_second": 149.366,
      "eval_steps_per_second": 18.8,
      "step": 2000
    },
    {
      "epoch": 4.94,
      "eval_accuracy_score": 0.9621814021483506,
      "eval_f1": 0.6484424666242848,
      "eval_loss": 0.2120533287525177,
      "eval_precision": 0.6919945725915875,
      "eval_recall": 0.6100478468899522,
      "eval_runtime": 6.7607,
      "eval_samples_per_second": 149.245,
      "eval_steps_per_second": 18.785,
      "step": 2100
    },
    {
      "epoch": 5.18,
      "eval_accuracy_score": 0.9617364774677429,
      "eval_f1": 0.6427196921103272,
      "eval_loss": 0.21272720396518707,
      "eval_precision": 0.6929460580912863,
      "eval_recall": 0.5992822966507177,
      "eval_runtime": 6.823,
      "eval_samples_per_second": 147.882,
      "eval_steps_per_second": 18.613,
      "step": 2200
    },
    {
      "epoch": 5.41,
      "eval_accuracy_score": 0.9614186741244518,
      "eval_f1": 0.6440460947503202,
      "eval_loss": 0.21506403386592865,
      "eval_precision": 0.6928374655647382,
      "eval_recall": 0.6016746411483254,
      "eval_runtime": 6.7509,
      "eval_samples_per_second": 149.462,
      "eval_steps_per_second": 18.812,
      "step": 2300
    },
    {
      "epoch": 5.65,
      "eval_accuracy_score": 0.9625627661603,
      "eval_f1": 0.6498740554156172,
      "eval_loss": 0.20958468317985535,
      "eval_precision": 0.6861702127659575,
      "eval_recall": 0.6172248803827751,
      "eval_runtime": 6.7421,
      "eval_samples_per_second": 149.656,
      "eval_steps_per_second": 18.837,
      "step": 2400
    },
    {
      "epoch": 5.88,
      "learning_rate": 4.019607843137255e-06,
      "loss": 0.0811,
      "step": 2500
    },
    {
      "epoch": 5.88,
      "eval_accuracy_score": 0.9624356448229835,
      "eval_f1": 0.6591337099811676,
      "eval_loss": 0.2008962631225586,
      "eval_precision": 0.6935270805812418,
      "eval_recall": 0.6279904306220095,
      "eval_runtime": 6.7089,
      "eval_samples_per_second": 150.397,
      "eval_steps_per_second": 18.93,
      "step": 2500
    },
    {
      "epoch": 6.12,
      "eval_accuracy_score": 0.9621178414796924,
      "eval_f1": 0.6448717948717948,
      "eval_loss": 0.21091684699058533,
      "eval_precision": 0.6947513812154696,
      "eval_recall": 0.6016746411483254,
      "eval_runtime": 6.7609,
      "eval_samples_per_second": 149.241,
      "eval_steps_per_second": 18.785,
      "step": 2600
    },
    {
      "epoch": 6.35,
      "eval_accuracy_score": 0.9621178414796924,
      "eval_f1": 0.6499057196731616,
      "eval_loss": 0.21349507570266724,
      "eval_precision": 0.6847682119205298,
      "eval_recall": 0.618421052631579,
      "eval_runtime": 6.7376,
      "eval_samples_per_second": 149.757,
      "eval_steps_per_second": 18.849,
      "step": 2700
    },
    {
      "epoch": 6.59,
      "eval_accuracy_score": 0.9620542808110342,
      "eval_f1": 0.6467218332272437,
      "eval_loss": 0.2102096974849701,
      "eval_precision": 0.691156462585034,
      "eval_recall": 0.6076555023923444,
      "eval_runtime": 6.7394,
      "eval_samples_per_second": 149.717,
      "eval_steps_per_second": 18.844,
      "step": 2800
    },
    {
      "epoch": 6.82,
      "eval_accuracy_score": 0.9630076908409076,
      "eval_f1": 0.6658385093167701,
      "eval_loss": 0.2015107125043869,
      "eval_precision": 0.6925064599483204,
      "eval_recall": 0.6411483253588517,
      "eval_runtime": 6.7773,
      "eval_samples_per_second": 148.879,
      "eval_steps_per_second": 18.739,
      "step": 2900
    },
    {
      "epoch": 7.06,
      "learning_rate": 3.8235294117647055e-06,
      "loss": 0.0674,
      "step": 3000
    },
    {
      "epoch": 7.06,
      "eval_accuracy_score": 0.96364329752749,
      "eval_f1": 0.6624921728240452,
      "eval_loss": 0.20179474353790283,
      "eval_precision": 0.695137976346912,
      "eval_recall": 0.6327751196172249,
      "eval_runtime": 6.8013,
      "eval_samples_per_second": 148.354,
      "eval_steps_per_second": 18.673,
      "step": 3000
    },
    {
      "epoch": 7.29,
      "eval_accuracy_score": 0.9629441301722494,
      "eval_f1": 0.6454431960049937,
      "eval_loss": 0.20865464210510254,
      "eval_precision": 0.674934725848564,
      "eval_recall": 0.618421052631579,
      "eval_runtime": 6.7901,
      "eval_samples_per_second": 148.599,
      "eval_steps_per_second": 18.704,
      "step": 3100
    },
    {
      "epoch": 7.53,
      "eval_accuracy_score": 0.9631983728468824,
      "eval_f1": 0.6507237256135934,
      "eval_loss": 0.2077988088130951,
      "eval_precision": 0.6865869853917662,
      "eval_recall": 0.618421052631579,
      "eval_runtime": 6.7566,
      "eval_samples_per_second": 149.335,
      "eval_steps_per_second": 18.796,
      "step": 3200
    },
    {
      "epoch": 7.76,
      "eval_accuracy_score": 0.9626898874976165,
      "eval_f1": 0.6499678869621066,
      "eval_loss": 0.2155311405658722,
      "eval_precision": 0.7018030513176144,
      "eval_recall": 0.6052631578947368,
      "eval_runtime": 6.7572,
      "eval_samples_per_second": 149.321,
      "eval_steps_per_second": 18.795,
      "step": 3300
    },
    {
      "epoch": 8.0,
      "eval_accuracy_score": 0.9624356448229835,
      "eval_f1": 0.6524271844660194,
      "eval_loss": 0.21822784841060638,
      "eval_precision": 0.7108603667136812,
      "eval_recall": 0.6028708133971292,
      "eval_runtime": 6.7807,
      "eval_samples_per_second": 148.804,
      "eval_steps_per_second": 18.73,
      "step": 3400
    },
    {
      "epoch": 8.24,
      "learning_rate": 3.6274509803921573e-06,
      "loss": 0.0559,
      "step": 3500
    },
    {
      "epoch": 8.24,
      "eval_accuracy_score": 0.9631348121782242,
      "eval_f1": 0.659062103929024,
      "eval_loss": 0.21273677051067352,
      "eval_precision": 0.7008086253369272,
      "eval_recall": 0.6220095693779905,
      "eval_runtime": 6.7444,
      "eval_samples_per_second": 149.606,
      "eval_steps_per_second": 18.831,
      "step": 3500
    },
    {
      "epoch": 8.47,
      "eval_accuracy_score": 0.9634526155215153,
      "eval_f1": 0.6608478802992518,
      "eval_loss": 0.20193149149417877,
      "eval_precision": 0.6901041666666666,
      "eval_recall": 0.6339712918660287,
      "eval_runtime": 8.1777,
      "eval_samples_per_second": 123.384,
      "eval_steps_per_second": 15.53,
      "step": 3600
    },
    {
      "epoch": 8.71,
      "eval_accuracy_score": 0.9634526155215153,
      "eval_f1": 0.6587942821628341,
      "eval_loss": 0.20160645246505737,
      "eval_precision": 0.685640362225097,
      "eval_recall": 0.6339712918660287,
      "eval_runtime": 6.7668,
      "eval_samples_per_second": 149.11,
      "eval_steps_per_second": 18.768,
      "step": 3700
    },
    {
      "epoch": 8.94,
      "eval_accuracy_score": 0.9634526155215153,
      "eval_f1": 0.662553979025293,
      "eval_loss": 0.20665320754051208,
      "eval_precision": 0.6840764331210191,
      "eval_recall": 0.6423444976076556,
      "eval_runtime": 6.7328,
      "eval_samples_per_second": 149.863,
      "eval_steps_per_second": 18.863,
      "step": 3800
    },
    {
      "epoch": 9.18,
      "eval_accuracy_score": 0.9629441301722494,
      "eval_f1": 0.6566775244299674,
      "eval_loss": 0.22287048399448395,
      "eval_precision": 0.721030042918455,
      "eval_recall": 0.6028708133971292,
      "eval_runtime": 6.7851,
      "eval_samples_per_second": 148.709,
      "eval_steps_per_second": 18.718,
      "step": 3900
    },
    {
      "epoch": 9.41,
      "learning_rate": 3.431372549019608e-06,
      "loss": 0.0459,
      "step": 4000
    },
    {
      "epoch": 9.41,
      "eval_accuracy_score": 0.9635797368588318,
      "eval_f1": 0.6574827802128992,
      "eval_loss": 0.20987075567245483,
      "eval_precision": 0.6898817345597897,
      "eval_recall": 0.6279904306220095,
      "eval_runtime": 6.7469,
      "eval_samples_per_second": 149.549,
      "eval_steps_per_second": 18.823,
      "step": 4000
    },
    {
      "epoch": 9.65,
      "eval_accuracy_score": 0.9628805695035911,
      "eval_f1": 0.6568690095846645,
      "eval_loss": 0.22190582752227783,
      "eval_precision": 0.7050754458161865,
      "eval_recall": 0.6148325358851675,
      "eval_runtime": 6.7586,
      "eval_samples_per_second": 149.292,
      "eval_steps_per_second": 18.791,
      "step": 4100
    },
    {
      "epoch": 9.88,
      "eval_accuracy_score": 0.9632619335155406,
      "eval_f1": 0.6525265127885215,
      "eval_loss": 0.21028834581375122,
      "eval_precision": 0.681877444589309,
      "eval_recall": 0.6255980861244019,
      "eval_runtime": 6.7583,
      "eval_samples_per_second": 149.298,
      "eval_steps_per_second": 18.792,
      "step": 4200
    },
    {
      "epoch": 10.12,
      "eval_accuracy_score": 0.9640882222080976,
      "eval_f1": 0.6692111959287532,
      "eval_loss": 0.2170829027891159,
      "eval_precision": 0.7146739130434783,
      "eval_recall": 0.6291866028708134,
      "eval_runtime": 6.7544,
      "eval_samples_per_second": 149.383,
      "eval_steps_per_second": 18.802,
      "step": 4300
    },
    {
      "epoch": 10.35,
      "eval_accuracy_score": 0.9630712515095659,
      "eval_f1": 0.6495619524405507,
      "eval_loss": 0.2193835973739624,
      "eval_precision": 0.6811023622047244,
      "eval_recall": 0.6208133971291866,
      "eval_runtime": 6.7362,
      "eval_samples_per_second": 149.787,
      "eval_steps_per_second": 18.853,
      "step": 4400
    },
    {
      "epoch": 10.59,
      "learning_rate": 3.2352941176470594e-06,
      "loss": 0.0399,
      "step": 4500
    },
    {
      "epoch": 10.59,
      "eval_accuracy_score": 0.9634526155215153,
      "eval_f1": 0.6556543837357053,
      "eval_loss": 0.21863853931427002,
      "eval_precision": 0.6991869918699187,
      "eval_recall": 0.6172248803827751,
      "eval_runtime": 6.769,
      "eval_samples_per_second": 149.062,
      "eval_steps_per_second": 18.762,
      "step": 4500
    },
    {
      "epoch": 10.82,
      "eval_accuracy_score": 0.9637068581961482,
      "eval_f1": 0.6624685138539044,
      "eval_loss": 0.21445031464099884,
      "eval_precision": 0.699468085106383,
      "eval_recall": 0.6291866028708134,
      "eval_runtime": 6.7298,
      "eval_samples_per_second": 149.93,
      "eval_steps_per_second": 18.871,
      "step": 4600
    },
    {
      "epoch": 11.06,
      "eval_accuracy_score": 0.9644695862200471,
      "eval_f1": 0.6759142496847416,
      "eval_loss": 0.20991285145282745,
      "eval_precision": 0.7146666666666667,
      "eval_recall": 0.6411483253588517,
      "eval_runtime": 6.734,
      "eval_samples_per_second": 149.837,
      "eval_steps_per_second": 18.86,
      "step": 4700
    },
    {
      "epoch": 11.29,
      "eval_accuracy_score": 0.96364329752749,
      "eval_f1": 0.6649778340721977,
      "eval_loss": 0.22495105862617493,
      "eval_precision": 0.7065948855989233,
      "eval_recall": 0.6279904306220095,
      "eval_runtime": 6.7408,
      "eval_samples_per_second": 149.687,
      "eval_steps_per_second": 18.841,
      "step": 4800
    },
    {
      "epoch": 11.53,
      "eval_accuracy_score": 0.9639611008707811,
      "eval_f1": 0.6670894102726697,
      "eval_loss": 0.22267203032970428,
      "eval_precision": 0.7098515519568152,
      "eval_recall": 0.6291866028708134,
      "eval_runtime": 6.7689,
      "eval_samples_per_second": 149.064,
      "eval_steps_per_second": 18.762,
      "step": 4900
    },
    {
      "epoch": 11.76,
      "learning_rate": 3.03921568627451e-06,
      "loss": 0.0368,
      "step": 5000
    },
    {
      "epoch": 11.76,
      "eval_accuracy_score": 0.9637068581961482,
      "eval_f1": 0.6588235294117647,
      "eval_loss": 0.21161217987537384,
      "eval_precision": 0.6829268292682927,
      "eval_recall": 0.6363636363636364,
      "eval_runtime": 6.7536,
      "eval_samples_per_second": 149.402,
      "eval_steps_per_second": 18.805,
      "step": 5000
    },
    {
      "epoch": 12.0,
      "eval_accuracy_score": 0.9625627661603,
      "eval_f1": 0.6593830334190232,
      "eval_loss": 0.227540984749794,
      "eval_precision": 0.7125,
      "eval_recall": 0.6136363636363636,
      "eval_runtime": 6.7584,
      "eval_samples_per_second": 149.295,
      "eval_steps_per_second": 18.791,
      "step": 5100
    },
    {
      "epoch": 12.24,
      "eval_accuracy_score": 0.9628805695035911,
      "eval_f1": 0.6640471512770137,
      "eval_loss": 0.23519518971443176,
      "eval_precision": 0.7337192474674384,
      "eval_recall": 0.6064593301435407,
      "eval_runtime": 6.7729,
      "eval_samples_per_second": 148.976,
      "eval_steps_per_second": 18.751,
      "step": 5200
    },
    {
      "epoch": 12.47,
      "eval_accuracy_score": 0.9628170088349329,
      "eval_f1": 0.6679462571976967,
      "eval_loss": 0.2271033227443695,
      "eval_precision": 0.7180192572214581,
      "eval_recall": 0.6244019138755981,
      "eval_runtime": 6.7726,
      "eval_samples_per_second": 148.983,
      "eval_steps_per_second": 18.752,
      "step": 5300
    },
    {
      "epoch": 12.71,
      "eval_accuracy_score": 0.9630076908409076,
      "eval_f1": 0.6628643852978454,
      "eval_loss": 0.22853700816631317,
      "eval_precision": 0.7048517520215634,
      "eval_recall": 0.6255980861244019,
      "eval_runtime": 6.7535,
      "eval_samples_per_second": 149.405,
      "eval_steps_per_second": 18.805,
      "step": 5400
    },
    {
      "epoch": 12.94,
      "learning_rate": 2.843137254901961e-06,
      "loss": 0.0321,
      "step": 5500
    },
    {
      "epoch": 12.94,
      "eval_accuracy_score": 0.9631348121782242,
      "eval_f1": 0.664548919949174,
      "eval_loss": 0.22333784401416779,
      "eval_precision": 0.7086720867208672,
      "eval_recall": 0.6255980861244019,
      "eval_runtime": 6.7401,
      "eval_samples_per_second": 149.702,
      "eval_steps_per_second": 18.843,
      "step": 5500
    },
    {
      "epoch": 13.18,
      "eval_accuracy_score": 0.9637068581961482,
      "eval_f1": 0.6705054382597568,
      "eval_loss": 0.222885861992836,
      "eval_precision": 0.7207702888583218,
      "eval_recall": 0.6267942583732058,
      "eval_runtime": 6.7486,
      "eval_samples_per_second": 149.513,
      "eval_steps_per_second": 18.819,
      "step": 5600
    },
    {
      "epoch": 13.41,
      "eval_accuracy_score": 0.9633254941841988,
      "eval_f1": 0.6619718309859155,
      "eval_loss": 0.2285127490758896,
      "eval_precision": 0.7121212121212122,
      "eval_recall": 0.618421052631579,
      "eval_runtime": 6.8129,
      "eval_samples_per_second": 148.102,
      "eval_steps_per_second": 18.641,
      "step": 5700
    },
    {
      "epoch": 13.65,
      "eval_accuracy_score": 0.9644695862200471,
      "eval_f1": 0.6734177215189874,
      "eval_loss": 0.22083869576454163,
      "eval_precision": 0.7150537634408602,
      "eval_recall": 0.6363636363636364,
      "eval_runtime": 6.7283,
      "eval_samples_per_second": 149.964,
      "eval_steps_per_second": 18.876,
      "step": 5800
    },
    {
      "epoch": 13.88,
      "eval_accuracy_score": 0.9635161761901735,
      "eval_f1": 0.6684005201560469,
      "eval_loss": 0.2334665209054947,
      "eval_precision": 0.7321937321937322,
      "eval_recall": 0.6148325358851675,
      "eval_runtime": 6.7215,
      "eval_samples_per_second": 150.116,
      "eval_steps_per_second": 18.895,
      "step": 5900
    },
    {
      "epoch": 14.12,
      "learning_rate": 2.647058823529412e-06,
      "loss": 0.0291,
      "step": 6000
    },
    {
      "epoch": 14.12,
      "eval_accuracy_score": 0.9641517828767558,
      "eval_f1": 0.663265306122449,
      "eval_loss": 0.2206926792860031,
      "eval_precision": 0.7103825136612022,
      "eval_recall": 0.6220095693779905,
      "eval_runtime": 6.7314,
      "eval_samples_per_second": 149.894,
      "eval_steps_per_second": 18.867,
      "step": 6000
    },
    {
      "epoch": 14.35,
      "eval_accuracy_score": 0.9650416322379711,
      "eval_f1": 0.6737633061991233,
      "eval_loss": 0.21664156019687653,
      "eval_precision": 0.7069645203679369,
      "eval_recall": 0.6435406698564593,
      "eval_runtime": 6.8128,
      "eval_samples_per_second": 148.104,
      "eval_steps_per_second": 18.641,
      "step": 6100
    },
    {
      "epoch": 14.59,
      "eval_accuracy_score": 0.9646602682260217,
      "eval_f1": 0.6654275092936804,
      "eval_loss": 0.20899562537670135,
      "eval_precision": 0.6902313624678663,
      "eval_recall": 0.6423444976076556,
      "eval_runtime": 6.7812,
      "eval_samples_per_second": 148.794,
      "eval_steps_per_second": 18.728,
      "step": 6200
    },
    {
      "epoch": 14.82,
      "eval_accuracy_score": 0.9647873895633382,
      "eval_f1": 0.6766917293233083,
      "eval_loss": 0.21245865523815155,
      "eval_precision": 0.7105263157894737,
      "eval_recall": 0.645933014354067,
      "eval_runtime": 6.7236,
      "eval_samples_per_second": 150.069,
      "eval_steps_per_second": 18.889,
      "step": 6300
    },
    {
      "epoch": 15.06,
      "eval_accuracy_score": 0.9637704188648064,
      "eval_f1": 0.6666666666666667,
      "eval_loss": 0.22959989309310913,
      "eval_precision": 0.713506139154161,
      "eval_recall": 0.6255980861244019,
      "eval_runtime": 6.7691,
      "eval_samples_per_second": 149.061,
      "eval_steps_per_second": 18.762,
      "step": 6400
    },
    {
      "epoch": 15.29,
      "learning_rate": 2.450980392156863e-06,
      "loss": 0.0251,
      "step": 6500
    },
    {
      "epoch": 15.29,
      "eval_accuracy_score": 0.9645331468887053,
      "eval_f1": 0.6733542319749217,
      "eval_loss": 0.22114437818527222,
      "eval_precision": 0.7075098814229249,
      "eval_recall": 0.6423444976076556,
      "eval_runtime": 6.8495,
      "eval_samples_per_second": 147.311,
      "eval_steps_per_second": 18.542,
      "step": 6500
    },
    {
      "epoch": 15.53,
      "eval_accuracy_score": 0.9640882222080976,
      "eval_f1": 0.6713197969543148,
      "eval_loss": 0.22384566068649292,
      "eval_precision": 0.7148648648648649,
      "eval_recall": 0.6327751196172249,
      "eval_runtime": 6.7143,
      "eval_samples_per_second": 150.277,
      "eval_steps_per_second": 18.915,
      "step": 6600
    },
    {
      "epoch": 15.76,
      "eval_accuracy_score": 0.9637068581961482,
      "eval_f1": 0.6641172721478649,
      "eval_loss": 0.23098178207874298,
      "eval_precision": 0.7107776261937244,
      "eval_recall": 0.6232057416267942,
      "eval_runtime": 6.7457,
      "eval_samples_per_second": 149.576,
      "eval_steps_per_second": 18.827,
      "step": 6700
    },
    {
      "epoch": 16.0,
      "eval_accuracy_score": 0.9650416322379711,
      "eval_f1": 0.6762860727728984,
      "eval_loss": 0.21991874277591705,
      "eval_precision": 0.7110817941952506,
      "eval_recall": 0.6447368421052632,
      "eval_runtime": 6.7686,
      "eval_samples_per_second": 149.07,
      "eval_steps_per_second": 18.763,
      "step": 6800
    },
    {
      "epoch": 16.24,
      "eval_accuracy_score": 0.96364329752749,
      "eval_f1": 0.6636771300448431,
      "eval_loss": 0.23369288444519043,
      "eval_precision": 0.7144827586206897,
      "eval_recall": 0.6196172248803827,
      "eval_runtime": 6.8164,
      "eval_samples_per_second": 148.025,
      "eval_steps_per_second": 18.631,
      "step": 6900
    },
    {
      "epoch": 16.47,
      "learning_rate": 2.254901960784314e-06,
      "loss": 0.0227,
      "step": 7000
    },
    {
      "epoch": 16.47,
      "eval_accuracy_score": 0.9646602682260217,
      "eval_f1": 0.6712243629583592,
      "eval_loss": 0.22149834036827087,
      "eval_precision": 0.6985769728331177,
      "eval_recall": 0.645933014354067,
      "eval_runtime": 6.7644,
      "eval_samples_per_second": 149.164,
      "eval_steps_per_second": 18.775,
      "step": 7000
    },
    {
      "epoch": 16.71,
      "eval_accuracy_score": 0.9645331468887053,
      "eval_f1": 0.6687422166874221,
      "eval_loss": 0.2212422788143158,
      "eval_precision": 0.6974025974025974,
      "eval_recall": 0.6423444976076556,
      "eval_runtime": 6.7009,
      "eval_samples_per_second": 150.576,
      "eval_steps_per_second": 18.953,
      "step": 7100
    },
    {
      "epoch": 16.94,
      "eval_accuracy_score": 0.9635161761901735,
      "eval_f1": 0.6653821451509313,
      "eval_loss": 0.24178394675254822,
      "eval_precision": 0.7184466019417476,
      "eval_recall": 0.6196172248803827,
      "eval_runtime": 6.7952,
      "eval_samples_per_second": 148.486,
      "eval_steps_per_second": 18.69,
      "step": 7200
    },
    {
      "epoch": 17.18,
      "eval_accuracy_score": 0.9633890548528571,
      "eval_f1": 0.6675307841866494,
      "eval_loss": 0.24713467061519623,
      "eval_precision": 0.7284299858557284,
      "eval_recall": 0.6160287081339713,
      "eval_runtime": 6.807,
      "eval_samples_per_second": 148.229,
      "eval_steps_per_second": 18.657,
      "step": 7300
    },
    {
      "epoch": 17.41,
      "eval_accuracy_score": 0.9643424648827306,
      "eval_f1": 0.670031545741325,
      "eval_loss": 0.22886203229427338,
      "eval_precision": 0.7089452603471295,
      "eval_recall": 0.6351674641148325,
      "eval_runtime": 6.7775,
      "eval_samples_per_second": 148.874,
      "eval_steps_per_second": 18.738,
      "step": 7400
    },
    {
      "epoch": 17.65,
      "learning_rate": 2.058823529411765e-06,
      "loss": 0.0197,
      "step": 7500
    },
    {
      "epoch": 17.65,
      "eval_accuracy_score": 0.9646602682260217,
      "eval_f1": 0.6753731343283582,
      "eval_loss": 0.22524945437908173,
      "eval_precision": 0.7033678756476683,
      "eval_recall": 0.6495215311004785,
      "eval_runtime": 6.7338,
      "eval_samples_per_second": 149.84,
      "eval_steps_per_second": 18.86,
      "step": 7500
    },
    {
      "epoch": 17.88,
      "eval_accuracy_score": 0.9633890548528571,
      "eval_f1": 0.664528543938422,
      "eval_loss": 0.24701638519763947,
      "eval_precision": 0.7164591977869986,
      "eval_recall": 0.6196172248803827,
      "eval_runtime": 6.7838,
      "eval_samples_per_second": 148.736,
      "eval_steps_per_second": 18.721,
      "step": 7600
    },
    {
      "epoch": 18.12,
      "eval_accuracy_score": 0.9654865569185788,
      "eval_f1": 0.6825,
      "eval_loss": 0.22353364527225494,
      "eval_precision": 0.7146596858638743,
      "eval_recall": 0.65311004784689,
      "eval_runtime": 6.7595,
      "eval_samples_per_second": 149.272,
      "eval_steps_per_second": 18.788,
      "step": 7700
    },
    {
      "epoch": 18.35,
      "eval_accuracy_score": 0.9638975402021229,
      "eval_f1": 0.6590765338393421,
      "eval_loss": 0.23786970973014832,
      "eval_precision": 0.6993288590604027,
      "eval_recall": 0.6232057416267942,
      "eval_runtime": 6.8141,
      "eval_samples_per_second": 148.075,
      "eval_steps_per_second": 18.638,
      "step": 7800
    },
    {
      "epoch": 18.59,
      "eval_accuracy_score": 0.9644060255513888,
      "eval_f1": 0.6666666666666667,
      "eval_loss": 0.23264023661613464,
      "eval_precision": 0.7014531043593131,
      "eval_recall": 0.6351674641148325,
      "eval_runtime": 6.8013,
      "eval_samples_per_second": 148.353,
      "eval_steps_per_second": 18.673,
      "step": 7900
    },
    {
      "epoch": 18.82,
      "learning_rate": 1.8627450980392158e-06,
      "loss": 0.0183,
      "step": 8000
    },
    {
      "epoch": 18.82,
      "eval_accuracy_score": 0.9649780715693129,
      "eval_f1": 0.6724244293645897,
      "eval_loss": 0.22304123640060425,
      "eval_precision": 0.6942675159235668,
      "eval_recall": 0.6519138755980861,
      "eval_runtime": 6.7426,
      "eval_samples_per_second": 149.646,
      "eval_steps_per_second": 18.835,
      "step": 8000
    },
    {
      "epoch": 19.06,
      "eval_accuracy_score": 0.9643424648827306,
      "eval_f1": 0.6683480453972257,
      "eval_loss": 0.2350449413061142,
      "eval_precision": 0.7066666666666667,
      "eval_recall": 0.6339712918660287,
      "eval_runtime": 6.8057,
      "eval_samples_per_second": 148.259,
      "eval_steps_per_second": 18.661,
      "step": 8100
    },
    {
      "epoch": 19.29,
      "eval_accuracy_score": 0.9652323142439458,
      "eval_f1": 0.6790582403965303,
      "eval_loss": 0.226871520280838,
      "eval_precision": 0.7043701799485861,
      "eval_recall": 0.6555023923444976,
      "eval_runtime": 6.7483,
      "eval_samples_per_second": 149.519,
      "eval_steps_per_second": 18.819,
      "step": 8200
    },
    {
      "epoch": 19.53,
      "eval_accuracy_score": 0.96472382889468,
      "eval_f1": 0.6683354192740926,
      "eval_loss": 0.23186342418193817,
      "eval_precision": 0.7007874015748031,
      "eval_recall": 0.638755980861244,
      "eval_runtime": 6.7632,
      "eval_samples_per_second": 149.19,
      "eval_steps_per_second": 18.778,
      "step": 8300
    },
    {
      "epoch": 19.76,
      "eval_accuracy_score": 0.9645967075573635,
      "eval_f1": 0.6712933753943218,
      "eval_loss": 0.2337142825126648,
      "eval_precision": 0.7102803738317757,
      "eval_recall": 0.6363636363636364,
      "eval_runtime": 6.7451,
      "eval_samples_per_second": 149.591,
      "eval_steps_per_second": 18.829,
      "step": 8400
    },
    {
      "epoch": 20.0,
      "learning_rate": 1.6666666666666667e-06,
      "loss": 0.0162,
      "step": 8500
    },
    {
      "epoch": 20.0,
      "eval_accuracy_score": 0.9647873895633382,
      "eval_f1": 0.6751430387794024,
      "eval_loss": 0.2389359027147293,
      "eval_precision": 0.7204884667571235,
      "eval_recall": 0.6351674641148325,
      "eval_runtime": 6.7503,
      "eval_samples_per_second": 149.474,
      "eval_steps_per_second": 18.814,
      "step": 8500
    },
    {
      "epoch": 20.24,
      "eval_accuracy_score": 0.9638975402021229,
      "eval_f1": 0.6709677419354839,
      "eval_loss": 0.25359493494033813,
      "eval_precision": 0.7282913165266106,
      "eval_recall": 0.6220095693779905,
      "eval_runtime": 6.7422,
      "eval_samples_per_second": 149.655,
      "eval_steps_per_second": 18.837,
      "step": 8600
    },
    {
      "epoch": 20.47,
      "eval_accuracy_score": 0.964215343545414,
      "eval_f1": 0.6709346991037132,
      "eval_loss": 0.24693100154399872,
      "eval_precision": 0.721763085399449,
      "eval_recall": 0.6267942583732058,
      "eval_runtime": 6.7296,
      "eval_samples_per_second": 149.934,
      "eval_steps_per_second": 18.872,
      "step": 8700
    },
    {
      "epoch": 20.71,
      "eval_accuracy_score": 0.9637704188648064,
      "eval_f1": 0.6687938736439056,
      "eval_loss": 0.2458009421825409,
      "eval_precision": 0.7168262653898769,
      "eval_recall": 0.6267942583732058,
      "eval_runtime": 6.7627,
      "eval_samples_per_second": 149.201,
      "eval_steps_per_second": 18.78,
      "step": 8800
    },
    {
      "epoch": 20.94,
      "eval_accuracy_score": 0.9648509502319964,
      "eval_f1": 0.676304211187932,
      "eval_loss": 0.23430827260017395,
      "eval_precision": 0.7125827814569536,
      "eval_recall": 0.6435406698564593,
      "eval_runtime": 6.7289,
      "eval_samples_per_second": 149.951,
      "eval_steps_per_second": 18.874,
      "step": 8900
    },
    {
      "epoch": 21.18,
      "learning_rate": 1.4705882352941177e-06,
      "loss": 0.0149,
      "step": 9000
    },
    {
      "epoch": 21.18,
      "eval_accuracy_score": 0.9651687535752876,
      "eval_f1": 0.6788413098236775,
      "eval_loss": 0.23078210651874542,
      "eval_precision": 0.7167553191489362,
      "eval_recall": 0.6447368421052632,
      "eval_runtime": 6.7181,
      "eval_samples_per_second": 150.19,
      "eval_steps_per_second": 18.904,
      "step": 9000
    }
  ],
  "max_steps": 12750,
  "num_train_epochs": 30,
  "total_flos": 4695577703714304.0,
  "trial_name": null,
  "trial_params": null
}