{
  "best_metric": 0.06025264039635658,
  "best_model_checkpoint": "roberta-large-finetuned-iterate_intent_classification-200k_all_extra_datasets_v2_single-task_multi-sent/checkpoint-56000",
  "epoch": 1.5705631590756113,
  "global_step": 56000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.01,
      "learning_rate": 2.9860612519632043e-05,
      "loss": 0.139,
      "step": 500
    },
    {
      "epoch": 0.03,
      "learning_rate": 2.9720383666143147e-05,
      "loss": 0.0977,
      "step": 1000
    },
    {
      "epoch": 0.03,
      "eval_accuracy": 0.971162091635854,
      "eval_f1": 0.5399681845297277,
      "eval_loss": 0.09991234540939331,
      "eval_precision": 0.5387896825396825,
      "eval_recall": 0.5411518533280192,
      "eval_runtime": 37.2769,
      "eval_samples_per_second": 80.479,
      "eval_steps_per_second": 5.043,
      "step": 1000
    },
    {
      "epoch": 0.04,
      "learning_rate": 2.9580154812654254e-05,
      "loss": 0.0907,
      "step": 1500
    },
    {
      "epoch": 0.06,
      "learning_rate": 2.943992595916536e-05,
      "loss": 0.085,
      "step": 2000
    },
    {
      "epoch": 0.06,
      "eval_accuracy": 0.9737669546615523,
      "eval_f1": 0.5691315136476427,
      "eval_loss": 0.09658516198396683,
      "eval_precision": 0.566936919122009,
      "eval_recall": 0.5713431646074133,
      "eval_runtime": 38.0964,
      "eval_samples_per_second": 78.748,
      "eval_steps_per_second": 4.935,
      "step": 2000
    },
    {
      "epoch": 0.07,
      "learning_rate": 2.9299697105676466e-05,
      "loss": 0.085,
      "step": 2500
    },
    {
      "epoch": 0.08,
      "learning_rate": 2.915946825218757e-05,
      "loss": 0.0758,
      "step": 3000
    },
    {
      "epoch": 0.08,
      "eval_accuracy": 0.9763026620317009,
      "eval_f1": 0.6236316332040647,
      "eval_loss": 0.07386751472949982,
      "eval_precision": 0.6146105466860183,
      "eval_recall": 0.6329214826624153,
      "eval_runtime": 37.6732,
      "eval_samples_per_second": 79.632,
      "eval_steps_per_second": 4.99,
      "step": 3000
    },
    {
      "epoch": 0.1,
      "learning_rate": 2.9019519856405656e-05,
      "loss": 0.0781,
      "step": 3500
    },
    {
      "epoch": 0.11,
      "learning_rate": 2.887929100291676e-05,
      "loss": 0.0782,
      "step": 4000
    },
    {
      "epoch": 0.11,
      "eval_accuracy": 0.9755096771813999,
      "eval_f1": 0.5991719984945427,
      "eval_loss": 0.07741887867450714,
      "eval_precision": 0.5675579322638146,
      "eval_recall": 0.6345157433240335,
      "eval_runtime": 36.9968,
      "eval_samples_per_second": 81.088,
      "eval_steps_per_second": 5.082,
      "step": 4000
    },
    {
      "epoch": 0.13,
      "learning_rate": 2.8739342607134845e-05,
      "loss": 0.0778,
      "step": 4500
    },
    {
      "epoch": 0.14,
      "learning_rate": 2.859911375364595e-05,
      "loss": 0.0695,
      "step": 5000
    },
    {
      "epoch": 0.14,
      "eval_accuracy": 0.9774137628975298,
      "eval_f1": 0.680416421135337,
      "eval_loss": 0.07352685928344727,
      "eval_precision": 0.6707978311386522,
      "eval_recall": 0.6903148664806696,
      "eval_runtime": 36.5263,
      "eval_samples_per_second": 82.133,
      "eval_steps_per_second": 5.147,
      "step": 5000
    },
    {
      "epoch": 0.15,
      "learning_rate": 2.8458884900157057e-05,
      "loss": 0.0699,
      "step": 5500
    },
    {
      "epoch": 0.17,
      "learning_rate": 2.8318656046668165e-05,
      "loss": 0.0722,
      "step": 6000
    },
    {
      "epoch": 0.17,
      "eval_accuracy": 0.9802675862832062,
      "eval_f1": 0.7195344478966317,
      "eval_loss": 0.06846912950277328,
      "eval_precision": 0.7123327800019529,
      "eval_recall": 0.7268832204065365,
      "eval_runtime": 37.6415,
      "eval_samples_per_second": 79.699,
      "eval_steps_per_second": 4.994,
      "step": 6000
    },
    {
      "epoch": 0.18,
      "learning_rate": 2.817842719317927e-05,
      "loss": 0.0702,
      "step": 6500
    },
    {
      "epoch": 0.2,
      "learning_rate": 2.8038198339690376e-05,
      "loss": 0.0667,
      "step": 7000
    },
    {
      "epoch": 0.2,
      "eval_accuracy": 0.9801108334639607,
      "eval_f1": 0.7278459189202502,
      "eval_loss": 0.06565115600824356,
      "eval_precision": 0.7197272284461763,
      "eval_recall": 0.7361498605021921,
      "eval_runtime": 37.325,
      "eval_samples_per_second": 80.375,
      "eval_steps_per_second": 5.037,
      "step": 7000
    },
    {
      "epoch": 0.21,
      "learning_rate": 2.789796948620148e-05,
      "loss": 0.0658,
      "step": 7500
    },
    {
      "epoch": 0.22,
      "learning_rate": 2.7757740632712588e-05,
      "loss": 0.0688,
      "step": 8000
    },
    {
      "epoch": 0.22,
      "eval_accuracy": 0.9796728476454805,
      "eval_f1": 0.7163943328232216,
      "eval_loss": 0.06845768541097641,
      "eval_precision": 0.7099109676156932,
      "eval_recall": 0.7229972100438422,
      "eval_runtime": 36.6425,
      "eval_samples_per_second": 81.872,
      "eval_steps_per_second": 5.131,
      "step": 8000
    },
    {
      "epoch": 0.24,
      "learning_rate": 2.7617511779223692e-05,
      "loss": 0.0678,
      "step": 8500
    },
    {
      "epoch": 0.25,
      "learning_rate": 2.7477563383441778e-05,
      "loss": 0.0654,
      "step": 9000
    },
    {
      "epoch": 0.25,
      "eval_accuracy": 0.9798526523499091,
      "eval_f1": 0.7101066431855984,
      "eval_loss": 0.06661399453878403,
      "eval_precision": 0.6974822217951182,
      "eval_recall": 0.7231964926265444,
      "eval_runtime": 41.9581,
      "eval_samples_per_second": 71.5,
      "eval_steps_per_second": 4.481,
      "step": 9000
    },
    {
      "epoch": 0.27,
      "learning_rate": 2.7337334529952882e-05,
      "loss": 0.0691,
      "step": 9500
    },
    {
      "epoch": 0.28,
      "learning_rate": 2.7197386134170967e-05,
      "loss": 0.0677,
      "step": 10000
    },
    {
      "epoch": 0.28,
      "eval_accuracy": 0.980018625923228,
      "eval_f1": 0.7221836228287842,
      "eval_loss": 0.07092269510030746,
      "eval_precision": 0.7193988530749457,
      "eval_recall": 0.7249900358708649,
      "eval_runtime": 37.1023,
      "eval_samples_per_second": 80.858,
      "eval_steps_per_second": 5.067,
      "step": 10000
    },
    {
      "epoch": 0.29,
      "learning_rate": 2.7057157280682075e-05,
      "loss": 0.0686,
      "step": 10500
    },
    {
      "epoch": 0.31,
      "learning_rate": 2.691692842719318e-05,
      "loss": 0.0666,
      "step": 11000
    },
    {
      "epoch": 0.31,
      "eval_accuracy": 0.9806548579542835,
      "eval_f1": 0.7343549184379634,
      "eval_loss": 0.0653684139251709,
      "eval_precision": 0.7286639199529135,
      "eval_recall": 0.7401355121562375,
      "eval_runtime": 35.9849,
      "eval_samples_per_second": 83.368,
      "eval_steps_per_second": 5.224,
      "step": 11000
    },
    {
      "epoch": 0.32,
      "learning_rate": 2.6776699573704287e-05,
      "loss": 0.0667,
      "step": 11500
    },
    {
      "epoch": 0.34,
      "learning_rate": 2.663647072021539e-05,
      "loss": 0.0635,
      "step": 12000
    },
    {
      "epoch": 0.34,
      "eval_accuracy": 0.9803413523157923,
      "eval_f1": 0.7172954434100932,
      "eval_loss": 0.06524238735437393,
      "eval_precision": 0.7056101792943898,
      "eval_recall": 0.7293742526903149,
      "eval_runtime": 37.7011,
      "eval_samples_per_second": 79.573,
      "eval_steps_per_second": 4.987,
      "step": 12000
    },
    {
      "epoch": 0.35,
      "learning_rate": 2.6496241866726498e-05,
      "loss": 0.066,
      "step": 12500
    },
    {
      "epoch": 0.36,
      "learning_rate": 2.6356013013237602e-05,
      "loss": 0.0635,
      "step": 13000
    },
    {
      "epoch": 0.36,
      "eval_accuracy": 0.9800601193165577,
      "eval_f1": 0.7266683205160009,
      "eval_loss": 0.07080024480819702,
      "eval_precision": 0.7236881114734658,
      "eval_recall": 0.7296731765643683,
      "eval_runtime": 37.3623,
      "eval_samples_per_second": 80.295,
      "eval_steps_per_second": 5.032,
      "step": 13000
    },
    {
      "epoch": 0.38,
      "learning_rate": 2.621578415974871e-05,
      "loss": 0.0614,
      "step": 13500
    },
    {
      "epoch": 0.39,
      "learning_rate": 2.6075555306259814e-05,
      "loss": 0.0619,
      "step": 14000
    },
    {
      "epoch": 0.39,
      "eval_accuracy": 0.979778886317323,
      "eval_f1": 0.7210257933561068,
      "eval_loss": 0.06537187844514847,
      "eval_precision": 0.7165207123880744,
      "eval_recall": 0.7255878836189718,
      "eval_runtime": 37.6468,
      "eval_samples_per_second": 79.688,
      "eval_steps_per_second": 4.994,
      "step": 14000
    },
    {
      "epoch": 0.41,
      "learning_rate": 2.59356069104779e-05,
      "loss": 0.0623,
      "step": 14500
    },
    {
      "epoch": 0.42,
      "learning_rate": 2.5795378056989004e-05,
      "loss": 0.0621,
      "step": 15000
    },
    {
      "epoch": 0.42,
      "eval_accuracy": 0.9795529778425279,
      "eval_f1": 0.7259988073941562,
      "eval_loss": 0.07811370491981506,
      "eval_precision": 0.7241276764472641,
      "eval_recall": 0.7278796333200478,
      "eval_runtime": 37.6797,
      "eval_samples_per_second": 79.618,
      "eval_steps_per_second": 4.989,
      "step": 15000
    },
    {
      "epoch": 0.43,
      "learning_rate": 2.565542966120709e-05,
      "loss": 0.0663,
      "step": 15500
    },
    {
      "epoch": 0.45,
      "learning_rate": 2.5515200807718197e-05,
      "loss": 0.0635,
      "step": 16000
    },
    {
      "epoch": 0.45,
      "eval_accuracy": 0.9805442089054043,
      "eval_f1": 0.7281001137656427,
      "eval_loss": 0.06664826720952988,
      "eval_precision": 0.7229152342598959,
      "eval_recall": 0.7333599043443603,
      "eval_runtime": 37.7966,
      "eval_samples_per_second": 79.372,
      "eval_steps_per_second": 4.974,
      "step": 16000
    },
    {
      "epoch": 0.46,
      "learning_rate": 2.53749719542293e-05,
      "loss": 0.0619,
      "step": 16500
    },
    {
      "epoch": 0.48,
      "learning_rate": 2.5235023558447387e-05,
      "loss": 0.0592,
      "step": 17000
    },
    {
      "epoch": 0.48,
      "eval_accuracy": 0.979691289153627,
      "eval_f1": 0.7246881057706644,
      "eval_loss": 0.0674288421869278,
      "eval_precision": 0.7229991074085094,
      "eval_recall": 0.7263850139497808,
      "eval_runtime": 36.2962,
      "eval_samples_per_second": 82.653,
      "eval_steps_per_second": 5.18,
      "step": 17000
    },
    {
      "epoch": 0.49,
      "learning_rate": 2.509479470495849e-05,
      "loss": 0.0616,
      "step": 17500
    },
    {
      "epoch": 0.5,
      "learning_rate": 2.49545658514696e-05,
      "loss": 0.062,
      "step": 18000
    },
    {
      "epoch": 0.5,
      "eval_accuracy": 0.9812219343297894,
      "eval_f1": 0.7340672360171793,
      "eval_loss": 0.06332722306251526,
      "eval_precision": 0.7274239311221994,
      "eval_recall": 0.7408330011956955,
      "eval_runtime": 38.753,
      "eval_samples_per_second": 77.413,
      "eval_steps_per_second": 4.851,
      "step": 18000
    },
    {
      "epoch": 0.52,
      "learning_rate": 2.4814336997980706e-05,
      "loss": 0.063,
      "step": 18500
    },
    {
      "epoch": 0.53,
      "learning_rate": 2.4674108144491813e-05,
      "loss": 0.0607,
      "step": 19000
    },
    {
      "epoch": 0.53,
      "eval_accuracy": 0.9811988824446063,
      "eval_f1": 0.7373217115689383,
      "eval_loss": 0.06261081993579865,
      "eval_precision": 0.732965734541158,
      "eval_recall": 0.7417297728178557,
      "eval_runtime": 36.3964,
      "eval_samples_per_second": 82.426,
      "eval_steps_per_second": 5.165,
      "step": 19000
    },
    {
      "epoch": 0.55,
      "learning_rate": 2.4533879291002917e-05,
      "loss": 0.0634,
      "step": 19500
    },
    {
      "epoch": 0.56,
      "learning_rate": 2.4393650437514025e-05,
      "loss": 0.0629,
      "step": 20000
    },
    {
      "epoch": 0.56,
      "eval_accuracy": 0.9799218080054587,
      "eval_f1": 0.7318235995232418,
      "eval_loss": 0.07822923362255096,
      "eval_precision": 0.7295049504950495,
      "eval_recall": 0.7341570346751694,
      "eval_runtime": 37.4868,
      "eval_samples_per_second": 80.028,
      "eval_steps_per_second": 5.015,
      "step": 20000
    },
    {
      "epoch": 0.57,
      "learning_rate": 2.425342158402513e-05,
      "loss": 0.0613,
      "step": 20500
    },
    {
      "epoch": 0.59,
      "learning_rate": 2.4113192730536237e-05,
      "loss": 0.0624,
      "step": 21000
    },
    {
      "epoch": 0.59,
      "eval_accuracy": 0.9803644042009756,
      "eval_f1": 0.7339413164155432,
      "eval_loss": 0.06663613021373749,
      "eval_precision": 0.7301775147928994,
      "eval_recall": 0.7377441211638103,
      "eval_runtime": 35.995,
      "eval_samples_per_second": 83.345,
      "eval_steps_per_second": 5.223,
      "step": 21000
    },
    {
      "epoch": 0.6,
      "learning_rate": 2.3972963877047344e-05,
      "loss": 0.0608,
      "step": 21500
    },
    {
      "epoch": 0.62,
      "learning_rate": 2.3833015481265426e-05,
      "loss": 0.0624,
      "step": 22000
    },
    {
      "epoch": 0.62,
      "eval_accuracy": 0.9802122617587666,
      "eval_f1": 0.7311229308545011,
      "eval_loss": 0.06742220371961594,
      "eval_precision": 0.7294911219125086,
      "eval_recall": 0.7327620565962535,
      "eval_runtime": 37.1663,
      "eval_samples_per_second": 80.718,
      "eval_steps_per_second": 5.058,
      "step": 22000
    },
    {
      "epoch": 0.63,
      "learning_rate": 2.3692786627776534e-05,
      "loss": 0.0593,
      "step": 22500
    },
    {
      "epoch": 0.65,
      "learning_rate": 2.3552557774287638e-05,
      "loss": 0.0593,
      "step": 23000
    },
    {
      "epoch": 0.65,
      "eval_accuracy": 0.9812634277231191,
      "eval_f1": 0.7430700447093891,
      "eval_loss": 0.06372907757759094,
      "eval_precision": 0.7409352090350704,
      "eval_recall": 0.7452172180151455,
      "eval_runtime": 37.7419,
      "eval_samples_per_second": 79.487,
      "eval_steps_per_second": 4.981,
      "step": 23000
    },
    {
      "epoch": 0.66,
      "learning_rate": 2.3412328920798745e-05,
      "loss": 0.0629,
      "step": 23500
    },
    {
      "epoch": 0.67,
      "learning_rate": 2.327210006730985e-05,
      "loss": 0.0605,
      "step": 24000
    },
    {
      "epoch": 0.67,
      "eval_accuracy": 0.9806087541839171,
      "eval_f1": 0.7302190657197158,
      "eval_loss": 0.06761059165000916,
      "eval_precision": 0.7330789315123519,
      "eval_recall": 0.7273814268632921,
      "eval_runtime": 37.6798,
      "eval_samples_per_second": 79.618,
      "eval_steps_per_second": 4.989,
      "step": 24000
    },
    {
      "epoch": 0.69,
      "learning_rate": 2.3131871213820957e-05,
      "loss": 0.0608,
      "step": 24500
    },
    {
      "epoch": 0.7,
      "learning_rate": 2.299164236033206e-05,
      "loss": 0.0577,
      "step": 25000
    },
    {
      "epoch": 0.7,
      "eval_accuracy": 0.9804105079713419,
      "eval_f1": 0.7315063052328468,
      "eval_loss": 0.07262897491455078,
      "eval_precision": 0.7289728873936275,
      "eval_recall": 0.7340573933838183,
      "eval_runtime": 36.2251,
      "eval_samples_per_second": 82.815,
      "eval_steps_per_second": 5.19,
      "step": 25000
    },
    {
      "epoch": 0.72,
      "learning_rate": 2.285141350684317e-05,
      "loss": 0.065,
      "step": 25500
    },
    {
      "epoch": 0.73,
      "learning_rate": 2.2711184653354273e-05,
      "loss": 0.0616,
      "step": 26000
    },
    {
      "epoch": 0.73,
      "eval_accuracy": 0.981291089985339,
      "eval_f1": 0.7420074349442379,
      "eval_loss": 0.06614366918802261,
      "eval_precision": 0.738238485057698,
      "eval_recall": 0.7458150657632523,
      "eval_runtime": 37.1932,
      "eval_samples_per_second": 80.66,
      "eval_steps_per_second": 5.055,
      "step": 26000
    },
    {
      "epoch": 0.74,
      "learning_rate": 2.257095579986538e-05,
      "loss": 0.0587,
      "step": 26500
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.2431007404083466e-05,
      "loss": 0.0598,
      "step": 27000
    },
    {
      "epoch": 0.76,
      "eval_accuracy": 0.9814386220505112,
      "eval_f1": 0.7464872353057589,
      "eval_loss": 0.06462829560041428,
      "eval_precision": 0.7413522012578616,
      "eval_recall": 0.7516939019529693,
      "eval_runtime": 37.4813,
      "eval_samples_per_second": 80.04,
      "eval_steps_per_second": 5.016,
      "step": 27000
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.229077855059457e-05,
      "loss": 0.0536,
      "step": 27500
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2150549697105678e-05,
      "loss": 0.0596,
      "step": 28000
    },
    {
      "epoch": 0.79,
      "eval_accuracy": 0.9802906381683895,
      "eval_f1": 0.735488974587165,
      "eval_loss": 0.06780258566141129,
      "eval_precision": 0.7299313052011777,
      "eval_recall": 0.7411319250697489,
      "eval_runtime": 37.4961,
      "eval_samples_per_second": 80.008,
      "eval_steps_per_second": 5.014,
      "step": 28000
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.201060130132376e-05,
      "loss": 0.0602,
      "step": 28500
    },
    {
      "epoch": 0.81,
      "learning_rate": 2.1870372447834867e-05,
      "loss": 0.0593,
      "step": 29000
    },
    {
      "epoch": 0.81,
      "eval_accuracy": 0.9815723229845736,
      "eval_f1": 0.7491701758731731,
      "eval_loss": 0.06298363208770752,
      "eval_precision": 0.7449995073406247,
      "eval_recall": 0.7533878039059386,
      "eval_runtime": 37.7907,
      "eval_samples_per_second": 79.385,
      "eval_steps_per_second": 4.975,
      "step": 29000
    },
    {
      "epoch": 0.83,
      "learning_rate": 2.173014359434597e-05,
      "loss": 0.0586,
      "step": 29500
    },
    {
      "epoch": 0.84,
      "learning_rate": 2.158991474085708e-05,
      "loss": 0.0619,
      "step": 30000
    },
    {
      "epoch": 0.84,
      "eval_accuracy": 0.9810697918875806,
      "eval_f1": 0.7425102020503633,
      "eval_loss": 0.06618673354387283,
      "eval_precision": 0.7416981507257904,
      "eval_recall": 0.7433240334794738,
      "eval_runtime": 37.549,
      "eval_samples_per_second": 79.896,
      "eval_steps_per_second": 5.007,
      "step": 30000
    },
    {
      "epoch": 0.86,
      "learning_rate": 2.1449685887368183e-05,
      "loss": 0.0595,
      "step": 30500
    },
    {
      "epoch": 0.87,
      "learning_rate": 2.130945703387929e-05,
      "loss": 0.0589,
      "step": 31000
    },
    {
      "epoch": 0.87,
      "eval_accuracy": 0.9798572627269458,
      "eval_f1": 0.7328214215396731,
      "eval_loss": 0.06754804402589798,
      "eval_precision": 0.724124513618677,
      "eval_recall": 0.7417297728178557,
      "eval_runtime": 37.8499,
      "eval_samples_per_second": 79.261,
      "eval_steps_per_second": 4.967,
      "step": 31000
    },
    {
      "epoch": 0.88,
      "learning_rate": 2.1169228180390395e-05,
      "loss": 0.0593,
      "step": 31500
    },
    {
      "epoch": 0.9,
      "learning_rate": 2.1028999326901502e-05,
      "loss": 0.0616,
      "step": 32000
    },
    {
      "epoch": 0.9,
      "eval_accuracy": 0.9811481682972033,
      "eval_f1": 0.752437998118905,
      "eval_loss": 0.06686053425073624,
      "eval_precision": 0.7476635514018691,
      "eval_recall": 0.7572738142686329,
      "eval_runtime": 37.608,
      "eval_samples_per_second": 79.77,
      "eval_steps_per_second": 4.999,
      "step": 32000
    },
    {
      "epoch": 0.91,
      "learning_rate": 2.088877047341261e-05,
      "loss": 0.0596,
      "step": 32500
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.0748541619923717e-05,
      "loss": 0.0599,
      "step": 33000
    },
    {
      "epoch": 0.93,
      "eval_accuracy": 0.9808623249209321,
      "eval_f1": 0.7464684014869889,
      "eval_loss": 0.0668148472905159,
      "eval_precision": 0.7426767925830949,
      "eval_recall": 0.7502989238740534,
      "eval_runtime": 37.7142,
      "eval_samples_per_second": 79.546,
      "eval_steps_per_second": 4.985,
      "step": 33000
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.06085932241418e-05,
      "loss": 0.0611,
      "step": 33500
    },
    {
      "epoch": 0.95,
      "learning_rate": 2.0468364370652904e-05,
      "loss": 0.0578,
      "step": 34000
    },
    {
      "epoch": 0.95,
      "eval_accuracy": 0.9800970023328508,
      "eval_f1": 0.7286303792493615,
      "eval_loss": 0.07239069789648056,
      "eval_precision": 0.7186046511627907,
      "eval_recall": 0.738939816660024,
      "eval_runtime": 36.2678,
      "eval_samples_per_second": 82.718,
      "eval_steps_per_second": 5.184,
      "step": 34000
    },
    {
      "epoch": 0.97,
      "learning_rate": 2.032841597487099e-05,
      "loss": 0.0591,
      "step": 34500
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.0188187121382093e-05,
      "loss": 0.0552,
      "step": 35000
    },
    {
      "epoch": 0.98,
      "eval_accuracy": 0.9813971286571815,
      "eval_f1": 0.7495317890586495,
      "eval_loss": 0.06262348592281342,
      "eval_precision": 0.7415642676028866,
      "eval_recall": 0.7576723794340374,
      "eval_runtime": 37.8404,
      "eval_samples_per_second": 79.28,
      "eval_steps_per_second": 4.968,
      "step": 35000
    },
    {
      "epoch": 1.0,
      "learning_rate": 2.0047958267893204e-05,
      "loss": 0.0552,
      "step": 35500
    },
    {
      "epoch": 1.01,
      "learning_rate": 1.990772941440431e-05,
      "loss": 0.0533,
      "step": 36000
    },
    {
      "epoch": 1.01,
      "eval_accuracy": 0.981254206969046,
      "eval_f1": 0.7463703703703705,
      "eval_loss": 0.06460578739643097,
      "eval_precision": 0.7398668494223615,
      "eval_recall": 0.752989238740534,
      "eval_runtime": 37.9225,
      "eval_samples_per_second": 79.109,
      "eval_steps_per_second": 4.957,
      "step": 36000
    },
    {
      "epoch": 1.02,
      "learning_rate": 1.9767500560915416e-05,
      "loss": 0.0502,
      "step": 36500
    },
    {
      "epoch": 1.04,
      "learning_rate": 1.962727170742652e-05,
      "loss": 0.0495,
      "step": 37000
    },
    {
      "epoch": 1.04,
      "eval_accuracy": 0.9808484937898221,
      "eval_f1": 0.7483538789048964,
      "eval_loss": 0.0672934502363205,
      "eval_precision": 0.7436780478205255,
      "eval_recall": 0.7530888800318852,
      "eval_runtime": 37.432,
      "eval_samples_per_second": 80.145,
      "eval_steps_per_second": 5.022,
      "step": 37000
    },
    {
      "epoch": 1.05,
      "learning_rate": 1.9487042853937628e-05,
      "loss": 0.051,
      "step": 37500
    },
    {
      "epoch": 1.07,
      "learning_rate": 1.9346814000448735e-05,
      "loss": 0.0545,
      "step": 38000
    },
    {
      "epoch": 1.07,
      "eval_accuracy": 0.9808992079372251,
      "eval_f1": 0.7423830921929782,
      "eval_loss": 0.06774791330099106,
      "eval_precision": 0.7358786098874205,
      "eval_recall": 0.7490035870864886,
      "eval_runtime": 36.4586,
      "eval_samples_per_second": 82.285,
      "eval_steps_per_second": 5.157,
      "step": 38000
    },
    {
      "epoch": 1.08,
      "learning_rate": 1.9206865604666817e-05,
      "loss": 0.0517,
      "step": 38500
    },
    {
      "epoch": 1.09,
      "learning_rate": 1.9066636751177925e-05,
      "loss": 0.0506,
      "step": 39000
    },
    {
      "epoch": 1.09,
      "eval_accuracy": 0.9809821947238845,
      "eval_f1": 0.7475723369645586,
      "eval_loss": 0.0674295574426651,
      "eval_precision": 0.7397327090039996,
      "eval_recall": 0.7555799123156636,
      "eval_runtime": 37.4832,
      "eval_samples_per_second": 80.036,
      "eval_steps_per_second": 5.016,
      "step": 39000
    },
    {
      "epoch": 1.11,
      "learning_rate": 1.892640789768903e-05,
      "loss": 0.0513,
      "step": 39500
    },
    {
      "epoch": 1.12,
      "learning_rate": 1.8786179044200137e-05,
      "loss": 0.0505,
      "step": 40000
    },
    {
      "epoch": 1.12,
      "eval_accuracy": 0.9814017390342182,
      "eval_f1": 0.7522636188214338,
      "eval_loss": 0.06595376133918762,
      "eval_precision": 0.7471253071253071,
      "eval_recall": 0.7574730968513352,
      "eval_runtime": 37.3722,
      "eval_samples_per_second": 80.274,
      "eval_steps_per_second": 5.03,
      "step": 40000
    },
    {
      "epoch": 1.14,
      "learning_rate": 1.864595019071124e-05,
      "loss": 0.0497,
      "step": 40500
    },
    {
      "epoch": 1.15,
      "learning_rate": 1.8505721337222348e-05,
      "loss": 0.0563,
      "step": 41000
    },
    {
      "epoch": 1.15,
      "eval_accuracy": 0.9808945975601885,
      "eval_f1": 0.7516394655095903,
      "eval_loss": 0.06491059809923172,
      "eval_precision": 0.7439726695949244,
      "eval_recall": 0.7594659226783579,
      "eval_runtime": 38.0002,
      "eval_samples_per_second": 78.947,
      "eval_steps_per_second": 4.947,
      "step": 41000
    },
    {
      "epoch": 1.16,
      "learning_rate": 1.836577294144043e-05,
      "loss": 0.0523,
      "step": 41500
    },
    {
      "epoch": 1.18,
      "learning_rate": 1.8225544087951538e-05,
      "loss": 0.0502,
      "step": 42000
    },
    {
      "epoch": 1.18,
      "eval_accuracy": 0.9805949230528073,
      "eval_f1": 0.7549393414211438,
      "eval_loss": 0.07190626114606857,
      "eval_precision": 0.7503691308199626,
      "eval_recall": 0.7595655639697091,
      "eval_runtime": 37.6782,
      "eval_samples_per_second": 79.622,
      "eval_steps_per_second": 4.99,
      "step": 42000
    },
    {
      "epoch": 1.19,
      "learning_rate": 1.8085315234462645e-05,
      "loss": 0.051,
      "step": 42500
    },
    {
      "epoch": 1.21,
      "learning_rate": 1.794508638097375e-05,
      "loss": 0.0491,
      "step": 43000
    },
    {
      "epoch": 1.21,
      "eval_accuracy": 0.9808254419046389,
      "eval_f1": 0.7479091995221027,
      "eval_loss": 0.06869912892580032,
      "eval_precision": 0.7473139673696777,
      "eval_recall": 0.7485053806297329,
      "eval_runtime": 37.2482,
      "eval_samples_per_second": 80.541,
      "eval_steps_per_second": 5.047,
      "step": 43000
    },
    {
      "epoch": 1.22,
      "learning_rate": 1.7805137985191835e-05,
      "loss": 0.0497,
      "step": 43500
    },
    {
      "epoch": 1.23,
      "learning_rate": 1.766490913170294e-05,
      "loss": 0.051,
      "step": 44000
    },
    {
      "epoch": 1.23,
      "eval_accuracy": 0.9811850513134964,
      "eval_f1": 0.7476012925677354,
      "eval_loss": 0.0647246241569519,
      "eval_precision": 0.7460065482686774,
      "eval_recall": 0.7492028696691909,
      "eval_runtime": 37.6178,
      "eval_samples_per_second": 79.749,
      "eval_steps_per_second": 4.998,
      "step": 44000
    },
    {
      "epoch": 1.25,
      "learning_rate": 1.7524960735921025e-05,
      "loss": 0.0517,
      "step": 44500
    },
    {
      "epoch": 1.26,
      "learning_rate": 1.738473188243213e-05,
      "loss": 0.0495,
      "step": 45000
    },
    {
      "epoch": 1.26,
      "eval_accuracy": 0.9815031673290242,
      "eval_f1": 0.7493440269320264,
      "eval_loss": 0.06404220312833786,
      "eval_precision": 0.7446620092492374,
      "eval_recall": 0.7540852929453966,
      "eval_runtime": 37.4983,
      "eval_samples_per_second": 80.004,
      "eval_steps_per_second": 5.014,
      "step": 45000
    },
    {
      "epoch": 1.28,
      "learning_rate": 1.7244503028943237e-05,
      "loss": 0.052,
      "step": 45500
    },
    {
      "epoch": 1.29,
      "learning_rate": 1.710427417545434e-05,
      "loss": 0.0507,
      "step": 46000
    },
    {
      "epoch": 1.29,
      "eval_accuracy": 0.9804289494794884,
      "eval_f1": 0.7446007529225283,
      "eval_loss": 0.06634628772735596,
      "eval_precision": 0.7403467297084318,
      "eval_recall": 0.7489039457951375,
      "eval_runtime": 37.6634,
      "eval_samples_per_second": 79.653,
      "eval_steps_per_second": 4.992,
      "step": 46000
    },
    {
      "epoch": 1.3,
      "learning_rate": 1.6964045321965448e-05,
      "loss": 0.048,
      "step": 46500
    },
    {
      "epoch": 1.32,
      "learning_rate": 1.6823816468476552e-05,
      "loss": 0.0496,
      "step": 47000
    },
    {
      "epoch": 1.32,
      "eval_accuracy": 0.9806825202165033,
      "eval_f1": 0.7495407833986993,
      "eval_loss": 0.07511032372713089,
      "eval_precision": 0.7469080835064806,
      "eval_recall": 0.752192108409725,
      "eval_runtime": 37.4863,
      "eval_samples_per_second": 80.029,
      "eval_steps_per_second": 5.015,
      "step": 47000
    },
    {
      "epoch": 1.33,
      "learning_rate": 1.6683868072694638e-05,
      "loss": 0.0479,
      "step": 47500
    },
    {
      "epoch": 1.35,
      "learning_rate": 1.6543639219205746e-05,
      "loss": 0.0482,
      "step": 48000
    },
    {
      "epoch": 1.35,
      "eval_accuracy": 0.9812311550838627,
      "eval_f1": 0.7515115472296561,
      "eval_loss": 0.06654708087444305,
      "eval_precision": 0.7475843028988365,
      "eval_recall": 0.7554802710243125,
      "eval_runtime": 37.3402,
      "eval_samples_per_second": 80.342,
      "eval_steps_per_second": 5.035,
      "step": 48000
    },
    {
      "epoch": 1.36,
      "learning_rate": 1.6403690823423828e-05,
      "loss": 0.0496,
      "step": 48500
    },
    {
      "epoch": 1.37,
      "learning_rate": 1.6263461969934935e-05,
      "loss": 0.0499,
      "step": 49000
    },
    {
      "epoch": 1.37,
      "eval_accuracy": 0.9817290758038192,
      "eval_f1": 0.7567942181080144,
      "eval_loss": 0.06324990093708038,
      "eval_precision": 0.7519921298573536,
      "eval_recall": 0.7616580310880829,
      "eval_runtime": 37.4694,
      "eval_samples_per_second": 80.065,
      "eval_steps_per_second": 5.017,
      "step": 49000
    },
    {
      "epoch": 1.39,
      "learning_rate": 1.612323311644604e-05,
      "loss": 0.0487,
      "step": 49500
    },
    {
      "epoch": 1.4,
      "learning_rate": 1.5983004262957147e-05,
      "loss": 0.0492,
      "step": 50000
    },
    {
      "epoch": 1.4,
      "eval_accuracy": 0.9811158956579469,
      "eval_f1": 0.752822961747003,
      "eval_loss": 0.07030627131462097,
      "eval_precision": 0.7516638521903248,
      "eval_recall": 0.7539856516540454,
      "eval_runtime": 37.5303,
      "eval_samples_per_second": 79.935,
      "eval_steps_per_second": 5.009,
      "step": 50000
    },
    {
      "epoch": 1.42,
      "learning_rate": 1.584305586717523e-05,
      "loss": 0.0503,
      "step": 50500
    },
    {
      "epoch": 1.43,
      "learning_rate": 1.5702827013686337e-05,
      "loss": 0.0496,
      "step": 51000
    },
    {
      "epoch": 1.43,
      "eval_accuracy": 0.981719855049746,
      "eval_f1": 0.7585012126911844,
      "eval_loss": 0.06571871042251587,
      "eval_precision": 0.7536146355857185,
      "eval_recall": 0.7634515743324033,
      "eval_runtime": 37.9295,
      "eval_samples_per_second": 79.094,
      "eval_steps_per_second": 4.957,
      "step": 51000
    },
    {
      "epoch": 1.44,
      "learning_rate": 1.556259816019744e-05,
      "loss": 0.0477,
      "step": 51500
    },
    {
      "epoch": 1.46,
      "learning_rate": 1.542236930670855e-05,
      "loss": 0.0499,
      "step": 52000
    },
    {
      "epoch": 1.46,
      "eval_accuracy": 0.9822085550156292,
      "eval_f1": 0.7642292490118576,
      "eval_loss": 0.061449870467185974,
      "eval_precision": 0.757938063504508,
      "eval_recall": 0.7706257473096851,
      "eval_runtime": 37.5922,
      "eval_samples_per_second": 79.804,
      "eval_steps_per_second": 5.001,
      "step": 52000
    },
    {
      "epoch": 1.47,
      "learning_rate": 1.5282140453219652e-05,
      "loss": 0.0475,
      "step": 52500
    },
    {
      "epoch": 1.49,
      "learning_rate": 1.514191159973076e-05,
      "loss": 0.0475,
      "step": 53000
    },
    {
      "epoch": 1.49,
      "eval_accuracy": 0.9815538814764272,
      "eval_f1": 0.7547375191727277,
      "eval_loss": 0.06496689468622208,
      "eval_precision": 0.7495823095823095,
      "eval_recall": 0.7599641291351136,
      "eval_runtime": 37.7023,
      "eval_samples_per_second": 79.571,
      "eval_steps_per_second": 4.986,
      "step": 53000
    },
    {
      "epoch": 1.5,
      "learning_rate": 1.5001682746241866e-05,
      "loss": 0.0515,
      "step": 53500
    },
    {
      "epoch": 1.51,
      "learning_rate": 1.4861453892752973e-05,
      "loss": 0.048,
      "step": 54000
    },
    {
      "epoch": 1.51,
      "eval_accuracy": 0.9812219343297894,
      "eval_f1": 0.7529961708687652,
      "eval_loss": 0.06513578444719315,
      "eval_precision": 0.7516132234686786,
      "eval_recall": 0.75438421681945,
      "eval_runtime": 37.4039,
      "eval_samples_per_second": 80.205,
      "eval_steps_per_second": 5.026,
      "step": 54000
    },
    {
      "epoch": 1.53,
      "learning_rate": 1.4721225039264079e-05,
      "loss": 0.0471,
      "step": 54500
    },
    {
      "epoch": 1.54,
      "learning_rate": 1.4580996185775185e-05,
      "loss": 0.0487,
      "step": 55000
    },
    {
      "epoch": 1.54,
      "eval_accuracy": 0.9822085550156292,
      "eval_f1": 0.7677227722772277,
      "eval_loss": 0.061350539326667786,
      "eval_precision": 0.7628886265249901,
      "eval_recall": 0.7726185731367079,
      "eval_runtime": 37.2631,
      "eval_samples_per_second": 80.509,
      "eval_steps_per_second": 5.045,
      "step": 55000
    },
    {
      "epoch": 1.56,
      "learning_rate": 1.444076733228629e-05,
      "loss": 0.0496,
      "step": 55500
    },
    {
      "epoch": 1.57,
      "learning_rate": 1.4300538478797398e-05,
      "loss": 0.0491,
      "step": 56000
    },
    {
      "epoch": 1.57,
      "eval_accuracy": 0.9823653078348747,
      "eval_f1": 0.7622540516429598,
      "eval_loss": 0.06025264039635658,
      "eval_precision": 0.7583078591854847,
      "eval_recall": 0.7662415304902351,
      "eval_runtime": 36.0146,
      "eval_samples_per_second": 83.299,
      "eval_steps_per_second": 5.22,
      "step": 56000
    }
  ],
  "max_steps": 106968,
  "num_train_epochs": 3,
  "total_flos": 3.1285620016887974e+17,
  "trial_name": null,
  "trial_params": null
}