bde-cner-batteryonlybert-uncased-base / trainer_state.json

update

b9a11b7 almost 2 years ago

No virus

22.5 kB

	{
	"best_metric": null,
	"best_model_checkpoint": null,
	"epoch": 19.0,
	"global_step": 61693,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.15,
	"learning_rate": 2.9769017554665847e-05,
	"loss": 0.0666,
	"step": 500
	},
	{
	"epoch": 0.31,
	"learning_rate": 2.953803510933169e-05,
	"loss": 0.0447,
	"step": 1000
	},
	{
	"epoch": 0.46,
	"learning_rate": 2.9307052663997538e-05,
	"loss": 0.0411,
	"step": 1500
	},
	{
	"epoch": 0.62,
	"learning_rate": 2.9076070218663384e-05,
	"loss": 0.038,
	"step": 2000
	},
	{
	"epoch": 0.77,
	"learning_rate": 2.8845087773329226e-05,
	"loss": 0.0346,
	"step": 2500
	},
	{
	"epoch": 0.92,
	"learning_rate": 2.8614105327995072e-05,
	"loss": 0.0332,
	"step": 3000
	},
	{
	"epoch": 1.0,
	"eval_accuracy": 0.9877246731440231,
	"eval_f1": 0.889670288672294,
	"eval_loss": 0.03370480611920357,
	"eval_precision": 0.8513566583363085,
	"eval_recall": 0.9315948823127258,
	"eval_runtime": 50.7022,
	"eval_samples_per_second": 438.443,
	"eval_steps_per_second": 13.708,
	"step": 3247
	},
	{
	"epoch": 1.08,
	"learning_rate": 2.8383122882660918e-05,
	"loss": 0.0291,
	"step": 3500
	},
	{
	"epoch": 1.23,
	"learning_rate": 2.8152140437326767e-05,
	"loss": 0.0226,
	"step": 4000
	},
	{
	"epoch": 1.39,
	"learning_rate": 2.792115799199261e-05,
	"loss": 0.023,
	"step": 4500
	},
	{
	"epoch": 1.54,
	"learning_rate": 2.7690175546658455e-05,
	"loss": 0.0235,
	"step": 5000
	},
	{
	"epoch": 1.69,
	"learning_rate": 2.74591931013243e-05,
	"loss": 0.023,
	"step": 5500
	},
	{
	"epoch": 1.85,
	"learning_rate": 2.7228210655990143e-05,
	"loss": 0.0218,
	"step": 6000
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.9908514749994501,
	"eval_f1": 0.9142371280113368,
	"eval_loss": 0.0262825395911932,
	"eval_precision": 0.8852986917939805,
	"eval_recall": 0.9451313604844223,
	"eval_runtime": 50.2363,
	"eval_samples_per_second": 442.508,
	"eval_steps_per_second": 13.835,
	"step": 6494
	},
	{
	"epoch": 2.0,
	"learning_rate": 2.6997228210655992e-05,
	"loss": 0.0228,
	"step": 6500
	},
	{
	"epoch": 2.16,
	"learning_rate": 2.6766245765321838e-05,
	"loss": 0.014,
	"step": 7000
	},
	{
	"epoch": 2.31,
	"learning_rate": 2.653526331998768e-05,
	"loss": 0.0143,
	"step": 7500
	},
	{
	"epoch": 2.46,
	"learning_rate": 2.6304280874653526e-05,
	"loss": 0.0158,
	"step": 8000
	},
	{
	"epoch": 2.62,
	"learning_rate": 2.6073298429319372e-05,
	"loss": 0.015,
	"step": 8500
	},
	{
	"epoch": 2.77,
	"learning_rate": 2.5842315983985218e-05,
	"loss": 0.0142,
	"step": 9000
	},
	{
	"epoch": 2.93,
	"learning_rate": 2.5611333538651064e-05,
	"loss": 0.0147,
	"step": 9500
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.9930254150662127,
	"eval_f1": 0.9280089446645269,
	"eval_loss": 0.024331996217370033,
	"eval_precision": 0.9160101990333752,
	"eval_recall": 0.9403262037308331,
	"eval_runtime": 50.2727,
	"eval_samples_per_second": 442.188,
	"eval_steps_per_second": 13.825,
	"step": 9741
	},
	{
	"epoch": 3.08,
	"learning_rate": 2.538035109331691e-05,
	"loss": 0.0122,
	"step": 10000
	},
	{
	"epoch": 3.23,
	"learning_rate": 2.5149368647982755e-05,
	"loss": 0.0103,
	"step": 10500
	},
	{
	"epoch": 3.39,
	"learning_rate": 2.4918386202648598e-05,
	"loss": 0.0095,
	"step": 11000
	},
	{
	"epoch": 3.54,
	"learning_rate": 2.4687403757314447e-05,
	"loss": 0.0111,
	"step": 11500
	},
	{
	"epoch": 3.7,
	"learning_rate": 2.4456421311980292e-05,
	"loss": 0.0099,
	"step": 12000
	},
	{
	"epoch": 3.85,
	"learning_rate": 2.4225438866646135e-05,
	"loss": 0.0097,
	"step": 12500
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.9936326074754469,
	"eval_f1": 0.9362323294406885,
	"eval_loss": 0.027174057438969612,
	"eval_precision": 0.920862222054295,
	"eval_recall": 0.9521242308819221,
	"eval_runtime": 50.3309,
	"eval_samples_per_second": 441.677,
	"eval_steps_per_second": 13.809,
	"step": 12988
	},
	{
	"epoch": 4.0,
	"learning_rate": 2.399445642131198e-05,
	"loss": 0.0102,
	"step": 13000
	},
	{
	"epoch": 4.16,
	"learning_rate": 2.3763473975977826e-05,
	"loss": 0.0076,
	"step": 13500
	},
	{
	"epoch": 4.31,
	"learning_rate": 2.3532491530643672e-05,
	"loss": 0.007,
	"step": 14000
	},
	{
	"epoch": 4.47,
	"learning_rate": 2.3301509085309518e-05,
	"loss": 0.007,
	"step": 14500
	},
	{
	"epoch": 4.62,
	"learning_rate": 2.3070526639975364e-05,
	"loss": 0.0082,
	"step": 15000
	},
	{
	"epoch": 4.77,
	"learning_rate": 2.2839544194641206e-05,
	"loss": 0.0079,
	"step": 15500
	},
	{
	"epoch": 4.93,
	"learning_rate": 2.2608561749307052e-05,
	"loss": 0.0077,
	"step": 16000
	},
	{
	"epoch": 5.0,
	"eval_accuracy": 0.9943201214002335,
	"eval_f1": 0.9403489135049596,
	"eval_loss": 0.023451806977391243,
	"eval_precision": 0.929177551915486,
	"eval_recall": 0.9517921672038285,
	"eval_runtime": 50.2007,
	"eval_samples_per_second": 442.822,
	"eval_steps_per_second": 13.844,
	"step": 16235
	},
	{
	"epoch": 5.08,
	"learning_rate": 2.2377579303972898e-05,
	"loss": 0.0064,
	"step": 16500
	},
	{
	"epoch": 5.24,
	"learning_rate": 2.2146596858638743e-05,
	"loss": 0.0052,
	"step": 17000
	},
	{
	"epoch": 5.39,
	"learning_rate": 2.191561441330459e-05,
	"loss": 0.0055,
	"step": 17500
	},
	{
	"epoch": 5.54,
	"learning_rate": 2.1684631967970435e-05,
	"loss": 0.0061,
	"step": 18000
	},
	{
	"epoch": 5.7,
	"learning_rate": 2.145364952263628e-05,
	"loss": 0.0056,
	"step": 18500
	},
	{
	"epoch": 5.85,
	"learning_rate": 2.1222667077302123e-05,
	"loss": 0.0054,
	"step": 19000
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.994450643863006,
	"eval_f1": 0.9450084195333173,
	"eval_loss": 0.0263934638351202,
	"eval_precision": 0.9312535558505595,
	"eval_recall": 0.9591757007520265,
	"eval_runtime": 50.2902,
	"eval_samples_per_second": 442.035,
	"eval_steps_per_second": 13.82,
	"step": 19482
	},
	{
	"epoch": 6.01,
	"learning_rate": 2.0991684631967972e-05,
	"loss": 0.0062,
	"step": 19500
	},
	{
	"epoch": 6.16,
	"learning_rate": 2.0760702186633818e-05,
	"loss": 0.0033,
	"step": 20000
	},
	{
	"epoch": 6.31,
	"learning_rate": 2.052971974129966e-05,
	"loss": 0.0042,
	"step": 20500
	},
	{
	"epoch": 6.47,
	"learning_rate": 2.0298737295965506e-05,
	"loss": 0.0042,
	"step": 21000
	},
	{
	"epoch": 6.62,
	"learning_rate": 2.0067754850631352e-05,
	"loss": 0.0045,
	"step": 21500
	},
	{
	"epoch": 6.78,
	"learning_rate": 1.9836772405297198e-05,
	"loss": 0.0039,
	"step": 22000
	},
	{
	"epoch": 6.93,
	"learning_rate": 1.9605789959963044e-05,
	"loss": 0.0043,
	"step": 22500
	},
	{
	"epoch": 7.0,
	"eval_accuracy": 0.9948756785494699,
	"eval_f1": 0.9503865101154663,
	"eval_loss": 0.026261983439326286,
	"eval_precision": 0.9473980473223471,
	"eval_recall": 0.9533938861216916,
	"eval_runtime": 50.3703,
	"eval_samples_per_second": 441.332,
	"eval_steps_per_second": 13.798,
	"step": 22729
	},
	{
	"epoch": 7.08,
	"learning_rate": 1.937480751462889e-05,
	"loss": 0.004,
	"step": 23000
	},
	{
	"epoch": 7.24,
	"learning_rate": 1.914382506929473e-05,
	"loss": 0.0029,
	"step": 23500
	},
	{
	"epoch": 7.39,
	"learning_rate": 1.8912842623960577e-05,
	"loss": 0.0031,
	"step": 24000
	},
	{
	"epoch": 7.55,
	"learning_rate": 1.8681860178626427e-05,
	"loss": 0.0034,
	"step": 24500
	},
	{
	"epoch": 7.7,
	"learning_rate": 1.8450877733292272e-05,
	"loss": 0.0037,
	"step": 25000
	},
	{
	"epoch": 7.85,
	"learning_rate": 1.8219895287958115e-05,
	"loss": 0.0036,
	"step": 25500
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.994658141111516,
	"eval_f1": 0.9494068997650896,
	"eval_loss": 0.02981843240559101,
	"eval_precision": 0.943654361962835,
	"eval_recall": 0.9552300029299736,
	"eval_runtime": 50.1982,
	"eval_samples_per_second": 442.845,
	"eval_steps_per_second": 13.845,
	"step": 25976
	},
	{
	"epoch": 8.01,
	"learning_rate": 1.798891284262396e-05,
	"loss": 0.0036,
	"step": 26000
	},
	{
	"epoch": 8.16,
	"learning_rate": 1.7757930397289806e-05,
	"loss": 0.0027,
	"step": 26500
	},
	{
	"epoch": 8.32,
	"learning_rate": 1.7526947951955652e-05,
	"loss": 0.0026,
	"step": 27000
	},
	{
	"epoch": 8.47,
	"learning_rate": 1.7295965506621498e-05,
	"loss": 0.0029,
	"step": 27500
	},
	{
	"epoch": 8.62,
	"learning_rate": 1.7064983061287344e-05,
	"loss": 0.0028,
	"step": 28000
	},
	{
	"epoch": 8.78,
	"learning_rate": 1.6834000615953186e-05,
	"loss": 0.0029,
	"step": 28500
	},
	{
	"epoch": 8.93,
	"learning_rate": 1.6603018170619032e-05,
	"loss": 0.0027,
	"step": 29000
	},
	{
	"epoch": 9.0,
	"eval_accuracy": 0.9942837854765313,
	"eval_f1": 0.9483075157773954,
	"eval_loss": 0.03117133490741253,
	"eval_precision": 0.9288564203427929,
	"eval_recall": 0.9685906826838558,
	"eval_runtime": 50.2531,
	"eval_samples_per_second": 442.361,
	"eval_steps_per_second": 13.83,
	"step": 29223
	},
	{
	"epoch": 9.09,
	"learning_rate": 1.637203572528488e-05,
	"loss": 0.0028,
	"step": 29500
	},
	{
	"epoch": 9.24,
	"learning_rate": 1.6141053279950723e-05,
	"loss": 0.0019,
	"step": 30000
	},
	{
	"epoch": 9.39,
	"learning_rate": 1.591007083461657e-05,
	"loss": 0.0022,
	"step": 30500
	},
	{
	"epoch": 9.55,
	"learning_rate": 1.5679088389282415e-05,
	"loss": 0.0024,
	"step": 31000
	},
	{
	"epoch": 9.7,
	"learning_rate": 1.544810594394826e-05,
	"loss": 0.0024,
	"step": 31500
	},
	{
	"epoch": 9.86,
	"learning_rate": 1.5217123498614105e-05,
	"loss": 0.0023,
	"step": 32000
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.9948642040472482,
	"eval_f1": 0.9512794425354655,
	"eval_loss": 0.036810312420129776,
	"eval_precision": 0.935158800551037,
	"eval_recall": 0.9679656216427386,
	"eval_runtime": 50.4106,
	"eval_samples_per_second": 440.978,
	"eval_steps_per_second": 13.787,
	"step": 32470
	},
	{
	"epoch": 10.01,
	"learning_rate": 1.4986141053279952e-05,
	"loss": 0.0024,
	"step": 32500
	},
	{
	"epoch": 10.16,
	"learning_rate": 1.4755158607945796e-05,
	"loss": 0.0018,
	"step": 33000
	},
	{
	"epoch": 10.32,
	"learning_rate": 1.4524176162611642e-05,
	"loss": 0.0018,
	"step": 33500
	},
	{
	"epoch": 10.47,
	"learning_rate": 1.4293193717277488e-05,
	"loss": 0.002,
	"step": 34000
	},
	{
	"epoch": 10.63,
	"learning_rate": 1.4062211271943332e-05,
	"loss": 0.0024,
	"step": 34500
	},
	{
	"epoch": 10.78,
	"learning_rate": 1.383122882660918e-05,
	"loss": 0.002,
	"step": 35000
	},
	{
	"epoch": 10.93,
	"learning_rate": 1.3600246381275023e-05,
	"loss": 0.0019,
	"step": 35500
	},
	{
	"epoch": 11.0,
	"eval_accuracy": 0.9952223041374186,
	"eval_f1": 0.9571868114802629,
	"eval_loss": 0.034278471022844315,
	"eval_precision": 0.9512868001697727,
	"eval_recall": 0.9631604648891493,
	"eval_runtime": 50.1571,
	"eval_samples_per_second": 443.208,
	"eval_steps_per_second": 13.856,
	"step": 35717
	},
	{
	"epoch": 11.09,
	"learning_rate": 1.3369263935940867e-05,
	"loss": 0.0018,
	"step": 36000
	},
	{
	"epoch": 11.24,
	"learning_rate": 1.3138281490606715e-05,
	"loss": 0.0014,
	"step": 36500
	},
	{
	"epoch": 11.4,
	"learning_rate": 1.2907299045272559e-05,
	"loss": 0.0016,
	"step": 37000
	},
	{
	"epoch": 11.55,
	"learning_rate": 1.2676316599938406e-05,
	"loss": 0.0016,
	"step": 37500
	},
	{
	"epoch": 11.7,
	"learning_rate": 1.244533415460425e-05,
	"loss": 0.0014,
	"step": 38000
	},
	{
	"epoch": 11.86,
	"learning_rate": 1.2214351709270095e-05,
	"loss": 0.0018,
	"step": 38500
	},
	{
	"epoch": 12.0,
	"eval_accuracy": 0.9950344091635375,
	"eval_f1": 0.9542591914950985,
	"eval_loss": 0.03573078662157059,
	"eval_precision": 0.941064747108317,
	"eval_recall": 0.9678288895399941,
	"eval_runtime": 50.2611,
	"eval_samples_per_second": 442.291,
	"eval_steps_per_second": 13.828,
	"step": 38964
	},
	{
	"epoch": 12.01,
	"learning_rate": 1.1983369263935942e-05,
	"loss": 0.0015,
	"step": 39000
	},
	{
	"epoch": 12.17,
	"learning_rate": 1.1752386818601786e-05,
	"loss": 0.0014,
	"step": 39500
	},
	{
	"epoch": 12.32,
	"learning_rate": 1.1521404373267632e-05,
	"loss": 0.0016,
	"step": 40000
	},
	{
	"epoch": 12.47,
	"learning_rate": 1.1290421927933478e-05,
	"loss": 0.0017,
	"step": 40500
	},
	{
	"epoch": 12.63,
	"learning_rate": 1.1059439482599322e-05,
	"loss": 0.0011,
	"step": 41000
	},
	{
	"epoch": 12.78,
	"learning_rate": 1.082845703726517e-05,
	"loss": 0.0014,
	"step": 41500
	},
	{
	"epoch": 12.94,
	"learning_rate": 1.0597474591931013e-05,
	"loss": 0.0014,
	"step": 42000
	},
	{
	"epoch": 13.0,
	"eval_accuracy": 0.9954953016694444,
	"eval_f1": 0.9582205552548141,
	"eval_loss": 0.034824222326278687,
	"eval_precision": 0.9485197022180545,
	"eval_recall": 0.9681218869030179,
	"eval_runtime": 50.5254,
	"eval_samples_per_second": 439.977,
	"eval_steps_per_second": 13.755,
	"step": 42211
	},
	{
	"epoch": 13.09,
	"learning_rate": 1.0366492146596857e-05,
	"loss": 0.0013,
	"step": 42500
	},
	{
	"epoch": 13.24,
	"learning_rate": 1.0135509701262705e-05,
	"loss": 0.001,
	"step": 43000
	},
	{
	"epoch": 13.4,
	"learning_rate": 9.904527255928549e-06,
	"loss": 0.0011,
	"step": 43500
	},
	{
	"epoch": 13.55,
	"learning_rate": 9.673544810594396e-06,
	"loss": 0.0012,
	"step": 44000
	},
	{
	"epoch": 13.7,
	"learning_rate": 9.44256236526024e-06,
	"loss": 0.0013,
	"step": 44500
	},
	{
	"epoch": 13.86,
	"learning_rate": 9.211579919926085e-06,
	"loss": 0.0012,
	"step": 45000
	},
	{
	"epoch": 14.0,
	"eval_accuracy": 0.99525290281001,
	"eval_f1": 0.9559630182389084,
	"eval_loss": 0.03898163139820099,
	"eval_precision": 0.9486449577811544,
	"eval_recall": 0.9633948627795683,
	"eval_runtime": 50.2226,
	"eval_samples_per_second": 442.629,
	"eval_steps_per_second": 13.838,
	"step": 45458
	},
	{
	"epoch": 14.01,
	"learning_rate": 8.980597474591932e-06,
	"loss": 0.0012,
	"step": 45500
	},
	{
	"epoch": 14.17,
	"learning_rate": 8.749615029257776e-06,
	"loss": 0.0007,
	"step": 46000
	},
	{
	"epoch": 14.32,
	"learning_rate": 8.518632583923622e-06,
	"loss": 0.0009,
	"step": 46500
	},
	{
	"epoch": 14.47,
	"learning_rate": 8.287650138589468e-06,
	"loss": 0.0013,
	"step": 47000
	},
	{
	"epoch": 14.63,
	"learning_rate": 8.056667693255312e-06,
	"loss": 0.0012,
	"step": 47500
	},
	{
	"epoch": 14.78,
	"learning_rate": 7.82568524792116e-06,
	"loss": 0.001,
	"step": 48000
	},
	{
	"epoch": 14.94,
	"learning_rate": 7.594702802587003e-06,
	"loss": 0.001,
	"step": 48500
	},
	{
	"epoch": 15.0,
	"eval_accuracy": 0.9952519466014915,
	"eval_f1": 0.9577630980820753,
	"eval_loss": 0.04225644841790199,
	"eval_precision": 0.9485612475573777,
	"eval_recall": 0.9671452290262721,
	"eval_runtime": 56.1286,
	"eval_samples_per_second": 396.055,
	"eval_steps_per_second": 12.382,
	"step": 48705
	},
	{
	"epoch": 15.09,
	"learning_rate": 7.363720357252849e-06,
	"loss": 0.0009,
	"step": 49000
	},
	{
	"epoch": 15.24,
	"learning_rate": 7.132737911918695e-06,
	"loss": 0.0008,
	"step": 49500
	},
	{
	"epoch": 15.4,
	"learning_rate": 6.90175546658454e-06,
	"loss": 0.0009,
	"step": 50000
	},
	{
	"epoch": 15.55,
	"learning_rate": 6.6707730212503855e-06,
	"loss": 0.0008,
	"step": 50500
	},
	{
	"epoch": 15.71,
	"learning_rate": 6.43979057591623e-06,
	"loss": 0.0007,
	"step": 51000
	},
	{
	"epoch": 15.86,
	"learning_rate": 6.208808130582076e-06,
	"loss": 0.0008,
	"step": 51500
	},
	{
	"epoch": 16.0,
	"eval_accuracy": 0.9950430150402038,
	"eval_f1": 0.9558787995940656,
	"eval_loss": 0.04262382909655571,
	"eval_precision": 0.9460493590969964,
	"eval_recall": 0.9659146401015725,
	"eval_runtime": 50.4693,
	"eval_samples_per_second": 440.466,
	"eval_steps_per_second": 13.771,
	"step": 51952
	},
	{
	"epoch": 16.01,
	"learning_rate": 5.977825685247921e-06,
	"loss": 0.0008,
	"step": 52000
	},
	{
	"epoch": 16.17,
	"learning_rate": 5.746843239913767e-06,
	"loss": 0.0008,
	"step": 52500
	},
	{
	"epoch": 16.32,
	"learning_rate": 5.515860794579612e-06,
	"loss": 0.0008,
	"step": 53000
	},
	{
	"epoch": 16.48,
	"learning_rate": 5.2848783492454576e-06,
	"loss": 0.0009,
	"step": 53500
	},
	{
	"epoch": 16.63,
	"learning_rate": 5.0538959039113025e-06,
	"loss": 0.0008,
	"step": 54000
	},
	{
	"epoch": 16.78,
	"learning_rate": 4.822913458577148e-06,
	"loss": 0.0006,
	"step": 54500
	},
	{
	"epoch": 16.94,
	"learning_rate": 4.591931013242994e-06,
	"loss": 0.001,
	"step": 55000
	},
	{
	"epoch": 17.0,
	"eval_accuracy": 0.9952113077394561,
	"eval_f1": 0.9582838092477171,
	"eval_loss": 0.04263555258512497,
	"eval_precision": 0.9482501434308663,
	"eval_recall": 0.9685320832112511,
	"eval_runtime": 50.1705,
	"eval_samples_per_second": 443.089,
	"eval_steps_per_second": 13.853,
	"step": 55199
	},
	{
	"epoch": 17.09,
	"learning_rate": 4.360948567908839e-06,
	"loss": 0.0008,
	"step": 55500
	},
	{
	"epoch": 17.25,
	"learning_rate": 4.129966122574684e-06,
	"loss": 0.0008,
	"step": 56000
	},
	{
	"epoch": 17.4,
	"learning_rate": 3.89898367724053e-06,
	"loss": 0.0008,
	"step": 56500
	},
	{
	"epoch": 17.55,
	"learning_rate": 3.668001231906375e-06,
	"loss": 0.0007,
	"step": 57000
	},
	{
	"epoch": 17.71,
	"learning_rate": 3.4370187865722208e-06,
	"loss": 0.0007,
	"step": 57500
	},
	{
	"epoch": 17.86,
	"learning_rate": 3.206036341238066e-06,
	"loss": 0.0006,
	"step": 58000
	},
	{
	"epoch": 18.0,
	"eval_accuracy": 0.9952199136161224,
	"eval_f1": 0.9574789135649616,
	"eval_loss": 0.045220062136650085,
	"eval_precision": 0.9483607656785913,
	"eval_recall": 0.9667740990331087,
	"eval_runtime": 50.3784,
	"eval_samples_per_second": 441.26,
	"eval_steps_per_second": 13.796,
	"step": 58446
	},
	{
	"epoch": 18.02,
	"learning_rate": 2.9750538959039115e-06,
	"loss": 0.0007,
	"step": 58500
	},
	{
	"epoch": 18.17,
	"learning_rate": 2.744071450569757e-06,
	"loss": 0.0007,
	"step": 59000
	},
	{
	"epoch": 18.32,
	"learning_rate": 2.513089005235602e-06,
	"loss": 0.0006,
	"step": 59500
	},
	{
	"epoch": 18.48,
	"learning_rate": 2.2821065599014475e-06,
	"loss": 0.0006,
	"step": 60000
	},
	{
	"epoch": 18.63,
	"learning_rate": 2.051124114567293e-06,
	"loss": 0.0007,
	"step": 60500
	},
	{
	"epoch": 18.79,
	"learning_rate": 1.8201416692331382e-06,
	"loss": 0.0007,
	"step": 61000
	},
	{
	"epoch": 18.94,
	"learning_rate": 1.5891592238989836e-06,
	"loss": 0.0006,
	"step": 61500
	},
	{
	"epoch": 19.0,
	"eval_accuracy": 0.9954895644183336,
	"eval_f1": 0.959768669851647,
	"eval_loss": 0.046882398426532745,
	"eval_precision": 0.9504664125500412,
	"eval_recall": 0.969254810040043,
	"eval_runtime": 50.5066,
	"eval_samples_per_second": 440.141,
	"eval_steps_per_second": 13.761,
	"step": 61693
	}
	],
	"max_steps": 64940,
	"num_train_epochs": 20,
	"total_flos": 5.157312926507336e+17,
	"trial_name": null,
	"trial_params": null
	}