dino-base-2023_11_27-with_custom_head / trainer_state.json

🍻 cheers

25c63a6 8 months ago

No virus

47.5 kB

	{
	"best_metric": 0.1039666160941124,
	"best_model_checkpoint": "./dino-base-2023_11_27-with_custom_head/checkpoint-43952",
	"epoch": 90.0,
	"eval_steps": 500,
	"global_step": 48240,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.93,
	"learning_rate": 0.01,
	"loss": 0.2471,
	"step": 500
	},
	{
	"epoch": 1.0,
	"eval_accuracy": 0.39442658092175775,
	"eval_f1_macro": 0.40064106475011957,
	"eval_f1_micro": 0.5684482898035094,
	"eval_loss": 0.2136440873146057,
	"eval_roc_auc": 0.7020299868465498,
	"eval_runtime": 648.3221,
	"eval_samples_per_second": 4.317,
	"eval_steps_per_second": 0.27,
	"learning_rate": 0.01,
	"step": 536
	},
	{
	"epoch": 1.87,
	"learning_rate": 0.01,
	"loss": 0.2208,
	"step": 1000
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.4090746695248303,
	"eval_f1_macro": 0.646218183693934,
	"eval_f1_micro": 0.6908665105386417,
	"eval_loss": 0.21994435787200928,
	"eval_roc_auc": 0.7944947312416977,
	"eval_runtime": 649.3168,
	"eval_samples_per_second": 4.311,
	"eval_steps_per_second": 0.27,
	"learning_rate": 0.01,
	"step": 1072
	},
	{
	"epoch": 2.8,
	"learning_rate": 0.01,
	"loss": 0.2181,
	"step": 1500
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.43122543765630583,
	"eval_f1_macro": 0.5770940809584216,
	"eval_f1_micro": 0.6712328767123288,
	"eval_loss": 0.19793672859668732,
	"eval_roc_auc": 0.7666801441240528,
	"eval_runtime": 645.3042,
	"eval_samples_per_second": 4.337,
	"eval_steps_per_second": 0.271,
	"learning_rate": 0.01,
	"step": 1608
	},
	{
	"epoch": 3.73,
	"learning_rate": 0.01,
	"loss": 0.2187,
	"step": 2000
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.4137191854233655,
	"eval_f1_macro": 0.606113442290164,
	"eval_f1_micro": 0.7318466985527052,
	"eval_loss": 0.1766517609357834,
	"eval_roc_auc": 0.8268705246501159,
	"eval_runtime": 668.3118,
	"eval_samples_per_second": 4.188,
	"eval_steps_per_second": 0.262,
	"learning_rate": 0.01,
	"step": 2144
	},
	{
	"epoch": 4.66,
	"learning_rate": 0.01,
	"loss": 0.2128,
	"step": 2500
	},
	{
	"epoch": 5.0,
	"eval_accuracy": 0.43265451947123973,
	"eval_f1_macro": 0.5526692766303807,
	"eval_f1_micro": 0.7173007124613524,
	"eval_loss": 0.17600227892398834,
	"eval_roc_auc": 0.8011887560107374,
	"eval_runtime": 647.0188,
	"eval_samples_per_second": 4.326,
	"eval_steps_per_second": 0.27,
	"learning_rate": 0.01,
	"step": 2680
	},
	{
	"epoch": 5.6,
	"learning_rate": 0.01,
	"loss": 0.2171,
	"step": 3000
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.4226509467667024,
	"eval_f1_macro": 0.5183527283365527,
	"eval_f1_micro": 0.7108839135498899,
	"eval_loss": 0.1992170512676239,
	"eval_roc_auc": 0.8061565099276957,
	"eval_runtime": 650.6673,
	"eval_samples_per_second": 4.302,
	"eval_steps_per_second": 0.269,
	"learning_rate": 0.01,
	"step": 3216
	},
	{
	"epoch": 6.53,
	"learning_rate": 0.01,
	"loss": 0.2108,
	"step": 3500
	},
	{
	"epoch": 7.0,
	"eval_accuracy": 0.41729188996070027,
	"eval_f1_macro": 0.6054999995580052,
	"eval_f1_micro": 0.7338740337092892,
	"eval_loss": 0.16948619484901428,
	"eval_roc_auc": 0.8232094683978447,
	"eval_runtime": 649.3312,
	"eval_samples_per_second": 4.311,
	"eval_steps_per_second": 0.27,
	"learning_rate": 0.01,
	"step": 3752
	},
	{
	"epoch": 7.46,
	"learning_rate": 0.01,
	"loss": 0.2147,
	"step": 4000
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.4226509467667024,
	"eval_f1_macro": 0.6176021212641017,
	"eval_f1_micro": 0.7440822902466228,
	"eval_loss": 0.16185873746871948,
	"eval_roc_auc": 0.8341874074405569,
	"eval_runtime": 663.7112,
	"eval_samples_per_second": 4.217,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.01,
	"step": 4288
	},
	{
	"epoch": 8.4,
	"learning_rate": 0.01,
	"loss": 0.2112,
	"step": 4500
	},
	{
	"epoch": 9.0,
	"eval_accuracy": 0.43086816720257237,
	"eval_f1_macro": 0.6402287128969387,
	"eval_f1_micro": 0.7336987336987336,
	"eval_loss": 0.17079614102840424,
	"eval_roc_auc": 0.8244850070361233,
	"eval_runtime": 656.7931,
	"eval_samples_per_second": 4.262,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.01,
	"step": 4824
	},
	{
	"epoch": 9.33,
	"learning_rate": 0.01,
	"loss": 0.216,
	"step": 5000
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.42836727402643804,
	"eval_f1_macro": 0.643393584513474,
	"eval_f1_micro": 0.7493341591824095,
	"eval_loss": 0.1750514954328537,
	"eval_roc_auc": 0.83718619371997,
	"eval_runtime": 657.1366,
	"eval_samples_per_second": 4.259,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.01,
	"step": 5360
	},
	{
	"epoch": 10.26,
	"learning_rate": 0.01,
	"loss": 0.2151,
	"step": 5500
	},
	{
	"epoch": 11.0,
	"eval_accuracy": 0.43372633083244017,
	"eval_f1_macro": 0.6292914445814428,
	"eval_f1_micro": 0.7241767706883986,
	"eval_loss": 0.17014054954051971,
	"eval_roc_auc": 0.8078434001509203,
	"eval_runtime": 662.7207,
	"eval_samples_per_second": 4.223,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.01,
	"step": 5896
	},
	{
	"epoch": 11.19,
	"learning_rate": 0.01,
	"loss": 0.213,
	"step": 6000
	},
	{
	"epoch": 12.0,
	"eval_accuracy": 0.3565559128260093,
	"eval_f1_macro": 0.5371100777543761,
	"eval_f1_micro": 0.6629161350191394,
	"eval_loss": 0.2409001588821411,
	"eval_roc_auc": 0.8034829311226885,
	"eval_runtime": 657.3534,
	"eval_samples_per_second": 4.258,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.01,
	"step": 6432
	},
	{
	"epoch": 12.13,
	"learning_rate": 0.01,
	"loss": 0.2161,
	"step": 6500
	},
	{
	"epoch": 13.0,
	"eval_accuracy": 0.4194355126831011,
	"eval_f1_macro": 0.6243034191518838,
	"eval_f1_micro": 0.7290690310322989,
	"eval_loss": 0.1704823523759842,
	"eval_roc_auc": 0.820743148916754,
	"eval_runtime": 665.336,
	"eval_samples_per_second": 4.207,
	"eval_steps_per_second": 0.263,
	"learning_rate": 0.01,
	"step": 6968
	},
	{
	"epoch": 13.06,
	"learning_rate": 0.01,
	"loss": 0.2145,
	"step": 7000
	},
	{
	"epoch": 13.99,
	"learning_rate": 0.01,
	"loss": 0.2136,
	"step": 7500
	},
	{
	"epoch": 14.0,
	"eval_accuracy": 0.44265809217577706,
	"eval_f1_macro": 0.6215367292632343,
	"eval_f1_micro": 0.734259379462547,
	"eval_loss": 0.16933664679527283,
	"eval_roc_auc": 0.8177495297062425,
	"eval_runtime": 654.4339,
	"eval_samples_per_second": 4.277,
	"eval_steps_per_second": 0.267,
	"learning_rate": 0.01,
	"step": 7504
	},
	{
	"epoch": 14.93,
	"learning_rate": 0.001,
	"loss": 0.1826,
	"step": 8000
	},
	{
	"epoch": 15.0,
	"eval_accuracy": 0.4969632011432655,
	"eval_f1_macro": 0.7459554779815883,
	"eval_f1_micro": 0.7967720076387605,
	"eval_loss": 0.13880470395088196,
	"eval_roc_auc": 0.8648126874646008,
	"eval_runtime": 668.3546,
	"eval_samples_per_second": 4.188,
	"eval_steps_per_second": 0.262,
	"learning_rate": 0.001,
	"step": 8040
	},
	{
	"epoch": 15.86,
	"learning_rate": 0.001,
	"loss": 0.1731,
	"step": 8500
	},
	{
	"epoch": 16.0,
	"eval_accuracy": 0.5155412647374062,
	"eval_f1_macro": 0.7385190479208986,
	"eval_f1_micro": 0.8016270337922403,
	"eval_loss": 0.14762958884239197,
	"eval_roc_auc": 0.8631052728177114,
	"eval_runtime": 657.5159,
	"eval_samples_per_second": 4.257,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.001,
	"step": 8576
	},
	{
	"epoch": 16.79,
	"learning_rate": 0.001,
	"loss": 0.1649,
	"step": 9000
	},
	{
	"epoch": 17.0,
	"eval_accuracy": 0.5023222579492675,
	"eval_f1_macro": 0.7692855132157861,
	"eval_f1_micro": 0.813318908522659,
	"eval_loss": 0.1351146697998047,
	"eval_roc_auc": 0.8811667807242409,
	"eval_runtime": 655.4487,
	"eval_samples_per_second": 4.27,
	"eval_steps_per_second": 0.267,
	"learning_rate": 0.001,
	"step": 9112
	},
	{
	"epoch": 17.72,
	"learning_rate": 0.001,
	"loss": 0.1624,
	"step": 9500
	},
	{
	"epoch": 18.0,
	"eval_accuracy": 0.5212575919971418,
	"eval_f1_macro": 0.7714136364578609,
	"eval_f1_micro": 0.8185593067340675,
	"eval_loss": 0.13848340511322021,
	"eval_roc_auc": 0.8837626029149266,
	"eval_runtime": 662.3967,
	"eval_samples_per_second": 4.226,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.001,
	"step": 9648
	},
	{
	"epoch": 18.66,
	"learning_rate": 0.001,
	"loss": 0.1576,
	"step": 10000
	},
	{
	"epoch": 19.0,
	"eval_accuracy": 0.5205430510896749,
	"eval_f1_macro": 0.7631806100991755,
	"eval_f1_micro": 0.8175969609705288,
	"eval_loss": 0.13018544018268585,
	"eval_roc_auc": 0.8779148602729905,
	"eval_runtime": 679.9157,
	"eval_samples_per_second": 4.117,
	"eval_steps_per_second": 0.257,
	"learning_rate": 0.001,
	"step": 10184
	},
	{
	"epoch": 19.59,
	"learning_rate": 0.001,
	"loss": 0.1544,
	"step": 10500
	},
	{
	"epoch": 20.0,
	"eval_accuracy": 0.5319757056091461,
	"eval_f1_macro": 0.7721701876863485,
	"eval_f1_micro": 0.8229907814143413,
	"eval_loss": 0.12343110144138336,
	"eval_roc_auc": 0.8780568409783432,
	"eval_runtime": 658.9399,
	"eval_samples_per_second": 4.248,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.001,
	"step": 10720
	},
	{
	"epoch": 20.52,
	"learning_rate": 0.001,
	"loss": 0.1542,
	"step": 11000
	},
	{
	"epoch": 21.0,
	"eval_accuracy": 0.525902107895677,
	"eval_f1_macro": 0.7754587726434372,
	"eval_f1_micro": 0.8267645466032855,
	"eval_loss": 0.13044790923595428,
	"eval_roc_auc": 0.8884477411328827,
	"eval_runtime": 659.4337,
	"eval_samples_per_second": 4.245,
	"eval_steps_per_second": 0.265,
	"learning_rate": 0.001,
	"step": 11256
	},
	{
	"epoch": 21.46,
	"learning_rate": 0.001,
	"loss": 0.1525,
	"step": 11500
	},
	{
	"epoch": 22.0,
	"eval_accuracy": 0.5376920328688818,
	"eval_f1_macro": 0.76461964189607,
	"eval_f1_micro": 0.8176823176823177,
	"eval_loss": 0.12196117639541626,
	"eval_roc_auc": 0.8724977198539325,
	"eval_runtime": 674.7285,
	"eval_samples_per_second": 4.148,
	"eval_steps_per_second": 0.259,
	"learning_rate": 0.001,
	"step": 11792
	},
	{
	"epoch": 22.39,
	"learning_rate": 0.001,
	"loss": 0.1505,
	"step": 12000
	},
	{
	"epoch": 23.0,
	"eval_accuracy": 0.5255448374419436,
	"eval_f1_macro": 0.7872363331907107,
	"eval_f1_micro": 0.8264049955396968,
	"eval_loss": 0.13109837472438812,
	"eval_roc_auc": 0.891814004155335,
	"eval_runtime": 658.8901,
	"eval_samples_per_second": 4.248,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.001,
	"step": 12328
	},
	{
	"epoch": 23.32,
	"learning_rate": 0.001,
	"loss": 0.1515,
	"step": 12500
	},
	{
	"epoch": 24.0,
	"eval_accuracy": 0.5316184351554126,
	"eval_f1_macro": 0.7629977302664256,
	"eval_f1_micro": 0.8188446438586652,
	"eval_loss": 0.12468679994344711,
	"eval_roc_auc": 0.8736890703040258,
	"eval_runtime": 649.926,
	"eval_samples_per_second": 4.307,
	"eval_steps_per_second": 0.269,
	"learning_rate": 0.001,
	"step": 12864
	},
	{
	"epoch": 24.25,
	"learning_rate": 0.001,
	"loss": 0.1471,
	"step": 13000
	},
	{
	"epoch": 25.0,
	"eval_accuracy": 0.5226866738120758,
	"eval_f1_macro": 0.7726394339166129,
	"eval_f1_micro": 0.8258118937157316,
	"eval_loss": 0.1264602392911911,
	"eval_roc_auc": 0.8875076814616129,
	"eval_runtime": 661.9223,
	"eval_samples_per_second": 4.229,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.001,
	"step": 13400
	},
	{
	"epoch": 25.19,
	"learning_rate": 0.001,
	"loss": 0.1475,
	"step": 13500
	},
	{
	"epoch": 26.0,
	"eval_accuracy": 0.5330475169703466,
	"eval_f1_macro": 0.7834057788273457,
	"eval_f1_micro": 0.8301059554256485,
	"eval_loss": 0.12767212092876434,
	"eval_roc_auc": 0.8867279830614062,
	"eval_runtime": 654.8587,
	"eval_samples_per_second": 4.274,
	"eval_steps_per_second": 0.267,
	"learning_rate": 0.001,
	"step": 13936
	},
	{
	"epoch": 26.12,
	"learning_rate": 0.001,
	"loss": 0.1484,
	"step": 14000
	},
	{
	"epoch": 27.0,
	"eval_accuracy": 0.5398356555912825,
	"eval_f1_macro": 0.7661233818608114,
	"eval_f1_micro": 0.8218290555693994,
	"eval_loss": 0.12360195070505142,
	"eval_roc_auc": 0.8754121833739898,
	"eval_runtime": 658.0747,
	"eval_samples_per_second": 4.253,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.001,
	"step": 14472
	},
	{
	"epoch": 27.05,
	"learning_rate": 0.001,
	"loss": 0.1475,
	"step": 14500
	},
	{
	"epoch": 27.99,
	"learning_rate": 0.001,
	"loss": 0.1472,
	"step": 15000
	},
	{
	"epoch": 28.0,
	"eval_accuracy": 0.5401929260450161,
	"eval_f1_macro": 0.7728524137767288,
	"eval_f1_micro": 0.8228913409388442,
	"eval_loss": 0.1256585270166397,
	"eval_roc_auc": 0.8757945197904818,
	"eval_runtime": 655.1438,
	"eval_samples_per_second": 4.272,
	"eval_steps_per_second": 0.267,
	"learning_rate": 0.001,
	"step": 15008
	},
	{
	"epoch": 28.92,
	"learning_rate": 0.0001,
	"loss": 0.1379,
	"step": 15500
	},
	{
	"epoch": 29.0,
	"eval_accuracy": 0.5451947123972848,
	"eval_f1_macro": 0.7891009081675242,
	"eval_f1_micro": 0.8352094482376824,
	"eval_loss": 0.11994459480047226,
	"eval_roc_auc": 0.8865305601939816,
	"eval_runtime": 657.6068,
	"eval_samples_per_second": 4.256,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.0001,
	"step": 15544
	},
	{
	"epoch": 29.85,
	"learning_rate": 0.0001,
	"loss": 0.1349,
	"step": 16000
	},
	{
	"epoch": 30.0,
	"eval_accuracy": 0.5487674169346195,
	"eval_f1_macro": 0.7943922901606704,
	"eval_f1_micro": 0.841315916787615,
	"eval_loss": 0.11564121395349503,
	"eval_roc_auc": 0.895138845939546,
	"eval_runtime": 659.4245,
	"eval_samples_per_second": 4.245,
	"eval_steps_per_second": 0.265,
	"learning_rate": 0.0001,
	"step": 16080
	},
	{
	"epoch": 30.78,
	"learning_rate": 0.0001,
	"loss": 0.1326,
	"step": 16500
	},
	{
	"epoch": 31.0,
	"eval_accuracy": 0.5498392282958199,
	"eval_f1_macro": 0.7983364672353336,
	"eval_f1_micro": 0.84037558685446,
	"eval_loss": 0.11515345424413681,
	"eval_roc_auc": 0.8960665621862288,
	"eval_runtime": 652.6109,
	"eval_samples_per_second": 4.289,
	"eval_steps_per_second": 0.268,
	"learning_rate": 0.0001,
	"step": 16616
	},
	{
	"epoch": 31.72,
	"learning_rate": 0.0001,
	"loss": 0.1321,
	"step": 17000
	},
	{
	"epoch": 32.0,
	"eval_accuracy": 0.5509110396570204,
	"eval_f1_macro": 0.7911364775051637,
	"eval_f1_micro": 0.8385913426265589,
	"eval_loss": 0.11371538788080215,
	"eval_roc_auc": 0.89024940896342,
	"eval_runtime": 663.8067,
	"eval_samples_per_second": 4.217,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.0001,
	"step": 17152
	},
	{
	"epoch": 32.65,
	"learning_rate": 0.0001,
	"loss": 0.1294,
	"step": 17500
	},
	{
	"epoch": 33.0,
	"eval_accuracy": 0.5512683101107538,
	"eval_f1_macro": 0.7924466456431516,
	"eval_f1_micro": 0.8406133545115768,
	"eval_loss": 0.11363548040390015,
	"eval_roc_auc": 0.891620070857568,
	"eval_runtime": 641.5792,
	"eval_samples_per_second": 4.363,
	"eval_steps_per_second": 0.273,
	"learning_rate": 0.0001,
	"step": 17688
	},
	{
	"epoch": 33.58,
	"learning_rate": 0.0001,
	"loss": 0.1297,
	"step": 18000
	},
	{
	"epoch": 34.0,
	"eval_accuracy": 0.5551982851018221,
	"eval_f1_macro": 0.7994952163993189,
	"eval_f1_micro": 0.8438879816125325,
	"eval_loss": 0.1100151389837265,
	"eval_roc_auc": 0.8965325171836247,
	"eval_runtime": 666.5011,
	"eval_samples_per_second": 4.2,
	"eval_steps_per_second": 0.263,
	"learning_rate": 0.0001,
	"step": 18224
	},
	{
	"epoch": 34.51,
	"learning_rate": 0.0001,
	"loss": 0.1296,
	"step": 18500
	},
	{
	"epoch": 35.0,
	"eval_accuracy": 0.5569846373704894,
	"eval_f1_macro": 0.7958547104209327,
	"eval_f1_micro": 0.8430563978168587,
	"eval_loss": 0.11022897809743881,
	"eval_roc_auc": 0.8952561397957243,
	"eval_runtime": 651.2057,
	"eval_samples_per_second": 4.298,
	"eval_steps_per_second": 0.269,
	"learning_rate": 0.0001,
	"step": 18760
	},
	{
	"epoch": 35.45,
	"learning_rate": 0.0001,
	"loss": 0.1276,
	"step": 19000
	},
	{
	"epoch": 36.0,
	"eval_accuracy": 0.5584137191854234,
	"eval_f1_macro": 0.7954026209465306,
	"eval_f1_micro": 0.8428501708150318,
	"eval_loss": 0.11038191616535187,
	"eval_roc_auc": 0.8933002510838177,
	"eval_runtime": 659.4359,
	"eval_samples_per_second": 4.245,
	"eval_steps_per_second": 0.265,
	"learning_rate": 0.0001,
	"step": 19296
	},
	{
	"epoch": 36.38,
	"learning_rate": 0.0001,
	"loss": 0.1264,
	"step": 19500
	},
	{
	"epoch": 37.0,
	"eval_accuracy": 0.5644873168988924,
	"eval_f1_macro": 0.8073166114826349,
	"eval_f1_micro": 0.8467775842392937,
	"eval_loss": 0.11108729988336563,
	"eval_roc_auc": 0.9003547734565809,
	"eval_runtime": 649.1518,
	"eval_samples_per_second": 4.312,
	"eval_steps_per_second": 0.27,
	"learning_rate": 0.0001,
	"step": 19832
	},
	{
	"epoch": 37.31,
	"learning_rate": 0.0001,
	"loss": 0.1279,
	"step": 20000
	},
	{
	"epoch": 38.0,
	"eval_accuracy": 0.5662736691675598,
	"eval_f1_macro": 0.8059718169069215,
	"eval_f1_micro": 0.8457475869604808,
	"eval_loss": 0.11050034314393997,
	"eval_roc_auc": 0.8964483289954395,
	"eval_runtime": 661.6908,
	"eval_samples_per_second": 4.23,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.0001,
	"step": 20368
	},
	{
	"epoch": 38.25,
	"learning_rate": 0.0001,
	"loss": 0.1231,
	"step": 20500
	},
	{
	"epoch": 39.0,
	"eval_accuracy": 0.5623436941764915,
	"eval_f1_macro": 0.810452280144873,
	"eval_f1_micro": 0.8481141692150868,
	"eval_loss": 0.1114969253540039,
	"eval_roc_auc": 0.9016441984475202,
	"eval_runtime": 645.0365,
	"eval_samples_per_second": 4.339,
	"eval_steps_per_second": 0.271,
	"learning_rate": 0.0001,
	"step": 20904
	},
	{
	"epoch": 39.18,
	"learning_rate": 0.0001,
	"loss": 0.1276,
	"step": 21000
	},
	{
	"epoch": 40.0,
	"eval_accuracy": 0.564844587352626,
	"eval_f1_macro": 0.7998757908744976,
	"eval_f1_micro": 0.8442948914040991,
	"eval_loss": 0.10886894911527634,
	"eval_roc_auc": 0.8932229387863774,
	"eval_runtime": 664.3024,
	"eval_samples_per_second": 4.213,
	"eval_steps_per_second": 0.263,
	"learning_rate": 0.0001,
	"step": 21440
	},
	{
	"epoch": 40.11,
	"learning_rate": 0.0001,
	"loss": 0.121,
	"step": 21500
	},
	{
	"epoch": 41.0,
	"eval_accuracy": 0.5627009646302251,
	"eval_f1_macro": 0.8014681171854418,
	"eval_f1_micro": 0.8454512239678481,
	"eval_loss": 0.10981705039739609,
	"eval_roc_auc": 0.8953198348828445,
	"eval_runtime": 652.9462,
	"eval_samples_per_second": 4.287,
	"eval_steps_per_second": 0.268,
	"learning_rate": 0.0001,
	"step": 21976
	},
	{
	"epoch": 41.04,
	"learning_rate": 0.0001,
	"loss": 0.1241,
	"step": 22000
	},
	{
	"epoch": 41.98,
	"learning_rate": 0.0001,
	"loss": 0.1229,
	"step": 22500
	},
	{
	"epoch": 42.0,
	"eval_accuracy": 0.5619864237227581,
	"eval_f1_macro": 0.8009464266100834,
	"eval_f1_micro": 0.8459390554813646,
	"eval_loss": 0.10872387140989304,
	"eval_roc_auc": 0.8965747458488879,
	"eval_runtime": 655.0026,
	"eval_samples_per_second": 4.273,
	"eval_steps_per_second": 0.267,
	"learning_rate": 0.0001,
	"step": 22512
	},
	{
	"epoch": 42.91,
	"learning_rate": 0.0001,
	"loss": 0.1227,
	"step": 23000
	},
	{
	"epoch": 43.0,
	"eval_accuracy": 0.5687745623436942,
	"eval_f1_macro": 0.8067169938735436,
	"eval_f1_micro": 0.8468292682926829,
	"eval_loss": 0.10882638394832611,
	"eval_roc_auc": 0.8956753719148074,
	"eval_runtime": 660.8489,
	"eval_samples_per_second": 4.235,
	"eval_steps_per_second": 0.265,
	"learning_rate": 0.0001,
	"step": 23048
	},
	{
	"epoch": 43.84,
	"learning_rate": 0.0001,
	"loss": 0.1221,
	"step": 23500
	},
	{
	"epoch": 44.0,
	"eval_accuracy": 0.5673454805287603,
	"eval_f1_macro": 0.8065744332804647,
	"eval_f1_micro": 0.8476346632659257,
	"eval_loss": 0.10762665420770645,
	"eval_roc_auc": 0.897394560379003,
	"eval_runtime": 657.9808,
	"eval_samples_per_second": 4.254,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.0001,
	"step": 23584
	},
	{
	"epoch": 44.78,
	"learning_rate": 0.0001,
	"loss": 0.1191,
	"step": 24000
	},
	{
	"epoch": 45.0,
	"eval_accuracy": 0.5698463737048947,
	"eval_f1_macro": 0.817339787108748,
	"eval_f1_micro": 0.8507955568898229,
	"eval_loss": 0.10689569264650345,
	"eval_roc_auc": 0.9027498177813545,
	"eval_runtime": 671.4032,
	"eval_samples_per_second": 4.169,
	"eval_steps_per_second": 0.261,
	"learning_rate": 0.0001,
	"step": 24120
	},
	{
	"epoch": 45.71,
	"learning_rate": 0.0001,
	"loss": 0.1212,
	"step": 24500
	},
	{
	"epoch": 46.0,
	"eval_accuracy": 0.563415505537692,
	"eval_f1_macro": 0.8173548628519673,
	"eval_f1_micro": 0.8508932256352808,
	"eval_loss": 0.10721632838249207,
	"eval_roc_auc": 0.9086343215547117,
	"eval_runtime": 661.9534,
	"eval_samples_per_second": 4.228,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.0001,
	"step": 24656
	},
	{
	"epoch": 46.64,
	"learning_rate": 0.0001,
	"loss": 0.1198,
	"step": 25000
	},
	{
	"epoch": 47.0,
	"eval_accuracy": 0.5687745623436942,
	"eval_f1_macro": 0.8090465345914333,
	"eval_f1_micro": 0.849293563579278,
	"eval_loss": 0.10663535445928574,
	"eval_roc_auc": 0.900130416633457,
	"eval_runtime": 673.8512,
	"eval_samples_per_second": 4.154,
	"eval_steps_per_second": 0.26,
	"learning_rate": 0.0001,
	"step": 25192
	},
	{
	"epoch": 47.57,
	"learning_rate": 0.0001,
	"loss": 0.1201,
	"step": 25500
	},
	{
	"epoch": 48.0,
	"eval_accuracy": 0.5652018578063595,
	"eval_f1_macro": 0.8082582901487069,
	"eval_f1_micro": 0.8484811957569913,
	"eval_loss": 0.10762892663478851,
	"eval_roc_auc": 0.9002407000277199,
	"eval_runtime": 662.4725,
	"eval_samples_per_second": 4.225,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.0001,
	"step": 25728
	},
	{
	"epoch": 48.51,
	"learning_rate": 0.0001,
	"loss": 0.1189,
	"step": 26000
	},
	{
	"epoch": 49.0,
	"eval_accuracy": 0.5687745623436942,
	"eval_f1_macro": 0.8152048365492516,
	"eval_f1_micro": 0.8507597141312836,
	"eval_loss": 0.10654111951589584,
	"eval_roc_auc": 0.9026532861685821,
	"eval_runtime": 679.062,
	"eval_samples_per_second": 4.122,
	"eval_steps_per_second": 0.258,
	"learning_rate": 0.0001,
	"step": 26264
	},
	{
	"epoch": 49.44,
	"learning_rate": 0.0001,
	"loss": 0.1176,
	"step": 26500
	},
	{
	"epoch": 50.0,
	"eval_accuracy": 0.563415505537692,
	"eval_f1_macro": 0.8033757987633436,
	"eval_f1_micro": 0.8462940461725396,
	"eval_loss": 0.10730718821287155,
	"eval_roc_auc": 0.8965096424048645,
	"eval_runtime": 643.0995,
	"eval_samples_per_second": 4.352,
	"eval_steps_per_second": 0.272,
	"learning_rate": 0.0001,
	"step": 26800
	},
	{
	"epoch": 50.37,
	"learning_rate": 0.0001,
	"loss": 0.1202,
	"step": 27000
	},
	{
	"epoch": 51.0,
	"eval_accuracy": 0.5727045373347625,
	"eval_f1_macro": 0.8102272806912906,
	"eval_f1_micro": 0.8480676328502416,
	"eval_loss": 0.10732194036245346,
	"eval_roc_auc": 0.8994002578253693,
	"eval_runtime": 645.0782,
	"eval_samples_per_second": 4.339,
	"eval_steps_per_second": 0.271,
	"learning_rate": 0.0001,
	"step": 27336
	},
	{
	"epoch": 51.31,
	"learning_rate": 0.0001,
	"loss": 0.1167,
	"step": 27500
	},
	{
	"epoch": 52.0,
	"eval_accuracy": 0.571632725973562,
	"eval_f1_macro": 0.8179079350328715,
	"eval_f1_micro": 0.8521687462863933,
	"eval_loss": 0.10600127279758453,
	"eval_roc_auc": 0.9068707918898985,
	"eval_runtime": 661.3351,
	"eval_samples_per_second": 4.232,
	"eval_steps_per_second": 0.265,
	"learning_rate": 0.0001,
	"step": 27872
	},
	{
	"epoch": 52.24,
	"learning_rate": 0.0001,
	"loss": 0.1192,
	"step": 28000
	},
	{
	"epoch": 53.0,
	"eval_accuracy": 0.5712754555198285,
	"eval_f1_macro": 0.8127939311574505,
	"eval_f1_micro": 0.8507093268940539,
	"eval_loss": 0.10628383606672287,
	"eval_roc_auc": 0.9009869922949931,
	"eval_runtime": 649.2151,
	"eval_samples_per_second": 4.311,
	"eval_steps_per_second": 0.27,
	"learning_rate": 0.0001,
	"step": 28408
	},
	{
	"epoch": 53.17,
	"learning_rate": 0.0001,
	"loss": 0.1156,
	"step": 28500
	},
	{
	"epoch": 54.0,
	"eval_accuracy": 0.5719899964272954,
	"eval_f1_macro": 0.8113280265904282,
	"eval_f1_micro": 0.8493415488703637,
	"eval_loss": 0.10670817643404007,
	"eval_roc_auc": 0.9000055427080821,
	"eval_runtime": 659.1604,
	"eval_samples_per_second": 4.246,
	"eval_steps_per_second": 0.265,
	"learning_rate": 0.0001,
	"step": 28944
	},
	{
	"epoch": 54.1,
	"learning_rate": 0.0001,
	"loss": 0.1193,
	"step": 29000
	},
	{
	"epoch": 55.0,
	"eval_accuracy": 0.5727045373347625,
	"eval_f1_macro": 0.8116343899877551,
	"eval_f1_micro": 0.8490052609300356,
	"eval_loss": 0.10690104961395264,
	"eval_roc_auc": 0.8994929994035434,
	"eval_runtime": 663.4912,
	"eval_samples_per_second": 4.219,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.0001,
	"step": 29480
	},
	{
	"epoch": 55.04,
	"learning_rate": 0.0001,
	"loss": 0.1161,
	"step": 29500
	},
	{
	"epoch": 55.97,
	"learning_rate": 0.0001,
	"loss": 0.116,
	"step": 30000
	},
	{
	"epoch": 56.0,
	"eval_accuracy": 0.5744908896034298,
	"eval_f1_macro": 0.818624257330544,
	"eval_f1_micro": 0.8542707589816796,
	"eval_loss": 0.10558204352855682,
	"eval_roc_auc": 0.9077319963356549,
	"eval_runtime": 659.0048,
	"eval_samples_per_second": 4.247,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.0001,
	"step": 30016
	},
	{
	"epoch": 56.9,
	"learning_rate": 0.0001,
	"loss": 0.1147,
	"step": 30500
	},
	{
	"epoch": 57.0,
	"eval_accuracy": 0.5730618077884959,
	"eval_f1_macro": 0.8113712664273885,
	"eval_f1_micro": 0.8505116959064327,
	"eval_loss": 0.10627623647451401,
	"eval_roc_auc": 0.8980389880708319,
	"eval_runtime": 669.8276,
	"eval_samples_per_second": 4.179,
	"eval_steps_per_second": 0.261,
	"learning_rate": 0.0001,
	"step": 30552
	},
	{
	"epoch": 57.84,
	"learning_rate": 0.0001,
	"loss": 0.1139,
	"step": 31000
	},
	{
	"epoch": 58.0,
	"eval_accuracy": 0.5705609146123616,
	"eval_f1_macro": 0.8074486566040442,
	"eval_f1_micro": 0.8488632919066383,
	"eval_loss": 0.10657747834920883,
	"eval_roc_auc": 0.898615796069772,
	"eval_runtime": 654.902,
	"eval_samples_per_second": 4.274,
	"eval_steps_per_second": 0.267,
	"learning_rate": 0.0001,
	"step": 31088
	},
	{
	"epoch": 58.77,
	"learning_rate": 0.0001,
	"loss": 0.1143,
	"step": 31500
	},
	{
	"epoch": 59.0,
	"eval_accuracy": 0.5727045373347625,
	"eval_f1_macro": 0.8065194300593265,
	"eval_f1_micro": 0.8490646517579673,
	"eval_loss": 0.10738535225391388,
	"eval_roc_auc": 0.8971341466029096,
	"eval_runtime": 661.8186,
	"eval_samples_per_second": 4.229,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.0001,
	"step": 31624
	},
	{
	"epoch": 59.7,
	"learning_rate": 0.0001,
	"loss": 0.1148,
	"step": 32000
	},
	{
	"epoch": 60.0,
	"eval_accuracy": 0.5694891032511611,
	"eval_f1_macro": 0.8079607267977419,
	"eval_f1_micro": 0.8498935199269851,
	"eval_loss": 0.10777446627616882,
	"eval_roc_auc": 0.8980542827803957,
	"eval_runtime": 663.1043,
	"eval_samples_per_second": 4.221,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.0001,
	"step": 32160
	},
	{
	"epoch": 60.63,
	"learning_rate": 0.0001,
	"loss": 0.1143,
	"step": 32500
	},
	{
	"epoch": 61.0,
	"eval_accuracy": 0.572347266881029,
	"eval_f1_macro": 0.8159017507862669,
	"eval_f1_micro": 0.8512052195976559,
	"eval_loss": 0.10536229610443115,
	"eval_roc_auc": 0.9010383439575261,
	"eval_runtime": 660.7796,
	"eval_samples_per_second": 4.236,
	"eval_steps_per_second": 0.265,
	"learning_rate": 0.0001,
	"step": 32696
	},
	{
	"epoch": 61.57,
	"learning_rate": 0.0001,
	"loss": 0.1133,
	"step": 33000
	},
	{
	"epoch": 62.0,
	"eval_accuracy": 0.5737763486959628,
	"eval_f1_macro": 0.808341771577789,
	"eval_f1_micro": 0.8495672315006705,
	"eval_loss": 0.10581369698047638,
	"eval_roc_auc": 0.8973203339377094,
	"eval_runtime": 655.4703,
	"eval_samples_per_second": 4.27,
	"eval_steps_per_second": 0.267,
	"learning_rate": 0.0001,
	"step": 33232
	},
	{
	"epoch": 62.5,
	"learning_rate": 0.0001,
	"loss": 0.1134,
	"step": 33500
	},
	{
	"epoch": 63.0,
	"eval_accuracy": 0.5680600214362272,
	"eval_f1_macro": 0.8087952156757714,
	"eval_f1_micro": 0.847873368777187,
	"eval_loss": 0.1063385158777237,
	"eval_roc_auc": 0.899139005299654,
	"eval_runtime": 659.92,
	"eval_samples_per_second": 4.241,
	"eval_steps_per_second": 0.265,
	"learning_rate": 0.0001,
	"step": 33768
	},
	{
	"epoch": 63.43,
	"learning_rate": 0.0001,
	"loss": 0.1123,
	"step": 34000
	},
	{
	"epoch": 64.0,
	"eval_accuracy": 0.5702036441586281,
	"eval_f1_macro": 0.8121242156828758,
	"eval_f1_micro": 0.8503755754785559,
	"eval_loss": 0.10543316602706909,
	"eval_roc_auc": 0.8997137007632394,
	"eval_runtime": 647.0637,
	"eval_samples_per_second": 4.326,
	"eval_steps_per_second": 0.27,
	"learning_rate": 0.0001,
	"step": 34304
	},
	{
	"epoch": 64.37,
	"learning_rate": 0.0001,
	"loss": 0.1141,
	"step": 34500
	},
	{
	"epoch": 65.0,
	"eval_accuracy": 0.5730618077884959,
	"eval_f1_macro": 0.8099395952334975,
	"eval_f1_micro": 0.8494330240737371,
	"eval_loss": 0.10500979423522949,
	"eval_roc_auc": 0.8988602109578501,
	"eval_runtime": 649.7608,
	"eval_samples_per_second": 4.308,
	"eval_steps_per_second": 0.269,
	"learning_rate": 0.0001,
	"step": 34840
	},
	{
	"epoch": 65.3,
	"learning_rate": 0.0001,
	"loss": 0.1104,
	"step": 35000
	},
	{
	"epoch": 66.0,
	"eval_accuracy": 0.5762772418720972,
	"eval_f1_macro": 0.8132610218333434,
	"eval_f1_micro": 0.8506980430409072,
	"eval_loss": 0.10500740259885788,
	"eval_roc_auc": 0.8978957335797464,
	"eval_runtime": 652.9454,
	"eval_samples_per_second": 4.287,
	"eval_steps_per_second": 0.268,
	"learning_rate": 0.0001,
	"step": 35376
	},
	{
	"epoch": 66.23,
	"learning_rate": 0.0001,
	"loss": 0.1124,
	"step": 35500
	},
	{
	"epoch": 67.0,
	"eval_accuracy": 0.5669882100750268,
	"eval_f1_macro": 0.8163481281680508,
	"eval_f1_micro": 0.8512857399748246,
	"eval_loss": 0.10600199550390244,
	"eval_roc_auc": 0.9035619176711028,
	"eval_runtime": 657.7451,
	"eval_samples_per_second": 4.255,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.0001,
	"step": 35912
	},
	{
	"epoch": 67.16,
	"learning_rate": 0.0001,
	"loss": 0.1111,
	"step": 36000
	},
	{
	"epoch": 68.0,
	"eval_accuracy": 0.5680600214362272,
	"eval_f1_macro": 0.8156635542444352,
	"eval_f1_micro": 0.8511868899867453,
	"eval_loss": 0.10536548495292664,
	"eval_roc_auc": 0.9018856620506218,
	"eval_runtime": 656.6156,
	"eval_samples_per_second": 4.263,
	"eval_steps_per_second": 0.267,
	"learning_rate": 0.0001,
	"step": 36448
	},
	{
	"epoch": 68.1,
	"learning_rate": 0.0001,
	"loss": 0.1097,
	"step": 36500
	},
	{
	"epoch": 69.0,
	"eval_accuracy": 0.5673454805287603,
	"eval_f1_macro": 0.8109923908741982,
	"eval_f1_micro": 0.8500871237156763,
	"eval_loss": 0.1056470051407814,
	"eval_roc_auc": 0.9021192764421861,
	"eval_runtime": 657.5814,
	"eval_samples_per_second": 4.257,
	"eval_steps_per_second": 0.266,
	"learning_rate": 0.0001,
	"step": 36984
	},
	{
	"epoch": 69.03,
	"learning_rate": 0.0001,
	"loss": 0.1106,
	"step": 37000
	},
	{
	"epoch": 69.96,
	"learning_rate": 0.0001,
	"loss": 0.1096,
	"step": 37500
	},
	{
	"epoch": 70.0,
	"eval_accuracy": 0.5673454805287603,
	"eval_f1_macro": 0.8119494369118779,
	"eval_f1_micro": 0.8500514558992676,
	"eval_loss": 0.1059202253818512,
	"eval_roc_auc": 0.8997405001477684,
	"eval_runtime": 661.9686,
	"eval_samples_per_second": 4.228,
	"eval_steps_per_second": 0.264,
	"learning_rate": 0.0001,
	"step": 37520
	},
	{
	"epoch": 70.9,
	"learning_rate": 0.0001,
	"loss": 0.1097,
	"step": 38000
	},
	{
	"epoch": 71.0,
	"eval_accuracy": 0.5737763486959628,
	"eval_f1_macro": 0.8171777200998823,
	"eval_f1_micro": 0.8517297200071947,
	"eval_loss": 0.10546696186065674,
	"eval_roc_auc": 0.9037381432590107,
	"eval_runtime": 654.6273,
	"eval_samples_per_second": 4.276,
	"eval_steps_per_second": 0.267,
	"learning_rate": 0.0001,
	"step": 38056
	},
	{
	"epoch": 71.83,
	"learning_rate": 1e-05,
	"loss": 0.1084,
	"step": 38500
	},
	{
	"epoch": 72.0,
	"eval_accuracy": 0.5630582350839586,
	"eval_f1_macro": 0.8063147670569071,
	"eval_f1_micro": 0.84692696594993,
	"eval_loss": 0.10735420882701874,
	"eval_roc_auc": 0.8960515366190057,
	"eval_runtime": 658.0374,
	"eval_samples_per_second": 4.254,
	"eval_steps_per_second": 0.266,
	"learning_rate": 1e-05,
	"step": 38592
	},
	{
	"epoch": 72.76,
	"learning_rate": 1e-05,
	"loss": 0.1091,
	"step": 39000
	},
	{
	"epoch": 73.0,
	"eval_accuracy": 0.5734190782422294,
	"eval_f1_macro": 0.8171103344103756,
	"eval_f1_micro": 0.8525143029208069,
	"eval_loss": 0.10438621789216995,
	"eval_roc_auc": 0.9027705800247602,
	"eval_runtime": 664.8235,
	"eval_samples_per_second": 4.21,
	"eval_steps_per_second": 0.263,
	"learning_rate": 1e-05,
	"step": 39128
	},
	{
	"epoch": 73.69,
	"learning_rate": 1e-05,
	"loss": 0.1051,
	"step": 39500
	},
	{
	"epoch": 74.0,
	"eval_accuracy": 0.571632725973562,
	"eval_f1_macro": 0.8187356068324974,
	"eval_f1_micro": 0.8532934131736527,
	"eval_loss": 0.10408420860767365,
	"eval_roc_auc": 0.9050291111780234,
	"eval_runtime": 673.5967,
	"eval_samples_per_second": 4.155,
	"eval_steps_per_second": 0.26,
	"learning_rate": 1e-05,
	"step": 39664
	},
	{
	"epoch": 74.63,
	"learning_rate": 1e-05,
	"loss": 0.1069,
	"step": 40000
	},
	{
	"epoch": 75.0,
	"eval_accuracy": 0.5698463737048947,
	"eval_f1_macro": 0.8154818599661411,
	"eval_f1_micro": 0.8505788712011578,
	"eval_loss": 0.10555566847324371,
	"eval_roc_auc": 0.9012750442052373,
	"eval_runtime": 657.1771,
	"eval_samples_per_second": 4.259,
	"eval_steps_per_second": 0.266,
	"learning_rate": 1e-05,
	"step": 40200
	},
	{
	"epoch": 75.56,
	"learning_rate": 1e-05,
	"loss": 0.1079,
	"step": 40500
	},
	{
	"epoch": 76.0,
	"eval_accuracy": 0.572347266881029,
	"eval_f1_macro": 0.8153806167901401,
	"eval_f1_micro": 0.8517114840883114,
	"eval_loss": 0.10429207235574722,
	"eval_roc_auc": 0.9026594578808756,
	"eval_runtime": 664.6613,
	"eval_samples_per_second": 4.211,
	"eval_steps_per_second": 0.263,
	"learning_rate": 1e-05,
	"step": 40736
	},
	{
	"epoch": 76.49,
	"learning_rate": 1e-05,
	"loss": 0.1072,
	"step": 41000
	},
	{
	"epoch": 77.0,
	"eval_accuracy": 0.5780635941407646,
	"eval_f1_macro": 0.8187874152985335,
	"eval_f1_micro": 0.853607002716571,
	"eval_loss": 0.10398340970277786,
	"eval_roc_auc": 0.9026235354990767,
	"eval_runtime": 664.3977,
	"eval_samples_per_second": 4.213,
	"eval_steps_per_second": 0.263,
	"learning_rate": 1e-05,
	"step": 41272
	},
	{
	"epoch": 77.43,
	"learning_rate": 1e-05,
	"loss": 0.105,
	"step": 41500
	},
	{
	"epoch": 78.0,
	"eval_accuracy": 0.5712754555198285,
	"eval_f1_macro": 0.8150330415154026,
	"eval_f1_micro": 0.8514409743156879,
	"eval_loss": 0.10431113094091415,
	"eval_roc_auc": 0.9018006351128146,
	"eval_runtime": 660.4258,
	"eval_samples_per_second": 4.238,
	"eval_steps_per_second": 0.265,
	"learning_rate": 1e-05,
	"step": 41808
	},
	{
	"epoch": 78.36,
	"learning_rate": 1e-05,
	"loss": 0.1061,
	"step": 42000
	},
	{
	"epoch": 79.0,
	"eval_accuracy": 0.5734190782422294,
	"eval_f1_macro": 0.8180685346674,
	"eval_f1_micro": 0.8525934861278649,
	"eval_loss": 0.10427288711071014,
	"eval_roc_auc": 0.9023377306953573,
	"eval_runtime": 662.4252,
	"eval_samples_per_second": 4.225,
	"eval_steps_per_second": 0.264,
	"learning_rate": 1e-05,
	"step": 42344
	},
	{
	"epoch": 79.29,
	"learning_rate": 1e-05,
	"loss": 0.1045,
	"step": 42500
	},
	{
	"epoch": 80.0,
	"eval_accuracy": 0.5719899964272954,
	"eval_f1_macro": 0.8176554657248621,
	"eval_f1_micro": 0.8512023142288917,
	"eval_loss": 0.10507169365882874,
	"eval_roc_auc": 0.9017990921847413,
	"eval_runtime": 662.5216,
	"eval_samples_per_second": 4.225,
	"eval_steps_per_second": 0.264,
	"learning_rate": 1e-05,
	"step": 42880
	},
	{
	"epoch": 80.22,
	"learning_rate": 1e-05,
	"loss": 0.1062,
	"step": 43000
	},
	{
	"epoch": 81.0,
	"eval_accuracy": 0.5694891032511611,
	"eval_f1_macro": 0.8157488543073257,
	"eval_f1_micro": 0.8500577402297453,
	"eval_loss": 0.10686225444078445,
	"eval_roc_auc": 0.8984886750378719,
	"eval_runtime": 655.8239,
	"eval_samples_per_second": 4.268,
	"eval_steps_per_second": 0.267,
	"learning_rate": 1e-05,
	"step": 43416
	},
	{
	"epoch": 81.16,
	"learning_rate": 1e-05,
	"loss": 0.1057,
	"step": 43500
	},
	{
	"epoch": 82.0,
	"eval_accuracy": 0.5734190782422294,
	"eval_f1_macro": 0.8184447896335341,
	"eval_f1_micro": 0.8530242056579975,
	"eval_loss": 0.1039666160941124,
	"eval_roc_auc": 0.9039006170654286,
	"eval_runtime": 659.9314,
	"eval_samples_per_second": 4.241,
	"eval_steps_per_second": 0.265,
	"learning_rate": 1e-05,
	"step": 43952
	},
	{
	"epoch": 82.09,
	"learning_rate": 1e-05,
	"loss": 0.1073,
	"step": 44000
	},
	{
	"epoch": 83.0,
	"eval_accuracy": 0.5712754555198285,
	"eval_f1_macro": 0.8151349204991644,
	"eval_f1_micro": 0.8503600634688149,
	"eval_loss": 0.10477207601070404,
	"eval_roc_auc": 0.8973831902752079,
	"eval_runtime": 660.9853,
	"eval_samples_per_second": 4.235,
	"eval_steps_per_second": 0.265,
	"learning_rate": 1e-05,
	"step": 44488
	},
	{
	"epoch": 83.02,
	"learning_rate": 1e-05,
	"loss": 0.1053,
	"step": 44500
	},
	{
	"epoch": 83.96,
	"learning_rate": 1e-05,
	"loss": 0.1059,
	"step": 45000
	},
	{
	"epoch": 84.0,
	"eval_accuracy": 0.5741336191496963,
	"eval_f1_macro": 0.8177615611039802,
	"eval_f1_micro": 0.8525637163342773,
	"eval_loss": 0.1043851226568222,
	"eval_roc_auc": 0.9026457060993854,
	"eval_runtime": 661.1385,
	"eval_samples_per_second": 4.234,
	"eval_steps_per_second": 0.265,
	"learning_rate": 1e-05,
	"step": 45024
	},
	{
	"epoch": 84.89,
	"learning_rate": 1e-05,
	"loss": 0.1054,
	"step": 45500
	},
	{
	"epoch": 85.0,
	"eval_accuracy": 0.5702036441586281,
	"eval_f1_macro": 0.8148620661290662,
	"eval_f1_micro": 0.8505413415593056,
	"eval_loss": 0.10626183450222015,
	"eval_roc_auc": 0.9002829286929828,
	"eval_runtime": 667.6418,
	"eval_samples_per_second": 4.192,
	"eval_steps_per_second": 0.262,
	"learning_rate": 1e-05,
	"step": 45560
	},
	{
	"epoch": 85.82,
	"learning_rate": 1e-05,
	"loss": 0.1046,
	"step": 46000
	},
	{
	"epoch": 86.0,
	"eval_accuracy": 0.5727045373347625,
	"eval_f1_macro": 0.8160800717420196,
	"eval_f1_micro": 0.8525306469231703,
	"eval_loss": 0.10432148724794388,
	"eval_roc_auc": 0.9003534996708482,
	"eval_runtime": 656.1196,
	"eval_samples_per_second": 4.266,
	"eval_steps_per_second": 0.267,
	"learning_rate": 1e-05,
	"step": 46096
	},
	{
	"epoch": 86.75,
	"learning_rate": 1e-05,
	"loss": 0.105,
	"step": 46500
	},
	{
	"epoch": 87.0,
	"eval_accuracy": 0.5719899964272954,
	"eval_f1_macro": 0.8185429098530308,
	"eval_f1_micro": 0.8532148646214804,
	"eval_loss": 0.10474765300750732,
	"eval_roc_auc": 0.904161869591144,
	"eval_runtime": 662.4652,
	"eval_samples_per_second": 4.225,
	"eval_steps_per_second": 0.264,
	"learning_rate": 1e-05,
	"step": 46632
	},
	{
	"epoch": 87.69,
	"learning_rate": 1e-05,
	"loss": 0.1029,
	"step": 47000
	},
	{
	"epoch": 88.0,
	"eval_accuracy": 0.5759199714183637,
	"eval_f1_macro": 0.8155503181233792,
	"eval_f1_micro": 0.8518207954000958,
	"eval_loss": 0.10432733595371246,
	"eval_roc_auc": 0.9041143079632091,
	"eval_runtime": 659.661,
	"eval_samples_per_second": 4.243,
	"eval_steps_per_second": 0.265,
	"learning_rate": 1e-05,
	"step": 47168
	},
	{
	"epoch": 88.62,
	"learning_rate": 1.0000000000000002e-06,
	"loss": 0.1059,
	"step": 47500
	},
	{
	"epoch": 89.0,
	"eval_accuracy": 0.5787781350482315,
	"eval_f1_macro": 0.8178092875894164,
	"eval_f1_micro": 0.8538892570946557,
	"eval_loss": 0.10400809347629547,
	"eval_roc_auc": 0.9033957884012571,
	"eval_runtime": 659.0133,
	"eval_samples_per_second": 4.247,
	"eval_steps_per_second": 0.266,
	"learning_rate": 1.0000000000000002e-06,
	"step": 47704
	},
	{
	"epoch": 89.55,
	"learning_rate": 1.0000000000000002e-06,
	"loss": 0.1047,
	"step": 48000
	},
	{
	"epoch": 90.0,
	"eval_accuracy": 0.5694891032511611,
	"eval_f1_macro": 0.8136056007290207,
	"eval_f1_micro": 0.8504655833485485,
	"eval_loss": 0.10469033569097519,
	"eval_roc_auc": 0.8982986976684738,
	"eval_runtime": 653.5683,
	"eval_samples_per_second": 4.283,
	"eval_steps_per_second": 0.268,
	"learning_rate": 1.0000000000000002e-06,
	"step": 48240
	},
	{
	"epoch": 90.0,
	"learning_rate": 1.0000000000000002e-06,
	"step": 48240,
	"total_flos": 6.13340503159962e+19,
	"train_loss": 0.13765035268679188,
	"train_runtime": 238196.7751,
	"train_samples_per_second": 3.237,
	"train_steps_per_second": 0.203
	}
	],
	"logging_steps": 500,
	"max_steps": 48240,
	"num_train_epochs": 90,
	"save_steps": 500,
	"total_flos": 6.13340503159962e+19,
	"trial_name": null,
	"trial_params": null
	}