All Dunn!!!

5068037 over 1 year ago

16.1 kB

	{
	"best_metric": null,
	"best_model_checkpoint": null,
	"epoch": 5.0,
	"global_step": 52190,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.0,
	"learning_rate": 0.000999980839241234,
	"loss": 0.7834,
	"step": 1
	},
	{
	"epoch": 0.05,
	"learning_rate": 0.0009899980839241235,
	"loss": 0.7384,
	"step": 522
	},
	{
	"epoch": 0.1,
	"learning_rate": 0.000979996167848247,
	"loss": 0.7597,
	"step": 1044
	},
	{
	"epoch": 0.15,
	"learning_rate": 0.0009699942517723703,
	"loss": 0.7401,
	"step": 1566
	},
	{
	"epoch": 0.2,
	"learning_rate": 0.0009599923356964936,
	"loss": 0.7495,
	"step": 2088
	},
	{
	"epoch": 0.25,
	"learning_rate": 0.000949990419620617,
	"loss": 0.7017,
	"step": 2610
	},
	{
	"epoch": 0.3,
	"learning_rate": 0.0009399885035447404,
	"loss": 0.7398,
	"step": 3132
	},
	{
	"epoch": 0.35,
	"learning_rate": 0.0009299865874688638,
	"loss": 0.6949,
	"step": 3654
	},
	{
	"epoch": 0.4,
	"learning_rate": 0.0009199846713929871,
	"loss": 0.6335,
	"step": 4176
	},
	{
	"epoch": 0.45,
	"learning_rate": 0.0009099827553171107,
	"loss": 0.648,
	"step": 4698
	},
	{
	"epoch": 0.5,
	"learning_rate": 0.000899980839241234,
	"loss": 0.6445,
	"step": 5220
	},
	{
	"epoch": 0.55,
	"learning_rate": 0.0008899789231653573,
	"loss": 0.6429,
	"step": 5742
	},
	{
	"epoch": 0.6,
	"learning_rate": 0.0008799770070894808,
	"loss": 0.6316,
	"step": 6264
	},
	{
	"epoch": 0.65,
	"learning_rate": 0.0008699750910136041,
	"loss": 0.6066,
	"step": 6786
	},
	{
	"epoch": 0.7,
	"learning_rate": 0.0008599731749377275,
	"loss": 0.6397,
	"step": 7308
	},
	{
	"epoch": 0.75,
	"learning_rate": 0.0008499712588618509,
	"loss": 0.6243,
	"step": 7830
	},
	{
	"epoch": 0.8,
	"learning_rate": 0.0008399693427859744,
	"loss": 0.6271,
	"step": 8352
	},
	{
	"epoch": 0.85,
	"learning_rate": 0.0008299674267100977,
	"loss": 0.614,
	"step": 8874
	},
	{
	"epoch": 0.9,
	"learning_rate": 0.0008199655106342211,
	"loss": 0.6358,
	"step": 9396
	},
	{
	"epoch": 0.95,
	"learning_rate": 0.0008099635945583445,
	"loss": 0.633,
	"step": 9918
	},
	{
	"epoch": 1.0,
	"eval_Macro F1": 0.5744881635875178,
	"eval_Macro Precision": 0.6541570568719827,
	"eval_Macro Recall": 0.564346253205228,
	"eval_Micro F1": 0.826105701864693,
	"eval_Micro Precision": 0.826105701864693,
	"eval_Micro Recall": 0.826105701864693,
	"eval_Weighted F1": 0.7913544313349856,
	"eval_Weighted Precision": 0.7843732666581203,
	"eval_Weighted Recall": 0.826105701864693,
	"eval_accuracy": 0.826105701864693,
	"eval_loss": 0.5608153343200684,
	"eval_runtime": 2136.2944,
	"eval_samples_per_second": 13.029,
	"eval_steps_per_second": 1.629,
	"step": 10438
	},
	{
	"epoch": 1.0,
	"learning_rate": 0.0007999616784824679,
	"loss": 0.6139,
	"step": 10440
	},
	{
	"epoch": 1.05,
	"learning_rate": 0.0007899597624065913,
	"loss": 0.5945,
	"step": 10962
	},
	{
	"epoch": 1.1,
	"learning_rate": 0.0007799578463307148,
	"loss": 0.6018,
	"step": 11484
	},
	{
	"epoch": 1.15,
	"learning_rate": 0.0007699559302548381,
	"loss": 0.597,
	"step": 12006
	},
	{
	"epoch": 1.2,
	"learning_rate": 0.0007599540141789615,
	"loss": 0.5891,
	"step": 12528
	},
	{
	"epoch": 1.25,
	"learning_rate": 0.0007499520981030848,
	"loss": 0.6139,
	"step": 13050
	},
	{
	"epoch": 1.3,
	"learning_rate": 0.0007399501820272084,
	"loss": 0.5878,
	"step": 13572
	},
	{
	"epoch": 1.35,
	"learning_rate": 0.0007299482659513317,
	"loss": 0.6183,
	"step": 14094
	},
	{
	"epoch": 1.4,
	"learning_rate": 0.0007199463498754551,
	"loss": 0.6038,
	"step": 14616
	},
	{
	"epoch": 1.45,
	"learning_rate": 0.0007099444337995785,
	"loss": 0.6506,
	"step": 15138
	},
	{
	"epoch": 1.5,
	"learning_rate": 0.0006999425177237019,
	"loss": 0.6063,
	"step": 15660
	},
	{
	"epoch": 1.55,
	"learning_rate": 0.0006899406016478252,
	"loss": 0.5931,
	"step": 16182
	},
	{
	"epoch": 1.6,
	"learning_rate": 0.0006799386855719488,
	"loss": 0.5828,
	"step": 16704
	},
	{
	"epoch": 1.65,
	"learning_rate": 0.0006699367694960721,
	"loss": 0.5912,
	"step": 17226
	},
	{
	"epoch": 1.7,
	"learning_rate": 0.0006599348534201954,
	"loss": 0.6105,
	"step": 17748
	},
	{
	"epoch": 1.75,
	"learning_rate": 0.0006499329373443188,
	"loss": 0.5893,
	"step": 18270
	},
	{
	"epoch": 1.8,
	"learning_rate": 0.0006399310212684422,
	"loss": 0.611,
	"step": 18792
	},
	{
	"epoch": 1.85,
	"learning_rate": 0.0006299291051925656,
	"loss": 0.6371,
	"step": 19314
	},
	{
	"epoch": 1.9,
	"learning_rate": 0.000619927189116689,
	"loss": 0.5925,
	"step": 19836
	},
	{
	"epoch": 1.95,
	"learning_rate": 0.0006099252730408125,
	"loss": 0.6029,
	"step": 20358
	},
	{
	"epoch": 2.0,
	"eval_Macro F1": 0.5060450221643912,
	"eval_Macro Precision": 0.6929448637916937,
	"eval_Macro Recall": 0.5239477514921818,
	"eval_Micro F1": 0.8330758452197032,
	"eval_Micro Precision": 0.8330758452197032,
	"eval_Micro Recall": 0.8330758452197032,
	"eval_Weighted F1": 0.7724263350491593,
	"eval_Weighted Precision": 0.7892310862523967,
	"eval_Weighted Recall": 0.8330758452197032,
	"eval_accuracy": 0.8330758452197032,
	"eval_loss": 0.6489848494529724,
	"eval_runtime": 1320.9895,
	"eval_samples_per_second": 21.07,
	"eval_steps_per_second": 2.634,
	"step": 20876
	},
	{
	"epoch": 2.0,
	"learning_rate": 0.0005999233569649358,
	"loss": 0.5882,
	"step": 20880
	},
	{
	"epoch": 2.05,
	"learning_rate": 0.0005899214408890592,
	"loss": 0.5831,
	"step": 21402
	},
	{
	"epoch": 2.1,
	"learning_rate": 0.0005799195248131826,
	"loss": 0.5755,
	"step": 21924
	},
	{
	"epoch": 2.15,
	"learning_rate": 0.000569917608737306,
	"loss": 0.5822,
	"step": 22446
	},
	{
	"epoch": 2.2,
	"learning_rate": 0.0005599156926614294,
	"loss": 0.5632,
	"step": 22968
	},
	{
	"epoch": 2.25,
	"learning_rate": 0.0005499137765855528,
	"loss": 0.5756,
	"step": 23490
	},
	{
	"epoch": 2.3,
	"learning_rate": 0.0005399118605096762,
	"loss": 0.6018,
	"step": 24012
	},
	{
	"epoch": 2.35,
	"learning_rate": 0.0005299099444337996,
	"loss": 0.5978,
	"step": 24534
	},
	{
	"epoch": 2.4,
	"learning_rate": 0.0005199080283579229,
	"loss": 0.5767,
	"step": 25056
	},
	{
	"epoch": 2.45,
	"learning_rate": 0.0005099061122820464,
	"loss": 0.5538,
	"step": 25578
	},
	{
	"epoch": 2.5,
	"learning_rate": 0.0004999041962061698,
	"loss": 0.5621,
	"step": 26100
	},
	{
	"epoch": 2.55,
	"learning_rate": 0.0004899022801302932,
	"loss": 0.594,
	"step": 26622
	},
	{
	"epoch": 2.6,
	"learning_rate": 0.00047990036405441656,
	"loss": 0.5616,
	"step": 27144
	},
	{
	"epoch": 2.65,
	"learning_rate": 0.00046989844797853996,
	"loss": 0.5444,
	"step": 27666
	},
	{
	"epoch": 2.7,
	"learning_rate": 0.00045989653190266336,
	"loss": 0.5558,
	"step": 28188
	},
	{
	"epoch": 2.75,
	"learning_rate": 0.00044989461582678675,
	"loss": 0.5415,
	"step": 28710
	},
	{
	"epoch": 2.8,
	"learning_rate": 0.0004398926997509101,
	"loss": 0.5452,
	"step": 29232
	},
	{
	"epoch": 2.85,
	"learning_rate": 0.00042989078367503355,
	"loss": 0.5595,
	"step": 29754
	},
	{
	"epoch": 2.9,
	"learning_rate": 0.00041988886759915695,
	"loss": 0.565,
	"step": 30276
	},
	{
	"epoch": 2.95,
	"learning_rate": 0.0004098869515232803,
	"loss": 0.5478,
	"step": 30798
	},
	{
	"epoch": 3.0,
	"eval_Macro F1": 0.6188634906559709,
	"eval_Macro Precision": 0.6783819638851676,
	"eval_Macro Recall": 0.6003398559173716,
	"eval_Micro F1": 0.8304530593180757,
	"eval_Micro Precision": 0.8304530593180757,
	"eval_Micro Recall": 0.8304530593180757,
	"eval_Weighted F1": 0.8070780134214183,
	"eval_Weighted Precision": 0.8001960025950923,
	"eval_Weighted Recall": 0.8304530593180757,
	"eval_accuracy": 0.8304530593180757,
	"eval_loss": 0.5508156418800354,
	"eval_runtime": 1285.8765,
	"eval_samples_per_second": 21.645,
	"eval_steps_per_second": 2.706,
	"step": 31314
	},
	{
	"epoch": 3.0,
	"learning_rate": 0.00039988503544740374,
	"loss": 0.5593,
	"step": 31320
	},
	{
	"epoch": 3.05,
	"learning_rate": 0.0003898831193715271,
	"loss": 0.5348,
	"step": 31842
	},
	{
	"epoch": 3.1,
	"learning_rate": 0.0003798812032956505,
	"loss": 0.5459,
	"step": 32364
	},
	{
	"epoch": 3.15,
	"learning_rate": 0.00036987928721977394,
	"loss": 0.5544,
	"step": 32886
	},
	{
	"epoch": 3.2,
	"learning_rate": 0.0003598773711438973,
	"loss": 0.5442,
	"step": 33408
	},
	{
	"epoch": 3.25,
	"learning_rate": 0.00034987545506802074,
	"loss": 0.542,
	"step": 33930
	},
	{
	"epoch": 3.3,
	"learning_rate": 0.0003398735389921441,
	"loss": 0.5325,
	"step": 34452
	},
	{
	"epoch": 3.35,
	"learning_rate": 0.0003298716229162675,
	"loss": 0.5525,
	"step": 34974
	},
	{
	"epoch": 3.4,
	"learning_rate": 0.00031986970684039093,
	"loss": 0.5547,
	"step": 35496
	},
	{
	"epoch": 3.45,
	"learning_rate": 0.0003098677907645143,
	"loss": 0.5484,
	"step": 36018
	},
	{
	"epoch": 3.5,
	"learning_rate": 0.00029986587468863767,
	"loss": 0.5368,
	"step": 36540
	},
	{
	"epoch": 3.55,
	"learning_rate": 0.00028986395861276107,
	"loss": 0.5487,
	"step": 37062
	},
	{
	"epoch": 3.6,
	"learning_rate": 0.00027986204253688447,
	"loss": 0.5403,
	"step": 37584
	},
	{
	"epoch": 3.65,
	"learning_rate": 0.00026986012646100787,
	"loss": 0.5459,
	"step": 38106
	},
	{
	"epoch": 3.7,
	"learning_rate": 0.00025985821038513126,
	"loss": 0.5376,
	"step": 38628
	},
	{
	"epoch": 3.75,
	"learning_rate": 0.00024985629430925466,
	"loss": 0.5186,
	"step": 39150
	},
	{
	"epoch": 3.8,
	"learning_rate": 0.00023985437823337806,
	"loss": 0.5371,
	"step": 39672
	},
	{
	"epoch": 3.85,
	"learning_rate": 0.00022985246215750143,
	"loss": 0.5413,
	"step": 40194
	},
	{
	"epoch": 3.9,
	"learning_rate": 0.00021985054608162483,
	"loss": 0.5328,
	"step": 40716
	},
	{
	"epoch": 3.95,
	"learning_rate": 0.00020984863000574823,
	"loss": 0.513,
	"step": 41238
	},
	{
	"epoch": 4.0,
	"eval_Macro F1": 0.6224111150035051,
	"eval_Macro Precision": 0.6915564589610266,
	"eval_Macro Recall": 0.60231662265339,
	"eval_Micro F1": 0.8347285596234686,
	"eval_Micro Precision": 0.8347285596234686,
	"eval_Micro Recall": 0.8347285596234686,
	"eval_Weighted F1": 0.8100695837354521,
	"eval_Weighted Precision": 0.8049325371288767,
	"eval_Weighted Recall": 0.8347285596234686,
	"eval_accuracy": 0.8347285596234686,
	"eval_loss": 0.5459285974502563,
	"eval_runtime": 1277.4842,
	"eval_samples_per_second": 21.787,
	"eval_steps_per_second": 2.724,
	"step": 41752
	},
	{
	"epoch": 4.0,
	"learning_rate": 0.00019984671392987163,
	"loss": 0.5375,
	"step": 41760
	},
	{
	"epoch": 4.05,
	"learning_rate": 0.00018984479785399502,
	"loss": 0.5505,
	"step": 42282
	},
	{
	"epoch": 4.1,
	"learning_rate": 0.00017984288177811842,
	"loss": 0.5258,
	"step": 42804
	},
	{
	"epoch": 4.15,
	"learning_rate": 0.00016984096570224182,
	"loss": 0.5132,
	"step": 43326
	},
	{
	"epoch": 4.2,
	"learning_rate": 0.0001598390496263652,
	"loss": 0.5182,
	"step": 43848
	},
	{
	"epoch": 4.25,
	"learning_rate": 0.00014983713355048862,
	"loss": 0.5147,
	"step": 44370
	},
	{
	"epoch": 4.3,
	"learning_rate": 0.00013983521747461201,
	"loss": 0.5364,
	"step": 44892
	},
	{
	"epoch": 4.35,
	"learning_rate": 0.00012983330139873538,
	"loss": 0.53,
	"step": 45414
	},
	{
	"epoch": 4.4,
	"learning_rate": 0.00011983138532285878,
	"loss": 0.5288,
	"step": 45936
	},
	{
	"epoch": 4.45,
	"learning_rate": 0.00010982946924698218,
	"loss": 0.5087,
	"step": 46458
	},
	{
	"epoch": 4.5,
	"learning_rate": 9.982755317110558e-05,
	"loss": 0.5101,
	"step": 46980
	},
	{
	"epoch": 4.55,
	"learning_rate": 8.982563709522898e-05,
	"loss": 0.5235,
	"step": 47502
	},
	{
	"epoch": 4.6,
	"learning_rate": 7.982372101935238e-05,
	"loss": 0.5143,
	"step": 48024
	},
	{
	"epoch": 4.65,
	"learning_rate": 6.982180494347576e-05,
	"loss": 0.5299,
	"step": 48546
	},
	{
	"epoch": 4.7,
	"learning_rate": 5.981988886759916e-05,
	"loss": 0.5362,
	"step": 49068
	},
	{
	"epoch": 4.75,
	"learning_rate": 4.981797279172255e-05,
	"loss": 0.5186,
	"step": 49590
	},
	{
	"epoch": 4.8,
	"learning_rate": 3.981605671584595e-05,
	"loss": 0.5256,
	"step": 50112
	},
	{
	"epoch": 4.85,
	"learning_rate": 2.9814140639969346e-05,
	"loss": 0.5233,
	"step": 50634
	},
	{
	"epoch": 4.9,
	"learning_rate": 1.9812224564092737e-05,
	"loss": 0.5263,
	"step": 51156
	},
	{
	"epoch": 4.95,
	"learning_rate": 9.810308488216133e-06,
	"loss": 0.5288,
	"step": 51678
	},
	{
	"epoch": 5.0,
	"eval_Macro F1": 0.6307998158823078,
	"eval_Macro Precision": 0.7029273840489014,
	"eval_Macro Recall": 0.6089557840149206,
	"eval_Micro F1": 0.8381417741529839,
	"eval_Micro Precision": 0.8381417741529839,
	"eval_Micro Recall": 0.8381417741529839,
	"eval_Weighted F1": 0.8141748808079556,
	"eval_Weighted Precision": 0.810121498718634,
	"eval_Weighted Recall": 0.8381417741529839,
	"eval_accuracy": 0.8381417741529839,
	"eval_loss": 0.5336272716522217,
	"eval_runtime": 1277.7048,
	"eval_samples_per_second": 21.784,
	"eval_steps_per_second": 2.724,
	"step": 52190
	},
	{
	"epoch": 5.0,
	"step": 52190,
	"total_flos": 2.1040687845486864e+16,
	"train_loss": 0.5799241374931839,
	"train_runtime": 32322.6365,
	"train_samples_per_second": 12.916,
	"train_steps_per_second": 1.615
	}
	],
	"max_steps": 52190,
	"num_train_epochs": 5,
	"total_flos": 2.1040687845486864e+16,
	"trial_name": null,
	"trial_params": null
	}