layoutlmv3-large-finetuned-funsd / trainer_state.json

add

6661811 about 2 years ago

No virus

18.3 kB

	{
	"best_metric": null,
	"best_model_checkpoint": null,
	"epoch": 100.0,
	"global_step": 1000,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 2.0,
	"eval_accuracy": 0.7733118971061094,
	"eval_f1": 0.7518500246669956,
	"eval_loss": 0.8074839115142822,
	"eval_precision": 0.7419668938656281,
	"eval_recall": 0.762,
	"eval_runtime": 2.1702,
	"eval_samples_per_second": 24.883,
	"eval_steps_per_second": 0.461,
	"step": 20
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.8378502526412495,
	"eval_f1": 0.8489243413101281,
	"eval_loss": 0.6263514161109924,
	"eval_precision": 0.8217126813289658,
	"eval_recall": 0.878,
	"eval_runtime": 1.8285,
	"eval_samples_per_second": 29.533,
	"eval_steps_per_second": 0.547,
	"step": 40
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.8375057418465779,
	"eval_f1": 0.8824383164005806,
	"eval_loss": 0.5844890475273132,
	"eval_precision": 0.8547328959700093,
	"eval_recall": 0.912,
	"eval_runtime": 1.6994,
	"eval_samples_per_second": 31.775,
	"eval_steps_per_second": 0.588,
	"step": 60
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.8396876435461644,
	"eval_f1": 0.8708251473477405,
	"eval_loss": 0.7096832990646362,
	"eval_precision": 0.8556949806949807,
	"eval_recall": 0.8865,
	"eval_runtime": 1.9498,
	"eval_samples_per_second": 27.695,
	"eval_steps_per_second": 0.513,
	"step": 80
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.8438217730822233,
	"eval_f1": 0.8839153959665518,
	"eval_loss": 0.7337720394134521,
	"eval_precision": 0.8697967086156825,
	"eval_recall": 0.8985,
	"eval_runtime": 1.6222,
	"eval_samples_per_second": 33.289,
	"eval_steps_per_second": 0.616,
	"step": 100
	},
	{
	"epoch": 12.0,
	"eval_accuracy": 0.8494487827285255,
	"eval_f1": 0.8967391304347826,
	"eval_loss": 0.8648139238357544,
	"eval_precision": 0.88623046875,
	"eval_recall": 0.9075,
	"eval_runtime": 1.6638,
	"eval_samples_per_second": 32.455,
	"eval_steps_per_second": 0.601,
	"step": 120
	},
	{
	"epoch": 14.0,
	"eval_accuracy": 0.8330271015158475,
	"eval_f1": 0.8940709501364426,
	"eval_loss": 0.8960414528846741,
	"eval_precision": 0.8872476612506155,
	"eval_recall": 0.901,
	"eval_runtime": 1.8377,
	"eval_samples_per_second": 29.384,
	"eval_steps_per_second": 0.544,
	"step": 140
	},
	{
	"epoch": 16.0,
	"eval_accuracy": 0.8408360128617364,
	"eval_f1": 0.897062453715132,
	"eval_loss": 0.9291977882385254,
	"eval_precision": 0.8859093125304729,
	"eval_recall": 0.9085,
	"eval_runtime": 2.2856,
	"eval_samples_per_second": 23.626,
	"eval_steps_per_second": 0.438,
	"step": 160
	},
	{
	"epoch": 18.0,
	"eval_accuracy": 0.8530087276067984,
	"eval_f1": 0.9070520807376028,
	"eval_loss": 0.956124484539032,
	"eval_precision": 0.9041231992051664,
	"eval_recall": 0.91,
	"eval_runtime": 2.1004,
	"eval_samples_per_second": 25.71,
	"eval_steps_per_second": 0.476,
	"step": 180
	},
	{
	"epoch": 20.0,
	"eval_accuracy": 0.8460036747818098,
	"eval_f1": 0.9054455445544554,
	"eval_loss": 1.1085299253463745,
	"eval_precision": 0.8965686274509804,
	"eval_recall": 0.9145,
	"eval_runtime": 1.9718,
	"eval_samples_per_second": 27.386,
	"eval_steps_per_second": 0.507,
	"step": 200
	},
	{
	"epoch": 22.0,
	"eval_accuracy": 0.8494487827285255,
	"eval_f1": 0.9123157631776169,
	"eval_loss": 1.1246980428695679,
	"eval_precision": 0.9116325511732402,
	"eval_recall": 0.913,
	"eval_runtime": 2.2938,
	"eval_samples_per_second": 23.541,
	"eval_steps_per_second": 0.436,
	"step": 220
	},
	{
	"epoch": 24.0,
	"eval_accuracy": 0.8488745980707395,
	"eval_f1": 0.9118450459399057,
	"eval_loss": 1.2039830684661865,
	"eval_precision": 0.9057720769610261,
	"eval_recall": 0.918,
	"eval_runtime": 2.3959,
	"eval_samples_per_second": 22.539,
	"eval_steps_per_second": 0.417,
	"step": 240
	},
	{
	"epoch": 26.0,
	"eval_accuracy": 0.8449701423977951,
	"eval_f1": 0.9141426783479348,
	"eval_loss": 1.2313123941421509,
	"eval_precision": 0.9152882205513785,
	"eval_recall": 0.913,
	"eval_runtime": 1.8248,
	"eval_samples_per_second": 29.592,
	"eval_steps_per_second": 0.548,
	"step": 260
	},
	{
	"epoch": 28.0,
	"eval_accuracy": 0.8450849793293523,
	"eval_f1": 0.9095876800794833,
	"eval_loss": 1.2972946166992188,
	"eval_precision": 0.903751233958539,
	"eval_recall": 0.9155,
	"eval_runtime": 2.3256,
	"eval_samples_per_second": 23.219,
	"eval_steps_per_second": 0.43,
	"step": 280
	},
	{
	"epoch": 30.0,
	"eval_accuracy": 0.8516306844281121,
	"eval_f1": 0.9177467597208374,
	"eval_loss": 1.27461838722229,
	"eval_precision": 0.9150099403578529,
	"eval_recall": 0.9205,
	"eval_runtime": 2.085,
	"eval_samples_per_second": 25.899,
	"eval_steps_per_second": 0.48,
	"step": 300
	},
	{
	"epoch": 32.0,
	"eval_accuracy": 0.8451998162609095,
	"eval_f1": 0.9093167701863354,
	"eval_loss": 1.3256772756576538,
	"eval_precision": 0.9037037037037037,
	"eval_recall": 0.915,
	"eval_runtime": 1.6622,
	"eval_samples_per_second": 32.487,
	"eval_steps_per_second": 0.602,
	"step": 320
	},
	{
	"epoch": 34.0,
	"eval_accuracy": 0.8609324758842444,
	"eval_f1": 0.9068725099601593,
	"eval_loss": 1.1881499290466309,
	"eval_precision": 0.9032738095238095,
	"eval_recall": 0.9105,
	"eval_runtime": 1.8765,
	"eval_samples_per_second": 28.777,
	"eval_steps_per_second": 0.533,
	"step": 340
	},
	{
	"epoch": 36.0,
	"eval_accuracy": 0.8310748736793753,
	"eval_f1": 0.9006986027944112,
	"eval_loss": 1.4595391750335693,
	"eval_precision": 0.8989043824701195,
	"eval_recall": 0.9025,
	"eval_runtime": 1.593,
	"eval_samples_per_second": 33.898,
	"eval_steps_per_second": 0.628,
	"step": 360
	},
	{
	"epoch": 38.0,
	"eval_accuracy": 0.8542719338539274,
	"eval_f1": 0.9134879082523062,
	"eval_loss": 1.3311606645584106,
	"eval_precision": 0.9109895574341124,
	"eval_recall": 0.916,
	"eval_runtime": 2.269,
	"eval_samples_per_second": 23.799,
	"eval_steps_per_second": 0.441,
	"step": 380
	},
	{
	"epoch": 40.0,
	"eval_accuracy": 0.8555351401010565,
	"eval_f1": 0.9195,
	"eval_loss": 1.2927559614181519,
	"eval_precision": 0.9195,
	"eval_recall": 0.9195,
	"eval_runtime": 1.8831,
	"eval_samples_per_second": 28.676,
	"eval_steps_per_second": 0.531,
	"step": 400
	},
	{
	"epoch": 42.0,
	"eval_accuracy": 0.8598989435002297,
	"eval_f1": 0.9248439450686643,
	"eval_loss": 1.3193974494934082,
	"eval_precision": 0.9236907730673317,
	"eval_recall": 0.926,
	"eval_runtime": 1.733,
	"eval_samples_per_second": 31.16,
	"eval_steps_per_second": 0.577,
	"step": 420
	},
	{
	"epoch": 44.0,
	"eval_accuracy": 0.8456591639871383,
	"eval_f1": 0.9162290572643161,
	"eval_loss": 1.455527424812317,
	"eval_precision": 0.9164582291145573,
	"eval_recall": 0.916,
	"eval_runtime": 2.5054,
	"eval_samples_per_second": 21.554,
	"eval_steps_per_second": 0.399,
	"step": 440
	},
	{
	"epoch": 46.0,
	"eval_accuracy": 0.8541570969223702,
	"eval_f1": 0.916729182295574,
	"eval_loss": 1.4188611507415771,
	"eval_precision": 0.9169584792396198,
	"eval_recall": 0.9165,
	"eval_runtime": 2.3672,
	"eval_samples_per_second": 22.811,
	"eval_steps_per_second": 0.422,
	"step": 460
	},
	{
	"epoch": 48.0,
	"eval_accuracy": 0.8516306844281121,
	"eval_f1": 0.9209932279909707,
	"eval_loss": 1.462133765220642,
	"eval_precision": 0.9240060392551586,
	"eval_recall": 0.918,
	"eval_runtime": 2.0221,
	"eval_samples_per_second": 26.705,
	"eval_steps_per_second": 0.495,
	"step": 480
	},
	{
	"epoch": 50.0,
	"learning_rate": 5e-06,
	"loss": 0.1212,
	"step": 500
	},
	{
	"epoch": 50.0,
	"eval_accuracy": 0.8492191088654111,
	"eval_f1": 0.9188919391065635,
	"eval_loss": 1.5107489824295044,
	"eval_precision": 0.9172894867962132,
	"eval_recall": 0.9205,
	"eval_runtime": 2.2455,
	"eval_samples_per_second": 24.048,
	"eval_steps_per_second": 0.445,
	"step": 500
	},
	{
	"epoch": 52.0,
	"eval_accuracy": 0.8520900321543409,
	"eval_f1": 0.9225037257824144,
	"eval_loss": 1.3997772932052612,
	"eval_precision": 0.9165844027640672,
	"eval_recall": 0.9285,
	"eval_runtime": 1.6019,
	"eval_samples_per_second": 33.711,
	"eval_steps_per_second": 0.624,
	"step": 520
	},
	{
	"epoch": 54.0,
	"eval_accuracy": 0.8531235645383556,
	"eval_f1": 0.9185,
	"eval_loss": 1.3953099250793457,
	"eval_precision": 0.9185,
	"eval_recall": 0.9185,
	"eval_runtime": 2.4867,
	"eval_samples_per_second": 21.715,
	"eval_steps_per_second": 0.402,
	"step": 540
	},
	{
	"epoch": 56.0,
	"eval_accuracy": 0.8493339457969683,
	"eval_f1": 0.9165622650964669,
	"eval_loss": 1.424229621887207,
	"eval_precision": 0.9186338523355098,
	"eval_recall": 0.9145,
	"eval_runtime": 2.2429,
	"eval_samples_per_second": 24.076,
	"eval_steps_per_second": 0.446,
	"step": 560
	},
	{
	"epoch": 58.0,
	"eval_accuracy": 0.8508268259072118,
	"eval_f1": 0.9144851657940662,
	"eval_loss": 1.4575742483139038,
	"eval_precision": 0.9119840875186475,
	"eval_recall": 0.917,
	"eval_runtime": 1.7215,
	"eval_samples_per_second": 31.368,
	"eval_steps_per_second": 0.581,
	"step": 580
	},
	{
	"epoch": 60.0,
	"eval_accuracy": 0.8524345429490124,
	"eval_f1": 0.9176001991535974,
	"eval_loss": 1.469473123550415,
	"eval_precision": 0.9137332672285573,
	"eval_recall": 0.9215,
	"eval_runtime": 2.1512,
	"eval_samples_per_second": 25.102,
	"eval_steps_per_second": 0.465,
	"step": 600
	},
	{
	"epoch": 62.0,
	"eval_accuracy": 0.8517455213596693,
	"eval_f1": 0.918474195961107,
	"eval_loss": 1.4966249465942383,
	"eval_precision": 0.9159622078567876,
	"eval_recall": 0.921,
	"eval_runtime": 2.0241,
	"eval_samples_per_second": 26.678,
	"eval_steps_per_second": 0.494,
	"step": 620
	},
	{
	"epoch": 64.0,
	"eval_accuracy": 0.8484152503445108,
	"eval_f1": 0.92,
	"eval_loss": 1.5030325651168823,
	"eval_precision": 0.92,
	"eval_recall": 0.92,
	"eval_runtime": 2.1745,
	"eval_samples_per_second": 24.834,
	"eval_steps_per_second": 0.46,
	"step": 640
	},
	{
	"epoch": 66.0,
	"eval_accuracy": 0.8462333486449242,
	"eval_f1": 0.9175591531755916,
	"eval_loss": 1.4818426370620728,
	"eval_precision": 0.9141439205955335,
	"eval_recall": 0.921,
	"eval_runtime": 2.068,
	"eval_samples_per_second": 26.112,
	"eval_steps_per_second": 0.484,
	"step": 660
	},
	{
	"epoch": 68.0,
	"eval_accuracy": 0.8497932935231971,
	"eval_f1": 0.9201501877346684,
	"eval_loss": 1.4994901418685913,
	"eval_precision": 0.9213032581453634,
	"eval_recall": 0.919,
	"eval_runtime": 1.5887,
	"eval_samples_per_second": 33.99,
	"eval_steps_per_second": 0.629,
	"step": 680
	},
	{
	"epoch": 70.0,
	"eval_accuracy": 0.8501378043178687,
	"eval_f1": 0.9175180662845751,
	"eval_loss": 1.52091383934021,
	"eval_precision": 0.914555389965226,
	"eval_recall": 0.9205,
	"eval_runtime": 2.0412,
	"eval_samples_per_second": 26.455,
	"eval_steps_per_second": 0.49,
	"step": 700
	},
	{
	"epoch": 72.0,
	"eval_accuracy": 0.8465778594395957,
	"eval_f1": 0.9170633926334252,
	"eval_loss": 1.54710054397583,
	"eval_precision": 0.9191361125062782,
	"eval_recall": 0.915,
	"eval_runtime": 1.9021,
	"eval_samples_per_second": 28.39,
	"eval_steps_per_second": 0.526,
	"step": 720
	},
	{
	"epoch": 74.0,
	"eval_accuracy": 0.8531235645383556,
	"eval_f1": 0.919080919080919,
	"eval_loss": 1.5027331113815308,
	"eval_precision": 0.9181636726546906,
	"eval_recall": 0.92,
	"eval_runtime": 2.6669,
	"eval_samples_per_second": 20.248,
	"eval_steps_per_second": 0.375,
	"step": 740
	},
	{
	"epoch": 76.0,
	"eval_accuracy": 0.8531235645383556,
	"eval_f1": 0.9171464330413016,
	"eval_loss": 1.5013470649719238,
	"eval_precision": 0.9182957393483709,
	"eval_recall": 0.916,
	"eval_runtime": 2.1913,
	"eval_samples_per_second": 24.643,
	"eval_steps_per_second": 0.456,
	"step": 760
	},
	{
	"epoch": 78.0,
	"eval_accuracy": 0.8509416628387689,
	"eval_f1": 0.9218045112781955,
	"eval_loss": 1.5246856212615967,
	"eval_precision": 0.9241206030150754,
	"eval_recall": 0.9195,
	"eval_runtime": 1.7299,
	"eval_samples_per_second": 31.215,
	"eval_steps_per_second": 0.578,
	"step": 780
	},
	{
	"epoch": 80.0,
	"eval_accuracy": 0.8507119889756546,
	"eval_f1": 0.9178286852589641,
	"eval_loss": 1.5289556980133057,
	"eval_precision": 0.9141865079365079,
	"eval_recall": 0.9215,
	"eval_runtime": 1.9199,
	"eval_samples_per_second": 28.126,
	"eval_steps_per_second": 0.521,
	"step": 800
	},
	{
	"epoch": 82.0,
	"eval_accuracy": 0.852779053743684,
	"eval_f1": 0.9211576846307385,
	"eval_loss": 1.523385763168335,
	"eval_precision": 0.9193227091633466,
	"eval_recall": 0.923,
	"eval_runtime": 1.6928,
	"eval_samples_per_second": 31.899,
	"eval_steps_per_second": 0.591,
	"step": 820
	},
	{
	"epoch": 84.0,
	"eval_accuracy": 0.8535829122645843,
	"eval_f1": 0.9211183225162256,
	"eval_loss": 1.5238100290298462,
	"eval_precision": 0.919740777666999,
	"eval_recall": 0.9225,
	"eval_runtime": 1.7587,
	"eval_samples_per_second": 30.704,
	"eval_steps_per_second": 0.569,
	"step": 840
	},
	{
	"epoch": 86.0,
	"eval_accuracy": 0.8497932935231971,
	"eval_f1": 0.9178116412690482,
	"eval_loss": 1.52961266040802,
	"eval_precision": 0.9171243135297055,
	"eval_recall": 0.9185,
	"eval_runtime": 2.2872,
	"eval_samples_per_second": 23.609,
	"eval_steps_per_second": 0.437,
	"step": 860
	},
	{
	"epoch": 88.0,
	"eval_accuracy": 0.8484152503445108,
	"eval_f1": 0.9172293073268317,
	"eval_loss": 1.5319523811340332,
	"eval_precision": 0.9174587293646823,
	"eval_recall": 0.917,
	"eval_runtime": 1.8758,
	"eval_samples_per_second": 28.788,
	"eval_steps_per_second": 0.533,
	"step": 880
	},
	{
	"epoch": 90.0,
	"eval_accuracy": 0.8516306844281121,
	"eval_f1": 0.9216520650813517,
	"eval_loss": 1.5241385698318481,
	"eval_precision": 0.9228070175438596,
	"eval_recall": 0.9205,
	"eval_runtime": 2.319,
	"eval_samples_per_second": 23.286,
	"eval_steps_per_second": 0.431,
	"step": 900
	},
	{
	"epoch": 92.0,
	"eval_accuracy": 0.8524345429490124,
	"eval_f1": 0.922,
	"eval_loss": 1.5183860063552856,
	"eval_precision": 0.922,
	"eval_recall": 0.922,
	"eval_runtime": 1.8138,
	"eval_samples_per_second": 29.771,
	"eval_steps_per_second": 0.551,
	"step": 920
	},
	{
	"epoch": 94.0,
	"eval_accuracy": 0.8526642168121268,
	"eval_f1": 0.9215,
	"eval_loss": 1.5182560682296753,
	"eval_precision": 0.9215,
	"eval_recall": 0.9215,
	"eval_runtime": 2.1167,
	"eval_samples_per_second": 25.511,
	"eval_steps_per_second": 0.472,
	"step": 940
	},
	{
	"epoch": 96.0,
	"eval_accuracy": 0.8523197060174552,
	"eval_f1": 0.9209999999999999,
	"eval_loss": 1.519921898841858,
	"eval_precision": 0.921,
	"eval_recall": 0.921,
	"eval_runtime": 2.4525,
	"eval_samples_per_second": 22.018,
	"eval_steps_per_second": 0.408,
	"step": 960
	},
	{
	"epoch": 98.0,
	"eval_accuracy": 0.8520900321543409,
	"eval_f1": 0.9214607303651825,
	"eval_loss": 1.5220308303833008,
	"eval_precision": 0.9219219219219219,
	"eval_recall": 0.921,
	"eval_runtime": 2.2195,
	"eval_samples_per_second": 24.33,
	"eval_steps_per_second": 0.451,
	"step": 980
	},
	{
	"epoch": 100.0,
	"learning_rate": 0.0,
	"loss": 0.0007,
	"step": 1000
	},
	{
	"epoch": 100.0,
	"eval_accuracy": 0.8518603582912264,
	"eval_f1": 0.9214607303651825,
	"eval_loss": 1.5228424072265625,
	"eval_precision": 0.9219219219219219,
	"eval_recall": 0.921,
	"eval_runtime": 2.3676,
	"eval_samples_per_second": 22.808,
	"eval_steps_per_second": 0.422,
	"step": 1000
	},
	{
	"epoch": 100.0,
	"step": 1000,
	"total_flos": 1.4163133547413504e+16,
	"train_loss": 0.06096216064691544,
	"train_runtime": 422.6711,
	"train_samples_per_second": 37.854,
	"train_steps_per_second": 2.366
	}
	],
	"max_steps": 1000,
	"num_train_epochs": 100,
	"total_flos": 1.4163133547413504e+16,
	"trial_name": null,
	"trial_params": null
	}