Token-Level-Stereotype-Detector / trainer_state.json

new update

c688bf6 over 1 year ago

5.77 kB

	{
	"best_metric": 0.07052170485258102,
	"best_model_checkpoint": "token_level_model/best_model/checkpoint-948",
	"epoch": 12.0,
	"global_step": 3792,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 1.0,
	"eval_balanced accuracy": 0.5633085631676005,
	"eval_f1": 0.5303163390780957,
	"eval_loss": 0.09163307398557663,
	"eval_precision": 0.6548165588282941,
	"eval_recall": 0.5633085631676005,
	"eval_runtime": 5.3367,
	"eval_samples_per_second": 236.852,
	"eval_steps_per_second": 14.803,
	"step": 316
	},
	{
	"epoch": 1.58,
	"learning_rate": 1.7362869198312237e-05,
	"loss": 0.1839,
	"step": 500
	},
	{
	"epoch": 2.0,
	"eval_balanced accuracy": 0.7195902052549533,
	"eval_f1": 0.7255288809894066,
	"eval_loss": 0.0722324550151825,
	"eval_precision": 0.7454575741625619,
	"eval_recall": 0.7195902052549533,
	"eval_runtime": 5.3534,
	"eval_samples_per_second": 236.111,
	"eval_steps_per_second": 14.757,
	"step": 632
	},
	{
	"epoch": 3.0,
	"eval_balanced accuracy": 0.7147400555506803,
	"eval_f1": 0.7192305114894215,
	"eval_loss": 0.07052170485258102,
	"eval_precision": 0.7756273409712318,
	"eval_recall": 0.7147400555506803,
	"eval_runtime": 5.4755,
	"eval_samples_per_second": 230.847,
	"eval_steps_per_second": 14.428,
	"step": 948
	},
	{
	"epoch": 3.16,
	"learning_rate": 1.4725738396624474e-05,
	"loss": 0.0587,
	"step": 1000
	},
	{
	"epoch": 4.0,
	"eval_balanced accuracy": 0.7295185936273012,
	"eval_f1": 0.7296703416168215,
	"eval_loss": 0.07182055711746216,
	"eval_precision": 0.7401045017667032,
	"eval_recall": 0.7295185936273012,
	"eval_runtime": 5.3937,
	"eval_samples_per_second": 234.345,
	"eval_steps_per_second": 14.647,
	"step": 1264
	},
	{
	"epoch": 4.75,
	"learning_rate": 1.208860759493671e-05,
	"loss": 0.0376,
	"step": 1500
	},
	{
	"epoch": 5.0,
	"eval_balanced accuracy": 0.735330002568732,
	"eval_f1": 0.743746101471838,
	"eval_loss": 0.07561135292053223,
	"eval_precision": 0.758929084908083,
	"eval_recall": 0.735330002568732,
	"eval_runtime": 5.5304,
	"eval_samples_per_second": 228.555,
	"eval_steps_per_second": 14.285,
	"step": 1580
	},
	{
	"epoch": 6.0,
	"eval_balanced accuracy": 0.7487913019838482,
	"eval_f1": 0.7539294881409199,
	"eval_loss": 0.08333344757556915,
	"eval_precision": 0.7640729935139194,
	"eval_recall": 0.7487913019838482,
	"eval_runtime": 5.304,
	"eval_samples_per_second": 238.312,
	"eval_steps_per_second": 14.894,
	"step": 1896
	},
	{
	"epoch": 6.33,
	"learning_rate": 9.451476793248946e-06,
	"loss": 0.0239,
	"step": 2000
	},
	{
	"epoch": 7.0,
	"eval_balanced accuracy": 0.7495077050154062,
	"eval_f1": 0.7547220689413356,
	"eval_loss": 0.09176070988178253,
	"eval_precision": 0.7680132999431392,
	"eval_recall": 0.7495077050154062,
	"eval_runtime": 5.4894,
	"eval_samples_per_second": 230.262,
	"eval_steps_per_second": 14.391,
	"step": 2212
	},
	{
	"epoch": 7.91,
	"learning_rate": 6.814345991561182e-06,
	"loss": 0.0161,
	"step": 2500
	},
	{
	"epoch": 8.0,
	"eval_balanced accuracy": 0.7519480763726148,
	"eval_f1": 0.7441340002103095,
	"eval_loss": 0.10090441256761551,
	"eval_precision": 0.7421918161304624,
	"eval_recall": 0.7519480763726148,
	"eval_runtime": 5.4772,
	"eval_samples_per_second": 230.774,
	"eval_steps_per_second": 14.423,
	"step": 2528
	},
	{
	"epoch": 9.0,
	"eval_balanced accuracy": 0.7372305744818235,
	"eval_f1": 0.7418663358868686,
	"eval_loss": 0.10627683997154236,
	"eval_precision": 0.747694948865169,
	"eval_recall": 0.7372305744818235,
	"eval_runtime": 5.673,
	"eval_samples_per_second": 222.809,
	"eval_steps_per_second": 13.926,
	"step": 2844
	},
	{
	"epoch": 9.49,
	"learning_rate": 4.177215189873418e-06,
	"loss": 0.0107,
	"step": 3000
	},
	{
	"epoch": 10.0,
	"eval_balanced accuracy": 0.7454153105654866,
	"eval_f1": 0.7532278014935634,
	"eval_loss": 0.11291743814945221,
	"eval_precision": 0.7635910633921945,
	"eval_recall": 0.7454153105654866,
	"eval_runtime": 5.7497,
	"eval_samples_per_second": 219.839,
	"eval_steps_per_second": 13.74,
	"step": 3160
	},
	{
	"epoch": 11.0,
	"eval_balanced accuracy": 0.7422514651185799,
	"eval_f1": 0.7462413455365297,
	"eval_loss": 0.11802595853805542,
	"eval_precision": 0.7518280300030182,
	"eval_recall": 0.7422514651185799,
	"eval_runtime": 5.6277,
	"eval_samples_per_second": 224.602,
	"eval_steps_per_second": 14.038,
	"step": 3476
	},
	{
	"epoch": 11.08,
	"learning_rate": 1.5400843881856542e-06,
	"loss": 0.007,
	"step": 3500
	},
	{
	"epoch": 12.0,
	"eval_balanced accuracy": 0.7397630177088332,
	"eval_f1": 0.7454360643197575,
	"eval_loss": 0.11985792219638824,
	"eval_precision": 0.7526407260582226,
	"eval_recall": 0.7397630177088332,
	"eval_runtime": 5.7001,
	"eval_samples_per_second": 221.752,
	"eval_steps_per_second": 13.859,
	"step": 3792
	}
	],
	"max_steps": 3792,
	"num_train_epochs": 12,
	"total_flos": 302819736843288.0,
	"trial_name": null,
	"trial_params": null
	}