abdiharyadi
/

indoamrbart-mbart-one-ft

TensorBoard

Model card Files Files and versions Metrics Training metrics Community

indoamrbart-mbart-one-ft / mbart-en-id-smaller-fted /trainer_state.json

abdiharyadi

Upload folder using huggingface_hub

79c0a48 verified 7 months ago

raw

history blame contribute delete

No virus

13 kB

	{
	"best_metric": 1.4071465730667114,
	"best_model_checkpoint": "/kaggle/working/amr-tst-indo/AMRBART-id/fine-tune/../outputs/mbart-en-id-smaller-fted/checkpoint-1520",
	"epoch": 15.9958071278826,
	"global_step": 1520,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.01,
	"learning_rate": 5e-09,
	"loss": 6.0549,
	"step": 1
	},
	{
	"epoch": 0.21,
	"learning_rate": 1e-07,
	"loss": 5.9202,
	"step": 20
	},
	{
	"epoch": 0.42,
	"learning_rate": 2e-07,
	"loss": 5.3467,
	"step": 40
	},
	{
	"epoch": 0.63,
	"learning_rate": 3e-07,
	"loss": 4.6465,
	"step": 60
	},
	{
	"epoch": 0.84,
	"learning_rate": 4e-07,
	"loss": 4.3418,
	"step": 80
	},
	{
	"epoch": 1.0,
	"eval_loss": 3.378068447113037,
	"eval_runtime": 2.5518,
	"eval_samples_per_second": 103.849,
	"eval_steps_per_second": 20.77,
	"step": 95
	},
	{
	"epoch": 1.05,
	"learning_rate": 5e-07,
	"loss": 4.0362,
	"step": 100
	},
	{
	"epoch": 1.26,
	"learning_rate": 6e-07,
	"loss": 3.469,
	"step": 120
	},
	{
	"epoch": 1.47,
	"learning_rate": 7e-07,
	"loss": 2.8971,
	"step": 140
	},
	{
	"epoch": 1.68,
	"learning_rate": 8e-07,
	"loss": 2.4616,
	"step": 160
	},
	{
	"epoch": 1.89,
	"learning_rate": 9e-07,
	"loss": 2.2282,
	"step": 180
	},
	{
	"epoch": 2.0,
	"eval_loss": 2.078709840774536,
	"eval_runtime": 2.5357,
	"eval_samples_per_second": 104.508,
	"eval_steps_per_second": 20.902,
	"step": 190
	},
	{
	"epoch": 2.1,
	"learning_rate": 1e-06,
	"loss": 2.2418,
	"step": 200
	},
	{
	"epoch": 2.31,
	"learning_rate": 9.863636363636363e-07,
	"loss": 2.0575,
	"step": 220
	},
	{
	"epoch": 2.52,
	"learning_rate": 9.727272727272727e-07,
	"loss": 2.0621,
	"step": 240
	},
	{
	"epoch": 2.73,
	"learning_rate": 9.59090909090909e-07,
	"loss": 1.9103,
	"step": 260
	},
	{
	"epoch": 2.94,
	"learning_rate": 9.454545454545455e-07,
	"loss": 1.947,
	"step": 280
	},
	{
	"epoch": 3.0,
	"eval_loss": 1.817661166191101,
	"eval_runtime": 2.5208,
	"eval_samples_per_second": 105.125,
	"eval_steps_per_second": 21.025,
	"step": 285
	},
	{
	"epoch": 3.16,
	"learning_rate": 9.318181818181817e-07,
	"loss": 1.9331,
	"step": 300
	},
	{
	"epoch": 3.37,
	"learning_rate": 9.181818181818181e-07,
	"loss": 1.7866,
	"step": 320
	},
	{
	"epoch": 3.58,
	"learning_rate": 9.045454545454545e-07,
	"loss": 1.8531,
	"step": 340
	},
	{
	"epoch": 3.79,
	"learning_rate": 8.909090909090909e-07,
	"loss": 1.7661,
	"step": 360
	},
	{
	"epoch": 4.0,
	"learning_rate": 8.772727272727273e-07,
	"loss": 1.7924,
	"step": 380
	},
	{
	"epoch": 4.0,
	"eval_loss": 1.6833910942077637,
	"eval_runtime": 2.5259,
	"eval_samples_per_second": 104.913,
	"eval_steps_per_second": 20.983,
	"step": 380
	},
	{
	"epoch": 4.21,
	"learning_rate": 8.636363636363636e-07,
	"loss": 1.7426,
	"step": 400
	},
	{
	"epoch": 4.42,
	"learning_rate": 8.5e-07,
	"loss": 1.6863,
	"step": 420
	},
	{
	"epoch": 4.63,
	"learning_rate": 8.363636363636363e-07,
	"loss": 1.6788,
	"step": 440
	},
	{
	"epoch": 4.84,
	"learning_rate": 8.227272727272727e-07,
	"loss": 1.6764,
	"step": 460
	},
	{
	"epoch": 5.0,
	"eval_loss": 1.613844633102417,
	"eval_runtime": 2.526,
	"eval_samples_per_second": 104.911,
	"eval_steps_per_second": 20.982,
	"step": 475
	},
	{
	"epoch": 5.05,
	"learning_rate": 8.09090909090909e-07,
	"loss": 1.7464,
	"step": 480
	},
	{
	"epoch": 5.26,
	"learning_rate": 7.954545454545454e-07,
	"loss": 1.6661,
	"step": 500
	},
	{
	"epoch": 5.47,
	"learning_rate": 7.818181818181818e-07,
	"loss": 1.6213,
	"step": 520
	},
	{
	"epoch": 5.68,
	"learning_rate": 7.681818181818182e-07,
	"loss": 1.5895,
	"step": 540
	},
	{
	"epoch": 5.89,
	"learning_rate": 7.545454545454546e-07,
	"loss": 1.5868,
	"step": 560
	},
	{
	"epoch": 6.0,
	"eval_loss": 1.5621322393417358,
	"eval_runtime": 2.5161,
	"eval_samples_per_second": 105.322,
	"eval_steps_per_second": 21.064,
	"step": 570
	},
	{
	"epoch": 6.1,
	"learning_rate": 7.409090909090909e-07,
	"loss": 1.6402,
	"step": 580
	},
	{
	"epoch": 6.31,
	"learning_rate": 7.272727272727274e-07,
	"loss": 1.5571,
	"step": 600
	},
	{
	"epoch": 6.52,
	"learning_rate": 7.136363636363637e-07,
	"loss": 1.6449,
	"step": 620
	},
	{
	"epoch": 6.73,
	"learning_rate": 7.000000000000001e-07,
	"loss": 1.5674,
	"step": 640
	},
	{
	"epoch": 6.94,
	"learning_rate": 6.863636363636363e-07,
	"loss": 1.605,
	"step": 660
	},
	{
	"epoch": 7.0,
	"eval_loss": 1.530236005783081,
	"eval_runtime": 2.5271,
	"eval_samples_per_second": 104.864,
	"eval_steps_per_second": 20.973,
	"step": 665
	},
	{
	"epoch": 7.16,
	"learning_rate": 6.727272727272727e-07,
	"loss": 1.5795,
	"step": 680
	},
	{
	"epoch": 7.37,
	"learning_rate": 6.590909090909091e-07,
	"loss": 1.5291,
	"step": 700
	},
	{
	"epoch": 7.58,
	"learning_rate": 6.454545454545455e-07,
	"loss": 1.5663,
	"step": 720
	},
	{
	"epoch": 7.79,
	"learning_rate": 6.318181818181818e-07,
	"loss": 1.5326,
	"step": 740
	},
	{
	"epoch": 8.0,
	"learning_rate": 6.181818181818181e-07,
	"loss": 1.5897,
	"step": 760
	},
	{
	"epoch": 8.0,
	"eval_loss": 1.5036414861679077,
	"eval_runtime": 2.5257,
	"eval_samples_per_second": 104.921,
	"eval_steps_per_second": 20.984,
	"step": 760
	},
	{
	"epoch": 8.21,
	"learning_rate": 6.045454545454545e-07,
	"loss": 1.5629,
	"step": 780
	},
	{
	"epoch": 8.42,
	"learning_rate": 5.909090909090909e-07,
	"loss": 1.5069,
	"step": 800
	},
	{
	"epoch": 8.63,
	"learning_rate": 5.772727272727273e-07,
	"loss": 1.5059,
	"step": 820
	},
	{
	"epoch": 8.84,
	"learning_rate": 5.636363636363636e-07,
	"loss": 1.5103,
	"step": 840
	},
	{
	"epoch": 9.0,
	"eval_loss": 1.4787436723709106,
	"eval_runtime": 2.5377,
	"eval_samples_per_second": 104.427,
	"eval_steps_per_second": 20.885,
	"step": 855
	},
	{
	"epoch": 9.05,
	"learning_rate": 5.5e-07,
	"loss": 1.5148,
	"step": 860
	},
	{
	"epoch": 9.26,
	"learning_rate": 5.363636363636363e-07,
	"loss": 1.4927,
	"step": 880
	},
	{
	"epoch": 9.47,
	"learning_rate": 5.227272727272728e-07,
	"loss": 1.4826,
	"step": 900
	},
	{
	"epoch": 9.68,
	"learning_rate": 5.090909090909092e-07,
	"loss": 1.4854,
	"step": 920
	},
	{
	"epoch": 9.89,
	"learning_rate": 4.954545454545455e-07,
	"loss": 1.4713,
	"step": 940
	},
	{
	"epoch": 10.0,
	"eval_loss": 1.4612189531326294,
	"eval_runtime": 2.5505,
	"eval_samples_per_second": 103.9,
	"eval_steps_per_second": 20.78,
	"step": 950
	},
	{
	"epoch": 10.1,
	"learning_rate": 4.818181818181817e-07,
	"loss": 1.4923,
	"step": 960
	},
	{
	"epoch": 10.31,
	"learning_rate": 4.6818181818181814e-07,
	"loss": 1.4864,
	"step": 980
	},
	{
	"epoch": 10.52,
	"learning_rate": 4.545454545454545e-07,
	"loss": 1.4972,
	"step": 1000
	},
	{
	"epoch": 10.73,
	"learning_rate": 4.409090909090909e-07,
	"loss": 1.4156,
	"step": 1020
	},
	{
	"epoch": 10.94,
	"learning_rate": 4.272727272727273e-07,
	"loss": 1.4455,
	"step": 1040
	},
	{
	"epoch": 11.0,
	"eval_loss": 1.44575035572052,
	"eval_runtime": 2.5276,
	"eval_samples_per_second": 104.843,
	"eval_steps_per_second": 20.969,
	"step": 1045
	},
	{
	"epoch": 11.16,
	"learning_rate": 4.1363636363636366e-07,
	"loss": 1.5115,
	"step": 1060
	},
	{
	"epoch": 11.37,
	"learning_rate": 4.0000000000000003e-07,
	"loss": 1.4458,
	"step": 1080
	},
	{
	"epoch": 11.58,
	"learning_rate": 3.863636363636364e-07,
	"loss": 1.461,
	"step": 1100
	},
	{
	"epoch": 11.79,
	"learning_rate": 3.727272727272727e-07,
	"loss": 1.4437,
	"step": 1120
	},
	{
	"epoch": 12.0,
	"learning_rate": 3.5909090909090907e-07,
	"loss": 1.4553,
	"step": 1140
	},
	{
	"epoch": 12.0,
	"eval_loss": 1.432648777961731,
	"eval_runtime": 2.5587,
	"eval_samples_per_second": 103.568,
	"eval_steps_per_second": 20.714,
	"step": 1140
	},
	{
	"epoch": 12.21,
	"learning_rate": 3.4545454545454544e-07,
	"loss": 1.4858,
	"step": 1160
	},
	{
	"epoch": 12.42,
	"learning_rate": 3.3181818181818177e-07,
	"loss": 1.4193,
	"step": 1180
	},
	{
	"epoch": 12.63,
	"learning_rate": 3.1818181818181815e-07,
	"loss": 1.4363,
	"step": 1200
	},
	{
	"epoch": 12.84,
	"learning_rate": 3.0454545454545453e-07,
	"loss": 1.4501,
	"step": 1220
	},
	{
	"epoch": 13.0,
	"eval_loss": 1.4239989519119263,
	"eval_runtime": 2.5751,
	"eval_samples_per_second": 102.907,
	"eval_steps_per_second": 20.581,
	"step": 1235
	},
	{
	"epoch": 13.05,
	"learning_rate": 2.909090909090909e-07,
	"loss": 1.4586,
	"step": 1240
	},
	{
	"epoch": 13.26,
	"learning_rate": 2.772727272727273e-07,
	"loss": 1.4263,
	"step": 1260
	},
	{
	"epoch": 13.47,
	"learning_rate": 2.6363636363636356e-07,
	"loss": 1.4484,
	"step": 1280
	},
	{
	"epoch": 13.68,
	"learning_rate": 2.4999999999999994e-07,
	"loss": 1.3985,
	"step": 1300
	},
	{
	"epoch": 13.89,
	"learning_rate": 2.3636363636363634e-07,
	"loss": 1.4134,
	"step": 1320
	},
	{
	"epoch": 14.0,
	"eval_loss": 1.4161295890808105,
	"eval_runtime": 2.5462,
	"eval_samples_per_second": 104.076,
	"eval_steps_per_second": 20.815,
	"step": 1330
	},
	{
	"epoch": 14.1,
	"learning_rate": 2.2272727272727272e-07,
	"loss": 1.4115,
	"step": 1340
	},
	{
	"epoch": 14.31,
	"learning_rate": 2.0909090909090907e-07,
	"loss": 1.4126,
	"step": 1360
	},
	{
	"epoch": 14.52,
	"learning_rate": 1.9545454545454545e-07,
	"loss": 1.4652,
	"step": 1380
	},
	{
	"epoch": 14.73,
	"learning_rate": 1.8181818181818186e-07,
	"loss": 1.4327,
	"step": 1400
	},
	{
	"epoch": 14.94,
	"learning_rate": 1.681818181818182e-07,
	"loss": 1.422,
	"step": 1420
	},
	{
	"epoch": 15.0,
	"eval_loss": 1.4098496437072754,
	"eval_runtime": 2.5612,
	"eval_samples_per_second": 103.468,
	"eval_steps_per_second": 20.694,
	"step": 1425
	},
	{
	"epoch": 15.16,
	"learning_rate": 1.5454545454545448e-07,
	"loss": 1.4582,
	"step": 1440
	},
	{
	"epoch": 15.37,
	"learning_rate": 1.4090909090909086e-07,
	"loss": 1.4484,
	"step": 1460
	},
	{
	"epoch": 15.58,
	"learning_rate": 1.2727272727272724e-07,
	"loss": 1.3937,
	"step": 1480
	},
	{
	"epoch": 15.79,
	"learning_rate": 1.1363636363636362e-07,
	"loss": 1.416,
	"step": 1500
	},
	{
	"epoch": 16.0,
	"learning_rate": 1e-07,
	"loss": 1.4139,
	"step": 1520
	},
	{
	"epoch": 16.0,
	"eval_loss": 1.4071465730667114,
	"eval_runtime": 2.5382,
	"eval_samples_per_second": 104.404,
	"eval_steps_per_second": 20.881,
	"step": 1520
	},
	{
	"epoch": 16.0,
	"step": 1520,
	"total_flos": 1443270331367424.0,
	"train_loss": 1.854057946016914,
	"train_runtime": 1311.705,
	"train_samples_per_second": 29.055,
	"train_steps_per_second": 1.159
	}
	],
	"max_steps": 1520,
	"num_train_epochs": 16,
	"total_flos": 1443270331367424.0,
	"trial_name": null,
	"trial_params": null
	}