Upload folder using huggingface_hub

e818adf 10 months ago

No virus

6.48 kB

	{
	"best_metric": 1.1251049041748047,
	"best_model_checkpoint": "./mbartLarge_koja_mid2_run1/checkpoint-22708",
	"epoch": 2.0,
	"eval_steps": 500,
	"global_step": 22708,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.04,
	"learning_rate": 4.977981328166285e-05,
	"loss": 1.9241,
	"step": 500
	},
	{
	"epoch": 0.09,
	"learning_rate": 4.95596265633257e-05,
	"loss": 1.6494,
	"step": 1000
	},
	{
	"epoch": 0.13,
	"learning_rate": 4.933943984498855e-05,
	"loss": 1.5434,
	"step": 1500
	},
	{
	"epoch": 0.18,
	"learning_rate": 4.91192531266514e-05,
	"loss": 1.4836,
	"step": 2000
	},
	{
	"epoch": 0.22,
	"learning_rate": 4.889906640831425e-05,
	"loss": 1.4499,
	"step": 2500
	},
	{
	"epoch": 0.26,
	"learning_rate": 4.86788796899771e-05,
	"loss": 1.3934,
	"step": 3000
	},
	{
	"epoch": 0.31,
	"learning_rate": 4.845869297163995e-05,
	"loss": 1.3857,
	"step": 3500
	},
	{
	"epoch": 0.35,
	"learning_rate": 4.82385062533028e-05,
	"loss": 1.3396,
	"step": 4000
	},
	{
	"epoch": 0.4,
	"learning_rate": 4.801831953496565e-05,
	"loss": 1.3322,
	"step": 4500
	},
	{
	"epoch": 0.44,
	"learning_rate": 4.77981328166285e-05,
	"loss": 1.3106,
	"step": 5000
	},
	{
	"epoch": 0.48,
	"learning_rate": 4.757794609829135e-05,
	"loss": 1.2924,
	"step": 5500
	},
	{
	"epoch": 0.53,
	"learning_rate": 4.73577593799542e-05,
	"loss": 1.2834,
	"step": 6000
	},
	{
	"epoch": 0.57,
	"learning_rate": 4.713757266161705e-05,
	"loss": 1.2791,
	"step": 6500
	},
	{
	"epoch": 0.62,
	"learning_rate": 4.69173859432799e-05,
	"loss": 1.255,
	"step": 7000
	},
	{
	"epoch": 0.66,
	"learning_rate": 4.669719922494275e-05,
	"loss": 1.2573,
	"step": 7500
	},
	{
	"epoch": 0.7,
	"learning_rate": 4.64770125066056e-05,
	"loss": 1.2382,
	"step": 8000
	},
	{
	"epoch": 0.75,
	"learning_rate": 4.625682578826845e-05,
	"loss": 1.223,
	"step": 8500
	},
	{
	"epoch": 0.79,
	"learning_rate": 4.6036639069931303e-05,
	"loss": 1.2145,
	"step": 9000
	},
	{
	"epoch": 0.84,
	"learning_rate": 4.5816452351594153e-05,
	"loss": 1.219,
	"step": 9500
	},
	{
	"epoch": 0.88,
	"learning_rate": 4.5596265633257004e-05,
	"loss": 1.2125,
	"step": 10000
	},
	{
	"epoch": 0.92,
	"learning_rate": 4.5376078914919854e-05,
	"loss": 1.1996,
	"step": 10500
	},
	{
	"epoch": 0.97,
	"learning_rate": 4.5155892196582704e-05,
	"loss": 1.1823,
	"step": 11000
	},
	{
	"epoch": 1.0,
	"eval_bleu": 29.4501,
	"eval_gen_len": 18.8118,
	"eval_loss": 1.1695398092269897,
	"eval_runtime": 1716.1373,
	"eval_samples_per_second": 13.231,
	"eval_steps_per_second": 0.827,
	"step": 11354
	},
	{
	"epoch": 1.01,
	"learning_rate": 4.4935705478245554e-05,
	"loss": 1.1596,
	"step": 11500
	},
	{
	"epoch": 1.06,
	"learning_rate": 4.4715518759908404e-05,
	"loss": 1.0777,
	"step": 12000
	},
	{
	"epoch": 1.1,
	"learning_rate": 4.4495332041571254e-05,
	"loss": 1.0658,
	"step": 12500
	},
	{
	"epoch": 1.14,
	"learning_rate": 4.427514532323411e-05,
	"loss": 1.0296,
	"step": 13000
	},
	{
	"epoch": 1.19,
	"learning_rate": 4.4054958604896954e-05,
	"loss": 1.0269,
	"step": 13500
	},
	{
	"epoch": 1.23,
	"learning_rate": 4.3834771886559804e-05,
	"loss": 1.0192,
	"step": 14000
	},
	{
	"epoch": 1.28,
	"learning_rate": 4.3614585168222654e-05,
	"loss": 0.9946,
	"step": 14500
	},
	{
	"epoch": 1.32,
	"learning_rate": 4.3394398449885504e-05,
	"loss": 0.9996,
	"step": 15000
	},
	{
	"epoch": 1.37,
	"learning_rate": 4.3174211731548354e-05,
	"loss": 0.975,
	"step": 15500
	},
	{
	"epoch": 1.41,
	"learning_rate": 4.295402501321121e-05,
	"loss": 0.9874,
	"step": 16000
	},
	{
	"epoch": 1.45,
	"learning_rate": 4.2733838294874054e-05,
	"loss": 0.9683,
	"step": 16500
	},
	{
	"epoch": 1.5,
	"learning_rate": 4.2513651576536904e-05,
	"loss": 0.9675,
	"step": 17000
	},
	{
	"epoch": 1.54,
	"learning_rate": 4.2293464858199754e-05,
	"loss": 0.969,
	"step": 17500
	},
	{
	"epoch": 1.59,
	"learning_rate": 4.2073278139862604e-05,
	"loss": 0.9548,
	"step": 18000
	},
	{
	"epoch": 1.63,
	"learning_rate": 4.1853091421525454e-05,
	"loss": 0.9563,
	"step": 18500
	},
	{
	"epoch": 1.67,
	"learning_rate": 4.163290470318831e-05,
	"loss": 0.9536,
	"step": 19000
	},
	{
	"epoch": 1.72,
	"learning_rate": 4.1412717984851155e-05,
	"loss": 0.941,
	"step": 19500
	},
	{
	"epoch": 1.76,
	"learning_rate": 4.1192531266514005e-05,
	"loss": 0.9285,
	"step": 20000
	},
	{
	"epoch": 1.81,
	"learning_rate": 4.0972344548176855e-05,
	"loss": 0.9303,
	"step": 20500
	},
	{
	"epoch": 1.85,
	"learning_rate": 4.0752157829839705e-05,
	"loss": 0.9428,
	"step": 21000
	},
	{
	"epoch": 1.89,
	"learning_rate": 4.0531971111502555e-05,
	"loss": 0.9359,
	"step": 21500
	},
	{
	"epoch": 1.94,
	"learning_rate": 4.031178439316541e-05,
	"loss": 0.9302,
	"step": 22000
	},
	{
	"epoch": 1.98,
	"learning_rate": 4.0091597674828255e-05,
	"loss": 0.9207,
	"step": 22500
	},
	{
	"epoch": 2.0,
	"eval_bleu": 30.842,
	"eval_gen_len": 18.0892,
	"eval_loss": 1.1251049041748047,
	"eval_runtime": 1535.7063,
	"eval_samples_per_second": 14.786,
	"eval_steps_per_second": 0.925,
	"step": 22708
	}
	],
	"logging_steps": 500,
	"max_steps": 113540,
	"num_train_epochs": 10,
	"save_steps": 500,
	"total_flos": 7.874829468219474e+17,
	"trial_name": null,
	"trial_params": null
	}