rshrott
/

vit-base-renovation

Image Classification

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

vit-base-renovation / trainer_state.json

rshrott's picture

🍻 cheers

86e3a80 over 1 year ago

3.91 kB

	{
	"best_metric": 0.5519602298736572,
	"best_model_checkpoint": "./vit-base-renovation/checkpoint-200",
	"epoch": 4.0,
	"global_step": 240,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.17,
	"learning_rate": 0.00019166666666666667,
	"loss": 1.0207,
	"step": 10
	},
	{
	"epoch": 0.33,
	"learning_rate": 0.00018333333333333334,
	"loss": 0.9553,
	"step": 20
	},
	{
	"epoch": 0.5,
	"learning_rate": 0.000175,
	"loss": 0.9262,
	"step": 30
	},
	{
	"epoch": 0.67,
	"learning_rate": 0.0001666666666666667,
	"loss": 1.0583,
	"step": 40
	},
	{
	"epoch": 0.83,
	"learning_rate": 0.00015833333333333332,
	"loss": 0.9631,
	"step": 50
	},
	{
	"epoch": 1.0,
	"learning_rate": 0.00015000000000000001,
	"loss": 1.0413,
	"step": 60
	},
	{
	"epoch": 1.17,
	"learning_rate": 0.00014250000000000002,
	"loss": 0.8439,
	"step": 70
	},
	{
	"epoch": 1.33,
	"learning_rate": 0.00013416666666666666,
	"loss": 0.8593,
	"step": 80
	},
	{
	"epoch": 1.5,
	"learning_rate": 0.00012583333333333335,
	"loss": 0.7704,
	"step": 90
	},
	{
	"epoch": 1.67,
	"learning_rate": 0.00011833333333333334,
	"loss": 0.7677,
	"step": 100
	},
	{
	"epoch": 1.67,
	"eval_accuracy": 0.7666666666666667,
	"eval_loss": 0.677022397518158,
	"eval_runtime": 2.0668,
	"eval_samples_per_second": 14.515,
	"eval_steps_per_second": 1.935,
	"step": 100
	},
	{
	"epoch": 1.83,
	"learning_rate": 0.00011000000000000002,
	"loss": 0.869,
	"step": 110
	},
	{
	"epoch": 2.0,
	"learning_rate": 0.00010166666666666667,
	"loss": 0.713,
	"step": 120
	},
	{
	"epoch": 2.17,
	"learning_rate": 9.333333333333334e-05,
	"loss": 0.516,
	"step": 130
	},
	{
	"epoch": 2.33,
	"learning_rate": 8.5e-05,
	"loss": 0.436,
	"step": 140
	},
	{
	"epoch": 2.5,
	"learning_rate": 7.666666666666667e-05,
	"loss": 0.4567,
	"step": 150
	},
	{
	"epoch": 2.67,
	"learning_rate": 6.833333333333333e-05,
	"loss": 0.3406,
	"step": 160
	},
	{
	"epoch": 2.83,
	"learning_rate": 6e-05,
	"loss": 0.3733,
	"step": 170
	},
	{
	"epoch": 3.0,
	"learning_rate": 5.166666666666667e-05,
	"loss": 0.3386,
	"step": 180
	},
	{
	"epoch": 3.17,
	"learning_rate": 4.3333333333333334e-05,
	"loss": 0.2098,
	"step": 190
	},
	{
	"epoch": 3.33,
	"learning_rate": 3.5e-05,
	"loss": 0.13,
	"step": 200
	},
	{
	"epoch": 3.33,
	"eval_accuracy": 0.9,
	"eval_loss": 0.5519602298736572,
	"eval_runtime": 1.3933,
	"eval_samples_per_second": 21.532,
	"eval_steps_per_second": 2.871,
	"step": 200
	},
	{
	"epoch": 3.5,
	"learning_rate": 2.6666666666666667e-05,
	"loss": 0.1127,
	"step": 210
	},
	{
	"epoch": 3.67,
	"learning_rate": 1.8333333333333333e-05,
	"loss": 0.0929,
	"step": 220
	},
	{
	"epoch": 3.83,
	"learning_rate": 1e-05,
	"loss": 0.1072,
	"step": 230
	},
	{
	"epoch": 4.0,
	"learning_rate": 1.6666666666666667e-06,
	"loss": 0.1091,
	"step": 240
	},
	{
	"epoch": 4.0,
	"step": 240,
	"total_flos": 2.972619364024074e+17,
	"train_loss": 0.5838068192203839,
	"train_runtime": 384.6439,
	"train_samples_per_second": 9.973,
	"train_steps_per_second": 0.624
	}
	],
	"max_steps": 240,
	"num_train_epochs": 4,
	"total_flos": 2.972619364024074e+17,
	"trial_name": null,
	"trial_params": null
	}