vit-base-renovation / trainer_state.json
rshrott's picture
🍻 cheers
86e3a80
raw
history blame
3.91 kB
{
"best_metric": 0.5519602298736572,
"best_model_checkpoint": "./vit-base-renovation/checkpoint-200",
"epoch": 4.0,
"global_step": 240,
"is_hyper_param_search": false,
"is_local_process_zero": true,
"is_world_process_zero": true,
"log_history": [
{
"epoch": 0.17,
"learning_rate": 0.00019166666666666667,
"loss": 1.0207,
"step": 10
},
{
"epoch": 0.33,
"learning_rate": 0.00018333333333333334,
"loss": 0.9553,
"step": 20
},
{
"epoch": 0.5,
"learning_rate": 0.000175,
"loss": 0.9262,
"step": 30
},
{
"epoch": 0.67,
"learning_rate": 0.0001666666666666667,
"loss": 1.0583,
"step": 40
},
{
"epoch": 0.83,
"learning_rate": 0.00015833333333333332,
"loss": 0.9631,
"step": 50
},
{
"epoch": 1.0,
"learning_rate": 0.00015000000000000001,
"loss": 1.0413,
"step": 60
},
{
"epoch": 1.17,
"learning_rate": 0.00014250000000000002,
"loss": 0.8439,
"step": 70
},
{
"epoch": 1.33,
"learning_rate": 0.00013416666666666666,
"loss": 0.8593,
"step": 80
},
{
"epoch": 1.5,
"learning_rate": 0.00012583333333333335,
"loss": 0.7704,
"step": 90
},
{
"epoch": 1.67,
"learning_rate": 0.00011833333333333334,
"loss": 0.7677,
"step": 100
},
{
"epoch": 1.67,
"eval_accuracy": 0.7666666666666667,
"eval_loss": 0.677022397518158,
"eval_runtime": 2.0668,
"eval_samples_per_second": 14.515,
"eval_steps_per_second": 1.935,
"step": 100
},
{
"epoch": 1.83,
"learning_rate": 0.00011000000000000002,
"loss": 0.869,
"step": 110
},
{
"epoch": 2.0,
"learning_rate": 0.00010166666666666667,
"loss": 0.713,
"step": 120
},
{
"epoch": 2.17,
"learning_rate": 9.333333333333334e-05,
"loss": 0.516,
"step": 130
},
{
"epoch": 2.33,
"learning_rate": 8.5e-05,
"loss": 0.436,
"step": 140
},
{
"epoch": 2.5,
"learning_rate": 7.666666666666667e-05,
"loss": 0.4567,
"step": 150
},
{
"epoch": 2.67,
"learning_rate": 6.833333333333333e-05,
"loss": 0.3406,
"step": 160
},
{
"epoch": 2.83,
"learning_rate": 6e-05,
"loss": 0.3733,
"step": 170
},
{
"epoch": 3.0,
"learning_rate": 5.166666666666667e-05,
"loss": 0.3386,
"step": 180
},
{
"epoch": 3.17,
"learning_rate": 4.3333333333333334e-05,
"loss": 0.2098,
"step": 190
},
{
"epoch": 3.33,
"learning_rate": 3.5e-05,
"loss": 0.13,
"step": 200
},
{
"epoch": 3.33,
"eval_accuracy": 0.9,
"eval_loss": 0.5519602298736572,
"eval_runtime": 1.3933,
"eval_samples_per_second": 21.532,
"eval_steps_per_second": 2.871,
"step": 200
},
{
"epoch": 3.5,
"learning_rate": 2.6666666666666667e-05,
"loss": 0.1127,
"step": 210
},
{
"epoch": 3.67,
"learning_rate": 1.8333333333333333e-05,
"loss": 0.0929,
"step": 220
},
{
"epoch": 3.83,
"learning_rate": 1e-05,
"loss": 0.1072,
"step": 230
},
{
"epoch": 4.0,
"learning_rate": 1.6666666666666667e-06,
"loss": 0.1091,
"step": 240
},
{
"epoch": 4.0,
"step": 240,
"total_flos": 2.972619364024074e+17,
"train_loss": 0.5838068192203839,
"train_runtime": 384.6439,
"train_samples_per_second": 9.973,
"train_steps_per_second": 0.624
}
],
"max_steps": 240,
"num_train_epochs": 4,
"total_flos": 2.972619364024074e+17,
"trial_name": null,
"trial_params": null
}