videomae-base-finetuned-Risky-situations / trainer_state.json

End of training

91bea8a verified 3 months ago

No virus

4.56 kB

	{
	"best_metric": 1.0,
	"best_model_checkpoint": "videomae-base-finetuned-Risky-situations/checkpoint-25",
	"epoch": 4.2,
	"eval_steps": 500,
	"global_step": 125,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.08,
	"grad_norm": 8.516080856323242,
	"learning_rate": 3.846153846153846e-05,
	"loss": 0.5136,
	"step": 10
	},
	{
	"epoch": 0.16,
	"grad_norm": 40.52229690551758,
	"learning_rate": 4.6875e-05,
	"loss": 0.4618,
	"step": 20
	},
	{
	"epoch": 0.2,
	"eval_accuracy": 1.0,
	"eval_loss": 0.010277315974235535,
	"eval_runtime": 11.9488,
	"eval_samples_per_second": 1.004,
	"eval_steps_per_second": 0.502,
	"step": 25
	},
	{
	"epoch": 1.04,
	"grad_norm": 110.08763122558594,
	"learning_rate": 4.2410714285714285e-05,
	"loss": 0.0748,
	"step": 30
	},
	{
	"epoch": 1.12,
	"grad_norm": 14.86829662322998,
	"learning_rate": 3.794642857142857e-05,
	"loss": 0.6214,
	"step": 40
	},
	{
	"epoch": 1.2,
	"grad_norm": 0.27806639671325684,
	"learning_rate": 3.348214285714286e-05,
	"loss": 0.3548,
	"step": 50
	},
	{
	"epoch": 1.2,
	"eval_accuracy": 1.0,
	"eval_loss": 0.002936301752924919,
	"eval_runtime": 11.6674,
	"eval_samples_per_second": 1.029,
	"eval_steps_per_second": 0.514,
	"step": 50
	},
	{
	"epoch": 2.08,
	"grad_norm": 0.032773926854133606,
	"learning_rate": 2.9017857142857146e-05,
	"loss": 0.2253,
	"step": 60
	},
	{
	"epoch": 2.16,
	"grad_norm": 0.036098264157772064,
	"learning_rate": 2.455357142857143e-05,
	"loss": 0.2182,
	"step": 70
	},
	{
	"epoch": 2.2,
	"eval_accuracy": 1.0,
	"eval_loss": 0.0008991466020233929,
	"eval_runtime": 11.8302,
	"eval_samples_per_second": 1.014,
	"eval_steps_per_second": 0.507,
	"step": 75
	},
	{
	"epoch": 3.04,
	"grad_norm": 0.034782785922288895,
	"learning_rate": 2.0089285714285717e-05,
	"loss": 0.0011,
	"step": 80
	},
	{
	"epoch": 3.12,
	"grad_norm": 0.4517887532711029,
	"learning_rate": 1.5625e-05,
	"loss": 0.3581,
	"step": 90
	},
	{
	"epoch": 3.2,
	"grad_norm": 3.7396240234375,
	"learning_rate": 1.1160714285714287e-05,
	"loss": 0.2513,
	"step": 100
	},
	{
	"epoch": 3.2,
	"eval_accuracy": 1.0,
	"eval_loss": 0.003270552260801196,
	"eval_runtime": 11.5723,
	"eval_samples_per_second": 1.037,
	"eval_steps_per_second": 0.518,
	"step": 100
	},
	{
	"epoch": 4.08,
	"grad_norm": 357.18890380859375,
	"learning_rate": 6.696428571428572e-06,
	"loss": 0.2286,
	"step": 110
	},
	{
	"epoch": 4.16,
	"grad_norm": 0.019339008256793022,
	"learning_rate": 2.2321428571428573e-06,
	"loss": 0.0021,
	"step": 120
	},
	{
	"epoch": 4.2,
	"eval_accuracy": 1.0,
	"eval_loss": 0.0007905661477707326,
	"eval_runtime": 14.2671,
	"eval_samples_per_second": 0.841,
	"eval_steps_per_second": 0.421,
	"step": 125
	},
	{
	"epoch": 4.2,
	"step": 125,
	"total_flos": 3.11516147367936e+17,
	"train_loss": 0.26490905868075787,
	"train_runtime": 483.7689,
	"train_samples_per_second": 0.517,
	"train_steps_per_second": 0.258
	},
	{
	"epoch": 4.2,
	"eval_accuracy": 0.7692307692307693,
	"eval_loss": 0.6328043341636658,
	"eval_runtime": 16.8871,
	"eval_samples_per_second": 0.77,
	"eval_steps_per_second": 0.415,
	"step": 125
	},
	{
	"epoch": 4.2,
	"eval_accuracy": 0.75,
	"eval_loss": 0.6846519112586975,
	"eval_runtime": 14.0555,
	"eval_samples_per_second": 0.854,
	"eval_steps_per_second": 0.427,
	"step": 125
	}
	],
	"logging_steps": 10,
	"max_steps": 125,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 9223372036854775807,
	"save_steps": 500,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": true
	},
	"attributes": {}
	}
	},
	"total_flos": 3.11516147367936e+17,
	"train_batch_size": 2,
	"trial_name": null,
	"trial_params": null
	}