wav2vec2-base-ks-ept4 / trainer_state.json

End of training

57b1f77 almost 2 years ago

No virus

8.83 kB

	{
	"best_metric": 0.6209179170344219,
	"best_model_checkpoint": "wav2vec2-base-ks-ept4/checkpoint-50",
	"epoch": 10.0,
	"global_step": 500,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.2,
	"learning_rate": 0.0006000000000000001,
	"loss": 2.3283,
	"step": 10
	},
	{
	"epoch": 0.4,
	"learning_rate": 0.0012000000000000001,
	"loss": 1.6542,
	"step": 20
	},
	{
	"epoch": 0.6,
	"learning_rate": 0.0018,
	"loss": 1.6034,
	"step": 30
	},
	{
	"epoch": 0.8,
	"learning_rate": 0.0024000000000000002,
	"loss": 1.5269,
	"step": 40
	},
	{
	"epoch": 1.0,
	"learning_rate": 0.003,
	"loss": 1.5133,
	"step": 50
	},
	{
	"epoch": 1.0,
	"eval_accuracy": 0.6209179170344219,
	"eval_loss": 1.5663108825683594,
	"eval_runtime": 21.8829,
	"eval_samples_per_second": 310.653,
	"eval_steps_per_second": 1.234,
	"step": 50
	},
	{
	"epoch": 1.2,
	"learning_rate": 0.0029333333333333334,
	"loss": 1.5101,
	"step": 60
	},
	{
	"epoch": 1.4,
	"learning_rate": 0.0028666666666666667,
	"loss": 1.508,
	"step": 70
	},
	{
	"epoch": 1.6,
	"learning_rate": 0.0028,
	"loss": 1.4892,
	"step": 80
	},
	{
	"epoch": 1.8,
	"learning_rate": 0.0027333333333333333,
	"loss": 1.4799,
	"step": 90
	},
	{
	"epoch": 2.0,
	"learning_rate": 0.0026666666666666666,
	"loss": 1.4819,
	"step": 100
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.616946160635481,
	"eval_loss": 1.567515254020691,
	"eval_runtime": 21.8563,
	"eval_samples_per_second": 311.031,
	"eval_steps_per_second": 1.235,
	"step": 100
	},
	{
	"epoch": 2.2,
	"learning_rate": 0.0026000000000000003,
	"loss": 1.4618,
	"step": 110
	},
	{
	"epoch": 2.4,
	"learning_rate": 0.002533333333333333,
	"loss": 1.4394,
	"step": 120
	},
	{
	"epoch": 2.6,
	"learning_rate": 0.0024666666666666665,
	"loss": 1.4276,
	"step": 130
	},
	{
	"epoch": 2.8,
	"learning_rate": 0.0024000000000000002,
	"loss": 1.4366,
	"step": 140
	},
	{
	"epoch": 3.0,
	"learning_rate": 0.0023333333333333335,
	"loss": 1.4082,
	"step": 150
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.5801706384230656,
	"eval_loss": 1.5372090339660645,
	"eval_runtime": 21.932,
	"eval_samples_per_second": 309.959,
	"eval_steps_per_second": 1.231,
	"step": 150
	},
	{
	"epoch": 3.2,
	"learning_rate": 0.002266666666666667,
	"loss": 1.3901,
	"step": 160
	},
	{
	"epoch": 3.4,
	"learning_rate": 0.0021999999999999997,
	"loss": 1.3768,
	"step": 170
	},
	{
	"epoch": 3.6,
	"learning_rate": 0.0021333333333333334,
	"loss": 1.3484,
	"step": 180
	},
	{
	"epoch": 3.8,
	"learning_rate": 0.0020666666666666667,
	"loss": 1.383,
	"step": 190
	},
	{
	"epoch": 4.0,
	"learning_rate": 0.002,
	"loss": 1.3536,
	"step": 200
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.5338334804354222,
	"eval_loss": 1.6715859174728394,
	"eval_runtime": 21.8613,
	"eval_samples_per_second": 310.96,
	"eval_steps_per_second": 1.235,
	"step": 200
	},
	{
	"epoch": 4.2,
	"learning_rate": 0.0019333333333333336,
	"loss": 1.3741,
	"step": 210
	},
	{
	"epoch": 4.4,
	"learning_rate": 0.0018666666666666666,
	"loss": 1.3391,
	"step": 220
	},
	{
	"epoch": 4.6,
	"learning_rate": 0.0018,
	"loss": 1.3356,
	"step": 230
	},
	{
	"epoch": 4.8,
	"learning_rate": 0.0017333333333333333,
	"loss": 1.3387,
	"step": 240
	},
	{
	"epoch": 5.0,
	"learning_rate": 0.0016666666666666668,
	"loss": 1.296,
	"step": 250
	},
	{
	"epoch": 5.0,
	"eval_accuracy": 0.5398646660782583,
	"eval_loss": 1.7601238489151,
	"eval_runtime": 22.0068,
	"eval_samples_per_second": 308.905,
	"eval_steps_per_second": 1.227,
	"step": 250
	},
	{
	"epoch": 5.2,
	"learning_rate": 0.0016,
	"loss": 1.3301,
	"step": 260
	},
	{
	"epoch": 5.4,
	"learning_rate": 0.0015333333333333332,
	"loss": 1.302,
	"step": 270
	},
	{
	"epoch": 5.6,
	"learning_rate": 0.0014666666666666667,
	"loss": 1.336,
	"step": 280
	},
	{
	"epoch": 5.8,
	"learning_rate": 0.0014,
	"loss": 1.294,
	"step": 290
	},
	{
	"epoch": 6.0,
	"learning_rate": 0.0013333333333333333,
	"loss": 1.3053,
	"step": 300
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.5629596940276552,
	"eval_loss": 1.6777722835540771,
	"eval_runtime": 21.9377,
	"eval_samples_per_second": 309.877,
	"eval_steps_per_second": 1.231,
	"step": 300
	},
	{
	"epoch": 6.2,
	"learning_rate": 0.0012666666666666666,
	"loss": 1.3201,
	"step": 310
	},
	{
	"epoch": 6.4,
	"learning_rate": 0.0012000000000000001,
	"loss": 1.2991,
	"step": 320
	},
	{
	"epoch": 6.6,
	"learning_rate": 0.0011333333333333334,
	"loss": 1.2925,
	"step": 330
	},
	{
	"epoch": 6.8,
	"learning_rate": 0.0010666666666666667,
	"loss": 1.2839,
	"step": 340
	},
	{
	"epoch": 7.0,
	"learning_rate": 0.001,
	"loss": 1.2734,
	"step": 350
	},
	{
	"epoch": 7.0,
	"eval_accuracy": 0.5734039423359811,
	"eval_loss": 1.6553702354431152,
	"eval_runtime": 21.7383,
	"eval_samples_per_second": 312.72,
	"eval_steps_per_second": 1.242,
	"step": 350
	},
	{
	"epoch": 7.2,
	"learning_rate": 0.0009333333333333333,
	"loss": 1.2872,
	"step": 360
	},
	{
	"epoch": 7.4,
	"learning_rate": 0.0008666666666666666,
	"loss": 1.2871,
	"step": 370
	},
	{
	"epoch": 7.6,
	"learning_rate": 0.0008,
	"loss": 1.2759,
	"step": 380
	},
	{
	"epoch": 7.8,
	"learning_rate": 0.0007333333333333333,
	"loss": 1.2837,
	"step": 390
	},
	{
	"epoch": 8.0,
	"learning_rate": 0.0006666666666666666,
	"loss": 1.2837,
	"step": 400
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.5741394527802295,
	"eval_loss": 1.7337615489959717,
	"eval_runtime": 21.934,
	"eval_samples_per_second": 309.93,
	"eval_steps_per_second": 1.231,
	"step": 400
	},
	{
	"epoch": 8.2,
	"learning_rate": 0.0006000000000000001,
	"loss": 1.2858,
	"step": 410
	},
	{
	"epoch": 8.4,
	"learning_rate": 0.0005333333333333334,
	"loss": 1.2885,
	"step": 420
	},
	{
	"epoch": 8.6,
	"learning_rate": 0.00046666666666666666,
	"loss": 1.2894,
	"step": 430
	},
	{
	"epoch": 8.8,
	"learning_rate": 0.0004,
	"loss": 1.2564,
	"step": 440
	},
	{
	"epoch": 9.0,
	"learning_rate": 0.0003333333333333333,
	"loss": 1.2682,
	"step": 450
	},
	{
	"epoch": 9.0,
	"eval_accuracy": 0.577375698734922,
	"eval_loss": 1.7313262224197388,
	"eval_runtime": 21.8086,
	"eval_samples_per_second": 311.712,
	"eval_steps_per_second": 1.238,
	"step": 450
	},
	{
	"epoch": 9.2,
	"learning_rate": 0.0002666666666666667,
	"loss": 1.2823,
	"step": 460
	},
	{
	"epoch": 9.4,
	"learning_rate": 0.0002,
	"loss": 1.2619,
	"step": 470
	},
	{
	"epoch": 9.6,
	"learning_rate": 0.00013333333333333334,
	"loss": 1.2786,
	"step": 480
	},
	{
	"epoch": 9.8,
	"learning_rate": 6.666666666666667e-05,
	"loss": 1.2655,
	"step": 490
	},
	{
	"epoch": 10.0,
	"learning_rate": 0.0,
	"loss": 1.2776,
	"step": 500
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.5791409238011179,
	"eval_loss": 1.7083179950714111,
	"eval_runtime": 21.8044,
	"eval_samples_per_second": 311.771,
	"eval_steps_per_second": 1.238,
	"step": 500
	},
	{
	"epoch": 10.0,
	"step": 500,
	"total_flos": 4.64057080824576e+18,
	"train_loss": 1.3802507629394531,
	"train_runtime": 2795.9881,
	"train_samples_per_second": 182.74,
	"train_steps_per_second": 0.179
	}
	],
	"max_steps": 500,
	"num_train_epochs": 10,
	"total_flos": 4.64057080824576e+18,
	"trial_name": null,
	"trial_params": null
	}