{ "best_metric": 0.6209179170344219, "best_model_checkpoint": "wav2vec2-base-ks-ept4/checkpoint-50", "epoch": 10.0, "global_step": 500, "is_hyper_param_search": false, "is_local_process_zero": true, "is_world_process_zero": true, "log_history": [ { "epoch": 0.2, "learning_rate": 0.0006000000000000001, "loss": 2.3283, "step": 10 }, { "epoch": 0.4, "learning_rate": 0.0012000000000000001, "loss": 1.6542, "step": 20 }, { "epoch": 0.6, "learning_rate": 0.0018, "loss": 1.6034, "step": 30 }, { "epoch": 0.8, "learning_rate": 0.0024000000000000002, "loss": 1.5269, "step": 40 }, { "epoch": 1.0, "learning_rate": 0.003, "loss": 1.5133, "step": 50 }, { "epoch": 1.0, "eval_accuracy": 0.6209179170344219, "eval_loss": 1.5663108825683594, "eval_runtime": 21.8829, "eval_samples_per_second": 310.653, "eval_steps_per_second": 1.234, "step": 50 }, { "epoch": 1.2, "learning_rate": 0.0029333333333333334, "loss": 1.5101, "step": 60 }, { "epoch": 1.4, "learning_rate": 0.0028666666666666667, "loss": 1.508, "step": 70 }, { "epoch": 1.6, "learning_rate": 0.0028, "loss": 1.4892, "step": 80 }, { "epoch": 1.8, "learning_rate": 0.0027333333333333333, "loss": 1.4799, "step": 90 }, { "epoch": 2.0, "learning_rate": 0.0026666666666666666, "loss": 1.4819, "step": 100 }, { "epoch": 2.0, "eval_accuracy": 0.616946160635481, "eval_loss": 1.567515254020691, "eval_runtime": 21.8563, "eval_samples_per_second": 311.031, "eval_steps_per_second": 1.235, "step": 100 }, { "epoch": 2.2, "learning_rate": 0.0026000000000000003, "loss": 1.4618, "step": 110 }, { "epoch": 2.4, "learning_rate": 0.002533333333333333, "loss": 1.4394, "step": 120 }, { "epoch": 2.6, "learning_rate": 0.0024666666666666665, "loss": 1.4276, "step": 130 }, { "epoch": 2.8, "learning_rate": 0.0024000000000000002, "loss": 1.4366, "step": 140 }, { "epoch": 3.0, "learning_rate": 0.0023333333333333335, "loss": 1.4082, "step": 150 }, { "epoch": 3.0, "eval_accuracy": 0.5801706384230656, "eval_loss": 1.5372090339660645, "eval_runtime": 21.932, "eval_samples_per_second": 309.959, "eval_steps_per_second": 1.231, "step": 150 }, { "epoch": 3.2, "learning_rate": 0.002266666666666667, "loss": 1.3901, "step": 160 }, { "epoch": 3.4, "learning_rate": 0.0021999999999999997, "loss": 1.3768, "step": 170 }, { "epoch": 3.6, "learning_rate": 0.0021333333333333334, "loss": 1.3484, "step": 180 }, { "epoch": 3.8, "learning_rate": 0.0020666666666666667, "loss": 1.383, "step": 190 }, { "epoch": 4.0, "learning_rate": 0.002, "loss": 1.3536, "step": 200 }, { "epoch": 4.0, "eval_accuracy": 0.5338334804354222, "eval_loss": 1.6715859174728394, "eval_runtime": 21.8613, "eval_samples_per_second": 310.96, "eval_steps_per_second": 1.235, "step": 200 }, { "epoch": 4.2, "learning_rate": 0.0019333333333333336, "loss": 1.3741, "step": 210 }, { "epoch": 4.4, "learning_rate": 0.0018666666666666666, "loss": 1.3391, "step": 220 }, { "epoch": 4.6, "learning_rate": 0.0018, "loss": 1.3356, "step": 230 }, { "epoch": 4.8, "learning_rate": 0.0017333333333333333, "loss": 1.3387, "step": 240 }, { "epoch": 5.0, "learning_rate": 0.0016666666666666668, "loss": 1.296, "step": 250 }, { "epoch": 5.0, "eval_accuracy": 0.5398646660782583, "eval_loss": 1.7601238489151, "eval_runtime": 22.0068, "eval_samples_per_second": 308.905, "eval_steps_per_second": 1.227, "step": 250 }, { "epoch": 5.2, "learning_rate": 0.0016, "loss": 1.3301, "step": 260 }, { "epoch": 5.4, "learning_rate": 0.0015333333333333332, "loss": 1.302, "step": 270 }, { "epoch": 5.6, "learning_rate": 0.0014666666666666667, "loss": 1.336, "step": 280 }, { "epoch": 5.8, "learning_rate": 0.0014, "loss": 1.294, "step": 290 }, { "epoch": 6.0, "learning_rate": 0.0013333333333333333, "loss": 1.3053, "step": 300 }, { "epoch": 6.0, "eval_accuracy": 0.5629596940276552, "eval_loss": 1.6777722835540771, "eval_runtime": 21.9377, "eval_samples_per_second": 309.877, "eval_steps_per_second": 1.231, "step": 300 }, { "epoch": 6.2, "learning_rate": 0.0012666666666666666, "loss": 1.3201, "step": 310 }, { "epoch": 6.4, "learning_rate": 0.0012000000000000001, "loss": 1.2991, "step": 320 }, { "epoch": 6.6, "learning_rate": 0.0011333333333333334, "loss": 1.2925, "step": 330 }, { "epoch": 6.8, "learning_rate": 0.0010666666666666667, "loss": 1.2839, "step": 340 }, { "epoch": 7.0, "learning_rate": 0.001, "loss": 1.2734, "step": 350 }, { "epoch": 7.0, "eval_accuracy": 0.5734039423359811, "eval_loss": 1.6553702354431152, "eval_runtime": 21.7383, "eval_samples_per_second": 312.72, "eval_steps_per_second": 1.242, "step": 350 }, { "epoch": 7.2, "learning_rate": 0.0009333333333333333, "loss": 1.2872, "step": 360 }, { "epoch": 7.4, "learning_rate": 0.0008666666666666666, "loss": 1.2871, "step": 370 }, { "epoch": 7.6, "learning_rate": 0.0008, "loss": 1.2759, "step": 380 }, { "epoch": 7.8, "learning_rate": 0.0007333333333333333, "loss": 1.2837, "step": 390 }, { "epoch": 8.0, "learning_rate": 0.0006666666666666666, "loss": 1.2837, "step": 400 }, { "epoch": 8.0, "eval_accuracy": 0.5741394527802295, "eval_loss": 1.7337615489959717, "eval_runtime": 21.934, "eval_samples_per_second": 309.93, "eval_steps_per_second": 1.231, "step": 400 }, { "epoch": 8.2, "learning_rate": 0.0006000000000000001, "loss": 1.2858, "step": 410 }, { "epoch": 8.4, "learning_rate": 0.0005333333333333334, "loss": 1.2885, "step": 420 }, { "epoch": 8.6, "learning_rate": 0.00046666666666666666, "loss": 1.2894, "step": 430 }, { "epoch": 8.8, "learning_rate": 0.0004, "loss": 1.2564, "step": 440 }, { "epoch": 9.0, "learning_rate": 0.0003333333333333333, "loss": 1.2682, "step": 450 }, { "epoch": 9.0, "eval_accuracy": 0.577375698734922, "eval_loss": 1.7313262224197388, "eval_runtime": 21.8086, "eval_samples_per_second": 311.712, "eval_steps_per_second": 1.238, "step": 450 }, { "epoch": 9.2, "learning_rate": 0.0002666666666666667, "loss": 1.2823, "step": 460 }, { "epoch": 9.4, "learning_rate": 0.0002, "loss": 1.2619, "step": 470 }, { "epoch": 9.6, "learning_rate": 0.00013333333333333334, "loss": 1.2786, "step": 480 }, { "epoch": 9.8, "learning_rate": 6.666666666666667e-05, "loss": 1.2655, "step": 490 }, { "epoch": 10.0, "learning_rate": 0.0, "loss": 1.2776, "step": 500 }, { "epoch": 10.0, "eval_accuracy": 0.5791409238011179, "eval_loss": 1.7083179950714111, "eval_runtime": 21.8044, "eval_samples_per_second": 311.771, "eval_steps_per_second": 1.238, "step": 500 }, { "epoch": 10.0, "step": 500, "total_flos": 4.64057080824576e+18, "train_loss": 1.3802507629394531, "train_runtime": 2795.9881, "train_samples_per_second": 182.74, "train_steps_per_second": 0.179 } ], "max_steps": 500, "num_train_epochs": 10, "total_flos": 4.64057080824576e+18, "trial_name": null, "trial_params": null }