{ "best_metric": 0.8000882612533098, "best_model_checkpoint": "wav2vec2-base-ks-linear_lrX100/checkpoint-200", "epoch": 10.0, "global_step": 500, "is_hyper_param_search": false, "is_local_process_zero": true, "is_world_process_zero": true, "log_history": [ { "epoch": 0.2, "learning_rate": 0.0006000000000000001, "loss": 2.3797, "step": 10 }, { "epoch": 0.4, "learning_rate": 0.0012000000000000001, "loss": 1.7088, "step": 20 }, { "epoch": 0.6, "learning_rate": 0.0018, "loss": 1.6113, "step": 30 }, { "epoch": 0.8, "learning_rate": 0.0024000000000000002, "loss": 1.3897, "step": 40 }, { "epoch": 1.0, "learning_rate": 0.003, "loss": 1.1789, "step": 50 }, { "epoch": 1.0, "eval_accuracy": 0.6225360400117682, "eval_loss": 1.3621203899383545, "eval_runtime": 21.3821, "eval_samples_per_second": 317.93, "eval_steps_per_second": 1.263, "step": 50 }, { "epoch": 1.2, "learning_rate": 0.0029333333333333334, "loss": 0.9704, "step": 60 }, { "epoch": 1.4, "learning_rate": 0.0028666666666666667, "loss": 0.8038, "step": 70 }, { "epoch": 1.6, "learning_rate": 0.0028, "loss": 0.7138, "step": 80 }, { "epoch": 1.8, "learning_rate": 0.0027333333333333333, "loss": 0.6653, "step": 90 }, { "epoch": 2.0, "learning_rate": 0.0026666666666666666, "loss": 0.636, "step": 100 }, { "epoch": 2.0, "eval_accuracy": 0.6912327155045601, "eval_loss": 0.9175861477851868, "eval_runtime": 21.4019, "eval_samples_per_second": 317.635, "eval_steps_per_second": 1.262, "step": 100 }, { "epoch": 2.2, "learning_rate": 0.0026000000000000003, "loss": 0.5934, "step": 110 }, { "epoch": 2.4, "learning_rate": 0.002533333333333333, "loss": 0.5859, "step": 120 }, { "epoch": 2.6, "learning_rate": 0.0024666666666666665, "loss": 0.5763, "step": 130 }, { "epoch": 2.8, "learning_rate": 0.0024000000000000002, "loss": 0.5691, "step": 140 }, { "epoch": 3.0, "learning_rate": 0.0023333333333333335, "loss": 0.5575, "step": 150 }, { "epoch": 3.0, "eval_accuracy": 0.7375698734922036, "eval_loss": 0.8543426394462585, "eval_runtime": 21.3905, "eval_samples_per_second": 317.805, "eval_steps_per_second": 1.262, "step": 150 }, { "epoch": 3.2, "learning_rate": 0.002266666666666667, "loss": 0.551, "step": 160 }, { "epoch": 3.4, "learning_rate": 0.0021999999999999997, "loss": 0.5521, "step": 170 }, { "epoch": 3.6, "learning_rate": 0.0021333333333333334, "loss": 0.5286, "step": 180 }, { "epoch": 3.8, "learning_rate": 0.0020666666666666667, "loss": 0.5242, "step": 190 }, { "epoch": 4.0, "learning_rate": 0.002, "loss": 0.5289, "step": 200 }, { "epoch": 4.0, "eval_accuracy": 0.8000882612533098, "eval_loss": 0.6970205307006836, "eval_runtime": 21.418, "eval_samples_per_second": 317.397, "eval_steps_per_second": 1.261, "step": 200 }, { "epoch": 4.2, "learning_rate": 0.0019333333333333336, "loss": 0.5081, "step": 210 }, { "epoch": 4.4, "learning_rate": 0.0018666666666666666, "loss": 0.5112, "step": 220 }, { "epoch": 4.6, "learning_rate": 0.0018, "loss": 0.4974, "step": 230 }, { "epoch": 4.8, "learning_rate": 0.0017333333333333333, "loss": 0.5185, "step": 240 }, { "epoch": 5.0, "learning_rate": 0.0016666666666666668, "loss": 0.4926, "step": 250 }, { "epoch": 5.0, "eval_accuracy": 0.754780817887614, "eval_loss": 0.8231518864631653, "eval_runtime": 21.4963, "eval_samples_per_second": 316.24, "eval_steps_per_second": 1.256, "step": 250 }, { "epoch": 5.2, "learning_rate": 0.0016, "loss": 0.5061, "step": 260 }, { "epoch": 5.4, "learning_rate": 0.0015333333333333332, "loss": 0.4854, "step": 270 }, { "epoch": 5.6, "learning_rate": 0.0014666666666666667, "loss": 0.5022, "step": 280 }, { "epoch": 5.8, "learning_rate": 0.0014, "loss": 0.4705, "step": 290 }, { "epoch": 6.0, "learning_rate": 0.0013333333333333333, "loss": 0.4831, "step": 300 }, { "epoch": 6.0, "eval_accuracy": 0.7755222124154163, "eval_loss": 0.7442342042922974, "eval_runtime": 21.4025, "eval_samples_per_second": 317.626, "eval_steps_per_second": 1.262, "step": 300 }, { "epoch": 6.2, "learning_rate": 0.0012666666666666666, "loss": 0.5032, "step": 310 }, { "epoch": 6.4, "learning_rate": 0.0012000000000000001, "loss": 0.4751, "step": 320 }, { "epoch": 6.6, "learning_rate": 0.0011333333333333334, "loss": 0.4787, "step": 330 }, { "epoch": 6.8, "learning_rate": 0.0010666666666666667, "loss": 0.4752, "step": 340 }, { "epoch": 7.0, "learning_rate": 0.001, "loss": 0.4539, "step": 350 }, { "epoch": 7.0, "eval_accuracy": 0.7784642541924095, "eval_loss": 0.7483688592910767, "eval_runtime": 21.5213, "eval_samples_per_second": 315.873, "eval_steps_per_second": 1.255, "step": 350 }, { "epoch": 7.2, "learning_rate": 0.0009333333333333333, "loss": 0.4729, "step": 360 }, { "epoch": 7.4, "learning_rate": 0.0008666666666666666, "loss": 0.4911, "step": 370 }, { "epoch": 7.6, "learning_rate": 0.0008, "loss": 0.4657, "step": 380 }, { "epoch": 7.8, "learning_rate": 0.0007333333333333333, "loss": 0.4692, "step": 390 }, { "epoch": 8.0, "learning_rate": 0.0006666666666666666, "loss": 0.4816, "step": 400 }, { "epoch": 8.0, "eval_accuracy": 0.7981759340982642, "eval_loss": 0.7037906646728516, "eval_runtime": 21.423, "eval_samples_per_second": 317.322, "eval_steps_per_second": 1.26, "step": 400 }, { "epoch": 8.2, "learning_rate": 0.0006000000000000001, "loss": 0.46, "step": 410 }, { "epoch": 8.4, "learning_rate": 0.0005333333333333334, "loss": 0.4667, "step": 420 }, { "epoch": 8.6, "learning_rate": 0.00046666666666666666, "loss": 0.478, "step": 430 }, { "epoch": 8.8, "learning_rate": 0.0004, "loss": 0.4613, "step": 440 }, { "epoch": 9.0, "learning_rate": 0.0003333333333333333, "loss": 0.4666, "step": 450 }, { "epoch": 9.0, "eval_accuracy": 0.7764048249485143, "eval_loss": 0.7277358770370483, "eval_runtime": 21.3626, "eval_samples_per_second": 318.22, "eval_steps_per_second": 1.264, "step": 450 }, { "epoch": 9.2, "learning_rate": 0.0002666666666666667, "loss": 0.4615, "step": 460 }, { "epoch": 9.4, "learning_rate": 0.0002, "loss": 0.4659, "step": 470 }, { "epoch": 9.6, "learning_rate": 0.00013333333333333334, "loss": 0.4513, "step": 480 }, { "epoch": 9.8, "learning_rate": 6.666666666666667e-05, "loss": 0.4684, "step": 490 }, { "epoch": 10.0, "learning_rate": 0.0, "loss": 0.4417, "step": 500 }, { "epoch": 10.0, "eval_accuracy": 0.7869961753456899, "eval_loss": 0.728851854801178, "eval_runtime": 21.5051, "eval_samples_per_second": 316.111, "eval_steps_per_second": 1.256, "step": 500 }, { "epoch": 10.0, "step": 500, "total_flos": 4.6387626201984e+18, "train_loss": 0.6397550992965698, "train_runtime": 2848.749, "train_samples_per_second": 179.356, "train_steps_per_second": 0.176 } ], "max_steps": 500, "num_train_epochs": 10, "total_flos": 4.6387626201984e+18, "trial_name": null, "trial_params": null }