{ "best_metric": 0.6037069726390115, "best_model_checkpoint": "wav2vec2-base-ks-padpt200/checkpoint-50", "epoch": 10.0, "global_step": 500, "is_hyper_param_search": false, "is_local_process_zero": true, "is_world_process_zero": true, "log_history": [ { "epoch": 0.2, "learning_rate": 0.0006000000000000001, "loss": 2.3517, "step": 10 }, { "epoch": 0.4, "learning_rate": 0.0012000000000000001, "loss": 1.6787, "step": 20 }, { "epoch": 0.6, "learning_rate": 0.0018, "loss": 1.6019, "step": 30 }, { "epoch": 0.8, "learning_rate": 0.0024000000000000002, "loss": 1.4328, "step": 40 }, { "epoch": 1.0, "learning_rate": 0.003, "loss": 1.2728, "step": 50 }, { "epoch": 1.0, "eval_accuracy": 0.6037069726390115, "eval_loss": 1.654016137123108, "eval_runtime": 21.5386, "eval_samples_per_second": 315.619, "eval_steps_per_second": 1.254, "step": 50 }, { "epoch": 1.2, "learning_rate": 0.0029333333333333334, "loss": 1.1348, "step": 60 }, { "epoch": 1.4, "learning_rate": 0.0028666666666666667, "loss": 1.0202, "step": 70 }, { "epoch": 1.6, "learning_rate": 0.0028, "loss": 0.9311, "step": 80 }, { "epoch": 1.8, "learning_rate": 0.0027333333333333333, "loss": 0.875, "step": 90 }, { "epoch": 2.0, "learning_rate": 0.0026666666666666666, "loss": 0.8498, "step": 100 }, { "epoch": 2.0, "eval_accuracy": 0.6015004413062666, "eval_loss": 1.2558543682098389, "eval_runtime": 21.512, "eval_samples_per_second": 316.01, "eval_steps_per_second": 1.255, "step": 100 }, { "epoch": 2.2, "learning_rate": 0.0026000000000000003, "loss": 0.8029, "step": 110 }, { "epoch": 2.4, "learning_rate": 0.002533333333333333, "loss": 0.7905, "step": 120 }, { "epoch": 2.6, "learning_rate": 0.0024666666666666665, "loss": 0.7623, "step": 130 }, { "epoch": 2.8, "learning_rate": 0.0024000000000000002, "loss": 0.7663, "step": 140 }, { "epoch": 3.0, "learning_rate": 0.0023333333333333335, "loss": 0.7563, "step": 150 }, { "epoch": 3.0, "eval_accuracy": 0.5035304501323918, "eval_loss": 1.4191871881484985, "eval_runtime": 21.609, "eval_samples_per_second": 314.591, "eval_steps_per_second": 1.249, "step": 150 }, { "epoch": 3.2, "learning_rate": 0.002266666666666667, "loss": 0.7197, "step": 160 }, { "epoch": 3.4, "learning_rate": 0.0021999999999999997, "loss": 0.7179, "step": 170 }, { "epoch": 3.6, "learning_rate": 0.0021333333333333334, "loss": 0.712, "step": 180 }, { "epoch": 3.8, "learning_rate": 0.0020666666666666667, "loss": 0.7052, "step": 190 }, { "epoch": 4.0, "learning_rate": 0.002, "loss": 0.701, "step": 200 }, { "epoch": 4.0, "eval_accuracy": 0.5641365107384525, "eval_loss": 1.3318381309509277, "eval_runtime": 21.6642, "eval_samples_per_second": 313.79, "eval_steps_per_second": 1.246, "step": 200 }, { "epoch": 4.2, "learning_rate": 0.0019333333333333336, "loss": 0.7089, "step": 210 }, { "epoch": 4.4, "learning_rate": 0.0018666666666666666, "loss": 0.6701, "step": 220 }, { "epoch": 4.6, "learning_rate": 0.0018, "loss": 0.6708, "step": 230 }, { "epoch": 4.8, "learning_rate": 0.0017333333333333333, "loss": 0.6919, "step": 240 }, { "epoch": 5.0, "learning_rate": 0.0016666666666666668, "loss": 0.6592, "step": 250 }, { "epoch": 5.0, "eval_accuracy": 0.5666372462488968, "eval_loss": 1.3235656023025513, "eval_runtime": 21.5427, "eval_samples_per_second": 315.559, "eval_steps_per_second": 1.253, "step": 250 }, { "epoch": 5.2, "learning_rate": 0.0016, "loss": 0.6754, "step": 260 }, { "epoch": 5.4, "learning_rate": 0.0015333333333333332, "loss": 0.6507, "step": 270 }, { "epoch": 5.6, "learning_rate": 0.0014666666666666667, "loss": 0.6772, "step": 280 }, { "epoch": 5.8, "learning_rate": 0.0014, "loss": 0.6406, "step": 290 }, { "epoch": 6.0, "learning_rate": 0.0013333333333333333, "loss": 0.6404, "step": 300 }, { "epoch": 6.0, "eval_accuracy": 0.5469255663430421, "eval_loss": 1.3652924299240112, "eval_runtime": 21.5599, "eval_samples_per_second": 315.308, "eval_steps_per_second": 1.252, "step": 300 }, { "epoch": 6.2, "learning_rate": 0.0012666666666666666, "loss": 0.6756, "step": 310 }, { "epoch": 6.4, "learning_rate": 0.0012000000000000001, "loss": 0.6302, "step": 320 }, { "epoch": 6.6, "learning_rate": 0.0011333333333333334, "loss": 0.6518, "step": 330 }, { "epoch": 6.8, "learning_rate": 0.0010666666666666667, "loss": 0.6366, "step": 340 }, { "epoch": 7.0, "learning_rate": 0.001, "loss": 0.6315, "step": 350 }, { "epoch": 7.0, "eval_accuracy": 0.5082377169755811, "eval_loss": 1.4052200317382812, "eval_runtime": 21.5251, "eval_samples_per_second": 315.818, "eval_steps_per_second": 1.254, "step": 350 }, { "epoch": 7.2, "learning_rate": 0.0009333333333333333, "loss": 0.6419, "step": 360 }, { "epoch": 7.4, "learning_rate": 0.0008666666666666666, "loss": 0.6378, "step": 370 }, { "epoch": 7.6, "learning_rate": 0.0008, "loss": 0.6341, "step": 380 }, { "epoch": 7.8, "learning_rate": 0.0007333333333333333, "loss": 0.622, "step": 390 }, { "epoch": 8.0, "learning_rate": 0.0006666666666666666, "loss": 0.6306, "step": 400 }, { "epoch": 8.0, "eval_accuracy": 0.5589879376287143, "eval_loss": 1.2818050384521484, "eval_runtime": 21.6065, "eval_samples_per_second": 314.627, "eval_steps_per_second": 1.25, "step": 400 }, { "epoch": 8.2, "learning_rate": 0.0006000000000000001, "loss": 0.6304, "step": 410 }, { "epoch": 8.4, "learning_rate": 0.0005333333333333334, "loss": 0.6259, "step": 420 }, { "epoch": 8.6, "learning_rate": 0.00046666666666666666, "loss": 0.6382, "step": 430 }, { "epoch": 8.8, "learning_rate": 0.0004, "loss": 0.614, "step": 440 }, { "epoch": 9.0, "learning_rate": 0.0003333333333333333, "loss": 0.6297, "step": 450 }, { "epoch": 9.0, "eval_accuracy": 0.5659017358046484, "eval_loss": 1.3096237182617188, "eval_runtime": 21.4981, "eval_samples_per_second": 316.214, "eval_steps_per_second": 1.256, "step": 450 }, { "epoch": 9.2, "learning_rate": 0.0002666666666666667, "loss": 0.6214, "step": 460 }, { "epoch": 9.4, "learning_rate": 0.0002, "loss": 0.615, "step": 470 }, { "epoch": 9.6, "learning_rate": 0.00013333333333333334, "loss": 0.6261, "step": 480 }, { "epoch": 9.8, "learning_rate": 6.666666666666667e-05, "loss": 0.6285, "step": 490 }, { "epoch": 10.0, "learning_rate": 0.0, "loss": 0.6056, "step": 500 }, { "epoch": 10.0, "eval_accuracy": 0.5367755222124154, "eval_loss": 1.3595339059829712, "eval_runtime": 21.6001, "eval_samples_per_second": 314.721, "eval_steps_per_second": 1.25, "step": 500 }, { "epoch": 10.0, "step": 500, "total_flos": 4.6387822402944e+18, "train_loss": 0.797907998085022, "train_runtime": 2773.1028, "train_samples_per_second": 184.248, "train_steps_per_second": 0.18 } ], "max_steps": 500, "num_train_epochs": 10, "total_flos": 4.6387822402944e+18, "trial_name": null, "trial_params": null }