{ "best_metric": 0.8324507208002354, "best_model_checkpoint": "wav2vec2-base-ks-linear_lrX1000/checkpoint-350", "epoch": 10.0, "global_step": 500, "is_hyper_param_search": false, "is_local_process_zero": true, "is_world_process_zero": true, "log_history": [ { "epoch": 0.2, "learning_rate": 0.006, "loss": 2.078, "step": 10 }, { "epoch": 0.4, "learning_rate": 0.012, "loss": 1.9515, "step": 20 }, { "epoch": 0.6, "learning_rate": 0.018, "loss": 1.625, "step": 30 }, { "epoch": 0.8, "learning_rate": 0.024, "loss": 0.9844, "step": 40 }, { "epoch": 1.0, "learning_rate": 0.03, "loss": 0.7558, "step": 50 }, { "epoch": 1.0, "eval_accuracy": 0.6462194763165637, "eval_loss": 1.0584145784378052, "eval_runtime": 21.5879, "eval_samples_per_second": 314.899, "eval_steps_per_second": 1.251, "step": 50 }, { "epoch": 1.2, "learning_rate": 0.029333333333333333, "loss": 0.7432, "step": 60 }, { "epoch": 1.4, "learning_rate": 0.028666666666666667, "loss": 0.6872, "step": 70 }, { "epoch": 1.6, "learning_rate": 0.028, "loss": 0.6169, "step": 80 }, { "epoch": 1.8, "learning_rate": 0.02733333333333333, "loss": 0.6001, "step": 90 }, { "epoch": 2.0, "learning_rate": 0.026666666666666665, "loss": 0.5971, "step": 100 }, { "epoch": 2.0, "eval_accuracy": 0.7509561635775228, "eval_loss": 0.7815613150596619, "eval_runtime": 21.5518, "eval_samples_per_second": 315.427, "eval_steps_per_second": 1.253, "step": 100 }, { "epoch": 2.2, "learning_rate": 0.026, "loss": 0.5564, "step": 110 }, { "epoch": 2.4, "learning_rate": 0.025333333333333333, "loss": 0.5688, "step": 120 }, { "epoch": 2.6, "learning_rate": 0.024666666666666663, "loss": 0.547, "step": 130 }, { "epoch": 2.8, "learning_rate": 0.024, "loss": 0.554, "step": 140 }, { "epoch": 3.0, "learning_rate": 0.023333333333333334, "loss": 0.5382, "step": 150 }, { "epoch": 3.0, "eval_accuracy": 0.7519858781994704, "eval_loss": 0.7870466113090515, "eval_runtime": 21.5731, "eval_samples_per_second": 315.114, "eval_steps_per_second": 1.252, "step": 150 }, { "epoch": 3.2, "learning_rate": 0.022666666666666665, "loss": 0.5201, "step": 160 }, { "epoch": 3.4, "learning_rate": 0.022, "loss": 0.5182, "step": 170 }, { "epoch": 3.6, "learning_rate": 0.021333333333333333, "loss": 0.4925, "step": 180 }, { "epoch": 3.8, "learning_rate": 0.020666666666666667, "loss": 0.4796, "step": 190 }, { "epoch": 4.0, "learning_rate": 0.019999999999999997, "loss": 0.5045, "step": 200 }, { "epoch": 4.0, "eval_accuracy": 0.7880258899676376, "eval_loss": 0.6646667718887329, "eval_runtime": 21.561, "eval_samples_per_second": 315.291, "eval_steps_per_second": 1.252, "step": 200 }, { "epoch": 4.2, "learning_rate": 0.019333333333333334, "loss": 0.4937, "step": 210 }, { "epoch": 4.4, "learning_rate": 0.018666666666666665, "loss": 0.5115, "step": 220 }, { "epoch": 4.6, "learning_rate": 0.018, "loss": 0.5066, "step": 230 }, { "epoch": 4.8, "learning_rate": 0.017333333333333333, "loss": 0.5229, "step": 240 }, { "epoch": 5.0, "learning_rate": 0.016666666666666666, "loss": 0.4717, "step": 250 }, { "epoch": 5.0, "eval_accuracy": 0.6053250956163577, "eval_loss": 1.157195806503296, "eval_runtime": 21.5727, "eval_samples_per_second": 315.121, "eval_steps_per_second": 1.252, "step": 250 }, { "epoch": 5.2, "learning_rate": 0.016, "loss": 0.4958, "step": 260 }, { "epoch": 5.4, "learning_rate": 0.01533333333333333, "loss": 0.4583, "step": 270 }, { "epoch": 5.6, "learning_rate": 0.014666666666666666, "loss": 0.4818, "step": 280 }, { "epoch": 5.8, "learning_rate": 0.014, "loss": 0.453, "step": 290 }, { "epoch": 6.0, "learning_rate": 0.013333333333333332, "loss": 0.4651, "step": 300 }, { "epoch": 6.0, "eval_accuracy": 0.7944983818770227, "eval_loss": 0.6386590600013733, "eval_runtime": 21.5083, "eval_samples_per_second": 316.064, "eval_steps_per_second": 1.255, "step": 300 }, { "epoch": 6.2, "learning_rate": 0.012666666666666666, "loss": 0.4753, "step": 310 }, { "epoch": 6.4, "learning_rate": 0.012, "loss": 0.4375, "step": 320 }, { "epoch": 6.6, "learning_rate": 0.011333333333333332, "loss": 0.4621, "step": 330 }, { "epoch": 6.8, "learning_rate": 0.010666666666666666, "loss": 0.4491, "step": 340 }, { "epoch": 7.0, "learning_rate": 0.009999999999999998, "loss": 0.4205, "step": 350 }, { "epoch": 7.0, "eval_accuracy": 0.8324507208002354, "eval_loss": 0.5661188960075378, "eval_runtime": 21.6613, "eval_samples_per_second": 313.831, "eval_steps_per_second": 1.246, "step": 350 }, { "epoch": 7.2, "learning_rate": 0.009333333333333332, "loss": 0.4489, "step": 360 }, { "epoch": 7.4, "learning_rate": 0.008666666666666666, "loss": 0.4413, "step": 370 }, { "epoch": 7.6, "learning_rate": 0.008, "loss": 0.4273, "step": 380 }, { "epoch": 7.8, "learning_rate": 0.007333333333333333, "loss": 0.4379, "step": 390 }, { "epoch": 8.0, "learning_rate": 0.006666666666666666, "loss": 0.4423, "step": 400 }, { "epoch": 8.0, "eval_accuracy": 0.7846425419240953, "eval_loss": 0.710049569606781, "eval_runtime": 21.7419, "eval_samples_per_second": 312.669, "eval_steps_per_second": 1.242, "step": 400 }, { "epoch": 8.2, "learning_rate": 0.006, "loss": 0.414, "step": 410 }, { "epoch": 8.4, "learning_rate": 0.005333333333333333, "loss": 0.4385, "step": 420 }, { "epoch": 8.6, "learning_rate": 0.004666666666666666, "loss": 0.4319, "step": 430 }, { "epoch": 8.8, "learning_rate": 0.004, "loss": 0.407, "step": 440 }, { "epoch": 9.0, "learning_rate": 0.003333333333333333, "loss": 0.426, "step": 450 }, { "epoch": 9.0, "eval_accuracy": 0.7828773168578994, "eval_loss": 0.7053545117378235, "eval_runtime": 21.6406, "eval_samples_per_second": 314.131, "eval_steps_per_second": 1.248, "step": 450 }, { "epoch": 9.2, "learning_rate": 0.0026666666666666666, "loss": 0.4198, "step": 460 }, { "epoch": 9.4, "learning_rate": 0.002, "loss": 0.4325, "step": 470 }, { "epoch": 9.6, "learning_rate": 0.0013333333333333333, "loss": 0.3989, "step": 480 }, { "epoch": 9.8, "learning_rate": 0.0006666666666666666, "loss": 0.4232, "step": 490 }, { "epoch": 10.0, "learning_rate": 0.0, "loss": 0.4067, "step": 500 }, { "epoch": 10.0, "eval_accuracy": 0.8114151220947338, "eval_loss": 0.6287888884544373, "eval_runtime": 21.6259, "eval_samples_per_second": 314.346, "eval_steps_per_second": 1.249, "step": 500 }, { "epoch": 10.0, "step": 500, "total_flos": 4.6387626201984e+18, "train_loss": 0.5883967700004578, "train_runtime": 2872.1803, "train_samples_per_second": 177.893, "train_steps_per_second": 0.174 } ], "max_steps": 500, "num_train_epochs": 10, "total_flos": 4.6387626201984e+18, "trial_name": null, "trial_params": null }