{ "best_metric": 0.6685789938217123, "best_model_checkpoint": "wav2vec2-base-ks-linear_lrX10/checkpoint-500", "epoch": 10.0, "global_step": 500, "is_hyper_param_search": false, "is_local_process_zero": true, "is_world_process_zero": true, "log_history": [ { "epoch": 0.2, "learning_rate": 5.9999999999999995e-05, "loss": 2.4812, "step": 10 }, { "epoch": 0.4, "learning_rate": 0.00011999999999999999, "loss": 2.3934, "step": 20 }, { "epoch": 0.6, "learning_rate": 0.00017999999999999998, "loss": 2.2123, "step": 30 }, { "epoch": 0.8, "learning_rate": 0.00023999999999999998, "loss": 1.9247, "step": 40 }, { "epoch": 1.0, "learning_rate": 0.0003, "loss": 1.6226, "step": 50 }, { "epoch": 1.0, "eval_accuracy": 0.6209179170344219, "eval_loss": 1.7588366270065308, "eval_runtime": 21.5252, "eval_samples_per_second": 315.815, "eval_steps_per_second": 1.254, "step": 50 }, { "epoch": 1.2, "learning_rate": 0.00029333333333333327, "loss": 1.5341, "step": 60 }, { "epoch": 1.4, "learning_rate": 0.0002866666666666667, "loss": 1.4827, "step": 70 }, { "epoch": 1.6, "learning_rate": 0.00028, "loss": 1.4304, "step": 80 }, { "epoch": 1.8, "learning_rate": 0.00027333333333333333, "loss": 1.4002, "step": 90 }, { "epoch": 2.0, "learning_rate": 0.0002666666666666666, "loss": 1.382, "step": 100 }, { "epoch": 2.0, "eval_accuracy": 0.6209179170344219, "eval_loss": 1.5695877075195312, "eval_runtime": 21.5764, "eval_samples_per_second": 315.067, "eval_steps_per_second": 1.251, "step": 100 }, { "epoch": 2.2, "learning_rate": 0.00026, "loss": 1.3576, "step": 110 }, { "epoch": 2.4, "learning_rate": 0.00025333333333333333, "loss": 1.311, "step": 120 }, { "epoch": 2.6, "learning_rate": 0.0002466666666666666, "loss": 1.2804, "step": 130 }, { "epoch": 2.8, "learning_rate": 0.00023999999999999998, "loss": 1.2763, "step": 140 }, { "epoch": 3.0, "learning_rate": 0.0002333333333333333, "loss": 1.2373, "step": 150 }, { "epoch": 3.0, "eval_accuracy": 0.6212121212121212, "eval_loss": 1.3818469047546387, "eval_runtime": 21.615, "eval_samples_per_second": 314.503, "eval_steps_per_second": 1.249, "step": 150 }, { "epoch": 3.2, "learning_rate": 0.00022666666666666663, "loss": 1.2093, "step": 160 }, { "epoch": 3.4, "learning_rate": 0.00021999999999999995, "loss": 1.1755, "step": 170 }, { "epoch": 3.6, "learning_rate": 0.00021333333333333333, "loss": 1.1348, "step": 180 }, { "epoch": 3.8, "learning_rate": 0.00020666666666666666, "loss": 1.1384, "step": 190 }, { "epoch": 4.0, "learning_rate": 0.00019999999999999998, "loss": 1.1019, "step": 200 }, { "epoch": 4.0, "eval_accuracy": 0.6228302441894675, "eval_loss": 1.2576569318771362, "eval_runtime": 21.6992, "eval_samples_per_second": 313.284, "eval_steps_per_second": 1.244, "step": 200 }, { "epoch": 4.2, "learning_rate": 0.00019333333333333333, "loss": 1.0917, "step": 210 }, { "epoch": 4.4, "learning_rate": 0.00018666666666666666, "loss": 1.0561, "step": 220 }, { "epoch": 4.6, "learning_rate": 0.00017999999999999998, "loss": 1.0332, "step": 230 }, { "epoch": 4.8, "learning_rate": 0.0001733333333333333, "loss": 1.0284, "step": 240 }, { "epoch": 5.0, "learning_rate": 0.00016666666666666666, "loss": 0.9831, "step": 250 }, { "epoch": 5.0, "eval_accuracy": 0.6331273904089438, "eval_loss": 1.182599663734436, "eval_runtime": 21.7405, "eval_samples_per_second": 312.688, "eval_steps_per_second": 1.242, "step": 250 }, { "epoch": 5.2, "learning_rate": 0.00015999999999999999, "loss": 0.9864, "step": 260 }, { "epoch": 5.4, "learning_rate": 0.0001533333333333333, "loss": 0.9584, "step": 270 }, { "epoch": 5.6, "learning_rate": 0.00014666666666666664, "loss": 0.978, "step": 280 }, { "epoch": 5.8, "learning_rate": 0.00014, "loss": 0.9272, "step": 290 }, { "epoch": 6.0, "learning_rate": 0.0001333333333333333, "loss": 0.9241, "step": 300 }, { "epoch": 6.0, "eval_accuracy": 0.6481318034716093, "eval_loss": 1.120007038116455, "eval_runtime": 21.7093, "eval_samples_per_second": 313.138, "eval_steps_per_second": 1.244, "step": 300 }, { "epoch": 6.2, "learning_rate": 0.00012666666666666666, "loss": 0.9326, "step": 310 }, { "epoch": 6.4, "learning_rate": 0.00011999999999999999, "loss": 0.9032, "step": 320 }, { "epoch": 6.6, "learning_rate": 0.00011333333333333331, "loss": 0.8962, "step": 330 }, { "epoch": 6.8, "learning_rate": 0.00010666666666666667, "loss": 0.8878, "step": 340 }, { "epoch": 7.0, "learning_rate": 9.999999999999999e-05, "loss": 0.8695, "step": 350 }, { "epoch": 7.0, "eval_accuracy": 0.6581347455133862, "eval_loss": 1.0821330547332764, "eval_runtime": 21.7517, "eval_samples_per_second": 312.527, "eval_steps_per_second": 1.241, "step": 350 }, { "epoch": 7.2, "learning_rate": 9.333333333333333e-05, "loss": 0.8749, "step": 360 }, { "epoch": 7.4, "learning_rate": 8.666666666666665e-05, "loss": 0.8742, "step": 370 }, { "epoch": 7.6, "learning_rate": 7.999999999999999e-05, "loss": 0.8536, "step": 380 }, { "epoch": 7.8, "learning_rate": 7.333333333333332e-05, "loss": 0.8575, "step": 390 }, { "epoch": 8.0, "learning_rate": 6.666666666666666e-05, "loss": 0.8529, "step": 400 }, { "epoch": 8.0, "eval_accuracy": 0.66519564577817, "eval_loss": 1.0631604194641113, "eval_runtime": 21.7691, "eval_samples_per_second": 312.277, "eval_steps_per_second": 1.24, "step": 400 }, { "epoch": 8.2, "learning_rate": 5.9999999999999995e-05, "loss": 0.8466, "step": 410 }, { "epoch": 8.4, "learning_rate": 5.333333333333333e-05, "loss": 0.8515, "step": 420 }, { "epoch": 8.6, "learning_rate": 4.6666666666666665e-05, "loss": 0.8432, "step": 430 }, { "epoch": 8.8, "learning_rate": 3.9999999999999996e-05, "loss": 0.823, "step": 440 }, { "epoch": 9.0, "learning_rate": 3.333333333333333e-05, "loss": 0.8385, "step": 450 }, { "epoch": 9.0, "eval_accuracy": 0.6676963812886143, "eval_loss": 1.0494288206100464, "eval_runtime": 21.67, "eval_samples_per_second": 313.706, "eval_steps_per_second": 1.246, "step": 450 }, { "epoch": 9.2, "learning_rate": 2.6666666666666667e-05, "loss": 0.842, "step": 460 }, { "epoch": 9.4, "learning_rate": 1.9999999999999998e-05, "loss": 0.8235, "step": 470 }, { "epoch": 9.6, "learning_rate": 1.3333333333333333e-05, "loss": 0.8233, "step": 480 }, { "epoch": 9.8, "learning_rate": 6.666666666666667e-06, "loss": 0.8304, "step": 490 }, { "epoch": 10.0, "learning_rate": 0.0, "loss": 0.8162, "step": 500 }, { "epoch": 10.0, "eval_accuracy": 0.6685789938217123, "eval_loss": 1.0471274852752686, "eval_runtime": 21.6937, "eval_samples_per_second": 313.363, "eval_steps_per_second": 1.245, "step": 500 }, { "epoch": 10.0, "step": 500, "total_flos": 4.6387626201984e+18, "train_loss": 1.1438689880371093, "train_runtime": 2860.7533, "train_samples_per_second": 178.603, "train_steps_per_second": 0.175 } ], "max_steps": 500, "num_train_epochs": 10, "total_flos": 4.6387626201984e+18, "trial_name": null, "trial_params": null }