abdusah
/

aradia-ctc-data2vec-ft

+{
+    "epoch": 30.0,
+    "eval_loss": 3.0463998317718506,
+    "eval_runtime": 175.3201,
+    "eval_samples": 4899,
+    "eval_samples_per_second": 27.943,
+    "eval_steps_per_second": 0.878,
+    "eval_wer": 1.0,
+    "train_loss": 3.233657403475996,
+    "train_runtime": 33798.1213,
+    "train_samples": 14730,
+    "train_samples_per_second": 13.075,
+    "train_steps_per_second": 0.204
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 30.0,
+    "eval_loss": 3.0463998317718506,
+    "eval_runtime": 175.3201,
+    "eval_samples": 4899,
+    "eval_samples_per_second": 27.943,
+    "eval_steps_per_second": 0.878,
+    "eval_wer": 1.0
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 30.0,
+    "train_loss": 3.233657403475996,
+    "train_runtime": 33798.1213,
+    "train_samples": 14730,
+    "train_samples_per_second": 13.075,
+    "train_steps_per_second": 0.204
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,724 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 29.997830802603037,
+  "global_step": 6900,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.43,
+      "eval_loss": 3.3600032329559326,
+      "eval_runtime": 177.4912,
+      "eval_samples_per_second": 27.601,
+      "eval_steps_per_second": 0.868,
+      "eval_wer": 1.0,
+      "step": 100
+    },
+    {
+      "epoch": 0.87,
+      "eval_loss": 3.088737726211548,
+      "eval_runtime": 176.8112,
+      "eval_samples_per_second": 27.708,
+      "eval_steps_per_second": 0.871,
+      "eval_wer": 1.0,
+      "step": 200
+    },
+    {
+      "epoch": 1.3,
+      "eval_loss": 3.0779149532318115,
+      "eval_runtime": 176.3294,
+      "eval_samples_per_second": 27.783,
+      "eval_steps_per_second": 0.873,
+      "eval_wer": 1.0,
+      "step": 300
+    },
+    {
+      "epoch": 1.74,
+      "eval_loss": 3.05513334274292,
+      "eval_runtime": 176.7029,
+      "eval_samples_per_second": 27.724,
+      "eval_steps_per_second": 0.872,
+      "eval_wer": 1.0,
+      "step": 400
+    },
+    {
+      "epoch": 2.17,
+      "learning_rate": 0.00029699999999999996,
+      "loss": 4.8553,
+      "step": 500
+    },
+    {
+      "epoch": 2.17,
+      "eval_loss": 3.052617311477661,
+      "eval_runtime": 176.6413,
+      "eval_samples_per_second": 27.734,
+      "eval_steps_per_second": 0.872,
+      "eval_wer": 1.0,
+      "step": 500
+    },
+    {
+      "epoch": 2.61,
+      "eval_loss": 3.0559935569763184,
+      "eval_runtime": 175.4042,
+      "eval_samples_per_second": 27.93,
+      "eval_steps_per_second": 0.878,
+      "eval_wer": 1.0,
+      "step": 600
+    },
+    {
+      "epoch": 3.04,
+      "eval_loss": 3.125081777572632,
+      "eval_runtime": 174.6598,
+      "eval_samples_per_second": 28.049,
+      "eval_steps_per_second": 0.882,
+      "eval_wer": 1.0,
+      "step": 700
+    },
+    {
+      "epoch": 3.48,
+      "eval_loss": 3.087021589279175,
+      "eval_runtime": 177.8472,
+      "eval_samples_per_second": 27.546,
+      "eval_steps_per_second": 0.866,
+      "eval_wer": 1.0,
+      "step": 800
+    },
+    {
+      "epoch": 3.91,
+      "eval_loss": 3.08219575881958,
+      "eval_runtime": 180.0973,
+      "eval_samples_per_second": 27.202,
+      "eval_steps_per_second": 0.855,
+      "eval_wer": 1.0,
+      "step": 900
+    },
+    {
+      "epoch": 4.35,
+      "learning_rate": 0.00027679687499999997,
+      "loss": 3.1133,
+      "step": 1000
+    },
+    {
+      "epoch": 4.35,
+      "eval_loss": 3.048403739929199,
+      "eval_runtime": 177.987,
+      "eval_samples_per_second": 27.524,
+      "eval_steps_per_second": 0.865,
+      "eval_wer": 1.0,
+      "step": 1000
+    },
+    {
+      "epoch": 4.78,
+      "eval_loss": 3.0558109283447266,
+      "eval_runtime": 176.2514,
+      "eval_samples_per_second": 27.796,
+      "eval_steps_per_second": 0.874,
+      "eval_wer": 1.0,
+      "step": 1100
+    },
+    {
+      "epoch": 5.22,
+      "eval_loss": 3.1018614768981934,
+      "eval_runtime": 174.5505,
+      "eval_samples_per_second": 28.066,
+      "eval_steps_per_second": 0.882,
+      "eval_wer": 1.0,
+      "step": 1200
+    },
+    {
+      "epoch": 5.65,
+      "eval_loss": 3.0914077758789062,
+      "eval_runtime": 174.0307,
+      "eval_samples_per_second": 28.15,
+      "eval_steps_per_second": 0.885,
+      "eval_wer": 1.0,
+      "step": 1300
+    },
+    {
+      "epoch": 6.09,
+      "eval_loss": 3.069120168685913,
+      "eval_runtime": 175.4381,
+      "eval_samples_per_second": 27.924,
+      "eval_steps_per_second": 0.878,
+      "eval_wer": 1.0,
+      "step": 1400
+    },
+    {
+      "epoch": 6.52,
+      "learning_rate": 0.00025335937499999995,
+      "loss": 3.109,
+      "step": 1500
+    },
+    {
+      "epoch": 6.52,
+      "eval_loss": 3.0588901042938232,
+      "eval_runtime": 175.6572,
+      "eval_samples_per_second": 27.89,
+      "eval_steps_per_second": 0.877,
+      "eval_wer": 1.0,
+      "step": 1500
+    },
+    {
+      "epoch": 6.95,
+      "eval_loss": 3.050849199295044,
+      "eval_runtime": 175.685,
+      "eval_samples_per_second": 27.885,
+      "eval_steps_per_second": 0.877,
+      "eval_wer": 1.0,
+      "step": 1600
+    },
+    {
+      "epoch": 7.39,
+      "eval_loss": 3.054013252258301,
+      "eval_runtime": 177.236,
+      "eval_samples_per_second": 27.641,
+      "eval_steps_per_second": 0.869,
+      "eval_wer": 1.0,
+      "step": 1700
+    },
+    {
+      "epoch": 7.82,
+      "eval_loss": 3.0545613765716553,
+      "eval_runtime": 177.8822,
+      "eval_samples_per_second": 27.541,
+      "eval_steps_per_second": 0.866,
+      "eval_wer": 1.0,
+      "step": 1800
+    },
+    {
+      "epoch": 8.26,
+      "eval_loss": 3.0523643493652344,
+      "eval_runtime": 172.9222,
+      "eval_samples_per_second": 28.331,
+      "eval_steps_per_second": 0.891,
+      "eval_wer": 1.0,
+      "step": 1900
+    },
+    {
+      "epoch": 8.69,
+      "learning_rate": 0.00022992187499999996,
+      "loss": 3.1106,
+      "step": 2000
+    },
+    {
+      "epoch": 8.69,
+      "eval_loss": 3.056912422180176,
+      "eval_runtime": 175.8694,
+      "eval_samples_per_second": 27.856,
+      "eval_steps_per_second": 0.876,
+      "eval_wer": 1.0,
+      "step": 2000
+    },
+    {
+      "epoch": 9.13,
+      "eval_loss": 3.0621554851531982,
+      "eval_runtime": 175.7147,
+      "eval_samples_per_second": 27.88,
+      "eval_steps_per_second": 0.876,
+      "eval_wer": 1.0,
+      "step": 2100
+    },
+    {
+      "epoch": 9.56,
+      "eval_loss": 3.0517823696136475,
+      "eval_runtime": 174.9875,
+      "eval_samples_per_second": 27.996,
+      "eval_steps_per_second": 0.88,
+      "eval_wer": 1.0,
+      "step": 2200
+    },
+    {
+      "epoch": 10.0,
+      "eval_loss": 3.0749499797821045,
+      "eval_runtime": 176.3933,
+      "eval_samples_per_second": 27.773,
+      "eval_steps_per_second": 0.873,
+      "eval_wer": 1.0,
+      "step": 2300
+    },
+    {
+      "epoch": 10.43,
+      "eval_loss": 3.0697524547576904,
+      "eval_runtime": 175.8486,
+      "eval_samples_per_second": 27.859,
+      "eval_steps_per_second": 0.876,
+      "eval_wer": 1.0,
+      "step": 2400
+    },
+    {
+      "epoch": 10.87,
+      "learning_rate": 0.00020648437499999996,
+      "loss": 3.1058,
+      "step": 2500
+    },
+    {
+      "epoch": 10.87,
+      "eval_loss": 3.0664749145507812,
+      "eval_runtime": 176.8396,
+      "eval_samples_per_second": 27.703,
+      "eval_steps_per_second": 0.871,
+      "eval_wer": 1.0,
+      "step": 2500
+    },
+    {
+      "epoch": 11.3,
+      "eval_loss": 3.055528402328491,
+      "eval_runtime": 176.8954,
+      "eval_samples_per_second": 27.694,
+      "eval_steps_per_second": 0.871,
+      "eval_wer": 1.0,
+      "step": 2600
+    },
+    {
+      "epoch": 11.74,
+      "eval_loss": 3.0589022636413574,
+      "eval_runtime": 177.2054,
+      "eval_samples_per_second": 27.646,
+      "eval_steps_per_second": 0.869,
+      "eval_wer": 1.0,
+      "step": 2700
+    },
+    {
+      "epoch": 12.17,
+      "eval_loss": 3.061063051223755,
+      "eval_runtime": 176.5606,
+      "eval_samples_per_second": 27.747,
+      "eval_steps_per_second": 0.872,
+      "eval_wer": 1.0,
+      "step": 2800
+    },
+    {
+      "epoch": 12.61,
+      "eval_loss": 3.056131601333618,
+      "eval_runtime": 175.9193,
+      "eval_samples_per_second": 27.848,
+      "eval_steps_per_second": 0.875,
+      "eval_wer": 1.0,
+      "step": 2900
+    },
+    {
+      "epoch": 13.04,
+      "learning_rate": 0.00018304687499999997,
+      "loss": 3.1071,
+      "step": 3000
+    },
+    {
+      "epoch": 13.04,
+      "eval_loss": 3.0480217933654785,
+      "eval_runtime": 175.6518,
+      "eval_samples_per_second": 27.89,
+      "eval_steps_per_second": 0.877,
+      "eval_wer": 1.0,
+      "step": 3000
+    },
+    {
+      "epoch": 13.48,
+      "eval_loss": 3.0491693019866943,
+      "eval_runtime": 173.0223,
+      "eval_samples_per_second": 28.314,
+      "eval_steps_per_second": 0.89,
+      "eval_wer": 1.0,
+      "step": 3100
+    },
+    {
+      "epoch": 13.91,
+      "eval_loss": 3.057448387145996,
+      "eval_runtime": 175.4684,
+      "eval_samples_per_second": 27.92,
+      "eval_steps_per_second": 0.878,
+      "eval_wer": 1.0,
+      "step": 3200
+    },
+    {
+      "epoch": 14.35,
+      "eval_loss": 3.053784132003784,
+      "eval_runtime": 176.0074,
+      "eval_samples_per_second": 27.834,
+      "eval_steps_per_second": 0.875,
+      "eval_wer": 1.0,
+      "step": 3300
+    },
+    {
+      "epoch": 14.78,
+      "eval_loss": 3.050539016723633,
+      "eval_runtime": 175.3243,
+      "eval_samples_per_second": 27.943,
+      "eval_steps_per_second": 0.878,
+      "eval_wer": 1.0,
+      "step": 3400
+    },
+    {
+      "epoch": 15.22,
+      "learning_rate": 0.00015960937499999997,
+      "loss": 3.1061,
+      "step": 3500
+    },
+    {
+      "epoch": 15.22,
+      "eval_loss": 3.059952735900879,
+      "eval_runtime": 176.5589,
+      "eval_samples_per_second": 27.747,
+      "eval_steps_per_second": 0.872,
+      "eval_wer": 1.0,
+      "step": 3500
+    },
+    {
+      "epoch": 15.65,
+      "eval_loss": 3.0595669746398926,
+      "eval_runtime": 177.5778,
+      "eval_samples_per_second": 27.588,
+      "eval_steps_per_second": 0.867,
+      "eval_wer": 1.0,
+      "step": 3600
+    },
+    {
+      "epoch": 16.09,
+      "eval_loss": 3.0623462200164795,
+      "eval_runtime": 174.5228,
+      "eval_samples_per_second": 28.071,
+      "eval_steps_per_second": 0.882,
+      "eval_wer": 1.0,
+      "step": 3700
+    },
+    {
+      "epoch": 16.52,
+      "eval_loss": 3.079986095428467,
+      "eval_runtime": 175.7994,
+      "eval_samples_per_second": 27.867,
+      "eval_steps_per_second": 0.876,
+      "eval_wer": 1.0,
+      "step": 3800
+    },
+    {
+      "epoch": 16.95,
+      "eval_loss": 3.0583465099334717,
+      "eval_runtime": 176.6021,
+      "eval_samples_per_second": 27.74,
+      "eval_steps_per_second": 0.872,
+      "eval_wer": 1.0,
+      "step": 3900
+    },
+    {
+      "epoch": 17.39,
+      "learning_rate": 0.00013617187499999998,
+      "loss": 3.1036,
+      "step": 4000
+    },
+    {
+      "epoch": 17.39,
+      "eval_loss": 3.053365468978882,
+      "eval_runtime": 175.9714,
+      "eval_samples_per_second": 27.84,
+      "eval_steps_per_second": 0.875,
+      "eval_wer": 1.0,
+      "step": 4000
+    },
+    {
+      "epoch": 17.82,
+      "eval_loss": 3.0563225746154785,
+      "eval_runtime": 175.7204,
+      "eval_samples_per_second": 27.88,
+      "eval_steps_per_second": 0.876,
+      "eval_wer": 1.0,
+      "step": 4100
+    },
+    {
+      "epoch": 18.26,
+      "eval_loss": 3.0481250286102295,
+      "eval_runtime": 175.8171,
+      "eval_samples_per_second": 27.864,
+      "eval_steps_per_second": 0.876,
+      "eval_wer": 1.0,
+      "step": 4200
+    },
+    {
+      "epoch": 18.69,
+      "eval_loss": 3.0476744174957275,
+      "eval_runtime": 175.2697,
+      "eval_samples_per_second": 27.951,
+      "eval_steps_per_second": 0.879,
+      "eval_wer": 1.0,
+      "step": 4300
+    },
+    {
+      "epoch": 19.13,
+      "eval_loss": 3.0504729747772217,
+      "eval_runtime": 175.8225,
+      "eval_samples_per_second": 27.863,
+      "eval_steps_per_second": 0.876,
+      "eval_wer": 1.0,
+      "step": 4400
+    },
+    {
+      "epoch": 19.56,
+      "learning_rate": 0.00011273437499999999,
+      "loss": 3.1086,
+      "step": 4500
+    },
+    {
+      "epoch": 19.56,
+      "eval_loss": 3.0484793186187744,
+      "eval_runtime": 176.184,
+      "eval_samples_per_second": 27.806,
+      "eval_steps_per_second": 0.874,
+      "eval_wer": 1.0,
+      "step": 4500
+    },
+    {
+      "epoch": 20.0,
+      "eval_loss": 3.0480639934539795,
+      "eval_runtime": 175.5218,
+      "eval_samples_per_second": 27.911,
+      "eval_steps_per_second": 0.877,
+      "eval_wer": 1.0,
+      "step": 4600
+    },
+    {
+      "epoch": 20.43,
+      "eval_loss": 3.061495780944824,
+      "eval_runtime": 176.4313,
+      "eval_samples_per_second": 27.767,
+      "eval_steps_per_second": 0.873,
+      "eval_wer": 1.0,
+      "step": 4700
+    },
+    {
+      "epoch": 20.87,
+      "eval_loss": 3.0657691955566406,
+      "eval_runtime": 175.5853,
+      "eval_samples_per_second": 27.901,
+      "eval_steps_per_second": 0.877,
+      "eval_wer": 1.0,
+      "step": 4800
+    },
+    {
+      "epoch": 21.3,
+      "eval_loss": 3.050532341003418,
+      "eval_runtime": 176.2169,
+      "eval_samples_per_second": 27.801,
+      "eval_steps_per_second": 0.874,
+      "eval_wer": 1.0,
+      "step": 4900
+    },
+    {
+      "epoch": 21.74,
+      "learning_rate": 8.9296875e-05,
+      "loss": 3.1028,
+      "step": 5000
+    },
+    {
+      "epoch": 21.74,
+      "eval_loss": 3.0491702556610107,
+      "eval_runtime": 175.9502,
+      "eval_samples_per_second": 27.843,
+      "eval_steps_per_second": 0.875,
+      "eval_wer": 1.0,
+      "step": 5000
+    },
+    {
+      "epoch": 22.17,
+      "eval_loss": 3.048527479171753,
+      "eval_runtime": 174.9586,
+      "eval_samples_per_second": 28.001,
+      "eval_steps_per_second": 0.88,
+      "eval_wer": 1.0,
+      "step": 5100
+    },
+    {
+      "epoch": 22.61,
+      "eval_loss": 3.0482711791992188,
+      "eval_runtime": 176.76,
+      "eval_samples_per_second": 27.716,
+      "eval_steps_per_second": 0.871,
+      "eval_wer": 1.0,
+      "step": 5200
+    },
+    {
+      "epoch": 23.04,
+      "eval_loss": 3.0478527545928955,
+      "eval_runtime": 174.8893,
+      "eval_samples_per_second": 28.012,
+      "eval_steps_per_second": 0.881,
+      "eval_wer": 1.0,
+      "step": 5300
+    },
+    {
+      "epoch": 23.48,
+      "eval_loss": 3.05094313621521,
+      "eval_runtime": 175.0794,
+      "eval_samples_per_second": 27.982,
+      "eval_steps_per_second": 0.88,
+      "eval_wer": 1.0,
+      "step": 5400
+    },
+    {
+      "epoch": 23.91,
+      "learning_rate": 6.5859375e-05,
+      "loss": 3.1087,
+      "step": 5500
+    },
+    {
+      "epoch": 23.91,
+      "eval_loss": 3.0529990196228027,
+      "eval_runtime": 176.1904,
+      "eval_samples_per_second": 27.805,
+      "eval_steps_per_second": 0.874,
+      "eval_wer": 1.0,
+      "step": 5500
+    },
+    {
+      "epoch": 24.35,
+      "eval_loss": 3.048621654510498,
+      "eval_runtime": 175.2104,
+      "eval_samples_per_second": 27.961,
+      "eval_steps_per_second": 0.879,
+      "eval_wer": 1.0,
+      "step": 5600
+    },
+    {
+      "epoch": 24.78,
+      "eval_loss": 3.051391124725342,
+      "eval_runtime": 175.9351,
+      "eval_samples_per_second": 27.845,
+      "eval_steps_per_second": 0.875,
+      "eval_wer": 1.0,
+      "step": 5700
+    },
+    {
+      "epoch": 25.22,
+      "eval_loss": 3.050508499145508,
+      "eval_runtime": 175.1722,
+      "eval_samples_per_second": 27.967,
+      "eval_steps_per_second": 0.879,
+      "eval_wer": 1.0,
+      "step": 5800
+    },
+    {
+      "epoch": 25.65,
+      "eval_loss": 3.050753355026245,
+      "eval_runtime": 175.581,
+      "eval_samples_per_second": 27.902,
+      "eval_steps_per_second": 0.877,
+      "eval_wer": 1.0,
+      "step": 5900
+    },
+    {
+      "epoch": 26.09,
+      "learning_rate": 4.2421875e-05,
+      "loss": 3.1043,
+      "step": 6000
+    },
+    {
+      "epoch": 26.09,
+      "eval_loss": 3.050074815750122,
+      "eval_runtime": 175.9337,
+      "eval_samples_per_second": 27.846,
+      "eval_steps_per_second": 0.875,
+      "eval_wer": 1.0,
+      "step": 6000
+    },
+    {
+      "epoch": 26.52,
+      "eval_loss": 3.046748638153076,
+      "eval_runtime": 176.2651,
+      "eval_samples_per_second": 27.793,
+      "eval_steps_per_second": 0.874,
+      "eval_wer": 1.0,
+      "step": 6100
+    },
+    {
+      "epoch": 26.95,
+      "eval_loss": 3.046581268310547,
+      "eval_runtime": 175.4906,
+      "eval_samples_per_second": 27.916,
+      "eval_steps_per_second": 0.878,
+      "eval_wer": 1.0,
+      "step": 6200
+    },
+    {
+      "epoch": 27.39,
+      "eval_loss": 3.0465457439422607,
+      "eval_runtime": 174.3257,
+      "eval_samples_per_second": 28.103,
+      "eval_steps_per_second": 0.883,
+      "eval_wer": 1.0,
+      "step": 6300
+    },
+    {
+      "epoch": 27.82,
+      "eval_loss": 3.0464954376220703,
+      "eval_runtime": 174.3395,
+      "eval_samples_per_second": 28.1,
+      "eval_steps_per_second": 0.883,
+      "eval_wer": 1.0,
+      "step": 6400
+    },
+    {
+      "epoch": 28.26,
+      "learning_rate": 1.8984375e-05,
+      "loss": 3.1175,
+      "step": 6500
+    },
+    {
+      "epoch": 28.26,
+      "eval_loss": 3.046614170074463,
+      "eval_runtime": 174.756,
+      "eval_samples_per_second": 28.033,
+      "eval_steps_per_second": 0.881,
+      "eval_wer": 1.0,
+      "step": 6500
+    },
+    {
+      "epoch": 28.69,
+      "eval_loss": 3.046605110168457,
+      "eval_runtime": 174.8316,
+      "eval_samples_per_second": 28.021,
+      "eval_steps_per_second": 0.881,
+      "eval_wer": 1.0,
+      "step": 6600
+    },
+    {
+      "epoch": 29.13,
+      "eval_loss": 3.0464911460876465,
+      "eval_runtime": 174.5543,
+      "eval_samples_per_second": 28.066,
+      "eval_steps_per_second": 0.882,
+      "eval_wer": 1.0,
+      "step": 6700
+    },
+    {
+      "epoch": 29.56,
+      "eval_loss": 3.046463966369629,
+      "eval_runtime": 175.0973,
+      "eval_samples_per_second": 27.979,
+      "eval_steps_per_second": 0.88,
+      "eval_wer": 1.0,
+      "step": 6800
+    },
+    {
+      "epoch": 30.0,
+      "eval_loss": 3.0463998317718506,
+      "eval_runtime": 174.6633,
+      "eval_samples_per_second": 28.048,
+      "eval_steps_per_second": 0.882,
+      "eval_wer": 1.0,
+      "step": 6900
+    },
+    {
+      "epoch": 30.0,
+      "step": 6900,
+      "total_flos": 1.7654566052477592e+19,
+      "train_loss": 3.233657403475996,
+      "train_runtime": 33798.1213,
+      "train_samples_per_second": 13.075,
+      "train_steps_per_second": 0.204
+    }
+  ],
+  "max_steps": 6900,
+  "num_train_epochs": 30,
+  "total_flos": 1.7654566052477592e+19,
+  "trial_name": null,
+  "trial_params": null
+}