End of training

Browse files

Files changed (6) hide show

README.md +3 -1
all_results.json +12 -12
eval_results.json +7 -7
runs/Mar05_08-26-36_6f484a5b3164/events.out.tfevents.1709687641.6f484a5b3164.1068.1 +3 -0
train_results.json +6 -6
trainer_state.json +199 -175

README.md CHANGED Viewed

@@ -2,6 +2,8 @@
 license: apache-2.0
 base_model: facebook/wav2vec2-large-xlsr-53
 tags:
 - generated_from_trainer
 metrics:
 - wer
@@ -15,7 +17,7 @@ should probably proofread and complete it, then remove this comment. -->
 # wav2vec2-xlsr-53-ft-ccv-en-cy
-This model is a fine-tuned version of [facebook/wav2vec2-large-xlsr-53](https://huggingface.co/facebook/wav2vec2-large-xlsr-53) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.2765
 - Wer: 0.2115

 license: apache-2.0
 base_model: facebook/wav2vec2-large-xlsr-53
 tags:
+- automatic-speech-recognition
+- techiaith/commonvoice_16_1_en_cy
 - generated_from_trainer
 metrics:
 - wer
 # wav2vec2-xlsr-53-ft-ccv-en-cy
+This model is a fine-tuned version of [facebook/wav2vec2-large-xlsr-53](https://huggingface.co/facebook/wav2vec2-large-xlsr-53) on the TECHIAITH/COMMONVOICE_16_1_EN_CY - DEFAULT dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.2765
 - Wer: 0.2115

all_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
-    "epoch": 4.55,
-    "eval_loss": 0.2908598780632019,
-    "eval_runtime": 1109.9533,
-    "eval_samples": 26295,
-    "eval_samples_per_second": 23.69,
-    "eval_steps_per_second": 0.741,
-    "eval_wer": 0.21777283505046477,
-    "train_loss": 0.47586327913072374,
-    "train_runtime": 55725.2112,
-    "train_samples": 126693,
-    "train_samples_per_second": 10.336,
-    "train_steps_per_second": 0.162
 }

 {
+    "epoch": 4.52,
+    "eval_loss": 0.2764733135700226,
+    "eval_runtime": 1091.0858,
+    "eval_samples": 26228,
+    "eval_samples_per_second": 24.038,
+    "eval_steps_per_second": 0.752,
+    "eval_wer": 0.21145248459613483,
+    "train_loss": 0.49683192168341744,
+    "train_runtime": 52483.3074,
+    "train_samples": 127287,
+    "train_samples_per_second": 10.975,
+    "train_steps_per_second": 0.171
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 4.55,
-    "eval_loss": 0.2908598780632019,
-    "eval_runtime": 1109.9533,
-    "eval_samples": 26295,
-    "eval_samples_per_second": 23.69,
-    "eval_steps_per_second": 0.741,
-    "eval_wer": 0.21777283505046477
 }

 {
+    "epoch": 4.52,
+    "eval_loss": 0.2764733135700226,
+    "eval_runtime": 1091.0858,
+    "eval_samples": 26228,
+    "eval_samples_per_second": 24.038,
+    "eval_steps_per_second": 0.752,
+    "eval_wer": 0.21145248459613483
 }

runs/Mar05_08-26-36_6f484a5b3164/events.out.tfevents.1709687641.6f484a5b3164.1068.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:71ddd99e3067192b0e3694f4bd27c83f3242d678d541fa16fcc435052292331f
+size 406

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 4.55,
-    "train_loss": 0.47586327913072374,
-    "train_runtime": 55725.2112,
-    "train_samples": 126693,
-    "train_samples_per_second": 10.336,
-    "train_steps_per_second": 0.162
 }

 {
+    "epoch": 4.52,
+    "train_loss": 0.49683192168341744,
+    "train_runtime": 52483.3074,
+    "train_samples": 127287,
+    "train_samples_per_second": 10.975,
+    "train_steps_per_second": 0.171
 }

trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-  "best_metric": 0.2908598780632019,
   "best_model_checkpoint": "/models/hfhub/DewiBrynJones/wav2vec2-xlsr-53-ft-ccv-en-cy/checkpoint-9000",
-  "epoch": 4.545454545454545,
   "eval_steps": 500,
   "global_step": 9000,
   "is_hyper_param_search": false,
@@ -10,313 +10,337 @@
   "log_history": [
     {
       "epoch": 0.2,
-      "learning_rate": 0.00014925,
-      "loss": 5.8377,
       "step": 400
     },
     {
       "epoch": 0.25,
-      "eval_loss": 1.2190359830856323,
-      "eval_runtime": 1220.4523,
-      "eval_samples_per_second": 21.545,
-      "eval_steps_per_second": 0.674,
-      "eval_wer": 0.8568814654720188,
       "step": 500
     },
     {
       "epoch": 0.4,
-      "learning_rate": 0.00029925,
-      "loss": 0.9829,
       "step": 800
     },
     {
-      "epoch": 0.51,
-      "eval_loss": 0.5584714412689209,
-      "eval_runtime": 1188.1001,
-      "eval_samples_per_second": 22.132,
-      "eval_steps_per_second": 0.692,
-      "eval_wer": 0.4700631596617496,
       "step": 1000
     },
     {
-      "epoch": 0.61,
-      "learning_rate": 0.00028543902439024386,
-      "loss": 0.45,
       "step": 1200
     },
     {
-      "epoch": 0.76,
-      "eval_loss": 0.4735090434551239,
-      "eval_runtime": 1202.8188,
-      "eval_samples_per_second": 21.861,
-      "eval_steps_per_second": 0.683,
-      "eval_wer": 0.39008750026229094,
       "step": 1500
     },
     {
-      "epoch": 0.81,
-      "learning_rate": 0.00027080487804878047,
-      "loss": 0.3636,
       "step": 1600
     },
     {
       "epoch": 1.01,
-      "learning_rate": 0.00025617073170731703,
-      "loss": 0.3151,
       "step": 2000
     },
     {
       "epoch": 1.01,
-      "eval_loss": 0.4124945402145386,
-      "eval_runtime": 1160.0644,
-      "eval_samples_per_second": 22.667,
-      "eval_steps_per_second": 0.709,
-      "eval_wer": 0.34183435801666073,
       "step": 2000
     },
     {
       "epoch": 1.21,
-      "learning_rate": 0.00024153658536585365,
-      "loss": 0.2524,
       "step": 2400
     },
     {
       "epoch": 1.26,
-      "eval_loss": 0.3830628991127014,
-      "eval_runtime": 1409.4338,
-      "eval_samples_per_second": 18.656,
-      "eval_steps_per_second": 0.583,
-      "eval_wer": 0.3117191598296158,
       "step": 2500
     },
     {
       "epoch": 1.41,
-      "learning_rate": 0.00022690243902439024,
-      "loss": 0.243,
       "step": 2800
     },
     {
-      "epoch": 1.52,
-      "eval_loss": 0.3661448061466217,
-      "eval_runtime": 1425.6726,
-      "eval_samples_per_second": 18.444,
-      "eval_steps_per_second": 0.577,
-      "eval_wer": 0.30780368046666806,
       "step": 3000
     },
     {
-      "epoch": 1.62,
-      "learning_rate": 0.0002122682926829268,
-      "loss": 0.2341,
       "step": 3200
     },
     {
-      "epoch": 1.77,
-      "eval_loss": 0.3488619327545166,
-      "eval_runtime": 1416.3145,
-      "eval_samples_per_second": 18.566,
-      "eval_steps_per_second": 0.58,
-      "eval_wer": 0.2883060201019787,
       "step": 3500
     },
     {
-      "epoch": 1.82,
-      "learning_rate": 0.00019763414634146341,
-      "loss": 0.2235,
       "step": 3600
     },
     {
-      "epoch": 2.02,
-      "learning_rate": 0.00018299999999999998,
-      "loss": 0.211,
       "step": 4000
     },
     {
-      "epoch": 2.02,
-      "eval_loss": 0.34998372197151184,
-      "eval_runtime": 1154.299,
-      "eval_samples_per_second": 22.78,
-      "eval_steps_per_second": 0.712,
-      "eval_wer": 0.27384434605619323,
       "step": 4000
     },
     {
-      "epoch": 2.22,
-      "learning_rate": 0.0001683658536585366,
-      "loss": 0.1702,
       "step": 4400
     },
     {
-      "epoch": 2.27,
-      "eval_loss": 0.34594303369522095,
-      "eval_runtime": 1230.9263,
-      "eval_samples_per_second": 21.362,
-      "eval_steps_per_second": 0.668,
-      "eval_wer": 0.27035272887508655,
       "step": 4500
     },
     {
-      "epoch": 2.42,
-      "learning_rate": 0.00015373170731707315,
-      "loss": 0.1634,
       "step": 4800
     },
     {
-      "epoch": 2.53,
-      "eval_loss": 0.33047276735305786,
-      "eval_runtime": 1138.5459,
-      "eval_samples_per_second": 23.095,
-      "eval_steps_per_second": 0.722,
-      "eval_wer": 0.2583125249176406,
       "step": 5000
     },
     {
-      "epoch": 2.63,
-      "learning_rate": 0.00013909756097560974,
-      "loss": 0.1608,
       "step": 5200
     },
     {
-      "epoch": 2.78,
-      "eval_loss": 0.3136747479438782,
-      "eval_runtime": 1199.9023,
-      "eval_samples_per_second": 21.914,
-      "eval_steps_per_second": 0.685,
-      "eval_wer": 0.24792580313490148,
       "step": 5500
     },
     {
-      "epoch": 2.83,
-      "learning_rate": 0.00012446341463414633,
-      "loss": 0.1542,
       "step": 5600
     },
     {
-      "epoch": 3.03,
-      "learning_rate": 0.00010982926829268292,
-      "loss": 0.1481,
       "step": 6000
     },
     {
-      "epoch": 3.03,
-      "eval_loss": 0.32883504033088684,
-      "eval_runtime": 1167.9676,
-      "eval_samples_per_second": 22.513,
-      "eval_steps_per_second": 0.704,
-      "eval_wer": 0.2562183939400298,
       "step": 6000
     },
     {
-      "epoch": 3.23,
-      "learning_rate": 9.519512195121951e-05,
-      "loss": 0.1216,
       "step": 6400
     },
     {
-      "epoch": 3.28,
-      "eval_loss": 0.3174259662628174,
-      "eval_runtime": 1161.665,
-      "eval_samples_per_second": 22.636,
-      "eval_steps_per_second": 0.708,
-      "eval_wer": 0.24461464213022222,
       "step": 6500
     },
     {
-      "epoch": 3.43,
-      "learning_rate": 8.05609756097561e-05,
-      "loss": 0.1181,
       "step": 6800
     },
     {
-      "epoch": 3.54,
-      "eval_loss": 0.30002185702323914,
-      "eval_runtime": 1207.6988,
-      "eval_samples_per_second": 21.773,
-      "eval_steps_per_second": 0.681,
-      "eval_wer": 0.2324569318253352,
       "step": 7000
     },
     {
-      "epoch": 3.64,
-      "learning_rate": 6.592682926829267e-05,
-      "loss": 0.1143,
       "step": 7200
     },
     {
-      "epoch": 3.79,
-      "eval_loss": 0.29287537932395935,
-      "eval_runtime": 1095.1242,
-      "eval_samples_per_second": 24.011,
-      "eval_steps_per_second": 0.751,
-      "eval_wer": 0.23258702813857357,
       "step": 7500
     },
     {
-      "epoch": 3.84,
-      "learning_rate": 5.129268292682927e-05,
-      "loss": 0.1139,
       "step": 7600
     },
     {
-      "epoch": 4.04,
-      "learning_rate": 3.665853658536585e-05,
-      "loss": 0.1049,
       "step": 8000
     },
     {
-      "epoch": 4.04,
-      "eval_loss": 0.2921387255191803,
-      "eval_runtime": 1091.9168,
-      "eval_samples_per_second": 24.082,
-      "eval_steps_per_second": 0.753,
-      "eval_wer": 0.22178483748452482,
       "step": 8000
     },
     {
-      "epoch": 4.24,
-      "learning_rate": 2.2024390243902437e-05,
-      "loss": 0.0913,
       "step": 8400
     },
     {
-      "epoch": 4.29,
-      "eval_loss": 0.2968423664569855,
-      "eval_runtime": 1104.263,
-      "eval_samples_per_second": 23.812,
-      "eval_steps_per_second": 0.744,
-      "eval_wer": 0.2208196067734016,
       "step": 8500
     },
     {
-      "epoch": 4.44,
-      "learning_rate": 7.4268292682926826e-06,
-      "loss": 0.0883,
       "step": 8800
     },
     {
-      "epoch": 4.55,
-      "eval_loss": 0.2908598780632019,
-      "eval_runtime": 1095.7607,
-      "eval_samples_per_second": 23.997,
-      "eval_steps_per_second": 0.75,
-      "eval_wer": 0.21777283505046477,
       "step": 9000
     },
     {
-      "epoch": 4.55,
       "step": 9000,
-      "total_flos": 8.920242900072627e+19,
-      "train_loss": 0.47586327913072374,
-      "train_runtime": 55725.2112,
-      "train_samples_per_second": 10.336,
-      "train_steps_per_second": 0.162
     }
   ],
   "logging_steps": 400,
   "max_steps": 9000,
   "num_train_epochs": 5,
   "save_steps": 500,
-  "total_flos": 8.920242900072627e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.2764733135700226,
   "best_model_checkpoint": "/models/hfhub/DewiBrynJones/wav2vec2-xlsr-53-ft-ccv-en-cy/checkpoint-9000",
+  "epoch": 4.524886877828054,
   "eval_steps": 500,
   "global_step": 9000,
   "is_hyper_param_search": false,
   "log_history": [
     {
       "epoch": 0.2,
+      "grad_norm": 1.6815159320831299,
+      "learning_rate": 0.00014774999999999999,
+      "loss": 5.9898,
       "step": 400
     },
     {
       "epoch": 0.25,
+      "eval_loss": 1.3093085289001465,
+      "eval_runtime": 3176.8808,
+      "eval_samples_per_second": 8.256,
+      "eval_steps_per_second": 0.258,
+      "eval_wer": 0.7970769457237188,
       "step": 500
     },
     {
       "epoch": 0.4,
+      "grad_norm": 2.3292043209075928,
+      "learning_rate": 0.00029775,
+      "loss": 1.0749,
       "step": 800
     },
     {
+      "epoch": 0.5,
+      "eval_loss": 0.5815957188606262,
+      "eval_runtime": 1123.0217,
+      "eval_samples_per_second": 23.355,
+      "eval_steps_per_second": 0.73,
+      "eval_wer": 0.4617458414821357,
       "step": 1000
     },
     {
+      "epoch": 0.6,
+      "grad_norm": 2.9652466773986816,
+      "learning_rate": 0.0002855853658536585,
+      "loss": 0.4332,
       "step": 1200
     },
     {
+      "epoch": 0.75,
+      "eval_loss": 0.48338082432746887,
+      "eval_runtime": 1101.5414,
+      "eval_samples_per_second": 23.81,
+      "eval_steps_per_second": 0.744,
+      "eval_wer": 0.4091476878430383,
       "step": 1500
     },
     {
+      "epoch": 0.8,
+      "grad_norm": 3.57124924659729,
+      "learning_rate": 0.0002709512195121951,
+      "loss": 0.3655,
       "step": 1600
     },
     {
       "epoch": 1.01,
+      "grad_norm": 1.1706229448318481,
+      "learning_rate": 0.0002563170731707317,
+      "loss": 0.3303,
       "step": 2000
     },
     {
       "epoch": 1.01,
+      "eval_loss": 0.42033129930496216,
+      "eval_runtime": 1101.1368,
+      "eval_samples_per_second": 23.819,
+      "eval_steps_per_second": 0.745,
+      "eval_wer": 0.3419174394885707,
       "step": 2000
     },
     {
       "epoch": 1.21,
+      "grad_norm": 0.8928599953651428,
+      "learning_rate": 0.0002416829268292683,
+      "loss": 0.276,
       "step": 2400
     },
     {
       "epoch": 1.26,
+      "eval_loss": 0.3909631669521332,
+      "eval_runtime": 1098.4606,
+      "eval_samples_per_second": 23.877,
+      "eval_steps_per_second": 0.746,
+      "eval_wer": 0.3186423569490884,
       "step": 2500
     },
     {
       "epoch": 1.41,
+      "grad_norm": 0.6678148508071899,
+      "learning_rate": 0.00022704878048780485,
+      "loss": 0.2591,
       "step": 2800
     },
     {
+      "epoch": 1.51,
+      "eval_loss": 0.39008986949920654,
+      "eval_runtime": 1093.6554,
+      "eval_samples_per_second": 23.982,
+      "eval_steps_per_second": 0.75,
+      "eval_wer": 0.3067188190019557,
       "step": 3000
     },
     {
+      "epoch": 1.61,
+      "grad_norm": 0.7449674606323242,
+      "learning_rate": 0.00021241463414634144,
+      "loss": 0.2501,
       "step": 3200
     },
     {
+      "epoch": 1.76,
+      "eval_loss": 0.3645510971546173,
+      "eval_runtime": 1101.42,
+      "eval_samples_per_second": 23.813,
+      "eval_steps_per_second": 0.744,
+      "eval_wer": 0.2895379891910079,
       "step": 3500
     },
     {
+      "epoch": 1.81,
+      "grad_norm": 0.994420051574707,
+      "learning_rate": 0.00019778048780487803,
+      "loss": 0.2332,
       "step": 3600
     },
     {
+      "epoch": 2.01,
+      "grad_norm": 0.632382333278656,
+      "learning_rate": 0.00018314634146341462,
+      "loss": 0.224,
       "step": 4000
     },
     {
+      "epoch": 2.01,
+      "eval_loss": 0.35174447298049927,
+      "eval_runtime": 1113.1837,
+      "eval_samples_per_second": 23.561,
+      "eval_steps_per_second": 0.737,
+      "eval_wer": 0.2805501230206296,
       "step": 4000
     },
     {
+      "epoch": 2.21,
+      "grad_norm": 0.5861485600471497,
+      "learning_rate": 0.00016851219512195123,
+      "loss": 0.182,
       "step": 4400
     },
     {
+      "epoch": 2.26,
+      "eval_loss": 0.33475443720817566,
+      "eval_runtime": 1111.5845,
+      "eval_samples_per_second": 23.595,
+      "eval_steps_per_second": 0.738,
+      "eval_wer": 0.2655689441255021,
       "step": 4500
     },
     {
+      "epoch": 2.41,
+      "grad_norm": 0.585738480091095,
+      "learning_rate": 0.0001538780487804878,
+      "loss": 0.1777,
       "step": 4800
     },
     {
+      "epoch": 2.51,
+      "eval_loss": 0.32769647240638733,
+      "eval_runtime": 1109.5932,
+      "eval_samples_per_second": 23.637,
+      "eval_steps_per_second": 0.739,
+      "eval_wer": 0.2611948772948079,
       "step": 5000
     },
     {
+      "epoch": 2.61,
+      "grad_norm": 0.6404664516448975,
+      "learning_rate": 0.00013924390243902438,
+      "loss": 0.1734,
       "step": 5200
     },
     {
+      "epoch": 2.77,
+      "eval_loss": 0.33233708143234253,
+      "eval_runtime": 1114.1252,
+      "eval_samples_per_second": 23.541,
+      "eval_steps_per_second": 0.736,
+      "eval_wer": 0.2643113999116775,
       "step": 5500
     },
     {
+      "epoch": 2.82,
+      "grad_norm": 1.567084550857544,
+      "learning_rate": 0.00012460975609756097,
+      "loss": 0.1704,
       "step": 5600
     },
     {
+      "epoch": 3.02,
+      "grad_norm": 1.35818612575531,
+      "learning_rate": 0.00010997560975609755,
+      "loss": 0.1629,
       "step": 6000
     },
     {
+      "epoch": 3.02,
+      "eval_loss": 0.31713536381721497,
+      "eval_runtime": 1084.7842,
+      "eval_samples_per_second": 24.178,
+      "eval_steps_per_second": 0.756,
+      "eval_wer": 0.24851428931928585,
       "step": 6000
     },
     {
+      "epoch": 3.22,
+      "grad_norm": 1.0975894927978516,
+      "learning_rate": 9.534146341463413e-05,
+      "loss": 0.1338,
       "step": 6400
     },
     {
+      "epoch": 3.27,
+      "eval_loss": 0.310283362865448,
+      "eval_runtime": 1090.9879,
+      "eval_samples_per_second": 24.041,
+      "eval_steps_per_second": 0.752,
+      "eval_wer": 0.23984186066073643,
       "step": 6500
     },
     {
+      "epoch": 3.42,
+      "grad_norm": 1.2747470140457153,
+      "learning_rate": 8.070731707317072e-05,
+      "loss": 0.1292,
       "step": 6800
     },
     {
+      "epoch": 3.52,
+      "eval_loss": 0.2933865785598755,
+      "eval_runtime": 1076.7354,
+      "eval_samples_per_second": 24.359,
+      "eval_steps_per_second": 0.762,
+      "eval_wer": 0.22680798267196603,
       "step": 7000
     },
     {
+      "epoch": 3.62,
+      "grad_norm": 0.5606548190116882,
+      "learning_rate": 6.607317073170731e-05,
+      "loss": 0.1264,
       "step": 7200
     },
     {
+      "epoch": 3.77,
+      "eval_loss": 0.29226595163345337,
+      "eval_runtime": 1074.899,
+      "eval_samples_per_second": 24.4,
+      "eval_steps_per_second": 0.763,
+      "eval_wer": 0.22483965259815364,
       "step": 7500
     },
     {
+      "epoch": 3.82,
+      "grad_norm": 1.5185168981552124,
+      "learning_rate": 5.14390243902439e-05,
+      "loss": 0.1241,
       "step": 7600
     },
     {
+      "epoch": 4.02,
+      "grad_norm": 0.7815582156181335,
+      "learning_rate": 3.680487804878048e-05,
+      "loss": 0.118,
       "step": 8000
     },
     {
+      "epoch": 4.02,
+      "eval_loss": 0.28800907731056213,
+      "eval_runtime": 1083.1518,
+      "eval_samples_per_second": 24.215,
+      "eval_steps_per_second": 0.757,
+      "eval_wer": 0.21931739322440225,
       "step": 8000
     },
     {
+      "epoch": 4.22,
+      "grad_norm": 1.339690089225769,
+      "learning_rate": 2.217073170731707e-05,
+      "loss": 0.0996,
       "step": 8400
     },
     {
+      "epoch": 4.27,
+      "eval_loss": 0.2792861759662628,
+      "eval_runtime": 1078.7477,
+      "eval_samples_per_second": 24.313,
+      "eval_steps_per_second": 0.76,
+      "eval_wer": 0.21242403213256786,
       "step": 8500
     },
     {
+      "epoch": 4.42,
+      "grad_norm": 1.0311238765716553,
+      "learning_rate": 7.536585365853659e-06,
+      "loss": 0.0969,
       "step": 8800
     },
     {
+      "epoch": 4.52,
+      "eval_loss": 0.2764733135700226,
+      "eval_runtime": 1074.1619,
+      "eval_samples_per_second": 24.417,
+      "eval_steps_per_second": 0.763,
+      "eval_wer": 0.21145248459613483,
       "step": 9000
     },
     {
+      "epoch": 4.52,
       "step": 9000,
+      "total_flos": 8.933861078537978e+19,
+      "train_loss": 0.49683192168341744,
+      "train_runtime": 52483.3074,
+      "train_samples_per_second": 10.975,
+      "train_steps_per_second": 0.171
     }
   ],
   "logging_steps": 400,
   "max_steps": 9000,
+  "num_input_tokens_seen": 0,
   "num_train_epochs": 5,
   "save_steps": 500,
+  "total_flos": 8.933861078537978e+19,
+  "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null
 }