ivanlau
/

wav2vec2-large-xls-r-300m-cantonese

@@ -1,14 +1,14 @@
 {
-    "epoch": 1.0,
-    "eval_loss": 40.69682312011719,
-    "eval_runtime": 26.0441,
-    "eval_samples": 553,
-    "eval_samples_per_second": 21.233,
-    "eval_steps_per_second": 21.233,
-    "eval_wer": 1.0,
-    "train_loss": 109.71464342948718,
-    "train_runtime": 1380.1966,
-    "train_samples": 3119,
-    "train_samples_per_second": 2.26,
-    "train_steps_per_second": 0.141
 }

 {
+    "epoch": 10.0,
+    "eval_loss": 2.67260479927063,
+    "eval_runtime": 163.5078,
+    "eval_samples": 3659,
+    "eval_samples_per_second": 22.378,
+    "eval_steps_per_second": 1.401,
+    "eval_wer": 0.9814612868047983,
+    "train_loss": 14.438921352032104,
+    "train_runtime": 7245.592,
+    "train_samples": 11686,
+    "train_samples_per_second": 16.128,
+    "train_steps_per_second": 0.253
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 1.0,
-    "eval_loss": 40.69682312011719,
-    "eval_runtime": 26.0441,
-    "eval_samples": 553,
-    "eval_samples_per_second": 21.233,
-    "eval_steps_per_second": 21.233,
-    "eval_wer": 1.0
 }

 {
+    "epoch": 10.0,
+    "eval_loss": 2.67260479927063,
+    "eval_runtime": 163.5078,
+    "eval_samples": 3659,
+    "eval_samples_per_second": 22.378,
+    "eval_steps_per_second": 1.401,
+    "eval_wer": 0.9814612868047983
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 1.0,
-    "train_loss": 109.71464342948718,
-    "train_runtime": 1380.1966,
-    "train_samples": 3119,
-    "train_samples_per_second": 2.26,
-    "train_steps_per_second": 0.141
 }

 {
+    "epoch": 10.0,
+    "train_loss": 14.438921352032104,
+    "train_runtime": 7245.592,
+    "train_samples": 11686,
+    "train_samples_per_second": 16.128,
+    "train_steps_per_second": 0.253
 }

trainer_state.json CHANGED Viewed

@@ -1,196 +1,133 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.0,
-  "global_step": 195,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.05,
-      "eval_loss": 239.00135803222656,
-      "eval_runtime": 28.5979,
-      "eval_samples_per_second": 19.337,
-      "eval_steps_per_second": 19.337,
-      "eval_wer": 1.0,
-      "step": 10
-    },
-    {
-      "epoch": 0.1,
-      "eval_loss": 235.82070922851562,
-      "eval_runtime": 27.9371,
-      "eval_samples_per_second": 19.794,
-      "eval_steps_per_second": 19.794,
-      "eval_wer": 1.0,
-      "step": 20
-    },
-    {
-      "epoch": 0.15,
-      "eval_loss": 226.90093994140625,
-      "eval_runtime": 27.8094,
-      "eval_samples_per_second": 19.885,
-      "eval_steps_per_second": 19.885,
-      "eval_wer": 1.0,
-      "step": 30
-    },
-    {
-      "epoch": 0.21,
-      "eval_loss": 198.07687377929688,
-      "eval_runtime": 27.9651,
-      "eval_samples_per_second": 19.775,
-      "eval_steps_per_second": 19.775,
-      "eval_wer": 1.0,
-      "step": 40
-    },
-    {
-      "epoch": 0.26,
-      "eval_loss": 166.6727752685547,
-      "eval_runtime": 28.4525,
-      "eval_samples_per_second": 19.436,
-      "eval_steps_per_second": 19.436,
-      "eval_wer": 1.0,
-      "step": 50
-    },
-    {
-      "epoch": 0.31,
-      "eval_loss": 149.14447021484375,
-      "eval_runtime": 27.248,
-      "eval_samples_per_second": 20.295,
-      "eval_steps_per_second": 20.295,
       "eval_wer": 1.0,
-      "step": 60
     },
     {
-      "epoch": 0.36,
-      "eval_loss": 138.44029235839844,
-      "eval_runtime": 26.1313,
-      "eval_samples_per_second": 21.162,
-      "eval_steps_per_second": 21.162,
       "eval_wer": 1.0,
-      "step": 70
     },
     {
-      "epoch": 0.41,
-      "eval_loss": 131.72488403320312,
-      "eval_runtime": 28.1944,
-      "eval_samples_per_second": 19.614,
-      "eval_steps_per_second": 19.614,
-      "eval_wer": 1.0,
-      "step": 80
     },
     {
-      "epoch": 0.46,
-      "eval_loss": 125.558349609375,
-      "eval_runtime": 26.1125,
-      "eval_samples_per_second": 21.178,
-      "eval_steps_per_second": 21.178,
       "eval_wer": 1.0,
-      "step": 90
     },
     {
-      "epoch": 0.51,
-      "eval_loss": 119.75148010253906,
-      "eval_runtime": 27.1597,
-      "eval_samples_per_second": 20.361,
-      "eval_steps_per_second": 20.361,
-      "eval_wer": 1.0,
-      "step": 100
     },
     {
-      "epoch": 0.56,
-      "eval_loss": 113.72832489013672,
-      "eval_runtime": 26.3538,
-      "eval_samples_per_second": 20.984,
-      "eval_steps_per_second": 20.984,
-      "eval_wer": 1.0,
-      "step": 110
     },
     {
-      "epoch": 0.62,
-      "eval_loss": 107.24547576904297,
-      "eval_runtime": 26.997,
-      "eval_samples_per_second": 20.484,
-      "eval_steps_per_second": 20.484,
-      "eval_wer": 1.0,
-      "step": 120
     },
     {
-      "epoch": 0.67,
-      "eval_loss": 100.21720886230469,
-      "eval_runtime": 27.4511,
-      "eval_samples_per_second": 20.145,
-      "eval_steps_per_second": 20.145,
-      "eval_wer": 1.0,
-      "step": 130
     },
     {
-      "epoch": 0.72,
-      "eval_loss": 92.55851745605469,
-      "eval_runtime": 27.8487,
-      "eval_samples_per_second": 19.857,
-      "eval_steps_per_second": 19.857,
-      "eval_wer": 1.0,
-      "step": 140
     },
     {
-      "epoch": 0.77,
-      "eval_loss": 84.25730895996094,
-      "eval_runtime": 26.3189,
-      "eval_samples_per_second": 21.012,
-      "eval_steps_per_second": 21.012,
-      "eval_wer": 1.0,
-      "step": 150
     },
     {
-      "epoch": 0.82,
-      "eval_loss": 75.29525756835938,
-      "eval_runtime": 26.194,
-      "eval_samples_per_second": 21.112,
-      "eval_steps_per_second": 21.112,
-      "eval_wer": 1.0,
-      "step": 160
     },
     {
-      "epoch": 0.87,
-      "eval_loss": 65.69525909423828,
-      "eval_runtime": 26.5696,
-      "eval_samples_per_second": 20.813,
-      "eval_steps_per_second": 20.813,
-      "eval_wer": 1.0,
-      "step": 170
     },
     {
-      "epoch": 0.92,
-      "eval_loss": 55.75440216064453,
-      "eval_runtime": 27.1022,
-      "eval_samples_per_second": 20.404,
-      "eval_steps_per_second": 20.404,
-      "eval_wer": 1.0,
-      "step": 180
     },
     {
-      "epoch": 0.97,
-      "eval_loss": 45.729740142822266,
-      "eval_runtime": 27.0279,
-      "eval_samples_per_second": 20.46,
-      "eval_steps_per_second": 20.46,
-      "eval_wer": 1.0,
-      "step": 190
-    },
-    {
-      "epoch": 1.0,
-      "step": 195,
-      "total_flos": 2.4781601494187277e+17,
-      "train_loss": 109.71464342948718,
-      "train_runtime": 1380.1966,
-      "train_samples_per_second": 2.26,
-      "train_steps_per_second": 0.141
     }
   ],
-  "max_steps": 195,
-  "num_train_epochs": 1,
-  "total_flos": 2.4781601494187277e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 10.0,
+  "global_step": 1830,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 1.0,
+      "eval_loss": 47.84418869018555,
+      "eval_runtime": 186.8063,
+      "eval_samples_per_second": 19.587,
+      "eval_steps_per_second": 1.226,
       "eval_wer": 1.0,
+      "step": 183
     },
     {
+      "epoch": 2.0,
+      "eval_loss": 6.310945510864258,
+      "eval_runtime": 163.2985,
+      "eval_samples_per_second": 22.407,
+      "eval_steps_per_second": 1.402,
       "eval_wer": 1.0,
+      "step": 366
     },
     {
+      "epoch": 2.73,
+      "learning_rate": 0.00029699999999999996,
+      "loss": 41.8902,
+      "step": 500
     },
     {
+      "epoch": 3.0,
+      "eval_loss": 6.239192008972168,
+      "eval_runtime": 163.0201,
+      "eval_samples_per_second": 22.445,
+      "eval_steps_per_second": 1.405,
       "eval_wer": 1.0,
+      "step": 549
     },
     {
+      "epoch": 4.0,
+      "eval_loss": 5.973925590515137,
+      "eval_runtime": 163.0214,
+      "eval_samples_per_second": 22.445,
+      "eval_steps_per_second": 1.405,
+      "eval_wer": 1.1123227917121048,
+      "step": 732
     },
     {
+      "epoch": 5.0,
+      "eval_loss": 4.901411056518555,
+      "eval_runtime": 162.8715,
+      "eval_samples_per_second": 22.466,
+      "eval_steps_per_second": 1.406,
+      "eval_wer": 1.9473827699018538,
+      "step": 915
     },
     {
+      "epoch": 5.46,
+      "learning_rate": 0.00018834586466165413,
+      "loss": 5.5817,
+      "step": 1000
     },
     {
+      "epoch": 6.0,
+      "eval_loss": 3.9892334938049316,
+      "eval_runtime": 163.2053,
+      "eval_samples_per_second": 22.42,
+      "eval_steps_per_second": 1.403,
+      "eval_wer": 1.0188113413304254,
+      "step": 1098
     },
     {
+      "epoch": 7.0,
+      "eval_loss": 3.5080456733703613,
+      "eval_runtime": 162.7362,
+      "eval_samples_per_second": 22.484,
+      "eval_steps_per_second": 1.407,
+      "eval_wer": 1.0103598691384952,
+      "step": 1281
     },
     {
+      "epoch": 8.0,
+      "eval_loss": 3.0796852111816406,
+      "eval_runtime": 164.2666,
+      "eval_samples_per_second": 22.275,
+      "eval_steps_per_second": 1.394,
+      "eval_wer": 0.9904580152671756,
+      "step": 1464
     },
     {
+      "epoch": 8.2,
+      "learning_rate": 7.556390977443609e-05,
+      "loss": 3.5579,
+      "step": 1500
     },
     {
+      "epoch": 9.0,
+      "eval_loss": 2.8110806941986084,
+      "eval_runtime": 168.541,
+      "eval_samples_per_second": 21.71,
+      "eval_steps_per_second": 1.359,
+      "eval_wer": 0.9836423118865867,
+      "step": 1647
     },
     {
+      "epoch": 10.0,
+      "eval_loss": 2.67260479927063,
+      "eval_runtime": 165.7448,
+      "eval_samples_per_second": 22.076,
+      "eval_steps_per_second": 1.382,
+      "eval_wer": 0.9814612868047983,
+      "step": 1830
     },
     {
+      "epoch": 10.0,
+      "step": 1830,
+      "total_flos": 1.3577354977100892e+19,
+      "train_loss": 14.438921352032104,
+      "train_runtime": 7245.592,
+      "train_samples_per_second": 16.128,
+      "train_steps_per_second": 0.253
     }
   ],
+  "max_steps": 1830,
+  "num_train_epochs": 10,
+  "total_flos": 1.3577354977100892e+19,
   "trial_name": null,
   "trial_params": null
 }