End of training

Browse files

Files changed (5) hide show

README.md +24 -24
config.json +1 -1
model.safetensors +3 -0
trainer_state.json +189 -189
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -17,9 +17,9 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [facebook/wav2vec2-xls-r-300m](https://huggingface.co/facebook/wav2vec2-xls-r-300m) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.3192
-- Wer: 0.0429
-- Per: 0.0326
 ## Model description
@@ -51,31 +51,31 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step  | Validation Loss | Wer    | Per    |
 |:-------------:|:-----:|:-----:|:---------------:|:------:|:------:|
-| 8.6256        | 1.0   | 1617  | 3.2158          | 1.0    | 1.0    |
-| 1.3467        | 2.0   | 3234  | 0.3775          | 0.0753 | 0.0605 |
-| 0.1996        | 3.0   | 4851  | 0.3054          | 0.0561 | 0.0421 |
-| 0.1311        | 4.0   | 6468  | 0.3120          | 0.0507 | 0.0387 |
-| 0.1044        | 5.0   | 8085  | 0.3169          | 0.0507 | 0.0386 |
-| 0.0891        | 6.0   | 9702  | 0.3030          | 0.0496 | 0.0372 |
-| 0.0788        | 7.0   | 11319 | 0.3174          | 0.0520 | 0.0391 |
-| 0.0619        | 8.0   | 12936 | 0.3312          | 0.0546 | 0.0417 |
-| 0.0552        | 9.0   | 14553 | 0.3353          | 0.0480 | 0.0358 |
-| 0.0493        | 10.0  | 16170 | 0.2742          | 0.0452 | 0.0336 |
-| 0.0417        | 11.0  | 17787 | 0.2894          | 0.0459 | 0.0355 |
-| 0.0382        | 12.0  | 19404 | 0.2949          | 0.0463 | 0.0350 |
-| 0.0306        | 13.0  | 21021 | 0.3041          | 0.0472 | 0.0348 |
-| 0.03          | 14.0  | 22638 | 0.3109          | 0.0453 | 0.0339 |
-| 0.0244        | 15.0  | 24255 | 0.3234          | 0.0448 | 0.0335 |
-| 0.0215        | 16.0  | 25872 | 0.3321          | 0.0436 | 0.0332 |
-| 0.0182        | 17.0  | 27489 | 0.3367          | 0.0420 | 0.0315 |
-| 0.0171        | 18.0  | 29106 | 0.3317          | 0.0430 | 0.0328 |
-| 0.0155        | 19.0  | 30723 | 0.3249          | 0.0423 | 0.0321 |
-| 0.0132        | 20.0  | 32340 | 0.3192          | 0.0429 | 0.0326 |
 ### Framework versions
-- Transformers 4.34.1
 - Pytorch 2.1.0+cu118
 - Datasets 2.14.6
 - Tokenizers 0.14.1

 This model is a fine-tuned version of [facebook/wav2vec2-xls-r-300m](https://huggingface.co/facebook/wav2vec2-xls-r-300m) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.3501
+- Wer: 0.0432
+- Per: 0.0327
 ## Model description
 | Training Loss | Epoch | Step  | Validation Loss | Wer    | Per    |
 |:-------------:|:-----:|:-----:|:---------------:|:------:|:------:|
+| 8.1087        | 1.0   | 1637  | 3.1701          | 1.0    | 1.0    |
+| 1.1869        | 2.0   | 3274  | 0.4045          | 0.0800 | 0.0646 |
+| 0.2           | 3.0   | 4911  | 0.3260          | 0.0591 | 0.0464 |
+| 0.1283        | 4.0   | 6548  | 0.3042          | 0.0618 | 0.0475 |
+| 0.1037        | 5.0   | 8185  | 0.2727          | 0.0531 | 0.0410 |
+| 0.0844        | 6.0   | 9822  | 0.3184          | 0.0543 | 0.0409 |
+| 0.0738        | 7.0   | 11459 | 0.2886          | 0.0485 | 0.0366 |
+| 0.0613        | 8.0   | 13096 | 0.3345          | 0.0488 | 0.0374 |
+| 0.0573        | 9.0   | 14733 | 0.3469          | 0.0505 | 0.0394 |
+| 0.0514        | 10.0  | 16370 | 0.3245          | 0.0510 | 0.0386 |
+| 0.0469        | 11.0  | 18007 | 0.3094          | 0.0492 | 0.0374 |
+| 0.0375        | 12.0  | 19644 | 0.3656          | 0.0521 | 0.0392 |
+| 0.0356        | 13.0  | 21281 | 0.3296          | 0.0472 | 0.0356 |
+| 0.0291        | 14.0  | 22918 | 0.3301          | 0.0448 | 0.0336 |
+| 0.0242        | 15.0  | 24555 | 0.3575          | 0.0460 | 0.0357 |
+| 0.0216        | 16.0  | 26192 | 0.3376          | 0.0443 | 0.0335 |
+| 0.0208        | 17.0  | 27829 | 0.3688          | 0.0436 | 0.0332 |
+| 0.018         | 18.0  | 29466 | 0.3673          | 0.0445 | 0.0340 |
+| 0.0164        | 19.0  | 31103 | 0.3576          | 0.0432 | 0.0327 |
+| 0.0128        | 20.0  | 32740 | 0.3501          | 0.0432 | 0.0327 |
 ### Framework versions
+- Transformers 4.35.0
 - Pytorch 2.1.0+cu118
 - Datasets 2.14.6
 - Tokenizers 0.14.1

config.json CHANGED Viewed

@@ -102,7 +102,7 @@
     1
   ],
   "torch_dtype": "float32",
-  "transformers_version": "4.34.1",
   "use_weighted_layer_sum": false,
   "vocab_size": 40,
   "xvector_output_dim": 512

     1
   ],
   "torch_dtype": "float32",
+  "transformers_version": "4.35.0",
   "use_weighted_layer_sum": false,
   "vocab_size": 40,
   "xvector_output_dim": 512

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:62a1ad6b551d23fd41826148687406ae9d40d16b74e3ccad082a3defedec9a1b
+size 1261971480

trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 0.2741861045360565,
-  "best_model_checkpoint": "nrshoudi/wav2vec_arabic_mdd/checkpoint-16170",
   "epoch": 20.0,
   "eval_steps": 500,
-  "global_step": 32340,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -11,338 +11,338 @@
     {
       "epoch": 1.0,
       "learning_rate": 5e-05,
-      "loss": 8.6256,
-      "step": 1617
     },
     {
       "epoch": 1.0,
-      "eval_loss": 3.215786933898926,
       "eval_per": 1.0,
-      "eval_runtime": 116.0176,
-      "eval_samples_per_second": 7.008,
-      "eval_steps_per_second": 3.508,
       "eval_wer": 1.0,
-      "step": 1617
     },
     {
       "epoch": 2.0,
       "learning_rate": 0.0001,
-      "loss": 1.3467,
-      "step": 3234
     },
     {
       "epoch": 2.0,
-      "eval_loss": 0.37750244140625,
-      "eval_per": 0.060468293602185995,
-      "eval_runtime": 116.9742,
-      "eval_samples_per_second": 6.95,
-      "eval_steps_per_second": 3.479,
-      "eval_wer": 0.07531146470066725,
-      "step": 3234
     },
     {
       "epoch": 3.0,
       "learning_rate": 9.444444444444444e-05,
-      "loss": 0.1996,
-      "step": 4851
     },
     {
       "epoch": 3.0,
-      "eval_loss": 0.30538317561149597,
-      "eval_per": 0.042094600961085464,
-      "eval_runtime": 117.0156,
-      "eval_samples_per_second": 6.948,
-      "eval_steps_per_second": 3.478,
-      "eval_wer": 0.056133638187672065,
-      "step": 4851
     },
     {
       "epoch": 4.0,
       "learning_rate": 8.888888888888889e-05,
-      "loss": 0.1311,
-      "step": 6468
     },
     {
       "epoch": 4.0,
-      "eval_loss": 0.31199753284454346,
-      "eval_per": 0.038655422594930745,
-      "eval_runtime": 116.6027,
-      "eval_samples_per_second": 6.972,
-      "eval_steps_per_second": 3.49,
-      "eval_wer": 0.05067425691754934,
-      "step": 6468
     },
     {
       "epoch": 5.0,
       "learning_rate": 8.333333333333334e-05,
-      "loss": 0.1044,
-      "step": 8085
     },
     {
       "epoch": 5.0,
-      "eval_loss": 0.31690752506256104,
-      "eval_per": 0.038608310562517664,
-      "eval_runtime": 118.0869,
-      "eval_samples_per_second": 6.885,
-      "eval_steps_per_second": 3.447,
-      "eval_wer": 0.05072091829592646,
-      "step": 8085
     },
     {
       "epoch": 6.0,
       "learning_rate": 7.777777777777778e-05,
-      "loss": 0.0891,
-      "step": 9702
     },
     {
       "epoch": 6.0,
-      "eval_loss": 0.30304601788520813,
-      "eval_per": 0.03721850560633186,
-      "eval_runtime": 118.602,
-      "eval_samples_per_second": 6.855,
-      "eval_steps_per_second": 3.432,
-      "eval_wer": 0.04960104521487565,
-      "step": 9702
     },
     {
       "epoch": 7.0,
       "learning_rate": 7.222222222222222e-05,
-      "loss": 0.0788,
-      "step": 11319
     },
     {
       "epoch": 7.0,
-      "eval_loss": 0.31736186146736145,
-      "eval_per": 0.03910298690285499,
-      "eval_runtime": 118.2233,
-      "eval_samples_per_second": 6.877,
-      "eval_steps_per_second": 3.443,
-      "eval_wer": 0.052027436890485744,
-      "step": 11319
     },
     {
       "epoch": 8.0,
       "learning_rate": 6.666666666666667e-05,
-      "loss": 0.0619,
-      "step": 12936
     },
     {
       "epoch": 8.0,
-      "eval_loss": 0.33120226860046387,
-      "eval_per": 0.0416941486855743,
-      "eval_runtime": 118.3706,
-      "eval_samples_per_second": 6.868,
-      "eval_steps_per_second": 3.438,
-      "eval_wer": 0.05459381270122719,
-      "step": 12936
     },
     {
       "epoch": 9.0,
       "learning_rate": 6.111111111111112e-05,
-      "loss": 0.0552,
-      "step": 14553
     },
     {
       "epoch": 9.0,
-      "eval_loss": 0.3352554142475128,
-      "eval_per": 0.03575803260152643,
-      "eval_runtime": 119.3222,
-      "eval_samples_per_second": 6.813,
-      "eval_steps_per_second": 3.411,
-      "eval_wer": 0.04796789697167654,
-      "step": 14553
     },
     {
       "epoch": 10.0,
       "learning_rate": 5.555555555555556e-05,
-      "loss": 0.0493,
-      "step": 16170
     },
     {
       "epoch": 10.0,
-      "eval_loss": 0.2741861045360565,
-      "eval_per": 0.033567323094318285,
-      "eval_runtime": 119.9093,
-      "eval_samples_per_second": 6.78,
-      "eval_steps_per_second": 3.394,
-      "eval_wer": 0.04521487564742663,
-      "step": 16170
     },
     {
       "epoch": 11.0,
       "learning_rate": 5e-05,
-      "loss": 0.0417,
-      "step": 17787
     },
     {
       "epoch": 11.0,
-      "eval_loss": 0.28943416476249695,
-      "eval_per": 0.03547536040704796,
-      "eval_runtime": 120.1333,
-      "eval_samples_per_second": 6.767,
-      "eval_steps_per_second": 3.388,
-      "eval_wer": 0.04586813494470627,
-      "step": 17787
     },
     {
       "epoch": 12.0,
       "learning_rate": 4.4444444444444447e-05,
-      "loss": 0.0382,
-      "step": 19404
     },
     {
       "epoch": 12.0,
-      "eval_loss": 0.29486820101737976,
-      "eval_per": 0.03500424008291718,
-      "eval_runtime": 119.6619,
-      "eval_samples_per_second": 6.794,
-      "eval_steps_per_second": 3.401,
-      "eval_wer": 0.04633474872847744,
-      "step": 19404
     },
     {
       "epoch": 13.0,
       "learning_rate": 3.888888888888889e-05,
-      "loss": 0.0306,
-      "step": 21021
     },
     {
       "epoch": 13.0,
-      "eval_loss": 0.30409368872642517,
-      "eval_per": 0.034792235937058325,
-      "eval_runtime": 120.2788,
-      "eval_samples_per_second": 6.759,
-      "eval_steps_per_second": 3.384,
-      "eval_wer": 0.04717465353926555,
-      "step": 21021
     },
     {
       "epoch": 14.0,
       "learning_rate": 3.3333333333333335e-05,
-      "loss": 0.03,
-      "step": 22638
     },
     {
       "epoch": 14.0,
-      "eval_loss": 0.3109176456928253,
-      "eval_per": 0.033920663337416376,
-      "eval_runtime": 118.5483,
-      "eval_samples_per_second": 6.858,
-      "eval_steps_per_second": 3.433,
-      "eval_wer": 0.045261537025803746,
-      "step": 22638
     },
     {
       "epoch": 15.0,
       "learning_rate": 2.777777777777778e-05,
-      "loss": 0.0244,
-      "step": 24255
     },
     {
       "epoch": 15.0,
-      "eval_loss": 0.3234339952468872,
-      "eval_per": 0.03347309902949213,
-      "eval_runtime": 118.5882,
-      "eval_samples_per_second": 6.856,
-      "eval_steps_per_second": 3.432,
-      "eval_wer": 0.044841584620409686,
-      "step": 24255
     },
     {
       "epoch": 16.0,
       "learning_rate": 2.2222222222222223e-05,
-      "loss": 0.0215,
-      "step": 25872
     },
     {
       "epoch": 16.0,
-      "eval_loss": 0.33212560415267944,
-      "eval_per": 0.03316687081880712,
-      "eval_runtime": 118.6022,
-      "eval_samples_per_second": 6.855,
-      "eval_steps_per_second": 3.432,
-      "eval_wer": 0.04362838878260464,
-      "step": 25872
     },
     {
       "epoch": 17.0,
       "learning_rate": 1.6666666666666667e-05,
-      "loss": 0.0182,
-      "step": 27489
     },
     {
       "epoch": 17.0,
-      "eval_loss": 0.3367431163787842,
-      "eval_per": 0.03154150570055592,
-      "eval_runtime": 118.0708,
-      "eval_samples_per_second": 6.886,
-      "eval_steps_per_second": 3.447,
-      "eval_wer": 0.04204190191778265,
-      "step": 27489
     },
     {
       "epoch": 18.0,
       "learning_rate": 1.1111111111111112e-05,
-      "loss": 0.0171,
-      "step": 29106
     },
     {
       "epoch": 18.0,
-      "eval_loss": 0.3317033350467682,
-      "eval_per": 0.032766418543295955,
-      "eval_runtime": 117.8323,
-      "eval_samples_per_second": 6.9,
-      "eval_steps_per_second": 3.454,
-      "eval_wer": 0.043021790863702114,
-      "step": 29106
     },
     {
       "epoch": 19.0,
       "learning_rate": 5.555555555555556e-06,
-      "loss": 0.0155,
-      "step": 30723
     },
     {
       "epoch": 19.0,
-      "eval_loss": 0.3248533606529236,
-      "eval_per": 0.03210685008951286,
-      "eval_runtime": 118.4543,
-      "eval_samples_per_second": 6.863,
-      "eval_steps_per_second": 3.436,
-      "eval_wer": 0.04227520880966824,
-      "step": 30723
     },
     {
       "epoch": 20.0,
       "learning_rate": 0.0,
-      "loss": 0.0132,
-      "step": 32340
     },
     {
       "epoch": 20.0,
-      "eval_loss": 0.31921908259391785,
-      "eval_per": 0.032577970413643645,
-      "eval_runtime": 118.1674,
-      "eval_samples_per_second": 6.88,
-      "eval_steps_per_second": 3.444,
-      "eval_wer": 0.04292846810694788,
-      "step": 32340
     },
     {
       "epoch": 20.0,
-      "step": 32340,
-      "total_flos": 1.0355998175044045e+19,
-      "train_loss": 0.54961431122298,
-      "train_runtime": 19355.5909,
-      "train_samples_per_second": 3.342,
-      "train_steps_per_second": 1.671
     }
   ],
   "logging_steps": 500,
-  "max_steps": 32340,
   "num_train_epochs": 20,
   "save_steps": 500,
-  "total_flos": 1.0355998175044045e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.2726672291755676,
+  "best_model_checkpoint": "nrshoudi/wav2vec_arabic_mdd/checkpoint-8185",
   "epoch": 20.0,
   "eval_steps": 500,
+  "global_step": 32740,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
     {
       "epoch": 1.0,
       "learning_rate": 5e-05,
+      "loss": 8.1087,
+      "step": 1637
     },
     {
       "epoch": 1.0,
+      "eval_loss": 3.1701228618621826,
       "eval_per": 1.0,
+      "eval_runtime": 115.1384,
+      "eval_samples_per_second": 7.061,
+      "eval_steps_per_second": 3.535,
       "eval_wer": 1.0,
+      "step": 1637
     },
     {
       "epoch": 2.0,
       "learning_rate": 0.0001,
+      "loss": 1.1869,
+      "step": 3274
     },
     {
       "epoch": 2.0,
+      "eval_loss": 0.40448808670043945,
+      "eval_per": 0.06459059643833034,
+      "eval_runtime": 117.2186,
+      "eval_samples_per_second": 6.936,
+      "eval_steps_per_second": 3.472,
+      "eval_wer": 0.07997760253837899,
+      "step": 3274
     },
     {
       "epoch": 3.0,
       "learning_rate": 9.444444444444444e-05,
+      "loss": 0.2,
+      "step": 4911
     },
     {
       "epoch": 3.0,
+      "eval_loss": 0.3259519040584564,
+      "eval_per": 0.04635823989446905,
+      "eval_runtime": 116.6876,
+      "eval_samples_per_second": 6.967,
+      "eval_steps_per_second": 3.488,
+      "eval_wer": 0.05907330502543045,
+      "step": 4911
     },
     {
       "epoch": 4.0,
       "learning_rate": 8.888888888888889e-05,
+      "loss": 0.1283,
+      "step": 6548
     },
     {
       "epoch": 4.0,
+      "eval_loss": 0.3042123317718506,
+      "eval_per": 0.04748892867238293,
+      "eval_runtime": 116.8704,
+      "eval_samples_per_second": 6.956,
+      "eval_steps_per_second": 3.482,
+      "eval_wer": 0.06182632634968037,
+      "step": 6548
     },
     {
       "epoch": 5.0,
       "learning_rate": 8.333333333333334e-05,
+      "loss": 0.1037,
+      "step": 8185
     },
     {
       "epoch": 5.0,
+      "eval_loss": 0.2726672291755676,
+      "eval_per": 0.04101102421558466,
+      "eval_runtime": 117.5633,
+      "eval_samples_per_second": 6.915,
+      "eval_steps_per_second": 3.462,
+      "eval_wer": 0.053147309971536556,
+      "step": 8185
     },
     {
       "epoch": 6.0,
       "learning_rate": 7.777777777777778e-05,
+      "loss": 0.0844,
+      "step": 9822
     },
     {
       "epoch": 6.0,
+      "eval_loss": 0.31839433312416077,
+      "eval_per": 0.040916800150758506,
+      "eval_runtime": 117.5398,
+      "eval_samples_per_second": 6.917,
+      "eval_steps_per_second": 3.463,
+      "eval_wer": 0.05431384443096449,
+      "step": 9822
     },
     {
       "epoch": 7.0,
       "learning_rate": 7.222222222222222e-05,
+      "loss": 0.0738,
+      "step": 11459
     },
     {
       "epoch": 7.0,
+      "eval_loss": 0.28862160444259644,
+      "eval_per": 0.03655893715254876,
+      "eval_runtime": 117.5297,
+      "eval_samples_per_second": 6.917,
+      "eval_steps_per_second": 3.463,
+      "eval_wer": 0.048527833512201954,
+      "step": 11459
     },
     {
       "epoch": 8.0,
       "learning_rate": 6.666666666666667e-05,
+      "loss": 0.0613,
+      "step": 13096
     },
     {
       "epoch": 8.0,
+      "eval_loss": 0.3345281481742859,
+      "eval_per": 0.037359841703571095,
+      "eval_runtime": 117.0501,
+      "eval_samples_per_second": 6.946,
+      "eval_steps_per_second": 3.477,
+      "eval_wer": 0.04880780178246465,
+      "step": 13096
     },
     {
       "epoch": 9.0,
       "learning_rate": 6.111111111111112e-05,
+      "loss": 0.0573,
+      "step": 14733
     },
     {
       "epoch": 9.0,
+      "eval_loss": 0.34689363837242126,
+      "eval_per": 0.03943277112974654,
+      "eval_runtime": 117.6593,
+      "eval_samples_per_second": 6.91,
+      "eval_steps_per_second": 3.459,
+      "eval_wer": 0.05053427278241799,
+      "step": 14733
     },
     {
       "epoch": 10.0,
       "learning_rate": 5.555555555555556e-05,
+      "loss": 0.0514,
+      "step": 16370
     },
     {
       "epoch": 10.0,
+      "eval_loss": 0.3245474100112915,
+      "eval_per": 0.038608310562517664,
+      "eval_runtime": 117.7221,
+      "eval_samples_per_second": 6.906,
+      "eval_steps_per_second": 3.457,
+      "eval_wer": 0.051047547944566285,
+      "step": 16370
     },
     {
       "epoch": 11.0,
       "learning_rate": 5e-05,
+      "loss": 0.0469,
+      "step": 18007
     },
     {
       "epoch": 11.0,
+      "eval_loss": 0.30943331122398376,
+      "eval_per": 0.03738339771977763,
+      "eval_runtime": 118.4378,
+      "eval_samples_per_second": 6.864,
+      "eval_steps_per_second": 3.436,
+      "eval_wer": 0.049181092809481596,
+      "step": 18007
     },
     {
       "epoch": 12.0,
       "learning_rate": 4.4444444444444447e-05,
+      "loss": 0.0375,
+      "step": 19644
     },
     {
       "epoch": 12.0,
+      "eval_loss": 0.36555343866348267,
+      "eval_per": 0.03919721096768115,
+      "eval_runtime": 117.4812,
+      "eval_samples_per_second": 6.92,
+      "eval_steps_per_second": 3.464,
+      "eval_wer": 0.05207409826886286,
+      "step": 19644
     },
     {
       "epoch": 13.0,
       "learning_rate": 3.888888888888889e-05,
+      "loss": 0.0356,
+      "step": 21281
     },
     {
       "epoch": 13.0,
+      "eval_loss": 0.3295977711677551,
+      "eval_per": 0.03561669650428719,
+      "eval_runtime": 120.3969,
+      "eval_samples_per_second": 6.753,
+      "eval_steps_per_second": 3.38,
+      "eval_wer": 0.04722131491764267,
+      "step": 21281
     },
     {
       "epoch": 14.0,
       "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.0291,
+      "step": 22918
     },
     {
       "epoch": 14.0,
+      "eval_loss": 0.3301165699958801,
+      "eval_per": 0.033637991142937904,
+      "eval_runtime": 120.2853,
+      "eval_samples_per_second": 6.759,
+      "eval_steps_per_second": 3.384,
+      "eval_wer": 0.04479492324203257,
+      "step": 22918
     },
     {
       "epoch": 15.0,
       "learning_rate": 2.777777777777778e-05,
+      "loss": 0.0242,
+      "step": 24555
     },
     {
       "epoch": 15.0,
+      "eval_loss": 0.3575274646282196,
+      "eval_per": 0.03573447658531989,
+      "eval_runtime": 120.2073,
+      "eval_samples_per_second": 6.763,
+      "eval_steps_per_second": 3.386,
+      "eval_wer": 0.046008119079837616,
+      "step": 24555
     },
     {
       "epoch": 16.0,
       "learning_rate": 2.2222222222222223e-05,
+      "loss": 0.0216,
+      "step": 26192
     },
     {
       "epoch": 16.0,
+      "eval_loss": 0.3376178741455078,
+      "eval_per": 0.033496655045698674,
+      "eval_runtime": 119.4419,
+      "eval_samples_per_second": 6.807,
+      "eval_steps_per_second": 3.408,
+      "eval_wer": 0.04428164807988428,
+      "step": 26192
     },
     {
       "epoch": 17.0,
       "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.0208,
+      "step": 27829
     },
     {
       "epoch": 17.0,
+      "eval_loss": 0.3688383400440216,
+      "eval_per": 0.033190426835013664,
+      "eval_runtime": 118.4061,
+      "eval_samples_per_second": 6.866,
+      "eval_steps_per_second": 3.437,
+      "eval_wer": 0.04358172740422752,
+      "step": 27829
     },
     {
       "epoch": 18.0,
       "learning_rate": 1.1111111111111112e-05,
+      "loss": 0.018,
+      "step": 29466
     },
     {
       "epoch": 18.0,
+      "eval_loss": 0.3673172891139984,
+      "eval_per": 0.03403844341844907,
+      "eval_runtime": 118.1876,
+      "eval_samples_per_second": 6.879,
+      "eval_steps_per_second": 3.444,
+      "eval_wer": 0.04446829359339275,
+      "step": 29466
     },
     {
       "epoch": 19.0,
       "learning_rate": 5.555555555555556e-06,
+      "loss": 0.0164,
+      "step": 31103
     },
     {
       "epoch": 19.0,
+      "eval_loss": 0.35759395360946655,
+      "eval_per": 0.03271930651088288,
+      "eval_runtime": 119.0412,
+      "eval_samples_per_second": 6.83,
+      "eval_steps_per_second": 3.419,
+      "eval_wer": 0.043208436377210585,
+      "step": 31103
     },
     {
       "epoch": 20.0,
       "learning_rate": 0.0,
+      "loss": 0.0128,
+      "step": 32740
     },
     {
       "epoch": 20.0,
+      "eval_loss": 0.3501162827014923,
+      "eval_per": 0.03269575049467634,
+      "eval_runtime": 118.2142,
+      "eval_samples_per_second": 6.877,
+      "eval_steps_per_second": 3.443,
+      "eval_wer": 0.04316177499883347,
+      "step": 32740
     },
     {
       "epoch": 20.0,
+      "step": 32740,
+      "total_flos": 1.0473975577487264e+19,
+      "train_loss": 0.5159456469186866,
+      "train_runtime": 19614.1198,
+      "train_samples_per_second": 3.337,
+      "train_steps_per_second": 1.669
     }
   ],
   "logging_steps": 500,
+  "max_steps": 32740,
   "num_train_epochs": 20,
   "save_steps": 500,
+  "total_flos": 1.0473975577487264e+19,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84b4a7ac0e1c6b093474175c4fd5e8c724dc3907c9fb9bd69ef08bd309794b0d
-size 4536

 version https://git-lfs.github.com/spec/v1
+oid sha256:c84c431828ae995bf9a2d808d39b34e50bb5c6715b86b7684e2870eeb4303e57
+size 4600