legendary2910
/

Mnong-ASR-v1

@@ -1,13 +1,13 @@
 ---
-base_model: openai/whisper-medium
 language:
 - vi
 license: apache-2.0
-metrics:
-- wer
 tags:
 - hf-asr-leaderboard
 - generated_from_trainer
 model-index:
 - name: Whisper Medium Mnong
   results: []
@@ -20,8 +20,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [openai/whisper-medium](https://huggingface.co/openai/whisper-medium) on the MnongAudio-v2 dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.2759
-- Wer: 20.7811
 ## Model description
@@ -52,17 +52,33 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss | Wer     |
-|:-------------:|:------:|:----:|:---------------:|:-------:|
-| 0.3667        | 2.0325 | 1000 | 0.5079          | 42.3819 |
-| 0.0556        | 4.0650 | 2000 | 0.3091          | 24.1080 |
-| 0.0089        | 6.0976 | 3000 | 0.2708          | 17.7917 |
-| 0.0012        | 8.1301 | 4000 | 0.2759          | 20.7811 |
 ### Framework versions
-- Transformers 4.42.3
-- Pytorch 2.3.1+cu121
 - Datasets 2.20.0
 - Tokenizers 0.19.1

 ---
 language:
 - vi
 license: apache-2.0
+base_model: openai/whisper-medium
 tags:
 - hf-asr-leaderboard
 - generated_from_trainer
+metrics:
+- wer
 model-index:
 - name: Whisper Medium Mnong
   results: []
 This model is a fine-tuned version of [openai/whisper-medium](https://huggingface.co/openai/whisper-medium) on the MnongAudio-v2 dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.2773
+- Wer: 16.8874
 ## Model description
 ### Training results
+| Training Loss | Epoch  | Step | Validation Loss | Wer      |
+|:-------------:|:------:|:----:|:---------------:|:--------:|
+| 2.1592        | 0.2915 | 200  | 2.0293          | 117.3459 |
+| 1.3786        | 0.5831 | 400  | 1.3853          | 90.0408  |
+| 0.9096        | 0.8746 | 600  | 1.0002          | 77.8146  |
+| 0.5869        | 1.1662 | 800  | 0.7615          | 64.7733  |
+| 0.4996        | 1.4577 | 1000 | 0.5799          | 52.1141  |
+| 0.3741        | 1.7493 | 1200 | 0.4811          | 60.9781  |
+| 0.1899        | 2.0408 | 1400 | 0.4078          | 35.3031  |
+| 0.1792        | 2.3324 | 1600 | 0.3690          | 34.2588  |
+| 0.1514        | 2.6239 | 1800 | 0.3361          | 31.5079  |
+| 0.1758        | 2.9155 | 2000 | 0.3069          | 30.9730  |
+| 0.0619        | 3.2070 | 2200 | 0.3031          | 28.2731  |
+| 0.047         | 3.4985 | 2400 | 0.2952          | 22.1600  |
+| 0.0472        | 3.7901 | 2600 | 0.2914          | 24.8344  |
+| 0.0246        | 4.0816 | 2800 | 0.2799          | 20.0458  |
+| 0.0255        | 4.3732 | 3000 | 0.2849          | 23.4590  |
+| 0.0246        | 4.6647 | 3200 | 0.2773          | 19.5619  |
+| 0.0235        | 4.9563 | 3400 | 0.2736          | 20.4279  |
+| 0.0088        | 5.2478 | 3600 | 0.2795          | 19.9440  |
+| 0.0076        | 5.5394 | 3800 | 0.2786          | 17.0657  |
+| 0.0057        | 5.8309 | 4000 | 0.2773          | 16.8874  |
 ### Framework versions
+- Transformers 4.42.4
+- Pytorch 2.4.0+cu121
 - Datasets 2.20.0
 - Tokenizers 0.19.1

generation_config.json CHANGED Viewed

@@ -246,5 +246,5 @@
     "transcribe": 50359,
     "translate": 50358
   },
-  "transformers_version": "4.42.3"
 }

     "transcribe": 50359,
     "translate": 50358
   },
+  "transformers_version": "4.42.4"
 }