Add model files

Files changed (5) hide show

README.md CHANGED Viewed

@@ -21,7 +21,7 @@ model-index:
     metrics:
        - name: Test WER
          type: wer
-         value:
 ---
 # Wav2Vec2-Large-XLSR-53-euskera
@@ -84,7 +84,7 @@ processor = Wav2Vec2Processor.from_pretrained("ivangtorre/wav2vec2-large-xlsr-53
 model = Wav2Vec2ForCTC.from_pretrained("ivangtorre/wav2vec2-large-xlsr-53-basque")
 model.to("cuda")
-chars_to_ignore_regex = 'default=[",", "?", ".", "!", "-", ";", ":", '""', "%", "'", '"', "�"]'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 # Preprocessing the datasets.
@@ -114,7 +114,7 @@ result = test_dataset.map(evaluate, batched=True, batch_size=8)
 print("WER: {:2f}".format(100 * wer.compute(predictions=result["pred_strings"], references=result["sentence"])))
 ```
-**Test Result**:
 ## Training

     metrics:
        - name: Test WER
          type: wer
+         value: 44.48
 ---
 # Wav2Vec2-Large-XLSR-53-euskera
 model = Wav2Vec2ForCTC.from_pretrained("ivangtorre/wav2vec2-large-xlsr-53-basque")
 model.to("cuda")
+chars_to_ignore_regex = '[",", "?", ".", "!", "-", ";", ":", '""', "%", "'", '"', "�"]'
 resampler = torchaudio.transforms.Resample(48_000, 16_000)
 # Preprocessing the datasets.
 print("WER: {:2f}".format(100 * wer.compute(predictions=result["pred_strings"], references=result["sentence"])))
 ```
+**Test Result**: 44.48 %
 ## Training

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2e816e78ee7fd0e498f93f933dd0b18034841e0ba38042639fceb7d006be4270
 size 1262055847

 version https://git-lfs.github.com/spec/v1
+oid sha256:509588dea56f1c5e67678b30228db8d4070585445da2cfab49c13ee8fc134dc5
 size 1262055847

trainer_state.json CHANGED Viewed

@@ -1,30 +1,30 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.1845425867507886,
   "global_step": 500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 1.18,
-      "learning_rate": 0.0003470916966876807,
-      "loss": 1.587,
       "step": 500
     },
     {
-      "epoch": 1.18,
-      "eval_loss": 0.2940497398376465,
-      "eval_runtime": 783.4997,
-      "eval_samples_per_second": 6.601,
-      "eval_wer": 0.5440472766257878,
       "step": 500
     }
   ],
-  "max_steps": 2110,
-  "num_train_epochs": 5,
-  "total_flos": 2.4510852111832704e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 3.785894206549118,
   "global_step": 500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 3.79,
+      "learning_rate": 0.00039436231366470835,
+      "loss": 1.5121,
       "step": 500
     },
     {
+      "epoch": 3.79,
+      "eval_loss": 0.186998650431633,
+      "eval_runtime": 714.138,
+      "eval_samples_per_second": 7.242,
+      "eval_wer": 0.39502654080485317,
       "step": 500
     }
   ],
+  "max_steps": 6600,
+  "num_train_epochs": 50,
+  "total_flos": 7.843188479774457e+18,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:474caa22f1c7f0c4e89880f0d02b07015187ad5c2b1a354e1f8340ea7bbd6181
 size 2287

 version https://git-lfs.github.com/spec/v1
+oid sha256:38479a919eda7dd28d3ae5f9cab083881c8741ef35462dbc9ab73b870d8c6d48
 size 2287

vocab.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"r": 0, "w": 1, "e": 2, "a": 3, "b": 4, "p": 5, "m": 7, "x": 8, "q": 9, "d": 10, "g": 11, "h": 12, "f": 13, "~~\u00ed~~": 14, "v": 15, "c": 16, "~~\u00f1~~": 17, "i": 18, "t": 19, "y": 20, "n": 21, "z": 22, "o": 23, "l": 24, "s": 25, "k": 26, "j": 27, "u": 28, "\|": 6, "[UNK]": 29, "[PAD]": 30}


1	+ {"m": 0, "d": 1, "c": 2, "l": 3, "b": 4, "i": 5, "y": 6, "w": 7, "k": 8, "n": 10, "\u00f1": 11, "o": 12, "a": 13, "x": 14, "z": 15, "u": 16, "r": 17, "q": 18, "h": 19, "t": 20, "g": 21, "p": 22, "v": 23, "e": 24, "j": 25, "f": 26, "s": 27, "\u00ed": 28, "\|": 9, "[UNK]": 29, "[PAD]": 30}