RuudVelo
/

wav2vec2-large-xls-r-1b-cv8-mt-lm

Automatic Speech Recognition

mozilla-foundation/common_voice_8_0

generated_from_trainer

robust-speech-event

hf-asr-leaderboard

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

RuudVelo commited on Feb 5, 2022

Commit

a54cf9e

•

1 Parent(s): 5d61107

Update README.md

Files changed (1) hide show

README.md +33 -1

README.md CHANGED Viewed

@@ -64,7 +64,39 @@ Common Voice 8 mt dataset has been used for the model
 ## Training procedure
 ### Training hyperparameters
-Parameters can be found in the run.sh file at https://huggingface.co/RuudVelo/wav2vec2-large-xls-r-1b-cv8-mt-lm
 ### Framework versions
 - Transformers 4.16.0.dev0

 ## Training procedure
 ### Training hyperparameters
+The following config and hyperparameters were used during training:
+model = Wav2Vec2ForCTC.from_pretrained(
+    "facebook/wav2vec2-xls-r-1b",
+    attention_dropout=0.05,
+    hidden_dropout=0.05,
+    feat_proj_dropout=0.05,
+    mask_time_prob=0.55,
+    mask_feature_prob=0.10,
+    layerdrop=0.05,
+    ctc_zero_infinity=True,
+    ctc_loss_reduction="mean",
+    pad_token_id=processor.tokenizer.pad_token_id,
+    vocab_size=len(processor.tokenizer),
+)
+from transformers import TrainingArguments
+training_args = TrainingArguments(
+  output_dir=repo_name,
+  group_by_length=True,
+  per_device_train_batch_size=32,
+  gradient_accumulation_steps=2,
+  evaluation_strategy="steps",
+  num_train_epochs=50,
+  gradient_checkpointing=True,
+  fp16=True,
+  save_steps=400,
+  eval_steps=400,
+  logging_steps=400,
+  learning_rate=5.5e-05,
+  warmup_steps=500,
+  save_total_limit=2,
+  push_to_hub=True,
+  report_to="tensorboard")
 ### Framework versions
 - Transformers 4.16.0.dev0