facebook
/

wav2vec2-xls-r-300m-21-to-en

Automatic Speech Recognition Transformers PyTorch

23 languages speech-encoder-decoder speech xls_r xls_r_translation Inference Endpoints

Model card Files Files and versions Community

patrickvonplaten commited on Nov 17, 2021

Commit

482d17b

•

1 Parent(s): a0cfb98

upload

Files changed (2) hide show

config.json +12 -8
pytorch_model.bin +1 -1

config.json CHANGED Viewed

@@ -2,8 +2,7 @@
   "architectures": [
     "SpeechEncoderDecoderModel"
   ],
-  "decoder": {
-    "_name_or_path": "/home/suraj/projects/mbart-50/hf_models/mbart-50-large-one-to-many/",
     "_num_labels": 3,
     "activation_dropout": 0.0,
     "activation_function": "relu",
@@ -94,13 +93,13 @@
     "use_cache": true,
     "vocab_size": 250054
   },
-  "decoder_start_token_id": 250004,
   "encoder": {
     "_name_or_path": "",
     "activation_dropout": 0.0,
-    "adaptor_kernel_size": 3,
-    "adaptor_stride": 2,
-    "add_adaptor": true,
     "add_cross_attention": false,
     "apply_spec_augment": true,
     "architectures": [
@@ -188,7 +187,7 @@
     "min_length": 0,
     "model_type": "wav2vec2",
     "no_repeat_ngram_size": 0,
-    "num_adaptor_layers": 3,
     "num_attention_heads": 16,
     "num_beam_groups": 1,
     "num_beams": 1,
@@ -201,6 +200,7 @@
     "num_negatives": 100,
     "num_return_sequences": 1,
     "output_attentions": false,
     "output_hidden_states": false,
     "output_scores": false,
     "pad_token_id": 0,
@@ -229,11 +229,15 @@
   },
   "eos_token_id": 2,
   "feature_extractor_type": "wav2vec2",
   "is_encoder_decoder": true,
   "model_type": "speech-encoder-decoder",
   "pad_token_id": 1,
   "tie_word_embeddings": false,
   "tokenizer_class": "mbart50",
   "torch_dtype": "float32",
-  "transformers_version": null
 }

   "architectures": [
     "SpeechEncoderDecoderModel"
   ],
+  "decoder": { "_name_or_path": "/home/suraj/projects/mbart-50/hf_models/mbart-50-large-one-to-many/",
     "_num_labels": 3,
     "activation_dropout": 0.0,
     "activation_function": "relu",
     "use_cache": true,
     "vocab_size": 250054
   },
+  "decoder_start_token_id": 2,
   "encoder": {
     "_name_or_path": "",
     "activation_dropout": 0.0,
+    "adapter_kernel_size": 3,
+    "adapter_stride": 2,
+    "add_adapter": true,
     "add_cross_attention": false,
     "apply_spec_augment": true,
     "architectures": [
     "min_length": 0,
     "model_type": "wav2vec2",
     "no_repeat_ngram_size": 0,
+    "num_adapter_layers": 3,
     "num_attention_heads": 16,
     "num_beam_groups": 1,
     "num_beams": 1,
     "num_negatives": 100,
     "num_return_sequences": 1,
     "output_attentions": false,
+    "output_hidden_size": 1024,
     "output_hidden_states": false,
     "output_scores": false,
     "pad_token_id": 0,
   },
   "eos_token_id": 2,
   "feature_extractor_type": "wav2vec2",
+  "forced_bos_token_id": 250004,
+  "forced_eos_token_id": 2,
   "is_encoder_decoder": true,
   "model_type": "speech-encoder-decoder",
   "pad_token_id": 1,
   "tie_word_embeddings": false,
   "tokenizer_class": "mbart50",
   "torch_dtype": "float32",
+  "transformers_version": null,
+	"num_beams": 5,
+	"max_length": 200
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3d66cb120c5f741721592bdc5f72800c82faa9503984e71cc36447f1bdd06a05
 size 3172257129

 version https://git-lfs.github.com/spec/v1
+oid sha256:02b827faddcf3cc3f0412f90423f5215e49f4dd42ef5765affd297e495334679
 size 3172257129