RASMUS
/

w2v-bert-2.0-finnish-v1

RASMUS commited on Feb 3

Commit

92083b0

•

1 Parent(s): 814d0bf

Training in progress, step 200

Files changed (3) hide show

config.json CHANGED Viewed

@@ -9,7 +9,7 @@
   "architectures": [
     "Wav2Vec2BertForCTC"
   ],
-  "attention_dropout": 0.0,
   "bos_token_id": 1,
   "classifier_proj_size": 768,
   "codevector_dim": 768,
@@ -20,24 +20,24 @@
   "ctc_zero_infinity": false,
   "diversity_loss_weight": 0.1,
   "eos_token_id": 2,
-  "feat_proj_dropout": 0.0,
   "feat_quantizer_dropout": 0.0,
   "feature_projection_input_dim": 160,
   "final_dropout": 0.1,
   "hidden_act": "swish",
-  "hidden_dropout": 0.0,
   "hidden_size": 1024,
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-05,
-  "layerdrop": 0.0,
   "left_max_position_embeddings": 64,
   "mask_feature_length": 10,
   "mask_feature_min_masks": 0,
   "mask_feature_prob": 0.0,
   "mask_time_length": 10,
   "mask_time_min_masks": 2,
-  "mask_time_prob": 0.0,
   "max_source_positions": 5000,
   "model_type": "wav2vec2-bert",
   "num_adapter_layers": 1,
@@ -47,7 +47,7 @@
   "num_hidden_layers": 24,
   "num_negatives": 100,
   "output_hidden_size": 1024,
-  "pad_token_id": 31,
   "position_embeddings_type": "relative_key",
   "proj_codevector_dim": 768,
   "right_max_position_embeddings": 8,
@@ -77,6 +77,6 @@
   "transformers_version": "4.37.1",
   "use_intermediate_ffn_before_adapter": false,
   "use_weighted_layer_sum": false,
-  "vocab_size": 34,
   "xvector_output_dim": 512
 }

   "architectures": [
     "Wav2Vec2BertForCTC"
   ],
+  "attention_dropout": 0.094,
   "bos_token_id": 1,
   "classifier_proj_size": 768,
   "codevector_dim": 768,
   "ctc_zero_infinity": false,
   "diversity_loss_weight": 0.1,
   "eos_token_id": 2,
+  "feat_proj_dropout": 0.04,
   "feat_quantizer_dropout": 0.0,
   "feature_projection_input_dim": 160,
   "final_dropout": 0.1,
   "hidden_act": "swish",
+  "hidden_dropout": 0.047,
   "hidden_size": 1024,
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-05,
+  "layerdrop": 0.041,
   "left_max_position_embeddings": 64,
   "mask_feature_length": 10,
   "mask_feature_min_masks": 0,
   "mask_feature_prob": 0.0,
   "mask_time_length": 10,
   "mask_time_min_masks": 2,
+  "mask_time_prob": 0.082,
   "max_source_positions": 5000,
   "model_type": "wav2vec2-bert",
   "num_adapter_layers": 1,
   "num_hidden_layers": 24,
   "num_negatives": 100,
   "output_hidden_size": 1024,
+  "pad_token_id": 30,
   "position_embeddings_type": "relative_key",
   "proj_codevector_dim": 768,
   "right_max_position_embeddings": 8,
   "transformers_version": "4.37.1",
   "use_intermediate_ffn_before_adapter": false,
   "use_weighted_layer_sum": false,
+  "vocab_size": 33,
   "xvector_output_dim": 512
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1f9a3ba181c15a2eda6fe8c15e51681feb3f51ce1b2b2090f6f70021a6c03811
-size 2422953960

 version https://git-lfs.github.com/spec/v1
+oid sha256:ead45dfa8c03bd2d10c5c4e3d09f476c9f0a2b8df0751d07566c54ab2fcaf091
+size 2422954060

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a6a354d3b9705b750b5d8d5bc4f4119c0969eab3b2b3005ff27b2795fcf082ee
 size 4728

 version https://git-lfs.github.com/spec/v1
+oid sha256:5bb26e778420fd0b07b32eaf2a2743154884f9b6eebf38865474eade984bfbde
 size 4728