marinone94 commited on Feb 3, 2022

Commit

bbba84f

•

1 Parent(s): fbe783d

Training in progress, step 100

Browse files

Files changed (17) hide show

checkpoint-100/optimizer.pt +1 -1
checkpoint-100/pytorch_model.bin +1 -1
checkpoint-100/rng_state.pth +2 -2
checkpoint-100/scaler.pt +1 -1
checkpoint-100/scheduler.pt +1 -1
checkpoint-100/trainer_state.json +27 -84
checkpoint-100/training_args.bin +1 -1
checkpoint-80/config.json +0 -115
checkpoint-80/optimizer.pt +0 -3
checkpoint-80/preprocessor_config.json +0 -9
checkpoint-80/pytorch_model.bin +0 -3
checkpoint-80/rng_state.pth +0 -3
checkpoint-80/scaler.pt +0 -3
checkpoint-80/scheduler.pt +0 -3
checkpoint-80/trainer_state.json +0 -100
checkpoint-80/training_args.bin +0 -3
pytorch_model.bin +1 -1

checkpoint-100/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e1722a491ea58423692abe6cde8aac0703fa17d8346a9ae868114f2509e04c97
 size 2490337361

 version https://git-lfs.github.com/spec/v1
+oid sha256:6a37fc39f7fbbd9e4e27f32438be5a7defea135497c5dd3778613d2e5336ad19
 size 2490337361

checkpoint-100/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7998265fd0c18bea1f246ca75cca77edd2def33646432a9437b4d839e97eab3d
 size 1262063089

 version https://git-lfs.github.com/spec/v1
+oid sha256:b71ffcd1b91ea379737ddde0779f635b716bdd28dd2319a1848a317ef50fd710
 size 1262063089

checkpoint-100/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:24a8cdd3a3488a3315f9617b64f16798a9e655a6d49b281bfbe024d5e3f2a880
-size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0b19e6c7c1493b5479a5fdad58d60d11a146aedd47536529f399dc05f5b158e
+size 14567

checkpoint-100/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2f28dfdeb34cb1b60f5d9c9b44dc5523bf2866ea557da6b58b27104a0030e0b3
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:13a3423b2fe42f204bc8fe2c666ff379f9fd753a0f13613064a5e71e86b519e8
 size 559

checkpoint-100/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6af49a56cc0b3dfaf6c4d29d3b9ab21c908c0ad2d95e41f19e6b8101ed863a39
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:48ba5c556f6ae479cce41c7f298c01a0d3452634d5c926dc7e48294e0c69c304
 size 623

checkpoint-100/trainer_state.json CHANGED Viewed

@@ -1,121 +1,64 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.3311258278145695,
   "global_step": 100,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
-    {
-      "epoch": 0.13,
-      "learning_rate": 4.9999999999999996e-05,
-      "loss": 13.2048,
-      "step": 10
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 7.46938775510204e-05,
-      "loss": 26.5657,
-      "step": 20
-    },
     {
       "epoch": 0.26,
-      "eval_loss": 17.199691772460938,
-      "eval_runtime": 5.248,
-      "eval_samples_per_second": 18.674,
-      "eval_steps_per_second": 0.762,
-      "eval_wer": 1.0,
       "step": 20
     },
     {
-      "epoch": 0.4,
-      "learning_rate": 7.36734693877551e-05,
-      "loss": 8.0091,
-      "step": 30
-    },
-    {
-      "epoch": 0.53,
-      "learning_rate": 7.265306122448979e-05,
-      "loss": 7.6332,
       "step": 40
     },
     {
-      "epoch": 0.53,
-      "eval_loss": 4.783994197845459,
-      "eval_runtime": 4.9818,
-      "eval_samples_per_second": 19.672,
-      "eval_steps_per_second": 0.803,
       "eval_wer": 1.0,
-      "step": 40
-    },
-    {
-      "epoch": 0.66,
-      "learning_rate": 7.163265306122449e-05,
-      "loss": 3.8261,
       "step": 50
     },
     {
-      "epoch": 0.79,
-      "learning_rate": 7.061224489795918e-05,
-      "loss": 3.8717,
       "step": 60
     },
     {
-      "epoch": 0.79,
-      "eval_loss": 3.6783852577209473,
-      "eval_runtime": 4.9141,
-      "eval_samples_per_second": 19.943,
-      "eval_steps_per_second": 0.814,
-      "eval_wer": 1.0,
-      "step": 60
-    },
-    {
-      "epoch": 0.93,
-      "learning_rate": 6.959183673469387e-05,
-      "loss": 3.7607,
-      "step": 70
-    },
-    {
-      "epoch": 1.07,
-      "learning_rate": 6.857142857142857e-05,
-      "loss": 3.638,
       "step": 80
     },
     {
-      "epoch": 1.07,
-      "eval_loss": 3.4979612827301025,
-      "eval_runtime": 5.0758,
-      "eval_samples_per_second": 19.307,
-      "eval_steps_per_second": 0.788,
-      "eval_wer": 1.0,
-      "step": 80
-    },
-    {
-      "epoch": 1.2,
-      "learning_rate": 6.755102040816325e-05,
-      "loss": 3.4601,
-      "step": 90
-    },
-    {
-      "epoch": 1.33,
-      "learning_rate": 6.653061224489796e-05,
-      "loss": 3.4138,
       "step": 100
     },
     {
-      "epoch": 1.33,
-      "eval_loss": 3.489065170288086,
-      "eval_runtime": 4.9074,
-      "eval_samples_per_second": 19.97,
-      "eval_steps_per_second": 0.815,
       "eval_wer": 1.0,
       "step": 100
     }
   ],
-  "max_steps": 750,
   "num_train_epochs": 10,
-  "total_flos": 2.00880445675488e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.281150159744409,
   "global_step": 100,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.26,
+      "learning_rate": 0.0007307692307692308,
+      "loss": 4.2559,
       "step": 20
     },
     {
+      "epoch": 0.51,
+      "learning_rate": 0.0007115384615384615,
+      "loss": 3.068,
       "step": 40
     },
     {
+      "epoch": 0.64,
+      "eval_loss": 3.058549165725708,
+      "eval_runtime": 3.3353,
+      "eval_samples_per_second": 29.982,
+      "eval_steps_per_second": 1.199,
       "eval_wer": 1.0,
       "step": 50
     },
     {
+      "epoch": 0.77,
+      "learning_rate": 0.0006923076923076924,
+      "loss": 3.0637,
       "step": 60
     },
     {
+      "epoch": 1.03,
+      "learning_rate": 0.0006730769230769232,
+      "loss": 3.0752,
       "step": 80
     },
     {
+      "epoch": 1.28,
+      "learning_rate": 0.0006538461538461538,
+      "loss": 3.0083,
       "step": 100
     },
     {
+      "epoch": 1.28,
+      "eval_loss": 3.1246652603149414,
+      "eval_runtime": 3.2285,
+      "eval_samples_per_second": 30.974,
+      "eval_steps_per_second": 1.239,
       "eval_wer": 1.0,
       "step": 100
     }
   ],
+  "max_steps": 780,
   "num_train_epochs": 10,
+  "total_flos": 1.5267594688539034e+18,
   "trial_name": null,
   "trial_params": null
 }

checkpoint-100/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:470abf25a211ef5ec3a9821c884f2749839bee5e95f633b168d26f90c1809409
 size 3055

 version https://git-lfs.github.com/spec/v1
+oid sha256:31becb5e425437ea470512000be6c31bb502b71fe15942ff8cf0cc01eb8267a0
 size 3055

checkpoint-80/config.json DELETED Viewed

@@ -1,115 +0,0 @@
-{
-  "_name_or_path": "KBLab/wav2vec2-large-voxrex",
-  "activation_dropout": 0.1,
-  "adapter_kernel_size": 3,
-  "adapter_stride": 2,
-  "add_adapter": false,
-  "apply_spec_augment": true,
-  "architectures": [
-    "Wav2Vec2ForCTC"
-  ],
-  "attention_dropout": 0.0,
-  "bos_token_id": 1,
-  "classifier_proj_size": 256,
-  "codevector_dim": 768,
-  "contrastive_logits_temperature": 0.1,
-  "conv_bias": true,
-  "conv_dim": [
-    512,
-    512,
-    512,
-    512,
-    512,
-    512,
-    512
-  ],
-  "conv_kernel": [
-    10,
-    3,
-    3,
-    3,
-    3,
-    2,
-    2
-  ],
-  "conv_stride": [
-    5,
-    2,
-    2,
-    2,
-    2,
-    2,
-    2
-  ],
-  "ctc_loss_reduction": "mean",
-  "ctc_zero_infinity": false,
-  "diversity_loss_weight": 0.1,
-  "do_stable_layer_norm": true,
-  "eos_token_id": 2,
-  "feat_extract_activation": "gelu",
-  "feat_extract_dropout": 0.0,
-  "feat_extract_norm": "layer",
-  "feat_proj_dropout": 0.0,
-  "feat_quantizer_dropout": 0.0,
-  "final_dropout": 0.0,
-  "hidden_act": "gelu",
-  "hidden_dropout": 0.0,
-  "hidden_size": 1024,
-  "initializer_range": 0.02,
-  "intermediate_size": 4096,
-  "layer_norm_eps": 1e-05,
-  "layerdrop": 0.0,
-  "mask_channel_length": 10,
-  "mask_channel_min_space": 1,
-  "mask_channel_other": 0.0,
-  "mask_channel_prob": 0.0,
-  "mask_channel_selection": "static",
-  "mask_feature_length": 64,
-  "mask_feature_min_masks": 0,
-  "mask_feature_prob": 0.25,
-  "mask_time_length": 10,
-  "mask_time_min_masks": 2,
-  "mask_time_min_space": 1,
-  "mask_time_other": 0.0,
-  "mask_time_prob": 0.75,
-  "mask_time_selection": "static",
-  "model_type": "wav2vec2",
-  "num_adapter_layers": 3,
-  "num_attention_heads": 16,
-  "num_codevector_groups": 2,
-  "num_codevectors_per_group": 320,
-  "num_conv_pos_embedding_groups": 16,
-  "num_conv_pos_embeddings": 128,
-  "num_feat_extract_layers": 7,
-  "num_hidden_layers": 24,
-  "num_negatives": 100,
-  "output_hidden_size": 1024,
-  "pad_token_id": 31,
-  "proj_codevector_dim": 768,
-  "tdnn_dilation": [
-    1,
-    2,
-    3,
-    1,
-    1
-  ],
-  "tdnn_dim": [
-    512,
-    512,
-    512,
-    512,
-    1500
-  ],
-  "tdnn_kernel": [
-    5,
-    3,
-    3,
-    1,
-    1
-  ],
-  "torch_dtype": "float32",
-  "transformers_version": "4.17.0.dev0",
-  "use_weighted_layer_sum": false,
-  "vocab_size": 34,
-  "xvector_output_dim": 512
-}

checkpoint-80/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:6b638480e632c1a7b61ada4cfb4e085fc6687b2cc7006a885f1727d7d5a41f17
-size 2490337361

checkpoint-80/preprocessor_config.json DELETED Viewed

@@ -1,9 +0,0 @@
-{
-  "do_normalize": true,
-  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
-  "feature_size": 1,
-  "padding_side": "right",
-  "padding_value": 0,
-  "return_attention_mask": true,
-  "sampling_rate": 16000
-}

checkpoint-80/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:d243142fcbd07def1347c28af05f32d03aa37c7536de513cc8503d261cf6d773
-size 1262063089

checkpoint-80/rng_state.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:d26c7900baa445f707767794b45729eeb213e1b2dc71ded73ca14c4c4a7d25a4
-size 14567

checkpoint-80/scaler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:2409ebedbf30ba97120ef308e1ac839369eea668dd8be70d109b5b98fe71857f
-size 559

checkpoint-80/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:721652adf9b5a54ee9b9baf3dac2052ee6350d8d896360a6439d75c8bb179b00
-size 623

checkpoint-80/trainer_state.json DELETED Viewed

@@ -1,100 +0,0 @@
-{
-  "best_metric": null,
-  "best_model_checkpoint": null,
-  "epoch": 1.0662251655629138,
-  "global_step": 80,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.13,
-      "learning_rate": 4.9999999999999996e-05,
-      "loss": 13.2048,
-      "step": 10
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 7.46938775510204e-05,
-      "loss": 26.5657,
-      "step": 20
-    },
-    {
-      "epoch": 0.26,
-      "eval_loss": 17.199691772460938,
-      "eval_runtime": 5.248,
-      "eval_samples_per_second": 18.674,
-      "eval_steps_per_second": 0.762,
-      "eval_wer": 1.0,
-      "step": 20
-    },
-    {
-      "epoch": 0.4,
-      "learning_rate": 7.36734693877551e-05,
-      "loss": 8.0091,
-      "step": 30
-    },
-    {
-      "epoch": 0.53,
-      "learning_rate": 7.265306122448979e-05,
-      "loss": 7.6332,
-      "step": 40
-    },
-    {
-      "epoch": 0.53,
-      "eval_loss": 4.783994197845459,
-      "eval_runtime": 4.9818,
-      "eval_samples_per_second": 19.672,
-      "eval_steps_per_second": 0.803,
-      "eval_wer": 1.0,
-      "step": 40
-    },
-    {
-      "epoch": 0.66,
-      "learning_rate": 7.163265306122449e-05,
-      "loss": 3.8261,
-      "step": 50
-    },
-    {
-      "epoch": 0.79,
-      "learning_rate": 7.061224489795918e-05,
-      "loss": 3.8717,
-      "step": 60
-    },
-    {
-      "epoch": 0.79,
-      "eval_loss": 3.6783852577209473,
-      "eval_runtime": 4.9141,
-      "eval_samples_per_second": 19.943,
-      "eval_steps_per_second": 0.814,
-      "eval_wer": 1.0,
-      "step": 60
-    },
-    {
-      "epoch": 0.93,
-      "learning_rate": 6.959183673469387e-05,
-      "loss": 3.7607,
-      "step": 70
-    },
-    {
-      "epoch": 1.07,
-      "learning_rate": 6.857142857142857e-05,
-      "loss": 3.638,
-      "step": 80
-    },
-    {
-      "epoch": 1.07,
-      "eval_loss": 3.4979612827301025,
-      "eval_runtime": 5.0758,
-      "eval_samples_per_second": 19.307,
-      "eval_steps_per_second": 0.788,
-      "eval_wer": 1.0,
-      "step": 80
-    }
-  ],
-  "max_steps": 750,
-  "num_train_epochs": 10,
-  "total_flos": 1.61703171100896e+18,
-  "trial_name": null,
-  "trial_params": null
-}

checkpoint-80/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:470abf25a211ef5ec3a9821c884f2749839bee5e95f633b168d26f90c1809409
-size 3055

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:80ebb6ebc7a95b13fda5cdc22fab5fcfb9ffdb99ca0102065a7147116a7f9f3f
 size 1262063089

 version https://git-lfs.github.com/spec/v1
+oid sha256:b71ffcd1b91ea379737ddde0779f635b716bdd28dd2319a1848a317ef50fd710
 size 1262063089