Training in progress, step 2217

Browse files

Files changed (11) hide show

config.json +1 -1
last-checkpoint/config.json +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +8 -152
last-checkpoint/training_args.bin +1 -1
pytorch_model.bin +1 -1
training_args.bin +1 -1

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "mprzibilla/dys_base_M12",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

 {
+  "_name_or_path": "facebook/wav2vec2-base",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

last-checkpoint/config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "mprzibilla/dys_base_M12",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

 {
+  "_name_or_path": "facebook/wav2vec2-base",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65bbe84b69e0c2d542678e1e55b48eaf5dd1c1a8b9c265d59029020df8e2c2d2
 size 721661957

 version https://git-lfs.github.com/spec/v1
+oid sha256:de5514a6910ce746e9c92a397cffec47d7fd1f237e1a2b8b261042f78999eeeb
 size 721661957

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f010f98c29320e1cda391b7f740a19e10d5c75c3fbcb7b3c51e33ca8279cb670
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:759e446e095444985649f11d7e10c84ab0b633047cd26f44592ee68c5b5d605f
 size 377646433

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ef5adadbcb71232c007537e7afcf523fbe2fa23feb9e2cb1c2f1c5acc5329f94
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:3dc97fceb4985e338e186ef1a3a167f3e155c62158139c473d4ca69e6902657a
 size 14639

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d6e48cc84c599c0c5a5ffabdf6256e5f9e1c636c8231eae8b7f641065e6a3c09
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:ad65ef749044d3d43ee9fad31de44a1334019fd3af8f1fffd0103d345faf6439
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aa1687238ab6602eea0de58e5522259be443f3aeedb64de6b1e0446e005cdcc9
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:d445c2c3563c8513591cb1b12a3935b29973c8970c65da94c9d5ec03942d0648
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 30.0,
-  "global_step": 22170,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -10,167 +10,23 @@
     {
       "epoch": 3.0,
       "learning_rate": 9.47725762035894e-05,
-      "loss": 9.5412,
       "step": 2217
     },
     {
       "epoch": 3.0,
       "eval_cer": 1.0,
-      "eval_loss": 3.259145498275757,
-      "eval_runtime": 6.4877,
-      "eval_samples_per_second": 27.745,
-      "eval_steps_per_second": 3.545,
       "eval_wer": 1.0,
       "step": 2217
-    },
-    {
-      "epoch": 6.0,
-      "learning_rate": 8.42465103029152e-05,
-      "loss": 3.4578,
-      "step": 4434
-    },
-    {
-      "epoch": 6.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.401315927505493,
-      "eval_runtime": 6.3787,
-      "eval_samples_per_second": 28.219,
-      "eval_steps_per_second": 3.606,
-      "eval_wer": 1.0,
-      "step": 4434
-    },
-    {
-      "epoch": 9.0,
-      "learning_rate": 7.3720444402241e-05,
-      "loss": 3.48,
-      "step": 6651
-    },
-    {
-      "epoch": 9.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.331057071685791,
-      "eval_runtime": 6.3849,
-      "eval_samples_per_second": 28.191,
-      "eval_steps_per_second": 3.602,
-      "eval_wer": 1.0,
-      "step": 6651
-    },
-    {
-      "epoch": 12.0,
-      "learning_rate": 6.31943785015668e-05,
-      "loss": 3.4812,
-      "step": 8868
-    },
-    {
-      "epoch": 12.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.3546454906463623,
-      "eval_runtime": 6.5497,
-      "eval_samples_per_second": 27.482,
-      "eval_steps_per_second": 3.512,
-      "eval_wer": 1.0,
-      "step": 8868
-    },
-    {
-      "epoch": 15.0,
-      "learning_rate": 5.26683126008926e-05,
-      "loss": 3.4777,
-      "step": 11085
-    },
-    {
-      "epoch": 15.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.3556110858917236,
-      "eval_runtime": 6.4494,
-      "eval_samples_per_second": 27.91,
-      "eval_steps_per_second": 3.566,
-      "eval_wer": 1.0,
-      "step": 11085
-    },
-    {
-      "epoch": 18.0,
-      "learning_rate": 4.2146994587408606e-05,
-      "loss": 3.4773,
-      "step": 13302
-    },
-    {
-      "epoch": 18.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.3619229793548584,
-      "eval_runtime": 6.5622,
-      "eval_samples_per_second": 27.43,
-      "eval_steps_per_second": 3.505,
-      "eval_wer": 1.0,
-      "step": 13302
-    },
-    {
-      "epoch": 21.0,
-      "learning_rate": 3.162567657392461e-05,
-      "loss": 3.4764,
-      "step": 15519
-    },
-    {
-      "epoch": 21.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.3821072578430176,
-      "eval_runtime": 6.425,
-      "eval_samples_per_second": 28.016,
-      "eval_steps_per_second": 3.58,
-      "eval_wer": 1.0,
-      "step": 15519
-    },
-    {
-      "epoch": 24.0,
-      "learning_rate": 2.1104358560440606e-05,
-      "loss": 3.475,
-      "step": 17736
-    },
-    {
-      "epoch": 24.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.3482470512390137,
-      "eval_runtime": 6.442,
-      "eval_samples_per_second": 27.942,
-      "eval_steps_per_second": 3.57,
-      "eval_wer": 1.0,
-      "step": 17736
-    },
-    {
-      "epoch": 27.0,
-      "learning_rate": 1.0583040546956604e-05,
-      "loss": 3.4768,
-      "step": 19953
-    },
-    {
-      "epoch": 27.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.360586166381836,
-      "eval_runtime": 6.4129,
-      "eval_samples_per_second": 28.069,
-      "eval_steps_per_second": 3.587,
-      "eval_wer": 1.0,
-      "step": 19953
-    },
-    {
-      "epoch": 30.0,
-      "learning_rate": 6.17225334726047e-08,
-      "loss": 3.4768,
-      "step": 22170
-    },
-    {
-      "epoch": 30.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.3605401515960693,
-      "eval_runtime": 6.4105,
-      "eval_samples_per_second": 28.079,
-      "eval_steps_per_second": 3.588,
-      "eval_wer": 1.0,
-      "step": 22170
     }
   ],
   "max_steps": 22170,
   "num_train_epochs": 30,
-  "total_flos": 1.7046676802783232e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "global_step": 2217,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
     {
       "epoch": 3.0,
       "learning_rate": 9.47725762035894e-05,
+      "loss": 9.5446,
       "step": 2217
     },
     {
       "epoch": 3.0,
       "eval_cer": 1.0,
+      "eval_loss": 3.3644652366638184,
+      "eval_runtime": 7.1511,
+      "eval_samples_per_second": 25.171,
+      "eval_steps_per_second": 3.216,
       "eval_wer": 1.0,
       "step": 2217
     }
   ],
   "max_steps": 22170,
   "num_train_epochs": 30,
+  "total_flos": 1.7036476895380378e+18,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:181a6e2d442bf1169104d9f2b02381814e9db21e98dbb91663067f7ea0b95742
 size 3451

 version https://git-lfs.github.com/spec/v1
+oid sha256:d4728ac8f5c2d24f53b8faec82ed28f6e52bc930d3902e7e3901da9875264904
 size 3451

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f010f98c29320e1cda391b7f740a19e10d5c75c3fbcb7b3c51e33ca8279cb670
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:759e446e095444985649f11d7e10c84ab0b633047cd26f44592ee68c5b5d605f
 size 377646433

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:181a6e2d442bf1169104d9f2b02381814e9db21e98dbb91663067f7ea0b95742
 size 3451

 version https://git-lfs.github.com/spec/v1
+oid sha256:d4728ac8f5c2d24f53b8faec82ed28f6e52bc930d3902e7e3901da9875264904
 size 3451