Training in progress, epoch 1

Browse files

Files changed (11) hide show

config.json +1 -1
last-checkpoint/config.json +1 -1
last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +20 -99
last-checkpoint/training_args.bin +1 -1
pytorch_model.bin +1 -1
training_args.bin +1 -1

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "mprzibilla/large_base_M14",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

 {
+  "_name_or_path": "facebook/wav2vec2-base",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

last-checkpoint/config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "mprzibilla/large_base_M14",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

 {
+  "_name_or_path": "facebook/wav2vec2-base",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a43ff0832f82e5c911d2109aa0b12be97350abf074884d1a3e5e72837ee62af7
-size 721662341

 version https://git-lfs.github.com/spec/v1
+oid sha256:5e6a9f09e6fb63ad751dc4611e137ce1869f410c418fa9bfaad1418641415acc
+size 721661957

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1d858722fd7c0abc20836fa5be62502020431ae85b7cc58e6359e0f11a10e0fd
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:280f8c091473f4d05ea40cb0c88ed010f67a742293a0a7a41cd0ee9528191e96
 size 377646433

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:714d5c5f10cba45cdf257a0981aa3270f279566ee860d39fea2bccaeb32fdb57
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:f5826ea72677989986439d9f551db7e4c81ec8600b7258910ddfb9d4f9272c47
 size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:83a3e1a101d651056f6daabdf10f309dfb053a93a16e8bb179c3cea7d861f569
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:fe7c767111accfefd8c962f6b3f65e0837fac0d4f2fb9b95baf14515e7dae4e1
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8a460bcf071af848d4a6a5e51c58f3a1808740a09c7408af65b5c0292a2e61d3
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:69329aa5f5ce6722e627e837927ad2e18f7a9b9c2acd8a4165059b6ad1f66c71
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,112 +1,33 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 30.0,
-  "global_step": 128100,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 10.0,
-      "learning_rate": 9.474177246394675e-05,
-      "loss": 1.9253,
-      "step": 42700
-    },
-    {
-      "epoch": 10.0,
-      "eval_cer": 0.10995670995670996,
-      "eval_loss": 0.8505344986915588,
-      "eval_runtime": 7.9974,
-      "eval_samples_per_second": 26.259,
-      "eval_steps_per_second": 3.376,
-      "eval_wer": 0.17142857142857143,
-      "step": 42700
-    },
-    {
-      "epoch": 20.0,
-      "learning_rate": 8.421915444348577e-05,
-      "loss": 0.198,
-      "step": 85400
-    },
-    {
-      "epoch": 20.0,
-      "eval_cer": 0.1038961038961039,
-      "eval_loss": 1.091776728630066,
-      "eval_runtime": 7.7941,
-      "eval_samples_per_second": 26.943,
-      "eval_steps_per_second": 3.464,
-      "eval_wer": 0.19523809523809524,
-      "step": 85400
-    },
-    {
-      "epoch": 21.0,
-      "learning_rate": 3.1609351246969886e-05,
-      "loss": 0.0837,
-      "step": 89670
-    },
-    {
-      "epoch": 21.0,
-      "eval_cer": 0.11082251082251082,
-      "eval_loss": 1.0681313276290894,
-      "eval_runtime": 7.6465,
-      "eval_samples_per_second": 27.464,
-      "eval_steps_per_second": 3.531,
-      "eval_wer": 0.1761904761904762,
-      "step": 89670
-    },
-    {
-      "epoch": 24.0,
-      "learning_rate": 2.1086322363285264e-05,
-      "loss": 0.061,
-      "step": 102480
-    },
-    {
-      "epoch": 24.0,
-      "eval_cer": 0.16363636363636364,
-      "eval_loss": 1.676707148551941,
-      "eval_runtime": 7.6904,
-      "eval_samples_per_second": 27.307,
-      "eval_steps_per_second": 3.511,
-      "eval_wer": 0.24285714285714285,
-      "step": 102480
-    },
-    {
-      "epoch": 27.0,
-      "learning_rate": 1.0564115206047907e-05,
-      "loss": 0.0445,
-      "step": 115290
-    },
-    {
-      "epoch": 27.0,
-      "eval_cer": 0.10562770562770563,
-      "eval_loss": 1.3365751504898071,
-      "eval_runtime": 7.6936,
-      "eval_samples_per_second": 27.295,
-      "eval_steps_per_second": 3.509,
-      "eval_wer": 0.14285714285714285,
-      "step": 115290
-    },
-    {
-      "epoch": 30.0,
-      "learning_rate": 4.190804881055097e-08,
-      "loss": 0.0337,
-      "step": 128100
-    },
-    {
-      "epoch": 30.0,
-      "eval_cer": 0.10043290043290043,
-      "eval_loss": 1.295832633972168,
-      "eval_runtime": 7.6185,
-      "eval_samples_per_second": 27.564,
-      "eval_steps_per_second": 3.544,
-      "eval_wer": 0.14285714285714285,
-      "step": 128100
     }
   ],
-  "max_steps": 128100,
-  "num_train_epochs": 30,
-  "total_flos": 9.694905007000497e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 4270,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 1.0,
+      "learning_rate": 9.825795424664739e-05,
+      "loss": 7.2959,
+      "step": 4270
+    },
+    {
+      "epoch": 1.0,
+      "eval_cer": 0.5922077922077922,
+      "eval_loss": 1.3762445449829102,
+      "eval_new_wer": 0.3952380952380952,
+      "eval_old_wer": 1.0,
+      "eval_runtime": 7.8519,
+      "eval_samples_per_second": 26.745,
+      "eval_steps_per_second": 3.439,
+      "step": 4270
     }
   ],
+  "max_steps": 64050,
+  "num_train_epochs": 15,
+  "total_flos": 3.3863997052324454e+18,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9d8b33716b4066af3bfff06c10a7f3e5a9f75eeeb9bc04bfb6b9092a433f06df
 size 3451

 version https://git-lfs.github.com/spec/v1
+oid sha256:40b73e2d38557903613d82a7f7939cc536f83ca7910211be0f74d26aab9d8c03
 size 3451

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1d858722fd7c0abc20836fa5be62502020431ae85b7cc58e6359e0f11a10e0fd
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:280f8c091473f4d05ea40cb0c88ed010f67a742293a0a7a41cd0ee9528191e96
 size 377646433

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9d8b33716b4066af3bfff06c10a7f3e5a9f75eeeb9bc04bfb6b9092a433f06df
 size 3451

 version https://git-lfs.github.com/spec/v1
+oid sha256:40b73e2d38557903613d82a7f7939cc536f83ca7910211be0f74d26aab9d8c03
 size 3451