Training in progress, step 4017

Browse files

Files changed (11) hide show

config.json +1 -1
last-checkpoint/config.json +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +15 -127
last-checkpoint/training_args.bin +1 -1
pytorch_model.bin +1 -1
training_args.bin +1 -1

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "mprzibilla/dys_base_M14",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

 {
+  "_name_or_path": "facebook/wav2vec2-base",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

last-checkpoint/config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "mprzibilla/dys_base_M14",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

 {
+  "_name_or_path": "facebook/wav2vec2-base",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a06fabdd8e40a2415cbe05368ed03179ec54a1e5182bde3d9ba22d80f13c39fa
 size 721668101

 version https://git-lfs.github.com/spec/v1
+oid sha256:db25401d6710bd1958c6f51c19bcbfc3c41763a042336726a244dae071aeb197
 size 721668101

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3c29322461c6641c00268ddbc3ec7fbf3eac47dd6a465262f2c85a21f0e923f3
 size 377649505

 version https://git-lfs.github.com/spec/v1
+oid sha256:4971a68c9621393e9b2d50a639c8a82b0a059cb9042cec298ad92dc07e0c545a
 size 377649505

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:867d0fac469b0104f98602164cbc9aaefeeb58efe54cfdeef565345818c9775e
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b5161ff77ee89f2795b7a591f9b22f7fe74e0468c02497e0c2537a5b71a719a
 size 14639

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:614b2a06196347e24b6b4f4717f17dcc9f41c85649107516c838a44076205f5e
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:7395a75c4ab5ea271598dca5da8f8c4f98245cae4f5cff35b4dbb2a0e74423c2
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a6c0b6edf3b19e4b41e5e2509db370fca85acfb1ad4b630e5f2532f6549b4daa
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:78c3424e1374c05636562c17e7efec21ba0140ab354c9520c0792238885bcd45
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,144 +1,32 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 30.0,
-  "global_step": 40170,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 10.0,
-      "learning_rate": 9.474548956408946e-05,
-      "loss": 2.9276,
-      "step": 13390
     },
     {
-      "epoch": 10.0,
-      "eval_cer": 0.17402597402597403,
-      "eval_loss": 1.8234585523605347,
-      "eval_runtime": 7.7319,
-      "eval_samples_per_second": 27.16,
-      "eval_steps_per_second": 3.492,
-      "eval_wer": 0.319047619047619,
-      "step": 13390
-    },
-    {
-      "epoch": 12.0,
-      "learning_rate": 6.318589172475237e-05,
-      "loss": 0.338,
-      "step": 16068
-    },
-    {
-      "epoch": 12.0,
-      "eval_cer": 0.13506493506493505,
-      "eval_loss": 2.124079942703247,
-      "eval_runtime": 7.7938,
-      "eval_samples_per_second": 26.944,
-      "eval_steps_per_second": 3.464,
-      "eval_wer": 0.30952380952380953,
-      "step": 16068
-    },
-    {
-      "epoch": 15.0,
-      "learning_rate": 5.265971385147529e-05,
-      "loss": 0.1144,
-      "step": 20085
-    },
-    {
-      "epoch": 15.0,
-      "eval_cer": 0.10562770562770563,
-      "eval_loss": 1.8706998825073242,
-      "eval_runtime": 7.8262,
-      "eval_samples_per_second": 26.833,
-      "eval_steps_per_second": 3.45,
-      "eval_wer": 0.2714285714285714,
-      "step": 20085
-    },
-    {
-      "epoch": 18.0,
-      "learning_rate": 4.21387767936691e-05,
-      "loss": 0.087,
-      "step": 24102
-    },
-    {
-      "epoch": 18.0,
-      "eval_cer": 0.11601731601731602,
-      "eval_loss": 1.7962666749954224,
-      "eval_runtime": 8.1091,
-      "eval_samples_per_second": 25.897,
-      "eval_steps_per_second": 3.33,
-      "eval_wer": 0.29523809523809524,
-      "step": 24102
-    },
-    {
-      "epoch": 21.0,
-      "learning_rate": 3.16178397358629e-05,
-      "loss": 0.0722,
-      "step": 28119
-    },
-    {
-      "epoch": 21.0,
-      "eval_cer": 0.09696969696969697,
-      "eval_loss": 1.405766487121582,
-      "eval_runtime": 7.9215,
-      "eval_samples_per_second": 26.51,
-      "eval_steps_per_second": 3.408,
-      "eval_wer": 0.22857142857142856,
-      "step": 28119
-    },
-    {
-      "epoch": 24.0,
-      "learning_rate": 2.1091661862585817e-05,
-      "loss": 0.0558,
-      "step": 32136
-    },
-    {
-      "epoch": 24.0,
-      "eval_cer": 0.11688311688311688,
-      "eval_loss": 2.0048906803131104,
-      "eval_runtime": 7.8624,
-      "eval_samples_per_second": 26.71,
-      "eval_steps_per_second": 3.434,
-      "eval_wer": 0.2571428571428571,
-      "step": 32136
-    },
-    {
-      "epoch": 27.0,
-      "learning_rate": 1.0570724804779624e-05,
-      "loss": 0.0451,
-      "step": 36153
-    },
-    {
-      "epoch": 27.0,
-      "eval_cer": 0.06666666666666667,
-      "eval_loss": 0.9005960822105408,
-      "eval_runtime": 7.9263,
-      "eval_samples_per_second": 26.494,
-      "eval_steps_per_second": 3.406,
-      "eval_wer": 0.13333333333333333,
-      "step": 36153
-    },
-    {
-      "epoch": 30.0,
-      "learning_rate": 4.9787746973429064e-08,
-      "loss": 0.0386,
-      "step": 40170
-    },
-    {
-      "epoch": 30.0,
-      "eval_cer": 0.09177489177489177,
-      "eval_loss": 1.1628663539886475,
-      "eval_runtime": 8.0633,
-      "eval_samples_per_second": 26.044,
-      "eval_steps_per_second": 3.349,
-      "eval_wer": 0.20476190476190476,
-      "step": 40170
     }
   ],
   "max_steps": 40170,
   "num_train_epochs": 30,
-  "total_flos": 3.0777160112253587e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "global_step": 4017,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 3.0,
+      "learning_rate": 9.475394371364185e-05,
+      "loss": 6.1685,
+      "step": 4017
     },
     {
+      "epoch": 3.0,
+      "eval_cer": 0.2329004329004329,
+      "eval_loss": 1.0849695205688477,
+      "eval_runtime": 7.5095,
+      "eval_samples_per_second": 27.965,
+      "eval_steps_per_second": 3.595,
+      "eval_wer": 0.10952380952380952,
+      "step": 4017
     }
   ],
   "max_steps": 40170,
   "num_train_epochs": 30,
+  "total_flos": 3.0684859051639557e+18,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ffe3b5a4aad1671b33ccddc25dbba51e25a3b8b55bc57f05d04b95bad2307f39
 size 3451

 version https://git-lfs.github.com/spec/v1
+oid sha256:44a7ed8f97dac3c9e0a2af7de4d043ff4ada25dd33067d84682f5e73789b9937
 size 3451

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3c29322461c6641c00268ddbc3ec7fbf3eac47dd6a465262f2c85a21f0e923f3
 size 377649505

 version https://git-lfs.github.com/spec/v1
+oid sha256:4971a68c9621393e9b2d50a639c8a82b0a059cb9042cec298ad92dc07e0c545a
 size 377649505

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ffe3b5a4aad1671b33ccddc25dbba51e25a3b8b55bc57f05d04b95bad2307f39
 size 3451

 version https://git-lfs.github.com/spec/v1
+oid sha256:44a7ed8f97dac3c9e0a2af7de4d043ff4ada25dd33067d84682f5e73789b9937
 size 3451