Training in progress, step 828

Browse files

Files changed (11) hide show

config.json +1 -1
last-checkpoint/config.json +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +16 -160
last-checkpoint/training_args.bin +1 -1
pytorch_model.bin +1 -1
training_args.bin +1 -1

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "mprzibilla/med_v1_M16",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

 {
+  "_name_or_path": "facebook/wav2vec2-base",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

last-checkpoint/config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "mprzibilla/med_v1_M16",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

 {
+  "_name_or_path": "facebook/wav2vec2-base",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:02357769b90aa41ce2f1afead332b9564317d839be8930fe5a826347af5a9f8b
 size 721655813

 version https://git-lfs.github.com/spec/v1
+oid sha256:b4a031967083729509b330ae5b9862e958ffb80898c092b455aa943fd6caa7ff
 size 721655813

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:21aa9cb44d5586aa8e48837f4538361d742ca0ba800116a88ff3b4e599c12004
 size 377643361

 version https://git-lfs.github.com/spec/v1
+oid sha256:53c62e616c844d10c3144dcd2038e383c1842e2d5ebfde60fb6bd7c6642d0e98
 size 377643361

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8f85b544042f38e4c2648beb46ed4f6f71e64194c93da7c306a94c723b12f626
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:a0f3498b0fb3cfa636cb872575769e3bfed9eaa1dcdcda885418a848dae9c8ba
 size 14639

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0e991ec205035f90ff82667dd27be6bf8e088e795818085707b459d6bc307da5
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:d3a242853240e19c1959624b9f2b00c3fe07605c6350cc106c509c195a771cbd
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b6cf9f4e8a47c5d0da9d4aa0a555c09f05c78b7659905c8447b24283c11fd972
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:50f6ed94eee609b90f0f8ed99014ef4e5800bb577a0b23b95118111398bab8ad
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,176 +1,32 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 150.0,
-  "global_step": 41400,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 15.0,
-      "learning_rate": 9.475464022374778e-05,
-      "loss": 5.3664,
-      "step": 4140
     },
     {
-      "epoch": 15.0,
-      "eval_cer": 0.7292929292929293,
-      "eval_loss": 5.88323450088501,
-      "eval_runtime": 6.7058,
-      "eval_samples_per_second": 26.842,
-      "eval_steps_per_second": 3.43,
       "eval_wer": 1.0,
-      "step": 4140
-    },
-    {
-      "epoch": 30.0,
-      "learning_rate": 8.423595219933893e-05,
-      "loss": 0.2558,
-      "step": 8280
-    },
-    {
-      "epoch": 30.0,
-      "eval_cer": 0.7838383838383839,
-      "eval_loss": 8.95319652557373,
-      "eval_runtime": 6.7537,
-      "eval_samples_per_second": 26.652,
-      "eval_steps_per_second": 3.406,
-      "eval_wer": 1.0,
-      "step": 8280
-    },
-    {
-      "epoch": 45.0,
-      "learning_rate": 7.371217899822019e-05,
-      "loss": 0.1491,
-      "step": 12420
-    },
-    {
-      "epoch": 45.0,
-      "eval_cer": 0.795959595959596,
-      "eval_loss": 10.358320236206055,
-      "eval_runtime": 6.7593,
-      "eval_samples_per_second": 26.63,
-      "eval_steps_per_second": 3.403,
-      "eval_wer": 1.0,
-      "step": 12420
-    },
-    {
-      "epoch": 60.0,
-      "learning_rate": 6.318840579710145e-05,
-      "loss": 0.1152,
-      "step": 16560
-    },
-    {
-      "epoch": 60.0,
-      "eval_cer": 0.7272727272727273,
-      "eval_loss": 12.108501434326172,
-      "eval_runtime": 6.7041,
-      "eval_samples_per_second": 26.849,
-      "eval_steps_per_second": 3.431,
-      "eval_wer": 1.0,
-      "step": 16560
-    },
-    {
-      "epoch": 75.0,
-      "learning_rate": 5.2664632595982714e-05,
-      "loss": 0.0708,
-      "step": 20700
-    },
-    {
-      "epoch": 75.0,
-      "eval_cer": 0.7414141414141414,
-      "eval_loss": 9.7799654006958,
-      "eval_runtime": 6.7084,
-      "eval_samples_per_second": 26.832,
-      "eval_steps_per_second": 3.429,
-      "eval_wer": 1.0,
-      "step": 20700
-    },
-    {
-      "epoch": 90.0,
-      "learning_rate": 4.2143401983218914e-05,
-      "loss": 0.054,
-      "step": 24840
-    },
-    {
-      "epoch": 90.0,
-      "eval_cer": 0.798989898989899,
-      "eval_loss": 11.434998512268066,
-      "eval_runtime": 6.42,
-      "eval_samples_per_second": 28.037,
-      "eval_steps_per_second": 3.583,
-      "eval_wer": 1.0,
-      "step": 24840
-    },
-    {
-      "epoch": 105.0,
-      "learning_rate": 3.162217137045512e-05,
-      "loss": 0.0402,
-      "step": 28980
-    },
-    {
-      "epoch": 105.0,
-      "eval_cer": 0.7303030303030303,
-      "eval_loss": 12.891875267028809,
-      "eval_runtime": 6.5239,
-      "eval_samples_per_second": 27.591,
-      "eval_steps_per_second": 3.526,
-      "eval_wer": 1.0,
-      "step": 28980
-    },
-    {
-      "epoch": 120.0,
-      "learning_rate": 2.110094075769133e-05,
-      "loss": 0.031,
-      "step": 33120
-    },
-    {
-      "epoch": 120.0,
-      "eval_cer": 0.805050505050505,
-      "eval_loss": 15.067849159240723,
-      "eval_runtime": 6.6085,
-      "eval_samples_per_second": 27.238,
-      "eval_steps_per_second": 3.48,
-      "eval_wer": 1.0,
-      "step": 33120
-    },
-    {
-      "epoch": 135.0,
-      "learning_rate": 1.057716755657259e-05,
-      "loss": 0.0216,
-      "step": 37260
-    },
-    {
-      "epoch": 135.0,
-      "eval_cer": 0.8010101010101011,
-      "eval_loss": 12.422484397888184,
-      "eval_runtime": 6.5214,
-      "eval_samples_per_second": 27.601,
-      "eval_steps_per_second": 3.527,
-      "eval_wer": 0.9944444444444445,
-      "step": 37260
-    },
-    {
-      "epoch": 150.0,
-      "learning_rate": 5.339435545385202e-08,
-      "loss": 0.0159,
-      "step": 41400
-    },
-    {
-      "epoch": 150.0,
-      "eval_cer": 0.8151515151515152,
-      "eval_loss": 13.647612571716309,
-      "eval_runtime": 6.4833,
-      "eval_samples_per_second": 27.764,
-      "eval_steps_per_second": 3.548,
-      "eval_wer": 1.0,
-      "step": 41400
     }
   ],
-  "max_steps": 41400,
-  "num_train_epochs": 150,
-  "total_flos": 3.011933304516902e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "global_step": 828,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 3.0,
+      "learning_rate": 9.482583269768625e-05,
+      "loss": 12.6085,
+      "step": 828
     },
     {
+      "epoch": 3.0,
+      "eval_cer": 1.0,
+      "eval_loss": 3.3823344707489014,
+      "eval_runtime": 6.8797,
+      "eval_samples_per_second": 26.164,
+      "eval_steps_per_second": 3.343,
       "eval_wer": 1.0,
+      "step": 828
     }
   ],
+  "max_steps": 8280,
+  "num_train_epochs": 30,
+  "total_flos": 6.02312311651008e+17,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f0c93b966a3ec522c6f5abd8c27e7e708d3c3929f9378097c6ad88dc644fada0
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:580d7bd32205de9a862dd2a98921bfd07a0cef71b3c04bb533415e04a16ec08b
 size 3387

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:21aa9cb44d5586aa8e48837f4538361d742ca0ba800116a88ff3b4e599c12004
 size 377643361

 version https://git-lfs.github.com/spec/v1
+oid sha256:53c62e616c844d10c3144dcd2038e383c1842e2d5ebfde60fb6bd7c6642d0e98
 size 377643361

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f0c93b966a3ec522c6f5abd8c27e7e708d3c3929f9378097c6ad88dc644fada0
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:580d7bd32205de9a862dd2a98921bfd07a0cef71b3c04bb533415e04a16ec08b
 size 3387