Training in progress, step 4000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +255 -5
pytorch_model.bin +1 -1
runs/Aug20_17-07-13_713cba38a708/events.out.tfevents.1692551245.713cba38a708.95.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:145802247f511f2db8a6588be1fa1b29d0b032879310d24beb32ffec60f6d996
 size 1934161157

 version https://git-lfs.github.com/spec/v1
+oid sha256:d2eeaa3e0dd9026beaf9e1275fc1de9ebf175e2cdcb2016072c06c0f3625fab9
 size 1934161157

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4da96b2ae6e5559d7f78e7908472ddf37a9adc97bc0dfa1983148ab68e5b3eb9
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:0529397fb768bff68c9e2f5a80dadfcde0b2f3be588cb77e11b29df524c2ac23
 size 967102729

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db1b5c1b07a03db7d365bf63cf3eae9ed5e22033102108fc6ba233d19973a74e
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:bb08efb4868a5313ffdecb076fda7bef23ca071e8b0db9ad3e0f977f931a25bb
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f375f0ec2d81d3bc0adbea21cfba80dd771ec303d1e16586405d497868a3b309
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:c05c5f02f34690b6cdc36257cc6f4b53027dee7ea004e5e07023153262401341
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 17.98756798756799,
-  "best_model_checkpoint": "./whisper-small-vivos/checkpoint-3000",
-  "epoch": 4.11522633744856,
-  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -756,11 +756,261 @@
       "eval_steps_per_second": 0.122,
       "eval_wer": 17.98756798756799,
       "step": 3000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 6,
-  "total_flos": 1.384748184895488e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 17.63791763791764,
+  "best_model_checkpoint": "./whisper-small-vivos/checkpoint-4000",
+  "epoch": 5.486968449931413,
+  "global_step": 4000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.122,
       "eval_wer": 17.98756798756799,
       "step": 3000
+    },
+    {
+      "epoch": 4.15,
+      "learning_rate": 1e-05,
+      "loss": 0.0289,
+      "step": 3025
+    },
+    {
+      "epoch": 4.18,
+      "learning_rate": 1e-05,
+      "loss": 0.0226,
+      "step": 3050
+    },
+    {
+      "epoch": 4.22,
+      "learning_rate": 1e-05,
+      "loss": 0.0204,
+      "step": 3075
+    },
+    {
+      "epoch": 4.25,
+      "learning_rate": 1e-05,
+      "loss": 0.0213,
+      "step": 3100
+    },
+    {
+      "epoch": 4.29,
+      "learning_rate": 1e-05,
+      "loss": 0.0223,
+      "step": 3125
+    },
+    {
+      "epoch": 4.32,
+      "learning_rate": 1e-05,
+      "loss": 0.0259,
+      "step": 3150
+    },
+    {
+      "epoch": 4.36,
+      "learning_rate": 1e-05,
+      "loss": 0.0207,
+      "step": 3175
+    },
+    {
+      "epoch": 4.39,
+      "learning_rate": 1e-05,
+      "loss": 0.0235,
+      "step": 3200
+    },
+    {
+      "epoch": 4.42,
+      "learning_rate": 1e-05,
+      "loss": 0.0216,
+      "step": 3225
+    },
+    {
+      "epoch": 4.46,
+      "learning_rate": 1e-05,
+      "loss": 0.0209,
+      "step": 3250
+    },
+    {
+      "epoch": 4.49,
+      "learning_rate": 1e-05,
+      "loss": 0.0233,
+      "step": 3275
+    },
+    {
+      "epoch": 4.53,
+      "learning_rate": 1e-05,
+      "loss": 0.028,
+      "step": 3300
+    },
+    {
+      "epoch": 4.56,
+      "learning_rate": 1e-05,
+      "loss": 0.0283,
+      "step": 3325
+    },
+    {
+      "epoch": 4.6,
+      "learning_rate": 1e-05,
+      "loss": 0.0256,
+      "step": 3350
+    },
+    {
+      "epoch": 4.63,
+      "learning_rate": 1e-05,
+      "loss": 0.0238,
+      "step": 3375
+    },
+    {
+      "epoch": 4.66,
+      "learning_rate": 1e-05,
+      "loss": 0.0255,
+      "step": 3400
+    },
+    {
+      "epoch": 4.7,
+      "learning_rate": 1e-05,
+      "loss": 0.0236,
+      "step": 3425
+    },
+    {
+      "epoch": 4.73,
+      "learning_rate": 1e-05,
+      "loss": 0.0244,
+      "step": 3450
+    },
+    {
+      "epoch": 4.77,
+      "learning_rate": 1e-05,
+      "loss": 0.0342,
+      "step": 3475
+    },
+    {
+      "epoch": 4.8,
+      "learning_rate": 1e-05,
+      "loss": 0.022,
+      "step": 3500
+    },
+    {
+      "epoch": 4.84,
+      "learning_rate": 1e-05,
+      "loss": 0.0231,
+      "step": 3525
+    },
+    {
+      "epoch": 4.87,
+      "learning_rate": 1e-05,
+      "loss": 0.024,
+      "step": 3550
+    },
+    {
+      "epoch": 4.9,
+      "learning_rate": 1e-05,
+      "loss": 0.0275,
+      "step": 3575
+    },
+    {
+      "epoch": 4.94,
+      "learning_rate": 1e-05,
+      "loss": 0.0264,
+      "step": 3600
+    },
+    {
+      "epoch": 4.97,
+      "learning_rate": 1e-05,
+      "loss": 0.0285,
+      "step": 3625
+    },
+    {
+      "epoch": 5.01,
+      "learning_rate": 1e-05,
+      "loss": 0.0199,
+      "step": 3650
+    },
+    {
+      "epoch": 5.04,
+      "learning_rate": 1e-05,
+      "loss": 0.0177,
+      "step": 3675
+    },
+    {
+      "epoch": 5.08,
+      "learning_rate": 1e-05,
+      "loss": 0.0154,
+      "step": 3700
+    },
+    {
+      "epoch": 5.11,
+      "learning_rate": 1e-05,
+      "loss": 0.0126,
+      "step": 3725
+    },
+    {
+      "epoch": 5.14,
+      "learning_rate": 1e-05,
+      "loss": 0.0118,
+      "step": 3750
+    },
+    {
+      "epoch": 5.18,
+      "learning_rate": 1e-05,
+      "loss": 0.0129,
+      "step": 3775
+    },
+    {
+      "epoch": 5.21,
+      "learning_rate": 1e-05,
+      "loss": 0.0141,
+      "step": 3800
+    },
+    {
+      "epoch": 5.25,
+      "learning_rate": 1e-05,
+      "loss": 0.0144,
+      "step": 3825
+    },
+    {
+      "epoch": 5.28,
+      "learning_rate": 1e-05,
+      "loss": 0.0135,
+      "step": 3850
+    },
+    {
+      "epoch": 5.32,
+      "learning_rate": 1e-05,
+      "loss": 0.0185,
+      "step": 3875
+    },
+    {
+      "epoch": 5.35,
+      "learning_rate": 1e-05,
+      "loss": 0.0137,
+      "step": 3900
+    },
+    {
+      "epoch": 5.38,
+      "learning_rate": 1e-05,
+      "loss": 0.0129,
+      "step": 3925
+    },
+    {
+      "epoch": 5.42,
+      "learning_rate": 1e-05,
+      "loss": 0.015,
+      "step": 3950
+    },
+    {
+      "epoch": 5.45,
+      "learning_rate": 1e-05,
+      "loss": 0.0128,
+      "step": 3975
+    },
+    {
+      "epoch": 5.49,
+      "learning_rate": 1e-05,
+      "loss": 0.0199,
+      "step": 4000
+    },
+    {
+      "epoch": 5.49,
+      "eval_cer": 7.027554850324982,
+      "eval_loss": 0.25804632902145386,
+      "eval_runtime": 394.0647,
+      "eval_samples_per_second": 1.929,
+      "eval_steps_per_second": 0.122,
+      "eval_wer": 17.63791763791764,
+      "step": 4000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 6,
+  "total_flos": 1.84636939124736e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4da96b2ae6e5559d7f78e7908472ddf37a9adc97bc0dfa1983148ab68e5b3eb9
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:0529397fb768bff68c9e2f5a80dadfcde0b2f3be588cb77e11b29df524c2ac23
 size 967102729

runs/Aug20_17-07-13_713cba38a708/events.out.tfevents.1692551245.713cba38a708.95.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:667db5d350222a235eac237786b548d21eb5511ddfd0c40292cd8517321f5b71
-size 25764

 version https://git-lfs.github.com/spec/v1
+oid sha256:87cfbca740150fa86fac7e75b3663363867462c93653210ab71be000e23ad764
+size 32409