Training in progress, step 3000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +255 -5
pytorch_model.bin +1 -1
runs/Aug20_17-07-13_713cba38a708/events.out.tfevents.1692551245.713cba38a708.95.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9345b866ebc9159328815b3ecdcc308b8a2e853a3e173aee675d508068a92b2d
 size 1934161157

 version https://git-lfs.github.com/spec/v1
+oid sha256:145802247f511f2db8a6588be1fa1b29d0b032879310d24beb32ffec60f6d996
 size 1934161157

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65503e2d287eeb93231cc3f6e123f111f05e00b5886775a96c9f0f3234a9cb60
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:4da96b2ae6e5559d7f78e7908472ddf37a9adc97bc0dfa1983148ab68e5b3eb9
 size 967102729

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:def05a477428754b4320528e52a0b3ae385799f784ed0d816af6d7b633b37a5a
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:db1b5c1b07a03db7d365bf63cf3eae9ed5e22033102108fc6ba233d19973a74e
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5cd37dd530bd467817ba99df096031e0ec04862523fd363efae5f40294a6a156
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:f375f0ec2d81d3bc0adbea21cfba80dd771ec303d1e16586405d497868a3b309
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 19.08831908831909,
-  "best_model_checkpoint": "./whisper-small-vivos/checkpoint-2000",
-  "epoch": 2.7434842249657065,
-  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -506,11 +506,261 @@
       "eval_steps_per_second": 0.122,
       "eval_wer": 19.08831908831909,
       "step": 2000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 6,
-  "total_flos": 9.23242412703744e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 17.98756798756799,
+  "best_model_checkpoint": "./whisper-small-vivos/checkpoint-3000",
+  "epoch": 4.11522633744856,
+  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.122,
       "eval_wer": 19.08831908831909,
       "step": 2000
+    },
+    {
+      "epoch": 2.78,
+      "learning_rate": 1e-05,
+      "loss": 0.0816,
+      "step": 2025
+    },
+    {
+      "epoch": 2.81,
+      "learning_rate": 1e-05,
+      "loss": 0.0796,
+      "step": 2050
+    },
+    {
+      "epoch": 2.85,
+      "learning_rate": 1e-05,
+      "loss": 0.0721,
+      "step": 2075
+    },
+    {
+      "epoch": 2.88,
+      "learning_rate": 1e-05,
+      "loss": 0.0716,
+      "step": 2100
+    },
+    {
+      "epoch": 2.91,
+      "learning_rate": 1e-05,
+      "loss": 0.0659,
+      "step": 2125
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 1e-05,
+      "loss": 0.0644,
+      "step": 2150
+    },
+    {
+      "epoch": 2.98,
+      "learning_rate": 1e-05,
+      "loss": 0.0653,
+      "step": 2175
+    },
+    {
+      "epoch": 3.02,
+      "learning_rate": 1e-05,
+      "loss": 0.0558,
+      "step": 2200
+    },
+    {
+      "epoch": 3.05,
+      "learning_rate": 1e-05,
+      "loss": 0.043,
+      "step": 2225
+    },
+    {
+      "epoch": 3.09,
+      "learning_rate": 1e-05,
+      "loss": 0.047,
+      "step": 2250
+    },
+    {
+      "epoch": 3.12,
+      "learning_rate": 1e-05,
+      "loss": 0.0355,
+      "step": 2275
+    },
+    {
+      "epoch": 3.16,
+      "learning_rate": 1e-05,
+      "loss": 0.033,
+      "step": 2300
+    },
+    {
+      "epoch": 3.19,
+      "learning_rate": 1e-05,
+      "loss": 0.0357,
+      "step": 2325
+    },
+    {
+      "epoch": 3.22,
+      "learning_rate": 1e-05,
+      "loss": 0.0364,
+      "step": 2350
+    },
+    {
+      "epoch": 3.26,
+      "learning_rate": 1e-05,
+      "loss": 0.0425,
+      "step": 2375
+    },
+    {
+      "epoch": 3.29,
+      "learning_rate": 1e-05,
+      "loss": 0.0398,
+      "step": 2400
+    },
+    {
+      "epoch": 3.33,
+      "learning_rate": 1e-05,
+      "loss": 0.0376,
+      "step": 2425
+    },
+    {
+      "epoch": 3.36,
+      "learning_rate": 1e-05,
+      "loss": 0.0413,
+      "step": 2450
+    },
+    {
+      "epoch": 3.4,
+      "learning_rate": 1e-05,
+      "loss": 0.0374,
+      "step": 2475
+    },
+    {
+      "epoch": 3.43,
+      "learning_rate": 1e-05,
+      "loss": 0.0383,
+      "step": 2500
+    },
+    {
+      "epoch": 3.46,
+      "learning_rate": 1e-05,
+      "loss": 0.0381,
+      "step": 2525
+    },
+    {
+      "epoch": 3.5,
+      "learning_rate": 1e-05,
+      "loss": 0.0466,
+      "step": 2550
+    },
+    {
+      "epoch": 3.53,
+      "learning_rate": 1e-05,
+      "loss": 0.04,
+      "step": 2575
+    },
+    {
+      "epoch": 3.57,
+      "learning_rate": 1e-05,
+      "loss": 0.0452,
+      "step": 2600
+    },
+    {
+      "epoch": 3.6,
+      "learning_rate": 1e-05,
+      "loss": 0.0393,
+      "step": 2625
+    },
+    {
+      "epoch": 3.64,
+      "learning_rate": 1e-05,
+      "loss": 0.0461,
+      "step": 2650
+    },
+    {
+      "epoch": 3.67,
+      "learning_rate": 1e-05,
+      "loss": 0.0403,
+      "step": 2675
+    },
+    {
+      "epoch": 3.7,
+      "learning_rate": 1e-05,
+      "loss": 0.0489,
+      "step": 2700
+    },
+    {
+      "epoch": 3.74,
+      "learning_rate": 1e-05,
+      "loss": 0.0418,
+      "step": 2725
+    },
+    {
+      "epoch": 3.77,
+      "learning_rate": 1e-05,
+      "loss": 0.0389,
+      "step": 2750
+    },
+    {
+      "epoch": 3.81,
+      "learning_rate": 1e-05,
+      "loss": 0.041,
+      "step": 2775
+    },
+    {
+      "epoch": 3.84,
+      "learning_rate": 1e-05,
+      "loss": 0.0394,
+      "step": 2800
+    },
+    {
+      "epoch": 3.88,
+      "learning_rate": 1e-05,
+      "loss": 0.0485,
+      "step": 2825
+    },
+    {
+      "epoch": 3.91,
+      "learning_rate": 1e-05,
+      "loss": 0.0416,
+      "step": 2850
+    },
+    {
+      "epoch": 3.94,
+      "learning_rate": 1e-05,
+      "loss": 0.0501,
+      "step": 2875
+    },
+    {
+      "epoch": 3.98,
+      "learning_rate": 1e-05,
+      "loss": 0.0393,
+      "step": 2900
+    },
+    {
+      "epoch": 4.01,
+      "learning_rate": 1e-05,
+      "loss": 0.0306,
+      "step": 2925
+    },
+    {
+      "epoch": 4.05,
+      "learning_rate": 1e-05,
+      "loss": 0.0265,
+      "step": 2950
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 1e-05,
+      "loss": 0.0223,
+      "step": 2975
+    },
+    {
+      "epoch": 4.12,
+      "learning_rate": 1e-05,
+      "loss": 0.0215,
+      "step": 3000
+    },
+    {
+      "epoch": 4.12,
+      "eval_cer": 7.079429983827164,
+      "eval_loss": 0.24198034405708313,
+      "eval_runtime": 393.3959,
+      "eval_samples_per_second": 1.932,
+      "eval_steps_per_second": 0.122,
+      "eval_wer": 17.98756798756799,
+      "step": 3000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 6,
+  "total_flos": 1.384748184895488e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65503e2d287eeb93231cc3f6e123f111f05e00b5886775a96c9f0f3234a9cb60
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:4da96b2ae6e5559d7f78e7908472ddf37a9adc97bc0dfa1983148ab68e5b3eb9
 size 967102729

runs/Aug20_17-07-13_713cba38a708/events.out.tfevents.1692551245.713cba38a708.95.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7badd4eee194eccbbca23d4b453d756dca52d0772c6e2718bb059f9da62b8d29
-size 19119

 version https://git-lfs.github.com/spec/v1
+oid sha256:667db5d350222a235eac237786b548d21eb5511ddfd0c40292cd8517321f5b71
+size 25764