Training in progress, step 2000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +255 -5
pytorch_model.bin +1 -1
runs/Aug20_17-07-13_713cba38a708/events.out.tfevents.1692551245.713cba38a708.95.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c5a0364b80d7da28a472b485617d9fd03601e396d96c284dde0cf058c312d114
 size 1934161157

 version https://git-lfs.github.com/spec/v1
+oid sha256:9345b866ebc9159328815b3ecdcc308b8a2e853a3e173aee675d508068a92b2d
 size 1934161157

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:383ebae7d6ef21ae47fd894b8df9f65cfb2f7f9d22e0541de8b6117cf1dea24f
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:65503e2d287eeb93231cc3f6e123f111f05e00b5886775a96c9f0f3234a9cb60
 size 967102729

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a414e764969027db59f536475e679fa837f5cf868456c551dece078e20eb451
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:def05a477428754b4320528e52a0b3ae385799f784ed0d816af6d7b633b37a5a
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:59963924066510fdace06e40de705170e7801273e45f984c4330d09d2783e55d
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:5cd37dd530bd467817ba99df096031e0ec04862523fd363efae5f40294a6a156
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 20.616420616420616,
-  "best_model_checkpoint": "./whisper-small-vivos/checkpoint-1000",
-  "epoch": 1.3717421124828533,
-  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -256,11 +256,261 @@
       "eval_steps_per_second": 0.122,
       "eval_wer": 20.616420616420616,
       "step": 1000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 6,
-  "total_flos": 4.61621206351872e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 19.08831908831909,
+  "best_model_checkpoint": "./whisper-small-vivos/checkpoint-2000",
+  "epoch": 2.7434842249657065,
+  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.122,
       "eval_wer": 20.616420616420616,
       "step": 1000
+    },
+    {
+      "epoch": 1.41,
+      "learning_rate": 1e-05,
+      "loss": 0.1184,
+      "step": 1025
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 1e-05,
+      "loss": 0.125,
+      "step": 1050
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 1e-05,
+      "loss": 0.1163,
+      "step": 1075
+    },
+    {
+      "epoch": 1.51,
+      "learning_rate": 1e-05,
+      "loss": 0.1263,
+      "step": 1100
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 1e-05,
+      "loss": 0.1129,
+      "step": 1125
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 1e-05,
+      "loss": 0.1199,
+      "step": 1150
+    },
+    {
+      "epoch": 1.61,
+      "learning_rate": 1e-05,
+      "loss": 0.1231,
+      "step": 1175
+    },
+    {
+      "epoch": 1.65,
+      "learning_rate": 1e-05,
+      "loss": 0.1195,
+      "step": 1200
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 1e-05,
+      "loss": 0.1145,
+      "step": 1225
+    },
+    {
+      "epoch": 1.71,
+      "learning_rate": 1e-05,
+      "loss": 0.1115,
+      "step": 1250
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 1e-05,
+      "loss": 0.117,
+      "step": 1275
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 1e-05,
+      "loss": 0.1089,
+      "step": 1300
+    },
+    {
+      "epoch": 1.82,
+      "learning_rate": 1e-05,
+      "loss": 0.1143,
+      "step": 1325
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 1e-05,
+      "loss": 0.1195,
+      "step": 1350
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 1e-05,
+      "loss": 0.1137,
+      "step": 1375
+    },
+    {
+      "epoch": 1.92,
+      "learning_rate": 1e-05,
+      "loss": 0.1142,
+      "step": 1400
+    },
+    {
+      "epoch": 1.95,
+      "learning_rate": 1e-05,
+      "loss": 0.1022,
+      "step": 1425
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 1e-05,
+      "loss": 0.1,
+      "step": 1450
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 1e-05,
+      "loss": 0.0854,
+      "step": 1475
+    },
+    {
+      "epoch": 2.06,
+      "learning_rate": 1e-05,
+      "loss": 0.0707,
+      "step": 1500
+    },
+    {
+      "epoch": 2.09,
+      "learning_rate": 1e-05,
+      "loss": 0.0702,
+      "step": 1525
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 1e-05,
+      "loss": 0.0647,
+      "step": 1550
+    },
+    {
+      "epoch": 2.16,
+      "learning_rate": 1e-05,
+      "loss": 0.0713,
+      "step": 1575
+    },
+    {
+      "epoch": 2.19,
+      "learning_rate": 1e-05,
+      "loss": 0.0627,
+      "step": 1600
+    },
+    {
+      "epoch": 2.23,
+      "learning_rate": 1e-05,
+      "loss": 0.0678,
+      "step": 1625
+    },
+    {
+      "epoch": 2.26,
+      "learning_rate": 1e-05,
+      "loss": 0.0667,
+      "step": 1650
+    },
+    {
+      "epoch": 2.3,
+      "learning_rate": 1e-05,
+      "loss": 0.0795,
+      "step": 1675
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 1e-05,
+      "loss": 0.0608,
+      "step": 1700
+    },
+    {
+      "epoch": 2.37,
+      "learning_rate": 1e-05,
+      "loss": 0.0642,
+      "step": 1725
+    },
+    {
+      "epoch": 2.4,
+      "learning_rate": 1e-05,
+      "loss": 0.0684,
+      "step": 1750
+    },
+    {
+      "epoch": 2.43,
+      "learning_rate": 1e-05,
+      "loss": 0.0676,
+      "step": 1775
+    },
+    {
+      "epoch": 2.47,
+      "learning_rate": 1e-05,
+      "loss": 0.0743,
+      "step": 1800
+    },
+    {
+      "epoch": 2.5,
+      "learning_rate": 1e-05,
+      "loss": 0.0713,
+      "step": 1825
+    },
+    {
+      "epoch": 2.54,
+      "learning_rate": 1e-05,
+      "loss": 0.062,
+      "step": 1850
+    },
+    {
+      "epoch": 2.57,
+      "learning_rate": 1e-05,
+      "loss": 0.0678,
+      "step": 1875
+    },
+    {
+      "epoch": 2.61,
+      "learning_rate": 1e-05,
+      "loss": 0.0668,
+      "step": 1900
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 1e-05,
+      "loss": 0.0739,
+      "step": 1925
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 1e-05,
+      "loss": 0.0672,
+      "step": 1950
+    },
+    {
+      "epoch": 2.71,
+      "learning_rate": 1e-05,
+      "loss": 0.0653,
+      "step": 1975
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 1e-05,
+      "loss": 0.0696,
+      "step": 2000
+    },
+    {
+      "epoch": 2.74,
+      "eval_cer": 7.509688444051142,
+      "eval_loss": 0.217300683259964,
+      "eval_runtime": 392.9774,
+      "eval_samples_per_second": 1.934,
+      "eval_steps_per_second": 0.122,
+      "eval_wer": 19.08831908831909,
+      "step": 2000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 6,
+  "total_flos": 9.23242412703744e+18,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:383ebae7d6ef21ae47fd894b8df9f65cfb2f7f9d22e0541de8b6117cf1dea24f
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:65503e2d287eeb93231cc3f6e123f111f05e00b5886775a96c9f0f3234a9cb60
 size 967102729

runs/Aug20_17-07-13_713cba38a708/events.out.tfevents.1692551245.713cba38a708.95.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d21c93fc97b39bff9f20d4451035bbdf4c8cff4a82b54050f17d54a5a22c4597
-size 12474

 version https://git-lfs.github.com/spec/v1
+oid sha256:7badd4eee194eccbbca23d4b453d756dca52d0772c6e2718bb059f9da62b8d29
+size 19119