Training in progress, step 3000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +255 -5
pytorch_model.bin +1 -1
runs/Aug17_16-46-37_8582233f681d/events.out.tfevents.1692290809.8582233f681d.216.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:681a60ed57add5fb21363a44a2f5591041a0fe5d518d5c483aa0636c868c46a7
 size 1934161157

 version https://git-lfs.github.com/spec/v1
+oid sha256:4a64142a477ac995752a5a07600ba81b284532e8e4d4037e38e0f8eb87ad0740
 size 1934161157

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f9dd712d07b073f0caf4eec287bd0224534565171a49c28cbf3ca0b4b9b7cb98
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:2b5e8a23f34e7b9601f22dcc073ac75de81211e5c61813bbbd64f9c96d30afbd
 size 967102729

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1ff2483baa43e96dd429264d4ff11728434987ac928368cb400847576898fcc7
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:ac80e31889643159eab6698b68e325c45c28c5fc3ac3d7375688097866a7d5e9
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9536b63cd02db26062d122a42fc284c452283fd0cb8cc2a36d3aee25ee14708d
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:7714285e54100d4ac40dc418b750401bda88dd754c30602720da851473b84959
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 111.96070726915521,
-  "best_model_checkpoint": "./whisper-vietnamese-3/checkpoint-2000",
-  "epoch": 14.388489208633093,
-  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -506,11 +506,261 @@
       "eval_steps_per_second": 0.125,
       "eval_wer": 111.96070726915521,
       "step": 2000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 29,
-  "total_flos": 9.20645144100864e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 109.13163064833007,
+  "best_model_checkpoint": "./whisper-vietnamese-3/checkpoint-3000",
+  "epoch": 21.58273381294964,
+  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.125,
       "eval_wer": 111.96070726915521,
       "step": 2000
+    },
+    {
+      "epoch": 14.57,
+      "learning_rate": 5.6485714285714285e-06,
+      "loss": 0.0027,
+      "step": 2025
+    },
+    {
+      "epoch": 14.75,
+      "learning_rate": 5.5771428571428575e-06,
+      "loss": 0.0024,
+      "step": 2050
+    },
+    {
+      "epoch": 14.93,
+      "learning_rate": 5.5057142857142865e-06,
+      "loss": 0.0029,
+      "step": 2075
+    },
+    {
+      "epoch": 15.11,
+      "learning_rate": 5.4342857142857155e-06,
+      "loss": 0.0016,
+      "step": 2100
+    },
+    {
+      "epoch": 15.29,
+      "learning_rate": 5.362857142857143e-06,
+      "loss": 0.0018,
+      "step": 2125
+    },
+    {
+      "epoch": 15.47,
+      "learning_rate": 5.291428571428572e-06,
+      "loss": 0.0018,
+      "step": 2150
+    },
+    {
+      "epoch": 15.65,
+      "learning_rate": 5.220000000000001e-06,
+      "loss": 0.0027,
+      "step": 2175
+    },
+    {
+      "epoch": 15.83,
+      "learning_rate": 5.14857142857143e-06,
+      "loss": 0.0015,
+      "step": 2200
+    },
+    {
+      "epoch": 16.01,
+      "learning_rate": 5.077142857142857e-06,
+      "loss": 0.0016,
+      "step": 2225
+    },
+    {
+      "epoch": 16.19,
+      "learning_rate": 5.005714285714286e-06,
+      "loss": 0.0013,
+      "step": 2250
+    },
+    {
+      "epoch": 16.37,
+      "learning_rate": 4.934285714285715e-06,
+      "loss": 0.002,
+      "step": 2275
+    },
+    {
+      "epoch": 16.55,
+      "learning_rate": 4.862857142857143e-06,
+      "loss": 0.0019,
+      "step": 2300
+    },
+    {
+      "epoch": 16.73,
+      "learning_rate": 4.7914285714285715e-06,
+      "loss": 0.0013,
+      "step": 2325
+    },
+    {
+      "epoch": 16.91,
+      "learning_rate": 4.7200000000000005e-06,
+      "loss": 0.0017,
+      "step": 2350
+    },
+    {
+      "epoch": 17.09,
+      "learning_rate": 4.648571428571429e-06,
+      "loss": 0.0015,
+      "step": 2375
+    },
+    {
+      "epoch": 17.27,
+      "learning_rate": 4.577142857142858e-06,
+      "loss": 0.0013,
+      "step": 2400
+    },
+    {
+      "epoch": 17.45,
+      "learning_rate": 4.505714285714286e-06,
+      "loss": 0.0017,
+      "step": 2425
+    },
+    {
+      "epoch": 17.63,
+      "learning_rate": 4.434285714285715e-06,
+      "loss": 0.0019,
+      "step": 2450
+    },
+    {
+      "epoch": 17.81,
+      "learning_rate": 4.362857142857143e-06,
+      "loss": 0.002,
+      "step": 2475
+    },
+    {
+      "epoch": 17.99,
+      "learning_rate": 4.291428571428572e-06,
+      "loss": 0.0017,
+      "step": 2500
+    },
+    {
+      "epoch": 18.17,
+      "learning_rate": 4.22e-06,
+      "loss": 0.001,
+      "step": 2525
+    },
+    {
+      "epoch": 18.35,
+      "learning_rate": 4.148571428571429e-06,
+      "loss": 0.0009,
+      "step": 2550
+    },
+    {
+      "epoch": 18.53,
+      "learning_rate": 4.0771428571428574e-06,
+      "loss": 0.0012,
+      "step": 2575
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 4.0057142857142864e-06,
+      "loss": 0.0016,
+      "step": 2600
+    },
+    {
+      "epoch": 18.88,
+      "learning_rate": 3.934285714285715e-06,
+      "loss": 0.0018,
+      "step": 2625
+    },
+    {
+      "epoch": 19.06,
+      "learning_rate": 3.862857142857143e-06,
+      "loss": 0.0014,
+      "step": 2650
+    },
+    {
+      "epoch": 19.24,
+      "learning_rate": 3.7914285714285722e-06,
+      "loss": 0.0012,
+      "step": 2675
+    },
+    {
+      "epoch": 19.42,
+      "learning_rate": 3.7200000000000004e-06,
+      "loss": 0.001,
+      "step": 2700
+    },
+    {
+      "epoch": 19.6,
+      "learning_rate": 3.648571428571429e-06,
+      "loss": 0.0014,
+      "step": 2725
+    },
+    {
+      "epoch": 19.78,
+      "learning_rate": 3.5771428571428576e-06,
+      "loss": 0.0013,
+      "step": 2750
+    },
+    {
+      "epoch": 19.96,
+      "learning_rate": 3.505714285714286e-06,
+      "loss": 0.0009,
+      "step": 2775
+    },
+    {
+      "epoch": 20.14,
+      "learning_rate": 3.4342857142857143e-06,
+      "loss": 0.0008,
+      "step": 2800
+    },
+    {
+      "epoch": 20.32,
+      "learning_rate": 3.3628571428571433e-06,
+      "loss": 0.0016,
+      "step": 2825
+    },
+    {
+      "epoch": 20.5,
+      "learning_rate": 3.2914285714285715e-06,
+      "loss": 0.0008,
+      "step": 2850
+    },
+    {
+      "epoch": 20.68,
+      "learning_rate": 3.2200000000000005e-06,
+      "loss": 0.0014,
+      "step": 2875
+    },
+    {
+      "epoch": 20.86,
+      "learning_rate": 3.1485714285714287e-06,
+      "loss": 0.001,
+      "step": 2900
+    },
+    {
+      "epoch": 21.04,
+      "learning_rate": 3.0771428571428573e-06,
+      "loss": 0.0009,
+      "step": 2925
+    },
+    {
+      "epoch": 21.22,
+      "learning_rate": 3.005714285714286e-06,
+      "loss": 0.0007,
+      "step": 2950
+    },
+    {
+      "epoch": 21.4,
+      "learning_rate": 2.9342857142857144e-06,
+      "loss": 0.0011,
+      "step": 2975
+    },
+    {
+      "epoch": 21.58,
+      "learning_rate": 2.8628571428571435e-06,
+      "loss": 0.0009,
+      "step": 3000
+    },
+    {
+      "epoch": 21.58,
+      "eval_cer": 101.53081033112092,
+      "eval_loss": 0.6016765236854553,
+      "eval_runtime": 253.4179,
+      "eval_samples_per_second": 0.975,
+      "eval_steps_per_second": 0.122,
+      "eval_wer": 109.13163064833007,
+      "step": 3000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 29,
+  "total_flos": 1.380967716151296e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f9dd712d07b073f0caf4eec287bd0224534565171a49c28cbf3ca0b4b9b7cb98
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:2b5e8a23f34e7b9601f22dcc073ac75de81211e5c61813bbbd64f9c96d30afbd
 size 967102729

runs/Aug17_16-46-37_8582233f681d/events.out.tfevents.1692290809.8582233f681d.216.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:181579ae0c49e470dcaaaddd157e87cc76dad37db6713ce767a401b7c6770256
-size 18176

 version https://git-lfs.github.com/spec/v1
+oid sha256:6c280ec21aa54cf98fe2a2c7712a454106a1a24645c93578c704ad15b98de349
+size 24821