Training in progress, step 11000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:666bd295da5110fc8ed72c097e043b17b68a4f46ec1f780894808ac7d810702a
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:b15938f7058276e6bdfc2fddcc7a120da5e6a0c7c9c19c71e16cb873fc6886b3
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:492b321ad12ae8744ac23f006fa941f8bd7881d2b5e9aecb269dbdaf98b5ee88
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:6bdd501f6153777369e4dc961faa1bf60f1f7535ded5d73c87f2ff06b5aa8064
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aad3fc937f2c6f56a2a6ddd2d655b320e20d5cf3c0672d854ed64624351b0488
-size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:069bc79c0b97b8bebabb6777e867a3617901ff0e79b431f2ba4a791a90815e7f
+size 14639

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0ff19fa2317539f8bfb616fcdefc3caa2efd60d151a696a55bb38626512e9ba9
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b4b38bb567a4c3bd8aafad6c492b89fde494be62ffddc238da23107b19a9945
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1196c99a263cfa6a64b1d73b220e535cc282c309df0a28be120a2a37266e02ba
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:7e9a74567933ed8c342d4d89869156924da4e6db37efcc7105e4c34e754e42a4
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
-  "epoch": 0.34711374917560484,
-  "global_step": 10000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2496,11 +2496,260 @@
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.10322861869805133,
       "step": 10000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
-  "total_flos": 3.39707363328e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
+  "epoch": 0.3818251240931653,
+  "global_step": 11000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.10322861869805133,
       "step": 10000
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.115510204081633e-06,
+      "loss": 0.1827,
+      "step": 10025
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.10530612244898e-06,
+      "loss": 0.1653,
+      "step": 10050
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.095102040816327e-06,
+      "loss": 0.1726,
+      "step": 10075
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.084897959183675e-06,
+      "loss": 0.1569,
+      "step": 10100
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.074693877551021e-06,
+      "loss": 0.1796,
+      "step": 10125
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.064489795918368e-06,
+      "loss": 0.1457,
+      "step": 10150
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.054285714285715e-06,
+      "loss": 0.1797,
+      "step": 10175
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.044081632653061e-06,
+      "loss": 0.1596,
+      "step": 10200
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.033877551020409e-06,
+      "loss": 0.1855,
+      "step": 10225
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 6.023673469387755e-06,
+      "loss": 0.1495,
+      "step": 10250
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 6.013469387755102e-06,
+      "loss": 0.1741,
+      "step": 10275
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 6.0032653061224495e-06,
+      "loss": 0.1859,
+      "step": 10300
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 5.993061224489797e-06,
+      "loss": 0.1874,
+      "step": 10325
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 5.982857142857144e-06,
+      "loss": 0.159,
+      "step": 10350
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 5.97265306122449e-06,
+      "loss": 0.1653,
+      "step": 10375
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 5.962448979591837e-06,
+      "loss": 0.1417,
+      "step": 10400
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 5.952244897959184e-06,
+      "loss": 0.1819,
+      "step": 10425
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 5.942040816326531e-06,
+      "loss": 0.1605,
+      "step": 10450
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 5.931836734693878e-06,
+      "loss": 0.1886,
+      "step": 10475
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 5.921632653061224e-06,
+      "loss": 0.1667,
+      "step": 10500
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.911428571428573e-06,
+      "loss": 0.1765,
+      "step": 10525
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.901224489795919e-06,
+      "loss": 0.1484,
+      "step": 10550
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.891020408163266e-06,
+      "loss": 0.1748,
+      "step": 10575
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.880816326530613e-06,
+      "loss": 0.1514,
+      "step": 10600
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.87061224489796e-06,
+      "loss": 0.191,
+      "step": 10625
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.860408163265307e-06,
+      "loss": 0.154,
+      "step": 10650
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.850204081632653e-06,
+      "loss": 0.1758,
+      "step": 10675
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.84e-06,
+      "loss": 0.1675,
+      "step": 10700
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.829795918367347e-06,
+      "loss": 0.1946,
+      "step": 10725
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.819591836734695e-06,
+      "loss": 0.1563,
+      "step": 10750
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.809387755102042e-06,
+      "loss": 0.177,
+      "step": 10775
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 5.799183673469388e-06,
+      "loss": 0.1467,
+      "step": 10800
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 5.788979591836735e-06,
+      "loss": 0.1677,
+      "step": 10825
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 5.778775510204082e-06,
+      "loss": 0.1638,
+      "step": 10850
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 5.768571428571429e-06,
+      "loss": 0.2078,
+      "step": 10875
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 5.758367346938776e-06,
+      "loss": 0.1474,
+      "step": 10900
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 5.748163265306122e-06,
+      "loss": 0.1758,
+      "step": 10925
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 5.73795918367347e-06,
+      "loss": 0.1453,
+      "step": 10950
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 5.727755102040817e-06,
+      "loss": 0.1806,
+      "step": 10975
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 5.717551020408164e-06,
+      "loss": 0.1457,
+      "step": 11000
+    },
+    {
+      "epoch": 0.38,
+      "eval_loss": 0.17772968113422394,
+      "eval_runtime": 31110.5279,
+      "eval_samples_per_second": 0.998,
+      "eval_steps_per_second": 0.062,
+      "eval_wer": 0.09984380314573199,
+      "step": 11000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
+  "total_flos": 3.736780996608e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:492b321ad12ae8744ac23f006fa941f8bd7881d2b5e9aecb269dbdaf98b5ee88
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:6bdd501f6153777369e4dc961faa1bf60f1f7535ded5d73c87f2ff06b5aa8064
 size 6173655480

runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3649b56169acd2abda9b0ee07a52cc5ff3d90c7e405842df1439d1a6f490683e
-size 70369

 version https://git-lfs.github.com/spec/v1
+oid sha256:9c954f05ee34517b3eb4c4f0da7bbc163f490b1b0ac3836bb3e4f0baf08b45f5
+size 76967