Training in progress, step 4000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Jan28_23-42-14_gpu07.cyverse.org/events.out.tfevents.1674974582.gpu07.cyverse.org.94170.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:43b529b6527a55ecb1b2908bd5bb21af352a338f256021a3435cb4e37cb0e7d9
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:cabcd18d745237ccff0ec1f82242c3cf6523964b69f61c6d491e0dcca8c96bd7
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:754a96c8f6aa3da0eed380bf4de66f9ac5838d1ecc89aec3728052ea541b779a
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:6744d734b49bb04f2a83a82c65c40351e020bce2add378d9abffb9d286d369c7
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7a86cb34862aab94736a5ade9f79f8059219434eb9b4a3f6f63ad15faca3b737
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:e9719089c9777993e0b77b3d1ee31f8b1880df71d36ecfa484ab6990dbdfc6a8
 size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0dbbd96826db496f861eb18e5267b27126c9f62d91eb523417dba169a922dd12
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:0f950b784a3ad9098996d53ce7727828e81f8df26d9869581909648eda25b95a
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2c7ac18b548a5f57b43479491efeef75333701321d878addd7822f27ec30f6d9
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:285522fdbcf7692ca0fd2c300f90f1d4ac21d59ac64354db24bfa3599d4d3173
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.7431560204762965,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-japanese-24h/checkpoint-3000",
-  "epoch": 22.900763358778626,
-  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -753,11 +753,260 @@
       "eval_steps_per_second": 0.164,
       "eval_wer": 0.7431560204762965,
       "step": 3000
     }
   ],
   "max_steps": 5000,
   "num_train_epochs": 39,
-  "total_flos": 3.16373713809408e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.7431560204762965,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-japanese-24h/checkpoint-3000",
+  "epoch": 30.53435114503817,
+  "global_step": 4000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.164,
       "eval_wer": 0.7431560204762965,
       "step": 3000
+    },
+    {
+      "epoch": 23.09,
+      "learning_rate": 4.397777777777778e-06,
+      "loss": 0.0002,
+      "step": 3025
+    },
+    {
+      "epoch": 23.28,
+      "learning_rate": 4.3422222222222225e-06,
+      "loss": 0.0002,
+      "step": 3050
+    },
+    {
+      "epoch": 23.47,
+      "learning_rate": 4.2866666666666666e-06,
+      "loss": 0.0002,
+      "step": 3075
+    },
+    {
+      "epoch": 23.66,
+      "learning_rate": 4.2311111111111114e-06,
+      "loss": 0.0002,
+      "step": 3100
+    },
+    {
+      "epoch": 23.85,
+      "learning_rate": 4.175555555555556e-06,
+      "loss": 0.0002,
+      "step": 3125
+    },
+    {
+      "epoch": 24.05,
+      "learning_rate": 4.12e-06,
+      "loss": 0.0002,
+      "step": 3150
+    },
+    {
+      "epoch": 24.24,
+      "learning_rate": 4.064444444444444e-06,
+      "loss": 0.0002,
+      "step": 3175
+    },
+    {
+      "epoch": 24.43,
+      "learning_rate": 4.008888888888889e-06,
+      "loss": 0.0002,
+      "step": 3200
+    },
+    {
+      "epoch": 24.62,
+      "learning_rate": 3.953333333333333e-06,
+      "loss": 0.0002,
+      "step": 3225
+    },
+    {
+      "epoch": 24.81,
+      "learning_rate": 3.897777777777778e-06,
+      "loss": 0.0002,
+      "step": 3250
+    },
+    {
+      "epoch": 25.0,
+      "learning_rate": 3.842222222222223e-06,
+      "loss": 0.0002,
+      "step": 3275
+    },
+    {
+      "epoch": 25.19,
+      "learning_rate": 3.7866666666666667e-06,
+      "loss": 0.0002,
+      "step": 3300
+    },
+    {
+      "epoch": 25.38,
+      "learning_rate": 3.7311111111111116e-06,
+      "loss": 0.0002,
+      "step": 3325
+    },
+    {
+      "epoch": 25.57,
+      "learning_rate": 3.675555555555556e-06,
+      "loss": 0.0002,
+      "step": 3350
+    },
+    {
+      "epoch": 25.76,
+      "learning_rate": 3.62e-06,
+      "loss": 0.0002,
+      "step": 3375
+    },
+    {
+      "epoch": 25.95,
+      "learning_rate": 3.564444444444445e-06,
+      "loss": 0.0002,
+      "step": 3400
+    },
+    {
+      "epoch": 26.15,
+      "learning_rate": 3.508888888888889e-06,
+      "loss": 0.0002,
+      "step": 3425
+    },
+    {
+      "epoch": 26.34,
+      "learning_rate": 3.4533333333333334e-06,
+      "loss": 0.0002,
+      "step": 3450
+    },
+    {
+      "epoch": 26.53,
+      "learning_rate": 3.3977777777777783e-06,
+      "loss": 0.0002,
+      "step": 3475
+    },
+    {
+      "epoch": 26.72,
+      "learning_rate": 3.3422222222222224e-06,
+      "loss": 0.0002,
+      "step": 3500
+    },
+    {
+      "epoch": 26.91,
+      "learning_rate": 3.286666666666667e-06,
+      "loss": 0.0002,
+      "step": 3525
+    },
+    {
+      "epoch": 27.1,
+      "learning_rate": 3.2311111111111117e-06,
+      "loss": 0.0002,
+      "step": 3550
+    },
+    {
+      "epoch": 27.29,
+      "learning_rate": 3.1755555555555557e-06,
+      "loss": 0.0002,
+      "step": 3575
+    },
+    {
+      "epoch": 27.48,
+      "learning_rate": 3.12e-06,
+      "loss": 0.0002,
+      "step": 3600
+    },
+    {
+      "epoch": 27.67,
+      "learning_rate": 3.064444444444445e-06,
+      "loss": 0.0002,
+      "step": 3625
+    },
+    {
+      "epoch": 27.86,
+      "learning_rate": 3.008888888888889e-06,
+      "loss": 0.0002,
+      "step": 3650
+    },
+    {
+      "epoch": 28.05,
+      "learning_rate": 2.9533333333333336e-06,
+      "loss": 0.0002,
+      "step": 3675
+    },
+    {
+      "epoch": 28.24,
+      "learning_rate": 2.8977777777777785e-06,
+      "loss": 0.0002,
+      "step": 3700
+    },
+    {
+      "epoch": 28.44,
+      "learning_rate": 2.8422222222222225e-06,
+      "loss": 0.0002,
+      "step": 3725
+    },
+    {
+      "epoch": 28.63,
+      "learning_rate": 2.786666666666667e-06,
+      "loss": 0.0002,
+      "step": 3750
+    },
+    {
+      "epoch": 28.82,
+      "learning_rate": 2.7311111111111114e-06,
+      "loss": 0.0002,
+      "step": 3775
+    },
+    {
+      "epoch": 29.01,
+      "learning_rate": 2.675555555555556e-06,
+      "loss": 0.0002,
+      "step": 3800
+    },
+    {
+      "epoch": 29.2,
+      "learning_rate": 2.6200000000000003e-06,
+      "loss": 0.0002,
+      "step": 3825
+    },
+    {
+      "epoch": 29.39,
+      "learning_rate": 2.5644444444444444e-06,
+      "loss": 0.0002,
+      "step": 3850
+    },
+    {
+      "epoch": 29.58,
+      "learning_rate": 2.5088888888888892e-06,
+      "loss": 0.0002,
+      "step": 3875
+    },
+    {
+      "epoch": 29.77,
+      "learning_rate": 2.4533333333333333e-06,
+      "loss": 0.0002,
+      "step": 3900
+    },
+    {
+      "epoch": 29.96,
+      "learning_rate": 2.397777777777778e-06,
+      "loss": 0.0002,
+      "step": 3925
+    },
+    {
+      "epoch": 30.15,
+      "learning_rate": 2.342222222222222e-06,
+      "loss": 0.0002,
+      "step": 3950
+    },
+    {
+      "epoch": 30.34,
+      "learning_rate": 2.2866666666666667e-06,
+      "loss": 0.0002,
+      "step": 3975
+    },
+    {
+      "epoch": 30.53,
+      "learning_rate": 2.2311111111111115e-06,
+      "loss": 0.0002,
+      "step": 4000
+    },
+    {
+      "epoch": 30.53,
+      "eval_loss": 0.4122720956802368,
+      "eval_runtime": 1713.6333,
+      "eval_samples_per_second": 2.617,
+      "eval_steps_per_second": 0.164,
+      "eval_wer": 0.7442688626752726,
+      "step": 4000
     }
   ],
   "max_steps": 5000,
   "num_train_epochs": 39,
+  "total_flos": 4.2176792328192e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:754a96c8f6aa3da0eed380bf4de66f9ac5838d1ecc89aec3728052ea541b779a
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:6744d734b49bb04f2a83a82c65c40351e020bce2add378d9abffb9d286d369c7
 size 6173655480

runs/Jan28_23-42-14_gpu07.cyverse.org/events.out.tfevents.1674974582.gpu07.cyverse.org.94170.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b9c793cf7ac753d6045f2e0aff18181a1aa802d07daa76157c9eea31d897ec8e
-size 24198

 version https://git-lfs.github.com/spec/v1
+oid sha256:9e6183fac4cb12f0942d286f36bbc9314f13fcf6e7786a873e26691f74d646f8
+size 30796