Training in progress, step 3000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +254 -5
pytorch_model.bin +1 -1
runs/Jan28_23-19-38_gpu07.cyverse.org/events.out.tfevents.1674973221.gpu07.cyverse.org.79624.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:46124b4c921f12dd4bf47335e9d76a44f1413ead1fdc2eb7bac5d8c91d14785d
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:28231ed2fa6db3a8ba9dec24805c24d474d5a98e2fc81e01f9dd3ec22fef6617
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5e3bce729d0a5aa88b97e2208db0eac5024f1cb7d8c05fa4291f05c5ffb546b6
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:188ae5e3d4f5fd4f3ea79612ae9050f69c98af92f2396885f41ca19d41d84d28
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6450fb70c9f637c8cf70a85044894a9aa53e7fb40b60415f65080b1848d744f8
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:fedfd6bd95ed17c2f4580cf3014f35b56bcb8755a40fc6136021f6ca87c22803
 size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:73fb9353e9395a668a7a368e6a41451629f20384989decfcc02ea7b20b2db3e5
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:2ada1c4bf7218841e7f1bffbf7fa805df783718f35f0ea75965dbcfe82b6b0a0
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:55371a8ee3a1d4bb4b0f9e4ee704a9718614f62f69f56fa1c068056dd8b6df67
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:90be8dc230b164dd2d5b3c32eb6c2a7edeaf871fd8d5b65aa972b35423500fc7
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 0.42719787333206743,
-  "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-arabic-24h/checkpoint-2000",
-  "epoch": 3.5650623885918002,
-  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -504,11 +504,260 @@
       "eval_steps_per_second": 0.147,
       "eval_wer": 0.42719787333206743,
       "step": 2000
     }
   ],
   "max_steps": 5000,
   "num_train_epochs": 9,
-  "total_flos": 2.122725154885632e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.4207764409383577,
+  "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-arabic-24h/checkpoint-3000",
+  "epoch": 5.347593582887701,
+  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.147,
       "eval_wer": 0.42719787333206743,
       "step": 2000
+    },
+    {
+      "epoch": 3.61,
+      "learning_rate": 6.6222222222222236e-06,
+      "loss": 0.051,
+      "step": 2025
+    },
+    {
+      "epoch": 3.65,
+      "learning_rate": 6.566666666666667e-06,
+      "loss": 0.0552,
+      "step": 2050
+    },
+    {
+      "epoch": 3.7,
+      "learning_rate": 6.511111111111112e-06,
+      "loss": 0.0559,
+      "step": 2075
+    },
+    {
+      "epoch": 3.74,
+      "learning_rate": 6.455555555555556e-06,
+      "loss": 0.0562,
+      "step": 2100
+    },
+    {
+      "epoch": 3.79,
+      "learning_rate": 6.4000000000000006e-06,
+      "loss": 0.0597,
+      "step": 2125
+    },
+    {
+      "epoch": 3.83,
+      "learning_rate": 6.3444444444444454e-06,
+      "loss": 0.0512,
+      "step": 2150
+    },
+    {
+      "epoch": 3.88,
+      "learning_rate": 6.28888888888889e-06,
+      "loss": 0.0533,
+      "step": 2175
+    },
+    {
+      "epoch": 3.92,
+      "learning_rate": 6.2333333333333335e-06,
+      "loss": 0.0545,
+      "step": 2200
+    },
+    {
+      "epoch": 3.97,
+      "learning_rate": 6.177777777777778e-06,
+      "loss": 0.0538,
+      "step": 2225
+    },
+    {
+      "epoch": 4.01,
+      "learning_rate": 6.124444444444445e-06,
+      "loss": 0.05,
+      "step": 2250
+    },
+    {
+      "epoch": 4.06,
+      "learning_rate": 6.06888888888889e-06,
+      "loss": 0.0303,
+      "step": 2275
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 6.013333333333335e-06,
+      "loss": 0.0259,
+      "step": 2300
+    },
+    {
+      "epoch": 4.14,
+      "learning_rate": 5.957777777777778e-06,
+      "loss": 0.0257,
+      "step": 2325
+    },
+    {
+      "epoch": 4.19,
+      "learning_rate": 5.902222222222223e-06,
+      "loss": 0.0303,
+      "step": 2350
+    },
+    {
+      "epoch": 4.23,
+      "learning_rate": 5.846666666666667e-06,
+      "loss": 0.0292,
+      "step": 2375
+    },
+    {
+      "epoch": 4.28,
+      "learning_rate": 5.791111111111112e-06,
+      "loss": 0.0307,
+      "step": 2400
+    },
+    {
+      "epoch": 4.32,
+      "learning_rate": 5.735555555555557e-06,
+      "loss": 0.0274,
+      "step": 2425
+    },
+    {
+      "epoch": 4.37,
+      "learning_rate": 5.68e-06,
+      "loss": 0.0277,
+      "step": 2450
+    },
+    {
+      "epoch": 4.41,
+      "learning_rate": 5.624444444444445e-06,
+      "loss": 0.0277,
+      "step": 2475
+    },
+    {
+      "epoch": 4.46,
+      "learning_rate": 5.56888888888889e-06,
+      "loss": 0.0327,
+      "step": 2500
+    },
+    {
+      "epoch": 4.5,
+      "learning_rate": 5.513333333333334e-06,
+      "loss": 0.0268,
+      "step": 2525
+    },
+    {
+      "epoch": 4.55,
+      "learning_rate": 5.4577777777777785e-06,
+      "loss": 0.0317,
+      "step": 2550
+    },
+    {
+      "epoch": 4.59,
+      "learning_rate": 5.402222222222223e-06,
+      "loss": 0.0289,
+      "step": 2575
+    },
+    {
+      "epoch": 4.63,
+      "learning_rate": 5.346666666666667e-06,
+      "loss": 0.0304,
+      "step": 2600
+    },
+    {
+      "epoch": 4.68,
+      "learning_rate": 5.2911111111111115e-06,
+      "loss": 0.0304,
+      "step": 2625
+    },
+    {
+      "epoch": 4.72,
+      "learning_rate": 5.235555555555556e-06,
+      "loss": 0.0286,
+      "step": 2650
+    },
+    {
+      "epoch": 4.77,
+      "learning_rate": 5.18e-06,
+      "loss": 0.0285,
+      "step": 2675
+    },
+    {
+      "epoch": 4.81,
+      "learning_rate": 5.124444444444445e-06,
+      "loss": 0.0303,
+      "step": 2700
+    },
+    {
+      "epoch": 4.86,
+      "learning_rate": 5.06888888888889e-06,
+      "loss": 0.0281,
+      "step": 2725
+    },
+    {
+      "epoch": 4.9,
+      "learning_rate": 5.013333333333333e-06,
+      "loss": 0.0291,
+      "step": 2750
+    },
+    {
+      "epoch": 4.95,
+      "learning_rate": 4.957777777777778e-06,
+      "loss": 0.0286,
+      "step": 2775
+    },
+    {
+      "epoch": 4.99,
+      "learning_rate": 4.902222222222222e-06,
+      "loss": 0.0298,
+      "step": 2800
+    },
+    {
+      "epoch": 5.04,
+      "learning_rate": 4.846666666666667e-06,
+      "loss": 0.0238,
+      "step": 2825
+    },
+    {
+      "epoch": 5.08,
+      "learning_rate": 4.791111111111111e-06,
+      "loss": 0.0122,
+      "step": 2850
+    },
+    {
+      "epoch": 5.12,
+      "learning_rate": 4.735555555555556e-06,
+      "loss": 0.0148,
+      "step": 2875
+    },
+    {
+      "epoch": 5.17,
+      "learning_rate": 4.680000000000001e-06,
+      "loss": 0.0123,
+      "step": 2900
+    },
+    {
+      "epoch": 5.21,
+      "learning_rate": 4.624444444444445e-06,
+      "loss": 0.0162,
+      "step": 2925
+    },
+    {
+      "epoch": 5.26,
+      "learning_rate": 4.568888888888889e-06,
+      "loss": 0.015,
+      "step": 2950
+    },
+    {
+      "epoch": 5.3,
+      "learning_rate": 4.513333333333333e-06,
+      "loss": 0.0161,
+      "step": 2975
+    },
+    {
+      "epoch": 5.35,
+      "learning_rate": 4.457777777777778e-06,
+      "loss": 0.0125,
+      "step": 3000
+    },
+    {
+      "epoch": 5.35,
+      "eval_loss": 0.2745016813278198,
+      "eval_runtime": 4396.7332,
+      "eval_samples_per_second": 2.374,
+      "eval_steps_per_second": 0.149,
+      "eval_wer": 0.4207764409383577,
+      "step": 3000
     }
   ],
   "max_steps": 5000,
   "num_train_epochs": 9,
+  "total_flos": 3.18401342134272e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5e3bce729d0a5aa88b97e2208db0eac5024f1cb7d8c05fa4291f05c5ffb546b6
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:188ae5e3d4f5fd4f3ea79612ae9050f69c98af92f2396885f41ca19d41d84d28
 size 6173655480

runs/Jan28_23-19-38_gpu07.cyverse.org/events.out.tfevents.1674973221.gpu07.cyverse.org.79624.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:15a4e7be97529d4d330c452ac014f467e347887004f00a52765249d37330791c
-size 17594

 version https://git-lfs.github.com/spec/v1
+oid sha256:4c5e71c8a208596e260a1b1a53ca941ba4612a5a88ad5428422911ad98f8b3d5
+size 24192