Training in progress, step 4000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Apr09_14-45-21_gpu07.cyverse.org/events.out.tfevents.1681076808.gpu07.cyverse.org.48142.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5d663f5f146d9e8f297bc578554bd7042672ed6047e1f155a177a7a2f277f077
 size 2524414853

 version https://git-lfs.github.com/spec/v1
+oid sha256:27258b0c1d06a9b5e61d8f927d63726deb3b0f232f363bb381e6603a2e047efd
 size 2524414853

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5258a25b9c74c3d9d5b375fb7669f896562d55ca5085300312146eb59f59737e
 size 1262229869

 version https://git-lfs.github.com/spec/v1
+oid sha256:bb9bb8d82c12f7963f345a3bc44171138b5cd9c15813fe124d03c8957cb8aa3d
 size 1262229869

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cfa739ad5003b32689d1be9cfc41058f1ee1620e0b3d1c54f70c056c125f5219
-size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:dc101980f72fb94e34cbe7f2fcca59c7772750d7ccf19bcd551759aee050f696
+size 14639

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:52b81cce263ca1a87119e3db86ee6c4352a4b53f0c600c4f6eca5921e2e70890
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:4eb4748670085a8091d197542279b737c13c5a3f63f48bc90750499483c77941
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.0693531029534856,
   "best_model_checkpoint": "./wav2vec2-xls-r-300m-ar/checkpoint-3000",
-  "epoch": 26.548672566371682,
-  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -753,11 +753,260 @@
       "eval_steps_per_second": 1.197,
       "eval_wer": 0.0693531029534856,
       "step": 3000
     }
   ],
   "max_steps": 10000,
   "num_train_epochs": 89,
-  "total_flos": 1.1850399847250571e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.0693531029534856,
   "best_model_checkpoint": "./wav2vec2-xls-r-300m-ar/checkpoint-3000",
+  "epoch": 35.39823008849557,
+  "global_step": 4000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 1.197,
       "eval_wer": 0.0693531029534856,
       "step": 3000
+    },
+    {
+      "epoch": 26.77,
+      "learning_rate": 0.0002202631578947368,
+      "loss": 0.0238,
+      "step": 3025
+    },
+    {
+      "epoch": 26.99,
+      "learning_rate": 0.00021947368421052632,
+      "loss": 0.0226,
+      "step": 3050
+    },
+    {
+      "epoch": 27.21,
+      "learning_rate": 0.00021868421052631578,
+      "loss": 0.0255,
+      "step": 3075
+    },
+    {
+      "epoch": 27.43,
+      "learning_rate": 0.00021789473684210526,
+      "loss": 0.0326,
+      "step": 3100
+    },
+    {
+      "epoch": 27.65,
+      "learning_rate": 0.00021710526315789472,
+      "loss": 0.0629,
+      "step": 3125
+    },
+    {
+      "epoch": 27.88,
+      "learning_rate": 0.0002163157894736842,
+      "loss": 0.0348,
+      "step": 3150
+    },
+    {
+      "epoch": 28.1,
+      "learning_rate": 0.00021552631578947368,
+      "loss": 0.0311,
+      "step": 3175
+    },
+    {
+      "epoch": 28.32,
+      "learning_rate": 0.00021473684210526314,
+      "loss": 0.023,
+      "step": 3200
+    },
+    {
+      "epoch": 28.54,
+      "learning_rate": 0.00021394736842105262,
+      "loss": 0.0214,
+      "step": 3225
+    },
+    {
+      "epoch": 28.76,
+      "learning_rate": 0.00021315789473684208,
+      "loss": 0.0201,
+      "step": 3250
+    },
+    {
+      "epoch": 28.98,
+      "learning_rate": 0.00021236842105263156,
+      "loss": 0.0202,
+      "step": 3275
+    },
+    {
+      "epoch": 29.2,
+      "learning_rate": 0.00021157894736842102,
+      "loss": 0.0231,
+      "step": 3300
+    },
+    {
+      "epoch": 29.42,
+      "learning_rate": 0.0002107894736842105,
+      "loss": 0.0291,
+      "step": 3325
+    },
+    {
+      "epoch": 29.65,
+      "learning_rate": 0.00020999999999999998,
+      "loss": 0.0241,
+      "step": 3350
+    },
+    {
+      "epoch": 29.87,
+      "learning_rate": 0.00020921052631578944,
+      "loss": 0.0261,
+      "step": 3375
+    },
+    {
+      "epoch": 30.09,
+      "learning_rate": 0.00020842105263157895,
+      "loss": 0.0281,
+      "step": 3400
+    },
+    {
+      "epoch": 30.31,
+      "learning_rate": 0.0002076315789473684,
+      "loss": 0.0237,
+      "step": 3425
+    },
+    {
+      "epoch": 30.53,
+      "learning_rate": 0.0002068421052631579,
+      "loss": 0.0199,
+      "step": 3450
+    },
+    {
+      "epoch": 30.75,
+      "learning_rate": 0.00020605263157894737,
+      "loss": 0.0199,
+      "step": 3475
+    },
+    {
+      "epoch": 30.97,
+      "learning_rate": 0.00020526315789473683,
+      "loss": 0.0207,
+      "step": 3500
+    },
+    {
+      "epoch": 31.19,
+      "learning_rate": 0.0002044736842105263,
+      "loss": 0.0221,
+      "step": 3525
+    },
+    {
+      "epoch": 31.42,
+      "learning_rate": 0.00020368421052631576,
+      "loss": 0.0234,
+      "step": 3550
+    },
+    {
+      "epoch": 31.64,
+      "learning_rate": 0.00020289473684210525,
+      "loss": 0.025,
+      "step": 3575
+    },
+    {
+      "epoch": 31.86,
+      "learning_rate": 0.0002021052631578947,
+      "loss": 0.0251,
+      "step": 3600
+    },
+    {
+      "epoch": 32.08,
+      "learning_rate": 0.0002013157894736842,
+      "loss": 0.0232,
+      "step": 3625
+    },
+    {
+      "epoch": 32.3,
+      "learning_rate": 0.00020052631578947367,
+      "loss": 0.0215,
+      "step": 3650
+    },
+    {
+      "epoch": 32.52,
+      "learning_rate": 0.00019973684210526313,
+      "loss": 0.019,
+      "step": 3675
+    },
+    {
+      "epoch": 32.74,
+      "learning_rate": 0.0001989473684210526,
+      "loss": 0.0215,
+      "step": 3700
+    },
+    {
+      "epoch": 32.96,
+      "learning_rate": 0.0001981578947368421,
+      "loss": 0.0209,
+      "step": 3725
+    },
+    {
+      "epoch": 33.19,
+      "learning_rate": 0.00019736842105263157,
+      "loss": 0.0258,
+      "step": 3750
+    },
+    {
+      "epoch": 33.41,
+      "learning_rate": 0.00019657894736842106,
+      "loss": 0.0206,
+      "step": 3775
+    },
+    {
+      "epoch": 33.63,
+      "learning_rate": 0.0001957894736842105,
+      "loss": 0.019,
+      "step": 3800
+    },
+    {
+      "epoch": 33.85,
+      "learning_rate": 0.000195,
+      "loss": 0.0205,
+      "step": 3825
+    },
+    {
+      "epoch": 34.07,
+      "learning_rate": 0.00019421052631578945,
+      "loss": 0.0243,
+      "step": 3850
+    },
+    {
+      "epoch": 34.29,
+      "learning_rate": 0.00019342105263157894,
+      "loss": 0.0166,
+      "step": 3875
+    },
+    {
+      "epoch": 34.51,
+      "learning_rate": 0.0001926315789473684,
+      "loss": 0.0159,
+      "step": 3900
+    },
+    {
+      "epoch": 34.73,
+      "learning_rate": 0.00019184210526315787,
+      "loss": 0.0194,
+      "step": 3925
+    },
+    {
+      "epoch": 34.96,
+      "learning_rate": 0.00019105263157894736,
+      "loss": 0.0207,
+      "step": 3950
+    },
+    {
+      "epoch": 35.18,
+      "learning_rate": 0.0001902631578947368,
+      "loss": 0.0212,
+      "step": 3975
+    },
+    {
+      "epoch": 35.4,
+      "learning_rate": 0.0001894736842105263,
+      "loss": 0.021,
+      "step": 4000
+    },
+    {
+      "epoch": 35.4,
+      "eval_loss": 0.26615452766418457,
+      "eval_runtime": 10.7513,
+      "eval_samples_per_second": 9.301,
+      "eval_steps_per_second": 1.209,
+      "eval_wer": 0.07222288652397466,
+      "step": 4000
     }
   ],
   "max_steps": 10000,
   "num_train_epochs": 89,
+  "total_flos": 1.5768864774399195e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5258a25b9c74c3d9d5b375fb7669f896562d55ca5085300312146eb59f59737e
 size 1262229869

 version https://git-lfs.github.com/spec/v1
+oid sha256:bb9bb8d82c12f7963f345a3bc44171138b5cd9c15813fe124d03c8957cb8aa3d
 size 1262229869

runs/Apr09_14-45-21_gpu07.cyverse.org/events.out.tfevents.1681076808.gpu07.cyverse.org.48142.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:45e79a3318aae7f7e3793092d9c72a265dbb46e733875d98b4217ffa7542a1bb
-size 25176

 version https://git-lfs.github.com/spec/v1
+oid sha256:50fa134d7573be5c46508e873e8bb15f1862c32825a16d7b12c777045dccecb2
+size 31774