Training in progress, step 2000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Apr09_14-45-21_gpu07.cyverse.org/events.out.tfevents.1681076808.gpu07.cyverse.org.48142.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ddbbaa276202fa979205f050d64ec0fb23b7d02bcc83d371bf853f236d4705b1
 size 2524414853

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c22fbe8882f8237fdad9f99aee540b3eee7a95a06ed453d7dbf634c5e50ad4a
 size 2524414853

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a804cb4638c6b5cb2ed7579b53ad7958115a6c4f0fb821c0582d87f7b54620e
 size 1262229869

 version https://git-lfs.github.com/spec/v1
+oid sha256:7766aaba3075cb7cda575d932f2711e23f9758a8c4cf6beb80955eb66a503a07
 size 1262229869

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c35bd2fb5b221148ef9f3df4d84de356b110717172d9465cad80304a59c6933a
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:f76adf0ffd2c50b454ef9f773fefb9715aac5ca126b5dc5340154393be241e4a
 size 14639

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fdf9887d830501ed44fcfc9b1240b3894b0a39f156a92a6534273c610fd7f49b
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:12c4c42f5c0f6326c3478ca4b895e02f447517c1b69320adf8921f0dc4132efb
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.07856032524213799,
   "best_model_checkpoint": "./wav2vec2-xls-r-300m-ar/checkpoint-1000",
-  "epoch": 8.849557522123893,
-  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -255,11 +255,260 @@
       "eval_steps_per_second": 1.116,
       "eval_wer": 0.07856032524213799,
       "step": 1000
     }
   ],
   "max_steps": 10000,
   "num_train_epochs": 89,
-  "total_flos": 3.9707238818974925e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.07856032524213799,
   "best_model_checkpoint": "./wav2vec2-xls-r-300m-ar/checkpoint-1000",
+  "epoch": 17.699115044247787,
+  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 1.116,
       "eval_wer": 0.07856032524213799,
       "step": 1000
+    },
+    {
+      "epoch": 9.07,
+      "learning_rate": 0.00028342105263157895,
+      "loss": 0.0863,
+      "step": 1025
+    },
+    {
+      "epoch": 9.29,
+      "learning_rate": 0.0002826315789473684,
+      "loss": 0.0638,
+      "step": 1050
+    },
+    {
+      "epoch": 9.51,
+      "learning_rate": 0.00028184210526315787,
+      "loss": 0.0604,
+      "step": 1075
+    },
+    {
+      "epoch": 9.73,
+      "learning_rate": 0.00028105263157894735,
+      "loss": 0.0621,
+      "step": 1100
+    },
+    {
+      "epoch": 9.96,
+      "learning_rate": 0.00028026315789473683,
+      "loss": 0.0707,
+      "step": 1125
+    },
+    {
+      "epoch": 10.18,
+      "learning_rate": 0.0002794736842105263,
+      "loss": 0.0799,
+      "step": 1150
+    },
+    {
+      "epoch": 10.4,
+      "learning_rate": 0.00027868421052631574,
+      "loss": 0.0694,
+      "step": 1175
+    },
+    {
+      "epoch": 10.62,
+      "learning_rate": 0.00027789473684210523,
+      "loss": 0.0655,
+      "step": 1200
+    },
+    {
+      "epoch": 10.84,
+      "learning_rate": 0.0002771052631578947,
+      "loss": 0.0776,
+      "step": 1225
+    },
+    {
+      "epoch": 11.06,
+      "learning_rate": 0.0002763157894736842,
+      "loss": 0.0582,
+      "step": 1250
+    },
+    {
+      "epoch": 11.28,
+      "learning_rate": 0.0002755263157894737,
+      "loss": 0.0547,
+      "step": 1275
+    },
+    {
+      "epoch": 11.5,
+      "learning_rate": 0.0002747368421052631,
+      "loss": 0.0597,
+      "step": 1300
+    },
+    {
+      "epoch": 11.73,
+      "learning_rate": 0.0002739473684210526,
+      "loss": 0.0492,
+      "step": 1325
+    },
+    {
+      "epoch": 11.95,
+      "learning_rate": 0.00027315789473684207,
+      "loss": 0.0699,
+      "step": 1350
+    },
+    {
+      "epoch": 12.17,
+      "learning_rate": 0.00027236842105263155,
+      "loss": 0.0594,
+      "step": 1375
+    },
+    {
+      "epoch": 12.39,
+      "learning_rate": 0.00027157894736842104,
+      "loss": 0.0541,
+      "step": 1400
+    },
+    {
+      "epoch": 12.61,
+      "learning_rate": 0.0002707894736842105,
+      "loss": 0.0522,
+      "step": 1425
+    },
+    {
+      "epoch": 12.83,
+      "learning_rate": 0.00027,
+      "loss": 0.0645,
+      "step": 1450
+    },
+    {
+      "epoch": 13.05,
+      "learning_rate": 0.00026921052631578943,
+      "loss": 0.0583,
+      "step": 1475
+    },
+    {
+      "epoch": 13.27,
+      "learning_rate": 0.0002684210526315789,
+      "loss": 0.0443,
+      "step": 1500
+    },
+    {
+      "epoch": 13.5,
+      "learning_rate": 0.0002676315789473684,
+      "loss": 0.0548,
+      "step": 1525
+    },
+    {
+      "epoch": 13.72,
+      "learning_rate": 0.0002668421052631579,
+      "loss": 0.0484,
+      "step": 1550
+    },
+    {
+      "epoch": 13.94,
+      "learning_rate": 0.00026605263157894736,
+      "loss": 0.0775,
+      "step": 1575
+    },
+    {
+      "epoch": 14.16,
+      "learning_rate": 0.0002652631578947368,
+      "loss": 0.0554,
+      "step": 1600
+    },
+    {
+      "epoch": 14.38,
+      "learning_rate": 0.0002644736842105263,
+      "loss": 0.0456,
+      "step": 1625
+    },
+    {
+      "epoch": 14.6,
+      "learning_rate": 0.00026368421052631576,
+      "loss": 0.0563,
+      "step": 1650
+    },
+    {
+      "epoch": 14.82,
+      "learning_rate": 0.00026289473684210524,
+      "loss": 0.0493,
+      "step": 1675
+    },
+    {
+      "epoch": 15.04,
+      "learning_rate": 0.0002621052631578947,
+      "loss": 0.0452,
+      "step": 1700
+    },
+    {
+      "epoch": 15.27,
+      "learning_rate": 0.0002613157894736842,
+      "loss": 0.0389,
+      "step": 1725
+    },
+    {
+      "epoch": 15.49,
+      "learning_rate": 0.0002605263157894737,
+      "loss": 0.0436,
+      "step": 1750
+    },
+    {
+      "epoch": 15.71,
+      "learning_rate": 0.0002597368421052631,
+      "loss": 0.0407,
+      "step": 1775
+    },
+    {
+      "epoch": 15.93,
+      "learning_rate": 0.0002589473684210526,
+      "loss": 0.0448,
+      "step": 1800
+    },
+    {
+      "epoch": 16.15,
+      "learning_rate": 0.0002581578947368421,
+      "loss": 0.0457,
+      "step": 1825
+    },
+    {
+      "epoch": 16.37,
+      "learning_rate": 0.00025736842105263157,
+      "loss": 0.0461,
+      "step": 1850
+    },
+    {
+      "epoch": 16.59,
+      "learning_rate": 0.00025657894736842105,
+      "loss": 0.0452,
+      "step": 1875
+    },
+    {
+      "epoch": 16.81,
+      "learning_rate": 0.0002557894736842105,
+      "loss": 0.0484,
+      "step": 1900
+    },
+    {
+      "epoch": 17.04,
+      "learning_rate": 0.00025499999999999996,
+      "loss": 0.0376,
+      "step": 1925
+    },
+    {
+      "epoch": 17.26,
+      "learning_rate": 0.00025421052631578945,
+      "loss": 0.0409,
+      "step": 1950
+    },
+    {
+      "epoch": 17.48,
+      "learning_rate": 0.00025342105263157893,
+      "loss": 0.0315,
+      "step": 1975
+    },
+    {
+      "epoch": 17.7,
+      "learning_rate": 0.00025263157894736836,
+      "loss": 0.0396,
+      "step": 2000
+    },
+    {
+      "epoch": 17.7,
+      "eval_loss": 0.21985749900341034,
+      "eval_runtime": 11.0577,
+      "eval_samples_per_second": 9.043,
+      "eval_steps_per_second": 1.176,
+      "eval_wer": 0.08071266292000479,
+      "step": 2000
     }
   ],
   "max_steps": 10000,
   "num_train_epochs": 89,
+  "total_flos": 7.898916075572138e+18,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a804cb4638c6b5cb2ed7579b53ad7958115a6c4f0fb821c0582d87f7b54620e
 size 1262229869

 version https://git-lfs.github.com/spec/v1
+oid sha256:7766aaba3075cb7cda575d932f2711e23f9758a8c4cf6beb80955eb66a503a07
 size 1262229869

runs/Apr09_14-45-21_gpu07.cyverse.org/events.out.tfevents.1681076808.gpu07.cyverse.org.48142.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:540382d84d95bb9fbcb54bd2eae7512adb538af0c7b45e172684e621105bd32b
-size 11980

 version https://git-lfs.github.com/spec/v1
+oid sha256:65c3d972900bf03bff1b80a32a9fbc17a6bd3bf805d064d49e97a10dc60048cd
+size 18578