Training in progress, step 3000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +254 -5
pytorch_model.bin +1 -1
runs/Apr09_14-45-21_gpu07.cyverse.org/events.out.tfevents.1681076808.gpu07.cyverse.org.48142.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8c22fbe8882f8237fdad9f99aee540b3eee7a95a06ed453d7dbf634c5e50ad4a
 size 2524414853

 version https://git-lfs.github.com/spec/v1
+oid sha256:5d663f5f146d9e8f297bc578554bd7042672ed6047e1f155a177a7a2f277f077
 size 2524414853

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7766aaba3075cb7cda575d932f2711e23f9758a8c4cf6beb80955eb66a503a07
 size 1262229869

 version https://git-lfs.github.com/spec/v1
+oid sha256:5258a25b9c74c3d9d5b375fb7669f896562d55ca5085300312146eb59f59737e
 size 1262229869

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f76adf0ffd2c50b454ef9f773fefb9715aac5ca126b5dc5340154393be241e4a
-size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:cfa739ad5003b32689d1be9cfc41058f1ee1620e0b3d1c54f70c056c125f5219
+size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:12c4c42f5c0f6326c3478ca4b895e02f447517c1b69320adf8921f0dc4132efb
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:52b81cce263ca1a87119e3db86ee6c4352a4b53f0c600c4f6eca5921e2e70890
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 0.07856032524213799,
-  "best_model_checkpoint": "./wav2vec2-xls-r-300m-ar/checkpoint-1000",
-  "epoch": 17.699115044247787,
-  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -504,11 +504,260 @@
       "eval_steps_per_second": 1.176,
       "eval_wer": 0.08071266292000479,
       "step": 2000
     }
   ],
   "max_steps": 10000,
   "num_train_epochs": 89,
-  "total_flos": 7.898916075572138e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.0693531029534856,
+  "best_model_checkpoint": "./wav2vec2-xls-r-300m-ar/checkpoint-3000",
+  "epoch": 26.548672566371682,
+  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 1.176,
       "eval_wer": 0.08071266292000479,
       "step": 2000
+    },
+    {
+      "epoch": 17.92,
+      "learning_rate": 0.00025184210526315784,
+      "loss": 0.0406,
+      "step": 2025
+    },
+    {
+      "epoch": 18.14,
+      "learning_rate": 0.0002510526315789474,
+      "loss": 0.0322,
+      "step": 2050
+    },
+    {
+      "epoch": 18.36,
+      "learning_rate": 0.0002502631578947368,
+      "loss": 0.0393,
+      "step": 2075
+    },
+    {
+      "epoch": 18.58,
+      "learning_rate": 0.0002494736842105263,
+      "loss": 0.0438,
+      "step": 2100
+    },
+    {
+      "epoch": 18.81,
+      "learning_rate": 0.0002486842105263158,
+      "loss": 0.0372,
+      "step": 2125
+    },
+    {
+      "epoch": 19.03,
+      "learning_rate": 0.00024789473684210526,
+      "loss": 0.0335,
+      "step": 2150
+    },
+    {
+      "epoch": 19.25,
+      "learning_rate": 0.00024710526315789474,
+      "loss": 0.0327,
+      "step": 2175
+    },
+    {
+      "epoch": 19.47,
+      "learning_rate": 0.00024631578947368417,
+      "loss": 0.0307,
+      "step": 2200
+    },
+    {
+      "epoch": 19.69,
+      "learning_rate": 0.00024552631578947365,
+      "loss": 0.0374,
+      "step": 2225
+    },
+    {
+      "epoch": 19.91,
+      "learning_rate": 0.00024473684210526314,
+      "loss": 0.035,
+      "step": 2250
+    },
+    {
+      "epoch": 20.13,
+      "learning_rate": 0.0002439473684210526,
+      "loss": 0.0336,
+      "step": 2275
+    },
+    {
+      "epoch": 20.35,
+      "learning_rate": 0.00024315789473684207,
+      "loss": 0.0426,
+      "step": 2300
+    },
+    {
+      "epoch": 20.58,
+      "learning_rate": 0.00024236842105263156,
+      "loss": 0.0375,
+      "step": 2325
+    },
+    {
+      "epoch": 20.8,
+      "learning_rate": 0.000241578947368421,
+      "loss": 0.0352,
+      "step": 2350
+    },
+    {
+      "epoch": 21.02,
+      "learning_rate": 0.00024078947368421052,
+      "loss": 0.0319,
+      "step": 2375
+    },
+    {
+      "epoch": 21.24,
+      "learning_rate": 0.00023999999999999998,
+      "loss": 0.0339,
+      "step": 2400
+    },
+    {
+      "epoch": 21.46,
+      "learning_rate": 0.00023921052631578946,
+      "loss": 0.0335,
+      "step": 2425
+    },
+    {
+      "epoch": 21.68,
+      "learning_rate": 0.00023842105263157895,
+      "loss": 0.0329,
+      "step": 2450
+    },
+    {
+      "epoch": 21.9,
+      "learning_rate": 0.0002376315789473684,
+      "loss": 0.0373,
+      "step": 2475
+    },
+    {
+      "epoch": 22.12,
+      "learning_rate": 0.00023684210526315788,
+      "loss": 0.0371,
+      "step": 2500
+    },
+    {
+      "epoch": 22.35,
+      "learning_rate": 0.00023605263157894734,
+      "loss": 0.0273,
+      "step": 2525
+    },
+    {
+      "epoch": 22.57,
+      "learning_rate": 0.00023526315789473682,
+      "loss": 0.0361,
+      "step": 2550
+    },
+    {
+      "epoch": 22.79,
+      "learning_rate": 0.00023447368421052628,
+      "loss": 0.0367,
+      "step": 2575
+    },
+    {
+      "epoch": 23.01,
+      "learning_rate": 0.00023368421052631576,
+      "loss": 0.0374,
+      "step": 2600
+    },
+    {
+      "epoch": 23.23,
+      "learning_rate": 0.00023289473684210524,
+      "loss": 0.0264,
+      "step": 2625
+    },
+    {
+      "epoch": 23.45,
+      "learning_rate": 0.0002321052631578947,
+      "loss": 0.0331,
+      "step": 2650
+    },
+    {
+      "epoch": 23.67,
+      "learning_rate": 0.00023131578947368418,
+      "loss": 0.0407,
+      "step": 2675
+    },
+    {
+      "epoch": 23.89,
+      "learning_rate": 0.00023052631578947364,
+      "loss": 0.031,
+      "step": 2700
+    },
+    {
+      "epoch": 24.12,
+      "learning_rate": 0.00022973684210526315,
+      "loss": 0.0294,
+      "step": 2725
+    },
+    {
+      "epoch": 24.34,
+      "learning_rate": 0.00022894736842105263,
+      "loss": 0.0345,
+      "step": 2750
+    },
+    {
+      "epoch": 24.56,
+      "learning_rate": 0.0002281578947368421,
+      "loss": 0.027,
+      "step": 2775
+    },
+    {
+      "epoch": 24.78,
+      "learning_rate": 0.00022736842105263157,
+      "loss": 0.0241,
+      "step": 2800
+    },
+    {
+      "epoch": 25.0,
+      "learning_rate": 0.00022657894736842103,
+      "loss": 0.0304,
+      "step": 2825
+    },
+    {
+      "epoch": 25.22,
+      "learning_rate": 0.0002257894736842105,
+      "loss": 0.026,
+      "step": 2850
+    },
+    {
+      "epoch": 25.44,
+      "learning_rate": 0.000225,
+      "loss": 0.0325,
+      "step": 2875
+    },
+    {
+      "epoch": 25.66,
+      "learning_rate": 0.00022421052631578945,
+      "loss": 0.0374,
+      "step": 2900
+    },
+    {
+      "epoch": 25.88,
+      "learning_rate": 0.00022342105263157893,
+      "loss": 0.036,
+      "step": 2925
+    },
+    {
+      "epoch": 26.11,
+      "learning_rate": 0.0002226315789473684,
+      "loss": 0.0339,
+      "step": 2950
+    },
+    {
+      "epoch": 26.33,
+      "learning_rate": 0.00022184210526315787,
+      "loss": 0.0312,
+      "step": 2975
+    },
+    {
+      "epoch": 26.55,
+      "learning_rate": 0.00022105263157894733,
+      "loss": 0.0285,
+      "step": 3000
+    },
+    {
+      "epoch": 26.55,
+      "eval_loss": 0.22891539335250854,
+      "eval_runtime": 10.8646,
+      "eval_samples_per_second": 9.204,
+      "eval_steps_per_second": 1.197,
+      "eval_wer": 0.0693531029534856,
+      "step": 3000
     }
   ],
   "max_steps": 10000,
   "num_train_epochs": 89,
+  "total_flos": 1.1850399847250571e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7766aaba3075cb7cda575d932f2711e23f9758a8c4cf6beb80955eb66a503a07
 size 1262229869

 version https://git-lfs.github.com/spec/v1
+oid sha256:5258a25b9c74c3d9d5b375fb7669f896562d55ca5085300312146eb59f59737e
 size 1262229869

runs/Apr09_14-45-21_gpu07.cyverse.org/events.out.tfevents.1681076808.gpu07.cyverse.org.48142.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65c3d972900bf03bff1b80a32a9fbc17a6bd3bf805d064d49e97a10dc60048cd
-size 18578

 version https://git-lfs.github.com/spec/v1
+oid sha256:45e79a3318aae7f7e3793092d9c72a265dbb46e733875d98b4217ffa7542a1bb
+size 25176