Training in progress, epoch 9

Files changed (7) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:911e783859de200ee856ea020a337ed6fd58158d927fdad27f58cc95e41518ce
 size 721661957

 version https://git-lfs.github.com/spec/v1
+oid sha256:745e302d3c28d1ecfd6bf63b5b26765fafd24857219333d8c8adec58a11a8473
 size 721661957

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:89b80b139cef01fd9b602dfac9c0896df7559dc96671d6411b235eb86f2fddb0
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:c3970293ec14528092d6ca1debf3fc3ad39d7d84a2d74df9c18c36eb3b48a7c9
 size 377646433

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ced15c725d859bed0b1f98b9eae921565b887986994c804e9dc9b99fe8c78868
-size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:cff87da20c71f603e8023886f748a7a90ad51a74dd3e257041031deac40726e3
+size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:971f2667e86066fc978a1099a9710d51e2e0613e9915add47dd7faa5f1d0e4b5
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:e9e056a14039066710c55d865723e703d98f3fcc915514a0580416816023f68e
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9b12d0b9a3a875a2aec9f9a0359d12814fa93fd9cd4ce92d62912b530c291996
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:7babf57865d31d5177ad3e6889bb5a4c41062ad6b69e376c5e9c2e44eb18880d
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 8.0,
-  "global_step": 34160,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -142,11 +142,28 @@
       "eval_samples_per_second": 24.653,
       "eval_steps_per_second": 3.17,
       "step": 34160
     }
   ],
   "max_steps": 64050,
   "num_train_epochs": 15,
-  "total_flos": 2.588128854040959e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 9.0,
+  "global_step": 38430,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 24.653,
       "eval_steps_per_second": 3.17,
       "step": 34160
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 4.213778595845386e-05,
+      "loss": 0.1601,
+      "step": 38430
+    },
+    {
+      "epoch": 9.0,
+      "eval_cer": 0.14805194805194805,
+      "eval_loss": 1.2215726375579834,
+      "eval_new_wer": 0.18095238095238095,
+      "eval_old_wer": 0.24285714285714285,
+      "eval_runtime": 8.367,
+      "eval_samples_per_second": 25.098,
+      "eval_steps_per_second": 3.227,
+      "step": 38430
     }
   ],
   "max_steps": 64050,
   "num_train_epochs": 15,
+  "total_flos": 2.911541312483291e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:89b80b139cef01fd9b602dfac9c0896df7559dc96671d6411b235eb86f2fddb0
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:c3970293ec14528092d6ca1debf3fc3ad39d7d84a2d74df9c18c36eb3b48a7c9
 size 377646433