Training in progress, step 134000

Files changed (7) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0b1315aae041ecfad32a2045e873b3b7b0ca28ef1eec9909b436babc0fc54cfd
 size 174303

 version https://git-lfs.github.com/spec/v1
+oid sha256:9bbc0864acfd13b716f75d307bf48aada3819f622ff0bd60c9128105ebfcff8e
 size 174303

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cd61bdceb0ef57878ceaf45cac1881611e20948df45a7ecffed935dd90c56113
 size 377644503

 version https://git-lfs.github.com/spec/v1
+oid sha256:887961831a0f30b4269cdd28f6acde7f7d51f9a06abaabe2de32501df0b1860f
 size 377644503

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d05f4b8959da68caddda81a208352c89f58937d7235715093c9facb2b1a46252
 size 14567

 version https://git-lfs.github.com/spec/v1
+oid sha256:93198e96e3eab53a5e609a281fb99228f51dc43ea5bfb0348b2d825a7a3ab647
 size 14567

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:906b725cee85d765f660dacee1d3b63d2fdc393827dbe4ac970fc816b71db97a
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:61823d7f75e62090d2b8f678678ba83a75ec4c530252db1f2a051fa6494b9b82
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:885bb4553973695a9d249897a59c8887ce09937b3a50d9b334cd1eb683a8e04c
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:26fc2b87137deb440e0add509cb5c6eaf84f92619ce4a6bab36eea0195aa5885
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 225.0,
-  "global_step": 120600,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -150,11 +150,27 @@
       "eval_steps_per_second": 27.275,
       "eval_wer": 1.0,
       "step": 120600
     }
   ],
   "max_steps": 134000,
   "num_train_epochs": 250,
-  "total_flos": 1.1203867904870783e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 250.0,
+  "global_step": 134000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 27.275,
       "eval_wer": 1.0,
       "step": 120600
+    },
+    {
+      "epoch": 250.0,
+      "learning_rate": 4.4776119402985075e-08,
+      "loss": 2.4161,
+      "step": 134000
+    },
+    {
+      "epoch": 250.0,
+      "eval_cer": 0.898989898989899,
+      "eval_loss": 3.1552622318267822,
+      "eval_runtime": 0.843,
+      "eval_samples_per_second": 213.521,
+      "eval_steps_per_second": 27.283,
+      "eval_wer": 1.0,
+      "step": 134000
     }
   ],
   "max_steps": 134000,
   "num_train_epochs": 250,
+  "total_flos": 1.2448746848771059e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cd61bdceb0ef57878ceaf45cac1881611e20948df45a7ecffed935dd90c56113
 size 377644503

 version https://git-lfs.github.com/spec/v1
+oid sha256:887961831a0f30b4269cdd28f6acde7f7d51f9a06abaabe2de32501df0b1860f
 size 377644503