Training in progress, epoch 3

Files changed (7) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c66c7709fa5efe0f0fc488e8cf6d4a32f82b300f2fa148338838d2d3a2aacb03
 size 721655813

 version https://git-lfs.github.com/spec/v1
+oid sha256:35bf61b0ee2387056f6730c81fe7e7e01871a299bcce0c1b03fd0317d031c67e
 size 721655813

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:70a5a56a4a8511137221d1c2baa0f7d0280e769ad7dd774e4e9911bab67bcfe1
 size 377643361

 version https://git-lfs.github.com/spec/v1
+oid sha256:8d37e928b61a0709b47efcddedd3feea119aa3edfcd1b5b25d9831cff745ce18
 size 377643361

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4c2634a7cef85c3733bc176012cfb6c54d1c7f2270618efcc8e78560b92e66da
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:6457fbcd6125299d39a3f5df2c17d3e6f9f698138fa8998160ef0f8c3bf30c3d
 size 14639

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:447cc34a22a930dc4621a4092ac804cb3cfeff61ab9e2a15f78bdcd75e1608b2
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:6e7fe873bf9870bc33e181471559570d069770474c7c78954a92130213e90d23
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:507f5b7aa1e6ee0e18fdd912dafad73a7a30a7de0c89cb410c1d05169d4364f3
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:25865c944bd4ec7dcfcf1f877f5bbf6521cd66f246fd2fc5cb052a94c656e59b
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 2.0,
-  "global_step": 644,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -40,11 +40,28 @@
       "eval_samples_per_second": 25.968,
       "eval_steps_per_second": 3.339,
       "step": 644
     }
   ],
   "max_steps": 4830,
   "num_train_epochs": 15,
-  "total_flos": 4.7619840722208e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "global_step": 966,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 25.968,
       "eval_steps_per_second": 3.339,
       "step": 644
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 8.4353889736326e-05,
+      "loss": 3.4744,
+      "step": 966
+    },
+    {
+      "epoch": 3.0,
+      "eval_cer": 1.0,
+      "eval_loss": 3.3035826683044434,
+      "eval_new_wer": 1.0,
+      "eval_old_wer": 1.0,
+      "eval_runtime": 7.8439,
+      "eval_samples_per_second": 26.772,
+      "eval_steps_per_second": 3.442,
+      "step": 966
     }
   ],
   "max_steps": 4830,
   "num_train_epochs": 15,
+  "total_flos": 7.14270063333216e+17,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:70a5a56a4a8511137221d1c2baa0f7d0280e769ad7dd774e4e9911bab67bcfe1
 size 377643361

 version https://git-lfs.github.com/spec/v1
+oid sha256:8d37e928b61a0709b47efcddedd3feea119aa3edfcd1b5b25d9831cff745ce18
 size 377643361