Training in progress, epoch 1

Browse files

Files changed (9) hide show

last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +9 -247
last-checkpoint/training_args.bin +1 -1
pytorch_model.bin +1 -1
training_args.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5c83da8a036d69efc8024b00e44d6a00123cfc886a3fa289af79285418564b80
-size 168299

 version https://git-lfs.github.com/spec/v1
+oid sha256:4da6ad10fe5ddfee1403f949f31c1ef5eea2feda23160bf58ce1088f375e0be4
+size 721655813

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:92fe0edec4ebcac6b9bfef5c8f50a1f58b8ce7a05e14cb0975d8c1b760c74879
 size 377643361

 version https://git-lfs.github.com/spec/v1
+oid sha256:4e977485d43ce175909714a990eaf32d0340768b859b648a3e806d55dfcda5f9
 size 377643361

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ad40faf567f1a7fc0c84303ebf9c04650cca482149b50a1f10be4e8b10e81ed1
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:87e59c420ac8f254a85b7998827f0de34b640bffc0c9b34d43149710f0b80a4a
 size 14639

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:72c25de5caa05be3ade9c581fb6e8d0990d8379d446f63ba53da2351bc6bb8bc
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:3364651fd5a9e628b0b6f0c628dfc49d08e7dd9bf653f061f7a1e5bea9536652
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:603fd8cfbe6a3a7249f97ae827d8bf30db6a5a28fc7f5478df2bb53acdb8f061
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:33f8658c69038edd1bc039ffb6bc31d7c511183dc762692b5ed25c6a8b5f8c59
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,271 +1,33 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 15.0,
-  "global_step": 4140,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
-      "learning_rate": 9.844902110348335e-05,
-      "loss": 134.3311,
       "step": 276
     },
     {
       "epoch": 1.0,
       "eval_cer": 1.0,
-      "eval_loss": 40.12137985229492,
       "eval_new_wer": 1.0,
       "eval_old_wer": 1.0,
-      "eval_runtime": 6.4824,
-      "eval_samples_per_second": 27.767,
-      "eval_steps_per_second": 3.548,
       "step": 276
-    },
-    {
-      "epoch": 2.0,
-      "learning_rate": 9.143147724383423e-05,
-      "loss": 12.6593,
-      "step": 552
-    },
-    {
-      "epoch": 2.0,
-      "eval_cer": 1.0,
-      "eval_loss": 4.015556335449219,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.4651,
-      "eval_samples_per_second": 27.842,
-      "eval_steps_per_second": 3.558,
-      "step": 552
-    },
-    {
-      "epoch": 3.0,
-      "learning_rate": 8.441393338418511e-05,
-      "loss": 3.5481,
-      "step": 828
-    },
-    {
-      "epoch": 3.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.8011059761047363,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.4663,
-      "eval_samples_per_second": 27.837,
-      "eval_steps_per_second": 3.557,
-      "step": 828
-    },
-    {
-      "epoch": 4.0,
-      "learning_rate": 7.739638952453599e-05,
-      "loss": 3.4168,
-      "step": 1104
-    },
-    {
-      "epoch": 4.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.76212739944458,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.4555,
-      "eval_samples_per_second": 27.883,
-      "eval_steps_per_second": 3.563,
-      "step": 1104
-    },
-    {
-      "epoch": 5.0,
-      "learning_rate": 7.037884566488685e-05,
-      "loss": 3.3804,
-      "step": 1380
-    },
-    {
-      "epoch": 5.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.722968816757202,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.5104,
-      "eval_samples_per_second": 27.648,
-      "eval_steps_per_second": 3.533,
-      "step": 1380
-    },
-    {
-      "epoch": 6.0,
-      "learning_rate": 6.336130180523773e-05,
-      "loss": 3.3596,
-      "step": 1656
-    },
-    {
-      "epoch": 6.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.714810609817505,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.4471,
-      "eval_samples_per_second": 27.919,
-      "eval_steps_per_second": 3.567,
-      "step": 1656
-    },
-    {
-      "epoch": 7.0,
-      "learning_rate": 5.6343757945588615e-05,
-      "loss": 3.3422,
-      "step": 1932
-    },
-    {
-      "epoch": 7.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.6891369819641113,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.4647,
-      "eval_samples_per_second": 27.843,
-      "eval_steps_per_second": 3.558,
-      "step": 1932
-    },
-    {
-      "epoch": 8.0,
-      "learning_rate": 4.932621408593949e-05,
-      "loss": 3.3317,
-      "step": 2208
-    },
-    {
-      "epoch": 8.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.7060208320617676,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.4783,
-      "eval_samples_per_second": 27.785,
-      "eval_steps_per_second": 3.55,
-      "step": 2208
-    },
-    {
-      "epoch": 9.0,
-      "learning_rate": 4.230867022629036e-05,
-      "loss": 3.3247,
-      "step": 2484
-    },
-    {
-      "epoch": 9.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.6837430000305176,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.5103,
-      "eval_samples_per_second": 27.649,
-      "eval_steps_per_second": 3.533,
-      "step": 2484
-    },
-    {
-      "epoch": 10.0,
-      "learning_rate": 3.529112636664124e-05,
-      "loss": 3.3178,
-      "step": 2760
-    },
-    {
-      "epoch": 10.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.660386562347412,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.4496,
-      "eval_samples_per_second": 27.909,
-      "eval_steps_per_second": 3.566,
-      "step": 2760
-    },
-    {
-      "epoch": 11.0,
-      "learning_rate": 2.827358250699212e-05,
-      "loss": 3.3115,
-      "step": 3036
-    },
-    {
-      "epoch": 11.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.6680169105529785,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.5154,
-      "eval_samples_per_second": 27.627,
-      "eval_steps_per_second": 3.53,
-      "step": 3036
-    },
-    {
-      "epoch": 12.0,
-      "learning_rate": 2.1256038647342997e-05,
-      "loss": 3.3048,
-      "step": 3312
-    },
-    {
-      "epoch": 12.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.662872314453125,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.4674,
-      "eval_samples_per_second": 27.832,
-      "eval_steps_per_second": 3.556,
-      "step": 3312
-    },
-    {
-      "epoch": 13.0,
-      "learning_rate": 1.4238494787693874e-05,
-      "loss": 3.3012,
-      "step": 3588
-    },
-    {
-      "epoch": 13.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.665947198867798,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.509,
-      "eval_samples_per_second": 27.654,
-      "eval_steps_per_second": 3.534,
-      "step": 3588
-    },
-    {
-      "epoch": 14.0,
-      "learning_rate": 7.2209509280447494e-06,
-      "loss": 3.298,
-      "step": 3864
-    },
-    {
-      "epoch": 14.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.6620442867279053,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.4873,
-      "eval_samples_per_second": 27.747,
-      "eval_steps_per_second": 3.545,
-      "step": 3864
-    },
-    {
-      "epoch": 15.0,
-      "learning_rate": 2.0340706839562675e-07,
-      "loss": 3.2999,
-      "step": 4140
-    },
-    {
-      "epoch": 15.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.6636345386505127,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.4572,
-      "eval_samples_per_second": 27.876,
-      "eval_steps_per_second": 3.562,
-      "step": 4140
     }
   ],
   "max_steps": 4140,
   "num_train_epochs": 15,
-  "total_flos": 3.049755441937728e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 276,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "learning_rate": 9.842359521993389e-05,
+      "loss": 27.18,
       "step": 276
     },
     {
       "epoch": 1.0,
       "eval_cer": 1.0,
+      "eval_loss": 3.3241915702819824,
       "eval_new_wer": 1.0,
       "eval_old_wer": 1.0,
+      "eval_runtime": 6.7757,
+      "eval_samples_per_second": 26.565,
+      "eval_steps_per_second": 3.394,
       "step": 276
     }
   ],
   "max_steps": 4140,
   "num_train_epochs": 15,
+  "total_flos": 2.00879993971008e+17,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9698411e7a1146b016a2d4859cac51b281a6688b094cb726a6d30b60b24f1bac
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:deb9c0f892450f00fa996999ceb9f160bb8cf2b07756f1ef89cb049e366cb472
 size 3387

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:92fe0edec4ebcac6b9bfef5c8f50a1f58b8ce7a05e14cb0975d8c1b760c74879
 size 377643361

 version https://git-lfs.github.com/spec/v1
+oid sha256:4e977485d43ce175909714a990eaf32d0340768b859b648a3e806d55dfcda5f9
 size 377643361

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9698411e7a1146b016a2d4859cac51b281a6688b094cb726a6d30b60b24f1bac
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:deb9c0f892450f00fa996999ceb9f160bb8cf2b07756f1ef89cb049e366cb472
 size 3387