Training in progress, epoch 1

Browse files

Files changed (9) hide show

last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +9 -247
last-checkpoint/training_args.bin +1 -1
pytorch_model.bin +1 -1
training_args.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1a08673e36b5589851a89e97585a3867293b7bfc29762c0d241bad5a459e2c98
-size 162155

 version https://git-lfs.github.com/spec/v1
+oid sha256:8676f9764c07e6b933f4fa352af9b98b3b044de2eff759af6bf5baa43998241a
+size 721649669

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fd2694752b23d09cc0476bcd99fca84c77c41869f0d0641d2ed74aed026ce263
 size 377640289

 version https://git-lfs.github.com/spec/v1
+oid sha256:3321050bfb777e92d4a9535bacf26233d6d93c177f40afb72e9a4edb621469ad
 size 377640289

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:df299414f56d3cee0b6d3d0811a00f61147a37acc97a9fa7bcc500e7d68f6f17
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:02a382c9fbd249cde2e9b0ca8a6981276f1d798e47ccb2d4445b039ddbd74cae
 size 14639

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:df7dc3303bdc1a2737159ab5ce6ac6dfaf84d16b8f82e60421bc66305d6aac5e
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:af1f41381fb3909e7aa415aa1d1f2d9db8344ae4f5d0ae7b0cdf50527d59f2cb
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4b0cf379358077b3b304ca0deebe51217ffd230c794737401ceae6e68e81a0c3
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:00e56ff1f9aeef202866d18c52f49cf630af4e847aa9aca70191fe768f73377a
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,271 +1,33 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 15.0,
-  "global_step": 4830,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
-      "learning_rate": 9.840923948572674e-05,
-      "loss": 110.9133,
       "step": 322
     },
     {
       "epoch": 1.0,
       "eval_cer": 1.0,
-      "eval_loss": 12.292933464050293,
       "eval_new_wer": 1.0,
       "eval_old_wer": 1.0,
-      "eval_runtime": 7.4878,
-      "eval_samples_per_second": 28.046,
-      "eval_steps_per_second": 3.606,
       "step": 322
-    },
-    {
-      "epoch": 2.0,
-      "learning_rate": 9.139246023098715e-05,
-      "loss": 5.7752,
-      "step": 644
-    },
-    {
-      "epoch": 2.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.7167434692382812,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.7609,
-      "eval_samples_per_second": 27.059,
-      "eval_steps_per_second": 3.479,
-      "step": 644
-    },
-    {
-      "epoch": 3.0,
-      "learning_rate": 8.437568097624755e-05,
-      "loss": 3.4632,
-      "step": 966
-    },
-    {
-      "epoch": 3.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.6892776489257812,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.762,
-      "eval_samples_per_second": 23.967,
-      "eval_steps_per_second": 3.081,
-      "step": 966
-    },
-    {
-      "epoch": 4.0,
-      "learning_rate": 7.735890172150796e-05,
-      "loss": 3.3883,
-      "step": 1288
-    },
-    {
-      "epoch": 4.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.6128814220428467,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.0803,
-      "eval_samples_per_second": 25.989,
-      "eval_steps_per_second": 3.341,
-      "step": 1288
-    },
-    {
-      "epoch": 5.0,
-      "learning_rate": 7.034212246676837e-05,
-      "loss": 3.3461,
-      "step": 1610
-    },
-    {
-      "epoch": 5.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.5834929943084717,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.5699,
-      "eval_samples_per_second": 24.504,
-      "eval_steps_per_second": 3.151,
-      "step": 1610
-    },
-    {
-      "epoch": 6.0,
-      "learning_rate": 6.332534321202876e-05,
-      "loss": 3.3228,
-      "step": 1932
-    },
-    {
-      "epoch": 6.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.564229726791382,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.6036,
-      "eval_samples_per_second": 27.619,
-      "eval_steps_per_second": 3.551,
-      "step": 1932
-    },
-    {
-      "epoch": 7.0,
-      "learning_rate": 5.6308563957289177e-05,
-      "loss": 3.3009,
-      "step": 2254
-    },
-    {
-      "epoch": 7.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.5358943939208984,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.829,
-      "eval_samples_per_second": 26.824,
-      "eval_steps_per_second": 3.449,
-      "step": 2254
-    },
-    {
-      "epoch": 8.0,
-      "learning_rate": 4.9291784702549575e-05,
-      "loss": 3.2842,
-      "step": 2576
-    },
-    {
-      "epoch": 8.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.5163114070892334,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.665,
-      "eval_samples_per_second": 27.397,
-      "eval_steps_per_second": 3.523,
-      "step": 2576
-    },
-    {
-      "epoch": 9.0,
-      "learning_rate": 4.2275005447809986e-05,
-      "loss": 3.2793,
-      "step": 2898
-    },
-    {
-      "epoch": 9.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.4834606647491455,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.9806,
-      "eval_samples_per_second": 23.384,
-      "eval_steps_per_second": 3.006,
-      "step": 2898
-    },
-    {
-      "epoch": 10.0,
-      "learning_rate": 3.5258226193070384e-05,
-      "loss": 3.2629,
-      "step": 3220
-    },
-    {
-      "epoch": 10.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.4674203395843506,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 9.6156,
-      "eval_samples_per_second": 21.839,
-      "eval_steps_per_second": 2.808,
-      "step": 3220
-    },
-    {
-      "epoch": 11.0,
-      "learning_rate": 2.824144693833079e-05,
-      "loss": 3.2617,
-      "step": 3542
-    },
-    {
-      "epoch": 11.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.4477264881134033,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.5536,
-      "eval_samples_per_second": 24.551,
-      "eval_steps_per_second": 3.157,
-      "step": 3542
-    },
-    {
-      "epoch": 12.0,
-      "learning_rate": 2.1224667683591198e-05,
-      "loss": 3.251,
-      "step": 3864
-    },
-    {
-      "epoch": 12.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.451367139816284,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.3215,
-      "eval_samples_per_second": 28.683,
-      "eval_steps_per_second": 3.688,
-      "step": 3864
-    },
-    {
-      "epoch": 13.0,
-      "learning_rate": 1.4207888428851601e-05,
-      "loss": 3.2499,
-      "step": 4186
-    },
-    {
-      "epoch": 13.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.4498093128204346,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.0836,
-      "eval_samples_per_second": 25.979,
-      "eval_steps_per_second": 3.34,
-      "step": 4186
-    },
-    {
-      "epoch": 14.0,
-      "learning_rate": 7.191109174112007e-06,
-      "loss": 3.2462,
-      "step": 4508
-    },
-    {
-      "epoch": 14.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.4502668380737305,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.7485,
-      "eval_samples_per_second": 27.102,
-      "eval_steps_per_second": 3.485,
-      "step": 4508
-    },
-    {
-      "epoch": 15.0,
-      "learning_rate": 1.743299193724123e-07,
-      "loss": 3.2407,
-      "step": 4830
-    },
-    {
-      "epoch": 15.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.4475154876708984,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.7552,
-      "eval_samples_per_second": 27.079,
-      "eval_steps_per_second": 3.482,
-      "step": 4830
     }
   ],
   "max_steps": 4830,
   "num_train_epochs": 15,
-  "total_flos": 3.496646357064e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 322,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "learning_rate": 9.83874482458052e-05,
+      "loss": 20.722,
       "step": 322
     },
     {
       "epoch": 1.0,
       "eval_cer": 1.0,
+      "eval_loss": 3.2618589401245117,
       "eval_new_wer": 1.0,
       "eval_old_wer": 1.0,
+      "eval_runtime": 7.6687,
+      "eval_samples_per_second": 27.384,
+      "eval_steps_per_second": 3.521,
       "step": 322
     }
   ],
   "max_steps": 4830,
   "num_train_epochs": 15,
+  "total_flos": 2.331097571376e+17,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:82d8a5336a4bd974fb46749e5c97487a8c34caeee0663a03cc169408151233dd
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:ec767e1aae092c1f11b99196ba7b3d812c3d6f0dd8fc08a3236cbdaed665c876
 size 3387

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fd2694752b23d09cc0476bcd99fca84c77c41869f0d0641d2ed74aed026ce263
 size 377640289

 version https://git-lfs.github.com/spec/v1
+oid sha256:3321050bfb777e92d4a9535bacf26233d6d93c177f40afb72e9a4edb621469ad
 size 377640289

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:82d8a5336a4bd974fb46749e5c97487a8c34caeee0663a03cc169408151233dd
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:ec767e1aae092c1f11b99196ba7b3d812c3d6f0dd8fc08a3236cbdaed665c876
 size 3387