Training in progress, epoch 1

Browse files

Files changed (9) hide show

last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +10 -248
last-checkpoint/training_args.bin +1 -1
pytorch_model.bin +1 -1
training_args.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:85d14ad71efaeb6f8c96ed277aa259e96333bc30592251c2f05028d66d9061c6
-size 174443

 version https://git-lfs.github.com/spec/v1
+oid sha256:efc6647797c11fdbfe1c53573aed9eee8aed3fc96cd75545eba6b0404edef60f
+size 721661957

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ae468078234726dc3f32d7c0c525848bea6e3a58826eba261fde5d86cf449ce1
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:21c5c6e2cd0d7ac6d4cde87d8af3b8df1081994728e89911a12dfc295ad3ed34
 size 377646433

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cf7539c9994537b387463a8673aaefbb794dfde125417e655d2b51405c4e2f64
-size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:bb6ae5f9e453d51becd476652216570f82dcae8f982fc0601e5338479912db79
+size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2c7177329123711707b115784f744eaacba2e7e33dd8619b9095aec55c16969c
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:0e32795b646599b8d93af06eddf31ae776ce5c0edc63fcf2d9b03ddfb799e2fa
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b230ed8d52f0444d599022c01005f39471d414ff3b188db371ba37836420c733
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:057d059f9b8d3b5f52d0c6fee3f0cc3e21e2e0460adc929d8f9a15caf8f70251
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,271 +1,33 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 15.0,
-  "global_step": 9330,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
-      "learning_rate": 9.834160649819495e-05,
-      "loss": 96.5964,
       "step": 622
     },
     {
       "epoch": 1.0,
       "eval_cer": 1.0,
-      "eval_loss": 5.171775817871094,
-      "eval_new_wer": 0.9,
       "eval_old_wer": 1.0,
-      "eval_runtime": 8.3226,
-      "eval_samples_per_second": 25.232,
-      "eval_steps_per_second": 3.244,
       "step": 622
-    },
-    {
-      "epoch": 2.0,
-      "learning_rate": 9.132445848375451e-05,
-      "loss": 3.683,
-      "step": 1244
-    },
-    {
-      "epoch": 2.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.42059063911438,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.3577,
-      "eval_samples_per_second": 25.126,
-      "eval_steps_per_second": 3.231,
-      "step": 1244
-    },
-    {
-      "epoch": 3.0,
-      "learning_rate": 8.430731046931408e-05,
-      "loss": 3.4329,
-      "step": 1866
-    },
-    {
-      "epoch": 3.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.338214159011841,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.1905,
-      "eval_samples_per_second": 25.64,
-      "eval_steps_per_second": 3.297,
-      "step": 1866
-    },
-    {
-      "epoch": 4.0,
-      "learning_rate": 7.729016245487365e-05,
-      "loss": 3.3838,
-      "step": 2488
-    },
-    {
-      "epoch": 4.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.2940337657928467,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.3238,
-      "eval_samples_per_second": 25.229,
-      "eval_steps_per_second": 3.244,
-      "step": 2488
-    },
-    {
-      "epoch": 5.0,
-      "learning_rate": 7.027301444043322e-05,
-      "loss": 3.3494,
-      "step": 3110
-    },
-    {
-      "epoch": 5.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.281006097793579,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.2617,
-      "eval_samples_per_second": 25.419,
-      "eval_steps_per_second": 3.268,
-      "step": 3110
-    },
-    {
-      "epoch": 6.0,
-      "learning_rate": 6.325586642599278e-05,
-      "loss": 3.3299,
-      "step": 3732
-    },
-    {
-      "epoch": 6.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.266472578048706,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.1451,
-      "eval_samples_per_second": 25.782,
-      "eval_steps_per_second": 3.315,
-      "step": 3732
-    },
-    {
-      "epoch": 7.0,
-      "learning_rate": 5.623871841155235e-05,
-      "loss": 3.312,
-      "step": 4354
-    },
-    {
-      "epoch": 7.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.279639720916748,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.6675,
-      "eval_samples_per_second": 24.229,
-      "eval_steps_per_second": 3.115,
-      "step": 4354
-    },
-    {
-      "epoch": 8.0,
-      "learning_rate": 4.922157039711192e-05,
-      "loss": 3.2929,
-      "step": 4976
-    },
-    {
-      "epoch": 8.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.2772765159606934,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.4097,
-      "eval_samples_per_second": 24.971,
-      "eval_steps_per_second": 3.211,
-      "step": 4976
-    },
-    {
-      "epoch": 9.0,
-      "learning_rate": 4.220442238267148e-05,
-      "loss": 3.2798,
-      "step": 5598
-    },
-    {
-      "epoch": 9.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.262816905975342,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.1919,
-      "eval_samples_per_second": 25.635,
-      "eval_steps_per_second": 3.296,
-      "step": 5598
-    },
-    {
-      "epoch": 10.0,
-      "learning_rate": 3.518727436823105e-05,
-      "loss": 3.2665,
-      "step": 6220
-    },
-    {
-      "epoch": 10.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.2637782096862793,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.2335,
-      "eval_samples_per_second": 25.506,
-      "eval_steps_per_second": 3.279,
-      "step": 6220
-    },
-    {
-      "epoch": 11.0,
-      "learning_rate": 2.8170126353790616e-05,
-      "loss": 3.2541,
-      "step": 6842
-    },
-    {
-      "epoch": 11.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.2613089084625244,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.2348,
-      "eval_samples_per_second": 25.502,
-      "eval_steps_per_second": 3.279,
-      "step": 6842
-    },
-    {
-      "epoch": 12.0,
-      "learning_rate": 2.1152978339350183e-05,
-      "loss": 3.2467,
-      "step": 7464
-    },
-    {
-      "epoch": 12.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.258359432220459,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.25,
-      "eval_samples_per_second": 25.454,
-      "eval_steps_per_second": 3.273,
-      "step": 7464
-    },
-    {
-      "epoch": 13.0,
-      "learning_rate": 1.413583032490975e-05,
-      "loss": 3.2398,
-      "step": 8086
-    },
-    {
-      "epoch": 13.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.2569637298583984,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.1571,
-      "eval_samples_per_second": 25.744,
-      "eval_steps_per_second": 3.31,
-      "step": 8086
-    },
-    {
-      "epoch": 14.0,
-      "learning_rate": 7.118682310469314e-06,
-      "loss": 3.2345,
-      "step": 8708
-    },
-    {
-      "epoch": 14.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.2544875144958496,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.2343,
-      "eval_samples_per_second": 25.503,
-      "eval_steps_per_second": 3.279,
-      "step": 8708
-    },
-    {
-      "epoch": 15.0,
-      "learning_rate": 1.0153429602888086e-07,
-      "loss": 3.2314,
-      "step": 9330
-    },
-    {
-      "epoch": 15.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.2543957233428955,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.2039,
-      "eval_samples_per_second": 25.598,
-      "eval_steps_per_second": 3.291,
-      "step": 9330
     }
   ],
   "max_steps": 9330,
   "num_train_epochs": 15,
-  "total_flos": 6.957306456149069e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 622,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "learning_rate": 9.831904332129964e-05,
+      "loss": 16.5448,
       "step": 622
     },
     {
       "epoch": 1.0,
       "eval_cer": 1.0,
+      "eval_loss": 3.223598003387451,
+      "eval_new_wer": 1.0,
       "eval_old_wer": 1.0,
+      "eval_runtime": 7.6496,
+      "eval_samples_per_second": 27.453,
+      "eval_steps_per_second": 3.53,
       "step": 622
     }
   ],
   "max_steps": 9330,
   "num_train_epochs": 15,
+  "total_flos": 4.605345185202432e+17,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:91b9508419e9a24441e2ac1532a2b4015ebd6d32ce5c156b4344590fc43d072e
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:dc1e2ae024a6dd754c3004074fec2e6921494ba45e8e6866bd9d35a0bd3f913a
 size 3387

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ae468078234726dc3f32d7c0c525848bea6e3a58826eba261fde5d86cf449ce1
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:21c5c6e2cd0d7ac6d4cde87d8af3b8df1081994728e89911a12dfc295ad3ed34
 size 377646433

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:91b9508419e9a24441e2ac1532a2b4015ebd6d32ce5c156b4344590fc43d072e
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:dc1e2ae024a6dd754c3004074fec2e6921494ba45e8e6866bd9d35a0bd3f913a
 size 3387