Training in progress, epoch 1

Browse files

Files changed (9) hide show

last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +11 -249
last-checkpoint/training_args.bin +1 -1
pytorch_model.bin +1 -1
training_args.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fe496069d41533adab99f5654f48d2852900e3a265c6f9761f806e206bddb82f
-size 168299

 version https://git-lfs.github.com/spec/v1
+oid sha256:ca2488c7c7e90101e4b14aa522a59ad2bf2118296861b9ea9158cca63add0769
+size 721655813

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cb4263fac02c7e3f7b0b8a14c2db49580404a71631cc58cd1845d1d7eb188f37
 size 377643361

 version https://git-lfs.github.com/spec/v1
+oid sha256:77a87c8ec786e02155f6f7dec60ce648c9a2caaee133fb17f93a3d7e1be007a9
 size 377643361

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b93b6efe0b15dcc71515d500d0dd28ca0159793f22435ec50f82333b0c73b7f1
-size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea49d5f6f6fde3589f0e548b39f94eb336cef5282e7f7120921ec12941b1115e
+size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e85dde748b24c92e67e7952517ef9975ea1302852fedfd5b4a4a96f5b401ed67
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:d86624103fa47ceeb667c5882baed38a7d9803787a13ec04e49ed10f8b91695a
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:05bcda048f77d9a7e1e5808d85cb3e44fb872033bb9c98a2805b9bf943cd48e5
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:fac6afd13d5ae29d5fa67e15b29421215e62ba138c49b108fef3d1c1618449c6
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,271 +1,33 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 15.0,
-  "global_step": 9330,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
-      "learning_rate": 9.831904332129964e-05,
-      "loss": 94.6389,
       "step": 622
     },
     {
       "epoch": 1.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 4.338134765625,
-      "eval_new_wer": 0.9,
       "eval_old_wer": 1.0,
-      "eval_runtime": 8.6594,
-      "eval_samples_per_second": 24.251,
-      "eval_steps_per_second": 3.118,
       "step": 622
-    },
-    {
-      "epoch": 2.0,
-      "learning_rate": 9.130189530685921e-05,
-      "loss": 3.6309,
-      "step": 1244
-    },
-    {
-      "epoch": 2.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 4.148990154266357,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.5756,
-      "eval_samples_per_second": 24.488,
-      "eval_steps_per_second": 3.148,
-      "step": 1244
-    },
-    {
-      "epoch": 3.0,
-      "learning_rate": 8.428474729241878e-05,
-      "loss": 3.3586,
-      "step": 1866
-    },
-    {
-      "epoch": 3.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 4.03645133972168,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.62,
-      "eval_samples_per_second": 24.362,
-      "eval_steps_per_second": 3.132,
-      "step": 1866
-    },
-    {
-      "epoch": 4.0,
-      "learning_rate": 7.726759927797835e-05,
-      "loss": 3.319,
-      "step": 2488
-    },
-    {
-      "epoch": 4.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.9594714641571045,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.8026,
-      "eval_samples_per_second": 23.857,
-      "eval_steps_per_second": 3.067,
-      "step": 2488
-    },
-    {
-      "epoch": 5.0,
-      "learning_rate": 7.02504512635379e-05,
-      "loss": 3.2905,
-      "step": 3110
-    },
-    {
-      "epoch": 5.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.8774044513702393,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.6675,
-      "eval_samples_per_second": 24.228,
-      "eval_steps_per_second": 3.115,
-      "step": 3110
-    },
-    {
-      "epoch": 6.0,
-      "learning_rate": 6.323330324909747e-05,
-      "loss": 3.2693,
-      "step": 3732
-    },
-    {
-      "epoch": 6.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.8836023807525635,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.4359,
-      "eval_samples_per_second": 24.894,
-      "eval_steps_per_second": 3.201,
-      "step": 3732
-    },
-    {
-      "epoch": 7.0,
-      "learning_rate": 5.621615523465704e-05,
-      "loss": 3.2546,
-      "step": 4354
-    },
-    {
-      "epoch": 7.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.8469648361206055,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.5607,
-      "eval_samples_per_second": 24.531,
-      "eval_steps_per_second": 3.154,
-      "step": 4354
-    },
-    {
-      "epoch": 8.0,
-      "learning_rate": 4.9199007220216606e-05,
-      "loss": 3.2424,
-      "step": 4976
-    },
-    {
-      "epoch": 8.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.798175811767578,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.5308,
-      "eval_samples_per_second": 24.617,
-      "eval_steps_per_second": 3.165,
-      "step": 4976
-    },
-    {
-      "epoch": 9.0,
-      "learning_rate": 4.2181859205776176e-05,
-      "loss": 3.2306,
-      "step": 5598
-    },
-    {
-      "epoch": 9.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.7588889598846436,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.6596,
-      "eval_samples_per_second": 24.25,
-      "eval_steps_per_second": 3.118,
-      "step": 5598
-    },
-    {
-      "epoch": 10.0,
-      "learning_rate": 3.516471119133574e-05,
-      "loss": 3.2218,
-      "step": 6220
-    },
-    {
-      "epoch": 10.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.738402843475342,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.5202,
-      "eval_samples_per_second": 24.647,
-      "eval_steps_per_second": 3.169,
-      "step": 6220
-    },
-    {
-      "epoch": 11.0,
-      "learning_rate": 2.814756317689531e-05,
-      "loss": 3.2149,
-      "step": 6842
-    },
-    {
-      "epoch": 11.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.7330896854400635,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.6236,
-      "eval_samples_per_second": 24.352,
-      "eval_steps_per_second": 3.131,
-      "step": 6842
-    },
-    {
-      "epoch": 12.0,
-      "learning_rate": 2.1130415162454876e-05,
-      "loss": 3.2088,
-      "step": 7464
-    },
-    {
-      "epoch": 12.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.721147298812866,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.7097,
-      "eval_samples_per_second": 24.111,
-      "eval_steps_per_second": 3.1,
-      "step": 7464
-    },
-    {
-      "epoch": 13.0,
-      "learning_rate": 1.4113267148014443e-05,
-      "loss": 3.2056,
-      "step": 8086
-    },
-    {
-      "epoch": 13.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.7029576301574707,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.5372,
-      "eval_samples_per_second": 24.598,
-      "eval_steps_per_second": 3.163,
-      "step": 8086
-    },
-    {
-      "epoch": 14.0,
-      "learning_rate": 7.0961191335740075e-06,
-      "loss": 3.2031,
-      "step": 8708
-    },
-    {
-      "epoch": 14.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.6995913982391357,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.6411,
-      "eval_samples_per_second": 24.302,
-      "eval_steps_per_second": 3.125,
-      "step": 8708
-    },
-    {
-      "epoch": 15.0,
-      "learning_rate": 7.8971119133574e-08,
-      "loss": 3.1984,
-      "step": 9330
-    },
-    {
-      "epoch": 15.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.7015275955200195,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.7621,
-      "eval_samples_per_second": 23.967,
-      "eval_steps_per_second": 3.081,
-      "step": 9330
     }
   ],
   "max_steps": 9330,
   "num_train_epochs": 15,
-  "total_flos": 7.036379245117149e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 622,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "learning_rate": 9.83303249097473e-05,
+      "loss": 16.7556,
       "step": 622
     },
     {
       "epoch": 1.0,
+      "eval_cer": 0.9341991341991343,
+      "eval_loss": 3.3474249839782715,
+      "eval_new_wer": 0.9380952380952381,
       "eval_old_wer": 1.0,
+      "eval_runtime": 7.7874,
+      "eval_samples_per_second": 26.967,
+      "eval_steps_per_second": 3.467,
       "step": 622
     }
   ],
   "max_steps": 9330,
   "num_train_epochs": 15,
+  "total_flos": 4.58996805867552e+17,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f8c3732970442c8712223c0ddb31aa73105a191b2acb15fdb899c989a36e1288
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:0000b096c0b617d6be374ea1bea5add3f1148e5ae411824afcaf501618c33f42
 size 3387

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cb4263fac02c7e3f7b0b8a14c2db49580404a71631cc58cd1845d1d7eb188f37
 size 377643361

 version https://git-lfs.github.com/spec/v1
+oid sha256:77a87c8ec786e02155f6f7dec60ce648c9a2caaee133fb17f93a3d7e1be007a9
 size 377643361

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f8c3732970442c8712223c0ddb31aa73105a191b2acb15fdb899c989a36e1288
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:0000b096c0b617d6be374ea1bea5add3f1148e5ae411824afcaf501618c33f42
 size 3387