Training in progress, epoch 1

Browse files

Files changed (9) hide show

last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +11 -249
last-checkpoint/training_args.bin +1 -1
pytorch_model.bin +1 -1
training_args.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:128a94b56ac83cb4272fe5debfffb148e1b4a4e73c41edd529851347b4952513
-size 174443

 version https://git-lfs.github.com/spec/v1
+oid sha256:87a365e4891d90ec23233f68651248b0bb5da2d876f36817a4be0ad6f4f0c322
+size 721661957

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:71a045dea2c5c6e15f1f42b075b58894e90de6d6a649eadded10af44c12c7bd0
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea916919791655f74aec3b70a6233614608427e834da06bc5f606ea72149c620
 size 377646433

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e9bdcf09921bc14cad1e6e13a86c29a6b2e2586fed5f02d8ae0b665e3f67ad32
-size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:41734c590d4ca9111afda14d4d6e0db4819c1b65e8ffee27fa29d4e1cde666e4
+size 14639

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1d345ce6510ab8af247d205e03e585917625e9354fcd14c7564f682739dbc9cc
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:bd86c1f3d5f1b7e58ab1b190ff0893321dea6cfb611bb6b4388ebc93c6931aa8
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:748a98a49b1ce62329be45e166c4c382fbcf1153bd7d7c5e4d58f6bb85eae1b8
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:a50eceed5d5a14aef24a7445d77f16047b39c151ba5bdc2775618ddbda6486ac
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,271 +1,33 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 15.0,
-  "global_step": 11085,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
-      "learning_rate": 9.833823948342988e-05,
-      "loss": 106.1639,
       "step": 739
     },
     {
       "epoch": 1.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.7620224952697754,
-      "eval_new_wer": 0.9,
       "eval_old_wer": 1.0,
-      "eval_runtime": 7.2762,
-      "eval_samples_per_second": 24.738,
-      "eval_steps_per_second": 3.161,
       "step": 739
-    },
-    {
-      "epoch": 2.0,
-      "learning_rate": 9.132086221631374e-05,
-      "loss": 3.7546,
-      "step": 1478
-    },
-    {
-      "epoch": 2.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.780017852783203,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.3406,
-      "eval_samples_per_second": 24.521,
-      "eval_steps_per_second": 3.133,
-      "step": 1478
-    },
-    {
-      "epoch": 3.0,
-      "learning_rate": 8.43034849491976e-05,
-      "loss": 3.4946,
-      "step": 2217
-    },
-    {
-      "epoch": 3.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.61942720413208,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.4322,
-      "eval_samples_per_second": 24.219,
-      "eval_steps_per_second": 3.095,
-      "step": 2217
-    },
-    {
-      "epoch": 4.0,
-      "learning_rate": 7.728610768208148e-05,
-      "loss": 3.4427,
-      "step": 2956
-    },
-    {
-      "epoch": 4.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.581315040588379,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.2928,
-      "eval_samples_per_second": 24.682,
-      "eval_steps_per_second": 3.154,
-      "step": 2956
-    },
-    {
-      "epoch": 5.0,
-      "learning_rate": 7.026873041496534e-05,
-      "loss": 3.4094,
-      "step": 3695
-    },
-    {
-      "epoch": 5.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.5385422706604004,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.2804,
-      "eval_samples_per_second": 24.724,
-      "eval_steps_per_second": 3.159,
-      "step": 3695
-    },
-    {
-      "epoch": 6.0,
-      "learning_rate": 6.325135314784922e-05,
-      "loss": 3.384,
-      "step": 4434
-    },
-    {
-      "epoch": 6.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.447321891784668,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.2913,
-      "eval_samples_per_second": 24.687,
-      "eval_steps_per_second": 3.154,
-      "step": 4434
-    },
-    {
-      "epoch": 7.0,
-      "learning_rate": 5.6233975880733084e-05,
-      "loss": 3.3675,
-      "step": 5173
-    },
-    {
-      "epoch": 7.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.407554864883423,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.8277,
-      "eval_samples_per_second": 22.995,
-      "eval_steps_per_second": 2.938,
-      "step": 5173
-    },
-    {
-      "epoch": 8.0,
-      "learning_rate": 4.9216598613616946e-05,
-      "loss": 3.3539,
-      "step": 5912
-    },
-    {
-      "epoch": 8.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.375277042388916,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.2374,
-      "eval_samples_per_second": 24.871,
-      "eval_steps_per_second": 3.178,
-      "step": 5912
-    },
-    {
-      "epoch": 9.0,
-      "learning_rate": 4.2199221346500814e-05,
-      "loss": 3.3382,
-      "step": 6651
-    },
-    {
-      "epoch": 9.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.335272789001465,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.2156,
-      "eval_samples_per_second": 24.946,
-      "eval_steps_per_second": 3.188,
-      "step": 6651
-    },
-    {
-      "epoch": 10.0,
-      "learning_rate": 3.5181844079384676e-05,
-      "loss": 3.3304,
-      "step": 7390
-    },
-    {
-      "epoch": 10.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.328141212463379,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.5963,
-      "eval_samples_per_second": 23.696,
-      "eval_steps_per_second": 3.028,
-      "step": 7390
-    },
-    {
-      "epoch": 11.0,
-      "learning_rate": 2.816446681226854e-05,
-      "loss": 3.3184,
-      "step": 8129
-    },
-    {
-      "epoch": 11.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.3093180656433105,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.2653,
-      "eval_samples_per_second": 24.775,
-      "eval_steps_per_second": 3.166,
-      "step": 8129
-    },
-    {
-      "epoch": 12.0,
-      "learning_rate": 2.1147089545152407e-05,
-      "loss": 3.3116,
-      "step": 8868
-    },
-    {
-      "epoch": 12.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.3055644035339355,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.2417,
-      "eval_samples_per_second": 24.856,
-      "eval_steps_per_second": 3.176,
-      "step": 8868
-    },
-    {
-      "epoch": 13.0,
-      "learning_rate": 1.4129712278036275e-05,
-      "loss": 3.3032,
-      "step": 9607
-    },
-    {
-      "epoch": 13.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.3021399974823,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.3911,
-      "eval_samples_per_second": 24.354,
-      "eval_steps_per_second": 3.112,
-      "step": 9607
-    },
-    {
-      "epoch": 14.0,
-      "learning_rate": 7.112335010920141e-06,
-      "loss": 3.3038,
-      "step": 10346
-    },
-    {
-      "epoch": 14.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.3013970851898193,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.3511,
-      "eval_samples_per_second": 24.486,
-      "eval_steps_per_second": 3.129,
-      "step": 10346
-    },
-    {
-      "epoch": 15.0,
-      "learning_rate": 9.495774380400722e-08,
-      "loss": 3.2971,
-      "step": 11085
-    },
-    {
-      "epoch": 15.0,
-      "eval_cer": 0.9636363636363636,
-      "eval_loss": 3.2989487648010254,
-      "eval_new_wer": 0.9,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.2244,
-      "eval_samples_per_second": 24.915,
-      "eval_steps_per_second": 3.184,
-      "step": 11085
     }
   ],
   "max_steps": 11085,
   "num_train_epochs": 15,
-  "total_flos": 9.523001095942625e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 739,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "learning_rate": 9.831924793466908e-05,
+      "loss": 18.2448,
       "step": 739
     },
     {
       "epoch": 1.0,
+      "eval_cer": 1.0,
+      "eval_loss": 3.3216891288757324,
+      "eval_new_wer": 1.0,
       "eval_old_wer": 1.0,
+      "eval_runtime": 7.2541,
+      "eval_samples_per_second": 24.814,
+      "eval_steps_per_second": 3.171,
       "step": 739
     }
   ],
   "max_steps": 11085,
   "num_train_epochs": 15,
+  "total_flos": 5.7487243575776256e+17,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:115fc2c46d06a974e25903ba4a4848c2b0bd38c134a25db9593ebb2b4a25589e
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:c03ddeae8e5b6c8b1c706e99c450b1a83dc9b242862b2db4c5fb889a74640900
 size 3387

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:71a045dea2c5c6e15f1f42b075b58894e90de6d6a649eadded10af44c12c7bd0
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea916919791655f74aec3b70a6233614608427e834da06bc5f606ea72149c620
 size 377646433

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:115fc2c46d06a974e25903ba4a4848c2b0bd38c134a25db9593ebb2b4a25589e
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:c03ddeae8e5b6c8b1c706e99c450b1a83dc9b242862b2db4c5fb889a74640900
 size 3387