Training in progress, epoch 1

Browse files

Files changed (9) hide show

last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +8 -246
last-checkpoint/training_args.bin +1 -1
pytorch_model.bin +1 -1
training_args.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6f2fb35b64f668567811a213cdc1071780c91b6c53c54f8cd0099fa086852d65
-size 174443

 version https://git-lfs.github.com/spec/v1
+oid sha256:5d184fe2a459d72ab4f17f9800832f7189c8809e50bf6f25e22d726b15e12b61
+size 721661957

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:823124d7b3c57a5d49f76380cfdef993242c2f09379aad159cd616aa33d53e83
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:78b8af0529522cbae8a484627f1931663045d8e1f9d51e2919c7c377f92e91cf
 size 377646433

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78b452a196ff537133ad21db6358981ae79efa83bf1bb6fa65ea52d4f4f814fb
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c2d6b5f0154fde0c288bdb2ab6d96ec62bdc8d9fe5703db59a28c412b3261fa
 size 14639

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5e27801f4fd62147e483469cdfce5fee96801e62edb4854e281b2150912ec391
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:9b63cb11ac01032c977cdc85c62fc3b92562156ab5c4471214784ecf2efc9205
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ffef3b2283afa05a6f5f6370d44f20f10535bd3da41245a94669aed13c81edc8
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:e89163b4d12e6402024e5086a1eecd70185a21973d01ffc02723c8dcbaa443b9
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 15.0,
-  "global_step": 10050,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -10,262 +10,24 @@
     {
       "epoch": 1.0,
       "learning_rate": 9.832425638877252e-05,
-      "loss": 95.9188,
       "step": 670
     },
     {
       "epoch": 1.0,
       "eval_cer": 1.0,
-      "eval_loss": 4.503777027130127,
       "eval_new_wer": 1.0,
       "eval_old_wer": 1.0,
-      "eval_runtime": 6.9965,
-      "eval_samples_per_second": 25.727,
-      "eval_steps_per_second": 3.287,
       "step": 670
-    },
-    {
-      "epoch": 2.0,
-      "learning_rate": 9.130708001675745e-05,
-      "loss": 3.6163,
-      "step": 1340
-    },
-    {
-      "epoch": 2.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.9380106925964355,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.9825,
-      "eval_samples_per_second": 25.779,
-      "eval_steps_per_second": 3.294,
-      "step": 1340
-    },
-    {
-      "epoch": 3.0,
-      "learning_rate": 8.428990364474236e-05,
-      "loss": 3.4075,
-      "step": 2010
-    },
-    {
-      "epoch": 3.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.9024274349212646,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.1179,
-      "eval_samples_per_second": 25.288,
-      "eval_steps_per_second": 3.231,
-      "step": 2010
-    },
-    {
-      "epoch": 4.0,
-      "learning_rate": 7.727272727272727e-05,
-      "loss": 3.3579,
-      "step": 2680
-    },
-    {
-      "epoch": 4.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.84831166267395,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.0506,
-      "eval_samples_per_second": 25.53,
-      "eval_steps_per_second": 3.262,
-      "step": 2680
-    },
-    {
-      "epoch": 5.0,
-      "learning_rate": 7.02555509007122e-05,
-      "loss": 3.322,
-      "step": 3350
-    },
-    {
-      "epoch": 5.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.8365871906280518,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.7477,
-      "eval_samples_per_second": 23.233,
-      "eval_steps_per_second": 2.969,
-      "step": 3350
-    },
-    {
-      "epoch": 6.0,
-      "learning_rate": 6.323837452869711e-05,
-      "loss": 3.2953,
-      "step": 4020
-    },
-    {
-      "epoch": 6.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.838519334793091,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.1306,
-      "eval_samples_per_second": 22.139,
-      "eval_steps_per_second": 2.829,
-      "step": 4020
-    },
-    {
-      "epoch": 7.0,
-      "learning_rate": 5.622119815668203e-05,
-      "loss": 3.2672,
-      "step": 4690
-    },
-    {
-      "epoch": 7.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.821115016937256,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.1147,
-      "eval_samples_per_second": 25.3,
-      "eval_steps_per_second": 3.233,
-      "step": 4690
-    },
-    {
-      "epoch": 8.0,
-      "learning_rate": 4.920402178466695e-05,
-      "loss": 3.2428,
-      "step": 5360
-    },
-    {
-      "epoch": 8.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.810203790664673,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.283,
-      "eval_samples_per_second": 21.731,
-      "eval_steps_per_second": 2.777,
-      "step": 5360
-    },
-    {
-      "epoch": 9.0,
-      "learning_rate": 4.2186845412651864e-05,
-      "loss": 3.219,
-      "step": 6030
-    },
-    {
-      "epoch": 9.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.7927558422088623,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 8.3214,
-      "eval_samples_per_second": 21.631,
-      "eval_steps_per_second": 2.764,
-      "step": 6030
-    },
-    {
-      "epoch": 10.0,
-      "learning_rate": 3.516966904063678e-05,
-      "loss": 3.1953,
-      "step": 6700
-    },
-    {
-      "epoch": 10.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.765852212905884,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.1004,
-      "eval_samples_per_second": 25.351,
-      "eval_steps_per_second": 3.239,
-      "step": 6700
-    },
-    {
-      "epoch": 11.0,
-      "learning_rate": 2.8152492668621706e-05,
-      "loss": 3.1763,
-      "step": 7370
-    },
-    {
-      "epoch": 11.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.7410292625427246,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.0826,
-      "eval_samples_per_second": 25.414,
-      "eval_steps_per_second": 3.247,
-      "step": 7370
-    },
-    {
-      "epoch": 12.0,
-      "learning_rate": 2.113531629660662e-05,
-      "loss": 3.1599,
-      "step": 8040
-    },
-    {
-      "epoch": 12.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.718080759048462,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.1262,
-      "eval_samples_per_second": 25.259,
-      "eval_steps_per_second": 3.228,
-      "step": 8040
-    },
-    {
-      "epoch": 13.0,
-      "learning_rate": 1.4118139924591539e-05,
-      "loss": 3.1486,
-      "step": 8710
-    },
-    {
-      "epoch": 13.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.698702096939087,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 7.1837,
-      "eval_samples_per_second": 25.057,
-      "eval_steps_per_second": 3.202,
-      "step": 8710
-    },
-    {
-      "epoch": 14.0,
-      "learning_rate": 7.100963552576456e-06,
-      "loss": 3.1406,
-      "step": 9380
-    },
-    {
-      "epoch": 14.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.6906392574310303,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.667,
-      "eval_samples_per_second": 26.999,
-      "eval_steps_per_second": 3.45,
-      "step": 9380
-    },
-    {
-      "epoch": 15.0,
-      "learning_rate": 8.378718056137412e-08,
-      "loss": 3.1362,
-      "step": 10050
-    },
-    {
-      "epoch": 15.0,
-      "eval_cer": 1.0,
-      "eval_loss": 3.688339948654175,
-      "eval_new_wer": 1.0,
-      "eval_old_wer": 1.0,
-      "eval_runtime": 6.6264,
-      "eval_samples_per_second": 27.164,
-      "eval_steps_per_second": 3.471,
-      "step": 10050
     }
   ],
   "max_steps": 10050,
   "num_train_epochs": 15,
-  "total_flos": 7.632809641470351e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 670,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
     {
       "epoch": 1.0,
       "learning_rate": 9.832425638877252e-05,
+      "loss": 16.2547,
       "step": 670
     },
     {
       "epoch": 1.0,
       "eval_cer": 1.0,
+      "eval_loss": 3.4289255142211914,
       "eval_new_wer": 1.0,
       "eval_old_wer": 1.0,
+      "eval_runtime": 6.8022,
+      "eval_samples_per_second": 26.462,
+      "eval_steps_per_second": 3.381,
       "step": 670
     }
   ],
   "max_steps": 10050,
   "num_train_epochs": 15,
+  "total_flos": 4.9786204745604096e+17,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0d4e1ecc5fa26f638726cb7298e2320d46fa3abc13a5d3f54489ef31ef42a5be
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:10f57580858b49a35243099dbdd8cae4d75b5c98e2ac927e2270c781b5291665
 size 3387

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:823124d7b3c57a5d49f76380cfdef993242c2f09379aad159cd616aa33d53e83
 size 377646433

 version https://git-lfs.github.com/spec/v1
+oid sha256:78b8af0529522cbae8a484627f1931663045d8e1f9d51e2919c7c377f92e91cf
 size 377646433

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0d4e1ecc5fa26f638726cb7298e2320d46fa3abc13a5d3f54489ef31ef42a5be
 size 3387

 version https://git-lfs.github.com/spec/v1
+oid sha256:10f57580858b49a35243099dbdd8cae4d75b5c98e2ac927e2270c781b5291665
 size 3387