Training in progress, epoch 3

Browse files

Files changed (10) hide show

{checkpoint-96 → checkpoint-384}/config.json +0 -0
{checkpoint-96 → checkpoint-384}/optimizer.pt +2 -2
{checkpoint-96 → checkpoint-384}/preprocessor_config.json +0 -0
{checkpoint-96 → checkpoint-384}/pytorch_model.bin +1 -1
{checkpoint-96 → checkpoint-384}/rng_state.pth +2 -2
{checkpoint-96 → checkpoint-384}/scaler.pt +1 -1
{checkpoint-96 → checkpoint-384}/scheduler.pt +1 -1
{checkpoint-96 → checkpoint-384}/trainer_state.json +48 -3
{checkpoint-96 → checkpoint-384}/training_args.bin +0 -0
pytorch_model.bin +1 -1

{checkpoint-96 → checkpoint-384}/config.json RENAMED Viewed

File without changes

{checkpoint-96 → checkpoint-384}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c55e930ed4249341e99a4c46286f740db87be4e84bd738a4c4ef34f432eeabf6
-size 2490337361

 version https://git-lfs.github.com/spec/v1
+oid sha256:bccdf1951285bc8f144e548c876fbba29c6232b75d96f576898dd120c4e52c32
+size 2490337809

{checkpoint-96 → checkpoint-384}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-96 → checkpoint-384}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4b3d7adc84f99873379ee01a5b7bece995841b13eb00f32cc9e0820a51bff003
 size 1262063089

 version https://git-lfs.github.com/spec/v1
+oid sha256:39cd4931c86a20e934a7a6a159fcff1ae2afc563726fc1d6f8d1d4b9ddf31f04
 size 1262063089

{checkpoint-96 → checkpoint-384}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3954dc971c4bbccd0f85caf4847af99e2e7855f973ba533949cc40f358a7ad26
-size 14631

 version https://git-lfs.github.com/spec/v1
+oid sha256:326defae442174688b8a39c89a59d4cd08f602e59d0f8c786318fe121dc96f13
+size 14567

{checkpoint-96 → checkpoint-384}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:85781709d7068a117043a04686e2279506d06f7c98e4956a70cb9d522e7edbb7
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:f500d0462151884dfc3fb596f7314ea368243375fee037876ece3f34632a4556
 size 559

{checkpoint-96 → checkpoint-384}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ae5d8befbb39b76a1e9e1dec9fe376e2b4c979f54b3926eba16675473b185bfc
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:3339333fbf9f04b9505e1075b6ae46b18caeefdc727f16807fe4be87e1daff43
 size 623

{checkpoint-96 → checkpoint-384}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.9974025974025974,
-  "global_step": 96,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -15,11 +15,56 @@
       "eval_steps_per_second": 0.839,
       "eval_wer": 1.0021133629565406,
       "step": 96
     }
   ],
   "max_steps": 19200,
   "num_train_epochs": 200,
-  "total_flos": 1.4911839837896755e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 3.9974025974025973,
+  "global_step": 384,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.839,
       "eval_wer": 1.0021133629565406,
       "step": 96
+    },
+    {
+      "epoch": 1.04,
+      "learning_rate": 1.5156249999999998e-06,
+      "loss": 15.219,
+      "step": 100
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 17.49703025817871,
+      "eval_runtime": 186.0672,
+      "eval_samples_per_second": 27.114,
+      "eval_steps_per_second": 0.849,
+      "eval_wer": 1.0,
+      "step": 192
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 3.0781249999999994e-06,
+      "loss": 14.7046,
+      "step": 200
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 11.056963920593262,
+      "eval_runtime": 184.9586,
+      "eval_samples_per_second": 27.276,
+      "eval_steps_per_second": 0.854,
+      "eval_wer": 1.0,
+      "step": 288
+    },
+    {
+      "epoch": 3.12,
+      "learning_rate": 4.640624999999999e-06,
+      "loss": 11.6089,
+      "step": 300
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 5.172672271728516,
+      "eval_runtime": 185.1159,
+      "eval_samples_per_second": 27.253,
+      "eval_steps_per_second": 0.854,
+      "eval_wer": 1.0,
+      "step": 384
     }
   ],
   "max_steps": 19200,
   "num_train_epochs": 200,
+  "total_flos": 5.964637507404861e+18,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-96 → checkpoint-384}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:93ae39ff149e15fe177c2e150a25cfc9f072552e2017ffd7b6a8d1279dd15fc9
 size 1262063089

 version https://git-lfs.github.com/spec/v1
+oid sha256:39cd4931c86a20e934a7a6a159fcff1ae2afc563726fc1d6f8d1d4b9ddf31f04
 size 1262063089