Training in progress, step 1100

Browse files

Files changed (10) hide show

{checkpoint-800 → checkpoint-1100}/config.json +0 -0
{checkpoint-800 → checkpoint-1100}/optimizer.pt +1 -1
{checkpoint-800 → checkpoint-1100}/preprocessor_config.json +0 -0
{checkpoint-800 → checkpoint-1100}/pytorch_model.bin +1 -1
{checkpoint-800 → checkpoint-1100}/rng_state.pth +2 -2
{checkpoint-800 → checkpoint-1100}/scaler.pt +1 -1
{checkpoint-800 → checkpoint-1100}/scheduler.pt +1 -1
{checkpoint-800 → checkpoint-1100}/trainer_state.json +120 -3
{checkpoint-800 → checkpoint-1100}/training_args.bin +0 -0
pytorch_model.bin +1 -1

{checkpoint-800 → checkpoint-1100}/config.json RENAMED Viewed

File without changes

{checkpoint-800 → checkpoint-1100}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3228c2d654fd3d25a0ad00a301f5ce6f4265d0cc4c922a869f44a37a2b0f0f2
 size 2490337809

 version https://git-lfs.github.com/spec/v1
+oid sha256:d2764c7b6a7ab8b996c7f8b013c511bd3930da2122168a0414e1ca544a9e84f2
 size 2490337809

{checkpoint-800 → checkpoint-1100}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-800 → checkpoint-1100}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:83f2151485570eebb9c2c7ead79b5dbb947c911745136ec08aec4531150fc59d
 size 1262063089

 version https://git-lfs.github.com/spec/v1
+oid sha256:f52f572d7d82915632c807843bc385396652654a3642cc0c48a960f29f61ae2c
 size 1262063089

{checkpoint-800 → checkpoint-1100}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:191ab0b0b7f850bd200dd0e9733735c31b1e7d63b3150165c4de6c4a12c5ef5e
-size 14567

 version https://git-lfs.github.com/spec/v1
+oid sha256:ecce699b9acc62a6e6d026fa16dc32a7b0705c4e3b0ae1ece12b2b69d2fab156
+size 14503

{checkpoint-800 → checkpoint-1100}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0c2074cdcefbaa0a39f736d6b0f7bf018c350d49e85648bc8accc4f756ad816e
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:9fb16c30b686aa43e110b0d33f9d46bf3127b7124542ca8dc34831233d4675a0
 size 559

{checkpoint-800 → checkpoint-1100}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:595ce5051ecea72321f0a4e15d7e1d59293398355f90dbde31fcccb29f2b4f95
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:00e7aeb62a4a52ddfec85a856a87b7012a808e573de75503e41cc84ea035b66c
 size 623

{checkpoint-800 → checkpoint-1100}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 8.78688524590164,
-  "global_step": 800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -318,11 +318,128 @@
       "eval_steps_per_second": 0.792,
       "eval_wer": 1.0,
       "step": 800
     }
   ],
   "max_steps": 4550,
   "num_train_epochs": 50,
-  "total_flos": 1.2402928809554872e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 12.087431693989071,
+  "global_step": 1100,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.792,
       "eval_wer": 1.0,
       "step": 800
+    },
+    {
+      "epoch": 9.01,
+      "learning_rate": 0.0001025,
+      "loss": 2.8933,
+      "step": 820
+    },
+    {
+      "epoch": 9.23,
+      "learning_rate": 0.000105,
+      "loss": 2.7318,
+      "step": 840
+    },
+    {
+      "epoch": 9.45,
+      "learning_rate": 0.0001075,
+      "loss": 2.5941,
+      "step": 860
+    },
+    {
+      "epoch": 9.67,
+      "learning_rate": 0.00011,
+      "loss": 2.4441,
+      "step": 880
+    },
+    {
+      "epoch": 9.89,
+      "learning_rate": 0.00011250000000000001,
+      "loss": 2.2931,
+      "step": 900
+    },
+    {
+      "epoch": 9.89,
+      "eval_loss": 1.5057899951934814,
+      "eval_runtime": 196.4368,
+      "eval_samples_per_second": 24.654,
+      "eval_steps_per_second": 0.774,
+      "eval_wer": 0.9775759296054499,
+      "step": 900
+    },
+    {
+      "epoch": 10.11,
+      "learning_rate": 0.000115,
+      "loss": 2.1999,
+      "step": 920
+    },
+    {
+      "epoch": 10.33,
+      "learning_rate": 0.0001175,
+      "loss": 2.0574,
+      "step": 940
+    },
+    {
+      "epoch": 10.55,
+      "learning_rate": 0.00012,
+      "loss": 1.9672,
+      "step": 960
+    },
+    {
+      "epoch": 10.77,
+      "learning_rate": 0.0001225,
+      "loss": 1.9015,
+      "step": 980
+    },
+    {
+      "epoch": 10.98,
+      "learning_rate": 0.000125,
+      "loss": 1.8427,
+      "step": 1000
+    },
+    {
+      "epoch": 10.98,
+      "eval_loss": 0.9154536724090576,
+      "eval_runtime": 203.1168,
+      "eval_samples_per_second": 23.843,
+      "eval_steps_per_second": 0.748,
+      "eval_wer": 0.7832245245529378,
+      "step": 1000
+    },
+    {
+      "epoch": 11.21,
+      "learning_rate": 0.0001275,
+      "loss": 1.8155,
+      "step": 1020
+    },
+    {
+      "epoch": 11.43,
+      "learning_rate": 0.00013000000000000002,
+      "loss": 1.6767,
+      "step": 1040
+    },
+    {
+      "epoch": 11.64,
+      "learning_rate": 0.00013250000000000002,
+      "loss": 1.5184,
+      "step": 1060
+    },
+    {
+      "epoch": 11.86,
+      "learning_rate": 0.000135,
+      "loss": 1.4505,
+      "step": 1080
+    },
+    {
+      "epoch": 12.09,
+      "learning_rate": 0.0001375,
+      "loss": 1.4286,
+      "step": 1100
+    },
+    {
+      "epoch": 12.09,
+      "eval_loss": 0.4074769914150238,
+      "eval_runtime": 194.7798,
+      "eval_samples_per_second": 24.864,
+      "eval_steps_per_second": 0.78,
+      "eval_wer": 0.37964802724950325,
+      "step": 1100
     }
   ],
   "max_steps": 4550,
   "num_train_epochs": 50,
+  "total_flos": 1.7049406331377541e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-800 → checkpoint-1100}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8dccfbc86aa27461d23f7422a406db1866d4a1ca82d159e2b5e3bcbdbc5a4a7a
 size 1262063089

 version https://git-lfs.github.com/spec/v1
+oid sha256:f52f572d7d82915632c807843bc385396652654a3642cc0c48a960f29f61ae2c
 size 1262063089