Training in progress, step 1000

Browse files

Files changed (10) hide show

{checkpoint-700 → checkpoint-1000}/config.json +0 -0
{checkpoint-700 → checkpoint-1000}/optimizer.pt +1 -1
{checkpoint-700 → checkpoint-1000}/preprocessor_config.json +0 -0
{checkpoint-700 → checkpoint-1000}/pytorch_model.bin +1 -1
{checkpoint-700 → checkpoint-1000}/rng_state.pth +1 -1
{checkpoint-700 → checkpoint-1000}/scaler.pt +1 -1
{checkpoint-700 → checkpoint-1000}/scheduler.pt +1 -1
{checkpoint-700 → checkpoint-1000}/trainer_state.json +210 -3
{checkpoint-700 → checkpoint-1000}/training_args.bin +0 -0
pytorch_model.bin +1 -1

{checkpoint-700 → checkpoint-1000}/config.json RENAMED Viewed

File without changes

{checkpoint-700 → checkpoint-1000}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:069822e7cb50437bf3b0c3c681ba2097aca5275abda255e4fc6af68096387a0f
 size 2490346001

 version https://git-lfs.github.com/spec/v1
+oid sha256:7366ea0f0c13b52774f5b65c9237727cabcae8df11565fda3d45477aa2f04998
 size 2490346001

{checkpoint-700 → checkpoint-1000}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-700 → checkpoint-1000}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f82fd4ef9d1ee16be752146f67271d9079ee4c70b3fc0deb5e49afca834a8366
 size 1262067185

 version https://git-lfs.github.com/spec/v1
+oid sha256:215e82f2b95ddb6481797f61b17faad7070953e16644208286be9592449527ca
 size 1262067185

{checkpoint-700 → checkpoint-1000}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:87ff61a351af84ca56c488c49a3cc628f0fcf141b18f2d6a7cc51cc4bc0d60cf
 size 14567

 version https://git-lfs.github.com/spec/v1
+oid sha256:5a99d24035e5ff3cbd9dc315b818c70efc6bc64689f3aea3ad3aeea51446c2e6
 size 14567

{checkpoint-700 → checkpoint-1000}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f78925f079cf346f5de839091ad9ea905df589af85f400d7d4ba825eb420db33
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:9b5445ebb608f848fc4858bff0aee1c5e183c4aaa9123cfc6cd096717ff96db5
 size 559

{checkpoint-700 → checkpoint-1000}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8642bc4d6c53b743cbfe106c9335222647650f89ec52d95e575d8e1f87f4f2be
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:51077c0775f8e63b91513c5020d22be0afef1f97e1846c4b1d969f7f83bbe0d8
 size 623

{checkpoint-700 → checkpoint-1000}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.3229527104959631,
-  "global_step": 700,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -489,11 +489,218 @@
       "eval_steps_per_second": 1.12,
       "eval_wer": 0.9999694058618369,
       "step": 700
     }
   ],
   "max_steps": 6501,
   "num_train_epochs": 3,
-  "total_flos": 1.3228060515474647e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.461361014994233,
+  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 1.12,
       "eval_wer": 0.9999694058618369,
       "step": 700
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 6.838304552590267e-05,
+      "loss": 2.9139,
+      "step": 710
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 6.826530612244897e-05,
+      "loss": 2.9957,
+      "step": 720
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 6.814756671899528e-05,
+      "loss": 2.9842,
+      "step": 730
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 6.802982731554159e-05,
+      "loss": 3.2804,
+      "step": 740
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.792386185243327e-05,
+      "loss": 3.4944,
+      "step": 750
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.780612244897958e-05,
+      "loss": 2.9905,
+      "step": 760
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 6.768838304552589e-05,
+      "loss": 2.9692,
+      "step": 770
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 6.757064364207221e-05,
+      "loss": 2.9747,
+      "step": 780
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 6.745290423861852e-05,
+      "loss": 3.294,
+      "step": 790
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 6.73469387755102e-05,
+      "loss": 3.5998,
+      "step": 800
+    },
+    {
+      "epoch": 0.37,
+      "eval_loss": 3.059178590774536,
+      "eval_runtime": 129.2337,
+      "eval_samples_per_second": 35.749,
+      "eval_steps_per_second": 1.122,
+      "eval_wer": 1.0,
+      "step": 800
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 6.72291993720565e-05,
+      "loss": 2.9902,
+      "step": 810
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 6.711145996860281e-05,
+      "loss": 2.9644,
+      "step": 820
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 6.699372056514913e-05,
+      "loss": 2.9529,
+      "step": 830
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 6.687598116169544e-05,
+      "loss": 3.2737,
+      "step": 840
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 6.677001569858712e-05,
+      "loss": 3.6534,
+      "step": 850
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 6.665227629513343e-05,
+      "loss": 2.9664,
+      "step": 860
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 6.653453689167974e-05,
+      "loss": 2.9463,
+      "step": 870
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 6.641679748822606e-05,
+      "loss": 2.9591,
+      "step": 880
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 6.629905808477237e-05,
+      "loss": 3.2701,
+      "step": 890
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 6.618131868131867e-05,
+      "loss": 3.3784,
+      "step": 900
+    },
+    {
+      "epoch": 0.42,
+      "eval_loss": 3.0334482192993164,
+      "eval_runtime": 129.072,
+      "eval_samples_per_second": 35.794,
+      "eval_steps_per_second": 1.123,
+      "eval_wer": 1.0,
+      "step": 900
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 6.606357927786498e-05,
+      "loss": 2.9729,
+      "step": 910
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 6.594583987441129e-05,
+      "loss": 2.9444,
+      "step": 920
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 6.582810047095761e-05,
+      "loss": 2.9441,
+      "step": 930
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 6.571036106750392e-05,
+      "loss": 3.2629,
+      "step": 940
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 6.56043956043956e-05,
+      "loss": 3.6467,
+      "step": 950
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 6.548665620094191e-05,
+      "loss": 2.9472,
+      "step": 960
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 6.536891679748822e-05,
+      "loss": 2.9301,
+      "step": 970
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 6.525117739403452e-05,
+      "loss": 2.9555,
+      "step": 980
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 6.513343799058084e-05,
+      "loss": 3.2888,
+      "step": 990
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 6.502747252747253e-05,
+      "loss": 3.6354,
+      "step": 1000
+    },
+    {
+      "epoch": 0.46,
+      "eval_loss": 2.9995181560516357,
+      "eval_runtime": 128.998,
+      "eval_samples_per_second": 35.815,
+      "eval_steps_per_second": 1.124,
+      "eval_wer": 1.0,
+      "step": 1000
     }
   ],
   "max_steps": 6501,
   "num_train_epochs": 3,
+  "total_flos": 1.8908999903639437e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-700 → checkpoint-1000}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:03c4ad43954ff5d68a16a7e40b86626a429d98e2fdeccfd745f3e2d0f37d6ea5
 size 1262067185

 version https://git-lfs.github.com/spec/v1
+oid sha256:215e82f2b95ddb6481797f61b17faad7070953e16644208286be9592449527ca
 size 1262067185