Training in progress, step 33, checkpoint

Browse files

Files changed (8) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +60 -4

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:923b73a88308bb0d1d1cb0c219b95ae0f2c9d701ac17626333ea058ada85f809
 size 335604696

 version https://git-lfs.github.com/spec/v1
+oid sha256:65afd1fbfb289acdfc2dad9ab51171e3c47ae51c1f7fa56be3775c40bf49e722
 size 335604696

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:80058062562e6d82f489cfdbf83de2f34d2b98eded5d6dfbb3e3d0ef19d0d2a4
 size 671466706

 version https://git-lfs.github.com/spec/v1
+oid sha256:e3658547d28c3a6e869f7ff40c443d6693285979de668f3d88204f1ba3dfbcd7
 size 671466706

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a4370452686fcd9a18215a07354b2da2386fa3cd7e6ce298b5bf17d885387d3c
 size 15024

 version https://git-lfs.github.com/spec/v1
+oid sha256:e65457c496b52a3dfee048d2351edf3bdd77f1d0d91a73d32b6ffece8c2629df
 size 15024

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c2fd01b0471130b62e04ab9901bd5133d77aa02cdf83327c22671b8f2a3c5218
 size 15024

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc5b7017b2d9c7d92c1bcbd6ba1e8a45be0084fd0db5062263165298ec8d1792
 size 15024

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b78aa7a3cff5624d66e1cb35cdf67a0e0823349725146cedaf218a1f0342ff32
 size 15024

 version https://git-lfs.github.com/spec/v1
+oid sha256:7651419a43670ff1865f0cf3e1cdc4d1de812555470f86ee8be7fca6e8cb35e8
 size 15024

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6f166aba3cda0798d535aba25a21add4274fa102347f26d09727980e297e8967
 size 15024

 version https://git-lfs.github.com/spec/v1
+oid sha256:c0b35caf84524dc8db4b2a3d75b4084ca310f0916a4c8150eff2d9512bcc8b12
 size 15024

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3277e7386e7d1f090188f038a1b7e93c95ae7289f4d9bd037cfc517b4000a96
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:241e4bf4fc78d16a947d399dce6bc1d0f0ed33816fbcbf4d95fdfe0f51a1eea8
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 0.6004818081855774,
   "best_model_checkpoint": "miner_id_24/checkpoint-25",
-  "epoch": 2.3255813953488373,
   "eval_steps": 25,
-  "global_step": 25,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -198,6 +198,62 @@
       "eval_samples_per_second": 14.266,
       "eval_steps_per_second": 3.709,
       "step": 25
     }
   ],
   "logging_steps": 1,
@@ -221,12 +277,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 2.994299446839214e+17,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 0.6004818081855774,
   "best_model_checkpoint": "miner_id_24/checkpoint-25",
+  "epoch": 3.0697674418604652,
   "eval_steps": 25,
+  "global_step": 33,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 14.266,
       "eval_steps_per_second": 3.709,
       "step": 25
+    },
+    {
+      "epoch": 2.4186046511627906,
+      "grad_norm": 0.2399173527956009,
+      "learning_rate": 2.0855884478824412e-05,
+      "loss": 0.4546,
+      "step": 26
+    },
+    {
+      "epoch": 2.511627906976744,
+      "grad_norm": 0.21842080354690552,
+      "learning_rate": 1.806564514567258e-05,
+      "loss": 0.4159,
+      "step": 27
+    },
+    {
+      "epoch": 2.604651162790698,
+      "grad_norm": 0.09714235365390778,
+      "learning_rate": 1.5654402273493805e-05,
+      "loss": 0.3683,
+      "step": 28
+    },
+    {
+      "epoch": 2.697674418604651,
+      "grad_norm": 0.1338994950056076,
+      "learning_rate": 1.3646898477089626e-05,
+      "loss": 0.405,
+      "step": 29
+    },
+    {
+      "epoch": 2.7906976744186047,
+      "grad_norm": 0.18371757864952087,
+      "learning_rate": 1.2063733461997805e-05,
+      "loss": 0.4067,
+      "step": 30
+    },
+    {
+      "epoch": 2.883720930232558,
+      "grad_norm": 0.12735600769519806,
+      "learning_rate": 1.092115264363775e-05,
+      "loss": 0.4753,
+      "step": 31
+    },
+    {
+      "epoch": 2.9767441860465116,
+      "grad_norm": 0.1807902604341507,
+      "learning_rate": 1.023088044736472e-05,
+      "loss": 0.4981,
+      "step": 32
+    },
+    {
+      "epoch": 3.0697674418604652,
+      "grad_norm": 0.3723318576812744,
+      "learning_rate": 1e-05,
+      "loss": 0.4004,
+      "step": 33
     }
   ],
   "logging_steps": 1,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 3.953855388419359e+17,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null