Training in progress, step 155000

Browse files

Files changed (10) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +62 -2
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:340c057c14851ae833de3cc710450e92f28b73faba3e6e2b797775c590c9112f
 size 402588883

 version https://git-lfs.github.com/spec/v1
+oid sha256:180bd8afcb8ea5ad3ae5a04d5f826ec4d98e9451644a379bcab2f975d3632c6f
 size 402588883

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ed3477a9cbd8106a26fce5dc6885670b82a628ff97f5f44a25b28c6803baa0b7
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:0454b1e243d2b5dca220df0685fba6335eb1b63797f2431af905499564f43e15
 size 201355195

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78bfcdc5f8d31603c243202ea2e17ab1950c927dc5c5016fae62b983ebe9e1e1
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:70b73a32ed5abbbe50bd03d52cbc0d9f97f3bad9c8c83394d1113e5e9a9c7c63
 size 14503

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ddbbbcc0085c3c3412d4ad08f1489a0e2b5ac8e2c094ba1211fb11dee05d5e38
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:4f22de639dadaf8f5ca48485412759765d7b50886c5fd569dc2a771bad6b9966
 size 14503

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c129f476dc2862f36a419e15a11aed6247ca6f392bcfb1f0e011d6fd682b02d0
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:b862981d7b744793ba14de4eb91fa95c39e539315482c513f3de839b7f196be9
 size 14503

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eff4296aefa46c24bf3575f40d88d08cfe8b434da2fa9f20d5131da4319a6071
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:a842a7ac403f25c499f6e5769786574ac0afe54e735c6b7d2cf5e5b07eb1651b
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:602374283a35c3573b57bcdea4b872e46b2c01ee008a17814427fffa842d87fa
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:ae031280daf8907f446f3bdbb161df8e5e839f1f031c6cce17991477b9b4dddf
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7e39b8e2ce44c4392d7d60aaf96fb597369284a27e068da332c89dde5d5e7950
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:068e1b75a2254acb81dd3afc8ec00c3c6ffb9c49ea1f1957f47f3efdd8db87e2
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 2.5531867813890945,
-  "global_step": 150000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1806,6 +1806,66 @@
       "learning_rate": 0.0001211659584640809,
       "loss": 0.3427,
       "step": 150000
     }
   ],
   "max_steps": 500000,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 2.63829244006434,
+  "global_step": 155000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 0.0001211659584640809,
       "loss": 0.3427,
       "step": 150000
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 0.00012098789141193026,
+      "loss": 0.3423,
+      "step": 150500
+    },
+    {
+      "epoch": 2.57,
+      "learning_rate": 0.00012080941982583888,
+      "loss": 0.3425,
+      "step": 151000
+    },
+    {
+      "epoch": 2.58,
+      "learning_rate": 0.00012063054546724922,
+      "loss": 0.3425,
+      "step": 151500
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 0.00012045127010157905,
+      "loss": 0.3426,
+      "step": 152000
+    },
+    {
+      "epoch": 2.6,
+      "learning_rate": 0.00012027195524467175,
+      "loss": 0.3422,
+      "step": 152500
+    },
+    {
+      "epoch": 2.6,
+      "learning_rate": 0.00012009188397006361,
+      "loss": 0.342,
+      "step": 153000
+    },
+    {
+      "epoch": 2.61,
+      "learning_rate": 0.00011991141700474647,
+      "loss": 0.3422,
+      "step": 153500
+    },
+    {
+      "epoch": 2.62,
+      "learning_rate": 0.00011973055612985635,
+      "loss": 0.3417,
+      "step": 154000
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 0.00011954930313041712,
+      "loss": 0.3416,
+      "step": 154500
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 0.00011936802347035692,
+      "loss": 0.3417,
+      "step": 155000
     }
   ],
   "max_steps": 500000,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ed3477a9cbd8106a26fce5dc6885670b82a628ff97f5f44a25b28c6803baa0b7
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:0454b1e243d2b5dca220df0685fba6335eb1b63797f2431af905499564f43e15
 size 201355195