Training in progress, step 170000

Browse files

Files changed (10) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +62 -2
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:036aa766680514ebd6de901bdce97db53f0d37ca399d80b47ef766eb1bfc07af
 size 402588883

 version https://git-lfs.github.com/spec/v1
+oid sha256:602836472b5e2c722465609242f7a47d056ce7ba46e7a86301fef60ff775ce83
 size 402588883

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b8a22485edc13dba34e8db83180d2c2081cf07a4481b12bb65b2efc00098593e
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:c26aab368e09302dcf13e7d296cef18de072ca0cd67c5e930b7cbc403c13a86d
 size 201355195

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3906b7bf9b2299d26cf2c3bb194cd599ad2ab76018d03dc2b0848a7b379518c6
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:c05bfeb5e98bce683190574682f813e2a522697190e69ee10bf7a068f93b6976
 size 14503

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5c35974bf9bd4c8745f9376e1b44780a74da197e9bc52f8e04c7df7d58bd88ab
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:f01f5f84e3a31f42df04145fae58f6f7b1f4506d8b1fe2fb28025394ec8cb07e
 size 14503

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84410c327199006a774462587e14b56cd0625ce7dea9dc2d950e65b384e19400
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:10e21d463f6e7cd0c9117ab55e1ffd1516f0bf98cf844492234460cda5925bd4
 size 14503

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f2084089a60ac88585fd1ad4a3050aa7d4e52c87b4c2533fca1237f1fd63e24d
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:6a2d31392d162b7d4d2268dd187329a9f9784b8b62661a5b232ff40ede5f5e92
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e11d7a4429ee3329729eddce2fc923bf2e9c12b836aecdb35beb8451fcb77a64
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:92e5f3bbd27916276b7daba9adf7aec1e0ea749af3982c865282b426347aa9a4
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65cadebf6576eff943bbe91b7eec7f11ed6ac3d8a79550cd75c237196b314951
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:edb9d0fd6374cceb9b089b55b43f947afaefabbdd3f8ebab7e2dcb2476738627
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 2.8085037574148304,
-  "global_step": 165000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1986,6 +1986,66 @@
       "learning_rate": 0.0001156586388892709,
       "loss": 0.3405,
       "step": 165000
     }
   ],
   "max_steps": 500000,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 2.893609416090076,
+  "global_step": 170000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 0.0001156586388892709,
       "loss": 0.3405,
       "step": 165000
+    },
+    {
+      "epoch": 2.82,
+      "learning_rate": 0.00011546922402047642,
+      "loss": 0.3403,
+      "step": 165500
+    },
+    {
+      "epoch": 2.83,
+      "learning_rate": 0.00011527945908476035,
+      "loss": 0.3409,
+      "step": 166000
+    },
+    {
+      "epoch": 2.83,
+      "learning_rate": 0.000115089345955026,
+      "loss": 0.3406,
+      "step": 166500
+    },
+    {
+      "epoch": 2.84,
+      "learning_rate": 0.00011489926777088424,
+      "loss": 0.3406,
+      "step": 167000
+    },
+    {
+      "epoch": 2.85,
+      "learning_rate": 0.00011470846457254845,
+      "loss": 0.3403,
+      "step": 167500
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 0.00011451731881567971,
+      "loss": 0.3402,
+      "step": 168000
+    },
+    {
+      "epoch": 2.87,
+      "learning_rate": 0.00011432583238680949,
+      "loss": 0.3405,
+      "step": 168500
+    },
+    {
+      "epoch": 2.88,
+      "learning_rate": 0.00011413400717583146,
+      "loss": 0.3401,
+      "step": 169000
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 0.00011394184507598311,
+      "loss": 0.3398,
+      "step": 169500
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 0.00011374934798382673,
+      "loss": 0.3396,
+      "step": 170000
     }
   ],
   "max_steps": 500000,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b8a22485edc13dba34e8db83180d2c2081cf07a4481b12bb65b2efc00098593e
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:c26aab368e09302dcf13e7d296cef18de072ca0cd67c5e930b7cbc403c13a86d
 size 201355195