Training in progress, step 310000

Browse files

Files changed (10) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +62 -2
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b86ec373a87fb848fa4c282e9da6c641866d8edb18a6a07e31822093e14b8a32
 size 402588883

 version https://git-lfs.github.com/spec/v1
+oid sha256:11ba1af3ca07f05b59a0f9d045b8502a890e39d6d713b1a68a79774487c538c4
 size 402588883

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e6217ad6a566e562ec9964ed6e3830bc2763400ee37cbfda59f6766a1f173da6
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:33044061cdae69282e0841e3fa8fb5cc7bb7ba2c335ee94c43ec527fde5de60a
 size 201355195

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3e6690b65f996aad073f44b6a151e106e9bf8f5dcfec0f8d72e915bb0c1a22c8
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:d9e955485a8b6c2204c1cd05e7146bc3d8d4aea199220bdeb0763bf9b3fe4990
 size 14503

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0c0c8d01ae095dee6e5e4685c890f66e2752139031cf4077d57c5d1c40f8e6ce
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:a40eb8bd77540d5f51aa2626d7dc28a426fa540c25aaff397ab33d9c2cfc9ca6
 size 14503

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2226ba585a0a6d657ab1dce069794831a3bd1b186c469994072b8cc66bfa981b
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:aedd0ee2fba46776b8e9a3d54ff8ed40a6879de49804fa15d3dcd9b89d1ec8a0
 size 14503

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a3a4792182bacddada4a6f975c636f0e268d13755c75e2dd224565c52ba57f7b
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:bbedddb259fec8d39a25799576be00b42005bed9171320d734f89be1d9f42f86
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5d215fe8a0a89c578e7fd4f09fe2912ad7664506d3316781377f0651d2cead23
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:513b23ca2b61699867f7e4f0e83f6e0bf3f9836045ea9437165be2c511401531
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:332054eb74ed5aecc1eead210fb6e690d9e0ffcc73d31549e00b4a47cd460ca8
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:1db0c9d6f53ee9862fd806add4b35c4edb1edf9c5abd3a62a1824f925a04677b
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 5.191487732019302,
-  "global_step": 305000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3666,6 +3666,66 @@
       "learning_rate": 5.633842476876674e-05,
       "loss": 0.3248,
       "step": 305000
     }
   ],
   "max_steps": 500000,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 5.276593390694547,
+  "global_step": 310000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 5.633842476876674e-05,
       "loss": 0.3248,
       "step": 305000
+    },
+    {
+      "epoch": 5.2,
+      "learning_rate": 5.6131574812333625e-05,
+      "loss": 0.3251,
+      "step": 305500
+    },
+    {
+      "epoch": 5.21,
+      "learning_rate": 5.592496042762104e-05,
+      "loss": 0.3251,
+      "step": 306000
+    },
+    {
+      "epoch": 5.22,
+      "learning_rate": 5.571858365382955e-05,
+      "loss": 0.3251,
+      "step": 306500
+    },
+    {
+      "epoch": 5.23,
+      "learning_rate": 5.5512446527814595e-05,
+      "loss": 0.325,
+      "step": 307000
+    },
+    {
+      "epoch": 5.23,
+      "learning_rate": 5.530655108406638e-05,
+      "loss": 0.3248,
+      "step": 307500
+    },
+    {
+      "epoch": 5.24,
+      "learning_rate": 5.5100899354689826e-05,
+      "loss": 0.3249,
+      "step": 308000
+    },
+    {
+      "epoch": 5.25,
+      "learning_rate": 5.4895903934754626e-05,
+      "loss": 0.3249,
+      "step": 308500
+    },
+    {
+      "epoch": 5.26,
+      "learning_rate": 5.469074522323032e-05,
+      "loss": 0.3249,
+      "step": 309000
+    },
+    {
+      "epoch": 5.27,
+      "learning_rate": 5.448624587103454e-05,
+      "loss": 0.325,
+      "step": 309500
+    },
+    {
+      "epoch": 5.28,
+      "learning_rate": 5.428158826048664e-05,
+      "loss": 0.3249,
+      "step": 310000
     }
   ],
   "max_steps": 500000,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e6217ad6a566e562ec9964ed6e3830bc2763400ee37cbfda59f6766a1f173da6
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:33044061cdae69282e0841e3fa8fb5cc7bb7ba2c335ee94c43ec527fde5de60a
 size 201355195