Training in progress, step 95000

Browse files

Files changed (10) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +62 -2
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7ec6dc111e6167617249a4034f667ff8c1dac4e0508b2d117f87c2a48b53f992
 size 402588883

 version https://git-lfs.github.com/spec/v1
+oid sha256:49d2f9fd02baa9e0c22f5c82248312a95a270b3a028effebe32e1392f0c37fc2
 size 402588883

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fd1a954286945255af2c2f6a9caa52188dcc39909af1998372c65c068243f847
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ac5235992e9611032e2c41f60afcde835225966992d0ea5cfd4d0eda9cba8a0
 size 201355195

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fd75299155a785e038cc2034bc0ffae9f55e960c94bd0d7eeb1f0123fe91a7b9
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:c9fe8c1f3fa28b12c9d2a65af760b0b35f65714034bb64c832234a8f24b344c8
 size 14503

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1a9f62023cae76e82d48aee2a952f4c6d76c642cc4db4f90dd6af1d183efff25
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:a8ec81724571758b6d4301f68ec67b23dd77b1dc5a0ab1a193ecd39032e5dfcc
 size 14503

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6fb5901ddeb1cfbe18f3314a87d55dbe2efa71565718ac2ab36838d79b0ca129
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:2c4a0b2174a92c44f50fd38251e945dda3c30ecce8231dab22a5b071d4e60c46
 size 14503

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:143c38b79821877e7c44d516c39a7e7355c53315c2e2279c91582047957f2c7c
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:861db5ae944afe794057fd5610f75a42f98fa68025a2916d28fc7185e4e6d801
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:03c7bc8447e7ec329f5ebcdbdba23f6503dd9b1599722a7f3d541e97e65b905e
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:2a0f946614c19c2972db15bb634815fba8ed2e0baad2e81053291315bbb52cc8
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88745b2213b88b884ae47af09195b94e85097099ce2e5b5e82db98c713a418d9
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:103fe1f064bd97ae5baa548336c4edee90a9847277e285efd11ebc1b1de7fd09
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.5319103667202834,
-  "global_step": 90000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1086,6 +1086,66 @@
       "learning_rate": 0.00013911237967573605,
       "loss": 0.3541,
       "step": 90000
     }
   ],
   "max_steps": 500000,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.6170160253955286,
+  "global_step": 95000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 0.00013911237967573605,
       "loss": 0.3541,
       "step": 90000
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 0.0001389943003647822,
+      "loss": 0.3539,
+      "step": 90500
+    },
+    {
+      "epoch": 1.55,
+      "learning_rate": 0.00013887563880390073,
+      "loss": 0.3536,
+      "step": 91000
+    },
+    {
+      "epoch": 1.56,
+      "learning_rate": 0.0001387563961642333,
+      "loss": 0.3537,
+      "step": 91500
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 0.00013863657362265668,
+      "loss": 0.3549,
+      "step": 92000
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 0.0001385161723617709,
+      "loss": 0.3539,
+      "step": 92500
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 0.00013839519356988788,
+      "loss": 0.3535,
+      "step": 93000
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 0.0001382736384410194,
+      "loss": 0.3537,
+      "step": 93500
+    },
+    {
+      "epoch": 1.6,
+      "learning_rate": 0.00013815150817486554,
+      "loss": 0.3527,
+      "step": 94000
+    },
+    {
+      "epoch": 1.61,
+      "learning_rate": 0.0001380288039768027,
+      "loss": 0.3529,
+      "step": 94500
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 0.00013790552705787178,
+      "loss": 0.353,
+      "step": 95000
     }
   ],
   "max_steps": 500000,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fd1a954286945255af2c2f6a9caa52188dcc39909af1998372c65c068243f847
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ac5235992e9611032e2c41f60afcde835225966992d0ea5cfd4d0eda9cba8a0
 size 201355195