Training in progress, step 85000

Browse files

Files changed (10) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +62 -2
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:81b7562bdb5f8faadd0a5b65c7785e2e90c7a490a2d517760b2fd3790ff21fa6
 size 402588883

 version https://git-lfs.github.com/spec/v1
+oid sha256:e51fe3d77cc9e74a03015a679bf9c6e5b20948a91fec3a0a678f7ab3d632266b
 size 402588883

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5acd3a5ba17eb21f71e4b3d447f414429a59c91a0f7e46be8a0dd35e859d16b8
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:c035316a6d8fc5afe7f4bf5263646f9d28003e5dc92f6d7d8ca0dfcd6793a547
 size 201355195

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f6ac1dc083f6d9f681e725e424bbc3a537f99007bc80e9ec5d3de1580b2efd7e
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:366fcf2af7e77643d8ba291b8a66dfb537d4ef759595fd9e7a945bd15b02507a
 size 14503

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3f57b3e9d8a73989fe9797603663e6bb728be62b005d78dcfad9151e45cd55d
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:d3ec4b721b64709a3029a0a2cb04e18d166896dfa34d7fdfc8143f8d8565fa60
 size 14503

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e43b64a44eef5630d42417f02e38b9fb28b7598ada2873cd67e62b74ecb5ef79
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:4fb92796b14e92fd63e400d0d94dcf933348fe7696852142cff135a6ac92eff3
 size 14503

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d92421316a9dfafb1a555182d77547876e8df4fda5a4cc89de3afac2777482f9
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:58ff7b8548b63f48264cef8154875e50044ff9178a1ba8dad705f9e679474825
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cf4bafa60b699a6f31d50ef65345a6d8036c7593d5739566caa2305a2ecf2172
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:42b6574b57c2570000c9af4e77bbf53b450e6d4b62d98188361ee6a5f2aaa995
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ba4175cf663e1b18eb62a532a65b4ed6e0d23646843ce2ef7c2dd44a7e4a8f86
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:345b6e5a884c94f439eac86a159284d4991183aeed3398174ad1ad011c4a43d7
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.3616990493697925,
-  "global_step": 80000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -966,6 +966,66 @@
       "learning_rate": 0.00014134803491572606,
       "loss": 0.3542,
       "step": 80000
     }
   ],
   "max_steps": 500000,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.446804708045038,
+  "global_step": 85000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 0.00014134803491572606,
       "loss": 0.3542,
       "step": 80000
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 0.00014124203974129223,
+      "loss": 0.3539,
+      "step": 80500
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 0.00014113522832260466,
+      "loss": 0.3541,
+      "step": 81000
+    },
+    {
+      "epoch": 1.39,
+      "learning_rate": 0.00014102781352389485,
+      "loss": 0.3537,
+      "step": 81500
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 0.00014091979640530345,
+      "loss": 0.3535,
+      "step": 82000
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 0.00014081139586900036,
+      "loss": 0.3533,
+      "step": 82500
+    },
+    {
+      "epoch": 1.41,
+      "learning_rate": 0.0001407021785141258,
+      "loss": 0.3535,
+      "step": 83000
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 0.00014059236205325574,
+      "loss": 0.3536,
+      "step": 83500
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 0.00014048194757023435,
+      "loss": 0.353,
+      "step": 84000
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 0.00014037115877265014,
+      "loss": 0.353,
+      "step": 84500
+    },
+    {
+      "epoch": 1.45,
+      "learning_rate": 0.00014025955271103284,
+      "loss": 0.3529,
+      "step": 85000
     }
   ],
   "max_steps": 500000,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5acd3a5ba17eb21f71e4b3d447f414429a59c91a0f7e46be8a0dd35e859d16b8
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:c035316a6d8fc5afe7f4bf5263646f9d28003e5dc92f6d7d8ca0dfcd6793a547
 size 201355195