Training in progress, step 380000

Browse files

Files changed (10) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +62 -2
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:01baad12886859fe661dc2c57b9551bee36b3953bfb73c88674787afb1b0d4f1
 size 402588883

 version https://git-lfs.github.com/spec/v1
+oid sha256:f8272af4ddd50ac3c03d82b6371903a8e2d3b850546bd45a9f8b94a3453985af
 size 402588883

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bd981b2367b8f646d8a64ee2a06cb78ea5c57392438a6ecb841b7b90f8bc9262
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:28618062dba6742c58cd97862917d0e5cce7292726a4d65b550febad17e88fa8
 size 201355195

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:901a27103a0b4211a4cb7a615613c314ba9ba27cf41267b98b7ba2249414cd9b
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:5de7856e29d324fe8b2d7a8039c54b4faff384ee2fadaf89719b8ee47b48cf0c
 size 14503

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:91f2501e96098cce18ed377f2b39bc56addb66460445a4b4b497a44f3ffc8dec
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:f0dd029a7e6530ace2ca7d9672c2c2caa1be55bd585e32a5581428856929e03f
 size 14503

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dcb9d53d5ff6d1d8aebbf1aee526cc63f3a9dde3f1806b1d8b9b050a109501bb
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:57d4b43fb88447123981547f4327ac577192580fb4ced52d9deda508c9b8d482
 size 14503

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:33faa00288becf57e2f9d3147b6546682afc43e2c183d9d5c3bb0b18c48d7d88
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:81980e5ddbb31a0d475d91342667e7ec7c33d09f8b11bc51c09d140f2402de83
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aecfd8f3c31fe2329f8e851fcd0e456175517d9817546d182dadca4d30b38d2a
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:bcf90e1e79ee4934f7f14472b5dc245979542d20b81316a586ad390ebbd17f9c
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c25dbfef0114645bbf748b2cdd5378d772f339989f50b561bc114ec7915e61ce
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:3230a86e29e9aa1af252bbac77fbb562b1bc880e11ef24d2344026ff504c2e85
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 6.382975464038604,
-  "global_step": 375000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -4506,6 +4506,66 @@
       "learning_rate": 3.054826368875238e-05,
       "loss": 0.3212,
       "step": 375000
     }
   ],
   "max_steps": 500000,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 6.4680811227138495,
+  "global_step": 380000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 3.054826368875238e-05,
       "loss": 0.3212,
       "step": 375000
+    },
+    {
+      "epoch": 6.39,
+      "learning_rate": 3.0392863517601306e-05,
+      "loss": 0.3212,
+      "step": 375500
+    },
+    {
+      "epoch": 6.4,
+      "learning_rate": 3.0237952948860104e-05,
+      "loss": 0.3208,
+      "step": 376000
+    },
+    {
+      "epoch": 6.41,
+      "learning_rate": 3.0083841859145522e-05,
+      "loss": 0.3209,
+      "step": 376500
+    },
+    {
+      "epoch": 6.42,
+      "learning_rate": 2.9929914090262566e-05,
+      "loss": 0.3209,
+      "step": 377000
+    },
+    {
+      "epoch": 6.43,
+      "learning_rate": 2.977648049291346e-05,
+      "loss": 0.3209,
+      "step": 377500
+    },
+    {
+      "epoch": 6.43,
+      "learning_rate": 2.9623542581425794e-05,
+      "loss": 0.321,
+      "step": 378000
+    },
+    {
+      "epoch": 6.44,
+      "learning_rate": 2.947110186523508e-05,
+      "loss": 0.3209,
+      "step": 378500
+    },
+    {
+      "epoch": 6.45,
+      "learning_rate": 2.9319159848869626e-05,
+      "loss": 0.3209,
+      "step": 379000
+    },
+    {
+      "epoch": 6.46,
+      "learning_rate": 2.9167718031935745e-05,
+      "loss": 0.3207,
+      "step": 379500
+    },
+    {
+      "epoch": 6.47,
+      "learning_rate": 2.9016777909103095e-05,
+      "loss": 0.3207,
+      "step": 380000
     }
   ],
   "max_steps": 500000,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bd981b2367b8f646d8a64ee2a06cb78ea5c57392438a6ecb841b7b90f8bc9262
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:28618062dba6742c58cd97862917d0e5cce7292726a4d65b550febad17e88fa8
 size 201355195