Training in progress, step 290000

Browse files

Files changed (10) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +62 -2
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:384293c7b6170abe531d7bdf7476bb62f67ad8ce508056061bc0de67e870104f
 size 402588883

 version https://git-lfs.github.com/spec/v1
+oid sha256:51b14eff4a4273c6d3b74abfacfc73b884cf9b9b7c89a08f51ead1f04044721d
 size 402588883

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5b5a8b986e893a68e13b43ea75fe3e572af751fb6a190938f14988c4ad5ac3c2
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:d0869ad7d95645188dccb3e4d87a800a424ce412e68cf67a7641e510484c467e
 size 201355195

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a06a1d9ebb40a393bd637d58f8ac7f856d188c1c5bf11d1566eb610b346ad8db
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:12b3f1f4ef7d54ab74f08b6a6f7af18fc022998fa9e7e56e07868a564d491d66
 size 14503

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:37d7cf8cd4c6eef2e6ad10c251ab5f9b0130c611543cc0602e57cfa17d524f95
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:9135594bbb586f075b7638cecd4126fb3316150a75a6fdf73a4dbcbfa23edf9f
 size 14503

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e8649226118c04ea709506642ca7fa86b6350292287b21608c909d6c416ffbf9
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:36e6eeeb63a7d5efe3d89e51c42e86fbccb201f0a76f81a39558ea2786f8b6a1
 size 14503

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0b28ff5b5c2e38d28ac0e3b1d579a52d003d336b7290b91f14ef1a77b308dc1d
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:43d15bd14eb8428e51e4855f72917c2a4075d4c0c1aa4a9dd827fec888eb9fd9
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b5b841b24ad93d751ff4010600ca084716ce2c6f905f00caaa1959fea109ec4
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:1e94f3f55189c88e8c606f8b356b8d855b941bd1572eb843a4126c797cf5f785
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8a03e6f2e407c63ad22a8716076189eef21e436952132cb7536181c961b045df
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:6efbd14b80e31c442e70702f490a0feb0bba9ae059c89f649541b88541b74c6a
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 4.8510565867524535,
-  "global_step": 285000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3426,6 +3426,66 @@
       "learning_rate": 6.477890930484919e-05,
       "loss": 0.3269,
       "step": 285000
     }
   ],
   "max_steps": 500000,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 4.936162245427698,
+  "global_step": 290000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 6.477890930484919e-05,
       "loss": 0.3269,
       "step": 285000
+    },
+    {
+      "epoch": 4.86,
+      "learning_rate": 6.456433515923394e-05,
+      "loss": 0.3271,
+      "step": 285500
+    },
+    {
+      "epoch": 4.87,
+      "learning_rate": 6.434991335739906e-05,
+      "loss": 0.3268,
+      "step": 286000
+    },
+    {
+      "epoch": 4.88,
+      "learning_rate": 6.413564601560114e-05,
+      "loss": 0.3267,
+      "step": 286500
+    },
+    {
+      "epoch": 4.89,
+      "learning_rate": 6.392196331243996e-05,
+      "loss": 0.3266,
+      "step": 287000
+    },
+    {
+      "epoch": 4.89,
+      "learning_rate": 6.370801091388329e-05,
+      "loss": 0.3265,
+      "step": 287500
+    },
+    {
+      "epoch": 4.9,
+      "learning_rate": 6.349421931068155e-05,
+      "loss": 0.3265,
+      "step": 288000
+    },
+    {
+      "epoch": 4.91,
+      "learning_rate": 6.328059061287157e-05,
+      "loss": 0.3263,
+      "step": 288500
+    },
+    {
+      "epoch": 4.92,
+      "learning_rate": 6.306712692888235e-05,
+      "loss": 0.3263,
+      "step": 289000
+    },
+    {
+      "epoch": 4.93,
+      "learning_rate": 6.285383036551425e-05,
+      "loss": 0.3262,
+      "step": 289500
+    },
+    {
+      "epoch": 4.94,
+      "learning_rate": 6.264070302791827e-05,
+      "loss": 0.3263,
+      "step": 290000
     }
   ],
   "max_steps": 500000,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5b5a8b986e893a68e13b43ea75fe3e572af751fb6a190938f14988c4ad5ac3c2
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:d0869ad7d95645188dccb3e4d87a800a424ce412e68cf67a7641e510484c467e
 size 201355195