Training in progress, step 285000

Browse files

Files changed (10) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +62 -2
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88919edc5cc9978bcacef57b4d166e6499ad44e7dc4e53de13f434f06da69bf3
 size 402588883

 version https://git-lfs.github.com/spec/v1
+oid sha256:384293c7b6170abe531d7bdf7476bb62f67ad8ce508056061bc0de67e870104f
 size 402588883

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:02e1e464ec648e1c27493b3bd8c73cd61efe7f80d5890c32e96d2d92c2d0ec34
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:5b5a8b986e893a68e13b43ea75fe3e572af751fb6a190938f14988c4ad5ac3c2
 size 201355195

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4a1c61ad55a678b1e53f42eaf630499a66857d7df923cc1018e80a600ac47063
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:a06a1d9ebb40a393bd637d58f8ac7f856d188c1c5bf11d1566eb610b346ad8db
 size 14503

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:30317d7b1938bdbcc9a22d97f01bcb942661d60c8a5091072798ab5aeb8c102d
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:37d7cf8cd4c6eef2e6ad10c251ab5f9b0130c611543cc0602e57cfa17d524f95
 size 14503

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4c1f71265ba8cd08cd3b24db9213294ebdb63f997b0b686de8f79962089e55e3
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:e8649226118c04ea709506642ca7fa86b6350292287b21608c909d6c416ffbf9
 size 14503

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2d7ac8d597b7ec3e4ffbece8dfc2e6bf240d4f9bb2fd8c33c6cf950c39a8bfba
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b28ff5b5c2e38d28ac0e3b1d579a52d003d336b7290b91f14ef1a77b308dc1d
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:150d4722a87d1e0c9417fe2ad5187fcdb99bc1fa8df35b1041b525828c9619c7
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:6b5b841b24ad93d751ff4010600ca084716ce2c6f905f00caaa1959fea109ec4
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:934fd8b46f09eaf550920a49d68342628d951e52603050827548210fb29af8b7
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:8a03e6f2e407c63ad22a8716076189eef21e436952132cb7536181c961b045df
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 4.765950928077208,
-  "global_step": 280000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3366,6 +3366,66 @@
       "learning_rate": 6.693213095317489e-05,
       "loss": 0.3274,
       "step": 280000
     }
   ],
   "max_steps": 500000,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 4.8510565867524535,
+  "global_step": 285000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 6.693213095317489e-05,
       "loss": 0.3274,
       "step": 280000
+    },
+    {
+      "epoch": 4.77,
+      "learning_rate": 6.671615034437533e-05,
+      "loss": 0.3272,
+      "step": 280500
+    },
+    {
+      "epoch": 4.78,
+      "learning_rate": 6.650030084180895e-05,
+      "loss": 0.3272,
+      "step": 281000
+    },
+    {
+      "epoch": 4.79,
+      "learning_rate": 6.628458457582322e-05,
+      "loss": 0.3273,
+      "step": 281500
+    },
+    {
+      "epoch": 4.8,
+      "learning_rate": 6.606900367545062e-05,
+      "loss": 0.3272,
+      "step": 282000
+    },
+    {
+      "epoch": 4.81,
+      "learning_rate": 6.585356026838752e-05,
+      "loss": 0.327,
+      "step": 282500
+    },
+    {
+      "epoch": 4.82,
+      "learning_rate": 6.563825648097345e-05,
+      "loss": 0.3268,
+      "step": 283000
+    },
+    {
+      "epoch": 4.83,
+      "learning_rate": 6.542309443816984e-05,
+      "loss": 0.3271,
+      "step": 283500
+    },
+    {
+      "epoch": 4.83,
+      "learning_rate": 6.520807626353919e-05,
+      "loss": 0.3268,
+      "step": 284000
+    },
+    {
+      "epoch": 4.84,
+      "learning_rate": 6.499363367648454e-05,
+      "loss": 0.3268,
+      "step": 284500
+    },
+    {
+      "epoch": 4.85,
+      "learning_rate": 6.477890930484919e-05,
+      "loss": 0.3269,
+      "step": 285000
     }
   ],
   "max_steps": 500000,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:02e1e464ec648e1c27493b3bd8c73cd61efe7f80d5890c32e96d2d92c2d0ec34
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:5b5a8b986e893a68e13b43ea75fe3e572af751fb6a190938f14988c4ad5ac3c2
 size 201355195