Training in progress, step 335000

Browse files

Files changed (10) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +62 -2
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:93c386d61a4b6ef81bbfcb895bf31c8912994a5d8d326aea019e1ed65d741296
 size 402588883

 version https://git-lfs.github.com/spec/v1
+oid sha256:939d248a527eb497165f1bf7060d53f43322c7933a1ba71de5100c7e404ce85a
 size 402588883

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d237c084114006c5f33d8e180c7dd892faa0c663e6711cc98e83c92531e4a9ae
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:1d649d0c6ecfcc65c828c103d2a888b212e5dbe03b91f9ccd0b4dfb9c64351b2
 size 201355195

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cefdfcff28f636aad12436d5ff497346817f4d094e600a7df6bfb170c76276d7
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:56e84016321a01e0368546b323377a45ad0805d65d9112522d3c528db3adebf7
 size 14503

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:20bb0c8a84a659fe6e934f689d267fbe623cbcfd8dbdfb676c4f75156049a619
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:0d9a4f19ed98bc52de3d9f825e4cc563b4cde6045cdd45620e227104c4272941
 size 14503

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3fb63874d7d3d5ac08ffad64465ec2fbfa345ac503e455335d667a26323bb2cc
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:aafab39ea8a348fd9f1b8a4af6531230422ffb8726dce19b15d2e52b47fcbe9a
 size 14503

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9667eb53f8fae1f918d3e0d457d7c34063204af804980f96316823e35c6471c8
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:29833b46f079abd1ae1687af5eaf0fb3f0c523c72cb6eb7d6dee4f081703eacd
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:06288cf6f41b2bddb76e843dba8b3dabddbcaf6a803daeb605d0c871fbf06be6
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:dcee40751dfd949836000607c46de013a7c1680e8c9d348fd9f5d7a4177a5fff
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9cadbb633c7a5781675b6107c9161ef4941fe852de8b07b05a702996516fb85b
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c39e93187239f8eb7faa42ef30f45c99619a534ecb50ec81e9bc0704a6cd1e6
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 5.617016025395529,
-  "global_step": 330000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3966,6 +3966,66 @@
       "learning_rate": 4.63273586320064e-05,
       "loss": 0.3235,
       "step": 330000
     }
   ],
   "max_steps": 500000,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 5.702121684070774,
+  "global_step": 335000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 4.63273586320064e-05,
       "loss": 0.3235,
       "step": 330000
+    },
+    {
+      "epoch": 5.63,
+      "learning_rate": 4.613472874127472e-05,
+      "loss": 0.3233,
+      "step": 330500
+    },
+    {
+      "epoch": 5.63,
+      "learning_rate": 4.594243308709837e-05,
+      "loss": 0.3231,
+      "step": 331000
+    },
+    {
+      "epoch": 5.64,
+      "learning_rate": 4.575047356735788e-05,
+      "loss": 0.3231,
+      "step": 331500
+    },
+    {
+      "epoch": 5.65,
+      "learning_rate": 4.5558852076616174e-05,
+      "loss": 0.3234,
+      "step": 332000
+    },
+    {
+      "epoch": 5.66,
+      "learning_rate": 4.536757050610003e-05,
+      "loss": 0.3231,
+      "step": 332500
+    },
+    {
+      "epoch": 5.67,
+      "learning_rate": 4.5176630743681286e-05,
+      "loss": 0.323,
+      "step": 333000
+    },
+    {
+      "epoch": 5.68,
+      "learning_rate": 4.498603467385838e-05,
+      "loss": 0.3229,
+      "step": 333500
+    },
+    {
+      "epoch": 5.69,
+      "learning_rate": 4.4795784177737496e-05,
+      "loss": 0.323,
+      "step": 334000
+    },
+    {
+      "epoch": 5.69,
+      "learning_rate": 4.460588113301429e-05,
+      "loss": 0.3232,
+      "step": 334500
+    },
+    {
+      "epoch": 5.7,
+      "learning_rate": 4.4416327413955116e-05,
+      "loss": 0.3231,
+      "step": 335000
     }
   ],
   "max_steps": 500000,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d237c084114006c5f33d8e180c7dd892faa0c663e6711cc98e83c92531e4a9ae
 size 201355195

 version https://git-lfs.github.com/spec/v1
+oid sha256:1d649d0c6ecfcc65c828c103d2a888b212e5dbe03b91f9ccd0b4dfb9c64351b2
 size 201355195