Training in progress, step 14200

Browse files

Files changed (11) hide show

{checkpoint-13600 → checkpoint-14200}/config.json +0 -0
{checkpoint-13600 → checkpoint-14200}/optimizer.pt +1 -1
{checkpoint-13600 → checkpoint-14200}/preprocessor_config.json +0 -0
{checkpoint-13600 → checkpoint-14200}/pytorch_model.bin +1 -1
{checkpoint-13600 → checkpoint-14200}/rng_state.pth +2 -2
{checkpoint-13600 → checkpoint-14200}/scaler.pt +1 -1
{checkpoint-13600 → checkpoint-14200}/scheduler.pt +1 -1
{checkpoint-13600 → checkpoint-14200}/trainer_state.json +75 -3
{checkpoint-13600 → checkpoint-14200}/training_args.bin +0 -0
pytorch_model.bin +1 -1
runs/Feb29_13-56-06_3a0664c7c2dd/events.out.tfevents.1709215109.3a0664c7c2dd.2321.0 +2 -2

{checkpoint-13600 → checkpoint-14200}/config.json RENAMED Viewed

File without changes

{checkpoint-13600 → checkpoint-14200}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2ef09549a78125d1de375d2095ccf6196b177421fc89c97d84799588f3fa5a7c
 size 330501178

 version https://git-lfs.github.com/spec/v1
+oid sha256:4629854b6d2f7516c3614b86c6b8a3b31bb89e0aa451a5f6e54287f289fdc3c6
 size 330501178

{checkpoint-13600 → checkpoint-14200}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-13600 → checkpoint-14200}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0d4989b2d7f4cae57b5a3aa1cf86e415ff5b1965edd161d195369354348da688
 size 166628834

 version https://git-lfs.github.com/spec/v1
+oid sha256:0095f434db700d3588f4af5ce6bb23a3a7fc70b5d35e5253b019ce1cb8c172ce
 size 166628834

{checkpoint-13600 → checkpoint-14200}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:537b572ce49c7fb1c6fd03aafb446241aa726fc8f5b60652b0e98a5dbb1d2e11
-size 14180

 version https://git-lfs.github.com/spec/v1
+oid sha256:db45b1808e1a2b82d1f76cb07176001727ce19eec258b0d0aab00d7ffa409eb0
+size 14244

{checkpoint-13600 → checkpoint-14200}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0966922245d3c6dcafc3e3da4ae01f193f0ff913d9252f11da8684e4ef0bac2e
 size 988

 version https://git-lfs.github.com/spec/v1
+oid sha256:bb93e2da8d9da1aec4f1882aaa56ed786d86c462721ce504a8471fd13b7c4e2e
 size 988

{checkpoint-13600 → checkpoint-14200}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d47ce7fd4eab69b12315aaacde513de620180503352b93c9d2b97de65db0e8a4
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:276b37392024b06e44ae6c01cf2efbfa37883112a2b8c070d4f93f17b342f4fb
 size 1064

{checkpoint-13600 → checkpoint-14200}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 2.5840775223256696,
-  "global_step": 13600,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1638,11 +1638,83 @@
       "learning_rate": 7.418772563176896e-06,
       "loss": 0.93,
       "step": 13600
     }
   ],
   "max_steps": 52630,
   "num_train_epochs": 10,
-  "total_flos": 5.199665023171584e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 2.698080942428273,
+  "global_step": 14200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 7.418772563176896e-06,
       "loss": 0.93,
       "step": 13600
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 7.409272278168346e-06,
+      "loss": 0.9355,
+      "step": 13650
+    },
+    {
+      "epoch": 2.6,
+      "learning_rate": 7.3997719931597955e-06,
+      "loss": 0.9297,
+      "step": 13700
+    },
+    {
+      "epoch": 2.61,
+      "learning_rate": 7.390271708151245e-06,
+      "loss": 0.9037,
+      "step": 13750
+    },
+    {
+      "epoch": 2.62,
+      "learning_rate": 7.380771423142695e-06,
+      "loss": 0.9066,
+      "step": 13800
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 7.371271138134145e-06,
+      "loss": 0.9081,
+      "step": 13850
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 7.361770853125595e-06,
+      "loss": 0.9332,
+      "step": 13900
+    },
+    {
+      "epoch": 2.65,
+      "learning_rate": 7.352270568117044e-06,
+      "loss": 0.9515,
+      "step": 13950
+    },
+    {
+      "epoch": 2.66,
+      "learning_rate": 7.342770283108493e-06,
+      "loss": 0.9192,
+      "step": 14000
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 7.3332699980999435e-06,
+      "loss": 0.9532,
+      "step": 14050
+    },
+    {
+      "epoch": 2.68,
+      "learning_rate": 7.323769713091393e-06,
+      "loss": 0.9195,
+      "step": 14100
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 7.314269428082843e-06,
+      "loss": 0.935,
+      "step": 14150
+    },
+    {
+      "epoch": 2.7,
+      "learning_rate": 7.304769143074293e-06,
+      "loss": 0.9003,
+      "step": 14200
     }
   ],
   "max_steps": 52630,
   "num_train_epochs": 10,
+  "total_flos": 5.429070443510784e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-13600 → checkpoint-14200}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:670470fed4544d93929c2372f87c97e34165b8b048a83ee2aa089a1adc4dddb1
 size 166628834

 version https://git-lfs.github.com/spec/v1
+oid sha256:0095f434db700d3588f4af5ce6bb23a3a7fc70b5d35e5253b019ce1cb8c172ce
 size 166628834

runs/Feb29_13-56-06_3a0664c7c2dd/events.out.tfevents.1709215109.3a0664c7c2dd.2321.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7bd93f380aeab7a5fef6c099d0b1c1cd2174c9bce2c7a7abef500335123eab98
-size 10793

 version https://git-lfs.github.com/spec/v1
+oid sha256:f44289628044379305f2e5b513edc923c821844c15c4113788714dfb4d9dec87
+size 11421