Training in progress, step 12500

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +153 -3
pytorch_model.bin +1 -1
runs/Jan03_01-47-25_21bb7eba274c/events.out.tfevents.1672710460.21bb7eba274c.23.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:83e26aa9d961b153eb39f40717703226047b1acbf11f069146c5b3e243f1cc9c
 size 1115513717

 version https://git-lfs.github.com/spec/v1
+oid sha256:57f3c69d772afc58e37ee903b2b7079a268d08467aafd7213c557e89eabc81a1
 size 1115513717

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f99858e3c21b907dfaa9a430a7827c8a6a05713100d80743af281217de43680f
 size 557969145

 version https://git-lfs.github.com/spec/v1
+oid sha256:87db461c28c81d8c1f329067e24f4856e8aa966760e3915178a00b7c12a98ad9
 size 557969145

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:072b62bbf3d9acdacc06abc15a04c205e72d5bda5cf1bf40a5b6dcbb83bd3857
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c498e4129e3e140b55c067c9e46781a5ac9ad4114d9a53b3d323278fa7cab1b
 size 15523

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:de4e0f6dd04181f2245ca4e861eb942143b0203adeeec2bd8c0e3bf4752a809d
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:b9ff76b4edb8bccd8e7ba583674a071e8b77e61693d6d7c7089e776edb889d9d
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.5605381165919282,
-  "global_step": 10000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -606,11 +606,161 @@
       "learning_rate": 1.883408071748879e-05,
       "loss": 0.6866,
       "step": 10000
     }
   ],
   "max_steps": 32112,
   "num_train_epochs": 2,
-  "total_flos": 4.620457598754816e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.7006726457399103,
+  "global_step": 12500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 1.883408071748879e-05,
       "loss": 0.6866,
       "step": 10000
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 1.8522670652715494e-05,
+      "loss": 0.7075,
+      "step": 10100
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 1.82112605879422e-05,
+      "loss": 0.7549,
+      "step": 10200
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 1.7899850523168908e-05,
+      "loss": 0.7435,
+      "step": 10300
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 1.7588440458395615e-05,
+      "loss": 0.7484,
+      "step": 10400
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 1.7277030393622322e-05,
+      "loss": 0.7309,
+      "step": 10500
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 1.696562032884903e-05,
+      "loss": 0.8038,
+      "step": 10600
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 1.6654210264075736e-05,
+      "loss": 0.7695,
+      "step": 10700
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 1.634280019930244e-05,
+      "loss": 0.7406,
+      "step": 10800
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 1.6031390134529147e-05,
+      "loss": 0.6867,
+      "step": 10900
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 1.5719980069755854e-05,
+      "loss": 0.6952,
+      "step": 11000
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 1.540857000498256e-05,
+      "loss": 0.6863,
+      "step": 11100
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 1.5097159940209268e-05,
+      "loss": 0.7765,
+      "step": 11200
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 1.4785749875435975e-05,
+      "loss": 0.7468,
+      "step": 11300
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 1.4474339810662682e-05,
+      "loss": 0.8029,
+      "step": 11400
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 1.4162929745889389e-05,
+      "loss": 0.7224,
+      "step": 11500
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 1.3851519681116093e-05,
+      "loss": 0.7289,
+      "step": 11600
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 1.35401096163428e-05,
+      "loss": 0.758,
+      "step": 11700
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 1.3228699551569507e-05,
+      "loss": 0.7118,
+      "step": 11800
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 1.2917289486796214e-05,
+      "loss": 0.7478,
+      "step": 11900
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 1.260587942202292e-05,
+      "loss": 0.7617,
+      "step": 12000
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 1.2294469357249628e-05,
+      "loss": 0.7288,
+      "step": 12100
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 1.1983059292476335e-05,
+      "loss": 0.7643,
+      "step": 12200
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 1.167164922770304e-05,
+      "loss": 0.7059,
+      "step": 12300
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 1.1360239162929747e-05,
+      "loss": 0.7185,
+      "step": 12400
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 1.1048829098156454e-05,
+      "loss": 0.6894,
+      "step": 12500
     }
   ],
   "max_steps": 32112,
   "num_train_epochs": 2,
+  "total_flos": 5.775039312666624e+16,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f99858e3c21b907dfaa9a430a7827c8a6a05713100d80743af281217de43680f
 size 557969145

 version https://git-lfs.github.com/spec/v1
+oid sha256:87db461c28c81d8c1f329067e24f4856e8aa966760e3915178a00b7c12a98ad9
 size 557969145

runs/Jan03_01-47-25_21bb7eba274c/events.out.tfevents.1672710460.21bb7eba274c.23.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:676d0297bfea30711b3d71a47eea34d72cd91e97c73b68283c3fbb798b0843dc
-size 25339

 version https://git-lfs.github.com/spec/v1
+oid sha256:5eb77c9add49418cf9c6164ece1dbd00292b09e7083152c9df2cb409c236cba4
+size 29264