Training in progress, step 1000000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Feb08_20-05-26_t1v-n-9f780742-w-0/events.out.tfevents.1675886954.t1v-n-9f780742-w-0.24792.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:72cad57ae599372b1775daab8ed6df0397ced72996d9fa2edd093808cfe400a4
 size 1475917081

 version https://git-lfs.github.com/spec/v1
+oid sha256:3e6c5c58329ef888378799c1553da2721cd6143a7d1581dad62eb4357f2a22d6
 size 1475917081

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2fb7acac33e4f38fc79dc957e435bff0e83f26677ce0d27b3d2e63cd987cb20a
 size 737971755

 version https://git-lfs.github.com/spec/v1
+oid sha256:86a118c032ac69034e4977ea7a4bb263056a16d7eacb04c82f234aabf5a2d0e7
 size 737971755

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3f988a9f99a0b5464f47b3f2e652699d46e76f7aa98dea6ae21be564d50c084
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c521200981c625df088d1c9ecf00d1ed99b766912221c97b61ef045b8afc8180
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3f988a9f99a0b5464f47b3f2e652699d46e76f7aa98dea6ae21be564d50c084
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c521200981c625df088d1c9ecf00d1ed99b766912221c97b61ef045b8afc8180
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3f988a9f99a0b5464f47b3f2e652699d46e76f7aa98dea6ae21be564d50c084
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c521200981c625df088d1c9ecf00d1ed99b766912221c97b61ef045b8afc8180
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3f988a9f99a0b5464f47b3f2e652699d46e76f7aa98dea6ae21be564d50c084
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c521200981c625df088d1c9ecf00d1ed99b766912221c97b61ef045b8afc8180
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3f988a9f99a0b5464f47b3f2e652699d46e76f7aa98dea6ae21be564d50c084
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c521200981c625df088d1c9ecf00d1ed99b766912221c97b61ef045b8afc8180
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3f988a9f99a0b5464f47b3f2e652699d46e76f7aa98dea6ae21be564d50c084
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c521200981c625df088d1c9ecf00d1ed99b766912221c97b61ef045b8afc8180
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3f988a9f99a0b5464f47b3f2e652699d46e76f7aa98dea6ae21be564d50c084
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c521200981c625df088d1c9ecf00d1ed99b766912221c97b61ef045b8afc8180
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3f988a9f99a0b5464f47b3f2e652699d46e76f7aa98dea6ae21be564d50c084
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:c521200981c625df088d1c9ecf00d1ed99b766912221c97b61ef045b8afc8180
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bc2c2c8416f63b11e9c82d6dac05baa6ad73177ac658621e099b23ff71f2f801
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:906bc3ed48818cc1785b6a98c1e064532a322520b99cdf458cfd827674d9b7ec
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.95,
-  "global_step": 950000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -5858,11 +5858,319 @@
       "eval_samples_per_second": 75.881,
       "eval_steps_per_second": 0.607,
       "step": 950000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 1.60210593251328e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 1000000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 75.881,
       "eval_steps_per_second": 0.607,
       "step": 950000
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 6.549893279788277e-07,
+      "loss": 0.8154,
+      "step": 951000
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 6.285834552247128e-07,
+      "loss": 0.8177,
+      "step": 952000
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 6.027175003719354e-07,
+      "loss": 0.8213,
+      "step": 953000
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 5.773917462864264e-07,
+      "loss": 0.8164,
+      "step": 954000
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 5.526064699265753e-07,
+      "loss": 0.8177,
+      "step": 955000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 5.283619423401998e-07,
+      "loss": 0.8101,
+      "step": 956000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 5.046584286615697e-07,
+      "loss": 0.7825,
+      "step": 957000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 4.814961881085045e-07,
+      "loss": 0.7899,
+      "step": 958000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 4.5887547397955864e-07,
+      "loss": 0.7768,
+      "step": 959000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 4.367965336512403e-07,
+      "loss": 0.7668,
+      "step": 960000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 4.1525960857530243e-07,
+      "loss": 0.7703,
+      "step": 961000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 3.9426493427611177e-07,
+      "loss": 0.7643,
+      "step": 962000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 3.738127403480507e-07,
+      "loss": 0.7798,
+      "step": 963000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 3.5390325045304706e-07,
+      "loss": 0.7798,
+      "step": 964000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 3.3453668231809286e-07,
+      "loss": 0.7513,
+      "step": 965000
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 3.157132477328628e-07,
+      "loss": 0.7495,
+      "step": 966000
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 2.9743315254743833e-07,
+      "loss": 0.7556,
+      "step": 967000
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 2.796965966699927e-07,
+      "loss": 0.7669,
+      "step": 968000
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 2.625037740646763e-07,
+      "loss": 0.7642,
+      "step": 969000
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 2.458548727494292e-07,
+      "loss": 0.7617,
+      "step": 970000
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 2.2975007479397738e-07,
+      "loss": 0.7558,
+      "step": 971000
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 2.1418955631781202e-07,
+      "loss": 0.7666,
+      "step": 972000
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 1.9917348748826335e-07,
+      "loss": 0.7648,
+      "step": 973000
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 1.847020325186577e-07,
+      "loss": 0.7933,
+      "step": 974000
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 1.7077534966650766e-07,
+      "loss": 0.7956,
+      "step": 975000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 1.5739359123178587e-07,
+      "loss": 0.7901,
+      "step": 976000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 1.4455690355525964e-07,
+      "loss": 0.7815,
+      "step": 977000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 1.3226542701689215e-07,
+      "loss": 0.8116,
+      "step": 978000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 1.2051929603428825e-07,
+      "loss": 0.7959,
+      "step": 979000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 1.0931863906127327e-07,
+      "loss": 0.7908,
+      "step": 980000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 9.866357858642205e-08,
+      "loss": 0.8115,
+      "step": 981000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 8.855423113177664e-08,
+      "loss": 0.8025,
+      "step": 982000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 7.899070725153613e-08,
+      "loss": 0.8166,
+      "step": 983000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 6.997311153086883e-08,
+      "loss": 0.7991,
+      "step": 984000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 6.150154258476315e-08,
+      "loss": 0.8127,
+      "step": 985000
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 5.3576093056922906e-08,
+      "loss": 0.8191,
+      "step": 986000
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 4.619684961881254e-08,
+      "loss": 0.7956,
+      "step": 987000
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 3.936389296864129e-08,
+      "loss": 0.7759,
+      "step": 988000
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 3.3077297830541584e-08,
+      "loss": 0.7988,
+      "step": 989000
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 2.7337132953697554e-08,
+      "loss": 0.801,
+      "step": 990000
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 2.214346111164556e-08,
+      "loss": 0.7963,
+      "step": 991000
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 1.749633910153592e-08,
+      "loss": 0.7973,
+      "step": 992000
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 1.3395817743561134e-08,
+      "loss": 0.8083,
+      "step": 993000
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 9.841941880361916e-09,
+      "loss": 0.8207,
+      "step": 994000
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 6.834750376549792e-09,
+      "loss": 0.8163,
+      "step": 995000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 4.3742761183018784e-09,
+      "loss": 0.7993,
+      "step": 996000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 2.4605460129556445e-09,
+      "loss": 0.8185,
+      "step": 997000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 1.0935809887702154e-09,
+      "loss": 0.8205,
+      "step": 998000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 2.7339599464326627e-10,
+      "loss": 0.8165,
+      "step": 999000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 0.0,
+      "loss": 0.8279,
+      "step": 1000000
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 0.548393726348877,
+      "eval_runtime": 58.8399,
+      "eval_samples_per_second": 84.976,
+      "eval_steps_per_second": 0.68,
+      "step": 1000000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 1.6864272973824e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2fb7acac33e4f38fc79dc957e435bff0e83f26677ce0d27b3d2e63cd987cb20a
 size 737971755

 version https://git-lfs.github.com/spec/v1
+oid sha256:86a118c032ac69034e4977ea7a4bb263056a16d7eacb04c82f234aabf5a2d0e7
 size 737971755

runs/Feb08_20-05-26_t1v-n-9f780742-w-0/events.out.tfevents.1675886954.t1v-n-9f780742-w-0.24792.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f3e300bea4f3fc32a2a718e59c89d410b4e3139b01588e348827e6289e3f862a
-size 28590

 version https://git-lfs.github.com/spec/v1
+oid sha256:686edc9c7a9eeaf8cb634b3e399883280a24a26f0c571915b7450f63d469aeb0
+size 36866