Training in progress, step 700000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Dec27_23-39-04_t1v-n-6071ee6f-w-0/events.out.tfevents.1672184365.t1v-n-6071ee6f-w-0.108001.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7b936634e1dfc46ccbf5d05442acdf50be4c41a28a88b6765a1eef45e08b8630
 size 885325017

 version https://git-lfs.github.com/spec/v1
+oid sha256:161f7b79c9b5476a2d2fd8144b006edb9d86a4e65b54aca3a8f80b7be9d17118
 size 885325017

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ab1ec67e0f440b016179e8869a41e8d020330d2dd0454d4d4861673b4f892817
 size 442675755

 version https://git-lfs.github.com/spec/v1
+oid sha256:0eeecbdbd5a1874c86b640e2c39584c96f99788d6fa8017c95100da99d1a3bdf
 size 442675755

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:746e89f09f32dffb623a925841ddd5ad900b2452171cd343a4f6909ee43e4b5c
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ece6b85f10da16f28f9c919dfa5a138960f3292a7d2e2d00fe3ba1045fdcbd0
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:746e89f09f32dffb623a925841ddd5ad900b2452171cd343a4f6909ee43e4b5c
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ece6b85f10da16f28f9c919dfa5a138960f3292a7d2e2d00fe3ba1045fdcbd0
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:746e89f09f32dffb623a925841ddd5ad900b2452171cd343a4f6909ee43e4b5c
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ece6b85f10da16f28f9c919dfa5a138960f3292a7d2e2d00fe3ba1045fdcbd0
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:746e89f09f32dffb623a925841ddd5ad900b2452171cd343a4f6909ee43e4b5c
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ece6b85f10da16f28f9c919dfa5a138960f3292a7d2e2d00fe3ba1045fdcbd0
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:746e89f09f32dffb623a925841ddd5ad900b2452171cd343a4f6909ee43e4b5c
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ece6b85f10da16f28f9c919dfa5a138960f3292a7d2e2d00fe3ba1045fdcbd0
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:746e89f09f32dffb623a925841ddd5ad900b2452171cd343a4f6909ee43e4b5c
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ece6b85f10da16f28f9c919dfa5a138960f3292a7d2e2d00fe3ba1045fdcbd0
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:746e89f09f32dffb623a925841ddd5ad900b2452171cd343a4f6909ee43e4b5c
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ece6b85f10da16f28f9c919dfa5a138960f3292a7d2e2d00fe3ba1045fdcbd0
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:746e89f09f32dffb623a925841ddd5ad900b2452171cd343a4f6909ee43e4b5c
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ece6b85f10da16f28f9c919dfa5a138960f3292a7d2e2d00fe3ba1045fdcbd0
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9d7fa20411577666fac76fe76348b4f9231439cc2e524d6e3185910c258591e9
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:d2d6ab5c2c0046e2c66cf435ff00463ff3da7208ddb35b5b6f19c87d94f3623b
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 4.065832,
-  "global_step": 650000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -4010,11 +4010,319 @@
       "eval_samples_per_second": 459.624,
       "eval_steps_per_second": 3.677,
       "step": 650000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 1.0949559629981417e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 4.115832,
+  "global_step": 700000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 459.624,
       "eval_steps_per_second": 3.677,
       "step": 650000
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 2.976391850971065e-05,
+      "loss": 0.5916,
+      "step": 651000
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 2.9612829550614836e-05,
+      "loss": 0.6444,
+      "step": 652000
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 2.9461963542348737e-05,
+      "loss": 0.728,
+      "step": 653000
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 2.931132213475884e-05,
+      "loss": 0.7342,
+      "step": 654000
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 2.916090697523549e-05,
+      "loss": 0.6294,
+      "step": 655000
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 2.9010719708694722e-05,
+      "loss": 0.5908,
+      "step": 656000
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 2.8860761977560436e-05,
+      "loss": 0.6325,
+      "step": 657000
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 2.8711035421746367e-05,
+      "loss": 0.7502,
+      "step": 658000
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 2.8561541678638142e-05,
+      "loss": 0.7234,
+      "step": 659000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 2.8412282383075363e-05,
+      "loss": 0.6181,
+      "step": 660000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 2.8263259167333777e-05,
+      "loss": 0.6052,
+      "step": 661000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 2.811447366110741e-05,
+      "loss": 0.6333,
+      "step": 662000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 2.7965927491490705e-05,
+      "loss": 0.7455,
+      "step": 663000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 2.7817622282960815e-05,
+      "loss": 0.7029,
+      "step": 664000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 2.766955965735968e-05,
+      "loss": 0.6464,
+      "step": 665000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 2.7521741233876496e-05,
+      "loss": 0.593,
+      "step": 666000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 2.7374168629029813e-05,
+      "loss": 0.6397,
+      "step": 667000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 2.7226843456650037e-05,
+      "loss": 0.7202,
+      "step": 668000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 2.707976732786166e-05,
+      "loss": 0.7335,
+      "step": 669000
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.693294185106562e-05,
+      "loss": 0.6304,
+      "step": 670000
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.6786368631921836e-05,
+      "loss": 0.5923,
+      "step": 671000
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.6640049273331515e-05,
+      "loss": 0.6228,
+      "step": 672000
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.6493985375419778e-05,
+      "loss": 0.7495,
+      "step": 673000
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.6348178535517966e-05,
+      "loss": 0.7187,
+      "step": 674000
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.6202630348146324e-05,
+      "loss": 0.6219,
+      "step": 675000
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.6057342404996522e-05,
+      "loss": 0.599,
+      "step": 676000
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.591231629491423e-05,
+      "loss": 0.6306,
+      "step": 677000
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.5767553603881767e-05,
+      "loss": 0.743,
+      "step": 678000
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.562305591500069e-05,
+      "loss": 0.7022,
+      "step": 679000
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 2.547882480847461e-05,
+      "loss": 0.65,
+      "step": 680000
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 2.5334861861591753e-05,
+      "loss": 0.5924,
+      "step": 681000
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 2.5191168648707887e-05,
+      "loss": 0.6319,
+      "step": 682000
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 2.5047746741228978e-05,
+      "loss": 0.7178,
+      "step": 683000
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 2.490459770759398e-05,
+      "loss": 0.7333,
+      "step": 684000
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 2.476172311325783e-05,
+      "loss": 0.6311,
+      "step": 685000
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 2.4619124520674146e-05,
+      "loss": 0.5951,
+      "step": 686000
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 2.447680348927837e-05,
+      "loss": 0.6113,
+      "step": 687000
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 2.433476157547044e-05,
+      "loss": 0.7479,
+      "step": 688000
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 2.419300033259798e-05,
+      "loss": 0.7127,
+      "step": 689000
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 2.405152131093926e-05,
+      "loss": 0.6273,
+      "step": 690000
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 2.3910326057686127e-05,
+      "loss": 0.5972,
+      "step": 691000
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 2.3769416116927335e-05,
+      "loss": 0.6259,
+      "step": 692000
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 2.362879302963135e-05,
+      "loss": 0.7377,
+      "step": 693000
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 2.3488458333629777e-05,
+      "loss": 0.7024,
+      "step": 694000
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 2.3348413563600325e-05,
+      "loss": 0.6521,
+      "step": 695000
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 2.3208660251050158e-05,
+      "loss": 0.5945,
+      "step": 696000
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 2.3069199924299174e-05,
+      "loss": 0.6217,
+      "step": 697000
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 2.29300341084631e-05,
+      "loss": 0.7156,
+      "step": 698000
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 2.279116432543705e-05,
+      "loss": 0.7326,
+      "step": 699000
+    },
+    {
+      "epoch": 4.12,
+      "learning_rate": 2.2652592093878666e-05,
+      "loss": 0.633,
+      "step": 700000
+    },
+    {
+      "epoch": 4.12,
+      "eval_loss": 0.498170405626297,
+      "eval_runtime": 12.3374,
+      "eval_samples_per_second": 405.272,
+      "eval_steps_per_second": 3.242,
+      "step": 700000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 1.1791829560272617e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ab1ec67e0f440b016179e8869a41e8d020330d2dd0454d4d4861673b4f892817
 size 442675755

 version https://git-lfs.github.com/spec/v1
+oid sha256:0eeecbdbd5a1874c86b640e2c39584c96f99788d6fa8017c95100da99d1a3bdf
 size 442675755

runs/Dec27_23-39-04_t1v-n-6071ee6f-w-0/events.out.tfevents.1672184365.t1v-n-6071ee6f-w-0.108001.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6cdcb04bf875594c9cd8a7bfd71509bee6f455a645199ff52ec612a57de2563b
-size 111321

 version https://git-lfs.github.com/spec/v1
+oid sha256:7b4dfe752c28a231c835948b7463e31a6e026a3449fa84fc300902612193e1c8
+size 119597