Training in progress, step 6800

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +69 -5
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:19a0167071d6077d8f26fcfb7304a29ea809d034ec769f851d56de0c8bea89c8
 size 2843228158

 version https://git-lfs.github.com/spec/v1
+oid sha256:43b746406019bd322df48fd0f5832641bf2c23f192d1ba2c1bcf2cc6ec4661ff
 size 2843228158

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b64bf1490035f1c45fec685049f0d6a1e6e790b80c14856fab49fcd0b7114687
 size 1421588461

 version https://git-lfs.github.com/spec/v1
+oid sha256:c70a2b61096d5fd16d601664f84ccd8cb72633596aa2bd5105a81863e667c6b3
 size 1421588461

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:493e658da36031d3825842e705fcbf542f533c87882496ee53fda9fcd47858eb
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:b11b41a45679a6cc286e868bec1372008710d641cbd28a995ea530dff638bd50
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bda94d2ae823993ee852e2514dee8cef8ce45edf13d5b4966c68949e7923c4ab
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:ad34206adf67443db75af07189b4384fe36c9a4922d3cd2b4375c9ae9591e609
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:49b37a86f5ceab52bac4fb464c21074a6c79d3fab0788b80ac9b85da08906513
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce44e4c1c23e749cd9382e42f9e5375956ba931527c483dc2fade7c594fb4a25
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 0.9206360860900841,
-  "best_model_checkpoint": "/home2/s5431786/nlp-final-project/results/roberta-large-e-snli-classification-nli-base/checkpoint-5200",
-  "epoch": 0.6057781919850885,
-  "global_step": 5200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -214,11 +214,75 @@
       "eval_samples_per_second": 974.901,
       "eval_steps_per_second": 15.254,
       "step": 5200
     }
   ],
   "max_steps": 25752,
   "num_train_epochs": 3,
-  "total_flos": 3.2222917166779776e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9274853061519247,
+  "best_model_checkpoint": "/home2/s5431786/nlp-final-project/results/roberta-large-e-snli-classification-nli-base/checkpoint-6000",
+  "epoch": 0.7921714818266542,
+  "global_step": 6800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 974.901,
       "eval_steps_per_second": 15.254,
       "step": 5200
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 8.23945389143231e-06,
+      "loss": 0.288,
+      "step": 5600
+    },
+    {
+      "epoch": 0.65,
+      "eval_accuracy": 0.9222718959561065,
+      "eval_f1": 0.9220252130752401,
+      "eval_loss": 0.23495520651340485,
+      "eval_runtime": 9.9904,
+      "eval_samples_per_second": 985.146,
+      "eval_steps_per_second": 15.415,
+      "step": 5600
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 8.07635709614127e-06,
+      "loss": 0.2746,
+      "step": 6000
+    },
+    {
+      "epoch": 0.7,
+      "eval_accuracy": 0.9277585856533225,
+      "eval_f1": 0.9274853061519247,
+      "eval_loss": 0.22077496349811554,
+      "eval_runtime": 9.9415,
+      "eval_samples_per_second": 989.988,
+      "eval_steps_per_second": 15.491,
+      "step": 6000
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 7.912851536952257e-06,
+      "loss": 0.2756,
+      "step": 6400
+    },
+    {
+      "epoch": 0.75,
+      "eval_accuracy": 0.9215606584027637,
+      "eval_f1": 0.9208559714907353,
+      "eval_loss": 0.23040013015270233,
+      "eval_runtime": 9.916,
+      "eval_samples_per_second": 992.538,
+      "eval_steps_per_second": 15.53,
+      "step": 6400
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 7.749345977763243e-06,
+      "loss": 0.272,
+      "step": 6800
+    },
+    {
+      "epoch": 0.79,
+      "eval_accuracy": 0.9237959764275554,
+      "eval_f1": 0.9236808650336354,
+      "eval_loss": 0.2243068963289261,
+      "eval_runtime": 11.5455,
+      "eval_samples_per_second": 852.451,
+      "eval_steps_per_second": 13.338,
+      "step": 6800
     }
   ],
   "max_steps": 25752,
   "num_train_epochs": 3,
+  "total_flos": 4.208639555132851e+16,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b64bf1490035f1c45fec685049f0d6a1e6e790b80c14856fab49fcd0b7114687
 size 1421588461

 version https://git-lfs.github.com/spec/v1
+oid sha256:c70a2b61096d5fd16d601664f84ccd8cb72633596aa2bd5105a81863e667c6b3
 size 1421588461