Training in progress, step 5200

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +69 -5
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51c2ce7163cd0393f56a1f16f501794039c69dc4b905609c536b8d2610416be3
 size 2843228158

 version https://git-lfs.github.com/spec/v1
+oid sha256:19a0167071d6077d8f26fcfb7304a29ea809d034ec769f851d56de0c8bea89c8
 size 2843228158

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:860047c7dff7fb338d60a846bf0cd150c69e3ae5f5234ecc36a7a1b6c68c35c0
 size 1421588461

 version https://git-lfs.github.com/spec/v1
+oid sha256:b64bf1490035f1c45fec685049f0d6a1e6e790b80c14856fab49fcd0b7114687
 size 1421588461

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ce1247af97fcc60eb232e79ad70b57f6a40adfdd60aca9b5b05f159818f9be36
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:493e658da36031d3825842e705fcbf542f533c87882496ee53fda9fcd47858eb
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:90e2f8a70acd9fbfda3012da5136ca5cf89ee1cda6e3e2e92b1fe97de3c5a73c
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:bda94d2ae823993ee852e2514dee8cef8ce45edf13d5b4966c68949e7923c4ab
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f1d7f009df2a5e3ebf2598687f4ede8c86c686b0f969b80266c4f9c02766b1a3
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:49b37a86f5ceab52bac4fb464c21074a6c79d3fab0788b80ac9b85da08906513
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 0.9182731413386942,
-  "best_model_checkpoint": "/home2/s5431786/nlp-final-project/results/roberta-large-e-snli-classification-nli-base/checkpoint-2800",
-  "epoch": 0.4193849021435228,
-  "global_step": 3600,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -150,11 +150,75 @@
       "eval_samples_per_second": 990.544,
       "eval_steps_per_second": 15.499,
       "step": 3600
     }
   ],
   "max_steps": 25752,
   "num_train_epochs": 3,
-  "total_flos": 2.2294086874568064e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9206360860900841,
+  "best_model_checkpoint": "/home2/s5431786/nlp-final-project/results/roberta-large-e-snli-classification-nli-base/checkpoint-5200",
+  "epoch": 0.6057781919850885,
+  "global_step": 5200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 990.544,
       "eval_steps_per_second": 15.499,
       "step": 3600
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 8.893476128188358e-06,
+      "loss": 0.3027,
+      "step": 4000
+    },
+    {
+      "epoch": 0.47,
+      "eval_accuracy": 0.9191221296484454,
+      "eval_f1": 0.9190571565466592,
+      "eval_loss": 0.23602379858493805,
+      "eval_runtime": 10.6438,
+      "eval_samples_per_second": 924.674,
+      "eval_steps_per_second": 14.469,
+      "step": 4000
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 8.729970568999347e-06,
+      "loss": 0.2968,
+      "step": 4400
+    },
+    {
+      "epoch": 0.51,
+      "eval_accuracy": 0.9187157081893924,
+      "eval_f1": 0.9182261319193824,
+      "eval_loss": 0.23287305235862732,
+      "eval_runtime": 9.9312,
+      "eval_samples_per_second": 991.014,
+      "eval_steps_per_second": 15.507,
+      "step": 4400
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 8.566465009810335e-06,
+      "loss": 0.2888,
+      "step": 4800
+    },
+    {
+      "epoch": 0.56,
+      "eval_accuracy": 0.9196301564722618,
+      "eval_f1": 0.9189361658403055,
+      "eval_loss": 0.24621723592281342,
+      "eval_runtime": 9.9085,
+      "eval_samples_per_second": 993.291,
+      "eval_steps_per_second": 15.542,
+      "step": 4800
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 8.402959450621321e-06,
+      "loss": 0.2898,
+      "step": 5200
+    },
+    {
+      "epoch": 0.61,
+      "eval_accuracy": 0.9211542369437107,
+      "eval_f1": 0.9206360860900841,
+      "eval_loss": 0.23345668613910675,
+      "eval_runtime": 10.0954,
+      "eval_samples_per_second": 974.901,
+      "eval_steps_per_second": 15.254,
+      "step": 5200
     }
   ],
   "max_steps": 25752,
   "num_train_epochs": 3,
+  "total_flos": 3.2222917166779776e+16,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:860047c7dff7fb338d60a846bf0cd150c69e3ae5f5234ecc36a7a1b6c68c35c0
 size 1421588461

 version https://git-lfs.github.com/spec/v1
+oid sha256:b64bf1490035f1c45fec685049f0d6a1e6e790b80c14856fab49fcd0b7114687
 size 1421588461