Training in progress, step 10000

Files changed (6) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3f8e904a7fd900eaadbc06b512420b2cce1e9e454622d76a3fa080070f3e050
 size 1135685

 version https://git-lfs.github.com/spec/v1
+oid sha256:1dcf1e089fce6094a43a6df148dccae971c0758feecdb68eeeb7dc88e615426f
 size 1135685

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d8ae2563b0e8a25139da34cf6ac4768d4e4242b4cd3c4ac7ca590c4dc920c85b
 size 307910149

 version https://git-lfs.github.com/spec/v1
+oid sha256:6f0978cde5847e3dd7ce8a7f7c7c3254251303630f4b6281edb8558cea3d3d29
 size 307910149

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:909cc4fa6326c0b3925b658ea002b5681dbb40db16e29a002e73843a5ff1ce21
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:40593ea88f5e9169b2d59cd6aa5b2cd985839724b0346e888aae95e4bdf14a75
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0480a19c1bb0f1d4849d6f8498c92440ead5e7dc1264bee4fc839d9a71a6e7c3
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:71a546360b22b38e65568c028955da704276b3a9551ee9dcac6165cd80d1258c
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 1.7871696949005127,
   "best_model_checkpoint": "/home3/s5431786/nlp-final-project/results/google-flan-t5-small-e-snli-generation-label_and_explanation-selected-b64/checkpoint-2000",
-  "epoch": 0.9319664492078286,
-  "global_step": 8000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -94,11 +94,33 @@
       "eval_samples_per_second": 69.169,
       "eval_steps_per_second": 1.082,
       "step": 8000
     }
   ],
   "max_steps": 85840,
   "num_train_epochs": 10,
-  "total_flos": 1.09605688836096e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 1.7871696949005127,
   "best_model_checkpoint": "/home3/s5431786/nlp-final-project/results/google-flan-t5-small-e-snli-generation-label_and_explanation-selected-b64/checkpoint-2000",
+  "epoch": 1.1649580615097856,
+  "global_step": 10000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 69.169,
       "eval_steps_per_second": 1.082,
       "step": 8000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 0.0009300044145779173,
+      "loss": 1.1155,
+      "step": 10000
+    },
+    {
+      "epoch": 1.16,
+      "eval_accuracy": 0.8695387116439748,
+      "eval_bertscore_f1": 0.9330506412037212,
+      "eval_bleu": 0.4022160428281426,
+      "eval_f1": 0.868816289704145,
+      "eval_loss": 1.8499114513397217,
+      "eval_rouge1": 0.6082846765097942,
+      "eval_rouge2": 0.4018899263767985,
+      "eval_rougeL": 0.5518885347721499,
+      "eval_rougeLsum": 0.5540212762276107,
+      "eval_runtime": 150.2024,
+      "eval_samples_per_second": 65.525,
+      "eval_steps_per_second": 1.025,
+      "step": 10000
     }
   ],
   "max_steps": 85840,
   "num_train_epochs": 10,
+  "total_flos": 1.3703196663877632e+16,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d8ae2563b0e8a25139da34cf6ac4768d4e4242b4cd3c4ac7ca590c4dc920c85b
 size 307910149

 version https://git-lfs.github.com/spec/v1
+oid sha256:6f0978cde5847e3dd7ce8a7f7c7c3254251303630f4b6281edb8558cea3d3d29
 size 307910149