Training in progress, step 14500

Files changed (7) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:013e6a1226a36bd248f072c7c79967408c3ae0ca9c7dd23f6bfabe4a1f315208
 size 838981

 version https://git-lfs.github.com/spec/v1
+oid sha256:d72bcd5d67677336ea44ac21b39046210c3ff91ff61c07e085af69880771da09
 size 838981

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0bbc1bb3927fc3f29aa1e2744d560ffbb24507f800377781cd43473921699703
 size 242014297

 version https://git-lfs.github.com/spec/v1
+oid sha256:8a43f747cfa3f540c13e90a6adfa0fd0b4bd0db108e4f2ac14203bd4eef11db2
 size 242014297

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2384f23031e3baa505f44a88d4ec6e2937aab888fbdd617468de146894c22377
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc4dd445fffcceb22a20bf5eed3ac992f6b1b4353bf8125d39cce5fb62c1155e
 size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:49bd52013718f906ccb7029ac40bb7327e034199463aababf5db6fc528e83805
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:5c90c29bc2f74036c291681a1031c81300dba59e8fc6586a175a7c2aa56888cb
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:089070342a816a2a0f686e6ee2de3468e24f5d9f721f1ee1f52415d2ea6e13c9
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:05d8c2508419cd87dcc10e1d12fb122dbba1aed33cf9d8f5c2664992fcb15521
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.5734578017441343,
   "best_model_checkpoint": "results/checkpoint-12000",
-  "epoch": 2.8,
-  "global_step": 14000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -566,11 +566,31 @@
       "eval_samples_per_second": 36.697,
       "eval_steps_per_second": 1.835,
       "step": 14000
     }
   ],
   "max_steps": 15000,
   "num_train_epochs": 3,
-  "total_flos": 3.635285016969216e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.5734578017441343,
   "best_model_checkpoint": "results/checkpoint-12000",
+  "epoch": 2.9,
+  "global_step": 14500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 36.697,
       "eval_steps_per_second": 1.835,
       "step": 14000
+    },
+    {
+      "epoch": 2.9,
+      "learning_rate": 3.550877192982456e-06,
+      "loss": 0.4984,
+      "step": 14500
+    },
+    {
+      "epoch": 2.9,
+      "eval_bleu": 0.13386113820042875,
+      "eval_exact_match": 0.166,
+      "eval_loss": 0.7553720474243164,
+      "eval_rouge1": 0.5732764191737172,
+      "eval_rouge2": 0.4072722620184557,
+      "eval_rougeL": 0.5550480838843836,
+      "eval_rougeLsum": 0.5626680551333753,
+      "eval_runtime": 55.1875,
+      "eval_samples_per_second": 36.24,
+      "eval_steps_per_second": 1.812,
+      "step": 14500
     }
   ],
   "max_steps": 15000,
   "num_train_epochs": 3,
+  "total_flos": 3.762840964104192e+16,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0bbc1bb3927fc3f29aa1e2744d560ffbb24507f800377781cd43473921699703
 size 242014297

 version https://git-lfs.github.com/spec/v1
+oid sha256:8a43f747cfa3f540c13e90a6adfa0fd0b4bd0db108e4f2ac14203bd4eef11db2
 size 242014297