Training in progress, step 18500

Files changed (7) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:df3ce5a688f600eb8191826018d1465dd8a48f7a35ac3df7b436b77947d0730d
 size 484085807

 version https://git-lfs.github.com/spec/v1
+oid sha256:efcfa970792427bb23ebd020b6982aa74c7317dbb9190f428d3c36534fb6f0c3
 size 484085807

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51867a121ea917f6dab296cb29e3e6b997879b2e37424393afd1e80aa4afe1c7
 size 242031355

 version https://git-lfs.github.com/spec/v1
+oid sha256:7cc1a8936b0fa1aa5064ea04490b3de5cce525ce55b5ba2b41d74c912d609693
 size 242031355

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:30f2bbf1f180179bc03eec2e349e92cf3c6ba01af99a5ef539c83b5dba075448
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:93e5a4f3b1fffa26f175a593c8b4814c17d1c369a461be2103e449e62e97e04a
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84f401cf700349c5dd3182bbdfc3423846f749fc53eb1f3cd7e29a3076c6f334
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:6497b3560f4dce675de0441236126359cb27ad7919d73715dda52b9f6fbfb5a6
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c47a947d6728feb1a2291e261a815eaf3bf55b2f88ee375970930ee6ae8cc827
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b588f887bdc9fb70ea38b100d6e637cb1ee0350c78a0aeefe7dcba6cb23b8a7
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.6761348247528076,
   "best_model_checkpoint": "/home2/s5431786/jb-internship/results/t5-small-CodeXGLUE-CONCODE-faster/checkpoint-18000",
-  "epoch": 5.76,
-  "global_step": 18000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -690,11 +690,30 @@
       "eval_samples_per_second": 75.297,
       "eval_steps_per_second": 2.372,
       "step": 18000
     }
   ],
   "max_steps": 62500,
   "num_train_epochs": 20,
-  "total_flos": 7.528963755422515e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.6761348247528076,
   "best_model_checkpoint": "/home2/s5431786/jb-internship/results/t5-small-CodeXGLUE-CONCODE-faster/checkpoint-18000",
+  "epoch": 5.92,
+  "global_step": 18500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 75.297,
       "eval_steps_per_second": 2.372,
       "step": 18000
+    },
+    {
+      "epoch": 5.92,
+      "learning_rate": 0.00037058526315789477,
+      "loss": 0.4865,
+      "step": 18500
+    },
+    {
+      "epoch": 5.92,
+      "eval_bleu": 0.06815194117913387,
+      "eval_exact_match": 0.1055,
+      "eval_loss": 0.6767784357070923,
+      "eval_rouge1": 0.5103735531673305,
+      "eval_rouge2": 0.3571731763455166,
+      "eval_rougeL": 0.49830522378417486,
+      "eval_runtime": 25.9799,
+      "eval_samples_per_second": 76.983,
+      "eval_steps_per_second": 2.425,
+      "step": 18500
     }
   ],
   "max_steps": 62500,
   "num_train_epochs": 20,
+  "total_flos": 7.739043837326131e+16,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51867a121ea917f6dab296cb29e3e6b997879b2e37424393afd1e80aa4afe1c7
 size 242031355

 version https://git-lfs.github.com/spec/v1
+oid sha256:7cc1a8936b0fa1aa5064ea04490b3de5cce525ce55b5ba2b41d74c912d609693
 size 242031355