Training in progress, step 2000

Files changed (15) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cc1b93a6b0b1f2b386cf7ee987f5d56bf64fbef445d41f5bfb3cc05e12b7aada
 size 1987250795

 version https://git-lfs.github.com/spec/v1
+oid sha256:706f00eb19f820fe319f7fafa5e70c41f6a9e1a7d166f8307a88018472cc1657
 size 1987250795

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:52564efd56a5ea6b573c8b10e183d879db2ec6de0aad81a84eb25e8534a7117d
 size 996026489

 version https://git-lfs.github.com/spec/v1
+oid sha256:faf1f2b9424af846730ab18d00f63657ae804747565792e465df7cbcce97ff99
 size 996026489

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d2a18d5b86bf269bf95ab6bea7393d2c5f7dabb83991c3b84f4f1512e121ab62
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:a60916cb59c8af4c3fd3f107d03f442d74a5f179944593d033585e1acab19ee4
 size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5477cf1aa2d17968d104d1bcb25665280e729d92cb7a986c7fb18a35fab276e8
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:b101589015f43511eb0eb50cc023fb256454216407517c39629d0bc69dd1c56c
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cf87ddda7572b37a559a6d8c1e13c8d6c7fdccde84c44b7bca91dc3f42335c54
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:abc9f4c211b246066019b67bda62d8798fabc65b9d4d90687512ceea2d93be15
 size 627

last-checkpoint/tokenizer.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "version": "1.0",
   "truncation": {
     "direction": "Right",
-    "max_length": 256,
     "strategy": "LongestFirst",
     "stride": 0
   },

   "version": "1.0",
   "truncation": {
     "direction": "Right",
+    "max_length": 512,
     "strategy": "LongestFirst",
     "stride": 0
   },

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 50.0,
-  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -42,11 +42,47 @@
       "eval_samples_per_second": 2.065,
       "eval_steps_per_second": 0.263,
       "step": 1000
     }
   ],
-  "max_steps": 6000,
   "num_train_epochs": 300,
-  "total_flos": 1684342840243968.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 51.282051282051285,
+  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 2.065,
       "eval_steps_per_second": 0.263,
       "step": 1000
+    },
+    {
+      "epoch": 38.46,
+      "learning_rate": 3.737500000000001e-05,
+      "loss": 0.0966,
+      "step": 1500
+    },
+    {
+      "epoch": 38.46,
+      "eval_bleu": 95.4441,
+      "eval_em": 0.3669,
+      "eval_gen_len": 81.6475,
+      "eval_loss": 0.21956025063991547,
+      "eval_rm": 0.4484,
+      "eval_runtime": 168.3123,
+      "eval_samples_per_second": 2.478,
+      "eval_steps_per_second": 0.315,
+      "step": 1500
+    },
+    {
+      "epoch": 51.28,
+      "learning_rate": 4.9875000000000006e-05,
+      "loss": 0.0406,
+      "step": 2000
+    },
+    {
+      "epoch": 51.28,
+      "eval_bleu": 96.0687,
+      "eval_em": 0.5108,
+      "eval_gen_len": 80.777,
+      "eval_loss": 0.21358482539653778,
+      "eval_rm": 0.5947,
+      "eval_runtime": 167.4281,
+      "eval_samples_per_second": 2.491,
+      "eval_steps_per_second": 0.317,
+      "step": 2000
     }
   ],
+  "max_steps": 11700,
   "num_train_epochs": 300,
+  "total_flos": 2482891695940608.0,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1fc784f56cec5fc43d18ab5ff57ab39bd39a59b8189c581fdeed27fd56ef525
 size 4155

 version https://git-lfs.github.com/spec/v1
+oid sha256:6bb7cbf69764be856cace1d69d8021e6c2300e10ccc26fbc78c609f8368570b4
 size 4155

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:52564efd56a5ea6b573c8b10e183d879db2ec6de0aad81a84eb25e8534a7117d
 size 996026489

 version https://git-lfs.github.com/spec/v1
+oid sha256:faf1f2b9424af846730ab18d00f63657ae804747565792e465df7cbcce97ff99
 size 996026489

runs/May24_13-41-32_8e3a7392af54/1684936618.1342323/events.out.tfevents.1684936618.8e3a7392af54.2936.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e23e80c2336e8305aa99b1c12e57436739f52bc63ab92a14b656d5260e5d1fe
+size 6285

runs/May24_13-41-32_8e3a7392af54/events.out.tfevents.1684936618.8e3a7392af54.2936.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:545cb9a8e1f415d4c8c7a1797c5eaa18187dbebc88795fed0b0f4997de88d716
+size 8595

runs/May24_14-02-57_8e3a7392af54/1684937027.34625/events.out.tfevents.1684937027.8e3a7392af54.8284.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2962706436f264e3725e42f9465d412f3857622e13aabef567c952efaa7493e2
+size 6285

runs/May24_14-02-57_8e3a7392af54/events.out.tfevents.1684937027.8e3a7392af54.8284.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3e3507793a2cbaef8e2d6f31609252db3b06a0dc159c914011f230c63ca7eed9
+size 9833

tokenizer.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "version": "1.0",
   "truncation": {
     "direction": "Right",
-    "max_length": 256,
     "strategy": "LongestFirst",
     "stride": 0
   },

   "version": "1.0",
   "truncation": {
     "direction": "Right",
+    "max_length": 512,
     "strategy": "LongestFirst",
     "stride": 0
   },

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1fc784f56cec5fc43d18ab5ff57ab39bd39a59b8189c581fdeed27fd56ef525
 size 4155

 version https://git-lfs.github.com/spec/v1
+oid sha256:6bb7cbf69764be856cace1d69d8021e6c2300e10ccc26fbc78c609f8368570b4
 size 4155