Training in progress, step 12900

Files changed (7) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1acab9f1f87bb8997dd7facdc59e29791172f20bfb8f28ec5f916f86fa567602
 size 168299

 version https://git-lfs.github.com/spec/v1
+oid sha256:5990995660d7c8ef450a06f4f502b88c7d752b56eec9f1cec91e8d3513b2a441
 size 168299

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:59ad9650eaf554ddda7628e26bd103d8554b3de0c7f7682a88d21b66017028d8
 size 377643361

 version https://git-lfs.github.com/spec/v1
+oid sha256:936a710233cf483b671c9477973ee64f4dfca8c393e650dab6af783eb8ddb9b0
 size 377643361

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:80e544cba32ec75459c161247d4facaa2b4fc8fcb7647fcacaa0d26c5953f6ca
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:8ded27760656c0d272b31d2ec257c97ddeec796cbce5f12c71319260e973b38f
 size 14639

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2b147065468330380807804ba3fbd366eb4829ebc88e87bc212032c83a8a8578
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:bb3b559632ef334f45db24351ce386ff70c241ff4efb81c961a12e1e7bf84f49
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5f5f8a200466194c3de6667fb6855522764bf15876e8b390e023cab10eb20011
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:3a4a0aa4359797d3666762513dc8ad38c116a34a6308ea535e1a273206e85322
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 25.0,
-  "global_step": 6450,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -22,11 +22,27 @@
       "eval_steps_per_second": 3.35,
       "eval_wer": 1.0,
       "step": 6450
     }
   ],
   "max_steps": 64500,
   "num_train_epochs": 250,
-  "total_flos": 6.195000792219702e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 50.0,
+  "global_step": 12900,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 3.35,
       "eval_wer": 1.0,
       "step": 6450
+    },
+    {
+      "epoch": 50.0,
+      "learning_rate": 8.422521419828641e-05,
+      "loss": 3.1417,
+      "step": 12900
+    },
+    {
+      "epoch": 50.0,
+      "eval_cer": 0.9991341991341991,
+      "eval_loss": 3.1051225662231445,
+      "eval_runtime": 7.9823,
+      "eval_samples_per_second": 26.308,
+      "eval_steps_per_second": 3.382,
+      "eval_wer": 1.0,
+      "step": 12900
     }
   ],
   "max_steps": 64500,
   "num_train_epochs": 250,
+  "total_flos": 1.2395173933378003e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:59ad9650eaf554ddda7628e26bd103d8554b3de0c7f7682a88d21b66017028d8
 size 377643361

 version https://git-lfs.github.com/spec/v1
+oid sha256:936a710233cf483b671c9477973ee64f4dfca8c393e650dab6af783eb8ddb9b0
 size 377643361