Training in progress, step 2000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +69 -3
last-checkpoint/training_args.bin +1 -1

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:53b109faeebfa0c0ba61658697fa9237074126c445642641b79158eb7ba30739
 size 966995080

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b5ba145e3e92fb66ec788be874f8cbee7f0085ff368bcc6e82e40aaa73a0d5f
 size 966995080

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc9233433683d3c753053a718e86d2d4fe0a922bf031d40e5d28f0e2784fb198
 size 1925064044

 version https://git-lfs.github.com/spec/v1
+oid sha256:1740cd8b874efa4ad122d863e23ff5318215a8e3b731c7097e12bd5a7057bcab
 size 1925064044

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:be7e79fe3343879b02c09de94643d5ac71cd5dcd0d985d78489ded30fcafb6d1
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:f03aeefa39ca2fb11f1333722fa756c6e72bf123601f13c4e37abb0a0813d75e
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:095de9bddf48720b0136a232ba94acee339b784d05fa46f4489ae091d1c97a55
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:db935c5df4ebb31f619d9a38b43de8eafe4ba340e61b0eff0830784e21464f5b
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
-  "epoch": 3.435114503816794,
   "eval_steps": 100,
-  "global_step": 1800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -601,6 +601,72 @@
       "eval_steps_per_second": 0.114,
       "eval_wer": 163.39434276206325,
       "step": 1800
     }
   ],
   "logging_steps": 25,
@@ -608,7 +674,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
-  "total_flos": 1.661645876502528e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
+  "epoch": 3.816793893129771,
   "eval_steps": 100,
+  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.114,
       "eval_wer": 163.39434276206325,
       "step": 1800
+    },
+    {
+      "epoch": 3.48,
+      "learning_rate": 6.231428571428571e-06,
+      "loss": 0.0348,
+      "step": 1825
+    },
+    {
+      "epoch": 3.53,
+      "learning_rate": 6.16e-06,
+      "loss": 0.0336,
+      "step": 1850
+    },
+    {
+      "epoch": 3.58,
+      "learning_rate": 6.088571428571429e-06,
+      "loss": 0.0347,
+      "step": 1875
+    },
+    {
+      "epoch": 3.63,
+      "learning_rate": 6.017142857142858e-06,
+      "loss": 0.0345,
+      "step": 1900
+    },
+    {
+      "epoch": 3.63,
+      "eval_loss": 0.40161246061325073,
+      "eval_runtime": 1812.1091,
+      "eval_samples_per_second": 0.828,
+      "eval_steps_per_second": 0.104,
+      "eval_wer": 158.56905158069884,
+      "step": 1900
+    },
+    {
+      "epoch": 3.67,
+      "learning_rate": 5.945714285714286e-06,
+      "loss": 0.0327,
+      "step": 1925
+    },
+    {
+      "epoch": 3.72,
+      "learning_rate": 5.874285714285715e-06,
+      "loss": 0.0363,
+      "step": 1950
+    },
+    {
+      "epoch": 3.77,
+      "learning_rate": 5.802857142857144e-06,
+      "loss": 0.0328,
+      "step": 1975
+    },
+    {
+      "epoch": 3.82,
+      "learning_rate": 5.731428571428572e-06,
+      "loss": 0.0346,
+      "step": 2000
+    },
+    {
+      "epoch": 3.82,
+      "eval_loss": 0.40199828147888184,
+      "eval_runtime": 1770.9946,
+      "eval_samples_per_second": 0.847,
+      "eval_steps_per_second": 0.106,
+      "eval_wer": 176.11619523017194,
+      "step": 2000
     }
   ],
   "logging_steps": 25,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
+  "total_flos": 1.846340532707328e+19,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:56b1eae5bcb377ffc0d4c8ff2741201cd456f48425776cda068ae6f4f3917a46
 size 4856

 version https://git-lfs.github.com/spec/v1
+oid sha256:77aa736647908221a6b18a6489ddd200e9a64629e700dfb2729d6eac836a4004
 size 4856