End of training

Browse files

Files changed (5) hide show

all_results.json +14 -0
eval_results.json +9 -0
pytorch_model.bin +1 -1
train_results.json +8 -0
trainer_state.json +148 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "epoch": 49.98,
+    "eval_loss": 1.0834776163101196,
+    "eval_runtime": 17.233,
+    "eval_samples": 509,
+    "eval_samples_per_second": 29.536,
+    "eval_steps_per_second": 3.714,
+    "eval_wer": 0.7489748096074985,
+    "train_loss": 4.119469966888428,
+    "train_runtime": 2676.0092,
+    "train_samples": 1035,
+    "train_samples_per_second": 19.338,
+    "train_steps_per_second": 0.598
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 49.98,
+    "eval_loss": 1.0834776163101196,
+    "eval_runtime": 17.233,
+    "eval_samples": 509,
+    "eval_samples_per_second": 29.536,
+    "eval_steps_per_second": 3.714,
+    "eval_wer": 0.7489748096074985
+}

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f861c8e99f069e5b1e089b6db083237c52824a51c19a10dfcd2712791da36470
 size 1262063089

 version https://git-lfs.github.com/spec/v1
+oid sha256:b47d3e78fde38ad751e57fe17fa7a09a47fd46fdb32aa8d942b9be80e7578f6b
 size 1262063089

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 49.98,
+    "train_loss": 4.119469966888428,
+    "train_runtime": 2676.0092,
+    "train_samples": 1035,
+    "train_samples_per_second": 19.338,
+    "train_steps_per_second": 0.598
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,148 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 49.98461538461538,
+  "global_step": 1600,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 3.12,
+      "learning_rate": 3.675e-06,
+      "loss": 16.3071,
+      "step": 100
+    },
+    {
+      "epoch": 6.25,
+      "learning_rate": 7.3875e-06,
+      "loss": 10.3912,
+      "step": 200
+    },
+    {
+      "epoch": 9.37,
+      "learning_rate": 1.1137499999999998e-05,
+      "loss": 4.1432,
+      "step": 300
+    },
+    {
+      "epoch": 12.49,
+      "learning_rate": 1.48875e-05,
+      "loss": 3.3835,
+      "step": 400
+    },
+    {
+      "epoch": 15.62,
+      "learning_rate": 1.86375e-05,
+      "loss": 3.1483,
+      "step": 500
+    },
+    {
+      "epoch": 15.62,
+      "eval_loss": 3.0498125553131104,
+      "eval_runtime": 17.1221,
+      "eval_samples_per_second": 29.728,
+      "eval_steps_per_second": 3.738,
+      "eval_wer": 1.0,
+      "step": 500
+    },
+    {
+      "epoch": 18.74,
+      "learning_rate": 2.23875e-05,
+      "loss": 3.032,
+      "step": 600
+    },
+    {
+      "epoch": 21.86,
+      "learning_rate": 2.6137499999999995e-05,
+      "loss": 2.9869,
+      "step": 700
+    },
+    {
+      "epoch": 24.98,
+      "learning_rate": 2.9887499999999998e-05,
+      "loss": 2.9399,
+      "step": 800
+    },
+    {
+      "epoch": 28.12,
+      "learning_rate": 3.36375e-05,
+      "loss": 2.9046,
+      "step": 900
+    },
+    {
+      "epoch": 31.25,
+      "learning_rate": 3.7387499999999994e-05,
+      "loss": 2.8449,
+      "step": 1000
+    },
+    {
+      "epoch": 31.25,
+      "eval_loss": 2.7789549827575684,
+      "eval_runtime": 16.9653,
+      "eval_samples_per_second": 30.002,
+      "eval_steps_per_second": 3.772,
+      "eval_wer": 0.9493263034563562,
+      "step": 1000
+    },
+    {
+      "epoch": 34.37,
+      "learning_rate": 4.11375e-05,
+      "loss": 2.8219,
+      "step": 1100
+    },
+    {
+      "epoch": 37.49,
+      "learning_rate": 4.48875e-05,
+      "loss": 2.761,
+      "step": 1200
+    },
+    {
+      "epoch": 40.62,
+      "learning_rate": 4.8637499999999996e-05,
+      "loss": 2.5482,
+      "step": 1300
+    },
+    {
+      "epoch": 43.74,
+      "learning_rate": 5.23875e-05,
+      "loss": 2.1627,
+      "step": 1400
+    },
+    {
+      "epoch": 46.86,
+      "learning_rate": 5.61375e-05,
+      "loss": 1.8683,
+      "step": 1500
+    },
+    {
+      "epoch": 46.86,
+      "eval_loss": 1.233871340751648,
+      "eval_runtime": 17.2711,
+      "eval_samples_per_second": 29.471,
+      "eval_steps_per_second": 3.706,
+      "eval_wer": 0.8160515524311658,
+      "step": 1500
+    },
+    {
+      "epoch": 49.98,
+      "learning_rate": 5.988749999999999e-05,
+      "loss": 1.6679,
+      "step": 1600
+    },
+    {
+      "epoch": 49.98,
+      "step": 1600,
+      "total_flos": 6.038839616760506e+18,
+      "train_loss": 4.119469966888428,
+      "train_runtime": 2676.0092,
+      "train_samples_per_second": 19.338,
+      "train_steps_per_second": 0.598
+    }
+  ],
+  "max_steps": 1600,
+  "num_train_epochs": 50,
+  "total_flos": 6.038839616760506e+18,
+  "trial_name": null,
+  "trial_params": null
+}