End of training

Browse files

Files changed (5) hide show

all_results.json +12 -0
eval_results.json +8 -0
runs/Dec14_12-34-50_129-146-3-4/events.out.tfevents.1671044568.129-146-3-4.128084.2 +3 -0
train_results.json +7 -0
trainer_state.json +310 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 18.05,
+    "eval_loss": 0.310791015625,
+    "eval_runtime": 1233.2613,
+    "eval_samples_per_second": 1.473,
+    "eval_steps_per_second": 0.092,
+    "eval_wer": 15.220630647952316,
+    "train_loss": 0.11388700485229492,
+    "train_runtime": 21738.0755,
+    "train_samples_per_second": 2.944,
+    "train_steps_per_second": 0.046
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 18.05,
+    "eval_loss": 0.310791015625,
+    "eval_runtime": 1233.2613,
+    "eval_samples_per_second": 1.473,
+    "eval_steps_per_second": 0.092,
+    "eval_wer": 15.220630647952316
+}

runs/Dec14_12-34-50_129-146-3-4/events.out.tfevents.1671044568.129-146-3-4.128084.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:354a891ce4c7f6f541b5539b5e788788a97708d9e7bbb9ce498f8c80c7131817
+size 358

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 18.05,
+    "train_loss": 0.11388700485229492,
+    "train_runtime": 21738.0755,
+    "train_samples_per_second": 2.944,
+    "train_steps_per_second": 0.046
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,310 @@

+{
+  "best_metric": 15.220630647952316,
+  "best_model_checkpoint": "./checkpoint-800",
+  "epoch": 18.046,
+  "global_step": 1000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.03,
+      "learning_rate": 6.808639180087963e-07,
+      "loss": 0.6535,
+      "step": 25
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 8.406206186877934e-07,
+      "loss": 0.3728,
+      "step": 50
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.316614300602277e-07,
+      "loss": 0.3301,
+      "step": 75
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 9.956130378462473e-07,
+      "loss": 0.2662,
+      "step": 100
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 1e-06,
+      "loss": 0.2556,
+      "step": 125
+    },
+    {
+      "epoch": 2.04,
+      "learning_rate": 1e-06,
+      "loss": 0.2261,
+      "step": 150
+    },
+    {
+      "epoch": 3.02,
+      "learning_rate": 1e-06,
+      "loss": 0.2064,
+      "step": 175
+    },
+    {
+      "epoch": 3.04,
+      "learning_rate": 1e-06,
+      "loss": 0.1931,
+      "step": 200
+    },
+    {
+      "epoch": 3.04,
+      "eval_loss": 0.2491455078125,
+      "eval_runtime": 1241.9821,
+      "eval_samples_per_second": 1.462,
+      "eval_steps_per_second": 0.092,
+      "eval_wer": 16.927033262834073,
+      "step": 200
+    },
+    {
+      "epoch": 4.01,
+      "learning_rate": 1e-06,
+      "loss": 0.1728,
+      "step": 225
+    },
+    {
+      "epoch": 4.04,
+      "learning_rate": 1e-06,
+      "loss": 0.1673,
+      "step": 250
+    },
+    {
+      "epoch": 5.01,
+      "learning_rate": 1e-06,
+      "loss": 0.1485,
+      "step": 275
+    },
+    {
+      "epoch": 5.04,
+      "learning_rate": 1e-06,
+      "loss": 0.1505,
+      "step": 300
+    },
+    {
+      "epoch": 6.01,
+      "learning_rate": 1e-06,
+      "loss": 0.1237,
+      "step": 325
+    },
+    {
+      "epoch": 6.03,
+      "learning_rate": 1e-06,
+      "loss": 0.1269,
+      "step": 350
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 1e-06,
+      "loss": 0.1095,
+      "step": 375
+    },
+    {
+      "epoch": 7.03,
+      "learning_rate": 1e-06,
+      "loss": 0.1108,
+      "step": 400
+    },
+    {
+      "epoch": 7.03,
+      "eval_loss": 0.2379150390625,
+      "eval_runtime": 1224.773,
+      "eval_samples_per_second": 1.483,
+      "eval_steps_per_second": 0.093,
+      "eval_wer": 15.271101711209385,
+      "step": 400
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 1e-06,
+      "loss": 0.0918,
+      "step": 425
+    },
+    {
+      "epoch": 8.03,
+      "learning_rate": 1e-06,
+      "loss": 0.0965,
+      "step": 450
+    },
+    {
+      "epoch": 8.05,
+      "learning_rate": 1e-06,
+      "loss": 0.0762,
+      "step": 475
+    },
+    {
+      "epoch": 9.02,
+      "learning_rate": 1e-06,
+      "loss": 0.0795,
+      "step": 500
+    },
+    {
+      "epoch": 9.05,
+      "learning_rate": 1e-06,
+      "loss": 0.0647,
+      "step": 525
+    },
+    {
+      "epoch": 10.02,
+      "learning_rate": 1e-06,
+      "loss": 0.0687,
+      "step": 550
+    },
+    {
+      "epoch": 10.04,
+      "learning_rate": 1e-06,
+      "loss": 0.0549,
+      "step": 575
+    },
+    {
+      "epoch": 11.02,
+      "learning_rate": 1e-06,
+      "loss": 0.0548,
+      "step": 600
+    },
+    {
+      "epoch": 11.02,
+      "eval_loss": 0.266845703125,
+      "eval_runtime": 1238.3412,
+      "eval_samples_per_second": 1.466,
+      "eval_steps_per_second": 0.092,
+      "eval_wer": 15.311959238607962,
+      "step": 600
+    },
+    {
+      "epoch": 11.04,
+      "learning_rate": 1e-06,
+      "loss": 0.0459,
+      "step": 625
+    },
+    {
+      "epoch": 12.01,
+      "learning_rate": 1e-06,
+      "loss": 0.0412,
+      "step": 650
+    },
+    {
+      "epoch": 12.04,
+      "learning_rate": 1e-06,
+      "loss": 0.0388,
+      "step": 675
+    },
+    {
+      "epoch": 13.01,
+      "learning_rate": 1e-06,
+      "loss": 0.0318,
+      "step": 700
+    },
+    {
+      "epoch": 13.04,
+      "learning_rate": 1e-06,
+      "loss": 0.0302,
+      "step": 725
+    },
+    {
+      "epoch": 14.01,
+      "learning_rate": 1e-06,
+      "loss": 0.0237,
+      "step": 750
+    },
+    {
+      "epoch": 14.03,
+      "learning_rate": 1e-06,
+      "loss": 0.0249,
+      "step": 775
+    },
+    {
+      "epoch": 15.01,
+      "learning_rate": 1e-06,
+      "loss": 0.0189,
+      "step": 800
+    },
+    {
+      "epoch": 15.01,
+      "eval_loss": 0.310791015625,
+      "eval_runtime": 1234.5727,
+      "eval_samples_per_second": 1.471,
+      "eval_steps_per_second": 0.092,
+      "eval_wer": 15.220630647952316,
+      "step": 800
+    },
+    {
+      "epoch": 15.03,
+      "learning_rate": 1e-06,
+      "loss": 0.0192,
+      "step": 825
+    },
+    {
+      "epoch": 16.0,
+      "learning_rate": 1e-06,
+      "loss": 0.0147,
+      "step": 850
+    },
+    {
+      "epoch": 16.03,
+      "learning_rate": 1e-06,
+      "loss": 0.016,
+      "step": 875
+    },
+    {
+      "epoch": 16.05,
+      "learning_rate": 1e-06,
+      "loss": 0.0113,
+      "step": 900
+    },
+    {
+      "epoch": 17.02,
+      "learning_rate": 1e-06,
+      "loss": 0.0118,
+      "step": 925
+    },
+    {
+      "epoch": 17.05,
+      "learning_rate": 1e-06,
+      "loss": 0.009,
+      "step": 950
+    },
+    {
+      "epoch": 18.02,
+      "learning_rate": 1e-06,
+      "loss": 0.0094,
+      "step": 975
+    },
+    {
+      "epoch": 18.05,
+      "learning_rate": 1e-06,
+      "loss": 0.0078,
+      "step": 1000
+    },
+    {
+      "epoch": 18.05,
+      "eval_loss": 0.349853515625,
+      "eval_runtime": 1222.6116,
+      "eval_samples_per_second": 1.485,
+      "eval_steps_per_second": 0.093,
+      "eval_wer": 15.557104402999421,
+      "step": 1000
+    },
+    {
+      "epoch": 18.05,
+      "step": 1000,
+      "total_flos": 1.3481286560656864e+20,
+      "train_loss": 0.11388700485229492,
+      "train_runtime": 21738.0755,
+      "train_samples_per_second": 2.944,
+      "train_steps_per_second": 0.046
+    }
+  ],
+  "max_steps": 1000,
+  "num_train_epochs": 9223372036854775807,
+  "total_flos": 1.3481286560656864e+20,
+  "trial_name": null,
+  "trial_params": null
+}