TenzinGayche commited on May 17, 2023

Commit

0d45503

•

1 Parent(s): e68c6d8

Training in progress, step 2500

Browse files

Files changed (19) hide show

{checkpoint-1300 → checkpoint-2400}/config.json +0 -0
{checkpoint-1300 → checkpoint-2400}/optimizer.pt +1 -1
{checkpoint-1300 → checkpoint-2400}/preprocessor_config.json +0 -0
{checkpoint-1400 → checkpoint-2400}/pytorch_model.bin +1 -1
{checkpoint-1400 → checkpoint-2400}/rng_state.pth +1 -1
{checkpoint-1400 → checkpoint-2400}/scaler.pt +1 -1
{checkpoint-1300 → checkpoint-2400}/scheduler.pt +1 -1
{checkpoint-1400 → checkpoint-2400}/trainer_state.json +213 -3
{checkpoint-1300 → checkpoint-2400}/training_args.bin +0 -0
{checkpoint-1400 → checkpoint-2500}/config.json +0 -0
{checkpoint-1400 → checkpoint-2500}/optimizer.pt +1 -1
{checkpoint-1400 → checkpoint-2500}/preprocessor_config.json +0 -0
{checkpoint-1300 → checkpoint-2500}/pytorch_model.bin +1 -1
{checkpoint-1300 → checkpoint-2500}/rng_state.pth +2 -2
{checkpoint-1300 → checkpoint-2500}/scaler.pt +1 -1
{checkpoint-1400 → checkpoint-2500}/scheduler.pt +1 -1
{checkpoint-1300 → checkpoint-2500}/trainer_state.json +255 -3
{checkpoint-1400 → checkpoint-2500}/training_args.bin +0 -0
pytorch_model.bin +1 -1

{checkpoint-1300 → checkpoint-2400}/config.json RENAMED Viewed

File without changes

{checkpoint-1300 → checkpoint-2400}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:60c1666c0a22afd442f94ad9a2fb031f26ef23fc68ac37235ef5e164c93d256d
 size 2490946501

 version https://git-lfs.github.com/spec/v1
+oid sha256:21ec413dbf6dce3f66f0847998faf0727145082a010278c772b5854d5056f118
 size 2490946501

{checkpoint-1300 → checkpoint-2400}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-1400 → checkpoint-2400}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:525988dbd5f8d7b2e059acdea4c0a6bc193e607eee39c65af058fb9d8d7a8539
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:66e4f13af4571dc4fc776d37a670bd005d274231a78ff352023ba5c4fadd8614
 size 1262344621

{checkpoint-1400 → checkpoint-2400}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3e195c0cbe62b1c3287e8c8ade092811fd748dee533be1e8e2f44adb3a467e7d
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:89ee801de1abf33cd6ebc4f0b38240fe2dfecaa66947acc7503d6a21ded7f76f
 size 14639

{checkpoint-1400 → checkpoint-2400}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:beab7ac9352e542e0ab61f68c372e6cd98f7db9ae003386f401b5ce518bf6451
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:2dcc907e7c7cdb7f74446d1478d9321af62972312f69212a9da63fbf093fd591
 size 557

{checkpoint-1300 → checkpoint-2400}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:25421b1b72b7f9c181ce4b25601b3a2bfa4015a8cac8ada8a61cd22ffcfde034
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:3212d7bddbe681e165c9fd72ab4f4e8de8c824c01389aa4a534800797bb190ca
 size 627

{checkpoint-1400 → checkpoint-2400}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 9.523809523809524,
-  "global_step": 1400,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -300,11 +300,221 @@
       "eval_samples_per_second": 23.669,
       "eval_steps_per_second": 2.979,
       "step": 1400
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
-  "total_flos": 5.445185739163822e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 16.3265306122449,
+  "global_step": 2400,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 23.669,
       "eval_steps_per_second": 2.979,
       "step": 1400
+    },
+    {
+      "epoch": 9.86,
+      "learning_rate": 0.00021051968503937006,
+      "loss": 0.4415,
+      "step": 1450
+    },
+    {
+      "epoch": 10.2,
+      "learning_rate": 0.00020579527559055118,
+      "loss": 0.417,
+      "step": 1500
+    },
+    {
+      "epoch": 10.2,
+      "eval_cer": 0.17156367193869232,
+      "eval_loss": 0.3833578824996948,
+      "eval_runtime": 24.455,
+      "eval_samples_per_second": 24.044,
+      "eval_steps_per_second": 3.026,
+      "step": 1500
+    },
+    {
+      "epoch": 10.54,
+      "learning_rate": 0.00020107086614173225,
+      "loss": 0.3959,
+      "step": 1550
+    },
+    {
+      "epoch": 10.88,
+      "learning_rate": 0.00019634645669291338,
+      "loss": 0.4074,
+      "step": 1600
+    },
+    {
+      "epoch": 10.88,
+      "eval_cer": 0.16301972933311593,
+      "eval_loss": 0.3626195192337036,
+      "eval_runtime": 24.5184,
+      "eval_samples_per_second": 23.982,
+      "eval_steps_per_second": 3.018,
+      "step": 1600
+    },
+    {
+      "epoch": 11.22,
+      "learning_rate": 0.00019162204724409448,
+      "loss": 0.3584,
+      "step": 1650
+    },
+    {
+      "epoch": 11.56,
+      "learning_rate": 0.0001868976377952756,
+      "loss": 0.3682,
+      "step": 1700
+    },
+    {
+      "epoch": 11.56,
+      "eval_cer": 0.15685635088863525,
+      "eval_loss": 0.36927542090415955,
+      "eval_runtime": 24.3751,
+      "eval_samples_per_second": 24.123,
+      "eval_steps_per_second": 3.036,
+      "step": 1700
+    },
+    {
+      "epoch": 11.9,
+      "learning_rate": 0.00018217322834645667,
+      "loss": 0.3455,
+      "step": 1750
+    },
+    {
+      "epoch": 12.24,
+      "learning_rate": 0.00017744881889763777,
+      "loss": 0.3245,
+      "step": 1800
+    },
+    {
+      "epoch": 12.24,
+      "eval_cer": 0.15816076960704387,
+      "eval_loss": 0.3740461468696594,
+      "eval_runtime": 24.7162,
+      "eval_samples_per_second": 23.79,
+      "eval_steps_per_second": 2.994,
+      "step": 1800
+    },
+    {
+      "epoch": 12.59,
+      "learning_rate": 0.0001727244094488189,
+      "loss": 0.3208,
+      "step": 1850
+    },
+    {
+      "epoch": 12.93,
+      "learning_rate": 0.000168,
+      "loss": 0.3063,
+      "step": 1900
+    },
+    {
+      "epoch": 12.93,
+      "eval_cer": 0.15904125224196966,
+      "eval_loss": 0.3622555434703827,
+      "eval_runtime": 24.4729,
+      "eval_samples_per_second": 24.027,
+      "eval_steps_per_second": 3.024,
+      "step": 1900
+    },
+    {
+      "epoch": 13.27,
+      "learning_rate": 0.0001632755905511811,
+      "loss": 0.3019,
+      "step": 1950
+    },
+    {
+      "epoch": 13.61,
+      "learning_rate": 0.00015855118110236219,
+      "loss": 0.2945,
+      "step": 2000
+    },
+    {
+      "epoch": 13.61,
+      "eval_cer": 0.16634599706505787,
+      "eval_loss": 0.3725011348724365,
+      "eval_runtime": 25.0023,
+      "eval_samples_per_second": 23.518,
+      "eval_steps_per_second": 2.96,
+      "step": 2000
+    },
+    {
+      "epoch": 13.95,
+      "learning_rate": 0.0001538267716535433,
+      "loss": 0.279,
+      "step": 2050
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 0.0001491023622047244,
+      "loss": 0.2674,
+      "step": 2100
+    },
+    {
+      "epoch": 14.29,
+      "eval_cer": 0.15731289744007826,
+      "eval_loss": 0.3531067371368408,
+      "eval_runtime": 24.8381,
+      "eval_samples_per_second": 23.673,
+      "eval_steps_per_second": 2.979,
+      "step": 2100
+    },
+    {
+      "epoch": 14.63,
+      "learning_rate": 0.0001443779527559055,
+      "loss": 0.2584,
+      "step": 2150
+    },
+    {
+      "epoch": 14.97,
+      "learning_rate": 0.0001396535433070866,
+      "loss": 0.2796,
+      "step": 2200
+    },
+    {
+      "epoch": 14.97,
+      "eval_cer": 0.14808413500733736,
+      "eval_loss": 0.3606802523136139,
+      "eval_runtime": 24.8151,
+      "eval_samples_per_second": 23.695,
+      "eval_steps_per_second": 2.982,
+      "step": 2200
+    },
+    {
+      "epoch": 15.31,
+      "learning_rate": 0.0001349291338582677,
+      "loss": 0.2462,
+      "step": 2250
+    },
+    {
+      "epoch": 15.65,
+      "learning_rate": 0.0001302047244094488,
+      "loss": 0.256,
+      "step": 2300
+    },
+    {
+      "epoch": 15.65,
+      "eval_cer": 0.15819338007500408,
+      "eval_loss": 0.3580550253391266,
+      "eval_runtime": 24.5695,
+      "eval_samples_per_second": 23.932,
+      "eval_steps_per_second": 3.012,
+      "step": 2300
+    },
+    {
+      "epoch": 15.99,
+      "learning_rate": 0.00012548031496062992,
+      "loss": 0.2524,
+      "step": 2350
+    },
+    {
+      "epoch": 16.33,
+      "learning_rate": 0.00012075590551181102,
+      "loss": 0.2219,
+      "step": 2400
+    },
+    {
+      "epoch": 16.33,
+      "eval_cer": 0.14801891407141693,
+      "eval_loss": 0.35925593972206116,
+      "eval_runtime": 24.982,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.962,
+      "step": 2400
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
+  "total_flos": 9.330801216434254e+18,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-1300 → checkpoint-2400}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-1400 → checkpoint-2500}/config.json RENAMED Viewed

File without changes

{checkpoint-1400 → checkpoint-2500}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1e5e6891b1564f4b96d98ec7f0ef55e8529b27ce8ed8b89164463ea2b9d4e22c
 size 2490946501

 version https://git-lfs.github.com/spec/v1
+oid sha256:c295d37c841b2d9274e1c2ff590e71f0a545a4dfe10d0f547dca1cf116d93838
 size 2490946501

{checkpoint-1400 → checkpoint-2500}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-1300 → checkpoint-2500}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0bc90199dc2ecc37a23a362572fba266636f4b6878e99b8110257efd797480e7
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:a368a48ff43ab4bc8e301dc5a41abb75b9de3b052aeffd6edcf4765b37523a8d
 size 1262344621

{checkpoint-1300 → checkpoint-2500}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3e6254add3221c3bb1601a93aa46c1e8325da0f3ff08620c5c64a7e934c66208
-size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:8575e4b2ab78e0afbc81dc9eacc30543d16798a08a6fac89cde25f7c7f9d9a06
+size 14703

{checkpoint-1300 → checkpoint-2500}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aef98761cd842a9942d5f99a607d8d1f1e746566961234fad871f99a1c4bb56e
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c0deb49ff9261d5b5d7609a0755c25d7a947f998b4734a1525c3a096a987646
 size 557

{checkpoint-1400 → checkpoint-2500}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2f5e93a0a05373e052e8c26d47329bbd69b6ce25046ec38875cdf3bacb435a33
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:d1dc16f2d67a6830e5fca5f7b55d822dad401a11ddc497a9f782324d540f77d8
 size 627

{checkpoint-1300 → checkpoint-2500}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 8.843537414965986,
-  "global_step": 1300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -279,11 +279,263 @@
       "eval_samples_per_second": 23.629,
       "eval_steps_per_second": 2.974,
       "step": 1300
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
-  "total_flos": 5.062688283872989e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 17.006802721088434,
+  "global_step": 2500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 23.629,
       "eval_steps_per_second": 2.974,
       "step": 1300
+    },
+    {
+      "epoch": 9.18,
+      "learning_rate": 0.00021996850393700784,
+      "loss": 0.4621,
+      "step": 1350
+    },
+    {
+      "epoch": 9.52,
+      "learning_rate": 0.00021524409448818896,
+      "loss": 0.4583,
+      "step": 1400
+    },
+    {
+      "epoch": 9.52,
+      "eval_cer": 0.1760313060492418,
+      "eval_loss": 0.41417357325553894,
+      "eval_runtime": 24.8425,
+      "eval_samples_per_second": 23.669,
+      "eval_steps_per_second": 2.979,
+      "step": 1400
+    },
+    {
+      "epoch": 9.86,
+      "learning_rate": 0.00021051968503937006,
+      "loss": 0.4415,
+      "step": 1450
+    },
+    {
+      "epoch": 10.2,
+      "learning_rate": 0.00020579527559055118,
+      "loss": 0.417,
+      "step": 1500
+    },
+    {
+      "epoch": 10.2,
+      "eval_cer": 0.17156367193869232,
+      "eval_loss": 0.3833578824996948,
+      "eval_runtime": 24.455,
+      "eval_samples_per_second": 24.044,
+      "eval_steps_per_second": 3.026,
+      "step": 1500
+    },
+    {
+      "epoch": 10.54,
+      "learning_rate": 0.00020107086614173225,
+      "loss": 0.3959,
+      "step": 1550
+    },
+    {
+      "epoch": 10.88,
+      "learning_rate": 0.00019634645669291338,
+      "loss": 0.4074,
+      "step": 1600
+    },
+    {
+      "epoch": 10.88,
+      "eval_cer": 0.16301972933311593,
+      "eval_loss": 0.3626195192337036,
+      "eval_runtime": 24.5184,
+      "eval_samples_per_second": 23.982,
+      "eval_steps_per_second": 3.018,
+      "step": 1600
+    },
+    {
+      "epoch": 11.22,
+      "learning_rate": 0.00019162204724409448,
+      "loss": 0.3584,
+      "step": 1650
+    },
+    {
+      "epoch": 11.56,
+      "learning_rate": 0.0001868976377952756,
+      "loss": 0.3682,
+      "step": 1700
+    },
+    {
+      "epoch": 11.56,
+      "eval_cer": 0.15685635088863525,
+      "eval_loss": 0.36927542090415955,
+      "eval_runtime": 24.3751,
+      "eval_samples_per_second": 24.123,
+      "eval_steps_per_second": 3.036,
+      "step": 1700
+    },
+    {
+      "epoch": 11.9,
+      "learning_rate": 0.00018217322834645667,
+      "loss": 0.3455,
+      "step": 1750
+    },
+    {
+      "epoch": 12.24,
+      "learning_rate": 0.00017744881889763777,
+      "loss": 0.3245,
+      "step": 1800
+    },
+    {
+      "epoch": 12.24,
+      "eval_cer": 0.15816076960704387,
+      "eval_loss": 0.3740461468696594,
+      "eval_runtime": 24.7162,
+      "eval_samples_per_second": 23.79,
+      "eval_steps_per_second": 2.994,
+      "step": 1800
+    },
+    {
+      "epoch": 12.59,
+      "learning_rate": 0.0001727244094488189,
+      "loss": 0.3208,
+      "step": 1850
+    },
+    {
+      "epoch": 12.93,
+      "learning_rate": 0.000168,
+      "loss": 0.3063,
+      "step": 1900
+    },
+    {
+      "epoch": 12.93,
+      "eval_cer": 0.15904125224196966,
+      "eval_loss": 0.3622555434703827,
+      "eval_runtime": 24.4729,
+      "eval_samples_per_second": 24.027,
+      "eval_steps_per_second": 3.024,
+      "step": 1900
+    },
+    {
+      "epoch": 13.27,
+      "learning_rate": 0.0001632755905511811,
+      "loss": 0.3019,
+      "step": 1950
+    },
+    {
+      "epoch": 13.61,
+      "learning_rate": 0.00015855118110236219,
+      "loss": 0.2945,
+      "step": 2000
+    },
+    {
+      "epoch": 13.61,
+      "eval_cer": 0.16634599706505787,
+      "eval_loss": 0.3725011348724365,
+      "eval_runtime": 25.0023,
+      "eval_samples_per_second": 23.518,
+      "eval_steps_per_second": 2.96,
+      "step": 2000
+    },
+    {
+      "epoch": 13.95,
+      "learning_rate": 0.0001538267716535433,
+      "loss": 0.279,
+      "step": 2050
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 0.0001491023622047244,
+      "loss": 0.2674,
+      "step": 2100
+    },
+    {
+      "epoch": 14.29,
+      "eval_cer": 0.15731289744007826,
+      "eval_loss": 0.3531067371368408,
+      "eval_runtime": 24.8381,
+      "eval_samples_per_second": 23.673,
+      "eval_steps_per_second": 2.979,
+      "step": 2100
+    },
+    {
+      "epoch": 14.63,
+      "learning_rate": 0.0001443779527559055,
+      "loss": 0.2584,
+      "step": 2150
+    },
+    {
+      "epoch": 14.97,
+      "learning_rate": 0.0001396535433070866,
+      "loss": 0.2796,
+      "step": 2200
+    },
+    {
+      "epoch": 14.97,
+      "eval_cer": 0.14808413500733736,
+      "eval_loss": 0.3606802523136139,
+      "eval_runtime": 24.8151,
+      "eval_samples_per_second": 23.695,
+      "eval_steps_per_second": 2.982,
+      "step": 2200
+    },
+    {
+      "epoch": 15.31,
+      "learning_rate": 0.0001349291338582677,
+      "loss": 0.2462,
+      "step": 2250
+    },
+    {
+      "epoch": 15.65,
+      "learning_rate": 0.0001302047244094488,
+      "loss": 0.256,
+      "step": 2300
+    },
+    {
+      "epoch": 15.65,
+      "eval_cer": 0.15819338007500408,
+      "eval_loss": 0.3580550253391266,
+      "eval_runtime": 24.5695,
+      "eval_samples_per_second": 23.932,
+      "eval_steps_per_second": 3.012,
+      "step": 2300
+    },
+    {
+      "epoch": 15.99,
+      "learning_rate": 0.00012548031496062992,
+      "loss": 0.2524,
+      "step": 2350
+    },
+    {
+      "epoch": 16.33,
+      "learning_rate": 0.00012075590551181102,
+      "loss": 0.2219,
+      "step": 2400
+    },
+    {
+      "epoch": 16.33,
+      "eval_cer": 0.14801891407141693,
+      "eval_loss": 0.35925593972206116,
+      "eval_runtime": 24.982,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.962,
+      "step": 2400
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 0.0001160314960629921,
+      "loss": 0.2364,
+      "step": 2450
+    },
+    {
+      "epoch": 17.01,
+      "learning_rate": 0.00011130708661417321,
+      "loss": 0.2291,
+      "step": 2500
+    },
+    {
+      "epoch": 17.01,
+      "eval_cer": 0.1471058209685309,
+      "eval_loss": 0.35567909479141235,
+      "eval_runtime": 24.4749,
+      "eval_samples_per_second": 24.025,
+      "eval_steps_per_second": 3.024,
+      "step": 2500
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
+  "total_flos": 9.701648869870967e+18,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-1400 → checkpoint-2500}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b720f0acc795f0ce8dfdc5369d926dbb4f0c576ab9a917bc26dcfdd9c8bb55f7
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:a368a48ff43ab4bc8e301dc5a41abb75b9de3b052aeffd6edcf4765b37523a8d
 size 1262344621