TenzinGayche commited on May 17, 2023

Commit

3ff632d

•

1 Parent(s): d7d6ee2

Training in progress, step 3100

Browse files

Files changed (19) hide show

{checkpoint-1900 → checkpoint-3000}/config.json +0 -0
{checkpoint-1900 → checkpoint-3000}/optimizer.pt +1 -1
{checkpoint-1900 → checkpoint-3000}/preprocessor_config.json +0 -0
{checkpoint-2000 → checkpoint-3000}/pytorch_model.bin +1 -1
{checkpoint-2000 → checkpoint-3000}/rng_state.pth +1 -1
{checkpoint-2000 → checkpoint-3000}/scaler.pt +1 -1
{checkpoint-1900 → checkpoint-3000}/scheduler.pt +1 -1
{checkpoint-2000 → checkpoint-3000}/trainer_state.json +213 -3
{checkpoint-1900 → checkpoint-3000}/training_args.bin +0 -0
{checkpoint-2000 → checkpoint-3100}/config.json +0 -0
{checkpoint-2000 → checkpoint-3100}/optimizer.pt +1 -1
{checkpoint-2000 → checkpoint-3100}/preprocessor_config.json +0 -0
{checkpoint-1900 → checkpoint-3100}/pytorch_model.bin +1 -1
{checkpoint-1900 → checkpoint-3100}/rng_state.pth +2 -2
{checkpoint-1900 → checkpoint-3100}/scaler.pt +1 -1
{checkpoint-2000 → checkpoint-3100}/scheduler.pt +1 -1
{checkpoint-1900 → checkpoint-3100}/trainer_state.json +255 -3
{checkpoint-2000 → checkpoint-3100}/training_args.bin +0 -0
pytorch_model.bin +1 -1

{checkpoint-1900 → checkpoint-3000}/config.json RENAMED Viewed

File without changes

{checkpoint-1900 → checkpoint-3000}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:edfc1df136634c5b701601b6ff6af9b1881f7cd09119136764e47cb758be8c01
 size 2490946501

 version https://git-lfs.github.com/spec/v1
+oid sha256:add5027d5fd3913c88e3ce4c98bba2cacc80d01308c6d7e2ef915041867428fd
 size 2490946501

{checkpoint-1900 → checkpoint-3000}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-2000 → checkpoint-3000}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6cd38ec9830107698c5d0ace7830fd9cf63e7332cde8b2dc9f42453c1fe96228
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:17b0809c17d9dbb31d634626a048a7d434c078f79477bfe8f7a8cf3593908c7c
 size 1262344621

{checkpoint-2000 → checkpoint-3000}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f5c1cece2539dcc21e5f05a104f8a7b0d17369adf61ee02eabacdc5688c8ce77
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:54e994db3699b40bee8c6677e4890450c771f5c163635dc7865e66b42965e184
 size 14639

{checkpoint-2000 → checkpoint-3000}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fa1f6377b029d7c93ef2025a47117a476c1020f2bd22a0097fe33acd14b35ae7
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:e09035270122b5f507afb3c91029317a19c9951c55151aa7d9fc1f5691d8ea29
 size 557

{checkpoint-1900 → checkpoint-3000}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a0ea1eff427e80a898e7d7eedbf89dfef56c38dc29788f8cb29b845574ba7ec4
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:9e3cf2d9b187c53d4ab17e26aaa543c99e77f6fa20e6dcea24354d1208058809
 size 627

{checkpoint-2000 → checkpoint-3000}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 13.60544217687075,
-  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -426,11 +426,221 @@
       "eval_samples_per_second": 23.518,
       "eval_steps_per_second": 2.96,
       "step": 2000
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
-  "total_flos": 7.778933854152041e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 20.408163265306122,
+  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 23.518,
       "eval_steps_per_second": 2.96,
       "step": 2000
+    },
+    {
+      "epoch": 13.95,
+      "learning_rate": 0.0001538267716535433,
+      "loss": 0.279,
+      "step": 2050
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 0.0001491023622047244,
+      "loss": 0.2674,
+      "step": 2100
+    },
+    {
+      "epoch": 14.29,
+      "eval_cer": 0.15731289744007826,
+      "eval_loss": 0.3531067371368408,
+      "eval_runtime": 24.8381,
+      "eval_samples_per_second": 23.673,
+      "eval_steps_per_second": 2.979,
+      "step": 2100
+    },
+    {
+      "epoch": 14.63,
+      "learning_rate": 0.0001443779527559055,
+      "loss": 0.2584,
+      "step": 2150
+    },
+    {
+      "epoch": 14.97,
+      "learning_rate": 0.0001396535433070866,
+      "loss": 0.2796,
+      "step": 2200
+    },
+    {
+      "epoch": 14.97,
+      "eval_cer": 0.14808413500733736,
+      "eval_loss": 0.3606802523136139,
+      "eval_runtime": 24.8151,
+      "eval_samples_per_second": 23.695,
+      "eval_steps_per_second": 2.982,
+      "step": 2200
+    },
+    {
+      "epoch": 15.31,
+      "learning_rate": 0.0001349291338582677,
+      "loss": 0.2462,
+      "step": 2250
+    },
+    {
+      "epoch": 15.65,
+      "learning_rate": 0.0001302047244094488,
+      "loss": 0.256,
+      "step": 2300
+    },
+    {
+      "epoch": 15.65,
+      "eval_cer": 0.15819338007500408,
+      "eval_loss": 0.3580550253391266,
+      "eval_runtime": 24.5695,
+      "eval_samples_per_second": 23.932,
+      "eval_steps_per_second": 3.012,
+      "step": 2300
+    },
+    {
+      "epoch": 15.99,
+      "learning_rate": 0.00012548031496062992,
+      "loss": 0.2524,
+      "step": 2350
+    },
+    {
+      "epoch": 16.33,
+      "learning_rate": 0.00012075590551181102,
+      "loss": 0.2219,
+      "step": 2400
+    },
+    {
+      "epoch": 16.33,
+      "eval_cer": 0.14801891407141693,
+      "eval_loss": 0.35925593972206116,
+      "eval_runtime": 24.982,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.962,
+      "step": 2400
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 0.0001160314960629921,
+      "loss": 0.2364,
+      "step": 2450
+    },
+    {
+      "epoch": 17.01,
+      "learning_rate": 0.00011130708661417321,
+      "loss": 0.2291,
+      "step": 2500
+    },
+    {
+      "epoch": 17.01,
+      "eval_cer": 0.1471058209685309,
+      "eval_loss": 0.35567909479141235,
+      "eval_runtime": 24.4749,
+      "eval_samples_per_second": 24.025,
+      "eval_steps_per_second": 3.024,
+      "step": 2500
+    },
+    {
+      "epoch": 17.35,
+      "learning_rate": 0.00010658267716535431,
+      "loss": 0.2045,
+      "step": 2550
+    },
+    {
+      "epoch": 17.69,
+      "learning_rate": 0.00010185826771653542,
+      "loss": 0.2172,
+      "step": 2600
+    },
+    {
+      "epoch": 17.69,
+      "eval_cer": 0.14792108266753629,
+      "eval_loss": 0.3606509566307068,
+      "eval_runtime": 25.1105,
+      "eval_samples_per_second": 23.416,
+      "eval_steps_per_second": 2.947,
+      "step": 2600
+    },
+    {
+      "epoch": 18.03,
+      "learning_rate": 9.713385826771652e-05,
+      "loss": 0.2271,
+      "step": 2650
+    },
+    {
+      "epoch": 18.37,
+      "learning_rate": 9.240944881889763e-05,
+      "loss": 0.1858,
+      "step": 2700
+    },
+    {
+      "epoch": 18.37,
+      "eval_cer": 0.15144301320723952,
+      "eval_loss": 0.3589307963848114,
+      "eval_runtime": 24.5005,
+      "eval_samples_per_second": 24.0,
+      "eval_steps_per_second": 3.02,
+      "step": 2700
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 8.768503937007873e-05,
+      "loss": 0.1995,
+      "step": 2750
+    },
+    {
+      "epoch": 19.05,
+      "learning_rate": 8.296062992125984e-05,
+      "loss": 0.1872,
+      "step": 2800
+    },
+    {
+      "epoch": 19.05,
+      "eval_cer": 0.14766019892385457,
+      "eval_loss": 0.36663514375686646,
+      "eval_runtime": 24.4383,
+      "eval_samples_per_second": 24.061,
+      "eval_steps_per_second": 3.028,
+      "step": 2800
+    },
+    {
+      "epoch": 19.39,
+      "learning_rate": 7.823622047244094e-05,
+      "loss": 0.177,
+      "step": 2850
+    },
+    {
+      "epoch": 19.73,
+      "learning_rate": 7.351181102362205e-05,
+      "loss": 0.1855,
+      "step": 2900
+    },
+    {
+      "epoch": 19.73,
+      "eval_cer": 0.1432577857492255,
+      "eval_loss": 0.3651330769062042,
+      "eval_runtime": 24.7826,
+      "eval_samples_per_second": 23.726,
+      "eval_steps_per_second": 2.986,
+      "step": 2900
+    },
+    {
+      "epoch": 20.07,
+      "learning_rate": 6.878740157480315e-05,
+      "loss": 0.1773,
+      "step": 2950
+    },
+    {
+      "epoch": 20.41,
+      "learning_rate": 6.406299212598424e-05,
+      "loss": 0.185,
+      "step": 3000
+    },
+    {
+      "epoch": 20.41,
+      "eval_cer": 0.1447578672753954,
+      "eval_loss": 0.36554473638534546,
+      "eval_runtime": 24.7061,
+      "eval_samples_per_second": 23.8,
+      "eval_steps_per_second": 2.995,
+      "step": 3000
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
+  "total_flos": 1.1654661840261913e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-1900 → checkpoint-3000}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-2000 → checkpoint-3100}/config.json RENAMED Viewed

File without changes

{checkpoint-2000 → checkpoint-3100}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3400ad82ded439b14c2bac67c692eb6cb3776ec6471beac1430b11b22c8fb5b5
 size 2490946501

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0547651e9fa5e5a88a9166ef0d5f076cee95faf27589392ad547f526db7c4fe
 size 2490946501

{checkpoint-2000 → checkpoint-3100}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-1900 → checkpoint-3100}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:944bbfe53ed8e3678f0df597947df90c1f1fd1a592c5e2f1c1893cd644db8b25
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:aa48ab3bfa27ac8b74f16b85b0b0e9423a7006947f26bc79b3a134b3a28201d9
 size 1262344621

{checkpoint-1900 → checkpoint-3100}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:19558c49bacfb403056aca7f61bd635fce6a3b4d6a2d60ba71c39efd76e04aa8
-size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:6e6882a736f444e030f1e63185cd593b64dcbe537747a536c06d91a9ff822878
+size 14575

{checkpoint-1900 → checkpoint-3100}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c12154f7b08b94398fffa27beb8a5986462659e12ab1223bd629316877afb771
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:2a5a1c934e0cb72b172df77c7f977d3f9bcedc7c9991dd7cf5ab0d4a3a9e556e
 size 557

{checkpoint-2000 → checkpoint-3100}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bb073859e728ca55c339a2f6d3ed17539f043fe9dec39e46f41d5b139c046481
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:4f224e654f13b383690d5d87143e399102b541cd0bfe5fa57c4e0ad3f1abceb1
 size 627

{checkpoint-1900 → checkpoint-3100}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 12.92517006802721,
-  "global_step": 1900,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -405,11 +405,263 @@
       "eval_samples_per_second": 24.027,
       "eval_steps_per_second": 3.024,
       "step": 1900
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
-  "total_flos": 7.38349957947191e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 21.08843537414966,
+  "global_step": 3100,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 24.027,
       "eval_steps_per_second": 3.024,
       "step": 1900
+    },
+    {
+      "epoch": 13.27,
+      "learning_rate": 0.0001632755905511811,
+      "loss": 0.3019,
+      "step": 1950
+    },
+    {
+      "epoch": 13.61,
+      "learning_rate": 0.00015855118110236219,
+      "loss": 0.2945,
+      "step": 2000
+    },
+    {
+      "epoch": 13.61,
+      "eval_cer": 0.16634599706505787,
+      "eval_loss": 0.3725011348724365,
+      "eval_runtime": 25.0023,
+      "eval_samples_per_second": 23.518,
+      "eval_steps_per_second": 2.96,
+      "step": 2000
+    },
+    {
+      "epoch": 13.95,
+      "learning_rate": 0.0001538267716535433,
+      "loss": 0.279,
+      "step": 2050
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 0.0001491023622047244,
+      "loss": 0.2674,
+      "step": 2100
+    },
+    {
+      "epoch": 14.29,
+      "eval_cer": 0.15731289744007826,
+      "eval_loss": 0.3531067371368408,
+      "eval_runtime": 24.8381,
+      "eval_samples_per_second": 23.673,
+      "eval_steps_per_second": 2.979,
+      "step": 2100
+    },
+    {
+      "epoch": 14.63,
+      "learning_rate": 0.0001443779527559055,
+      "loss": 0.2584,
+      "step": 2150
+    },
+    {
+      "epoch": 14.97,
+      "learning_rate": 0.0001396535433070866,
+      "loss": 0.2796,
+      "step": 2200
+    },
+    {
+      "epoch": 14.97,
+      "eval_cer": 0.14808413500733736,
+      "eval_loss": 0.3606802523136139,
+      "eval_runtime": 24.8151,
+      "eval_samples_per_second": 23.695,
+      "eval_steps_per_second": 2.982,
+      "step": 2200
+    },
+    {
+      "epoch": 15.31,
+      "learning_rate": 0.0001349291338582677,
+      "loss": 0.2462,
+      "step": 2250
+    },
+    {
+      "epoch": 15.65,
+      "learning_rate": 0.0001302047244094488,
+      "loss": 0.256,
+      "step": 2300
+    },
+    {
+      "epoch": 15.65,
+      "eval_cer": 0.15819338007500408,
+      "eval_loss": 0.3580550253391266,
+      "eval_runtime": 24.5695,
+      "eval_samples_per_second": 23.932,
+      "eval_steps_per_second": 3.012,
+      "step": 2300
+    },
+    {
+      "epoch": 15.99,
+      "learning_rate": 0.00012548031496062992,
+      "loss": 0.2524,
+      "step": 2350
+    },
+    {
+      "epoch": 16.33,
+      "learning_rate": 0.00012075590551181102,
+      "loss": 0.2219,
+      "step": 2400
+    },
+    {
+      "epoch": 16.33,
+      "eval_cer": 0.14801891407141693,
+      "eval_loss": 0.35925593972206116,
+      "eval_runtime": 24.982,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.962,
+      "step": 2400
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 0.0001160314960629921,
+      "loss": 0.2364,
+      "step": 2450
+    },
+    {
+      "epoch": 17.01,
+      "learning_rate": 0.00011130708661417321,
+      "loss": 0.2291,
+      "step": 2500
+    },
+    {
+      "epoch": 17.01,
+      "eval_cer": 0.1471058209685309,
+      "eval_loss": 0.35567909479141235,
+      "eval_runtime": 24.4749,
+      "eval_samples_per_second": 24.025,
+      "eval_steps_per_second": 3.024,
+      "step": 2500
+    },
+    {
+      "epoch": 17.35,
+      "learning_rate": 0.00010658267716535431,
+      "loss": 0.2045,
+      "step": 2550
+    },
+    {
+      "epoch": 17.69,
+      "learning_rate": 0.00010185826771653542,
+      "loss": 0.2172,
+      "step": 2600
+    },
+    {
+      "epoch": 17.69,
+      "eval_cer": 0.14792108266753629,
+      "eval_loss": 0.3606509566307068,
+      "eval_runtime": 25.1105,
+      "eval_samples_per_second": 23.416,
+      "eval_steps_per_second": 2.947,
+      "step": 2600
+    },
+    {
+      "epoch": 18.03,
+      "learning_rate": 9.713385826771652e-05,
+      "loss": 0.2271,
+      "step": 2650
+    },
+    {
+      "epoch": 18.37,
+      "learning_rate": 9.240944881889763e-05,
+      "loss": 0.1858,
+      "step": 2700
+    },
+    {
+      "epoch": 18.37,
+      "eval_cer": 0.15144301320723952,
+      "eval_loss": 0.3589307963848114,
+      "eval_runtime": 24.5005,
+      "eval_samples_per_second": 24.0,
+      "eval_steps_per_second": 3.02,
+      "step": 2700
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 8.768503937007873e-05,
+      "loss": 0.1995,
+      "step": 2750
+    },
+    {
+      "epoch": 19.05,
+      "learning_rate": 8.296062992125984e-05,
+      "loss": 0.1872,
+      "step": 2800
+    },
+    {
+      "epoch": 19.05,
+      "eval_cer": 0.14766019892385457,
+      "eval_loss": 0.36663514375686646,
+      "eval_runtime": 24.4383,
+      "eval_samples_per_second": 24.061,
+      "eval_steps_per_second": 3.028,
+      "step": 2800
+    },
+    {
+      "epoch": 19.39,
+      "learning_rate": 7.823622047244094e-05,
+      "loss": 0.177,
+      "step": 2850
+    },
+    {
+      "epoch": 19.73,
+      "learning_rate": 7.351181102362205e-05,
+      "loss": 0.1855,
+      "step": 2900
+    },
+    {
+      "epoch": 19.73,
+      "eval_cer": 0.1432577857492255,
+      "eval_loss": 0.3651330769062042,
+      "eval_runtime": 24.7826,
+      "eval_samples_per_second": 23.726,
+      "eval_steps_per_second": 2.986,
+      "step": 2900
+    },
+    {
+      "epoch": 20.07,
+      "learning_rate": 6.878740157480315e-05,
+      "loss": 0.1773,
+      "step": 2950
+    },
+    {
+      "epoch": 20.41,
+      "learning_rate": 6.406299212598424e-05,
+      "loss": 0.185,
+      "step": 3000
+    },
+    {
+      "epoch": 20.41,
+      "eval_cer": 0.1447578672753954,
+      "eval_loss": 0.36554473638534546,
+      "eval_runtime": 24.7061,
+      "eval_samples_per_second": 23.8,
+      "eval_steps_per_second": 2.995,
+      "step": 3000
+    },
+    {
+      "epoch": 20.75,
+      "learning_rate": 5.933858267716535e-05,
+      "loss": 0.1735,
+      "step": 3050
+    },
+    {
+      "epoch": 21.09,
+      "learning_rate": 5.461417322834645e-05,
+      "loss": 0.1599,
+      "step": 3100
+    },
+    {
+      "epoch": 21.09,
+      "eval_cer": 0.14867112343062122,
+      "eval_loss": 0.37344449758529663,
+      "eval_runtime": 24.8752,
+      "eval_samples_per_second": 23.638,
+      "eval_steps_per_second": 2.975,
+      "step": 3100
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
+  "total_flos": 1.2047450649580579e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-2000 → checkpoint-3100}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a6ffc772554604c775a56582be10709d4c3e456a09beff5590f70c6d6164bae7
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:aa48ab3bfa27ac8b74f16b85b0b0e9423a7006947f26bc79b3a134b3a28201d9
 size 1262344621