TenzinGayche commited on May 17, 2023

Commit

d7d6ee2

•

1 Parent(s): 2f23d51

Training in progress, step 2900

Browse files

Files changed (19) hide show

{checkpoint-1700 → checkpoint-2800}/config.json +0 -0
{checkpoint-1700 → checkpoint-2800}/optimizer.pt +1 -1
{checkpoint-1700 → checkpoint-2800}/preprocessor_config.json +0 -0
{checkpoint-1800 → checkpoint-2800}/pytorch_model.bin +1 -1
{checkpoint-1800 → checkpoint-2800}/rng_state.pth +1 -1
{checkpoint-1800 → checkpoint-2800}/scaler.pt +1 -1
{checkpoint-1700 → checkpoint-2800}/scheduler.pt +1 -1
{checkpoint-1800 → checkpoint-2800}/trainer_state.json +213 -3
{checkpoint-1700 → checkpoint-2800}/training_args.bin +0 -0
{checkpoint-1800 → checkpoint-2900}/config.json +0 -0
{checkpoint-1800 → checkpoint-2900}/optimizer.pt +1 -1
{checkpoint-1800 → checkpoint-2900}/preprocessor_config.json +0 -0
{checkpoint-1700 → checkpoint-2900}/pytorch_model.bin +1 -1
{checkpoint-1700 → checkpoint-2900}/rng_state.pth +1 -1
{checkpoint-1700 → checkpoint-2900}/scaler.pt +1 -1
{checkpoint-1800 → checkpoint-2900}/scheduler.pt +1 -1
{checkpoint-1700 → checkpoint-2900}/trainer_state.json +255 -3
{checkpoint-1800 → checkpoint-2900}/training_args.bin +0 -0
pytorch_model.bin +1 -1

{checkpoint-1700 → checkpoint-2800}/config.json RENAMED Viewed

File without changes

{checkpoint-1700 → checkpoint-2800}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:338ba02b721f5c923b03a6437e0bf0d6913d2f5150fc93110856b5274907a102
 size 2490946501

 version https://git-lfs.github.com/spec/v1
+oid sha256:284fe9fd3efe2fa6bfac3dde889d7df4a894fadafdf72a079a9aa70dae570bb6
 size 2490946501

{checkpoint-1700 → checkpoint-2800}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-1800 → checkpoint-2800}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:52a571823a5349c817772817b3ca92d24c7154a82c1ebe1934fc9b5c45efd5ae
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:d79086abe43be08504757ae268247e875b4ca0ee40d8541768b0d1afc44dcff9
 size 1262344621

{checkpoint-1800 → checkpoint-2800}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:47d39bea761335d6d65b0b6d7eff2cfb4efe3fe039ea66b0c5cffcd47767de2b
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:27687fa73261753e3f3ea1442dcfbb7ebac6e911817034879446db31b67ab26f
 size 14575

{checkpoint-1800 → checkpoint-2800}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e961ca75ff911c1f4b25d656bc8175958d7392f62f4f35cdbbe7bb3902c5e7a6
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:05b468846eb222417f6778288d55e188312cf2d6a8edd4f708c9744ca1711621
 size 557

{checkpoint-1700 → checkpoint-2800}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7a0f385f9f50d27e3534f7102c4921897834c11c7a2ceb3c3a568765164e2f10
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:2b188442f4189d4023ae493e876a79dd05e958bbee2b254952060c03892fff41
 size 627

{checkpoint-1800 → checkpoint-2800}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 12.244897959183673,
-  "global_step": 1800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -384,11 +384,221 @@
       "eval_samples_per_second": 23.79,
       "eval_steps_per_second": 2.994,
       "step": 1800
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
-  "total_flos": 6.982329131312831e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 19.047619047619047,
+  "global_step": 2800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 23.79,
       "eval_steps_per_second": 2.994,
       "step": 1800
+    },
+    {
+      "epoch": 12.59,
+      "learning_rate": 0.0001727244094488189,
+      "loss": 0.3208,
+      "step": 1850
+    },
+    {
+      "epoch": 12.93,
+      "learning_rate": 0.000168,
+      "loss": 0.3063,
+      "step": 1900
+    },
+    {
+      "epoch": 12.93,
+      "eval_cer": 0.15904125224196966,
+      "eval_loss": 0.3622555434703827,
+      "eval_runtime": 24.4729,
+      "eval_samples_per_second": 24.027,
+      "eval_steps_per_second": 3.024,
+      "step": 1900
+    },
+    {
+      "epoch": 13.27,
+      "learning_rate": 0.0001632755905511811,
+      "loss": 0.3019,
+      "step": 1950
+    },
+    {
+      "epoch": 13.61,
+      "learning_rate": 0.00015855118110236219,
+      "loss": 0.2945,
+      "step": 2000
+    },
+    {
+      "epoch": 13.61,
+      "eval_cer": 0.16634599706505787,
+      "eval_loss": 0.3725011348724365,
+      "eval_runtime": 25.0023,
+      "eval_samples_per_second": 23.518,
+      "eval_steps_per_second": 2.96,
+      "step": 2000
+    },
+    {
+      "epoch": 13.95,
+      "learning_rate": 0.0001538267716535433,
+      "loss": 0.279,
+      "step": 2050
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 0.0001491023622047244,
+      "loss": 0.2674,
+      "step": 2100
+    },
+    {
+      "epoch": 14.29,
+      "eval_cer": 0.15731289744007826,
+      "eval_loss": 0.3531067371368408,
+      "eval_runtime": 24.8381,
+      "eval_samples_per_second": 23.673,
+      "eval_steps_per_second": 2.979,
+      "step": 2100
+    },
+    {
+      "epoch": 14.63,
+      "learning_rate": 0.0001443779527559055,
+      "loss": 0.2584,
+      "step": 2150
+    },
+    {
+      "epoch": 14.97,
+      "learning_rate": 0.0001396535433070866,
+      "loss": 0.2796,
+      "step": 2200
+    },
+    {
+      "epoch": 14.97,
+      "eval_cer": 0.14808413500733736,
+      "eval_loss": 0.3606802523136139,
+      "eval_runtime": 24.8151,
+      "eval_samples_per_second": 23.695,
+      "eval_steps_per_second": 2.982,
+      "step": 2200
+    },
+    {
+      "epoch": 15.31,
+      "learning_rate": 0.0001349291338582677,
+      "loss": 0.2462,
+      "step": 2250
+    },
+    {
+      "epoch": 15.65,
+      "learning_rate": 0.0001302047244094488,
+      "loss": 0.256,
+      "step": 2300
+    },
+    {
+      "epoch": 15.65,
+      "eval_cer": 0.15819338007500408,
+      "eval_loss": 0.3580550253391266,
+      "eval_runtime": 24.5695,
+      "eval_samples_per_second": 23.932,
+      "eval_steps_per_second": 3.012,
+      "step": 2300
+    },
+    {
+      "epoch": 15.99,
+      "learning_rate": 0.00012548031496062992,
+      "loss": 0.2524,
+      "step": 2350
+    },
+    {
+      "epoch": 16.33,
+      "learning_rate": 0.00012075590551181102,
+      "loss": 0.2219,
+      "step": 2400
+    },
+    {
+      "epoch": 16.33,
+      "eval_cer": 0.14801891407141693,
+      "eval_loss": 0.35925593972206116,
+      "eval_runtime": 24.982,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.962,
+      "step": 2400
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 0.0001160314960629921,
+      "loss": 0.2364,
+      "step": 2450
+    },
+    {
+      "epoch": 17.01,
+      "learning_rate": 0.00011130708661417321,
+      "loss": 0.2291,
+      "step": 2500
+    },
+    {
+      "epoch": 17.01,
+      "eval_cer": 0.1471058209685309,
+      "eval_loss": 0.35567909479141235,
+      "eval_runtime": 24.4749,
+      "eval_samples_per_second": 24.025,
+      "eval_steps_per_second": 3.024,
+      "step": 2500
+    },
+    {
+      "epoch": 17.35,
+      "learning_rate": 0.00010658267716535431,
+      "loss": 0.2045,
+      "step": 2550
+    },
+    {
+      "epoch": 17.69,
+      "learning_rate": 0.00010185826771653542,
+      "loss": 0.2172,
+      "step": 2600
+    },
+    {
+      "epoch": 17.69,
+      "eval_cer": 0.14792108266753629,
+      "eval_loss": 0.3606509566307068,
+      "eval_runtime": 25.1105,
+      "eval_samples_per_second": 23.416,
+      "eval_steps_per_second": 2.947,
+      "step": 2600
+    },
+    {
+      "epoch": 18.03,
+      "learning_rate": 9.713385826771652e-05,
+      "loss": 0.2271,
+      "step": 2650
+    },
+    {
+      "epoch": 18.37,
+      "learning_rate": 9.240944881889763e-05,
+      "loss": 0.1858,
+      "step": 2700
+    },
+    {
+      "epoch": 18.37,
+      "eval_cer": 0.15144301320723952,
+      "eval_loss": 0.3589307963848114,
+      "eval_runtime": 24.5005,
+      "eval_samples_per_second": 24.0,
+      "eval_steps_per_second": 3.02,
+      "step": 2700
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 8.768503937007873e-05,
+      "loss": 0.1995,
+      "step": 2750
+    },
+    {
+      "epoch": 19.05,
+      "learning_rate": 8.296062992125984e-05,
+      "loss": 0.1872,
+      "step": 2800
+    },
+    {
+      "epoch": 19.05,
+      "eval_cer": 0.14766019892385457,
+      "eval_loss": 0.36663514375686646,
+      "eval_runtime": 24.4383,
+      "eval_samples_per_second": 24.061,
+      "eval_steps_per_second": 3.028,
+      "step": 2800
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
+  "total_flos": 1.0878260136221063e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-1700 → checkpoint-2800}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-1800 → checkpoint-2900}/config.json RENAMED Viewed

File without changes

{checkpoint-1800 → checkpoint-2900}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:42f99a886bbf378c0dcaebf101e4c5328ee0274d00a62c2e1be3614a61c5e312
 size 2490946501

 version https://git-lfs.github.com/spec/v1
+oid sha256:da92116ac7249a9c2f78c6d915c53ed280d77d3eee1ec0daa3648db76ed65088
 size 2490946501

{checkpoint-1800 → checkpoint-2900}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-1700 → checkpoint-2900}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:019acb608476676b22ab74cd09e4aca50c24dd533fcbd74898a0026c97c98361
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:a6ffc772554604c775a56582be10709d4c3e456a09beff5590f70c6d6164bae7
 size 1262344621

{checkpoint-1700 → checkpoint-2900}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:71a1db9e934ba49590cfdbe67c7ee3acaf29bd87a47fabf42f5d018afb48d43b
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:2f89b2092406b7051521efc60918e39ddbc8577addacf224a167b0840e13a8b1
 size 14639

{checkpoint-1700 → checkpoint-2900}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fb5240745a606135a0f5215801453e4a46e10de71a210812a2ab7133882ce395
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:e9d0e0ea2050687876737e0313597d903728681aadc2ef7b13381f1a340209c4
 size 557

{checkpoint-1800 → checkpoint-2900}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ae735c83da45a65907ba8c02193907649b6ed04e0ca77c0400a50dbb61401aaa
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:2a694febd2309e1fb1cb50db9210a98ee65b7677fbb4514ceb39bb98bbdadc9d
 size 627

{checkpoint-1700 → checkpoint-2900}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 11.564625850340136,
-  "global_step": 1700,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -363,11 +363,263 @@
       "eval_samples_per_second": 24.123,
       "eval_steps_per_second": 3.036,
       "step": 1700
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
-  "total_flos": 6.617213289199883e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 19.727891156462587,
+  "global_step": 2900,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 24.123,
       "eval_steps_per_second": 3.036,
       "step": 1700
+    },
+    {
+      "epoch": 11.9,
+      "learning_rate": 0.00018217322834645667,
+      "loss": 0.3455,
+      "step": 1750
+    },
+    {
+      "epoch": 12.24,
+      "learning_rate": 0.00017744881889763777,
+      "loss": 0.3245,
+      "step": 1800
+    },
+    {
+      "epoch": 12.24,
+      "eval_cer": 0.15816076960704387,
+      "eval_loss": 0.3740461468696594,
+      "eval_runtime": 24.7162,
+      "eval_samples_per_second": 23.79,
+      "eval_steps_per_second": 2.994,
+      "step": 1800
+    },
+    {
+      "epoch": 12.59,
+      "learning_rate": 0.0001727244094488189,
+      "loss": 0.3208,
+      "step": 1850
+    },
+    {
+      "epoch": 12.93,
+      "learning_rate": 0.000168,
+      "loss": 0.3063,
+      "step": 1900
+    },
+    {
+      "epoch": 12.93,
+      "eval_cer": 0.15904125224196966,
+      "eval_loss": 0.3622555434703827,
+      "eval_runtime": 24.4729,
+      "eval_samples_per_second": 24.027,
+      "eval_steps_per_second": 3.024,
+      "step": 1900
+    },
+    {
+      "epoch": 13.27,
+      "learning_rate": 0.0001632755905511811,
+      "loss": 0.3019,
+      "step": 1950
+    },
+    {
+      "epoch": 13.61,
+      "learning_rate": 0.00015855118110236219,
+      "loss": 0.2945,
+      "step": 2000
+    },
+    {
+      "epoch": 13.61,
+      "eval_cer": 0.16634599706505787,
+      "eval_loss": 0.3725011348724365,
+      "eval_runtime": 25.0023,
+      "eval_samples_per_second": 23.518,
+      "eval_steps_per_second": 2.96,
+      "step": 2000
+    },
+    {
+      "epoch": 13.95,
+      "learning_rate": 0.0001538267716535433,
+      "loss": 0.279,
+      "step": 2050
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 0.0001491023622047244,
+      "loss": 0.2674,
+      "step": 2100
+    },
+    {
+      "epoch": 14.29,
+      "eval_cer": 0.15731289744007826,
+      "eval_loss": 0.3531067371368408,
+      "eval_runtime": 24.8381,
+      "eval_samples_per_second": 23.673,
+      "eval_steps_per_second": 2.979,
+      "step": 2100
+    },
+    {
+      "epoch": 14.63,
+      "learning_rate": 0.0001443779527559055,
+      "loss": 0.2584,
+      "step": 2150
+    },
+    {
+      "epoch": 14.97,
+      "learning_rate": 0.0001396535433070866,
+      "loss": 0.2796,
+      "step": 2200
+    },
+    {
+      "epoch": 14.97,
+      "eval_cer": 0.14808413500733736,
+      "eval_loss": 0.3606802523136139,
+      "eval_runtime": 24.8151,
+      "eval_samples_per_second": 23.695,
+      "eval_steps_per_second": 2.982,
+      "step": 2200
+    },
+    {
+      "epoch": 15.31,
+      "learning_rate": 0.0001349291338582677,
+      "loss": 0.2462,
+      "step": 2250
+    },
+    {
+      "epoch": 15.65,
+      "learning_rate": 0.0001302047244094488,
+      "loss": 0.256,
+      "step": 2300
+    },
+    {
+      "epoch": 15.65,
+      "eval_cer": 0.15819338007500408,
+      "eval_loss": 0.3580550253391266,
+      "eval_runtime": 24.5695,
+      "eval_samples_per_second": 23.932,
+      "eval_steps_per_second": 3.012,
+      "step": 2300
+    },
+    {
+      "epoch": 15.99,
+      "learning_rate": 0.00012548031496062992,
+      "loss": 0.2524,
+      "step": 2350
+    },
+    {
+      "epoch": 16.33,
+      "learning_rate": 0.00012075590551181102,
+      "loss": 0.2219,
+      "step": 2400
+    },
+    {
+      "epoch": 16.33,
+      "eval_cer": 0.14801891407141693,
+      "eval_loss": 0.35925593972206116,
+      "eval_runtime": 24.982,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.962,
+      "step": 2400
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 0.0001160314960629921,
+      "loss": 0.2364,
+      "step": 2450
+    },
+    {
+      "epoch": 17.01,
+      "learning_rate": 0.00011130708661417321,
+      "loss": 0.2291,
+      "step": 2500
+    },
+    {
+      "epoch": 17.01,
+      "eval_cer": 0.1471058209685309,
+      "eval_loss": 0.35567909479141235,
+      "eval_runtime": 24.4749,
+      "eval_samples_per_second": 24.025,
+      "eval_steps_per_second": 3.024,
+      "step": 2500
+    },
+    {
+      "epoch": 17.35,
+      "learning_rate": 0.00010658267716535431,
+      "loss": 0.2045,
+      "step": 2550
+    },
+    {
+      "epoch": 17.69,
+      "learning_rate": 0.00010185826771653542,
+      "loss": 0.2172,
+      "step": 2600
+    },
+    {
+      "epoch": 17.69,
+      "eval_cer": 0.14792108266753629,
+      "eval_loss": 0.3606509566307068,
+      "eval_runtime": 25.1105,
+      "eval_samples_per_second": 23.416,
+      "eval_steps_per_second": 2.947,
+      "step": 2600
+    },
+    {
+      "epoch": 18.03,
+      "learning_rate": 9.713385826771652e-05,
+      "loss": 0.2271,
+      "step": 2650
+    },
+    {
+      "epoch": 18.37,
+      "learning_rate": 9.240944881889763e-05,
+      "loss": 0.1858,
+      "step": 2700
+    },
+    {
+      "epoch": 18.37,
+      "eval_cer": 0.15144301320723952,
+      "eval_loss": 0.3589307963848114,
+      "eval_runtime": 24.5005,
+      "eval_samples_per_second": 24.0,
+      "eval_steps_per_second": 3.02,
+      "step": 2700
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 8.768503937007873e-05,
+      "loss": 0.1995,
+      "step": 2750
+    },
+    {
+      "epoch": 19.05,
+      "learning_rate": 8.296062992125984e-05,
+      "loss": 0.1872,
+      "step": 2800
+    },
+    {
+      "epoch": 19.05,
+      "eval_cer": 0.14766019892385457,
+      "eval_loss": 0.36663514375686646,
+      "eval_runtime": 24.4383,
+      "eval_samples_per_second": 24.061,
+      "eval_steps_per_second": 3.028,
+      "step": 2800
+    },
+    {
+      "epoch": 19.39,
+      "learning_rate": 7.823622047244094e-05,
+      "loss": 0.177,
+      "step": 2850
+    },
+    {
+      "epoch": 19.73,
+      "learning_rate": 7.351181102362205e-05,
+      "loss": 0.1855,
+      "step": 2900
+    },
+    {
+      "epoch": 19.73,
+      "eval_cer": 0.1432577857492255,
+      "eval_loss": 0.3651330769062042,
+      "eval_runtime": 24.7826,
+      "eval_samples_per_second": 23.726,
+      "eval_steps_per_second": 2.986,
+      "step": 2900
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
+  "total_flos": 1.1249154319313052e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-1800 → checkpoint-2900}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4bba14f51afadd438f5716f846b339431901a15de8cc5ac24dc52e61e72244c4
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:a6ffc772554604c775a56582be10709d4c3e456a09beff5590f70c6d6164bae7
 size 1262344621