TenzinGayche commited on May 17, 2023

Commit

da8f1b3

•

1 Parent(s): b09b7d8

Training in progress, step 3500

Browse files

Files changed (19) hide show

{checkpoint-2300 → checkpoint-3400}/config.json +0 -0
{checkpoint-2300 → checkpoint-3400}/optimizer.pt +1 -1
{checkpoint-2300 → checkpoint-3400}/preprocessor_config.json +0 -0
{checkpoint-2400 → checkpoint-3400}/pytorch_model.bin +1 -1
{checkpoint-2400 → checkpoint-3400}/rng_state.pth +1 -1
{checkpoint-2400 → checkpoint-3400}/scaler.pt +1 -1
{checkpoint-2300 → checkpoint-3400}/scheduler.pt +1 -1
{checkpoint-2400 → checkpoint-3400}/trainer_state.json +213 -3
{checkpoint-2300 → checkpoint-3400}/training_args.bin +0 -0
{checkpoint-2400 → checkpoint-3500}/config.json +0 -0
{checkpoint-2400 → checkpoint-3500}/optimizer.pt +1 -1
{checkpoint-2400 → checkpoint-3500}/preprocessor_config.json +0 -0
{checkpoint-2300 → checkpoint-3500}/pytorch_model.bin +1 -1
{checkpoint-2300 → checkpoint-3500}/rng_state.pth +2 -2
{checkpoint-2300 → checkpoint-3500}/scaler.pt +1 -1
{checkpoint-2400 → checkpoint-3500}/scheduler.pt +1 -1
{checkpoint-2300 → checkpoint-3500}/trainer_state.json +255 -3
{checkpoint-2400 → checkpoint-3500}/training_args.bin +0 -0
pytorch_model.bin +1 -1

{checkpoint-2300 → checkpoint-3400}/config.json RENAMED Viewed

File without changes

{checkpoint-2300 → checkpoint-3400}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dbad45bff05a119c155307c8c11c1892878504528085f311ec7cc2bfbec75f92
 size 2490946501

 version https://git-lfs.github.com/spec/v1
+oid sha256:0155669d8d78dc52747668d0b42eb560e4765834195634a0b4b47be31ac20d8b
 size 2490946501

{checkpoint-2300 → checkpoint-3400}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-2400 → checkpoint-3400}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:66e4f13af4571dc4fc776d37a670bd005d274231a78ff352023ba5c4fadd8614
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:32217beff331fa3114f28e0275103916da8ce5a7181c533f9c804cbde37f309b
 size 1262344621

{checkpoint-2400 → checkpoint-3400}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:89ee801de1abf33cd6ebc4f0b38240fe2dfecaa66947acc7503d6a21ded7f76f
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:6c4434b2064b73f9bf293826024571f12f809882a08cda4c28bec84dbe416b42
 size 14639

{checkpoint-2400 → checkpoint-3400}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2dcc907e7c7cdb7f74446d1478d9321af62972312f69212a9da63fbf093fd591
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:517b3951b7b7fa883fc465ac17bdbebbf42c218ce832245b7095ad857dd3ea8b
 size 557

{checkpoint-2300 → checkpoint-3400}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3cf6461683881fab2828ae13727bd0d098da0dff54d9acaddb978ed9c072d839
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ea8e60bb0e12681fe1a9e00ddfc643b756dfc2093beb59f68e1a27419f359de
 size 627

{checkpoint-2400 → checkpoint-3400}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 16.3265306122449,
-  "global_step": 2400,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -510,11 +510,221 @@
       "eval_samples_per_second": 23.537,
       "eval_steps_per_second": 2.962,
       "step": 2400
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
-  "total_flos": 9.330801216434254e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 23.12925170068027,
+  "global_step": 3400,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 23.537,
       "eval_steps_per_second": 2.962,
       "step": 2400
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 0.0001160314960629921,
+      "loss": 0.2364,
+      "step": 2450
+    },
+    {
+      "epoch": 17.01,
+      "learning_rate": 0.00011130708661417321,
+      "loss": 0.2291,
+      "step": 2500
+    },
+    {
+      "epoch": 17.01,
+      "eval_cer": 0.1471058209685309,
+      "eval_loss": 0.35567909479141235,
+      "eval_runtime": 24.4749,
+      "eval_samples_per_second": 24.025,
+      "eval_steps_per_second": 3.024,
+      "step": 2500
+    },
+    {
+      "epoch": 17.35,
+      "learning_rate": 0.00010658267716535431,
+      "loss": 0.2045,
+      "step": 2550
+    },
+    {
+      "epoch": 17.69,
+      "learning_rate": 0.00010185826771653542,
+      "loss": 0.2172,
+      "step": 2600
+    },
+    {
+      "epoch": 17.69,
+      "eval_cer": 0.14792108266753629,
+      "eval_loss": 0.3606509566307068,
+      "eval_runtime": 25.1105,
+      "eval_samples_per_second": 23.416,
+      "eval_steps_per_second": 2.947,
+      "step": 2600
+    },
+    {
+      "epoch": 18.03,
+      "learning_rate": 9.713385826771652e-05,
+      "loss": 0.2271,
+      "step": 2650
+    },
+    {
+      "epoch": 18.37,
+      "learning_rate": 9.240944881889763e-05,
+      "loss": 0.1858,
+      "step": 2700
+    },
+    {
+      "epoch": 18.37,
+      "eval_cer": 0.15144301320723952,
+      "eval_loss": 0.3589307963848114,
+      "eval_runtime": 24.5005,
+      "eval_samples_per_second": 24.0,
+      "eval_steps_per_second": 3.02,
+      "step": 2700
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 8.768503937007873e-05,
+      "loss": 0.1995,
+      "step": 2750
+    },
+    {
+      "epoch": 19.05,
+      "learning_rate": 8.296062992125984e-05,
+      "loss": 0.1872,
+      "step": 2800
+    },
+    {
+      "epoch": 19.05,
+      "eval_cer": 0.14766019892385457,
+      "eval_loss": 0.36663514375686646,
+      "eval_runtime": 24.4383,
+      "eval_samples_per_second": 24.061,
+      "eval_steps_per_second": 3.028,
+      "step": 2800
+    },
+    {
+      "epoch": 19.39,
+      "learning_rate": 7.823622047244094e-05,
+      "loss": 0.177,
+      "step": 2850
+    },
+    {
+      "epoch": 19.73,
+      "learning_rate": 7.351181102362205e-05,
+      "loss": 0.1855,
+      "step": 2900
+    },
+    {
+      "epoch": 19.73,
+      "eval_cer": 0.1432577857492255,
+      "eval_loss": 0.3651330769062042,
+      "eval_runtime": 24.7826,
+      "eval_samples_per_second": 23.726,
+      "eval_steps_per_second": 2.986,
+      "step": 2900
+    },
+    {
+      "epoch": 20.07,
+      "learning_rate": 6.878740157480315e-05,
+      "loss": 0.1773,
+      "step": 2950
+    },
+    {
+      "epoch": 20.41,
+      "learning_rate": 6.406299212598424e-05,
+      "loss": 0.185,
+      "step": 3000
+    },
+    {
+      "epoch": 20.41,
+      "eval_cer": 0.1447578672753954,
+      "eval_loss": 0.36554473638534546,
+      "eval_runtime": 24.7061,
+      "eval_samples_per_second": 23.8,
+      "eval_steps_per_second": 2.995,
+      "step": 3000
+    },
+    {
+      "epoch": 20.75,
+      "learning_rate": 5.933858267716535e-05,
+      "loss": 0.1735,
+      "step": 3050
+    },
+    {
+      "epoch": 21.09,
+      "learning_rate": 5.461417322834645e-05,
+      "loss": 0.1599,
+      "step": 3100
+    },
+    {
+      "epoch": 21.09,
+      "eval_cer": 0.14867112343062122,
+      "eval_loss": 0.37344449758529663,
+      "eval_runtime": 24.8752,
+      "eval_samples_per_second": 23.638,
+      "eval_steps_per_second": 2.975,
+      "step": 3100
+    },
+    {
+      "epoch": 21.43,
+      "learning_rate": 4.9889763779527555e-05,
+      "loss": 0.1578,
+      "step": 3150
+    },
+    {
+      "epoch": 21.77,
+      "learning_rate": 4.516535433070866e-05,
+      "loss": 0.1742,
+      "step": 3200
+    },
+    {
+      "epoch": 21.77,
+      "eval_cer": 0.148638512962661,
+      "eval_loss": 0.3685232102870941,
+      "eval_runtime": 25.1361,
+      "eval_samples_per_second": 23.393,
+      "eval_steps_per_second": 2.944,
+      "step": 3200
+    },
+    {
+      "epoch": 22.11,
+      "learning_rate": 4.0440944881889764e-05,
+      "loss": 0.1666,
+      "step": 3250
+    },
+    {
+      "epoch": 22.45,
+      "learning_rate": 3.571653543307086e-05,
+      "loss": 0.1605,
+      "step": 3300
+    },
+    {
+      "epoch": 22.45,
+      "eval_cer": 0.14746453611609325,
+      "eval_loss": 0.3691498637199402,
+      "eval_runtime": 24.7916,
+      "eval_samples_per_second": 23.718,
+      "eval_steps_per_second": 2.985,
+      "step": 3300
+    },
+    {
+      "epoch": 22.79,
+      "learning_rate": 3.0992125984251966e-05,
+      "loss": 0.1576,
+      "step": 3350
+    },
+    {
+      "epoch": 23.13,
+      "learning_rate": 2.626771653543307e-05,
+      "loss": 0.158,
+      "step": 3400
+    },
+    {
+      "epoch": 23.13,
+      "eval_cer": 0.14792108266753629,
+      "eval_loss": 0.3718402683734894,
+      "eval_runtime": 25.1969,
+      "eval_samples_per_second": 23.336,
+      "eval_steps_per_second": 2.937,
+      "step": 3400
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
+  "total_flos": 1.3212293608860776e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-2300 → checkpoint-3400}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-2400 → checkpoint-3500}/config.json RENAMED Viewed

File without changes

{checkpoint-2400 → checkpoint-3500}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:21ec413dbf6dce3f66f0847998faf0727145082a010278c772b5854d5056f118
 size 2490946501

 version https://git-lfs.github.com/spec/v1
+oid sha256:f04041306edbbac18605924f8df50a5e03706a70792d783f76ed32424300e2c4
 size 2490946501

{checkpoint-2400 → checkpoint-3500}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-2300 → checkpoint-3500}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b720f0acc795f0ce8dfdc5369d926dbb4f0c576ab9a917bc26dcfdd9c8bb55f7
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:818fb31b610a3b7a22588d0ae86d69e50589408512a65b1d7fc146223ccf1b1b
 size 1262344621

{checkpoint-2300 → checkpoint-3500}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c10f001cd94004ed8e139f1abb106e02ae7c2d0fce73d744121e622abf6f82fb
-size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:dafc311b7e5f564adf4679af0330bb536167c71f804b37ac8f873865b58cfa2b
+size 14575

{checkpoint-2300 → checkpoint-3500}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dd56176e725920af6b7720880038e0e973fdda3a8cf9ee899ad7b77393e85f3c
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0b7ce33c47aa1ee0ba2ffb842fb2976f29bf5cd6cf51d56b243ce711b00be22
 size 557

{checkpoint-2400 → checkpoint-3500}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3212d7bddbe681e165c9fd72ab4f4e8de8c824c01389aa4a534800797bb190ca
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:99a01f1abc9bc9b7a6d49af45a235647089ddad25aebc02aaf8c80d94ad3699d
 size 627

{checkpoint-2300 → checkpoint-3500}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 15.646258503401361,
-  "global_step": 2300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -489,11 +489,263 @@
       "eval_samples_per_second": 23.932,
       "eval_steps_per_second": 3.012,
       "step": 2300
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
-  "total_flos": 8.938326603459674e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 23.80952380952381,
+  "global_step": 3500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 23.932,
       "eval_steps_per_second": 3.012,
       "step": 2300
+    },
+    {
+      "epoch": 15.99,
+      "learning_rate": 0.00012548031496062992,
+      "loss": 0.2524,
+      "step": 2350
+    },
+    {
+      "epoch": 16.33,
+      "learning_rate": 0.00012075590551181102,
+      "loss": 0.2219,
+      "step": 2400
+    },
+    {
+      "epoch": 16.33,
+      "eval_cer": 0.14801891407141693,
+      "eval_loss": 0.35925593972206116,
+      "eval_runtime": 24.982,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.962,
+      "step": 2400
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 0.0001160314960629921,
+      "loss": 0.2364,
+      "step": 2450
+    },
+    {
+      "epoch": 17.01,
+      "learning_rate": 0.00011130708661417321,
+      "loss": 0.2291,
+      "step": 2500
+    },
+    {
+      "epoch": 17.01,
+      "eval_cer": 0.1471058209685309,
+      "eval_loss": 0.35567909479141235,
+      "eval_runtime": 24.4749,
+      "eval_samples_per_second": 24.025,
+      "eval_steps_per_second": 3.024,
+      "step": 2500
+    },
+    {
+      "epoch": 17.35,
+      "learning_rate": 0.00010658267716535431,
+      "loss": 0.2045,
+      "step": 2550
+    },
+    {
+      "epoch": 17.69,
+      "learning_rate": 0.00010185826771653542,
+      "loss": 0.2172,
+      "step": 2600
+    },
+    {
+      "epoch": 17.69,
+      "eval_cer": 0.14792108266753629,
+      "eval_loss": 0.3606509566307068,
+      "eval_runtime": 25.1105,
+      "eval_samples_per_second": 23.416,
+      "eval_steps_per_second": 2.947,
+      "step": 2600
+    },
+    {
+      "epoch": 18.03,
+      "learning_rate": 9.713385826771652e-05,
+      "loss": 0.2271,
+      "step": 2650
+    },
+    {
+      "epoch": 18.37,
+      "learning_rate": 9.240944881889763e-05,
+      "loss": 0.1858,
+      "step": 2700
+    },
+    {
+      "epoch": 18.37,
+      "eval_cer": 0.15144301320723952,
+      "eval_loss": 0.3589307963848114,
+      "eval_runtime": 24.5005,
+      "eval_samples_per_second": 24.0,
+      "eval_steps_per_second": 3.02,
+      "step": 2700
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 8.768503937007873e-05,
+      "loss": 0.1995,
+      "step": 2750
+    },
+    {
+      "epoch": 19.05,
+      "learning_rate": 8.296062992125984e-05,
+      "loss": 0.1872,
+      "step": 2800
+    },
+    {
+      "epoch": 19.05,
+      "eval_cer": 0.14766019892385457,
+      "eval_loss": 0.36663514375686646,
+      "eval_runtime": 24.4383,
+      "eval_samples_per_second": 24.061,
+      "eval_steps_per_second": 3.028,
+      "step": 2800
+    },
+    {
+      "epoch": 19.39,
+      "learning_rate": 7.823622047244094e-05,
+      "loss": 0.177,
+      "step": 2850
+    },
+    {
+      "epoch": 19.73,
+      "learning_rate": 7.351181102362205e-05,
+      "loss": 0.1855,
+      "step": 2900
+    },
+    {
+      "epoch": 19.73,
+      "eval_cer": 0.1432577857492255,
+      "eval_loss": 0.3651330769062042,
+      "eval_runtime": 24.7826,
+      "eval_samples_per_second": 23.726,
+      "eval_steps_per_second": 2.986,
+      "step": 2900
+    },
+    {
+      "epoch": 20.07,
+      "learning_rate": 6.878740157480315e-05,
+      "loss": 0.1773,
+      "step": 2950
+    },
+    {
+      "epoch": 20.41,
+      "learning_rate": 6.406299212598424e-05,
+      "loss": 0.185,
+      "step": 3000
+    },
+    {
+      "epoch": 20.41,
+      "eval_cer": 0.1447578672753954,
+      "eval_loss": 0.36554473638534546,
+      "eval_runtime": 24.7061,
+      "eval_samples_per_second": 23.8,
+      "eval_steps_per_second": 2.995,
+      "step": 3000
+    },
+    {
+      "epoch": 20.75,
+      "learning_rate": 5.933858267716535e-05,
+      "loss": 0.1735,
+      "step": 3050
+    },
+    {
+      "epoch": 21.09,
+      "learning_rate": 5.461417322834645e-05,
+      "loss": 0.1599,
+      "step": 3100
+    },
+    {
+      "epoch": 21.09,
+      "eval_cer": 0.14867112343062122,
+      "eval_loss": 0.37344449758529663,
+      "eval_runtime": 24.8752,
+      "eval_samples_per_second": 23.638,
+      "eval_steps_per_second": 2.975,
+      "step": 3100
+    },
+    {
+      "epoch": 21.43,
+      "learning_rate": 4.9889763779527555e-05,
+      "loss": 0.1578,
+      "step": 3150
+    },
+    {
+      "epoch": 21.77,
+      "learning_rate": 4.516535433070866e-05,
+      "loss": 0.1742,
+      "step": 3200
+    },
+    {
+      "epoch": 21.77,
+      "eval_cer": 0.148638512962661,
+      "eval_loss": 0.3685232102870941,
+      "eval_runtime": 25.1361,
+      "eval_samples_per_second": 23.393,
+      "eval_steps_per_second": 2.944,
+      "step": 3200
+    },
+    {
+      "epoch": 22.11,
+      "learning_rate": 4.0440944881889764e-05,
+      "loss": 0.1666,
+      "step": 3250
+    },
+    {
+      "epoch": 22.45,
+      "learning_rate": 3.571653543307086e-05,
+      "loss": 0.1605,
+      "step": 3300
+    },
+    {
+      "epoch": 22.45,
+      "eval_cer": 0.14746453611609325,
+      "eval_loss": 0.3691498637199402,
+      "eval_runtime": 24.7916,
+      "eval_samples_per_second": 23.718,
+      "eval_steps_per_second": 2.985,
+      "step": 3300
+    },
+    {
+      "epoch": 22.79,
+      "learning_rate": 3.0992125984251966e-05,
+      "loss": 0.1576,
+      "step": 3350
+    },
+    {
+      "epoch": 23.13,
+      "learning_rate": 2.626771653543307e-05,
+      "loss": 0.158,
+      "step": 3400
+    },
+    {
+      "epoch": 23.13,
+      "eval_cer": 0.14792108266753629,
+      "eval_loss": 0.3718402683734894,
+      "eval_runtime": 25.1969,
+      "eval_samples_per_second": 23.336,
+      "eval_steps_per_second": 2.937,
+      "step": 3400
+    },
+    {
+      "epoch": 23.47,
+      "learning_rate": 2.1543307086614174e-05,
+      "loss": 0.1609,
+      "step": 3450
+    },
+    {
+      "epoch": 23.81,
+      "learning_rate": 1.6818897637795275e-05,
+      "loss": 0.1475,
+      "step": 3500
+    },
+    {
+      "epoch": 23.81,
+      "eval_cer": 0.14671449535300832,
+      "eval_loss": 0.37474170327186584,
+      "eval_runtime": 24.7655,
+      "eval_samples_per_second": 23.743,
+      "eval_steps_per_second": 2.988,
+      "step": 3500
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
+  "total_flos": 1.3594647658299998e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-2400 → checkpoint-3500}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:71b3268161afb2bcdf8b28a1a1d911f835d6d1a33dd0c929b5d6cf7248b065dc
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:818fb31b610a3b7a22588d0ae86d69e50589408512a65b1d7fc146223ccf1b1b
 size 1262344621