TenzinGayche commited on May 17, 2023

Commit

b09b7d8

•

1 Parent(s): 3ff632d

Training in progress, step 3300

Browse files

Files changed (19) hide show

{checkpoint-2100 → checkpoint-3200}/config.json +0 -0
{checkpoint-2100 → checkpoint-3200}/optimizer.pt +1 -1
{checkpoint-2100 → checkpoint-3200}/preprocessor_config.json +0 -0
{checkpoint-2200 → checkpoint-3200}/pytorch_model.bin +1 -1
{checkpoint-2200 → checkpoint-3200}/rng_state.pth +1 -1
{checkpoint-2200 → checkpoint-3200}/scaler.pt +1 -1
{checkpoint-2100 → checkpoint-3200}/scheduler.pt +1 -1
{checkpoint-2200 → checkpoint-3200}/trainer_state.json +213 -3
{checkpoint-2100 → checkpoint-3200}/training_args.bin +0 -0
{checkpoint-2200 → checkpoint-3300}/config.json +0 -0
{checkpoint-2200 → checkpoint-3300}/optimizer.pt +1 -1
{checkpoint-2200 → checkpoint-3300}/preprocessor_config.json +0 -0
{checkpoint-2100 → checkpoint-3300}/pytorch_model.bin +1 -1
{checkpoint-2100 → checkpoint-3300}/rng_state.pth +1 -1
{checkpoint-2100 → checkpoint-3300}/scaler.pt +1 -1
{checkpoint-2200 → checkpoint-3300}/scheduler.pt +1 -1
{checkpoint-2100 → checkpoint-3300}/trainer_state.json +255 -3
{checkpoint-2200 → checkpoint-3300}/training_args.bin +0 -0
pytorch_model.bin +1 -1

{checkpoint-2100 → checkpoint-3200}/config.json RENAMED Viewed

File without changes

{checkpoint-2100 → checkpoint-3200}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:87e2080de9b12e77e557f50a48e30b7ba4194eca0fd9c1a98f3b79a795706b37
 size 2490946501

 version https://git-lfs.github.com/spec/v1
+oid sha256:3b096ae7b366c7c999b92a9c0d6ce1c8f70bba3cd30c87556eab078c149c9e3d
 size 2490946501

{checkpoint-2100 → checkpoint-3200}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-2200 → checkpoint-3200}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6cce06d15cec4e6aaad2f52b7c165936df822e00a89dfb534de60b39c6180cc4
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:f1aab560189c775afd4d52f128e4bd0cfd72f760ad25aab0de2f45c34b0b45e2
 size 1262344621

{checkpoint-2200 → checkpoint-3200}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:96e9dc9cd32a89c54dbb93c6ae252f82b827a1a9d04f14d2ce52e858a5d26e24
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:86fe28654777ce9becd5efc4b0839519aac223aa554449121cb9e9b1d6391db8
 size 14575

{checkpoint-2200 → checkpoint-3200}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:daf71784c669ab5c19402209fd2ce2ba2839e04cc29da73480a4896e9283ae06
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:bd7c34e3c6e4a21fa45cdb54a89b626e4c29dfd67a2bac43d63b8bce896a050f
 size 557

{checkpoint-2100 → checkpoint-3200}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6c20e8e4f4623e1333635d4d6f55117df2428ab91ba217c9207d1a49a91c2552
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:d9eae38967de4c32ee3782c111dc2a1911655d360e132f06fbb454136bb7010c
 size 627

{checkpoint-2200 → checkpoint-3200}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 14.965986394557824,
-  "global_step": 2200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -468,11 +468,221 @@
       "eval_samples_per_second": 23.695,
       "eval_steps_per_second": 2.982,
       "step": 2200
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
-  "total_flos": 8.535511077527554e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 21.768707482993197,
+  "global_step": 3200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 23.695,
       "eval_steps_per_second": 2.982,
       "step": 2200
+    },
+    {
+      "epoch": 15.31,
+      "learning_rate": 0.0001349291338582677,
+      "loss": 0.2462,
+      "step": 2250
+    },
+    {
+      "epoch": 15.65,
+      "learning_rate": 0.0001302047244094488,
+      "loss": 0.256,
+      "step": 2300
+    },
+    {
+      "epoch": 15.65,
+      "eval_cer": 0.15819338007500408,
+      "eval_loss": 0.3580550253391266,
+      "eval_runtime": 24.5695,
+      "eval_samples_per_second": 23.932,
+      "eval_steps_per_second": 3.012,
+      "step": 2300
+    },
+    {
+      "epoch": 15.99,
+      "learning_rate": 0.00012548031496062992,
+      "loss": 0.2524,
+      "step": 2350
+    },
+    {
+      "epoch": 16.33,
+      "learning_rate": 0.00012075590551181102,
+      "loss": 0.2219,
+      "step": 2400
+    },
+    {
+      "epoch": 16.33,
+      "eval_cer": 0.14801891407141693,
+      "eval_loss": 0.35925593972206116,
+      "eval_runtime": 24.982,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.962,
+      "step": 2400
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 0.0001160314960629921,
+      "loss": 0.2364,
+      "step": 2450
+    },
+    {
+      "epoch": 17.01,
+      "learning_rate": 0.00011130708661417321,
+      "loss": 0.2291,
+      "step": 2500
+    },
+    {
+      "epoch": 17.01,
+      "eval_cer": 0.1471058209685309,
+      "eval_loss": 0.35567909479141235,
+      "eval_runtime": 24.4749,
+      "eval_samples_per_second": 24.025,
+      "eval_steps_per_second": 3.024,
+      "step": 2500
+    },
+    {
+      "epoch": 17.35,
+      "learning_rate": 0.00010658267716535431,
+      "loss": 0.2045,
+      "step": 2550
+    },
+    {
+      "epoch": 17.69,
+      "learning_rate": 0.00010185826771653542,
+      "loss": 0.2172,
+      "step": 2600
+    },
+    {
+      "epoch": 17.69,
+      "eval_cer": 0.14792108266753629,
+      "eval_loss": 0.3606509566307068,
+      "eval_runtime": 25.1105,
+      "eval_samples_per_second": 23.416,
+      "eval_steps_per_second": 2.947,
+      "step": 2600
+    },
+    {
+      "epoch": 18.03,
+      "learning_rate": 9.713385826771652e-05,
+      "loss": 0.2271,
+      "step": 2650
+    },
+    {
+      "epoch": 18.37,
+      "learning_rate": 9.240944881889763e-05,
+      "loss": 0.1858,
+      "step": 2700
+    },
+    {
+      "epoch": 18.37,
+      "eval_cer": 0.15144301320723952,
+      "eval_loss": 0.3589307963848114,
+      "eval_runtime": 24.5005,
+      "eval_samples_per_second": 24.0,
+      "eval_steps_per_second": 3.02,
+      "step": 2700
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 8.768503937007873e-05,
+      "loss": 0.1995,
+      "step": 2750
+    },
+    {
+      "epoch": 19.05,
+      "learning_rate": 8.296062992125984e-05,
+      "loss": 0.1872,
+      "step": 2800
+    },
+    {
+      "epoch": 19.05,
+      "eval_cer": 0.14766019892385457,
+      "eval_loss": 0.36663514375686646,
+      "eval_runtime": 24.4383,
+      "eval_samples_per_second": 24.061,
+      "eval_steps_per_second": 3.028,
+      "step": 2800
+    },
+    {
+      "epoch": 19.39,
+      "learning_rate": 7.823622047244094e-05,
+      "loss": 0.177,
+      "step": 2850
+    },
+    {
+      "epoch": 19.73,
+      "learning_rate": 7.351181102362205e-05,
+      "loss": 0.1855,
+      "step": 2900
+    },
+    {
+      "epoch": 19.73,
+      "eval_cer": 0.1432577857492255,
+      "eval_loss": 0.3651330769062042,
+      "eval_runtime": 24.7826,
+      "eval_samples_per_second": 23.726,
+      "eval_steps_per_second": 2.986,
+      "step": 2900
+    },
+    {
+      "epoch": 20.07,
+      "learning_rate": 6.878740157480315e-05,
+      "loss": 0.1773,
+      "step": 2950
+    },
+    {
+      "epoch": 20.41,
+      "learning_rate": 6.406299212598424e-05,
+      "loss": 0.185,
+      "step": 3000
+    },
+    {
+      "epoch": 20.41,
+      "eval_cer": 0.1447578672753954,
+      "eval_loss": 0.36554473638534546,
+      "eval_runtime": 24.7061,
+      "eval_samples_per_second": 23.8,
+      "eval_steps_per_second": 2.995,
+      "step": 3000
+    },
+    {
+      "epoch": 20.75,
+      "learning_rate": 5.933858267716535e-05,
+      "loss": 0.1735,
+      "step": 3050
+    },
+    {
+      "epoch": 21.09,
+      "learning_rate": 5.461417322834645e-05,
+      "loss": 0.1599,
+      "step": 3100
+    },
+    {
+      "epoch": 21.09,
+      "eval_cer": 0.14867112343062122,
+      "eval_loss": 0.37344449758529663,
+      "eval_runtime": 24.8752,
+      "eval_samples_per_second": 23.638,
+      "eval_steps_per_second": 2.975,
+      "step": 3100
+    },
+    {
+      "epoch": 21.43,
+      "learning_rate": 4.9889763779527555e-05,
+      "loss": 0.1578,
+      "step": 3150
+    },
+    {
+      "epoch": 21.77,
+      "learning_rate": 4.516535433070866e-05,
+      "loss": 0.1742,
+      "step": 3200
+    },
+    {
+      "epoch": 21.77,
+      "eval_cer": 0.148638512962661,
+      "eval_loss": 0.3685232102870941,
+      "eval_runtime": 25.1361,
+      "eval_samples_per_second": 23.393,
+      "eval_steps_per_second": 2.944,
+      "step": 3200
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
+  "total_flos": 1.242459434699676e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-2100 → checkpoint-3200}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-2200 → checkpoint-3300}/config.json RENAMED Viewed

File without changes

{checkpoint-2200 → checkpoint-3300}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6767d1346acea9f1cfc55aa58dcfbce8b49d761c43b31cd3ece778ea28537d18
 size 2490946501

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b656fc491d0ed8f6ebfccb7267d33dde8cfdd3fc42b0f12ed1ea145c2467b56
 size 2490946501

{checkpoint-2200 → checkpoint-3300}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-2100 → checkpoint-3300}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ec5ea49be8b746ea48d869dab13f1c8fb1f407557d206b2a7a9ee54fc7002b55
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:71b3268161afb2bcdf8b28a1a1d911f835d6d1a33dd0c929b5d6cf7248b065dc
 size 1262344621

{checkpoint-2100 → checkpoint-3300}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d26c90a74252f9ad5cdc4c91db335ffbbece95883ba82e495b95ac3d28e6ea52
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:e8d02f162a600f1e16123bc1f3de13d710b69a81bc405e4671daab4d2f276389
 size 14639

{checkpoint-2100 → checkpoint-3300}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1f255336918f2820e02ae648c756202ba55ed3193e9fd1950955ca2f6fb0457f
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:f5d87cd8a2522fd3677eac24590995de677069aa54288fb9a97a9c0b1ce60c09
 size 557

{checkpoint-2200 → checkpoint-3300}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:96e91f67ea7900c342bef5999be148a76880328bc0cbe140bae8517f86187cdb
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:96a17614a18bd66b442195d1c5c4d8d5494ab5df6a2f462116d009a1efdf394c
 size 627

{checkpoint-2100 → checkpoint-3300}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 14.285714285714286,
-  "global_step": 2100,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -447,11 +447,263 @@
       "eval_samples_per_second": 23.673,
       "eval_steps_per_second": 2.979,
       "step": 2100
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
-  "total_flos": 8.157984479823167e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 22.448979591836736,
+  "global_step": 3300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 23.673,
       "eval_steps_per_second": 2.979,
       "step": 2100
+    },
+    {
+      "epoch": 14.63,
+      "learning_rate": 0.0001443779527559055,
+      "loss": 0.2584,
+      "step": 2150
+    },
+    {
+      "epoch": 14.97,
+      "learning_rate": 0.0001396535433070866,
+      "loss": 0.2796,
+      "step": 2200
+    },
+    {
+      "epoch": 14.97,
+      "eval_cer": 0.14808413500733736,
+      "eval_loss": 0.3606802523136139,
+      "eval_runtime": 24.8151,
+      "eval_samples_per_second": 23.695,
+      "eval_steps_per_second": 2.982,
+      "step": 2200
+    },
+    {
+      "epoch": 15.31,
+      "learning_rate": 0.0001349291338582677,
+      "loss": 0.2462,
+      "step": 2250
+    },
+    {
+      "epoch": 15.65,
+      "learning_rate": 0.0001302047244094488,
+      "loss": 0.256,
+      "step": 2300
+    },
+    {
+      "epoch": 15.65,
+      "eval_cer": 0.15819338007500408,
+      "eval_loss": 0.3580550253391266,
+      "eval_runtime": 24.5695,
+      "eval_samples_per_second": 23.932,
+      "eval_steps_per_second": 3.012,
+      "step": 2300
+    },
+    {
+      "epoch": 15.99,
+      "learning_rate": 0.00012548031496062992,
+      "loss": 0.2524,
+      "step": 2350
+    },
+    {
+      "epoch": 16.33,
+      "learning_rate": 0.00012075590551181102,
+      "loss": 0.2219,
+      "step": 2400
+    },
+    {
+      "epoch": 16.33,
+      "eval_cer": 0.14801891407141693,
+      "eval_loss": 0.35925593972206116,
+      "eval_runtime": 24.982,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.962,
+      "step": 2400
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 0.0001160314960629921,
+      "loss": 0.2364,
+      "step": 2450
+    },
+    {
+      "epoch": 17.01,
+      "learning_rate": 0.00011130708661417321,
+      "loss": 0.2291,
+      "step": 2500
+    },
+    {
+      "epoch": 17.01,
+      "eval_cer": 0.1471058209685309,
+      "eval_loss": 0.35567909479141235,
+      "eval_runtime": 24.4749,
+      "eval_samples_per_second": 24.025,
+      "eval_steps_per_second": 3.024,
+      "step": 2500
+    },
+    {
+      "epoch": 17.35,
+      "learning_rate": 0.00010658267716535431,
+      "loss": 0.2045,
+      "step": 2550
+    },
+    {
+      "epoch": 17.69,
+      "learning_rate": 0.00010185826771653542,
+      "loss": 0.2172,
+      "step": 2600
+    },
+    {
+      "epoch": 17.69,
+      "eval_cer": 0.14792108266753629,
+      "eval_loss": 0.3606509566307068,
+      "eval_runtime": 25.1105,
+      "eval_samples_per_second": 23.416,
+      "eval_steps_per_second": 2.947,
+      "step": 2600
+    },
+    {
+      "epoch": 18.03,
+      "learning_rate": 9.713385826771652e-05,
+      "loss": 0.2271,
+      "step": 2650
+    },
+    {
+      "epoch": 18.37,
+      "learning_rate": 9.240944881889763e-05,
+      "loss": 0.1858,
+      "step": 2700
+    },
+    {
+      "epoch": 18.37,
+      "eval_cer": 0.15144301320723952,
+      "eval_loss": 0.3589307963848114,
+      "eval_runtime": 24.5005,
+      "eval_samples_per_second": 24.0,
+      "eval_steps_per_second": 3.02,
+      "step": 2700
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 8.768503937007873e-05,
+      "loss": 0.1995,
+      "step": 2750
+    },
+    {
+      "epoch": 19.05,
+      "learning_rate": 8.296062992125984e-05,
+      "loss": 0.1872,
+      "step": 2800
+    },
+    {
+      "epoch": 19.05,
+      "eval_cer": 0.14766019892385457,
+      "eval_loss": 0.36663514375686646,
+      "eval_runtime": 24.4383,
+      "eval_samples_per_second": 24.061,
+      "eval_steps_per_second": 3.028,
+      "step": 2800
+    },
+    {
+      "epoch": 19.39,
+      "learning_rate": 7.823622047244094e-05,
+      "loss": 0.177,
+      "step": 2850
+    },
+    {
+      "epoch": 19.73,
+      "learning_rate": 7.351181102362205e-05,
+      "loss": 0.1855,
+      "step": 2900
+    },
+    {
+      "epoch": 19.73,
+      "eval_cer": 0.1432577857492255,
+      "eval_loss": 0.3651330769062042,
+      "eval_runtime": 24.7826,
+      "eval_samples_per_second": 23.726,
+      "eval_steps_per_second": 2.986,
+      "step": 2900
+    },
+    {
+      "epoch": 20.07,
+      "learning_rate": 6.878740157480315e-05,
+      "loss": 0.1773,
+      "step": 2950
+    },
+    {
+      "epoch": 20.41,
+      "learning_rate": 6.406299212598424e-05,
+      "loss": 0.185,
+      "step": 3000
+    },
+    {
+      "epoch": 20.41,
+      "eval_cer": 0.1447578672753954,
+      "eval_loss": 0.36554473638534546,
+      "eval_runtime": 24.7061,
+      "eval_samples_per_second": 23.8,
+      "eval_steps_per_second": 2.995,
+      "step": 3000
+    },
+    {
+      "epoch": 20.75,
+      "learning_rate": 5.933858267716535e-05,
+      "loss": 0.1735,
+      "step": 3050
+    },
+    {
+      "epoch": 21.09,
+      "learning_rate": 5.461417322834645e-05,
+      "loss": 0.1599,
+      "step": 3100
+    },
+    {
+      "epoch": 21.09,
+      "eval_cer": 0.14867112343062122,
+      "eval_loss": 0.37344449758529663,
+      "eval_runtime": 24.8752,
+      "eval_samples_per_second": 23.638,
+      "eval_steps_per_second": 2.975,
+      "step": 3100
+    },
+    {
+      "epoch": 21.43,
+      "learning_rate": 4.9889763779527555e-05,
+      "loss": 0.1578,
+      "step": 3150
+    },
+    {
+      "epoch": 21.77,
+      "learning_rate": 4.516535433070866e-05,
+      "loss": 0.1742,
+      "step": 3200
+    },
+    {
+      "epoch": 21.77,
+      "eval_cer": 0.148638512962661,
+      "eval_loss": 0.3685232102870941,
+      "eval_runtime": 25.1361,
+      "eval_samples_per_second": 23.393,
+      "eval_steps_per_second": 2.944,
+      "step": 3200
+    },
+    {
+      "epoch": 22.11,
+      "learning_rate": 4.0440944881889764e-05,
+      "loss": 0.1666,
+      "step": 3250
+    },
+    {
+      "epoch": 22.45,
+      "learning_rate": 3.571653543307086e-05,
+      "loss": 0.1605,
+      "step": 3300
+    },
+    {
+      "epoch": 22.45,
+      "eval_cer": 0.14746453611609325,
+      "eval_loss": 0.3691498637199402,
+      "eval_runtime": 24.7916,
+      "eval_samples_per_second": 23.718,
+      "eval_steps_per_second": 2.985,
+      "step": 3300
     }
   ],
   "max_steps": 3675,
   "num_train_epochs": 25,
+  "total_flos": 1.2812925033719341e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-2200 → checkpoint-3300}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aa48ab3bfa27ac8b74f16b85b0b0e9423a7006947f26bc79b3a134b3a28201d9
 size 1262344621

 version https://git-lfs.github.com/spec/v1
+oid sha256:71b3268161afb2bcdf8b28a1a1d911f835d6d1a33dd0c929b5d6cf7248b065dc
 size 1262344621