final training

Browse files

Files changed (9) hide show

all_results.json +15 -15
eval_pretrained_results.json +3 -3
pytorch_model.bin +1 -1
requirements.txt +199 -4
test_finetuned_results.json +5 -5
test_pretrained_results.json +3 -3
train_results.json +4 -4
trainer_state.json +275 -275
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -2,31 +2,31 @@
     "epoch": 2.32,
     "eval_loss": 1.6191972494125366,
     "eval_pretrained_loss": 1.710707187652588,
-    "eval_pretrained_runtime": 113.3653,
-    "eval_pretrained_samples_per_second": 2.911,
-    "eval_pretrained_steps_per_second": 0.097,
     "eval_pretrained_wer": 258.2308797700783,
     "eval_runtime": 56.3363,
     "eval_samples_per_second": 0.071,
     "eval_steps_per_second": 0.036,
     "eval_wer": 153.2258064516129,
-    "test_finetuned_loss": 1.0526511669158936,
-    "test_finetuned_runtime": 167.4865,
-    "test_finetuned_samples_per_second": 4.532,
-    "test_finetuned_steps_per_second": 0.143,
-    "test_finetuned_wer": 176.51198300471353,
     "test_loss": 1.7568330764770508,
     "test_pretrained_loss": 1.723103642463684,
-    "test_pretrained_runtime": 171.9859,
-    "test_pretrained_samples_per_second": 4.413,
-    "test_pretrained_steps_per_second": 0.14,
     "test_pretrained_wer": 261.9265750514506,
     "test_runtime": 37.8582,
     "test_samples_per_second": 0.106,
     "test_steps_per_second": 0.053,
     "test_wer": 138.5964912280702,
-    "train_loss": 0.9721650715385165,
-    "train_runtime": 1491.7987,
-    "train_samples_per_second": 4.805,
-    "train_steps_per_second": 0.075
 }

     "epoch": 2.32,
     "eval_loss": 1.6191972494125366,
     "eval_pretrained_loss": 1.710707187652588,
+    "eval_pretrained_runtime": 125.9444,
+    "eval_pretrained_samples_per_second": 2.62,
+    "eval_pretrained_steps_per_second": 0.087,
     "eval_pretrained_wer": 258.2308797700783,
     "eval_runtime": 56.3363,
     "eval_samples_per_second": 0.071,
     "eval_steps_per_second": 0.036,
     "eval_wer": 153.2258064516129,
+    "test_finetuned_loss": 1.0840972661972046,
+    "test_finetuned_runtime": 169.6782,
+    "test_finetuned_samples_per_second": 4.473,
+    "test_finetuned_steps_per_second": 0.141,
+    "test_finetuned_wer": 172.4357697669787,
     "test_loss": 1.7568330764770508,
     "test_pretrained_loss": 1.723103642463684,
+    "test_pretrained_runtime": 196.5873,
+    "test_pretrained_samples_per_second": 3.861,
+    "test_pretrained_steps_per_second": 0.122,
     "test_pretrained_wer": 261.9265750514506,
     "test_runtime": 37.8582,
     "test_samples_per_second": 0.106,
     "test_steps_per_second": 0.053,
     "test_wer": 138.5964912280702,
+    "train_loss": 1.0522634956453527,
+    "train_runtime": 1735.2585,
+    "train_samples_per_second": 4.131,
+    "train_steps_per_second": 0.065
 }

eval_pretrained_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "eval_pretrained_loss": 1.710707187652588,
-    "eval_pretrained_runtime": 113.3653,
-    "eval_pretrained_samples_per_second": 2.911,
-    "eval_pretrained_steps_per_second": 0.097,
     "eval_pretrained_wer": 258.2308797700783
 }

 {
     "eval_pretrained_loss": 1.710707187652588,
+    "eval_pretrained_runtime": 125.9444,
+    "eval_pretrained_samples_per_second": 2.62,
+    "eval_pretrained_steps_per_second": 0.087,
     "eval_pretrained_wer": 258.2308797700783
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c74db4ae6de9cc4fe7ef67b639a61333e374adb566ec56ff72f1129f43c25bf4
 size 151098921

 version https://git-lfs.github.com/spec/v1
+oid sha256:2027faf2910d36a40b249965d707ab19532ef0effc8d243d184de4439275106e
 size 151098921

requirements.txt CHANGED Viewed

@@ -1,100 +1,295 @@
 absl-py==1.3.0
 aiohttp==3.8.3
 aiosignal==1.3.1
 appdirs==1.4.4
 async-timeout==4.0.2
 attrs==22.1.0
 audioread==3.0.0
 boto3==1.26.27
 botocore==1.29.27
 cachetools==5.2.0
 certifi==2022.12.7
 cffi==1.15.1
 charset-normalizer==2.1.1
 click==8.1.3
 contextlib2==21.6.0
 datasets @ git+https://github.com/huggingface/datasets@6338ded243ccb495b53b1996cba0847bdc250aba
 decorator==5.1.1
 dill==0.3.6
 docker-pycreds==0.4.0
 evaluate==0.3.0
 filelock==3.8.2
 frozenlist==1.3.3
 fsspec==2022.11.0
 gitdb==4.0.10
 GitPython==3.1.29
 google-auth==2.15.0
 google-auth-oauthlib==0.4.6
 google-pasta==0.2.0
 grpcio==1.51.1
 huggingface-hub==0.11.1
 idna==3.4
 importlib-metadata==4.13.0
 jiwer==2.5.1
 jmespath==1.0.1
 joblib==1.2.0
 Levenshtein==0.20.2
 librosa==0.9.2
 llvmlite==0.39.1
 Markdown==3.4.1
 MarkupSafe==2.1.1
 more-itertools==9.0.0
 multidict==6.0.3
 multiprocess==0.70.14
 numba==0.56.4
 numpy==1.23.5
 oauthlib==3.2.2
 packaging==20.9
 pandas==1.5.2
 pathos==0.3.0
 pathtools==0.1.2
 pooch==1.6.0
 pox==0.3.2
 ppft==1.7.6.6
 promise==2.3
 protobuf==3.20.3
 protobuf3-to-dict==0.1.5
 psutil==5.9.4
 pyarrow==10.0.1
 pyasn1==0.4.8
 pyasn1-modules==0.2.8
 pycparser==2.21
 pyparsing==3.0.9
 python-dateutil==2.8.2
 pytz==2022.6
 PyYAML==6.0
 rapidfuzz==2.13.4
 regex==2022.10.31
 requests==2.28.1
 requests-oauthlib==1.3.1
 resampy==0.4.2
 responses==0.18.0
 rsa==4.9
 s3transfer==0.6.0
 sagemaker==2.121.1
 schema==0.7.5
 scikit-learn==1.2.0
 scipy==1.9.3
 sentry-sdk==1.11.1
 setproctitle==1.3.2
 shortuuid==1.0.11
 six==1.16.0
 smdebug-rulesconfig==1.0.1
 smmap==5.0.0
 soundfile==0.11.0
 tensorboard==2.11.0
 tensorboard-data-server==0.6.1
 tensorboard-plugin-wit==1.8.1
 threadpoolctl==3.1.0
 tokenizers==0.13.2
-torch==1.11.0
-torchaudio==0.11.0
 tqdm==4.64.1
 transformers @ git+https://github.com/huggingface/transformers@9a6c6ef97fa5df4b1fb8dbc9e8c10ee3a9ed7e2a
-typing-extensions==4.4.0
 urllib3==1.26.13
 wandb==0.13.6
 Werkzeug==2.2.2
 xxhash==3.1.0
 yarl==1.8.2
-zipp==3.11.0

 absl-py==1.3.0
 aiohttp==3.8.3
 aiosignal==1.3.1
+anyio==3.6.2
 appdirs==1.4.4
+argon2-cffi==21.3.0
+argon2-cffi-bindings==21.2.0
+astunparse==1.6.2
 async-timeout==4.0.2
+atomicwrites==1.1.5
 attrs==22.1.0
 audioread==3.0.0
+Automat==0.8.0
+Babel==2.10.3
+backcall==0.1.0
+beautifulsoup4==4.8.2
+bleach==3.1.1
+blinker==1.4
+blosc==1.7.0
 boto3==1.26.27
 botocore==1.29.27
+bottle==0.12.15
 cachetools==5.2.0
+caffe==1.0.0
 certifi==2022.12.7
 cffi==1.15.1
+chardet==3.0.4
 charset-normalizer==2.1.1
 click==8.1.3
+cloud-init==22.3.4
+cloudpickle==1.3.0
+colorama==0.4.3
+command-not-found==0.3
+configobj==5.0.6
+constantly==15.1.0
 contextlib2==21.6.0
+cryptography==2.8
+ctop==1.0.0
+cycler==0.10.0
+Cython==0.29.14
+dask==2.8.1+dfsg
 datasets @ git+https://github.com/huggingface/datasets@6338ded243ccb495b53b1996cba0847bdc250aba
+dbus-python==1.2.16
 decorator==5.1.1
+defusedxml==0.6.0
 dill==0.3.6
+distlib==0.3.0
+distro==1.4.0
+distro-info===0.23ubuntu1
+docker==4.1.0
 docker-pycreds==0.4.0
+entrypoints==0.3
+et-xmlfile==1.0.1
 evaluate==0.3.0
+fastjsonschema==2.16.2
 filelock==3.8.2
+flake8==3.7.9
+flatbuffers==1.12
+fonttools==4.38.0
 frozenlist==1.3.3
 fsspec==2022.11.0
+future==0.18.2
+gast==0.4.0
 gitdb==4.0.10
 GitPython==3.1.29
+Glances==3.1.3
 google-auth==2.15.0
 google-auth-oauthlib==0.4.6
 google-pasta==0.2.0
 grpcio==1.51.1
+h5py==2.10.0
+html5lib==1.0.1
+htmlmin==0.1.12
+httplib2==0.14.0
 huggingface-hub==0.11.1
+hyperlink==19.0.0
+icdiff==1.9.5
 idna==3.4
+ImageHash==4.3.1
+imageio==2.4.1
 importlib-metadata==4.13.0
+incremental==16.10.1
+influxdb==5.2.0
+iotop==0.6
+ipykernel==5.2.0
+ipython==7.13.0
+ipython_genutils==0.2.0
+ipywidgets==8.0.2
+jdcal==1.0
+jedi==0.15.2
+Jinja2==3.1.2
 jiwer==2.5.1
 jmespath==1.0.1
 joblib==1.2.0
+json5==0.9.10
+jsonpatch==1.22
+jsonpointer==2.0
+jsonschema==3.2.0
+jupyter-console==6.0.0
+jupyter-server==1.21.0
+jupyter_client==7.4.4
+jupyter_core==4.11.2
+jupyterlab==3.5.0
+jupyterlab-pygments==0.2.2
+jupyterlab-widgets==3.0.3
+jupyterlab_server==2.16.1
+kaptan==0.5.10
+keras==2.9.0
+Keras-Preprocessing==1.1.2
+keyring==18.0.1
+kiwisolver==1.0.1
+language-selector==0.1
+launchpadlib==1.10.13
+lazr.restfulclient==0.14.2
+lazr.uri==1.0.3
 Levenshtein==0.20.2
 librosa==0.9.2
+libtmux==0.8.2
 llvmlite==0.39.1
+locket==0.2.0
+lxml==4.5.0
+Mako==1.1.0
 Markdown==3.4.1
 MarkupSafe==2.1.1
+matplotlib==3.5.3
+mccabe==0.6.1
+missingno==0.5.1
+mistune==2.0.4
 more-itertools==9.0.0
+mpi4py==3.0.3
 multidict==6.0.3
+multimethod==1.9
 multiprocess==0.70.14
+nbclassic==0.4.7
+nbclient==0.7.0
+nbconvert==7.2.2
+nbformat==5.7.0
+nest-asyncio==1.5.6
+netifaces==0.10.4
+networkx==2.4
+nose==1.3.7
+notebook==6.0.3
+notebook_shim==0.2.0
 numba==0.56.4
+numexpr==2.7.1
 numpy==1.23.5
+nvidia-cublas-cu11==11.10.3.66
+nvidia-cuda-nvrtc-cu11==11.7.99
+nvidia-cuda-runtime-cu11==11.7.99
+nvidia-cudnn-cu11==8.5.0.96
+nvidia-ml-py==7.352.0
 oauthlib==3.2.2
+olefile==0.46
+openpyxl==3.0.3
+opt-einsum==3.3.0
 packaging==20.9
 pandas==1.5.2
+pandas-profiling==3.4.0
+pandocfilters==1.4.2
+parameterized==0.7.0
+parso==0.5.2
+partd==1.0.0
 pathos==0.3.0
 pathtools==0.1.2
+patsy==0.5.3
+pexpect==4.6.0
+phik==0.12.2
+pickleshare==0.7.5
+Pillow==7.0.0
+pluggy==0.13.0
+ply==3.11
 pooch==1.6.0
 pox==0.3.2
 ppft==1.7.6.6
+prometheus-client==0.7.1
 promise==2.3
+prompt-toolkit==2.0.10
 protobuf==3.20.3
 protobuf3-to-dict==0.1.5
 psutil==5.9.4
+ptyprocess==0.7.0
+py==1.8.1
 pyarrow==10.0.1
 pyasn1==0.4.8
 pyasn1-modules==0.2.8
+pycodestyle==2.5.0
 pycparser==2.21
+pycryptodomex==3.6.1
+pycuda==2019.1.2
+pydantic==1.10.2
+pydot==1.4.1
+pyflakes==2.1.1
+Pygments==2.13.0
+PyGObject==3.36.0
+pygpu==0.7.6
+PyHamcrest==1.9.0
+pyinotify==0.9.6
+PyJWT==1.7.1
+pymacaroons==0.13.0
+PyNaCl==1.3.0
+pyOpenSSL==19.0.0
 pyparsing==3.0.9
+pyrsistent==0.15.5
+pyserial==3.4
+pysmi==0.3.2
+pysnmp==4.4.6
+pystache==0.5.4
+pytest==4.6.9
+python-apt==2.0.0+ubuntu0.20.4.8
 python-dateutil==2.8.2
+python-debian===0.1.36ubuntu1
+pytools==2019.1.1
 pytz==2022.6
+PyWavelets==0.5.1
 PyYAML==6.0
+pyzmq==24.0.1
 rapidfuzz==2.13.4
 regex==2022.10.31
 requests==2.28.1
 requests-oauthlib==1.3.1
+requests-unixsocket==0.2.0
 resampy==0.4.2
 responses==0.18.0
 rsa==4.9
 s3transfer==0.6.0
 sagemaker==2.121.1
 schema==0.7.5
+scikit-cuda==0.5.3
+scikit-image==0.16.2
 scikit-learn==1.2.0
 scipy==1.9.3
+seaborn==0.12.1
+SecretStorage==2.3.1
+Send2Trash==1.8.0
 sentry-sdk==1.11.1
+service-identity==18.1.0
 setproctitle==1.3.2
 shortuuid==1.0.11
+simplejson==3.16.0
 six==1.16.0
 smdebug-rulesconfig==1.0.1
 smmap==5.0.0
+sniffio==1.3.0
+sos==4.4
 soundfile==0.11.0
+soupsieve==1.9.5
+ssh-import-id==5.10
+statsmodels==0.13.2
+systemd-python==234
+tables==3.6.1
+tangled-up-in-unicode==0.2.0
 tensorboard==2.11.0
 tensorboard-data-server==0.6.1
 tensorboard-plugin-wit==1.8.1
+tensorflow-estimator==2.9.0
+tensorflow-gpu==2.9.1
+termcolor==1.1.0
+terminado==0.17.0
+testpath==0.4.4
+Theano==1.0.4
 threadpoolctl==3.1.0
+tinycss2==1.2.1
+tmuxp==1.5.4
 tokenizers==0.13.2
+tomli==2.0.1
+toolz==0.9.0
+torch==1.13.1
+torchaudio==0.13.1
+torchvision==0.13.1
+tornado==6.2
 tqdm==4.64.1
+traitlets==5.5.0
 transformers @ git+https://github.com/huggingface/transformers@9a6c6ef97fa5df4b1fb8dbc9e8c10ee3a9ed7e2a
+Twisted==18.9.0
+typing_extensions==4.4.0
+ubuntu-advantage-tools==27.11.2
+ufw==0.36
+unattended-upgrades==0.1
 urllib3==1.26.13
+virtualenv==20.0.17
+visions==0.7.5
+wadllib==1.3.3
 wandb==0.13.6
+wcwidth==0.1.8
+webencodings==0.5.1
+websocket-client==0.53.0
 Werkzeug==2.2.2
+widgetsnbextension==4.0.3
+wrapt==1.11.2
+xlrd==1.1.0
+xlwt==1.3.0
 xxhash==3.1.0
 yarl==1.8.2
+zipp==3.11.0
+zope.interface==4.7.1

test_finetuned_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 2.32,
-    "test_finetuned_loss": 1.0526511669158936,
-    "test_finetuned_runtime": 167.4865,
-    "test_finetuned_samples_per_second": 4.532,
-    "test_finetuned_steps_per_second": 0.143,
-    "test_finetuned_wer": 176.51198300471353
 }

 {
     "epoch": 2.32,
+    "test_finetuned_loss": 1.0840972661972046,
+    "test_finetuned_runtime": 169.6782,
+    "test_finetuned_samples_per_second": 4.473,
+    "test_finetuned_steps_per_second": 0.141,
+    "test_finetuned_wer": 172.4357697669787
 }

test_pretrained_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "test_pretrained_loss": 1.723103642463684,
-    "test_pretrained_runtime": 171.9859,
-    "test_pretrained_samples_per_second": 4.413,
-    "test_pretrained_steps_per_second": 0.14,
     "test_pretrained_wer": 261.9265750514506
 }

 {
     "test_pretrained_loss": 1.723103642463684,
+    "test_pretrained_runtime": 196.5873,
+    "test_pretrained_samples_per_second": 3.861,
+    "test_pretrained_steps_per_second": 0.122,
     "test_pretrained_wer": 261.9265750514506
 }

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 2.32,
-    "train_loss": 0.9721650715385165,
-    "train_runtime": 1491.7987,
-    "train_samples_per_second": 4.805,
-    "train_steps_per_second": 0.075
 }

 {
     "epoch": 2.32,
+    "train_loss": 1.0522634956453527,
+    "train_runtime": 1735.2585,
+    "train_samples_per_second": 4.131,
+    "train_steps_per_second": 0.065
 }

trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 158.1031454574485,
   "best_model_checkpoint": "./checkpoint-88",
   "epoch": 2.3214285714285716,
   "global_step": 112,
@@ -15,768 +15,768 @@
     },
     {
       "epoch": 0.02,
-      "learning_rate": 4.347826086956522e-07,
       "loss": 1.6564,
       "step": 2
     },
     {
       "epoch": 0.03,
-      "learning_rate": 8.695652173913044e-07,
       "loss": 1.6518,
       "step": 3
     },
     {
       "epoch": 0.04,
-      "learning_rate": 1.3043478260869566e-06,
-      "loss": 1.6233,
       "step": 4
     },
     {
       "epoch": 0.04,
-      "learning_rate": 1.7391304347826088e-06,
-      "loss": 1.712,
       "step": 5
     },
     {
       "epoch": 0.05,
-      "learning_rate": 2.173913043478261e-06,
-      "loss": 1.6476,
       "step": 6
     },
     {
       "epoch": 0.06,
-      "learning_rate": 2.6086956521739132e-06,
-      "loss": 1.5716,
       "step": 7
     },
     {
       "epoch": 0.07,
-      "learning_rate": 3.043478260869566e-06,
-      "loss": 1.5909,
       "step": 8
     },
     {
       "epoch": 0.08,
-      "learning_rate": 3.4782608695652175e-06,
-      "loss": 1.5905,
       "step": 9
     },
     {
       "epoch": 0.09,
-      "learning_rate": 3.91304347826087e-06,
-      "loss": 1.5486,
       "step": 10
     },
     {
       "epoch": 0.1,
-      "learning_rate": 4.347826086956522e-06,
-      "loss": 1.5299,
       "step": 11
     },
     {
       "epoch": 0.1,
-      "eval_loss": 1.5621598958969116,
-      "eval_runtime": 105.0814,
-      "eval_samples_per_second": 3.14,
-      "eval_steps_per_second": 0.105,
-      "eval_wer": 219.67108414497844,
       "step": 11
     },
     {
       "epoch": 0.11,
-      "learning_rate": 4.782608695652174e-06,
-      "loss": 1.4537,
       "step": 12
     },
     {
       "epoch": 0.12,
-      "learning_rate": 5.2173913043478265e-06,
-      "loss": 1.3729,
       "step": 13
     },
     {
       "epoch": 0.12,
-      "learning_rate": 5.652173913043479e-06,
-      "loss": 1.4921,
       "step": 14
     },
     {
       "epoch": 0.13,
-      "learning_rate": 6.086956521739132e-06,
-      "loss": 1.5069,
       "step": 15
     },
     {
       "epoch": 0.14,
-      "learning_rate": 6.521739130434783e-06,
-      "loss": 1.388,
       "step": 16
     },
     {
       "epoch": 0.15,
-      "learning_rate": 6.956521739130435e-06,
-      "loss": 1.3857,
       "step": 17
     },
     {
       "epoch": 0.16,
-      "learning_rate": 7.391304347826087e-06,
-      "loss": 1.3389,
       "step": 18
     },
     {
       "epoch": 0.17,
-      "learning_rate": 7.82608695652174e-06,
-      "loss": 1.3089,
       "step": 19
     },
     {
       "epoch": 0.18,
-      "learning_rate": 8.260869565217392e-06,
-      "loss": 1.2118,
       "step": 20
     },
     {
       "epoch": 0.19,
-      "learning_rate": 8.695652173913044e-06,
-      "loss": 1.1634,
       "step": 21
     },
     {
       "epoch": 0.2,
-      "learning_rate": 9.130434782608697e-06,
-      "loss": 1.1908,
       "step": 22
     },
     {
       "epoch": 0.2,
-      "eval_loss": 1.3651723861694336,
-      "eval_runtime": 110.8115,
-      "eval_samples_per_second": 2.978,
-      "eval_steps_per_second": 0.099,
-      "eval_wer": 192.2401405077439,
       "step": 22
     },
     {
       "epoch": 0.21,
-      "learning_rate": 9.565217391304349e-06,
-      "loss": 1.1192,
       "step": 23
     },
     {
       "epoch": 0.21,
-      "learning_rate": 1e-05,
-      "loss": 1.2042,
       "step": 24
     },
     {
       "epoch": 0.22,
-      "learning_rate": 9.887640449438202e-06,
-      "loss": 1.1448,
       "step": 25
     },
     {
       "epoch": 0.23,
-      "learning_rate": 9.775280898876405e-06,
-      "loss": 1.1393,
       "step": 26
     },
     {
       "epoch": 0.24,
-      "learning_rate": 9.662921348314608e-06,
-      "loss": 1.1482,
       "step": 27
     },
     {
       "epoch": 0.25,
-      "learning_rate": 9.55056179775281e-06,
-      "loss": 1.179,
       "step": 28
     },
     {
       "epoch": 0.26,
-      "learning_rate": 9.438202247191012e-06,
-      "loss": 0.9847,
       "step": 29
     },
     {
       "epoch": 0.27,
-      "learning_rate": 9.325842696629213e-06,
-      "loss": 1.1149,
       "step": 30
     },
     {
       "epoch": 0.28,
-      "learning_rate": 9.213483146067417e-06,
-      "loss": 1.0657,
       "step": 31
     },
     {
       "epoch": 0.29,
-      "learning_rate": 9.101123595505619e-06,
-      "loss": 1.0028,
       "step": 32
     },
     {
       "epoch": 0.29,
-      "learning_rate": 8.988764044943822e-06,
-      "loss": 1.1161,
       "step": 33
     },
     {
       "epoch": 0.29,
-      "eval_loss": 1.1921106576919556,
-      "eval_runtime": 103.0628,
-      "eval_samples_per_second": 3.202,
-      "eval_steps_per_second": 0.107,
-      "eval_wer": 200.23950183618075,
       "step": 33
     },
     {
       "epoch": 0.3,
-      "learning_rate": 8.876404494382023e-06,
-      "loss": 1.0931,
       "step": 34
     },
     {
       "epoch": 0.31,
-      "learning_rate": 8.764044943820226e-06,
-      "loss": 1.0635,
       "step": 35
     },
     {
       "epoch": 0.32,
-      "learning_rate": 8.651685393258428e-06,
-      "loss": 1.0671,
       "step": 36
     },
     {
       "epoch": 0.33,
-      "learning_rate": 8.53932584269663e-06,
-      "loss": 1.0251,
       "step": 37
     },
     {
       "epoch": 0.34,
-      "learning_rate": 8.426966292134832e-06,
-      "loss": 1.0486,
       "step": 38
     },
     {
       "epoch": 1.01,
-      "learning_rate": 8.314606741573035e-06,
-      "loss": 0.9926,
       "step": 39
     },
     {
       "epoch": 1.02,
-      "learning_rate": 8.202247191011237e-06,
-      "loss": 1.0232,
       "step": 40
     },
     {
       "epoch": 1.03,
-      "learning_rate": 8.08988764044944e-06,
-      "loss": 0.9421,
       "step": 41
     },
     {
       "epoch": 1.04,
-      "learning_rate": 7.97752808988764e-06,
-      "loss": 0.9541,
       "step": 42
     },
     {
       "epoch": 1.04,
-      "learning_rate": 7.865168539325843e-06,
-      "loss": 0.9639,
       "step": 43
     },
     {
       "epoch": 1.05,
-      "learning_rate": 7.752808988764046e-06,
-      "loss": 0.9216,
       "step": 44
     },
     {
       "epoch": 1.05,
-      "eval_loss": 1.1263455152511597,
-      "eval_runtime": 93.6663,
-      "eval_samples_per_second": 3.523,
-      "eval_steps_per_second": 0.117,
-      "eval_wer": 186.52403001756346,
       "step": 44
     },
     {
       "epoch": 1.06,
-      "learning_rate": 7.640449438202247e-06,
-      "loss": 0.9097,
       "step": 45
     },
     {
       "epoch": 1.07,
-      "learning_rate": 7.5280898876404495e-06,
-      "loss": 0.8688,
       "step": 46
     },
     {
       "epoch": 1.08,
-      "learning_rate": 7.415730337078652e-06,
-      "loss": 0.9019,
       "step": 47
     },
     {
       "epoch": 1.09,
-      "learning_rate": 7.303370786516854e-06,
-      "loss": 0.9135,
       "step": 48
     },
     {
       "epoch": 1.1,
-      "learning_rate": 7.191011235955056e-06,
-      "loss": 0.9033,
       "step": 49
     },
     {
       "epoch": 1.11,
-      "learning_rate": 7.078651685393258e-06,
-      "loss": 0.8575,
       "step": 50
     },
     {
       "epoch": 1.12,
-      "learning_rate": 6.966292134831461e-06,
-      "loss": 0.8276,
       "step": 51
     },
     {
       "epoch": 1.12,
-      "learning_rate": 6.853932584269663e-06,
-      "loss": 0.9276,
       "step": 52
     },
     {
       "epoch": 1.13,
-      "learning_rate": 6.741573033707865e-06,
-      "loss": 0.9186,
       "step": 53
     },
     {
       "epoch": 1.14,
-      "learning_rate": 6.629213483146067e-06,
-      "loss": 0.8693,
       "step": 54
     },
     {
       "epoch": 1.15,
-      "learning_rate": 6.51685393258427e-06,
-      "loss": 0.8441,
       "step": 55
     },
     {
       "epoch": 1.15,
-      "eval_loss": 1.0945535898208618,
-      "eval_runtime": 102.0356,
-      "eval_samples_per_second": 3.234,
-      "eval_steps_per_second": 0.108,
-      "eval_wer": 179.32300814306242,
       "step": 55
     },
     {
       "epoch": 1.16,
-      "learning_rate": 6.404494382022472e-06,
-      "loss": 0.8189,
       "step": 56
     },
     {
       "epoch": 1.17,
-      "learning_rate": 6.292134831460674e-06,
-      "loss": 0.8047,
       "step": 57
     },
     {
       "epoch": 1.18,
-      "learning_rate": 6.179775280898876e-06,
-      "loss": 0.7858,
       "step": 58
     },
     {
       "epoch": 1.19,
-      "learning_rate": 6.06741573033708e-06,
-      "loss": 0.7312,
       "step": 59
     },
     {
       "epoch": 1.2,
-      "learning_rate": 5.955056179775281e-06,
-      "loss": 0.7638,
       "step": 60
     },
     {
       "epoch": 1.21,
-      "learning_rate": 5.842696629213483e-06,
-      "loss": 0.7374,
       "step": 61
     },
     {
       "epoch": 1.21,
-      "learning_rate": 5.730337078651685e-06,
-      "loss": 0.7986,
       "step": 62
     },
     {
       "epoch": 1.22,
-      "learning_rate": 5.617977528089889e-06,
-      "loss": 0.762,
       "step": 63
     },
     {
       "epoch": 1.23,
-      "learning_rate": 5.50561797752809e-06,
-      "loss": 0.785,
       "step": 64
     },
     {
       "epoch": 1.24,
-      "learning_rate": 5.393258426966292e-06,
-      "loss": 0.8349,
       "step": 65
     },
     {
       "epoch": 1.25,
-      "learning_rate": 5.280898876404494e-06,
-      "loss": 0.8505,
       "step": 66
     },
     {
       "epoch": 1.25,
-      "eval_loss": 1.0748353004455566,
-      "eval_runtime": 93.3893,
-      "eval_samples_per_second": 3.534,
-      "eval_steps_per_second": 0.118,
-      "eval_wer": 159.68385757624142,
       "step": 66
     },
     {
       "epoch": 1.26,
-      "learning_rate": 5.168539325842698e-06,
-      "loss": 0.7309,
       "step": 67
     },
     {
       "epoch": 1.27,
-      "learning_rate": 5.0561797752809e-06,
-      "loss": 0.8261,
       "step": 68
     },
     {
       "epoch": 1.28,
-      "learning_rate": 4.943820224719101e-06,
-      "loss": 0.8053,
       "step": 69
     },
     {
       "epoch": 1.29,
-      "learning_rate": 4.831460674157304e-06,
-      "loss": 0.7672,
       "step": 70
     },
     {
       "epoch": 1.29,
-      "learning_rate": 4.719101123595506e-06,
-      "loss": 0.8692,
       "step": 71
     },
     {
       "epoch": 1.3,
-      "learning_rate": 4.606741573033709e-06,
-      "loss": 0.8588,
       "step": 72
     },
     {
       "epoch": 1.31,
-      "learning_rate": 4.494382022471911e-06,
-      "loss": 0.8277,
       "step": 73
     },
     {
       "epoch": 1.32,
-      "learning_rate": 4.382022471910113e-06,
-      "loss": 0.8387,
       "step": 74
     },
     {
       "epoch": 1.33,
-      "learning_rate": 4.269662921348315e-06,
-      "loss": 0.801,
       "step": 75
     },
     {
       "epoch": 1.34,
-      "learning_rate": 4.157303370786518e-06,
-      "loss": 0.7801,
       "step": 76
     },
     {
       "epoch": 2.01,
-      "learning_rate": 4.04494382022472e-06,
-      "loss": 0.7844,
       "step": 77
     },
     {
       "epoch": 2.01,
-      "eval_loss": 1.0585265159606934,
-      "eval_runtime": 87.6428,
-      "eval_samples_per_second": 3.765,
-      "eval_steps_per_second": 0.126,
-      "eval_wer": 163.2923519080313,
       "step": 77
     },
     {
       "epoch": 2.02,
-      "learning_rate": 3.932584269662922e-06,
-      "loss": 0.8227,
       "step": 78
     },
     {
       "epoch": 2.03,
-      "learning_rate": 3.820224719101124e-06,
-      "loss": 0.757,
       "step": 79
     },
     {
       "epoch": 2.04,
-      "learning_rate": 3.707865168539326e-06,
-      "loss": 0.7713,
       "step": 80
     },
     {
       "epoch": 2.04,
-      "learning_rate": 3.595505617977528e-06,
-      "loss": 0.7782,
       "step": 81
     },
     {
       "epoch": 2.05,
-      "learning_rate": 3.4831460674157306e-06,
-      "loss": 0.7468,
       "step": 82
     },
     {
       "epoch": 2.06,
-      "learning_rate": 3.3707865168539327e-06,
-      "loss": 0.7457,
       "step": 83
     },
     {
       "epoch": 2.07,
-      "learning_rate": 3.258426966292135e-06,
-      "loss": 0.7126,
       "step": 84
     },
     {
       "epoch": 2.08,
-      "learning_rate": 3.146067415730337e-06,
-      "loss": 0.7476,
       "step": 85
     },
     {
       "epoch": 2.09,
-      "learning_rate": 3.03370786516854e-06,
-      "loss": 0.76,
       "step": 86
     },
     {
       "epoch": 2.1,
-      "learning_rate": 2.9213483146067416e-06,
-      "loss": 0.7673,
       "step": 87
     },
     {
       "epoch": 2.11,
-      "learning_rate": 2.8089887640449444e-06,
-      "loss": 0.7208,
       "step": 88
     },
     {
       "epoch": 2.11,
-      "eval_loss": 1.0490810871124268,
-      "eval_runtime": 106.8845,
-      "eval_samples_per_second": 3.087,
-      "eval_steps_per_second": 0.103,
-      "eval_wer": 158.1031454574485,
       "step": 88
     },
     {
       "epoch": 2.12,
-      "learning_rate": 2.696629213483146e-06,
-      "loss": 0.7045,
       "step": 89
     },
     {
       "epoch": 2.12,
-      "learning_rate": 2.584269662921349e-06,
-      "loss": 0.7887,
       "step": 90
     },
     {
       "epoch": 2.13,
-      "learning_rate": 2.4719101123595505e-06,
-      "loss": 0.7821,
       "step": 91
     },
     {
       "epoch": 2.14,
-      "learning_rate": 2.359550561797753e-06,
-      "loss": 0.7487,
       "step": 92
     },
     {
       "epoch": 2.15,
-      "learning_rate": 2.2471910112359554e-06,
-      "loss": 0.7281,
       "step": 93
     },
     {
       "epoch": 2.16,
-      "learning_rate": 2.1348314606741574e-06,
-      "loss": 0.7084,
       "step": 94
     },
     {
       "epoch": 2.17,
-      "learning_rate": 2.02247191011236e-06,
-      "loss": 0.6971,
       "step": 95
     },
     {
       "epoch": 2.18,
-      "learning_rate": 1.910112359550562e-06,
-      "loss": 0.6869,
       "step": 96
     },
     {
       "epoch": 2.19,
-      "learning_rate": 1.797752808988764e-06,
-      "loss": 0.6411,
       "step": 97
     },
     {
       "epoch": 2.2,
-      "learning_rate": 1.6853932584269663e-06,
-      "loss": 0.6658,
       "step": 98
     },
     {
       "epoch": 2.21,
-      "learning_rate": 1.5730337078651686e-06,
-      "loss": 0.6481,
       "step": 99
     },
     {
       "epoch": 2.21,
-      "eval_loss": 1.046801209449768,
-      "eval_runtime": 89.0792,
-      "eval_samples_per_second": 3.705,
-      "eval_steps_per_second": 0.123,
-      "eval_wer": 158.51828197349514,
       "step": 99
     },
     {
       "epoch": 2.21,
-      "learning_rate": 1.4606741573033708e-06,
-      "loss": 0.7064,
       "step": 100
     },
     {
       "epoch": 2.22,
-      "learning_rate": 1.348314606741573e-06,
-      "loss": 0.6699,
       "step": 101
     },
     {
       "epoch": 2.23,
-      "learning_rate": 1.2359550561797752e-06,
-      "loss": 0.6974,
       "step": 102
     },
     {
       "epoch": 2.24,
-      "learning_rate": 1.1235955056179777e-06,
-      "loss": 0.7523,
       "step": 103
     },
     {
       "epoch": 2.25,
-      "learning_rate": 1.01123595505618e-06,
-      "loss": 0.7621,
       "step": 104
     },
     {
       "epoch": 2.26,
-      "learning_rate": 8.98876404494382e-07,
-      "loss": 0.657,
       "step": 105
     },
     {
       "epoch": 2.27,
-      "learning_rate": 7.865168539325843e-07,
-      "loss": 0.7443,
       "step": 106
     },
     {
       "epoch": 2.28,
-      "learning_rate": 6.741573033707865e-07,
-      "loss": 0.729,
       "step": 107
     },
     {
       "epoch": 2.29,
-      "learning_rate": 5.617977528089888e-07,
-      "loss": 0.6983,
       "step": 108
     },
     {
       "epoch": 2.29,
-      "learning_rate": 4.49438202247191e-07,
-      "loss": 0.7963,
       "step": 109
     },
     {
       "epoch": 2.3,
-      "learning_rate": 3.3707865168539325e-07,
-      "loss": 0.7912,
       "step": 110
     },
     {
       "epoch": 2.3,
-      "eval_loss": 1.045613408088684,
-      "eval_runtime": 91.8976,
-      "eval_samples_per_second": 3.591,
-      "eval_steps_per_second": 0.12,
-      "eval_wer": 168.6092926712438,
       "step": 110
     },
     {
       "epoch": 2.31,
-      "learning_rate": 2.247191011235955e-07,
-      "loss": 0.7626,
       "step": 111
     },
     {
       "epoch": 2.32,
-      "learning_rate": 1.1235955056179776e-07,
-      "loss": 0.7754,
       "step": 112
     },
     {
       "epoch": 2.32,
       "step": 112,
       "total_flos": 1.7415399333888e+17,
-      "train_loss": 0.9721650715385165,
-      "train_runtime": 1491.7987,
-      "train_samples_per_second": 4.805,
-      "train_steps_per_second": 0.075
     }
   ],
   "max_steps": 112,

 {
+  "best_metric": 161.45617116397892,
   "best_model_checkpoint": "./checkpoint-88",
   "epoch": 2.3214285714285716,
   "global_step": 112,
     },
     {
       "epoch": 0.02,
+      "learning_rate": 2.2058823529411765e-07,
       "loss": 1.6564,
       "step": 2
     },
     {
       "epoch": 0.03,
+      "learning_rate": 4.411764705882353e-07,
       "loss": 1.6518,
       "step": 3
     },
     {
       "epoch": 0.04,
+      "learning_rate": 6.61764705882353e-07,
+      "loss": 1.6237,
       "step": 4
     },
     {
       "epoch": 0.04,
+      "learning_rate": 8.823529411764706e-07,
+      "loss": 1.7141,
       "step": 5
     },
     {
       "epoch": 0.05,
+      "learning_rate": 1.1029411764705884e-06,
+      "loss": 1.655,
       "step": 6
     },
     {
       "epoch": 0.06,
+      "learning_rate": 1.323529411764706e-06,
+      "loss": 1.5904,
       "step": 7
     },
     {
       "epoch": 0.07,
+      "learning_rate": 1.5441176470588234e-06,
+      "loss": 1.6232,
       "step": 8
     },
     {
       "epoch": 0.08,
+      "learning_rate": 1.7647058823529412e-06,
+      "loss": 1.6403,
       "step": 9
     },
     {
       "epoch": 0.09,
+      "learning_rate": 1.985294117647059e-06,
+      "loss": 1.6065,
       "step": 10
     },
     {
       "epoch": 0.1,
+      "learning_rate": 2.2058823529411767e-06,
+      "loss": 1.5947,
       "step": 11
     },
     {
       "epoch": 0.1,
+      "eval_loss": 1.629066824913025,
+      "eval_runtime": 125.637,
+      "eval_samples_per_second": 2.627,
+      "eval_steps_per_second": 0.088,
+      "eval_wer": 227.94188088775348,
       "step": 11
     },
     {
       "epoch": 0.11,
+      "learning_rate": 2.4264705882352943e-06,
+      "loss": 1.52,
       "step": 12
     },
     {
       "epoch": 0.12,
+      "learning_rate": 2.647058823529412e-06,
+      "loss": 1.4456,
       "step": 13
     },
     {
       "epoch": 0.12,
+      "learning_rate": 2.867647058823529e-06,
+      "loss": 1.58,
       "step": 14
     },
     {
       "epoch": 0.13,
+      "learning_rate": 3.088235294117647e-06,
+      "loss": 1.5958,
       "step": 15
     },
     {
       "epoch": 0.14,
+      "learning_rate": 3.308823529411765e-06,
+      "loss": 1.4695,
       "step": 16
     },
     {
       "epoch": 0.15,
+      "learning_rate": 3.5294117647058825e-06,
+      "loss": 1.4718,
       "step": 17
     },
     {
       "epoch": 0.16,
+      "learning_rate": 3.75e-06,
+      "loss": 1.4406,
       "step": 18
     },
     {
       "epoch": 0.17,
+      "learning_rate": 3.970588235294118e-06,
+      "loss": 1.4339,
       "step": 19
     },
     {
       "epoch": 0.18,
+      "learning_rate": 4.191176470588236e-06,
+      "loss": 1.313,
       "step": 20
     },
     {
       "epoch": 0.19,
+      "learning_rate": 4.411764705882353e-06,
+      "loss": 1.2825,
       "step": 21
     },
     {
       "epoch": 0.2,
+      "learning_rate": 4.632352941176471e-06,
+      "loss": 1.3194,
       "step": 22
     },
     {
       "epoch": 0.2,
+      "eval_loss": 1.460469126701355,
+      "eval_runtime": 118.4642,
+      "eval_samples_per_second": 2.786,
+      "eval_steps_per_second": 0.093,
+      "eval_wer": 235.94124221619032,
       "step": 22
     },
     {
       "epoch": 0.21,
+      "learning_rate": 4.852941176470589e-06,
+      "loss": 1.2301,
       "step": 23
     },
     {
       "epoch": 0.21,
+      "learning_rate": 5.073529411764706e-06,
+      "loss": 1.3231,
       "step": 24
     },
     {
       "epoch": 0.22,
+      "learning_rate": 5.294117647058824e-06,
+      "loss": 1.2689,
       "step": 25
     },
     {
       "epoch": 0.23,
+      "learning_rate": 5.5147058823529415e-06,
+      "loss": 1.2768,
       "step": 26
     },
     {
       "epoch": 0.24,
+      "learning_rate": 5.735294117647058e-06,
+      "loss": 1.2927,
       "step": 27
     },
     {
       "epoch": 0.25,
+      "learning_rate": 5.955882352941176e-06,
+      "loss": 1.3419,
       "step": 28
     },
     {
       "epoch": 0.26,
+      "learning_rate": 6.176470588235294e-06,
+      "loss": 1.141,
       "step": 29
     },
     {
       "epoch": 0.27,
+      "learning_rate": 6.397058823529412e-06,
+      "loss": 1.2907,
       "step": 30
     },
     {
       "epoch": 0.28,
+      "learning_rate": 6.61764705882353e-06,
+      "loss": 1.2248,
       "step": 31
     },
     {
       "epoch": 0.29,
+      "learning_rate": 6.838235294117647e-06,
+      "loss": 1.149,
       "step": 32
     },
     {
       "epoch": 0.29,
+      "learning_rate": 7.058823529411765e-06,
+      "loss": 1.2636,
       "step": 33
     },
     {
       "epoch": 0.29,
+      "eval_loss": 1.3149287700653076,
+      "eval_runtime": 115.745,
+      "eval_samples_per_second": 2.851,
+      "eval_steps_per_second": 0.095,
+      "eval_wer": 177.19942519559316,
       "step": 33
     },
     {
       "epoch": 0.3,
+      "learning_rate": 7.2794117647058826e-06,
+      "loss": 1.2351,
       "step": 34
     },
     {
       "epoch": 0.31,
+      "learning_rate": 7.5e-06,
+      "loss": 1.2055,
       "step": 35
     },
     {
       "epoch": 0.32,
+      "learning_rate": 7.403846153846155e-06,
+      "loss": 1.1864,
       "step": 36
     },
     {
       "epoch": 0.33,
+      "learning_rate": 7.307692307692308e-06,
+      "loss": 1.148,
       "step": 37
     },
     {
       "epoch": 0.34,
+      "learning_rate": 7.211538461538462e-06,
+      "loss": 1.1505,
       "step": 38
     },
     {
       "epoch": 1.01,
+      "learning_rate": 7.115384615384615e-06,
+      "loss": 1.0859,
       "step": 39
     },
     {
       "epoch": 1.02,
+      "learning_rate": 7.01923076923077e-06,
+      "loss": 1.119,
       "step": 40
     },
     {
       "epoch": 1.03,
+      "learning_rate": 6.923076923076923e-06,
+      "loss": 1.0238,
       "step": 41
     },
     {
       "epoch": 1.04,
+      "learning_rate": 6.826923076923077e-06,
+      "loss": 1.0468,
       "step": 42
     },
     {
       "epoch": 1.04,
+      "learning_rate": 6.730769230769231e-06,
+      "loss": 1.061,
       "step": 43
     },
     {
       "epoch": 1.05,
+      "learning_rate": 6.6346153846153846e-06,
+      "loss": 1.0238,
       "step": 44
     },
     {
       "epoch": 1.05,
+      "eval_loss": 1.1836069822311401,
+      "eval_runtime": 109.1507,
+      "eval_samples_per_second": 3.023,
+      "eval_steps_per_second": 0.101,
+      "eval_wer": 199.80839853105542,
       "step": 44
     },
     {
       "epoch": 1.06,
+      "learning_rate": 6.538461538461539e-06,
+      "loss": 1.0016,
       "step": 45
     },
     {
       "epoch": 1.07,
+      "learning_rate": 6.442307692307692e-06,
+      "loss": 0.9635,
       "step": 46
     },
     {
       "epoch": 1.08,
+      "learning_rate": 6.3461538461538466e-06,
+      "loss": 0.9953,
       "step": 47
     },
     {
       "epoch": 1.09,
+      "learning_rate": 6.25e-06,
+      "loss": 1.0061,
       "step": 48
     },
     {
       "epoch": 1.1,
+      "learning_rate": 6.153846153846154e-06,
+      "loss": 0.9933,
       "step": 49
     },
     {
       "epoch": 1.11,
+      "learning_rate": 6.057692307692308e-06,
+      "loss": 0.9479,
       "step": 50
     },
     {
       "epoch": 1.12,
+      "learning_rate": 5.9615384615384615e-06,
+      "loss": 0.9132,
       "step": 51
     },
     {
       "epoch": 1.12,
+      "learning_rate": 5.865384615384615e-06,
+      "loss": 1.0232,
       "step": 52
     },
     {
       "epoch": 1.13,
+      "learning_rate": 5.76923076923077e-06,
+      "loss": 1.0153,
       "step": 53
     },
     {
       "epoch": 1.14,
+      "learning_rate": 5.673076923076923e-06,
+      "loss": 0.9548,
       "step": 54
     },
     {
       "epoch": 1.15,
+      "learning_rate": 5.576923076923077e-06,
+      "loss": 0.9306,
       "step": 55
     },
     {
       "epoch": 1.15,
+      "eval_loss": 1.1363615989685059,
+      "eval_runtime": 115.8861,
+      "eval_samples_per_second": 2.848,
+      "eval_steps_per_second": 0.095,
+      "eval_wer": 210.21874501037843,
       "step": 55
     },
     {
       "epoch": 1.16,
+      "learning_rate": 5.480769230769231e-06,
+      "loss": 0.9088,
       "step": 56
     },
     {
       "epoch": 1.17,
+      "learning_rate": 5.384615384615385e-06,
+      "loss": 0.8902,
       "step": 57
     },
     {
       "epoch": 1.18,
+      "learning_rate": 5.288461538461539e-06,
+      "loss": 0.861,
       "step": 58
     },
     {
       "epoch": 1.19,
+      "learning_rate": 5.192307692307692e-06,
+      "loss": 0.8047,
       "step": 59
     },
     {
       "epoch": 1.2,
+      "learning_rate": 5.096153846153847e-06,
+      "loss": 0.8459,
       "step": 60
     },
     {
       "epoch": 1.21,
+      "learning_rate": 4.9999999999999996e-06,
+      "loss": 0.8103,
       "step": 61
     },
     {
       "epoch": 1.21,
+      "learning_rate": 4.903846153846154e-06,
+      "loss": 0.8752,
       "step": 62
     },
     {
       "epoch": 1.22,
+      "learning_rate": 4.807692307692308e-06,
+      "loss": 0.8398,
       "step": 63
     },
     {
       "epoch": 1.23,
+      "learning_rate": 4.711538461538462e-06,
+      "loss": 0.8571,
       "step": 64
     },
     {
       "epoch": 1.24,
+      "learning_rate": 4.615384615384616e-06,
+      "loss": 0.8998,
       "step": 65
     },
     {
       "epoch": 1.25,
+      "learning_rate": 4.519230769230769e-06,
+      "loss": 0.9233,
       "step": 66
     },
     {
       "epoch": 1.25,
+      "eval_loss": 1.1090655326843262,
+      "eval_runtime": 104.9772,
+      "eval_samples_per_second": 3.144,
+      "eval_steps_per_second": 0.105,
+      "eval_wer": 175.20357656075362,
       "step": 66
     },
     {
       "epoch": 1.26,
+      "learning_rate": 4.423076923076924e-06,
+      "loss": 0.7878,
       "step": 67
     },
     {
       "epoch": 1.27,
+      "learning_rate": 4.3269230769230765e-06,
+      "loss": 0.8948,
       "step": 68
     },
     {
       "epoch": 1.28,
+      "learning_rate": 4.230769230769231e-06,
+      "loss": 0.8711,
       "step": 69
     },
     {
       "epoch": 1.29,
+      "learning_rate": 4.134615384615385e-06,
+      "loss": 0.8292,
       "step": 70
     },
     {
       "epoch": 1.29,
+      "learning_rate": 4.0384615384615385e-06,
+      "loss": 0.9318,
       "step": 71
     },
     {
       "epoch": 1.3,
+      "learning_rate": 3.942307692307692e-06,
+      "loss": 0.9272,
       "step": 72
     },
     {
       "epoch": 1.31,
+      "learning_rate": 3.846153846153846e-06,
+      "loss": 0.8923,
       "step": 73
     },
     {
       "epoch": 1.32,
+      "learning_rate": 3.75e-06,
+      "loss": 0.9013,
       "step": 74
     },
     {
       "epoch": 1.33,
+      "learning_rate": 3.653846153846154e-06,
+      "loss": 0.8659,
       "step": 75
     },
     {
       "epoch": 1.34,
+      "learning_rate": 3.5576923076923075e-06,
+      "loss": 0.8422,
       "step": 76
     },
     {
       "epoch": 2.01,
+      "learning_rate": 3.4615384615384617e-06,
+      "loss": 0.8482,
       "step": 77
     },
     {
       "epoch": 2.01,
+      "eval_loss": 1.0900639295578003,
+      "eval_runtime": 99.705,
+      "eval_samples_per_second": 3.31,
+      "eval_steps_per_second": 0.11,
+      "eval_wer": 161.85534089094685,
       "step": 77
     },
     {
       "epoch": 2.02,
+      "learning_rate": 3.3653846153846154e-06,
+      "loss": 0.8925,
       "step": 78
     },
     {
       "epoch": 2.03,
+      "learning_rate": 3.2692307692307696e-06,
+      "loss": 0.8202,
       "step": 79
     },
     {
       "epoch": 2.04,
+      "learning_rate": 3.1730769230769233e-06,
+      "loss": 0.8384,
       "step": 80
     },
     {
       "epoch": 2.04,
+      "learning_rate": 3.076923076923077e-06,
+      "loss": 0.8469,
       "step": 81
     },
     {
       "epoch": 2.05,
+      "learning_rate": 2.9807692307692307e-06,
+      "loss": 0.8172,
       "step": 82
     },
     {
       "epoch": 2.06,
+      "learning_rate": 2.884615384615385e-06,
+      "loss": 0.8119,
       "step": 83
     },
     {
       "epoch": 2.07,
+      "learning_rate": 2.7884615384615386e-06,
+      "loss": 0.7811,
       "step": 84
     },
     {
       "epoch": 2.08,
+      "learning_rate": 2.6923076923076923e-06,
+      "loss": 0.819,
       "step": 85
     },
     {
       "epoch": 2.09,
+      "learning_rate": 2.596153846153846e-06,
+      "loss": 0.8324,
       "step": 86
     },
     {
       "epoch": 2.1,
+      "learning_rate": 2.4999999999999998e-06,
+      "loss": 0.8336,
       "step": 87
     },
     {
       "epoch": 2.11,
+      "learning_rate": 2.403846153846154e-06,
+      "loss": 0.7929,
       "step": 88
     },
     {
       "epoch": 2.11,
+      "eval_loss": 1.0782241821289062,
+      "eval_runtime": 111.1236,
+      "eval_samples_per_second": 2.97,
+      "eval_steps_per_second": 0.099,
+      "eval_wer": 161.45617116397892,
       "step": 88
     },
     {
       "epoch": 2.12,
+      "learning_rate": 2.307692307692308e-06,
+      "loss": 0.774,
       "step": 89
     },
     {
       "epoch": 2.12,
+      "learning_rate": 2.211538461538462e-06,
+      "loss": 0.8693,
       "step": 90
     },
     {
       "epoch": 2.13,
+      "learning_rate": 2.1153846153846155e-06,
+      "loss": 0.8628,
       "step": 91
     },
     {
       "epoch": 2.14,
+      "learning_rate": 2.0192307692307692e-06,
+      "loss": 0.8199,
       "step": 92
     },
     {
       "epoch": 2.15,
+      "learning_rate": 1.923076923076923e-06,
+      "loss": 0.7995,
       "step": 93
     },
     {
       "epoch": 2.16,
+      "learning_rate": 1.826923076923077e-06,
+      "loss": 0.7824,
       "step": 94
     },
     {
       "epoch": 2.17,
+      "learning_rate": 1.7307692307692308e-06,
+      "loss": 0.7694,
       "step": 95
     },
     {
       "epoch": 2.18,
+      "learning_rate": 1.6346153846153848e-06,
+      "loss": 0.7526,
       "step": 96
     },
     {
       "epoch": 2.19,
+      "learning_rate": 1.5384615384615385e-06,
+      "loss": 0.7037,
       "step": 97
     },
     {
       "epoch": 2.2,
+      "learning_rate": 1.4423076923076924e-06,
+      "loss": 0.7366,
       "step": 98
     },
     {
       "epoch": 2.21,
+      "learning_rate": 1.3461538461538462e-06,
+      "loss": 0.7134,
       "step": 99
     },
     {
       "epoch": 2.21,
+      "eval_loss": 1.0737253427505493,
+      "eval_runtime": 96.9018,
+      "eval_samples_per_second": 3.406,
+      "eval_steps_per_second": 0.114,
+      "eval_wer": 177.1195912501996,
       "step": 99
     },
     {
       "epoch": 2.21,
+      "learning_rate": 1.2499999999999999e-06,
+      "loss": 0.7738,
       "step": 100
     },
     {
       "epoch": 2.22,
+      "learning_rate": 1.153846153846154e-06,
+      "loss": 0.7373,
       "step": 101
     },
     {
       "epoch": 2.23,
+      "learning_rate": 1.0576923076923078e-06,
+      "loss": 0.7623,
       "step": 102
     },
     {
       "epoch": 2.24,
+      "learning_rate": 9.615384615384615e-07,
+      "loss": 0.815,
       "step": 103
     },
     {
       "epoch": 2.25,
+      "learning_rate": 8.653846153846154e-07,
+      "loss": 0.829,
       "step": 104
     },
     {
       "epoch": 2.26,
+      "learning_rate": 7.692307692307693e-07,
+      "loss": 0.7113,
       "step": 105
     },
     {
       "epoch": 2.27,
+      "learning_rate": 6.730769230769231e-07,
+      "loss": 0.8106,
       "step": 106
     },
     {
       "epoch": 2.28,
+      "learning_rate": 5.76923076923077e-07,
+      "loss": 0.7909,
       "step": 107
     },
     {
       "epoch": 2.29,
+      "learning_rate": 4.807692307692307e-07,
+      "loss": 0.7564,
       "step": 108
     },
     {
       "epoch": 2.29,
+      "learning_rate": 3.8461538461538463e-07,
+      "loss": 0.8574,
       "step": 109
     },
     {
       "epoch": 2.3,
+      "learning_rate": 2.884615384615385e-07,
+      "loss": 0.8543,
       "step": 110
     },
     {
       "epoch": 2.3,
+      "eval_loss": 1.0717276334762573,
+      "eval_runtime": 95.923,
+      "eval_samples_per_second": 3.44,
+      "eval_steps_per_second": 0.115,
+      "eval_wer": 187.5459045186013,
       "step": 110
     },
     {
       "epoch": 2.31,
+      "learning_rate": 1.9230769230769231e-07,
+      "loss": 0.824,
       "step": 111
     },
     {
       "epoch": 2.32,
+      "learning_rate": 9.615384615384616e-08,
+      "loss": 0.8352,
       "step": 112
     },
     {
       "epoch": 2.32,
       "step": 112,
       "total_flos": 1.7415399333888e+17,
+      "train_loss": 1.0522634956453527,
+      "train_runtime": 1735.2585,
+      "train_samples_per_second": 4.131,
+      "train_steps_per_second": 0.065
     }
   ],
   "max_steps": 112,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:23666f2916cd5411d616f8c83fed6cb219a0ba72c70f8943bef9ed5bb45800ed
 size 3579

 version https://git-lfs.github.com/spec/v1
+oid sha256:4578ee205fe35fdbb3b98224d5f855f806bd9eedb29095f0f731a29261db2d94
 size 3579