ProgramadorArtificial commited on Jun 9, 2023

Commit

0d330da

•

1 Parent(s): c50e76b

Add checkpoint

Browse files

Files changed (20) hide show

.gitattributes +1 -0
README.md +79 -0
added_tokens.json +4 -0
config.json +108 -0
dataset_files/dataset.tsv +3 -0
dataset_files/dataset_cleaned.tsv +3 -0
dataset_files/test.tsv +3 -0
dataset_files/train.tsv +3 -0
dataset_files/validation.tsv +3 -0
optimizer.pt +3 -0
preprocessor_config.json +10 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scaler.pt +3 -0
scheduler.pt +3 -0
special_tokens_map.json +120 -0
tokenizer_config.json +13 -0
trainer_state.json +2510 -0
training_args.bin +3 -0
vocab.json +46 -0

.gitattributes CHANGED Viewed

@@ -32,3 +32,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.tsv filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,3 +1,82 @@
 ---
 license: apache-2.0
 ---

 ---
 license: apache-2.0
+datasets:
+- mozilla-foundation/common_voice_13_0
+- falabrasil/Audio_Corpora-Bases_de_áudio
+- lucasgris/wav2vec4bp
+- Edresson/TTS-Portuguese-Corpus
+- voxforge/voxforge-pt-dataset
+- programadorartificial/custom_dataset
+language:
+- pt
+metrics:
+- wer
+- cer
+pipeline_tag: automatic-speech-recognition
+tags:
+- Wav2Vec2
+- speech-to-text
 ---
+# Wav2Vec 2.0 - Brazilian Portuguese
+This model is a fine-tuned of [facebook/wav2vec2-large-xlsr-53](https://huggingface.co/facebook/wav2vec2-large-xlsr-53-portuguese) model with the following datasets:
+- [Common Voice 13.0](https://commonvoice.mozilla.org/pt/datasets)
+- [FalaBrasil](https://github.com/falabrasil/gitlab-resources)
+- [Multilingual Librispeech (MLS) Portuguese](http://www.openslr.org/94/)
+- [TTS-Portuguese-Corpus](https://github.com/Edresson/TTS-Portuguese-Corpus)
+- [VoxForge](https://www.voxforge.org/pt/Downloads)
+- Custom_dataset - With me talking - Not available
+All datasets were pre-processed and cleaned (trying to keep only brazilian speakers), not original training, testing and validating files wer not used. The files used to training, testing and validating are in the "dataset_files" folder.
+The model was fine-tuned using the [ProgramadorArificial/transformers](https://github.com/ProgramadorArtificial/transformers/tree/main) repository, more specific, the [speech-recognition](https://github.com/ProgramadorArtificial/transformers/tree/main/examples/pytorch/speech-recognition) folder.
+```python
+from transformers import AutoModelForCTC, Wav2Vec2Processor
+processor = Wav2Vec2Processor.from_pretrained('ProgramadorArtificial/wav2vec2-large-xlsr-53-portuguese')
+model = AutoModelForCTC.from_pretrained('ProgramadorArtificial/wav2vec2-large-xlsr-53-portuguese')
+```
+## Results test and validation dataset
+### Test
+| WER   | CER  |
+|-------|------|
+| 11.7% | 3.3% |
+| Prediction | Real                                                                            |
+| ------------ |---------------------------------------------------------------------------------|
+| ele é considerado por seus companheiros de tropa como um oficial moderado | ele é considerado por seus companheiros de tropa como um oficial moderado       |
+| os empréstimos do banco mundial exigem contrapartidas do governo beneficiados | os empréstimos do banco mundial exigem contrapartidas dos governos beneficiados |
+| mwendel queiroz rodrigues | wendell queiroz rodrgues                                                        |
+| virmontes | virmond                                                                         |
+| conversões pelo dólar turismo a mil seiscentos e oitenta reais | conversões pelo dólar turismo a mil seiscentos e oitenta reais                  |
+| o grupo de moda são paulo promove o seu primeiro encontro | o grupo de moda são paulo promove o seu primeiro encontro                       |
+| abandonou a frança e se fixou em são paulo | abandonou a frança e se fixou em são paulo                                      |
+| o avanço da tecnologia fez esta divisão perder o sentido	| o avanço da tecnologia fez esta divisão perder o sentido                        |
+| reservadamente confessa não entender o comportamento do presidente | reservadamente confessa não entender o comportamento do presidente              |
+| foi definido o campeonato estadual que começa no dia trinta | foi definido o campeonato estadual que começa no dia trinta                     |
+### Validation
+| WER  | CER  |
+|------|------|
+| 9.5% | 2.6% |
+| Prediction  | Real |
+| ------------- | ------------- |
+| pontex gestal | pontes gestal |
+| o cruzeiro real continua valendo até o dia quinze de julho | o cruzeiro real continua valendo até o dia quinze de julho |
+| o espaço fica portanto vago e disponível para o traficante | o espaço fica portanto vago e disponível para o traficante |
+| os botões estão empilhados | os botões estão empilhados |
+| as chances que apareciam eram perdidas pelos atacantes cruzeirenses | as chances que apareciam eram perdidas pelos atacantes cruzeirenses |
+| possibilitar que a população se sinta identificada com o estado | possibilitar que a população se sinta identificada com o estado |
+| os detentos serão transferidos das delegacias que estiverem lotadas | os detentos serão transferidos das delegacias que estiverem lotadas |
+| a euforia pela pista menos quente causou três incidentes | a euforia pela pista menos quente causou três incidentes |
+| almeida é presidente da liga independente das escolas de samba | almeida é presidente da liga independente das escolas de samba |
+| os modos de seu pensamento as cendências de seu espírito e até as menores particularidades de sua vida é nessa fonte que deve beber o poeta brasileiro é dela que há de sair o verdadeiro poema nacional tal como eu o imagino | os modos de seu pensamento as tendências de seu espírito e até as menores particularidades de sua vida é nessa fonte que deve beber o poeta brasileiro é dela que há de sair o verdadeiro poema nacional tal como eu o imagino |
+## Autor
+* **Programador Artificial** - [GitHub](https://github.com/ProgramadorArtificial) - [YouTube](https://www.youtube.com/@ProgramadorArtificial)

added_tokens.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "</s>": 45,
+  "<s>": 44
+}

config.json ADDED Viewed

	@@ -0,0 +1,108 @@

+{
+  "_name_or_path": "custom/checkpoint-104000",
+  "activation_dropout": 0.0,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 256,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.0,
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 43,
+  "proj_codevector_dim": 256,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.30.0.dev0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 46,
+  "xvector_output_dim": 512
+}

dataset_files/dataset.tsv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8ced2405fc049e21b29a24484b6317a63d55e3709490ab9ea1df4145c9ff578b
+size 33440132

dataset_files/dataset_cleaned.tsv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:828dbc62ffc0e32fd09aa7926ea4d4eb805c4f438d5729ad7b08fa0cf03bc6b8
+size 31300268

dataset_files/test.tsv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ca42464ec3e3bcd7bf51cbe6b8fe834c77ab5a9236b1af51e55dfb1cff01b563
+size 445

dataset_files/train.tsv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a0a2427b6fb32a3bf7a2c74e7cf98951e86d0f2b5b9b0e0540d9d74eec084dd5
+size 1285

dataset_files/validation.tsv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1bf6cbed6c4e9947339bfb9bebc640b2c0b0180625447a9f678ffb185bd235bc
+size 2188

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4aa636f620c8dd46721b3a99b6561b4ada26b1c64d2e89bab17ce5fcdf959775
+size 2490436753

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "processor_class": "Wav2Vec2Processor",
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a3d9fecee01d7d2b5050639bd58353751e33104c619793074b1ed8453cb2ca43
+size 1262087281

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:534e88bd04308ed9aacb122000aa304ac595e155cb0d03c71ba95a72f5769169
+size 14567

scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a4010334f7673bc3387cdfd0405ab9d54c121c6f2e12704099272671a8cda3e8
+size 559

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b630229639be0b098ad69aff739d3f984087b2119369f3c006bc079ffec83cd1
+size 623

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,120 @@

+{
+  "additional_special_tokens": [
+    {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    }
+  ],
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "[PAD]",
+  "unk_token": "[UNK]"
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "processor_class": "Wav2Vec2Processor",
+  "replace_word_delimiter_char": " ",
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "unk_token": "[UNK]",
+  "word_delimiter_token": "|"
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,2510 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 8.05017317232987,
+  "global_step": 172000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0002958,
+      "loss": 3.155,
+      "step": 500
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 0.0002999769241570842,
+      "loss": 0.338,
+      "step": 1000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 0.00029995352066528323,
+      "loss": 0.327,
+      "step": 1500
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 0.00029993011717348224,
+      "loss": 0.3225,
+      "step": 2000
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 0.00029990671368168126,
+      "loss": 0.3079,
+      "step": 2500
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 0.00029988331018988027,
+      "loss": 0.3309,
+      "step": 3000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 0.00029985990669807933,
+      "loss": 0.2943,
+      "step": 3500
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 0.00029983650320627834,
+      "loss": 0.2795,
+      "step": 4000
+    },
+    {
+      "epoch": 0.19,
+      "eval_cer": 0.05897733717227239,
+      "eval_loss": 0.22565825283527374,
+      "eval_runtime": 1455.9056,
+      "eval_samples_per_second": 13.045,
+      "eval_steps_per_second": 3.262,
+      "eval_wer": 0.20478772194834444,
+      "step": 4000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 0.0002998130997144774,
+      "loss": 0.2896,
+      "step": 4500
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 0.0002997896962226764,
+      "loss": 0.2735,
+      "step": 5000
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 0.00029976629273087543,
+      "loss": 0.281,
+      "step": 5500
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 0.00029974288923907444,
+      "loss": 0.2755,
+      "step": 6000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.00029971948574727345,
+      "loss": 0.2831,
+      "step": 6500
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 0.0002996961290624561,
+      "loss": 0.2708,
+      "step": 7000
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 0.0002996727255706551,
+      "loss": 0.2667,
+      "step": 7500
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 0.0002996493220788541,
+      "loss": 0.2582,
+      "step": 8000
+    },
+    {
+      "epoch": 0.37,
+      "eval_cer": 0.05252843759542817,
+      "eval_loss": 0.20639470219612122,
+      "eval_runtime": 1350.2359,
+      "eval_samples_per_second": 14.066,
+      "eval_steps_per_second": 3.517,
+      "eval_wer": 0.18800766597579208,
+      "step": 8000
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 0.0002996259185870532,
+      "loss": 0.2874,
+      "step": 8500
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 0.0002996025150952522,
+      "loss": 0.2585,
+      "step": 9000
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 0.0002995791116034512,
+      "loss": 0.2579,
+      "step": 9500
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 0.0002995557081116502,
+      "loss": 0.2664,
+      "step": 10000
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 0.00029953230461984923,
+      "loss": 0.2702,
+      "step": 10500
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00029950890112804824,
+      "loss": 0.2487,
+      "step": 11000
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 0.0002994854976362473,
+      "loss": 0.2501,
+      "step": 11500
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0002994620941444463,
+      "loss": 0.2485,
+      "step": 12000
+    },
+    {
+      "epoch": 0.56,
+      "eval_cer": 0.04427867207608079,
+      "eval_loss": 0.16677920520305634,
+      "eval_runtime": 1348.5895,
+      "eval_samples_per_second": 14.084,
+      "eval_steps_per_second": 3.521,
+      "eval_wer": 0.15644211290530335,
+      "step": 12000
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 0.0002994386906526454,
+      "loss": 0.2546,
+      "step": 12500
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.000299415333967828,
+      "loss": 0.2376,
+      "step": 13000
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 0.000299391930476027,
+      "loss": 0.2451,
+      "step": 13500
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 0.000299368526984226,
+      "loss": 0.2436,
+      "step": 14000
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 0.000299345123492425,
+      "loss": 0.2405,
+      "step": 14500
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 0.0002993217200006241,
+      "loss": 0.2447,
+      "step": 15000
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 0.0002992983165088231,
+      "loss": 0.2415,
+      "step": 15500
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 0.0002992749130170221,
+      "loss": 0.2379,
+      "step": 16000
+    },
+    {
+      "epoch": 0.75,
+      "eval_cer": 0.04885581621079265,
+      "eval_loss": 0.1717624068260193,
+      "eval_runtime": 1346.3358,
+      "eval_samples_per_second": 14.107,
+      "eval_steps_per_second": 3.527,
+      "eval_wer": 0.17038060554963563,
+      "step": 16000
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 0.00029925150952522117,
+      "loss": 0.2462,
+      "step": 16500
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 0.0002992281060334202,
+      "loss": 0.2305,
+      "step": 17000
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 0.0002992047025416192,
+      "loss": 0.2333,
+      "step": 17500
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 0.0002991812990498182,
+      "loss": 0.2243,
+      "step": 18000
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 0.00029915794236500085,
+      "loss": 0.2182,
+      "step": 18500
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 0.00029913453887319986,
+      "loss": 0.2347,
+      "step": 19000
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.00029911113538139887,
+      "loss": 0.2178,
+      "step": 19500
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 0.00029908773188959794,
+      "loss": 0.2313,
+      "step": 20000
+    },
+    {
+      "epoch": 0.94,
+      "eval_cer": 0.04552196483880818,
+      "eval_loss": 0.166758194565773,
+      "eval_runtime": 1346.4361,
+      "eval_samples_per_second": 14.106,
+      "eval_steps_per_second": 3.527,
+      "eval_wer": 0.1609425559237618,
+      "step": 20000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.00029906432839779695,
+      "loss": 0.2118,
+      "step": 20500
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 0.00029904092490599596,
+      "loss": 0.2437,
+      "step": 21000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 0.00029901752141419497,
+      "loss": 0.2139,
+      "step": 21500
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 0.00029899416472937756,
+      "loss": 0.2157,
+      "step": 22000
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 0.00029897076123757663,
+      "loss": 0.211,
+      "step": 22500
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 0.00029894735774577564,
+      "loss": 0.2121,
+      "step": 23000
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 0.00029892395425397465,
+      "loss": 0.2066,
+      "step": 23500
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 0.0002989005507621737,
+      "loss": 0.2047,
+      "step": 24000
+    },
+    {
+      "epoch": 1.12,
+      "eval_cer": 0.04369247044453169,
+      "eval_loss": 0.15543465316295624,
+      "eval_runtime": 1348.2816,
+      "eval_samples_per_second": 14.087,
+      "eval_steps_per_second": 3.522,
+      "eval_wer": 0.14927965588980355,
+      "step": 24000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 0.00029887714727037273,
+      "loss": 0.2077,
+      "step": 24500
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 0.00029885374377857174,
+      "loss": 0.201,
+      "step": 25000
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 0.00029883034028677075,
+      "loss": 0.207,
+      "step": 25500
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 0.00029880693679496976,
+      "loss": 0.1931,
+      "step": 26000
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 0.0002987835801101524,
+      "loss": 0.2115,
+      "step": 26500
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 0.0002987601766183514,
+      "loss": 0.2226,
+      "step": 27000
+    },
+    {
+      "epoch": 1.29,
+      "learning_rate": 0.0002987367731265505,
+      "loss": 0.2106,
+      "step": 27500
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 0.0002987133696347495,
+      "loss": 0.2055,
+      "step": 28000
+    },
+    {
+      "epoch": 1.31,
+      "eval_cer": 0.049039174628102776,
+      "eval_loss": 0.16633369028568268,
+      "eval_runtime": 1346.0932,
+      "eval_samples_per_second": 14.11,
+      "eval_steps_per_second": 3.528,
+      "eval_wer": 0.16584113006787746,
+      "step": 28000
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 0.0002986900129499321,
+      "loss": 0.2178,
+      "step": 28500
+    },
+    {
+      "epoch": 1.36,
+      "learning_rate": 0.0002986666094581311,
+      "loss": 0.2125,
+      "step": 29000
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 0.0002986432059663301,
+      "loss": 0.2029,
+      "step": 29500
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 0.0002986198024745292,
+      "loss": 0.2104,
+      "step": 30000
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 0.0002985963989827282,
+      "loss": 0.2034,
+      "step": 30500
+    },
+    {
+      "epoch": 1.45,
+      "learning_rate": 0.00029857304229791084,
+      "loss": 0.2116,
+      "step": 31000
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 0.00029854963880610985,
+      "loss": 0.2059,
+      "step": 31500
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 0.00029852623531430886,
+      "loss": 0.205,
+      "step": 32000
+    },
+    {
+      "epoch": 1.5,
+      "eval_cer": 0.04317034201457052,
+      "eval_loss": 0.14783667027950287,
+      "eval_runtime": 1347.0872,
+      "eval_samples_per_second": 14.099,
+      "eval_steps_per_second": 3.525,
+      "eval_wer": 0.15488081437331427,
+      "step": 32000
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 0.00029850283182250787,
+      "loss": 0.2225,
+      "step": 32500
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 0.0002984794751376905,
+      "loss": 0.2011,
+      "step": 33000
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 0.00029845607164588953,
+      "loss": 0.2011,
+      "step": 33500
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 0.0002984327149610722,
+      "loss": 0.1957,
+      "step": 34000
+    },
+    {
+      "epoch": 1.61,
+      "learning_rate": 0.0002984093114692712,
+      "loss": 0.2044,
+      "step": 34500
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 0.00029838590797747025,
+      "loss": 0.2011,
+      "step": 35000
+    },
+    {
+      "epoch": 1.66,
+      "learning_rate": 0.00029836250448566926,
+      "loss": 0.2046,
+      "step": 35500
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 0.0002983391009938683,
+      "loss": 0.2017,
+      "step": 36000
+    },
+    {
+      "epoch": 1.68,
+      "eval_cer": 0.04304628539021943,
+      "eval_loss": 0.14913983643054962,
+      "eval_runtime": 1406.2309,
+      "eval_samples_per_second": 13.506,
+      "eval_steps_per_second": 3.377,
+      "eval_wer": 0.1499119817952591,
+      "step": 36000
+    },
+    {
+      "epoch": 1.71,
+      "learning_rate": 0.0002983156975020673,
+      "loss": 0.2028,
+      "step": 36500
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 0.0002982922940102663,
+      "loss": 0.1991,
+      "step": 37000
+    },
+    {
+      "epoch": 1.76,
+      "learning_rate": 0.0002982688905184653,
+      "loss": 0.2145,
+      "step": 37500
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 0.00029824553383364796,
+      "loss": 0.2043,
+      "step": 38000
+    },
+    {
+      "epoch": 1.8,
+      "learning_rate": 0.00029822213034184697,
+      "loss": 0.194,
+      "step": 38500
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 0.00029819872685004603,
+      "loss": 0.2006,
+      "step": 39000
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 0.00029817532335824504,
+      "loss": 0.2095,
+      "step": 39500
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 0.00029815196667342764,
+      "loss": 0.1975,
+      "step": 40000
+    },
+    {
+      "epoch": 1.87,
+      "eval_cer": 0.0433755125856127,
+      "eval_loss": 0.14519542455673218,
+      "eval_runtime": 1370.9335,
+      "eval_samples_per_second": 13.854,
+      "eval_steps_per_second": 3.464,
+      "eval_wer": 0.14985343310030952,
+      "step": 40000
+    },
+    {
+      "epoch": 1.9,
+      "learning_rate": 0.00029812856318162665,
+      "loss": 0.2033,
+      "step": 40500
+    },
+    {
+      "epoch": 1.92,
+      "learning_rate": 0.0002981051596898257,
+      "loss": 0.1975,
+      "step": 41000
+    },
+    {
+      "epoch": 1.94,
+      "learning_rate": 0.0002980817561980247,
+      "loss": 0.1945,
+      "step": 41500
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 0.00029805835270622374,
+      "loss": 0.1939,
+      "step": 42000
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 0.0002980349492144228,
+      "loss": 0.2073,
+      "step": 42500
+    },
+    {
+      "epoch": 2.01,
+      "learning_rate": 0.0002980115925296054,
+      "loss": 0.193,
+      "step": 43000
+    },
+    {
+      "epoch": 2.04,
+      "learning_rate": 0.0002979881890378044,
+      "loss": 0.1895,
+      "step": 43500
+    },
+    {
+      "epoch": 2.06,
+      "learning_rate": 0.002979647855460034,
+      "loss": 0.1882,
+      "step": 44000
+    },
+    {
+      "epoch": 2.06,
+      "eval_cer": 0.04118611765475723,
+      "eval_loss": 0.1441776603460312,
+      "eval_runtime": 1437.09,
+      "eval_samples_per_second": 13.216,
+      "eval_steps_per_second": 3.305,
+      "eval_wer": 0.14381901427417182,
+      "step": 44000
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 0.00029794138205420243,
+      "loss": 0.1814,
+      "step": 44500
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 0.0002979179785624015,
+      "loss": 0.1857,
+      "step": 45000
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 0.0002978945750706005,
+      "loss": 0.193,
+      "step": 45500
+    },
+    {
+      "epoch": 2.15,
+      "learning_rate": 0.0002978711715787995,
+      "loss": 0.1835,
+      "step": 46000
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 0.0002978477680869986,
+      "loss": 0.171,
+      "step": 46500
+    },
+    {
+      "epoch": 2.2,
+      "learning_rate": 0.0002978243645951976,
+      "loss": 0.1777,
+      "step": 47000
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 0.0002978010079103802,
+      "loss": 0.1701,
+      "step": 47500
+    },
+    {
+      "epoch": 2.25,
+      "learning_rate": 0.0002977776044185792,
+      "loss": 0.1821,
+      "step": 48000
+    },
+    {
+      "epoch": 2.25,
+      "eval_cer": 0.04377358439122279,
+      "eval_loss": 0.14771120250225067,
+      "eval_runtime": 1168.4306,
+      "eval_samples_per_second": 16.255,
+      "eval_steps_per_second": 4.064,
+      "eval_wer": 0.1521368322033435,
+      "step": 48000
+    },
+    {
+      "epoch": 2.27,
+      "learning_rate": 0.00029775420092677826,
+      "loss": 0.1878,
+      "step": 48500
+    },
+    {
+      "epoch": 2.29,
+      "learning_rate": 0.0002977307974349773,
+      "loss": 0.1848,
+      "step": 49000
+    },
+    {
+      "epoch": 2.32,
+      "learning_rate": 0.0002977073939431763,
+      "loss": 0.1837,
+      "step": 49500
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 0.00029768403725835893,
+      "loss": 0.1736,
+      "step": 50000
+    },
+    {
+      "epoch": 2.36,
+      "learning_rate": 0.00029766063376655794,
+      "loss": 0.1805,
+      "step": 50500
+    },
+    {
+      "epoch": 2.39,
+      "learning_rate": 0.00029763723027475696,
+      "loss": 0.1795,
+      "step": 51000
+    },
+    {
+      "epoch": 2.41,
+      "learning_rate": 0.00029761382678295597,
+      "loss": 0.1752,
+      "step": 51500
+    },
+    {
+      "epoch": 2.43,
+      "learning_rate": 0.000297590423291155,
+      "loss": 0.1848,
+      "step": 52000
+    },
+    {
+      "epoch": 2.43,
+      "eval_cer": 0.04313966867338481,
+      "eval_loss": 0.13986873626708984,
+      "eval_runtime": 1079.4763,
+      "eval_samples_per_second": 17.595,
+      "eval_steps_per_second": 4.399,
+      "eval_wer": 0.14816332743943136,
+      "step": 52000
+    },
+    {
+      "epoch": 2.46,
+      "learning_rate": 0.0002975670666063376,
+      "loss": 0.1873,
+      "step": 52500
+    },
+    {
+      "epoch": 2.48,
+      "learning_rate": 0.0002975436631145367,
+      "loss": 0.1848,
+      "step": 53000
+    },
+    {
+      "epoch": 2.5,
+      "learning_rate": 0.0002975202596227357,
+      "loss": 0.1953,
+      "step": 53500
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 0.0002974968561309347,
+      "loss": 0.1779,
+      "step": 54000
+    },
+    {
+      "epoch": 2.55,
+      "learning_rate": 0.0002974734526391337,
+      "loss": 0.1861,
+      "step": 54500
+    },
+    {
+      "epoch": 2.57,
+      "learning_rate": 0.00029745004914733274,
+      "loss": 0.1784,
+      "step": 55000
+    },
+    {
+      "epoch": 2.6,
+      "learning_rate": 0.0002974266924625154,
+      "loss": 0.1902,
+      "step": 55500
+    },
+    {
+      "epoch": 2.62,
+      "learning_rate": 0.0002974032889707144,
+      "loss": 0.1852,
+      "step": 56000
+    },
+    {
+      "epoch": 2.62,
+      "eval_cer": 0.041413782009335605,
+      "eval_loss": 0.14103934168815613,
+      "eval_runtime": 1043.4328,
+      "eval_samples_per_second": 18.202,
+      "eval_steps_per_second": 4.551,
+      "eval_wer": 0.1456340238176091,
+      "step": 56000
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 0.0002973798854789134,
+      "loss": 0.1758,
+      "step": 56500
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 0.00029735648198711247,
+      "loss": 0.1799,
+      "step": 57000
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 0.00029733312530229506,
+      "loss": 0.177,
+      "step": 57500
+    },
+    {
+      "epoch": 2.71,
+      "learning_rate": 0.00029730972181049413,
+      "loss": 0.176,
+      "step": 58000
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 0.00029728631831869314,
+      "loss": 0.1852,
+      "step": 58500
+    },
+    {
+      "epoch": 2.76,
+      "learning_rate": 0.00029726296163387573,
+      "loss": 0.1813,
+      "step": 59000
+    },
+    {
+      "epoch": 2.78,
+      "learning_rate": 0.00029723955814207474,
+      "loss": 0.1879,
+      "step": 59500
+    },
+    {
+      "epoch": 2.81,
+      "learning_rate": 0.0002972161546502738,
+      "loss": 0.173,
+      "step": 60000
+    },
+    {
+      "epoch": 2.81,
+      "eval_cer": 0.039124869127077605,
+      "eval_loss": 0.13692142069339752,
+      "eval_runtime": 1043.8955,
+      "eval_samples_per_second": 18.194,
+      "eval_steps_per_second": 4.549,
+      "eval_wer": 0.13655507285409274,
+      "step": 60000
+    },
+    {
+      "epoch": 2.83,
+      "learning_rate": 0.0002971927511584728,
+      "loss": 0.17,
+      "step": 60500
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 0.00029716934766667183,
+      "loss": 0.1885,
+      "step": 61000
+    },
+    {
+      "epoch": 2.88,
+      "learning_rate": 0.0002971459441748709,
+      "loss": 0.1885,
+      "step": 61500
+    },
+    {
+      "epoch": 2.9,
+      "learning_rate": 0.0002971225874900535,
+      "loss": 0.1775,
+      "step": 62000
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 0.0002970991839982525,
+      "loss": 0.184,
+      "step": 62500
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 0.0002970757805064515,
+      "loss": 0.1865,
+      "step": 63000
+    },
+    {
+      "epoch": 2.97,
+      "learning_rate": 0.0002970523770146505,
+      "loss": 0.177,
+      "step": 63500
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 0.0002970289735228496,
+      "loss": 0.1766,
+      "step": 64000
+    },
+    {
+      "epoch": 3.0,
+      "eval_cer": 0.043919453169305935,
+      "eval_loss": 0.14147880673408508,
+      "eval_runtime": 1043.0346,
+      "eval_samples_per_second": 18.209,
+      "eval_steps_per_second": 4.553,
+      "eval_wer": 0.14889323450313627,
+      "step": 64000
+    },
+    {
+      "epoch": 3.02,
+      "learning_rate": 0.0002970055700310486,
+      "loss": 0.1751,
+      "step": 64500
+    },
+    {
+      "epoch": 3.04,
+      "learning_rate": 0.00029698216653924767,
+      "loss": 0.16,
+      "step": 65000
+    },
+    {
+      "epoch": 3.07,
+      "learning_rate": 0.0002969587630474467,
+      "loss": 0.1654,
+      "step": 65500
+    },
+    {
+      "epoch": 3.09,
+      "learning_rate": 0.00029693540636262927,
+      "loss": 0.169,
+      "step": 66000
+    },
+    {
+      "epoch": 3.11,
+      "learning_rate": 0.0002969120028708283,
+      "loss": 0.1668,
+      "step": 66500
+    },
+    {
+      "epoch": 3.14,
+      "learning_rate": 0.0002968885993790273,
+      "loss": 0.1555,
+      "step": 67000
+    },
+    {
+      "epoch": 3.16,
+      "learning_rate": 0.00029686519588722636,
+      "loss": 0.1643,
+      "step": 67500
+    },
+    {
+      "epoch": 3.18,
+      "learning_rate": 0.00029684179239542537,
+      "loss": 0.1651,
+      "step": 68000
+    },
+    {
+      "epoch": 3.18,
+      "eval_cer": 0.04225832133664878,
+      "eval_loss": 0.14033427834510803,
+      "eval_runtime": 1043.9782,
+      "eval_samples_per_second": 18.193,
+      "eval_steps_per_second": 4.549,
+      "eval_wer": 0.1446074700328263,
+      "step": 68000
+    },
+    {
+      "epoch": 3.21,
+      "learning_rate": 0.0002968183889036244,
+      "loss": 0.181,
+      "step": 68500
+    },
+    {
+      "epoch": 3.23,
+      "learning_rate": 0.00029679507902579067,
+      "loss": 0.1691,
+      "step": 69000
+    },
+    {
+      "epoch": 3.25,
+      "learning_rate": 0.0002967716755339897,
+      "loss": 0.159,
+      "step": 69500
+    },
+    {
+      "epoch": 3.28,
+      "learning_rate": 0.0002967482720421887,
+      "loss": 0.171,
+      "step": 70000
+    },
+    {
+      "epoch": 3.3,
+      "learning_rate": 0.0002967248685503877,
+      "loss": 0.1529,
+      "step": 70500
+    },
+    {
+      "epoch": 3.32,
+      "learning_rate": 0.0002967014650585867,
+      "loss": 0.1714,
+      "step": 71000
+    },
+    {
+      "epoch": 3.35,
+      "learning_rate": 0.0002966780615667857,
+      "loss": 0.1646,
+      "step": 71500
+    },
+    {
+      "epoch": 3.37,
+      "learning_rate": 0.0002966546580749848,
+      "loss": 0.1648,
+      "step": 72000
+    },
+    {
+      "epoch": 3.37,
+      "eval_cer": 0.04023797059721677,
+      "eval_loss": 0.13524918258190155,
+      "eval_runtime": 1043.0033,
+      "eval_samples_per_second": 18.21,
+      "eval_steps_per_second": 4.553,
+      "eval_wer": 0.1384325343388096,
+      "step": 72000
+    },
+    {
+      "epoch": 3.39,
+      "learning_rate": 0.0002966312545831838,
+      "loss": 0.1855,
+      "step": 72500
+    },
+    {
+      "epoch": 3.42,
+      "learning_rate": 0.00029660789789836645,
+      "loss": 0.173,
+      "step": 73000
+    },
+    {
+      "epoch": 3.44,
+      "learning_rate": 0.00029658449440656546,
+      "loss": 0.1811,
+      "step": 73500
+    },
+    {
+      "epoch": 3.46,
+      "learning_rate": 0.00029656109091476447,
+      "loss": 0.1772,
+      "step": 74000
+    },
+    {
+      "epoch": 3.49,
+      "learning_rate": 0.0002965376874229635,
+      "loss": 0.1683,
+      "step": 74500
+    },
+    {
+      "epoch": 3.51,
+      "learning_rate": 0.0002965142839311625,
+      "loss": 0.1689,
+      "step": 75000
+    },
+    {
+      "epoch": 3.53,
+      "learning_rate": 0.0002964908804393615,
+      "loss": 0.1541,
+      "step": 75500
+    },
+    {
+      "epoch": 3.56,
+      "learning_rate": 0.0002964675705615278,
+      "loss": 0.1541,
+      "step": 76000
+    },
+    {
+      "epoch": 3.56,
+      "eval_cer": 0.0414948959560267,
+      "eval_loss": 0.13895024359226227,
+      "eval_runtime": 1042.4783,
+      "eval_samples_per_second": 18.219,
+      "eval_steps_per_second": 4.555,
+      "eval_wer": 0.1431398494127566,
+      "step": 76000
+    },
+    {
+      "epoch": 3.58,
+      "learning_rate": 0.0002964441670697268,
+      "loss": 0.1739,
+      "step": 76500
+    },
+    {
+      "epoch": 3.6,
+      "learning_rate": 0.0002964207635779258,
+      "loss": 0.1671,
+      "step": 77000
+    },
+    {
+      "epoch": 3.63,
+      "learning_rate": 0.0002963973600861248,
+      "loss": 0.168,
+      "step": 77500
+    },
+    {
+      "epoch": 3.65,
+      "learning_rate": 0.00029637395659432383,
+      "loss": 0.1611,
+      "step": 78000
+    },
+    {
+      "epoch": 3.67,
+      "learning_rate": 0.00029635055310252284,
+      "loss": 0.1654,
+      "step": 78500
+    },
+    {
+      "epoch": 3.7,
+      "learning_rate": 0.0002963271964177055,
+      "loss": 0.1714,
+      "step": 79000
+    },
+    {
+      "epoch": 3.72,
+      "learning_rate": 0.0002963037929259045,
+      "loss": 0.1735,
+      "step": 79500
+    },
+    {
+      "epoch": 3.74,
+      "learning_rate": 0.00029628038943410357,
+      "loss": 0.1634,
+      "step": 80000
+    },
+    {
+      "epoch": 3.74,
+      "eval_cer": 0.04235443113903067,
+      "eval_loss": 0.1428999900817871,
+      "eval_runtime": 1074.2691,
+      "eval_samples_per_second": 17.68,
+      "eval_steps_per_second": 4.421,
+      "eval_wer": 0.1467074165583516,
+      "step": 80000
+    },
+    {
+      "epoch": 3.77,
+      "learning_rate": 0.0002962569859423026,
+      "loss": 0.163,
+      "step": 80500
+    },
+    {
+      "epoch": 3.79,
+      "learning_rate": 0.00029623362925748517,
+      "loss": 0.1672,
+      "step": 81000
+    },
+    {
+      "epoch": 3.81,
+      "learning_rate": 0.0002962102257656842,
+      "loss": 0.1651,
+      "step": 81500
+    },
+    {
+      "epoch": 3.84,
+      "learning_rate": 0.00029618682227388325,
+      "loss": 0.1653,
+      "step": 82000
+    },
+    {
+      "epoch": 3.86,
+      "learning_rate": 0.00029616341878208226,
+      "loss": 0.163,
+      "step": 82500
+    },
+    {
+      "epoch": 3.88,
+      "learning_rate": 0.00029614001529028127,
+      "loss": 0.1681,
+      "step": 83000
+    },
+    {
+      "epoch": 3.91,
+      "learning_rate": 0.00029611661179848033,
+      "loss": 0.1608,
+      "step": 83500
+    },
+    {
+      "epoch": 3.93,
+      "learning_rate": 0.00029609325511366293,
+      "loss": 0.1649,
+      "step": 84000
+    },
+    {
+      "epoch": 3.93,
+      "eval_cer": 0.03920121166513982,
+      "eval_loss": 0.13187673687934875,
+      "eval_runtime": 1043.8537,
+      "eval_samples_per_second": 18.195,
+      "eval_steps_per_second": 4.549,
+      "eval_wer": 0.13773775649207445,
+      "step": 84000
+    },
+    {
+      "epoch": 3.95,
+      "learning_rate": 0.00029606985162186194,
+      "loss": 0.1629,
+      "step": 84500
+    },
+    {
+      "epoch": 3.98,
+      "learning_rate": 0.00029604644813006095,
+      "loss": 0.1671,
+      "step": 85000
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 0.00029602304463825996,
+      "loss": 0.1693,
+      "step": 85500
+    },
+    {
+      "epoch": 4.03,
+      "learning_rate": 0.000295999641146459,
+      "loss": 0.1524,
+      "step": 86000
+    },
+    {
+      "epoch": 4.05,
+      "learning_rate": 0.0002959762844616417,
+      "loss": 0.1639,
+      "step": 86500
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 0.0002959528809698407,
+      "loss": 0.1633,
+      "step": 87000
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 0.0002959294774780397,
+      "loss": 0.1557,
+      "step": 87500
+    },
+    {
+      "epoch": 4.12,
+      "learning_rate": 0.0002959060739862387,
+      "loss": 0.1571,
+      "step": 88000
+    },
+    {
+      "epoch": 4.12,
+      "eval_cer": 0.039078518300396985,
+      "eval_loss": 0.1323617696762085,
+      "eval_runtime": 1041.314,
+      "eval_samples_per_second": 18.239,
+      "eval_steps_per_second": 4.561,
+      "eval_wer": 0.13669168647564178,
+      "step": 88000
+    },
+    {
+      "epoch": 4.14,
+      "learning_rate": 0.0002958826704944377,
+      "loss": 0.1626,
+      "step": 88500
+    },
+    {
+      "epoch": 4.17,
+      "learning_rate": 0.00029585926700263673,
+      "loss": 0.1515,
+      "step": 89000
+    },
+    {
+      "epoch": 4.19,
+      "learning_rate": 0.0002958358635108358,
+      "loss": 0.1445,
+      "step": 89500
+    },
+    {
+      "epoch": 4.21,
+      "learning_rate": 0.0002958124600190348,
+      "loss": 0.1554,
+      "step": 90000
+    },
+    {
+      "epoch": 4.24,
+      "learning_rate": 0.00029578910333421745,
+      "loss": 0.1559,
+      "step": 90500
+    },
+    {
+      "epoch": 4.26,
+      "learning_rate": 0.00029576574664940005,
+      "loss": 0.1716,
+      "step": 91000
+    },
+    {
+      "epoch": 4.28,
+      "learning_rate": 0.0002957423431575991,
+      "loss": 0.1524,
+      "step": 91500
+    },
+    {
+      "epoch": 4.31,
+      "learning_rate": 0.0002957189396657981,
+      "loss": 0.1483,
+      "step": 92000
+    },
+    {
+      "epoch": 4.31,
+      "eval_cer": 0.03799609017144353,
+      "eval_loss": 0.12687690556049347,
+      "eval_runtime": 1041.0565,
+      "eval_samples_per_second": 18.244,
+      "eval_steps_per_second": 4.562,
+      "eval_wer": 0.13329195892223564,
+      "step": 92000
+    },
+    {
+      "epoch": 4.33,
+      "learning_rate": 0.00029569553617399714,
+      "loss": 0.1623,
+      "step": 92500
+    },
+    {
+      "epoch": 4.35,
+      "learning_rate": 0.00029567213268219615,
+      "loss": 0.1499,
+      "step": 93000
+    },
+    {
+      "epoch": 4.38,
+      "learning_rate": 0.0002956487759973788,
+      "loss": 0.1474,
+      "step": 93500
+    },
+    {
+      "epoch": 4.4,
+      "learning_rate": 0.0002956253725055778,
+      "loss": 0.1519,
+      "step": 94000
+    },
+    {
+      "epoch": 4.42,
+      "learning_rate": 0.0002956019690137768,
+      "loss": 0.1567,
+      "step": 94500
+    },
+    {
+      "epoch": 4.45,
+      "learning_rate": 0.0002955785655219759,
+      "loss": 0.1596,
+      "step": 95000
+    },
+    {
+      "epoch": 4.47,
+      "learning_rate": 0.0002955551620301749,
+      "loss": 0.1524,
+      "step": 95500
+    },
+    {
+      "epoch": 4.49,
+      "learning_rate": 0.0002955317585383739,
+      "loss": 0.1483,
+      "step": 96000
+    },
+    {
+      "epoch": 4.49,
+      "eval_cer": 0.03884608253718972,
+      "eval_loss": 0.13216418027877808,
+      "eval_runtime": 1043.5586,
+      "eval_samples_per_second": 18.2,
+      "eval_steps_per_second": 4.551,
+      "eval_wer": 0.1352787113041917,
+      "step": 96000
+    },
+    {
+      "epoch": 4.52,
+      "learning_rate": 0.0002955084018535565,
+      "loss": 0.1509,
+      "step": 96500
+    },
+    {
+      "epoch": 4.54,
+      "learning_rate": 0.0002954849983617555,
+      "loss": 0.1553,
+      "step": 97000
+    },
+    {
+      "epoch": 4.56,
+      "learning_rate": 0.0002954615948699546,
+      "loss": 0.1576,
+      "step": 97500
+    },
+    {
+      "epoch": 4.59,
+      "learning_rate": 0.0002954381913781536,
+      "loss": 0.157,
+      "step": 98000
+    },
+    {
+      "epoch": 4.61,
+      "learning_rate": 0.00029541478788635265,
+      "loss": 0.1641,
+      "step": 98500
+    },
+    {
+      "epoch": 4.63,
+      "learning_rate": 0.00029539138439455166,
+      "loss": 0.1631,
+      "step": 99000
+    },
+    {
+      "epoch": 4.66,
+      "learning_rate": 0.0002953679809027507,
+      "loss": 0.1619,
+      "step": 99500
+    },
+    {
+      "epoch": 4.68,
+      "learning_rate": 0.0002953445774109497,
+      "loss": 0.1502,
+      "step": 100000
+    },
+    {
+      "epoch": 4.68,
+      "eval_cer": 0.038923106705056054,
+      "eval_loss": 0.12758338451385498,
+      "eval_runtime": 1042.7138,
+      "eval_samples_per_second": 18.215,
+      "eval_steps_per_second": 4.554,
+      "eval_wer": 0.13328415242957567,
+      "step": 100000
+    },
+    {
+      "epoch": 4.7,
+      "learning_rate": 0.0002953212207261323,
+      "loss": 0.1508,
+      "step": 100500
+    },
+    {
+      "epoch": 4.73,
+      "learning_rate": 0.00029529781723433134,
+      "loss": 0.1423,
+      "step": 101000
+    },
+    {
+      "epoch": 4.75,
+      "learning_rate": 0.00029527441374253035,
+      "loss": 0.1619,
+      "step": 101500
+    },
+    {
+      "epoch": 4.77,
+      "learning_rate": 0.00029525101025072937,
+      "loss": 0.1483,
+      "step": 102000
+    },
+    {
+      "epoch": 4.8,
+      "learning_rate": 0.000295227653565912,
+      "loss": 0.1716,
+      "step": 102500
+    },
+    {
+      "epoch": 4.82,
+      "learning_rate": 0.000295204250074111,
+      "loss": 0.1461,
+      "step": 103000
+    },
+    {
+      "epoch": 4.84,
+      "learning_rate": 0.00029518084658231004,
+      "loss": 0.1455,
+      "step": 103500
+    },
+    {
+      "epoch": 4.87,
+      "learning_rate": 0.00029515744309050905,
+      "loss": 0.1523,
+      "step": 104000
+    },
+    {
+      "epoch": 4.87,
+      "eval_cer": 0.03784408672512324,
+      "eval_loss": 0.1300228387117386,
+      "eval_runtime": 1048.2511,
+      "eval_samples_per_second": 18.119,
+      "eval_steps_per_second": 4.53,
+      "eval_wer": 0.12833483608317037,
+      "step": 104000
+    },
+    {
+      "epoch": 4.89,
+      "learning_rate": 0.0002951340395987081,
+      "loss": 0.1646,
+      "step": 104500
+    },
+    {
+      "epoch": 4.91,
+      "learning_rate": 0.0002951106361069071,
+      "loss": 0.1519,
+      "step": 105000
+    },
+    {
+      "epoch": 4.94,
+      "learning_rate": 0.00029508727942208977,
+      "loss": 0.1516,
+      "step": 105500
+    },
+    {
+      "epoch": 4.96,
+      "learning_rate": 0.0002950638759302888,
+      "loss": 0.1675,
+      "step": 106000
+    },
+    {
+      "epoch": 4.98,
+      "learning_rate": 0.0002950404724384878,
+      "loss": 0.1474,
+      "step": 106500
+    },
+    {
+      "epoch": 5.01,
+      "learning_rate": 0.0002950170689466868,
+      "loss": 0.151,
+      "step": 107000
+    },
+    {
+      "epoch": 5.03,
+      "learning_rate": 0.0002949936654548858,
+      "loss": 0.1419,
+      "step": 107500
+    },
+    {
+      "epoch": 5.05,
+      "learning_rate": 0.00029497030877006846,
+      "loss": 0.139,
+      "step": 108000
+    },
+    {
+      "epoch": 5.05,
+      "eval_cer": 0.03710792653666623,
+      "eval_loss": 0.1256220042705536,
+      "eval_runtime": 1098.0599,
+      "eval_samples_per_second": 17.297,
+      "eval_steps_per_second": 4.325,
+      "eval_wer": 0.12972048853031065,
+      "step": 108000
+    },
+    {
+      "epoch": 5.08,
+      "learning_rate": 0.0002949469052782675,
+      "loss": 0.137,
+      "step": 108500
+    },
+    {
+      "epoch": 5.1,
+      "learning_rate": 0.0002949235017864665,
+      "loss": 0.141,
+      "step": 109000
+    },
+    {
+      "epoch": 5.12,
+      "learning_rate": 0.00029490009829466555,
+      "loss": 0.1528,
+      "step": 109500
+    },
+    {
+      "epoch": 5.15,
+      "learning_rate": 0.0002948767416098482,
+      "loss": 0.1426,
+      "step": 110000
+    },
+    {
+      "epoch": 5.17,
+      "learning_rate": 0.0002948533381180472,
+      "loss": 0.1375,
+      "step": 110500
+    },
+    {
+      "epoch": 5.2,
+      "learning_rate": 0.0002948299346262462,
+      "loss": 0.1413,
+      "step": 111000
+    },
+    {
+      "epoch": 5.22,
+      "learning_rate": 0.00029480653113444523,
+      "loss": 0.1322,
+      "step": 111500
+    },
+    {
+      "epoch": 5.24,
+      "learning_rate": 0.00029478312764264424,
+      "loss": 0.1444,
+      "step": 112000
+    },
+    {
+      "epoch": 5.24,
+      "eval_cer": 0.03732468481437857,
+      "eval_loss": 0.12207575142383575,
+      "eval_runtime": 1054.5242,
+      "eval_samples_per_second": 18.011,
+      "eval_steps_per_second": 4.503,
+      "eval_wer": 0.1293418736363033,
+      "step": 112000
+    },
+    {
+      "epoch": 5.27,
+      "learning_rate": 0.00029475972415084325,
+      "loss": 0.1512,
+      "step": 112500
+    },
+    {
+      "epoch": 5.29,
+      "learning_rate": 0.0002947363206590423,
+      "loss": 0.1393,
+      "step": 113000
+    },
+    {
+      "epoch": 5.31,
+      "learning_rate": 0.00029471291716724133,
+      "loss": 0.1487,
+      "step": 113500
+    },
+    {
+      "epoch": 5.34,
+      "learning_rate": 0.00029468951367544034,
+      "loss": 0.1493,
+      "step": 114000
+    },
+    {
+      "epoch": 5.36,
+      "learning_rate": 0.0002946661101836394,
+      "loss": 0.151,
+      "step": 114500
+    },
+    {
+      "epoch": 5.38,
+      "learning_rate": 0.0002946427066918384,
+      "loss": 0.1329,
+      "step": 115000
+    },
+    {
+      "epoch": 5.41,
+      "learning_rate": 0.00029461930320003743,
+      "loss": 0.1492,
+      "step": 115500
+    },
+    {
+      "epoch": 5.43,
+      "learning_rate": 0.00029459589970823644,
+      "loss": 0.1411,
+      "step": 116000
+    },
+    {
+      "epoch": 5.43,
+      "eval_cer": 0.037894527330628626,
+      "eval_loss": 0.12310981005430222,
+      "eval_runtime": 1041.1085,
+      "eval_samples_per_second": 18.243,
+      "eval_steps_per_second": 4.561,
+      "eval_wer": 0.13332708813920538,
+      "step": 116000
+    },
+    {
+      "epoch": 5.45,
+      "learning_rate": 0.00029457258983040267,
+      "loss": 0.1431,
+      "step": 116500
+    },
+    {
+      "epoch": 5.48,
+      "learning_rate": 0.0002945491863386017,
+      "loss": 0.1405,
+      "step": 117000
+    },
+    {
+      "epoch": 5.5,
+      "learning_rate": 0.00029452578284680075,
+      "loss": 0.1388,
+      "step": 117500
+    },
+    {
+      "epoch": 5.52,
+      "learning_rate": 0.00029450237935499976,
+      "loss": 0.1478,
+      "step": 118000
+    },
+    {
+      "epoch": 5.55,
+      "learning_rate": 0.00029447897586319877,
+      "loss": 0.1532,
+      "step": 118500
+    },
+    {
+      "epoch": 5.57,
+      "learning_rate": 0.00029445561917838136,
+      "loss": 0.1456,
+      "step": 119000
+    },
+    {
+      "epoch": 5.59,
+      "learning_rate": 0.000294432262493564,
+      "loss": 0.1511,
+      "step": 119500
+    },
+    {
+      "epoch": 5.62,
+      "learning_rate": 0.000294408859001763,
+      "loss": 0.1457,
+      "step": 120000
+    },
+    {
+      "epoch": 5.62,
+      "eval_cer": 0.03661783470749902,
+      "eval_loss": 0.12026005238294601,
+      "eval_runtime": 1041.1064,
+      "eval_samples_per_second": 18.243,
+      "eval_steps_per_second": 4.561,
+      "eval_wer": 0.12665253691495218,
+      "step": 120000
+    },
+    {
+      "epoch": 5.64,
+      "learning_rate": 0.0002943854555099621,
+      "loss": 0.1425,
+      "step": 120500
+    },
+    {
+      "epoch": 5.66,
+      "learning_rate": 0.0002943620520181611,
+      "loss": 0.1468,
+      "step": 121000
+    },
+    {
+      "epoch": 5.69,
+      "learning_rate": 0.0002943386485263601,
+      "loss": 0.1438,
+      "step": 121500
+    },
+    {
+      "epoch": 5.71,
+      "learning_rate": 0.0002943152450345591,
+      "loss": 0.1495,
+      "step": 122000
+    },
+    {
+      "epoch": 5.73,
+      "learning_rate": 0.00029429184154275813,
+      "loss": 0.1407,
+      "step": 122500
+    },
+    {
+      "epoch": 5.76,
+      "learning_rate": 0.00029426843805095714,
+      "loss": 0.1486,
+      "step": 123000
+    },
+    {
+      "epoch": 5.78,
+      "learning_rate": 0.0002942450345591562,
+      "loss": 0.1421,
+      "step": 123500
+    },
+    {
+      "epoch": 5.8,
+      "learning_rate": 0.0002942216310673552,
+      "loss": 0.1458,
+      "step": 124000
+    },
+    {
+      "epoch": 5.8,
+      "eval_cer": 0.037944967936134014,
+      "eval_loss": 0.12521982192993164,
+      "eval_runtime": 1041.2886,
+      "eval_samples_per_second": 18.24,
+      "eval_steps_per_second": 4.561,
+      "eval_wer": 0.1334519920217645,
+      "step": 124000
+    },
+    {
+      "epoch": 5.83,
+      "learning_rate": 0.00029419827438253787,
+      "loss": 0.1477,
+      "step": 124500
+    },
+    {
+      "epoch": 5.85,
+      "learning_rate": 0.0002941748708907369,
+      "loss": 0.1432,
+      "step": 125000
+    },
+    {
+      "epoch": 5.87,
+      "learning_rate": 0.0002941514673989359,
+      "loss": 0.1525,
+      "step": 125500
+    },
+    {
+      "epoch": 5.9,
+      "learning_rate": 0.0002941280639071349,
+      "loss": 0.1409,
+      "step": 126000
+    },
+    {
+      "epoch": 5.92,
+      "learning_rate": 0.0002941046604153339,
+      "loss": 0.1485,
+      "step": 126500
+    },
+    {
+      "epoch": 5.94,
+      "learning_rate": 0.000294081256923533,
+      "loss": 0.1422,
+      "step": 127000
+    },
+    {
+      "epoch": 5.97,
+      "learning_rate": 0.000294057853431732,
+      "loss": 0.1438,
+      "step": 127500
+    },
+    {
+      "epoch": 5.99,
+      "learning_rate": 0.00029403449674691464,
+      "loss": 0.1376,
+      "step": 128000
+    },
+    {
+      "epoch": 5.99,
+      "eval_cer": 0.03670849147144789,
+      "eval_loss": 0.12269050627946854,
+      "eval_runtime": 1041.8258,
+      "eval_samples_per_second": 18.23,
+      "eval_steps_per_second": 4.558,
+      "eval_wer": 0.1273629277470072,
+      "step": 128000
+    },
+    {
+      "epoch": 6.01,
+      "learning_rate": 0.00029401109325511365,
+      "loss": 0.1396,
+      "step": 128500
+    },
+    {
+      "epoch": 6.04,
+      "learning_rate": 0.00029398768976331266,
+      "loss": 0.1314,
+      "step": 129000
+    },
+    {
+      "epoch": 6.06,
+      "learning_rate": 0.00029396428627151167,
+      "loss": 0.1401,
+      "step": 129500
+    },
+    {
+      "epoch": 6.08,
+      "learning_rate": 0.0002939408827797107,
+      "loss": 0.1277,
+      "step": 130000
+    },
+    {
+      "epoch": 6.11,
+      "learning_rate": 0.0002939174792879097,
+      "loss": 0.1412,
+      "step": 130500
+    },
+    {
+      "epoch": 6.13,
+      "learning_rate": 0.00029389407579610876,
+      "loss": 0.1353,
+      "step": 131000
+    },
+    {
+      "epoch": 6.15,
+      "learning_rate": 0.00029387071911129135,
+      "loss": 0.1349,
+      "step": 131500
+    },
+    {
+      "epoch": 6.18,
+      "learning_rate": 0.0002938473156194904,
+      "loss": 0.1338,
+      "step": 132000
+    },
+    {
+      "epoch": 6.18,
+      "eval_cer": 0.036872082624438335,
+      "eval_loss": 0.1331152617931366,
+      "eval_runtime": 1042.3485,
+      "eval_samples_per_second": 18.221,
+      "eval_steps_per_second": 4.556,
+      "eval_wer": 0.1286002568336085,
+      "step": 132000
+    },
+    {
+      "epoch": 6.2,
+      "learning_rate": 0.00029382391212768943,
+      "loss": 0.1446,
+      "step": 132500
+    },
+    {
+      "epoch": 6.22,
+      "learning_rate": 0.00029380050863588844,
+      "loss": 0.1297,
+      "step": 133000
+    },
+    {
+      "epoch": 6.25,
+      "learning_rate": 0.00029377710514408745,
+      "loss": 0.1344,
+      "step": 133500
+    },
+    {
+      "epoch": 6.27,
+      "learning_rate": 0.0002937537484592701,
+      "loss": 0.1349,
+      "step": 134000
+    },
+    {
+      "epoch": 6.3,
+      "learning_rate": 0.0002937303449674691,
+      "loss": 0.1249,
+      "step": 134500
+    },
+    {
+      "epoch": 6.32,
+      "learning_rate": 0.0002937069414756681,
+      "loss": 0.1358,
+      "step": 135000
+    },
+    {
+      "epoch": 6.34,
+      "learning_rate": 0.0002936835379838672,
+      "loss": 0.1405,
+      "step": 135500
+    },
+    {
+      "epoch": 6.37,
+      "learning_rate": 0.0002936601344920662,
+      "loss": 0.1212,
+      "step": 136000
+    },
+    {
+      "epoch": 6.37,
+      "eval_cer": 0.036793013567159624,
+      "eval_loss": 0.12496736645698547,
+      "eval_runtime": 1043.01,
+      "eval_samples_per_second": 18.21,
+      "eval_steps_per_second": 4.553,
+      "eval_wer": 0.12528640069946173,
+      "step": 136000
+    },
+    {
+      "epoch": 6.39,
+      "learning_rate": 0.00029363677780724884,
+      "loss": 0.1332,
+      "step": 136500
+    },
+    {
+      "epoch": 6.41,
+      "learning_rate": 0.00029361337431544786,
+      "loss": 0.1396,
+      "step": 137000
+    },
+    {
+      "epoch": 6.44,
+      "learning_rate": 0.00029358997082364687,
+      "loss": 0.1304,
+      "step": 137500
+    },
+    {
+      "epoch": 6.46,
+      "learning_rate": 0.0002935665673318459,
+      "loss": 0.1303,
+      "step": 138000
+    },
+    {
+      "epoch": 6.48,
+      "learning_rate": 0.0002935431638400449,
+      "loss": 0.1356,
+      "step": 138500
+    },
+    {
+      "epoch": 6.51,
+      "learning_rate": 0.00029351980715522754,
+      "loss": 0.148,
+      "step": 139000
+    },
+    {
+      "epoch": 6.53,
+      "learning_rate": 0.00029349640366342655,
+      "loss": 0.1371,
+      "step": 139500
+    },
+    {
+      "epoch": 6.55,
+      "learning_rate": 0.0002934730001716256,
+      "loss": 0.1336,
+      "step": 140000
+    },
+    {
+      "epoch": 6.55,
+      "eval_cer": 0.03752712886620425,
+      "eval_loss": 0.12814708054065704,
+      "eval_runtime": 1042.3272,
+      "eval_samples_per_second": 18.222,
+      "eval_steps_per_second": 4.556,
+      "eval_wer": 0.13243324472964163,
+      "step": 140000
+    },
+    {
+      "epoch": 6.58,
+      "learning_rate": 0.0002934495966798246,
+      "loss": 0.1489,
+      "step": 140500
+    },
+    {
+      "epoch": 6.6,
+      "learning_rate": 0.00029342619318802364,
+      "loss": 0.1354,
+      "step": 141000
+    },
+    {
+      "epoch": 6.62,
+      "learning_rate": 0.00029340278969622265,
+      "loss": 0.1341,
+      "step": 141500
+    },
+    {
+      "epoch": 6.65,
+      "learning_rate": 0.00029337943301140524,
+      "loss": 0.1403,
+      "step": 142000
+    },
+    {
+      "epoch": 6.67,
+      "learning_rate": 0.0002933560295196043,
+      "loss": 0.1369,
+      "step": 142500
+    },
+    {
+      "epoch": 6.69,
+      "learning_rate": 0.0002933326260278033,
+      "loss": 0.1439,
+      "step": 143000
+    },
+    {
+      "epoch": 6.72,
+      "learning_rate": 0.00029330926934298596,
+      "loss": 0.1349,
+      "step": 143500
+    },
+    {
+      "epoch": 6.74,
+      "learning_rate": 0.000293285865851185,
+      "loss": 0.1345,
+      "step": 144000
+    },
+    {
+      "epoch": 6.74,
+      "eval_cer": 0.03716995484884177,
+      "eval_loss": 0.1245645210146904,
+      "eval_runtime": 1041.9872,
+      "eval_samples_per_second": 18.228,
+      "eval_steps_per_second": 4.558,
+      "eval_wer": 0.13216001748654355,
+      "step": 144000
+    },
+    {
+      "epoch": 6.76,
+      "learning_rate": 0.000293262462359384,
+      "loss": 0.1345,
+      "step": 144500
+    },
+    {
+      "epoch": 6.79,
+      "learning_rate": 0.000293239058867583,
+      "loss": 0.1392,
+      "step": 145000
+    },
+    {
+      "epoch": 6.81,
+      "learning_rate": 0.00029321570218276565,
+      "loss": 0.1437,
+      "step": 145500
+    },
+    {
+      "epoch": 6.83,
+      "learning_rate": 0.00029319229869096466,
+      "loss": 0.1481,
+      "step": 146000
+    },
+    {
+      "epoch": 6.86,
+      "learning_rate": 0.00029316889519916367,
+      "loss": 0.1301,
+      "step": 146500
+    },
+    {
+      "epoch": 6.88,
+      "learning_rate": 0.00029314549170736273,
+      "loss": 0.1358,
+      "step": 147000
+    },
+    {
+      "epoch": 6.9,
+      "learning_rate": 0.00029312208821556174,
+      "loss": 0.1284,
+      "step": 147500
+    },
+    {
+      "epoch": 6.93,
+      "learning_rate": 0.00029309868472376076,
+      "loss": 0.1389,
+      "step": 148000
+    },
+    {
+      "epoch": 6.93,
+      "eval_cer": 0.03524298739257514,
+      "eval_loss": 0.12240828573703766,
+      "eval_runtime": 1040.9111,
+      "eval_samples_per_second": 18.247,
+      "eval_steps_per_second": 4.562,
+      "eval_wer": 0.1233660035051152,
+      "step": 148000
+    },
+    {
+      "epoch": 6.95,
+      "learning_rate": 0.0002930753280389434,
+      "loss": 0.1344,
+      "step": 148500
+    },
+    {
+      "epoch": 6.97,
+      "learning_rate": 0.0002930519245471424,
+      "loss": 0.1379,
+      "step": 149000
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 0.0002930285210553414,
+      "loss": 0.1259,
+      "step": 149500
+    },
+    {
+      "epoch": 7.02,
+      "learning_rate": 0.00029300511756354044,
+      "loss": 0.1204,
+      "step": 150000
+    },
+    {
+      "epoch": 7.04,
+      "learning_rate": 0.0002929817140717395,
+      "loss": 0.1293,
+      "step": 150500
+    },
+    {
+      "epoch": 7.07,
+      "learning_rate": 0.0002929583105799385,
+      "loss": 0.1257,
+      "step": 151000
+    },
+    {
+      "epoch": 7.09,
+      "learning_rate": 0.0002929349070881375,
+      "loss": 0.1279,
+      "step": 151500
+    },
+    {
+      "epoch": 7.11,
+      "learning_rate": 0.00029291150359633654,
+      "loss": 0.126,
+      "step": 152000
+    },
+    {
+      "epoch": 7.11,
+      "eval_cer": 0.03576238930331981,
+      "eval_loss": 0.12034807354211807,
+      "eval_runtime": 1041.2962,
+      "eval_samples_per_second": 18.24,
+      "eval_steps_per_second": 4.561,
+      "eval_wer": 0.12211696467952396,
+      "step": 152000
+    },
+    {
+      "epoch": 7.14,
+      "learning_rate": 0.0002928881469115192,
+      "loss": 0.1337,
+      "step": 152500
+    },
+    {
+      "epoch": 7.16,
+      "learning_rate": 0.0002928647434197182,
+      "loss": 0.1237,
+      "step": 153000
+    },
+    {
+      "epoch": 7.18,
+      "learning_rate": 0.0002928413399279172,
+      "loss": 0.1244,
+      "step": 153500
+    },
+    {
+      "epoch": 7.21,
+      "learning_rate": 0.0002928179364361162,
+      "loss": 0.1335,
+      "step": 154000
+    },
+    {
+      "epoch": 7.23,
+      "learning_rate": 0.0002927945329443153,
+      "loss": 0.126,
+      "step": 154500
+    },
+    {
+      "epoch": 7.25,
+      "learning_rate": 0.0002927711762594979,
+      "loss": 0.1205,
+      "step": 155000
+    },
+    {
+      "epoch": 7.28,
+      "learning_rate": 0.00029274777276769694,
+      "loss": 0.1296,
+      "step": 155500
+    },
+    {
+      "epoch": 7.3,
+      "learning_rate": 0.00029272436927589595,
+      "loss": 0.1197,
+      "step": 156000
+    },
+    {
+      "epoch": 7.3,
+      "eval_cer": 0.03777728700431881,
+      "eval_loss": 0.1192484200000763,
+      "eval_runtime": 1041.7692,
+      "eval_samples_per_second": 18.231,
+      "eval_steps_per_second": 4.559,
+      "eval_wer": 0.12780789782862406,
+      "step": 156000
+    },
+    {
+      "epoch": 7.32,
+      "learning_rate": 0.00029270096578409496,
+      "loss": 0.1231,
+      "step": 156500
+    },
+    {
+      "epoch": 7.35,
+      "learning_rate": 0.000292677562292294,
+      "loss": 0.1209,
+      "step": 157000
+    },
+    {
+      "epoch": 7.37,
+      "learning_rate": 0.000292654158800493,
+      "loss": 0.1332,
+      "step": 157500
+    },
+    {
+      "epoch": 7.39,
+      "learning_rate": 0.0002926308489226592,
+      "loss": 0.1283,
+      "step": 158000
+    },
+    {
+      "epoch": 7.42,
+      "learning_rate": 0.0002926074454308583,
+      "loss": 0.1411,
+      "step": 158500
+    },
+    {
+      "epoch": 7.44,
+      "learning_rate": 0.0002925840419390573,
+      "loss": 0.1318,
+      "step": 159000
+    },
+    {
+      "epoch": 7.47,
+      "learning_rate": 0.0002925606384472563,
+      "loss": 0.1259,
+      "step": 159500
+    },
+    {
+      "epoch": 7.49,
+      "learning_rate": 0.0002925372349554553,
+      "loss": 0.1309,
+      "step": 160000
+    },
+    {
+      "epoch": 7.49,
+      "eval_cer": 0.035546994285215724,
+      "eval_loss": 0.11985628306865692,
+      "eval_runtime": 1041.0069,
+      "eval_samples_per_second": 18.245,
+      "eval_steps_per_second": 4.562,
+      "eval_wer": 0.12378755410875225,
+      "step": 160000
+    },
+    {
+      "epoch": 7.51,
+      "learning_rate": 0.0002925138314636543,
+      "loss": 0.1237,
+      "step": 160500
+    },
+    {
+      "epoch": 7.54,
+      "learning_rate": 0.00029249042797185334,
+      "loss": 0.1363,
+      "step": 161000
+    },
+    {
+      "epoch": 7.56,
+      "learning_rate": 0.0002924670244800524,
+      "loss": 0.1275,
+      "step": 161500
+    },
+    {
+      "epoch": 7.58,
+      "learning_rate": 0.0002924436209882514,
+      "loss": 0.1285,
+      "step": 162000
+    },
+    {
+      "epoch": 7.61,
+      "learning_rate": 0.0002924202174964505,
+      "loss": 0.1453,
+      "step": 162500
+    },
+    {
+      "epoch": 7.63,
+      "learning_rate": 0.0002923968140046495,
+      "loss": 0.1273,
+      "step": 163000
+    },
+    {
+      "epoch": 7.65,
+      "learning_rate": 0.0002923734105128485,
+      "loss": 0.1352,
+      "step": 163500
+    },
+    {
+      "epoch": 7.68,
+      "learning_rate": 0.0002923500070210475,
+      "loss": 0.127,
+      "step": 164000
+    },
+    {
+      "epoch": 7.68,
+      "eval_cer": 0.03588303777865026,
+      "eval_loss": 0.12572461366653442,
+      "eval_runtime": 1040.9162,
+      "eval_samples_per_second": 18.246,
+      "eval_steps_per_second": 4.562,
+      "eval_wer": 0.1238812320206716,
+      "step": 164000
+    },
+    {
+      "epoch": 7.7,
+      "learning_rate": 0.0002923266503362301,
+      "loss": 0.1382,
+      "step": 164500
+    },
+    {
+      "epoch": 7.72,
+      "learning_rate": 0.00029230324684442917,
+      "loss": 0.1312,
+      "step": 165000
+    },
+    {
+      "epoch": 7.75,
+      "learning_rate": 0.0002922798433526282,
+      "loss": 0.1342,
+      "step": 165500
+    },
+    {
+      "epoch": 7.77,
+      "learning_rate": 0.00029225648666781083,
+      "loss": 0.1442,
+      "step": 166000
+    },
+    {
+      "epoch": 7.79,
+      "learning_rate": 0.00029223308317600984,
+      "loss": 0.1253,
+      "step": 166500
+    },
+    {
+      "epoch": 7.82,
+      "learning_rate": 0.00029220967968420885,
+      "loss": 0.1321,
+      "step": 167000
+    },
+    {
+      "epoch": 7.84,
+      "learning_rate": 0.00029218627619240786,
+      "loss": 0.1337,
+      "step": 167500
+    },
+    {
+      "epoch": 7.86,
+      "learning_rate": 0.0002921628727006069,
+      "loss": 0.1233,
+      "step": 168000
+    },
+    {
+      "epoch": 7.86,
+      "eval_cer": 0.03597301291279501,
+      "eval_loss": 0.12973648309707642,
+      "eval_runtime": 1040.5606,
+      "eval_samples_per_second": 18.253,
+      "eval_steps_per_second": 4.564,
+      "eval_wer": 0.1249936572247138,
+      "step": 168000
+    },
+    {
+      "epoch": 7.89,
+      "learning_rate": 0.00029213946920880594,
+      "loss": 0.1334,
+      "step": 168500
+    },
+    {
+      "epoch": 7.91,
+      "learning_rate": 0.00029211606571700495,
+      "loss": 0.1323,
+      "step": 169000
+    },
+    {
+      "epoch": 7.93,
+      "learning_rate": 0.0002920927090321876,
+      "loss": 0.1329,
+      "step": 169500
+    },
+    {
+      "epoch": 7.96,
+      "learning_rate": 0.0002920693055403866,
+      "loss": 0.1306,
+      "step": 170000
+    },
+    {
+      "epoch": 7.98,
+      "learning_rate": 0.0002920459020485856,
+      "loss": 0.1397,
+      "step": 170500
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 0.00029202249855678463,
+      "loss": 0.1303,
+      "step": 171000
+    },
+    {
+      "epoch": 8.03,
+      "learning_rate": 0.0002919991418719673,
+      "loss": 0.1263,
+      "step": 171500
+    },
+    {
+      "epoch": 8.05,
+      "learning_rate": 0.0002919757383801663,
+      "loss": 0.1222,
+      "step": 172000
+    },
+    {
+      "epoch": 8.05,
+      "eval_cer": 0.033454390786546266,
+      "eval_loss": 0.12292832136154175,
+      "eval_runtime": 1040.6782,
+      "eval_samples_per_second": 18.251,
+      "eval_steps_per_second": 4.563,
+      "eval_wer": 0.11680074317810123,
+      "step": 172000
+    }
+  ],
+  "max_steps": 6409800,
+  "num_train_epochs": 300,
+  "total_flos": 2.798604341991718e+20,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bdcd370ad6ba8aeb168c02e43e1c989d05daa88726c020aab5c950a5e5e3ede0
+size 3887

vocab.json ADDED Viewed

	@@ -0,0 +1,46 @@

+{
+  "'": 1,
+  "-": 2,
+  "[PAD]": 43,
+  "[UNK]": 42,
+  "a": 3,
+  "b": 4,
+  "c": 5,
+  "d": 6,
+  "e": 7,
+  "f": 8,
+  "g": 9,
+  "h": 10,
+  "i": 11,
+  "j": 12,
+  "k": 13,
+  "l": 14,
+  "m": 15,
+  "n": 16,
+  "o": 17,
+  "p": 18,
+  "q": 19,
+  "r": 20,
+  "s": 21,
+  "t": 22,
+  "u": 23,
+  "v": 24,
+  "w": 25,
+  "x": 26,
+  "y": 27,
+  "z": 28,
+  "|": 0,
+  "à": 29,
+  "á": 30,
+  "â": 31,
+  "ã": 32,
+  "ç": 33,
+  "é": 34,
+  "ê": 35,
+  "í": 36,
+  "ò": 37,
+  "ó": 38,
+  "ô": 39,
+  "õ": 40,
+  "ú": 41
+}