wandb: Currently logged in as: sanchit-gandhi (use `wandb login --relogin` to force relogin)
wandb: wandb version 0.12.16 is available!  To upgrade, please run:
wandb:  $ pip install wandb --upgrade
wandb: Tracking run with wandb version 0.12.15
wandb: Run data is saved locally in /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/wandb/run-20220516_161739-qrxgdh9s
wandb: Run `wandb offline` to turn off syncing.
wandb: Syncing run flax-wav2vec2-ctc-baseline
wandb: ⭐️ View project at https://wandb.ai/sanchit-gandhi/commonvoice_9_0
wandb: 🚀 View run at https://wandb.ai/sanchit-gandhi/commonvoice_9_0/runs/qrxgdh9s
05/16/2022 16:17:41 - INFO - __main__ - Training/evaluation parameters FlaxTrainingArguments(
_n_gpu=0,
adafactor=False,
adam_beta1=0.9,
adam_beta2=0.999,
adam_epsilon=1e-08,
bf16=False,
bf16_full_eval=False,
data_seed=None,
dataloader_drop_last=False,
dataloader_num_workers=0,
dataloader_pin_memory=True,
ddp_bucket_cap_mb=None,
ddp_find_unused_parameters=None,
debug=[],
deepspeed=None,
disable_tqdm=False,
do_eval=True,
do_predict=True,
do_train=True,
eval_accumulation_steps=None,
eval_delay=0,
eval_steps=10000,
evaluation_strategy=IntervalStrategy.NO,
fp16=False,
fp16_backend=auto,
fp16_full_eval=False,
fp16_opt_level=O1,
gradient_accumulation_steps=1,
gradient_checkpointing=True,
greater_is_better=None,
group_by_length=False,
half_precision_backend=auto,
hub_model_id=None,
hub_strategy=HubStrategy.EVERY_SAVE,
hub_token=<HUB_TOKEN>,
ignore_data_skip=False,
label_names=None,
label_smoothing_factor=0.0,
learning_rate=0.0003,
length_column_name=input_length,
load_best_model_at_end=False,
local_rank=-1,
log_level=-1,
log_level_replica=-1,
log_on_each_node=True,
logging_dir=./flax-wav2vec2-ctc-cv9-baseline/runs/May16_16-17-35_t1v-n-7e6d8bf0-w-0,
logging_first_step=False,
logging_nan_inf_filter=True,
logging_steps=25,
logging_strategy=IntervalStrategy.STEPS,
lr_scheduler_type=SchedulerType.LINEAR,
matmul_precision=default,
max_grad_norm=1.0,
max_steps=50000,
metric_for_best_model=None,
mp_parameters=,
multisteps=False,
no_cuda=False,
num_train_epochs=3.0,
optim=OptimizerNames.ADAMW_HF,
output_dir=./flax-wav2vec2-ctc-cv9-baseline,
overwrite_output_dir=True,
past_index=-1,
per_device_eval_batch_size=8,
per_device_train_batch_size=8,
precision=full,
prediction_loss_only=False,
push_to_hub=True,
push_to_hub_model_id=None,
push_to_hub_organization=None,
push_to_hub_token=<PUSH_TO_HUB_TOKEN>,
remove_unused_columns=True,
report_to=['wandb'],
resume_from_checkpoint=None,
run_name=./flax-wav2vec2-ctc-cv9-baseline,
save_on_each_node=False,
save_steps=10000,
save_strategy=IntervalStrategy.STEPS,
save_total_limit=None,
seed=42,
sharded_ddp=[],
skip_memory_metrics=True,
tf32=None,
tpu_metrics_debug=False,
tpu_num_cores=None,
use_legacy_prediction_loop=False,
warmup_ratio=0.0,
warmup_steps=500,
weight_decay=0.0,
xpu_backend=None,
)
05/16/2022 16:17:41 - INFO - __main__ - JAX devices: 8, matmul precision: default
05/16/2022 16:17:43 - WARNING - datasets.builder - Reusing dataset common_voice (/home/sanchitgandhi/cache/huggingface/datasets/mozilla-foundation___common_voice/en/9.0.0/26f54721b57ee2f31a333b315ed9151fbd8e693a3983c295fef63c67a12b9bf7)
05/16/2022 16:17:46 - WARNING - datasets.builder - Reusing dataset common_voice (/home/sanchitgandhi/cache/huggingface/datasets/mozilla-foundation___common_voice/en/9.0.0/26f54721b57ee2f31a333b315ed9151fbd8e693a3983c295fef63c67a12b9bf7)
05/16/2022 16:17:48 - WARNING - datasets.builder - Reusing dataset common_voice (/home/sanchitgandhi/cache/huggingface/datasets/mozilla-foundation___common_voice/en/9.0.0/26f54721b57ee2f31a333b315ed9151fbd8e693a3983c295fef63c67a12b9bf7)
loading configuration file https://huggingface.co/speech-seq2seq/flax-wav2vec2-large-lv60-scan/resolve/main/config.json from cache at /home/sanchitgandhi/.cache/huggingface/transformers/af26a73be492846deff70471176e0f6c3134134a11dc5908c11fbc12ed7c7c8e.d533ca185cf60c851bce32022efe596ce1bfaca5e73858c4e3b0cb8d6986cafd
/home/sanchitgandhi/transformers/src/transformers/configuration_utils.py:358: UserWarning: Passing `gradient_checkpointing` to a config initialization is deprecated and will be removed in v5 Transformers. Using `model.gradient_checkpointing_enable()` instead, or if you are using the `Trainer` API, pass `gradient_checkpointing=True` in your `TrainingArguments`.
  warnings.warn(
Model config Wav2Vec2Config {
  "activation_dropout": 0.1,
  "adapter_kernel_size": 3,
  "adapter_stride": 2,
  "add_adapter": false,
  "apply_spec_augment": true,
  "architectures": [
    "Wav2Vec2Model"
  ],
  "attention_dropout": 0.1,
  "bos_token_id": 1,
  "classifier_proj_size": 256,
  "codevector_dim": 768,
  "contrastive_logits_temperature": 0.1,
  "conv_bias": true,
  "conv_dim": [
    512,
    512,
    512,
    512,
    512,
    512,
    512
  ],
  "conv_kernel": [
    10,
    3,
    3,
    3,
    3,
    2,
    2
  ],
  "conv_stride": [
    5,
    2,
    2,
    2,
    2,
    2,
    2
  ],
  "ctc_loss_reduction": "sum",
  "ctc_zero_infinity": false,
  "diversity_loss_weight": 0.1,
  "do_stable_layer_norm": true,
  "eos_token_id": 2,
  "feat_extract_activation": "gelu",
  "feat_extract_dropout": 0.0,
  "feat_extract_norm": "layer",
  "feat_proj_dropout": 0.0,
  "feat_quantizer_dropout": 0.0,
  "final_dropout": 0.0,
  "fuse_matmuls": false,
  "gradient_checkpointing": true,
  "hidden_act": "gelu",
  "hidden_dropout": 0.1,
  "hidden_dropout_prob": 0.1,
  "hidden_size": 1024,
  "initializer_range": 0.02,
  "intermediate_size": 4096,
  "layer_norm_eps": 1e-05,
  "layerdrop": 0.0,
  "mask_feature_length": 10,
  "mask_feature_min_masks": 0,
  "mask_feature_prob": 0.0,
  "mask_time_length": 10,
  "mask_time_min_masks": 2,
  "mask_time_prob": 0.1,
  "model_type": "wav2vec2",
  "num_adapter_layers": 3,
  "num_attention_heads": 16,
  "num_codevector_groups": 2,
  "num_codevectors_per_group": 320,
  "num_conv_pos_embedding_groups": 16,
  "num_conv_pos_embeddings": 128,
  "num_feat_extract_layers": 7,
  "num_hidden_layers": 24,
  "num_negatives": 100,
  "output_hidden_size": 1024,
  "pad_token_id": 0,
  "proj_codevector_dim": 768,
  "tdnn_dilation": [
    1,
    2,
    3,
    1,
    1
  ],
  "tdnn_dim": [
    512,
    512,
    512,
    512,
    1500
  ],
  "tdnn_kernel": [
    5,
    3,
    3,
    1,
    1
  ],
  "transformers_version": "4.18.0.dev0",
  "use_scan": true,
  "use_weighted_layer_sum": false,
  "vocab_size": 32,
  "xvector_output_dim": 512
}

loading feature extractor configuration file https://huggingface.co/speech-seq2seq/flax-wav2vec2-large-lv60-scan/resolve/main/preprocessor_config.json from cache at /home/sanchitgandhi/.cache/huggingface/transformers/b496e500d1063975aa580ec835deb5094401775d2869a2e5d79556b66a21dc87.bef560b27c62cea1af8278853fdffeaf0141c9c44f4298df07ba06cdf6f8f963
Feature extractor Wav2Vec2FeatureExtractor {
  "do_normalize": true,
  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
  "feature_size": 1,
  "padding_side": "right",
  "padding_value": 0.0,
  "processor_class": "Wav2Vec2Processor",
  "return_attention_mask": true,
  "sampling_rate": 16000
}

loading file https://huggingface.co/patrickvonplaten/wav2vec2_ctc_cv9_tokenizer/resolve/main/vocab.json from cache at /home/sanchitgandhi/.cache/huggingface/transformers/a87a81d5e020048c331ad61c1f343904c1fff28b3ef918ce75aa0038d162c698.65c0f0efa332224f1dfbaeb422c47d17ba6a46c5c04ab9daa7da4acee61ccf81
loading file https://huggingface.co/patrickvonplaten/wav2vec2_ctc_cv9_tokenizer/resolve/main/tokenizer_config.json from cache at /home/sanchitgandhi/.cache/huggingface/transformers/ec2c496723611c2682a969c25d4cddec6efed7470218fc741989fe1298b15972.e954104c33fad04298b0c8a5c24afc74ea5b3a84fcf93e46b0ad82daa32bbafc
loading file https://huggingface.co/patrickvonplaten/wav2vec2_ctc_cv9_tokenizer/resolve/main/added_tokens.json from cache at None
loading file https://huggingface.co/patrickvonplaten/wav2vec2_ctc_cv9_tokenizer/resolve/main/special_tokens_map.json from cache at /home/sanchitgandhi/.cache/huggingface/transformers/c45c68d593f1bfa292a7ecd94f759a0126ca0c36029c2ca2a2c2fe3c5cb3d93e.9d6cd81ef646692fb1c169a880161ea1cb95f49694f220aced9b704b457e51dd
loading weights file https://huggingface.co/speech-seq2seq/flax-wav2vec2-large-lv60-scan/resolve/main/flax_model.msgpack from cache at /home/sanchitgandhi/.cache/huggingface/transformers/8738d0bc737753f3081921d57d6a989166e00a293f8cbc50ed7ac1a45c8bc8ae.30c766abe352bc4a15a81a2c3bff36eccb623f4dcb64b4a1ead66bbce22b6ca9
tcmalloc: large alloc 1261764608 bytes == 0x9dd74000 @  0x7f6b45402680 0x7f6b45423824 0x5f8a01 0x648cf1 0x5c4676 0x4f290e 0x64f718 0x5048b3 0x56b1da 0x56939a 0x50aaa0 0x56c28c 0x56939a 0x5f6a13 0x56b0ae 0x56939a 0x68d047 0x67e351 0x67e3cf 0x67e471 0x67e817 0x6b6fe2 0x6b736d 0x7f6b452150b3 0x5fa5ce
/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/tree_util.py:188: FutureWarning: jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() instead as a drop-in replacement.
  warnings.warn('jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() '
All model checkpoint weights were used when initializing FlaxWav2Vec2ForCTC.

Some weights of FlaxWav2Vec2ForCTC were not initialized from the model checkpoint at speech-seq2seq/flax-wav2vec2-large-lv60-scan and are newly initialized: {('lm_head', 'kernel'), ('lm_head', 'bias')}
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
05/16/2022 16:18:15 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/mozilla-foundation___common_voice/en/9.0.0/26f54721b57ee2f31a333b315ed9151fbd8e693a3983c295fef63c67a12b9bf7/cache-37d399322cc458c7.arrow
05/16/2022 16:18:15 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/mozilla-foundation___common_voice/en/9.0.0/26f54721b57ee2f31a333b315ed9151fbd8e693a3983c295fef63c67a12b9bf7/cache-52d5a8be94f19888.arrow
preprocess dataset:   0% 0/16335 [00:00<?, ?ex/s]preprocess dataset:   0% 1/16335 [00:00<3:11:00,  1.43ex/s]preprocess dataset:   0% 7/16335 [00:00<25:15, 10.77ex/s]  preprocess dataset:   0% 12/16335 [00:00<15:28, 17.58ex/s]preprocess dataset:   0% 20/16335 [00:01<09:11, 29.58ex/s]preprocess dataset:   0% 25/16335 [00:01<08:45, 31.06ex/s]preprocess dataset:   0% 32/16335 [00:01<07:03, 38.49ex/s]preprocess dataset:   0% 37/16335 [00:01<06:54, 39.36ex/s]preprocess dataset:   0% 42/16335 [00:01<06:38, 40.93ex/s]preprocess dataset:   0% 47/16335 [00:01<06:35, 41.13ex/s]preprocess dataset:   0% 52/16335 [00:01<06:34, 41.25ex/s]preprocess dataset:   0% 58/16335 [00:01<06:19, 42.86ex/s]preprocess dataset:   0% 63/16335 [00:02<06:38, 40.88ex/s]preprocess dataset:   0% 70/16335 [00:02<05:41, 47.56ex/s]preprocess dataset:   0% 77/16335 [00:02<05:26, 49.75ex/s]preprocess dataset:   1% 83/16335 [00:02<05:19, 50.86ex/s]preprocess dataset:   1% 92/16335 [00:02<04:49, 56.15ex/s]preprocess dataset:   1% 100/16335 [00:02<04:42, 57.50ex/s]preprocess dataset:   1% 107/16335 [00:02<04:35, 58.93ex/s]preprocess dataset:   1% 115/16335 [00:02<04:26, 60.76ex/s]preprocess dataset:   1% 123/16335 [00:03<04:13, 63.98ex/s]preprocess dataset:   1% 130/16335 [00:03<05:40, 47.64ex/s]preprocess dataset:   1% 136/16335 [00:03<05:41, 47.46ex/s]preprocess dataset:   1% 142/16335 [00:03<05:31, 48.91ex/s]preprocess dataset:   1% 149/16335 [00:03<05:09, 52.34ex/s]preprocess dataset:   1% 155/16335 [00:03<05:07, 52.65ex/s]preprocess dataset:   1% 162/16335 [00:03<04:56, 54.54ex/s]preprocess dataset:   1% 172/16335 [00:03<04:16, 62.94ex/s]preprocess dataset:   1% 179/16335 [00:04<04:18, 62.43ex/s]preprocess dataset:   1% 186/16335 [00:04<04:22, 61.49ex/s]preprocess dataset:   1% 194/16335 [00:04<04:06, 65.57ex/s]preprocess dataset:   1% 201/16335 [00:04<04:48, 55.83ex/s]preprocess dataset:   1% 207/16335 [00:04<04:57, 54.16ex/s]preprocess dataset:   1% 213/16335 [00:04<04:59, 53.91ex/s]preprocess dataset:   1% 219/16335 [00:04<05:20, 50.33ex/s]preprocess dataset:   1% 225/16335 [00:04<05:19, 50.39ex/s]preprocess dataset:   1% 232/16335 [00:05<04:54, 54.75ex/s]preprocess dataset:   1% 238/16335 [00:05<05:38, 47.60ex/s]preprocess dataset:   1% 245/16335 [00:05<05:20, 50.25ex/s]preprocess dataset:   2% 253/16335 [00:05<04:42, 56.94ex/s]preprocess dataset:   2% 259/16335 [00:05<04:45, 56.30ex/s]preprocess dataset:   2% 265/16335 [00:05<04:44, 56.51ex/s]preprocess dataset:   2% 273/16335 [00:05<04:19, 61.83ex/s]preprocess dataset:   2% 282/16335 [00:05<03:55, 68.14ex/s]preprocess dataset:   2% 292/16335 [00:06<03:35, 74.41ex/s]preprocess dataset:   2% 303/16335 [00:06<03:13, 82.83ex/s]preprocess dataset:   2% 312/16335 [00:06<03:39, 72.94ex/s]preprocess dataset:   2% 320/16335 [00:06<03:40, 72.62ex/s]preprocess dataset:   2% 328/16335 [00:06<03:35, 74.42ex/s]preprocess dataset:   2% 337/16335 [00:06<03:30, 76.02ex/s]preprocess dataset:   2% 346/16335 [00:06<03:25, 77.94ex/s]preprocess dataset:   2% 355/16335 [00:06<03:27, 76.93ex/s]preprocess dataset:   2% 363/16335 [00:07<06:00, 44.27ex/s]preprocess dataset:   2% 372/16335 [00:07<05:11, 51.22ex/s]preprocess dataset:   2% 379/16335 [00:07<05:12, 51.05ex/s]preprocess dataset:   2% 387/16335 [00:07<04:46, 55.63ex/s]preprocess dataset:   2% 395/16335 [00:07<04:24, 60.32ex/s]preprocess dataset:   2% 402/16335 [00:07<04:47, 55.43ex/s]preprocess dataset:   3% 409/16335 [00:07<04:46, 55.56ex/s]preprocess dataset:   3% 416/16335 [00:08<04:36, 57.67ex/s]preprocess dataset:   3% 425/16335 [00:08<04:08, 64.01ex/s]preprocess dataset:   3% 432/16335 [00:08<04:07, 64.31ex/s]preprocess dataset:   3% 440/16335 [00:08<03:52, 68.35ex/s]preprocess dataset:   3% 448/16335 [00:08<03:50, 68.83ex/s]preprocess dataset:   3% 456/16335 [00:08<03:41, 71.80ex/s]preprocess dataset:   3% 464/16335 [00:08<03:49, 69.01ex/s]preprocess dataset:   3% 472/16335 [00:08<04:04, 64.84ex/s]preprocess dataset:   3% 479/16335 [00:08<04:10, 63.31ex/s]preprocess dataset:   3% 486/16335 [00:09<04:51, 54.42ex/s]preprocess dataset:   3% 494/16335 [00:09<04:41, 56.36ex/s]preprocess dataset:   3% 505/16335 [00:09<03:52, 67.96ex/s]preprocess dataset:   3% 513/16335 [00:09<03:49, 69.03ex/s]preprocess dataset:   3% 521/16335 [00:09<03:47, 69.39ex/s]preprocess dataset:   3% 529/16335 [00:09<03:40, 71.69ex/s]preprocess dataset:   3% 539/16335 [00:09<03:18, 79.38ex/s]preprocess dataset:   3% 548/16335 [00:09<03:12, 82.06ex/s]preprocess dataset:   3% 558/16335 [00:10<03:10, 82.66ex/s]preprocess dataset:   3% 568/16335 [00:10<03:03, 85.92ex/s]preprocess dataset:   4% 578/16335 [00:10<02:55, 89.83ex/s]preprocess dataset:   4% 588/16335 [00:10<03:34, 73.35ex/s]preprocess dataset:   4% 596/16335 [00:10<03:35, 73.16ex/s]preprocess dataset:   4% 604/16335 [00:10<03:48, 68.97ex/s]preprocess dataset:   4% 612/16335 [00:10<03:59, 65.67ex/s]preprocess dataset:   4% 619/16335 [00:10<04:13, 61.94ex/s]preprocess dataset:   4% 627/16335 [00:11<03:59, 65.47ex/s]preprocess dataset:   4% 634/16335 [00:11<04:19, 60.43ex/s]preprocess dataset:   4% 645/16335 [00:11<04:01, 64.91ex/s]preprocess dataset:   4% 654/16335 [00:11<03:46, 69.09ex/s]preprocess dataset:   4% 663/16335 [00:11<03:31, 74.16ex/s]preprocess dataset:   4% 672/16335 [00:11<03:21, 77.55ex/s]preprocess dataset:   4% 680/16335 [00:11<03:35, 72.80ex/s]preprocess dataset:   4% 690/16335 [00:11<03:19, 78.57ex/s]preprocess dataset:   4% 699/16335 [00:12<03:30, 74.20ex/s]preprocess dataset:   4% 707/16335 [00:12<03:33, 73.21ex/s]preprocess dataset:   4% 716/16335 [00:12<03:25, 75.95ex/s]preprocess dataset:   4% 726/16335 [00:12<03:09, 82.29ex/s]preprocess dataset:   4% 735/16335 [00:12<03:23, 76.64ex/s]preprocess dataset:   5% 743/16335 [00:12<03:43, 69.69ex/s]preprocess dataset:   5% 753/16335 [00:12<03:22, 77.08ex/s]preprocess dataset:   5% 761/16335 [00:12<03:40, 70.52ex/s]preprocess dataset:   5% 771/16335 [00:12<03:19, 77.85ex/s]preprocess dataset:   5% 780/16335 [00:13<03:18, 78.42ex/s]preprocess dataset:   5% 790/16335 [00:13<03:09, 81.97ex/s]preprocess dataset:   5% 799/16335 [00:13<03:38, 71.17ex/s]preprocess dataset:   5% 809/16335 [00:13<03:22, 76.66ex/s]preprocess dataset:   5% 819/16335 [00:13<03:10, 81.61ex/s]preprocess dataset:   5% 828/16335 [00:13<03:12, 80.57ex/s]preprocess dataset:   5% 839/16335 [00:13<02:56, 87.98ex/s]preprocess dataset:   5% 849/16335 [00:13<02:56, 87.65ex/s]preprocess dataset:   5% 858/16335 [00:14<03:03, 84.22ex/s]preprocess dataset:   5% 867/16335 [00:14<03:03, 84.29ex/s]preprocess dataset:   5% 876/16335 [00:14<03:01, 85.03ex/s]preprocess dataset:   5% 885/16335 [00:14<03:03, 84.34ex/s]preprocess dataset:   5% 895/16335 [00:14<02:54, 88.25ex/s]preprocess dataset:   6% 905/16335 [00:14<02:49, 91.24ex/s]preprocess dataset:   6% 915/16335 [00:14<03:12, 80.23ex/s]preprocess dataset:   6% 925/16335 [00:14<03:08, 81.72ex/s]preprocess dataset:   6% 934/16335 [00:14<03:04, 83.36ex/s]preprocess dataset:   6% 943/16335 [00:15<03:01, 84.98ex/s]preprocess dataset:   6% 953/16335 [00:15<03:08, 81.81ex/s]preprocess dataset:   6% 963/16335 [00:15<03:03, 83.76ex/s]preprocess dataset:   6% 972/16335 [00:15<03:00, 85.19ex/s]preprocess dataset:   6% 982/16335 [00:15<03:00, 85.00ex/s]preprocess dataset:   6% 991/16335 [00:15<03:08, 81.20ex/s]preprocess dataset:   6% 1000/16335 [00:17<14:23, 17.75ex/s]preprocess dataset:   6% 1009/16335 [00:17<11:05, 23.03ex/s]preprocess dataset:   6% 1018/16335 [00:17<08:39, 29.49ex/s]preprocess dataset:   6% 1026/16335 [00:17<07:32, 33.85ex/s]preprocess dataset:   6% 1033/16335 [00:17<06:33, 38.93ex/s]preprocess dataset:   6% 1040/16335 [00:17<05:49, 43.82ex/s]preprocess dataset:   6% 1048/16335 [00:17<05:01, 50.69ex/s]preprocess dataset:   6% 1057/16335 [00:17<05:03, 50.29ex/s]preprocess dataset:   7% 1067/16335 [00:18<04:16, 59.50ex/s]preprocess dataset:   7% 1076/16335 [00:18<03:50, 66.09ex/s]preprocess dataset:   7% 1085/16335 [00:18<03:34, 70.96ex/s]preprocess dataset:   7% 1094/16335 [00:18<03:22, 75.09ex/s]preprocess dataset:   7% 1104/16335 [00:18<03:06, 81.64ex/s]preprocess dataset:   7% 1113/16335 [00:18<03:17, 77.10ex/s]preprocess dataset:   7% 1122/16335 [00:18<03:10, 79.93ex/s]preprocess dataset:   7% 1131/16335 [00:18<03:11, 79.28ex/s]preprocess dataset:   7% 1143/16335 [00:18<02:52, 88.25ex/s]preprocess dataset:   7% 1153/16335 [00:19<02:47, 90.45ex/s]preprocess dataset:   7% 1163/16335 [00:19<02:53, 87.40ex/s]preprocess dataset:   7% 1172/16335 [00:19<02:52, 87.94ex/s]preprocess dataset:   7% 1181/16335 [00:19<02:55, 86.15ex/s]preprocess dataset:   7% 1191/16335 [00:19<02:50, 88.88ex/s]preprocess dataset:   7% 1200/16335 [00:19<02:52, 87.65ex/s]preprocess dataset:   7% 1209/16335 [00:19<02:53, 87.30ex/s]preprocess dataset:   7% 1218/16335 [00:19<02:52, 87.81ex/s]preprocess dataset:   8% 1228/16335 [00:19<02:48, 89.59ex/s]preprocess dataset:   8% 1237/16335 [00:19<02:56, 85.64ex/s]preprocess dataset:   8% 1246/16335 [00:20<02:57, 85.13ex/s]preprocess dataset:   8% 1255/16335 [00:20<02:57, 84.85ex/s]preprocess dataset:   8% 1265/16335 [00:20<02:55, 85.78ex/s]preprocess dataset:   8% 1275/16335 [00:20<02:51, 87.92ex/s]preprocess dataset:   8% 1284/16335 [00:20<02:50, 88.10ex/s]preprocess dataset:   8% 1293/16335 [00:20<02:55, 85.72ex/s]preprocess dataset:   8% 1303/16335 [00:20<02:48, 89.40ex/s]preprocess dataset:   8% 1313/16335 [00:20<02:46, 90.43ex/s]preprocess dataset:   8% 1323/16335 [00:20<03:00, 83.08ex/s]preprocess dataset:   8% 1332/16335 [00:21<02:57, 84.66ex/s]preprocess dataset:   8% 1343/16335 [00:21<02:48, 88.78ex/s]preprocess dataset:   8% 1352/16335 [00:21<02:55, 85.52ex/s]preprocess dataset:   8% 1362/16335 [00:21<02:52, 86.96ex/s]preprocess dataset:   8% 1371/16335 [00:21<02:53, 86.42ex/s]preprocess dataset:   8% 1380/16335 [00:21<02:53, 86.41ex/s]preprocess dataset:   9% 1390/16335 [00:21<02:48, 88.62ex/s]preprocess dataset:   9% 1399/16335 [00:21<02:50, 87.37ex/s]preprocess dataset:   9% 1409/16335 [00:21<02:50, 87.51ex/s]preprocess dataset:   9% 1418/16335 [00:22<02:51, 86.82ex/s]preprocess dataset:   9% 1427/16335 [00:22<02:54, 85.29ex/s]preprocess dataset:   9% 1436/16335 [00:22<03:20, 74.46ex/s]preprocess dataset:   9% 1446/16335 [00:22<03:05, 80.33ex/s]preprocess dataset:   9% 1455/16335 [00:22<03:05, 80.30ex/s]preprocess dataset:   9% 1464/16335 [00:22<03:01, 81.87ex/s]preprocess dataset:   9% 1474/16335 [00:22<02:54, 84.98ex/s]preprocess dataset:   9% 1483/16335 [00:22<02:55, 84.43ex/s]preprocess dataset:   9% 1492/16335 [00:22<02:53, 85.32ex/s]preprocess dataset:   9% 1501/16335 [00:23<02:52, 85.98ex/s]preprocess dataset:   9% 1510/16335 [00:23<02:53, 85.55ex/s]preprocess dataset:   9% 1519/16335 [00:23<03:08, 78.78ex/s]preprocess dataset:   9% 1528/16335 [00:23<03:03, 80.73ex/s]preprocess dataset:   9% 1538/16335 [00:23<02:53, 85.10ex/s]preprocess dataset:   9% 1547/16335 [00:23<02:58, 82.75ex/s]preprocess dataset:  10% 1556/16335 [00:23<02:57, 83.07ex/s]preprocess dataset:  10% 1565/16335 [00:23<02:54, 84.42ex/s]preprocess dataset:  10% 1574/16335 [00:23<02:56, 83.40ex/s]preprocess dataset:  10% 1585/16335 [00:24<02:47, 88.00ex/s]preprocess dataset:  10% 1594/16335 [00:24<03:07, 78.62ex/s]preprocess dataset:  10% 1603/16335 [00:24<03:12, 76.49ex/s]preprocess dataset:  10% 1612/16335 [00:24<03:06, 79.06ex/s]preprocess dataset:  10% 1623/16335 [00:24<02:54, 84.48ex/s]preprocess dataset:  10% 1632/16335 [00:24<02:52, 85.31ex/s]preprocess dataset:  10% 1643/16335 [00:24<02:41, 91.01ex/s]preprocess dataset:  10% 1653/16335 [00:24<02:40, 91.75ex/s]preprocess dataset:  10% 1663/16335 [00:25<02:39, 91.87ex/s]preprocess dataset:  10% 1673/16335 [00:25<02:38, 92.35ex/s]preprocess dataset:  10% 1683/16335 [00:25<02:38, 92.45ex/s]preprocess dataset:  10% 1693/16335 [00:25<02:42, 89.90ex/s]preprocess dataset:  10% 1704/16335 [00:25<02:35, 94.25ex/s]preprocess dataset:  10% 1714/16335 [00:25<02:35, 93.89ex/s]preprocess dataset:  11% 1724/16335 [00:25<02:32, 95.50ex/s]preprocess dataset:  11% 1734/16335 [00:25<02:35, 93.84ex/s]preprocess dataset:  11% 1745/16335 [00:25<02:33, 95.22ex/s]preprocess dataset:  11% 1755/16335 [00:26<02:56, 82.44ex/s]preprocess dataset:  11% 1764/16335 [00:26<03:17, 73.70ex/s]preprocess dataset:  11% 1774/16335 [00:26<03:04, 79.03ex/s]preprocess dataset:  11% 1785/16335 [00:26<02:52, 84.58ex/s]preprocess dataset:  11% 1796/16335 [00:26<02:42, 89.35ex/s]preprocess dataset:  11% 1808/16335 [00:26<02:34, 93.84ex/s]preprocess dataset:  11% 1818/16335 [00:26<02:33, 94.32ex/s]preprocess dataset:  11% 1828/16335 [00:26<02:47, 86.50ex/s]preprocess dataset:  11% 1840/16335 [00:27<02:48, 86.14ex/s]preprocess dataset:  11% 1850/16335 [00:27<02:44, 88.15ex/s]preprocess dataset:  11% 1861/16335 [00:27<02:38, 91.07ex/s]preprocess dataset:  11% 1871/16335 [00:27<02:43, 88.37ex/s]preprocess dataset:  12% 1882/16335 [00:27<02:36, 92.61ex/s]preprocess dataset:  12% 1893/16335 [00:27<02:28, 97.12ex/s]preprocess dataset:  12% 1904/16335 [00:27<02:27, 97.97ex/s]preprocess dataset:  12% 1914/16335 [00:27<02:34, 93.09ex/s]preprocess dataset:  12% 1925/16335 [00:27<02:28, 97.23ex/s]preprocess dataset:  12% 1936/16335 [00:28<02:28, 96.75ex/s]preprocess dataset:  12% 1946/16335 [00:28<02:34, 93.35ex/s]preprocess dataset:  12% 1957/16335 [00:28<02:59, 79.88ex/s]preprocess dataset:  12% 1968/16335 [00:28<02:45, 86.89ex/s]preprocess dataset:  12% 1978/16335 [00:28<03:06, 76.81ex/s]preprocess dataset:  12% 1988/16335 [00:28<02:54, 82.15ex/s]preprocess dataset:  12% 1998/16335 [00:28<02:51, 83.73ex/s]preprocess dataset:  12% 2007/16335 [00:29<10:19, 23.13ex/s]preprocess dataset:  12% 2018/16335 [00:30<07:43, 30.89ex/s]preprocess dataset:  12% 2027/16335 [00:30<06:24, 37.18ex/s]preprocess dataset:  12% 2036/16335 [00:30<05:22, 44.41ex/s]preprocess dataset:  13% 2046/16335 [00:30<04:47, 49.76ex/s]preprocess dataset:  13% 2056/16335 [00:30<04:06, 57.93ex/s]preprocess dataset:  13% 2068/16335 [00:30<03:24, 69.77ex/s]preprocess dataset:  13% 2079/16335 [00:30<03:01, 78.33ex/s]preprocess dataset:  13% 2089/16335 [00:30<02:51, 83.26ex/s]preprocess dataset:  13% 2099/16335 [00:30<02:44, 86.38ex/s]preprocess dataset:  13% 2109/16335 [00:31<02:44, 86.22ex/s]preprocess dataset:  13% 2119/16335 [00:31<02:38, 89.43ex/s]preprocess dataset:  13% 2130/16335 [00:31<02:32, 93.43ex/s]preprocess dataset:  13% 2141/16335 [00:31<02:27, 96.51ex/s]preprocess dataset:  13% 2153/16335 [00:31<02:20, 101.27ex/s]preprocess dataset:  13% 2164/16335 [00:31<02:37, 89.96ex/s] preprocess dataset:  13% 2174/16335 [00:31<02:33, 92.04ex/s]preprocess dataset:  13% 2184/16335 [00:31<02:34, 91.41ex/s]preprocess dataset:  13% 2196/16335 [00:31<02:24, 97.79ex/s]preprocess dataset:  14% 2209/16335 [00:32<02:18, 102.02ex/s]preprocess dataset:  14% 2220/16335 [00:32<02:20, 100.44ex/s]preprocess dataset:  14% 2232/16335 [00:32<02:14, 104.59ex/s]preprocess dataset:  14% 2243/16335 [00:32<02:14, 105.04ex/s]preprocess dataset:  14% 2254/16335 [00:32<02:15, 104.13ex/s]preprocess dataset:  14% 2265/16335 [00:32<02:18, 101.34ex/s]preprocess dataset:  14% 2276/16335 [00:32<02:23, 98.25ex/s] preprocess dataset:  14% 2286/16335 [00:32<02:23, 97.75ex/s]preprocess dataset:  14% 2298/16335 [00:32<02:17, 101.73ex/s]preprocess dataset:  14% 2310/16335 [00:33<02:15, 103.45ex/s]preprocess dataset:  14% 2321/16335 [00:33<02:18, 100.91ex/s]preprocess dataset:  14% 2333/16335 [00:33<02:13, 104.85ex/s]preprocess dataset:  14% 2344/16335 [00:33<02:19, 100.10ex/s]preprocess dataset:  14% 2357/16335 [00:33<02:25, 95.99ex/s] preprocess dataset:  14% 2367/16335 [00:33<02:25, 96.29ex/s]preprocess dataset:  15% 2378/16335 [00:33<02:20, 99.00ex/s]preprocess dataset:  15% 2388/16335 [00:33<02:24, 96.76ex/s]preprocess dataset:  15% 2399/16335 [00:33<02:19, 99.62ex/s]preprocess dataset:  15% 2410/16335 [00:34<02:21, 98.65ex/s]preprocess dataset:  15% 2420/16335 [00:34<02:25, 95.79ex/s]preprocess dataset:  15% 2430/16335 [00:34<02:25, 95.36ex/s]preprocess dataset:  15% 2440/16335 [00:34<02:26, 94.79ex/s]preprocess dataset:  15% 2450/16335 [00:34<02:34, 89.84ex/s]preprocess dataset:  15% 2460/16335 [00:34<02:35, 89.15ex/s]preprocess dataset:  15% 2470/16335 [00:34<02:33, 90.06ex/s]preprocess dataset:  15% 2480/16335 [00:34<02:34, 89.68ex/s]preprocess dataset:  15% 2489/16335 [00:34<02:36, 88.27ex/s]preprocess dataset:  15% 2498/16335 [00:35<02:39, 86.99ex/s]preprocess dataset:  15% 2507/16335 [00:35<02:39, 86.52ex/s]preprocess dataset:  15% 2518/16335 [00:35<02:34, 89.26ex/s]preprocess dataset:  15% 2527/16335 [00:35<02:41, 85.53ex/s]preprocess dataset:  16% 2536/16335 [00:35<02:49, 81.21ex/s]preprocess dataset:  16% 2545/16335 [00:35<02:45, 83.46ex/s]preprocess dataset:  16% 2555/16335 [00:35<02:39, 86.30ex/s]preprocess dataset:  16% 2565/16335 [00:35<02:35, 88.38ex/s]preprocess dataset:  16% 2575/16335 [00:35<02:34, 89.05ex/s]preprocess dataset:  16% 2586/16335 [00:36<02:26, 94.00ex/s]preprocess dataset:  16% 2596/16335 [00:36<02:39, 86.08ex/s]preprocess dataset:  16% 2606/16335 [00:36<02:37, 87.24ex/s]preprocess dataset:  16% 2615/16335 [00:36<03:06, 73.55ex/s]preprocess dataset:  16% 2625/16335 [00:36<02:52, 79.58ex/s]preprocess dataset:  16% 2635/16335 [00:36<02:47, 81.61ex/s]preprocess dataset:  16% 2646/16335 [00:36<02:37, 87.14ex/s]preprocess dataset:  16% 2658/16335 [00:36<02:22, 95.76ex/s]preprocess dataset:  16% 2669/16335 [00:36<02:20, 97.55ex/s]preprocess dataset:  16% 2679/16335 [00:37<02:20, 97.03ex/s]preprocess dataset:  16% 2690/16335 [00:37<02:17, 99.44ex/s]preprocess dataset:  17% 2702/16335 [00:37<02:12, 102.96ex/s]preprocess dataset:  17% 2713/16335 [00:37<02:19, 97.61ex/s] preprocess dataset:  17% 2725/16335 [00:37<02:14, 101.33ex/s]preprocess dataset:  17% 2736/16335 [00:37<02:16, 99.59ex/s] preprocess dataset:  17% 2747/16335 [00:37<02:15, 100.41ex/s]preprocess dataset:  17% 2758/16335 [00:37<02:18, 98.01ex/s] preprocess dataset:  17% 2768/16335 [00:38<02:22, 95.14ex/s]preprocess dataset:  17% 2778/16335 [00:38<02:26, 92.39ex/s]preprocess dataset:  17% 2788/16335 [00:38<02:33, 88.09ex/s]preprocess dataset:  17% 2797/16335 [00:38<02:42, 83.13ex/s]preprocess dataset:  17% 2807/16335 [00:38<02:39, 85.06ex/s]preprocess dataset:  17% 2817/16335 [00:38<02:36, 86.16ex/s]preprocess dataset:  17% 2828/16335 [00:38<02:27, 91.61ex/s]preprocess dataset:  17% 2838/16335 [00:38<02:27, 91.29ex/s]preprocess dataset:  17% 2848/16335 [00:38<02:32, 88.65ex/s]preprocess dataset:  17% 2858/16335 [00:39<02:31, 88.96ex/s]preprocess dataset:  18% 2867/16335 [00:39<02:33, 87.73ex/s]preprocess dataset:  18% 2877/16335 [00:39<02:28, 90.71ex/s]preprocess dataset:  18% 2888/16335 [00:39<02:23, 94.03ex/s]preprocess dataset:  18% 2898/16335 [00:39<02:22, 94.45ex/s]preprocess dataset:  18% 2908/16335 [00:39<02:21, 94.88ex/s]preprocess dataset:  18% 2918/16335 [00:39<02:20, 95.75ex/s]preprocess dataset:  18% 2928/16335 [00:39<02:21, 94.65ex/s]preprocess dataset:  18% 2938/16335 [00:39<02:23, 93.06ex/s]preprocess dataset:  18% 2948/16335 [00:40<02:26, 91.31ex/s]preprocess dataset:  18% 2958/16335 [00:40<02:34, 86.84ex/s]preprocess dataset:  18% 2968/16335 [00:40<02:31, 88.38ex/s]preprocess dataset:  18% 2977/16335 [00:40<02:39, 83.89ex/s]preprocess dataset:  18% 2988/16335 [00:40<02:31, 87.93ex/s]preprocess dataset:  18% 2997/16335 [00:40<02:37, 84.70ex/s]preprocess dataset:  18% 3006/16335 [00:41<10:24, 21.33ex/s]preprocess dataset:  18% 3016/16335 [00:41<07:53, 28.12ex/s]preprocess dataset:  19% 3025/16335 [00:42<06:23, 34.68ex/s]preprocess dataset:  19% 3033/16335 [00:42<05:29, 40.38ex/s]preprocess dataset:  19% 3042/16335 [00:42<04:35, 48.28ex/s]preprocess dataset:  19% 3053/16335 [00:42<03:44, 59.16ex/s]preprocess dataset:  19% 3064/16335 [00:42<03:10, 69.60ex/s]preprocess dataset:  19% 3074/16335 [00:42<02:53, 76.24ex/s]preprocess dataset:  19% 3084/16335 [00:42<02:45, 80.30ex/s]preprocess dataset:  19% 3095/16335 [00:42<02:33, 86.28ex/s]preprocess dataset:  19% 3105/16335 [00:42<02:32, 86.73ex/s]preprocess dataset:  19% 3115/16335 [00:42<02:30, 88.13ex/s]preprocess dataset:  19% 3125/16335 [00:43<02:27, 89.33ex/s]preprocess dataset:  19% 3135/16335 [00:43<02:27, 89.35ex/s]preprocess dataset:  19% 3145/16335 [00:43<02:35, 85.09ex/s]preprocess dataset:  19% 3154/16335 [00:43<02:34, 85.12ex/s]preprocess dataset:  19% 3164/16335 [00:43<02:31, 86.97ex/s]preprocess dataset:  19% 3173/16335 [00:43<02:36, 84.36ex/s]preprocess dataset:  19% 3182/16335 [00:43<02:35, 84.72ex/s]preprocess dataset:  20% 3192/16335 [00:43<02:30, 87.25ex/s]preprocess dataset:  20% 3203/16335 [00:43<02:23, 91.83ex/s]preprocess dataset:  20% 3213/16335 [00:44<02:19, 94.09ex/s]preprocess dataset:  20% 3223/16335 [00:44<02:17, 95.08ex/s]preprocess dataset:  20% 3233/16335 [00:44<02:20, 93.53ex/s]preprocess dataset:  20% 3243/16335 [00:44<02:50, 76.69ex/s]preprocess dataset:  20% 3253/16335 [00:44<02:39, 81.96ex/s]preprocess dataset:  20% 3264/16335 [00:44<02:29, 87.66ex/s]preprocess dataset:  20% 3274/16335 [00:44<02:26, 89.41ex/s]preprocess dataset:  20% 3284/16335 [00:44<02:26, 89.30ex/s]preprocess dataset:  20% 3294/16335 [00:45<02:23, 90.91ex/s]preprocess dataset:  20% 3304/16335 [00:45<02:21, 92.34ex/s]preprocess dataset:  20% 3314/16335 [00:45<02:26, 88.93ex/s]preprocess dataset:  20% 3323/16335 [00:45<02:35, 83.86ex/s]preprocess dataset:  20% 3332/16335 [00:45<02:48, 77.21ex/s]preprocess dataset:  20% 3340/16335 [00:45<03:01, 71.42ex/s]preprocess dataset:  20% 3348/16335 [00:45<02:58, 72.77ex/s]preprocess dataset:  21% 3356/16335 [00:45<03:05, 69.79ex/s]preprocess dataset:  21% 3366/16335 [00:45<02:52, 75.29ex/s]preprocess dataset:  21% 3374/16335 [00:46<02:55, 74.03ex/s]preprocess dataset:  21% 3382/16335 [00:46<03:03, 70.67ex/s]preprocess dataset:  21% 3390/16335 [00:46<03:10, 67.82ex/s]preprocess dataset:  21% 3398/16335 [00:46<03:05, 69.73ex/s]preprocess dataset:  21% 3407/16335 [00:46<02:55, 73.46ex/s]preprocess dataset:  21% 3415/16335 [00:46<02:57, 72.69ex/s]preprocess dataset:  21% 3423/16335 [00:46<02:59, 71.91ex/s]preprocess dataset:  21% 3431/16335 [00:46<03:01, 71.29ex/s]preprocess dataset:  21% 3439/16335 [00:47<02:59, 71.98ex/s]preprocess dataset:  21% 3447/16335 [00:47<03:11, 67.15ex/s]preprocess dataset:  21% 3454/16335 [00:47<03:17, 65.24ex/s]preprocess dataset:  21% 3461/16335 [00:47<03:13, 66.45ex/s]preprocess dataset:  21% 3469/16335 [00:47<03:08, 68.32ex/s]preprocess dataset:  21% 3477/16335 [00:47<03:05, 69.17ex/s]preprocess dataset:  21% 3484/16335 [00:47<03:07, 68.51ex/s]preprocess dataset:  21% 3491/16335 [00:47<03:07, 68.51ex/s]preprocess dataset:  21% 3499/16335 [00:47<03:03, 69.88ex/s]preprocess dataset:  21% 3507/16335 [00:48<03:01, 70.53ex/s]preprocess dataset:  22% 3515/16335 [00:48<03:07, 68.50ex/s]preprocess dataset:  22% 3523/16335 [00:48<03:07, 68.32ex/s]preprocess dataset:  22% 3530/16335 [00:48<03:08, 68.00ex/s]preprocess dataset:  22% 3538/16335 [00:48<03:03, 69.67ex/s]preprocess dataset:  22% 3547/16335 [00:48<02:52, 74.12ex/s]preprocess dataset:  22% 3556/16335 [00:48<02:46, 76.52ex/s]preprocess dataset:  22% 3564/16335 [00:48<03:10, 67.01ex/s]preprocess dataset:  22% 3573/16335 [00:48<02:58, 71.49ex/s]preprocess dataset:  22% 3581/16335 [00:49<03:13, 65.83ex/s]preprocess dataset:  22% 3589/16335 [00:49<03:04, 69.10ex/s]preprocess dataset:  22% 3597/16335 [00:49<03:03, 69.44ex/s]preprocess dataset:  22% 3606/16335 [00:49<02:54, 72.79ex/s]preprocess dataset:  22% 3615/16335 [00:49<02:48, 75.60ex/s]preprocess dataset:  22% 3624/16335 [00:49<02:46, 76.28ex/s]preprocess dataset:  22% 3633/16335 [00:49<02:43, 77.65ex/s]preprocess dataset:  22% 3641/16335 [00:49<02:53, 73.22ex/s]preprocess dataset:  22% 3650/16335 [00:50<02:49, 74.92ex/s]preprocess dataset:  22% 3658/16335 [00:50<02:53, 73.16ex/s]preprocess dataset:  22% 3666/16335 [00:50<02:56, 71.67ex/s]preprocess dataset:  22% 3675/16335 [00:50<02:46, 76.10ex/s]preprocess dataset:  23% 3683/16335 [00:50<02:57, 71.24ex/s]preprocess dataset:  23% 3691/16335 [00:50<02:57, 71.19ex/s]preprocess dataset:  23% 3700/16335 [00:50<02:49, 74.66ex/s]preprocess dataset:  23% 3708/16335 [00:50<02:50, 74.12ex/s]preprocess dataset:  23% 3717/16335 [00:50<02:46, 76.00ex/s]preprocess dataset:  23% 3725/16335 [00:51<02:56, 71.56ex/s]preprocess dataset:  23% 3733/16335 [00:51<03:10, 66.23ex/s]preprocess dataset:  23% 3742/16335 [00:51<03:02, 68.91ex/s]preprocess dataset:  23% 3750/16335 [00:51<03:01, 69.23ex/s]preprocess dataset:  23% 3758/16335 [00:51<02:59, 69.94ex/s]preprocess dataset:  23% 3766/16335 [00:51<02:55, 71.70ex/s]preprocess dataset:  23% 3774/16335 [00:51<02:53, 72.29ex/s]preprocess dataset:  23% 3783/16335 [00:51<02:46, 75.44ex/s]preprocess dataset:  23% 3791/16335 [00:51<02:44, 76.11ex/s]preprocess dataset:  23% 3799/16335 [00:52<02:44, 76.13ex/s]preprocess dataset:  23% 3807/16335 [00:52<02:42, 77.02ex/s]preprocess dataset:  23% 3816/16335 [00:52<02:36, 79.93ex/s]preprocess dataset:  23% 3825/16335 [00:52<02:41, 77.70ex/s]preprocess dataset:  23% 3833/16335 [00:52<02:41, 77.30ex/s]preprocess dataset:  24% 3842/16335 [00:52<02:40, 77.99ex/s]preprocess dataset:  24% 3851/16335 [00:52<02:36, 79.88ex/s]preprocess dataset:  24% 3860/16335 [00:52<02:39, 78.12ex/s]preprocess dataset:  24% 3868/16335 [00:52<02:41, 77.03ex/s]preprocess dataset:  24% 3876/16335 [00:53<02:54, 71.59ex/s]preprocess dataset:  24% 3885/16335 [00:53<02:46, 74.67ex/s]preprocess dataset:  24% 3893/16335 [00:53<02:59, 69.25ex/s]preprocess dataset:  24% 3901/16335 [00:53<03:03, 67.85ex/s]preprocess dataset:  24% 3908/16335 [00:53<03:15, 63.48ex/s]preprocess dataset:  24% 3915/16335 [00:53<03:32, 58.37ex/s]preprocess dataset:  24% 3923/16335 [00:53<03:21, 61.47ex/s]preprocess dataset:  24% 3930/16335 [00:53<03:22, 61.36ex/s]preprocess dataset:  24% 3938/16335 [00:54<03:09, 65.49ex/s]preprocess dataset:  24% 3947/16335 [00:54<02:56, 70.37ex/s]preprocess dataset:  24% 3955/16335 [00:54<02:51, 72.00ex/s]preprocess dataset:  24% 3964/16335 [00:54<02:44, 75.16ex/s]preprocess dataset:  24% 3972/16335 [00:54<02:50, 72.50ex/s]preprocess dataset:  24% 3980/16335 [00:54<03:08, 65.43ex/s]preprocess dataset:  24% 3987/16335 [00:54<03:20, 61.67ex/s]preprocess dataset:  24% 3995/16335 [00:54<03:06, 66.29ex/s]preprocess dataset:  24% 4002/16335 [00:56<14:05, 14.59ex/s]preprocess dataset:  25% 4009/16335 [00:56<10:56, 18.77ex/s]preprocess dataset:  25% 4016/16335 [00:56<08:40, 23.67ex/s]preprocess dataset:  25% 4024/16335 [00:56<06:47, 30.24ex/s]preprocess dataset:  25% 4033/16335 [00:56<05:15, 39.00ex/s]preprocess dataset:  25% 4041/16335 [00:56<04:34, 44.84ex/s]preprocess dataset:  25% 4049/16335 [00:56<03:59, 51.36ex/s]preprocess dataset:  25% 4057/16335 [00:57<03:36, 56.76ex/s]preprocess dataset:  25% 4065/16335 [00:57<03:31, 57.89ex/s]preprocess dataset:  25% 4073/16335 [00:57<03:18, 61.69ex/s]preprocess dataset:  25% 4081/16335 [00:57<03:18, 61.76ex/s]preprocess dataset:  25% 4089/16335 [00:57<03:09, 64.70ex/s]preprocess dataset:  25% 4097/16335 [00:57<03:01, 67.49ex/s]preprocess dataset:  25% 4106/16335 [00:57<02:51, 71.14ex/s]preprocess dataset:  25% 4114/16335 [00:57<02:53, 70.52ex/s]preprocess dataset:  25% 4122/16335 [00:57<02:52, 70.94ex/s]preprocess dataset:  25% 4130/16335 [00:58<02:49, 72.05ex/s]preprocess dataset:  25% 4138/16335 [00:58<02:47, 72.66ex/s]preprocess dataset:  25% 4146/16335 [00:58<03:27, 58.63ex/s]preprocess dataset:  25% 4154/16335 [00:58<03:13, 62.95ex/s]preprocess dataset:  25% 4161/16335 [00:58<03:09, 64.18ex/s]preprocess dataset:  26% 4169/16335 [00:58<02:59, 67.96ex/s]preprocess dataset:  26% 4178/16335 [00:58<02:53, 70.26ex/s]preprocess dataset:  26% 4186/16335 [00:58<02:59, 67.76ex/s]preprocess dataset:  26% 4194/16335 [00:59<02:54, 69.39ex/s]preprocess dataset:  26% 4202/16335 [00:59<02:53, 69.86ex/s]preprocess dataset:  26% 4211/16335 [00:59<02:41, 75.00ex/s]preprocess dataset:  26% 4219/16335 [00:59<02:55, 68.94ex/s]preprocess dataset:  26% 4227/16335 [00:59<02:56, 68.76ex/s]preprocess dataset:  26% 4236/16335 [00:59<02:47, 72.44ex/s]preprocess dataset:  26% 4245/16335 [00:59<02:40, 75.49ex/s]preprocess dataset:  26% 4253/16335 [00:59<02:44, 73.27ex/s]preprocess dataset:  26% 4261/16335 [00:59<02:43, 73.90ex/s]preprocess dataset:  26% 4269/16335 [01:00<02:46, 72.51ex/s]preprocess dataset:  26% 4277/16335 [01:00<02:42, 74.42ex/s]preprocess dataset:  26% 4285/16335 [01:00<02:50, 70.52ex/s]preprocess dataset:  26% 4293/16335 [01:00<02:53, 69.35ex/s]preprocess dataset:  26% 4302/16335 [01:00<02:43, 73.44ex/s]preprocess dataset:  26% 4310/16335 [01:00<02:45, 72.86ex/s]preprocess dataset:  26% 4318/16335 [01:00<02:40, 74.77ex/s]preprocess dataset:  26% 4327/16335 [01:00<02:32, 78.62ex/s]preprocess dataset:  27% 4335/16335 [01:00<02:37, 76.19ex/s]preprocess dataset:  27% 4343/16335 [01:01<02:47, 71.67ex/s]preprocess dataset:  27% 4352/16335 [01:01<02:39, 75.24ex/s]preprocess dataset:  27% 4360/16335 [01:01<02:42, 73.49ex/s]preprocess dataset:  27% 4368/16335 [01:01<02:42, 73.57ex/s]preprocess dataset:  27% 4376/16335 [01:01<02:40, 74.44ex/s]preprocess dataset:  27% 4384/16335 [01:01<02:45, 72.33ex/s]preprocess dataset:  27% 4392/16335 [01:01<02:43, 73.07ex/s]preprocess dataset:  27% 4400/16335 [01:01<02:43, 73.18ex/s]preprocess dataset:  27% 4408/16335 [01:02<02:46, 71.76ex/s]preprocess dataset:  27% 4417/16335 [01:02<02:38, 75.10ex/s]preprocess dataset:  27% 4425/16335 [01:02<02:45, 72.15ex/s]preprocess dataset:  27% 4433/16335 [01:02<02:47, 71.14ex/s]preprocess dataset:  27% 4441/16335 [01:02<02:42, 72.99ex/s]preprocess dataset:  27% 4449/16335 [01:02<02:44, 72.10ex/s]preprocess dataset:  27% 4457/16335 [01:02<02:46, 71.52ex/s]preprocess dataset:  27% 4465/16335 [01:02<02:46, 71.43ex/s]preprocess dataset:  27% 4473/16335 [01:02<02:45, 71.76ex/s]preprocess dataset:  27% 4481/16335 [01:03<02:46, 71.31ex/s]preprocess dataset:  27% 4489/16335 [01:03<02:50, 69.42ex/s]preprocess dataset:  28% 4497/16335 [01:03<02:48, 70.45ex/s]preprocess dataset:  28% 4505/16335 [01:03<02:50, 69.43ex/s]preprocess dataset:  28% 4512/16335 [01:03<02:54, 67.82ex/s]preprocess dataset:  28% 4519/16335 [01:03<02:57, 66.69ex/s]preprocess dataset:  28% 4526/16335 [01:03<03:11, 61.66ex/s]preprocess dataset:  28% 4533/16335 [01:03<03:11, 61.68ex/s]preprocess dataset:  28% 4540/16335 [01:03<03:06, 63.30ex/s]preprocess dataset:  28% 4548/16335 [01:04<02:57, 66.59ex/s]preprocess dataset:  28% 4555/16335 [01:04<03:00, 65.27ex/s]preprocess dataset:  28% 4562/16335 [01:04<03:02, 64.34ex/s]preprocess dataset:  28% 4570/16335 [01:04<02:53, 67.77ex/s]preprocess dataset:  28% 4577/16335 [01:04<02:54, 67.46ex/s]preprocess dataset:  28% 4584/16335 [01:04<02:52, 67.94ex/s]preprocess dataset:  28% 4591/16335 [01:04<02:58, 65.93ex/s]preprocess dataset:  28% 4598/16335 [01:04<03:01, 64.80ex/s]preprocess dataset:  28% 4605/16335 [01:04<02:57, 66.03ex/s]preprocess dataset:  28% 4613/16335 [01:05<02:50, 68.63ex/s]preprocess dataset:  28% 4621/16335 [01:05<02:47, 69.99ex/s]preprocess dataset:  28% 4629/16335 [01:05<02:43, 71.60ex/s]preprocess dataset:  28% 4638/16335 [01:05<02:38, 73.86ex/s]preprocess dataset:  28% 4646/16335 [01:05<02:35, 75.24ex/s]preprocess dataset:  28% 4654/16335 [01:05<02:34, 75.47ex/s]preprocess dataset:  29% 4662/16335 [01:05<02:47, 69.64ex/s]preprocess dataset:  29% 4670/16335 [01:05<02:52, 67.72ex/s]preprocess dataset:  29% 4678/16335 [01:05<02:50, 68.44ex/s]preprocess dataset:  29% 4686/16335 [01:06<02:47, 69.46ex/s]preprocess dataset:  29% 4694/16335 [01:06<02:48, 69.00ex/s]preprocess dataset:  29% 4703/16335 [01:06<02:38, 73.40ex/s]preprocess dataset:  29% 4712/16335 [01:06<02:33, 75.83ex/s]preprocess dataset:  29% 4720/16335 [01:06<02:33, 75.64ex/s]preprocess dataset:  29% 4728/16335 [01:06<02:34, 75.29ex/s]preprocess dataset:  29% 4736/16335 [01:06<02:36, 74.35ex/s]preprocess dataset:  29% 4744/16335 [01:06<02:36, 74.18ex/s]preprocess dataset:  29% 4753/16335 [01:06<02:28, 78.04ex/s]preprocess dataset:  29% 4761/16335 [01:07<02:51, 67.68ex/s]preprocess dataset:  29% 4769/16335 [01:07<02:47, 68.98ex/s]preprocess dataset:  29% 4777/16335 [01:07<02:47, 68.83ex/s]preprocess dataset:  29% 4785/16335 [01:07<02:43, 70.60ex/s]preprocess dataset:  29% 4793/16335 [01:07<02:42, 70.87ex/s]preprocess dataset:  29% 4801/16335 [01:07<02:47, 68.92ex/s]preprocess dataset:  29% 4810/16335 [01:07<02:38, 72.51ex/s]preprocess dataset:  29% 4818/16335 [01:07<02:45, 69.48ex/s]preprocess dataset:  30% 4826/16335 [01:07<02:44, 69.90ex/s]preprocess dataset:  30% 4835/16335 [01:08<02:37, 73.03ex/s]preprocess dataset:  30% 4843/16335 [01:08<02:38, 72.50ex/s]preprocess dataset:  30% 4852/16335 [01:08<02:29, 76.83ex/s]preprocess dataset:  30% 4860/16335 [01:08<02:29, 76.73ex/s]preprocess dataset:  30% 4869/16335 [01:08<02:28, 77.45ex/s]preprocess dataset:  30% 4878/16335 [01:08<02:24, 79.06ex/s]preprocess dataset:  30% 4887/16335 [01:08<02:23, 79.73ex/s]preprocess dataset:  30% 4896/16335 [01:08<02:22, 80.49ex/s]preprocess dataset:  30% 4905/16335 [01:08<02:27, 77.51ex/s]preprocess dataset:  30% 4913/16335 [01:09<02:37, 72.55ex/s]preprocess dataset:  30% 4921/16335 [01:09<02:35, 73.27ex/s]preprocess dataset:  30% 4929/16335 [01:09<02:42, 70.26ex/s]preprocess dataset:  30% 4938/16335 [01:09<02:33, 74.44ex/s]preprocess dataset:  30% 4946/16335 [01:09<02:32, 74.74ex/s]preprocess dataset:  30% 4954/16335 [01:09<02:34, 73.57ex/s]preprocess dataset:  30% 4962/16335 [01:09<02:35, 72.92ex/s]preprocess dataset:  30% 4970/16335 [01:09<02:40, 70.62ex/s]preprocess dataset:  30% 4978/16335 [01:10<02:40, 70.79ex/s]preprocess dataset:  31% 4986/16335 [01:10<02:39, 71.35ex/s]preprocess dataset:  31% 4994/16335 [01:10<02:42, 69.84ex/s]preprocess dataset:  31% 5002/16335 [01:11<12:38, 14.95ex/s]preprocess dataset:  31% 5009/16335 [01:11<09:59, 18.90ex/s]preprocess dataset:  31% 5016/16335 [01:11<07:56, 23.73ex/s]preprocess dataset:  31% 5024/16335 [01:12<06:16, 30.07ex/s]preprocess dataset:  31% 5032/16335 [01:12<05:08, 36.61ex/s]preprocess dataset:  31% 5041/16335 [01:12<04:12, 44.76ex/s]preprocess dataset:  31% 5049/16335 [01:12<03:41, 50.91ex/s]preprocess dataset:  31% 5057/16335 [01:12<03:26, 54.68ex/s]preprocess dataset:  31% 5065/16335 [01:12<03:15, 57.72ex/s]preprocess dataset:  31% 5072/16335 [01:12<03:15, 57.62ex/s]preprocess dataset:  31% 5081/16335 [01:12<02:56, 63.67ex/s]preprocess dataset:  31% 5089/16335 [01:12<02:46, 67.41ex/s]preprocess dataset:  31% 5097/16335 [01:13<02:49, 66.27ex/s]preprocess dataset:  31% 5104/16335 [01:13<02:47, 66.91ex/s]preprocess dataset:  31% 5111/16335 [01:13<03:21, 55.64ex/s]preprocess dataset:  31% 5119/16335 [01:13<03:09, 59.19ex/s]preprocess dataset:  31% 5127/16335 [01:13<02:58, 62.71ex/s]preprocess dataset:  31% 5134/16335 [01:13<02:54, 64.18ex/s]preprocess dataset:  31% 5142/16335 [01:13<02:47, 66.91ex/s]preprocess dataset:  32% 5151/16335 [01:13<02:33, 72.90ex/s]preprocess dataset:  32% 5159/16335 [01:14<02:31, 73.55ex/s]preprocess dataset:  32% 5167/16335 [01:14<02:31, 73.96ex/s]preprocess dataset:  32% 5175/16335 [01:14<02:30, 74.35ex/s]preprocess dataset:  32% 5183/16335 [01:14<02:35, 71.90ex/s]preprocess dataset:  32% 5191/16335 [01:14<02:32, 73.09ex/s]preprocess dataset:  32% 5200/16335 [01:14<02:29, 74.73ex/s]preprocess dataset:  32% 5209/16335 [01:14<02:23, 77.64ex/s]preprocess dataset:  32% 5217/16335 [01:14<02:23, 77.41ex/s]preprocess dataset:  32% 5225/16335 [01:14<02:33, 72.29ex/s]preprocess dataset:  32% 5233/16335 [01:15<02:32, 72.77ex/s]preprocess dataset:  32% 5241/16335 [01:15<02:37, 70.45ex/s]preprocess dataset:  32% 5249/16335 [01:15<02:31, 73.00ex/s]preprocess dataset:  32% 5257/16335 [01:15<02:32, 72.67ex/s]preprocess dataset:  32% 5265/16335 [01:15<02:30, 73.77ex/s]preprocess dataset:  32% 5274/16335 [01:15<02:28, 74.25ex/s]preprocess dataset:  32% 5282/16335 [01:15<02:33, 72.11ex/s]preprocess dataset:  32% 5290/16335 [01:15<02:31, 73.05ex/s]preprocess dataset:  32% 5299/16335 [01:15<02:24, 76.17ex/s]preprocess dataset:  32% 5307/16335 [01:16<02:25, 75.82ex/s]preprocess dataset:  33% 5316/16335 [01:16<02:22, 77.49ex/s]preprocess dataset:  33% 5324/16335 [01:16<02:24, 75.98ex/s]preprocess dataset:  33% 5332/16335 [01:16<02:25, 75.87ex/s]preprocess dataset:  33% 5340/16335 [01:16<02:26, 75.06ex/s]preprocess dataset:  33% 5348/16335 [01:16<02:29, 73.52ex/s]preprocess dataset:  33% 5356/16335 [01:16<02:29, 73.67ex/s]preprocess dataset:  33% 5364/16335 [01:16<02:50, 64.35ex/s]preprocess dataset:  33% 5373/16335 [01:16<02:40, 68.17ex/s]preprocess dataset:  33% 5381/16335 [01:17<02:33, 71.15ex/s]preprocess dataset:  33% 5389/16335 [01:17<02:34, 70.94ex/s]preprocess dataset:  33% 5398/16335 [01:17<02:27, 74.32ex/s]preprocess dataset:  33% 5406/16335 [01:17<02:25, 75.20ex/s]preprocess dataset:  33% 5415/16335 [01:17<02:19, 78.01ex/s]preprocess dataset:  33% 5423/16335 [01:17<02:21, 77.18ex/s]preprocess dataset:  33% 5431/16335 [01:17<02:25, 74.84ex/s]preprocess dataset:  33% 5439/16335 [01:17<02:24, 75.48ex/s]preprocess dataset:  33% 5447/16335 [01:18<02:56, 61.69ex/s]preprocess dataset:  33% 5454/16335 [01:18<02:54, 62.42ex/s]preprocess dataset:  33% 5461/16335 [01:18<02:54, 62.28ex/s]preprocess dataset:  33% 5468/16335 [01:18<02:55, 61.89ex/s]preprocess dataset:  34% 5476/16335 [01:18<02:46, 65.38ex/s]preprocess dataset:  34% 5483/16335 [01:18<02:51, 63.10ex/s]preprocess dataset:  34% 5490/16335 [01:18<02:49, 63.90ex/s]preprocess dataset:  34% 5497/16335 [01:18<02:56, 61.37ex/s]preprocess dataset:  34% 5505/16335 [01:18<02:47, 64.53ex/s]preprocess dataset:  34% 5512/16335 [01:19<02:44, 65.63ex/s]preprocess dataset:  34% 5520/16335 [01:19<02:38, 68.13ex/s]preprocess dataset:  34% 5527/16335 [01:19<02:39, 67.56ex/s]preprocess dataset:  34% 5534/16335 [01:19<02:41, 66.83ex/s]preprocess dataset:  34% 5542/16335 [01:19<02:38, 67.89ex/s]preprocess dataset:  34% 5549/16335 [01:19<02:39, 67.47ex/s]preprocess dataset:  34% 5557/16335 [01:19<02:35, 69.22ex/s]preprocess dataset:  34% 5565/16335 [01:19<02:31, 71.19ex/s]preprocess dataset:  34% 5574/16335 [01:19<02:23, 74.90ex/s]preprocess dataset:  34% 5582/16335 [01:20<02:23, 75.19ex/s]preprocess dataset:  34% 5590/16335 [01:20<02:25, 74.00ex/s]preprocess dataset:  34% 5598/16335 [01:20<02:25, 73.79ex/s]preprocess dataset:  34% 5606/16335 [01:20<02:26, 73.38ex/s]preprocess dataset:  34% 5614/16335 [01:20<02:29, 71.61ex/s]preprocess dataset:  34% 5622/16335 [01:20<02:30, 71.17ex/s]preprocess dataset:  34% 5630/16335 [01:20<02:30, 71.23ex/s]preprocess dataset:  35% 5638/16335 [01:20<02:32, 69.95ex/s]preprocess dataset:  35% 5646/16335 [01:20<02:28, 72.04ex/s]preprocess dataset:  35% 5654/16335 [01:21<02:25, 73.61ex/s]preprocess dataset:  35% 5662/16335 [01:21<02:23, 74.19ex/s]preprocess dataset:  35% 5671/16335 [01:21<02:21, 75.14ex/s]preprocess dataset:  35% 5680/16335 [01:21<02:18, 76.98ex/s]preprocess dataset:  35% 5688/16335 [01:21<02:18, 76.85ex/s]preprocess dataset:  35% 5696/16335 [01:21<02:21, 75.29ex/s]preprocess dataset:  35% 5704/16335 [01:21<02:22, 74.72ex/s]preprocess dataset:  35% 5713/16335 [01:21<02:18, 76.81ex/s]preprocess dataset:  35% 5721/16335 [01:21<02:18, 76.79ex/s]preprocess dataset:  35% 5730/16335 [01:21<02:14, 79.03ex/s]preprocess dataset:  35% 5738/16335 [01:22<02:15, 78.30ex/s]preprocess dataset:  35% 5747/16335 [01:22<02:13, 79.51ex/s]preprocess dataset:  35% 5755/16335 [01:22<02:17, 76.88ex/s]preprocess dataset:  35% 5763/16335 [01:22<02:22, 74.25ex/s]preprocess dataset:  35% 5771/16335 [01:22<02:20, 75.38ex/s]preprocess dataset:  35% 5779/16335 [01:22<02:27, 71.63ex/s]preprocess dataset:  35% 5787/16335 [01:22<02:30, 70.12ex/s]preprocess dataset:  35% 5795/16335 [01:22<02:32, 69.04ex/s]preprocess dataset:  36% 5804/16335 [01:22<02:22, 73.66ex/s]preprocess dataset:  36% 5813/16335 [01:23<02:20, 75.01ex/s]preprocess dataset:  36% 5821/16335 [01:23<02:22, 73.95ex/s]preprocess dataset:  36% 5829/16335 [01:23<02:24, 72.87ex/s]preprocess dataset:  36% 5837/16335 [01:23<02:22, 73.88ex/s]preprocess dataset:  36% 5845/16335 [01:23<02:21, 74.26ex/s]preprocess dataset:  36% 5853/16335 [01:23<02:26, 71.36ex/s]preprocess dataset:  36% 5861/16335 [01:23<02:23, 73.16ex/s]preprocess dataset:  36% 5869/16335 [01:23<02:29, 69.92ex/s]preprocess dataset:  36% 5877/16335 [01:24<02:44, 63.70ex/s]preprocess dataset:  36% 5884/16335 [01:24<02:40, 65.08ex/s]preprocess dataset:  36% 5892/16335 [01:24<02:34, 67.40ex/s]preprocess dataset:  36% 5900/16335 [01:24<02:29, 69.84ex/s]preprocess dataset:  36% 5909/16335 [01:24<02:23, 72.66ex/s]preprocess dataset:  36% 5917/16335 [01:24<02:21, 73.72ex/s]preprocess dataset:  36% 5926/16335 [01:24<02:13, 78.05ex/s]preprocess dataset:  36% 5935/16335 [01:24<02:09, 80.52ex/s]preprocess dataset:  36% 5944/16335 [01:24<02:16, 75.94ex/s]preprocess dataset:  36% 5952/16335 [01:25<02:15, 76.61ex/s]preprocess dataset:  36% 5960/16335 [01:25<02:19, 74.52ex/s]preprocess dataset:  37% 5968/16335 [01:25<02:23, 72.34ex/s]preprocess dataset:  37% 5976/16335 [01:25<02:20, 73.52ex/s]preprocess dataset:  37% 5984/16335 [01:25<02:22, 72.66ex/s]preprocess dataset:  37% 5993/16335 [01:25<02:19, 73.91ex/s]preprocess dataset:  37% 6001/16335 [01:27<12:32, 13.73ex/s]preprocess dataset:  37% 6009/16335 [01:27<09:37, 17.89ex/s]preprocess dataset:  37% 6015/16335 [01:27<08:17, 20.76ex/s]preprocess dataset:  37% 6021/16335 [01:27<07:04, 24.27ex/s]preprocess dataset:  37% 6027/16335 [01:27<06:04, 28.28ex/s]preprocess dataset:  37% 6034/16335 [01:27<04:58, 34.52ex/s]preprocess dataset:  37% 6041/16335 [01:28<04:14, 40.46ex/s]preprocess dataset:  37% 6049/16335 [01:28<03:39, 46.91ex/s]preprocess dataset:  37% 6056/16335 [01:28<03:27, 49.61ex/s]preprocess dataset:  37% 6064/16335 [01:28<03:04, 55.76ex/s]preprocess dataset:  37% 6071/16335 [01:28<02:57, 57.88ex/s]preprocess dataset:  37% 6078/16335 [01:28<02:53, 59.14ex/s]preprocess dataset:  37% 6085/16335 [01:28<02:47, 61.31ex/s]preprocess dataset:  37% 6093/16335 [01:28<02:37, 65.22ex/s]preprocess dataset:  37% 6101/16335 [01:28<02:29, 68.41ex/s]preprocess dataset:  37% 6109/16335 [01:29<02:25, 70.31ex/s]preprocess dataset:  37% 6117/16335 [01:29<02:21, 72.15ex/s]preprocess dataset:  38% 6126/16335 [01:29<02:15, 75.59ex/s]preprocess dataset:  38% 6134/16335 [01:29<02:13, 76.60ex/s]preprocess dataset:  38% 6142/16335 [01:29<02:17, 74.03ex/s]preprocess dataset:  38% 6150/16335 [01:29<02:20, 72.49ex/s]preprocess dataset:  38% 6158/16335 [01:29<02:25, 69.91ex/s]preprocess dataset:  38% 6166/16335 [01:29<02:23, 70.99ex/s]preprocess dataset:  38% 6175/16335 [01:29<02:15, 74.92ex/s]preprocess dataset:  38% 6183/16335 [01:30<02:19, 72.65ex/s]preprocess dataset:  38% 6191/16335 [01:30<02:23, 70.74ex/s]preprocess dataset:  38% 6199/16335 [01:30<02:19, 72.84ex/s]preprocess dataset:  38% 6207/16335 [01:30<02:33, 66.09ex/s]preprocess dataset:  38% 6215/16335 [01:30<02:25, 69.35ex/s]preprocess dataset:  38% 6223/16335 [01:30<02:29, 67.79ex/s]preprocess dataset:  38% 6230/16335 [01:30<02:31, 66.80ex/s]preprocess dataset:  38% 6238/16335 [01:30<02:35, 65.10ex/s]preprocess dataset:  38% 6246/16335 [01:30<02:31, 66.60ex/s]preprocess dataset:  38% 6253/16335 [01:31<02:29, 67.28ex/s]preprocess dataset:  38% 6260/16335 [01:31<02:30, 66.96ex/s]preprocess dataset:  38% 6267/16335 [01:31<02:30, 67.01ex/s]preprocess dataset:  38% 6274/16335 [01:31<02:38, 63.33ex/s]preprocess dataset:  38% 6281/16335 [01:31<02:36, 64.30ex/s]preprocess dataset:  39% 6289/16335 [01:31<02:26, 68.55ex/s]preprocess dataset:  39% 6296/16335 [01:31<02:33, 65.57ex/s]preprocess dataset:  39% 6304/16335 [01:31<02:25, 68.92ex/s]preprocess dataset:  39% 6312/16335 [01:31<02:19, 71.62ex/s]preprocess dataset:  39% 6320/16335 [01:32<02:27, 67.90ex/s]preprocess dataset:  39% 6328/16335 [01:32<02:24, 69.46ex/s]preprocess dataset:  39% 6336/16335 [01:32<02:23, 69.77ex/s]preprocess dataset:  39% 6344/16335 [01:32<02:22, 70.34ex/s]preprocess dataset:  39% 6352/16335 [01:32<02:22, 70.27ex/s]preprocess dataset:  39% 6362/16335 [01:32<02:09, 76.77ex/s]preprocess dataset:  39% 6370/16335 [01:32<02:12, 75.26ex/s]preprocess dataset:  39% 6378/16335 [01:32<02:16, 73.11ex/s]preprocess dataset:  39% 6386/16335 [01:32<02:22, 69.97ex/s]preprocess dataset:  39% 6394/16335 [01:33<02:25, 68.33ex/s]preprocess dataset:  39% 6401/16335 [01:33<02:25, 68.38ex/s]preprocess dataset:  39% 6408/16335 [01:33<02:45, 60.09ex/s]preprocess dataset:  39% 6415/16335 [01:33<02:43, 60.60ex/s]preprocess dataset:  39% 6422/16335 [01:33<02:39, 62.24ex/s]preprocess dataset:  39% 6429/16335 [01:33<02:34, 64.01ex/s]preprocess dataset:  39% 6438/16335 [01:33<02:22, 69.51ex/s]preprocess dataset:  39% 6446/16335 [01:33<02:16, 72.38ex/s]preprocess dataset:  40% 6454/16335 [01:34<02:15, 73.12ex/s]preprocess dataset:  40% 6462/16335 [01:34<02:18, 71.53ex/s]preprocess dataset:  40% 6471/16335 [01:34<02:11, 74.90ex/s]preprocess dataset:  40% 6480/16335 [01:34<02:07, 77.04ex/s]preprocess dataset:  40% 6488/16335 [01:34<02:10, 75.25ex/s]preprocess dataset:  40% 6496/16335 [01:34<02:13, 73.60ex/s]preprocess dataset:  40% 6504/16335 [01:34<02:23, 68.56ex/s]preprocess dataset:  40% 6511/16335 [01:34<02:26, 67.23ex/s]preprocess dataset:  40% 6519/16335 [01:34<02:23, 68.28ex/s]preprocess dataset:  40% 6527/16335 [01:35<02:18, 70.70ex/s]preprocess dataset:  40% 6535/16335 [01:35<02:14, 72.97ex/s]preprocess dataset:  40% 6543/16335 [01:35<02:18, 70.66ex/s]preprocess dataset:  40% 6551/16335 [01:35<02:18, 70.85ex/s]preprocess dataset:  40% 6560/16335 [01:35<02:13, 72.95ex/s]preprocess dataset:  40% 6568/16335 [01:35<02:15, 72.26ex/s]preprocess dataset:  40% 6577/16335 [01:35<02:08, 75.81ex/s]preprocess dataset:  40% 6585/16335 [01:35<02:07, 76.27ex/s]preprocess dataset:  40% 6593/16335 [01:35<02:10, 74.80ex/s]preprocess dataset:  40% 6601/16335 [01:36<02:08, 75.66ex/s]preprocess dataset:  40% 6610/16335 [01:36<02:06, 77.15ex/s]preprocess dataset:  41% 6618/16335 [01:36<02:13, 72.92ex/s]preprocess dataset:  41% 6626/16335 [01:36<02:39, 60.72ex/s]preprocess dataset:  41% 6635/16335 [01:36<02:28, 65.45ex/s]preprocess dataset:  41% 6643/16335 [01:36<02:31, 64.04ex/s]preprocess dataset:  41% 6651/16335 [01:36<02:23, 67.63ex/s]preprocess dataset:  41% 6658/16335 [01:36<02:22, 67.93ex/s]preprocess dataset:  41% 6665/16335 [01:37<02:25, 66.57ex/s]preprocess dataset:  41% 6672/16335 [01:37<02:24, 66.75ex/s]preprocess dataset:  41% 6679/16335 [01:37<02:26, 65.85ex/s]preprocess dataset:  41% 6686/16335 [01:37<02:24, 66.69ex/s]preprocess dataset:  41% 6696/16335 [01:37<02:11, 73.31ex/s]preprocess dataset:  41% 6705/16335 [01:37<02:06, 76.29ex/s]preprocess dataset:  41% 6713/16335 [01:37<02:07, 75.64ex/s]preprocess dataset:  41% 6721/16335 [01:37<02:08, 75.01ex/s]preprocess dataset:  41% 6729/16335 [01:37<02:06, 75.94ex/s]preprocess dataset:  41% 6737/16335 [01:37<02:05, 76.36ex/s]preprocess dataset:  41% 6746/16335 [01:38<02:05, 76.65ex/s]preprocess dataset:  41% 6755/16335 [01:38<02:00, 79.41ex/s]preprocess dataset:  41% 6763/16335 [01:38<02:03, 77.58ex/s]preprocess dataset:  41% 6771/16335 [01:38<02:07, 75.02ex/s]preprocess dataset:  41% 6779/16335 [01:38<02:09, 73.65ex/s]preprocess dataset:  42% 6787/16335 [01:38<02:08, 74.30ex/s]preprocess dataset:  42% 6796/16335 [01:38<02:04, 76.71ex/s]preprocess dataset:  42% 6805/16335 [01:38<01:58, 80.16ex/s]preprocess dataset:  42% 6814/16335 [01:38<01:57, 81.18ex/s]preprocess dataset:  42% 6823/16335 [01:39<01:59, 79.35ex/s]preprocess dataset:  42% 6831/16335 [01:39<01:59, 79.27ex/s]preprocess dataset:  42% 6839/16335 [01:39<02:03, 76.96ex/s]preprocess dataset:  42% 6847/16335 [01:39<02:07, 74.23ex/s]preprocess dataset:  42% 6855/16335 [01:39<02:08, 73.97ex/s]preprocess dataset:  42% 6864/16335 [01:39<02:00, 78.36ex/s]preprocess dataset:  42% 6872/16335 [01:39<02:03, 76.32ex/s]preprocess dataset:  42% 6880/16335 [01:39<02:02, 77.26ex/s]preprocess dataset:  42% 6888/16335 [01:39<02:03, 76.35ex/s]preprocess dataset:  42% 6896/16335 [01:40<02:08, 73.45ex/s]preprocess dataset:  42% 6906/16335 [01:40<01:59, 79.11ex/s]preprocess dataset:  42% 6914/16335 [01:40<02:02, 76.70ex/s]preprocess dataset:  42% 6922/16335 [01:40<02:04, 75.35ex/s]preprocess dataset:  42% 6931/16335 [01:40<02:00, 78.28ex/s]preprocess dataset:  42% 6939/16335 [01:40<02:08, 72.91ex/s]preprocess dataset:  43% 6947/16335 [01:40<02:12, 70.90ex/s]preprocess dataset:  43% 6956/16335 [01:40<02:05, 74.63ex/s]preprocess dataset:  43% 6964/16335 [01:40<02:06, 74.33ex/s]preprocess dataset:  43% 6972/16335 [01:41<02:11, 70.99ex/s]preprocess dataset:  43% 6981/16335 [01:41<02:05, 74.58ex/s]preprocess dataset:  43% 6989/16335 [01:41<02:02, 75.99ex/s]preprocess dataset:  43% 6998/16335 [01:41<02:00, 77.60ex/s]preprocess dataset:  43% 7006/16335 [01:42<09:16, 16.75ex/s]preprocess dataset:  43% 7014/16335 [01:42<07:10, 21.64ex/s]preprocess dataset:  43% 7022/16335 [01:43<05:39, 27.46ex/s]preprocess dataset:  43% 7031/16335 [01:43<04:24, 35.19ex/s]preprocess dataset:  43% 7040/16335 [01:43<03:36, 42.98ex/s]preprocess dataset:  43% 7048/16335 [01:43<03:10, 48.72ex/s]preprocess dataset:  43% 7056/16335 [01:43<02:49, 54.84ex/s]preprocess dataset:  43% 7064/16335 [01:43<02:34, 60.14ex/s]preprocess dataset:  43% 7072/16335 [01:43<02:27, 62.73ex/s]preprocess dataset:  43% 7080/16335 [01:43<02:22, 64.94ex/s]preprocess dataset:  43% 7088/16335 [01:43<02:15, 68.14ex/s]preprocess dataset:  43% 7096/16335 [01:43<02:09, 71.19ex/s]preprocess dataset:  43% 7104/16335 [01:44<02:06, 73.17ex/s]preprocess dataset:  44% 7112/16335 [01:44<02:05, 73.59ex/s]preprocess dataset:  44% 7120/16335 [01:44<02:03, 74.40ex/s]preprocess dataset:  44% 7128/16335 [01:44<02:01, 75.50ex/s]preprocess dataset:  44% 7137/16335 [01:44<02:05, 73.35ex/s]preprocess dataset:  44% 7146/16335 [01:44<01:59, 76.98ex/s]preprocess dataset:  44% 7154/16335 [01:44<01:58, 77.70ex/s]preprocess dataset:  44% 7162/16335 [01:44<01:58, 77.69ex/s]preprocess dataset:  44% 7170/16335 [01:44<02:02, 75.11ex/s]preprocess dataset:  44% 7178/16335 [01:45<02:02, 74.45ex/s]preprocess dataset:  44% 7186/16335 [01:45<02:01, 75.55ex/s]preprocess dataset:  44% 7194/16335 [01:45<02:02, 74.62ex/s]preprocess dataset:  44% 7202/16335 [01:45<02:08, 70.96ex/s]preprocess dataset:  44% 7210/16335 [01:45<02:14, 67.76ex/s]preprocess dataset:  44% 7217/16335 [01:45<02:17, 66.23ex/s]preprocess dataset:  44% 7224/16335 [01:45<02:17, 66.45ex/s]preprocess dataset:  44% 7231/16335 [01:45<02:18, 65.91ex/s]preprocess dataset:  44% 7239/16335 [01:45<02:15, 67.29ex/s]preprocess dataset:  44% 7246/16335 [01:46<02:22, 63.79ex/s]preprocess dataset:  44% 7254/16335 [01:46<02:13, 67.90ex/s]preprocess dataset:  44% 7261/16335 [01:46<02:17, 65.99ex/s]preprocess dataset:  44% 7269/16335 [01:46<02:13, 68.00ex/s]preprocess dataset:  45% 7278/16335 [01:46<02:07, 71.06ex/s]preprocess dataset:  45% 7287/16335 [01:46<02:05, 72.20ex/s]preprocess dataset:  45% 7295/16335 [01:46<02:15, 66.90ex/s]preprocess dataset:  45% 7303/16335 [01:46<02:10, 69.29ex/s]preprocess dataset:  45% 7311/16335 [01:47<02:36, 57.77ex/s]preprocess dataset:  45% 7319/16335 [01:47<02:24, 62.51ex/s]preprocess dataset:  45% 7328/16335 [01:47<02:09, 69.35ex/s]preprocess dataset:  45% 7336/16335 [01:47<02:05, 71.73ex/s]preprocess dataset:  45% 7344/16335 [01:47<02:10, 69.00ex/s]preprocess dataset:  45% 7352/16335 [01:47<02:05, 71.55ex/s]preprocess dataset:  45% 7360/16335 [01:47<02:06, 70.97ex/s]preprocess dataset:  45% 7369/16335 [01:47<02:01, 73.59ex/s]preprocess dataset:  45% 7377/16335 [01:47<02:06, 71.03ex/s]preprocess dataset:  45% 7385/16335 [01:48<02:06, 70.67ex/s]preprocess dataset:  45% 7394/16335 [01:48<02:00, 73.97ex/s]preprocess dataset:  45% 7402/16335 [01:48<02:02, 73.09ex/s]preprocess dataset:  45% 7411/16335 [01:48<01:54, 77.62ex/s]preprocess dataset:  45% 7419/16335 [01:48<01:58, 75.47ex/s]preprocess dataset:  45% 7427/16335 [01:48<01:56, 76.59ex/s]preprocess dataset:  46% 7435/16335 [01:48<01:58, 74.80ex/s]preprocess dataset:  46% 7445/16335 [01:48<01:52, 78.90ex/s]preprocess dataset:  46% 7453/16335 [01:48<01:53, 78.02ex/s]preprocess dataset:  46% 7461/16335 [01:49<01:58, 75.07ex/s]preprocess dataset:  46% 7469/16335 [01:49<01:56, 76.23ex/s]preprocess dataset:  46% 7477/16335 [01:49<01:58, 74.97ex/s]preprocess dataset:  46% 7485/16335 [01:49<02:04, 70.94ex/s]preprocess dataset:  46% 7495/16335 [01:49<01:55, 76.54ex/s]preprocess dataset:  46% 7503/16335 [01:49<01:57, 75.10ex/s]preprocess dataset:  46% 7511/16335 [01:49<01:58, 74.31ex/s]preprocess dataset:  46% 7519/16335 [01:49<02:01, 72.36ex/s]preprocess dataset:  46% 7527/16335 [01:49<02:00, 72.83ex/s]preprocess dataset:  46% 7535/16335 [01:50<02:00, 73.04ex/s]preprocess dataset:  46% 7545/16335 [01:50<01:50, 79.42ex/s]preprocess dataset:  46% 7553/16335 [01:50<01:50, 79.57ex/s]preprocess dataset:  46% 7561/16335 [01:50<01:50, 79.18ex/s]preprocess dataset:  46% 7569/16335 [01:50<01:50, 79.34ex/s]preprocess dataset:  46% 7578/16335 [01:50<01:50, 79.52ex/s]preprocess dataset:  46% 7586/16335 [01:50<01:53, 76.83ex/s]preprocess dataset:  46% 7595/16335 [01:50<01:50, 79.17ex/s]preprocess dataset:  47% 7604/16335 [01:50<01:46, 82.01ex/s]preprocess dataset:  47% 7613/16335 [01:51<01:51, 78.51ex/s]preprocess dataset:  47% 7621/16335 [01:51<01:51, 78.23ex/s]preprocess dataset:  47% 7630/16335 [01:51<01:49, 79.79ex/s]preprocess dataset:  47% 7639/16335 [01:51<01:57, 74.11ex/s]preprocess dataset:  47% 7647/16335 [01:51<01:59, 72.70ex/s]preprocess dataset:  47% 7655/16335 [01:51<02:19, 62.22ex/s]preprocess dataset:  47% 7665/16335 [01:51<02:05, 69.08ex/s]preprocess dataset:  47% 7673/16335 [01:51<02:08, 67.18ex/s]preprocess dataset:  47% 7681/16335 [01:52<02:06, 68.63ex/s]preprocess dataset:  47% 7690/16335 [01:52<01:56, 73.92ex/s]preprocess dataset:  47% 7699/16335 [01:52<01:50, 78.21ex/s]preprocess dataset:  47% 7708/16335 [01:52<01:50, 78.29ex/s]preprocess dataset:  47% 7716/16335 [01:52<01:55, 74.45ex/s]preprocess dataset:  47% 7724/16335 [01:52<02:02, 70.45ex/s]preprocess dataset:  47% 7732/16335 [01:52<02:07, 67.67ex/s]preprocess dataset:  47% 7739/16335 [01:52<02:09, 66.56ex/s]preprocess dataset:  47% 7746/16335 [01:52<02:17, 62.36ex/s]preprocess dataset:  47% 7755/16335 [01:53<02:06, 67.87ex/s]preprocess dataset:  48% 7762/16335 [01:53<02:18, 61.84ex/s]preprocess dataset:  48% 7769/16335 [01:53<02:19, 61.37ex/s]preprocess dataset:  48% 7778/16335 [01:53<02:06, 67.68ex/s]preprocess dataset:  48% 7786/16335 [01:53<02:03, 69.09ex/s]preprocess dataset:  48% 7794/16335 [01:53<02:18, 61.75ex/s]preprocess dataset:  48% 7801/16335 [01:53<02:15, 62.95ex/s]preprocess dataset:  48% 7808/16335 [01:53<02:17, 62.19ex/s]preprocess dataset:  48% 7817/16335 [01:54<02:03, 68.73ex/s]preprocess dataset:  48% 7826/16335 [01:54<01:57, 72.12ex/s]preprocess dataset:  48% 7834/16335 [01:54<02:03, 69.10ex/s]preprocess dataset:  48% 7842/16335 [01:54<02:00, 70.22ex/s]preprocess dataset:  48% 7851/16335 [01:54<01:54, 74.20ex/s]preprocess dataset:  48% 7859/16335 [01:54<01:53, 74.93ex/s]preprocess dataset:  48% 7869/16335 [01:54<01:59, 70.88ex/s]preprocess dataset:  48% 7880/16335 [01:54<01:48, 78.24ex/s]preprocess dataset:  48% 7888/16335 [01:54<01:49, 76.92ex/s]preprocess dataset:  48% 7898/16335 [01:55<01:46, 79.10ex/s]preprocess dataset:  48% 7907/16335 [01:55<01:44, 80.27ex/s]preprocess dataset:  48% 7917/16335 [01:55<01:42, 82.06ex/s]preprocess dataset:  49% 7927/16335 [01:55<01:38, 85.41ex/s]preprocess dataset:  49% 7936/16335 [01:55<01:40, 83.24ex/s]preprocess dataset:  49% 7945/16335 [01:55<01:44, 80.23ex/s]preprocess dataset:  49% 7954/16335 [01:55<01:53, 73.56ex/s]preprocess dataset:  49% 7962/16335 [01:55<02:00, 69.68ex/s]preprocess dataset:  49% 7971/16335 [01:56<01:54, 73.07ex/s]preprocess dataset:  49% 7979/16335 [01:56<01:56, 71.91ex/s]preprocess dataset:  49% 7989/16335 [01:56<01:48, 76.87ex/s]preprocess dataset:  49% 7997/16335 [01:56<01:54, 72.64ex/s]preprocess dataset:  49% 8005/16335 [01:57<08:32, 16.25ex/s]preprocess dataset:  49% 8013/16335 [01:57<06:35, 21.02ex/s]preprocess dataset:  49% 8021/16335 [01:58<05:13, 26.49ex/s]preprocess dataset:  49% 8028/16335 [01:58<04:24, 31.41ex/s]preprocess dataset:  49% 8035/16335 [01:58<03:50, 35.96ex/s]preprocess dataset:  49% 8042/16335 [01:58<03:23, 40.76ex/s]preprocess dataset:  49% 8051/16335 [01:58<02:49, 49.00ex/s]preprocess dataset:  49% 8059/16335 [01:58<02:33, 54.02ex/s]preprocess dataset:  49% 8067/16335 [01:58<02:20, 58.93ex/s]preprocess dataset:  49% 8075/16335 [01:58<02:13, 61.68ex/s]preprocess dataset:  49% 8082/16335 [01:58<02:10, 63.34ex/s]preprocess dataset:  50% 8089/16335 [01:59<02:10, 63.23ex/s]preprocess dataset:  50% 8096/16335 [01:59<02:11, 62.59ex/s]preprocess dataset:  50% 8103/16335 [01:59<02:18, 59.36ex/s]preprocess dataset:  50% 8111/16335 [01:59<02:08, 64.03ex/s]preprocess dataset:  50% 8118/16335 [01:59<02:10, 62.95ex/s]preprocess dataset:  50% 8127/16335 [01:59<02:07, 64.45ex/s]preprocess dataset:  50% 8135/16335 [01:59<02:02, 66.73ex/s]preprocess dataset:  50% 8143/16335 [01:59<01:58, 69.27ex/s]preprocess dataset:  50% 8151/16335 [02:00<01:56, 70.10ex/s]preprocess dataset:  50% 8159/16335 [02:00<01:53, 72.13ex/s]preprocess dataset:  50% 8167/16335 [02:00<01:53, 71.76ex/s]preprocess dataset:  50% 8175/16335 [02:00<01:56, 69.87ex/s]preprocess dataset:  50% 8185/16335 [02:00<01:47, 76.04ex/s]preprocess dataset:  50% 8193/16335 [02:00<01:46, 76.56ex/s]preprocess dataset:  50% 8201/16335 [02:00<01:46, 76.67ex/s]preprocess dataset:  50% 8209/16335 [02:00<01:45, 77.29ex/s]preprocess dataset:  50% 8217/16335 [02:00<01:44, 77.32ex/s]preprocess dataset:  50% 8225/16335 [02:00<01:50, 73.55ex/s]preprocess dataset:  50% 8233/16335 [02:01<01:52, 71.84ex/s]preprocess dataset:  50% 8242/16335 [02:01<01:49, 74.25ex/s]preprocess dataset:  51% 8251/16335 [02:01<01:43, 78.09ex/s]preprocess dataset:  51% 8259/16335 [02:01<01:48, 74.76ex/s]preprocess dataset:  51% 8267/16335 [02:01<01:51, 72.49ex/s]preprocess dataset:  51% 8275/16335 [02:01<01:48, 74.06ex/s]preprocess dataset:  51% 8283/16335 [02:01<01:50, 73.13ex/s]preprocess dataset:  51% 8291/16335 [02:01<01:49, 73.32ex/s]preprocess dataset:  51% 8299/16335 [02:02<01:53, 70.84ex/s]preprocess dataset:  51% 8307/16335 [02:02<01:53, 70.89ex/s]preprocess dataset:  51% 8315/16335 [02:02<01:51, 71.97ex/s]preprocess dataset:  51% 8323/16335 [02:02<01:52, 71.25ex/s]preprocess dataset:  51% 8331/16335 [02:02<01:57, 68.35ex/s]preprocess dataset:  51% 8338/16335 [02:02<02:00, 66.49ex/s]preprocess dataset:  51% 8345/16335 [02:02<01:58, 67.26ex/s]preprocess dataset:  51% 8352/16335 [02:02<01:58, 67.23ex/s]preprocess dataset:  51% 8361/16335 [02:02<01:52, 71.19ex/s]preprocess dataset:  51% 8370/16335 [02:02<01:44, 75.93ex/s]preprocess dataset:  51% 8380/16335 [02:03<01:40, 78.88ex/s]preprocess dataset:  51% 8388/16335 [02:03<01:43, 76.85ex/s]preprocess dataset:  51% 8397/16335 [02:03<01:39, 80.09ex/s]preprocess dataset:  51% 8407/16335 [02:03<01:37, 81.47ex/s]preprocess dataset:  52% 8416/16335 [02:03<01:36, 82.01ex/s]preprocess dataset:  52% 8425/16335 [02:03<01:41, 78.01ex/s]preprocess dataset:  52% 8433/16335 [02:03<01:43, 76.26ex/s]preprocess dataset:  52% 8441/16335 [02:03<01:42, 76.75ex/s]preprocess dataset:  52% 8449/16335 [02:04<01:44, 75.29ex/s]preprocess dataset:  52% 8457/16335 [02:04<01:43, 76.40ex/s]preprocess dataset:  52% 8465/16335 [02:04<01:50, 71.03ex/s]preprocess dataset:  52% 8473/16335 [02:04<01:48, 72.65ex/s]preprocess dataset:  52% 8481/16335 [02:04<01:50, 71.24ex/s]preprocess dataset:  52% 8489/16335 [02:04<01:47, 72.69ex/s]preprocess dataset:  52% 8497/16335 [02:04<02:00, 64.78ex/s]preprocess dataset:  52% 8505/16335 [02:04<01:55, 67.86ex/s]preprocess dataset:  52% 8512/16335 [02:04<02:04, 62.60ex/s]preprocess dataset:  52% 8519/16335 [02:05<02:08, 61.00ex/s]preprocess dataset:  52% 8526/16335 [02:05<02:12, 58.75ex/s]preprocess dataset:  52% 8535/16335 [02:05<01:57, 66.17ex/s]preprocess dataset:  52% 8543/16335 [02:05<01:53, 68.93ex/s]preprocess dataset:  52% 8551/16335 [02:05<01:55, 67.19ex/s]preprocess dataset:  52% 8559/16335 [02:05<01:56, 66.69ex/s]preprocess dataset:  52% 8567/16335 [02:05<01:51, 69.83ex/s]preprocess dataset:  52% 8575/16335 [02:05<01:49, 70.69ex/s]preprocess dataset:  53% 8583/16335 [02:06<01:50, 69.97ex/s]preprocess dataset:  53% 8591/16335 [02:06<01:50, 70.21ex/s]preprocess dataset:  53% 8599/16335 [02:06<01:49, 70.35ex/s]preprocess dataset:  53% 8607/16335 [02:06<01:54, 67.32ex/s]preprocess dataset:  53% 8615/16335 [02:06<01:49, 70.19ex/s]preprocess dataset:  53% 8623/16335 [02:06<01:48, 70.82ex/s]preprocess dataset:  53% 8631/16335 [02:06<01:52, 68.63ex/s]preprocess dataset:  53% 8638/16335 [02:06<01:52, 68.39ex/s]preprocess dataset:  53% 8646/16335 [02:06<01:49, 69.97ex/s]preprocess dataset:  53% 8654/16335 [02:07<01:51, 69.10ex/s]preprocess dataset:  53% 8663/16335 [02:07<01:46, 72.19ex/s]preprocess dataset:  53% 8671/16335 [02:07<01:45, 72.77ex/s]preprocess dataset:  53% 8679/16335 [02:07<01:50, 69.20ex/s]preprocess dataset:  53% 8686/16335 [02:07<01:52, 67.91ex/s]preprocess dataset:  53% 8695/16335 [02:07<01:45, 72.17ex/s]preprocess dataset:  53% 8703/16335 [02:07<01:44, 73.14ex/s]preprocess dataset:  53% 8711/16335 [02:07<01:45, 72.07ex/s]preprocess dataset:  53% 8719/16335 [02:07<01:47, 70.59ex/s]preprocess dataset:  53% 8727/16335 [02:08<02:03, 61.57ex/s]preprocess dataset:  53% 8735/16335 [02:08<02:00, 63.25ex/s]preprocess dataset:  54% 8742/16335 [02:08<02:00, 63.18ex/s]preprocess dataset:  54% 8749/16335 [02:08<02:00, 62.91ex/s]preprocess dataset:  54% 8757/16335 [02:08<01:59, 63.47ex/s]preprocess dataset:  54% 8764/16335 [02:08<01:57, 64.57ex/s]preprocess dataset:  54% 8773/16335 [02:08<01:49, 69.30ex/s]preprocess dataset:  54% 8780/16335 [02:08<01:49, 69.08ex/s]preprocess dataset:  54% 8787/16335 [02:08<01:52, 67.16ex/s]preprocess dataset:  54% 8795/16335 [02:09<01:48, 69.33ex/s]preprocess dataset:  54% 8803/16335 [02:09<01:45, 71.55ex/s]preprocess dataset:  54% 8811/16335 [02:09<01:43, 72.69ex/s]preprocess dataset:  54% 8819/16335 [02:09<01:45, 71.02ex/s]preprocess dataset:  54% 8827/16335 [02:09<01:46, 70.74ex/s]preprocess dataset:  54% 8835/16335 [02:09<01:43, 72.27ex/s]preprocess dataset:  54% 8843/16335 [02:09<01:47, 69.81ex/s]preprocess dataset:  54% 8851/16335 [02:09<01:47, 69.47ex/s]preprocess dataset:  54% 8859/16335 [02:10<01:48, 68.90ex/s]preprocess dataset:  54% 8869/16335 [02:10<01:39, 75.31ex/s]preprocess dataset:  54% 8877/16335 [02:10<01:40, 74.27ex/s]preprocess dataset:  54% 8885/16335 [02:10<01:55, 64.37ex/s]preprocess dataset:  54% 8892/16335 [02:10<01:59, 62.10ex/s]preprocess dataset:  54% 8899/16335 [02:10<02:10, 56.85ex/s]preprocess dataset:  55% 8907/16335 [02:10<02:01, 61.18ex/s]preprocess dataset:  55% 8918/16335 [02:10<01:42, 72.21ex/s]preprocess dataset:  55% 8928/16335 [02:10<01:33, 79.15ex/s]preprocess dataset:  55% 8937/16335 [02:11<01:38, 75.37ex/s]preprocess dataset:  55% 8946/16335 [02:11<01:34, 78.46ex/s]preprocess dataset:  55% 8955/16335 [02:11<01:36, 76.17ex/s]preprocess dataset:  55% 8963/16335 [02:11<01:50, 66.86ex/s]preprocess dataset:  55% 8972/16335 [02:11<01:41, 72.50ex/s]preprocess dataset:  55% 8982/16335 [02:11<01:33, 78.66ex/s]preprocess dataset:  55% 8993/16335 [02:11<01:26, 85.29ex/s]preprocess dataset:  55% 9002/16335 [02:13<06:53, 17.75ex/s]preprocess dataset:  55% 9012/16335 [02:13<05:09, 23.63ex/s]preprocess dataset:  55% 9020/16335 [02:13<04:13, 28.83ex/s]preprocess dataset:  55% 9028/16335 [02:13<03:33, 34.30ex/s]preprocess dataset:  55% 9037/16335 [02:13<02:53, 42.12ex/s]preprocess dataset:  55% 9046/16335 [02:13<02:25, 50.05ex/s]preprocess dataset:  55% 9058/16335 [02:13<01:56, 62.43ex/s]preprocess dataset:  56% 9067/16335 [02:14<01:54, 63.51ex/s]preprocess dataset:  56% 9077/16335 [02:14<01:43, 70.32ex/s]preprocess dataset:  56% 9086/16335 [02:14<01:41, 71.39ex/s]preprocess dataset:  56% 9095/16335 [02:14<01:59, 60.52ex/s]preprocess dataset:  56% 9103/16335 [02:14<01:58, 61.09ex/s]preprocess dataset:  56% 9113/16335 [02:14<01:43, 69.49ex/s]preprocess dataset:  56% 9123/16335 [02:14<01:34, 76.72ex/s]preprocess dataset:  56% 9134/16335 [02:14<01:25, 84.29ex/s]preprocess dataset:  56% 9144/16335 [02:15<01:35, 75.28ex/s]preprocess dataset:  56% 9154/16335 [02:15<01:29, 80.39ex/s]preprocess dataset:  56% 9164/16335 [02:15<01:27, 81.99ex/s]preprocess dataset:  56% 9173/16335 [02:15<01:25, 84.03ex/s]preprocess dataset:  56% 9182/16335 [02:15<01:24, 84.44ex/s]preprocess dataset:  56% 9192/16335 [02:15<01:23, 85.15ex/s]preprocess dataset:  56% 9203/16335 [02:15<01:19, 89.34ex/s]preprocess dataset:  56% 9214/16335 [02:15<01:18, 90.57ex/s]preprocess dataset:  56% 9224/16335 [02:16<01:19, 89.29ex/s]preprocess dataset:  57% 9234/16335 [02:16<01:17, 91.25ex/s]preprocess dataset:  57% 9245/16335 [02:16<01:14, 95.06ex/s]preprocess dataset:  57% 9255/16335 [02:16<01:15, 93.59ex/s]preprocess dataset:  57% 9265/16335 [02:16<01:15, 93.68ex/s]preprocess dataset:  57% 9276/16335 [02:16<01:14, 94.84ex/s]preprocess dataset:  57% 9287/16335 [02:16<01:12, 97.35ex/s]preprocess dataset:  57% 9298/16335 [02:16<01:11, 98.41ex/s]preprocess dataset:  57% 9311/16335 [02:16<01:07, 104.56ex/s]preprocess dataset:  57% 9322/16335 [02:17<01:09, 100.54ex/s]preprocess dataset:  57% 9333/16335 [02:17<01:13, 94.84ex/s] preprocess dataset:  57% 9344/16335 [02:17<01:12, 97.04ex/s]preprocess dataset:  57% 9354/16335 [02:17<01:12, 96.11ex/s]preprocess dataset:  57% 9364/16335 [02:17<01:14, 93.49ex/s]preprocess dataset:  57% 9375/16335 [02:17<01:14, 93.92ex/s]preprocess dataset:  57% 9386/16335 [02:17<01:12, 96.31ex/s]preprocess dataset:  58% 9397/16335 [02:17<01:10, 98.59ex/s]preprocess dataset:  58% 9409/16335 [02:17<01:06, 104.39ex/s]preprocess dataset:  58% 9420/16335 [02:18<01:05, 104.85ex/s]preprocess dataset:  58% 9431/16335 [02:18<01:05, 105.15ex/s]preprocess dataset:  58% 9442/16335 [02:18<01:06, 103.21ex/s]preprocess dataset:  58% 9453/16335 [02:18<01:09, 99.02ex/s] preprocess dataset:  58% 9463/16335 [02:18<01:10, 97.91ex/s]preprocess dataset:  58% 9474/16335 [02:18<01:08, 100.13ex/s]preprocess dataset:  58% 9485/16335 [02:18<01:09, 98.51ex/s] preprocess dataset:  58% 9495/16335 [02:18<01:14, 91.30ex/s]preprocess dataset:  58% 9506/16335 [02:18<01:11, 96.10ex/s]preprocess dataset:  58% 9516/16335 [02:19<01:12, 94.07ex/s]preprocess dataset:  58% 9526/16335 [02:19<01:11, 94.59ex/s]preprocess dataset:  58% 9537/16335 [02:19<01:09, 97.91ex/s]preprocess dataset:  58% 9549/16335 [02:19<01:05, 102.84ex/s]preprocess dataset:  59% 9561/16335 [02:19<01:04, 105.76ex/s]preprocess dataset:  59% 9572/16335 [02:19<01:19, 84.80ex/s] preprocess dataset:  59% 9582/16335 [02:19<01:18, 86.08ex/s]preprocess dataset:  59% 9592/16335 [02:19<01:15, 89.18ex/s]preprocess dataset:  59% 9602/16335 [02:20<01:25, 79.06ex/s]preprocess dataset:  59% 9613/16335 [02:20<01:18, 85.52ex/s]preprocess dataset:  59% 9623/16335 [02:20<01:15, 89.22ex/s]preprocess dataset:  59% 9635/16335 [02:20<01:09, 96.73ex/s]preprocess dataset:  59% 9646/16335 [02:20<01:07, 98.92ex/s]preprocess dataset:  59% 9657/16335 [02:20<01:06, 100.07ex/s]preprocess dataset:  59% 9668/16335 [02:20<01:06, 99.68ex/s] preprocess dataset:  59% 9680/16335 [02:20<01:03, 104.93ex/s]preprocess dataset:  59% 9691/16335 [02:20<01:03, 103.88ex/s]preprocess dataset:  59% 9703/16335 [02:20<01:02, 105.86ex/s]preprocess dataset:  59% 9714/16335 [02:21<01:02, 106.09ex/s]preprocess dataset:  60% 9725/16335 [02:21<01:02, 105.17ex/s]preprocess dataset:  60% 9737/16335 [02:21<01:01, 107.57ex/s]preprocess dataset:  60% 9749/16335 [02:21<01:00, 109.42ex/s]preprocess dataset:  60% 9760/16335 [02:21<01:00, 108.88ex/s]preprocess dataset:  60% 9772/16335 [02:21<00:59, 110.38ex/s]preprocess dataset:  60% 9784/16335 [02:21<01:00, 109.03ex/s]preprocess dataset:  60% 9795/16335 [02:21<01:02, 104.49ex/s]preprocess dataset:  60% 9806/16335 [02:21<01:03, 102.90ex/s]preprocess dataset:  60% 9817/16335 [02:22<01:06, 97.60ex/s] preprocess dataset:  60% 9827/16335 [02:22<01:12, 90.03ex/s]preprocess dataset:  60% 9837/16335 [02:22<01:11, 90.33ex/s]preprocess dataset:  60% 9847/16335 [02:22<01:10, 91.90ex/s]preprocess dataset:  60% 9858/16335 [02:22<01:08, 95.10ex/s]preprocess dataset:  60% 9869/16335 [02:22<01:07, 96.15ex/s]preprocess dataset:  60% 9879/16335 [02:22<01:06, 96.96ex/s]preprocess dataset:  61% 9889/16335 [02:22<01:07, 95.03ex/s]preprocess dataset:  61% 9900/16335 [02:22<01:06, 96.16ex/s]preprocess dataset:  61% 9911/16335 [02:23<01:05, 98.40ex/s]preprocess dataset:  61% 9921/16335 [02:23<01:06, 96.87ex/s]preprocess dataset:  61% 9932/16335 [02:23<01:05, 98.32ex/s]preprocess dataset:  61% 9942/16335 [02:23<01:04, 98.40ex/s]preprocess dataset:  61% 9952/16335 [02:23<01:05, 98.14ex/s]preprocess dataset:  61% 9963/16335 [02:23<01:03, 101.11ex/s]preprocess dataset:  61% 9974/16335 [02:23<01:04, 99.35ex/s] preprocess dataset:  61% 9985/16335 [02:23<01:03, 99.59ex/s]preprocess dataset:  61% 9998/16335 [02:23<00:59, 106.02ex/s]preprocess dataset:  61% 10009/16335 [02:25<04:22, 24.11ex/s]preprocess dataset:  61% 10018/16335 [02:25<03:33, 29.62ex/s]preprocess dataset:  61% 10030/16335 [02:25<02:41, 38.99ex/s]preprocess dataset:  61% 10041/16335 [02:25<02:10, 48.14ex/s]preprocess dataset:  62% 10051/16335 [02:25<01:52, 55.76ex/s]preprocess dataset:  62% 10061/16335 [02:25<01:38, 63.54ex/s]preprocess dataset:  62% 10072/16335 [02:25<01:26, 72.63ex/s]preprocess dataset:  62% 10082/16335 [02:25<01:21, 76.34ex/s]preprocess dataset:  62% 10093/16335 [02:26<01:14, 84.11ex/s]preprocess dataset:  62% 10106/16335 [02:26<01:06, 93.53ex/s]preprocess dataset:  62% 10117/16335 [02:26<01:04, 96.87ex/s]preprocess dataset:  62% 10128/16335 [02:26<01:03, 97.80ex/s]preprocess dataset:  62% 10140/16335 [02:26<00:59, 103.60ex/s]preprocess dataset:  62% 10151/16335 [02:26<01:00, 101.80ex/s]preprocess dataset:  62% 10162/16335 [02:26<01:01, 101.02ex/s]preprocess dataset:  62% 10174/16335 [02:26<00:59, 103.26ex/s]preprocess dataset:  62% 10185/16335 [02:26<00:58, 104.41ex/s]preprocess dataset:  62% 10196/16335 [02:27<01:01, 100.51ex/s]preprocess dataset:  62% 10208/16335 [02:27<00:59, 103.59ex/s]preprocess dataset:  63% 10219/16335 [02:27<01:00, 100.70ex/s]preprocess dataset:  63% 10230/16335 [02:27<01:00, 101.65ex/s]preprocess dataset:  63% 10241/16335 [02:27<01:00, 101.16ex/s]preprocess dataset:  63% 10252/16335 [02:27<01:00, 99.97ex/s] preprocess dataset:  63% 10263/16335 [02:27<01:00, 100.09ex/s]preprocess dataset:  63% 10274/16335 [02:27<00:59, 102.30ex/s]preprocess dataset:  63% 10285/16335 [02:27<00:59, 101.49ex/s]preprocess dataset:  63% 10296/16335 [02:28<01:00, 100.35ex/s]preprocess dataset:  63% 10307/16335 [02:28<00:59, 100.74ex/s]preprocess dataset:  63% 10318/16335 [02:28<01:07, 89.79ex/s] preprocess dataset:  63% 10328/16335 [02:28<01:14, 80.55ex/s]preprocess dataset:  63% 10339/16335 [02:28<01:10, 85.53ex/s]preprocess dataset:  63% 10349/16335 [02:28<01:08, 87.77ex/s]preprocess dataset:  63% 10361/16335 [02:28<01:02, 95.62ex/s]preprocess dataset:  64% 10373/16335 [02:28<00:59, 99.51ex/s]preprocess dataset:  64% 10384/16335 [02:29<01:04, 92.48ex/s]preprocess dataset:  64% 10394/16335 [02:29<01:06, 88.99ex/s]preprocess dataset:  64% 10404/16335 [02:29<01:11, 82.90ex/s]preprocess dataset:  64% 10414/16335 [02:29<01:09, 85.26ex/s]preprocess dataset:  64% 10424/16335 [02:29<01:07, 87.34ex/s]preprocess dataset:  64% 10435/16335 [02:29<01:04, 92.07ex/s]preprocess dataset:  64% 10445/16335 [02:29<01:03, 92.44ex/s]preprocess dataset:  64% 10455/16335 [02:29<01:04, 91.71ex/s]preprocess dataset:  64% 10465/16335 [02:29<01:03, 92.72ex/s]preprocess dataset:  64% 10475/16335 [02:30<01:06, 87.68ex/s]preprocess dataset:  64% 10484/16335 [02:30<01:06, 88.26ex/s]preprocess dataset:  64% 10493/16335 [02:30<01:08, 85.52ex/s]preprocess dataset:  64% 10502/16335 [02:30<01:09, 84.47ex/s]preprocess dataset:  64% 10513/16335 [02:30<01:04, 90.85ex/s]preprocess dataset:  64% 10523/16335 [02:30<01:04, 90.45ex/s]preprocess dataset:  64% 10533/16335 [02:30<01:04, 89.73ex/s]preprocess dataset:  65% 10545/16335 [02:30<01:00, 96.00ex/s]preprocess dataset:  65% 10556/16335 [02:30<00:57, 99.73ex/s]preprocess dataset:  65% 10567/16335 [02:31<00:57, 100.11ex/s]preprocess dataset:  65% 10578/16335 [02:31<00:56, 101.38ex/s]preprocess dataset:  65% 10589/16335 [02:31<00:59, 97.06ex/s] preprocess dataset:  65% 10599/16335 [02:31<00:58, 97.61ex/s]preprocess dataset:  65% 10609/16335 [02:31<00:58, 97.29ex/s]preprocess dataset:  65% 10619/16335 [02:31<00:59, 96.85ex/s]preprocess dataset:  65% 10629/16335 [02:31<01:00, 94.52ex/s]preprocess dataset:  65% 10639/16335 [02:31<01:03, 90.25ex/s]preprocess dataset:  65% 10649/16335 [02:32<01:28, 64.32ex/s]preprocess dataset:  65% 10657/16335 [02:32<01:24, 67.37ex/s]preprocess dataset:  65% 10667/16335 [02:32<01:16, 74.41ex/s]preprocess dataset:  65% 10676/16335 [02:32<01:13, 77.40ex/s]preprocess dataset:  65% 10686/16335 [02:32<01:09, 81.69ex/s]preprocess dataset:  65% 10697/16335 [02:32<01:03, 88.81ex/s]preprocess dataset:  66% 10707/16335 [02:32<01:04, 87.23ex/s]preprocess dataset:  66% 10717/16335 [02:32<01:04, 86.96ex/s]preprocess dataset:  66% 10727/16335 [02:32<01:03, 88.86ex/s]preprocess dataset:  66% 10737/16335 [02:33<01:03, 88.57ex/s]preprocess dataset:  66% 10746/16335 [02:33<01:04, 86.81ex/s]preprocess dataset:  66% 10757/16335 [02:33<00:59, 93.19ex/s]preprocess dataset:  66% 10768/16335 [02:33<00:57, 96.58ex/s]preprocess dataset:  66% 10778/16335 [02:33<00:57, 96.66ex/s]preprocess dataset:  66% 10788/16335 [02:33<00:57, 97.21ex/s]preprocess dataset:  66% 10798/16335 [02:33<00:57, 95.74ex/s]preprocess dataset:  66% 10808/16335 [02:33<00:57, 96.48ex/s]preprocess dataset:  66% 10818/16335 [02:33<00:57, 95.40ex/s]preprocess dataset:  66% 10828/16335 [02:33<00:57, 94.99ex/s]preprocess dataset:  66% 10838/16335 [02:34<00:57, 96.02ex/s]preprocess dataset:  66% 10849/16335 [02:34<00:55, 98.01ex/s]preprocess dataset:  66% 10859/16335 [02:34<00:56, 97.74ex/s]preprocess dataset:  67% 10869/16335 [02:34<00:55, 98.29ex/s]preprocess dataset:  67% 10879/16335 [02:34<00:56, 96.65ex/s]preprocess dataset:  67% 10889/16335 [02:34<00:56, 95.84ex/s]preprocess dataset:  67% 10899/16335 [02:34<00:56, 96.66ex/s]preprocess dataset:  67% 10909/16335 [02:34<00:55, 97.35ex/s]preprocess dataset:  67% 10921/16335 [02:34<00:52, 102.74ex/s]preprocess dataset:  67% 10932/16335 [02:35<00:52, 102.31ex/s]preprocess dataset:  67% 10943/16335 [02:35<00:54, 99.18ex/s] preprocess dataset:  67% 10953/16335 [02:35<00:54, 98.21ex/s]preprocess dataset:  67% 10963/16335 [02:35<00:56, 95.27ex/s]preprocess dataset:  67% 10973/16335 [02:35<00:56, 94.69ex/s]preprocess dataset:  67% 10983/16335 [02:35<00:58, 91.06ex/s]preprocess dataset:  67% 10993/16335 [02:35<00:59, 90.00ex/s]preprocess dataset:  67% 11003/16335 [02:37<04:17, 20.72ex/s]preprocess dataset:  67% 11013/16335 [02:37<03:16, 27.12ex/s]preprocess dataset:  67% 11024/16335 [02:37<02:29, 35.43ex/s]preprocess dataset:  68% 11034/16335 [02:37<02:02, 43.27ex/s]preprocess dataset:  68% 11044/16335 [02:37<01:43, 51.22ex/s]preprocess dataset:  68% 11053/16335 [02:37<01:32, 57.04ex/s]preprocess dataset:  68% 11063/16335 [02:37<01:21, 64.63ex/s]preprocess dataset:  68% 11073/16335 [02:37<01:12, 72.10ex/s]preprocess dataset:  68% 11084/16335 [02:37<01:05, 79.76ex/s]preprocess dataset:  68% 11095/16335 [02:38<01:01, 84.72ex/s]preprocess dataset:  68% 11107/16335 [02:38<00:57, 91.35ex/s]preprocess dataset:  68% 11117/16335 [02:38<00:57, 90.89ex/s]preprocess dataset:  68% 11127/16335 [02:38<00:58, 88.96ex/s]preprocess dataset:  68% 11137/16335 [02:38<00:56, 91.67ex/s]preprocess dataset:  68% 11147/16335 [02:38<00:55, 93.15ex/s]preprocess dataset:  68% 11158/16335 [02:38<00:53, 96.29ex/s]preprocess dataset:  68% 11168/16335 [02:38<00:54, 95.39ex/s]preprocess dataset:  68% 11178/16335 [02:38<00:53, 95.65ex/s]preprocess dataset:  68% 11189/16335 [02:38<00:51, 99.18ex/s]preprocess dataset:  69% 11199/16335 [02:39<00:52, 97.19ex/s]preprocess dataset:  69% 11210/16335 [02:39<00:52, 97.04ex/s]preprocess dataset:  69% 11220/16335 [02:39<00:52, 97.38ex/s]preprocess dataset:  69% 11231/16335 [02:39<00:50, 100.39ex/s]preprocess dataset:  69% 11242/16335 [02:39<00:49, 102.30ex/s]preprocess dataset:  69% 11253/16335 [02:39<00:52, 97.69ex/s] preprocess dataset:  69% 11263/16335 [02:39<00:53, 94.18ex/s]preprocess dataset:  69% 11273/16335 [02:39<00:53, 94.65ex/s]preprocess dataset:  69% 11283/16335 [02:39<00:52, 95.71ex/s]preprocess dataset:  69% 11293/16335 [02:40<00:52, 96.57ex/s]preprocess dataset:  69% 11303/16335 [02:40<00:53, 93.62ex/s]preprocess dataset:  69% 11313/16335 [02:40<00:53, 93.60ex/s]preprocess dataset:  69% 11323/16335 [02:40<00:56, 88.93ex/s]preprocess dataset:  69% 11332/16335 [02:40<00:57, 87.55ex/s]preprocess dataset:  69% 11341/16335 [02:40<00:57, 87.29ex/s]preprocess dataset:  69% 11350/16335 [02:40<00:56, 87.72ex/s]preprocess dataset:  70% 11361/16335 [02:40<00:53, 92.35ex/s]preprocess dataset:  70% 11371/16335 [02:40<00:53, 92.93ex/s]preprocess dataset:  70% 11382/16335 [02:41<00:51, 95.78ex/s]preprocess dataset:  70% 11392/16335 [02:41<00:52, 94.49ex/s]preprocess dataset:  70% 11402/16335 [02:41<00:55, 88.61ex/s]preprocess dataset:  70% 11411/16335 [02:41<00:56, 87.12ex/s]preprocess dataset:  70% 11420/16335 [02:41<00:56, 86.58ex/s]preprocess dataset:  70% 11429/16335 [02:41<01:03, 77.11ex/s]preprocess dataset:  70% 11437/16335 [02:41<01:07, 72.15ex/s]preprocess dataset:  70% 11445/16335 [02:41<01:12, 67.60ex/s]preprocess dataset:  70% 11453/16335 [02:42<01:09, 70.53ex/s]preprocess dataset:  70% 11464/16335 [02:42<01:01, 79.28ex/s]preprocess dataset:  70% 11474/16335 [02:42<00:58, 82.52ex/s]preprocess dataset:  70% 11485/16335 [02:42<00:54, 89.69ex/s]preprocess dataset:  70% 11497/16335 [02:42<00:51, 94.81ex/s]preprocess dataset:  70% 11507/16335 [02:42<00:50, 95.89ex/s]preprocess dataset:  71% 11517/16335 [02:42<00:51, 93.78ex/s]preprocess dataset:  71% 11528/16335 [02:42<00:49, 96.60ex/s]preprocess dataset:  71% 11540/16335 [02:42<00:47, 102.02ex/s]preprocess dataset:  71% 11551/16335 [02:42<00:46, 103.14ex/s]preprocess dataset:  71% 11562/16335 [02:43<00:46, 103.51ex/s]preprocess dataset:  71% 11573/16335 [02:43<00:45, 104.81ex/s]preprocess dataset:  71% 11584/16335 [02:43<00:56, 84.40ex/s] preprocess dataset:  71% 11595/16335 [02:43<00:52, 89.67ex/s]preprocess dataset:  71% 11605/16335 [02:43<00:51, 92.22ex/s]preprocess dataset:  71% 11615/16335 [02:43<00:50, 93.05ex/s]preprocess dataset:  71% 11625/16335 [02:43<00:49, 94.83ex/s]preprocess dataset:  71% 11637/16335 [02:43<00:47, 99.20ex/s]preprocess dataset:  71% 11648/16335 [02:43<00:47, 98.53ex/s]preprocess dataset:  71% 11659/16335 [02:44<00:46, 100.83ex/s]preprocess dataset:  71% 11670/16335 [02:44<00:48, 96.18ex/s] preprocess dataset:  72% 11681/16335 [02:44<00:46, 99.37ex/s]preprocess dataset:  72% 11692/16335 [02:44<00:46, 100.08ex/s]preprocess dataset:  72% 11703/16335 [02:44<00:46, 99.07ex/s] preprocess dataset:  72% 11714/16335 [02:44<00:46, 99.82ex/s]preprocess dataset:  72% 11725/16335 [02:44<00:48, 96.03ex/s]preprocess dataset:  72% 11735/16335 [02:44<00:49, 93.08ex/s]preprocess dataset:  72% 11746/16335 [02:45<00:47, 95.78ex/s]preprocess dataset:  72% 11756/16335 [02:45<00:47, 96.92ex/s]preprocess dataset:  72% 11766/16335 [02:45<00:47, 96.68ex/s]preprocess dataset:  72% 11777/16335 [02:45<00:45, 100.22ex/s]preprocess dataset:  72% 11790/16335 [02:45<00:43, 104.22ex/s]preprocess dataset:  72% 11801/16335 [02:45<00:43, 104.14ex/s]preprocess dataset:  72% 11813/16335 [02:45<00:42, 107.52ex/s]preprocess dataset:  72% 11824/16335 [02:45<00:43, 103.39ex/s]preprocess dataset:  72% 11835/16335 [02:45<00:44, 100.22ex/s]preprocess dataset:  73% 11846/16335 [02:45<00:44, 100.64ex/s]preprocess dataset:  73% 11858/16335 [02:46<00:42, 104.47ex/s]preprocess dataset:  73% 11869/16335 [02:46<00:42, 104.28ex/s]preprocess dataset:  73% 11880/16335 [02:46<00:43, 103.51ex/s]preprocess dataset:  73% 11891/16335 [02:46<00:42, 104.07ex/s]preprocess dataset:  73% 11902/16335 [02:46<00:42, 104.09ex/s]preprocess dataset:  73% 11913/16335 [02:46<00:43, 102.58ex/s]preprocess dataset:  73% 11924/16335 [02:46<00:44, 99.06ex/s] preprocess dataset:  73% 11934/16335 [02:46<00:45, 96.22ex/s]preprocess dataset:  73% 11944/16335 [02:46<00:45, 96.84ex/s]preprocess dataset:  73% 11954/16335 [02:47<00:46, 95.03ex/s]preprocess dataset:  73% 11964/16335 [02:47<00:46, 94.96ex/s]preprocess dataset:  73% 11974/16335 [02:47<00:47, 92.53ex/s]preprocess dataset:  73% 11984/16335 [02:47<00:53, 80.89ex/s]preprocess dataset:  73% 11993/16335 [02:47<00:59, 73.58ex/s]preprocess dataset:  73% 12001/16335 [02:48<03:59, 18.07ex/s]preprocess dataset:  74% 12011/16335 [02:49<02:58, 24.24ex/s]preprocess dataset:  74% 12023/16335 [02:49<02:08, 33.46ex/s]preprocess dataset:  74% 12034/16335 [02:49<01:41, 42.40ex/s]preprocess dataset:  74% 12045/16335 [02:49<01:23, 51.62ex/s]preprocess dataset:  74% 12055/16335 [02:49<01:12, 59.02ex/s]preprocess dataset:  74% 12065/16335 [02:49<01:05, 65.02ex/s]preprocess dataset:  74% 12074/16335 [02:49<01:07, 62.83ex/s]preprocess dataset:  74% 12085/16335 [02:49<00:58, 72.04ex/s]preprocess dataset:  74% 12096/16335 [02:50<00:53, 79.84ex/s]preprocess dataset:  74% 12107/16335 [02:50<00:49, 84.57ex/s]preprocess dataset:  74% 12117/16335 [02:50<00:48, 86.44ex/s]preprocess dataset:  74% 12127/16335 [02:50<00:47, 87.74ex/s]preprocess dataset:  74% 12137/16335 [02:50<00:46, 90.37ex/s]preprocess dataset:  74% 12150/16335 [02:50<00:42, 99.04ex/s]preprocess dataset:  74% 12161/16335 [02:50<00:42, 97.35ex/s]preprocess dataset:  75% 12171/16335 [02:50<00:43, 95.26ex/s]preprocess dataset:  75% 12182/16335 [02:50<00:42, 96.85ex/s]preprocess dataset:  75% 12192/16335 [02:51<00:43, 95.78ex/s]preprocess dataset:  75% 12202/16335 [02:51<00:44, 92.46ex/s]preprocess dataset:  75% 12214/16335 [02:51<00:41, 99.11ex/s]preprocess dataset:  75% 12225/16335 [02:51<00:40, 100.65ex/s]preprocess dataset:  75% 12236/16335 [02:51<00:42, 96.16ex/s] preprocess dataset:  75% 12246/16335 [02:51<00:42, 95.79ex/s]preprocess dataset:  75% 12257/16335 [02:51<00:41, 97.19ex/s]preprocess dataset:  75% 12267/16335 [02:51<00:41, 97.42ex/s]preprocess dataset:  75% 12277/16335 [02:51<00:42, 95.35ex/s]preprocess dataset:  75% 12288/16335 [02:51<00:41, 97.04ex/s]preprocess dataset:  75% 12298/16335 [02:52<00:42, 94.62ex/s]preprocess dataset:  75% 12308/16335 [02:52<00:44, 91.32ex/s]preprocess dataset:  75% 12318/16335 [02:52<00:43, 91.68ex/s]preprocess dataset:  75% 12328/16335 [02:52<00:43, 91.94ex/s]preprocess dataset:  76% 12340/16335 [02:52<00:40, 97.64ex/s]preprocess dataset:  76% 12351/16335 [02:52<00:40, 98.99ex/s]preprocess dataset:  76% 12361/16335 [02:52<00:40, 98.66ex/s]preprocess dataset:  76% 12373/16335 [02:52<00:38, 103.93ex/s]preprocess dataset:  76% 12385/16335 [02:52<00:36, 107.14ex/s]preprocess dataset:  76% 12396/16335 [02:53<00:36, 107.89ex/s]preprocess dataset:  76% 12407/16335 [02:53<00:36, 106.26ex/s]preprocess dataset:  76% 12418/16335 [02:53<00:37, 105.02ex/s]preprocess dataset:  76% 12429/16335 [02:53<00:37, 104.51ex/s]preprocess dataset:  76% 12440/16335 [02:53<00:36, 105.91ex/s]preprocess dataset:  76% 12452/16335 [02:53<00:35, 108.43ex/s]preprocess dataset:  76% 12464/16335 [02:53<00:35, 110.08ex/s]preprocess dataset:  76% 12476/16335 [02:53<00:34, 110.36ex/s]preprocess dataset:  76% 12489/16335 [02:53<00:33, 113.71ex/s]preprocess dataset:  77% 12501/16335 [02:54<00:34, 110.08ex/s]preprocess dataset:  77% 12513/16335 [02:54<00:34, 110.72ex/s]preprocess dataset:  77% 12525/16335 [02:54<00:34, 111.47ex/s]preprocess dataset:  77% 12537/16335 [02:54<00:34, 110.28ex/s]preprocess dataset:  77% 12549/16335 [02:54<00:33, 112.81ex/s]preprocess dataset:  77% 12561/16335 [02:54<00:33, 112.17ex/s]preprocess dataset:  77% 12573/16335 [02:54<00:33, 112.15ex/s]preprocess dataset:  77% 12585/16335 [02:54<00:34, 110.17ex/s]preprocess dataset:  77% 12597/16335 [02:54<00:34, 109.85ex/s]preprocess dataset:  77% 12608/16335 [02:54<00:34, 109.08ex/s]preprocess dataset:  77% 12620/16335 [02:55<00:33, 110.89ex/s]preprocess dataset:  77% 12632/16335 [02:55<00:33, 111.12ex/s]preprocess dataset:  77% 12644/16335 [02:55<00:35, 103.04ex/s]preprocess dataset:  77% 12656/16335 [02:55<00:35, 103.58ex/s]preprocess dataset:  78% 12668/16335 [02:55<00:34, 105.83ex/s]preprocess dataset:  78% 12679/16335 [02:55<00:34, 104.80ex/s]preprocess dataset:  78% 12690/16335 [02:55<00:35, 103.85ex/s]preprocess dataset:  78% 12702/16335 [02:55<00:33, 107.28ex/s]preprocess dataset:  78% 12713/16335 [02:55<00:34, 105.59ex/s]preprocess dataset:  78% 12724/16335 [02:56<00:34, 104.16ex/s]preprocess dataset:  78% 12736/16335 [02:56<00:34, 105.03ex/s]preprocess dataset:  78% 12748/16335 [02:56<00:33, 107.47ex/s]preprocess dataset:  78% 12760/16335 [02:56<00:32, 109.47ex/s]preprocess dataset:  78% 12771/16335 [02:56<00:32, 108.83ex/s]preprocess dataset:  78% 12782/16335 [02:56<00:32, 108.20ex/s]preprocess dataset:  78% 12793/16335 [02:56<00:32, 108.29ex/s]preprocess dataset:  78% 12805/16335 [02:56<00:32, 110.25ex/s]preprocess dataset:  78% 12817/16335 [02:56<00:33, 103.81ex/s]preprocess dataset:  79% 12829/16335 [02:57<00:32, 106.89ex/s]preprocess dataset:  79% 12842/16335 [02:57<00:31, 112.21ex/s]preprocess dataset:  79% 12854/16335 [02:57<00:31, 111.94ex/s]preprocess dataset:  79% 12866/16335 [02:57<00:31, 109.45ex/s]preprocess dataset:  79% 12877/16335 [02:57<00:32, 106.07ex/s]preprocess dataset:  79% 12888/16335 [02:57<00:33, 104.10ex/s]preprocess dataset:  79% 12899/16335 [02:57<00:32, 105.54ex/s]preprocess dataset:  79% 12912/16335 [02:57<00:31, 109.58ex/s]preprocess dataset:  79% 12923/16335 [02:57<00:31, 109.37ex/s]preprocess dataset:  79% 12936/16335 [02:58<00:30, 112.59ex/s]preprocess dataset:  79% 12948/16335 [02:58<00:29, 114.13ex/s]preprocess dataset:  79% 12960/16335 [02:58<00:29, 113.53ex/s]preprocess dataset:  79% 12972/16335 [02:58<00:30, 110.74ex/s]preprocess dataset:  79% 12984/16335 [02:58<00:29, 112.08ex/s]preprocess dataset:  80% 12996/16335 [02:58<00:30, 108.62ex/s]preprocess dataset:  80% 13007/16335 [03:00<02:24, 23.03ex/s] preprocess dataset:  80% 13019/16335 [03:00<01:48, 30.48ex/s]preprocess dataset:  80% 13031/16335 [03:00<01:24, 39.31ex/s]preprocess dataset:  80% 13041/16335 [03:00<01:11, 46.37ex/s]preprocess dataset:  80% 13053/16335 [03:00<00:57, 57.05ex/s]preprocess dataset:  80% 13065/16335 [03:00<00:48, 67.00ex/s]preprocess dataset:  80% 13077/16335 [03:00<00:42, 77.38ex/s]preprocess dataset:  80% 13089/16335 [03:00<00:37, 85.72ex/s]preprocess dataset:  80% 13101/16335 [03:00<00:35, 91.25ex/s]preprocess dataset:  80% 13112/16335 [03:01<00:39, 80.76ex/s]preprocess dataset:  80% 13123/16335 [03:01<00:37, 86.24ex/s]preprocess dataset:  80% 13133/16335 [03:01<00:36, 88.84ex/s]preprocess dataset:  80% 13143/16335 [03:01<00:35, 90.50ex/s]preprocess dataset:  81% 13154/16335 [03:01<00:33, 95.54ex/s]preprocess dataset:  81% 13166/16335 [03:01<00:32, 98.77ex/s]preprocess dataset:  81% 13178/16335 [03:01<00:30, 103.50ex/s]preprocess dataset:  81% 13189/16335 [03:01<00:31, 100.25ex/s]preprocess dataset:  81% 13200/16335 [03:01<00:33, 92.37ex/s] preprocess dataset:  81% 13210/16335 [03:02<00:33, 92.09ex/s]preprocess dataset:  81% 13220/16335 [03:02<00:36, 86.05ex/s]preprocess dataset:  81% 13229/16335 [03:02<00:36, 85.51ex/s]preprocess dataset:  81% 13238/16335 [03:02<00:36, 85.32ex/s]preprocess dataset:  81% 13247/16335 [03:02<00:37, 83.22ex/s]preprocess dataset:  81% 13256/16335 [03:02<00:37, 83.17ex/s]preprocess dataset:  81% 13265/16335 [03:02<00:40, 75.97ex/s]preprocess dataset:  81% 13276/16335 [03:02<00:38, 79.77ex/s]preprocess dataset:  81% 13286/16335 [03:02<00:35, 84.96ex/s]preprocess dataset:  81% 13298/16335 [03:03<00:32, 92.67ex/s]preprocess dataset:  81% 13308/16335 [03:03<00:35, 85.35ex/s]preprocess dataset:  82% 13317/16335 [03:03<00:36, 82.10ex/s]preprocess dataset:  82% 13326/16335 [03:03<00:46, 65.31ex/s]preprocess dataset:  82% 13334/16335 [03:03<00:44, 67.59ex/s]preprocess dataset:  82% 13342/16335 [03:03<00:42, 70.36ex/s]preprocess dataset:  82% 13352/16335 [03:03<00:38, 77.53ex/s]preprocess dataset:  82% 13361/16335 [03:03<00:36, 80.80ex/s]preprocess dataset:  82% 13371/16335 [03:04<00:34, 85.39ex/s]preprocess dataset:  82% 13382/16335 [03:04<00:33, 89.45ex/s]preprocess dataset:  82% 13392/16335 [03:04<00:33, 88.16ex/s]preprocess dataset:  82% 13401/16335 [03:04<00:34, 84.38ex/s]preprocess dataset:  82% 13410/16335 [03:04<00:34, 85.78ex/s]preprocess dataset:  82% 13419/16335 [03:04<00:38, 75.70ex/s]preprocess dataset:  82% 13428/16335 [03:04<00:37, 77.97ex/s]preprocess dataset:  82% 13439/16335 [03:04<00:34, 83.49ex/s]preprocess dataset:  82% 13448/16335 [03:05<00:40, 71.01ex/s]preprocess dataset:  82% 13459/16335 [03:05<00:37, 76.37ex/s]preprocess dataset:  82% 13468/16335 [03:05<00:36, 79.29ex/s]preprocess dataset:  83% 13477/16335 [03:05<00:35, 81.48ex/s]preprocess dataset:  83% 13487/16335 [03:05<00:33, 86.19ex/s]preprocess dataset:  83% 13496/16335 [03:05<00:34, 81.48ex/s]preprocess dataset:  83% 13505/16335 [03:05<00:35, 78.86ex/s]preprocess dataset:  83% 13514/16335 [03:05<00:34, 81.09ex/s]preprocess dataset:  83% 13523/16335 [03:05<00:33, 83.13ex/s]preprocess dataset:  83% 13532/16335 [03:06<00:33, 82.67ex/s]preprocess dataset:  83% 13541/16335 [03:06<00:33, 83.68ex/s]preprocess dataset:  83% 13551/16335 [03:06<00:31, 88.09ex/s]preprocess dataset:  83% 13560/16335 [03:06<00:34, 80.71ex/s]preprocess dataset:  83% 13569/16335 [03:06<00:33, 83.16ex/s]preprocess dataset:  83% 13579/16335 [03:06<00:31, 86.43ex/s]preprocess dataset:  83% 13588/16335 [03:06<00:32, 84.44ex/s]preprocess dataset:  83% 13598/16335 [03:06<00:30, 88.77ex/s]preprocess dataset:  83% 13608/16335 [03:06<00:29, 91.91ex/s]preprocess dataset:  83% 13618/16335 [03:07<00:41, 64.71ex/s]preprocess dataset:  83% 13628/16335 [03:07<00:37, 71.52ex/s]preprocess dataset:  83% 13637/16335 [03:07<00:36, 74.25ex/s]preprocess dataset:  84% 13646/16335 [03:07<00:57, 46.41ex/s]preprocess dataset:  84% 13655/16335 [03:07<00:49, 53.62ex/s]preprocess dataset:  84% 13668/16335 [03:07<00:39, 67.47ex/s]preprocess dataset:  84% 13679/16335 [03:08<00:35, 75.80ex/s]preprocess dataset:  84% 13690/16335 [03:08<00:32, 82.06ex/s]preprocess dataset:  84% 13700/16335 [03:08<00:32, 81.64ex/s]preprocess dataset:  84% 13711/16335 [03:08<00:30, 87.12ex/s]preprocess dataset:  84% 13721/16335 [03:08<00:31, 82.26ex/s]preprocess dataset:  84% 13731/16335 [03:08<00:30, 85.27ex/s]preprocess dataset:  84% 13740/16335 [03:08<00:31, 83.14ex/s]preprocess dataset:  84% 13749/16335 [03:08<00:31, 82.73ex/s]preprocess dataset:  84% 13758/16335 [03:09<00:33, 77.70ex/s]preprocess dataset:  84% 13769/16335 [03:09<00:30, 84.74ex/s]preprocess dataset:  84% 13778/16335 [03:09<00:31, 81.49ex/s]preprocess dataset:  84% 13787/16335 [03:09<00:35, 72.00ex/s]preprocess dataset:  84% 13795/16335 [03:09<00:37, 66.98ex/s]preprocess dataset:  85% 13805/16335 [03:09<00:34, 72.93ex/s]preprocess dataset:  85% 13815/16335 [03:09<00:32, 78.19ex/s]preprocess dataset:  85% 13824/16335 [03:09<00:31, 80.57ex/s]preprocess dataset:  85% 13833/16335 [03:10<00:32, 76.73ex/s]preprocess dataset:  85% 13843/16335 [03:10<00:30, 81.57ex/s]preprocess dataset:  85% 13853/16335 [03:10<00:28, 85.70ex/s]preprocess dataset:  85% 13862/16335 [03:10<00:29, 85.26ex/s]preprocess dataset:  85% 13873/16335 [03:10<00:27, 90.82ex/s]preprocess dataset:  85% 13883/16335 [03:10<00:26, 90.98ex/s]preprocess dataset:  85% 13893/16335 [03:10<00:36, 66.16ex/s]preprocess dataset:  85% 13901/16335 [03:10<00:35, 68.65ex/s]preprocess dataset:  85% 13911/16335 [03:11<00:32, 74.90ex/s]preprocess dataset:  85% 13920/16335 [03:11<00:34, 70.69ex/s]preprocess dataset:  85% 13929/16335 [03:11<00:32, 73.06ex/s]preprocess dataset:  85% 13940/16335 [03:11<00:29, 81.56ex/s]preprocess dataset:  85% 13949/16335 [03:11<00:28, 83.77ex/s]preprocess dataset:  85% 13958/16335 [03:11<00:28, 84.87ex/s]preprocess dataset:  86% 13969/16335 [03:11<00:25, 91.01ex/s]preprocess dataset:  86% 13980/16335 [03:11<00:24, 95.18ex/s]preprocess dataset:  86% 13992/16335 [03:11<00:23, 99.53ex/s]preprocess dataset:  86% 14003/16335 [03:13<01:28, 26.49ex/s]preprocess dataset:  86% 14011/16335 [03:13<01:14, 31.32ex/s]preprocess dataset:  86% 14019/16335 [03:13<01:10, 33.01ex/s]preprocess dataset:  86% 14030/16335 [03:13<00:54, 42.33ex/s]preprocess dataset:  86% 14038/16335 [03:13<00:50, 45.40ex/s]preprocess dataset:  86% 14045/16335 [03:13<00:46, 49.52ex/s]preprocess dataset:  86% 14053/16335 [03:13<00:41, 54.96ex/s]preprocess dataset:  86% 14062/16335 [03:13<00:39, 58.14ex/s]preprocess dataset:  86% 14069/16335 [03:14<00:37, 60.13ex/s]preprocess dataset:  86% 14077/16335 [03:14<00:34, 64.75ex/s]preprocess dataset:  86% 14085/16335 [03:14<00:33, 66.61ex/s]preprocess dataset:  86% 14094/16335 [03:14<00:31, 71.77ex/s]preprocess dataset:  86% 14103/16335 [03:14<00:29, 75.82ex/s]preprocess dataset:  86% 14112/16335 [03:14<00:33, 65.79ex/s]preprocess dataset:  86% 14122/16335 [03:14<00:29, 74.12ex/s]preprocess dataset:  87% 14131/16335 [03:14<00:28, 77.81ex/s]preprocess dataset:  87% 14140/16335 [03:14<00:28, 76.56ex/s]preprocess dataset:  87% 14148/16335 [03:15<00:28, 75.54ex/s]preprocess dataset:  87% 14156/16335 [03:15<00:30, 70.82ex/s]preprocess dataset:  87% 14164/16335 [03:15<00:31, 69.32ex/s]preprocess dataset:  87% 14173/16335 [03:15<00:29, 72.42ex/s]preprocess dataset:  87% 14181/16335 [03:15<00:30, 71.37ex/s]preprocess dataset:  87% 14190/16335 [03:15<00:28, 74.38ex/s]preprocess dataset:  87% 14198/16335 [03:15<00:28, 75.11ex/s]preprocess dataset:  87% 14206/16335 [03:15<00:28, 75.58ex/s]preprocess dataset:  87% 14214/16335 [03:15<00:28, 73.97ex/s]preprocess dataset:  87% 14222/16335 [03:16<00:28, 73.81ex/s]preprocess dataset:  87% 14232/16335 [03:16<00:26, 79.47ex/s]preprocess dataset:  87% 14241/16335 [03:16<00:25, 81.84ex/s]preprocess dataset:  87% 14250/16335 [03:16<00:26, 79.33ex/s]preprocess dataset:  87% 14260/16335 [03:16<00:24, 83.52ex/s]preprocess dataset:  87% 14269/16335 [03:16<00:25, 80.14ex/s]preprocess dataset:  87% 14279/16335 [03:16<00:24, 83.21ex/s]preprocess dataset:  87% 14288/16335 [03:16<00:25, 81.21ex/s]preprocess dataset:  88% 14297/16335 [03:16<00:26, 77.12ex/s]preprocess dataset:  88% 14306/16335 [03:17<00:25, 78.09ex/s]preprocess dataset:  88% 14314/16335 [03:17<00:27, 74.27ex/s]preprocess dataset:  88% 14322/16335 [03:17<00:29, 67.41ex/s]preprocess dataset:  88% 14332/16335 [03:17<00:26, 75.14ex/s]preprocess dataset:  88% 14343/16335 [03:17<00:26, 73.95ex/s]preprocess dataset:  88% 14351/16335 [03:17<00:27, 72.21ex/s]preprocess dataset:  88% 14360/16335 [03:17<00:26, 75.04ex/s]preprocess dataset:  88% 14369/16335 [03:17<00:27, 72.24ex/s]preprocess dataset:  88% 14378/16335 [03:18<00:25, 75.61ex/s]preprocess dataset:  88% 14386/16335 [03:18<00:28, 69.37ex/s]preprocess dataset:  88% 14396/16335 [03:18<00:25, 76.51ex/s]preprocess dataset:  88% 14405/16335 [03:18<00:24, 79.58ex/s]preprocess dataset:  88% 14414/16335 [03:18<00:23, 81.98ex/s]preprocess dataset:  88% 14423/16335 [03:18<00:23, 81.05ex/s]preprocess dataset:  88% 14433/16335 [03:18<00:22, 85.75ex/s]preprocess dataset:  88% 14443/16335 [03:18<00:21, 86.63ex/s]preprocess dataset:  88% 14452/16335 [03:19<00:24, 76.37ex/s]preprocess dataset:  89% 14460/16335 [03:19<00:24, 77.16ex/s]preprocess dataset:  89% 14468/16335 [03:19<00:29, 63.32ex/s]preprocess dataset:  89% 14475/16335 [03:19<00:32, 57.39ex/s]preprocess dataset:  89% 14484/16335 [03:19<00:29, 62.89ex/s]preprocess dataset:  89% 14491/16335 [03:19<00:30, 59.70ex/s]preprocess dataset:  89% 14498/16335 [03:19<00:35, 51.65ex/s]preprocess dataset:  89% 14505/16335 [03:20<00:33, 54.87ex/s]preprocess dataset:  89% 14511/16335 [03:20<00:32, 55.76ex/s]preprocess dataset:  89% 14520/16335 [03:20<00:28, 63.85ex/s]preprocess dataset:  89% 14530/16335 [03:20<00:25, 70.90ex/s]preprocess dataset:  89% 14539/16335 [03:20<00:24, 74.80ex/s]preprocess dataset:  89% 14547/16335 [03:20<00:23, 75.24ex/s]preprocess dataset:  89% 14555/16335 [03:20<00:33, 52.65ex/s]preprocess dataset:  89% 14564/16335 [03:20<00:29, 60.30ex/s]preprocess dataset:  89% 14572/16335 [03:21<00:27, 64.68ex/s]preprocess dataset:  89% 14581/16335 [03:21<00:24, 70.75ex/s]preprocess dataset:  89% 14590/16335 [03:21<00:23, 74.76ex/s]preprocess dataset:  89% 14599/16335 [03:21<00:22, 78.05ex/s]preprocess dataset:  89% 14608/16335 [03:21<00:21, 79.51ex/s]preprocess dataset:  89% 14617/16335 [03:21<00:21, 80.47ex/s]preprocess dataset:  90% 14627/16335 [03:21<00:20, 84.07ex/s]preprocess dataset:  90% 14638/16335 [03:21<00:19, 89.01ex/s]preprocess dataset:  90% 14648/16335 [03:21<00:19, 86.09ex/s]preprocess dataset:  90% 14657/16335 [03:22<00:23, 71.93ex/s]preprocess dataset:  90% 14665/16335 [03:22<00:23, 71.08ex/s]preprocess dataset:  90% 14675/16335 [03:22<00:21, 76.13ex/s]preprocess dataset:  90% 14684/16335 [03:22<00:21, 78.45ex/s]preprocess dataset:  90% 14693/16335 [03:22<00:20, 80.88ex/s]preprocess dataset:  90% 14704/16335 [03:22<00:19, 84.69ex/s]preprocess dataset:  90% 14714/16335 [03:22<00:18, 87.96ex/s]preprocess dataset:  90% 14725/16335 [03:22<00:17, 91.46ex/s]preprocess dataset:  90% 14735/16335 [03:23<00:22, 71.83ex/s]preprocess dataset:  90% 14745/16335 [03:23<00:20, 75.80ex/s]preprocess dataset:  90% 14754/16335 [03:23<00:20, 77.91ex/s]preprocess dataset:  90% 14763/16335 [03:23<00:25, 60.66ex/s]preprocess dataset:  90% 14774/16335 [03:23<00:22, 68.27ex/s]preprocess dataset:  90% 14782/16335 [03:23<00:24, 64.55ex/s]preprocess dataset:  91% 14792/16335 [03:23<00:21, 71.01ex/s]preprocess dataset:  91% 14801/16335 [03:23<00:20, 74.99ex/s]preprocess dataset:  91% 14811/16335 [03:24<00:19, 80.13ex/s]preprocess dataset:  91% 14820/16335 [03:24<00:18, 81.14ex/s]preprocess dataset:  91% 14830/16335 [03:24<00:17, 84.72ex/s]preprocess dataset:  91% 14839/16335 [03:24<00:17, 83.12ex/s]preprocess dataset:  91% 14848/16335 [03:24<00:18, 81.80ex/s]preprocess dataset:  91% 14857/16335 [03:24<00:17, 84.04ex/s]preprocess dataset:  91% 14866/16335 [03:24<00:17, 83.42ex/s]preprocess dataset:  91% 14876/16335 [03:24<00:16, 86.31ex/s]preprocess dataset:  91% 14885/16335 [03:24<00:17, 81.75ex/s]preprocess dataset:  91% 14894/16335 [03:25<00:20, 70.16ex/s]preprocess dataset:  91% 14903/16335 [03:25<00:19, 74.09ex/s]preprocess dataset:  91% 14912/16335 [03:25<00:18, 77.33ex/s]preprocess dataset:  91% 14922/16335 [03:25<00:17, 82.26ex/s]preprocess dataset:  91% 14931/16335 [03:25<00:16, 84.02ex/s]preprocess dataset:  91% 14940/16335 [03:25<00:16, 83.47ex/s]preprocess dataset:  92% 14950/16335 [03:25<00:16, 85.76ex/s]preprocess dataset:  92% 14960/16335 [03:25<00:15, 89.63ex/s]preprocess dataset:  92% 14970/16335 [03:25<00:14, 91.56ex/s]preprocess dataset:  92% 14980/16335 [03:26<00:14, 90.88ex/s]preprocess dataset:  92% 14991/16335 [03:26<00:13, 96.18ex/s]preprocess dataset:  92% 15001/16335 [03:27<01:01, 21.66ex/s]preprocess dataset:  92% 15011/16335 [03:27<00:47, 28.16ex/s]preprocess dataset:  92% 15019/16335 [03:27<00:40, 32.90ex/s]preprocess dataset:  92% 15027/16335 [03:27<00:37, 34.72ex/s]preprocess dataset:  92% 15037/16335 [03:28<00:29, 43.35ex/s]preprocess dataset:  92% 15045/16335 [03:28<00:27, 46.94ex/s]preprocess dataset:  92% 15052/16335 [03:28<00:27, 46.19ex/s]preprocess dataset:  92% 15059/16335 [03:28<00:29, 43.32ex/s]preprocess dataset:  92% 15067/16335 [03:28<00:25, 49.71ex/s]preprocess dataset:  92% 15076/16335 [03:28<00:22, 57.07ex/s]preprocess dataset:  92% 15086/16335 [03:28<00:19, 65.72ex/s]preprocess dataset:  92% 15094/16335 [03:28<00:19, 63.32ex/s]preprocess dataset:  92% 15104/16335 [03:29<00:17, 70.76ex/s]preprocess dataset:  93% 15113/16335 [03:29<00:16, 73.00ex/s]preprocess dataset:  93% 15122/16335 [03:29<00:15, 75.96ex/s]preprocess dataset:  93% 15131/16335 [03:29<00:15, 78.25ex/s]preprocess dataset:  93% 15142/16335 [03:29<00:14, 84.62ex/s]preprocess dataset:  93% 15151/16335 [03:29<00:14, 83.33ex/s]preprocess dataset:  93% 15160/16335 [03:29<00:14, 80.70ex/s]preprocess dataset:  93% 15169/16335 [03:29<00:14, 79.12ex/s]preprocess dataset:  93% 15177/16335 [03:29<00:16, 71.75ex/s]preprocess dataset:  93% 15187/16335 [03:30<00:14, 77.46ex/s]preprocess dataset:  93% 15196/16335 [03:30<00:15, 74.13ex/s]preprocess dataset:  93% 15205/16335 [03:30<00:14, 78.04ex/s]preprocess dataset:  93% 15213/16335 [03:30<00:16, 66.70ex/s]preprocess dataset:  93% 15221/16335 [03:30<00:16, 69.11ex/s]preprocess dataset:  93% 15229/16335 [03:30<00:15, 71.31ex/s]preprocess dataset:  93% 15238/16335 [03:30<00:14, 74.09ex/s]preprocess dataset:  93% 15247/16335 [03:30<00:14, 77.16ex/s]preprocess dataset:  93% 15256/16335 [03:31<00:13, 78.04ex/s]preprocess dataset:  93% 15266/16335 [03:31<00:12, 82.95ex/s]preprocess dataset:  94% 15275/16335 [03:31<00:13, 80.12ex/s]preprocess dataset:  94% 15284/16335 [03:31<00:14, 74.78ex/s]preprocess dataset:  94% 15292/16335 [03:31<00:14, 73.57ex/s]preprocess dataset:  94% 15300/16335 [03:31<00:16, 62.67ex/s]preprocess dataset:  94% 15310/16335 [03:31<00:14, 68.97ex/s]preprocess dataset:  94% 15318/16335 [03:31<00:16, 62.03ex/s]preprocess dataset:  94% 15328/16335 [03:32<00:14, 69.75ex/s]preprocess dataset:  94% 15339/16335 [03:32<00:12, 78.40ex/s]preprocess dataset:  94% 15349/16335 [03:32<00:12, 81.68ex/s]preprocess dataset:  94% 15358/16335 [03:32<00:12, 80.64ex/s]preprocess dataset:  94% 15367/16335 [03:32<00:15, 60.92ex/s]preprocess dataset:  94% 15375/16335 [03:32<00:14, 64.10ex/s]preprocess dataset:  94% 15386/16335 [03:32<00:12, 73.73ex/s]preprocess dataset:  94% 15395/16335 [03:32<00:12, 74.25ex/s]preprocess dataset:  94% 15404/16335 [03:33<00:12, 76.53ex/s]preprocess dataset:  94% 15413/16335 [03:33<00:11, 79.84ex/s]preprocess dataset:  94% 15423/16335 [03:33<00:10, 83.77ex/s]preprocess dataset:  94% 15432/16335 [03:33<00:10, 82.50ex/s]preprocess dataset:  95% 15441/16335 [03:33<00:11, 79.34ex/s]preprocess dataset:  95% 15451/16335 [03:33<00:10, 84.04ex/s]preprocess dataset:  95% 15460/16335 [03:33<00:10, 81.60ex/s]preprocess dataset:  95% 15470/16335 [03:33<00:10, 83.21ex/s]preprocess dataset:  95% 15480/16335 [03:33<00:09, 86.60ex/s]preprocess dataset:  95% 15489/16335 [03:34<00:11, 71.13ex/s]preprocess dataset:  95% 15498/16335 [03:34<00:11, 74.22ex/s]preprocess dataset:  95% 15508/16335 [03:34<00:10, 78.69ex/s]preprocess dataset:  95% 15517/16335 [03:34<00:11, 69.11ex/s]preprocess dataset:  95% 15526/16335 [03:34<00:11, 72.23ex/s]preprocess dataset:  95% 15536/16335 [03:34<00:10, 76.94ex/s]preprocess dataset:  95% 15544/16335 [03:34<00:10, 77.24ex/s]preprocess dataset:  95% 15555/16335 [03:34<00:09, 83.70ex/s]preprocess dataset:  95% 15565/16335 [03:35<00:08, 87.29ex/s]preprocess dataset:  95% 15574/16335 [03:35<00:08, 85.81ex/s]preprocess dataset:  95% 15585/16335 [03:35<00:08, 90.79ex/s]preprocess dataset:  95% 15595/16335 [03:35<00:08, 85.48ex/s]preprocess dataset:  96% 15605/16335 [03:35<00:08, 88.05ex/s]preprocess dataset:  96% 15614/16335 [03:35<00:08, 87.98ex/s]preprocess dataset:  96% 15625/16335 [03:35<00:07, 92.42ex/s]preprocess dataset:  96% 15635/16335 [03:35<00:07, 90.36ex/s]preprocess dataset:  96% 15645/16335 [03:36<00:08, 84.16ex/s]preprocess dataset:  96% 15655/16335 [03:36<00:07, 86.50ex/s]preprocess dataset:  96% 15664/16335 [03:36<00:08, 83.78ex/s]preprocess dataset:  96% 15674/16335 [03:36<00:07, 88.05ex/s]preprocess dataset:  96% 15683/16335 [03:36<00:07, 86.40ex/s]preprocess dataset:  96% 15692/16335 [03:36<00:07, 80.99ex/s]preprocess dataset:  96% 15702/16335 [03:36<00:07, 85.95ex/s]preprocess dataset:  96% 15711/16335 [03:36<00:07, 80.66ex/s]preprocess dataset:  96% 15720/16335 [03:36<00:07, 83.09ex/s]preprocess dataset:  96% 15730/16335 [03:37<00:07, 86.11ex/s]preprocess dataset:  96% 15740/16335 [03:37<00:06, 88.51ex/s]preprocess dataset:  96% 15749/16335 [03:37<00:07, 79.45ex/s]preprocess dataset:  96% 15759/16335 [03:37<00:06, 84.37ex/s]preprocess dataset:  97% 15768/16335 [03:37<00:06, 83.52ex/s]preprocess dataset:  97% 15778/16335 [03:37<00:06, 82.11ex/s]preprocess dataset:  97% 15788/16335 [03:37<00:06, 85.96ex/s]preprocess dataset:  97% 15797/16335 [03:37<00:06, 80.78ex/s]preprocess dataset:  97% 15806/16335 [03:37<00:06, 82.96ex/s]preprocess dataset:  97% 15816/16335 [03:38<00:05, 87.25ex/s]preprocess dataset:  97% 15826/16335 [03:38<00:05, 88.41ex/s]preprocess dataset:  97% 15836/16335 [03:38<00:05, 89.22ex/s]preprocess dataset:  97% 15846/16335 [03:38<00:05, 90.68ex/s]preprocess dataset:  97% 15856/16335 [03:38<00:06, 77.87ex/s]preprocess dataset:  97% 15865/16335 [03:38<00:06, 77.24ex/s]preprocess dataset:  97% 15874/16335 [03:38<00:05, 78.89ex/s]preprocess dataset:  97% 15883/16335 [03:38<00:05, 78.10ex/s]preprocess dataset:  97% 15893/16335 [03:38<00:05, 82.11ex/s]preprocess dataset:  97% 15903/16335 [03:39<00:05, 85.64ex/s]preprocess dataset:  97% 15913/16335 [03:39<00:04, 88.87ex/s]preprocess dataset:  97% 15922/16335 [03:39<00:04, 86.60ex/s]preprocess dataset:  98% 15932/16335 [03:39<00:04, 88.24ex/s]preprocess dataset:  98% 15942/16335 [03:39<00:05, 76.21ex/s]preprocess dataset:  98% 15950/16335 [03:39<00:05, 76.13ex/s]preprocess dataset:  98% 15958/16335 [03:39<00:04, 76.15ex/s]preprocess dataset:  98% 15967/16335 [03:39<00:04, 78.43ex/s]preprocess dataset:  98% 15976/16335 [03:40<00:04, 79.98ex/s]preprocess dataset:  98% 15987/16335 [03:40<00:03, 87.21ex/s]preprocess dataset:  98% 15996/16335 [03:40<00:04, 83.17ex/s]preprocess dataset:  98% 16005/16335 [03:41<00:15, 21.60ex/s]preprocess dataset:  98% 16016/16335 [03:41<00:10, 29.58ex/s]preprocess dataset:  98% 16025/16335 [03:41<00:08, 36.45ex/s]preprocess dataset:  98% 16033/16335 [03:41<00:07, 41.75ex/s]preprocess dataset:  98% 16044/16335 [03:41<00:05, 52.61ex/s]preprocess dataset:  98% 16054/16335 [03:41<00:04, 60.34ex/s]preprocess dataset:  98% 16063/16335 [03:42<00:05, 50.61ex/s]preprocess dataset:  98% 16072/16335 [03:42<00:04, 57.77ex/s]preprocess dataset:  98% 16082/16335 [03:42<00:03, 66.35ex/s]preprocess dataset:  99% 16092/16335 [03:42<00:03, 73.33ex/s]preprocess dataset:  99% 16101/16335 [03:42<00:03, 71.72ex/s]preprocess dataset:  99% 16110/16335 [03:42<00:03, 74.05ex/s]preprocess dataset:  99% 16119/16335 [03:42<00:02, 75.84ex/s]preprocess dataset:  99% 16131/16335 [03:42<00:02, 85.09ex/s]preprocess dataset:  99% 16140/16335 [03:43<00:02, 84.56ex/s]preprocess dataset:  99% 16150/16335 [03:43<00:02, 87.47ex/s]preprocess dataset:  99% 16159/16335 [03:43<00:02, 85.72ex/s]preprocess dataset:  99% 16168/16335 [03:43<00:01, 83.56ex/s]preprocess dataset:  99% 16177/16335 [03:43<00:01, 83.52ex/s]preprocess dataset:  99% 16187/16335 [03:43<00:01, 74.45ex/s]preprocess dataset:  99% 16196/16335 [03:43<00:01, 75.03ex/s]preprocess dataset:  99% 16206/16335 [03:43<00:01, 80.33ex/s]preprocess dataset:  99% 16215/16335 [03:44<00:01, 80.64ex/s]preprocess dataset:  99% 16225/16335 [03:44<00:01, 83.08ex/s]preprocess dataset:  99% 16234/16335 [03:44<00:01, 81.77ex/s]preprocess dataset:  99% 16244/16335 [03:44<00:01, 85.27ex/s]preprocess dataset:  99% 16253/16335 [03:44<00:00, 85.42ex/s]preprocess dataset: 100% 16262/16335 [03:44<00:00, 83.80ex/s]preprocess dataset: 100% 16271/16335 [03:44<00:00, 85.37ex/s]preprocess dataset: 100% 16280/16335 [03:44<00:00, 82.61ex/s]preprocess dataset: 100% 16289/16335 [03:44<00:00, 83.08ex/s]preprocess dataset: 100% 16300/16335 [03:44<00:00, 87.28ex/s]preprocess dataset: 100% 16309/16335 [03:45<00:00, 83.69ex/s]preprocess dataset: 100% 16318/16335 [03:45<00:00, 81.14ex/s]preprocess dataset: 100% 16328/16335 [03:45<00:00, 85.54ex/s]preprocess dataset: 100% 16335/16335 [03:45<00:00, 72.47ex/s]05/16/2022 16:22:02 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/mozilla-foundation___common_voice/en/9.0.0/26f54721b57ee2f31a333b315ed9151fbd8e693a3983c295fef63c67a12b9bf7/cache-9f30c0118fe18803.arrow
05/16/2022 16:22:02 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/mozilla-foundation___common_voice/en/9.0.0/26f54721b57ee2f31a333b315ed9151fbd8e693a3983c295fef63c67a12b9bf7/cache-a8f880964bbda6ad.arrow

  0% 0/17 [00:00<?, ?ba/s]100% 17/17 [00:00<00:00, 235.76ba/s]
Feature extractor saved in ./flax-wav2vec2-ctc-cv9-baseline/preprocessor_config.json
tokenizer config file saved in ./flax-wav2vec2-ctc-cv9-baseline/tokenizer_config.json
Special tokens file saved in ./flax-wav2vec2-ctc-cv9-baseline/special_tokens_map.json
Configuration saved in ./flax-wav2vec2-ctc-cv9-baseline/config.json
loading feature extractor configuration file ./flax-wav2vec2-ctc-cv9-baseline/preprocessor_config.json
loading feature extractor configuration file ./flax-wav2vec2-ctc-cv9-baseline/preprocessor_config.json
Feature extractor Wav2Vec2FeatureExtractor {
  "do_normalize": true,
  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
  "feature_size": 1,
  "padding_side": "right",
  "padding_value": 0.0,
  "processor_class": "Wav2Vec2Processor",
  "return_attention_mask": true,
  "sampling_rate": 16000
}

Didn't find file ./flax-wav2vec2-ctc-cv9-baseline/added_tokens.json. We won't load it.
loading file ./flax-wav2vec2-ctc-cv9-baseline/vocab.json
loading file ./flax-wav2vec2-ctc-cv9-baseline/tokenizer_config.json
loading file None
loading file ./flax-wav2vec2-ctc-cv9-baseline/special_tokens_map.json
05/16/2022 16:22:02 - WARNING - __main__ - Unable to display metrics through TensorBoard because the package is not installed: Please run `pip install tensorboard` to enable.
/home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/./flax-wav2vec2-ctc-cv9-baseline is already a clone of https://huggingface.co/sanchit-gandhi/flax-wav2vec2-ctc-cv9-baseline. Make sure you pull the latest changes with `repo.git_pull()`.
05/16/2022 16:22:06 - WARNING - huggingface_hub.repository - /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/./flax-wav2vec2-ctc-cv9-baseline is already a clone of https://huggingface.co/sanchit-gandhi/flax-wav2vec2-ctc-cv9-baseline. Make sure you pull the latest changes with `repo.git_pull()`.
05/16/2022 16:22:08 - INFO - __main__ - ***** Running training *****
05/16/2022 16:22:08 - INFO - __main__ -   Num examples = 890102
05/16/2022 16:22:08 - INFO - __main__ -   Num Epochs = 4
05/16/2022 16:22:08 - INFO - __main__ -   Instantaneous batch size per device = 8
05/16/2022 16:22:08 - INFO - __main__ -   Num gradient accumulation steps = 1
05/16/2022 16:22:08 - INFO - __main__ -   Total train batch size (w. parallel & distributed) = 64
05/16/2022 16:22:08 - INFO - __main__ -   Total optimization steps = 50000
05/16/2022 16:22:08 - INFO - __main__ -   Gradient checkpointing: True
05/16/2022 16:22:08 - INFO - __main__ -   Use scan: True
05/16/2022 16:22:08 - INFO - __main__ -   Fuse matmuls: False
Epoch ... (1/4):   0% 0/4 [00:00<?, ?it/s]
Training...:   0% 0/13907 [00:00<?, ?it/s][A/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/tree_util.py:188: FutureWarning: jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() instead as a drop-in replacement.
  warnings.warn('jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() '

Training...:   0% 1/13907 [00:42<165:06:29, 42.74s/it][A
Training...:   0% 2/13907 [01:15<141:45:03, 36.70s/it][A
Training...:   0% 3/13907 [01:18<83:08:53, 21.53s/it] [A
Training...:   0% 4/13907 [01:21<55:09:09, 14.28s/it][A
Training...:   0% 5/13907 [01:24<39:32:53, 10.24s/it][A
Training...:   0% 6/13907 [01:55<66:43:10, 17.28s/it][A
Training...:   0% 7/13907 [01:58<48:43:05, 12.62s/it][A
Training...:   0% 8/13907 [02:01<36:44:39,  9.52s/it][A
Training...:   0% 9/13907 [02:04<28:39:17,  7.42s/it][A
Training...:   0% 10/13907 [02:07<23:02:08,  5.97s/it][A
Training...:   0% 11/13907 [02:09<19:08:16,  4.96s/it][A
Training...:   0% 12/13907 [02:12<16:23:28,  4.25s/it][A
Training...:   0% 13/13907 [02:15<14:23:10,  3.73s/it][A
Training...:   0% 14/13907 [02:17<12:55:15,  3.35s/it][A
Training...:   0% 15/13907 [02:20<11:51:07,  3.07s/it][A
Training...:   0% 16/13907 [02:22<11:05:19,  2.87s/it][A
Training...:   0% 17/13907 [02:24<10:30:41,  2.72s/it][A
Training...:   0% 18/13907 [02:27<10:02:28,  2.60s/it][A
Training...:   0% 19/13907 [02:29<9:45:53,  2.53s/it] [A
Training...:   0% 20/13907 [02:31<9:27:30,  2.45s/it][A
Training...:   0% 21/13907 [03:01<40:45:30, 10.57s/it][A
Training...:   0% 22/13907 [03:03<31:13:06,  8.09s/it][A
Training...:   0% 23/13907 [03:05<24:27:07,  6.34s/it][A
Training...:   0% 24/13907 [03:08<19:41:06,  5.10s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [03:22<?, ?it/s]
Training...:   0% 24/13907 [03:10<19:41:06,  5.10s/it][A
Training...:   0% 25/13907 [03:10<16:35:10,  4.30s/it][A
Training...:   0% 26/13907 [03:12<14:04:59,  3.65s/it][A
Training...:   0% 27/13907 [03:14<12:12:44,  3.17s/it][A
Training...:   0% 28/13907 [03:16<10:54:02,  2.83s/it][A
Training...:   0% 29/13907 [03:18<9:55:10,  2.57s/it] [A
Training...:   0% 30/13907 [03:20<9:12:37,  2.39s/it][A
Training...:   0% 31/13907 [03:22<8:40:15,  2.25s/it][A
Training...:   0% 32/13907 [03:24<8:16:47,  2.15s/it][A
Training...:   0% 33/13907 [03:26<7:58:27,  2.07s/it][A
Training...:   0% 34/13907 [03:28<7:42:52,  2.00s/it][A
Training...:   0% 35/13907 [03:30<7:29:24,  1.94s/it][A
Training...:   0% 36/13907 [03:31<7:18:06,  1.90s/it][A
Training...:   0% 37/13907 [03:33<7:07:49,  1.85s/it][A
Training...:   0% 38/13907 [03:35<6:57:12,  1.80s/it][A
Training...:   0% 39/13907 [03:36<6:48:12,  1.77s/it][A
Training...:   0% 40/13907 [03:38<6:38:24,  1.72s/it][A
Training...:   0% 41/13907 [03:40<6:29:31,  1.69s/it][A
Training...:   0% 42/13907 [03:41<6:20:28,  1.65s/it][A
Training...:   0% 43/13907 [03:43<6:11:48,  1.61s/it][A
Training...:   0% 44/13907 [04:17<43:52:59, 11.40s/it][A
Training...:   0% 45/13907 [04:18<32:25:52,  8.42s/it][A
Training...:   0% 46/13907 [04:20<24:19:45,  6.32s/it][A
Training...:   0% 47/13907 [04:21<18:35:35,  4.83s/it][A
Training...:   0% 48/13907 [04:22<14:28:00,  3.76s/it][A
Training...:   0% 49/13907 [04:24<11:29:03,  2.98s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [04:37<?, ?it/s]
Training...:   0% 49/13907 [04:25<11:29:03,  2.98s/it][A
Training...:   0% 50/13907 [04:25<9:26:04,  2.45s/it] [A
Training...:   0% 51/13907 [05:02<49:32:33, 12.87s/it][A
Training...:   0% 52/13907 [05:06<38:48:17, 10.08s/it][A
Training...:   0% 53/13907 [05:09<30:57:53,  8.05s/it][A
Training...:   0% 54/13907 [05:12<25:20:20,  6.58s/it][A
Training...:   0% 55/13907 [05:15<21:13:46,  5.52s/it][A
Training...:   0% 56/13907 [05:18<18:18:27,  4.76s/it][A
Training...:   0% 57/13907 [05:21<16:05:04,  4.18s/it][A
Training...:   0% 58/13907 [05:24<14:26:56,  3.76s/it][A
Training...:   0% 59/13907 [05:26<13:13:22,  3.44s/it][A
Training...:   0% 60/13907 [05:29<12:17:49,  3.20s/it][A
Training...:   0% 61/13907 [05:32<11:34:42,  3.01s/it][A
Training...:   0% 62/13907 [05:34<11:03:01,  2.87s/it][A
Training...:   0% 63/13907 [05:37<10:39:38,  2.77s/it][A
Training...:   0% 64/13907 [05:39<10:20:53,  2.69s/it][A
Training...:   0% 65/13907 [05:42<10:03:31,  2.62s/it][A
Training...:   0% 66/13907 [05:44<9:50:22,  2.56s/it] [A
Training...:   0% 67/13907 [05:46<9:39:20,  2.51s/it][A
Training...:   0% 68/13907 [05:49<9:26:40,  2.46s/it][A
Training...:   0% 69/13907 [05:51<9:16:09,  2.41s/it][A
Training...:   1% 70/13907 [05:53<9:06:06,  2.37s/it][A
Training...:   1% 71/13907 [05:56<8:55:30,  2.32s/it][A
Training...:   1% 72/13907 [05:58<8:47:45,  2.29s/it][A
Training...:   1% 73/13907 [06:00<8:38:51,  2.25s/it][A
Training...:   1% 74/13907 [06:02<8:29:50,  2.21s/it][A                                          
                                                     [AEpoch ... (1/4):   0% 0/4 [06:17<?, ?it/s]
Training...:   1% 74/13907 [06:04<8:29:50,  2.21s/it][A
Training...:   1% 75/13907 [06:04<8:43:18,  2.27s/it][A
Training...:   1% 76/13907 [06:07<8:31:43,  2.22s/it][A
Training...:   1% 77/13907 [06:09<8:19:08,  2.17s/it][A
Training...:   1% 78/13907 [06:11<8:08:32,  2.12s/it][A
Training...:   1% 79/13907 [06:13<7:58:05,  2.07s/it][A
Training...:   1% 80/13907 [06:15<7:49:41,  2.04s/it][A
Training...:   1% 81/13907 [06:16<7:41:03,  2.00s/it][A
Training...:   1% 82/13907 [06:18<7:33:45,  1.97s/it][A
Training...:   1% 83/13907 [06:20<7:25:56,  1.94s/it][A
Training...:   1% 84/13907 [06:22<7:19:04,  1.91s/it][A
Training...:   1% 85/13907 [06:24<7:11:32,  1.87s/it][A
Training...:   1% 86/13907 [06:26<7:06:16,  1.85s/it][A
Training...:   1% 87/13907 [06:27<6:58:49,  1.82s/it][A
Training...:   1% 88/13907 [06:29<6:51:29,  1.79s/it][A
Training...:   1% 89/13907 [06:31<6:43:18,  1.75s/it][A
Training...:   1% 90/13907 [06:32<6:36:36,  1.72s/it][A
Training...:   1% 91/13907 [06:34<6:27:43,  1.68s/it][A
Training...:   1% 92/13907 [06:36<6:18:45,  1.64s/it][A
Training...:   1% 93/13907 [06:37<6:10:13,  1.61s/it][A
Training...:   1% 94/13907 [06:39<5:59:33,  1.56s/it][A
Training...:   1% 95/13907 [06:40<5:48:58,  1.52s/it][A
Training...:   1% 96/13907 [06:41<5:39:46,  1.48s/it][A
Training...:   1% 97/13907 [06:43<5:28:36,  1.43s/it][A
Training...:   1% 98/13907 [06:44<5:15:12,  1.37s/it][A
Training...:   1% 99/13907 [06:45<4:57:57,  1.29s/it][A                                          
                                                     [AEpoch ... (1/4):   0% 0/4 [06:58<?, ?it/s]
Training...:   1% 99/13907 [06:46<4:57:57,  1.29s/it][A
Training...:   1% 100/13907 [06:46<4:50:19,  1.26s/it][A
Training...:   1% 101/13907 [06:50<7:35:02,  1.98s/it][A
Training...:   1% 102/13907 [06:53<9:10:40,  2.39s/it][A
Training...:   1% 103/13907 [06:56<10:05:49,  2.63s/it][A
Training...:   1% 104/13907 [06:59<10:36:25,  2.77s/it][A
Training...:   1% 105/13907 [07:02<10:50:40,  2.83s/it][A
Training...:   1% 106/13907 [07:05<10:55:59,  2.85s/it][A
Training...:   1% 107/13907 [07:08<10:54:23,  2.85s/it][A
Training...:   1% 108/13907 [07:11<10:48:35,  2.82s/it][A
Training...:   1% 109/13907 [07:14<10:40:02,  2.78s/it][A
Training...:   1% 110/13907 [07:16<10:29:29,  2.74s/it][A
Training...:   1% 111/13907 [07:19<10:19:06,  2.69s/it][A
Training...:   1% 112/13907 [07:21<10:08:47,  2.65s/it][A
Training...:   1% 113/13907 [07:24<9:59:30,  2.61s/it] [A
Training...:   1% 114/13907 [07:26<9:47:40,  2.56s/it][A
Training...:   1% 115/13907 [07:29<9:39:29,  2.52s/it][A
Training...:   1% 116/13907 [07:31<9:30:40,  2.48s/it][A
Training...:   1% 117/13907 [07:34<9:20:10,  2.44s/it][A
Training...:   1% 118/13907 [07:36<9:10:19,  2.39s/it][A
Training...:   1% 119/13907 [07:38<9:02:16,  2.36s/it][A
Training...:   1% 120/13907 [07:40<8:52:39,  2.32s/it][A
Training...:   1% 121/13907 [07:42<8:44:34,  2.28s/it][A
Training...:   1% 122/13907 [07:45<8:37:49,  2.25s/it][A
Training...:   1% 123/13907 [07:47<8:29:03,  2.22s/it][A
Training...:   1% 124/13907 [07:49<8:22:13,  2.19s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [08:04<?, ?it/s]
Training...:   1% 124/13907 [07:51<8:22:13,  2.19s/it][A
Training...:   1% 125/13907 [07:51<8:36:01,  2.25s/it][A
Training...:   1% 126/13907 [07:53<8:25:37,  2.20s/it][A
Training...:   1% 127/13907 [07:55<8:13:15,  2.15s/it][A
Training...:   1% 128/13907 [07:57<8:04:05,  2.11s/it][A
Training...:   1% 129/13907 [07:59<7:55:03,  2.07s/it][A
Training...:   1% 130/13907 [08:01<7:49:51,  2.05s/it][A
Training...:   1% 131/13907 [08:03<7:42:21,  2.01s/it][A
Training...:   1% 132/13907 [08:05<7:33:20,  1.97s/it][A
Training...:   1% 133/13907 [08:07<7:24:48,  1.94s/it][A
Training...:   1% 134/13907 [08:09<7:17:57,  1.91s/it][A
Training...:   1% 135/13907 [08:11<7:10:43,  1.88s/it][A
Training...:   1% 136/13907 [08:13<7:03:14,  1.84s/it][A
Training...:   1% 137/13907 [08:14<6:55:42,  1.81s/it][A
Training...:   1% 138/13907 [08:16<6:48:10,  1.78s/it][A
Training...:   1% 139/13907 [08:18<6:40:32,  1.75s/it][A
Training...:   1% 140/13907 [08:19<6:34:18,  1.72s/it][A
Training...:   1% 141/13907 [08:21<6:28:08,  1.69s/it][A
Training...:   1% 142/13907 [08:23<6:22:28,  1.67s/it][A
Training...:   1% 143/13907 [08:24<6:14:37,  1.63s/it][A
Training...:   1% 144/13907 [08:26<6:04:23,  1.59s/it][A
Training...:   1% 145/13907 [08:27<5:53:32,  1.54s/it][A
Training...:   1% 146/13907 [08:28<5:42:15,  1.49s/it][A
Training...:   1% 147/13907 [08:30<5:28:58,  1.43s/it][A
Training...:   1% 148/13907 [08:31<5:14:53,  1.37s/it][A
Training...:   1% 149/13907 [08:32<4:58:41,  1.30s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [08:46<?, ?it/s]
Training...:   1% 149/13907 [08:33<4:58:41,  1.30s/it][A
Training...:   1% 150/13907 [08:33<4:49:31,  1.26s/it][A
Training...:   1% 151/13907 [08:37<7:33:34,  1.98s/it][A
Training...:   1% 152/13907 [08:40<9:06:56,  2.39s/it][A
Training...:   1% 153/13907 [08:43<10:01:08,  2.62s/it][A
Training...:   1% 154/13907 [08:46<10:30:44,  2.75s/it][A
Training...:   1% 155/13907 [08:49<10:42:44,  2.80s/it][A
Training...:   1% 156/13907 [08:52<10:44:19,  2.81s/it][A
Training...:   1% 157/13907 [08:55<10:43:40,  2.81s/it][A
Training...:   1% 158/13907 [08:58<10:38:21,  2.79s/it][A
Training...:   1% 159/13907 [09:00<10:33:05,  2.76s/it][A
Training...:   1% 160/13907 [09:03<10:24:56,  2.73s/it][A
Training...:   1% 161/13907 [09:06<10:14:23,  2.68s/it][A
Training...:   1% 162/13907 [09:08<10:04:44,  2.64s/it][A
Training...:   1% 163/13907 [09:11<9:55:27,  2.60s/it] [A
Training...:   1% 164/13907 [09:13<9:47:03,  2.56s/it][A
Training...:   1% 165/13907 [09:16<9:38:10,  2.52s/it][A
Training...:   1% 166/13907 [09:18<9:28:16,  2.48s/it][A
Training...:   1% 167/13907 [09:20<9:16:34,  2.43s/it][A
Training...:   1% 168/13907 [09:23<9:07:25,  2.39s/it][A
Training...:   1% 169/13907 [09:25<8:58:34,  2.35s/it][A
Training...:   1% 170/13907 [09:27<8:50:03,  2.32s/it][A
Training...:   1% 171/13907 [09:29<8:42:37,  2.28s/it][A
Training...:   1% 172/13907 [09:31<8:33:35,  2.24s/it][A
Training...:   1% 173/13907 [09:34<8:29:54,  2.23s/it][A
Training...:   1% 174/13907 [09:36<8:21:27,  2.19s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [09:50<?, ?it/s]
Training...:   1% 174/13907 [09:38<8:21:27,  2.19s/it][A
Training...:   1% 175/13907 [09:38<8:36:02,  2.25s/it][A
Training...:   1% 176/13907 [09:40<8:26:06,  2.21s/it][A
Training...:   1% 177/13907 [09:42<8:14:09,  2.16s/it][A
Training...:   1% 178/13907 [09:44<8:04:10,  2.12s/it][A
Training...:   1% 179/13907 [09:46<7:54:42,  2.07s/it][A
Training...:   1% 180/13907 [09:48<7:46:05,  2.04s/it][A
Training...:   1% 181/13907 [09:50<7:36:09,  1.99s/it][A
Training...:   1% 182/13907 [09:52<7:27:59,  1.96s/it][A
Training...:   1% 183/13907 [09:54<7:20:14,  1.92s/it][A
Training...:   1% 184/13907 [09:56<7:12:36,  1.89s/it][A
Training...:   1% 185/13907 [09:57<7:03:26,  1.85s/it][A
Training...:   1% 186/13907 [09:59<6:56:40,  1.82s/it][A
Training...:   1% 187/13907 [10:01<6:48:48,  1.79s/it][A
Training...:   1% 188/13907 [10:03<6:41:22,  1.76s/it][A
Training...:   1% 189/13907 [10:04<6:35:09,  1.73s/it][A
Training...:   1% 190/13907 [10:06<6:26:18,  1.69s/it][A
Training...:   1% 191/13907 [10:07<6:19:09,  1.66s/it][A
Training...:   1% 192/13907 [10:09<6:10:45,  1.62s/it][A
Training...:   1% 193/13907 [10:10<6:01:21,  1.58s/it][A
Training...:   1% 194/13907 [10:12<5:51:34,  1.54s/it][A
Training...:   1% 195/13907 [10:13<5:41:04,  1.49s/it][A
Training...:   1% 196/13907 [10:15<5:30:55,  1.45s/it][A
Training...:   1% 197/13907 [10:16<5:18:50,  1.40s/it][A
Training...:   1% 198/13907 [10:17<5:05:32,  1.34s/it][A
Training...:   1% 199/13907 [10:18<4:51:28,  1.28s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [10:32<?, ?it/s]
Training...:   1% 199/13907 [10:19<4:51:28,  1.28s/it][A
Training...:   1% 200/13907 [10:19<4:43:28,  1.24s/it][A
Training...:   1% 201/13907 [10:23<7:31:48,  1.98s/it][A
Training...:   1% 202/13907 [10:26<9:05:41,  2.39s/it][A
Training...:   1% 203/13907 [10:30<9:58:09,  2.62s/it][A
Training...:   1% 204/13907 [10:33<10:27:16,  2.75s/it][A
Training...:   1% 205/13907 [10:36<10:42:08,  2.81s/it][A
Training...:   1% 206/13907 [10:38<10:44:09,  2.82s/it][A
Training...:   1% 207/13907 [10:41<10:42:20,  2.81s/it][A
Training...:   1% 208/13907 [10:44<10:36:25,  2.79s/it][A
Training...:   2% 209/13907 [10:47<10:27:23,  2.75s/it][A
Training...:   2% 210/13907 [10:49<10:17:08,  2.70s/it][A
Training...:   2% 211/13907 [10:52<10:07:31,  2.66s/it][A
Training...:   2% 212/13907 [10:54<10:00:25,  2.63s/it][A
Training...:   2% 213/13907 [10:57<9:50:15,  2.59s/it] [A
Training...:   2% 214/13907 [10:59<9:39:51,  2.54s/it][A
Training...:   2% 215/13907 [11:02<9:36:27,  2.53s/it][A
Training...:   2% 216/13907 [11:04<9:28:53,  2.49s/it][A
Training...:   2% 217/13907 [11:06<9:18:20,  2.45s/it][A
Training...:   2% 218/13907 [11:09<9:10:50,  2.41s/it][A
Training...:   2% 219/13907 [11:11<9:00:35,  2.37s/it][A
Training...:   2% 220/13907 [11:13<8:50:11,  2.32s/it][A
Training...:   2% 221/13907 [11:15<8:41:31,  2.29s/it][A
Training...:   2% 222/13907 [11:18<8:32:29,  2.25s/it][A
Training...:   2% 223/13907 [11:20<8:25:56,  2.22s/it][A
Training...:   2% 224/13907 [11:22<8:18:01,  2.18s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [11:37<?, ?it/s]
Training...:   2% 224/13907 [11:24<8:18:01,  2.18s/it][A
Training...:   2% 225/13907 [11:24<8:31:12,  2.24s/it][A
Training...:   2% 226/13907 [11:26<8:20:28,  2.19s/it][A
Training...:   2% 227/13907 [11:28<8:07:08,  2.14s/it][A
Training...:   2% 228/13907 [11:30<7:57:44,  2.10s/it][A
Training...:   2% 229/13907 [11:32<7:47:21,  2.05s/it][A
Training...:   2% 230/13907 [11:34<7:39:45,  2.02s/it][A
Training...:   2% 231/13907 [11:36<7:31:07,  1.98s/it][A
Training...:   2% 232/13907 [11:38<7:23:56,  1.95s/it][A
Training...:   2% 233/13907 [11:40<7:17:13,  1.92s/it][A
Training...:   2% 234/13907 [11:42<7:08:48,  1.88s/it][A
Training...:   2% 235/13907 [11:43<7:00:15,  1.84s/it][A
Training...:   2% 236/13907 [11:45<6:53:55,  1.82s/it][A
Training...:   2% 237/13907 [11:47<6:45:45,  1.78s/it][A
Training...:   2% 238/13907 [11:49<6:39:03,  1.75s/it][A
Training...:   2% 239/13907 [11:50<6:32:05,  1.72s/it][A
Training...:   2% 240/13907 [11:52<6:24:44,  1.69s/it][A
Training...:   2% 241/13907 [11:53<6:16:45,  1.65s/it][A
Training...:   2% 242/13907 [11:55<6:10:28,  1.63s/it][A
Training...:   2% 243/13907 [11:56<6:01:57,  1.59s/it][A
Training...:   2% 244/13907 [11:58<5:54:47,  1.56s/it][A
Training...:   2% 245/13907 [11:59<5:46:01,  1.52s/it][A
Training...:   2% 246/13907 [12:01<5:35:51,  1.48s/it][A
Training...:   2% 247/13907 [12:02<5:25:13,  1.43s/it][A
Training...:   2% 248/13907 [12:03<5:12:00,  1.37s/it][A
Training...:   2% 249/13907 [12:04<4:55:32,  1.30s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [12:18<?, ?it/s]
Training...:   2% 249/13907 [12:06<4:55:32,  1.30s/it][A
Training...:   2% 250/13907 [12:06<4:46:48,  1.26s/it][A
Training...:   2% 251/13907 [12:49<53:07:37, 14.01s/it][A
Training...:   2% 252/13907 [12:53<41:15:39, 10.88s/it][A
Training...:   2% 253/13907 [12:56<32:37:09,  8.60s/it][A
Training...:   2% 254/13907 [12:59<26:21:40,  6.95s/it][A
Training...:   2% 255/13907 [13:02<21:52:07,  5.77s/it][A
Training...:   2% 256/13907 [13:05<18:40:28,  4.92s/it][A
Training...:   2% 257/13907 [13:08<16:14:36,  4.28s/it][A
Training...:   2% 258/13907 [13:11<14:29:16,  3.82s/it][A
Training...:   2% 259/13907 [13:13<13:09:41,  3.47s/it][A
Training...:   2% 260/13907 [13:16<12:11:29,  3.22s/it][A
Training...:   2% 261/13907 [13:19<11:25:47,  3.02s/it][A
Training...:   2% 262/13907 [13:21<10:54:05,  2.88s/it][A
Training...:   2% 263/13907 [13:24<10:28:57,  2.77s/it][A
Training...:   2% 264/13907 [13:26<10:08:25,  2.68s/it][A
Training...:   2% 265/13907 [13:29<9:50:54,  2.60s/it] [A
Training...:   2% 266/13907 [13:31<9:38:33,  2.54s/it][A
Training...:   2% 267/13907 [13:33<9:30:51,  2.51s/it][A
Training...:   2% 268/13907 [13:36<9:19:03,  2.46s/it][A
Training...:   2% 269/13907 [13:38<9:06:06,  2.40s/it][A
Training...:   2% 270/13907 [13:40<8:56:14,  2.36s/it][A
Training...:   2% 271/13907 [13:42<8:45:45,  2.31s/it][A
Training...:   2% 272/13907 [13:45<8:36:43,  2.27s/it][A
Training...:   2% 273/13907 [13:47<8:27:56,  2.24s/it][A
Training...:   2% 274/13907 [13:49<8:20:28,  2.20s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [14:04<?, ?it/s]
Training...:   2% 274/13907 [13:51<8:20:28,  2.20s/it][A
Training...:   2% 275/13907 [13:51<8:32:05,  2.25s/it][A
Training...:   2% 276/13907 [13:53<8:21:46,  2.21s/it][A
Training...:   2% 277/13907 [13:55<8:07:52,  2.15s/it][A
Training...:   2% 278/13907 [13:57<7:58:21,  2.11s/it][A
Training...:   2% 279/13907 [13:59<7:47:01,  2.06s/it][A
Training...:   2% 280/13907 [14:01<7:36:41,  2.01s/it][A
Training...:   2% 281/13907 [14:03<7:29:43,  1.98s/it][A
Training...:   2% 282/13907 [14:05<7:21:24,  1.94s/it][A
Training...:   2% 283/13907 [14:07<7:16:28,  1.92s/it][A
Training...:   2% 284/13907 [14:09<7:08:44,  1.89s/it][A
Training...:   2% 285/13907 [14:10<6:59:50,  1.85s/it][A
Training...:   2% 286/13907 [14:12<6:51:49,  1.81s/it][A
Training...:   2% 287/13907 [14:14<6:44:08,  1.78s/it][A
Training...:   2% 288/13907 [14:16<6:37:19,  1.75s/it][A
Training...:   2% 289/13907 [14:17<6:29:37,  1.72s/it][A
Training...:   2% 290/13907 [14:19<6:21:38,  1.68s/it][A
Training...:   2% 291/13907 [14:20<6:14:04,  1.65s/it][A
Training...:   2% 292/13907 [14:22<6:05:28,  1.61s/it][A
Training...:   2% 293/13907 [14:23<5:56:35,  1.57s/it][A
Training...:   2% 294/13907 [14:25<5:49:02,  1.54s/it][A
Training...:   2% 295/13907 [14:26<5:38:26,  1.49s/it][A
Training...:   2% 296/13907 [14:28<5:28:05,  1.45s/it][A
Training...:   2% 297/13907 [14:29<5:16:25,  1.39s/it][A
Training...:   2% 298/13907 [14:30<5:02:58,  1.34s/it][A
Training...:   2% 299/13907 [14:31<4:46:53,  1.26s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [14:45<?, ?it/s]
Training...:   2% 299/13907 [14:32<4:46:53,  1.26s/it][A
Training...:   2% 300/13907 [14:32<4:38:22,  1.23s/it][A
Training...:   2% 301/13907 [15:08<43:37:03, 11.54s/it][A
Training...:   2% 302/13907 [15:12<34:44:43,  9.19s/it][A
Training...:   2% 303/13907 [15:15<28:08:40,  7.45s/it][A
Training...:   2% 304/13907 [15:18<23:16:55,  6.16s/it][A
Training...:   2% 305/13907 [15:21<19:45:31,  5.23s/it][A
Training...:   2% 306/13907 [15:24<17:10:33,  4.55s/it][A
Training...:   2% 307/13907 [15:27<15:13:04,  4.03s/it][A
Training...:   2% 308/13907 [15:30<13:47:01,  3.65s/it][A
Training...:   2% 309/13907 [15:32<12:41:58,  3.36s/it][A
Training...:   2% 310/13907 [15:35<11:53:52,  3.15s/it][A
Training...:   2% 311/13907 [15:38<11:17:38,  2.99s/it][A
Training...:   2% 312/13907 [15:40<10:48:34,  2.86s/it][A
Training...:   2% 313/13907 [15:43<10:24:39,  2.76s/it][A
Training...:   2% 314/13907 [15:45<10:05:20,  2.67s/it][A
Training...:   2% 315/13907 [15:48<9:54:22,  2.62s/it] [A
Training...:   2% 316/13907 [15:50<9:39:08,  2.56s/it][A
Training...:   2% 317/13907 [15:53<9:26:17,  2.50s/it][A
Training...:   2% 318/13907 [15:55<9:15:18,  2.45s/it][A
Training...:   2% 319/13907 [15:57<9:03:29,  2.40s/it][A
Training...:   2% 320/13907 [15:59<8:53:54,  2.36s/it][A
Training...:   2% 321/13907 [16:02<8:44:09,  2.31s/it][A
Training...:   2% 322/13907 [16:04<8:37:54,  2.29s/it][A
Training...:   2% 323/13907 [16:06<8:28:55,  2.25s/it][A
Training...:   2% 324/13907 [16:08<8:21:34,  2.22s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [16:23<?, ?it/s]
Training...:   2% 324/13907 [16:11<8:21:34,  2.22s/it][A
Training...:   2% 325/13907 [16:11<8:33:45,  2.27s/it][A
Training...:   2% 326/13907 [16:13<8:22:06,  2.22s/it][A
Training...:   2% 327/13907 [16:15<8:08:41,  2.16s/it][A
Training...:   2% 328/13907 [16:17<7:57:03,  2.11s/it][A
Training...:   2% 329/13907 [16:19<7:45:50,  2.06s/it][A
Training...:   2% 330/13907 [16:21<7:37:10,  2.02s/it][A
Training...:   2% 331/13907 [16:23<7:34:30,  2.01s/it][A
Training...:   2% 332/13907 [16:24<7:26:54,  1.98s/it][A
Training...:   2% 333/13907 [16:26<7:19:13,  1.94s/it][A
Training...:   2% 334/13907 [16:28<7:12:24,  1.91s/it][A
Training...:   2% 335/13907 [16:30<7:04:15,  1.88s/it][A
Training...:   2% 336/13907 [16:32<6:56:48,  1.84s/it][A
Training...:   2% 337/13907 [16:33<6:47:40,  1.80s/it][A
Training...:   2% 338/13907 [16:35<6:40:20,  1.77s/it][A
Training...:   2% 339/13907 [16:37<6:32:54,  1.74s/it][A
Training...:   2% 340/13907 [16:38<6:26:19,  1.71s/it][A
Training...:   2% 341/13907 [16:40<6:18:19,  1.67s/it][A
Training...:   2% 342/13907 [16:42<6:09:27,  1.63s/it][A
Training...:   2% 343/13907 [16:43<6:00:02,  1.59s/it][A
Training...:   2% 344/13907 [16:44<5:51:46,  1.56s/it][A
Training...:   2% 345/13907 [16:46<5:41:22,  1.51s/it][A
Training...:   2% 346/13907 [16:47<5:31:23,  1.47s/it][A
Training...:   2% 347/13907 [16:49<5:19:13,  1.41s/it][A
Training...:   3% 348/13907 [16:50<5:05:28,  1.35s/it][A
Training...:   3% 349/13907 [16:51<4:48:45,  1.28s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [17:04<?, ?it/s]
Training...:   3% 349/13907 [16:52<4:48:45,  1.28s/it][A
Training...:   3% 350/13907 [16:52<4:40:32,  1.24s/it][A
Training...:   3% 351/13907 [16:56<7:22:57,  1.96s/it][A
Training...:   3% 352/13907 [16:59<8:53:57,  2.36s/it][A
Training...:   3% 353/13907 [17:02<9:49:38,  2.61s/it][A
Training...:   3% 354/13907 [17:05<10:18:41,  2.74s/it][A
Training...:   3% 355/13907 [17:08<10:33:01,  2.80s/it][A
Training...:   3% 356/13907 [17:11<10:36:35,  2.82s/it][A
Training...:   3% 357/13907 [17:14<10:31:17,  2.80s/it][A
Training...:   3% 358/13907 [17:16<10:25:12,  2.77s/it][A
Training...:   3% 359/13907 [17:19<10:16:56,  2.73s/it][A
Training...:   3% 360/13907 [17:22<10:09:17,  2.70s/it][A
Training...:   3% 361/13907 [17:24<10:01:10,  2.66s/it][A
Training...:   3% 362/13907 [17:27<9:51:34,  2.62s/it] [A
Training...:   3% 363/13907 [17:29<9:44:55,  2.59s/it][A
Training...:   3% 364/13907 [17:32<9:37:19,  2.56s/it][A
Training...:   3% 365/13907 [17:34<9:30:01,  2.53s/it][A
Training...:   3% 366/13907 [17:37<9:21:41,  2.49s/it][A
Training...:   3% 367/13907 [17:39<9:12:19,  2.45s/it][A
Training...:   3% 368/13907 [17:41<9:03:44,  2.41s/it][A
Training...:   3% 369/13907 [17:44<8:57:37,  2.38s/it][A
Training...:   3% 370/13907 [17:46<8:49:30,  2.35s/it][A
Training...:   3% 371/13907 [17:48<8:40:01,  2.31s/it][A
Training...:   3% 372/13907 [17:50<8:32:22,  2.27s/it][A
Training...:   3% 373/13907 [17:52<8:23:20,  2.23s/it][A
Training...:   3% 374/13907 [17:55<8:13:30,  2.19s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [18:09<?, ?it/s]
Training...:   3% 374/13907 [17:57<8:13:30,  2.19s/it][A
Training...:   3% 375/13907 [17:57<8:27:18,  2.25s/it][A
Training...:   3% 376/13907 [17:59<8:16:48,  2.20s/it][A
Training...:   3% 377/13907 [18:01<8:03:47,  2.15s/it][A
Training...:   3% 378/13907 [18:03<7:54:59,  2.11s/it][A
Training...:   3% 379/13907 [18:05<7:45:40,  2.07s/it][A
Training...:   3% 380/13907 [18:07<7:36:10,  2.02s/it][A
Training...:   3% 381/13907 [18:09<7:27:51,  1.99s/it][A
Training...:   3% 382/13907 [18:11<7:20:33,  1.95s/it][A
Training...:   3% 383/13907 [18:13<7:12:48,  1.92s/it][A
Training...:   3% 384/13907 [18:14<7:05:02,  1.89s/it][A
Training...:   3% 385/13907 [18:16<6:57:50,  1.85s/it][A
Training...:   3% 386/13907 [18:18<6:49:08,  1.82s/it][A
Training...:   3% 387/13907 [18:20<6:42:44,  1.79s/it][A
Training...:   3% 388/13907 [18:21<6:35:23,  1.75s/it][A
Training...:   3% 389/13907 [18:23<6:28:40,  1.73s/it][A
Training...:   3% 390/13907 [18:25<6:21:24,  1.69s/it][A
Training...:   3% 391/13907 [18:26<6:13:11,  1.66s/it][A
Training...:   3% 392/13907 [18:28<6:04:45,  1.62s/it][A
Training...:   3% 393/13907 [18:29<5:56:37,  1.58s/it][A
Training...:   3% 394/13907 [18:31<5:49:31,  1.55s/it][A
Training...:   3% 395/13907 [18:32<5:40:17,  1.51s/it][A
Training...:   3% 396/13907 [18:33<5:29:57,  1.47s/it][A
Training...:   3% 397/13907 [18:35<5:19:07,  1.42s/it][A
Training...:   3% 398/13907 [18:36<5:06:31,  1.36s/it][A
Training...:   3% 399/13907 [18:37<4:50:43,  1.29s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [18:51<?, ?it/s]
Training...:   3% 399/13907 [18:38<4:50:43,  1.29s/it][A
Training...:   3% 400/13907 [18:38<4:43:29,  1.26s/it][A
Training...:   3% 401/13907 [18:42<7:22:52,  1.97s/it][A
Training...:   3% 402/13907 [18:45<8:58:20,  2.39s/it][A
Training...:   3% 403/13907 [18:48<9:51:10,  2.63s/it][A
Training...:   3% 404/13907 [18:52<10:22:15,  2.76s/it][A
Training...:   3% 405/13907 [18:55<10:37:36,  2.83s/it][A
Training...:   3% 406/13907 [18:57<10:38:30,  2.84s/it][A
Training...:   3% 407/13907 [19:00<10:35:03,  2.82s/it][A
Training...:   3% 408/13907 [19:03<10:30:49,  2.80s/it][A
Training...:   3% 409/13907 [19:06<10:22:50,  2.77s/it][A
Training...:   3% 410/13907 [19:08<10:15:52,  2.74s/it][A
Training...:   3% 411/13907 [19:11<10:04:19,  2.69s/it][A
Training...:   3% 412/13907 [19:13<9:53:33,  2.64s/it] [A
Training...:   3% 413/13907 [19:16<9:43:13,  2.59s/it][A
Training...:   3% 414/13907 [19:18<9:34:12,  2.55s/it][A
Training...:   3% 415/13907 [19:21<9:23:48,  2.51s/it][A
Training...:   3% 416/13907 [19:23<9:15:44,  2.47s/it][A
Training...:   3% 417/13907 [19:25<9:08:06,  2.44s/it][A
Training...:   3% 418/13907 [19:28<9:00:10,  2.40s/it][A
Training...:   3% 419/13907 [19:30<8:51:42,  2.37s/it][A
Training...:   3% 420/13907 [19:32<8:42:29,  2.32s/it][A
Training...:   3% 421/13907 [19:34<8:33:30,  2.28s/it][A
Training...:   3% 422/13907 [19:37<8:25:44,  2.25s/it][A
Training...:   3% 423/13907 [19:39<8:17:54,  2.22s/it][A
Training...:   3% 424/13907 [19:41<8:11:13,  2.19s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [19:56<?, ?it/s]
Training...:   3% 424/13907 [19:43<8:11:13,  2.19s/it][A
Training...:   3% 425/13907 [19:43<8:24:58,  2.25s/it][A
Training...:   3% 426/13907 [19:45<8:13:34,  2.20s/it][A
Training...:   3% 427/13907 [19:47<8:00:46,  2.14s/it][A
Training...:   3% 428/13907 [19:49<7:48:58,  2.09s/it][A
Training...:   3% 429/13907 [19:51<7:38:08,  2.04s/it][A
Training...:   3% 430/13907 [19:53<7:29:30,  2.00s/it][A
Training...:   3% 431/13907 [19:55<7:21:49,  1.97s/it][A
Training...:   3% 432/13907 [19:57<7:14:19,  1.93s/it][A
Training...:   3% 433/13907 [19:59<7:05:55,  1.90s/it][A
Training...:   3% 434/13907 [20:01<6:59:46,  1.87s/it][A
Training...:   3% 435/13907 [20:02<6:51:49,  1.83s/it][A
Training...:   3% 436/13907 [20:04<6:45:53,  1.81s/it][A
Training...:   3% 437/13907 [20:06<6:38:28,  1.77s/it][A
Training...:   3% 438/13907 [20:07<6:30:55,  1.74s/it][A
Training...:   3% 439/13907 [20:09<6:22:42,  1.70s/it][A
Training...:   3% 440/13907 [20:11<6:16:41,  1.68s/it][A
Training...:   3% 441/13907 [20:12<6:08:38,  1.64s/it][A
Training...:   3% 442/13907 [20:14<6:00:51,  1.61s/it][A
Training...:   3% 443/13907 [20:15<5:52:55,  1.57s/it][A
Training...:   3% 444/13907 [20:17<5:44:10,  1.53s/it][A
Training...:   3% 445/13907 [20:18<5:34:57,  1.49s/it][A
Training...:   3% 446/13907 [20:19<5:24:39,  1.45s/it][A
Training...:   3% 447/13907 [20:21<5:12:21,  1.39s/it][A
Training...:   3% 448/13907 [20:22<5:01:32,  1.34s/it][A
Training...:   3% 449/13907 [20:23<4:46:11,  1.28s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [20:36<?, ?it/s]
Training...:   3% 449/13907 [20:24<4:46:11,  1.28s/it][A
Training...:   3% 450/13907 [20:24<4:39:52,  1.25s/it][A
Training...:   3% 451/13907 [21:00<43:49:03, 11.72s/it][A
Training...:   3% 452/13907 [21:04<34:46:18,  9.30s/it][A
Training...:   3% 453/13907 [21:07<27:59:11,  7.49s/it][A
Training...:   3% 454/13907 [21:10<23:05:16,  6.18s/it][A
Training...:   3% 455/13907 [21:13<19:33:25,  5.23s/it][A
Training...:   3% 456/13907 [21:16<16:57:40,  4.54s/it][A
Training...:   3% 457/13907 [21:19<14:58:20,  4.01s/it][A
Training...:   3% 458/13907 [21:22<13:36:25,  3.64s/it][A
Training...:   3% 459/13907 [21:25<12:32:44,  3.36s/it][A
Training...:   3% 460/13907 [21:27<11:41:52,  3.13s/it][A
Training...:   3% 461/13907 [21:30<11:03:22,  2.96s/it][A
Training...:   3% 462/13907 [21:32<10:34:54,  2.83s/it][A
Training...:   3% 463/13907 [21:35<10:11:38,  2.73s/it][A
Training...:   3% 464/13907 [21:37<9:53:16,  2.65s/it] [A
Training...:   3% 465/13907 [21:40<9:36:49,  2.57s/it][A
Training...:   3% 466/13907 [21:42<9:23:19,  2.51s/it][A
Training...:   3% 467/13907 [21:44<9:13:48,  2.47s/it][A
Training...:   3% 468/13907 [21:47<9:05:49,  2.44s/it][A
Training...:   3% 469/13907 [21:49<8:58:08,  2.40s/it][A
Training...:   3% 470/13907 [21:51<8:48:11,  2.36s/it][A
Training...:   3% 471/13907 [21:54<8:38:35,  2.32s/it][A
Training...:   3% 472/13907 [21:56<8:30:36,  2.28s/it][A
Training...:   3% 473/13907 [21:58<8:19:21,  2.23s/it][A
Training...:   3% 474/13907 [22:00<8:11:26,  2.20s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [22:15<?, ?it/s]
Training...:   3% 474/13907 [22:02<8:11:26,  2.20s/it][A
Training...:   3% 475/13907 [22:02<8:23:47,  2.25s/it][A
Training...:   3% 476/13907 [22:04<8:14:23,  2.21s/it][A
Training...:   3% 477/13907 [22:06<7:59:28,  2.14s/it][A
Training...:   3% 478/13907 [22:08<7:48:29,  2.09s/it][A
Training...:   3% 479/13907 [22:10<7:36:55,  2.04s/it][A
Training...:   3% 480/13907 [22:12<7:27:48,  2.00s/it][A
Training...:   3% 481/13907 [22:14<7:19:14,  1.96s/it][A
Training...:   3% 482/13907 [22:16<7:10:43,  1.92s/it][A
Training...:   3% 483/13907 [22:18<7:02:10,  1.89s/it][A
Training...:   3% 484/13907 [22:20<6:57:25,  1.87s/it][A
Training...:   3% 485/13907 [22:21<6:51:41,  1.84s/it][A
Training...:   3% 486/13907 [22:23<6:46:51,  1.82s/it][A
Training...:   4% 487/13907 [22:25<6:42:29,  1.80s/it][A
Training...:   4% 488/13907 [22:27<6:38:15,  1.78s/it][A
Training...:   4% 489/13907 [22:28<6:30:21,  1.75s/it][A
Training...:   4% 490/13907 [22:30<6:22:47,  1.71s/it][A
Training...:   4% 491/13907 [22:31<6:12:04,  1.66s/it][A
Training...:   4% 492/13907 [22:33<6:03:02,  1.62s/it][A
Training...:   4% 493/13907 [22:34<5:52:26,  1.58s/it][A
Training...:   4% 494/13907 [22:36<5:44:07,  1.54s/it][A
Training...:   4% 495/13907 [22:37<5:33:59,  1.49s/it][A
Training...:   4% 496/13907 [22:39<5:24:00,  1.45s/it][A
Training...:   4% 497/13907 [22:40<5:11:47,  1.40s/it][A
Training...:   4% 498/13907 [22:41<4:59:03,  1.34s/it][A
Training...:   4% 499/13907 [22:42<4:44:21,  1.27s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [22:56<?, ?it/s]
Training...:   4% 499/13907 [22:43<4:44:21,  1.27s/it][A
Training...:   4% 500/13907 [22:43<4:36:52,  1.24s/it][A
Training...:   4% 501/13907 [22:47<7:16:21,  1.95s/it][A
Training...:   4% 502/13907 [22:50<8:48:11,  2.36s/it][A
Training...:   4% 503/13907 [22:53<9:39:24,  2.59s/it][A
Training...:   4% 504/13907 [22:56<10:08:07,  2.72s/it][A
Training...:   4% 505/13907 [22:59<10:20:16,  2.78s/it][A
Training...:   4% 506/13907 [23:02<10:28:38,  2.81s/it][A
Training...:   4% 507/13907 [23:05<10:25:03,  2.80s/it][A
Training...:   4% 508/13907 [23:08<10:21:07,  2.78s/it][A
Training...:   4% 509/13907 [23:10<10:13:55,  2.75s/it][A
Training...:   4% 510/13907 [23:13<10:04:48,  2.71s/it][A
Training...:   4% 511/13907 [23:16<9:54:06,  2.66s/it] [A
Training...:   4% 512/13907 [23:18<9:44:53,  2.62s/it][A
Training...:   4% 513/13907 [23:21<9:35:01,  2.58s/it][A
Training...:   4% 514/13907 [23:23<9:24:29,  2.53s/it][A
Training...:   4% 515/13907 [23:25<9:14:41,  2.49s/it][A
Training...:   4% 516/13907 [23:28<9:07:07,  2.45s/it][A
Training...:   4% 517/13907 [23:30<8:56:03,  2.40s/it][A
Training...:   4% 518/13907 [23:32<8:49:30,  2.37s/it][A
Training...:   4% 519/13907 [23:35<8:41:26,  2.34s/it][A
Training...:   4% 520/13907 [23:37<8:36:19,  2.31s/it][A
Training...:   4% 521/13907 [23:39<8:26:35,  2.27s/it][A
Training...:   4% 522/13907 [23:41<8:20:41,  2.24s/it][A
Training...:   4% 523/13907 [23:43<8:11:27,  2.20s/it][A
Training...:   4% 524/13907 [23:45<8:05:43,  2.18s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [24:00<?, ?it/s]
Training...:   4% 524/13907 [23:48<8:05:43,  2.18s/it][A
Training...:   4% 525/13907 [23:48<8:18:37,  2.24s/it][A
Training...:   4% 526/13907 [23:50<8:09:12,  2.19s/it][A
Training...:   4% 527/13907 [23:52<7:56:52,  2.14s/it][A
Training...:   4% 528/13907 [23:54<7:45:52,  2.09s/it][A
Training...:   4% 529/13907 [23:56<7:34:22,  2.04s/it][A
Training...:   4% 530/13907 [23:58<7:29:15,  2.02s/it][A
Training...:   4% 531/13907 [24:00<7:19:36,  1.97s/it][A
Training...:   4% 532/13907 [24:02<7:12:58,  1.94s/it][A
Training...:   4% 533/13907 [24:03<7:04:37,  1.91s/it][A
Training...:   4% 534/13907 [24:05<6:59:59,  1.88s/it][A
Training...:   4% 535/13907 [24:07<6:55:30,  1.86s/it][A
Training...:   4% 536/13907 [24:09<6:50:28,  1.84s/it][A
Training...:   4% 537/13907 [24:11<6:42:13,  1.81s/it][A
Training...:   4% 538/13907 [24:12<6:39:41,  1.79s/it][A
Training...:   4% 539/13907 [24:14<6:30:08,  1.75s/it][A
Training...:   4% 540/13907 [24:16<6:24:53,  1.73s/it][A
Training...:   4% 541/13907 [24:17<6:16:23,  1.69s/it][A
Training...:   4% 542/13907 [24:19<6:10:45,  1.66s/it][A
Training...:   4% 543/13907 [24:20<6:01:18,  1.62s/it][A
Training...:   4% 544/13907 [24:22<5:52:16,  1.58s/it][A
Training...:   4% 545/13907 [24:23<5:42:42,  1.54s/it][A
Training...:   4% 546/13907 [24:25<5:32:58,  1.50s/it][A
Training...:   4% 547/13907 [24:26<5:21:19,  1.44s/it][A
Training...:   4% 548/13907 [24:27<5:08:20,  1.38s/it][A
Training...:   4% 549/13907 [24:28<4:53:21,  1.32s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [24:42<?, ?it/s]
Training...:   4% 549/13907 [24:30<4:53:21,  1.32s/it][A
Training...:   4% 550/13907 [24:30<4:47:56,  1.29s/it][A
Training...:   4% 551/13907 [24:33<7:34:45,  2.04s/it][A
Training...:   4% 552/13907 [24:37<9:03:40,  2.44s/it][A
Training...:   4% 553/13907 [24:40<9:51:57,  2.66s/it][A
Training...:   4% 554/13907 [24:43<10:20:23,  2.79s/it][A
Training...:   4% 555/13907 [24:46<10:30:00,  2.83s/it][A
Training...:   4% 556/13907 [24:49<10:32:41,  2.84s/it][A
Training...:   4% 557/13907 [24:52<10:30:11,  2.83s/it][A
Training...:   4% 558/13907 [24:54<10:22:51,  2.80s/it][A
Training...:   4% 559/13907 [24:57<10:12:31,  2.75s/it][A
Training...:   4% 560/13907 [25:00<10:01:40,  2.70s/it][A
Training...:   4% 561/13907 [25:02<9:49:22,  2.65s/it] [A
Training...:   4% 562/13907 [25:05<9:43:15,  2.62s/it][A
Training...:   4% 563/13907 [25:07<9:30:58,  2.57s/it][A
Training...:   4% 564/13907 [25:10<9:21:13,  2.52s/it][A
Training...:   4% 565/13907 [25:12<9:10:31,  2.48s/it][A
Training...:   4% 566/13907 [25:14<9:01:53,  2.44s/it][A
Training...:   4% 567/13907 [25:17<8:53:04,  2.40s/it][A
Training...:   4% 568/13907 [25:19<8:45:06,  2.36s/it][A
Training...:   4% 569/13907 [25:21<8:34:17,  2.31s/it][A
Training...:   4% 570/13907 [25:23<8:26:23,  2.28s/it][A
Training...:   4% 571/13907 [25:25<8:16:47,  2.24s/it][A
Training...:   4% 572/13907 [25:28<8:11:34,  2.21s/it][A
Training...:   4% 573/13907 [25:30<8:04:50,  2.18s/it][A
Training...:   4% 574/13907 [25:32<7:58:10,  2.15s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [25:46<?, ?it/s]
Training...:   4% 574/13907 [25:34<7:58:10,  2.15s/it][A
Training...:   4% 575/13907 [25:34<8:15:27,  2.23s/it][A
Training...:   4% 576/13907 [25:36<8:05:02,  2.18s/it][A
Training...:   4% 577/13907 [25:38<7:51:47,  2.12s/it][A
Training...:   4% 578/13907 [25:40<7:44:39,  2.09s/it][A
Training...:   4% 579/13907 [25:42<7:33:11,  2.04s/it][A
Training...:   4% 580/13907 [25:44<7:24:36,  2.00s/it][A
Training...:   4% 581/13907 [25:46<7:17:13,  1.97s/it][A
Training...:   4% 582/13907 [25:48<7:11:15,  1.94s/it][A
Training...:   4% 583/13907 [25:50<7:05:45,  1.92s/it][A
Training...:   4% 584/13907 [25:52<6:59:09,  1.89s/it][A
Training...:   4% 585/13907 [25:53<6:52:40,  1.86s/it][A
Training...:   4% 586/13907 [25:55<6:46:52,  1.83s/it][A
Training...:   4% 587/13907 [25:57<6:37:31,  1.79s/it][A
Training...:   4% 588/13907 [25:58<6:29:56,  1.76s/it][A
Training...:   4% 589/13907 [26:00<6:21:50,  1.72s/it][A
Training...:   4% 590/13907 [26:02<6:14:05,  1.69s/it][A
Training...:   4% 591/13907 [26:03<6:06:15,  1.65s/it][A
Training...:   4% 592/13907 [26:05<5:59:35,  1.62s/it][A
Training...:   4% 593/13907 [26:06<5:49:17,  1.57s/it][A
Training...:   4% 594/13907 [26:08<5:40:10,  1.53s/it][A
Training...:   4% 595/13907 [26:09<5:30:51,  1.49s/it][A
Training...:   4% 596/13907 [26:10<5:20:28,  1.44s/it][A
Training...:   4% 597/13907 [26:12<5:08:29,  1.39s/it][A
Training...:   4% 598/13907 [26:13<4:54:57,  1.33s/it][A
Training...:   4% 599/13907 [26:14<4:40:43,  1.27s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [26:28<?, ?it/s]
Training...:   4% 599/13907 [26:15<4:40:43,  1.27s/it][A
Training...:   4% 600/13907 [26:15<4:34:17,  1.24s/it][A
Training...:   4% 601/13907 [26:19<7:12:12,  1.95s/it][A
Training...:   4% 602/13907 [26:22<8:47:12,  2.38s/it][A
Training...:   4% 603/13907 [26:25<9:43:55,  2.63s/it][A
Training...:   4% 604/13907 [26:28<10:12:02,  2.76s/it][A
Training...:   4% 605/13907 [26:31<10:21:53,  2.81s/it][A
Training...:   4% 606/13907 [26:34<10:25:52,  2.82s/it][A
Training...:   4% 607/13907 [26:37<10:21:57,  2.81s/it][A
Training...:   4% 608/13907 [26:40<10:15:20,  2.78s/it][A
Training...:   4% 609/13907 [26:42<10:07:07,  2.74s/it][A
Training...:   4% 610/13907 [26:45<10:00:06,  2.71s/it][A
Training...:   4% 611/13907 [26:48<9:51:41,  2.67s/it] [A
Training...:   4% 612/13907 [26:50<9:42:04,  2.63s/it][A
Training...:   4% 613/13907 [26:53<9:31:14,  2.58s/it][A
Training...:   4% 614/13907 [26:55<9:24:34,  2.55s/it][A
Training...:   4% 615/13907 [26:57<9:14:52,  2.50s/it][A
Training...:   4% 616/13907 [27:00<9:06:43,  2.47s/it][A
Training...:   4% 617/13907 [27:02<8:54:40,  2.41s/it][A
Training...:   4% 618/13907 [27:04<8:48:32,  2.39s/it][A
Training...:   4% 619/13907 [27:07<8:40:22,  2.35s/it][A
Training...:   4% 620/13907 [27:09<8:35:02,  2.33s/it][A
Training...:   4% 621/13907 [27:11<8:25:26,  2.28s/it][A
Training...:   4% 622/13907 [27:13<8:17:32,  2.25s/it][A
Training...:   4% 623/13907 [27:15<8:08:33,  2.21s/it][A
Training...:   4% 624/13907 [27:18<8:01:47,  2.18s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [27:32<?, ?it/s]
Training...:   4% 624/13907 [27:20<8:01:47,  2.18s/it][A
Training...:   4% 625/13907 [27:20<8:14:53,  2.24s/it][A
Training...:   5% 626/13907 [27:22<8:06:41,  2.20s/it][A
Training...:   5% 627/13907 [27:24<7:52:55,  2.14s/it][A
Training...:   5% 628/13907 [27:26<7:43:47,  2.10s/it][A
Training...:   5% 629/13907 [27:28<7:32:45,  2.05s/it][A
Training...:   5% 630/13907 [27:30<7:23:20,  2.00s/it][A
Training...:   5% 631/13907 [27:32<7:13:41,  1.96s/it][A
Training...:   5% 632/13907 [27:34<7:05:53,  1.92s/it][A
Training...:   5% 633/13907 [27:35<6:57:57,  1.89s/it][A
Training...:   5% 634/13907 [27:37<6:50:45,  1.86s/it][A
Training...:   5% 635/13907 [27:39<6:43:38,  1.82s/it][A
Training...:   5% 636/13907 [27:41<6:37:26,  1.80s/it][A
Training...:   5% 637/13907 [27:42<6:29:18,  1.76s/it][A
Training...:   5% 638/13907 [27:44<6:22:40,  1.73s/it][A
Training...:   5% 639/13907 [27:46<6:15:43,  1.70s/it][A
Training...:   5% 640/13907 [27:47<6:08:24,  1.67s/it][A
Training...:   5% 641/13907 [27:49<6:01:12,  1.63s/it][A
Training...:   5% 642/13907 [27:50<5:52:50,  1.60s/it][A
Training...:   5% 643/13907 [27:52<5:44:50,  1.56s/it][A
Training...:   5% 644/13907 [27:53<5:36:37,  1.52s/it][A
Training...:   5% 645/13907 [27:55<5:26:45,  1.48s/it][A
Training...:   5% 646/13907 [27:56<5:16:19,  1.43s/it][A
Training...:   5% 647/13907 [27:57<5:05:23,  1.38s/it][A
Training...:   5% 648/13907 [27:58<4:53:43,  1.33s/it][A
Training...:   5% 649/13907 [27:59<4:39:55,  1.27s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [28:13<?, ?it/s]
Training...:   5% 649/13907 [28:01<4:39:55,  1.27s/it][A
Training...:   5% 650/13907 [28:01<4:34:17,  1.24s/it][A
Training...:   5% 651/13907 [28:04<7:07:51,  1.94s/it][A
Training...:   5% 652/13907 [28:08<8:40:23,  2.36s/it][A
Training...:   5% 653/13907 [28:11<9:33:10,  2.59s/it][A
Training...:   5% 654/13907 [28:14<10:03:13,  2.73s/it][A
Training...:   5% 655/13907 [28:17<10:14:42,  2.78s/it][A
Training...:   5% 656/13907 [28:19<10:18:07,  2.80s/it][A
Training...:   5% 657/13907 [28:22<10:14:35,  2.78s/it][A
Training...:   5% 658/13907 [28:25<10:12:01,  2.77s/it][A
Training...:   5% 659/13907 [28:28<10:05:14,  2.74s/it][A
Training...:   5% 660/13907 [28:30<9:58:32,  2.71s/it] [A
Training...:   5% 661/13907 [28:33<9:48:32,  2.67s/it][A
Training...:   5% 662/13907 [28:35<9:43:04,  2.64s/it][A
Training...:   5% 663/13907 [28:38<9:32:32,  2.59s/it][A
Training...:   5% 664/13907 [28:40<9:23:20,  2.55s/it][A
Training...:   5% 665/13907 [28:43<9:11:11,  2.50s/it][A
Training...:   5% 666/13907 [28:45<9:03:01,  2.46s/it][A
Training...:   5% 667/13907 [28:47<8:50:45,  2.41s/it][A
Training...:   5% 668/13907 [28:50<8:44:21,  2.38s/it][A
Training...:   5% 669/13907 [28:52<8:36:04,  2.34s/it][A
Training...:   5% 670/13907 [28:54<8:30:13,  2.31s/it][A
Training...:   5% 671/13907 [28:56<8:20:16,  2.27s/it][A
Training...:   5% 672/13907 [28:59<8:13:57,  2.24s/it][A
Training...:   5% 673/13907 [29:01<8:06:05,  2.20s/it][A
Training...:   5% 674/13907 [29:03<8:03:21,  2.19s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [29:18<?, ?it/s]
Training...:   5% 674/13907 [29:05<8:03:21,  2.19s/it][A
Training...:   5% 675/13907 [29:05<8:16:22,  2.25s/it][A
Training...:   5% 676/13907 [29:07<8:07:42,  2.21s/it][A
Training...:   5% 677/13907 [29:09<7:53:03,  2.15s/it][A
Training...:   5% 678/13907 [29:11<7:44:13,  2.11s/it][A
Training...:   5% 679/13907 [29:13<7:32:25,  2.05s/it][A
Training...:   5% 680/13907 [29:15<7:24:05,  2.01s/it][A
Training...:   5% 681/13907 [29:17<7:14:24,  1.97s/it][A
Training...:   5% 682/13907 [29:19<7:07:47,  1.94s/it][A
Training...:   5% 683/13907 [29:21<6:58:37,  1.90s/it][A
Training...:   5% 684/13907 [29:23<6:54:35,  1.88s/it][A
Training...:   5% 685/13907 [29:24<6:46:41,  1.85s/it][A
Training...:   5% 686/13907 [29:26<6:40:13,  1.82s/it][A
Training...:   5% 687/13907 [29:28<6:31:54,  1.78s/it][A
Training...:   5% 688/13907 [29:29<6:25:19,  1.75s/it][A
Training...:   5% 689/13907 [29:31<6:18:05,  1.72s/it][A
Training...:   5% 690/13907 [29:33<6:11:26,  1.69s/it][A
Training...:   5% 691/13907 [29:34<6:03:54,  1.65s/it][A
Training...:   5% 692/13907 [29:36<5:55:15,  1.61s/it][A
Training...:   5% 693/13907 [29:37<5:48:28,  1.58s/it][A
Training...:   5% 694/13907 [29:39<5:38:00,  1.53s/it][A
Training...:   5% 695/13907 [29:40<5:28:27,  1.49s/it][A
Training...:   5% 696/13907 [29:41<5:16:54,  1.44s/it][A
Training...:   5% 697/13907 [29:43<5:04:58,  1.39s/it][A
Training...:   5% 698/13907 [29:44<4:53:03,  1.33s/it][A
Training...:   5% 699/13907 [29:45<4:38:23,  1.26s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [29:58<?, ?it/s]
Training...:   5% 699/13907 [29:46<4:38:23,  1.26s/it][A
Training...:   5% 700/13907 [29:46<4:31:23,  1.23s/it][A
Training...:   5% 701/13907 [29:50<7:18:33,  1.99s/it][A
Training...:   5% 702/13907 [29:53<8:51:21,  2.41s/it][A
Training...:   5% 703/13907 [29:56<9:38:29,  2.63s/it][A
Training...:   5% 704/13907 [29:59<10:04:05,  2.75s/it][A
Training...:   5% 705/13907 [30:02<10:13:26,  2.79s/it][A
Training...:   5% 706/13907 [30:05<10:17:54,  2.81s/it][A
Training...:   5% 707/13907 [30:08<10:14:41,  2.79s/it][A
Training...:   5% 708/13907 [30:11<10:07:32,  2.76s/it][A
Training...:   5% 709/13907 [30:13<9:57:16,  2.72s/it] [A
Training...:   5% 710/13907 [30:16<9:48:47,  2.68s/it][A
Training...:   5% 711/13907 [30:18<9:37:57,  2.63s/it][A
Training...:   5% 712/13907 [30:21<9:29:13,  2.59s/it][A
Training...:   5% 713/13907 [30:23<9:19:03,  2.54s/it][A
Training...:   5% 714/13907 [30:26<9:11:34,  2.51s/it][A
Training...:   5% 715/13907 [30:28<9:00:42,  2.46s/it][A
Training...:   5% 716/13907 [30:30<8:53:59,  2.43s/it][A
Training...:   5% 717/13907 [30:33<8:46:07,  2.39s/it][A
Training...:   5% 718/13907 [30:35<8:39:16,  2.36s/it][A
Training...:   5% 719/13907 [30:37<8:29:46,  2.32s/it][A
Training...:   5% 720/13907 [30:40<8:25:49,  2.30s/it][A
Training...:   5% 721/13907 [30:42<8:16:16,  2.26s/it][A
Training...:   5% 722/13907 [30:44<8:10:35,  2.23s/it][A
Training...:   5% 723/13907 [30:46<8:04:31,  2.21s/it][A
Training...:   5% 724/13907 [30:48<7:57:57,  2.18s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [31:03<?, ?it/s]
Training...:   5% 724/13907 [30:50<7:57:57,  2.18s/it][A
Training...:   5% 725/13907 [30:50<8:09:29,  2.23s/it][A
Training...:   5% 726/13907 [30:53<8:07:05,  2.22s/it][A
Training...:   5% 727/13907 [30:55<7:53:51,  2.16s/it][A
Training...:   5% 728/13907 [30:57<7:42:54,  2.11s/it][A
Training...:   5% 729/13907 [30:59<7:32:59,  2.06s/it][A
Training...:   5% 730/13907 [31:01<7:27:08,  2.04s/it][A
Training...:   5% 731/13907 [31:02<7:19:03,  2.00s/it][A
Training...:   5% 732/13907 [31:04<7:10:57,  1.96s/it][A
Training...:   5% 733/13907 [31:06<7:01:56,  1.92s/it][A
Training...:   5% 734/13907 [31:08<6:54:54,  1.89s/it][A
Training...:   5% 735/13907 [31:10<6:48:31,  1.86s/it][A
Training...:   5% 736/13907 [31:12<6:41:30,  1.83s/it][A
Training...:   5% 737/13907 [31:13<6:34:51,  1.80s/it][A
Training...:   5% 738/13907 [31:15<6:27:38,  1.77s/it][A
Training...:   5% 739/13907 [31:17<6:19:21,  1.73s/it][A
Training...:   5% 740/13907 [31:18<6:11:14,  1.69s/it][A
Training...:   5% 741/13907 [31:20<6:02:36,  1.65s/it][A
Training...:   5% 742/13907 [31:21<5:54:23,  1.62s/it][A
Training...:   5% 743/13907 [31:23<5:47:06,  1.58s/it][A
Training...:   5% 744/13907 [31:24<5:39:00,  1.55s/it][A
Training...:   5% 745/13907 [31:26<5:29:26,  1.50s/it][A
Training...:   5% 746/13907 [31:27<5:19:19,  1.46s/it][A
Training...:   5% 747/13907 [31:28<5:08:03,  1.40s/it][A
Training...:   5% 748/13907 [31:30<4:56:07,  1.35s/it][A
Training...:   5% 749/13907 [31:31<4:41:23,  1.28s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [31:44<?, ?it/s]
Training...:   5% 749/13907 [31:32<4:41:23,  1.28s/it][A
Training...:   5% 750/13907 [31:32<4:35:15,  1.26s/it][A
Training...:   5% 751/13907 [31:36<7:25:48,  2.03s/it][A
Training...:   5% 752/13907 [31:39<8:55:19,  2.44s/it][A
Training...:   5% 753/13907 [31:42<9:43:19,  2.66s/it][A
Training...:   5% 754/13907 [31:45<10:10:14,  2.78s/it][A
Training...:   5% 755/13907 [31:48<10:20:47,  2.83s/it][A
Training...:   5% 756/13907 [31:51<10:25:43,  2.85s/it][A
Training...:   5% 757/13907 [31:54<10:19:20,  2.83s/it][A
Training...:   5% 758/13907 [31:57<10:16:41,  2.81s/it][A
Training...:   5% 759/13907 [31:59<10:04:15,  2.76s/it][A
Training...:   5% 760/13907 [32:02<9:56:47,  2.72s/it] [A
Training...:   5% 761/13907 [32:05<9:46:47,  2.68s/it][A
Training...:   5% 762/13907 [32:07<9:37:30,  2.64s/it][A
Training...:   5% 763/13907 [32:10<9:27:37,  2.59s/it][A
Training...:   5% 764/13907 [32:12<9:18:41,  2.55s/it][A
Training...:   6% 765/13907 [32:14<9:07:14,  2.50s/it][A
Training...:   6% 766/13907 [32:17<9:02:08,  2.48s/it][A
Training...:   6% 767/13907 [32:19<8:52:37,  2.43s/it][A
Training...:   6% 768/13907 [32:21<8:43:35,  2.39s/it][A
Training...:   6% 769/13907 [32:24<8:35:44,  2.36s/it][A
Training...:   6% 770/13907 [32:26<8:28:02,  2.32s/it][A
Training...:   6% 771/13907 [32:28<8:20:25,  2.29s/it][A
Training...:   6% 772/13907 [32:30<8:16:58,  2.27s/it][A
Training...:   6% 773/13907 [32:33<8:07:13,  2.23s/it][A
Training...:   6% 774/13907 [32:35<8:00:22,  2.19s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [32:49<?, ?it/s]
Training...:   6% 774/13907 [32:37<8:00:22,  2.19s/it][A
Training...:   6% 775/13907 [32:37<8:14:05,  2.26s/it][A
Training...:   6% 776/13907 [32:39<8:03:07,  2.21s/it][A
Training...:   6% 777/13907 [32:41<7:48:34,  2.14s/it][A
Training...:   6% 778/13907 [32:43<7:37:38,  2.09s/it][A
Training...:   6% 779/13907 [32:45<7:27:31,  2.05s/it][A
Training...:   6% 780/13907 [32:47<7:19:01,  2.01s/it][A
Training...:   6% 781/13907 [32:49<7:11:47,  1.97s/it][A
Training...:   6% 782/13907 [32:51<7:05:08,  1.94s/it][A
Training...:   6% 783/13907 [32:53<6:56:37,  1.90s/it][A
Training...:   6% 784/13907 [32:54<6:49:29,  1.87s/it][A
Training...:   6% 785/13907 [32:56<6:42:28,  1.84s/it][A
Training...:   6% 786/13907 [32:58<6:35:54,  1.81s/it][A
Training...:   6% 787/13907 [33:00<6:30:39,  1.79s/it][A
Training...:   6% 788/13907 [33:01<6:23:17,  1.75s/it][A
Training...:   6% 789/13907 [33:03<6:16:26,  1.72s/it][A
Training...:   6% 790/13907 [33:05<6:09:52,  1.69s/it][A
Training...:   6% 791/13907 [33:06<6:03:11,  1.66s/it][A
Training...:   6% 792/13907 [33:08<5:54:59,  1.62s/it][A
Training...:   6% 793/13907 [33:09<5:47:15,  1.59s/it][A
Training...:   6% 794/13907 [33:11<5:38:59,  1.55s/it][A
Training...:   6% 795/13907 [33:12<5:29:38,  1.51s/it][A
Training...:   6% 796/13907 [33:13<5:18:47,  1.46s/it][A
Training...:   6% 797/13907 [33:15<5:07:39,  1.41s/it][A
Training...:   6% 798/13907 [33:16<4:55:12,  1.35s/it][A
Training...:   6% 799/13907 [33:17<4:40:52,  1.29s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [33:31<?, ?it/s]
Training...:   6% 799/13907 [33:18<4:40:52,  1.29s/it][A
Training...:   6% 800/13907 [33:18<4:33:20,  1.25s/it][A
Training...:   6% 801/13907 [33:22<7:07:28,  1.96s/it][A
Training...:   6% 802/13907 [33:25<8:40:11,  2.38s/it][A
Training...:   6% 803/13907 [33:28<9:29:45,  2.61s/it][A
Training...:   6% 804/13907 [33:31<9:58:52,  2.74s/it][A
Training...:   6% 805/13907 [33:34<10:09:35,  2.79s/it][A
Training...:   6% 806/13907 [33:37<10:16:44,  2.82s/it][A
Training...:   6% 807/13907 [33:40<10:12:11,  2.80s/it][A
Training...:   6% 808/13907 [33:43<10:08:17,  2.79s/it][A
Training...:   6% 809/13907 [33:45<9:57:05,  2.74s/it] [A
Training...:   6% 810/13907 [33:48<9:51:46,  2.71s/it][A
Training...:   6% 811/13907 [33:50<9:39:48,  2.66s/it][A
Training...:   6% 812/13907 [33:53<9:31:02,  2.62s/it][A
Training...:   6% 813/13907 [33:55<9:19:33,  2.56s/it][A
Training...:   6% 814/13907 [33:58<9:10:45,  2.52s/it][A
Training...:   6% 815/13907 [34:00<9:00:31,  2.48s/it][A
Training...:   6% 816/13907 [34:03<8:54:33,  2.45s/it][A
Training...:   6% 817/13907 [34:05<8:45:02,  2.41s/it][A
Training...:   6% 818/13907 [34:07<8:36:13,  2.37s/it][A
Training...:   6% 819/13907 [34:09<8:26:02,  2.32s/it][A
Training...:   6% 820/13907 [34:12<8:18:54,  2.29s/it][A
Training...:   6% 821/13907 [34:14<8:10:35,  2.25s/it][A
Training...:   6% 822/13907 [34:16<8:01:58,  2.21s/it][A
Training...:   6% 823/13907 [34:18<7:53:15,  2.17s/it][A
Training...:   6% 824/13907 [34:20<7:48:18,  2.15s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [34:35<?, ?it/s]
Training...:   6% 824/13907 [34:22<7:48:18,  2.15s/it][A
Training...:   6% 825/13907 [34:22<8:02:44,  2.21s/it][A
Training...:   6% 826/13907 [34:25<7:53:49,  2.17s/it][A
Training...:   6% 827/13907 [34:26<7:39:34,  2.11s/it][A
Training...:   6% 828/13907 [34:28<7:28:08,  2.06s/it][A
Training...:   6% 829/13907 [34:30<7:18:26,  2.01s/it][A
Training...:   6% 830/13907 [34:32<7:10:19,  1.97s/it][A
Training...:   6% 831/13907 [34:34<7:02:45,  1.94s/it][A
Training...:   6% 832/13907 [34:36<6:54:52,  1.90s/it][A
Training...:   6% 833/13907 [34:38<6:47:39,  1.87s/it][A
Training...:   6% 834/13907 [34:39<6:40:04,  1.84s/it][A
Training...:   6% 835/13907 [34:41<6:33:01,  1.80s/it][A
Training...:   6% 836/13907 [34:43<6:25:36,  1.77s/it][A
Training...:   6% 837/13907 [34:45<6:18:48,  1.74s/it][A
Training...:   6% 838/13907 [34:46<6:11:39,  1.71s/it][A
Training...:   6% 839/13907 [34:48<6:04:53,  1.68s/it][A
Training...:   6% 840/13907 [34:49<5:58:19,  1.65s/it][A
Training...:   6% 841/13907 [34:51<5:50:52,  1.61s/it][A
Training...:   6% 842/13907 [34:52<5:42:36,  1.57s/it][A
Training...:   6% 843/13907 [34:54<5:35:10,  1.54s/it][A
Training...:   6% 844/13907 [34:55<5:28:24,  1.51s/it][A
Training...:   6% 845/13907 [34:57<5:19:00,  1.47s/it][A
Training...:   6% 846/13907 [34:58<5:08:00,  1.41s/it][A
Training...:   6% 847/13907 [34:59<4:58:56,  1.37s/it][A
Training...:   6% 848/13907 [35:00<4:48:24,  1.33s/it][A
Training...:   6% 849/13907 [35:02<4:34:17,  1.26s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [35:15<?, ?it/s]
Training...:   6% 849/13907 [35:03<4:34:17,  1.26s/it][A
Training...:   6% 850/13907 [35:03<4:28:00,  1.23s/it][A
Training...:   6% 851/13907 [35:06<7:06:05,  1.96s/it][A
Training...:   6% 852/13907 [35:10<8:36:35,  2.37s/it][A
Training...:   6% 853/13907 [35:13<9:24:25,  2.59s/it][A
Training...:   6% 854/13907 [35:16<9:55:40,  2.74s/it][A
Training...:   6% 855/13907 [35:19<10:08:13,  2.80s/it][A
Training...:   6% 856/13907 [35:22<10:10:53,  2.81s/it][A
Training...:   6% 857/13907 [35:24<10:05:23,  2.78s/it][A
Training...:   6% 858/13907 [35:27<10:01:08,  2.76s/it][A
Training...:   6% 859/13907 [35:30<9:49:46,  2.71s/it] [A
Training...:   6% 860/13907 [35:32<9:43:16,  2.68s/it][A
Training...:   6% 861/13907 [35:35<9:33:52,  2.64s/it][A
Training...:   6% 862/13907 [35:37<9:23:45,  2.59s/it][A
Training...:   6% 863/13907 [35:40<9:13:39,  2.55s/it][A
Training...:   6% 864/13907 [35:42<9:05:45,  2.51s/it][A
Training...:   6% 865/13907 [35:44<8:53:33,  2.45s/it][A
Training...:   6% 866/13907 [35:47<8:46:06,  2.42s/it][A
Training...:   6% 867/13907 [35:49<8:36:40,  2.38s/it][A
Training...:   6% 868/13907 [35:51<8:34:16,  2.37s/it][A
Training...:   6% 869/13907 [35:54<8:24:01,  2.32s/it][A
Training...:   6% 870/13907 [35:56<8:17:07,  2.29s/it][A
Training...:   6% 871/13907 [35:58<8:08:37,  2.25s/it][A
Training...:   6% 872/13907 [36:00<8:01:48,  2.22s/it][A
Training...:   6% 873/13907 [36:02<7:53:23,  2.18s/it][A
Training...:   6% 874/13907 [36:04<7:48:10,  2.16s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [36:19<?, ?it/s]
Training...:   6% 874/13907 [36:07<7:48:10,  2.16s/it][A
Training...:   6% 875/13907 [36:07<8:01:29,  2.22s/it][A
Training...:   6% 876/13907 [36:09<7:50:47,  2.17s/it][A
Training...:   6% 877/13907 [36:11<7:36:58,  2.10s/it][A
Training...:   6% 878/13907 [36:13<7:26:47,  2.06s/it][A
Training...:   6% 879/13907 [36:15<7:16:38,  2.01s/it][A
Training...:   6% 880/13907 [36:16<7:08:50,  1.98s/it][A
Training...:   6% 881/13907 [36:18<7:00:21,  1.94s/it][A
Training...:   6% 882/13907 [36:20<6:54:57,  1.91s/it][A
Training...:   6% 883/13907 [36:22<6:45:56,  1.87s/it][A
Training...:   6% 884/13907 [36:24<6:39:22,  1.84s/it][A
Training...:   6% 885/13907 [36:25<6:32:29,  1.81s/it][A
Training...:   6% 886/13907 [36:27<6:25:38,  1.78s/it][A
Training...:   6% 887/13907 [36:29<6:18:44,  1.75s/it][A
Training...:   6% 888/13907 [36:30<6:12:50,  1.72s/it][A
Training...:   6% 889/13907 [36:32<6:05:40,  1.69s/it][A
Training...:   6% 890/13907 [36:34<5:58:52,  1.65s/it][A
Training...:   6% 891/13907 [36:35<5:53:00,  1.63s/it][A
Training...:   6% 892/13907 [36:37<5:47:16,  1.60s/it][A
Training...:   6% 893/13907 [36:38<5:39:56,  1.57s/it][A
Training...:   6% 894/13907 [36:40<5:30:15,  1.52s/it][A
Training...:   6% 895/13907 [36:41<5:19:50,  1.47s/it][A
Training...:   6% 896/13907 [36:42<5:07:54,  1.42s/it][A
Training...:   6% 897/13907 [36:44<4:57:38,  1.37s/it][A
Training...:   6% 898/13907 [36:45<4:45:44,  1.32s/it][A
Training...:   6% 899/13907 [36:46<4:31:01,  1.25s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [36:59<?, ?it/s]
Training...:   6% 899/13907 [36:47<4:31:01,  1.25s/it][A
Training...:   6% 900/13907 [36:47<4:24:59,  1.22s/it][A
Training...:   6% 901/13907 [36:51<6:58:00,  1.93s/it][A
Training...:   6% 902/13907 [36:54<8:32:49,  2.37s/it][A
Training...:   6% 903/13907 [36:57<9:23:30,  2.60s/it][A
Training...:   7% 904/13907 [37:00<9:52:19,  2.73s/it][A
Training...:   7% 905/13907 [37:03<10:07:13,  2.80s/it][A
Training...:   7% 906/13907 [37:06<10:14:16,  2.83s/it][A
Training...:   7% 907/13907 [37:09<10:11:13,  2.82s/it][A
Training...:   7% 908/13907 [37:12<10:04:58,  2.79s/it][A
Training...:   7% 909/13907 [37:14<9:54:34,  2.74s/it] [A
Training...:   7% 910/13907 [37:17<9:45:49,  2.70s/it][A
Training...:   7% 911/13907 [37:19<9:34:05,  2.65s/it][A
Training...:   7% 912/13907 [37:22<9:25:36,  2.61s/it][A
Training...:   7% 913/13907 [37:24<9:16:39,  2.57s/it][A
Training...:   7% 914/13907 [37:27<9:09:26,  2.54s/it][A
Training...:   7% 915/13907 [37:29<8:59:10,  2.49s/it][A
Training...:   7% 916/13907 [37:32<8:53:14,  2.46s/it][A
Training...:   7% 917/13907 [37:34<8:44:34,  2.42s/it][A
Training...:   7% 918/13907 [37:36<8:37:41,  2.39s/it][A
Training...:   7% 919/13907 [37:38<8:27:51,  2.35s/it][A
Training...:   7% 920/13907 [37:41<8:21:32,  2.32s/it][A
Training...:   7% 921/13907 [37:43<8:13:34,  2.28s/it][A
Training...:   7% 922/13907 [37:45<8:05:28,  2.24s/it][A
Training...:   7% 923/13907 [37:47<7:56:52,  2.20s/it][A
Training...:   7% 924/13907 [37:49<7:49:46,  2.17s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [38:04<?, ?it/s]
Training...:   7% 924/13907 [37:52<7:49:46,  2.17s/it][A
Training...:   7% 925/13907 [37:52<8:04:19,  2.24s/it][A
Training...:   7% 926/13907 [37:54<7:55:09,  2.20s/it][A
Training...:   7% 927/13907 [37:56<7:41:43,  2.13s/it][A
Training...:   7% 928/13907 [37:58<7:30:49,  2.08s/it][A
Training...:   7% 929/13907 [38:00<7:20:21,  2.04s/it][A
Training...:   7% 930/13907 [38:02<7:10:10,  1.99s/it][A
Training...:   7% 931/13907 [38:03<7:02:58,  1.96s/it][A
Training...:   7% 932/13907 [38:05<6:55:17,  1.92s/it][A
Training...:   7% 933/13907 [38:07<6:48:32,  1.89s/it][A
Training...:   7% 934/13907 [38:09<6:41:45,  1.86s/it][A
Training...:   7% 935/13907 [38:11<6:35:56,  1.83s/it][A
Training...:   7% 936/13907 [38:12<6:28:01,  1.79s/it][A
Training...:   7% 937/13907 [38:14<6:20:43,  1.76s/it][A
Training...:   7% 938/13907 [38:16<6:14:30,  1.73s/it][A
Training...:   7% 939/13907 [38:17<6:06:37,  1.70s/it][A
Training...:   7% 940/13907 [38:19<5:59:44,  1.66s/it][A
Training...:   7% 941/13907 [38:20<5:52:52,  1.63s/it][A
Training...:   7% 942/13907 [38:22<5:45:37,  1.60s/it][A
Training...:   7% 943/13907 [38:23<5:38:17,  1.57s/it][A
Training...:   7% 944/13907 [38:25<5:29:33,  1.53s/it][A
Training...:   7% 945/13907 [38:26<5:20:34,  1.48s/it][A
Training...:   7% 946/13907 [38:28<5:13:21,  1.45s/it][A
Training...:   7% 947/13907 [38:29<5:02:05,  1.40s/it][A
Training...:   7% 948/13907 [38:30<4:50:05,  1.34s/it][A
Training...:   7% 949/13907 [38:31<4:37:53,  1.29s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [38:45<?, ?it/s]
Training...:   7% 949/13907 [38:32<4:37:53,  1.29s/it][A
Training...:   7% 950/13907 [38:32<4:31:57,  1.26s/it][A
Training...:   7% 951/13907 [38:36<7:08:43,  1.99s/it][A
Training...:   7% 952/13907 [38:40<8:37:49,  2.40s/it][A
Training...:   7% 953/13907 [38:43<9:25:01,  2.62s/it][A
Training...:   7% 954/13907 [38:46<9:53:13,  2.75s/it][A
Training...:   7% 955/13907 [38:49<10:02:32,  2.79s/it][A
Training...:   7% 956/13907 [38:51<10:04:15,  2.80s/it][A
Training...:   7% 957/13907 [38:54<9:58:49,  2.77s/it] [A
Training...:   7% 958/13907 [38:57<9:53:57,  2.75s/it][A
Training...:   7% 959/13907 [38:59<9:43:42,  2.70s/it][A
Training...:   7% 960/13907 [39:02<9:36:52,  2.67s/it][A
Training...:   7% 961/13907 [39:05<9:28:31,  2.63s/it][A
Training...:   7% 962/13907 [39:07<9:19:28,  2.59s/it][A
Training...:   7% 963/13907 [39:09<9:09:18,  2.55s/it][A
Training...:   7% 964/13907 [39:12<9:03:25,  2.52s/it][A
Training...:   7% 965/13907 [39:14<8:54:22,  2.48s/it][A
Training...:   7% 966/13907 [39:17<8:46:23,  2.44s/it][A
Training...:   7% 967/13907 [39:19<8:37:41,  2.40s/it][A
Training...:   7% 968/13907 [39:21<8:30:48,  2.37s/it][A
Training...:   7% 969/13907 [39:24<8:25:07,  2.34s/it][A
Training...:   7% 970/13907 [39:26<8:17:16,  2.31s/it][A
Training...:   7% 971/13907 [39:28<8:08:06,  2.26s/it][A
Training...:   7% 972/13907 [39:30<7:59:41,  2.23s/it][A
Training...:   7% 973/13907 [39:32<7:51:57,  2.19s/it][A
Training...:   7% 974/13907 [39:34<7:44:57,  2.16s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [39:49<?, ?it/s]
Training...:   7% 974/13907 [39:37<7:44:57,  2.16s/it][A
Training...:   7% 975/13907 [39:37<7:56:53,  2.21s/it][A
Training...:   7% 976/13907 [39:39<7:50:07,  2.18s/it][A
Training...:   7% 977/13907 [39:41<7:38:12,  2.13s/it][A
Training...:   7% 978/13907 [39:43<7:26:48,  2.07s/it][A
Training...:   7% 979/13907 [39:45<7:17:19,  2.03s/it][A
Training...:   7% 980/13907 [39:47<7:10:08,  2.00s/it][A
Training...:   7% 981/13907 [39:48<7:03:59,  1.97s/it][A
Training...:   7% 982/13907 [39:50<6:53:46,  1.92s/it][A
Training...:   7% 983/13907 [39:52<6:44:51,  1.88s/it][A
Training...:   7% 984/13907 [39:54<6:37:56,  1.85s/it][A
Training...:   7% 985/13907 [39:56<6:31:37,  1.82s/it][A
Training...:   7% 986/13907 [39:57<6:25:09,  1.79s/it][A
Training...:   7% 987/13907 [39:59<6:18:39,  1.76s/it][A
Training...:   7% 988/13907 [40:01<6:11:21,  1.72s/it][A
Training...:   7% 989/13907 [40:02<6:03:49,  1.69s/it][A
Training...:   7% 990/13907 [40:04<5:56:37,  1.66s/it][A
Training...:   7% 991/13907 [40:05<5:48:49,  1.62s/it][A
Training...:   7% 992/13907 [40:07<5:41:27,  1.59s/it][A
Training...:   7% 993/13907 [40:08<5:35:24,  1.56s/it][A
Training...:   7% 994/13907 [40:10<5:27:51,  1.52s/it][A
Training...:   7% 995/13907 [40:11<5:19:27,  1.48s/it][A
Training...:   7% 996/13907 [40:12<5:10:43,  1.44s/it][A
Training...:   7% 997/13907 [40:14<5:00:05,  1.39s/it][A
Training...:   7% 998/13907 [40:15<4:51:37,  1.36s/it][A
Training...:   7% 999/13907 [40:16<4:37:23,  1.29s/it][A                                          
                                                      [AEpoch ... (1/4):   0% 0/4 [40:30<?, ?it/s]
Training...:   7% 999/13907 [40:17<4:37:23,  1.29s/it][A
Training...:   7% 1000/13907 [40:17<4:30:57,  1.26s/it][A
Training...:   7% 1001/13907 [40:21<7:10:11,  2.00s/it][A
Training...:   7% 1002/13907 [40:24<8:38:54,  2.41s/it][A
Training...:   7% 1003/13907 [40:28<9:25:04,  2.63s/it][A
Training...:   7% 1004/13907 [40:31<9:56:20,  2.77s/it][A
Training...:   7% 1005/13907 [40:34<10:06:44,  2.82s/it][A
Training...:   7% 1006/13907 [40:37<10:16:16,  2.87s/it][A
Training...:   7% 1007/13907 [40:40<10:17:45,  2.87s/it][A
Training...:   7% 1008/13907 [40:42<10:10:23,  2.84s/it][A
Training...:   7% 1009/13907 [40:45<10:01:45,  2.80s/it][A
Training...:   7% 1010/13907 [40:48<9:49:44,  2.74s/it] [A
Training...:   7% 1011/13907 [40:50<9:37:04,  2.68s/it][A
Training...:   7% 1012/13907 [40:53<9:26:32,  2.64s/it][A
Training...:   7% 1013/13907 [40:55<9:15:05,  2.58s/it][A
Training...:   7% 1014/13907 [40:58<9:05:51,  2.54s/it][A
Training...:   7% 1015/13907 [41:00<8:54:31,  2.49s/it][A
Training...:   7% 1016/13907 [41:02<8:48:09,  2.46s/it][A
Training...:   7% 1017/13907 [41:05<8:39:47,  2.42s/it][A
Training...:   7% 1018/13907 [41:07<8:32:54,  2.39s/it][A
Training...:   7% 1019/13907 [41:09<8:23:53,  2.35s/it][A
Training...:   7% 1020/13907 [41:11<8:17:15,  2.32s/it][A
Training...:   7% 1021/13907 [41:14<8:08:26,  2.27s/it][A
Training...:   7% 1022/13907 [41:16<8:01:10,  2.24s/it][A
Training...:   7% 1023/13907 [41:18<7:53:03,  2.20s/it][A
Training...:   7% 1024/13907 [41:20<7:45:44,  2.17s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [41:35<?, ?it/s]
Training...:   7% 1024/13907 [41:22<7:45:44,  2.17s/it][A
Training...:   7% 1025/13907 [41:22<7:58:32,  2.23s/it][A
Training...:   7% 1026/13907 [41:24<7:50:56,  2.19s/it][A
Training...:   7% 1027/13907 [41:26<7:37:37,  2.13s/it][A
Training...:   7% 1028/13907 [41:28<7:27:40,  2.09s/it][A
Training...:   7% 1029/13907 [41:30<7:23:11,  2.06s/it][A
Training...:   7% 1030/13907 [41:32<7:13:02,  2.02s/it][A
Training...:   7% 1031/13907 [41:34<7:04:01,  1.98s/it][A
Training...:   7% 1032/13907 [41:36<6:56:00,  1.94s/it][A
Training...:   7% 1033/13907 [41:38<6:49:48,  1.91s/it][A
Training...:   7% 1034/13907 [41:40<6:42:37,  1.88s/it][A
Training...:   7% 1035/13907 [41:42<6:38:01,  1.86s/it][A
Training...:   7% 1036/13907 [41:43<6:31:29,  1.82s/it][A
Training...:   7% 1037/13907 [41:45<6:25:16,  1.80s/it][A
Training...:   7% 1038/13907 [41:47<6:18:48,  1.77s/it][A
Training...:   7% 1039/13907 [41:48<6:10:58,  1.73s/it][A
Training...:   7% 1040/13907 [41:50<6:03:00,  1.69s/it][A
Training...:   7% 1041/13907 [41:52<5:56:30,  1.66s/it][A
Training...:   7% 1042/13907 [41:53<5:47:58,  1.62s/it][A
Training...:   7% 1043/13907 [41:55<5:39:52,  1.59s/it][A
Training...:   8% 1044/13907 [41:56<5:31:41,  1.55s/it][A
Training...:   8% 1045/13907 [41:57<5:25:16,  1.52s/it][A
Training...:   8% 1046/13907 [41:59<5:14:34,  1.47s/it][A
Training...:   8% 1047/13907 [42:00<5:03:28,  1.42s/it][A
Training...:   8% 1048/13907 [42:01<4:50:56,  1.36s/it][A
Training...:   8% 1049/13907 [42:02<4:36:03,  1.29s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [42:16<?, ?it/s]
Training...:   8% 1049/13907 [42:04<4:36:03,  1.29s/it][A
Training...:   8% 1050/13907 [42:04<4:29:56,  1.26s/it][A
Training...:   8% 1051/13907 [42:07<7:01:43,  1.97s/it][A
Training...:   8% 1052/13907 [42:11<8:27:40,  2.37s/it][A
Training...:   8% 1053/13907 [42:14<9:14:07,  2.59s/it][A
Training...:   8% 1054/13907 [42:17<9:42:42,  2.72s/it][A
Training...:   8% 1055/13907 [42:20<9:51:12,  2.76s/it][A
Training...:   8% 1056/13907 [42:22<9:58:19,  2.79s/it][A
Training...:   8% 1057/13907 [42:25<9:55:43,  2.78s/it][A
Training...:   8% 1058/13907 [42:28<9:54:32,  2.78s/it][A
Training...:   8% 1059/13907 [42:31<9:47:21,  2.74s/it][A
Training...:   8% 1060/13907 [42:33<9:39:01,  2.70s/it][A
Training...:   8% 1061/13907 [42:36<9:29:59,  2.66s/it][A
Training...:   8% 1062/13907 [42:38<9:20:36,  2.62s/it][A
Training...:   8% 1063/13907 [42:41<9:09:41,  2.57s/it][A
Training...:   8% 1064/13907 [42:43<9:00:04,  2.52s/it][A
Training...:   8% 1065/13907 [42:46<8:50:43,  2.48s/it][A
Training...:   8% 1066/13907 [42:48<8:44:32,  2.45s/it][A
Training...:   8% 1067/13907 [42:50<8:34:30,  2.40s/it][A
Training...:   8% 1068/13907 [42:53<8:26:03,  2.36s/it][A
Training...:   8% 1069/13907 [42:55<8:16:59,  2.32s/it][A
Training...:   8% 1070/13907 [42:57<8:10:49,  2.29s/it][A
Training...:   8% 1071/13907 [42:59<8:03:32,  2.26s/it][A
Training...:   8% 1072/13907 [43:01<7:55:59,  2.23s/it][A
Training...:   8% 1073/13907 [43:03<7:49:04,  2.19s/it][A
Training...:   8% 1074/13907 [43:06<7:44:44,  2.17s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [43:20<?, ?it/s]
Training...:   8% 1074/13907 [43:08<7:44:44,  2.17s/it][A
Training...:   8% 1075/13907 [43:08<7:59:02,  2.24s/it][A
Training...:   8% 1076/13907 [43:10<7:49:31,  2.20s/it][A
Training...:   8% 1077/13907 [43:12<7:35:17,  2.13s/it][A
Training...:   8% 1078/13907 [43:14<7:26:34,  2.09s/it][A
Training...:   8% 1079/13907 [43:16<7:18:39,  2.05s/it][A
Training...:   8% 1080/13907 [43:18<7:10:29,  2.01s/it][A
Training...:   8% 1081/13907 [43:20<7:03:40,  1.98s/it][A
Training...:   8% 1082/13907 [43:22<6:57:05,  1.95s/it][A
Training...:   8% 1083/13907 [43:24<6:49:13,  1.91s/it][A
Training...:   8% 1084/13907 [43:25<6:41:55,  1.88s/it][A
Training...:   8% 1085/13907 [43:27<6:35:40,  1.85s/it][A
Training...:   8% 1086/13907 [43:29<6:30:30,  1.83s/it][A
Training...:   8% 1087/13907 [43:31<6:23:35,  1.80s/it][A
Training...:   8% 1088/13907 [43:32<6:16:20,  1.76s/it][A
Training...:   8% 1089/13907 [43:34<6:09:52,  1.73s/it][A
Training...:   8% 1090/13907 [43:36<6:04:42,  1.71s/it][A
Training...:   8% 1091/13907 [43:37<5:57:49,  1.68s/it][A
Training...:   8% 1092/13907 [43:39<5:50:32,  1.64s/it][A
Training...:   8% 1093/13907 [43:40<5:43:21,  1.61s/it][A
Training...:   8% 1094/13907 [43:42<5:34:55,  1.57s/it][A
Training...:   8% 1095/13907 [43:43<5:29:32,  1.54s/it][A
Training...:   8% 1096/13907 [43:45<5:17:27,  1.49s/it][A
Training...:   8% 1097/13907 [43:46<5:05:08,  1.43s/it][A
Training...:   8% 1098/13907 [43:47<4:51:52,  1.37s/it][A
Training...:   8% 1099/13907 [43:48<4:36:20,  1.29s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [44:02<?, ?it/s]
Training...:   8% 1099/13907 [43:49<4:36:20,  1.29s/it][A
Training...:   8% 1100/13907 [43:49<4:27:53,  1.26s/it][A
Training...:   8% 1101/13907 [43:53<7:03:09,  1.98s/it][A
Training...:   8% 1102/13907 [43:56<8:29:42,  2.39s/it][A
Training...:   8% 1103/13907 [44:00<9:17:41,  2.61s/it][A
Training...:   8% 1104/13907 [44:03<9:46:40,  2.75s/it][A
Training...:   8% 1105/13907 [44:06<9:56:34,  2.80s/it][A
Training...:   8% 1106/13907 [44:08<9:59:56,  2.81s/it][A
Training...:   8% 1107/13907 [44:11<9:57:13,  2.80s/it][A
Training...:   8% 1108/13907 [44:14<9:52:08,  2.78s/it][A
Training...:   8% 1109/13907 [44:16<9:40:59,  2.72s/it][A
Training...:   8% 1110/13907 [44:19<9:31:45,  2.68s/it][A
Training...:   8% 1111/13907 [44:22<9:21:33,  2.63s/it][A
Training...:   8% 1112/13907 [44:24<9:13:46,  2.60s/it][A
Training...:   8% 1113/13907 [44:27<9:03:12,  2.55s/it][A
Training...:   8% 1114/13907 [44:29<8:57:04,  2.52s/it][A
Training...:   8% 1115/13907 [44:31<8:47:30,  2.47s/it][A
Training...:   8% 1116/13907 [44:34<8:42:52,  2.45s/it][A
Training...:   8% 1117/13907 [44:36<8:35:35,  2.42s/it][A
Training...:   8% 1118/13907 [44:38<8:28:33,  2.39s/it][A
Training...:   8% 1119/13907 [44:41<8:19:55,  2.35s/it][A
Training...:   8% 1120/13907 [44:43<8:13:57,  2.32s/it][A
Training...:   8% 1121/13907 [44:45<8:06:52,  2.28s/it][A
Training...:   8% 1122/13907 [44:47<7:58:15,  2.24s/it][A
Training...:   8% 1123/13907 [44:49<7:49:22,  2.20s/it][A
Training...:   8% 1124/13907 [44:51<7:41:12,  2.16s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [45:06<?, ?it/s]
Training...:   8% 1124/13907 [44:54<7:41:12,  2.16s/it][A
Training...:   8% 1125/13907 [44:54<7:52:56,  2.22s/it][A
Training...:   8% 1126/13907 [44:56<7:43:10,  2.17s/it][A
Training...:   8% 1127/13907 [44:58<7:31:10,  2.12s/it][A
Training...:   8% 1128/13907 [45:00<7:19:59,  2.07s/it][A
Training...:   8% 1129/13907 [45:02<7:10:45,  2.02s/it][A
Training...:   8% 1130/13907 [45:04<7:02:33,  1.98s/it][A
Training...:   8% 1131/13907 [45:05<6:55:39,  1.95s/it][A
Training...:   8% 1132/13907 [45:07<6:48:07,  1.92s/it][A
Training...:   8% 1133/13907 [45:09<6:41:54,  1.89s/it][A
Training...:   8% 1134/13907 [45:11<6:35:56,  1.86s/it][A
Training...:   8% 1135/13907 [45:13<6:30:40,  1.84s/it][A
Training...:   8% 1136/13907 [45:14<6:24:09,  1.80s/it][A
Training...:   8% 1137/13907 [45:16<6:17:43,  1.77s/it][A
Training...:   8% 1138/13907 [45:18<6:10:37,  1.74s/it][A
Training...:   8% 1139/13907 [45:19<6:03:26,  1.71s/it][A
Training...:   8% 1140/13907 [45:21<5:56:22,  1.67s/it][A
Training...:   8% 1141/13907 [45:23<5:50:05,  1.65s/it][A
Training...:   8% 1142/13907 [45:24<5:42:32,  1.61s/it][A
Training...:   8% 1143/13907 [45:26<5:35:30,  1.58s/it][A
Training...:   8% 1144/13907 [45:27<5:25:36,  1.53s/it][A
Training...:   8% 1145/13907 [45:28<5:16:47,  1.49s/it][A
Training...:   8% 1146/13907 [45:30<5:08:35,  1.45s/it][A
Training...:   8% 1147/13907 [45:31<4:57:19,  1.40s/it][A
Training...:   8% 1148/13907 [45:32<4:46:08,  1.35s/it][A
Training...:   8% 1149/13907 [45:33<4:32:55,  1.28s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [45:47<?, ?it/s]
Training...:   8% 1149/13907 [45:35<4:32:55,  1.28s/it][A
Training...:   8% 1150/13907 [45:35<4:27:11,  1.26s/it][A
Training...:   8% 1151/13907 [45:38<6:57:34,  1.96s/it][A
Training...:   8% 1152/13907 [45:42<8:24:54,  2.38s/it][A
Training...:   8% 1153/13907 [45:45<9:13:32,  2.60s/it][A
Training...:   8% 1154/13907 [45:48<9:43:23,  2.74s/it][A
Training...:   8% 1155/13907 [45:51<9:55:00,  2.80s/it][A
Training...:   8% 1156/13907 [45:54<9:59:57,  2.82s/it][A
Training...:   8% 1157/13907 [45:56<9:55:45,  2.80s/it][A
Training...:   8% 1158/13907 [45:59<9:51:41,  2.78s/it][A
Training...:   8% 1159/13907 [46:02<9:41:52,  2.74s/it][A
Training...:   8% 1160/13907 [46:04<9:33:32,  2.70s/it][A
Training...:   8% 1161/13907 [46:07<9:23:36,  2.65s/it][A
Training...:   8% 1162/13907 [46:09<9:13:58,  2.61s/it][A
Training...:   8% 1163/13907 [46:12<9:03:12,  2.56s/it][A
Training...:   8% 1164/13907 [46:14<8:55:25,  2.52s/it][A
Training...:   8% 1165/13907 [46:17<8:44:46,  2.47s/it][A
Training...:   8% 1166/13907 [46:19<8:37:07,  2.44s/it][A
Training...:   8% 1167/13907 [46:21<8:28:51,  2.40s/it][A
Training...:   8% 1168/13907 [46:24<8:21:29,  2.36s/it][A
Training...:   8% 1169/13907 [46:26<8:13:12,  2.32s/it][A
Training...:   8% 1170/13907 [46:28<8:07:25,  2.30s/it][A
Training...:   8% 1171/13907 [46:30<8:00:37,  2.26s/it][A
Training...:   8% 1172/13907 [46:32<7:52:24,  2.23s/it][A
Training...:   8% 1173/13907 [46:34<7:45:04,  2.19s/it][A
Training...:   8% 1174/13907 [46:37<7:36:53,  2.15s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [46:51<?, ?it/s]
Training...:   8% 1174/13907 [46:39<7:36:53,  2.15s/it][A
Training...:   8% 1175/13907 [46:39<7:49:58,  2.21s/it][A
Training...:   8% 1176/13907 [46:41<7:41:20,  2.17s/it][A
Training...:   8% 1177/13907 [46:43<7:29:14,  2.12s/it][A
Training...:   8% 1178/13907 [46:45<7:17:19,  2.06s/it][A
Training...:   8% 1179/13907 [46:47<7:08:52,  2.02s/it][A
Training...:   8% 1180/13907 [46:49<7:01:03,  1.99s/it][A
Training...:   8% 1181/13907 [46:51<6:53:43,  1.95s/it][A
Training...:   8% 1182/13907 [46:52<6:46:12,  1.92s/it][A
Training...:   9% 1183/13907 [46:54<6:41:21,  1.89s/it][A
Training...:   9% 1184/13907 [46:56<6:36:40,  1.87s/it][A
Training...:   9% 1185/13907 [46:58<6:31:28,  1.85s/it][A
Training...:   9% 1186/13907 [47:00<6:22:28,  1.80s/it][A
Training...:   9% 1187/13907 [47:01<6:16:17,  1.77s/it][A
Training...:   9% 1188/13907 [47:03<6:09:09,  1.74s/it][A
Training...:   9% 1189/13907 [47:05<6:01:22,  1.70s/it][A
Training...:   9% 1190/13907 [47:06<5:55:47,  1.68s/it][A
Training...:   9% 1191/13907 [47:08<5:48:49,  1.65s/it][A
Training...:   9% 1192/13907 [47:09<5:41:13,  1.61s/it][A
Training...:   9% 1193/13907 [47:11<5:32:54,  1.57s/it][A
Training...:   9% 1194/13907 [47:12<5:24:35,  1.53s/it][A
Training...:   9% 1195/13907 [47:14<5:17:30,  1.50s/it][A
Training...:   9% 1196/13907 [47:15<5:07:24,  1.45s/it][A
Training...:   9% 1197/13907 [47:16<4:56:16,  1.40s/it][A
Training...:   9% 1198/13907 [47:17<4:43:49,  1.34s/it][A
Training...:   9% 1199/13907 [47:19<4:29:24,  1.27s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [47:32<?, ?it/s]
Training...:   9% 1199/13907 [47:20<4:29:24,  1.27s/it][A
Training...:   9% 1200/13907 [47:20<4:23:32,  1.24s/it][A
Training...:   9% 1201/13907 [47:23<7:00:17,  1.98s/it][A
Training...:   9% 1202/13907 [47:27<8:30:30,  2.41s/it][A
Training...:   9% 1203/13907 [47:30<9:18:44,  2.64s/it][A
Training...:   9% 1204/13907 [47:33<9:44:41,  2.76s/it][A
Training...:   9% 1205/13907 [47:36<9:54:19,  2.81s/it][A
Training...:   9% 1206/13907 [47:39<10:00:40,  2.84s/it][A
Training...:   9% 1207/13907 [47:42<9:58:57,  2.83s/it] [A
Training...:   9% 1208/13907 [47:45<9:57:10,  2.82s/it][A
Training...:   9% 1209/13907 [47:47<9:47:24,  2.78s/it][A
Training...:   9% 1210/13907 [47:50<9:39:44,  2.74s/it][A
Training...:   9% 1211/13907 [47:52<9:28:54,  2.69s/it][A
Training...:   9% 1212/13907 [47:55<9:21:16,  2.65s/it][A
Training...:   9% 1213/13907 [47:57<9:09:03,  2.60s/it][A
Training...:   9% 1214/13907 [48:00<9:00:39,  2.56s/it][A
Training...:   9% 1215/13907 [48:02<8:50:52,  2.51s/it][A
Training...:   9% 1216/13907 [48:05<8:47:53,  2.50s/it][A
Training...:   9% 1217/13907 [48:07<8:38:40,  2.45s/it][A
Training...:   9% 1218/13907 [48:09<8:32:28,  2.42s/it][A
Training...:   9% 1219/13907 [48:12<8:26:16,  2.39s/it][A
Training...:   9% 1220/13907 [48:14<8:19:55,  2.36s/it][A
Training...:   9% 1221/13907 [48:16<8:16:08,  2.35s/it][A
Training...:   9% 1222/13907 [48:19<8:07:41,  2.31s/it][A
Training...:   9% 1223/13907 [48:21<8:00:02,  2.27s/it][A
Training...:   9% 1224/13907 [48:23<7:51:42,  2.23s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [48:38<?, ?it/s]
Training...:   9% 1224/13907 [48:25<7:51:42,  2.23s/it][A
Training...:   9% 1225/13907 [48:25<8:06:52,  2.30s/it][A
Training...:   9% 1226/13907 [48:27<7:53:47,  2.24s/it][A
Training...:   9% 1227/13907 [48:30<7:39:25,  2.17s/it][A
Training...:   9% 1228/13907 [48:32<7:28:28,  2.12s/it][A
Training...:   9% 1229/13907 [48:33<7:17:41,  2.07s/it][A
Training...:   9% 1230/13907 [48:35<7:08:22,  2.03s/it][A
Training...:   9% 1231/13907 [48:37<7:03:22,  2.00s/it][A
Training...:   9% 1232/13907 [48:39<6:56:40,  1.97s/it][A
Training...:   9% 1233/13907 [48:41<6:51:49,  1.95s/it][A
Training...:   9% 1234/13907 [48:43<6:47:12,  1.93s/it][A
Training...:   9% 1235/13907 [48:45<6:41:15,  1.90s/it][A
Training...:   9% 1236/13907 [48:47<6:34:21,  1.87s/it][A
Training...:   9% 1237/13907 [48:48<6:27:21,  1.83s/it][A
Training...:   9% 1238/13907 [48:50<6:20:50,  1.80s/it][A
Training...:   9% 1239/13907 [48:52<6:14:16,  1.77s/it][A
Training...:   9% 1240/13907 [48:53<6:06:41,  1.74s/it][A
Training...:   9% 1241/13907 [48:55<6:00:23,  1.71s/it][A
Training...:   9% 1242/13907 [48:57<5:53:02,  1.67s/it][A
Training...:   9% 1243/13907 [48:58<5:45:56,  1.64s/it][A
Training...:   9% 1244/13907 [49:00<5:36:39,  1.60s/it][A
Training...:   9% 1245/13907 [49:01<5:25:52,  1.54s/it][A
Training...:   9% 1246/13907 [49:03<5:14:33,  1.49s/it][A
Training...:   9% 1247/13907 [49:04<5:03:31,  1.44s/it][A
Training...:   9% 1248/13907 [49:05<4:50:45,  1.38s/it][A
Training...:   9% 1249/13907 [49:06<4:36:49,  1.31s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [49:20<?, ?it/s]
Training...:   9% 1249/13907 [49:07<4:36:49,  1.31s/it][A
Training...:   9% 1250/13907 [49:07<4:29:10,  1.28s/it][A
Training...:   9% 1251/13907 [49:11<6:58:23,  1.98s/it][A
Training...:   9% 1252/13907 [49:14<8:25:33,  2.40s/it][A
Training...:   9% 1253/13907 [49:18<9:11:27,  2.61s/it][A
Training...:   9% 1254/13907 [49:21<9:42:33,  2.76s/it][A
Training...:   9% 1255/13907 [49:24<9:54:16,  2.82s/it][A
Training...:   9% 1256/13907 [49:27<9:58:53,  2.84s/it][A
Training...:   9% 1257/13907 [49:29<9:55:04,  2.82s/it][A
Training...:   9% 1258/13907 [49:32<9:50:51,  2.80s/it][A
Training...:   9% 1259/13907 [49:35<9:45:59,  2.78s/it][A
Training...:   9% 1260/13907 [49:37<9:37:57,  2.74s/it][A
Training...:   9% 1261/13907 [49:40<9:29:03,  2.70s/it][A
Training...:   9% 1262/13907 [49:43<9:19:42,  2.66s/it][A
Training...:   9% 1263/13907 [49:45<9:09:29,  2.61s/it][A
Training...:   9% 1264/13907 [49:48<8:58:59,  2.56s/it][A
Training...:   9% 1265/13907 [49:50<8:47:21,  2.50s/it][A
Training...:   9% 1266/13907 [49:52<8:37:33,  2.46s/it][A
Training...:   9% 1267/13907 [49:55<8:28:30,  2.41s/it][A
Training...:   9% 1268/13907 [49:57<8:20:56,  2.38s/it][A
Training...:   9% 1269/13907 [49:59<8:14:23,  2.35s/it][A
Training...:   9% 1270/13907 [50:01<8:04:54,  2.30s/it][A
Training...:   9% 1271/13907 [50:04<7:57:40,  2.27s/it][A
Training...:   9% 1272/13907 [50:06<7:48:38,  2.23s/it][A
Training...:   9% 1273/13907 [50:08<7:39:34,  2.18s/it][A
Training...:   9% 1274/13907 [50:10<7:31:08,  2.14s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [50:24<?, ?it/s]
Training...:   9% 1274/13907 [50:12<7:31:08,  2.14s/it][A
Training...:   9% 1275/13907 [50:12<7:44:14,  2.21s/it][A
Training...:   9% 1276/13907 [50:14<7:35:38,  2.16s/it][A
Training...:   9% 1277/13907 [50:16<7:26:31,  2.12s/it][A
Training...:   9% 1278/13907 [50:18<7:15:48,  2.07s/it][A
Training...:   9% 1279/13907 [50:20<7:06:06,  2.02s/it][A
Training...:   9% 1280/13907 [50:22<6:58:44,  1.99s/it][A
Training...:   9% 1281/13907 [50:24<6:51:20,  1.95s/it][A
Training...:   9% 1282/13907 [50:26<6:43:34,  1.92s/it][A
Training...:   9% 1283/13907 [50:28<6:36:16,  1.88s/it][A
Training...:   9% 1284/13907 [50:29<6:31:49,  1.86s/it][A
Training...:   9% 1285/13907 [50:31<6:24:55,  1.83s/it][A
Training...:   9% 1286/13907 [50:33<6:17:56,  1.80s/it][A
Training...:   9% 1287/13907 [50:35<6:12:26,  1.77s/it][A
Training...:   9% 1288/13907 [50:36<6:06:33,  1.74s/it][A
Training...:   9% 1289/13907 [50:38<6:00:30,  1.71s/it][A
Training...:   9% 1290/13907 [50:39<5:53:37,  1.68s/it][A
Training...:   9% 1291/13907 [50:41<5:47:11,  1.65s/it][A
Training...:   9% 1292/13907 [50:43<5:39:44,  1.62s/it][A
Training...:   9% 1293/13907 [50:44<5:32:40,  1.58s/it][A
Training...:   9% 1294/13907 [50:46<5:25:10,  1.55s/it][A
Training...:   9% 1295/13907 [50:47<5:17:38,  1.51s/it][A
Training...:   9% 1296/13907 [50:48<5:07:30,  1.46s/it][A
Training...:   9% 1297/13907 [50:50<4:56:43,  1.41s/it][A
Training...:   9% 1298/13907 [50:51<4:46:11,  1.36s/it][A
Training...:   9% 1299/13907 [50:52<4:32:04,  1.29s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [51:05<?, ?it/s]
Training...:   9% 1299/13907 [50:53<4:32:04,  1.29s/it][A
Training...:   9% 1300/13907 [50:53<4:25:36,  1.26s/it][A
Training...:   9% 1301/13907 [50:57<6:53:59,  1.97s/it][A
Training...:   9% 1302/13907 [51:00<8:21:02,  2.38s/it][A
Training...:   9% 1303/13907 [51:03<9:08:48,  2.61s/it][A
Training...:   9% 1304/13907 [51:06<9:36:22,  2.74s/it][A
Training...:   9% 1305/13907 [51:09<9:46:14,  2.79s/it][A
Training...:   9% 1306/13907 [51:12<9:56:51,  2.84s/it][A
Training...:   9% 1307/13907 [51:15<9:57:41,  2.85s/it][A
Training...:   9% 1308/13907 [51:18<9:57:48,  2.85s/it][A
Training...:   9% 1309/13907 [51:21<9:51:27,  2.82s/it][A
Training...:   9% 1310/13907 [51:23<9:41:36,  2.77s/it][A
Training...:   9% 1311/13907 [51:26<9:28:44,  2.71s/it][A
Training...:   9% 1312/13907 [51:28<9:17:21,  2.66s/it][A
Training...:   9% 1313/13907 [51:31<9:04:27,  2.59s/it][A
Training...:   9% 1314/13907 [51:33<8:54:26,  2.55s/it][A
Training...:   9% 1315/13907 [51:36<8:43:39,  2.50s/it][A
Training...:   9% 1316/13907 [51:38<8:33:31,  2.45s/it][A
Training...:   9% 1317/13907 [51:40<8:24:41,  2.41s/it][A
Training...:   9% 1318/13907 [51:43<8:16:00,  2.36s/it][A
Training...:   9% 1319/13907 [51:45<8:08:28,  2.33s/it][A
Training...:   9% 1320/13907 [51:47<8:01:51,  2.30s/it][A
Training...:   9% 1321/13907 [51:49<7:54:25,  2.26s/it][A
Training...:  10% 1322/13907 [51:51<7:45:39,  2.22s/it][A
Training...:  10% 1323/13907 [51:53<7:37:36,  2.18s/it][A
Training...:  10% 1324/13907 [51:56<7:30:25,  2.15s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [52:10<?, ?it/s]
Training...:  10% 1324/13907 [51:58<7:30:25,  2.15s/it][A
Training...:  10% 1325/13907 [51:58<7:44:31,  2.22s/it][A
Training...:  10% 1326/13907 [52:00<7:35:52,  2.17s/it][A
Training...:  10% 1327/13907 [52:02<7:23:02,  2.11s/it][A
Training...:  10% 1328/13907 [52:04<7:12:10,  2.06s/it][A
Training...:  10% 1329/13907 [52:06<7:04:51,  2.03s/it][A
Training...:  10% 1330/13907 [52:08<6:59:53,  2.00s/it][A
Training...:  10% 1331/13907 [52:10<6:53:48,  1.97s/it][A
Training...:  10% 1332/13907 [52:11<6:43:53,  1.93s/it][A
Training...:  10% 1333/13907 [52:13<6:37:16,  1.90s/it][A
Training...:  10% 1334/13907 [52:15<6:31:41,  1.87s/it][A
Training...:  10% 1335/13907 [52:17<6:23:44,  1.83s/it][A
Training...:  10% 1336/13907 [52:19<6:17:15,  1.80s/it][A
Training...:  10% 1337/13907 [52:20<6:10:38,  1.77s/it][A
Training...:  10% 1338/13907 [52:22<6:03:19,  1.73s/it][A
Training...:  10% 1339/13907 [52:24<5:55:10,  1.70s/it][A
Training...:  10% 1340/13907 [52:25<5:47:36,  1.66s/it][A
Training...:  10% 1341/13907 [52:27<5:39:59,  1.62s/it][A
Training...:  10% 1342/13907 [52:28<5:33:08,  1.59s/it][A
Training...:  10% 1343/13907 [52:30<5:26:13,  1.56s/it][A
Training...:  10% 1344/13907 [52:31<5:18:33,  1.52s/it][A
Training...:  10% 1345/13907 [52:32<5:09:49,  1.48s/it][A
Training...:  10% 1346/13907 [52:34<5:01:08,  1.44s/it][A
Training...:  10% 1347/13907 [52:35<4:51:51,  1.39s/it][A
Training...:  10% 1348/13907 [52:36<4:41:18,  1.34s/it][A
Training...:  10% 1349/13907 [52:37<4:28:02,  1.28s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [52:51<?, ?it/s]
Training...:  10% 1349/13907 [52:39<4:28:02,  1.28s/it][A
Training...:  10% 1350/13907 [52:39<4:21:38,  1.25s/it][A
Training...:  10% 1351/13907 [52:42<6:56:12,  1.99s/it][A
Training...:  10% 1352/13907 [52:46<8:23:37,  2.41s/it][A
Training...:  10% 1353/13907 [52:49<9:12:12,  2.64s/it][A
Training...:  10% 1354/13907 [52:52<9:41:40,  2.78s/it][A
Training...:  10% 1355/13907 [52:55<9:57:02,  2.85s/it][A
Training...:  10% 1356/13907 [52:58<9:56:28,  2.85s/it][A
Training...:  10% 1357/13907 [53:01<9:49:13,  2.82s/it][A
Training...:  10% 1358/13907 [53:03<9:41:03,  2.78s/it][A
Training...:  10% 1359/13907 [53:06<9:31:27,  2.73s/it][A
Training...:  10% 1360/13907 [53:09<9:22:51,  2.69s/it][A
Training...:  10% 1361/13907 [53:11<9:12:55,  2.64s/it][A
Training...:  10% 1362/13907 [53:14<9:05:32,  2.61s/it][A
Training...:  10% 1363/13907 [53:16<8:55:04,  2.56s/it][A
Training...:  10% 1364/13907 [53:18<8:45:33,  2.51s/it][A
Training...:  10% 1365/13907 [53:21<8:35:26,  2.47s/it][A
Training...:  10% 1366/13907 [53:23<8:29:27,  2.44s/it][A
Training...:  10% 1367/13907 [53:26<8:21:30,  2.40s/it][A
Training...:  10% 1368/13907 [53:28<8:12:24,  2.36s/it][A
Training...:  10% 1369/13907 [53:30<8:03:31,  2.31s/it][A
Training...:  10% 1370/13907 [53:32<7:54:57,  2.27s/it][A
Training...:  10% 1371/13907 [53:34<7:52:01,  2.26s/it][A
Training...:  10% 1372/13907 [53:36<7:42:02,  2.21s/it][A
Training...:  10% 1373/13907 [53:39<7:34:14,  2.17s/it][A
Training...:  10% 1374/13907 [53:41<7:27:01,  2.14s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [53:55<?, ?it/s]
Training...:  10% 1374/13907 [53:43<7:27:01,  2.14s/it][A
Training...:  10% 1375/13907 [53:43<7:40:13,  2.20s/it][A
Training...:  10% 1376/13907 [53:45<7:33:42,  2.17s/it][A
Training...:  10% 1377/13907 [53:47<7:21:49,  2.12s/it][A
Training...:  10% 1378/13907 [53:49<7:12:22,  2.07s/it][A
Training...:  10% 1379/13907 [53:51<7:03:52,  2.03s/it][A
Training...:  10% 1380/13907 [53:53<6:56:56,  2.00s/it][A
Training...:  10% 1381/13907 [53:55<6:49:56,  1.96s/it][A
Training...:  10% 1382/13907 [53:57<6:45:03,  1.94s/it][A
Training...:  10% 1383/13907 [53:58<6:37:29,  1.90s/it][A
Training...:  10% 1384/13907 [54:00<6:31:56,  1.88s/it][A
Training...:  10% 1385/13907 [54:02<6:25:39,  1.85s/it][A
Training...:  10% 1386/13907 [54:04<6:20:12,  1.82s/it][A
Training...:  10% 1387/13907 [54:06<6:14:56,  1.80s/it][A
Training...:  10% 1388/13907 [54:07<6:09:34,  1.77s/it][A
Training...:  10% 1389/13907 [54:09<6:00:55,  1.73s/it][A
Training...:  10% 1390/13907 [54:11<5:54:00,  1.70s/it][A
Training...:  10% 1391/13907 [54:12<5:46:52,  1.66s/it][A
Training...:  10% 1392/13907 [54:14<5:38:28,  1.62s/it][A
Training...:  10% 1393/13907 [54:15<5:31:03,  1.59s/it][A
Training...:  10% 1394/13907 [54:17<5:22:29,  1.55s/it][A
Training...:  10% 1395/13907 [54:18<5:13:28,  1.50s/it][A
Training...:  10% 1396/13907 [54:19<5:02:42,  1.45s/it][A
Training...:  10% 1397/13907 [54:21<4:52:34,  1.40s/it][A
Training...:  10% 1398/13907 [54:22<4:43:08,  1.36s/it][A
Training...:  10% 1399/13907 [54:23<4:29:50,  1.29s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [54:37<?, ?it/s]
Training...:  10% 1399/13907 [54:24<4:29:50,  1.29s/it][A
Training...:  10% 1400/13907 [54:24<4:23:16,  1.26s/it][A
Training...:  10% 1401/13907 [54:28<6:48:05,  1.96s/it][A
Training...:  10% 1402/13907 [54:31<8:13:05,  2.37s/it][A
Training...:  10% 1403/13907 [54:34<8:58:17,  2.58s/it][A
Training...:  10% 1404/13907 [54:37<9:27:02,  2.72s/it][A
Training...:  10% 1405/13907 [54:40<9:41:42,  2.79s/it][A
Training...:  10% 1406/13907 [54:43<9:48:11,  2.82s/it][A
Training...:  10% 1407/13907 [54:46<9:43:49,  2.80s/it][A
Training...:  10% 1408/13907 [54:49<9:38:19,  2.78s/it][A
Training...:  10% 1409/13907 [54:51<9:29:56,  2.74s/it][A
Training...:  10% 1410/13907 [54:54<9:24:07,  2.71s/it][A
Training...:  10% 1411/13907 [54:56<9:13:32,  2.66s/it][A
Training...:  10% 1412/13907 [54:59<9:04:38,  2.62s/it][A
Training...:  10% 1413/13907 [55:01<8:54:05,  2.56s/it][A
Training...:  10% 1414/13907 [55:04<8:44:50,  2.52s/it][A
Training...:  10% 1415/13907 [55:06<8:35:45,  2.48s/it][A
Training...:  10% 1416/13907 [55:08<8:26:39,  2.43s/it][A
Training...:  10% 1417/13907 [55:11<8:19:07,  2.40s/it][A
Training...:  10% 1418/13907 [55:13<8:09:25,  2.35s/it][A
Training...:  10% 1419/13907 [55:15<8:02:06,  2.32s/it][A
Training...:  10% 1420/13907 [55:17<7:55:16,  2.28s/it][A
Training...:  10% 1421/13907 [55:20<7:48:45,  2.25s/it][A
Training...:  10% 1422/13907 [55:22<7:42:17,  2.22s/it][A
Training...:  10% 1423/13907 [55:24<7:36:21,  2.19s/it][A
Training...:  10% 1424/13907 [55:26<7:29:16,  2.16s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [55:41<?, ?it/s]
Training...:  10% 1424/13907 [55:28<7:29:16,  2.16s/it][A
Training...:  10% 1425/13907 [55:28<7:40:18,  2.21s/it][A
Training...:  10% 1426/13907 [55:30<7:30:12,  2.16s/it][A
Training...:  10% 1427/13907 [55:32<7:18:53,  2.11s/it][A
Training...:  10% 1428/13907 [55:34<7:09:29,  2.07s/it][A
Training...:  10% 1429/13907 [55:36<7:02:56,  2.03s/it][A
Training...:  10% 1430/13907 [55:38<6:57:36,  2.01s/it][A
Training...:  10% 1431/13907 [55:40<6:52:54,  1.99s/it][A
Training...:  10% 1432/13907 [55:42<6:47:47,  1.96s/it][A
Training...:  10% 1433/13907 [55:44<6:39:58,  1.92s/it][A
Training...:  10% 1434/13907 [55:46<6:33:02,  1.89s/it][A
Training...:  10% 1435/13907 [55:48<6:25:30,  1.85s/it][A
Training...:  10% 1436/13907 [55:49<6:17:20,  1.82s/it][A
Training...:  10% 1437/13907 [55:51<6:09:12,  1.78s/it][A
Training...:  10% 1438/13907 [55:53<6:02:23,  1.74s/it][A
Training...:  10% 1439/13907 [55:54<5:55:45,  1.71s/it][A
Training...:  10% 1440/13907 [55:56<5:49:41,  1.68s/it][A
Training...:  10% 1441/13907 [55:57<5:42:48,  1.65s/it][A
Training...:  10% 1442/13907 [55:59<5:35:31,  1.62s/it][A
Training...:  10% 1443/13907 [56:00<5:28:34,  1.58s/it][A
Training...:  10% 1444/13907 [56:02<5:21:25,  1.55s/it][A
Training...:  10% 1445/13907 [56:03<5:13:15,  1.51s/it][A
Training...:  10% 1446/13907 [56:05<5:05:45,  1.47s/it][A
Training...:  10% 1447/13907 [56:06<4:55:59,  1.43s/it][A
Training...:  10% 1448/13907 [56:07<4:44:57,  1.37s/it][A
Training...:  10% 1449/13907 [56:08<4:31:39,  1.31s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [56:22<?, ?it/s]
Training...:  10% 1449/13907 [56:10<4:31:39,  1.31s/it][A
Training...:  10% 1450/13907 [56:10<4:27:22,  1.29s/it][A
Training...:  10% 1451/13907 [56:13<6:58:17,  2.01s/it][A
Training...:  10% 1452/13907 [56:17<8:27:43,  2.45s/it][A
Training...:  10% 1453/13907 [56:20<9:14:13,  2.67s/it][A
Training...:  10% 1454/13907 [56:23<9:40:13,  2.80s/it][A
Training...:  10% 1455/13907 [56:26<9:54:13,  2.86s/it][A
Training...:  10% 1456/13907 [56:29<9:54:14,  2.86s/it][A
Training...:  10% 1457/13907 [56:32<9:48:52,  2.84s/it][A
Training...:  10% 1458/13907 [56:35<9:43:31,  2.81s/it][A
Training...:  10% 1459/13907 [56:37<9:34:03,  2.77s/it][A
Training...:  10% 1460/13907 [56:40<9:21:53,  2.71s/it][A
Training...:  11% 1461/13907 [56:42<9:11:30,  2.66s/it][A
Training...:  11% 1462/13907 [56:45<9:01:58,  2.61s/it][A
Training...:  11% 1463/13907 [56:47<8:53:14,  2.57s/it][A
Training...:  11% 1464/13907 [56:50<8:43:22,  2.52s/it][A
Training...:  11% 1465/13907 [56:52<8:35:10,  2.48s/it][A
Training...:  11% 1466/13907 [56:54<8:28:41,  2.45s/it][A
Training...:  11% 1467/13907 [56:57<8:20:23,  2.41s/it][A
Training...:  11% 1468/13907 [56:59<8:12:12,  2.37s/it][A
Training...:  11% 1469/13907 [57:01<8:05:12,  2.34s/it][A
Training...:  11% 1470/13907 [57:04<7:57:08,  2.30s/it][A
Training...:  11% 1471/13907 [57:06<7:49:22,  2.26s/it][A
Training...:  11% 1472/13907 [57:08<7:43:10,  2.23s/it][A
Training...:  11% 1473/13907 [57:10<7:36:30,  2.20s/it][A
Training...:  11% 1474/13907 [57:12<7:28:57,  2.17s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [57:27<?, ?it/s]
Training...:  11% 1474/13907 [57:15<7:28:57,  2.17s/it][A
Training...:  11% 1475/13907 [57:15<7:42:04,  2.23s/it][A
Training...:  11% 1476/13907 [57:17<7:32:52,  2.19s/it][A
Training...:  11% 1477/13907 [57:19<7:20:16,  2.13s/it][A
Training...:  11% 1478/13907 [57:21<7:11:04,  2.08s/it][A
Training...:  11% 1479/13907 [57:23<7:05:13,  2.05s/it][A
Training...:  11% 1480/13907 [57:25<7:00:37,  2.03s/it][A
Training...:  11% 1481/13907 [57:26<6:55:57,  2.01s/it][A
Training...:  11% 1482/13907 [57:28<6:46:26,  1.96s/it][A
Training...:  11% 1483/13907 [57:30<6:37:25,  1.92s/it][A
Training...:  11% 1484/13907 [57:32<6:29:31,  1.88s/it][A
Training...:  11% 1485/13907 [57:34<6:23:48,  1.85s/it][A
Training...:  11% 1486/13907 [57:35<6:16:40,  1.82s/it][A
Training...:  11% 1487/13907 [57:37<6:08:48,  1.78s/it][A
Training...:  11% 1488/13907 [57:39<6:02:27,  1.75s/it][A
Training...:  11% 1489/13907 [57:40<5:54:43,  1.71s/it][A
Training...:  11% 1490/13907 [57:42<5:47:17,  1.68s/it][A
Training...:  11% 1491/13907 [57:44<5:40:09,  1.64s/it][A
Training...:  11% 1492/13907 [57:45<5:33:35,  1.61s/it][A
Training...:  11% 1493/13907 [57:47<5:25:54,  1.58s/it][A
Training...:  11% 1494/13907 [57:48<5:18:21,  1.54s/it][A
Training...:  11% 1495/13907 [57:50<5:11:13,  1.50s/it][A
Training...:  11% 1496/13907 [57:51<5:03:55,  1.47s/it][A
Training...:  11% 1497/13907 [57:52<4:53:07,  1.42s/it][A
Training...:  11% 1498/13907 [57:53<4:41:30,  1.36s/it][A
Training...:  11% 1499/13907 [57:55<4:29:50,  1.30s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [58:08<?, ?it/s]
Training...:  11% 1499/13907 [57:56<4:29:50,  1.30s/it][A
Training...:  11% 1500/13907 [57:56<4:23:56,  1.28s/it][A
Training...:  11% 1501/13907 [58:00<6:56:23,  2.01s/it][A
Training...:  11% 1502/13907 [58:03<8:17:39,  2.41s/it][A
Training...:  11% 1503/13907 [58:06<9:00:54,  2.62s/it][A
Training...:  11% 1504/13907 [58:09<9:26:26,  2.74s/it][A
Training...:  11% 1505/13907 [58:12<9:35:55,  2.79s/it][A
Training...:  11% 1506/13907 [58:15<9:42:57,  2.82s/it][A
Training...:  11% 1507/13907 [58:18<9:40:41,  2.81s/it][A
Training...:  11% 1508/13907 [58:20<9:37:46,  2.80s/it][A
Training...:  11% 1509/13907 [58:23<9:30:45,  2.76s/it][A
Training...:  11% 1510/13907 [58:26<9:25:01,  2.73s/it][A
Training...:  11% 1511/13907 [58:28<9:18:09,  2.70s/it][A
Training...:  11% 1512/13907 [58:31<9:10:28,  2.66s/it][A
Training...:  11% 1513/13907 [58:33<9:01:59,  2.62s/it][A
Training...:  11% 1514/13907 [58:36<8:52:08,  2.58s/it][A
Training...:  11% 1515/13907 [58:38<8:43:43,  2.54s/it][A
Training...:  11% 1516/13907 [58:41<8:36:07,  2.50s/it][A
Training...:  11% 1517/13907 [58:43<8:28:31,  2.46s/it][A
Training...:  11% 1518/13907 [58:45<8:21:04,  2.43s/it][A
Training...:  11% 1519/13907 [58:48<8:13:21,  2.39s/it][A
Training...:  11% 1520/13907 [58:50<8:07:09,  2.36s/it][A
Training...:  11% 1521/13907 [58:52<8:00:31,  2.33s/it][A
Training...:  11% 1522/13907 [58:55<7:58:05,  2.32s/it][A
Training...:  11% 1523/13907 [58:57<7:52:56,  2.29s/it][A
Training...:  11% 1524/13907 [58:59<7:41:32,  2.24s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [59:14<?, ?it/s]
Training...:  11% 1524/13907 [59:01<7:41:32,  2.24s/it][A
Training...:  11% 1525/13907 [59:01<7:52:15,  2.29s/it][A
Training...:  11% 1526/13907 [59:03<7:40:13,  2.23s/it][A
Training...:  11% 1527/13907 [59:05<7:25:17,  2.16s/it][A
Training...:  11% 1528/13907 [59:07<7:15:56,  2.11s/it][A
Training...:  11% 1529/13907 [59:09<7:04:13,  2.06s/it][A
Training...:  11% 1530/13907 [59:11<6:53:57,  2.01s/it][A
Training...:  11% 1531/13907 [59:13<6:45:08,  1.96s/it][A
Training...:  11% 1532/13907 [59:15<6:37:19,  1.93s/it][A
Training...:  11% 1533/13907 [59:17<6:30:49,  1.90s/it][A
Training...:  11% 1534/13907 [59:19<6:24:59,  1.87s/it][A
Training...:  11% 1535/13907 [59:20<6:18:32,  1.84s/it][A
Training...:  11% 1536/13907 [59:22<6:12:23,  1.81s/it][A
Training...:  11% 1537/13907 [59:24<6:06:06,  1.78s/it][A
Training...:  11% 1538/13907 [59:25<6:00:20,  1.75s/it][A
Training...:  11% 1539/13907 [59:27<5:53:25,  1.71s/it][A
Training...:  11% 1540/13907 [59:29<5:45:20,  1.68s/it][A
Training...:  11% 1541/13907 [59:30<5:37:54,  1.64s/it][A
Training...:  11% 1542/13907 [59:32<5:29:58,  1.60s/it][A
Training...:  11% 1543/13907 [59:33<5:22:36,  1.57s/it][A
Training...:  11% 1544/13907 [59:35<5:14:53,  1.53s/it][A
Training...:  11% 1545/13907 [59:36<5:06:50,  1.49s/it][A
Training...:  11% 1546/13907 [59:37<4:56:45,  1.44s/it][A
Training...:  11% 1547/13907 [59:39<4:47:34,  1.40s/it][A
Training...:  11% 1548/13907 [59:40<4:36:40,  1.34s/it][A
Training...:  11% 1549/13907 [59:41<4:23:17,  1.28s/it][A                                          
                                                       [AEpoch ... (1/4):   0% 0/4 [59:55<?, ?it/s]
Training...:  11% 1549/13907 [59:42<4:23:17,  1.28s/it][A
Training...:  11% 1550/13907 [59:42<4:18:56,  1.26s/it][A
Training...:  11% 1551/13907 [59:46<6:52:25,  2.00s/it][A
Training...:  11% 1552/13907 [59:49<8:16:16,  2.41s/it][A
Training...:  11% 1553/13907 [59:52<8:58:13,  2.61s/it][A
Training...:  11% 1554/13907 [59:56<9:25:34,  2.75s/it][A
Training...:  11% 1555/13907 [59:58<9:37:45,  2.81s/it][A
Training...:  11% 1556/13907 [1:00:01<9:42:09,  2.83s/it][A
Training...:  11% 1557/13907 [1:00:04<9:39:24,  2.81s/it][A
Training...:  11% 1558/13907 [1:00:07<9:32:35,  2.78s/it][A
Training...:  11% 1559/13907 [1:00:09<9:23:44,  2.74s/it][A
Training...:  11% 1560/13907 [1:00:12<9:13:46,  2.69s/it][A
Training...:  11% 1561/13907 [1:00:15<9:03:47,  2.64s/it][A
Training...:  11% 1562/13907 [1:00:17<8:54:19,  2.60s/it][A
Training...:  11% 1563/13907 [1:00:20<8:45:49,  2.56s/it][A
Training...:  11% 1564/13907 [1:00:22<8:37:31,  2.52s/it][A
Training...:  11% 1565/13907 [1:00:24<8:31:37,  2.49s/it][A
Training...:  11% 1566/13907 [1:00:27<8:24:48,  2.45s/it][A
Training...:  11% 1567/13907 [1:00:29<8:18:42,  2.42s/it][A
Training...:  11% 1568/13907 [1:00:31<8:11:42,  2.39s/it][A
Training...:  11% 1569/13907 [1:00:34<8:03:22,  2.35s/it][A
Training...:  11% 1570/13907 [1:00:36<7:55:26,  2.31s/it][A
Training...:  11% 1571/13907 [1:00:38<7:49:02,  2.28s/it][A
Training...:  11% 1572/13907 [1:00:40<7:41:44,  2.25s/it][A
Training...:  11% 1573/13907 [1:00:42<7:34:08,  2.21s/it][A
Training...:  11% 1574/13907 [1:00:45<7:30:14,  2.19s/it][A                                          
                                                         [AEpoch ... (1/4):   0% 0/4 [1:00:59<?, ?it/s]
Training...:  11% 1574/13907 [1:00:47<7:30:14,  2.19s/it][A
Training...:  11% 1575/13907 [1:00:47<7:47:07,  2.27s/it][A
Training...:  11% 1576/13907 [1:00:49<7:35:51,  2.22s/it][A
Training...:  11% 1577/13907 [1:00:51<7:21:44,  2.15s/it][A
Training...:  11% 1578/13907 [1:00:53<7:11:37,  2.10s/it][A
Training...:  11% 1579/13907 [1:00:55<7:02:22,  2.06s/it][A
Training...:  11% 1580/13907 [1:00:57<6:55:33,  2.02s/it][A
Training...:  11% 1581/13907 [1:00:59<6:48:49,  1.99s/it][A
Training...:  11% 1582/13907 [1:01:01<6:39:49,  1.95s/it][A
Training...:  11% 1583/13907 [1:01:03<6:33:35,  1.92s/it][A
Training...:  11% 1584/13907 [1:01:04<6:27:05,  1.88s/it][A
Training...:  11% 1585/13907 [1:01:06<6:19:25,  1.85s/it][A
Training...:  11% 1586/13907 [1:01:08<6:13:34,  1.82s/it][A
Training...:  11% 1587/13907 [1:01:10<6:06:04,  1.78s/it][A
Training...:  11% 1588/13907 [1:01:11<5:59:25,  1.75s/it][A
Training...:  11% 1589/13907 [1:01:13<5:52:45,  1.72s/it][A
Training...:  11% 1590/13907 [1:01:15<5:45:14,  1.68s/it][A
Training...:  11% 1591/13907 [1:01:16<5:38:43,  1.65s/it][A
Training...:  11% 1592/13907 [1:01:18<5:31:29,  1.62s/it][A
Training...:  11% 1593/13907 [1:01:19<5:25:27,  1.59s/it][A
Training...:  11% 1594/13907 [1:01:21<5:16:58,  1.54s/it][A
Training...:  11% 1595/13907 [1:01:22<5:07:23,  1.50s/it][A
Training...:  11% 1596/13907 [1:01:23<4:57:43,  1.45s/it][A
Training...:  11% 1597/13907 [1:01:25<4:47:56,  1.40s/it][A
Training...:  11% 1598/13907 [1:01:26<4:36:26,  1.35s/it][A
Training...:  11% 1599/13907 [1:01:27<4:22:37,  1.28s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:01:40<?, ?it/s]
Training...:  11% 1599/13907 [1:01:28<4:22:37,  1.28s/it][A
Training...:  12% 1600/13907 [1:01:28<4:17:27,  1.26s/it][A
Training...:  12% 1601/13907 [1:01:32<6:40:46,  1.95s/it][A
Training...:  12% 1602/13907 [1:01:35<8:05:26,  2.37s/it][A
Training...:  12% 1603/13907 [1:01:38<8:51:49,  2.59s/it][A
Training...:  12% 1604/13907 [1:01:41<9:17:27,  2.72s/it][A
Training...:  12% 1605/13907 [1:01:44<9:33:35,  2.80s/it][A
Training...:  12% 1606/13907 [1:01:47<9:38:56,  2.82s/it][A
Training...:  12% 1607/13907 [1:01:50<9:37:19,  2.82s/it][A
Training...:  12% 1608/13907 [1:01:53<9:32:43,  2.79s/it][A
Training...:  12% 1609/13907 [1:01:55<9:27:37,  2.77s/it][A
Training...:  12% 1610/13907 [1:01:58<9:21:04,  2.74s/it][A
Training...:  12% 1611/13907 [1:02:01<9:12:23,  2.70s/it][A
Training...:  12% 1612/13907 [1:02:03<9:04:17,  2.66s/it][A
Training...:  12% 1613/13907 [1:02:06<8:50:59,  2.59s/it][A
Training...:  12% 1614/13907 [1:02:08<8:39:33,  2.54s/it][A
Training...:  12% 1615/13907 [1:02:10<8:30:21,  2.49s/it][A
Training...:  12% 1616/13907 [1:02:13<8:18:58,  2.44s/it][A
Training...:  12% 1617/13907 [1:02:15<8:08:48,  2.39s/it][A
Training...:  12% 1618/13907 [1:02:17<7:58:29,  2.34s/it][A
Training...:  12% 1619/13907 [1:02:19<7:50:08,  2.30s/it][A
Training...:  12% 1620/13907 [1:02:22<7:44:07,  2.27s/it][A
Training...:  12% 1621/13907 [1:02:24<7:38:11,  2.24s/it][A
Training...:  12% 1622/13907 [1:02:26<7:30:06,  2.20s/it][A
Training...:  12% 1623/13907 [1:02:28<7:23:10,  2.16s/it][A
Training...:  12% 1624/13907 [1:02:30<7:15:51,  2.13s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:02:45<?, ?it/s]
Training...:  12% 1624/13907 [1:02:32<7:15:51,  2.13s/it][A
Training...:  12% 1625/13907 [1:02:32<7:29:58,  2.20s/it][A
Training...:  12% 1626/13907 [1:02:34<7:21:50,  2.16s/it][A
Training...:  12% 1627/13907 [1:02:36<7:10:54,  2.11s/it][A
Training...:  12% 1628/13907 [1:02:38<7:04:38,  2.07s/it][A
Training...:  12% 1629/13907 [1:02:40<6:54:06,  2.02s/it][A
Training...:  12% 1630/13907 [1:02:42<6:46:38,  1.99s/it][A
Training...:  12% 1631/13907 [1:02:44<6:39:47,  1.95s/it][A
Training...:  12% 1632/13907 [1:02:46<6:32:26,  1.92s/it][A
Training...:  12% 1633/13907 [1:02:48<6:26:44,  1.89s/it][A
Training...:  12% 1634/13907 [1:02:50<6:19:52,  1.86s/it][A
Training...:  12% 1635/13907 [1:02:51<6:14:24,  1.83s/it][A
Training...:  12% 1636/13907 [1:02:53<6:06:54,  1.79s/it][A
Training...:  12% 1637/13907 [1:02:55<6:00:27,  1.76s/it][A
Training...:  12% 1638/13907 [1:02:56<5:52:58,  1.73s/it][A
Training...:  12% 1639/13907 [1:02:58<5:45:36,  1.69s/it][A
Training...:  12% 1640/13907 [1:03:00<5:38:42,  1.66s/it][A
Training...:  12% 1641/13907 [1:03:01<5:31:58,  1.62s/it][A
Training...:  12% 1642/13907 [1:03:03<5:25:21,  1.59s/it][A
Training...:  12% 1643/13907 [1:03:04<5:18:14,  1.56s/it][A
Training...:  12% 1644/13907 [1:03:05<5:09:20,  1.51s/it][A
Training...:  12% 1645/13907 [1:03:07<5:03:31,  1.49s/it][A
Training...:  12% 1646/13907 [1:03:08<4:53:24,  1.44s/it][A
Training...:  12% 1647/13907 [1:03:10<4:45:58,  1.40s/it][A
Training...:  12% 1648/13907 [1:03:11<4:33:30,  1.34s/it][A
Training...:  12% 1649/13907 [1:03:12<4:18:40,  1.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:03:25<?, ?it/s]
Training...:  12% 1649/13907 [1:03:13<4:18:40,  1.27s/it][A
Training...:  12% 1650/13907 [1:03:13<4:14:12,  1.24s/it][A
Training...:  12% 1651/13907 [1:03:17<6:52:32,  2.02s/it][A
Training...:  12% 1652/13907 [1:03:20<8:14:48,  2.42s/it][A
Training...:  12% 1653/13907 [1:03:23<9:00:23,  2.65s/it][A
Training...:  12% 1654/13907 [1:03:26<9:30:04,  2.79s/it][A
Training...:  12% 1655/13907 [1:03:29<9:36:36,  2.82s/it][A
Training...:  12% 1656/13907 [1:03:32<9:36:32,  2.82s/it][A
Training...:  12% 1657/13907 [1:03:35<9:30:32,  2.79s/it][A
Training...:  12% 1658/13907 [1:03:38<9:24:03,  2.76s/it][A
Training...:  12% 1659/13907 [1:03:40<9:15:30,  2.72s/it][A
Training...:  12% 1660/13907 [1:03:43<9:05:20,  2.67s/it][A
Training...:  12% 1661/13907 [1:03:45<8:56:13,  2.63s/it][A
Training...:  12% 1662/13907 [1:03:48<8:45:47,  2.58s/it][A
Training...:  12% 1663/13907 [1:03:50<8:38:37,  2.54s/it][A
Training...:  12% 1664/13907 [1:03:53<8:29:18,  2.50s/it][A
Training...:  12% 1665/13907 [1:03:55<8:19:49,  2.45s/it][A
Training...:  12% 1666/13907 [1:03:57<8:11:56,  2.41s/it][A
Training...:  12% 1667/13907 [1:04:00<8:04:45,  2.38s/it][A
Training...:  12% 1668/13907 [1:04:02<7:56:48,  2.34s/it][A
Training...:  12% 1669/13907 [1:04:04<7:49:34,  2.30s/it][A
Training...:  12% 1670/13907 [1:04:06<7:40:28,  2.26s/it][A
Training...:  12% 1671/13907 [1:04:08<7:35:42,  2.23s/it][A
Training...:  12% 1672/13907 [1:04:11<7:27:32,  2.19s/it][A
Training...:  12% 1673/13907 [1:04:13<7:21:07,  2.16s/it][A
Training...:  12% 1674/13907 [1:04:15<7:13:42,  2.13s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:04:29<?, ?it/s]
Training...:  12% 1674/13907 [1:04:17<7:13:42,  2.13s/it][A
Training...:  12% 1675/13907 [1:04:17<7:27:53,  2.20s/it][A
Training...:  12% 1676/13907 [1:04:19<7:18:19,  2.15s/it][A
Training...:  12% 1677/13907 [1:04:21<7:07:21,  2.10s/it][A
Training...:  12% 1678/13907 [1:04:23<6:57:53,  2.05s/it][A
Training...:  12% 1679/13907 [1:04:25<6:50:21,  2.01s/it][A
Training...:  12% 1680/13907 [1:04:27<6:43:36,  1.98s/it][A
Training...:  12% 1681/13907 [1:04:29<6:36:15,  1.94s/it][A
Training...:  12% 1682/13907 [1:04:30<6:30:16,  1.92s/it][A
Training...:  12% 1683/13907 [1:04:32<6:25:51,  1.89s/it][A
Training...:  12% 1684/13907 [1:04:34<6:21:18,  1.87s/it][A
Training...:  12% 1685/13907 [1:04:36<6:16:52,  1.85s/it][A
Training...:  12% 1686/13907 [1:04:38<6:12:48,  1.83s/it][A
Training...:  12% 1687/13907 [1:04:39<6:06:33,  1.80s/it][A
Training...:  12% 1688/13907 [1:04:41<6:01:21,  1.77s/it][A
Training...:  12% 1689/13907 [1:04:43<5:55:21,  1.75s/it][A
Training...:  12% 1690/13907 [1:04:45<5:50:38,  1.72s/it][A
Training...:  12% 1691/13907 [1:04:46<5:43:48,  1.69s/it][A
Training...:  12% 1692/13907 [1:04:48<5:37:04,  1.66s/it][A
Training...:  12% 1693/13907 [1:04:49<5:30:01,  1.62s/it][A
Training...:  12% 1694/13907 [1:04:51<5:22:09,  1.58s/it][A
Training...:  12% 1695/13907 [1:04:52<5:12:30,  1.54s/it][A
Training...:  12% 1696/13907 [1:04:54<5:01:39,  1.48s/it][A
Training...:  12% 1697/13907 [1:04:55<4:53:26,  1.44s/it][A
Training...:  12% 1698/13907 [1:04:56<4:41:19,  1.38s/it][A
Training...:  12% 1699/13907 [1:04:57<4:27:20,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:05:11<?, ?it/s]
Training...:  12% 1699/13907 [1:04:58<4:27:20,  1.31s/it][A
Training...:  12% 1700/13907 [1:04:58<4:20:28,  1.28s/it][A
Training...:  12% 1701/13907 [1:05:02<6:46:17,  2.00s/it][A
Training...:  12% 1702/13907 [1:05:06<8:18:45,  2.45s/it][A
Training...:  12% 1703/13907 [1:05:09<9:02:27,  2.67s/it][A
Training...:  12% 1704/13907 [1:05:12<9:23:51,  2.77s/it][A
Training...:  12% 1705/13907 [1:05:15<9:31:10,  2.81s/it][A
Training...:  12% 1706/13907 [1:05:18<9:31:09,  2.81s/it][A
Training...:  12% 1707/13907 [1:05:20<9:25:52,  2.78s/it][A
Training...:  12% 1708/13907 [1:05:23<9:20:43,  2.76s/it][A
Training...:  12% 1709/13907 [1:05:26<9:13:26,  2.72s/it][A
Training...:  12% 1710/13907 [1:05:28<9:05:00,  2.68s/it][A
Training...:  12% 1711/13907 [1:05:31<8:55:39,  2.64s/it][A
Training...:  12% 1712/13907 [1:05:33<8:46:34,  2.59s/it][A
Training...:  12% 1713/13907 [1:05:36<8:37:01,  2.54s/it][A
Training...:  12% 1714/13907 [1:05:38<8:29:58,  2.51s/it][A
Training...:  12% 1715/13907 [1:05:40<8:22:35,  2.47s/it][A
Training...:  12% 1716/13907 [1:05:43<8:14:19,  2.43s/it][A
Training...:  12% 1717/13907 [1:05:45<8:07:16,  2.40s/it][A
Training...:  12% 1718/13907 [1:05:47<8:00:47,  2.37s/it][A
Training...:  12% 1719/13907 [1:05:50<7:52:45,  2.33s/it][A
Training...:  12% 1720/13907 [1:05:52<7:47:14,  2.30s/it][A
Training...:  12% 1721/13907 [1:05:54<7:40:39,  2.27s/it][A
Training...:  12% 1722/13907 [1:05:56<7:34:41,  2.24s/it][A
Training...:  12% 1723/13907 [1:05:58<7:27:48,  2.21s/it][A
Training...:  12% 1724/13907 [1:06:00<7:20:28,  2.17s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:06:15<?, ?it/s]
Training...:  12% 1724/13907 [1:06:03<7:20:28,  2.17s/it][A
Training...:  12% 1725/13907 [1:06:03<7:34:37,  2.24s/it][A
Training...:  12% 1726/13907 [1:06:05<7:27:34,  2.20s/it][A
Training...:  12% 1727/13907 [1:06:07<7:17:19,  2.15s/it][A
Training...:  12% 1728/13907 [1:06:09<7:06:21,  2.10s/it][A
Training...:  12% 1729/13907 [1:06:11<6:59:29,  2.07s/it][A
Training...:  12% 1730/13907 [1:06:13<6:53:11,  2.04s/it][A
Training...:  12% 1731/13907 [1:06:15<6:47:13,  2.01s/it][A
Training...:  12% 1732/13907 [1:06:17<6:41:05,  1.98s/it][A
Training...:  12% 1733/13907 [1:06:19<6:31:46,  1.93s/it][A
Training...:  12% 1734/13907 [1:06:20<6:23:05,  1.89s/it][A
Training...:  12% 1735/13907 [1:06:22<6:16:58,  1.86s/it][A
Training...:  12% 1736/13907 [1:06:24<6:10:07,  1.82s/it][A
Training...:  12% 1737/13907 [1:06:26<6:03:26,  1.79s/it][A
Training...:  12% 1738/13907 [1:06:27<5:56:40,  1.76s/it][A
Training...:  13% 1739/13907 [1:06:29<5:50:48,  1.73s/it][A
Training...:  13% 1740/13907 [1:06:31<5:43:25,  1.69s/it][A
Training...:  13% 1741/13907 [1:06:32<5:37:00,  1.66s/it][A
Training...:  13% 1742/13907 [1:06:34<5:30:17,  1.63s/it][A
Training...:  13% 1743/13907 [1:06:35<5:23:55,  1.60s/it][A
Training...:  13% 1744/13907 [1:06:37<5:16:22,  1.56s/it][A
Training...:  13% 1745/13907 [1:06:38<5:07:21,  1.52s/it][A
Training...:  13% 1746/13907 [1:06:40<4:58:56,  1.47s/it][A
Training...:  13% 1747/13907 [1:06:41<4:48:26,  1.42s/it][A
Training...:  13% 1748/13907 [1:06:42<4:38:13,  1.37s/it][A
Training...:  13% 1749/13907 [1:06:43<4:25:24,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:06:57<?, ?it/s]
Training...:  13% 1749/13907 [1:06:44<4:25:24,  1.31s/it][A
Training...:  13% 1750/13907 [1:06:44<4:18:52,  1.28s/it][A
Training...:  13% 1751/13907 [1:06:48<6:42:59,  1.99s/it][A
Training...:  13% 1752/13907 [1:06:51<8:04:54,  2.39s/it][A
Training...:  13% 1753/13907 [1:06:55<8:51:19,  2.62s/it][A
Training...:  13% 1754/13907 [1:06:58<9:15:38,  2.74s/it][A
Training...:  13% 1755/13907 [1:07:01<9:24:48,  2.79s/it][A
Training...:  13% 1756/13907 [1:07:03<9:26:36,  2.80s/it][A
Training...:  13% 1757/13907 [1:07:06<9:25:28,  2.79s/it][A
Training...:  13% 1758/13907 [1:07:09<9:20:07,  2.77s/it][A
Training...:  13% 1759/13907 [1:07:12<9:13:27,  2.73s/it][A
Training...:  13% 1760/13907 [1:07:14<9:07:36,  2.70s/it][A
Training...:  13% 1761/13907 [1:07:17<9:03:39,  2.69s/it][A
Training...:  13% 1762/13907 [1:07:19<8:56:21,  2.65s/it][A
Training...:  13% 1763/13907 [1:07:22<8:45:13,  2.59s/it][A
Training...:  13% 1764/13907 [1:07:24<8:37:02,  2.55s/it][A
Training...:  13% 1765/13907 [1:07:27<8:29:05,  2.52s/it][A
Training...:  13% 1766/13907 [1:07:29<8:21:15,  2.48s/it][A
Training...:  13% 1767/13907 [1:07:31<8:13:00,  2.44s/it][A
Training...:  13% 1768/13907 [1:07:34<8:03:29,  2.39s/it][A
Training...:  13% 1769/13907 [1:07:36<7:55:23,  2.35s/it][A
Training...:  13% 1770/13907 [1:07:38<7:46:28,  2.31s/it][A
Training...:  13% 1771/13907 [1:07:40<7:39:53,  2.27s/it][A
Training...:  13% 1772/13907 [1:07:42<7:30:42,  2.23s/it][A
Training...:  13% 1773/13907 [1:07:45<7:23:21,  2.19s/it][A
Training...:  13% 1774/13907 [1:07:47<7:15:17,  2.15s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:08:01<?, ?it/s]
Training...:  13% 1774/13907 [1:07:49<7:15:17,  2.15s/it][A
Training...:  13% 1775/13907 [1:07:49<7:27:23,  2.21s/it][A
Training...:  13% 1776/13907 [1:07:51<7:18:47,  2.17s/it][A
Training...:  13% 1777/13907 [1:07:53<7:06:39,  2.11s/it][A
Training...:  13% 1778/13907 [1:07:55<6:57:09,  2.06s/it][A
Training...:  13% 1779/13907 [1:07:57<6:49:33,  2.03s/it][A
Training...:  13% 1780/13907 [1:07:59<6:41:04,  1.98s/it][A
Training...:  13% 1781/13907 [1:08:01<6:36:03,  1.96s/it][A
Training...:  13% 1782/13907 [1:08:03<6:28:56,  1.92s/it][A
Training...:  13% 1783/13907 [1:08:04<6:23:11,  1.90s/it][A
Training...:  13% 1784/13907 [1:08:06<6:17:57,  1.87s/it][A
Training...:  13% 1785/13907 [1:08:08<6:13:07,  1.85s/it][A
Training...:  13% 1786/13907 [1:08:10<6:07:36,  1.82s/it][A
Training...:  13% 1787/13907 [1:08:11<6:01:54,  1.79s/it][A
Training...:  13% 1788/13907 [1:08:13<5:57:24,  1.77s/it][A
Training...:  13% 1789/13907 [1:08:15<5:52:28,  1.75s/it][A
Training...:  13% 1790/13907 [1:08:17<5:45:31,  1.71s/it][A
Training...:  13% 1791/13907 [1:08:18<5:38:42,  1.68s/it][A
Training...:  13% 1792/13907 [1:08:20<5:32:31,  1.65s/it][A
Training...:  13% 1793/13907 [1:08:21<5:26:06,  1.62s/it][A
Training...:  13% 1794/13907 [1:08:23<5:19:03,  1.58s/it][A
Training...:  13% 1795/13907 [1:08:24<5:10:25,  1.54s/it][A
Training...:  13% 1796/13907 [1:08:26<5:00:39,  1.49s/it][A
Training...:  13% 1797/13907 [1:08:27<4:49:41,  1.44s/it][A
Training...:  13% 1798/13907 [1:08:28<4:37:07,  1.37s/it][A
Training...:  13% 1799/13907 [1:08:29<4:24:01,  1.31s/it][A                                            
                                                         [AStep... (25 | Loss: 12.334364891052246, Learning Rate: 1.4399993233382702e-05, Gradient Norm: 13.369550704956055)
Step... (50 | Loss: 14.861682891845703, Learning Rate: 2.9399991035461426e-05, Gradient Norm: 18.309890747070312)
Step... (75 | Loss: 11.550538063049316, Learning Rate: 4.439998883754015e-05, Gradient Norm: 16.079557418823242)
Step... (100 | Loss: 12.082499504089355, Learning Rate: 5.94000011915341e-05, Gradient Norm: 22.966690063476562)
Step... (125 | Loss: 6.873927593231201, Learning Rate: 7.440001354552805e-05, Gradient Norm: 21.314746856689453)
Step... (150 | Loss: 4.024751663208008, Learning Rate: 8.939999679569155e-05, Gradient Norm: 11.713733673095703)
Step... (175 | Loss: 3.206693172454834, Learning Rate: 0.00010440002370160073, Gradient Norm: 2.0044331550598145)
Step... (200 | Loss: 3.163811683654785, Learning Rate: 0.00011940000695176423, Gradient Norm: 1.4698171615600586)
Step... (225 | Loss: 3.0668554306030273, Learning Rate: 0.00013440000475384295, Gradient Norm: 1.795788049697876)
Step... (250 | Loss: 3.1151223182678223, Learning Rate: 0.0001494000171078369, Gradient Norm: 1.7860510349273682)
Step... (275 | Loss: 3.009897232055664, Learning Rate: 0.00016440001490991563, Gradient Norm: 1.5052776336669922)
Step... (300 | Loss: 3.0072836875915527, Learning Rate: 0.00017940002726390958, Gradient Norm: 1.2506722211837769)
Step... (325 | Loss: 2.951040029525757, Learning Rate: 0.00019440001051407307, Gradient Norm: 1.3311725854873657)
Step... (350 | Loss: 3.0115966796875, Learning Rate: 0.00020940002286806703, Gradient Norm: 1.3890976905822754)
Step... (375 | Loss: 2.9244978427886963, Learning Rate: 0.00022440002067014575, Gradient Norm: 0.8066762089729309)
Step... (400 | Loss: 2.9905269145965576, Learning Rate: 0.00023940001847222447, Gradient Norm: 1.5292177200317383)
Step... (425 | Loss: 2.9261813163757324, Learning Rate: 0.0002544000162743032, Gradient Norm: 0.6442322134971619)
Step... (450 | Loss: 2.9611921310424805, Learning Rate: 0.0002694000431802124, Gradient Norm: 1.3417249917984009)
Step... (475 | Loss: 2.9003779888153076, Learning Rate: 0.0002844000409822911, Gradient Norm: 0.7390152215957642)
Step... (500 | Loss: 2.960975408554077, Learning Rate: 0.00029940000968053937, Gradient Norm: 1.065114974975586)
Step... (525 | Loss: 2.9198503494262695, Learning Rate: 0.00029985455330461264, Gradient Norm: 0.7114599943161011)
Step... (550 | Loss: 2.9695820808410645, Learning Rate: 0.0002997030387632549, Gradient Norm: 1.4727423191070557)
Step... (575 | Loss: 2.8897881507873535, Learning Rate: 0.0002995515242218971, Gradient Norm: 0.8611453771591187)
Step... (600 | Loss: 2.939824104309082, Learning Rate: 0.00029940000968053937, Gradient Norm: 1.4339866638183594)
Step... (625 | Loss: 2.865407943725586, Learning Rate: 0.0002992484951391816, Gradient Norm: 0.6814063787460327)
Step... (650 | Loss: 2.8850808143615723, Learning Rate: 0.00029909698059782386, Gradient Norm: 1.288311243057251)
Step... (675 | Loss: 2.773454189300537, Learning Rate: 0.0002989454660564661, Gradient Norm: 0.7303662300109863)
Step... (700 | Loss: 2.7510194778442383, Learning Rate: 0.00029879395151510835, Gradient Norm: 1.362924337387085)
Step... (725 | Loss: 2.560518741607666, Learning Rate: 0.0002986424369737506, Gradient Norm: 0.8375956416130066)
Step... (750 | Loss: 2.6407976150512695, Learning Rate: 0.00029849092243239284, Gradient Norm: 1.4907749891281128)
Step... (775 | Loss: 2.270236015319824, Learning Rate: 0.0002983394078910351, Gradient Norm: 1.0780662298202515)
Step... (800 | Loss: 2.295368194580078, Learning Rate: 0.0002981878933496773, Gradient Norm: 1.772743821144104)
Step... (825 | Loss: 1.859156608581543, Learning Rate: 0.00029803637880831957, Gradient Norm: 1.1464412212371826)
Step... (850 | Loss: 1.8526251316070557, Learning Rate: 0.0002978848642669618, Gradient Norm: 2.792100429534912)
Step... (875 | Loss: 1.4700813293457031, Learning Rate: 0.00029773334972560406, Gradient Norm: 1.2907003164291382)
Step... (900 | Loss: 1.488046407699585, Learning Rate: 0.0002975818351842463, Epoch ... (1/4):   0% 0/4 [1:08:43<?, ?it/s]
Gradient Norm: 2.130526304244995)
Step... (925 | Loss: 1.0958577394485474, Learning Rate: 0.00029743032064288855, Gradient Norm: 1.1539320945739746)
Step... (950 | Loss: 1.271256446838379, Learning Rate: 0.0002972788061015308, Gradient Norm: 2.322736978530884)
Step... (975 | Loss: 0.9520063400268555, Learning Rate: 0.00029712729156017303, Gradient Norm: 1.3217865228652954)
Step... (1000 | Loss: 1.152571678161621, Learning Rate: 0.0002969757770188153, Gradient Norm: 2.431718349456787)
Step... (1025 | Loss: 0.8081986308097839, Learning Rate: 0.0002968242624774575, Gradient Norm: 1.3278074264526367)
Step... (1050 | Loss: 1.0121930837631226, Learning Rate: 0.00029667274793609977, Gradient Norm: 2.117893934249878)
Step... (1075 | Loss: 0.7971699237823486, Learning Rate: 0.000296521233394742, Gradient Norm: 1.3583803176879883)
Step... (1100 | Loss: 1.1073853969573975, Learning Rate: 0.00029636971885338426, Gradient Norm: 2.870421886444092)
Step... (1125 | Loss: 0.7170144319534302, Learning Rate: 0.00029621817520819604, Gradient Norm: 1.159989833831787)
Step... (1150 | Loss: 1.1344740390777588, Learning Rate: 0.00029606668977066875, Gradient Norm: 2.7074170112609863)
Step... (1175 | Loss: 0.6294679641723633, Learning Rate: 0.000295915175229311, Gradient Norm: 1.0982818603515625)
Step... (1200 | Loss: 0.9680623412132263, Learning Rate: 0.0002957636315841228, Gradient Norm: 3.55824613571167)
Step... (1225 | Loss: 0.6406606435775757, Learning Rate: 0.0002956121461465955, Gradient Norm: 1.238095998764038)
Step... (1250 | Loss: 0.9866185188293457, Learning Rate: 0.0002954606316052377, Gradient Norm: 2.0832324028015137)
Step... (1275 | Loss: 0.6358751654624939, Learning Rate: 0.0002953090879600495, Gradient Norm: 1.2122591733932495)
Step... (1300 | Loss: 0.8901994228363037, Learning Rate: 0.0002951576025225222, Gradient Norm: 2.273822069168091)
Step... (1325 | Loss: 0.5698936581611633, Learning Rate: 0.00029500608798116446, Gradient Norm: 1.1504490375518799)
Step... (1350 | Loss: 0.8507088422775269, Learning Rate: 0.00029485454433597624, Gradient Norm: 2.942460536956787)
Step... (1375 | Loss: 0.6010502576828003, Learning Rate: 0.00029470305889844894, Gradient Norm: 1.4176217317581177)
Step... (1400 | Loss: 0.7600523233413696, Learning Rate: 0.0002945515443570912, Gradient Norm: 2.109902858734131)
Step... (1425 | Loss: 0.5264939069747925, Learning Rate: 0.000294400000711903, Gradient Norm: 1.2926435470581055)
Step... (1450 | Loss: 0.7584718465805054, Learning Rate: 0.0002942484861705452, Gradient Norm: 1.9779664278030396)
Step... (1475 | Loss: 0.6164758205413818, Learning Rate: 0.0002940970007330179, Gradient Norm: 1.2337689399719238)
Step... (1500 | Loss: 0.6858441233634949, Learning Rate: 0.0002939454570878297, Gradient Norm: 2.2924301624298096)
Step... (1525 | Loss: 0.5755376815795898, Learning Rate: 0.00029379394254647195, Gradient Norm: 1.4017829895019531)
Step... (1550 | Loss: 0.8780264258384705, Learning Rate: 0.00029364245710894465, Gradient Norm: 2.6268410682678223)
Step... (1575 | Loss: 0.6200823783874512, Learning Rate: 0.00029349091346375644, Gradient Norm: 1.5088961124420166)
Step... (1600 | Loss: 0.6652272939682007, Learning Rate: 0.0002933393989223987, Gradient Norm: 2.093759536743164)
Step... (1625 | Loss: 0.5575203895568848, Learning Rate: 0.0002931879134848714, Gradient Norm: 1.4041132926940918)
Step... (1650 | Loss: 0.8704431056976318, Learning Rate: 0.0002930363698396832, Gradient Norm: 2.3673243522644043)
Step... (1675 | Loss: 0.49408310651779175, Learning Rate: 0.0002928848552983254, Gradient Norm: 1.4628618955612183)
Step... (1700 | Loss: 0.6727932095527649, Learning Rate: 0.0002927333698607981, Gradient Norm: 2.339308977127075)
Step... (1725 | Loss: 0.523999810218811, Learning Rate: 0.0002925818262156099, Gradient Norm: 1.1301261186599731)
Step... (1750 | Loss: 0.6691818237304688, Learning Rate: 0.00029243031167425215, Gradient Norm: 1.7627772092819214)
Step... (1775 | Loss: 0.5347098112106323, Learning Rate: 0.0002922787971328944, Gradient Norm: 1.088964819908142)
Training...:  13% 1799/13907 [1:08:30<4:24:01,  1.31s/it][A
Training...:  13% 1800/13907 [1:08:30<4:17:01,  1.27s/it][A
Training...:  13% 1801/13907 [1:08:34<6:43:50,  2.00s/it][A
Training...:  13% 1802/13907 [1:08:38<8:05:56,  2.41s/it][A
Training...:  13% 1803/13907 [1:08:41<8:51:09,  2.63s/it][A
Training...:  13% 1804/13907 [1:08:44<9:16:28,  2.76s/it][A
Training...:  13% 1805/13907 [1:08:47<9:27:34,  2.81s/it][A
Training...:  13% 1806/13907 [1:08:49<9:28:26,  2.82s/it][A
Training...:  13% 1807/13907 [1:08:52<9:27:13,  2.81s/it][A
Training...:  13% 1808/13907 [1:08:55<9:20:51,  2.78s/it][A
Training...:  13% 1809/13907 [1:08:58<9:13:23,  2.74s/it][A
Training...:  13% 1810/13907 [1:09:00<9:04:40,  2.70s/it][A
Training...:  13% 1811/13907 [1:09:03<8:54:58,  2.65s/it][A
Training...:  13% 1812/13907 [1:09:05<8:44:52,  2.60s/it][A
Training...:  13% 1813/13907 [1:09:08<8:37:03,  2.57s/it][A
Training...:  13% 1814/13907 [1:09:10<8:25:10,  2.51s/it][A
Training...:  13% 1815/13907 [1:09:13<8:18:33,  2.47s/it][A
Training...:  13% 1816/13907 [1:09:15<8:08:05,  2.42s/it][A
Training...:  13% 1817/13907 [1:09:17<8:00:32,  2.38s/it][A
Training...:  13% 1818/13907 [1:09:19<7:52:12,  2.34s/it][A
Training...:  13% 1819/13907 [1:09:22<7:46:00,  2.31s/it][A
Training...:  13% 1820/13907 [1:09:24<7:38:48,  2.28s/it][A
Training...:  13% 1821/13907 [1:09:26<7:33:03,  2.25s/it][A
Training...:  13% 1822/13907 [1:09:28<7:25:13,  2.21s/it][A
Training...:  13% 1823/13907 [1:09:30<7:16:55,  2.17s/it][A
Training...:  13% 1824/13907 [1:09:32<7:10:24,  2.14s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:09:47<?, ?it/s]
Training...:  13% 1824/13907 [1:09:35<7:10:24,  2.14s/it][A
Training...:  13% 1825/13907 [1:09:35<7:22:26,  2.20s/it][A
Training...:  13% 1826/13907 [1:09:37<7:12:30,  2.15s/it][A
Training...:  13% 1827/13907 [1:09:39<7:03:12,  2.10s/it][A
Training...:  13% 1828/13907 [1:09:41<6:53:42,  2.05s/it][A
Training...:  13% 1829/13907 [1:09:43<6:47:59,  2.03s/it][A
Training...:  13% 1830/13907 [1:09:44<6:43:48,  2.01s/it][A
Training...:  13% 1831/13907 [1:09:46<6:36:31,  1.97s/it][A
Training...:  13% 1832/13907 [1:09:48<6:32:26,  1.95s/it][A
Training...:  13% 1833/13907 [1:09:50<6:24:58,  1.91s/it][A
Training...:  13% 1834/13907 [1:09:52<6:18:00,  1.88s/it][A
Training...:  13% 1835/13907 [1:09:54<6:13:45,  1.86s/it][A
Training...:  13% 1836/13907 [1:09:55<6:06:27,  1.82s/it][A
Training...:  13% 1837/13907 [1:09:57<5:58:55,  1.78s/it][A
Training...:  13% 1838/13907 [1:09:59<5:52:43,  1.75s/it][A
Training...:  13% 1839/13907 [1:10:00<5:46:20,  1.72s/it][A
Training...:  13% 1840/13907 [1:10:02<5:39:03,  1.69s/it][A
Training...:  13% 1841/13907 [1:10:04<5:32:39,  1.65s/it][A
Training...:  13% 1842/13907 [1:10:05<5:26:54,  1.63s/it][A
Training...:  13% 1843/13907 [1:10:07<5:19:45,  1.59s/it][A
Training...:  13% 1844/13907 [1:10:08<5:13:56,  1.56s/it][A
Training...:  13% 1845/13907 [1:10:10<5:05:51,  1.52s/it][A
Training...:  13% 1846/13907 [1:10:11<4:56:42,  1.48s/it][A
Training...:  13% 1847/13907 [1:10:12<4:47:02,  1.43s/it][A
Training...:  13% 1848/13907 [1:10:14<4:36:52,  1.38s/it][A
Training...:  13% 1849/13907 [1:10:15<4:23:28,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:10:28<?, ?it/s]
Training...:  13% 1849/13907 [1:10:16<4:23:28,  1.31s/it][A
Training...:  13% 1850/13907 [1:10:16<4:17:11,  1.28s/it][A
Training...:  13% 1851/13907 [1:10:20<6:38:48,  1.98s/it][A
Training...:  13% 1852/13907 [1:10:23<8:00:03,  2.39s/it][A
Training...:  13% 1853/13907 [1:10:26<8:52:09,  2.65s/it][A
Training...:  13% 1854/13907 [1:10:29<9:15:15,  2.76s/it][A
Training...:  13% 1855/13907 [1:10:32<9:23:38,  2.81s/it][A
Training...:  13% 1856/13907 [1:10:35<9:26:02,  2.82s/it][A
Training...:  13% 1857/13907 [1:10:38<9:22:12,  2.80s/it][A
Training...:  13% 1858/13907 [1:10:40<9:15:07,  2.76s/it][A
Training...:  13% 1859/13907 [1:10:43<9:05:11,  2.72s/it][A
Training...:  13% 1860/13907 [1:10:46<8:57:12,  2.68s/it][A
Training...:  13% 1861/13907 [1:10:48<8:49:00,  2.63s/it][A
Training...:  13% 1862/13907 [1:10:51<8:38:09,  2.58s/it][A
Training...:  13% 1863/13907 [1:10:53<8:28:58,  2.54s/it][A
Training...:  13% 1864/13907 [1:10:55<8:20:04,  2.49s/it][A
Training...:  13% 1865/13907 [1:10:58<8:11:11,  2.45s/it][A
Training...:  13% 1866/13907 [1:11:00<8:01:27,  2.40s/it][A
Training...:  13% 1867/13907 [1:11:02<7:54:44,  2.37s/it][A
Training...:  13% 1868/13907 [1:11:05<7:46:31,  2.33s/it][A
Training...:  13% 1869/13907 [1:11:07<7:39:04,  2.29s/it][A
Training...:  13% 1870/13907 [1:11:09<7:32:55,  2.26s/it][A
Training...:  13% 1871/13907 [1:11:11<7:27:30,  2.23s/it][A
Training...:  13% 1872/13907 [1:11:13<7:19:59,  2.19s/it][A
Training...:  13% 1873/13907 [1:11:15<7:14:07,  2.16s/it][A
Training...:  13% 1874/13907 [1:11:17<7:06:52,  2.13s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:11:32<?, ?it/s]
Training...:  13% 1874/13907 [1:11:20<7:06:52,  2.13s/it][A
Training...:  13% 1875/13907 [1:11:20<7:19:41,  2.19s/it][A
Training...:  13% 1876/13907 [1:11:22<7:12:55,  2.16s/it][A
Training...:  13% 1877/13907 [1:11:24<7:03:05,  2.11s/it][A
Training...:  14% 1878/13907 [1:11:26<6:55:48,  2.07s/it][A
Training...:  14% 1879/13907 [1:11:28<6:50:34,  2.05s/it][A
Training...:  14% 1880/13907 [1:11:30<6:43:03,  2.01s/it][A
Training...:  14% 1881/13907 [1:11:32<6:37:47,  1.98s/it][A
Training...:  14% 1882/13907 [1:11:33<6:30:44,  1.95s/it][A
Training...:  14% 1883/13907 [1:11:35<6:25:14,  1.92s/it][A
Training...:  14% 1884/13907 [1:11:37<6:16:53,  1.88s/it][A
Training...:  14% 1885/13907 [1:11:39<6:10:03,  1.85s/it][A
Training...:  14% 1886/13907 [1:11:41<6:04:18,  1.82s/it][A
Training...:  14% 1887/13907 [1:11:42<5:57:09,  1.78s/it][A
Training...:  14% 1888/13907 [1:11:44<5:50:18,  1.75s/it][A
Training...:  14% 1889/13907 [1:11:46<5:43:27,  1.71s/it][A
Training...:  14% 1890/13907 [1:11:47<5:35:54,  1.68s/it][A
Training...:  14% 1891/13907 [1:11:49<5:29:19,  1.64s/it][A
Training...:  14% 1892/13907 [1:11:50<5:22:10,  1.61s/it][A
Training...:  14% 1893/13907 [1:11:52<5:16:01,  1.58s/it][A
Training...:  14% 1894/13907 [1:11:53<5:07:55,  1.54s/it][A
Training...:  14% 1895/13907 [1:11:55<4:59:32,  1.50s/it][A
Training...:  14% 1896/13907 [1:11:56<4:50:20,  1.45s/it][A
Training...:  14% 1897/13907 [1:11:57<4:40:05,  1.40s/it][A
Training...:  14% 1898/13907 [1:11:58<4:28:16,  1.34s/it][A
Training...:  14% 1899/13907 [1:12:00<4:14:42,  1.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:12:13<?, ?it/s]
Training...:  14% 1899/13907 [1:12:01<4:14:42,  1.27s/it][A
Training...:  14% 1900/13907 [1:12:01<4:10:02,  1.25s/it][A
Training...:  14% 1901/13907 [1:12:04<6:35:13,  1.98s/it][A
Training...:  14% 1902/13907 [1:12:08<7:56:58,  2.38s/it][A
Training...:  14% 1903/13907 [1:12:11<8:41:36,  2.61s/it][A
Training...:  14% 1904/13907 [1:12:14<9:05:45,  2.73s/it][A
Training...:  14% 1905/13907 [1:12:17<9:18:32,  2.79s/it][A
Training...:  14% 1906/13907 [1:12:20<9:25:36,  2.83s/it][A
Training...:  14% 1907/13907 [1:12:23<9:23:19,  2.82s/it][A
Training...:  14% 1908/13907 [1:12:25<9:19:29,  2.80s/it][A
Training...:  14% 1909/13907 [1:12:28<9:14:07,  2.77s/it][A
Training...:  14% 1910/13907 [1:12:31<9:05:12,  2.73s/it][A
Training...:  14% 1911/13907 [1:12:33<8:56:43,  2.68s/it][A
Training...:  14% 1912/13907 [1:12:36<8:45:45,  2.63s/it][A
Training...:  14% 1913/13907 [1:12:38<8:35:58,  2.58s/it][A
Training...:  14% 1914/13907 [1:12:41<8:25:34,  2.53s/it][A
Training...:  14% 1915/13907 [1:12:43<8:17:53,  2.49s/it][A
Training...:  14% 1916/13907 [1:12:45<8:08:43,  2.45s/it][A
Training...:  14% 1917/13907 [1:12:48<8:01:17,  2.41s/it][A
Training...:  14% 1918/13907 [1:12:50<7:53:55,  2.37s/it][A
Training...:  14% 1919/13907 [1:12:52<7:48:32,  2.35s/it][A
Training...:  14% 1920/13907 [1:12:54<7:42:43,  2.32s/it][A
Training...:  14% 1921/13907 [1:12:57<7:34:21,  2.27s/it][A
Training...:  14% 1922/13907 [1:12:59<7:25:42,  2.23s/it][A
Training...:  14% 1923/13907 [1:13:01<7:19:32,  2.20s/it][A
Training...:  14% 1924/13907 [1:13:03<7:11:37,  2.16s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:13:18<?, ?it/s]
Training...:  14% 1924/13907 [1:13:05<7:11:37,  2.16s/it][A
Training...:  14% 1925/13907 [1:13:05<7:22:55,  2.22s/it][A
Training...:  14% 1926/13907 [1:13:07<7:13:54,  2.17s/it][A
Training...:  14% 1927/13907 [1:13:09<7:02:31,  2.12s/it][A
Training...:  14% 1928/13907 [1:13:11<6:56:05,  2.08s/it][A
Training...:  14% 1929/13907 [1:13:13<6:47:08,  2.04s/it][A
Training...:  14% 1930/13907 [1:13:15<6:38:39,  2.00s/it][A
Training...:  14% 1931/13907 [1:13:17<6:31:26,  1.96s/it][A
Training...:  14% 1932/13907 [1:13:19<6:24:32,  1.93s/it][A
Training...:  14% 1933/13907 [1:13:21<6:17:21,  1.89s/it][A
Training...:  14% 1934/13907 [1:13:23<6:10:47,  1.86s/it][A
Training...:  14% 1935/13907 [1:13:24<6:05:07,  1.83s/it][A
Training...:  14% 1936/13907 [1:13:26<5:57:07,  1.79s/it][A
Training...:  14% 1937/13907 [1:13:28<5:52:22,  1.77s/it][A
Training...:  14% 1938/13907 [1:13:29<5:46:35,  1.74s/it][A
Training...:  14% 1939/13907 [1:13:31<5:40:25,  1.71s/it][A
Training...:  14% 1940/13907 [1:13:33<5:33:48,  1.67s/it][A
Training...:  14% 1941/13907 [1:13:34<5:27:22,  1.64s/it][A
Training...:  14% 1942/13907 [1:13:36<5:20:39,  1.61s/it][A
Training...:  14% 1943/13907 [1:13:37<5:12:58,  1.57s/it][A
Training...:  14% 1944/13907 [1:13:39<5:06:06,  1.54s/it][A
Training...:  14% 1945/13907 [1:13:40<4:57:31,  1.49s/it][A
Training...:  14% 1946/13907 [1:13:41<4:48:09,  1.45s/it][A
Training...:  14% 1947/13907 [1:13:43<4:38:15,  1.40s/it][A
Training...:  14% 1948/13907 [1:13:44<4:27:54,  1.34s/it][A
Training...:  14% 1949/13907 [1:13:45<4:13:59,  1.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:13:59<?, ?it/s]
Training...:  14% 1949/13907 [1:13:46<4:13:59,  1.27s/it][A
Training...:  14% 1950/13907 [1:13:46<4:07:42,  1.24s/it][A
Training...:  14% 1951/13907 [1:13:50<6:30:23,  1.96s/it][A
Training...:  14% 1952/13907 [1:13:53<7:54:54,  2.38s/it][A
Training...:  14% 1953/13907 [1:13:56<8:43:03,  2.63s/it][A
Training...:  14% 1954/13907 [1:13:59<9:09:17,  2.76s/it][A
Training...:  14% 1955/13907 [1:14:02<9:19:32,  2.81s/it][A
Training...:  14% 1956/13907 [1:14:05<9:23:48,  2.83s/it][A
Training...:  14% 1957/13907 [1:14:08<9:24:06,  2.83s/it][A
Training...:  14% 1958/13907 [1:14:11<9:19:57,  2.81s/it][A
Training...:  14% 1959/13907 [1:14:14<9:13:58,  2.78s/it][A
Training...:  14% 1960/13907 [1:14:16<9:04:57,  2.74s/it][A
Training...:  14% 1961/13907 [1:14:19<8:55:15,  2.69s/it][A
Training...:  14% 1962/13907 [1:14:21<8:44:22,  2.63s/it][A
Training...:  14% 1963/13907 [1:14:24<8:36:51,  2.60s/it][A
Training...:  14% 1964/13907 [1:14:26<8:26:46,  2.55s/it][A
Training...:  14% 1965/13907 [1:14:29<8:17:29,  2.50s/it][A
Training...:  14% 1966/13907 [1:14:31<8:09:00,  2.46s/it][A
Training...:  14% 1967/13907 [1:14:33<8:00:32,  2.41s/it][A
Training...:  14% 1968/13907 [1:14:36<7:52:42,  2.38s/it][A
Training...:  14% 1969/13907 [1:14:38<7:46:57,  2.35s/it][A
Training...:  14% 1970/13907 [1:14:40<7:38:33,  2.30s/it][A
Training...:  14% 1971/13907 [1:14:42<7:31:25,  2.27s/it][A
Training...:  14% 1972/13907 [1:14:44<7:26:09,  2.24s/it][A
Training...:  14% 1973/13907 [1:14:47<7:17:51,  2.20s/it][A
Training...:  14% 1974/13907 [1:14:49<7:11:25,  2.17s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:15:03<?, ?it/s]
Training...:  14% 1974/13907 [1:14:51<7:11:25,  2.17s/it][A
Training...:  14% 1975/13907 [1:14:51<7:25:13,  2.24s/it][A
Training...:  14% 1976/13907 [1:14:53<7:14:42,  2.19s/it][A
Training...:  14% 1977/13907 [1:14:55<7:02:55,  2.13s/it][A
Training...:  14% 1978/13907 [1:14:57<6:53:35,  2.08s/it][A
Training...:  14% 1979/13907 [1:14:59<6:44:00,  2.03s/it][A
Training...:  14% 1980/13907 [1:15:01<6:37:02,  2.00s/it][A
Training...:  14% 1981/13907 [1:15:03<6:30:38,  1.97s/it][A
Training...:  14% 1982/13907 [1:15:05<6:26:34,  1.95s/it][A
Training...:  14% 1983/13907 [1:15:06<6:19:38,  1.91s/it][A
Training...:  14% 1984/13907 [1:15:08<6:13:41,  1.88s/it][A
Training...:  14% 1985/13907 [1:15:10<6:07:34,  1.85s/it][A
Training...:  14% 1986/13907 [1:15:12<6:00:21,  1.81s/it][A
Training...:  14% 1987/13907 [1:15:14<5:55:19,  1.79s/it][A
Training...:  14% 1988/13907 [1:15:15<5:48:19,  1.75s/it][A
Training...:  14% 1989/13907 [1:15:17<5:42:04,  1.72s/it][A
Training...:  14% 1990/13907 [1:15:18<5:34:17,  1.68s/it][A
Training...:  14% 1991/13907 [1:15:20<5:28:57,  1.66s/it][A
Training...:  14% 1992/13907 [1:15:22<5:20:28,  1.61s/it][A
Training...:  14% 1993/13907 [1:15:23<5:13:38,  1.58s/it][A
Training...:  14% 1994/13907 [1:15:25<5:07:20,  1.55s/it][A
Training...:  14% 1995/13907 [1:15:26<5:00:45,  1.51s/it][A
Training...:  14% 1996/13907 [1:15:27<4:51:12,  1.47s/it][A
Training...:  14% 1997/13907 [1:15:29<4:41:59,  1.42s/it][A
Training...:  14% 1998/13907 [1:15:30<4:30:28,  1.36s/it][A
Training...:  14% 1999/13907 [1:15:31<4:17:22,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:15:45<?, ?it/s]
Training...:  14% 1999/13907 [1:15:32<4:17:22,  1.30s/it][A
Training...:  14% 2000/13907 [1:15:32<4:13:15,  1.28s/it][A
Training...:  14% 2001/13907 [1:15:36<6:38:59,  2.01s/it][A
Training...:  14% 2002/13907 [1:15:39<8:02:46,  2.43s/it][A
Training...:  14% 2003/13907 [1:15:43<8:49:19,  2.67s/it][A
Training...:  14% 2004/13907 [1:15:46<9:14:15,  2.79s/it][A
Training...:  14% 2005/13907 [1:15:49<9:22:23,  2.84s/it][A
Training...:  14% 2006/13907 [1:15:51<9:23:16,  2.84s/it][A
Training...:  14% 2007/13907 [1:15:54<9:19:01,  2.82s/it][A
Training...:  14% 2008/13907 [1:15:57<9:11:44,  2.78s/it][A
Training...:  14% 2009/13907 [1:16:00<9:01:33,  2.73s/it][A
Training...:  14% 2010/13907 [1:16:02<8:53:04,  2.69s/it][A
Training...:  14% 2011/13907 [1:16:05<8:43:19,  2.64s/it][A
Training...:  14% 2012/13907 [1:16:07<8:35:13,  2.60s/it][A
Training...:  14% 2013/13907 [1:16:10<8:27:19,  2.56s/it][A
Training...:  14% 2014/13907 [1:16:12<8:17:56,  2.51s/it][A
Training...:  14% 2015/13907 [1:16:14<8:09:02,  2.47s/it][A
Training...:  14% 2016/13907 [1:16:17<8:01:51,  2.43s/it][A
Training...:  15% 2017/13907 [1:16:19<7:55:29,  2.40s/it][A
Training...:  15% 2018/13907 [1:16:21<7:48:29,  2.36s/it][A
Training...:  15% 2019/13907 [1:16:24<7:42:27,  2.33s/it][A
Training...:  15% 2020/13907 [1:16:26<7:34:09,  2.29s/it][A
Training...:  15% 2021/13907 [1:16:28<7:25:48,  2.25s/it][A
Training...:  15% 2022/13907 [1:16:30<7:18:43,  2.21s/it][A
Training...:  15% 2023/13907 [1:16:32<7:11:53,  2.18s/it][A
Training...:  15% 2024/13907 [1:16:34<7:06:12,  2.15s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:16:49<?, ?it/s]
Training...:  15% 2024/13907 [1:16:37<7:06:12,  2.15s/it][A
Training...:  15% 2025/13907 [1:16:37<7:19:11,  2.22s/it][A
Training...:  15% 2026/13907 [1:16:39<7:11:06,  2.18s/it][A
Training...:  15% 2027/13907 [1:16:41<7:01:22,  2.13s/it][A
Training...:  15% 2028/13907 [1:16:43<6:51:28,  2.08s/it][A
Training...:  15% 2029/13907 [1:16:45<6:43:22,  2.04s/it][A
Training...:  15% 2030/13907 [1:16:47<6:38:15,  2.01s/it][A
Training...:  15% 2031/13907 [1:16:49<6:32:28,  1.98s/it][A
Training...:  15% 2032/13907 [1:16:50<6:26:11,  1.95s/it][A
Training...:  15% 2033/13907 [1:16:52<6:19:59,  1.92s/it][A
Training...:  15% 2034/13907 [1:16:54<6:13:41,  1.89s/it][A
Training...:  15% 2035/13907 [1:16:56<6:07:11,  1.86s/it][A
Training...:  15% 2036/13907 [1:16:58<6:01:18,  1.83s/it][A
Training...:  15% 2037/13907 [1:16:59<5:53:05,  1.78s/it][A
Training...:  15% 2038/13907 [1:17:01<5:45:41,  1.75s/it][A
Training...:  15% 2039/13907 [1:17:03<5:37:56,  1.71s/it][A
Training...:  15% 2040/13907 [1:17:04<5:31:30,  1.68s/it][A
Training...:  15% 2041/13907 [1:17:06<5:24:31,  1.64s/it][A
Training...:  15% 2042/13907 [1:17:07<5:18:14,  1.61s/it][A
Training...:  15% 2043/13907 [1:17:09<5:11:40,  1.58s/it][A
Training...:  15% 2044/13907 [1:17:10<5:03:25,  1.53s/it][A
Training...:  15% 2045/13907 [1:17:12<4:55:29,  1.49s/it][A
Training...:  15% 2046/13907 [1:17:13<4:46:15,  1.45s/it][A
Training...:  15% 2047/13907 [1:17:14<4:36:27,  1.40s/it][A
Training...:  15% 2048/13907 [1:17:15<4:25:32,  1.34s/it][A
Training...:  15% 2049/13907 [1:17:17<4:13:28,  1.28s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:17:30<?, ?it/s]
Training...:  15% 2049/13907 [1:17:18<4:13:28,  1.28s/it][A
Training...:  15% 2050/13907 [1:17:18<4:09:35,  1.26s/it][A
Training...:  15% 2051/13907 [1:17:21<6:25:32,  1.95s/it][A
Training...:  15% 2052/13907 [1:17:25<7:48:01,  2.37s/it][A
Training...:  15% 2053/13907 [1:17:28<8:40:56,  2.64s/it][A
Training...:  15% 2054/13907 [1:17:31<9:05:49,  2.76s/it][A
Training...:  15% 2055/13907 [1:17:34<9:17:08,  2.82s/it][A
Training...:  15% 2056/13907 [1:17:37<9:19:08,  2.83s/it][A
Training...:  15% 2057/13907 [1:17:40<9:14:54,  2.81s/it][A
Training...:  15% 2058/13907 [1:17:42<9:10:09,  2.79s/it][A
Training...:  15% 2059/13907 [1:17:45<9:04:43,  2.76s/it][A
Training...:  15% 2060/13907 [1:17:48<8:55:26,  2.71s/it][A
Training...:  15% 2061/13907 [1:17:50<8:48:10,  2.68s/it][A
Training...:  15% 2062/13907 [1:17:53<8:38:54,  2.63s/it][A
Training...:  15% 2063/13907 [1:17:55<8:30:07,  2.58s/it][A
Training...:  15% 2064/13907 [1:17:58<8:20:04,  2.53s/it][A
Training...:  15% 2065/13907 [1:18:00<8:12:41,  2.50s/it][A
Training...:  15% 2066/13907 [1:18:02<8:03:26,  2.45s/it][A
Training...:  15% 2067/13907 [1:18:05<7:57:09,  2.42s/it][A
Training...:  15% 2068/13907 [1:18:07<7:51:33,  2.39s/it][A
Training...:  15% 2069/13907 [1:18:09<7:47:09,  2.37s/it][A
Training...:  15% 2070/13907 [1:18:12<7:39:47,  2.33s/it][A
Training...:  15% 2071/13907 [1:18:14<7:33:08,  2.30s/it][A
Training...:  15% 2072/13907 [1:18:16<7:27:00,  2.27s/it][A
Training...:  15% 2073/13907 [1:18:18<7:20:45,  2.23s/it][A
Training...:  15% 2074/13907 [1:18:20<7:13:17,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:18:35<?, ?it/s]
Training...:  15% 2074/13907 [1:18:23<7:13:17,  2.20s/it][A
Training...:  15% 2075/13907 [1:18:23<7:26:20,  2.26s/it][A
Training...:  15% 2076/13907 [1:18:25<7:17:05,  2.22s/it][A
Training...:  15% 2077/13907 [1:18:27<7:05:40,  2.16s/it][A
Training...:  15% 2078/13907 [1:18:29<6:55:58,  2.11s/it][A
Training...:  15% 2079/13907 [1:18:31<6:46:50,  2.06s/it][A
Training...:  15% 2080/13907 [1:18:33<6:39:18,  2.03s/it][A
Training...:  15% 2081/13907 [1:18:35<6:32:08,  1.99s/it][A
Training...:  15% 2082/13907 [1:18:37<6:25:49,  1.96s/it][A
Training...:  15% 2083/13907 [1:18:38<6:20:11,  1.93s/it][A
Training...:  15% 2084/13907 [1:18:40<6:14:33,  1.90s/it][A
Training...:  15% 2085/13907 [1:18:42<6:07:15,  1.86s/it][A
Training...:  15% 2086/13907 [1:18:44<6:01:19,  1.83s/it][A
Training...:  15% 2087/13907 [1:18:45<5:55:40,  1.81s/it][A
Training...:  15% 2088/13907 [1:18:47<5:48:15,  1.77s/it][A
Training...:  15% 2089/13907 [1:18:49<5:44:07,  1.75s/it][A
Training...:  15% 2090/13907 [1:18:50<5:36:12,  1.71s/it][A
Training...:  15% 2091/13907 [1:18:52<5:28:45,  1.67s/it][A
Training...:  15% 2092/13907 [1:18:54<5:23:20,  1.64s/it][A
Training...:  15% 2093/13907 [1:18:55<5:16:26,  1.61s/it][A
Training...:  15% 2094/13907 [1:18:57<5:08:04,  1.56s/it][A
Training...:  15% 2095/13907 [1:18:58<4:59:35,  1.52s/it][A
Training...:  15% 2096/13907 [1:18:59<4:48:53,  1.47s/it][A
Training...:  15% 2097/13907 [1:19:01<4:37:46,  1.41s/it][A
Training...:  15% 2098/13907 [1:19:02<4:26:30,  1.35s/it][A
Training...:  15% 2099/13907 [1:19:03<4:13:55,  1.29s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:19:17<?, ?it/s]
Training...:  15% 2099/13907 [1:19:04<4:13:55,  1.29s/it][A
Training...:  15% 2100/13907 [1:19:04<4:07:07,  1.26s/it][A
Training...:  15% 2101/13907 [1:19:08<6:29:12,  1.98s/it][A
Training...:  15% 2102/13907 [1:19:11<7:51:59,  2.40s/it][A
Training...:  15% 2103/13907 [1:19:14<8:41:50,  2.65s/it][A
Training...:  15% 2104/13907 [1:19:18<9:04:45,  2.77s/it][A
Training...:  15% 2105/13907 [1:19:20<9:13:46,  2.82s/it][A
Training...:  15% 2106/13907 [1:19:23<9:15:33,  2.82s/it][A
Training...:  15% 2107/13907 [1:19:26<9:11:59,  2.81s/it][A
Training...:  15% 2108/13907 [1:19:29<9:05:15,  2.77s/it][A
Training...:  15% 2109/13907 [1:19:31<8:59:03,  2.74s/it][A
Training...:  15% 2110/13907 [1:19:34<8:49:42,  2.69s/it][A
Training...:  15% 2111/13907 [1:19:37<8:42:02,  2.66s/it][A
Training...:  15% 2112/13907 [1:19:39<8:33:19,  2.61s/it][A
Training...:  15% 2113/13907 [1:19:42<8:25:37,  2.57s/it][A
Training...:  15% 2114/13907 [1:19:44<8:15:20,  2.52s/it][A
Training...:  15% 2115/13907 [1:19:46<8:07:27,  2.48s/it][A
Training...:  15% 2116/13907 [1:19:49<7:58:35,  2.44s/it][A
Training...:  15% 2117/13907 [1:19:51<7:50:54,  2.40s/it][A
Training...:  15% 2118/13907 [1:19:53<7:44:40,  2.36s/it][A
Training...:  15% 2119/13907 [1:19:56<7:37:18,  2.33s/it][A
Training...:  15% 2120/13907 [1:19:58<7:29:19,  2.29s/it][A
Training...:  15% 2121/13907 [1:20:00<7:23:26,  2.26s/it][A
Training...:  15% 2122/13907 [1:20:02<7:14:46,  2.21s/it][A
Training...:  15% 2123/13907 [1:20:04<7:08:56,  2.18s/it][A
Training...:  15% 2124/13907 [1:20:06<7:02:44,  2.15s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:20:21<?, ?it/s]
Training...:  15% 2124/13907 [1:20:09<7:02:44,  2.15s/it][A
Training...:  15% 2125/13907 [1:20:09<7:14:19,  2.21s/it][A
Training...:  15% 2126/13907 [1:20:11<7:04:59,  2.16s/it][A
Training...:  15% 2127/13907 [1:20:13<6:55:13,  2.11s/it][A
Training...:  15% 2128/13907 [1:20:15<6:47:03,  2.07s/it][A
Training...:  15% 2129/13907 [1:20:17<6:39:44,  2.04s/it][A
Training...:  15% 2130/13907 [1:20:19<6:37:11,  2.02s/it][A
Training...:  15% 2131/13907 [1:20:20<6:33:05,  2.00s/it][A
Training...:  15% 2132/13907 [1:20:22<6:24:31,  1.96s/it][A
Training...:  15% 2133/13907 [1:20:24<6:18:55,  1.93s/it][A
Training...:  15% 2134/13907 [1:20:26<6:11:27,  1.89s/it][A
Training...:  15% 2135/13907 [1:20:28<6:05:15,  1.86s/it][A
Training...:  15% 2136/13907 [1:20:30<5:59:41,  1.83s/it][A
Training...:  15% 2137/13907 [1:20:31<5:54:01,  1.80s/it][A
Training...:  15% 2138/13907 [1:20:33<5:49:04,  1.78s/it][A
Training...:  15% 2139/13907 [1:20:35<5:44:11,  1.75s/it][A
Training...:  15% 2140/13907 [1:20:36<5:37:19,  1.72s/it][A
Training...:  15% 2141/13907 [1:20:38<5:30:47,  1.69s/it][A
Training...:  15% 2142/13907 [1:20:40<5:22:38,  1.65s/it][A
Training...:  15% 2143/13907 [1:20:41<5:16:03,  1.61s/it][A
Training...:  15% 2144/13907 [1:20:43<5:08:55,  1.58s/it][A
Training...:  15% 2145/13907 [1:20:44<5:00:12,  1.53s/it][A
Training...:  15% 2146/13907 [1:20:45<4:52:03,  1.49s/it][A
Training...:  15% 2147/13907 [1:20:47<4:41:39,  1.44s/it][A
Training...:  15% 2148/13907 [1:20:48<4:29:59,  1.38s/it][A
Training...:  15% 2149/13907 [1:20:49<4:17:36,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:21:03<?, ?it/s]
Training...:  15% 2149/13907 [1:20:50<4:17:36,  1.31s/it][A
Training...:  15% 2150/13907 [1:20:50<4:12:35,  1.29s/it][A
Training...:  15% 2151/13907 [1:20:54<6:40:46,  2.05s/it][A
Training...:  15% 2152/13907 [1:20:58<8:03:25,  2.47s/it][A
Training...:  15% 2153/13907 [1:21:01<8:43:05,  2.67s/it][A
Training...:  15% 2154/13907 [1:21:04<9:05:08,  2.78s/it][A
Training...:  15% 2155/13907 [1:21:07<9:13:59,  2.83s/it][A
Training...:  16% 2156/13907 [1:21:10<9:18:16,  2.85s/it][A
Training...:  16% 2157/13907 [1:21:12<9:15:04,  2.83s/it][A
Training...:  16% 2158/13907 [1:21:15<9:08:22,  2.80s/it][A
Training...:  16% 2159/13907 [1:21:18<9:01:49,  2.77s/it][A
Training...:  16% 2160/13907 [1:21:20<8:56:07,  2.74s/it][A
Training...:  16% 2161/13907 [1:21:23<8:50:32,  2.71s/it][A
Training...:  16% 2162/13907 [1:21:26<8:42:39,  2.67s/it][A
Training...:  16% 2163/13907 [1:21:28<8:31:29,  2.61s/it][A
Training...:  16% 2164/13907 [1:21:31<8:20:38,  2.56s/it][A
Training...:  16% 2165/13907 [1:21:33<8:11:00,  2.51s/it][A
Training...:  16% 2166/13907 [1:21:35<8:02:31,  2.47s/it][A
Training...:  16% 2167/13907 [1:21:38<7:55:05,  2.43s/it][A
Training...:  16% 2168/13907 [1:21:40<7:47:20,  2.39s/it][A
Training...:  16% 2169/13907 [1:21:42<7:41:49,  2.36s/it][A
Training...:  16% 2170/13907 [1:21:45<7:33:38,  2.32s/it][A
Training...:  16% 2171/13907 [1:21:47<7:27:29,  2.29s/it][A
Training...:  16% 2172/13907 [1:21:49<7:21:33,  2.26s/it][A
Training...:  16% 2173/13907 [1:21:51<7:15:34,  2.23s/it][A
Training...:  16% 2174/13907 [1:21:53<7:08:32,  2.19s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:22:08<?, ?it/s]
Training...:  16% 2174/13907 [1:21:56<7:08:32,  2.19s/it][A
Training...:  16% 2175/13907 [1:21:56<7:20:39,  2.25s/it][A
Training...:  16% 2176/13907 [1:21:58<7:11:43,  2.21s/it][A
Training...:  16% 2177/13907 [1:22:00<7:00:41,  2.15s/it][A
Training...:  16% 2178/13907 [1:22:02<6:52:46,  2.11s/it][A
Training...:  16% 2179/13907 [1:22:04<6:44:17,  2.07s/it][A
Training...:  16% 2180/13907 [1:22:06<6:35:47,  2.02s/it][A
Training...:  16% 2181/13907 [1:22:08<6:30:11,  2.00s/it][A
Training...:  16% 2182/13907 [1:22:09<6:23:15,  1.96s/it][A
Training...:  16% 2183/13907 [1:22:11<6:17:23,  1.93s/it][A
Training...:  16% 2184/13907 [1:22:13<6:11:19,  1.90s/it][A
Training...:  16% 2185/13907 [1:22:15<6:06:25,  1.88s/it][A
Training...:  16% 2186/13907 [1:22:17<6:01:36,  1.85s/it][A
Training...:  16% 2187/13907 [1:22:18<5:54:51,  1.82s/it][A
Training...:  16% 2188/13907 [1:22:20<5:47:28,  1.78s/it][A
Training...:  16% 2189/13907 [1:22:22<5:41:23,  1.75s/it][A
Training...:  16% 2190/13907 [1:22:23<5:32:55,  1.70s/it][A
Training...:  16% 2191/13907 [1:22:25<5:26:34,  1.67s/it][A
Training...:  16% 2192/13907 [1:22:27<5:18:39,  1.63s/it][A
Training...:  16% 2193/13907 [1:22:28<5:11:34,  1.60s/it][A
Training...:  16% 2194/13907 [1:22:30<5:03:38,  1.56s/it][A
Training...:  16% 2195/13907 [1:22:31<4:56:12,  1.52s/it][A
Training...:  16% 2196/13907 [1:22:32<4:46:41,  1.47s/it][A
Training...:  16% 2197/13907 [1:22:34<4:37:28,  1.42s/it][A
Training...:  16% 2198/13907 [1:22:35<4:27:43,  1.37s/it][A
Training...:  16% 2199/13907 [1:22:36<4:14:53,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:22:50<?, ?it/s]
Training...:  16% 2199/13907 [1:22:37<4:14:53,  1.31s/it][A
Training...:  16% 2200/13907 [1:22:37<4:09:19,  1.28s/it][A
Training...:  16% 2201/13907 [1:22:41<6:24:33,  1.97s/it][A
Training...:  16% 2202/13907 [1:22:44<7:42:53,  2.37s/it][A
Training...:  16% 2203/13907 [1:22:47<8:26:06,  2.59s/it][A
Training...:  16% 2204/13907 [1:22:50<8:52:48,  2.73s/it][A
Training...:  16% 2205/13907 [1:22:53<9:07:19,  2.81s/it][A
Training...:  16% 2206/13907 [1:22:56<9:10:00,  2.82s/it][A
Training...:  16% 2207/13907 [1:22:59<9:07:12,  2.81s/it][A
Training...:  16% 2208/13907 [1:23:02<9:00:18,  2.77s/it][A
Training...:  16% 2209/13907 [1:23:04<8:50:08,  2.72s/it][A
Training...:  16% 2210/13907 [1:23:07<8:41:29,  2.67s/it][A
Training...:  16% 2211/13907 [1:23:09<8:35:50,  2.65s/it][A
Training...:  16% 2212/13907 [1:23:12<8:27:16,  2.60s/it][A
Training...:  16% 2213/13907 [1:23:14<8:19:13,  2.56s/it][A
Training...:  16% 2214/13907 [1:23:17<8:09:17,  2.51s/it][A
Training...:  16% 2215/13907 [1:23:19<8:01:34,  2.47s/it][A
Training...:  16% 2216/13907 [1:23:21<7:53:51,  2.43s/it][A
Training...:  16% 2217/13907 [1:23:24<7:45:35,  2.39s/it][A
Training...:  16% 2218/13907 [1:23:26<7:40:29,  2.36s/it][A
Training...:  16% 2219/13907 [1:23:28<7:32:21,  2.32s/it][A
Training...:  16% 2220/13907 [1:23:30<7:25:53,  2.29s/it][A
Training...:  16% 2221/13907 [1:23:33<7:21:29,  2.27s/it][A
Training...:  16% 2222/13907 [1:23:35<7:14:24,  2.23s/it][A
Training...:  16% 2223/13907 [1:23:37<7:08:35,  2.20s/it][A
Training...:  16% 2224/13907 [1:23:39<7:02:09,  2.17s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:23:54<?, ?it/s]
Training...:  16% 2224/13907 [1:23:42<7:02:09,  2.17s/it][A
Training...:  16% 2225/13907 [1:23:42<7:17:37,  2.25s/it][A
Training...:  16% 2226/13907 [1:23:44<7:07:23,  2.20s/it][A
Training...:  16% 2227/13907 [1:23:46<6:58:42,  2.15s/it][A
Training...:  16% 2228/13907 [1:23:48<6:47:06,  2.09s/it][A
Training...:  16% 2229/13907 [1:23:50<6:38:50,  2.05s/it][A
Training...:  16% 2230/13907 [1:23:51<6:30:42,  2.01s/it][A
Training...:  16% 2231/13907 [1:23:53<6:23:00,  1.97s/it][A
Training...:  16% 2232/13907 [1:23:55<6:15:28,  1.93s/it][A
Training...:  16% 2233/13907 [1:23:57<6:10:40,  1.91s/it][A
Training...:  16% 2234/13907 [1:23:59<6:04:44,  1.87s/it][A
Training...:  16% 2235/13907 [1:24:01<5:58:47,  1.84s/it][A
Training...:  16% 2236/13907 [1:24:02<5:52:22,  1.81s/it][A
Training...:  16% 2237/13907 [1:24:04<5:47:00,  1.78s/it][A
Training...:  16% 2238/13907 [1:24:06<5:40:37,  1.75s/it][A
Training...:  16% 2239/13907 [1:24:07<5:34:59,  1.72s/it][A
Training...:  16% 2240/13907 [1:24:09<5:28:37,  1.69s/it][A
Training...:  16% 2241/13907 [1:24:11<5:22:10,  1.66s/it][A
Training...:  16% 2242/13907 [1:24:12<5:13:56,  1.61s/it][A
Training...:  16% 2243/13907 [1:24:14<5:06:16,  1.58s/it][A
Training...:  16% 2244/13907 [1:24:15<4:58:35,  1.54s/it][A
Training...:  16% 2245/13907 [1:24:16<4:49:05,  1.49s/it][A
Training...:  16% 2246/13907 [1:24:18<4:40:50,  1.45s/it][A
Training...:  16% 2247/13907 [1:24:19<4:30:47,  1.39s/it][A
Training...:  16% 2248/13907 [1:24:20<4:19:51,  1.34s/it][A
Training...:  16% 2249/13907 [1:24:21<4:08:03,  1.28s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:24:35<?, ?it/s]
Training...:  16% 2249/13907 [1:24:23<4:08:03,  1.28s/it][A
Training...:  16% 2250/13907 [1:24:23<4:04:59,  1.26s/it][A
Training...:  16% 2251/13907 [1:24:26<6:26:22,  1.99s/it][A
Training...:  16% 2252/13907 [1:24:30<7:44:01,  2.39s/it][A
Training...:  16% 2253/13907 [1:24:33<8:29:25,  2.62s/it][A
Training...:  16% 2254/13907 [1:24:36<8:51:36,  2.74s/it][A
Training...:  16% 2255/13907 [1:24:39<9:02:20,  2.79s/it][A
Training...:  16% 2256/13907 [1:24:42<9:08:17,  2.82s/it][A
Training...:  16% 2257/13907 [1:24:44<9:08:45,  2.83s/it][A
Training...:  16% 2258/13907 [1:24:47<9:00:24,  2.78s/it][A
Training...:  16% 2259/13907 [1:24:50<8:51:44,  2.74s/it][A
Training...:  16% 2260/13907 [1:24:52<8:41:43,  2.69s/it][A
Training...:  16% 2261/13907 [1:24:55<8:35:11,  2.65s/it][A
Training...:  16% 2262/13907 [1:24:57<8:26:27,  2.61s/it][A
Training...:  16% 2263/13907 [1:25:00<8:15:58,  2.56s/it][A
Training...:  16% 2264/13907 [1:25:02<8:06:07,  2.51s/it][A
Training...:  16% 2265/13907 [1:25:05<7:58:29,  2.47s/it][A
Training...:  16% 2266/13907 [1:25:07<7:49:06,  2.42s/it][A
Training...:  16% 2267/13907 [1:25:09<7:43:22,  2.39s/it][A
Training...:  16% 2268/13907 [1:25:11<7:34:54,  2.35s/it][A
Training...:  16% 2269/13907 [1:25:14<7:29:41,  2.32s/it][A
Training...:  16% 2270/13907 [1:25:16<7:22:48,  2.28s/it][A
Training...:  16% 2271/13907 [1:25:18<7:14:54,  2.24s/it][A
Training...:  16% 2272/13907 [1:25:20<7:08:09,  2.21s/it][A
Training...:  16% 2273/13907 [1:25:22<7:00:43,  2.17s/it][A
Training...:  16% 2274/13907 [1:25:24<6:53:11,  2.13s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:25:39<?, ?it/s]
Training...:  16% 2274/13907 [1:25:27<6:53:11,  2.13s/it][A
Training...:  16% 2275/13907 [1:25:27<7:04:39,  2.19s/it][A
Training...:  16% 2276/13907 [1:25:29<6:56:23,  2.15s/it][A
Training...:  16% 2277/13907 [1:25:31<6:44:55,  2.09s/it][A
Training...:  16% 2278/13907 [1:25:33<6:38:27,  2.06s/it][A
Training...:  16% 2279/13907 [1:25:34<6:29:34,  2.01s/it][A
Training...:  16% 2280/13907 [1:25:36<6:21:45,  1.97s/it][A
Training...:  16% 2281/13907 [1:25:38<6:14:53,  1.93s/it][A
Training...:  16% 2282/13907 [1:25:40<6:08:14,  1.90s/it][A
Training...:  16% 2283/13907 [1:25:42<6:03:14,  1.87s/it][A
Training...:  16% 2284/13907 [1:25:44<5:56:38,  1.84s/it][A
Training...:  16% 2285/13907 [1:25:45<5:51:48,  1.82s/it][A
Training...:  16% 2286/13907 [1:25:47<5:46:10,  1.79s/it][A
Training...:  16% 2287/13907 [1:25:49<5:39:56,  1.76s/it][A
Training...:  16% 2288/13907 [1:25:50<5:33:29,  1.72s/it][A
Training...:  16% 2289/13907 [1:25:52<5:27:07,  1.69s/it][A
Training...:  16% 2290/13907 [1:25:54<5:20:36,  1.66s/it][A
Training...:  16% 2291/13907 [1:25:55<5:15:26,  1.63s/it][A
Training...:  16% 2292/13907 [1:25:57<5:08:40,  1.59s/it][A
Training...:  16% 2293/13907 [1:25:58<5:03:44,  1.57s/it][A
Training...:  16% 2294/13907 [1:26:00<4:59:17,  1.55s/it][A
Training...:  17% 2295/13907 [1:26:01<4:51:17,  1.51s/it][A
Training...:  17% 2296/13907 [1:26:02<4:42:30,  1.46s/it][A
Training...:  17% 2297/13907 [1:26:04<4:33:11,  1.41s/it][A
Training...:  17% 2298/13907 [1:26:05<4:24:43,  1.37s/it][A
Training...:  17% 2299/13907 [1:26:06<4:10:53,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:26:20<?, ?it/s]
Training...:  17% 2299/13907 [1:26:07<4:10:53,  1.30s/it][A
Training...:  17% 2300/13907 [1:26:07<4:05:24,  1.27s/it][A
Training...:  17% 2301/13907 [1:26:11<6:33:21,  2.03s/it][A
Training...:  17% 2302/13907 [1:26:15<7:53:43,  2.45s/it][A
Training...:  17% 2303/13907 [1:26:18<8:38:43,  2.68s/it][A
Training...:  17% 2304/13907 [1:26:21<9:00:42,  2.80s/it][A
Training...:  17% 2305/13907 [1:26:24<9:08:42,  2.84s/it][A
Training...:  17% 2306/13907 [1:26:27<9:09:54,  2.84s/it][A
Training...:  17% 2307/13907 [1:26:29<9:07:42,  2.83s/it][A
Training...:  17% 2308/13907 [1:26:32<9:00:22,  2.80s/it][A
Training...:  17% 2309/13907 [1:26:35<8:54:05,  2.76s/it][A
Training...:  17% 2310/13907 [1:26:37<8:44:54,  2.72s/it][A
Training...:  17% 2311/13907 [1:26:40<8:35:22,  2.67s/it][A
Training...:  17% 2312/13907 [1:26:43<8:25:14,  2.61s/it][A
Training...:  17% 2313/13907 [1:26:45<8:17:12,  2.57s/it][A
Training...:  17% 2314/13907 [1:26:47<8:07:17,  2.52s/it][A
Training...:  17% 2315/13907 [1:26:50<7:59:56,  2.48s/it][A
Training...:  17% 2316/13907 [1:26:52<7:51:22,  2.44s/it][A
Training...:  17% 2317/13907 [1:26:54<7:44:56,  2.41s/it][A
Training...:  17% 2318/13907 [1:26:57<7:36:29,  2.36s/it][A
Training...:  17% 2319/13907 [1:26:59<7:30:09,  2.33s/it][A
Training...:  17% 2320/13907 [1:27:01<7:25:18,  2.31s/it][A
Training...:  17% 2321/13907 [1:27:03<7:19:12,  2.27s/it][A
Training...:  17% 2322/13907 [1:27:06<7:11:23,  2.23s/it][A
Training...:  17% 2323/13907 [1:27:08<7:04:52,  2.20s/it][A
Training...:  17% 2324/13907 [1:27:10<6:59:07,  2.17s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:27:25<?, ?it/s]
Training...:  17% 2324/13907 [1:27:12<6:59:07,  2.17s/it][A
Training...:  17% 2325/13907 [1:27:12<7:11:09,  2.23s/it][A
Training...:  17% 2326/13907 [1:27:14<7:00:59,  2.18s/it][A
Training...:  17% 2327/13907 [1:27:16<6:50:28,  2.13s/it][A
Training...:  17% 2328/13907 [1:27:18<6:41:38,  2.08s/it][A
Training...:  17% 2329/13907 [1:27:20<6:35:47,  2.05s/it][A
Training...:  17% 2330/13907 [1:27:22<6:27:44,  2.01s/it][A
Training...:  17% 2331/13907 [1:27:24<6:20:17,  1.97s/it][A
Training...:  17% 2332/13907 [1:27:26<6:14:37,  1.94s/it][A
Training...:  17% 2333/13907 [1:27:28<6:09:24,  1.92s/it][A
Training...:  17% 2334/13907 [1:27:30<6:04:12,  1.89s/it][A
Training...:  17% 2335/13907 [1:27:31<5:58:36,  1.86s/it][A
Training...:  17% 2336/13907 [1:27:33<5:52:48,  1.83s/it][A
Training...:  17% 2337/13907 [1:27:35<5:46:57,  1.80s/it][A
Training...:  17% 2338/13907 [1:27:37<5:40:40,  1.77s/it][A
Training...:  17% 2339/13907 [1:27:38<5:33:31,  1.73s/it][A
Training...:  17% 2340/13907 [1:27:40<5:26:16,  1.69s/it][A
Training...:  17% 2341/13907 [1:27:41<5:18:57,  1.65s/it][A
Training...:  17% 2342/13907 [1:27:43<5:10:59,  1.61s/it][A
Training...:  17% 2343/13907 [1:27:44<5:03:41,  1.58s/it][A
Training...:  17% 2344/13907 [1:27:46<4:56:00,  1.54s/it][A
Training...:  17% 2345/13907 [1:27:47<4:47:48,  1.49s/it][A
Training...:  17% 2346/13907 [1:27:49<4:39:34,  1.45s/it][A
Training...:  17% 2347/13907 [1:27:50<4:30:59,  1.41s/it][A
Training...:  17% 2348/13907 [1:27:51<4:20:00,  1.35s/it][A
Training...:  17% 2349/13907 [1:27:52<4:07:28,  1.28s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:28:06<?, ?it/s]
Training...:  17% 2349/13907 [1:27:53<4:07:28,  1.28s/it][A
Training...:  17% 2350/13907 [1:27:53<4:01:29,  1.25s/it][A
Training...:  17% 2351/13907 [1:27:57<6:18:17,  1.96s/it][A
Training...:  17% 2352/13907 [1:28:00<7:35:12,  2.36s/it][A
Training...:  17% 2353/13907 [1:28:03<8:18:31,  2.59s/it][A
Training...:  17% 2354/13907 [1:28:06<8:46:41,  2.74s/it][A
Training...:  17% 2355/13907 [1:28:09<8:59:08,  2.80s/it][A
Training...:  17% 2356/13907 [1:28:12<8:58:27,  2.80s/it][A
Training...:  17% 2357/13907 [1:28:15<8:56:05,  2.78s/it][A
Training...:  17% 2358/13907 [1:28:18<8:48:53,  2.75s/it][A
Training...:  17% 2359/13907 [1:28:20<8:40:40,  2.71s/it][A
Training...:  17% 2360/13907 [1:28:23<8:30:46,  2.65s/it][A
Training...:  17% 2361/13907 [1:28:25<8:23:04,  2.61s/it][A
Training...:  17% 2362/13907 [1:28:28<8:13:43,  2.57s/it][A
Training...:  17% 2363/13907 [1:28:30<8:07:31,  2.53s/it][A
Training...:  17% 2364/13907 [1:28:33<8:00:07,  2.50s/it][A
Training...:  17% 2365/13907 [1:28:35<7:52:51,  2.46s/it][A
Training...:  17% 2366/13907 [1:28:37<7:44:56,  2.42s/it][A
Training...:  17% 2367/13907 [1:28:40<7:40:17,  2.39s/it][A
Training...:  17% 2368/13907 [1:28:42<7:32:54,  2.36s/it][A
Training...:  17% 2369/13907 [1:28:44<7:28:27,  2.33s/it][A
Training...:  17% 2370/13907 [1:28:46<7:23:31,  2.31s/it][A
Training...:  17% 2371/13907 [1:28:49<7:17:47,  2.28s/it][A
Training...:  17% 2372/13907 [1:28:51<7:14:09,  2.26s/it][A
Training...:  17% 2373/13907 [1:28:53<7:09:04,  2.23s/it][A
Training...:  17% 2374/13907 [1:28:55<7:02:39,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:29:10<?, ?it/s]
Training...:  17% 2374/13907 [1:28:58<7:02:39,  2.20s/it][A
Training...:  17% 2375/13907 [1:28:58<7:16:29,  2.27s/it][A
Training...:  17% 2376/13907 [1:29:00<7:08:06,  2.23s/it][A
Training...:  17% 2377/13907 [1:29:02<6:57:09,  2.17s/it][A
Training...:  17% 2378/13907 [1:29:04<6:46:29,  2.12s/it][A
Training...:  17% 2379/13907 [1:29:06<6:36:19,  2.06s/it][A
Training...:  17% 2380/13907 [1:29:08<6:27:48,  2.02s/it][A
Training...:  17% 2381/13907 [1:29:09<6:21:30,  1.99s/it][A
Training...:  17% 2382/13907 [1:29:11<6:13:47,  1.95s/it][A
Training...:  17% 2383/13907 [1:29:13<6:07:19,  1.91s/it][A
Training...:  17% 2384/13907 [1:29:15<6:00:31,  1.88s/it][A
Training...:  17% 2385/13907 [1:29:17<5:56:26,  1.86s/it][A
Training...:  17% 2386/13907 [1:29:19<5:50:48,  1.83s/it][A
Training...:  17% 2387/13907 [1:29:20<5:45:29,  1.80s/it][A
Training...:  17% 2388/13907 [1:29:22<5:39:57,  1.77s/it][A
Training...:  17% 2389/13907 [1:29:24<5:32:10,  1.73s/it][A
Training...:  17% 2390/13907 [1:29:25<5:25:40,  1.70s/it][A
Training...:  17% 2391/13907 [1:29:27<5:19:05,  1.66s/it][A
Training...:  17% 2392/13907 [1:29:28<5:10:48,  1.62s/it][A
Training...:  17% 2393/13907 [1:29:30<5:03:26,  1.58s/it][A
Training...:  17% 2394/13907 [1:29:31<4:56:55,  1.55s/it][A
Training...:  17% 2395/13907 [1:29:33<4:47:05,  1.50s/it][A
Training...:  17% 2396/13907 [1:29:34<4:37:29,  1.45s/it][A
Training...:  17% 2397/13907 [1:29:35<4:26:23,  1.39s/it][A
Training...:  17% 2398/13907 [1:29:36<4:15:39,  1.33s/it][A
Training...:  17% 2399/13907 [1:29:38<4:03:25,  1.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:29:51<?, ?it/s]
Training...:  17% 2399/13907 [1:29:39<4:03:25,  1.27s/it][A
Training...:  17% 2400/13907 [1:29:39<3:57:43,  1.24s/it][A
Training...:  17% 2401/13907 [1:29:42<6:15:50,  1.96s/it][A
Training...:  17% 2402/13907 [1:29:46<7:36:44,  2.38s/it][A
Training...:  17% 2403/13907 [1:29:49<8:22:48,  2.62s/it][A
Training...:  17% 2404/13907 [1:29:52<8:47:58,  2.75s/it][A
Training...:  17% 2405/13907 [1:29:55<9:00:15,  2.82s/it][A
Training...:  17% 2406/13907 [1:29:58<9:01:20,  2.82s/it][A
Training...:  17% 2407/13907 [1:30:01<8:56:43,  2.80s/it][A
Training...:  17% 2408/13907 [1:30:03<8:50:16,  2.77s/it][A
Training...:  17% 2409/13907 [1:30:06<8:43:26,  2.73s/it][A
Training...:  17% 2410/13907 [1:30:08<8:34:28,  2.68s/it][A
Training...:  17% 2411/13907 [1:30:11<8:27:35,  2.65s/it][A
Training...:  17% 2412/13907 [1:30:14<8:18:17,  2.60s/it][A
Training...:  17% 2413/13907 [1:30:16<8:15:26,  2.59s/it][A
Training...:  17% 2414/13907 [1:30:19<8:07:50,  2.55s/it][A
Training...:  17% 2415/13907 [1:30:21<8:01:22,  2.51s/it][A
Training...:  17% 2416/13907 [1:30:23<7:53:29,  2.47s/it][A
Training...:  17% 2417/13907 [1:30:26<7:46:35,  2.44s/it][A
Training...:  17% 2418/13907 [1:30:28<7:38:03,  2.39s/it][A
Training...:  17% 2419/13907 [1:30:30<7:31:27,  2.36s/it][A
Training...:  17% 2420/13907 [1:30:32<7:23:56,  2.32s/it][A
Training...:  17% 2421/13907 [1:30:35<7:17:16,  2.28s/it][A
Training...:  17% 2422/13907 [1:30:37<7:09:15,  2.24s/it][A
Training...:  17% 2423/13907 [1:30:39<7:03:30,  2.21s/it][A
Training...:  17% 2424/13907 [1:30:41<6:56:27,  2.18s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:30:56<?, ?it/s]
Training...:  17% 2424/13907 [1:30:43<6:56:27,  2.18s/it][A
Training...:  17% 2425/13907 [1:30:43<7:07:41,  2.23s/it][A
Training...:  17% 2426/13907 [1:30:46<6:58:57,  2.19s/it][A
Training...:  17% 2427/13907 [1:30:48<6:49:55,  2.14s/it][A
Training...:  17% 2428/13907 [1:30:50<6:42:19,  2.10s/it][A
Training...:  17% 2429/13907 [1:30:52<6:37:17,  2.08s/it][A
Training...:  17% 2430/13907 [1:30:54<6:31:09,  2.04s/it][A
Training...:  17% 2431/13907 [1:30:55<6:24:27,  2.01s/it][A
Training...:  17% 2432/13907 [1:30:57<6:16:54,  1.97s/it][A
Training...:  17% 2433/13907 [1:30:59<6:10:25,  1.94s/it][A
Training...:  18% 2434/13907 [1:31:01<6:03:29,  1.90s/it][A
Training...:  18% 2435/13907 [1:31:03<5:58:04,  1.87s/it][A
Training...:  18% 2436/13907 [1:31:05<5:50:24,  1.83s/it][A
Training...:  18% 2437/13907 [1:31:06<5:44:39,  1.80s/it][A
Training...:  18% 2438/13907 [1:31:08<5:39:31,  1.78s/it][A
Training...:  18% 2439/13907 [1:31:10<5:34:50,  1.75s/it][A
Training...:  18% 2440/13907 [1:31:11<5:28:47,  1.72s/it][A
Training...:  18% 2441/13907 [1:31:13<5:22:34,  1.69s/it][A
Training...:  18% 2442/13907 [1:31:15<5:14:14,  1.64s/it][A
Training...:  18% 2443/13907 [1:31:16<5:08:15,  1.61s/it][A
Training...:  18% 2444/13907 [1:31:18<5:01:03,  1.58s/it][A
Training...:  18% 2445/13907 [1:31:19<4:52:40,  1.53s/it][A
Training...:  18% 2446/13907 [1:31:20<4:43:20,  1.48s/it][A
Training...:  18% 2447/13907 [1:31:22<4:34:44,  1.44s/it][A
Training...:  18% 2448/13907 [1:31:23<4:24:01,  1.38s/it][A
Training...:  18% 2449/13907 [1:31:24<4:10:58,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:31:38<?, ?it/s]
Training...:  18% 2449/13907 [1:31:25<4:10:58,  1.31s/it][A
Training...:  18% 2450/13907 [1:31:25<4:05:13,  1.28s/it][A
Training...:  18% 2451/13907 [1:31:29<6:25:14,  2.02s/it][A
Training...:  18% 2452/13907 [1:31:32<7:43:07,  2.43s/it][A
Training...:  18% 2453/13907 [1:31:36<8:26:00,  2.65s/it][A
Training...:  18% 2454/13907 [1:31:39<8:52:33,  2.79s/it][A
Training...:  18% 2455/13907 [1:31:42<9:00:08,  2.83s/it][A
Training...:  18% 2456/13907 [1:31:44<9:01:20,  2.84s/it][A
Training...:  18% 2457/13907 [1:31:47<8:55:07,  2.80s/it][A
Training...:  18% 2458/13907 [1:31:50<8:47:31,  2.76s/it][A
Training...:  18% 2459/13907 [1:31:53<8:39:04,  2.72s/it][A
Training...:  18% 2460/13907 [1:31:55<8:30:01,  2.67s/it][A
Training...:  18% 2461/13907 [1:31:58<8:21:53,  2.63s/it][A
Training...:  18% 2462/13907 [1:32:00<8:13:19,  2.59s/it][A
Training...:  18% 2463/13907 [1:32:03<8:04:44,  2.54s/it][A
Training...:  18% 2464/13907 [1:32:05<7:57:09,  2.50s/it][A
Training...:  18% 2465/13907 [1:32:07<7:48:53,  2.46s/it][A
Training...:  18% 2466/13907 [1:32:10<7:41:43,  2.42s/it][A
Training...:  18% 2467/13907 [1:32:12<7:35:10,  2.39s/it][A
Training...:  18% 2468/13907 [1:32:14<7:28:32,  2.35s/it][A
Training...:  18% 2469/13907 [1:32:16<7:21:04,  2.31s/it][A
Training...:  18% 2470/13907 [1:32:19<7:14:10,  2.28s/it][A
Training...:  18% 2471/13907 [1:32:21<7:07:31,  2.24s/it][A
Training...:  18% 2472/13907 [1:32:23<7:00:59,  2.21s/it][A
Training...:  18% 2473/13907 [1:32:25<6:55:50,  2.18s/it][A
Training...:  18% 2474/13907 [1:32:27<6:48:45,  2.15s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:32:42<?, ?it/s]
Training...:  18% 2474/13907 [1:32:29<6:48:45,  2.15s/it][A
Training...:  18% 2475/13907 [1:32:29<7:00:55,  2.21s/it][A
Training...:  18% 2476/13907 [1:32:31<6:51:34,  2.16s/it][A
Training...:  18% 2477/13907 [1:32:33<6:41:14,  2.11s/it][A
Training...:  18% 2478/13907 [1:32:35<6:32:38,  2.06s/it][A
Training...:  18% 2479/13907 [1:32:37<6:24:56,  2.02s/it][A
Training...:  18% 2480/13907 [1:32:39<6:18:12,  1.99s/it][A
Training...:  18% 2481/13907 [1:32:41<6:12:14,  1.95s/it][A
Training...:  18% 2482/13907 [1:32:43<6:08:21,  1.93s/it][A
Training...:  18% 2483/13907 [1:32:45<6:02:12,  1.90s/it][A
Training...:  18% 2484/13907 [1:32:47<5:56:34,  1.87s/it][A
Training...:  18% 2485/13907 [1:32:48<5:53:21,  1.86s/it][A
Training...:  18% 2486/13907 [1:32:50<5:46:45,  1.82s/it][A
Training...:  18% 2487/13907 [1:32:52<5:41:52,  1.80s/it][A
Training...:  18% 2488/13907 [1:32:54<5:37:29,  1.77s/it][A
Training...:  18% 2489/13907 [1:32:55<5:32:54,  1.75s/it][A
Training...:  18% 2490/13907 [1:32:57<5:26:36,  1.72s/it][A
Training...:  18% 2491/13907 [1:32:59<5:19:35,  1.68s/it][A
Training...:  18% 2492/13907 [1:33:00<5:12:46,  1.64s/it][A
Training...:  18% 2493/13907 [1:33:02<5:04:26,  1.60s/it][A
Training...:  18% 2494/13907 [1:33:03<4:54:44,  1.55s/it][A
Training...:  18% 2495/13907 [1:33:04<4:45:23,  1.50s/it][A
Training...:  18% 2496/13907 [1:33:06<4:36:52,  1.46s/it][A
Training...:  18% 2497/13907 [1:33:07<4:27:59,  1.41s/it][A
Training...:  18% 2498/13907 [1:33:08<4:16:47,  1.35s/it][A
Training...:  18% 2499/13907 [1:33:09<4:02:48,  1.28s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:33:23<?, ?it/s]
Training...:  18% 2499/13907 [1:33:11<4:02:48,  1.28s/it][A
Training...:  18% 2500/13907 [1:33:11<3:55:02,  1.24s/it][A
Training...:  18% 2501/13907 [1:33:14<6:11:30,  1.95s/it][A
Training...:  18% 2502/13907 [1:33:18<7:29:07,  2.36s/it][A
Training...:  18% 2503/13907 [1:33:21<8:14:43,  2.60s/it][A
Training...:  18% 2504/13907 [1:33:24<8:38:56,  2.73s/it][A
Training...:  18% 2505/13907 [1:33:27<8:53:09,  2.81s/it][A
Training...:  18% 2506/13907 [1:33:30<8:55:17,  2.82s/it][A
Training...:  18% 2507/13907 [1:33:32<8:54:30,  2.81s/it][A
Training...:  18% 2508/13907 [1:33:35<8:47:00,  2.77s/it][A
Training...:  18% 2509/13907 [1:33:38<8:40:37,  2.74s/it][A
Training...:  18% 2510/13907 [1:33:40<8:30:49,  2.69s/it][A
Training...:  18% 2511/13907 [1:33:43<8:21:43,  2.64s/it][A
Training...:  18% 2512/13907 [1:33:45<8:11:24,  2.59s/it][A
Training...:  18% 2513/13907 [1:33:48<8:04:01,  2.55s/it][A
Training...:  18% 2514/13907 [1:33:50<7:55:25,  2.50s/it][A
Training...:  18% 2515/13907 [1:33:53<7:49:13,  2.47s/it][A
Training...:  18% 2516/13907 [1:33:55<7:40:47,  2.43s/it][A
Training...:  18% 2517/13907 [1:33:57<7:33:44,  2.39s/it][A
Training...:  18% 2518/13907 [1:33:59<7:26:37,  2.35s/it][A
Training...:  18% 2519/13907 [1:34:02<7:19:29,  2.32s/it][A
Training...:  18% 2520/13907 [1:34:04<7:13:48,  2.29s/it][A
Training...:  18% 2521/13907 [1:34:06<7:08:40,  2.26s/it][A
Training...:  18% 2522/13907 [1:34:08<7:02:01,  2.22s/it][A
Training...:  18% 2523/13907 [1:34:10<6:56:54,  2.20s/it][A
Training...:  18% 2524/13907 [1:34:12<6:50:00,  2.16s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:34:27<?, ?it/s]
Training...:  18% 2524/13907 [1:34:15<6:50:00,  2.16s/it][A
Training...:  18% 2525/13907 [1:34:15<7:03:41,  2.23s/it][A
Training...:  18% 2526/13907 [1:34:17<6:55:03,  2.19s/it][A
Training...:  18% 2527/13907 [1:34:19<6:44:57,  2.14s/it][A
Training...:  18% 2528/13907 [1:34:21<6:36:55,  2.09s/it][A
Training...:  18% 2529/13907 [1:34:23<6:30:10,  2.06s/it][A
Training...:  18% 2530/13907 [1:34:25<6:23:18,  2.02s/it][A
Training...:  18% 2531/13907 [1:34:27<6:16:21,  1.99s/it][A
Training...:  18% 2532/13907 [1:34:29<6:10:54,  1.96s/it][A
Training...:  18% 2533/13907 [1:34:30<6:04:46,  1.92s/it][A
Training...:  18% 2534/13907 [1:34:32<5:57:31,  1.89s/it][A
Training...:  18% 2535/13907 [1:34:34<5:52:44,  1.86s/it][A
Training...:  18% 2536/13907 [1:34:36<5:45:42,  1.82s/it][A
Training...:  18% 2537/13907 [1:34:38<5:41:54,  1.80s/it][A
Training...:  18% 2538/13907 [1:34:39<5:36:53,  1.78s/it][A
Training...:  18% 2539/13907 [1:34:41<5:32:04,  1.75s/it][A
Training...:  18% 2540/13907 [1:34:43<5:25:32,  1.72s/it][A
Training...:  18% 2541/13907 [1:34:44<5:18:06,  1.68s/it][A
Training...:  18% 2542/13907 [1:34:46<5:14:31,  1.66s/it][A
Training...:  18% 2543/13907 [1:34:47<5:05:57,  1.62s/it][A
Training...:  18% 2544/13907 [1:34:49<4:59:05,  1.58s/it][A
Training...:  18% 2545/13907 [1:34:50<4:51:56,  1.54s/it][A
Training...:  18% 2546/13907 [1:34:52<4:42:14,  1.49s/it][A
Training...:  18% 2547/13907 [1:34:53<4:32:29,  1.44s/it][A
Training...:  18% 2548/13907 [1:34:54<4:21:05,  1.38s/it][A
Training...:  18% 2549/13907 [1:34:55<4:08:04,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:35:09<?, ?it/s]
Training...:  18% 2549/13907 [1:34:57<4:08:04,  1.31s/it][A
Training...:  18% 2550/13907 [1:34:57<4:01:21,  1.28s/it][A
Training...:  18% 2551/13907 [1:35:00<6:19:52,  2.01s/it][A
Training...:  18% 2552/13907 [1:35:04<7:38:53,  2.42s/it][A
Training...:  18% 2553/13907 [1:35:07<8:23:17,  2.66s/it][A
Training...:  18% 2554/13907 [1:35:10<8:51:27,  2.81s/it][A
Training...:  18% 2555/13907 [1:35:13<8:58:52,  2.85s/it][A
Training...:  18% 2556/13907 [1:35:16<8:58:09,  2.84s/it][A
Training...:  18% 2557/13907 [1:35:19<8:55:11,  2.83s/it][A
Training...:  18% 2558/13907 [1:35:21<8:47:28,  2.79s/it][A
Training...:  18% 2559/13907 [1:35:24<8:40:43,  2.75s/it][A
Training...:  18% 2560/13907 [1:35:27<8:30:45,  2.70s/it][A
Training...:  18% 2561/13907 [1:35:29<8:20:33,  2.65s/it][A
Training...:  18% 2562/13907 [1:35:32<8:10:17,  2.59s/it][A
Training...:  18% 2563/13907 [1:35:34<8:03:27,  2.56s/it][A
Training...:  18% 2564/13907 [1:35:36<7:56:11,  2.52s/it][A
Training...:  18% 2565/13907 [1:35:39<7:49:46,  2.49s/it][A
Training...:  18% 2566/13907 [1:35:41<7:42:38,  2.45s/it][A
Training...:  18% 2567/13907 [1:35:44<7:37:42,  2.42s/it][A
Training...:  18% 2568/13907 [1:35:46<7:29:04,  2.38s/it][A
Training...:  18% 2569/13907 [1:35:48<7:21:34,  2.34s/it][A
Training...:  18% 2570/13907 [1:35:50<7:14:01,  2.30s/it][A
Training...:  18% 2571/13907 [1:35:52<7:06:01,  2.25s/it][A
Training...:  18% 2572/13907 [1:35:55<6:58:37,  2.22s/it][A
Training...:  19% 2573/13907 [1:35:57<6:53:29,  2.19s/it][A
Training...:  19% 2574/13907 [1:35:59<6:46:22,  2.15s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:36:13<?, ?it/s]
Training...:  19% 2574/13907 [1:36:01<6:46:22,  2.15s/it][A
Training...:  19% 2575/13907 [1:36:01<6:56:35,  2.21s/it][A
Training...:  19% 2576/13907 [1:36:03<6:47:54,  2.16s/it][A
Training...:  19% 2577/13907 [1:36:05<6:38:10,  2.11s/it][A
Training...:  19% 2578/13907 [1:36:07<6:29:28,  2.06s/it][A
Training...:  19% 2579/13907 [1:36:09<6:22:21,  2.03s/it][A
Training...:  19% 2580/13907 [1:36:11<6:18:12,  2.00s/it][A
Training...:  19% 2581/13907 [1:36:13<6:13:43,  1.98s/it][A
Training...:  19% 2582/13907 [1:36:15<6:08:05,  1.95s/it][A
Training...:  19% 2583/13907 [1:36:17<6:00:59,  1.91s/it][A
Training...:  19% 2584/13907 [1:36:18<5:52:31,  1.87s/it][A
Training...:  19% 2585/13907 [1:36:20<5:45:42,  1.83s/it][A
Training...:  19% 2586/13907 [1:36:22<5:39:06,  1.80s/it][A
Training...:  19% 2587/13907 [1:36:23<5:32:01,  1.76s/it][A
Training...:  19% 2588/13907 [1:36:25<5:25:25,  1.73s/it][A
Training...:  19% 2589/13907 [1:36:27<5:19:22,  1.69s/it][A
Training...:  19% 2590/13907 [1:36:28<5:13:40,  1.66s/it][A
Training...:  19% 2591/13907 [1:36:30<5:07:17,  1.63s/it][A
Training...:  19% 2592/13907 [1:36:31<5:02:20,  1.60s/it][A
Training...:  19% 2593/13907 [1:36:33<4:55:38,  1.57s/it][A
Training...:  19% 2594/13907 [1:36:34<4:48:34,  1.53s/it][A
Training...:  19% 2595/13907 [1:36:36<4:40:45,  1.49s/it][A
Training...:  19% 2596/13907 [1:36:37<4:33:16,  1.45s/it][A
Training...:  19% 2597/13907 [1:36:38<4:24:13,  1.40s/it][A
Training...:  19% 2598/13907 [1:36:40<4:16:35,  1.36s/it][A
Training...:  19% 2599/13907 [1:36:41<4:04:38,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:36:54<?, ?it/s]
Training...:  19% 2599/13907 [1:36:42<4:04:38,  1.30s/it][A
Training...:  19% 2600/13907 [1:36:42<3:57:52,  1.26s/it][A
Training...:  19% 2601/13907 [1:36:46<6:09:51,  1.96s/it][A
Training...:  19% 2602/13907 [1:36:49<7:27:59,  2.38s/it][A
Training...:  19% 2603/13907 [1:36:52<8:16:15,  2.63s/it][A
Training...:  19% 2604/13907 [1:36:55<8:42:44,  2.77s/it][A
Training...:  19% 2605/13907 [1:36:58<8:54:22,  2.84s/it][A
Training...:  19% 2606/13907 [1:37:01<8:58:41,  2.86s/it][A
Training...:  19% 2607/13907 [1:37:04<8:58:52,  2.86s/it][A
Training...:  19% 2608/13907 [1:37:07<8:51:08,  2.82s/it][A
Training...:  19% 2609/13907 [1:37:09<8:43:20,  2.78s/it][A
Training...:  19% 2610/13907 [1:37:12<8:33:38,  2.73s/it][A
Training...:  19% 2611/13907 [1:37:15<8:26:53,  2.69s/it][A
Training...:  19% 2612/13907 [1:37:17<8:16:57,  2.64s/it][A
Training...:  19% 2613/13907 [1:37:20<8:10:54,  2.61s/it][A
Training...:  19% 2614/13907 [1:37:22<8:01:02,  2.56s/it][A
Training...:  19% 2615/13907 [1:37:25<7:52:38,  2.51s/it][A
Training...:  19% 2616/13907 [1:37:27<7:44:49,  2.47s/it][A
Training...:  19% 2617/13907 [1:37:29<7:37:26,  2.43s/it][A
Training...:  19% 2618/13907 [1:37:32<7:28:38,  2.38s/it][A
Training...:  19% 2619/13907 [1:37:34<7:21:11,  2.35s/it][A
Training...:  19% 2620/13907 [1:37:36<7:14:16,  2.31s/it][A
Training...:  19% 2621/13907 [1:37:38<7:06:20,  2.27s/it][A
Training...:  19% 2622/13907 [1:37:40<6:58:37,  2.23s/it][A
Training...:  19% 2623/13907 [1:37:42<6:52:43,  2.19s/it][A
Training...:  19% 2624/13907 [1:37:45<6:47:10,  2.17s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:37:59<?, ?it/s]
Training...:  19% 2624/13907 [1:37:47<6:47:10,  2.17s/it][A
Training...:  19% 2625/13907 [1:37:47<7:00:12,  2.23s/it][A
Training...:  19% 2626/13907 [1:37:49<6:50:57,  2.19s/it][A
Training...:  19% 2627/13907 [1:37:51<6:40:00,  2.13s/it][A
Training...:  19% 2628/13907 [1:37:53<6:30:41,  2.08s/it][A
Training...:  19% 2629/13907 [1:37:55<6:22:41,  2.04s/it][A
Training...:  19% 2630/13907 [1:37:57<6:16:17,  2.00s/it][A
Training...:  19% 2631/13907 [1:37:59<6:10:47,  1.97s/it][A
Training...:  19% 2632/13907 [1:38:01<6:03:28,  1.93s/it][A
Training...:  19% 2633/13907 [1:38:02<5:58:47,  1.91s/it][A
Training...:  19% 2634/13907 [1:38:04<5:53:07,  1.88s/it][A
Training...:  19% 2635/13907 [1:38:06<5:47:24,  1.85s/it][A
Training...:  19% 2636/13907 [1:38:08<5:41:40,  1.82s/it][A
Training...:  19% 2637/13907 [1:38:10<5:37:19,  1.80s/it][A
Training...:  19% 2638/13907 [1:38:11<5:32:08,  1.77s/it][A
Training...:  19% 2639/13907 [1:38:13<5:24:33,  1.73s/it][A
Training...:  19% 2640/13907 [1:38:14<5:17:32,  1.69s/it][A
Training...:  19% 2641/13907 [1:38:16<5:12:08,  1.66s/it][A
Training...:  19% 2642/13907 [1:38:18<5:05:55,  1.63s/it][A
Training...:  19% 2643/13907 [1:38:19<4:58:39,  1.59s/it][A
Training...:  19% 2644/13907 [1:38:21<4:53:13,  1.56s/it][A
Training...:  19% 2645/13907 [1:38:22<4:46:18,  1.53s/it][A
Training...:  19% 2646/13907 [1:38:23<4:36:11,  1.47s/it][A
Training...:  19% 2647/13907 [1:38:25<4:25:28,  1.41s/it][A
Training...:  19% 2648/13907 [1:38:26<4:16:22,  1.37s/it][A
Training...:  19% 2649/13907 [1:38:27<4:02:51,  1.29s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:38:41<?, ?it/s]
Training...:  19% 2649/13907 [1:38:28<4:02:51,  1.29s/it][A
Training...:  19% 2650/13907 [1:38:28<3:56:50,  1.26s/it][A
Training...:  19% 2651/13907 [1:38:32<6:15:26,  2.00s/it][A
Training...:  19% 2652/13907 [1:38:35<7:31:24,  2.41s/it][A
Training...:  19% 2653/13907 [1:38:38<8:11:51,  2.62s/it][A
Training...:  19% 2654/13907 [1:38:41<8:34:45,  2.74s/it][A
Training...:  19% 2655/13907 [1:38:44<8:46:01,  2.80s/it][A
Training...:  19% 2656/13907 [1:38:47<8:48:55,  2.82s/it][A
Training...:  19% 2657/13907 [1:38:50<8:47:40,  2.81s/it][A
Training...:  19% 2658/13907 [1:38:53<8:40:34,  2.78s/it][A
Training...:  19% 2659/13907 [1:38:55<8:34:57,  2.75s/it][A
Training...:  19% 2660/13907 [1:38:58<8:24:19,  2.69s/it][A
Training...:  19% 2661/13907 [1:39:01<8:15:03,  2.64s/it][A
Training...:  19% 2662/13907 [1:39:03<8:05:41,  2.59s/it][A
Training...:  19% 2663/13907 [1:39:05<7:57:21,  2.55s/it][A
Training...:  19% 2664/13907 [1:39:08<7:48:31,  2.50s/it][A
Training...:  19% 2665/13907 [1:39:10<7:41:52,  2.47s/it][A
Training...:  19% 2666/13907 [1:39:13<7:34:14,  2.42s/it][A
Training...:  19% 2667/13907 [1:39:15<7:27:52,  2.39s/it][A
Training...:  19% 2668/13907 [1:39:17<7:21:24,  2.36s/it][A
Training...:  19% 2669/13907 [1:39:19<7:14:33,  2.32s/it][A
Training...:  19% 2670/13907 [1:39:22<7:07:51,  2.28s/it][A
Training...:  19% 2671/13907 [1:39:24<7:00:27,  2.25s/it][A
Training...:  19% 2672/13907 [1:39:26<6:54:37,  2.21s/it][A
Training...:  19% 2673/13907 [1:39:28<6:49:56,  2.19s/it][A
Training...:  19% 2674/13907 [1:39:30<6:45:37,  2.17s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:39:45<?, ?it/s]
Training...:  19% 2674/13907 [1:39:32<6:45:37,  2.17s/it][A
Training...:  19% 2675/13907 [1:39:32<6:57:24,  2.23s/it][A
Training...:  19% 2676/13907 [1:39:35<6:48:52,  2.18s/it][A
Training...:  19% 2677/13907 [1:39:37<6:41:39,  2.15s/it][A
Training...:  19% 2678/13907 [1:39:39<6:33:54,  2.10s/it][A
Training...:  19% 2679/13907 [1:39:41<6:27:06,  2.07s/it][A
Training...:  19% 2680/13907 [1:39:43<6:21:35,  2.04s/it][A
Training...:  19% 2681/13907 [1:39:45<6:15:36,  2.01s/it][A
Training...:  19% 2682/13907 [1:39:46<6:07:41,  1.97s/it][A
Training...:  19% 2683/13907 [1:39:48<6:01:18,  1.93s/it][A
Training...:  19% 2684/13907 [1:39:50<5:54:50,  1.90s/it][A
Training...:  19% 2685/13907 [1:39:52<5:48:42,  1.86s/it][A
Training...:  19% 2686/13907 [1:39:54<5:42:54,  1.83s/it][A
Training...:  19% 2687/13907 [1:39:55<5:35:50,  1.80s/it][A
Training...:  19% 2688/13907 [1:39:57<5:29:54,  1.76s/it][A
Training...:  19% 2689/13907 [1:39:59<5:22:47,  1.73s/it][A
Training...:  19% 2690/13907 [1:40:00<5:17:01,  1.70s/it][A
Training...:  19% 2691/13907 [1:40:02<5:11:23,  1.67s/it][A
Training...:  19% 2692/13907 [1:40:03<5:04:51,  1.63s/it][A
Training...:  19% 2693/13907 [1:40:05<4:57:42,  1.59s/it][A
Training...:  19% 2694/13907 [1:40:06<4:50:05,  1.55s/it][A
Training...:  19% 2695/13907 [1:40:08<4:41:38,  1.51s/it][A
Training...:  19% 2696/13907 [1:40:09<4:32:14,  1.46s/it][A
Training...:  19% 2697/13907 [1:40:10<4:25:16,  1.42s/it][A
Training...:  19% 2698/13907 [1:40:12<4:14:45,  1.36s/it][A
Training...:  19% 2699/13907 [1:40:13<4:02:58,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:40:26<?, ?it/s]
Training...:  19% 2699/13907 [1:40:14<4:02:58,  1.30s/it][A
Training...:  19% 2700/13907 [1:40:14<3:56:48,  1.27s/it][A
Training...:  19% 2701/13907 [1:40:18<6:06:51,  1.96s/it][A
Training...:  19% 2702/13907 [1:40:21<7:23:13,  2.37s/it][A
Training...:  19% 2703/13907 [1:40:24<8:08:57,  2.62s/it][A
Training...:  19% 2704/13907 [1:40:27<8:34:40,  2.76s/it][A
Training...:  19% 2705/13907 [1:40:30<8:47:42,  2.83s/it][A
Training...:  19% 2706/13907 [1:40:33<8:50:13,  2.84s/it][A
Training...:  19% 2707/13907 [1:40:36<8:47:12,  2.82s/it][A
Training...:  19% 2708/13907 [1:40:39<8:41:14,  2.79s/it][A
Training...:  19% 2709/13907 [1:40:41<8:33:31,  2.75s/it][A
Training...:  19% 2710/13907 [1:40:44<8:26:06,  2.71s/it][A
Training...:  19% 2711/13907 [1:40:46<8:19:00,  2.67s/it][A
Training...:  20% 2712/13907 [1:40:49<8:11:00,  2.63s/it][A
Training...:  20% 2713/13907 [1:40:51<8:03:19,  2.59s/it][A
Training...:  20% 2714/13907 [1:40:54<7:54:20,  2.54s/it][A
Training...:  20% 2715/13907 [1:40:56<7:48:03,  2.51s/it][A
Training...:  20% 2716/13907 [1:40:59<7:41:33,  2.47s/it][A
Training...:  20% 2717/13907 [1:41:01<7:34:38,  2.44s/it][A
Training...:  20% 2718/13907 [1:41:03<7:26:42,  2.40s/it][A
Training...:  20% 2719/13907 [1:41:06<7:23:06,  2.38s/it][A
Training...:  20% 2720/13907 [1:41:08<7:15:11,  2.33s/it][A
Training...:  20% 2721/13907 [1:41:10<7:10:54,  2.31s/it][A
Training...:  20% 2722/13907 [1:41:12<7:03:18,  2.27s/it][A
Training...:  20% 2723/13907 [1:41:15<6:59:06,  2.25s/it][A
Training...:  20% 2724/13907 [1:41:17<6:50:10,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:41:31<?, ?it/s]
Training...:  20% 2724/13907 [1:41:19<6:50:10,  2.20s/it][A
Training...:  20% 2725/13907 [1:41:19<7:00:30,  2.26s/it][A
Training...:  20% 2726/13907 [1:41:21<6:51:02,  2.21s/it][A
Training...:  20% 2727/13907 [1:41:23<6:40:25,  2.15s/it][A
Training...:  20% 2728/13907 [1:41:25<6:32:07,  2.10s/it][A
Training...:  20% 2729/13907 [1:41:27<6:28:56,  2.09s/it][A
Training...:  20% 2730/13907 [1:41:29<6:19:36,  2.04s/it][A
Training...:  20% 2731/13907 [1:41:31<6:12:41,  2.00s/it][A
Training...:  20% 2732/13907 [1:41:33<6:05:46,  1.96s/it][A
Training...:  20% 2733/13907 [1:41:35<5:59:22,  1.93s/it][A
Training...:  20% 2734/13907 [1:41:37<5:51:32,  1.89s/it][A
Training...:  20% 2735/13907 [1:41:38<5:45:08,  1.85s/it][A
Training...:  20% 2736/13907 [1:41:40<5:38:28,  1.82s/it][A
Training...:  20% 2737/13907 [1:41:42<5:32:23,  1.79s/it][A
Training...:  20% 2738/13907 [1:41:43<5:27:16,  1.76s/it][A
Training...:  20% 2739/13907 [1:41:45<5:21:11,  1.73s/it][A
Training...:  20% 2740/13907 [1:41:47<5:14:13,  1.69s/it][A
Training...:  20% 2741/13907 [1:41:48<5:07:19,  1.65s/it][A
Training...:  20% 2742/13907 [1:41:50<5:00:44,  1.62s/it][A
Training...:  20% 2743/13907 [1:41:51<4:54:13,  1.58s/it][A
Training...:  20% 2744/13907 [1:41:53<4:46:42,  1.54s/it][A
Training...:  20% 2745/13907 [1:41:54<4:38:28,  1.50s/it][A
Training...:  20% 2746/13907 [1:41:55<4:29:14,  1.45s/it][A
Training...:  20% 2747/13907 [1:41:57<4:20:27,  1.40s/it][A
Training...:  20% 2748/13907 [1:41:58<4:09:46,  1.34s/it][A
Training...:  20% 2749/13907 [1:41:59<3:56:04,  1.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:42:13<?, ?it/s]
Training...:  20% 2749/13907 [1:42:00<3:56:04,  1.27s/it][A
Training...:  20% 2750/13907 [1:42:00<3:51:19,  1.24s/it][A
Training...:  20% 2751/13907 [1:42:04<6:05:15,  1.96s/it][A
Training...:  20% 2752/13907 [1:42:07<7:21:21,  2.37s/it][A
Training...:  20% 2753/13907 [1:42:10<8:07:05,  2.62s/it][A
Training...:  20% 2754/13907 [1:42:13<8:30:32,  2.75s/it][A
Training...:  20% 2755/13907 [1:42:16<8:40:17,  2.80s/it][A
Training...:  20% 2756/13907 [1:42:19<8:42:23,  2.81s/it][A
Training...:  20% 2757/13907 [1:42:22<8:38:56,  2.79s/it][A
Training...:  20% 2758/13907 [1:42:25<8:34:03,  2.77s/it][A
Training...:  20% 2759/13907 [1:42:27<8:27:48,  2.73s/it][A
Training...:  20% 2760/13907 [1:42:30<8:20:08,  2.69s/it][A
Training...:  20% 2761/13907 [1:42:32<8:10:49,  2.64s/it][A
Training...:  20% 2762/13907 [1:42:35<8:03:04,  2.60s/it][A
Training...:  20% 2763/13907 [1:42:37<7:53:47,  2.55s/it][A
Training...:  20% 2764/13907 [1:42:40<7:45:42,  2.51s/it][A
Training...:  20% 2765/13907 [1:42:42<7:41:24,  2.48s/it][A
Training...:  20% 2766/13907 [1:42:45<7:33:57,  2.44s/it][A
Training...:  20% 2767/13907 [1:42:47<7:26:35,  2.41s/it][A
Training...:  20% 2768/13907 [1:42:49<7:21:43,  2.38s/it][A
Training...:  20% 2769/13907 [1:42:51<7:14:03,  2.34s/it][A
Training...:  20% 2770/13907 [1:42:54<7:07:36,  2.30s/it][A
Training...:  20% 2771/13907 [1:42:56<7:03:40,  2.28s/it][A
Training...:  20% 2772/13907 [1:42:58<6:57:00,  2.25s/it][A
Training...:  20% 2773/13907 [1:43:00<6:50:23,  2.21s/it][A
Training...:  20% 2774/13907 [1:43:02<6:43:31,  2.17s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:43:17<?, ?it/s]
Training...:  20% 2774/13907 [1:43:05<6:43:31,  2.17s/it][A
Training...:  20% 2775/13907 [1:43:05<6:55:49,  2.24s/it][A
Training...:  20% 2776/13907 [1:43:07<6:50:10,  2.21s/it][A
Training...:  20% 2777/13907 [1:43:09<6:41:12,  2.16s/it][A
Training...:  20% 2778/13907 [1:43:11<6:32:34,  2.12s/it][A
Training...:  20% 2779/13907 [1:43:13<6:23:15,  2.07s/it][A
Training...:  20% 2780/13907 [1:43:15<6:18:44,  2.04s/it][A
Training...:  20% 2781/13907 [1:43:17<6:12:57,  2.01s/it][A
Training...:  20% 2782/13907 [1:43:19<6:05:31,  1.97s/it][A
Training...:  20% 2783/13907 [1:43:21<5:59:36,  1.94s/it][A
Training...:  20% 2784/13907 [1:43:22<5:52:44,  1.90s/it][A
Training...:  20% 2785/13907 [1:43:24<5:47:00,  1.87s/it][A
Training...:  20% 2786/13907 [1:43:26<5:41:40,  1.84s/it][A
Training...:  20% 2787/13907 [1:43:28<5:34:59,  1.81s/it][A
Training...:  20% 2788/13907 [1:43:29<5:28:20,  1.77s/it][A
Training...:  20% 2789/13907 [1:43:31<5:22:52,  1.74s/it][A
Training...:  20% 2790/13907 [1:43:33<5:16:32,  1.71s/it][A
Training...:  20% 2791/13907 [1:43:34<5:10:19,  1.68s/it][A
Training...:  20% 2792/13907 [1:43:36<5:03:44,  1.64s/it][A
Training...:  20% 2793/13907 [1:43:37<4:57:08,  1.60s/it][A
Training...:  20% 2794/13907 [1:43:39<4:51:42,  1.58s/it][A
Training...:  20% 2795/13907 [1:43:40<4:44:01,  1.53s/it][A
Training...:  20% 2796/13907 [1:43:42<4:35:49,  1.49s/it][A
Training...:  20% 2797/13907 [1:43:43<4:26:35,  1.44s/it][A
Training...:  20% 2798/13907 [1:43:44<4:15:37,  1.38s/it][A
Training...:  20% 2799/13907 [1:43:45<4:02:20,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:43:59<?, ?it/s]
Training...:  20% 2799/13907 [1:43:47<4:02:20,  1.31s/it][A
Training...:  20% 2800/13907 [1:43:47<3:55:46,  1.27s/it][A
Training...:  20% 2801/13907 [1:43:50<6:10:17,  2.00s/it][A
Training...:  20% 2802/13907 [1:43:54<7:23:26,  2.40s/it][A
Training...:  20% 2803/13907 [1:43:57<8:04:04,  2.62s/it][A
Training...:  20% 2804/13907 [1:44:00<8:28:23,  2.75s/it][A
Training...:  20% 2805/13907 [1:44:03<8:42:56,  2.83s/it][A
Training...:  20% 2806/13907 [1:44:06<8:41:31,  2.82s/it][A
Training...:  20% 2807/13907 [1:44:08<8:38:09,  2.80s/it][A
Training...:  20% 2808/13907 [1:44:11<8:30:52,  2.76s/it][A
Training...:  20% 2809/13907 [1:44:14<8:24:37,  2.73s/it][A
Training...:  20% 2810/13907 [1:44:16<8:16:06,  2.68s/it][A
Training...:  20% 2811/13907 [1:44:19<8:10:15,  2.65s/it][A
Training...:  20% 2812/13907 [1:44:21<8:00:45,  2.60s/it][A
Training...:  20% 2813/13907 [1:44:24<7:53:51,  2.56s/it][A
Training...:  20% 2814/13907 [1:44:26<7:46:17,  2.52s/it][A
Training...:  20% 2815/13907 [1:44:29<7:41:31,  2.50s/it][A
Training...:  20% 2816/13907 [1:44:31<7:33:17,  2.45s/it][A
Training...:  20% 2817/13907 [1:44:33<7:25:13,  2.41s/it][A
Training...:  20% 2818/13907 [1:44:36<7:17:40,  2.37s/it][A
Training...:  20% 2819/13907 [1:44:38<7:11:08,  2.33s/it][A
Training...:  20% 2820/13907 [1:44:40<7:03:56,  2.29s/it][A
Training...:  20% 2821/13907 [1:44:42<6:58:07,  2.26s/it][A
Training...:  20% 2822/13907 [1:44:44<6:52:32,  2.23s/it][A
Training...:  20% 2823/13907 [1:44:46<6:46:00,  2.20s/it][A
Training...:  20% 2824/13907 [1:44:49<6:39:40,  2.16s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:45:03<?, ?it/s]
Training...:  20% 2824/13907 [1:44:51<6:39:40,  2.16s/it][A
Training...:  20% 2825/13907 [1:44:51<6:52:55,  2.24s/it][A
Training...:  20% 2826/13907 [1:44:53<6:44:54,  2.19s/it][A
Training...:  20% 2827/13907 [1:44:55<6:36:27,  2.15s/it][A
Training...:  20% 2828/13907 [1:44:57<6:33:25,  2.13s/it][A
Training...:  20% 2829/13907 [1:44:59<6:28:44,  2.11s/it][A
Training...:  20% 2830/13907 [1:45:01<6:19:34,  2.06s/it][A
Training...:  20% 2831/13907 [1:45:03<6:10:29,  2.01s/it][A
Training...:  20% 2832/13907 [1:45:05<6:02:28,  1.96s/it][A
Training...:  20% 2833/13907 [1:45:07<5:54:41,  1.92s/it][A
Training...:  20% 2834/13907 [1:45:09<5:47:52,  1.89s/it][A
Training...:  20% 2835/13907 [1:45:10<5:41:01,  1.85s/it][A
Training...:  20% 2836/13907 [1:45:12<5:34:36,  1.81s/it][A
Training...:  20% 2837/13907 [1:45:14<5:27:39,  1.78s/it][A
Training...:  20% 2838/13907 [1:45:15<5:21:27,  1.74s/it][A
Training...:  20% 2839/13907 [1:45:17<5:15:20,  1.71s/it][A
Training...:  20% 2840/13907 [1:45:19<5:08:27,  1.67s/it][A
Training...:  20% 2841/13907 [1:45:20<5:03:01,  1.64s/it][A
Training...:  20% 2842/13907 [1:45:22<4:55:04,  1.60s/it][A
Training...:  20% 2843/13907 [1:45:23<4:47:55,  1.56s/it][A
Training...:  20% 2844/13907 [1:45:25<4:40:44,  1.52s/it][A
Training...:  20% 2845/13907 [1:45:26<4:32:37,  1.48s/it][A
Training...:  20% 2846/13907 [1:45:27<4:23:56,  1.43s/it][A
Training...:  20% 2847/13907 [1:45:29<4:14:23,  1.38s/it][A
Training...:  20% 2848/13907 [1:45:30<4:04:32,  1.33s/it][A
Training...:  20% 2849/13907 [1:45:31<3:53:36,  1.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:45:44<?, ?it/s]
Training...:  20% 2849/13907 [1:45:32<3:53:36,  1.27s/it][A
Training...:  20% 2850/13907 [1:45:32<3:50:58,  1.25s/it][A
Training...:  21% 2851/13907 [1:45:36<6:03:13,  1.97s/it][A
Training...:  21% 2852/13907 [1:45:39<7:17:43,  2.38s/it][A
Training...:  21% 2853/13907 [1:45:42<8:00:56,  2.61s/it][A
Training...:  21% 2854/13907 [1:45:45<8:27:36,  2.76s/it][A
Training...:  21% 2855/13907 [1:45:48<8:42:07,  2.83s/it][A
Training...:  21% 2856/13907 [1:45:51<8:42:58,  2.84s/it][A
Training...:  21% 2857/13907 [1:45:54<8:39:04,  2.82s/it][A
Training...:  21% 2858/13907 [1:45:57<8:32:11,  2.78s/it][A
Training...:  21% 2859/13907 [1:45:59<8:24:59,  2.74s/it][A
Training...:  21% 2860/13907 [1:46:02<8:13:56,  2.68s/it][A
Training...:  21% 2861/13907 [1:46:04<8:04:11,  2.63s/it][A
Training...:  21% 2862/13907 [1:46:07<7:55:11,  2.58s/it][A
Training...:  21% 2863/13907 [1:46:09<7:48:33,  2.55s/it][A
Training...:  21% 2864/13907 [1:46:12<7:42:20,  2.51s/it][A
Training...:  21% 2865/13907 [1:46:14<7:35:35,  2.48s/it][A
Training...:  21% 2866/13907 [1:46:16<7:27:19,  2.43s/it][A
Training...:  21% 2867/13907 [1:46:19<7:22:11,  2.40s/it][A
Training...:  21% 2868/13907 [1:46:21<7:16:44,  2.37s/it][A
Training...:  21% 2869/13907 [1:46:23<7:11:00,  2.34s/it][A
Training...:  21% 2870/13907 [1:46:26<7:03:29,  2.30s/it][A
Training...:  21% 2871/13907 [1:46:28<6:56:48,  2.27s/it][A
Training...:  21% 2872/13907 [1:46:30<6:49:35,  2.23s/it][A
Training...:  21% 2873/13907 [1:46:32<6:43:28,  2.19s/it][A
Training...:  21% 2874/13907 [1:46:34<6:37:12,  2.16s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:46:49<?, ?it/s]
Training...:  21% 2874/13907 [1:46:36<6:37:12,  2.16s/it][A
Training...:  21% 2875/13907 [1:46:36<6:50:08,  2.23s/it][A
Training...:  21% 2876/13907 [1:46:39<6:41:42,  2.18s/it][A
Training...:  21% 2877/13907 [1:46:41<6:31:18,  2.13s/it][A
Training...:  21% 2878/13907 [1:46:43<6:24:18,  2.09s/it][A
Training...:  21% 2879/13907 [1:46:44<6:15:00,  2.04s/it][A
Training...:  21% 2880/13907 [1:46:46<6:06:54,  2.00s/it][A
Training...:  21% 2881/13907 [1:46:48<6:00:37,  1.96s/it][A
Training...:  21% 2882/13907 [1:46:50<5:55:04,  1.93s/it][A
Training...:  21% 2883/13907 [1:46:52<5:48:57,  1.90s/it][A
Training...:  21% 2884/13907 [1:46:54<5:42:41,  1.87s/it][A
Training...:  21% 2885/13907 [1:46:55<5:38:02,  1.84s/it][A
Training...:  21% 2886/13907 [1:46:57<5:32:20,  1.81s/it][A
Training...:  21% 2887/13907 [1:46:59<5:25:44,  1.77s/it][A
Training...:  21% 2888/13907 [1:47:01<5:19:29,  1.74s/it][A
Training...:  21% 2889/13907 [1:47:02<5:13:46,  1.71s/it][A
Training...:  21% 2890/13907 [1:47:04<5:07:48,  1.68s/it][A
Training...:  21% 2891/13907 [1:47:05<5:02:51,  1.65s/it][A
Training...:  21% 2892/13907 [1:47:07<4:56:33,  1.62s/it][A
Training...:  21% 2893/13907 [1:47:08<4:50:09,  1.58s/it][A
Training...:  21% 2894/13907 [1:47:10<4:44:38,  1.55s/it][A
Training...:  21% 2895/13907 [1:47:11<4:36:58,  1.51s/it][A
Training...:  21% 2896/13907 [1:47:13<4:29:07,  1.47s/it][A
Training...:  21% 2897/13907 [1:47:14<4:19:58,  1.42s/it][A
Training...:  21% 2898/13907 [1:47:15<4:12:20,  1.38s/it][A
Training...:  21% 2899/13907 [1:47:16<3:59:18,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:47:30<?, ?it/s]
Training...:  21% 2899/13907 [1:47:18<3:59:18,  1.30s/it][A
Training...:  21% 2900/13907 [1:47:18<3:52:33,  1.27s/it][A
Training...:  21% 2901/13907 [1:47:21<6:09:59,  2.02s/it][A
Training...:  21% 2902/13907 [1:47:25<7:25:16,  2.43s/it][A
Training...:  21% 2903/13907 [1:47:28<8:08:52,  2.67s/it][A
Training...:  21% 2904/13907 [1:47:31<8:29:26,  2.78s/it][A
Training...:  21% 2905/13907 [1:47:34<8:40:08,  2.84s/it][A
Training...:  21% 2906/13907 [1:47:37<8:40:47,  2.84s/it][A
Training...:  21% 2907/13907 [1:47:40<8:38:57,  2.83s/it][A
Training...:  21% 2908/13907 [1:47:42<8:32:58,  2.80s/it][A
Training...:  21% 2909/13907 [1:47:45<8:25:37,  2.76s/it][A
Training...:  21% 2910/13907 [1:47:48<8:17:50,  2.72s/it][A
Training...:  21% 2911/13907 [1:47:50<8:09:49,  2.67s/it][A
Training...:  21% 2912/13907 [1:47:53<8:01:32,  2.63s/it][A
Training...:  21% 2913/13907 [1:47:55<7:54:47,  2.59s/it][A
Training...:  21% 2914/13907 [1:47:58<7:44:43,  2.54s/it][A
Training...:  21% 2915/13907 [1:48:00<7:35:57,  2.49s/it][A
Training...:  21% 2916/13907 [1:48:02<7:30:27,  2.46s/it][A
Training...:  21% 2917/13907 [1:48:05<7:22:27,  2.42s/it][A
Training...:  21% 2918/13907 [1:48:07<7:15:53,  2.38s/it][A
Training...:  21% 2919/13907 [1:48:09<7:09:54,  2.35s/it][A
Training...:  21% 2920/13907 [1:48:12<7:05:29,  2.32s/it][A
Training...:  21% 2921/13907 [1:48:14<6:59:15,  2.29s/it][A
Training...:  21% 2922/13907 [1:48:16<6:52:19,  2.25s/it][A
Training...:  21% 2923/13907 [1:48:18<6:46:19,  2.22s/it][A
Training...:  21% 2924/13907 [1:48:20<6:39:46,  2.18s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:48:35<?, ?it/s]
Training...:  21% 2924/13907 [1:48:23<6:39:46,  2.18s/it][A
Training...:  21% 2925/13907 [1:48:23<6:51:09,  2.25s/it][A
Training...:  21% 2926/13907 [1:48:25<6:42:46,  2.20s/it][A
Training...:  21% 2927/13907 [1:48:27<6:32:58,  2.15s/it][A
Training...:  21% 2928/13907 [1:48:29<6:24:51,  2.10s/it][A
Training...:  21% 2929/13907 [1:48:31<6:16:34,  2.06s/it][A
Training...:  21% 2930/13907 [1:48:33<6:08:42,  2.02s/it][A
Training...:  21% 2931/13907 [1:48:34<6:03:20,  1.99s/it][A
Training...:  21% 2932/13907 [1:48:36<5:58:54,  1.96s/it][A
Training...:  21% 2933/13907 [1:48:38<5:52:53,  1.93s/it][A
Training...:  21% 2934/13907 [1:48:40<5:45:58,  1.89s/it][A
Training...:  21% 2935/13907 [1:48:42<5:40:46,  1.86s/it][A
Training...:  21% 2936/13907 [1:48:44<5:34:49,  1.83s/it][A
Training...:  21% 2937/13907 [1:48:45<5:30:08,  1.81s/it][A
Training...:  21% 2938/13907 [1:48:47<5:23:55,  1.77s/it][A
Training...:  21% 2939/13907 [1:48:49<5:18:32,  1.74s/it][A
Training...:  21% 2940/13907 [1:48:50<5:13:14,  1.71s/it][A
Training...:  21% 2941/13907 [1:48:52<5:08:03,  1.69s/it][A
Training...:  21% 2942/13907 [1:48:54<5:01:54,  1.65s/it][A
Training...:  21% 2943/13907 [1:48:55<4:56:07,  1.62s/it][A
Training...:  21% 2944/13907 [1:48:57<4:48:01,  1.58s/it][A
Training...:  21% 2945/13907 [1:48:58<4:38:38,  1.53s/it][A
Training...:  21% 2946/13907 [1:48:59<4:28:52,  1.47s/it][A
Training...:  21% 2947/13907 [1:49:01<4:19:37,  1.42s/it][A
Training...:  21% 2948/13907 [1:49:02<4:08:40,  1.36s/it][A
Training...:  21% 2949/13907 [1:49:03<3:56:35,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:49:16<?, ?it/s]
Training...:  21% 2949/13907 [1:49:04<3:56:35,  1.30s/it][A
Training...:  21% 2950/13907 [1:49:04<3:49:31,  1.26s/it][A
Training...:  21% 2951/13907 [1:49:08<6:09:22,  2.02s/it][A
Training...:  21% 2952/13907 [1:49:11<7:24:50,  2.44s/it][A
Training...:  21% 2953/13907 [1:49:15<8:05:00,  2.66s/it][A
Training...:  21% 2954/13907 [1:49:18<8:36:41,  2.83s/it][A
Training...:  21% 2955/13907 [1:49:21<8:52:35,  2.92s/it][A
Training...:  21% 2956/13907 [1:49:24<8:51:09,  2.91s/it][A
Training...:  21% 2957/13907 [1:49:27<8:44:45,  2.88s/it][A
Training...:  21% 2958/13907 [1:49:29<8:37:25,  2.84s/it][A
Training...:  21% 2959/13907 [1:49:32<8:29:49,  2.79s/it][A
Training...:  21% 2960/13907 [1:49:35<8:19:11,  2.74s/it][A
Training...:  21% 2961/13907 [1:49:37<8:10:40,  2.69s/it][A
Training...:  21% 2962/13907 [1:49:40<8:01:52,  2.64s/it][A
Training...:  21% 2963/13907 [1:49:42<7:53:09,  2.59s/it][A
Training...:  21% 2964/13907 [1:49:45<7:42:59,  2.54s/it][A
Training...:  21% 2965/13907 [1:49:47<7:35:28,  2.50s/it][A
Training...:  21% 2966/13907 [1:49:49<7:26:52,  2.45s/it][A
Training...:  21% 2967/13907 [1:49:52<7:20:04,  2.41s/it][A
Training...:  21% 2968/13907 [1:49:54<7:13:30,  2.38s/it][A
Training...:  21% 2969/13907 [1:49:56<7:07:23,  2.34s/it][A
Training...:  21% 2970/13907 [1:49:59<7:01:45,  2.31s/it][A
Training...:  21% 2971/13907 [1:50:01<6:56:07,  2.28s/it][A
Training...:  21% 2972/13907 [1:50:03<6:49:08,  2.24s/it][A
Training...:  21% 2973/13907 [1:50:05<6:43:38,  2.21s/it][A
Training...:  21% 2974/13907 [1:50:07<6:37:07,  2.18s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:50:22<?, ?it/s]
Training...:  21% 2974/13907 [1:50:10<6:37:07,  2.18s/it][A
Training...:  21% 2975/13907 [1:50:10<6:48:58,  2.24s/it][A
Training...:  21% 2976/13907 [1:50:12<6:41:00,  2.20s/it][A
Training...:  21% 2977/13907 [1:50:14<6:31:33,  2.15s/it][A
Training...:  21% 2978/13907 [1:50:16<6:23:11,  2.10s/it][A
Training...:  21% 2979/13907 [1:50:18<6:17:19,  2.07s/it][A
Training...:  21% 2980/13907 [1:50:20<6:10:49,  2.04s/it][A
Training...:  21% 2981/13907 [1:50:22<6:05:01,  2.00s/it][A
Training...:  21% 2982/13907 [1:50:23<5:58:55,  1.97s/it][A
Training...:  21% 2983/13907 [1:50:25<5:53:22,  1.94s/it][A
Training...:  21% 2984/13907 [1:50:27<5:46:59,  1.91s/it][A
Training...:  21% 2985/13907 [1:50:29<5:40:52,  1.87s/it][A
Training...:  21% 2986/13907 [1:50:31<5:33:36,  1.83s/it][A
Training...:  21% 2987/13907 [1:50:32<5:27:58,  1.80s/it][A
Training...:  21% 2988/13907 [1:50:34<5:22:05,  1.77s/it][A
Training...:  21% 2989/13907 [1:50:36<5:15:48,  1.74s/it][A
Training...:  21% 2990/13907 [1:50:37<5:10:06,  1.70s/it][A
Training...:  22% 2991/13907 [1:50:39<5:04:11,  1.67s/it][A
Training...:  22% 2992/13907 [1:50:41<4:58:04,  1.64s/it][A
Training...:  22% 2993/13907 [1:50:42<4:50:52,  1.60s/it][A
Training...:  22% 2994/13907 [1:50:43<4:44:24,  1.56s/it][A
Training...:  22% 2995/13907 [1:50:45<4:36:57,  1.52s/it][A
Training...:  22% 2996/13907 [1:50:46<4:29:07,  1.48s/it][A
Training...:  22% 2997/13907 [1:50:48<4:19:21,  1.43s/it][A
Training...:  22% 2998/13907 [1:50:49<4:08:50,  1.37s/it][A
Training...:  22% 2999/13907 [1:50:50<3:57:20,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:51:04<?, ?it/s]
Training...:  22% 2999/13907 [1:50:51<3:57:20,  1.31s/it][A
Training...:  22% 3000/13907 [1:50:51<3:52:24,  1.28s/it][A
Training...:  22% 3001/13907 [1:50:55<6:04:47,  2.01s/it][A
Training...:  22% 3002/13907 [1:50:58<7:18:41,  2.41s/it][A
Training...:  22% 3003/13907 [1:51:01<7:56:52,  2.62s/it][A
Training...:  22% 3004/13907 [1:51:04<8:20:11,  2.75s/it][A
Training...:  22% 3005/13907 [1:51:07<8:31:16,  2.81s/it][A
Training...:  22% 3006/13907 [1:51:10<8:35:09,  2.84s/it][A
Training...:  22% 3007/13907 [1:51:13<8:33:40,  2.83s/it][A
Training...:  22% 3008/13907 [1:51:16<8:26:49,  2.79s/it][A
Training...:  22% 3009/13907 [1:51:18<8:20:36,  2.76s/it][A
Training...:  22% 3010/13907 [1:51:21<8:11:35,  2.71s/it][A
Training...:  22% 3011/13907 [1:51:24<8:03:47,  2.66s/it][A
Training...:  22% 3012/13907 [1:51:26<7:55:12,  2.62s/it][A
Training...:  22% 3013/13907 [1:51:29<7:45:43,  2.57s/it][A
Training...:  22% 3014/13907 [1:51:31<7:37:34,  2.52s/it][A
Training...:  22% 3015/13907 [1:51:33<7:31:22,  2.49s/it][A
Training...:  22% 3016/13907 [1:51:36<7:26:03,  2.46s/it][A
Training...:  22% 3017/13907 [1:51:38<7:19:00,  2.42s/it][A
Training...:  22% 3018/13907 [1:51:40<7:13:55,  2.39s/it][A
Training...:  22% 3019/13907 [1:51:43<7:08:24,  2.36s/it][A
Training...:  22% 3020/13907 [1:51:45<7:03:11,  2.33s/it][A
Training...:  22% 3021/13907 [1:51:47<6:58:50,  2.31s/it][A
Training...:  22% 3022/13907 [1:51:49<6:51:46,  2.27s/it][A
Training...:  22% 3023/13907 [1:51:52<6:45:08,  2.23s/it][A
Training...:  22% 3024/13907 [1:51:54<6:38:13,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:52:08<?, ?it/s]
Training...:  22% 3024/13907 [1:51:56<6:38:13,  2.20s/it][A
Training...:  22% 3025/13907 [1:51:56<6:48:53,  2.25s/it][A
Training...:  22% 3026/13907 [1:51:58<6:40:09,  2.21s/it][A
Training...:  22% 3027/13907 [1:52:00<6:30:25,  2.15s/it][A
Training...:  22% 3028/13907 [1:52:02<6:23:18,  2.11s/it][A
Training...:  22% 3029/13907 [1:52:04<6:16:26,  2.08s/it][A
Training...:  22% 3030/13907 [1:52:06<6:12:17,  2.05s/it][A
Training...:  22% 3031/13907 [1:52:08<6:04:53,  2.01s/it][A
Training...:  22% 3032/13907 [1:52:10<5:58:14,  1.98s/it][A
Training...:  22% 3033/13907 [1:52:12<5:53:37,  1.95s/it][A
Training...:  22% 3034/13907 [1:52:14<5:46:49,  1.91s/it][A
Training...:  22% 3035/13907 [1:52:16<5:41:17,  1.88s/it][A
Training...:  22% 3036/13907 [1:52:17<5:34:28,  1.85s/it][A
Training...:  22% 3037/13907 [1:52:19<5:28:26,  1.81s/it][A
Training...:  22% 3038/13907 [1:52:21<5:21:46,  1.78s/it][A
Training...:  22% 3039/13907 [1:52:22<5:15:30,  1.74s/it][A
Training...:  22% 3040/13907 [1:52:24<5:08:50,  1.71s/it][A
Training...:  22% 3041/13907 [1:52:26<5:02:34,  1.67s/it][A
Training...:  22% 3042/13907 [1:52:27<4:56:40,  1.64s/it][A
Training...:  22% 3043/13907 [1:52:29<4:49:47,  1.60s/it][A
Training...:  22% 3044/13907 [1:52:30<4:44:06,  1.57s/it][A
Training...:  22% 3045/13907 [1:52:32<4:36:45,  1.53s/it][A
Training...:  22% 3046/13907 [1:52:33<4:26:57,  1.47s/it][A
Training...:  22% 3047/13907 [1:52:34<4:19:14,  1.43s/it][A
Training...:  22% 3048/13907 [1:52:36<4:08:08,  1.37s/it][A
Training...:  22% 3049/13907 [1:52:37<3:55:30,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:52:50<?, ?it/s]
Training...:  22% 3049/13907 [1:52:38<3:55:30,  1.30s/it][A
Training...:  22% 3050/13907 [1:52:38<3:49:59,  1.27s/it][A
Training...:  22% 3051/13907 [1:52:42<6:04:13,  2.01s/it][A
Training...:  22% 3052/13907 [1:52:45<7:14:34,  2.40s/it][A
Training...:  22% 3053/13907 [1:52:48<7:55:48,  2.63s/it][A
Training...:  22% 3054/13907 [1:52:51<8:19:55,  2.76s/it][A
Training...:  22% 3055/13907 [1:52:54<8:32:24,  2.83s/it][A
Training...:  22% 3056/13907 [1:52:57<8:38:20,  2.87s/it][A
Training...:  22% 3057/13907 [1:53:00<8:38:19,  2.87s/it][A
Training...:  22% 3058/13907 [1:53:03<8:30:05,  2.82s/it][A
Training...:  22% 3059/13907 [1:53:05<8:22:59,  2.78s/it][A
Training...:  22% 3060/13907 [1:53:08<8:13:54,  2.73s/it][A
Training...:  22% 3061/13907 [1:53:11<8:06:30,  2.69s/it][A
Training...:  22% 3062/13907 [1:53:13<7:56:14,  2.63s/it][A
Training...:  22% 3063/13907 [1:53:16<7:47:57,  2.59s/it][A
Training...:  22% 3064/13907 [1:53:18<7:39:08,  2.54s/it][A
Training...:  22% 3065/13907 [1:53:20<7:30:24,  2.49s/it][A
Training...:  22% 3066/13907 [1:53:23<7:22:31,  2.45s/it][A
Training...:  22% 3067/13907 [1:53:25<7:15:03,  2.41s/it][A
Training...:  22% 3068/13907 [1:53:27<7:06:49,  2.36s/it][A
Training...:  22% 3069/13907 [1:53:30<7:02:21,  2.34s/it][A
Training...:  22% 3070/13907 [1:53:32<6:57:21,  2.31s/it][A
Training...:  22% 3071/13907 [1:53:34<6:52:07,  2.28s/it][A
Training...:  22% 3072/13907 [1:53:36<6:45:16,  2.24s/it][A
Training...:  22% 3073/13907 [1:53:38<6:39:30,  2.21s/it][A
Training...:  22% 3074/13907 [1:53:40<6:33:58,  2.18s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:53:55<?, ?it/s]
Training...:  22% 3074/13907 [1:53:43<6:33:58,  2.18s/it][A
Training...:  22% 3075/13907 [1:53:43<6:44:37,  2.24s/it][A
Training...:  22% 3076/13907 [1:53:45<6:36:27,  2.20s/it][A
Training...:  22% 3077/13907 [1:53:47<6:27:05,  2.14s/it][A
Training...:  22% 3078/13907 [1:53:49<6:20:45,  2.11s/it][A
Training...:  22% 3079/13907 [1:53:51<6:13:23,  2.07s/it][A
Training...:  22% 3080/13907 [1:53:53<6:06:10,  2.03s/it][A
Training...:  22% 3081/13907 [1:53:55<6:00:15,  2.00s/it][A
Training...:  22% 3082/13907 [1:53:57<5:53:19,  1.96s/it][A
Training...:  22% 3083/13907 [1:53:59<5:48:11,  1.93s/it][A
Training...:  22% 3084/13907 [1:54:00<5:42:55,  1.90s/it][A
Training...:  22% 3085/13907 [1:54:02<5:37:10,  1.87s/it][A
Training...:  22% 3086/13907 [1:54:04<5:31:36,  1.84s/it][A
Training...:  22% 3087/13907 [1:54:06<5:26:32,  1.81s/it][A
Training...:  22% 3088/13907 [1:54:07<5:20:35,  1.78s/it][A
Training...:  22% 3089/13907 [1:54:09<5:14:29,  1.74s/it][A
Training...:  22% 3090/13907 [1:54:11<5:08:56,  1.71s/it][A
Training...:  22% 3091/13907 [1:54:12<5:02:46,  1.68s/it][A
Training...:  22% 3092/13907 [1:54:14<4:56:21,  1.64s/it][A
Training...:  22% 3093/13907 [1:54:15<4:49:41,  1.61s/it][A
Training...:  22% 3094/13907 [1:54:17<4:42:52,  1.57s/it][A
Training...:  22% 3095/13907 [1:54:18<4:36:18,  1.53s/it][A
Training...:  22% 3096/13907 [1:54:20<4:28:25,  1.49s/it][A
Training...:  22% 3097/13907 [1:54:21<4:18:39,  1.44s/it][A
Training...:  22% 3098/13907 [1:54:22<4:08:12,  1.38s/it][A
Training...:  22% 3099/13907 [1:54:23<3:55:58,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:54:37<?, ?it/s]
Training...:  22% 3099/13907 [1:54:25<3:55:58,  1.31s/it][A
Training...:  22% 3100/13907 [1:54:25<3:50:26,  1.28s/it][A
Training...:  22% 3101/13907 [1:54:28<6:01:08,  2.01s/it][A
Training...:  22% 3102/13907 [1:54:32<7:16:36,  2.42s/it][A
Training...:  22% 3103/13907 [1:54:35<7:56:44,  2.65s/it][A
Training...:  22% 3104/13907 [1:54:38<8:17:52,  2.77s/it][A
Training...:  22% 3105/13907 [1:54:41<8:36:35,  2.87s/it][A
Training...:  22% 3106/13907 [1:54:44<8:34:24,  2.86s/it][A
Training...:  22% 3107/13907 [1:54:47<8:27:49,  2.82s/it][A
Training...:  22% 3108/13907 [1:54:49<8:21:40,  2.79s/it][A
Training...:  22% 3109/13907 [1:54:52<8:14:55,  2.75s/it][A
Training...:  22% 3110/13907 [1:54:55<8:05:02,  2.70s/it][A
Training...:  22% 3111/13907 [1:54:57<7:58:06,  2.66s/it][A
Training...:  22% 3112/13907 [1:55:00<7:48:43,  2.61s/it][A
Training...:  22% 3113/13907 [1:55:02<7:42:22,  2.57s/it][A
Training...:  22% 3114/13907 [1:55:04<7:33:52,  2.52s/it][A
Training...:  22% 3115/13907 [1:55:07<7:27:57,  2.49s/it][A
Training...:  22% 3116/13907 [1:55:09<7:20:50,  2.45s/it][A
Training...:  22% 3117/13907 [1:55:12<7:15:18,  2.42s/it][A
Training...:  22% 3118/13907 [1:55:14<7:12:23,  2.40s/it][A
Training...:  22% 3119/13907 [1:55:16<7:06:01,  2.37s/it][A
Training...:  22% 3120/13907 [1:55:19<7:01:28,  2.34s/it][A
Training...:  22% 3121/13907 [1:55:21<6:55:26,  2.31s/it][A
Training...:  22% 3122/13907 [1:55:23<6:47:17,  2.27s/it][A
Training...:  22% 3123/13907 [1:55:25<6:40:18,  2.23s/it][A
Training...:  22% 3124/13907 [1:55:27<6:33:54,  2.19s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:55:42<?, ?it/s]
Training...:  22% 3124/13907 [1:55:30<6:33:54,  2.19s/it][A
Training...:  22% 3125/13907 [1:55:30<6:43:56,  2.25s/it][A
Training...:  22% 3126/13907 [1:55:32<6:35:21,  2.20s/it][A
Training...:  22% 3127/13907 [1:55:34<6:24:36,  2.14s/it][A
Training...:  22% 3128/13907 [1:55:36<6:15:34,  2.09s/it][A
Training...:  22% 3129/13907 [1:55:38<6:07:13,  2.04s/it][A
Training...:  23% 3130/13907 [1:55:39<6:00:52,  2.01s/it][A
Training...:  23% 3131/13907 [1:55:41<5:53:12,  1.97s/it][A
Training...:  23% 3132/13907 [1:55:43<5:47:44,  1.94s/it][A
Training...:  23% 3133/13907 [1:55:45<5:42:50,  1.91s/it][A
Training...:  23% 3134/13907 [1:55:47<5:38:26,  1.88s/it][A
Training...:  23% 3135/13907 [1:55:49<5:34:01,  1.86s/it][A
Training...:  23% 3136/13907 [1:55:50<5:29:01,  1.83s/it][A
Training...:  23% 3137/13907 [1:55:52<5:24:21,  1.81s/it][A
Training...:  23% 3138/13907 [1:55:54<5:19:28,  1.78s/it][A
Training...:  23% 3139/13907 [1:55:56<5:14:25,  1.75s/it][A
Training...:  23% 3140/13907 [1:55:57<5:08:51,  1.72s/it][A
Training...:  23% 3141/13907 [1:55:59<5:02:16,  1.68s/it][A
Training...:  23% 3142/13907 [1:56:00<4:55:58,  1.65s/it][A
Training...:  23% 3143/13907 [1:56:02<4:51:02,  1.62s/it][A
Training...:  23% 3144/13907 [1:56:03<4:43:30,  1.58s/it][A
Training...:  23% 3145/13907 [1:56:05<4:36:25,  1.54s/it][A
Training...:  23% 3146/13907 [1:56:06<4:29:30,  1.50s/it][A
Training...:  23% 3147/13907 [1:56:08<4:20:12,  1.45s/it][A
Training...:  23% 3148/13907 [1:56:09<4:09:34,  1.39s/it][A
Training...:  23% 3149/13907 [1:56:10<3:56:30,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:56:24<?, ?it/s]
Training...:  23% 3149/13907 [1:56:11<3:56:30,  1.32s/it][A
Training...:  23% 3150/13907 [1:56:11<3:50:38,  1.29s/it][A
Training...:  23% 3151/13907 [1:56:15<5:59:57,  2.01s/it][A
Training...:  23% 3152/13907 [1:56:18<7:14:52,  2.43s/it][A
Training...:  23% 3153/13907 [1:56:22<7:54:45,  2.65s/it][A
Training...:  23% 3154/13907 [1:56:25<8:15:03,  2.76s/it][A
Training...:  23% 3155/13907 [1:56:28<8:30:24,  2.85s/it][A
Training...:  23% 3156/13907 [1:56:31<8:35:10,  2.88s/it][A
Training...:  23% 3157/13907 [1:56:33<8:35:27,  2.88s/it][A
Training...:  23% 3158/13907 [1:56:36<8:32:16,  2.86s/it][A
Training...:  23% 3159/13907 [1:56:39<8:21:28,  2.80s/it][A
Training...:  23% 3160/13907 [1:56:42<8:12:03,  2.75s/it][A
Training...:  23% 3161/13907 [1:56:44<8:04:38,  2.71s/it][A
Training...:  23% 3162/13907 [1:56:47<7:54:50,  2.65s/it][A
Training...:  23% 3163/13907 [1:56:49<7:47:18,  2.61s/it][A
Training...:  23% 3164/13907 [1:56:52<7:38:35,  2.56s/it][A
Training...:  23% 3165/13907 [1:56:54<7:30:34,  2.52s/it][A
Training...:  23% 3166/13907 [1:56:56<7:24:59,  2.49s/it][A
Training...:  23% 3167/13907 [1:56:59<7:17:30,  2.44s/it][A
Training...:  23% 3168/13907 [1:57:01<7:09:53,  2.40s/it][A
Training...:  23% 3169/13907 [1:57:03<7:05:43,  2.38s/it][A
Training...:  23% 3170/13907 [1:57:06<6:59:03,  2.34s/it][A
Training...:  23% 3171/13907 [1:57:08<6:53:06,  2.31s/it][A
Training...:  23% 3172/13907 [1:57:10<6:48:58,  2.29s/it][A
Training...:  23% 3173/13907 [1:57:12<6:45:36,  2.27s/it][A
Training...:  23% 3174/13907 [1:57:15<6:38:54,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:57:29<?, ?it/s]
Training...:  23% 3174/13907 [1:57:17<6:38:54,  2.23s/it][A
Training...:  23% 3175/13907 [1:57:17<6:49:54,  2.29s/it][A
Training...:  23% 3176/13907 [1:57:19<6:54:56,  2.32s/it][A
Training...:  23% 3177/13907 [1:57:21<6:42:59,  2.25s/it][A
Training...:  23% 3178/13907 [1:57:24<6:34:19,  2.21s/it][A
Training...:  23% 3179/13907 [1:57:26<6:27:25,  2.17s/it][A
Training...:  23% 3180/13907 [1:57:28<6:20:31,  2.13s/it][A
Training...:  23% 3181/13907 [1:57:30<6:13:07,  2.09s/it][A
Training...:  23% 3182/13907 [1:57:32<6:06:56,  2.05s/it][A
Training...:  23% 3183/13907 [1:57:34<6:01:30,  2.02s/it][A
Training...:  23% 3184/13907 [1:57:35<5:53:01,  1.98s/it][A
Training...:  23% 3185/13907 [1:57:37<5:44:54,  1.93s/it][A
Training...:  23% 3186/13907 [1:57:39<5:37:41,  1.89s/it][A
Training...:  23% 3187/13907 [1:57:41<5:31:02,  1.85s/it][A
Training...:  23% 3188/13907 [1:57:43<5:24:25,  1.82s/it][A
Training...:  23% 3189/13907 [1:57:44<5:17:23,  1.78s/it][A
Training...:  23% 3190/13907 [1:57:46<5:12:46,  1.75s/it][A
Training...:  23% 3191/13907 [1:57:48<5:06:20,  1.72s/it][A
Training...:  23% 3192/13907 [1:57:49<4:58:30,  1.67s/it][A
Training...:  23% 3193/13907 [1:57:51<4:51:04,  1.63s/it][A
Training...:  23% 3194/13907 [1:57:52<4:44:06,  1.59s/it][A
Training...:  23% 3195/13907 [1:57:54<4:36:43,  1.55s/it][A
Training...:  23% 3196/13907 [1:57:55<4:28:04,  1.50s/it][A
Training...:  23% 3197/13907 [1:57:56<4:18:51,  1.45s/it][A
Training...:  23% 3198/13907 [1:57:58<4:07:52,  1.39s/it][A
Training...:  23% 3199/13907 [1:57:59<3:54:39,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:58:12<?, ?it/s]
Training...:  23% 3199/13907 [1:58:00<3:54:39,  1.31s/it][A
Training...:  23% 3200/13907 [1:58:00<3:48:38,  1.28s/it][A
Training...:  23% 3201/13907 [1:58:04<5:59:07,  2.01s/it][A
Training...:  23% 3202/13907 [1:58:07<7:10:20,  2.41s/it][A
Training...:  23% 3203/13907 [1:58:10<7:56:10,  2.67s/it][A
Training...:  23% 3204/13907 [1:58:13<8:20:49,  2.81s/it][A
Training...:  23% 3205/13907 [1:58:16<8:33:47,  2.88s/it][A
Training...:  23% 3206/13907 [1:58:19<8:33:02,  2.88s/it][A
Training...:  23% 3207/13907 [1:58:22<8:33:29,  2.88s/it][A
Training...:  23% 3208/13907 [1:58:25<8:29:57,  2.86s/it][A
Training...:  23% 3209/13907 [1:58:28<8:20:14,  2.81s/it][A
Training...:  23% 3210/13907 [1:58:30<8:10:47,  2.75s/it][A
Training...:  23% 3211/13907 [1:58:33<8:01:40,  2.70s/it][A
Training...:  23% 3212/13907 [1:58:35<7:52:18,  2.65s/it][A
Training...:  23% 3213/13907 [1:58:38<7:43:03,  2.60s/it][A
Training...:  23% 3214/13907 [1:58:40<7:34:19,  2.55s/it][A
Training...:  23% 3215/13907 [1:58:43<7:26:11,  2.50s/it][A
Training...:  23% 3216/13907 [1:58:45<7:17:41,  2.46s/it][A
Training...:  23% 3217/13907 [1:58:47<7:09:53,  2.41s/it][A
Training...:  23% 3218/13907 [1:58:50<7:02:51,  2.37s/it][A
Training...:  23% 3219/13907 [1:58:52<6:56:29,  2.34s/it][A
Training...:  23% 3220/13907 [1:58:54<6:50:05,  2.30s/it][A
Training...:  23% 3221/13907 [1:58:56<6:44:39,  2.27s/it][A
Training...:  23% 3222/13907 [1:58:58<6:37:18,  2.23s/it][A
Training...:  23% 3223/13907 [1:59:01<6:31:55,  2.20s/it][A
Training...:  23% 3224/13907 [1:59:03<6:26:21,  2.17s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:59:17<?, ?it/s]
Training...:  23% 3224/13907 [1:59:05<6:26:21,  2.17s/it][A
Training...:  23% 3225/13907 [1:59:05<6:38:18,  2.24s/it][A
Training...:  23% 3226/13907 [1:59:07<6:30:23,  2.19s/it][A
Training...:  23% 3227/13907 [1:59:09<6:20:59,  2.14s/it][A
Training...:  23% 3228/13907 [1:59:11<6:12:05,  2.09s/it][A
Training...:  23% 3229/13907 [1:59:13<6:05:52,  2.06s/it][A
Training...:  23% 3230/13907 [1:59:15<5:58:35,  2.02s/it][A
Training...:  23% 3231/13907 [1:59:17<5:53:02,  1.98s/it][A
Training...:  23% 3232/13907 [1:59:19<5:47:48,  1.95s/it][A
Training...:  23% 3233/13907 [1:59:21<5:41:57,  1.92s/it][A
Training...:  23% 3234/13907 [1:59:23<5:36:19,  1.89s/it][A
Training...:  23% 3235/13907 [1:59:24<5:30:18,  1.86s/it][A
Training...:  23% 3236/13907 [1:59:26<5:23:54,  1.82s/it][A
Training...:  23% 3237/13907 [1:59:28<5:18:37,  1.79s/it][A
Training...:  23% 3238/13907 [1:59:29<5:12:44,  1.76s/it][A
Training...:  23% 3239/13907 [1:59:31<5:07:07,  1.73s/it][A
Training...:  23% 3240/13907 [1:59:33<5:00:54,  1.69s/it][A
Training...:  23% 3241/13907 [1:59:34<4:55:11,  1.66s/it][A
Training...:  23% 3242/13907 [1:59:36<4:50:40,  1.64s/it][A
Training...:  23% 3243/13907 [1:59:37<4:44:10,  1.60s/it][A
Training...:  23% 3244/13907 [1:59:39<4:38:22,  1.57s/it][A
Training...:  23% 3245/13907 [1:59:40<4:31:12,  1.53s/it][A
Training...:  23% 3246/13907 [1:59:42<4:23:14,  1.48s/it][A
Training...:  23% 3247/13907 [1:59:43<4:14:48,  1.43s/it][A
Training...:  23% 3248/13907 [1:59:44<4:05:45,  1.38s/it][A
Training...:  23% 3249/13907 [1:59:45<3:55:13,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [1:59:59<?, ?it/s]
Training...:  23% 3249/13907 [1:59:47<3:55:13,  1.32s/it][A
Training...:  23% 3250/13907 [1:59:47<3:49:57,  1.29s/it][A
Training...:  23% 3251/13907 [1:59:50<6:01:49,  2.04s/it][A
Training...:  23% 3252/13907 [1:59:54<7:14:08,  2.44s/it][A
Training...:  23% 3253/13907 [1:59:57<7:51:46,  2.66s/it][A
Training...:  23% 3254/13907 [2:00:00<8:12:56,  2.78s/it][A
Training...:  23% 3255/13907 [2:00:03<8:25:56,  2.85s/it][A
Training...:  23% 3256/13907 [2:00:06<8:28:29,  2.86s/it][A
Training...:  23% 3257/13907 [2:00:09<8:26:46,  2.86s/it][A
Training...:  23% 3258/13907 [2:00:12<8:26:08,  2.85s/it][A
Training...:  23% 3259/13907 [2:00:14<8:21:54,  2.83s/it][A
Training...:  23% 3260/13907 [2:00:17<8:14:06,  2.78s/it][A
Training...:  23% 3261/13907 [2:00:20<8:05:17,  2.74s/it][A
Training...:  23% 3262/13907 [2:00:22<7:56:51,  2.69s/it][A
Training...:  23% 3263/13907 [2:00:25<7:49:12,  2.64s/it][A
Training...:  23% 3264/13907 [2:00:27<7:45:45,  2.63s/it][A
Training...:  23% 3265/13907 [2:00:30<7:40:19,  2.60s/it][A
Training...:  23% 3266/13907 [2:00:32<7:31:35,  2.55s/it][A
Training...:  23% 3267/13907 [2:00:35<7:25:55,  2.51s/it][A
Training...:  23% 3268/13907 [2:00:37<7:18:25,  2.47s/it][A
Training...:  24% 3269/13907 [2:00:40<7:10:30,  2.43s/it][A
Training...:  24% 3270/13907 [2:00:42<7:04:40,  2.40s/it][A
Training...:  24% 3271/13907 [2:00:44<6:58:46,  2.36s/it][A
Training...:  24% 3272/13907 [2:00:46<6:49:43,  2.31s/it][A
Training...:  24% 3273/13907 [2:00:49<6:43:21,  2.28s/it][A
Training...:  24% 3274/13907 [2:00:51<6:36:05,  2.24s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:01:05<?, ?it/s]
Training...:  24% 3274/13907 [2:00:53<6:36:05,  2.24s/it][A
Training...:  24% 3275/13907 [2:00:53<6:45:15,  2.29s/it][A
Training...:  24% 3276/13907 [2:00:55<6:36:37,  2.24s/it][A
Training...:  24% 3277/13907 [2:00:57<6:23:57,  2.17s/it][A
Training...:  24% 3278/13907 [2:00:59<6:14:21,  2.11s/it][A
Training...:  24% 3279/13907 [2:01:01<6:06:21,  2.07s/it][A
Training...:  24% 3280/13907 [2:01:03<5:58:49,  2.03s/it][A
Training...:  24% 3281/13907 [2:01:05<5:53:10,  1.99s/it][A
Training...:  24% 3282/13907 [2:01:07<5:46:32,  1.96s/it][A
Training...:  24% 3283/13907 [2:01:09<5:41:35,  1.93s/it][A
Training...:  24% 3284/13907 [2:01:11<5:35:24,  1.89s/it][A
Training...:  24% 3285/13907 [2:01:12<5:29:59,  1.86s/it][A
Training...:  24% 3286/13907 [2:01:14<5:24:39,  1.83s/it][A
Training...:  24% 3287/13907 [2:01:16<5:19:26,  1.80s/it][A
Training...:  24% 3288/13907 [2:01:18<5:14:59,  1.78s/it][A
Training...:  24% 3289/13907 [2:01:19<5:08:57,  1.75s/it][A
Training...:  24% 3290/13907 [2:01:21<5:03:34,  1.72s/it][A
Training...:  24% 3291/13907 [2:01:23<4:57:30,  1.68s/it][A
Training...:  24% 3292/13907 [2:01:24<4:51:19,  1.65s/it][A
Training...:  24% 3293/13907 [2:01:26<4:45:01,  1.61s/it][A
Training...:  24% 3294/13907 [2:01:27<4:38:09,  1.57s/it][A
Training...:  24% 3295/13907 [2:01:29<4:31:31,  1.54s/it][A
Training...:  24% 3296/13907 [2:01:30<4:23:19,  1.49s/it][A
Training...:  24% 3297/13907 [2:01:31<4:13:58,  1.44s/it][A
Training...:  24% 3298/13907 [2:01:32<4:04:29,  1.38s/it][A
Training...:  24% 3299/13907 [2:01:34<3:52:41,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:01:47<?, ?it/s]
Training...:  24% 3299/13907 [2:01:35<3:52:41,  1.32s/it][A
Training...:  24% 3300/13907 [2:01:35<3:45:57,  1.28s/it][A
Training...:  24% 3301/13907 [2:01:38<5:50:44,  1.98s/it][A
Training...:  24% 3302/13907 [2:01:42<7:01:07,  2.38s/it][A
Training...:  24% 3303/13907 [2:01:45<7:41:46,  2.61s/it][A
Training...:  24% 3304/13907 [2:01:48<8:02:33,  2.73s/it][A
Training...:  24% 3305/13907 [2:01:51<8:12:41,  2.79s/it][A
Training...:  24% 3306/13907 [2:01:54<8:13:27,  2.79s/it][A
Training...:  24% 3307/13907 [2:01:56<8:12:57,  2.79s/it][A
Training...:  24% 3308/13907 [2:01:59<8:06:53,  2.76s/it][A
Training...:  24% 3309/13907 [2:02:02<8:00:31,  2.72s/it][A
Training...:  24% 3310/13907 [2:02:04<7:51:37,  2.67s/it][A
Training...:  24% 3311/13907 [2:02:07<7:46:48,  2.64s/it][A
Training...:  24% 3312/13907 [2:02:09<7:39:56,  2.60s/it][A
Training...:  24% 3313/13907 [2:02:12<7:32:22,  2.56s/it][A
Training...:  24% 3314/13907 [2:02:14<7:23:36,  2.51s/it][A
Training...:  24% 3315/13907 [2:02:17<7:15:11,  2.47s/it][A
Training...:  24% 3316/13907 [2:02:19<7:08:51,  2.43s/it][A
Training...:  24% 3317/13907 [2:02:21<7:03:25,  2.40s/it][A
Training...:  24% 3318/13907 [2:02:24<6:57:10,  2.36s/it][A
Training...:  24% 3319/13907 [2:02:26<6:51:36,  2.33s/it][A
Training...:  24% 3320/13907 [2:02:28<6:45:17,  2.30s/it][A
Training...:  24% 3321/13907 [2:02:30<6:40:23,  2.27s/it][A
Training...:  24% 3322/13907 [2:02:32<6:34:19,  2.24s/it][A
Training...:  24% 3323/13907 [2:02:35<6:29:15,  2.21s/it][A
Training...:  24% 3324/13907 [2:02:37<6:22:19,  2.17s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:02:51<?, ?it/s]
Training...:  24% 3324/13907 [2:02:39<6:22:19,  2.17s/it][A
Training...:  24% 3325/13907 [2:02:39<6:32:18,  2.22s/it][A
Training...:  24% 3326/13907 [2:02:41<6:26:47,  2.19s/it][A
Training...:  24% 3327/13907 [2:02:43<6:15:36,  2.13s/it][A
Training...:  24% 3328/13907 [2:02:45<6:07:29,  2.08s/it][A
Training...:  24% 3329/13907 [2:02:47<6:01:13,  2.05s/it][A
Training...:  24% 3330/13907 [2:02:49<5:56:54,  2.02s/it][A
Training...:  24% 3331/13907 [2:02:51<5:52:41,  2.00s/it][A
Training...:  24% 3332/13907 [2:02:53<5:46:08,  1.96s/it][A
Training...:  24% 3333/13907 [2:02:55<5:39:52,  1.93s/it][A
Training...:  24% 3334/13907 [2:02:56<5:33:07,  1.89s/it][A
Training...:  24% 3335/13907 [2:02:58<5:28:00,  1.86s/it][A
Training...:  24% 3336/13907 [2:03:00<5:21:22,  1.82s/it][A
Training...:  24% 3337/13907 [2:03:02<5:16:30,  1.80s/it][A
Training...:  24% 3338/13907 [2:03:03<5:14:21,  1.78s/it][A
Training...:  24% 3339/13907 [2:03:05<5:06:41,  1.74s/it][A
Training...:  24% 3340/13907 [2:03:07<5:01:53,  1.71s/it][A
Training...:  24% 3341/13907 [2:03:08<4:55:12,  1.68s/it][A
Training...:  24% 3342/13907 [2:03:10<4:49:13,  1.64s/it][A
Training...:  24% 3343/13907 [2:03:11<4:42:11,  1.60s/it][A
Training...:  24% 3344/13907 [2:03:13<4:35:10,  1.56s/it][A
Training...:  24% 3345/13907 [2:03:14<4:26:37,  1.51s/it][A
Training...:  24% 3346/13907 [2:03:16<4:17:59,  1.47s/it][A
Training...:  24% 3347/13907 [2:03:17<4:09:15,  1.42s/it][A
Training...:  24% 3348/13907 [2:03:18<3:59:32,  1.36s/it][A
Training...:  24% 3349/13907 [2:03:19<3:48:31,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:03:33<?, ?it/s]
Training...:  24% 3349/13907 [2:03:21<3:48:31,  1.30s/it][A
Training...:  24% 3350/13907 [2:03:21<3:43:25,  1.27s/it][A
Training...:  24% 3351/13907 [2:03:24<5:49:52,  1.99s/it][A
Training...:  24% 3352/13907 [2:03:28<7:01:01,  2.39s/it][A
Training...:  24% 3353/13907 [2:03:31<7:41:39,  2.62s/it][A
Training...:  24% 3354/13907 [2:03:34<8:02:13,  2.74s/it][A
Training...:  24% 3355/13907 [2:03:37<8:13:30,  2.81s/it][A
Training...:  24% 3356/13907 [2:03:40<8:16:02,  2.82s/it][A
Training...:  24% 3357/13907 [2:03:42<8:15:26,  2.82s/it][A
Training...:  24% 3358/13907 [2:03:45<8:10:14,  2.79s/it][A
Training...:  24% 3359/13907 [2:03:48<8:04:32,  2.76s/it][A
Training...:  24% 3360/13907 [2:03:50<7:57:08,  2.71s/it][A
Training...:  24% 3361/13907 [2:03:53<7:50:17,  2.68s/it][A
Training...:  24% 3362/13907 [2:03:55<7:41:46,  2.63s/it][A
Training...:  24% 3363/13907 [2:03:58<7:34:53,  2.59s/it][A
Training...:  24% 3364/13907 [2:04:00<7:25:46,  2.54s/it][A
Training...:  24% 3365/13907 [2:04:03<7:18:57,  2.50s/it][A
Training...:  24% 3366/13907 [2:04:05<7:12:12,  2.46s/it][A
Training...:  24% 3367/13907 [2:04:07<7:04:35,  2.42s/it][A
Training...:  24% 3368/13907 [2:04:10<6:57:52,  2.38s/it][A
Training...:  24% 3369/13907 [2:04:12<6:51:15,  2.34s/it][A
Training...:  24% 3370/13907 [2:04:14<6:46:18,  2.31s/it][A
Training...:  24% 3371/13907 [2:04:16<6:41:38,  2.29s/it][A
Training...:  24% 3372/13907 [2:04:19<6:35:49,  2.25s/it][A
Training...:  24% 3373/13907 [2:04:21<6:29:31,  2.22s/it][A
Training...:  24% 3374/13907 [2:04:23<6:23:45,  2.19s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:04:38<?, ?it/s]
Training...:  24% 3374/13907 [2:04:25<6:23:45,  2.19s/it][A
Training...:  24% 3375/13907 [2:04:25<6:35:58,  2.26s/it][A
Training...:  24% 3376/13907 [2:04:27<6:28:11,  2.21s/it][A
Training...:  24% 3377/13907 [2:04:29<6:19:04,  2.16s/it][A
Training...:  24% 3378/13907 [2:04:31<6:10:57,  2.11s/it][A
Training...:  24% 3379/13907 [2:04:33<6:04:14,  2.08s/it][A
Training...:  24% 3380/13907 [2:04:35<5:56:47,  2.03s/it][A
Training...:  24% 3381/13907 [2:04:37<5:51:07,  2.00s/it][A
Training...:  24% 3382/13907 [2:04:39<5:44:18,  1.96s/it][A
Training...:  24% 3383/13907 [2:04:41<5:39:11,  1.93s/it][A
Training...:  24% 3384/13907 [2:04:43<5:33:40,  1.90s/it][A
Training...:  24% 3385/13907 [2:04:45<5:27:40,  1.87s/it][A
Training...:  24% 3386/13907 [2:04:46<5:22:45,  1.84s/it][A
Training...:  24% 3387/13907 [2:04:48<5:18:50,  1.82s/it][A
Training...:  24% 3388/13907 [2:04:50<5:13:38,  1.79s/it][A
Training...:  24% 3389/13907 [2:04:52<5:08:02,  1.76s/it][A
Training...:  24% 3390/13907 [2:04:53<5:01:00,  1.72s/it][A
Training...:  24% 3391/13907 [2:04:55<4:54:46,  1.68s/it][A
Training...:  24% 3392/13907 [2:04:56<4:48:02,  1.64s/it][A
Training...:  24% 3393/13907 [2:04:58<4:41:07,  1.60s/it][A
Training...:  24% 3394/13907 [2:04:59<4:34:07,  1.56s/it][A
Training...:  24% 3395/13907 [2:05:01<4:26:38,  1.52s/it][A
Training...:  24% 3396/13907 [2:05:02<4:18:26,  1.48s/it][A
Training...:  24% 3397/13907 [2:05:03<4:08:45,  1.42s/it][A
Training...:  24% 3398/13907 [2:05:05<3:58:45,  1.36s/it][A
Training...:  24% 3399/13907 [2:05:06<3:47:28,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:05:19<?, ?it/s]
Training...:  24% 3399/13907 [2:05:07<3:47:28,  1.30s/it][A
Training...:  24% 3400/13907 [2:05:07<3:43:35,  1.28s/it][A
Training...:  24% 3401/13907 [2:05:11<5:49:44,  2.00s/it][A
Training...:  24% 3402/13907 [2:05:14<7:00:55,  2.40s/it][A
Training...:  24% 3403/13907 [2:05:17<7:42:24,  2.64s/it][A
Training...:  24% 3404/13907 [2:05:20<8:02:53,  2.76s/it][A
Training...:  24% 3405/13907 [2:05:23<8:12:02,  2.81s/it][A
Training...:  24% 3406/13907 [2:05:26<8:15:30,  2.83s/it][A
Training...:  24% 3407/13907 [2:05:29<8:13:19,  2.82s/it][A
Training...:  25% 3408/13907 [2:05:32<8:07:51,  2.79s/it][A
Training...:  25% 3409/13907 [2:05:34<8:04:38,  2.77s/it][A
Training...:  25% 3410/13907 [2:05:37<7:56:14,  2.72s/it][A
Training...:  25% 3411/13907 [2:05:40<7:48:14,  2.68s/it][A
Training...:  25% 3412/13907 [2:05:42<7:41:02,  2.64s/it][A
Training...:  25% 3413/13907 [2:05:45<7:36:52,  2.61s/it][A
Training...:  25% 3414/13907 [2:05:47<7:28:44,  2.57s/it][A
Training...:  25% 3415/13907 [2:05:50<7:24:22,  2.54s/it][A
Training...:  25% 3416/13907 [2:05:52<7:18:37,  2.51s/it][A
Training...:  25% 3417/13907 [2:05:54<7:10:01,  2.46s/it][A
Training...:  25% 3418/13907 [2:05:57<7:03:25,  2.42s/it][A
Training...:  25% 3419/13907 [2:05:59<6:56:59,  2.39s/it][A
Training...:  25% 3420/13907 [2:06:01<6:49:49,  2.34s/it][A
Training...:  25% 3421/13907 [2:06:04<6:44:18,  2.31s/it][A
Training...:  25% 3422/13907 [2:06:06<6:38:06,  2.28s/it][A
Training...:  25% 3423/13907 [2:06:08<6:31:36,  2.24s/it][A
Training...:  25% 3424/13907 [2:06:10<6:24:55,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:06:25<?, ?it/s]
Training...:  25% 3424/13907 [2:06:12<6:24:55,  2.20s/it][A
Training...:  25% 3425/13907 [2:06:12<6:36:32,  2.27s/it][A
Training...:  25% 3426/13907 [2:06:15<6:29:02,  2.23s/it][A
Training...:  25% 3427/13907 [2:06:17<6:18:56,  2.17s/it][A
Training...:  25% 3428/13907 [2:06:19<6:09:58,  2.12s/it][A
Training...:  25% 3429/13907 [2:06:21<6:02:10,  2.07s/it][A
Training...:  25% 3430/13907 [2:06:23<5:56:46,  2.04s/it][A
Training...:  25% 3431/13907 [2:06:24<5:49:48,  2.00s/it][A
Training...:  25% 3432/13907 [2:06:26<5:42:50,  1.96s/it][A
Training...:  25% 3433/13907 [2:06:28<5:37:35,  1.93s/it][A
Training...:  25% 3434/13907 [2:06:30<5:33:01,  1.91s/it][A
Training...:  25% 3435/13907 [2:06:32<5:27:45,  1.88s/it][A
Training...:  25% 3436/13907 [2:06:34<5:22:51,  1.85s/it][A
Training...:  25% 3437/13907 [2:06:35<5:18:00,  1.82s/it][A
Training...:  25% 3438/13907 [2:06:37<5:11:14,  1.78s/it][A
Training...:  25% 3439/13907 [2:06:39<5:04:32,  1.75s/it][A
Training...:  25% 3440/13907 [2:06:40<4:57:15,  1.70s/it][A
Training...:  25% 3441/13907 [2:06:42<4:50:52,  1.67s/it][A
Training...:  25% 3442/13907 [2:06:43<4:44:34,  1.63s/it][A
Training...:  25% 3443/13907 [2:06:45<4:38:49,  1.60s/it][A
Training...:  25% 3444/13907 [2:06:46<4:32:21,  1.56s/it][A
Training...:  25% 3445/13907 [2:06:48<4:24:47,  1.52s/it][A
Training...:  25% 3446/13907 [2:06:49<4:16:47,  1.47s/it][A
Training...:  25% 3447/13907 [2:06:51<4:08:14,  1.42s/it][A
Training...:  25% 3448/13907 [2:06:52<3:57:53,  1.36s/it][A
Training...:  25% 3449/13907 [2:06:53<3:46:22,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:07:06<?, ?it/s]
Training...:  25% 3449/13907 [2:06:54<3:46:22,  1.30s/it][A
Training...:  25% 3450/13907 [2:06:54<3:39:59,  1.26s/it][A
Training...:  25% 3451/13907 [2:06:58<5:45:39,  1.98s/it][A
Training...:  25% 3452/13907 [2:07:01<6:56:52,  2.39s/it][A
Training...:  25% 3453/13907 [2:07:04<7:36:46,  2.62s/it][A
Training...:  25% 3454/13907 [2:07:07<7:57:55,  2.74s/it][A
Training...:  25% 3455/13907 [2:07:10<8:07:35,  2.80s/it][A
Training...:  25% 3456/13907 [2:07:13<8:10:55,  2.82s/it][A
Training...:  25% 3457/13907 [2:07:16<8:10:32,  2.82s/it][A
Training...:  25% 3458/13907 [2:07:19<8:07:36,  2.80s/it][A
Training...:  25% 3459/13907 [2:07:21<8:01:04,  2.76s/it][A
Training...:  25% 3460/13907 [2:07:24<7:54:03,  2.72s/it][A
Training...:  25% 3461/13907 [2:07:26<7:44:41,  2.67s/it][A
Training...:  25% 3462/13907 [2:07:29<7:36:59,  2.63s/it][A
Training...:  25% 3463/13907 [2:07:32<7:30:20,  2.59s/it][A
Training...:  25% 3464/13907 [2:07:34<7:22:21,  2.54s/it][A
Training...:  25% 3465/13907 [2:07:36<7:14:14,  2.50s/it][A
Training...:  25% 3466/13907 [2:07:39<7:09:05,  2.47s/it][A
Training...:  25% 3467/13907 [2:07:41<7:02:58,  2.43s/it][A
Training...:  25% 3468/13907 [2:07:43<6:56:37,  2.39s/it][A
Training...:  25% 3469/13907 [2:07:46<6:51:52,  2.37s/it][A
Training...:  25% 3470/13907 [2:07:48<6:45:45,  2.33s/it][A
Training...:  25% 3471/13907 [2:07:50<6:41:50,  2.31s/it][A
Training...:  25% 3472/13907 [2:07:52<6:36:44,  2.28s/it][A
Training...:  25% 3473/13907 [2:07:55<6:31:39,  2.25s/it][A
Training...:  25% 3474/13907 [2:07:57<6:27:04,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:08:12<?, ?it/s]
Training...:  25% 3474/13907 [2:07:59<6:27:04,  2.23s/it][A
Training...:  25% 3475/13907 [2:07:59<6:37:16,  2.28s/it][A
Training...:  25% 3476/13907 [2:08:01<6:28:04,  2.23s/it][A
Training...:  25% 3477/13907 [2:08:03<6:18:25,  2.18s/it][A
Training...:  25% 3478/13907 [2:08:05<6:11:14,  2.14s/it][A
Training...:  25% 3479/13907 [2:08:07<6:04:52,  2.10s/it][A
Training...:  25% 3480/13907 [2:08:09<5:57:55,  2.06s/it][A
Training...:  25% 3481/13907 [2:08:11<5:50:59,  2.02s/it][A
Training...:  25% 3482/13907 [2:08:13<5:45:57,  1.99s/it][A
Training...:  25% 3483/13907 [2:08:15<5:40:50,  1.96s/it][A
Training...:  25% 3484/13907 [2:08:17<5:37:59,  1.95s/it][A
Training...:  25% 3485/13907 [2:08:19<5:31:38,  1.91s/it][A
Training...:  25% 3486/13907 [2:08:21<5:26:16,  1.88s/it][A
Training...:  25% 3487/13907 [2:08:22<5:21:28,  1.85s/it][A
Training...:  25% 3488/13907 [2:08:24<5:14:52,  1.81s/it][A
Training...:  25% 3489/13907 [2:08:26<5:09:29,  1.78s/it][A
Training...:  25% 3490/13907 [2:08:28<5:02:26,  1.74s/it][A
Training...:  25% 3491/13907 [2:08:29<4:55:33,  1.70s/it][A
Training...:  25% 3492/13907 [2:08:31<4:48:13,  1.66s/it][A
Training...:  25% 3493/13907 [2:08:32<4:42:17,  1.63s/it][A
Training...:  25% 3494/13907 [2:08:34<4:35:23,  1.59s/it][A
Training...:  25% 3495/13907 [2:08:35<4:28:41,  1.55s/it][A
Training...:  25% 3496/13907 [2:08:37<4:20:29,  1.50s/it][A
Training...:  25% 3497/13907 [2:08:38<4:10:50,  1.45s/it][A
Training...:  25% 3498/13907 [2:08:39<4:00:42,  1.39s/it][A
Training...:  25% 3499/13907 [2:08:40<3:48:50,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:08:54<?, ?it/s]
Training...:  25% 3499/13907 [2:08:42<3:48:50,  1.32s/it][A
Training...:  25% 3500/13907 [2:08:42<3:44:41,  1.30s/it][A
Training...:  25% 3501/13907 [2:08:45<5:53:49,  2.04s/it][A
Training...:  25% 3502/13907 [2:08:49<7:06:26,  2.46s/it][A
Training...:  25% 3503/13907 [2:08:52<7:44:42,  2.68s/it][A
Training...:  25% 3504/13907 [2:08:55<8:07:36,  2.81s/it][A
Training...:  25% 3505/13907 [2:08:58<8:16:29,  2.86s/it][A
Training...:  25% 3506/13907 [2:09:01<8:15:34,  2.86s/it][A
Training...:  25% 3507/13907 [2:09:04<8:13:11,  2.85s/it][A
Training...:  25% 3508/13907 [2:09:07<8:09:10,  2.82s/it][A
Training...:  25% 3509/13907 [2:09:09<8:03:40,  2.79s/it][A
Training...:  25% 3510/13907 [2:09:12<7:56:24,  2.75s/it][A
Training...:  25% 3511/13907 [2:09:14<7:48:01,  2.70s/it][A
Training...:  25% 3512/13907 [2:09:17<7:39:18,  2.65s/it][A
Training...:  25% 3513/13907 [2:09:19<7:30:34,  2.60s/it][A
Training...:  25% 3514/13907 [2:09:22<7:21:54,  2.55s/it][A
Training...:  25% 3515/13907 [2:09:24<7:15:05,  2.51s/it][A
Training...:  25% 3516/13907 [2:09:27<7:08:26,  2.47s/it][A
Training...:  25% 3517/13907 [2:09:29<7:02:36,  2.44s/it][A
Training...:  25% 3518/13907 [2:09:31<6:56:18,  2.40s/it][A
Training...:  25% 3519/13907 [2:09:34<6:49:22,  2.36s/it][A
Training...:  25% 3520/13907 [2:09:36<6:44:26,  2.34s/it][A
Training...:  25% 3521/13907 [2:09:38<6:37:42,  2.30s/it][A
Training...:  25% 3522/13907 [2:09:40<6:31:51,  2.26s/it][A
Training...:  25% 3523/13907 [2:09:42<6:25:05,  2.23s/it][A
Training...:  25% 3524/13907 [2:09:45<6:20:22,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:09:59<?, ?it/s]
Training...:  25% 3524/13907 [2:09:47<6:20:22,  2.20s/it][A
Training...:  25% 3525/13907 [2:09:47<6:32:41,  2.27s/it][A
Training...:  25% 3526/13907 [2:09:49<6:26:00,  2.23s/it][A
Training...:  25% 3527/13907 [2:09:51<6:16:35,  2.18s/it][A
Training...:  25% 3528/13907 [2:09:53<6:09:46,  2.14s/it][A
Training...:  25% 3529/13907 [2:09:55<6:01:26,  2.09s/it][A
Training...:  25% 3530/13907 [2:09:57<5:53:56,  2.05s/it][A
Training...:  25% 3531/13907 [2:09:59<5:47:32,  2.01s/it][A
Training...:  25% 3532/13907 [2:10:01<5:41:03,  1.97s/it][A
Training...:  25% 3533/13907 [2:10:03<5:35:37,  1.94s/it][A
Training...:  25% 3534/13907 [2:10:05<5:30:11,  1.91s/it][A
Training...:  25% 3535/13907 [2:10:07<5:24:55,  1.88s/it][A
Training...:  25% 3536/13907 [2:10:08<5:19:17,  1.85s/it][A
Training...:  25% 3537/13907 [2:10:10<5:14:49,  1.82s/it][A
Training...:  25% 3538/13907 [2:10:12<5:10:54,  1.80s/it][A
Training...:  25% 3539/13907 [2:10:14<5:06:40,  1.77s/it][A
Training...:  25% 3540/13907 [2:10:15<5:01:19,  1.74s/it][A
Training...:  25% 3541/13907 [2:10:17<4:56:27,  1.72s/it][A
Training...:  25% 3542/13907 [2:10:18<4:50:23,  1.68s/it][A
Training...:  25% 3543/13907 [2:10:20<4:44:46,  1.65s/it][A
Training...:  25% 3544/13907 [2:10:22<4:40:16,  1.62s/it][A
Training...:  25% 3545/13907 [2:10:23<4:32:08,  1.58s/it][A
Training...:  25% 3546/13907 [2:10:24<4:24:52,  1.53s/it][A
Training...:  26% 3547/13907 [2:10:26<4:15:18,  1.48s/it][A
Training...:  26% 3548/13907 [2:10:27<4:05:30,  1.42s/it][A
Training...:  26% 3549/13907 [2:10:28<3:52:20,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:10:42<?, ?it/s]
Training...:  26% 3549/13907 [2:10:30<3:52:20,  1.35s/it][A
Training...:  26% 3550/13907 [2:10:30<3:45:59,  1.31s/it][A
Training...:  26% 3551/13907 [2:10:33<5:56:29,  2.07s/it][A
Training...:  26% 3552/13907 [2:10:37<7:08:01,  2.48s/it][A
Training...:  26% 3553/13907 [2:10:40<7:45:36,  2.70s/it][A
Training...:  26% 3554/13907 [2:10:43<8:04:51,  2.81s/it][A
Training...:  26% 3555/13907 [2:10:46<8:12:54,  2.86s/it][A
Training...:  26% 3556/13907 [2:10:49<8:14:10,  2.86s/it][A
Training...:  26% 3557/13907 [2:10:52<8:10:38,  2.84s/it][A
Training...:  26% 3558/13907 [2:10:54<8:04:51,  2.81s/it][A
Training...:  26% 3559/13907 [2:10:57<7:58:34,  2.77s/it][A
Training...:  26% 3560/13907 [2:11:00<7:49:55,  2.73s/it][A
Training...:  26% 3561/13907 [2:11:02<7:41:45,  2.68s/it][A
Training...:  26% 3562/13907 [2:11:05<7:32:28,  2.62s/it][A
Training...:  26% 3563/13907 [2:11:07<7:25:06,  2.58s/it][A
Training...:  26% 3564/13907 [2:11:10<7:16:57,  2.53s/it][A
Training...:  26% 3565/13907 [2:11:12<7:11:42,  2.50s/it][A
Training...:  26% 3566/13907 [2:11:15<7:03:40,  2.46s/it][A
Training...:  26% 3567/13907 [2:11:17<6:56:51,  2.42s/it][A
Training...:  26% 3568/13907 [2:11:19<6:50:36,  2.38s/it][A
Training...:  26% 3569/13907 [2:11:21<6:46:01,  2.36s/it][A
Training...:  26% 3570/13907 [2:11:24<6:39:31,  2.32s/it][A
Training...:  26% 3571/13907 [2:11:26<6:34:29,  2.29s/it][A
Training...:  26% 3572/13907 [2:11:28<6:28:11,  2.25s/it][A
Training...:  26% 3573/13907 [2:11:30<6:22:38,  2.22s/it][A
Training...:  26% 3574/13907 [2:11:32<6:16:23,  2.19s/it][A                                            
                                                         [AStep... (1800 | Loss: 0.6978293657302856, Learning Rate: 0.00029212728259153664, Gradient Norm: 2.0010242462158203)
Step... (1825 | Loss: 0.5472574830055237, Learning Rate: 0.0002919757680501789, Gradient Norm: 1.1301038265228271)
Step... (1850 | Loss: 0.6337012052536011, Learning Rate: 0.00029182425350882113, Gradient Norm: 1.8181369304656982)
Step... (1875 | Loss: 0.46732097864151, Learning Rate: 0.0002916727389674634, Gradient Norm: 0.8997944593429565)
Step... (1900 | Loss: 0.593956708908081, Learning Rate: 0.0002915212244261056, Gradient Norm: 1.7906503677368164)
Step... (1925 | Loss: 0.4640756845474243, Learning Rate: 0.00029136970988474786, Gradient Norm: 1.089971661567688)
Step... (1950 | Loss: 0.5772274732589722, Learning Rate: 0.0002912181953433901, Gradient Norm: 2.147646903991699)
Step... (1975 | Loss: 0.49934878945350647, Learning Rate: 0.00029106668080203235, Gradient Norm: 1.1004698276519775)
Step... (2000 | Loss: 0.7690961360931396, Learning Rate: 0.0002909151662606746, Gradient Norm: 2.382781744003296)
Step... (2025 | Loss: 0.43770501017570496, Learning Rate: 0.00029076365171931684, Gradient Norm: 0.9125941395759583)
Step... (2050 | Loss: 0.6411051154136658, Learning Rate: 0.0002906121371779591, Gradient Norm: 2.3356573581695557)
Step... (2075 | Loss: 0.4145864248275757, Learning Rate: 0.00029046062263660133, Gradient Norm: 0.9490949511528015)
Step... (2100 | Loss: 1.0361984968185425, Learning Rate: 0.0002903091080952436, Gradient Norm: 3.170128345489502)
Step... (2125 | Loss: 0.4665517210960388, Learning Rate: 0.0002901575935538858, Gradient Norm: 0.957205593585968)
Step... (2150 | Loss: 0.5817217230796814, Learning Rate: 0.00029000607901252806, Gradient Norm: 2.187636137008667)
Step... (2175 | Loss: 0.38710394501686096, Learning Rate: 0.0002898545644711703, Gradient Norm: 0.9851716756820679)
Step... (2200 | Loss: 0.6310904026031494, Learning Rate: 0.00028970304992981255, Gradient Norm: 2.029205322265625)
Step... (2225 | Loss: 0.4785529375076294, Learning Rate: 0.0002895515353884548, Gradient Norm: 1.2231643199920654)
Step... (2250 | Loss: 0.6587331295013428, Learning Rate: 0.00028940002084709704, Gradient Norm: 1.7697904109954834)
Step... (2275 | Loss: 0.4396684765815735, Learning Rate: 0.0002892485063057393, Gradient Norm: 1.0930135250091553)
Step... (2300 | Loss: 0.678786039352417, Learning Rate: 0.00028909696266055107, Gradient Norm: 2.498936176300049)
Step... (2325 | Loss: 0.42974910140037537, Learning Rate: 0.00028894547722302377, Gradient Norm: 1.7281421422958374)
Step... (2350 | Loss: 0.5184593200683594, Learning Rate: 0.000288793962681666, Gradient Norm: 2.1045401096343994)
Step... (2375 | Loss: 0.5238255262374878, Learning Rate: 0.0002886424190364778, Gradient Norm: 1.292680263519287)
Step... (2400 | Loss: 0.6891995668411255, Learning Rate: 0.0002884909335989505, Gradient Norm: 2.3891937732696533)
Step... (2425 | Loss: 0.45717817544937134, Learning Rate: 0.00028833941905759275, Gradient Norm: 0.9768807888031006)
Step... (2450 | Loss: 0.5030912756919861, Learning Rate: 0.00028818787541240454, Gradient Norm: 2.0378482341766357)
Step... (2475 | Loss: 0.45990508794784546, Learning Rate: 0.00028803638997487724, Gradient Norm: 1.1318979263305664)
Step... (2500 | Loss: 0.5978463292121887, Learning Rate: 0.0002878848754335195, Gradient Norm: 2.1153724193573)
Step... (2525 | Loss: 0.3960564434528351, Learning Rate: 0.00028773333178833127, Gradient Norm: 0.9908939003944397)
Step... (2550 | Loss: 0.6662862300872803, Learning Rate: 0.00028758184635080397, Gradient Norm: 3.6523377895355225)
Step... (2575 | Loss: 0.40953582525253296, Learning Rate: 0.0002874303318094462, Gradient Norm: 0.9648922681808472)
Step... (2600 | Loss: 0.672416090965271, Learning Rate: 0.000287278788164258, Gradient Norm: 2.23461651802063)
Step... (2625 | Loss: 0.39090368151664734, Learning Rate: 0.00028712727362290025, Gradient Norm: 0.9665126800537109)
Step... (2650 | Loss: 0.6885042190551758, Learning Rate: 0.00028697578818537295, Gradient Norm: 1.8174450397491455)
Step... (2675 | Loss: 0.4123728Epoch ... (1/4):   0% 0/4 [2:11:47<?, ?it/s]
Training...:  26% 3574/13907 [2:11:35<6:16:23,  2.19s/it][A
Training...:  26% 3575/13907 [2:11:35<6:27:01,  2.25s/it][A573322296, Learning Rate: 0.00028682424454018474, Gradient Norm: 1.1184120178222656)
Step... (2700 | Loss: 0.5867893099784851, Learning Rate: 0.000286672729998827, Gradient Norm: 2.564655303955078)
Step... (2725 | Loss: 0.3634732961654663, Learning Rate: 0.0002865212445612997, Gradient Norm: 1.140446662902832)
Step... (2750 | Loss: 0.4960387945175171, Learning Rate: 0.00028636970091611147, Gradient Norm: 2.2194225788116455)
Step... (2775 | Loss: 0.452159583568573, Learning Rate: 0.0002862181863747537, Gradient Norm: 1.0929265022277832)
Step... (2800 | Loss: 0.6383284330368042, Learning Rate: 0.0002860667009372264, Gradient Norm: 2.4931979179382324)
Step... (2825 | Loss: 0.4347880780696869, Learning Rate: 0.0002859151572920382, Gradient Norm: 1.1227489709854126)
Step... (2850 | Loss: 0.5226588845252991, Learning Rate: 0.00028576364275068045, Gradient Norm: 2.017327308654785)
Step... (2875 | Loss: 0.4221178889274597, Learning Rate: 0.00028561215731315315, Gradient Norm: 1.1744664907455444)
Step... (2900 | Loss: 0.6765891313552856, Learning Rate: 0.00028546061366796494, Gradient Norm: 2.2728724479675293)
Step... (2925 | Loss: 0.3691360056400299, Learning Rate: 0.0002853090991266072, Gradient Norm: 1.0396571159362793)
Step... (2950 | Loss: 0.5809316635131836, Learning Rate: 0.0002851575845852494, Gradient Norm: 3.2051172256469727)
Step... (2975 | Loss: 0.4905562102794647, Learning Rate: 0.00028500607004389167, Gradient Norm: 1.3099851608276367)
Step... (3000 | Loss: 0.6900050640106201, Learning Rate: 0.0002848545555025339, Gradient Norm: 2.7156577110290527)
Step... (3025 | Loss: 0.38972440361976624, Learning Rate: 0.00028470304096117616, Gradient Norm: 1.1564626693725586)
Step... (3050 | Loss: 0.48105674982070923, Learning Rate: 0.0002845515264198184, Gradient Norm: 2.0513343811035156)
Step... (3075 | Loss: 0.41094738245010376, Learning Rate: 0.00028440001187846065, Gradient Norm: 0.958393394947052)
Step... (3100 | Loss: 0.5573859214782715, Learning Rate: 0.0002842484973371029, Gradient Norm: 2.312413215637207)
Step... (3125 | Loss: 0.3283689022064209, Learning Rate: 0.00028409698279574513, Gradient Norm: 1.0263142585754395)
Step... (3150 | Loss: 0.6974528431892395, Learning Rate: 0.0002839454682543874, Gradient Norm: 2.5025391578674316)
Step... (3175 | Loss: 0.402400940656662, Learning Rate: 0.0002837939537130296, Gradient Norm: 1.1224912405014038)
Step... (3200 | Loss: 0.6369305849075317, Learning Rate: 0.00028364243917167187, Gradient Norm: 2.698641300201416)
Step... (3225 | Loss: 0.40805625915527344, Learning Rate: 0.0002834909246303141, Gradient Norm: 1.0637365579605103)
Step... (3250 | Loss: 0.5417388081550598, Learning Rate: 0.00028333941008895636, Gradient Norm: 2.6534645557403564)
Step... (3275 | Loss: 0.31182295083999634, Learning Rate: 0.0002831878955475986, Gradient Norm: 1.0957961082458496)
Step... (3300 | Loss: 0.6028768420219421, Learning Rate: 0.00028303638100624084, Gradient Norm: 1.9402292966842651)
Step... (3325 | Loss: 0.4023550748825073, Learning Rate: 0.0002828848664648831, Gradient Norm: 1.1596357822418213)
Step... (3350 | Loss: 0.4744386076927185, Learning Rate: 0.00028273335192352533, Gradient Norm: 2.018648147583008)
Step... (3375 | Loss: 0.3794472813606262, Learning Rate: 0.0002825818373821676, Gradient Norm: 1.1930773258209229)
Step... (3400 | Loss: 0.5686264038085938, Learning Rate: 0.0002824303228408098, Gradient Norm: 2.828484535217285)
Step... (3425 | Loss: 0.31255874037742615, Learning Rate: 0.00028227880829945207, Gradient Norm: 1.0579535961151123)
Step... (3450 | Loss: 0.5982479453086853, Learning Rate: 0.0002821272937580943, Gradient Norm: 2.7494096755981445)
Step... (3475 | Loss: 0.34359002113342285, Learning Rate: 0.00028197577921673656, Gradient Norm: 1.1852035522460938)
Step... (3500 | Loss: 0.5755022764205933, Learning Rate: 0.0002818242646753788, Gradient Norm: 1.7318425178527832)
Step... (3525 | Loss: 0.364643394947052, Learning Rate: 0.00028167275013402104, Gradient Norm: 1.034223198890686)
Step... (3550 | Loss: 0.6293203830718994, Learning Rate: 0.00028152120648883283, Gradient Norm: 2.9400854110717773)

Training...:  26% 3576/13907 [2:11:37<6:21:22,  2.21s/it][A
Training...:  26% 3577/13907 [2:11:39<6:12:38,  2.16s/it][A
Training...:  26% 3578/13907 [2:11:41<6:04:43,  2.12s/it][A
Training...:  26% 3579/13907 [2:11:43<5:56:47,  2.07s/it][A
Training...:  26% 3580/13907 [2:11:45<5:49:57,  2.03s/it][A
Training...:  26% 3581/13907 [2:11:47<5:44:19,  2.00s/it][A
Training...:  26% 3582/13907 [2:11:49<5:39:08,  1.97s/it][A
Training...:  26% 3583/13907 [2:11:51<5:36:04,  1.95s/it][A
Training...:  26% 3584/13907 [2:11:52<5:31:25,  1.93s/it][A
Training...:  26% 3585/13907 [2:11:54<5:26:03,  1.90s/it][A
Training...:  26% 3586/13907 [2:11:56<5:20:05,  1.86s/it][A
Training...:  26% 3587/13907 [2:11:58<5:14:53,  1.83s/it][A
Training...:  26% 3588/13907 [2:11:59<5:09:27,  1.80s/it][A
Training...:  26% 3589/13907 [2:12:01<5:03:44,  1.77s/it][A
Training...:  26% 3590/13907 [2:12:03<4:56:34,  1.72s/it][A
Training...:  26% 3591/13907 [2:12:04<4:49:57,  1.69s/it][A
Training...:  26% 3592/13907 [2:12:06<4:43:41,  1.65s/it][A
Training...:  26% 3593/13907 [2:12:07<4:36:52,  1.61s/it][A
Training...:  26% 3594/13907 [2:12:09<4:29:28,  1.57s/it][A
Training...:  26% 3595/13907 [2:12:10<4:21:44,  1.52s/it][A
Training...:  26% 3596/13907 [2:12:12<4:13:29,  1.48s/it][A
Training...:  26% 3597/13907 [2:12:13<4:06:36,  1.44s/it][A
Training...:  26% 3598/13907 [2:12:14<3:58:23,  1.39s/it][A
Training...:  26% 3599/13907 [2:12:16<3:45:42,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:12:29<?, ?it/s]
Training...:  26% 3599/13907 [2:12:17<3:45:42,  1.31s/it][A
Training...:  26% 3600/13907 [2:12:17<3:40:08,  1.28s/it][A
Training...:  26% 3601/13907 [2:12:21<5:56:00,  2.07s/it][A
Training...:  26% 3602/13907 [2:12:24<7:03:10,  2.46s/it][A
Training...:  26% 3603/13907 [2:12:27<7:40:07,  2.68s/it][A
Training...:  26% 3604/13907 [2:12:30<7:56:11,  2.77s/it][A
Training...:  26% 3605/13907 [2:12:33<8:05:48,  2.83s/it][A
Training...:  26% 3606/13907 [2:12:36<8:04:32,  2.82s/it][A
Training...:  26% 3607/13907 [2:12:39<8:01:56,  2.81s/it][A
Training...:  26% 3608/13907 [2:12:41<7:55:49,  2.77s/it][A
Training...:  26% 3609/13907 [2:12:44<7:50:46,  2.74s/it][A
Training...:  26% 3610/13907 [2:12:47<7:43:57,  2.70s/it][A
Training...:  26% 3611/13907 [2:12:49<7:36:54,  2.66s/it][A
Training...:  26% 3612/13907 [2:12:52<7:28:29,  2.61s/it][A
Training...:  26% 3613/13907 [2:12:54<7:20:41,  2.57s/it][A
Training...:  26% 3614/13907 [2:12:57<7:13:56,  2.53s/it][A
Training...:  26% 3615/13907 [2:12:59<7:07:25,  2.49s/it][A
Training...:  26% 3616/13907 [2:13:01<7:00:54,  2.45s/it][A
Training...:  26% 3617/13907 [2:13:04<6:54:08,  2.41s/it][A
Training...:  26% 3618/13907 [2:13:06<6:47:52,  2.38s/it][A
Training...:  26% 3619/13907 [2:13:08<6:41:53,  2.34s/it][A
Training...:  26% 3620/13907 [2:13:11<6:35:45,  2.31s/it][A
Training...:  26% 3621/13907 [2:13:13<6:31:42,  2.28s/it][A
Training...:  26% 3622/13907 [2:13:15<6:26:27,  2.25s/it][A
Training...:  26% 3623/13907 [2:13:17<6:20:46,  2.22s/it][A
Training...:  26% 3624/13907 [2:13:19<6:15:24,  2.19s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:13:34<?, ?it/s]
Training...:  26% 3624/13907 [2:13:22<6:15:24,  2.19s/it][A
Training...:  26% 3625/13907 [2:13:22<6:25:03,  2.25s/it][A
Training...:  26% 3626/13907 [2:13:24<6:18:38,  2.21s/it][A
Training...:  26% 3627/13907 [2:13:26<6:09:31,  2.16s/it][A
Training...:  26% 3628/13907 [2:13:28<6:01:40,  2.11s/it][A
Training...:  26% 3629/13907 [2:13:30<5:54:11,  2.07s/it][A
Training...:  26% 3630/13907 [2:13:32<5:48:00,  2.03s/it][A
Training...:  26% 3631/13907 [2:13:34<5:43:02,  2.00s/it][A
Training...:  26% 3632/13907 [2:13:36<5:40:24,  1.99s/it][A
Training...:  26% 3633/13907 [2:13:37<5:36:33,  1.97s/it][A
Training...:  26% 3634/13907 [2:13:39<5:31:52,  1.94s/it][A
Training...:  26% 3635/13907 [2:13:41<5:27:41,  1.91s/it][A
Training...:  26% 3636/13907 [2:13:43<5:22:21,  1.88s/it][A
Training...:  26% 3637/13907 [2:13:45<5:17:29,  1.85s/it][A
Training...:  26% 3638/13907 [2:13:47<5:12:02,  1.82s/it][A
Training...:  26% 3639/13907 [2:13:48<5:06:14,  1.79s/it][A
Training...:  26% 3640/13907 [2:13:50<4:59:52,  1.75s/it][A
Training...:  26% 3641/13907 [2:13:52<4:55:01,  1.72s/it][A
Training...:  26% 3642/13907 [2:13:53<4:50:09,  1.70s/it][A
Training...:  26% 3643/13907 [2:13:55<4:44:18,  1.66s/it][A
Training...:  26% 3644/13907 [2:13:56<4:37:04,  1.62s/it][A
Training...:  26% 3645/13907 [2:13:58<4:29:02,  1.57s/it][A
Training...:  26% 3646/13907 [2:13:59<4:21:15,  1.53s/it][A
Training...:  26% 3647/13907 [2:14:01<4:12:19,  1.48s/it][A
Training...:  26% 3648/13907 [2:14:02<4:02:08,  1.42s/it][A
Training...:  26% 3649/13907 [2:14:03<3:51:45,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:14:17<?, ?it/s]
Training...:  26% 3649/13907 [2:14:04<3:51:45,  1.36s/it][A
Training...:  26% 3650/13907 [2:14:04<3:47:17,  1.33s/it][A
Training...:  26% 3651/13907 [2:14:08<5:51:48,  2.06s/it][A
Training...:  26% 3652/13907 [2:14:11<7:00:04,  2.46s/it][A
Training...:  26% 3653/13907 [2:14:15<7:38:27,  2.68s/it][A
Training...:  26% 3654/13907 [2:14:18<7:58:10,  2.80s/it][A
Training...:  26% 3655/13907 [2:14:21<8:10:02,  2.87s/it][A
Training...:  26% 3656/13907 [2:14:24<8:15:18,  2.90s/it][A
Training...:  26% 3657/13907 [2:14:27<8:15:12,  2.90s/it][A
Training...:  26% 3658/13907 [2:14:29<8:07:01,  2.85s/it][A
Training...:  26% 3659/13907 [2:14:32<8:01:20,  2.82s/it][A
Training...:  26% 3660/13907 [2:14:35<7:51:45,  2.76s/it][A
Training...:  26% 3661/13907 [2:14:37<7:43:35,  2.71s/it][A
Training...:  26% 3662/13907 [2:14:40<7:35:03,  2.67s/it][A
Training...:  26% 3663/13907 [2:14:42<7:25:39,  2.61s/it][A
Training...:  26% 3664/13907 [2:14:45<7:17:19,  2.56s/it][A
Training...:  26% 3665/13907 [2:14:47<7:10:43,  2.52s/it][A
Training...:  26% 3666/13907 [2:14:50<7:02:50,  2.48s/it][A
Training...:  26% 3667/13907 [2:14:52<6:56:27,  2.44s/it][A
Training...:  26% 3668/13907 [2:14:54<6:51:15,  2.41s/it][A
Training...:  26% 3669/13907 [2:14:57<6:45:00,  2.37s/it][A
Training...:  26% 3670/13907 [2:14:59<6:37:56,  2.33s/it][A
Training...:  26% 3671/13907 [2:15:01<6:31:27,  2.29s/it][A
Training...:  26% 3672/13907 [2:15:03<6:26:00,  2.26s/it][A
Training...:  26% 3673/13907 [2:15:05<6:20:30,  2.23s/it][A
Training...:  26% 3674/13907 [2:15:08<6:14:15,  2.19s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:15:22<?, ?it/s]
Training...:  26% 3674/13907 [2:15:10<6:14:15,  2.19s/it][A
Training...:  26% 3675/13907 [2:15:10<6:24:18,  2.25s/it][A
Training...:  26% 3676/13907 [2:15:12<6:17:05,  2.21s/it][A
Training...:  26% 3677/13907 [2:15:14<6:09:06,  2.16s/it][A
Training...:  26% 3678/13907 [2:15:16<6:00:21,  2.11s/it][A
Training...:  26% 3679/13907 [2:15:18<5:54:19,  2.08s/it][A
Training...:  26% 3680/13907 [2:15:20<5:48:16,  2.04s/it][A
Training...:  26% 3681/13907 [2:15:22<5:42:04,  2.01s/it][A
Training...:  26% 3682/13907 [2:15:24<5:36:14,  1.97s/it][A
Training...:  26% 3683/13907 [2:15:26<5:31:59,  1.95s/it][A
Training...:  26% 3684/13907 [2:15:28<5:25:19,  1.91s/it][A
Training...:  26% 3685/13907 [2:15:29<5:19:37,  1.88s/it][A
Training...:  27% 3686/13907 [2:15:31<5:12:53,  1.84s/it][A
Training...:  27% 3687/13907 [2:15:33<5:07:33,  1.81s/it][A
Training...:  27% 3688/13907 [2:15:35<5:02:29,  1.78s/it][A
Training...:  27% 3689/13907 [2:15:36<4:56:55,  1.74s/it][A
Training...:  27% 3690/13907 [2:15:38<4:51:29,  1.71s/it][A
Training...:  27% 3691/13907 [2:15:39<4:46:32,  1.68s/it][A
Training...:  27% 3692/13907 [2:15:41<4:39:53,  1.64s/it][A
Training...:  27% 3693/13907 [2:15:43<4:32:47,  1.60s/it][A
Training...:  27% 3694/13907 [2:15:44<4:26:15,  1.56s/it][A
Training...:  27% 3695/13907 [2:15:45<4:19:24,  1.52s/it][A
Training...:  27% 3696/13907 [2:15:47<4:11:04,  1.48s/it][A
Training...:  27% 3697/13907 [2:15:48<4:03:31,  1.43s/it][A
Training...:  27% 3698/13907 [2:15:49<3:54:17,  1.38s/it][A
Training...:  27% 3699/13907 [2:15:51<3:43:05,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:16:04<?, ?it/s]
Training...:  27% 3699/13907 [2:15:52<3:43:05,  1.31s/it][A
Training...:  27% 3700/13907 [2:15:52<3:38:13,  1.28s/it][A
Training...:  27% 3701/13907 [2:15:55<5:39:56,  2.00s/it][A
Training...:  27% 3702/13907 [2:15:59<6:50:32,  2.41s/it][A
Training...:  27% 3703/13907 [2:16:02<7:29:51,  2.65s/it][A
Training...:  27% 3704/13907 [2:16:05<7:50:25,  2.77s/it][A
Training...:  27% 3705/13907 [2:16:08<8:01:00,  2.83s/it][A
Training...:  27% 3706/13907 [2:16:11<8:06:48,  2.86s/it][A
Training...:  27% 3707/13907 [2:16:14<8:04:23,  2.85s/it][A
Training...:  27% 3708/13907 [2:16:16<7:57:10,  2.81s/it][A
Training...:  27% 3709/13907 [2:16:19<7:50:37,  2.77s/it][A
Training...:  27% 3710/13907 [2:16:22<7:42:34,  2.72s/it][A
Training...:  27% 3711/13907 [2:16:24<7:37:26,  2.69s/it][A
Training...:  27% 3712/13907 [2:16:27<7:32:59,  2.67s/it][A
Training...:  27% 3713/13907 [2:16:30<7:27:46,  2.64s/it][A
Training...:  27% 3714/13907 [2:16:32<7:18:47,  2.58s/it][A
Training...:  27% 3715/13907 [2:16:34<7:10:48,  2.54s/it][A
Training...:  27% 3716/13907 [2:16:37<7:03:16,  2.49s/it][A
Training...:  27% 3717/13907 [2:16:39<6:56:16,  2.45s/it][A
Training...:  27% 3718/13907 [2:16:42<6:49:07,  2.41s/it][A
Training...:  27% 3719/13907 [2:16:44<6:41:49,  2.37s/it][A
Training...:  27% 3720/13907 [2:16:46<6:35:48,  2.33s/it][A
Training...:  27% 3721/13907 [2:16:48<6:30:24,  2.30s/it][A
Training...:  27% 3722/13907 [2:16:50<6:25:23,  2.27s/it][A
Training...:  27% 3723/13907 [2:16:53<6:19:14,  2.23s/it][A
Training...:  27% 3724/13907 [2:16:55<6:12:49,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:17:09<?, ?it/s]
Training...:  27% 3724/13907 [2:16:57<6:12:49,  2.20s/it][A
Training...:  27% 3725/13907 [2:16:57<6:23:26,  2.26s/it][A
Training...:  27% 3726/13907 [2:16:59<6:14:37,  2.21s/it][A
Training...:  27% 3727/13907 [2:17:01<6:07:16,  2.16s/it][A
Training...:  27% 3728/13907 [2:17:03<5:57:45,  2.11s/it][A
Training...:  27% 3729/13907 [2:17:05<5:50:48,  2.07s/it][A
Training...:  27% 3730/13907 [2:17:07<5:43:18,  2.02s/it][A
Training...:  27% 3731/13907 [2:17:09<5:36:46,  1.99s/it][A
Training...:  27% 3732/13907 [2:17:11<5:30:20,  1.95s/it][A
Training...:  27% 3733/13907 [2:17:13<5:26:17,  1.92s/it][A
Training...:  27% 3734/13907 [2:17:15<5:22:41,  1.90s/it][A
Training...:  27% 3735/13907 [2:17:16<5:17:32,  1.87s/it][A
Training...:  27% 3736/13907 [2:17:18<5:12:47,  1.85s/it][A
Training...:  27% 3737/13907 [2:17:20<5:08:08,  1.82s/it][A
Training...:  27% 3738/13907 [2:17:22<5:02:26,  1.78s/it][A
Training...:  27% 3739/13907 [2:17:23<4:56:26,  1.75s/it][A
Training...:  27% 3740/13907 [2:17:25<4:51:33,  1.72s/it][A
Training...:  27% 3741/13907 [2:17:27<4:46:07,  1.69s/it][A
Training...:  27% 3742/13907 [2:17:28<4:41:04,  1.66s/it][A
Training...:  27% 3743/13907 [2:17:30<4:34:34,  1.62s/it][A
Training...:  27% 3744/13907 [2:17:31<4:27:11,  1.58s/it][A
Training...:  27% 3745/13907 [2:17:33<4:19:39,  1.53s/it][A
Training...:  27% 3746/13907 [2:17:34<4:10:53,  1.48s/it][A
Training...:  27% 3747/13907 [2:17:35<4:01:31,  1.43s/it][A
Training...:  27% 3748/13907 [2:17:36<3:51:05,  1.36s/it][A
Training...:  27% 3749/13907 [2:17:38<3:38:29,  1.29s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:17:51<?, ?it/s]
Training...:  27% 3749/13907 [2:17:39<3:38:29,  1.29s/it][A
Training...:  27% 3750/13907 [2:17:39<3:33:11,  1.26s/it][A
Training...:  27% 3751/13907 [2:17:42<5:36:10,  1.99s/it][A
Training...:  27% 3752/13907 [2:17:46<6:49:05,  2.42s/it][A
Training...:  27% 3753/13907 [2:17:49<7:26:24,  2.64s/it][A
Training...:  27% 3754/13907 [2:17:52<7:44:19,  2.74s/it][A
Training...:  27% 3755/13907 [2:17:55<7:55:20,  2.81s/it][A
Training...:  27% 3756/13907 [2:17:58<7:57:20,  2.82s/it][A
Training...:  27% 3757/13907 [2:18:01<7:53:43,  2.80s/it][A
Training...:  27% 3758/13907 [2:18:03<7:47:44,  2.77s/it][A
Training...:  27% 3759/13907 [2:18:06<7:42:38,  2.74s/it][A
Training...:  27% 3760/13907 [2:18:09<7:33:19,  2.68s/it][A
Training...:  27% 3761/13907 [2:18:11<7:27:46,  2.65s/it][A
Training...:  27% 3762/13907 [2:18:14<7:19:59,  2.60s/it][A
Training...:  27% 3763/13907 [2:18:16<7:12:06,  2.56s/it][A
Training...:  27% 3764/13907 [2:18:18<7:04:41,  2.51s/it][A
Training...:  27% 3765/13907 [2:18:21<6:57:04,  2.47s/it][A
Training...:  27% 3766/13907 [2:18:23<6:50:16,  2.43s/it][A
Training...:  27% 3767/13907 [2:18:25<6:42:46,  2.38s/it][A
Training...:  27% 3768/13907 [2:18:28<6:36:58,  2.35s/it][A
Training...:  27% 3769/13907 [2:18:30<6:32:21,  2.32s/it][A
Training...:  27% 3770/13907 [2:18:32<6:28:43,  2.30s/it][A
Training...:  27% 3771/13907 [2:18:34<6:24:37,  2.28s/it][A
Training...:  27% 3772/13907 [2:18:37<6:20:31,  2.25s/it][A
Training...:  27% 3773/13907 [2:18:39<6:15:19,  2.22s/it][A
Training...:  27% 3774/13907 [2:18:41<6:08:27,  2.18s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:18:56<?, ?it/s]
Training...:  27% 3774/13907 [2:18:43<6:08:27,  2.18s/it][A
Training...:  27% 3775/13907 [2:18:43<6:17:01,  2.23s/it][A
Training...:  27% 3776/13907 [2:18:45<6:09:14,  2.19s/it][A
Training...:  27% 3777/13907 [2:18:47<6:00:23,  2.13s/it][A
Training...:  27% 3778/13907 [2:18:49<5:51:36,  2.08s/it][A
Training...:  27% 3779/13907 [2:18:51<5:45:31,  2.05s/it][A
Training...:  27% 3780/13907 [2:18:53<5:38:48,  2.01s/it][A
Training...:  27% 3781/13907 [2:18:55<5:35:21,  1.99s/it][A
Training...:  27% 3782/13907 [2:18:57<5:31:23,  1.96s/it][A
Training...:  27% 3783/13907 [2:18:59<5:28:10,  1.94s/it][A
Training...:  27% 3784/13907 [2:19:01<5:21:17,  1.90s/it][A
Training...:  27% 3785/13907 [2:19:02<5:15:20,  1.87s/it][A
Training...:  27% 3786/13907 [2:19:04<5:09:24,  1.83s/it][A
Training...:  27% 3787/13907 [2:19:06<5:03:38,  1.80s/it][A
Training...:  27% 3788/13907 [2:19:08<4:56:48,  1.76s/it][A
Training...:  27% 3789/13907 [2:19:09<4:51:24,  1.73s/it][A
Training...:  27% 3790/13907 [2:19:11<4:46:11,  1.70s/it][A
Training...:  27% 3791/13907 [2:19:12<4:41:00,  1.67s/it][A
Training...:  27% 3792/13907 [2:19:14<4:34:39,  1.63s/it][A
Training...:  27% 3793/13907 [2:19:16<4:28:59,  1.60s/it][A
Training...:  27% 3794/13907 [2:19:17<4:22:47,  1.56s/it][A
Training...:  27% 3795/13907 [2:19:18<4:15:07,  1.51s/it][A
Training...:  27% 3796/13907 [2:19:20<4:07:41,  1.47s/it][A
Training...:  27% 3797/13907 [2:19:21<3:58:49,  1.42s/it][A
Training...:  27% 3798/13907 [2:19:22<3:49:50,  1.36s/it][A
Training...:  27% 3799/13907 [2:19:23<3:39:07,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:19:37<?, ?it/s]
Training...:  27% 3799/13907 [2:19:25<3:39:07,  1.30s/it][A
Training...:  27% 3800/13907 [2:19:25<3:35:08,  1.28s/it][A
Training...:  27% 3801/13907 [2:19:28<5:37:06,  2.00s/it][A
Training...:  27% 3802/13907 [2:19:32<6:49:27,  2.43s/it][A
Training...:  27% 3803/13907 [2:19:35<7:26:04,  2.65s/it][A
Training...:  27% 3804/13907 [2:19:38<7:44:59,  2.76s/it][A
Training...:  27% 3805/13907 [2:19:41<7:55:09,  2.82s/it][A
Training...:  27% 3806/13907 [2:19:44<7:55:07,  2.82s/it][A
Training...:  27% 3807/13907 [2:19:47<7:54:47,  2.82s/it][A
Training...:  27% 3808/13907 [2:19:49<7:49:27,  2.79s/it][A
Training...:  27% 3809/13907 [2:19:52<7:43:49,  2.76s/it][A
Training...:  27% 3810/13907 [2:19:55<7:36:57,  2.72s/it][A
Training...:  27% 3811/13907 [2:19:57<7:30:46,  2.68s/it][A
Training...:  27% 3812/13907 [2:20:00<7:24:26,  2.64s/it][A
Training...:  27% 3813/13907 [2:20:02<7:17:22,  2.60s/it][A
Training...:  27% 3814/13907 [2:20:05<7:09:19,  2.55s/it][A
Training...:  27% 3815/13907 [2:20:07<7:02:33,  2.51s/it][A
Training...:  27% 3816/13907 [2:20:10<6:55:40,  2.47s/it][A
Training...:  27% 3817/13907 [2:20:12<6:48:59,  2.43s/it][A
Training...:  27% 3818/13907 [2:20:14<6:42:35,  2.39s/it][A
Training...:  27% 3819/13907 [2:20:16<6:37:16,  2.36s/it][A
Training...:  27% 3820/13907 [2:20:19<6:30:22,  2.32s/it][A
Training...:  27% 3821/13907 [2:20:21<6:26:14,  2.30s/it][A
Training...:  27% 3822/13907 [2:20:23<6:20:25,  2.26s/it][A
Training...:  27% 3823/13907 [2:20:25<6:15:25,  2.23s/it][A
Training...:  27% 3824/13907 [2:20:27<6:07:52,  2.19s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:20:42<?, ?it/s]
Training...:  27% 3824/13907 [2:20:30<6:07:52,  2.19s/it][A
Training...:  28% 3825/13907 [2:20:30<6:18:02,  2.25s/it][A
Training...:  28% 3826/13907 [2:20:32<6:10:09,  2.20s/it][A
Training...:  28% 3827/13907 [2:20:34<6:01:36,  2.15s/it][A
Training...:  28% 3828/13907 [2:20:36<5:53:27,  2.10s/it][A
Training...:  28% 3829/13907 [2:20:38<5:46:12,  2.06s/it][A
Training...:  28% 3830/13907 [2:20:40<5:39:30,  2.02s/it][A
Training...:  28% 3831/13907 [2:20:42<5:33:46,  1.99s/it][A
Training...:  28% 3832/13907 [2:20:44<5:27:22,  1.95s/it][A
Training...:  28% 3833/13907 [2:20:45<5:23:25,  1.93s/it][A
Training...:  28% 3834/13907 [2:20:47<5:18:19,  1.90s/it][A
Training...:  28% 3835/13907 [2:20:49<5:12:11,  1.86s/it][A
Training...:  28% 3836/13907 [2:20:51<5:06:05,  1.82s/it][A
Training...:  28% 3837/13907 [2:20:52<5:00:58,  1.79s/it][A
Training...:  28% 3838/13907 [2:20:54<4:56:38,  1.77s/it][A
Training...:  28% 3839/13907 [2:20:56<4:52:10,  1.74s/it][A
Training...:  28% 3840/13907 [2:20:57<4:46:29,  1.71s/it][A
Training...:  28% 3841/13907 [2:20:59<4:41:10,  1.68s/it][A
Training...:  28% 3842/13907 [2:21:01<4:36:12,  1.65s/it][A
Training...:  28% 3843/13907 [2:21:02<4:31:54,  1.62s/it][A
Training...:  28% 3844/13907 [2:21:04<4:25:25,  1.58s/it][A
Training...:  28% 3845/13907 [2:21:05<4:17:51,  1.54s/it][A
Training...:  28% 3846/13907 [2:21:07<4:10:45,  1.50s/it][A
Training...:  28% 3847/13907 [2:21:08<4:02:28,  1.45s/it][A
Training...:  28% 3848/13907 [2:21:09<3:52:55,  1.39s/it][A
Training...:  28% 3849/13907 [2:21:10<3:41:38,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:21:24<?, ?it/s]
Training...:  28% 3849/13907 [2:21:12<3:41:38,  1.32s/it][A
Training...:  28% 3850/13907 [2:21:12<3:36:23,  1.29s/it][A
Training...:  28% 3851/13907 [2:21:15<5:40:57,  2.03s/it][A
Training...:  28% 3852/13907 [2:21:19<6:48:37,  2.44s/it][A
Training...:  28% 3853/13907 [2:21:22<7:25:18,  2.66s/it][A
Training...:  28% 3854/13907 [2:21:25<7:42:54,  2.76s/it][A
Training...:  28% 3855/13907 [2:21:28<7:52:04,  2.82s/it][A
Training...:  28% 3856/13907 [2:21:31<7:54:33,  2.83s/it][A
Training...:  28% 3857/13907 [2:21:33<7:53:25,  2.83s/it][A
Training...:  28% 3858/13907 [2:21:36<7:46:13,  2.78s/it][A
Training...:  28% 3859/13907 [2:21:39<7:38:49,  2.74s/it][A
Training...:  28% 3860/13907 [2:21:41<7:29:41,  2.69s/it][A
Training...:  28% 3861/13907 [2:21:44<7:23:11,  2.65s/it][A
Training...:  28% 3862/13907 [2:21:46<7:16:09,  2.61s/it][A
Training...:  28% 3863/13907 [2:21:49<7:09:20,  2.56s/it][A
Training...:  28% 3864/13907 [2:21:51<7:01:55,  2.52s/it][A
Training...:  28% 3865/13907 [2:21:54<6:54:46,  2.48s/it][A
Training...:  28% 3866/13907 [2:21:56<6:47:51,  2.44s/it][A
Training...:  28% 3867/13907 [2:21:58<6:42:30,  2.41s/it][A
Training...:  28% 3868/13907 [2:22:01<6:37:16,  2.37s/it][A
Training...:  28% 3869/13907 [2:22:03<6:31:25,  2.34s/it][A
Training...:  28% 3870/13907 [2:22:05<6:25:20,  2.30s/it][A
Training...:  28% 3871/13907 [2:22:07<6:18:27,  2.26s/it][A
Training...:  28% 3872/13907 [2:22:09<6:11:33,  2.22s/it][A
Training...:  28% 3873/13907 [2:22:12<6:05:50,  2.19s/it][A
Training...:  28% 3874/13907 [2:22:14<6:01:07,  2.16s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:22:28<?, ?it/s]
Training...:  28% 3874/13907 [2:22:16<6:01:07,  2.16s/it][A
Training...:  28% 3875/13907 [2:22:16<6:10:05,  2.21s/it][A
Training...:  28% 3876/13907 [2:22:18<6:02:37,  2.17s/it][A
Training...:  28% 3877/13907 [2:22:20<5:54:15,  2.12s/it][A
Training...:  28% 3878/13907 [2:22:22<5:45:42,  2.07s/it][A
Training...:  28% 3879/13907 [2:22:24<5:40:05,  2.03s/it][A
Training...:  28% 3880/13907 [2:22:26<5:32:49,  1.99s/it][A
Training...:  28% 3881/13907 [2:22:28<5:27:04,  1.96s/it][A
Training...:  28% 3882/13907 [2:22:30<5:22:09,  1.93s/it][A
Training...:  28% 3883/13907 [2:22:31<5:17:22,  1.90s/it][A
Training...:  28% 3884/13907 [2:22:33<5:12:24,  1.87s/it][A
Training...:  28% 3885/13907 [2:22:35<5:08:28,  1.85s/it][A
Training...:  28% 3886/13907 [2:22:37<5:04:43,  1.82s/it][A
Training...:  28% 3887/13907 [2:22:39<5:00:47,  1.80s/it][A
Training...:  28% 3888/13907 [2:22:40<4:55:03,  1.77s/it][A
Training...:  28% 3889/13907 [2:22:42<4:49:35,  1.73s/it][A
Training...:  28% 3890/13907 [2:22:43<4:43:47,  1.70s/it][A
Training...:  28% 3891/13907 [2:22:45<4:37:16,  1.66s/it][A
Training...:  28% 3892/13907 [2:22:47<4:31:29,  1.63s/it][A
Training...:  28% 3893/13907 [2:22:48<4:26:42,  1.60s/it][A
Training...:  28% 3894/13907 [2:22:50<4:20:13,  1.56s/it][A
Training...:  28% 3895/13907 [2:22:51<4:12:53,  1.52s/it][A
Training...:  28% 3896/13907 [2:22:52<4:04:48,  1.47s/it][A
Training...:  28% 3897/13907 [2:22:54<3:57:07,  1.42s/it][A
Training...:  28% 3898/13907 [2:22:55<3:48:05,  1.37s/it][A
Training...:  28% 3899/13907 [2:22:56<3:37:42,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:23:10<?, ?it/s]
Training...:  28% 3899/13907 [2:22:57<3:37:42,  1.31s/it][A
Training...:  28% 3900/13907 [2:22:57<3:33:07,  1.28s/it][A
Training...:  28% 3901/13907 [2:23:01<5:34:23,  2.01s/it][A
Training...:  28% 3902/13907 [2:23:04<6:41:42,  2.41s/it][A
Training...:  28% 3903/13907 [2:23:08<7:20:09,  2.64s/it][A
Training...:  28% 3904/13907 [2:23:11<7:39:27,  2.76s/it][A
Training...:  28% 3905/13907 [2:23:14<7:50:54,  2.82s/it][A
Training...:  28% 3906/13907 [2:23:16<7:52:20,  2.83s/it][A
Training...:  28% 3907/13907 [2:23:19<7:51:11,  2.83s/it][A
Training...:  28% 3908/13907 [2:23:22<7:49:55,  2.82s/it][A
Training...:  28% 3909/13907 [2:23:25<7:46:12,  2.80s/it][A
Training...:  28% 3910/13907 [2:23:27<7:37:09,  2.74s/it][A
Training...:  28% 3911/13907 [2:23:30<7:28:28,  2.69s/it][A
Training...:  28% 3912/13907 [2:23:32<7:19:26,  2.64s/it][A
Training...:  28% 3913/13907 [2:23:35<7:13:05,  2.60s/it][A
Training...:  28% 3914/13907 [2:23:37<7:06:50,  2.56s/it][A
Training...:  28% 3915/13907 [2:23:40<7:00:07,  2.52s/it][A
Training...:  28% 3916/13907 [2:23:42<6:53:35,  2.48s/it][A
Training...:  28% 3917/13907 [2:23:45<6:47:44,  2.45s/it][A
Training...:  28% 3918/13907 [2:23:47<6:41:46,  2.41s/it][A
Training...:  28% 3919/13907 [2:23:49<6:35:51,  2.38s/it][A
Training...:  28% 3920/13907 [2:23:52<6:29:12,  2.34s/it][A
Training...:  28% 3921/13907 [2:23:54<6:24:51,  2.31s/it][A
Training...:  28% 3922/13907 [2:23:56<6:19:17,  2.28s/it][A
Training...:  28% 3923/13907 [2:23:58<6:14:42,  2.25s/it][A
Training...:  28% 3924/13907 [2:24:00<6:08:42,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:24:15<?, ?it/s]
Training...:  28% 3924/13907 [2:24:03<6:08:42,  2.22s/it][A
Training...:  28% 3925/13907 [2:24:03<6:18:04,  2.27s/it][A
Training...:  28% 3926/13907 [2:24:05<6:10:30,  2.23s/it][A
Training...:  28% 3927/13907 [2:24:07<6:02:08,  2.18s/it][A
Training...:  28% 3928/13907 [2:24:09<5:53:15,  2.12s/it][A
Training...:  28% 3929/13907 [2:24:11<5:46:34,  2.08s/it][A
Training...:  28% 3930/13907 [2:24:13<5:40:04,  2.05s/it][A
Training...:  28% 3931/13907 [2:24:15<5:34:22,  2.01s/it][A
Training...:  28% 3932/13907 [2:24:17<5:27:54,  1.97s/it][A
Training...:  28% 3933/13907 [2:24:19<5:23:26,  1.95s/it][A
Training...:  28% 3934/13907 [2:24:20<5:19:43,  1.92s/it][A
Training...:  28% 3935/13907 [2:24:22<5:13:25,  1.89s/it][A
Training...:  28% 3936/13907 [2:24:24<5:08:08,  1.85s/it][A
Training...:  28% 3937/13907 [2:24:26<5:02:53,  1.82s/it][A
Training...:  28% 3938/13907 [2:24:27<4:57:47,  1.79s/it][A
Training...:  28% 3939/13907 [2:24:29<4:53:11,  1.76s/it][A
Training...:  28% 3940/13907 [2:24:31<4:48:09,  1.73s/it][A
Training...:  28% 3941/13907 [2:24:32<4:42:24,  1.70s/it][A
Training...:  28% 3942/13907 [2:24:34<4:36:53,  1.67s/it][A
Training...:  28% 3943/13907 [2:24:36<4:31:04,  1.63s/it][A
Training...:  28% 3944/13907 [2:24:37<4:24:54,  1.60s/it][A
Training...:  28% 3945/13907 [2:24:39<4:17:53,  1.55s/it][A
Training...:  28% 3946/13907 [2:24:40<4:09:34,  1.50s/it][A
Training...:  28% 3947/13907 [2:24:41<4:00:56,  1.45s/it][A
Training...:  28% 3948/13907 [2:24:43<3:51:35,  1.40s/it][A
Training...:  28% 3949/13907 [2:24:44<3:41:25,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:24:57<?, ?it/s]
Training...:  28% 3949/13907 [2:24:45<3:41:25,  1.33s/it][A
Training...:  28% 3950/13907 [2:24:45<3:36:13,  1.30s/it][A
Training...:  28% 3951/13907 [2:24:49<5:31:30,  2.00s/it][A
Training...:  28% 3952/13907 [2:24:52<6:37:06,  2.39s/it][A
Training...:  28% 3953/13907 [2:24:55<7:16:49,  2.63s/it][A
Training...:  28% 3954/13907 [2:24:58<7:37:59,  2.76s/it][A
Training...:  28% 3955/13907 [2:25:01<7:51:36,  2.84s/it][A
Training...:  28% 3956/13907 [2:25:04<7:51:58,  2.85s/it][A
Training...:  28% 3957/13907 [2:25:07<7:50:04,  2.83s/it][A
Training...:  28% 3958/13907 [2:25:10<7:44:14,  2.80s/it][A
Training...:  28% 3959/13907 [2:25:12<7:40:31,  2.78s/it][A
Training...:  28% 3960/13907 [2:25:15<7:32:34,  2.73s/it][A
Training...:  28% 3961/13907 [2:25:17<7:26:25,  2.69s/it][A
Training...:  28% 3962/13907 [2:25:20<7:20:43,  2.66s/it][A
Training...:  28% 3963/13907 [2:25:23<7:16:18,  2.63s/it][A
Training...:  29% 3964/13907 [2:25:25<7:12:25,  2.61s/it][A
Training...:  29% 3965/13907 [2:25:28<7:06:15,  2.57s/it][A
Training...:  29% 3966/13907 [2:25:30<6:57:53,  2.52s/it][A
Training...:  29% 3967/13907 [2:25:32<6:49:50,  2.47s/it][A
Training...:  29% 3968/13907 [2:25:35<6:41:31,  2.42s/it][A
Training...:  29% 3969/13907 [2:25:37<6:34:16,  2.38s/it][A
Training...:  29% 3970/13907 [2:25:39<6:27:11,  2.34s/it][A
Training...:  29% 3971/13907 [2:25:41<6:21:04,  2.30s/it][A
Training...:  29% 3972/13907 [2:25:44<6:15:58,  2.27s/it][A
Training...:  29% 3973/13907 [2:25:46<6:09:19,  2.23s/it][A
Training...:  29% 3974/13907 [2:25:48<6:02:55,  2.19s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:26:03<?, ?it/s]
Training...:  29% 3974/13907 [2:25:50<6:02:55,  2.19s/it][A
Training...:  29% 3975/13907 [2:25:50<6:13:55,  2.26s/it][A
Training...:  29% 3976/13907 [2:25:52<6:05:59,  2.21s/it][A
Training...:  29% 3977/13907 [2:25:54<5:56:21,  2.15s/it][A
Training...:  29% 3978/13907 [2:25:56<5:48:35,  2.11s/it][A
Training...:  29% 3979/13907 [2:25:58<5:41:38,  2.06s/it][A
Training...:  29% 3980/13907 [2:26:00<5:34:48,  2.02s/it][A
Training...:  29% 3981/13907 [2:26:02<5:29:35,  1.99s/it][A
Training...:  29% 3982/13907 [2:26:04<5:24:40,  1.96s/it][A
Training...:  29% 3983/13907 [2:26:06<5:19:55,  1.93s/it][A
Training...:  29% 3984/13907 [2:26:08<5:15:08,  1.91s/it][A
Training...:  29% 3985/13907 [2:26:10<5:09:33,  1.87s/it][A
Training...:  29% 3986/13907 [2:26:11<5:05:24,  1.85s/it][A
Training...:  29% 3987/13907 [2:26:13<5:00:36,  1.82s/it][A
Training...:  29% 3988/13907 [2:26:15<4:55:01,  1.78s/it][A
Training...:  29% 3989/13907 [2:26:17<4:49:49,  1.75s/it][A
Training...:  29% 3990/13907 [2:26:18<4:43:55,  1.72s/it][A
Training...:  29% 3991/13907 [2:26:20<4:37:37,  1.68s/it][A
Training...:  29% 3992/13907 [2:26:21<4:31:47,  1.64s/it][A
Training...:  29% 3993/13907 [2:26:23<4:25:41,  1.61s/it][A
Training...:  29% 3994/13907 [2:26:24<4:19:59,  1.57s/it][A
Training...:  29% 3995/13907 [2:26:26<4:13:31,  1.53s/it][A
Training...:  29% 3996/13907 [2:26:27<4:06:10,  1.49s/it][A
Training...:  29% 3997/13907 [2:26:29<3:57:54,  1.44s/it][A
Training...:  29% 3998/13907 [2:26:30<3:48:22,  1.38s/it][A
Training...:  29% 3999/13907 [2:26:31<3:38:33,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:26:45<?, ?it/s]
Training...:  29% 3999/13907 [2:26:32<3:38:33,  1.32s/it][A
Training...:  29% 4000/13907 [2:26:32<3:34:09,  1.30s/it][A
Training...:  29% 4001/13907 [2:26:36<5:31:03,  2.01s/it][A
Training...:  29% 4002/13907 [2:26:39<6:39:52,  2.42s/it][A
Training...:  29% 4003/13907 [2:26:42<7:19:13,  2.66s/it][A
Training...:  29% 4004/13907 [2:26:46<7:37:02,  2.77s/it][A
Training...:  29% 4005/13907 [2:26:48<7:44:58,  2.82s/it][A
Training...:  29% 4006/13907 [2:26:51<7:44:58,  2.82s/it][A
Training...:  29% 4007/13907 [2:26:54<7:43:31,  2.81s/it][A
Training...:  29% 4008/13907 [2:26:57<7:37:01,  2.77s/it][A
Training...:  29% 4009/13907 [2:26:59<7:32:06,  2.74s/it][A
Training...:  29% 4010/13907 [2:27:02<7:26:31,  2.71s/it][A
Training...:  29% 4011/13907 [2:27:05<7:22:28,  2.68s/it][A
Training...:  29% 4012/13907 [2:27:07<7:15:08,  2.64s/it][A
Training...:  29% 4013/13907 [2:27:10<7:09:24,  2.60s/it][A
Training...:  29% 4014/13907 [2:27:12<7:03:54,  2.57s/it][A
Training...:  29% 4015/13907 [2:27:15<6:58:21,  2.54s/it][A
Training...:  29% 4016/13907 [2:27:17<6:51:56,  2.50s/it][A
Training...:  29% 4017/13907 [2:27:19<6:46:53,  2.47s/it][A
Training...:  29% 4018/13907 [2:27:22<6:40:24,  2.43s/it][A
Training...:  29% 4019/13907 [2:27:24<6:34:40,  2.39s/it][A
Training...:  29% 4020/13907 [2:27:26<6:28:25,  2.36s/it][A
Training...:  29% 4021/13907 [2:27:29<6:22:45,  2.32s/it][A
Training...:  29% 4022/13907 [2:27:31<6:17:26,  2.29s/it][A
Training...:  29% 4023/13907 [2:27:33<6:13:23,  2.27s/it][A
Training...:  29% 4024/13907 [2:27:35<6:07:32,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:27:50<?, ?it/s]
Training...:  29% 4024/13907 [2:27:38<6:07:32,  2.23s/it][A
Training...:  29% 4025/13907 [2:27:38<6:18:05,  2.30s/it][A
Training...:  29% 4026/13907 [2:27:40<6:11:27,  2.26s/it][A
Training...:  29% 4027/13907 [2:27:42<6:01:14,  2.19s/it][A
Training...:  29% 4028/13907 [2:27:44<5:55:36,  2.16s/it][A
Training...:  29% 4029/13907 [2:27:46<5:48:08,  2.11s/it][A
Training...:  29% 4030/13907 [2:27:48<5:40:46,  2.07s/it][A
Training...:  29% 4031/13907 [2:27:50<5:34:49,  2.03s/it][A
Training...:  29% 4032/13907 [2:27:52<5:29:09,  2.00s/it][A
Training...:  29% 4033/13907 [2:27:54<5:24:21,  1.97s/it][A
Training...:  29% 4034/13907 [2:27:56<5:19:05,  1.94s/it][A
Training...:  29% 4035/13907 [2:27:57<5:15:47,  1.92s/it][A
Training...:  29% 4036/13907 [2:27:59<5:09:59,  1.88s/it][A
Training...:  29% 4037/13907 [2:28:01<5:06:13,  1.86s/it][A
Training...:  29% 4038/13907 [2:28:03<4:58:22,  1.81s/it][A
Training...:  29% 4039/13907 [2:28:04<4:51:40,  1.77s/it][A
Training...:  29% 4040/13907 [2:28:06<4:44:43,  1.73s/it][A
Training...:  29% 4041/13907 [2:28:08<4:37:12,  1.69s/it][A
Training...:  29% 4042/13907 [2:28:09<4:31:28,  1.65s/it][A
Training...:  29% 4043/13907 [2:28:11<4:24:38,  1.61s/it][A
Training...:  29% 4044/13907 [2:28:12<4:18:54,  1.58s/it][A
Training...:  29% 4045/13907 [2:28:14<4:11:52,  1.53s/it][A
Training...:  29% 4046/13907 [2:28:15<4:04:33,  1.49s/it][A
Training...:  29% 4047/13907 [2:28:16<3:56:23,  1.44s/it][A
Training...:  29% 4048/13907 [2:28:18<3:46:52,  1.38s/it][A
Training...:  29% 4049/13907 [2:28:19<3:35:20,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:28:32<?, ?it/s]
Training...:  29% 4049/13907 [2:28:20<3:35:20,  1.31s/it][A
Training...:  29% 4050/13907 [2:28:20<3:28:41,  1.27s/it][A
Training...:  29% 4051/13907 [2:28:24<5:29:59,  2.01s/it][A
Training...:  29% 4052/13907 [2:28:27<6:35:04,  2.41s/it][A
Training...:  29% 4053/13907 [2:28:30<7:11:30,  2.63s/it][A
Training...:  29% 4054/13907 [2:28:33<7:30:58,  2.75s/it][A
Training...:  29% 4055/13907 [2:28:36<7:42:42,  2.82s/it][A
Training...:  29% 4056/13907 [2:28:39<7:44:47,  2.83s/it][A
Training...:  29% 4057/13907 [2:28:42<7:43:43,  2.82s/it][A
Training...:  29% 4058/13907 [2:28:45<7:37:28,  2.79s/it][A
Training...:  29% 4059/13907 [2:28:47<7:34:35,  2.77s/it][A
Training...:  29% 4060/13907 [2:28:50<7:28:48,  2.73s/it][A
Training...:  29% 4061/13907 [2:28:53<7:23:37,  2.70s/it][A
Training...:  29% 4062/13907 [2:28:55<7:18:09,  2.67s/it][A
Training...:  29% 4063/13907 [2:28:58<7:11:27,  2.63s/it][A
Training...:  29% 4064/13907 [2:29:00<7:03:29,  2.58s/it][A
Training...:  29% 4065/13907 [2:29:03<6:58:20,  2.55s/it][A
Training...:  29% 4066/13907 [2:29:05<6:52:46,  2.52s/it][A
Training...:  29% 4067/13907 [2:29:08<6:51:26,  2.51s/it][A
Training...:  29% 4068/13907 [2:29:10<6:45:29,  2.47s/it][A
Training...:  29% 4069/13907 [2:29:12<6:40:39,  2.44s/it][A
Training...:  29% 4070/13907 [2:29:15<6:34:53,  2.41s/it][A
Training...:  29% 4071/13907 [2:29:17<6:29:54,  2.38s/it][A
Training...:  29% 4072/13907 [2:29:19<6:21:50,  2.33s/it][A
Training...:  29% 4073/13907 [2:29:21<6:15:29,  2.29s/it][A
Training...:  29% 4074/13907 [2:29:24<6:10:52,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:29:38<?, ?it/s]
Training...:  29% 4074/13907 [2:29:26<6:10:52,  2.26s/it][A
Training...:  29% 4075/13907 [2:29:26<6:22:21,  2.33s/it][A
Training...:  29% 4076/13907 [2:29:28<6:12:23,  2.27s/it][A
Training...:  29% 4077/13907 [2:29:30<6:02:14,  2.21s/it][A
Training...:  29% 4078/13907 [2:29:32<5:51:46,  2.15s/it][A
Training...:  29% 4079/13907 [2:29:34<5:43:28,  2.10s/it][A
Training...:  29% 4080/13907 [2:29:36<5:36:07,  2.05s/it][A
Training...:  29% 4081/13907 [2:29:38<5:30:59,  2.02s/it][A
Training...:  29% 4082/13907 [2:29:40<5:27:58,  2.00s/it][A
Training...:  29% 4083/13907 [2:29:42<5:22:45,  1.97s/it][A
Training...:  29% 4084/13907 [2:29:44<5:15:22,  1.93s/it][A
Training...:  29% 4085/13907 [2:29:46<5:09:58,  1.89s/it][A
Training...:  29% 4086/13907 [2:29:47<5:03:38,  1.86s/it][A
Training...:  29% 4087/13907 [2:29:49<4:58:32,  1.82s/it][A
Training...:  29% 4088/13907 [2:29:51<4:52:33,  1.79s/it][A
Training...:  29% 4089/13907 [2:29:53<4:47:25,  1.76s/it][A
Training...:  29% 4090/13907 [2:29:54<4:42:44,  1.73s/it][A
Training...:  29% 4091/13907 [2:29:56<4:36:38,  1.69s/it][A
Training...:  29% 4092/13907 [2:29:57<4:31:17,  1.66s/it][A
Training...:  29% 4093/13907 [2:29:59<4:24:54,  1.62s/it][A
Training...:  29% 4094/13907 [2:30:00<4:19:00,  1.58s/it][A
Training...:  29% 4095/13907 [2:30:02<4:10:57,  1.53s/it][A
Training...:  29% 4096/13907 [2:30:03<4:03:26,  1.49s/it][A
Training...:  29% 4097/13907 [2:30:05<3:55:10,  1.44s/it][A
Training...:  29% 4098/13907 [2:30:06<3:45:18,  1.38s/it][A
Training...:  29% 4099/13907 [2:30:07<3:33:48,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:30:20<?, ?it/s]
Training...:  29% 4099/13907 [2:30:08<3:33:48,  1.31s/it][A
Training...:  29% 4100/13907 [2:30:08<3:28:01,  1.27s/it][A
Training...:  29% 4101/13907 [2:30:12<5:27:34,  2.00s/it][A
Training...:  29% 4102/13907 [2:30:15<6:37:14,  2.43s/it][A
Training...:  30% 4103/13907 [2:30:18<7:14:19,  2.66s/it][A
Training...:  30% 4104/13907 [2:30:21<7:33:37,  2.78s/it][A
Training...:  30% 4105/13907 [2:30:25<7:46:26,  2.86s/it][A
Training...:  30% 4106/13907 [2:30:27<7:48:45,  2.87s/it][A
Training...:  30% 4107/13907 [2:30:30<7:51:32,  2.89s/it][A
Training...:  30% 4108/13907 [2:30:33<7:45:59,  2.85s/it][A
Training...:  30% 4109/13907 [2:30:36<7:38:48,  2.81s/it][A
Training...:  30% 4110/13907 [2:30:38<7:27:45,  2.74s/it][A
Training...:  30% 4111/13907 [2:30:41<7:22:53,  2.71s/it][A
Training...:  30% 4112/13907 [2:30:44<7:16:19,  2.67s/it][A
Training...:  30% 4113/13907 [2:30:46<7:09:13,  2.63s/it][A
Training...:  30% 4114/13907 [2:30:49<6:58:56,  2.57s/it][A
Training...:  30% 4115/13907 [2:30:51<6:51:04,  2.52s/it][A
Training...:  30% 4116/13907 [2:30:53<6:43:41,  2.47s/it][A
Training...:  30% 4117/13907 [2:30:56<6:37:26,  2.44s/it][A
Training...:  30% 4118/13907 [2:30:58<6:29:59,  2.39s/it][A
Training...:  30% 4119/13907 [2:31:00<6:24:18,  2.36s/it][A
Training...:  30% 4120/13907 [2:31:02<6:18:45,  2.32s/it][A
Training...:  30% 4121/13907 [2:31:05<6:12:23,  2.28s/it][A
Training...:  30% 4122/13907 [2:31:07<6:05:52,  2.24s/it][A
Training...:  30% 4123/13907 [2:31:09<6:00:39,  2.21s/it][A
Training...:  30% 4124/13907 [2:31:11<5:55:05,  2.18s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:31:26<?, ?it/s]
Training...:  30% 4124/13907 [2:31:13<5:55:05,  2.18s/it][A
Training...:  30% 4125/13907 [2:31:13<6:06:38,  2.25s/it][A
Training...:  30% 4126/13907 [2:31:16<5:58:44,  2.20s/it][A
Training...:  30% 4127/13907 [2:31:18<5:49:53,  2.15s/it][A
Training...:  30% 4128/13907 [2:31:20<5:42:57,  2.10s/it][A
Training...:  30% 4129/13907 [2:31:22<5:36:33,  2.07s/it][A
Training...:  30% 4130/13907 [2:31:24<5:30:26,  2.03s/it][A
Training...:  30% 4131/13907 [2:31:25<5:25:44,  2.00s/it][A
Training...:  30% 4132/13907 [2:31:27<5:20:03,  1.96s/it][A
Training...:  30% 4133/13907 [2:31:29<5:16:01,  1.94s/it][A
Training...:  30% 4134/13907 [2:31:31<5:09:34,  1.90s/it][A
Training...:  30% 4135/13907 [2:31:33<5:05:03,  1.87s/it][A
Training...:  30% 4136/13907 [2:31:35<4:59:40,  1.84s/it][A
Training...:  30% 4137/13907 [2:31:36<4:56:04,  1.82s/it][A
Training...:  30% 4138/13907 [2:31:38<4:50:11,  1.78s/it][A
Training...:  30% 4139/13907 [2:31:40<4:46:15,  1.76s/it][A
Training...:  30% 4140/13907 [2:31:41<4:40:36,  1.72s/it][A
Training...:  30% 4141/13907 [2:31:43<4:35:26,  1.69s/it][A
Training...:  30% 4142/13907 [2:31:45<4:29:22,  1.66s/it][A
Training...:  30% 4143/13907 [2:31:46<4:23:30,  1.62s/it][A
Training...:  30% 4144/13907 [2:31:48<4:17:02,  1.58s/it][A
Training...:  30% 4145/13907 [2:31:49<4:10:43,  1.54s/it][A
Training...:  30% 4146/13907 [2:31:50<4:02:59,  1.49s/it][A
Training...:  30% 4147/13907 [2:31:52<3:54:21,  1.44s/it][A
Training...:  30% 4148/13907 [2:31:53<3:45:27,  1.39s/it][A
Training...:  30% 4149/13907 [2:31:54<3:35:14,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:32:08<?, ?it/s]
Training...:  30% 4149/13907 [2:31:55<3:35:14,  1.32s/it][A
Training...:  30% 4150/13907 [2:31:55<3:30:19,  1.29s/it][A
Training...:  30% 4151/13907 [2:31:59<5:29:56,  2.03s/it][A
Training...:  30% 4152/13907 [2:32:03<6:37:37,  2.45s/it][A
Training...:  30% 4153/13907 [2:32:06<7:15:49,  2.68s/it][A
Training...:  30% 4154/13907 [2:32:09<7:34:21,  2.80s/it][A
Training...:  30% 4155/13907 [2:32:12<7:43:08,  2.85s/it][A
Training...:  30% 4156/13907 [2:32:15<7:43:27,  2.85s/it][A
Training...:  30% 4157/13907 [2:32:18<7:42:31,  2.85s/it][A
Training...:  30% 4158/13907 [2:32:20<7:36:15,  2.81s/it][A
Training...:  30% 4159/13907 [2:32:23<7:30:07,  2.77s/it][A
Training...:  30% 4160/13907 [2:32:26<7:23:50,  2.73s/it][A
Training...:  30% 4161/13907 [2:32:28<7:17:40,  2.69s/it][A
Training...:  30% 4162/13907 [2:32:31<7:08:53,  2.64s/it][A
Training...:  30% 4163/13907 [2:32:33<7:03:03,  2.61s/it][A
Training...:  30% 4164/13907 [2:32:36<6:56:55,  2.57s/it][A
Training...:  30% 4165/13907 [2:32:38<6:53:34,  2.55s/it][A
Training...:  30% 4166/13907 [2:32:41<6:47:08,  2.51s/it][A
Training...:  30% 4167/13907 [2:32:43<6:43:00,  2.48s/it][A
Training...:  30% 4168/13907 [2:32:45<6:38:37,  2.46s/it][A
Training...:  30% 4169/13907 [2:32:48<6:33:45,  2.43s/it][A
Training...:  30% 4170/13907 [2:32:50<6:27:35,  2.39s/it][A
Training...:  30% 4171/13907 [2:32:52<6:22:11,  2.36s/it][A
Training...:  30% 4172/13907 [2:32:55<6:16:55,  2.32s/it][A
Training...:  30% 4173/13907 [2:32:57<6:11:07,  2.29s/it][A
Training...:  30% 4174/13907 [2:32:59<6:06:53,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:33:14<?, ?it/s]
Training...:  30% 4174/13907 [2:33:02<6:06:53,  2.26s/it][A
Training...:  30% 4175/13907 [2:33:02<6:17:02,  2.32s/it][A
Training...:  30% 4176/13907 [2:33:04<6:06:57,  2.26s/it][A
Training...:  30% 4177/13907 [2:33:06<5:54:51,  2.19s/it][A
Training...:  30% 4178/13907 [2:33:08<5:45:33,  2.13s/it][A
Training...:  30% 4179/13907 [2:33:10<5:39:29,  2.09s/it][A
Training...:  30% 4180/13907 [2:33:12<5:33:13,  2.06s/it][A
Training...:  30% 4181/13907 [2:33:14<5:28:47,  2.03s/it][A
Training...:  30% 4182/13907 [2:33:15<5:22:51,  1.99s/it][A
Training...:  30% 4183/13907 [2:33:17<5:19:02,  1.97s/it][A
Training...:  30% 4184/13907 [2:33:19<5:13:37,  1.94s/it][A
Training...:  30% 4185/13907 [2:33:21<5:08:18,  1.90s/it][A
Training...:  30% 4186/13907 [2:33:23<5:04:19,  1.88s/it][A
Training...:  30% 4187/13907 [2:33:25<4:59:28,  1.85s/it][A
Training...:  30% 4188/13907 [2:33:26<4:54:44,  1.82s/it][A
Training...:  30% 4189/13907 [2:33:28<4:48:04,  1.78s/it][A
Training...:  30% 4190/13907 [2:33:30<4:41:48,  1.74s/it][A
Training...:  30% 4191/13907 [2:33:31<4:35:53,  1.70s/it][A
Training...:  30% 4192/13907 [2:33:33<4:30:39,  1.67s/it][A
Training...:  30% 4193/13907 [2:33:35<4:25:10,  1.64s/it][A
Training...:  30% 4194/13907 [2:33:36<4:19:49,  1.61s/it][A
Training...:  30% 4195/13907 [2:33:38<4:13:25,  1.57s/it][A
Training...:  30% 4196/13907 [2:33:39<4:06:07,  1.52s/it][A
Training...:  30% 4197/13907 [2:33:40<3:57:56,  1.47s/it][A
Training...:  30% 4198/13907 [2:33:42<3:49:36,  1.42s/it][A
Training...:  30% 4199/13907 [2:33:43<3:38:51,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:33:56<?, ?it/s]
Training...:  30% 4199/13907 [2:33:44<3:38:51,  1.35s/it][A
Training...:  30% 4200/13907 [2:33:44<3:32:31,  1.31s/it][A
Training...:  30% 4201/13907 [2:33:48<5:28:53,  2.03s/it][A
Training...:  30% 4202/13907 [2:33:51<6:29:39,  2.41s/it][A
Training...:  30% 4203/13907 [2:33:54<7:06:29,  2.64s/it][A
Training...:  30% 4204/13907 [2:33:57<7:25:17,  2.75s/it][A
Training...:  30% 4205/13907 [2:34:00<7:35:53,  2.82s/it][A
Training...:  30% 4206/13907 [2:34:03<7:39:34,  2.84s/it][A
Training...:  30% 4207/13907 [2:34:06<7:39:49,  2.84s/it][A
Training...:  30% 4208/13907 [2:34:09<7:34:42,  2.81s/it][A
Training...:  30% 4209/13907 [2:34:11<7:30:25,  2.79s/it][A
Training...:  30% 4210/13907 [2:34:14<7:22:09,  2.74s/it][A
Training...:  30% 4211/13907 [2:34:17<7:15:23,  2.69s/it][A
Training...:  30% 4212/13907 [2:34:19<7:07:56,  2.65s/it][A
Training...:  30% 4213/13907 [2:34:22<6:59:52,  2.60s/it][A
Training...:  30% 4214/13907 [2:34:24<6:52:22,  2.55s/it][A
Training...:  30% 4215/13907 [2:34:27<6:46:16,  2.52s/it][A
Training...:  30% 4216/13907 [2:34:29<6:42:09,  2.49s/it][A
Training...:  30% 4217/13907 [2:34:31<6:36:14,  2.45s/it][A
Training...:  30% 4218/13907 [2:34:34<6:29:13,  2.41s/it][A
Training...:  30% 4219/13907 [2:34:36<6:24:41,  2.38s/it][A
Training...:  30% 4220/13907 [2:34:38<6:18:00,  2.34s/it][A
Training...:  30% 4221/13907 [2:34:40<6:13:29,  2.31s/it][A
Training...:  30% 4222/13907 [2:34:43<6:09:15,  2.29s/it][A
Training...:  30% 4223/13907 [2:34:45<6:03:49,  2.25s/it][A
Training...:  30% 4224/13907 [2:34:47<5:58:21,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:35:02<?, ?it/s]
Training...:  30% 4224/13907 [2:34:49<5:58:21,  2.22s/it][A
Training...:  30% 4225/13907 [2:34:49<6:08:03,  2.28s/it][A
Training...:  30% 4226/13907 [2:34:52<6:00:50,  2.24s/it][A
Training...:  30% 4227/13907 [2:34:54<5:52:24,  2.18s/it][A
Training...:  30% 4228/13907 [2:34:56<5:44:49,  2.14s/it][A
Training...:  30% 4229/13907 [2:34:58<5:37:41,  2.09s/it][A
Training...:  30% 4230/13907 [2:35:00<5:30:29,  2.05s/it][A
Training...:  30% 4231/13907 [2:35:02<5:24:38,  2.01s/it][A
Training...:  30% 4232/13907 [2:35:03<5:18:38,  1.98s/it][A
Training...:  30% 4233/13907 [2:35:05<5:13:45,  1.95s/it][A
Training...:  30% 4234/13907 [2:35:07<5:08:16,  1.91s/it][A
Training...:  30% 4235/13907 [2:35:09<5:04:33,  1.89s/it][A
Training...:  30% 4236/13907 [2:35:11<5:00:46,  1.87s/it][A
Training...:  30% 4237/13907 [2:35:13<4:56:14,  1.84s/it][A
Training...:  30% 4238/13907 [2:35:14<4:52:33,  1.82s/it][A
Training...:  30% 4239/13907 [2:35:16<4:47:43,  1.79s/it][A
Training...:  30% 4240/13907 [2:35:18<4:42:53,  1.76s/it][A
Training...:  30% 4241/13907 [2:35:19<4:36:41,  1.72s/it][A
Training...:  31% 4242/13907 [2:35:21<4:31:28,  1.69s/it][A
Training...:  31% 4243/13907 [2:35:22<4:25:27,  1.65s/it][A
Training...:  31% 4244/13907 [2:35:24<4:19:42,  1.61s/it][A
Training...:  31% 4245/13907 [2:35:25<4:11:21,  1.56s/it][A
Training...:  31% 4246/13907 [2:35:27<4:02:30,  1.51s/it][A
Training...:  31% 4247/13907 [2:35:28<3:53:51,  1.45s/it][A
Training...:  31% 4248/13907 [2:35:29<3:45:32,  1.40s/it][A
Training...:  31% 4249/13907 [2:35:31<3:34:45,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:35:44<?, ?it/s]
Training...:  31% 4249/13907 [2:35:32<3:34:45,  1.33s/it][A
Training...:  31% 4250/13907 [2:35:32<3:29:51,  1.30s/it][A
Training...:  31% 4251/13907 [2:35:36<5:23:49,  2.01s/it][A
Training...:  31% 4252/13907 [2:35:39<6:30:33,  2.43s/it][A
Training...:  31% 4253/13907 [2:35:42<7:08:48,  2.67s/it][A
Training...:  31% 4254/13907 [2:35:45<7:28:33,  2.79s/it][A
Training...:  31% 4255/13907 [2:35:48<7:40:17,  2.86s/it][A
Training...:  31% 4256/13907 [2:35:51<7:41:57,  2.87s/it][A
Training...:  31% 4257/13907 [2:35:54<7:41:35,  2.87s/it][A
Training...:  31% 4258/13907 [2:35:57<7:34:58,  2.83s/it][A
Training...:  31% 4259/13907 [2:36:00<7:32:42,  2.82s/it][A
Training...:  31% 4260/13907 [2:36:02<7:25:03,  2.77s/it][A
Training...:  31% 4261/13907 [2:36:05<7:18:08,  2.73s/it][A
Training...:  31% 4262/13907 [2:36:07<7:11:04,  2.68s/it][A
Training...:  31% 4263/13907 [2:36:10<7:05:02,  2.64s/it][A
Training...:  31% 4264/13907 [2:36:12<6:59:14,  2.61s/it][A
Training...:  31% 4265/13907 [2:36:15<6:55:21,  2.58s/it][A
Training...:  31% 4266/13907 [2:36:17<6:47:34,  2.54s/it][A
Training...:  31% 4267/13907 [2:36:20<6:40:19,  2.49s/it][A
Training...:  31% 4268/13907 [2:36:22<6:32:15,  2.44s/it][A
Training...:  31% 4269/13907 [2:36:24<6:26:24,  2.41s/it][A
Training...:  31% 4270/13907 [2:36:27<6:19:23,  2.36s/it][A
Training...:  31% 4271/13907 [2:36:29<6:14:05,  2.33s/it][A
Training...:  31% 4272/13907 [2:36:31<6:07:46,  2.29s/it][A
Training...:  31% 4273/13907 [2:36:33<6:01:54,  2.25s/it][A
Training...:  31% 4274/13907 [2:36:35<5:55:45,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:36:50<?, ?it/s]
Training...:  31% 4274/13907 [2:36:38<5:55:45,  2.22s/it][A
Training...:  31% 4275/13907 [2:36:38<6:05:51,  2.28s/it][A
Training...:  31% 4276/13907 [2:36:40<5:58:21,  2.23s/it][A
Training...:  31% 4277/13907 [2:36:42<5:52:08,  2.19s/it][A
Training...:  31% 4278/13907 [2:36:44<5:45:10,  2.15s/it][A
Training...:  31% 4279/13907 [2:36:46<5:37:11,  2.10s/it][A
Training...:  31% 4280/13907 [2:36:48<5:29:52,  2.06s/it][A
Training...:  31% 4281/13907 [2:36:50<5:23:36,  2.02s/it][A
Training...:  31% 4282/13907 [2:36:52<5:17:45,  1.98s/it][A
Training...:  31% 4283/13907 [2:36:54<5:12:52,  1.95s/it][A
Training...:  31% 4284/13907 [2:36:56<5:07:09,  1.92s/it][A
Training...:  31% 4285/13907 [2:36:57<5:02:58,  1.89s/it][A
Training...:  31% 4286/13907 [2:36:59<4:58:02,  1.86s/it][A
Training...:  31% 4287/13907 [2:37:01<4:53:30,  1.83s/it][A
Training...:  31% 4288/13907 [2:37:03<4:48:01,  1.80s/it][A
Training...:  31% 4289/13907 [2:37:04<4:43:47,  1.77s/it][A
Training...:  31% 4290/13907 [2:37:06<4:38:41,  1.74s/it][A
Training...:  31% 4291/13907 [2:37:08<4:33:11,  1.70s/it][A
Training...:  31% 4292/13907 [2:37:09<4:27:02,  1.67s/it][A
Training...:  31% 4293/13907 [2:37:11<4:21:06,  1.63s/it][A
Training...:  31% 4294/13907 [2:37:12<4:15:06,  1.59s/it][A
Training...:  31% 4295/13907 [2:37:14<4:08:29,  1.55s/it][A
Training...:  31% 4296/13907 [2:37:15<4:00:19,  1.50s/it][A
Training...:  31% 4297/13907 [2:37:17<3:51:44,  1.45s/it][A
Training...:  31% 4298/13907 [2:37:18<3:43:22,  1.39s/it][A
Training...:  31% 4299/13907 [2:37:19<3:33:07,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:37:33<?, ?it/s]
Training...:  31% 4299/13907 [2:37:20<3:33:07,  1.33s/it][A
Training...:  31% 4300/13907 [2:37:20<3:27:35,  1.30s/it][A
Training...:  31% 4301/13907 [2:37:24<5:23:00,  2.02s/it][A
Training...:  31% 4302/13907 [2:37:27<6:31:14,  2.44s/it][A
Training...:  31% 4303/13907 [2:37:31<7:14:37,  2.72s/it][A
Training...:  31% 4304/13907 [2:37:34<7:36:43,  2.85s/it][A
Training...:  31% 4305/13907 [2:37:37<7:43:10,  2.89s/it][A
Training...:  31% 4306/13907 [2:37:40<7:44:10,  2.90s/it][A
Training...:  31% 4307/13907 [2:37:43<7:41:25,  2.88s/it][A
Training...:  31% 4308/13907 [2:37:45<7:34:32,  2.84s/it][A
Training...:  31% 4309/13907 [2:37:48<7:29:01,  2.81s/it][A
Training...:  31% 4310/13907 [2:37:51<7:22:46,  2.77s/it][A
Training...:  31% 4311/13907 [2:37:53<7:17:27,  2.74s/it][A
Training...:  31% 4312/13907 [2:37:56<7:12:07,  2.70s/it][A
Training...:  31% 4313/13907 [2:37:59<7:03:46,  2.65s/it][A
Training...:  31% 4314/13907 [2:38:01<6:53:55,  2.59s/it][A
Training...:  31% 4315/13907 [2:38:03<6:46:19,  2.54s/it][A
Training...:  31% 4316/13907 [2:38:06<6:38:35,  2.49s/it][A
Training...:  31% 4317/13907 [2:38:08<6:32:10,  2.45s/it][A
Training...:  31% 4318/13907 [2:38:10<6:25:07,  2.41s/it][A
Training...:  31% 4319/13907 [2:38:13<6:19:05,  2.37s/it][A
Training...:  31% 4320/13907 [2:38:15<6:13:47,  2.34s/it][A
Training...:  31% 4321/13907 [2:38:17<6:09:11,  2.31s/it][A
Training...:  31% 4322/13907 [2:38:19<6:04:13,  2.28s/it][A
Training...:  31% 4323/13907 [2:38:22<5:58:46,  2.25s/it][A
Training...:  31% 4324/13907 [2:38:24<5:53:24,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:38:39<?, ?it/s]
Training...:  31% 4324/13907 [2:38:26<5:53:24,  2.21s/it][A
Training...:  31% 4325/13907 [2:38:26<6:03:15,  2.27s/it][A
Training...:  31% 4326/13907 [2:38:28<5:55:42,  2.23s/it][A
Training...:  31% 4327/13907 [2:38:30<5:47:29,  2.18s/it][A
Training...:  31% 4328/13907 [2:38:32<5:39:45,  2.13s/it][A
Training...:  31% 4329/13907 [2:38:34<5:33:04,  2.09s/it][A
Training...:  31% 4330/13907 [2:38:36<5:26:07,  2.04s/it][A
Training...:  31% 4331/13907 [2:38:38<5:20:48,  2.01s/it][A
Training...:  31% 4332/13907 [2:38:40<5:15:36,  1.98s/it][A
Training...:  31% 4333/13907 [2:38:42<5:11:28,  1.95s/it][A
Training...:  31% 4334/13907 [2:38:44<5:05:53,  1.92s/it][A
Training...:  31% 4335/13907 [2:38:46<5:01:05,  1.89s/it][A
Training...:  31% 4336/13907 [2:38:48<4:56:10,  1.86s/it][A
Training...:  31% 4337/13907 [2:38:49<4:53:19,  1.84s/it][A
Training...:  31% 4338/13907 [2:38:51<4:48:46,  1.81s/it][A
Training...:  31% 4339/13907 [2:38:53<4:42:42,  1.77s/it][A
Training...:  31% 4340/13907 [2:38:54<4:37:18,  1.74s/it][A
Training...:  31% 4341/13907 [2:38:56<4:31:13,  1.70s/it][A
Training...:  31% 4342/13907 [2:38:58<4:25:34,  1.67s/it][A
Training...:  31% 4343/13907 [2:38:59<4:19:39,  1.63s/it][A
Training...:  31% 4344/13907 [2:39:01<4:12:41,  1.59s/it][A
Training...:  31% 4345/13907 [2:39:02<4:06:49,  1.55s/it][A
Training...:  31% 4346/13907 [2:39:03<3:59:36,  1.50s/it][A
Training...:  31% 4347/13907 [2:39:05<3:51:03,  1.45s/it][A
Training...:  31% 4348/13907 [2:39:06<3:42:00,  1.39s/it][A
Training...:  31% 4349/13907 [2:39:07<3:30:45,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:39:21<?, ?it/s]
Training...:  31% 4349/13907 [2:39:08<3:30:45,  1.32s/it][A
Training...:  31% 4350/13907 [2:39:08<3:23:51,  1.28s/it][A
Training...:  31% 4351/13907 [2:39:12<5:15:32,  1.98s/it][A
Training...:  31% 4352/13907 [2:39:15<6:19:19,  2.38s/it][A
Training...:  31% 4353/13907 [2:39:18<6:55:43,  2.61s/it][A
Training...:  31% 4354/13907 [2:39:22<7:15:46,  2.74s/it][A
Training...:  31% 4355/13907 [2:39:24<7:26:32,  2.80s/it][A
Training...:  31% 4356/13907 [2:39:27<7:27:03,  2.81s/it][A
Training...:  31% 4357/13907 [2:39:30<7:26:48,  2.81s/it][A
Training...:  31% 4358/13907 [2:39:33<7:22:40,  2.78s/it][A
Training...:  31% 4359/13907 [2:39:36<7:18:08,  2.75s/it][A
Training...:  31% 4360/13907 [2:39:38<7:12:33,  2.72s/it][A
Training...:  31% 4361/13907 [2:39:41<7:07:06,  2.68s/it][A
Training...:  31% 4362/13907 [2:39:43<7:00:34,  2.64s/it][A
Training...:  31% 4363/13907 [2:39:46<6:53:24,  2.60s/it][A
Training...:  31% 4364/13907 [2:39:48<6:46:56,  2.56s/it][A
Training...:  31% 4365/13907 [2:39:51<6:42:29,  2.53s/it][A
Training...:  31% 4366/13907 [2:39:53<6:36:32,  2.49s/it][A
Training...:  31% 4367/13907 [2:39:55<6:30:01,  2.45s/it][A
Training...:  31% 4368/13907 [2:39:58<6:24:05,  2.42s/it][A
Training...:  31% 4369/13907 [2:40:00<6:18:28,  2.38s/it][A
Training...:  31% 4370/13907 [2:40:02<6:12:53,  2.35s/it][A
Training...:  31% 4371/13907 [2:40:05<6:08:12,  2.32s/it][A
Training...:  31% 4372/13907 [2:40:07<6:02:46,  2.28s/it][A
Training...:  31% 4373/13907 [2:40:09<5:57:32,  2.25s/it][A
Training...:  31% 4374/13907 [2:40:11<5:51:56,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:40:26<?, ?it/s]
Training...:  31% 4374/13907 [2:40:14<5:51:56,  2.22s/it][A
Training...:  31% 4375/13907 [2:40:14<6:00:38,  2.27s/it][A
Training...:  31% 4376/13907 [2:40:16<5:55:29,  2.24s/it][A
Training...:  31% 4377/13907 [2:40:18<5:46:25,  2.18s/it][A
Training...:  31% 4378/13907 [2:40:20<5:37:31,  2.13s/it][A
Training...:  31% 4379/13907 [2:40:22<5:32:49,  2.10s/it][A
Training...:  31% 4380/13907 [2:40:24<5:25:51,  2.05s/it][A
Training...:  32% 4381/13907 [2:40:26<5:21:38,  2.03s/it][A
Training...:  32% 4382/13907 [2:40:28<5:15:33,  1.99s/it][A
Training...:  32% 4383/13907 [2:40:29<5:10:00,  1.95s/it][A
Training...:  32% 4384/13907 [2:40:31<5:03:56,  1.91s/it][A
Training...:  32% 4385/13907 [2:40:33<4:58:08,  1.88s/it][A
Training...:  32% 4386/13907 [2:40:35<4:52:43,  1.84s/it][A
Training...:  32% 4387/13907 [2:40:37<4:47:16,  1.81s/it][A
Training...:  32% 4388/13907 [2:40:38<4:42:27,  1.78s/it][A
Training...:  32% 4389/13907 [2:40:40<4:37:38,  1.75s/it][A
Training...:  32% 4390/13907 [2:40:42<4:31:41,  1.71s/it][A
Training...:  32% 4391/13907 [2:40:43<4:25:11,  1.67s/it][A
Training...:  32% 4392/13907 [2:40:45<4:20:17,  1.64s/it][A
Training...:  32% 4393/13907 [2:40:46<4:14:48,  1.61s/it][A
Training...:  32% 4394/13907 [2:40:48<4:09:25,  1.57s/it][A
Training...:  32% 4395/13907 [2:40:49<4:03:34,  1.54s/it][A
Training...:  32% 4396/13907 [2:40:51<3:55:46,  1.49s/it][A
Training...:  32% 4397/13907 [2:40:52<3:47:42,  1.44s/it][A
Training...:  32% 4398/13907 [2:40:53<3:39:29,  1.38s/it][A
Training...:  32% 4399/13907 [2:40:54<3:28:26,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:41:08<?, ?it/s]
Training...:  32% 4399/13907 [2:40:56<3:28:26,  1.32s/it][A
Training...:  32% 4400/13907 [2:40:56<3:22:56,  1.28s/it][A
Training...:  32% 4401/13907 [2:40:59<5:17:12,  2.00s/it][A
Training...:  32% 4402/13907 [2:41:03<6:21:21,  2.41s/it][A
Training...:  32% 4403/13907 [2:41:06<6:56:48,  2.63s/it][A
Training...:  32% 4404/13907 [2:41:09<7:16:14,  2.75s/it][A
Training...:  32% 4405/13907 [2:41:12<7:28:44,  2.83s/it][A
Training...:  32% 4406/13907 [2:41:15<7:29:33,  2.84s/it][A
Training...:  32% 4407/13907 [2:41:17<7:28:03,  2.83s/it][A
Training...:  32% 4408/13907 [2:41:20<7:22:55,  2.80s/it][A
Training...:  32% 4409/13907 [2:41:23<7:19:20,  2.78s/it][A
Training...:  32% 4410/13907 [2:41:26<7:12:34,  2.73s/it][A
Training...:  32% 4411/13907 [2:41:28<7:05:06,  2.69s/it][A
Training...:  32% 4412/13907 [2:41:31<6:58:04,  2.64s/it][A
Training...:  32% 4413/13907 [2:41:33<6:51:25,  2.60s/it][A
Training...:  32% 4414/13907 [2:41:36<6:44:04,  2.55s/it][A
Training...:  32% 4415/13907 [2:41:38<6:37:07,  2.51s/it][A
Training...:  32% 4416/13907 [2:41:40<6:29:51,  2.46s/it][A
Training...:  32% 4417/13907 [2:41:43<6:24:36,  2.43s/it][A
Training...:  32% 4418/13907 [2:41:45<6:17:17,  2.39s/it][A
Training...:  32% 4419/13907 [2:41:47<6:13:18,  2.36s/it][A
Training...:  32% 4420/13907 [2:41:50<6:09:01,  2.33s/it][A
Training...:  32% 4421/13907 [2:41:52<6:04:36,  2.31s/it][A
Training...:  32% 4422/13907 [2:41:54<5:57:26,  2.26s/it][A
Training...:  32% 4423/13907 [2:41:56<5:52:21,  2.23s/it][A
Training...:  32% 4424/13907 [2:41:58<5:46:29,  2.19s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:42:13<?, ?it/s]
Training...:  32% 4424/13907 [2:42:01<5:46:29,  2.19s/it][A
Training...:  32% 4425/13907 [2:42:01<5:57:04,  2.26s/it][A
Training...:  32% 4426/13907 [2:42:03<5:49:51,  2.21s/it][A
Training...:  32% 4427/13907 [2:42:05<5:40:20,  2.15s/it][A
Training...:  32% 4428/13907 [2:42:07<5:33:22,  2.11s/it][A
Training...:  32% 4429/13907 [2:42:09<5:25:25,  2.06s/it][A
Training...:  32% 4430/13907 [2:42:11<5:19:56,  2.03s/it][A
Training...:  32% 4431/13907 [2:42:13<5:14:39,  1.99s/it][A
Training...:  32% 4432/13907 [2:42:14<5:11:20,  1.97s/it][A
Training...:  32% 4433/13907 [2:42:16<5:07:32,  1.95s/it][A
Training...:  32% 4434/13907 [2:42:18<5:05:22,  1.93s/it][A
Training...:  32% 4435/13907 [2:42:20<4:58:59,  1.89s/it][A
Training...:  32% 4436/13907 [2:42:22<4:53:39,  1.86s/it][A
Training...:  32% 4437/13907 [2:42:24<4:48:56,  1.83s/it][A
Training...:  32% 4438/13907 [2:42:25<4:44:03,  1.80s/it][A
Training...:  32% 4439/13907 [2:42:27<4:38:19,  1.76s/it][A
Training...:  32% 4440/13907 [2:42:29<4:32:12,  1.73s/it][A
Training...:  32% 4441/13907 [2:42:30<4:26:49,  1.69s/it][A
Training...:  32% 4442/13907 [2:42:32<4:20:40,  1.65s/it][A
Training...:  32% 4443/13907 [2:42:33<4:15:15,  1.62s/it][A
Training...:  32% 4444/13907 [2:42:35<4:08:55,  1.58s/it][A
Training...:  32% 4445/13907 [2:42:36<4:01:12,  1.53s/it][A
Training...:  32% 4446/13907 [2:42:38<3:54:18,  1.49s/it][A
Training...:  32% 4447/13907 [2:42:39<3:46:53,  1.44s/it][A
Training...:  32% 4448/13907 [2:42:40<3:38:38,  1.39s/it][A
Training...:  32% 4449/13907 [2:42:41<3:27:50,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:42:55<?, ?it/s]
Training...:  32% 4449/13907 [2:42:43<3:27:50,  1.32s/it][A
Training...:  32% 4450/13907 [2:42:43<3:23:36,  1.29s/it][A
Training...:  32% 4451/13907 [2:42:46<5:18:00,  2.02s/it][A
Training...:  32% 4452/13907 [2:42:50<6:18:32,  2.40s/it][A
Training...:  32% 4453/13907 [2:42:53<6:53:56,  2.63s/it][A
Training...:  32% 4454/13907 [2:42:56<7:12:39,  2.75s/it][A
Training...:  32% 4455/13907 [2:42:59<7:23:04,  2.81s/it][A
Training...:  32% 4456/13907 [2:43:02<7:23:01,  2.81s/it][A
Training...:  32% 4457/13907 [2:43:04<7:21:09,  2.80s/it][A
Training...:  32% 4458/13907 [2:43:07<7:16:16,  2.77s/it][A
Training...:  32% 4459/13907 [2:43:10<7:10:36,  2.73s/it][A
Training...:  32% 4460/13907 [2:43:12<7:03:31,  2.69s/it][A
Training...:  32% 4461/13907 [2:43:15<6:57:25,  2.65s/it][A
Training...:  32% 4462/13907 [2:43:17<6:49:34,  2.60s/it][A
Training...:  32% 4463/13907 [2:43:20<6:43:57,  2.57s/it][A
Training...:  32% 4464/13907 [2:43:22<6:36:41,  2.52s/it][A
Training...:  32% 4465/13907 [2:43:25<6:30:31,  2.48s/it][A
Training...:  32% 4466/13907 [2:43:27<6:25:49,  2.45s/it][A
Training...:  32% 4467/13907 [2:43:29<6:22:25,  2.43s/it][A
Training...:  32% 4468/13907 [2:43:32<6:14:21,  2.38s/it][A
Training...:  32% 4469/13907 [2:43:34<6:08:30,  2.34s/it][A
Training...:  32% 4470/13907 [2:43:36<6:02:42,  2.31s/it][A
Training...:  32% 4471/13907 [2:43:38<5:56:52,  2.27s/it][A
Training...:  32% 4472/13907 [2:43:40<5:51:28,  2.24s/it][A
Training...:  32% 4473/13907 [2:43:43<5:45:36,  2.20s/it][A
Training...:  32% 4474/13907 [2:43:45<5:39:33,  2.16s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:43:59<?, ?it/s]
Training...:  32% 4474/13907 [2:43:47<5:39:33,  2.16s/it][A
Training...:  32% 4475/13907 [2:43:47<5:48:52,  2.22s/it][A
Training...:  32% 4476/13907 [2:43:49<5:41:40,  2.17s/it][A
Training...:  32% 4477/13907 [2:43:51<5:33:56,  2.12s/it][A
Training...:  32% 4478/13907 [2:43:53<5:25:31,  2.07s/it][A
Training...:  32% 4479/13907 [2:43:55<5:22:38,  2.05s/it][A
Training...:  32% 4480/13907 [2:43:57<5:15:09,  2.01s/it][A
Training...:  32% 4481/13907 [2:43:59<5:11:45,  1.98s/it][A
Training...:  32% 4482/13907 [2:44:01<5:05:32,  1.95s/it][A
Training...:  32% 4483/13907 [2:44:03<5:02:08,  1.92s/it][A
Training...:  32% 4484/13907 [2:44:04<4:58:11,  1.90s/it][A
Training...:  32% 4485/13907 [2:44:06<4:53:33,  1.87s/it][A
Training...:  32% 4486/13907 [2:44:08<4:48:56,  1.84s/it][A
Training...:  32% 4487/13907 [2:44:10<4:43:59,  1.81s/it][A
Training...:  32% 4488/13907 [2:44:11<4:37:52,  1.77s/it][A
Training...:  32% 4489/13907 [2:44:13<4:31:23,  1.73s/it][A
Training...:  32% 4490/13907 [2:44:15<4:26:42,  1.70s/it][A
Training...:  32% 4491/13907 [2:44:16<4:20:24,  1.66s/it][A
Training...:  32% 4492/13907 [2:44:18<4:14:53,  1.62s/it][A
Training...:  32% 4493/13907 [2:44:19<4:08:48,  1.59s/it][A
Training...:  32% 4494/13907 [2:44:21<4:03:37,  1.55s/it][A
Training...:  32% 4495/13907 [2:44:22<3:57:27,  1.51s/it][A
Training...:  32% 4496/13907 [2:44:24<3:49:59,  1.47s/it][A
Training...:  32% 4497/13907 [2:44:25<3:41:57,  1.42s/it][A
Training...:  32% 4498/13907 [2:44:26<3:33:59,  1.36s/it][A
Training...:  32% 4499/13907 [2:44:27<3:23:54,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:44:41<?, ?it/s]
Training...:  32% 4499/13907 [2:44:28<3:23:54,  1.30s/it][A
Training...:  32% 4500/13907 [2:44:28<3:20:37,  1.28s/it][A
Training...:  32% 4501/13907 [2:44:32<5:16:29,  2.02s/it][A
Training...:  32% 4502/13907 [2:44:36<6:19:07,  2.42s/it][A
Training...:  32% 4503/13907 [2:44:39<6:55:16,  2.65s/it][A
Training...:  32% 4504/13907 [2:44:42<7:13:43,  2.77s/it][A
Training...:  32% 4505/13907 [2:44:45<7:23:38,  2.83s/it][A
Training...:  32% 4506/13907 [2:44:48<7:25:28,  2.84s/it][A
Training...:  32% 4507/13907 [2:44:51<7:26:09,  2.85s/it][A
Training...:  32% 4508/13907 [2:44:53<7:19:41,  2.81s/it][A
Training...:  32% 4509/13907 [2:44:56<7:12:34,  2.76s/it][A
Training...:  32% 4510/13907 [2:44:58<7:04:29,  2.71s/it][A
Training...:  32% 4511/13907 [2:45:01<6:58:35,  2.67s/it][A
Training...:  32% 4512/13907 [2:45:04<6:50:19,  2.62s/it][A
Training...:  32% 4513/13907 [2:45:06<6:43:49,  2.58s/it][A
Training...:  32% 4514/13907 [2:45:09<6:38:04,  2.54s/it][A
Training...:  32% 4515/13907 [2:45:11<6:32:43,  2.51s/it][A
Training...:  32% 4516/13907 [2:45:13<6:26:29,  2.47s/it][A
Training...:  32% 4517/13907 [2:45:16<6:22:09,  2.44s/it][A
Training...:  32% 4518/13907 [2:45:18<6:17:18,  2.41s/it][A
Training...:  32% 4519/13907 [2:45:20<6:11:53,  2.38s/it][A
Training...:  33% 4520/13907 [2:45:23<6:05:58,  2.34s/it][A
Training...:  33% 4521/13907 [2:45:25<6:01:33,  2.31s/it][A
Training...:  33% 4522/13907 [2:45:27<5:55:32,  2.27s/it][A
Training...:  33% 4523/13907 [2:45:29<5:50:45,  2.24s/it][A
Training...:  33% 4524/13907 [2:45:31<5:45:37,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:45:46<?, ?it/s]
Training...:  33% 4524/13907 [2:45:34<5:45:37,  2.21s/it][A
Training...:  33% 4525/13907 [2:45:34<5:54:52,  2.27s/it][A
Training...:  33% 4526/13907 [2:45:36<5:47:02,  2.22s/it][A
Training...:  33% 4527/13907 [2:45:38<5:38:28,  2.17s/it][A
Training...:  33% 4528/13907 [2:45:40<5:30:14,  2.11s/it][A
Training...:  33% 4529/13907 [2:45:42<5:23:49,  2.07s/it][A
Training...:  33% 4530/13907 [2:45:44<5:16:54,  2.03s/it][A
Training...:  33% 4531/13907 [2:45:46<5:10:37,  1.99s/it][A
Training...:  33% 4532/13907 [2:45:48<5:05:28,  1.96s/it][A
Training...:  33% 4533/13907 [2:45:49<5:00:05,  1.92s/it][A
Training...:  33% 4534/13907 [2:45:51<4:56:14,  1.90s/it][A
Training...:  33% 4535/13907 [2:45:53<4:54:06,  1.88s/it][A
Training...:  33% 4536/13907 [2:45:55<4:48:05,  1.84s/it][A
Training...:  33% 4537/13907 [2:45:57<4:42:22,  1.81s/it][A
Training...:  33% 4538/13907 [2:45:58<4:37:11,  1.78s/it][A
Training...:  33% 4539/13907 [2:46:00<4:31:22,  1.74s/it][A
Training...:  33% 4540/13907 [2:46:02<4:25:59,  1.70s/it][A
Training...:  33% 4541/13907 [2:46:03<4:20:07,  1.67s/it][A
Training...:  33% 4542/13907 [2:46:05<4:14:40,  1.63s/it][A
Training...:  33% 4543/13907 [2:46:06<4:08:25,  1.59s/it][A
Training...:  33% 4544/13907 [2:46:08<4:02:09,  1.55s/it][A
Training...:  33% 4545/13907 [2:46:09<3:54:31,  1.50s/it][A
Training...:  33% 4546/13907 [2:46:10<3:48:27,  1.46s/it][A
Training...:  33% 4547/13907 [2:46:12<3:40:38,  1.41s/it][A
Training...:  33% 4548/13907 [2:46:13<3:31:49,  1.36s/it][A
Training...:  33% 4549/13907 [2:46:14<3:21:47,  1.29s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:46:28<?, ?it/s]
Training...:  33% 4549/13907 [2:46:15<3:21:47,  1.29s/it][A
Training...:  33% 4550/13907 [2:46:15<3:17:27,  1.27s/it][A
Training...:  33% 4551/13907 [2:46:19<5:15:35,  2.02s/it][A
Training...:  33% 4552/13907 [2:46:22<6:20:13,  2.44s/it][A
Training...:  33% 4553/13907 [2:46:26<6:55:00,  2.66s/it][A
Training...:  33% 4554/13907 [2:46:29<7:11:38,  2.77s/it][A
Training...:  33% 4555/13907 [2:46:32<7:21:39,  2.83s/it][A
Training...:  33% 4556/13907 [2:46:34<7:21:41,  2.83s/it][A
Training...:  33% 4557/13907 [2:46:37<7:18:57,  2.82s/it][A
Training...:  33% 4558/13907 [2:46:40<7:13:08,  2.78s/it][A
Training...:  33% 4559/13907 [2:46:43<7:08:25,  2.75s/it][A
Training...:  33% 4560/13907 [2:46:45<7:01:58,  2.71s/it][A
Training...:  33% 4561/13907 [2:46:48<6:56:02,  2.67s/it][A
Training...:  33% 4562/13907 [2:46:50<6:49:22,  2.63s/it][A
Training...:  33% 4563/13907 [2:46:53<6:43:25,  2.59s/it][A
Training...:  33% 4564/13907 [2:46:55<6:36:32,  2.55s/it][A
Training...:  33% 4565/13907 [2:46:58<6:31:00,  2.51s/it][A
Training...:  33% 4566/13907 [2:47:00<6:25:14,  2.47s/it][A
Training...:  33% 4567/13907 [2:47:02<6:21:35,  2.45s/it][A
Training...:  33% 4568/13907 [2:47:05<6:15:57,  2.42s/it][A
Training...:  33% 4569/13907 [2:47:07<6:10:16,  2.38s/it][A
Training...:  33% 4570/13907 [2:47:09<6:04:20,  2.34s/it][A
Training...:  33% 4571/13907 [2:47:12<5:58:56,  2.31s/it][A
Training...:  33% 4572/13907 [2:47:14<5:53:12,  2.27s/it][A
Training...:  33% 4573/13907 [2:47:16<5:48:36,  2.24s/it][A
Training...:  33% 4574/13907 [2:47:18<5:44:52,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:47:33<?, ?it/s]
Training...:  33% 4574/13907 [2:47:21<5:44:52,  2.22s/it][A
Training...:  33% 4575/13907 [2:47:21<5:56:58,  2.30s/it][A
Training...:  33% 4576/13907 [2:47:23<5:51:23,  2.26s/it][A
Training...:  33% 4577/13907 [2:47:25<5:41:55,  2.20s/it][A
Training...:  33% 4578/13907 [2:47:27<5:31:45,  2.13s/it][A
Training...:  33% 4579/13907 [2:47:29<5:24:22,  2.09s/it][A
Training...:  33% 4580/13907 [2:47:31<5:18:17,  2.05s/it][A
Training...:  33% 4581/13907 [2:47:33<5:12:36,  2.01s/it][A
Training...:  33% 4582/13907 [2:47:35<5:07:06,  1.98s/it][A
Training...:  33% 4583/13907 [2:47:36<5:00:53,  1.94s/it][A
Training...:  33% 4584/13907 [2:47:38<4:56:29,  1.91s/it][A
Training...:  33% 4585/13907 [2:47:40<4:50:46,  1.87s/it][A
Training...:  33% 4586/13907 [2:47:42<4:45:00,  1.83s/it][A
Training...:  33% 4587/13907 [2:47:44<4:40:22,  1.81s/it][A
Training...:  33% 4588/13907 [2:47:45<4:36:00,  1.78s/it][A
Training...:  33% 4589/13907 [2:47:47<4:30:22,  1.74s/it][A
Training...:  33% 4590/13907 [2:47:49<4:25:17,  1.71s/it][A
Training...:  33% 4591/13907 [2:47:50<4:20:16,  1.68s/it][A
Training...:  33% 4592/13907 [2:47:52<4:14:34,  1.64s/it][A
Training...:  33% 4593/13907 [2:47:53<4:09:28,  1.61s/it][A
Training...:  33% 4594/13907 [2:47:55<4:04:02,  1.57s/it][A
Training...:  33% 4595/13907 [2:47:56<3:57:45,  1.53s/it][A
Training...:  33% 4596/13907 [2:47:58<3:50:29,  1.49s/it][A
Training...:  33% 4597/13907 [2:47:59<3:42:34,  1.43s/it][A
Training...:  33% 4598/13907 [2:48:00<3:34:50,  1.38s/it][A
Training...:  33% 4599/13907 [2:48:01<3:23:36,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:48:15<?, ?it/s]
Training...:  33% 4599/13907 [2:48:02<3:23:36,  1.31s/it][A
Training...:  33% 4600/13907 [2:48:02<3:18:50,  1.28s/it][A
Training...:  33% 4601/13907 [2:48:06<5:14:11,  2.03s/it][A
Training...:  33% 4602/13907 [2:48:10<6:18:51,  2.44s/it][A
Training...:  33% 4603/13907 [2:48:13<6:52:57,  2.66s/it][A
Training...:  33% 4604/13907 [2:48:16<7:10:09,  2.77s/it][A
Training...:  33% 4605/13907 [2:48:19<7:19:27,  2.83s/it][A
Training...:  33% 4606/13907 [2:48:22<7:19:50,  2.84s/it][A
Training...:  33% 4607/13907 [2:48:24<7:18:56,  2.83s/it][A
Training...:  33% 4608/13907 [2:48:27<7:14:29,  2.80s/it][A
Training...:  33% 4609/13907 [2:48:30<7:09:57,  2.77s/it][A
Training...:  33% 4610/13907 [2:48:33<7:03:17,  2.73s/it][A
Training...:  33% 4611/13907 [2:48:35<6:56:53,  2.69s/it][A
Training...:  33% 4612/13907 [2:48:38<6:48:50,  2.64s/it][A
Training...:  33% 4613/13907 [2:48:40<6:44:33,  2.61s/it][A
Training...:  33% 4614/13907 [2:48:43<6:38:00,  2.57s/it][A
Training...:  33% 4615/13907 [2:48:45<6:30:58,  2.52s/it][A
Training...:  33% 4616/13907 [2:48:48<6:24:56,  2.49s/it][A
Training...:  33% 4617/13907 [2:48:50<6:18:17,  2.44s/it][A
Training...:  33% 4618/13907 [2:48:52<6:12:56,  2.41s/it][A
Training...:  33% 4619/13907 [2:48:55<6:09:06,  2.38s/it][A
Training...:  33% 4620/13907 [2:48:57<6:02:47,  2.34s/it][A
Training...:  33% 4621/13907 [2:48:59<5:57:39,  2.31s/it][A
Training...:  33% 4622/13907 [2:49:01<5:52:42,  2.28s/it][A
Training...:  33% 4623/13907 [2:49:03<5:50:42,  2.27s/it][A
Training...:  33% 4624/13907 [2:49:06<5:45:13,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:49:20<?, ?it/s]
Training...:  33% 4624/13907 [2:49:08<5:45:13,  2.23s/it][A
Training...:  33% 4625/13907 [2:49:08<5:53:16,  2.28s/it][A
Training...:  33% 4626/13907 [2:49:10<5:46:32,  2.24s/it][A
Training...:  33% 4627/13907 [2:49:12<5:37:01,  2.18s/it][A
Training...:  33% 4628/13907 [2:49:14<5:29:45,  2.13s/it][A
Training...:  33% 4629/13907 [2:49:16<5:24:16,  2.10s/it][A
Training...:  33% 4630/13907 [2:49:18<5:19:04,  2.06s/it][A
Training...:  33% 4631/13907 [2:49:20<5:16:41,  2.05s/it][A
Training...:  33% 4632/13907 [2:49:22<5:11:00,  2.01s/it][A
Training...:  33% 4633/13907 [2:49:24<5:07:40,  1.99s/it][A
Training...:  33% 4634/13907 [2:49:26<5:03:51,  1.97s/it][A
Training...:  33% 4635/13907 [2:49:28<4:58:55,  1.93s/it][A
Training...:  33% 4636/13907 [2:49:30<4:53:23,  1.90s/it][A
Training...:  33% 4637/13907 [2:49:31<4:48:19,  1.87s/it][A
Training...:  33% 4638/13907 [2:49:33<4:43:46,  1.84s/it][A
Training...:  33% 4639/13907 [2:49:35<4:37:59,  1.80s/it][A
Training...:  33% 4640/13907 [2:49:37<4:30:51,  1.75s/it][A
Training...:  33% 4641/13907 [2:49:38<4:24:58,  1.72s/it][A
Training...:  33% 4642/13907 [2:49:40<4:19:24,  1.68s/it][A
Training...:  33% 4643/13907 [2:49:41<4:13:29,  1.64s/it][A
Training...:  33% 4644/13907 [2:49:43<4:07:08,  1.60s/it][A
Training...:  33% 4645/13907 [2:49:44<4:01:52,  1.57s/it][A
Training...:  33% 4646/13907 [2:49:46<3:54:38,  1.52s/it][A
Training...:  33% 4647/13907 [2:49:47<3:46:29,  1.47s/it][A
Training...:  33% 4648/13907 [2:49:48<3:37:10,  1.41s/it][A
Training...:  33% 4649/13907 [2:49:50<3:26:38,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:50:03<?, ?it/s]
Training...:  33% 4649/13907 [2:49:51<3:26:38,  1.34s/it][A
Training...:  33% 4650/13907 [2:49:51<3:20:23,  1.30s/it][A
Training...:  33% 4651/13907 [2:49:54<5:13:06,  2.03s/it][A
Training...:  33% 4652/13907 [2:49:58<6:14:04,  2.43s/it][A
Training...:  33% 4653/13907 [2:50:01<6:48:05,  2.65s/it][A
Training...:  33% 4654/13907 [2:50:04<7:06:21,  2.76s/it][A
Training...:  33% 4655/13907 [2:50:07<7:15:27,  2.82s/it][A
Training...:  33% 4656/13907 [2:50:10<7:16:12,  2.83s/it][A
Training...:  33% 4657/13907 [2:50:13<7:16:20,  2.83s/it][A
Training...:  33% 4658/13907 [2:50:15<7:12:30,  2.81s/it][A
Training...:  34% 4659/13907 [2:50:18<7:07:20,  2.77s/it][A
Training...:  34% 4660/13907 [2:50:21<7:00:19,  2.73s/it][A
Training...:  34% 4661/13907 [2:50:23<6:55:21,  2.70s/it][A
Training...:  34% 4662/13907 [2:50:26<6:48:36,  2.65s/it][A
Training...:  34% 4663/13907 [2:50:28<6:43:41,  2.62s/it][A
Training...:  34% 4664/13907 [2:50:31<6:36:48,  2.58s/it][A
Training...:  34% 4665/13907 [2:50:33<6:32:23,  2.55s/it][A
Training...:  34% 4666/13907 [2:50:36<6:26:59,  2.51s/it][A
Training...:  34% 4667/13907 [2:50:38<6:19:34,  2.46s/it][A
Training...:  34% 4668/13907 [2:50:41<6:12:25,  2.42s/it][A
Training...:  34% 4669/13907 [2:50:43<6:08:00,  2.39s/it][A
Training...:  34% 4670/13907 [2:50:45<6:03:31,  2.36s/it][A
Training...:  34% 4671/13907 [2:50:47<6:00:37,  2.34s/it][A
Training...:  34% 4672/13907 [2:50:50<5:59:33,  2.34s/it][A
Training...:  34% 4673/13907 [2:50:52<5:53:54,  2.30s/it][A
Training...:  34% 4674/13907 [2:50:54<5:47:05,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:51:09<?, ?it/s]
Training...:  34% 4674/13907 [2:50:56<5:47:05,  2.26s/it][A
Training...:  34% 4675/13907 [2:50:56<5:53:24,  2.30s/it][A
Training...:  34% 4676/13907 [2:50:59<5:45:18,  2.24s/it][A
Training...:  34% 4677/13907 [2:51:01<5:35:36,  2.18s/it][A
Training...:  34% 4678/13907 [2:51:03<5:27:18,  2.13s/it][A
Training...:  34% 4679/13907 [2:51:05<5:20:11,  2.08s/it][A
Training...:  34% 4680/13907 [2:51:07<5:13:50,  2.04s/it][A
Training...:  34% 4681/13907 [2:51:08<5:07:14,  2.00s/it][A
Training...:  34% 4682/13907 [2:51:10<5:01:47,  1.96s/it][A
Training...:  34% 4683/13907 [2:51:12<4:57:11,  1.93s/it][A
Training...:  34% 4684/13907 [2:51:14<4:52:47,  1.90s/it][A
Training...:  34% 4685/13907 [2:51:16<4:48:55,  1.88s/it][A
Training...:  34% 4686/13907 [2:51:18<4:42:41,  1.84s/it][A
Training...:  34% 4687/13907 [2:51:19<4:37:47,  1.81s/it][A
Training...:  34% 4688/13907 [2:51:21<4:31:39,  1.77s/it][A
Training...:  34% 4689/13907 [2:51:23<4:27:08,  1.74s/it][A
Training...:  34% 4690/13907 [2:51:24<4:22:42,  1.71s/it][A
Training...:  34% 4691/13907 [2:51:26<4:17:55,  1.68s/it][A
Training...:  34% 4692/13907 [2:51:28<4:12:55,  1.65s/it][A
Training...:  34% 4693/13907 [2:51:29<4:07:59,  1.61s/it][A
Training...:  34% 4694/13907 [2:51:31<4:02:18,  1.58s/it][A
Training...:  34% 4695/13907 [2:51:32<3:56:35,  1.54s/it][A
Training...:  34% 4696/13907 [2:51:33<3:49:17,  1.49s/it][A
Training...:  34% 4697/13907 [2:51:35<3:42:25,  1.45s/it][A
Training...:  34% 4698/13907 [2:51:36<3:34:06,  1.39s/it][A
Training...:  34% 4699/13907 [2:51:37<3:23:09,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:51:51<?, ?it/s]
Training...:  34% 4699/13907 [2:51:38<3:23:09,  1.32s/it][A
Training...:  34% 4700/13907 [2:51:38<3:18:41,  1.29s/it][A
Training...:  34% 4701/13907 [2:51:42<5:08:34,  2.01s/it][A
Training...:  34% 4702/13907 [2:51:45<6:11:31,  2.42s/it][A
Training...:  34% 4703/13907 [2:51:49<6:45:02,  2.64s/it][A
Training...:  34% 4704/13907 [2:51:52<7:02:10,  2.75s/it][A
Training...:  34% 4705/13907 [2:51:55<7:12:22,  2.82s/it][A
Training...:  34% 4706/13907 [2:51:57<7:14:47,  2.84s/it][A
Training...:  34% 4707/13907 [2:52:00<7:14:22,  2.83s/it][A
Training...:  34% 4708/13907 [2:52:03<7:09:16,  2.80s/it][A
Training...:  34% 4709/13907 [2:52:06<7:06:00,  2.78s/it][A
Training...:  34% 4710/13907 [2:52:08<7:02:25,  2.76s/it][A
Training...:  34% 4711/13907 [2:52:11<6:55:24,  2.71s/it][A
Training...:  34% 4712/13907 [2:52:14<6:48:10,  2.66s/it][A
Training...:  34% 4713/13907 [2:52:16<6:41:16,  2.62s/it][A
Training...:  34% 4714/13907 [2:52:19<6:33:23,  2.57s/it][A
Training...:  34% 4715/13907 [2:52:21<6:25:53,  2.52s/it][A
Training...:  34% 4716/13907 [2:52:23<6:19:28,  2.48s/it][A
Training...:  34% 4717/13907 [2:52:26<6:13:50,  2.44s/it][A
Training...:  34% 4718/13907 [2:52:28<6:08:01,  2.40s/it][A
Training...:  34% 4719/13907 [2:52:30<6:02:39,  2.37s/it][A
Training...:  34% 4720/13907 [2:52:33<6:00:15,  2.35s/it][A
Training...:  34% 4721/13907 [2:52:35<5:57:53,  2.34s/it][A
Training...:  34% 4722/13907 [2:52:37<5:51:44,  2.30s/it][A
Training...:  34% 4723/13907 [2:52:39<5:44:03,  2.25s/it][A
Training...:  34% 4724/13907 [2:52:41<5:37:57,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:52:56<?, ?it/s]
Training...:  34% 4724/13907 [2:52:44<5:37:57,  2.21s/it][A
Training...:  34% 4725/13907 [2:52:44<5:46:33,  2.26s/it][A
Training...:  34% 4726/13907 [2:52:46<5:38:44,  2.21s/it][A
Training...:  34% 4727/13907 [2:52:48<5:29:41,  2.15s/it][A
Training...:  34% 4728/13907 [2:52:50<5:23:09,  2.11s/it][A
Training...:  34% 4729/13907 [2:52:52<5:16:13,  2.07s/it][A
Training...:  34% 4730/13907 [2:52:54<5:10:35,  2.03s/it][A
Training...:  34% 4731/13907 [2:52:56<5:05:04,  1.99s/it][A
Training...:  34% 4732/13907 [2:52:58<4:59:48,  1.96s/it][A
Training...:  34% 4733/13907 [2:52:59<4:55:06,  1.93s/it][A
Training...:  34% 4734/13907 [2:53:01<4:50:16,  1.90s/it][A
Training...:  34% 4735/13907 [2:53:03<4:45:24,  1.87s/it][A
Training...:  34% 4736/13907 [2:53:05<4:41:17,  1.84s/it][A
Training...:  34% 4737/13907 [2:53:07<4:36:38,  1.81s/it][A
Training...:  34% 4738/13907 [2:53:08<4:31:59,  1.78s/it][A
Training...:  34% 4739/13907 [2:53:10<4:28:02,  1.75s/it][A
Training...:  34% 4740/13907 [2:53:12<4:22:44,  1.72s/it][A
Training...:  34% 4741/13907 [2:53:13<4:16:44,  1.68s/it][A
Training...:  34% 4742/13907 [2:53:15<4:12:07,  1.65s/it][A
Training...:  34% 4743/13907 [2:53:16<4:06:20,  1.61s/it][A
Training...:  34% 4744/13907 [2:53:18<4:00:34,  1.58s/it][A
Training...:  34% 4745/13907 [2:53:19<3:55:23,  1.54s/it][A
Training...:  34% 4746/13907 [2:53:21<3:48:35,  1.50s/it][A
Training...:  34% 4747/13907 [2:53:22<3:40:34,  1.44s/it][A
Training...:  34% 4748/13907 [2:53:23<3:32:40,  1.39s/it][A
Training...:  34% 4749/13907 [2:53:24<3:23:33,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:53:38<?, ?it/s]
Training...:  34% 4749/13907 [2:53:26<3:23:33,  1.33s/it][A
Training...:  34% 4750/13907 [2:53:26<3:19:22,  1.31s/it][A
Training...:  34% 4751/13907 [2:53:29<5:10:05,  2.03s/it][A
Training...:  34% 4752/13907 [2:53:33<6:13:53,  2.45s/it][A
Training...:  34% 4753/13907 [2:53:36<6:49:21,  2.68s/it][A
Training...:  34% 4754/13907 [2:53:39<7:08:39,  2.81s/it][A
Training...:  34% 4755/13907 [2:53:42<7:19:52,  2.88s/it][A
Training...:  34% 4756/13907 [2:53:45<7:20:55,  2.89s/it][A
Training...:  34% 4757/13907 [2:53:48<7:18:41,  2.88s/it][A
Training...:  34% 4758/13907 [2:53:51<7:14:35,  2.85s/it][A
Training...:  34% 4759/13907 [2:53:54<7:08:49,  2.81s/it][A
Training...:  34% 4760/13907 [2:53:56<7:01:36,  2.77s/it][A
Training...:  34% 4761/13907 [2:53:59<6:54:16,  2.72s/it][A
Training...:  34% 4762/13907 [2:54:01<6:47:39,  2.67s/it][A
Training...:  34% 4763/13907 [2:54:04<6:41:30,  2.63s/it][A
Training...:  34% 4764/13907 [2:54:06<6:33:40,  2.58s/it][A
Training...:  34% 4765/13907 [2:54:09<6:26:39,  2.54s/it][A
Training...:  34% 4766/13907 [2:54:11<6:23:08,  2.51s/it][A
Training...:  34% 4767/13907 [2:54:14<6:17:50,  2.48s/it][A
Training...:  34% 4768/13907 [2:54:16<6:14:09,  2.46s/it][A
Training...:  34% 4769/13907 [2:54:18<6:07:52,  2.42s/it][A
Training...:  34% 4770/13907 [2:54:21<6:00:15,  2.37s/it][A
Training...:  34% 4771/13907 [2:54:23<5:54:48,  2.33s/it][A
Training...:  34% 4772/13907 [2:54:25<5:48:49,  2.29s/it][A
Training...:  34% 4773/13907 [2:54:27<5:42:49,  2.25s/it][A
Training...:  34% 4774/13907 [2:54:29<5:36:37,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:54:44<?, ?it/s]
Training...:  34% 4774/13907 [2:54:32<5:36:37,  2.21s/it][A
Training...:  34% 4775/13907 [2:54:32<5:46:03,  2.27s/it][A
Training...:  34% 4776/13907 [2:54:34<5:39:12,  2.23s/it][A
Training...:  34% 4777/13907 [2:54:36<5:32:50,  2.19s/it][A
Training...:  34% 4778/13907 [2:54:38<5:24:39,  2.13s/it][A
Training...:  34% 4779/13907 [2:54:40<5:18:16,  2.09s/it][A
Training...:  34% 4780/13907 [2:54:42<5:11:08,  2.05s/it][A
Training...:  34% 4781/13907 [2:54:44<5:05:13,  2.01s/it][A
Training...:  34% 4782/13907 [2:54:46<5:00:22,  1.98s/it][A
Training...:  34% 4783/13907 [2:54:48<4:56:29,  1.95s/it][A
Training...:  34% 4784/13907 [2:54:49<4:52:22,  1.92s/it][A
Training...:  34% 4785/13907 [2:54:51<4:47:16,  1.89s/it][A
Training...:  34% 4786/13907 [2:54:53<4:43:08,  1.86s/it][A
Training...:  34% 4787/13907 [2:54:55<4:38:32,  1.83s/it][A
Training...:  34% 4788/13907 [2:54:57<4:32:32,  1.79s/it][A
Training...:  34% 4789/13907 [2:54:58<4:26:48,  1.76s/it][A
Training...:  34% 4790/13907 [2:55:00<4:21:10,  1.72s/it][A
Training...:  34% 4791/13907 [2:55:01<4:15:54,  1.68s/it][A
Training...:  34% 4792/13907 [2:55:03<4:10:16,  1.65s/it][A
Training...:  34% 4793/13907 [2:55:05<4:04:36,  1.61s/it][A
Training...:  34% 4794/13907 [2:55:06<3:59:05,  1.57s/it][A
Training...:  34% 4795/13907 [2:55:07<3:52:28,  1.53s/it][A
Training...:  34% 4796/13907 [2:55:09<3:44:55,  1.48s/it][A
Training...:  34% 4797/13907 [2:55:10<3:38:00,  1.44s/it][A
Training...:  35% 4798/13907 [2:55:11<3:30:02,  1.38s/it][A
Training...:  35% 4799/13907 [2:55:13<3:19:43,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:55:26<?, ?it/s]
Training...:  35% 4799/13907 [2:55:14<3:19:43,  1.32s/it][A
Training...:  35% 4800/13907 [2:55:14<3:14:34,  1.28s/it][A
Training...:  35% 4801/13907 [2:55:18<5:07:07,  2.02s/it][A
Training...:  35% 4802/13907 [2:55:21<6:11:07,  2.45s/it][A
Training...:  35% 4803/13907 [2:55:24<6:44:55,  2.67s/it][A
Training...:  35% 4804/13907 [2:55:27<7:05:55,  2.81s/it][A
Training...:  35% 4805/13907 [2:55:30<7:13:08,  2.86s/it][A
Training...:  35% 4806/13907 [2:55:33<7:13:07,  2.86s/it][A
Training...:  35% 4807/13907 [2:55:36<7:11:02,  2.84s/it][A
Training...:  35% 4808/13907 [2:55:39<7:08:01,  2.82s/it][A
Training...:  35% 4809/13907 [2:55:42<7:08:35,  2.83s/it][A
Training...:  35% 4810/13907 [2:55:44<7:00:26,  2.77s/it][A
Training...:  35% 4811/13907 [2:55:47<6:50:06,  2.71s/it][A
Training...:  35% 4812/13907 [2:55:49<6:41:20,  2.65s/it][A
Training...:  35% 4813/13907 [2:55:52<6:34:42,  2.60s/it][A
Training...:  35% 4814/13907 [2:55:54<6:27:29,  2.56s/it][A
Training...:  35% 4815/13907 [2:55:57<6:22:22,  2.52s/it][A
Training...:  35% 4816/13907 [2:55:59<6:15:44,  2.48s/it][A
Training...:  35% 4817/13907 [2:56:01<6:10:29,  2.45s/it][A
Training...:  35% 4818/13907 [2:56:04<6:04:58,  2.41s/it][A
Training...:  35% 4819/13907 [2:56:06<5:59:56,  2.38s/it][A
Training...:  35% 4820/13907 [2:56:08<5:54:28,  2.34s/it][A
Training...:  35% 4821/13907 [2:56:11<5:50:00,  2.31s/it][A
Training...:  35% 4822/13907 [2:56:13<5:46:03,  2.29s/it][A
Training...:  35% 4823/13907 [2:56:15<5:40:34,  2.25s/it][A
Training...:  35% 4824/13907 [2:56:17<5:34:24,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:56:32<?, ?it/s]
Training...:  35% 4824/13907 [2:56:19<5:34:24,  2.21s/it][A
Training...:  35% 4825/13907 [2:56:19<5:42:19,  2.26s/it][A
Training...:  35% 4826/13907 [2:56:22<5:35:11,  2.21s/it][A
Training...:  35% 4827/13907 [2:56:24<5:26:05,  2.15s/it][A
Training...:  35% 4828/13907 [2:56:26<5:18:04,  2.10s/it][A
Training...:  35% 4829/13907 [2:56:27<5:11:24,  2.06s/it][A
Training...:  35% 4830/13907 [2:56:29<5:06:21,  2.03s/it][A
Training...:  35% 4831/13907 [2:56:31<5:00:56,  1.99s/it][A
Training...:  35% 4832/13907 [2:56:33<4:56:10,  1.96s/it][A
Training...:  35% 4833/13907 [2:56:35<4:51:39,  1.93s/it][A
Training...:  35% 4834/13907 [2:56:37<4:45:42,  1.89s/it][A
Training...:  35% 4835/13907 [2:56:39<4:40:38,  1.86s/it][A
Training...:  35% 4836/13907 [2:56:40<4:35:13,  1.82s/it][A
Training...:  35% 4837/13907 [2:56:42<4:30:21,  1.79s/it][A
Training...:  35% 4838/13907 [2:56:44<4:25:57,  1.76s/it][A
Training...:  35% 4839/13907 [2:56:45<4:20:59,  1.73s/it][A
Training...:  35% 4840/13907 [2:56:47<4:16:28,  1.70s/it][A
Training...:  35% 4841/13907 [2:56:49<4:11:10,  1.66s/it][A
Training...:  35% 4842/13907 [2:56:50<4:06:25,  1.63s/it][A
Training...:  35% 4843/13907 [2:56:52<4:01:42,  1.60s/it][A
Training...:  35% 4844/13907 [2:56:53<3:56:31,  1.57s/it][A
Training...:  35% 4845/13907 [2:56:55<3:51:02,  1.53s/it][A
Training...:  35% 4846/13907 [2:56:56<3:44:55,  1.49s/it][A
Training...:  35% 4847/13907 [2:56:57<3:37:15,  1.44s/it][A
Training...:  35% 4848/13907 [2:56:59<3:28:43,  1.38s/it][A
Training...:  35% 4849/13907 [2:57:00<3:18:33,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:57:13<?, ?it/s]
Training...:  35% 4849/13907 [2:57:01<3:18:33,  1.32s/it][A
Training...:  35% 4850/13907 [2:57:01<3:12:20,  1.27s/it][A
Training...:  35% 4851/13907 [2:57:05<5:01:58,  2.00s/it][A
Training...:  35% 4852/13907 [2:57:08<5:59:45,  2.38s/it][A
Training...:  35% 4853/13907 [2:57:11<6:32:04,  2.60s/it][A
Training...:  35% 4854/13907 [2:57:14<6:51:33,  2.73s/it][A
Training...:  35% 4855/13907 [2:57:17<7:01:48,  2.80s/it][A
Training...:  35% 4856/13907 [2:57:20<7:03:32,  2.81s/it][A
Training...:  35% 4857/13907 [2:57:23<7:01:25,  2.79s/it][A
Training...:  35% 4858/13907 [2:57:25<6:58:31,  2.78s/it][A
Training...:  35% 4859/13907 [2:57:28<6:52:52,  2.74s/it][A
Training...:  35% 4860/13907 [2:57:31<6:48:46,  2.71s/it][A
Training...:  35% 4861/13907 [2:57:33<6:45:38,  2.69s/it][A
Training...:  35% 4862/13907 [2:57:36<6:40:53,  2.66s/it][A
Training...:  35% 4863/13907 [2:57:38<6:33:32,  2.61s/it][A
Training...:  35% 4864/13907 [2:57:41<6:25:10,  2.56s/it][A
Training...:  35% 4865/13907 [2:57:43<6:18:11,  2.51s/it][A
Training...:  35% 4866/13907 [2:57:46<6:11:46,  2.47s/it][A
Training...:  35% 4867/13907 [2:57:48<6:06:02,  2.43s/it][A
Training...:  35% 4868/13907 [2:57:50<6:00:32,  2.39s/it][A
Training...:  35% 4869/13907 [2:57:52<5:55:09,  2.36s/it][A
Training...:  35% 4870/13907 [2:57:55<5:49:42,  2.32s/it][A
Training...:  35% 4871/13907 [2:57:57<5:44:41,  2.29s/it][A
Training...:  35% 4872/13907 [2:57:59<5:38:23,  2.25s/it][A
Training...:  35% 4873/13907 [2:58:01<5:32:58,  2.21s/it][A
Training...:  35% 4874/13907 [2:58:03<5:28:09,  2.18s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:58:18<?, ?it/s]
Training...:  35% 4874/13907 [2:58:06<5:28:09,  2.18s/it][A
Training...:  35% 4875/13907 [2:58:06<5:38:13,  2.25s/it][A
Training...:  35% 4876/13907 [2:58:08<5:32:01,  2.21s/it][A
Training...:  35% 4877/13907 [2:58:10<5:23:43,  2.15s/it][A
Training...:  35% 4878/13907 [2:58:12<5:17:10,  2.11s/it][A
Training...:  35% 4879/13907 [2:58:14<5:11:15,  2.07s/it][A
Training...:  35% 4880/13907 [2:58:16<5:05:52,  2.03s/it][A
Training...:  35% 4881/13907 [2:58:18<5:01:05,  2.00s/it][A
Training...:  35% 4882/13907 [2:58:20<4:56:09,  1.97s/it][A
Training...:  35% 4883/13907 [2:58:21<4:51:55,  1.94s/it][A
Training...:  35% 4884/13907 [2:58:23<4:46:50,  1.91s/it][A
Training...:  35% 4885/13907 [2:58:25<4:40:49,  1.87s/it][A
Training...:  35% 4886/13907 [2:58:27<4:35:39,  1.83s/it][A
Training...:  35% 4887/13907 [2:58:29<4:30:53,  1.80s/it][A
Training...:  35% 4888/13907 [2:58:30<4:26:50,  1.78s/it][A
Training...:  35% 4889/13907 [2:58:32<4:21:58,  1.74s/it][A
Training...:  35% 4890/13907 [2:58:34<4:16:28,  1.71s/it][A
Training...:  35% 4891/13907 [2:58:35<4:11:53,  1.68s/it][A
Training...:  35% 4892/13907 [2:58:37<4:07:10,  1.65s/it][A
Training...:  35% 4893/13907 [2:58:38<4:01:48,  1.61s/it][A
Training...:  35% 4894/13907 [2:58:40<3:55:37,  1.57s/it][A
Training...:  35% 4895/13907 [2:58:41<3:49:44,  1.53s/it][A
Training...:  35% 4896/13907 [2:58:43<3:42:35,  1.48s/it][A
Training...:  35% 4897/13907 [2:58:44<3:35:36,  1.44s/it][A
Training...:  35% 4898/13907 [2:58:45<3:27:11,  1.38s/it][A
Training...:  35% 4899/13907 [2:58:46<3:18:53,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [2:59:00<?, ?it/s]
Training...:  35% 4899/13907 [2:58:48<3:18:53,  1.32s/it][A
Training...:  35% 4900/13907 [2:58:48<3:14:21,  1.29s/it][A
Training...:  35% 4901/13907 [2:58:51<5:09:06,  2.06s/it][A
Training...:  35% 4902/13907 [2:58:55<6:08:13,  2.45s/it][A
Training...:  35% 4903/13907 [2:58:58<6:42:30,  2.68s/it][A
Training...:  35% 4904/13907 [2:59:01<7:00:42,  2.80s/it][A
Training...:  35% 4905/13907 [2:59:04<7:12:55,  2.89s/it][A
Training...:  35% 4906/13907 [2:59:07<7:15:35,  2.90s/it][A
Training...:  35% 4907/13907 [2:59:10<7:12:24,  2.88s/it][A
Training...:  35% 4908/13907 [2:59:13<7:05:24,  2.84s/it][A
Training...:  35% 4909/13907 [2:59:15<6:58:37,  2.79s/it][A
Training...:  35% 4910/13907 [2:59:18<6:50:39,  2.74s/it][A
Training...:  35% 4911/13907 [2:59:21<6:45:59,  2.71s/it][A
Training...:  35% 4912/13907 [2:59:23<6:40:48,  2.67s/it][A
Training...:  35% 4913/13907 [2:59:26<6:33:39,  2.63s/it][A
Training...:  35% 4914/13907 [2:59:28<6:24:51,  2.57s/it][A
Training...:  35% 4915/13907 [2:59:31<6:18:15,  2.52s/it][A
Training...:  35% 4916/13907 [2:59:33<6:10:25,  2.47s/it][A
Training...:  35% 4917/13907 [2:59:35<6:05:33,  2.44s/it][A
Training...:  35% 4918/13907 [2:59:38<6:00:16,  2.40s/it][A
Training...:  35% 4919/13907 [2:59:40<5:55:42,  2.37s/it][A
Training...:  35% 4920/13907 [2:59:42<5:50:19,  2.34s/it][A
Training...:  35% 4921/13907 [2:59:44<5:45:08,  2.30s/it][A
Training...:  35% 4922/13907 [2:59:47<5:40:30,  2.27s/it][A
Training...:  35% 4923/13907 [2:59:49<5:35:42,  2.24s/it][A
Training...:  35% 4924/13907 [2:59:51<5:30:47,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:00:06<?, ?it/s]
Training...:  35% 4924/13907 [2:59:53<5:30:47,  2.21s/it][A
Training...:  35% 4925/13907 [2:59:53<5:39:54,  2.27s/it][A
Training...:  35% 4926/13907 [2:59:55<5:33:05,  2.23s/it][A
Training...:  35% 4927/13907 [2:59:57<5:24:26,  2.17s/it][A
Training...:  35% 4928/13907 [2:59:59<5:17:13,  2.12s/it][A
Training...:  35% 4929/13907 [3:00:01<5:10:26,  2.07s/it][A
Training...:  35% 4930/13907 [3:00:03<5:04:08,  2.03s/it][A
Training...:  35% 4931/13907 [3:00:05<4:58:48,  2.00s/it][A
Training...:  35% 4932/13907 [3:00:07<4:53:51,  1.96s/it][A
Training...:  35% 4933/13907 [3:00:09<4:50:05,  1.94s/it][A
Training...:  35% 4934/13907 [3:00:11<4:45:26,  1.91s/it][A
Training...:  35% 4935/13907 [3:00:13<4:41:45,  1.88s/it][A
Training...:  35% 4936/13907 [3:00:15<4:36:54,  1.85s/it][A
Training...:  36% 4937/13907 [3:00:16<4:33:10,  1.83s/it][A
Training...:  36% 4938/13907 [3:00:18<4:28:54,  1.80s/it][A
Training...:  36% 4939/13907 [3:00:20<4:24:20,  1.77s/it][A
Training...:  36% 4940/13907 [3:00:21<4:19:18,  1.74s/it][A
Training...:  36% 4941/13907 [3:00:23<4:14:13,  1.70s/it][A
Training...:  36% 4942/13907 [3:00:25<4:08:16,  1.66s/it][A
Training...:  36% 4943/13907 [3:00:26<4:03:09,  1.63s/it][A
Training...:  36% 4944/13907 [3:00:28<3:57:14,  1.59s/it][A
Training...:  36% 4945/13907 [3:00:29<3:51:00,  1.55s/it][A
Training...:  36% 4946/13907 [3:00:30<3:44:46,  1.51s/it][A
Training...:  36% 4947/13907 [3:00:32<3:37:23,  1.46s/it][A
Training...:  36% 4948/13907 [3:00:33<3:29:12,  1.40s/it][A
Training...:  36% 4949/13907 [3:00:34<3:19:15,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:00:48<?, ?it/s]
Training...:  36% 4949/13907 [3:00:35<3:19:15,  1.33s/it][A
Training...:  36% 4950/13907 [3:00:35<3:14:35,  1.30s/it][A
Training...:  36% 4951/13907 [3:00:39<5:05:53,  2.05s/it][A
Training...:  36% 4952/13907 [3:00:43<6:06:47,  2.46s/it][A
Training...:  36% 4953/13907 [3:00:46<6:39:32,  2.68s/it][A
Training...:  36% 4954/13907 [3:00:49<6:55:05,  2.78s/it][A
Training...:  36% 4955/13907 [3:00:52<7:03:35,  2.84s/it][A
Training...:  36% 4956/13907 [3:00:55<7:04:42,  2.85s/it][A
Training...:  36% 4957/13907 [3:00:58<7:07:03,  2.86s/it][A
Training...:  36% 4958/13907 [3:01:00<7:01:02,  2.82s/it][A
Training...:  36% 4959/13907 [3:01:03<6:58:10,  2.80s/it][A
Training...:  36% 4960/13907 [3:01:06<6:54:59,  2.78s/it][A
Training...:  36% 4961/13907 [3:01:09<6:50:18,  2.75s/it][A
Training...:  36% 4962/13907 [3:01:11<6:40:59,  2.69s/it][A
Training...:  36% 4963/13907 [3:01:14<6:33:14,  2.64s/it][A
Training...:  36% 4964/13907 [3:01:16<6:26:06,  2.59s/it][A
Training...:  36% 4965/13907 [3:01:19<6:20:21,  2.55s/it][A
Training...:  36% 4966/13907 [3:01:21<6:14:33,  2.51s/it][A
Training...:  36% 4967/13907 [3:01:23<6:07:35,  2.47s/it][A
Training...:  36% 4968/13907 [3:01:26<6:01:43,  2.43s/it][A
Training...:  36% 4969/13907 [3:01:28<5:57:23,  2.40s/it][A
Training...:  36% 4970/13907 [3:01:30<5:51:39,  2.36s/it][A
Training...:  36% 4971/13907 [3:01:33<5:46:46,  2.33s/it][A
Training...:  36% 4972/13907 [3:01:35<5:41:38,  2.29s/it][A
Training...:  36% 4973/13907 [3:01:37<5:37:36,  2.27s/it][A
Training...:  36% 4974/13907 [3:01:39<5:31:58,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:01:54<?, ?it/s]
Training...:  36% 4974/13907 [3:01:41<5:31:58,  2.23s/it][A
Training...:  36% 4975/13907 [3:01:41<5:40:23,  2.29s/it][A
Training...:  36% 4976/13907 [3:01:44<5:33:48,  2.24s/it][A
Training...:  36% 4977/13907 [3:01:46<5:25:34,  2.19s/it][A
Training...:  36% 4978/13907 [3:01:48<5:18:06,  2.14s/it][A
Training...:  36% 4979/13907 [3:01:50<5:11:52,  2.10s/it][A
Training...:  36% 4980/13907 [3:01:52<5:06:28,  2.06s/it][A
Training...:  36% 4981/13907 [3:01:54<5:01:55,  2.03s/it][A
Training...:  36% 4982/13907 [3:01:56<4:56:36,  1.99s/it][A
Training...:  36% 4983/13907 [3:01:57<4:51:03,  1.96s/it][A
Training...:  36% 4984/13907 [3:01:59<4:46:41,  1.93s/it][A
Training...:  36% 4985/13907 [3:02:01<4:41:16,  1.89s/it][A
Training...:  36% 4986/13907 [3:02:03<4:36:17,  1.86s/it][A
Training...:  36% 4987/13907 [3:02:05<4:32:18,  1.83s/it][A
Training...:  36% 4988/13907 [3:02:06<4:28:18,  1.80s/it][A
Training...:  36% 4989/13907 [3:02:08<4:23:07,  1.77s/it][A
Training...:  36% 4990/13907 [3:02:10<4:18:34,  1.74s/it][A
Training...:  36% 4991/13907 [3:02:11<4:13:03,  1.70s/it][A
Training...:  36% 4992/13907 [3:02:13<4:07:31,  1.67s/it][A
Training...:  36% 4993/13907 [3:02:14<4:01:23,  1.62s/it][A
Training...:  36% 4994/13907 [3:02:16<3:58:39,  1.61s/it][A
Training...:  36% 4995/13907 [3:02:17<3:51:59,  1.56s/it][A
Training...:  36% 4996/13907 [3:02:19<3:43:37,  1.51s/it][A
Training...:  36% 4997/13907 [3:02:20<3:35:28,  1.45s/it][A
Training...:  36% 4998/13907 [3:02:21<3:26:05,  1.39s/it][A
Training...:  36% 4999/13907 [3:02:23<3:16:15,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:02:36<?, ?it/s]
Training...:  36% 4999/13907 [3:02:24<3:16:15,  1.32s/it][A
Training...:  36% 5000/13907 [3:02:24<3:11:31,  1.29s/it][A
Training...:  36% 5001/13907 [3:02:28<5:00:28,  2.02s/it][A
Training...:  36% 5002/13907 [3:02:31<5:58:40,  2.42s/it][A
Training...:  36% 5003/13907 [3:02:34<6:34:40,  2.66s/it][A
Training...:  36% 5004/13907 [3:02:37<6:51:58,  2.78s/it][A
Training...:  36% 5005/13907 [3:02:40<7:05:31,  2.87s/it][A
Training...:  36% 5006/13907 [3:02:43<7:08:48,  2.89s/it][A
Training...:  36% 5007/13907 [3:02:46<7:09:16,  2.89s/it][A
Training...:  36% 5008/13907 [3:02:49<7:02:09,  2.85s/it][A
Training...:  36% 5009/13907 [3:02:52<6:55:32,  2.80s/it][A
Training...:  36% 5010/13907 [3:02:54<6:47:15,  2.75s/it][A
Training...:  36% 5011/13907 [3:02:57<6:40:15,  2.70s/it][A
Training...:  36% 5012/13907 [3:02:59<6:33:30,  2.65s/it][A
Training...:  36% 5013/13907 [3:03:02<6:26:48,  2.61s/it][A
Training...:  36% 5014/13907 [3:03:04<6:19:55,  2.56s/it][A
Training...:  36% 5015/13907 [3:03:07<6:12:38,  2.51s/it][A
Training...:  36% 5016/13907 [3:03:09<6:06:27,  2.47s/it][A
Training...:  36% 5017/13907 [3:03:11<5:59:28,  2.43s/it][A
Training...:  36% 5018/13907 [3:03:14<5:53:05,  2.38s/it][A
Training...:  36% 5019/13907 [3:03:16<5:48:10,  2.35s/it][A
Training...:  36% 5020/13907 [3:03:18<5:43:07,  2.32s/it][A
Training...:  36% 5021/13907 [3:03:20<5:37:54,  2.28s/it][A
Training...:  36% 5022/13907 [3:03:23<5:33:40,  2.25s/it][A
Training...:  36% 5023/13907 [3:03:25<5:28:48,  2.22s/it][A
Training...:  36% 5024/13907 [3:03:27<5:22:44,  2.18s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:03:41<?, ?it/s]
Training...:  36% 5024/13907 [3:03:29<5:22:44,  2.18s/it][A
Training...:  36% 5025/13907 [3:03:29<5:30:52,  2.24s/it][A
Training...:  36% 5026/13907 [3:03:31<5:24:19,  2.19s/it][A
Training...:  36% 5027/13907 [3:03:33<5:17:03,  2.14s/it][A
Training...:  36% 5028/13907 [3:03:35<5:10:21,  2.10s/it][A
Training...:  36% 5029/13907 [3:03:37<5:04:51,  2.06s/it][A
Training...:  36% 5030/13907 [3:03:39<5:02:14,  2.04s/it][A
Training...:  36% 5031/13907 [3:03:41<4:59:17,  2.02s/it][A
Training...:  36% 5032/13907 [3:03:43<4:53:41,  1.99s/it][A
Training...:  36% 5033/13907 [3:03:45<4:49:30,  1.96s/it][A
Training...:  36% 5034/13907 [3:03:47<4:44:50,  1.93s/it][A
Training...:  36% 5035/13907 [3:03:49<4:39:59,  1.89s/it][A
Training...:  36% 5036/13907 [3:03:50<4:33:59,  1.85s/it][A
Training...:  36% 5037/13907 [3:03:52<4:28:04,  1.81s/it][A
Training...:  36% 5038/13907 [3:03:54<4:22:40,  1.78s/it][A
Training...:  36% 5039/13907 [3:03:55<4:18:11,  1.75s/it][A
Training...:  36% 5040/13907 [3:03:57<4:14:34,  1.72s/it][A
Training...:  36% 5041/13907 [3:03:59<4:09:14,  1.69s/it][A
Training...:  36% 5042/13907 [3:04:00<4:04:10,  1.65s/it][A
Training...:  36% 5043/13907 [3:04:02<3:58:45,  1.62s/it][A
Training...:  36% 5044/13907 [3:04:03<3:54:09,  1.59s/it][A
Training...:  36% 5045/13907 [3:04:05<3:48:28,  1.55s/it][A
Training...:  36% 5046/13907 [3:04:06<3:42:04,  1.50s/it][A
Training...:  36% 5047/13907 [3:04:08<3:35:14,  1.46s/it][A
Training...:  36% 5048/13907 [3:04:09<3:27:44,  1.41s/it][A
Training...:  36% 5049/13907 [3:04:10<3:18:28,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:04:24<?, ?it/s]
Training...:  36% 5049/13907 [3:04:11<3:18:28,  1.34s/it][A
Training...:  36% 5050/13907 [3:04:11<3:14:16,  1.32s/it][A
Training...:  36% 5051/13907 [3:04:15<5:12:24,  2.12s/it][A
Training...:  36% 5052/13907 [3:04:19<6:06:59,  2.49s/it][A
Training...:  36% 5053/13907 [3:04:22<6:35:49,  2.68s/it][A
Training...:  36% 5054/13907 [3:04:25<6:49:31,  2.78s/it][A
Training...:  36% 5055/13907 [3:04:28<6:56:21,  2.82s/it][A
Training...:  36% 5056/13907 [3:04:31<6:55:07,  2.81s/it][A
Training...:  36% 5057/13907 [3:04:33<6:53:40,  2.80s/it][A
Training...:  36% 5058/13907 [3:04:36<6:47:46,  2.76s/it][A
Training...:  36% 5059/13907 [3:04:39<6:42:16,  2.73s/it][A
Training...:  36% 5060/13907 [3:04:41<6:36:02,  2.69s/it][A
Training...:  36% 5061/13907 [3:04:44<6:30:43,  2.65s/it][A
Training...:  36% 5062/13907 [3:04:46<6:25:19,  2.61s/it][A
Training...:  36% 5063/13907 [3:04:49<6:20:12,  2.58s/it][A
Training...:  36% 5064/13907 [3:04:51<6:14:21,  2.54s/it][A
Training...:  36% 5065/13907 [3:04:54<6:09:23,  2.51s/it][A
Training...:  36% 5066/13907 [3:04:56<6:01:58,  2.46s/it][A
Training...:  36% 5067/13907 [3:04:58<5:57:37,  2.43s/it][A
Training...:  36% 5068/13907 [3:05:01<5:51:54,  2.39s/it][A
Training...:  36% 5069/13907 [3:05:03<5:48:08,  2.36s/it][A
Training...:  36% 5070/13907 [3:05:05<5:42:58,  2.33s/it][A
Training...:  36% 5071/13907 [3:05:07<5:37:59,  2.30s/it][A
Training...:  36% 5072/13907 [3:05:10<5:32:57,  2.26s/it][A
Training...:  36% 5073/13907 [3:05:12<5:28:40,  2.23s/it][A
Training...:  36% 5074/13907 [3:05:14<5:23:46,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:05:29<?, ?it/s]
Training...:  36% 5074/13907 [3:05:16<5:23:46,  2.20s/it][A
Training...:  36% 5075/13907 [3:05:16<5:33:52,  2.27s/it][A
Training...:  36% 5076/13907 [3:05:18<5:27:19,  2.22s/it][A
Training...:  37% 5077/13907 [3:05:20<5:19:00,  2.17s/it][A
Training...:  37% 5078/13907 [3:05:22<5:11:50,  2.12s/it][A
Training...:  37% 5079/13907 [3:05:24<5:05:08,  2.07s/it][A
Training...:  37% 5080/13907 [3:05:26<5:00:24,  2.04s/it][A
Training...:  37% 5081/13907 [3:05:28<4:55:56,  2.01s/it][A
Training...:  37% 5082/13907 [3:05:30<4:51:43,  1.98s/it][A
Training...:  37% 5083/13907 [3:05:32<4:47:27,  1.95s/it][A
Training...:  37% 5084/13907 [3:05:34<4:44:23,  1.93s/it][A
Training...:  37% 5085/13907 [3:05:36<4:39:55,  1.90s/it][A
Training...:  37% 5086/13907 [3:05:38<4:33:37,  1.86s/it][A
Training...:  37% 5087/13907 [3:05:39<4:28:40,  1.83s/it][A
Training...:  37% 5088/13907 [3:05:41<4:23:24,  1.79s/it][A
Training...:  37% 5089/13907 [3:05:43<4:18:25,  1.76s/it][A
Training...:  37% 5090/13907 [3:05:44<4:14:46,  1.73s/it][A
Training...:  37% 5091/13907 [3:05:46<4:09:23,  1.70s/it][A
Training...:  37% 5092/13907 [3:05:48<4:02:48,  1.65s/it][A
Training...:  37% 5093/13907 [3:05:49<3:57:18,  1.62s/it][A
Training...:  37% 5094/13907 [3:05:51<3:51:36,  1.58s/it][A
Training...:  37% 5095/13907 [3:05:52<3:44:17,  1.53s/it][A
Training...:  37% 5096/13907 [3:05:53<3:38:52,  1.49s/it][A
Training...:  37% 5097/13907 [3:05:55<3:31:11,  1.44s/it][A
Training...:  37% 5098/13907 [3:05:56<3:23:14,  1.38s/it][A
Training...:  37% 5099/13907 [3:05:57<3:14:05,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:06:11<?, ?it/s]
Training...:  37% 5099/13907 [3:05:58<3:14:05,  1.32s/it][A
Training...:  37% 5100/13907 [3:05:58<3:10:21,  1.30s/it][A
Training...:  37% 5101/13907 [3:06:02<5:00:26,  2.05s/it][A
Training...:  37% 5102/13907 [3:06:06<5:59:59,  2.45s/it][A
Training...:  37% 5103/13907 [3:06:09<6:32:30,  2.67s/it][A
Training...:  37% 5104/13907 [3:06:12<6:47:22,  2.78s/it][A
Training...:  37% 5105/13907 [3:06:15<6:56:15,  2.84s/it][A
Training...:  37% 5106/13907 [3:06:18<6:55:00,  2.83s/it][A
Training...:  37% 5107/13907 [3:06:20<6:53:20,  2.82s/it][A
Training...:  37% 5108/13907 [3:06:23<6:46:09,  2.77s/it][A
Training...:  37% 5109/13907 [3:06:26<6:40:46,  2.73s/it][A
Training...:  37% 5110/13907 [3:06:28<6:33:04,  2.68s/it][A
Training...:  37% 5111/13907 [3:06:31<6:28:33,  2.65s/it][A
Training...:  37% 5112/13907 [3:06:33<6:23:07,  2.61s/it][A
Training...:  37% 5113/13907 [3:06:36<6:17:35,  2.58s/it][A
Training...:  37% 5114/13907 [3:06:38<6:11:14,  2.53s/it][A
Training...:  37% 5115/13907 [3:06:41<6:05:02,  2.49s/it][A
Training...:  37% 5116/13907 [3:06:43<6:00:26,  2.46s/it][A
Training...:  37% 5117/13907 [3:06:45<5:56:02,  2.43s/it][A
Training...:  37% 5118/13907 [3:06:48<5:50:07,  2.39s/it][A
Training...:  37% 5119/13907 [3:06:50<5:46:15,  2.36s/it][A
Training...:  37% 5120/13907 [3:06:52<5:41:16,  2.33s/it][A
Training...:  37% 5121/13907 [3:06:55<5:38:24,  2.31s/it][A
Training...:  37% 5122/13907 [3:06:57<5:35:38,  2.29s/it][A
Training...:  37% 5123/13907 [3:06:59<5:32:08,  2.27s/it][A
Training...:  37% 5124/13907 [3:07:01<5:27:55,  2.24s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:07:16<?, ?it/s]
Training...:  37% 5124/13907 [3:07:04<5:27:55,  2.24s/it][A
Training...:  37% 5125/13907 [3:07:04<5:36:50,  2.30s/it][A
Training...:  37% 5126/13907 [3:07:06<5:28:28,  2.24s/it][A
Training...:  37% 5127/13907 [3:07:08<5:20:47,  2.19s/it][A
Training...:  37% 5128/13907 [3:07:10<5:13:53,  2.15s/it][A
Training...:  37% 5129/13907 [3:07:12<5:07:32,  2.10s/it][A
Training...:  37% 5130/13907 [3:07:14<5:03:12,  2.07s/it][A
Training...:  37% 5131/13907 [3:07:16<4:59:25,  2.05s/it][A
Training...:  37% 5132/13907 [3:07:18<4:52:38,  2.00s/it][A
Training...:  37% 5133/13907 [3:07:20<4:47:17,  1.96s/it][A
Training...:  37% 5134/13907 [3:07:21<4:41:43,  1.93s/it][A
Training...:  37% 5135/13907 [3:07:23<4:36:07,  1.89s/it][A
Training...:  37% 5136/13907 [3:07:25<4:31:25,  1.86s/it][A
Training...:  37% 5137/13907 [3:07:27<4:26:29,  1.82s/it][A
Training...:  37% 5138/13907 [3:07:29<4:21:01,  1.79s/it][A
Training...:  37% 5139/13907 [3:07:30<4:15:45,  1.75s/it][A
Training...:  37% 5140/13907 [3:07:32<4:10:41,  1.72s/it][A
Training...:  37% 5141/13907 [3:07:33<4:05:31,  1.68s/it][A
Training...:  37% 5142/13907 [3:07:35<4:00:39,  1.65s/it][A
Training...:  37% 5143/13907 [3:07:37<3:55:33,  1.61s/it][A
Training...:  37% 5144/13907 [3:07:38<3:50:17,  1.58s/it][A
Training...:  37% 5145/13907 [3:07:39<3:43:21,  1.53s/it][A
Training...:  37% 5146/13907 [3:07:41<3:36:27,  1.48s/it][A
Training...:  37% 5147/13907 [3:07:42<3:29:26,  1.43s/it][A
Training...:  37% 5148/13907 [3:07:43<3:20:53,  1.38s/it][A
Training...:  37% 5149/13907 [3:07:45<3:11:10,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:07:58<?, ?it/s]
Training...:  37% 5149/13907 [3:07:46<3:11:10,  1.31s/it][A
Training...:  37% 5150/13907 [3:07:46<3:06:07,  1.28s/it][A
Training...:  37% 5151/13907 [3:07:49<4:50:35,  1.99s/it][A
Training...:  37% 5152/13907 [3:07:53<5:52:01,  2.41s/it][A
Training...:  37% 5153/13907 [3:07:56<6:26:37,  2.65s/it][A
Training...:  37% 5154/13907 [3:07:59<6:42:47,  2.76s/it][A
Training...:  37% 5155/13907 [3:08:02<6:52:59,  2.83s/it][A
Training...:  37% 5156/13907 [3:08:05<6:54:31,  2.84s/it][A
Training...:  37% 5157/13907 [3:08:08<6:54:45,  2.84s/it][A
Training...:  37% 5158/13907 [3:08:11<6:53:00,  2.83s/it][A
Training...:  37% 5159/13907 [3:08:13<6:49:28,  2.81s/it][A
Training...:  37% 5160/13907 [3:08:16<6:42:32,  2.76s/it][A
Training...:  37% 5161/13907 [3:08:19<6:36:54,  2.72s/it][A
Training...:  37% 5162/13907 [3:08:21<6:29:58,  2.68s/it][A
Training...:  37% 5163/13907 [3:08:24<6:23:10,  2.63s/it][A
Training...:  37% 5164/13907 [3:08:26<6:16:55,  2.59s/it][A
Training...:  37% 5165/13907 [3:08:29<6:10:41,  2.54s/it][A
Training...:  37% 5166/13907 [3:08:31<6:03:53,  2.50s/it][A
Training...:  37% 5167/13907 [3:08:33<5:58:12,  2.46s/it][A
Training...:  37% 5168/13907 [3:08:36<5:51:47,  2.42s/it][A
Training...:  37% 5169/13907 [3:08:38<5:47:22,  2.39s/it][A
Training...:  37% 5170/13907 [3:08:40<5:42:24,  2.35s/it][A
Training...:  37% 5171/13907 [3:08:42<5:37:59,  2.32s/it][A
Training...:  37% 5172/13907 [3:08:45<5:32:26,  2.28s/it][A
Training...:  37% 5173/13907 [3:08:47<5:27:22,  2.25s/it][A
Training...:  37% 5174/13907 [3:08:49<5:22:25,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:09:04<?, ?it/s]
Training...:  37% 5174/13907 [3:08:51<5:22:25,  2.22s/it][A
Training...:  37% 5175/13907 [3:08:51<5:32:07,  2.28s/it][A
Training...:  37% 5176/13907 [3:08:54<5:24:36,  2.23s/it][A
Training...:  37% 5177/13907 [3:08:56<5:16:43,  2.18s/it][A
Training...:  37% 5178/13907 [3:08:58<5:08:59,  2.12s/it][A
Training...:  37% 5179/13907 [3:09:00<5:02:52,  2.08s/it][A
Training...:  37% 5180/13907 [3:09:02<4:58:38,  2.05s/it][A
Training...:  37% 5181/13907 [3:09:03<4:53:27,  2.02s/it][A
Training...:  37% 5182/13907 [3:09:05<4:47:19,  1.98s/it][A
Training...:  37% 5183/13907 [3:09:07<4:41:15,  1.93s/it][A
Training...:  37% 5184/13907 [3:09:09<4:36:06,  1.90s/it][A
Training...:  37% 5185/13907 [3:09:11<4:32:57,  1.88s/it][A
Training...:  37% 5186/13907 [3:09:13<4:28:20,  1.85s/it][A
Training...:  37% 5187/13907 [3:09:14<4:24:24,  1.82s/it][A
Training...:  37% 5188/13907 [3:09:16<4:20:05,  1.79s/it][A
Training...:  37% 5189/13907 [3:09:18<4:14:47,  1.75s/it][A
Training...:  37% 5190/13907 [3:09:19<4:10:03,  1.72s/it][A
Training...:  37% 5191/13907 [3:09:21<4:06:27,  1.70s/it][A
Training...:  37% 5192/13907 [3:09:23<4:01:16,  1.66s/it][A
Training...:  37% 5193/13907 [3:09:24<3:56:19,  1.63s/it][A
Training...:  37% 5194/13907 [3:09:26<3:51:09,  1.59s/it][A
Training...:  37% 5195/13907 [3:09:27<3:45:21,  1.55s/it][A
Training...:  37% 5196/13907 [3:09:29<3:37:34,  1.50s/it][A
Training...:  37% 5197/13907 [3:09:30<3:30:14,  1.45s/it][A
Training...:  37% 5198/13907 [3:09:31<3:22:08,  1.39s/it][A
Training...:  37% 5199/13907 [3:09:32<3:12:15,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:09:46<?, ?it/s]
Training...:  37% 5199/13907 [3:09:33<3:12:15,  1.32s/it][A
Training...:  37% 5200/13907 [3:09:33<3:07:11,  1.29s/it][A
Training...:  37% 5201/13907 [3:09:37<4:59:42,  2.07s/it][A
Training...:  37% 5202/13907 [3:09:41<5:58:00,  2.47s/it][A
Training...:  37% 5203/13907 [3:09:44<6:28:34,  2.68s/it][A
Training...:  37% 5204/13907 [3:09:47<6:42:59,  2.78s/it][A
Training...:  37% 5205/13907 [3:09:50<6:50:44,  2.83s/it][A
Training...:  37% 5206/13907 [3:09:53<6:50:27,  2.83s/it][A
Training...:  37% 5207/13907 [3:09:56<6:48:57,  2.82s/it][A
Training...:  37% 5208/13907 [3:09:58<6:44:42,  2.79s/it][A
Training...:  37% 5209/13907 [3:10:01<6:39:55,  2.76s/it][A
Training...:  37% 5210/13907 [3:10:04<6:34:08,  2.72s/it][A
Training...:  37% 5211/13907 [3:10:06<6:29:00,  2.68s/it][A
Training...:  37% 5212/13907 [3:10:09<6:22:19,  2.64s/it][A
Training...:  37% 5213/13907 [3:10:11<6:16:15,  2.60s/it][A
Training...:  37% 5214/13907 [3:10:14<6:10:46,  2.56s/it][A
Training...:  37% 5215/13907 [3:10:16<6:04:35,  2.52s/it][A
Training...:  38% 5216/13907 [3:10:18<5:59:34,  2.48s/it][A
Training...:  38% 5217/13907 [3:10:21<5:55:16,  2.45s/it][A
Training...:  38% 5218/13907 [3:10:23<5:49:48,  2.42s/it][A
Training...:  38% 5219/13907 [3:10:26<5:46:06,  2.39s/it][A
Training...:  38% 5220/13907 [3:10:28<5:40:47,  2.35s/it][A
Training...:  38% 5221/13907 [3:10:30<5:35:30,  2.32s/it][A
Training...:  38% 5222/13907 [3:10:32<5:30:56,  2.29s/it][A
Training...:  38% 5223/13907 [3:10:34<5:26:19,  2.25s/it][A
Training...:  38% 5224/13907 [3:10:37<5:21:15,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:10:51<?, ?it/s]
Training...:  38% 5224/13907 [3:10:39<5:21:15,  2.22s/it][A
Training...:  38% 5225/13907 [3:10:39<5:31:29,  2.29s/it][A
Training...:  38% 5226/13907 [3:10:41<5:23:35,  2.24s/it][A
Training...:  38% 5227/13907 [3:10:43<5:14:44,  2.18s/it][A
Training...:  38% 5228/13907 [3:10:45<5:08:36,  2.13s/it][A
Training...:  38% 5229/13907 [3:10:47<5:01:46,  2.09s/it][A
Training...:  38% 5230/13907 [3:10:49<4:55:24,  2.04s/it][A
Training...:  38% 5231/13907 [3:10:51<4:51:44,  2.02s/it][A
Training...:  38% 5232/13907 [3:10:53<4:47:32,  1.99s/it][A
Training...:  38% 5233/13907 [3:10:55<4:46:21,  1.98s/it][A
Training...:  38% 5234/13907 [3:10:57<4:41:31,  1.95s/it][A
Training...:  38% 5235/13907 [3:10:59<4:36:25,  1.91s/it][A
Training...:  38% 5236/13907 [3:11:00<4:30:47,  1.87s/it][A
Training...:  38% 5237/13907 [3:11:02<4:25:27,  1.84s/it][A
Training...:  38% 5238/13907 [3:11:04<4:19:24,  1.80s/it][A
Training...:  38% 5239/13907 [3:11:06<4:14:04,  1.76s/it][A
Training...:  38% 5240/13907 [3:11:07<4:08:31,  1.72s/it][A
Training...:  38% 5241/13907 [3:11:09<4:02:49,  1.68s/it][A
Training...:  38% 5242/13907 [3:11:10<3:57:25,  1.64s/it][A
Training...:  38% 5243/13907 [3:11:12<3:51:50,  1.61s/it][A
Training...:  38% 5244/13907 [3:11:13<3:45:48,  1.56s/it][A
Training...:  38% 5245/13907 [3:11:15<3:39:28,  1.52s/it][A
Training...:  38% 5246/13907 [3:11:16<3:33:19,  1.48s/it][A
Training...:  38% 5247/13907 [3:11:17<3:26:13,  1.43s/it][A
Training...:  38% 5248/13907 [3:11:19<3:18:19,  1.37s/it][A
Training...:  38% 5249/13907 [3:11:20<3:08:34,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:11:33<?, ?it/s]
Training...:  38% 5249/13907 [3:11:21<3:08:34,  1.31s/it][A
Training...:  38% 5250/13907 [3:11:21<3:03:34,  1.27s/it][A
Training...:  38% 5251/13907 [3:11:25<4:54:26,  2.04s/it][A
Training...:  38% 5252/13907 [3:11:28<5:53:15,  2.45s/it][A
Training...:  38% 5253/13907 [3:11:31<6:24:35,  2.67s/it][A
Training...:  38% 5254/13907 [3:11:34<6:40:29,  2.78s/it][A
Training...:  38% 5255/13907 [3:11:37<6:47:10,  2.82s/it][A
Training...:  38% 5256/13907 [3:11:40<6:47:46,  2.83s/it][A
Training...:  38% 5257/13907 [3:11:43<6:45:31,  2.81s/it][A
Training...:  38% 5258/13907 [3:11:46<6:41:31,  2.79s/it][A
Training...:  38% 5259/13907 [3:11:48<6:37:26,  2.76s/it][A
Training...:  38% 5260/13907 [3:11:51<6:30:12,  2.71s/it][A
Training...:  38% 5261/13907 [3:11:54<6:24:46,  2.67s/it][A
Training...:  38% 5262/13907 [3:11:56<6:18:21,  2.63s/it][A
Training...:  38% 5263/13907 [3:11:59<6:14:58,  2.60s/it][A
Training...:  38% 5264/13907 [3:12:01<6:09:54,  2.57s/it][A
Training...:  38% 5265/13907 [3:12:04<6:02:33,  2.52s/it][A
Training...:  38% 5266/13907 [3:12:06<5:57:15,  2.48s/it][A
Training...:  38% 5267/13907 [3:12:08<5:52:50,  2.45s/it][A
Training...:  38% 5268/13907 [3:12:11<5:46:58,  2.41s/it][A
Training...:  38% 5269/13907 [3:12:13<5:41:46,  2.37s/it][A
Training...:  38% 5270/13907 [3:12:15<5:36:04,  2.33s/it][A
Training...:  38% 5271/13907 [3:12:17<5:33:15,  2.32s/it][A
Training...:  38% 5272/13907 [3:12:20<5:28:13,  2.28s/it][A
Training...:  38% 5273/13907 [3:12:22<5:25:41,  2.26s/it][A
Training...:  38% 5274/13907 [3:12:24<5:23:04,  2.25s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:12:39<?, ?it/s]
Training...:  38% 5274/13907 [3:12:27<5:23:04,  2.25s/it][A
Training...:  38% 5275/13907 [3:12:27<5:32:14,  2.31s/it][A
Training...:  38% 5276/13907 [3:12:29<5:24:52,  2.26s/it][A
Training...:  38% 5277/13907 [3:12:31<5:15:51,  2.20s/it][A
Training...:  38% 5278/13907 [3:12:33<5:08:33,  2.15s/it][A
Training...:  38% 5279/13907 [3:12:35<5:02:11,  2.10s/it][A
Training...:  38% 5280/13907 [3:12:37<4:55:46,  2.06s/it][A
Training...:  38% 5281/13907 [3:12:39<4:50:23,  2.02s/it][A
Training...:  38% 5282/13907 [3:12:41<4:44:44,  1.98s/it][A
Training...:  38% 5283/13907 [3:12:42<4:40:47,  1.95s/it][A
Training...:  38% 5284/13907 [3:12:44<4:37:07,  1.93s/it][A
Training...:  38% 5285/13907 [3:12:46<4:33:12,  1.90s/it][A
Training...:  38% 5286/13907 [3:12:48<4:27:42,  1.86s/it][A
Training...:  38% 5287/13907 [3:12:50<4:23:25,  1.83s/it][A
Training...:  38% 5288/13907 [3:12:51<4:18:38,  1.80s/it][A
Training...:  38% 5289/13907 [3:12:53<4:14:10,  1.77s/it][A
Training...:  38% 5290/13907 [3:12:55<4:09:28,  1.74s/it][A
Training...:  38% 5291/13907 [3:12:56<4:03:54,  1.70s/it][A
Training...:  38% 5292/13907 [3:12:58<3:58:19,  1.66s/it][A
Training...:  38% 5293/13907 [3:12:59<3:52:47,  1.62s/it][A
Training...:  38% 5294/13907 [3:13:01<3:48:18,  1.59s/it][A
Training...:  38% 5295/13907 [3:13:02<3:42:05,  1.55s/it][A
Training...:  38% 5296/13907 [3:13:04<3:34:49,  1.50s/it][A
Training...:  38% 5297/13907 [3:13:05<3:28:04,  1.45s/it][A
Training...:  38% 5298/13907 [3:13:06<3:19:21,  1.39s/it][A
Training...:  38% 5299/13907 [3:13:08<3:09:54,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:13:21<?, ?it/s]
Training...:  38% 5299/13907 [3:13:09<3:09:54,  1.32s/it][A
Training...:  38% 5300/13907 [3:13:09<3:06:10,  1.30s/it][A
Training...:  38% 5301/13907 [3:13:13<4:49:16,  2.02s/it][A
Training...:  38% 5302/13907 [3:13:16<5:47:49,  2.43s/it][A
Training...:  38% 5303/13907 [3:13:19<6:22:46,  2.67s/it][A
Training...:  38% 5304/13907 [3:13:22<6:38:20,  2.78s/it][A
Training...:  38% 5305/13907 [3:13:25<6:47:05,  2.84s/it][A
Training...:  38% 5306/13907 [3:13:28<6:47:14,  2.84s/it][A
Training...:  38% 5307/13907 [3:13:31<6:45:54,  2.83s/it][A
Training...:  38% 5308/13907 [3:13:34<6:42:41,  2.81s/it][A
Training...:  38% 5309/13907 [3:13:36<6:40:40,  2.80s/it][A
Training...:  38% 5310/13907 [3:13:39<6:34:22,  2.75s/it][A
Training...:  38% 5311/13907 [3:13:42<6:28:28,  2.71s/it][A
Training...:  38% 5312/13907 [3:13:44<6:21:57,  2.67s/it][A
Training...:  38% 5313/13907 [3:13:47<6:15:41,  2.62s/it][A
Training...:  38% 5314/13907 [3:13:49<6:08:47,  2.58s/it][A
Training...:  38% 5315/13907 [3:13:52<6:02:08,  2.53s/it][A
Training...:  38% 5316/13907 [3:13:54<5:57:16,  2.50s/it][A
Training...:  38% 5317/13907 [3:13:56<5:53:14,  2.47s/it][A
Training...:  38% 5318/13907 [3:13:59<5:49:33,  2.44s/it][A
Training...:  38% 5319/13907 [3:14:01<5:46:22,  2.42s/it][A
Training...:  38% 5320/13907 [3:14:03<5:41:11,  2.38s/it][A
Training...:  38% 5321/13907 [3:14:06<5:35:38,  2.35s/it][A
Training...:  38% 5322/13907 [3:14:08<5:30:32,  2.31s/it][A
Training...:  38% 5323/13907 [3:14:10<5:24:44,  2.27s/it][A
Training...:  38% 5324/13907 [3:14:12<5:18:24,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:14:27<?, ?it/s]
Training...:  38% 5324/13907 [3:14:15<5:18:24,  2.23s/it][A
Training...:  38% 5325/13907 [3:14:15<5:26:51,  2.29s/it][AStep... (3575 | Loss: 0.4253823757171631, Learning Rate: 0.00028136972105130553, Gradient Norm: 1.2930679321289062)
Step... (3600 | Loss: 0.6448843479156494, Learning Rate: 0.0002812182065099478, Gradient Norm: 2.413753032684326)
Step... (3625 | Loss: 0.2674974799156189, Learning Rate: 0.00028106666286475956, Gradient Norm: 0.7690188884735107)
Step... (3650 | Loss: 0.39364200830459595, Learning Rate: 0.00028091517742723227, Gradient Norm: 1.5956361293792725)
Step... (3675 | Loss: 0.3645157814025879, Learning Rate: 0.0002807636628858745, Gradient Norm: 0.9324138164520264)
Step... (3700 | Loss: 0.5639095306396484, Learning Rate: 0.0002806121192406863, Gradient Norm: 2.8655946254730225)
Step... (3725 | Loss: 0.37358272075653076, Learning Rate: 0.000280460633803159, Gradient Norm: 1.067521572113037)
Step... (3750 | Loss: 0.45368385314941406, Learning Rate: 0.0002803090901579708, Gradient Norm: 2.4093050956726074)
Step... (3775 | Loss: 0.35640251636505127, Learning Rate: 0.00028015757561661303, Gradient Norm: 1.0067142248153687)
Step... (3800 | Loss: 0.6394878029823303, Learning Rate: 0.00028000609017908573, Gradient Norm: 2.385282039642334)
Step... (3825 | Loss: 0.34848862886428833, Learning Rate: 0.0002798545465338975, Gradient Norm: 1.1311923265457153)
Step... (3850 | Loss: 0.492030531167984, Learning Rate: 0.00027970303199253976, Gradient Norm: 2.933321952819824)
Step... (3875 | Loss: 0.33861714601516724, Learning Rate: 0.000279551517451182, Gradient Norm: 0.8739088177680969)
Step... (3900 | Loss: 0.5641072988510132, Learning Rate: 0.00027940000290982425, Gradient Norm: 2.2439217567443848)
Step... (3925 | Loss: 0.32389920949935913, Learning Rate: 0.0002792484883684665, Gradient Norm: 0.9139508008956909)
Step... (3950 | Loss: 0.5178664326667786, Learning Rate: 0.00027909697382710874, Gradient Norm: 2.085049867630005)
Step... (3975 | Loss: 0.30761581659317017, Learning Rate: 0.000278945459285751, Gradient Norm: 1.0036211013793945)
Step... (4000 | Loss: 0.5256925821304321, Learning Rate: 0.00027879394474439323, Gradient Norm: 2.400209903717041)
Step... (4025 | Loss: 0.32224857807159424, Learning Rate: 0.0002786424302030355, Gradient Norm: 0.8688358664512634)
Step... (4050 | Loss: 0.5449526309967041, Learning Rate: 0.0002784909156616777, Gradient Norm: 2.3643884658813477)
Step... (4075 | Loss: 0.28079754114151, Learning Rate: 0.00027833940112031996, Gradient Norm: 0.8119195699691772)
Step... (4100 | Loss: 0.5808231830596924, Learning Rate: 0.0002781878865789622, Gradient Norm: 2.6295132637023926)
Step... (4125 | Loss: 0.3554600477218628, Learning Rate: 0.00027803637203760445, Gradient Norm: 1.101374864578247)
Step... (4150 | Loss: 0.4581334888935089, Learning Rate: 0.0002778848574962467, Gradient Norm: 2.00299072265625)
Step... (4175 | Loss: 0.3885933756828308, Learning Rate: 0.00027773334295488894, Gradient Norm: 1.1725664138793945)
Step... (4200 | Loss: 0.42750126123428345, Learning Rate: 0.0002775818284135312, Gradient Norm: 1.841691493988037)
Step... (4225 | Loss: 0.329908549785614, Learning Rate: 0.00027743031387217343, Gradient Norm: 1.0391608476638794)
Step... (4250 | Loss: 0.47504639625549316, Learning Rate: 0.00027727879933081567, Gradient Norm: 1.535298466682434)
Step... (4275 | Loss: 0.31309086084365845, Learning Rate: 0.0002771272847894579, Gradient Norm: 0.9363979697227478)
Step... (4300 | Loss: 0.3500976860523224, Learning Rate: 0.00027697577024810016, Gradient Norm: 1.6965501308441162)
Step... (4325 | Loss: 0.3981360197067261, Learning Rate: 0.0002768242557067424, Gradient Norm: 1.0512714385986328)
Step... (4350 | Loss: 0.5064330697059631, Learning Rate: 0.00027667274116538465, Gradient Norm: 2.4849565029144287)
Step... (4375 | Loss: 0.2942696809768677, Learning Rate: 0.0002765212266240269, Gradient Norm: 0.8318080902099609)
Step... (4400 | Loss: 0.5194419622421265, Learning Rate: 0.00027636971208266914, Gradient Norm: 1.9905482530593872)
Step... (4425 | Loss: 0.35687920451164246, Learning Rate: 0.0002762181975413114, Gradient Norm: 1.1819708347320557)
Step... (4450 | Loss: 0.45489630103111267, Learning Rate: 0.00027606668299995363, Gradient Norm: 2.6165456771850586)
Step... (4475 | Loss: 0.31860458850860596, Learning Rate: 0.00027591516845859587, Gradient Norm: 1.1220293045043945)
Step... (4500 | Loss: 0.4688831567764282, Learning Rate: 0.0002757636539172381, Gradient Norm: 2.3841915130615234)
Step... (4525 | Loss: 0.3264866769313812, Learning Rate: 0.00027561213937588036, Gradient Norm: 0.9715157747268677)
Step... (4550 | Loss: 0.6108800172805786, Learning Rate: 0.0002754606248345226, Gradient Norm: 2.2967042922973633)
Step... (4575 | Loss: 0.3329111635684967, Learning Rate: 0.00027530911029316485, Gradient Norm: 0.9593373537063599)
Step... (4600 | Loss: 0.40488767623901367, Learning Rate: 0.0002751575957518071, Gradient Norm: 1.7300834655761719)
Step... (4625 | Loss: 0.3231159746646881, Learning Rate: 0.00027500608121044934, Gradient Norm: 0.9364924430847168)
Step... (4650 | Loss: 0.5726726055145264, Learning Rate: 0.0002748545666690916, Gradient Norm: 1.977988839149475)
Step... (4675 | Loss: 0.360607385635376, Learning Rate: 0.0002747030521277338, Gradient Norm: 1.2089555263519287)
Step... (4700 | Loss: 0.5176550149917603, Learning Rate: 0.00027455153758637607, Gradient Norm: 2.433479070663452)
Step... (4725 | Loss: 0.3829938769340515, Learning Rate: 0.0002744000230450183, Gradient Norm: 1.1646418571472168)
Step... (4750 | Loss: 0.46762847900390625, Learning Rate: 0.00027424850850366056, Gradient Norm: 2.0656232833862305)
Step... (4775 | Loss: 0.32675498723983765, Learning Rate: 0.0002740969939623028, Gradient Norm: 0.8253063559532166)
Step... (4800 | Loss: 0.4507569968700409, Learning Rate: 0.0002739454503171146, Gradient Norm: 1.782117486000061)
Step... (4825 | Loss: 0.3297850787639618, Learning Rate: 0.0002737939648795873, Gradient Norm: 1.0278469324111938)
Step... (4850 | Loss: 0.4634121358394623, Learning Rate: 0.00027364245033822954, Gradient Norm: 2.4051947593688965)
Step... (4875 | Loss: 0.3511888086795807, Learning Rate: 0.0002734909066930413, Gradient Norm: 1.0813241004943848)
Step... (4900 | Loss: 0.3853457570075989, Learning Rate: 0.000273339421255514, Gradient Norm: 1.7317184209823608)
Step... (4925 | Loss: 0.4860115051269531, Learning Rate: 0.00027318790671415627, Gradient Norm: 1.0713123083114624)
Step... (4950 | Loss: 0.4892176687717438, Learning Rate: 0.00027303636306896806, Gradient Norm: 1.8733751773834229)
Step... (4975 | Loss: 0.3268951177597046, Learning Rate: 0.00027288487763144076, Gradient Norm: 1.0437058210372925)
Step... (5000 | Loss: 0.445290744304657, Learning Rate: 0.000272733363090083, Gradient Norm: 1.6862096786499023)
Step... (5025 | Loss: 0.3165169954299927, Learning Rate: 0.0002725818194448948, Gradient Norm: 0.8350998163223267)
Step... (5050 | Loss: 0.40498030185699463, Learning Rate: 0.0002724303340073675, Gradient Norm: 1.8057130575180054)
Step... (5075 | Loss: 0.3311394155025482, Learning Rate: 0.00027227881946600974, Gradient Norm: 1.0816121101379395)
Step... (5100 | Loss: 0.48110130429267883, Learning Rate: 0.0002721272758208215, Gradient Norm: 1.9780380725860596)
Step... (5125 | Loss: 0.24633270502090454, Learning Rate: 0.00027197576127946377, Gradient Norm: 0.8663897514343262)
Step... (5150 | Loss: 0.45865318179130554, Learning Rate: 0.00027182427584193647, Gradient Norm: 2.1539907455444336)
Step... (5175 | Loss: 0.38842684030532837, Learning Rate: 0.00027167273219674826, Gradient Norm: 1.1728663444519043)
Step... (5200 | Loss: 0.4461976885795593, Learning Rate: 0.0002715212176553905, Gradient Norm: 2.482659339904785)
Step... (5225 | Loss: 0.35614243149757385, Learning Rate: 0.00027136970311403275, Gradient Norm: 1.1968554258346558)
Step... (5250 | Loss: 0.48933145403862, Learning Rate: 0.000271218188572675, Gradient Norm: 2.053926944732666)
Step... (5275 | Loss: 0.3193172216415405, Learning Rate: 0.00027106667403131723, Gradient Norm: 1.1395529508590698)
Step... (5300 | Loss: 0.5412476062774658, Learning Rate: 0.0002709151594899595, Gradient Norm: 2.297691822052002)
Step... (5325 | Loss: 0.30639898777008057, Learning Rate: 0.0002707636449486017, Gradient Norm: 0.8946040868759155)
Training...:  38% 5326/13907 [3:14:17<5:25:22,  2.28s/it][A
Training...:  38% 5327/13907 [3:14:19<5:16:18,  2.21s/it][A
Training...:  38% 5328/13907 [3:14:21<5:09:24,  2.16s/it][A
Training...:  38% 5329/13907 [3:14:23<5:02:35,  2.12s/it][A
Training...:  38% 5330/13907 [3:14:25<4:56:55,  2.08s/it][A
Training...:  38% 5331/13907 [3:14:27<4:51:42,  2.04s/it][A
Training...:  38% 5332/13907 [3:14:29<4:45:57,  2.00s/it][A
Training...:  38% 5333/13907 [3:14:31<4:42:15,  1.98s/it][A
Training...:  38% 5334/13907 [3:14:33<4:36:51,  1.94s/it][A
Training...:  38% 5335/13907 [3:14:34<4:32:26,  1.91s/it][A
Training...:  38% 5336/13907 [3:14:36<4:28:14,  1.88s/it][A
Training...:  38% 5337/13907 [3:14:38<4:23:15,  1.84s/it][A
Training...:  38% 5338/13907 [3:14:40<4:19:11,  1.81s/it][A
Training...:  38% 5339/13907 [3:14:41<4:13:57,  1.78s/it][A
Training...:  38% 5340/13907 [3:14:43<4:07:50,  1.74s/it][A
Training...:  38% 5341/13907 [3:14:45<4:03:41,  1.71s/it][A
Training...:  38% 5342/13907 [3:14:46<3:58:22,  1.67s/it][A
Training...:  38% 5343/13907 [3:14:48<3:52:58,  1.63s/it][A
Training...:  38% 5344/13907 [3:14:49<3:47:24,  1.59s/it][A
Training...:  38% 5345/13907 [3:14:51<3:41:30,  1.55s/it][A
Training...:  38% 5346/13907 [3:14:52<3:34:47,  1.51s/it][A
Training...:  38% 5347/13907 [3:14:54<3:28:34,  1.46s/it][A
Training...:  38% 5348/13907 [3:14:55<3:21:29,  1.41s/it][A
Training...:  38% 5349/13907 [3:14:56<3:12:25,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:15:10<?, ?it/s]
Training...:  38% 5349/13907 [3:14:57<3:12:25,  1.35s/it][A
Training...:  38% 5350/13907 [3:14:57<3:07:09,  1.31s/it][A
Training...:  38% 5351/13907 [3:15:01<4:54:56,  2.07s/it][A
Training...:  38% 5352/13907 [3:15:05<6:00:22,  2.53s/it][A
Training...:  38% 5353/13907 [3:15:08<6:29:53,  2.73s/it][A
Training...:  38% 5354/13907 [3:15:11<6:45:58,  2.85s/it][A
Training...:  39% 5355/13907 [3:15:14<6:56:34,  2.92s/it][A
Training...:  39% 5356/13907 [3:15:17<7:00:35,  2.95s/it][A
Training...:  39% 5357/13907 [3:15:20<6:57:42,  2.93s/it][A
Training...:  39% 5358/13907 [3:15:23<6:48:54,  2.87s/it][A
Training...:  39% 5359/13907 [3:15:25<6:41:11,  2.82s/it][A
Training...:  39% 5360/13907 [3:15:28<6:31:44,  2.75s/it][A
Training...:  39% 5361/13907 [3:15:31<6:24:53,  2.70s/it][A
Training...:  39% 5362/13907 [3:15:33<6:16:57,  2.65s/it][A
Training...:  39% 5363/13907 [3:15:36<6:10:45,  2.60s/it][A
Training...:  39% 5364/13907 [3:15:38<6:04:28,  2.56s/it][A
Training...:  39% 5365/13907 [3:15:41<5:58:42,  2.52s/it][A
Training...:  39% 5366/13907 [3:15:43<5:52:50,  2.48s/it][A
Training...:  39% 5367/13907 [3:15:45<5:47:27,  2.44s/it][A
Training...:  39% 5368/13907 [3:15:48<5:41:31,  2.40s/it][A
Training...:  39% 5369/13907 [3:15:50<5:36:49,  2.37s/it][A
Training...:  39% 5370/13907 [3:15:52<5:31:34,  2.33s/it][A
Training...:  39% 5371/13907 [3:15:54<5:27:44,  2.30s/it][A
Training...:  39% 5372/13907 [3:15:57<5:22:37,  2.27s/it][A
Training...:  39% 5373/13907 [3:15:59<5:17:32,  2.23s/it][A
Training...:  39% 5374/13907 [3:16:01<5:12:11,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:16:16<?, ?it/s]
Training...:  39% 5374/13907 [3:16:03<5:12:11,  2.20s/it][A
Training...:  39% 5375/13907 [3:16:03<5:20:41,  2.26s/it][A
Training...:  39% 5376/13907 [3:16:05<5:14:18,  2.21s/it][A
Training...:  39% 5377/13907 [3:16:07<5:06:16,  2.15s/it][A
Training...:  39% 5378/13907 [3:16:09<4:59:56,  2.11s/it][A
Training...:  39% 5379/13907 [3:16:11<4:53:53,  2.07s/it][A
Training...:  39% 5380/13907 [3:16:13<4:48:43,  2.03s/it][A
Training...:  39% 5381/13907 [3:16:15<4:44:34,  2.00s/it][A
Training...:  39% 5382/13907 [3:16:17<4:39:54,  1.97s/it][A
Training...:  39% 5383/13907 [3:16:19<4:35:26,  1.94s/it][A
Training...:  39% 5384/13907 [3:16:21<4:31:15,  1.91s/it][A
Training...:  39% 5385/13907 [3:16:23<4:27:05,  1.88s/it][A
Training...:  39% 5386/13907 [3:16:24<4:23:22,  1.85s/it][A
Training...:  39% 5387/13907 [3:16:26<4:18:37,  1.82s/it][A
Training...:  39% 5388/13907 [3:16:28<4:13:47,  1.79s/it][A
Training...:  39% 5389/13907 [3:16:30<4:08:45,  1.75s/it][A
Training...:  39% 5390/13907 [3:16:31<4:05:50,  1.73s/it][A
Training...:  39% 5391/13907 [3:16:33<4:01:54,  1.70s/it][A
Training...:  39% 5392/13907 [3:16:34<3:55:44,  1.66s/it][A
Training...:  39% 5393/13907 [3:16:36<3:51:06,  1.63s/it][A
Training...:  39% 5394/13907 [3:16:37<3:45:04,  1.59s/it][A
Training...:  39% 5395/13907 [3:16:39<3:38:33,  1.54s/it][A
Training...:  39% 5396/13907 [3:16:40<3:31:55,  1.49s/it][A
Training...:  39% 5397/13907 [3:16:42<3:24:56,  1.44s/it][A
Training...:  39% 5398/13907 [3:16:43<3:17:04,  1.39s/it][A
Training...:  39% 5399/13907 [3:16:44<3:08:23,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:16:58<?, ?it/s]
Training...:  39% 5399/13907 [3:16:45<3:08:23,  1.33s/it][A
Training...:  39% 5400/13907 [3:16:45<3:04:38,  1.30s/it][A
Training...:  39% 5401/13907 [3:16:49<4:49:17,  2.04s/it][A
Training...:  39% 5402/13907 [3:16:52<5:46:43,  2.45s/it][A
Training...:  39% 5403/13907 [3:16:56<6:17:28,  2.66s/it][A
Training...:  39% 5404/13907 [3:16:59<6:33:07,  2.77s/it][A
Training...:  39% 5405/13907 [3:17:02<6:44:55,  2.86s/it][A
Training...:  39% 5406/13907 [3:17:05<6:46:56,  2.87s/it][A
Training...:  39% 5407/13907 [3:17:07<6:46:49,  2.87s/it][A
Training...:  39% 5408/13907 [3:17:10<6:42:49,  2.84s/it][A
Training...:  39% 5409/13907 [3:17:13<6:35:07,  2.79s/it][A
Training...:  39% 5410/13907 [3:17:16<6:27:11,  2.73s/it][A
Training...:  39% 5411/13907 [3:17:18<6:23:56,  2.71s/it][A
Training...:  39% 5412/13907 [3:17:21<6:19:08,  2.68s/it][A
Training...:  39% 5413/13907 [3:17:23<6:15:52,  2.66s/it][A
Training...:  39% 5414/13907 [3:17:26<6:10:00,  2.61s/it][A
Training...:  39% 5415/13907 [3:17:28<6:05:26,  2.58s/it][A
Training...:  39% 5416/13907 [3:17:31<5:59:53,  2.54s/it][A
Training...:  39% 5417/13907 [3:17:33<5:55:14,  2.51s/it][A
Training...:  39% 5418/13907 [3:17:36<5:49:05,  2.47s/it][A
Training...:  39% 5419/13907 [3:17:38<5:44:34,  2.44s/it][A
Training...:  39% 5420/13907 [3:17:40<5:40:18,  2.41s/it][A
Training...:  39% 5421/13907 [3:17:43<5:37:28,  2.39s/it][A
Training...:  39% 5422/13907 [3:17:45<5:31:38,  2.35s/it][A
Training...:  39% 5423/13907 [3:17:47<5:25:24,  2.30s/it][A
Training...:  39% 5424/13907 [3:17:49<5:22:04,  2.28s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:18:04<?, ?it/s]
Training...:  39% 5424/13907 [3:17:52<5:22:04,  2.28s/it][A
Training...:  39% 5425/13907 [3:17:52<5:32:11,  2.35s/it][A
Training...:  39% 5426/13907 [3:17:54<5:22:47,  2.28s/it][A
Training...:  39% 5427/13907 [3:17:56<5:12:46,  2.21s/it][A
Training...:  39% 5428/13907 [3:17:58<5:04:20,  2.15s/it][A
Training...:  39% 5429/13907 [3:18:00<4:57:00,  2.10s/it][A
Training...:  39% 5430/13907 [3:18:02<4:52:14,  2.07s/it][A
Training...:  39% 5431/13907 [3:18:04<4:49:15,  2.05s/it][A
Training...:  39% 5432/13907 [3:18:06<4:42:49,  2.00s/it][A
Training...:  39% 5433/13907 [3:18:08<4:38:55,  1.97s/it][A
Training...:  39% 5434/13907 [3:18:10<4:33:30,  1.94s/it][A
Training...:  39% 5435/13907 [3:18:12<4:28:18,  1.90s/it][A
Training...:  39% 5436/13907 [3:18:13<4:23:44,  1.87s/it][A
Training...:  39% 5437/13907 [3:18:15<4:19:05,  1.84s/it][A
Training...:  39% 5438/13907 [3:18:17<4:15:23,  1.81s/it][A
Training...:  39% 5439/13907 [3:18:19<4:10:30,  1.77s/it][A
Training...:  39% 5440/13907 [3:18:20<4:05:34,  1.74s/it][A
Training...:  39% 5441/13907 [3:18:22<4:01:03,  1.71s/it][A
Training...:  39% 5442/13907 [3:18:23<3:56:29,  1.68s/it][A
Training...:  39% 5443/13907 [3:18:25<3:51:14,  1.64s/it][A
Training...:  39% 5444/13907 [3:18:26<3:45:35,  1.60s/it][A
Training...:  39% 5445/13907 [3:18:28<3:39:47,  1.56s/it][A
Training...:  39% 5446/13907 [3:18:29<3:32:48,  1.51s/it][A
Training...:  39% 5447/13907 [3:18:31<3:25:42,  1.46s/it][A
Training...:  39% 5448/13907 [3:18:32<3:16:37,  1.39s/it][A
Training...:  39% 5449/13907 [3:18:33<3:07:32,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:18:47<?, ?it/s]
Training...:  39% 5449/13907 [3:18:34<3:07:32,  1.33s/it][A
Training...:  39% 5450/13907 [3:18:34<3:02:33,  1.30s/it][A
Training...:  39% 5451/13907 [3:18:38<4:47:49,  2.04s/it][A
Training...:  39% 5452/13907 [3:18:41<5:42:33,  2.43s/it][A
Training...:  39% 5453/13907 [3:18:45<6:15:39,  2.67s/it][A
Training...:  39% 5454/13907 [3:18:48<6:31:50,  2.78s/it][A
Training...:  39% 5455/13907 [3:18:51<6:39:58,  2.84s/it][A
Training...:  39% 5456/13907 [3:18:54<6:42:01,  2.85s/it][A
Training...:  39% 5457/13907 [3:18:56<6:43:49,  2.87s/it][A
Training...:  39% 5458/13907 [3:18:59<6:38:42,  2.83s/it][A
Training...:  39% 5459/13907 [3:19:02<6:34:25,  2.80s/it][A
Training...:  39% 5460/13907 [3:19:05<6:28:04,  2.76s/it][A
Training...:  39% 5461/13907 [3:19:07<6:21:11,  2.71s/it][A
Training...:  39% 5462/13907 [3:19:10<6:14:07,  2.66s/it][A
Training...:  39% 5463/13907 [3:19:12<6:07:30,  2.61s/it][A
Training...:  39% 5464/13907 [3:19:15<6:02:35,  2.58s/it][A
Training...:  39% 5465/13907 [3:19:17<5:59:15,  2.55s/it][A
Training...:  39% 5466/13907 [3:19:20<5:53:53,  2.52s/it][A
Training...:  39% 5467/13907 [3:19:22<5:47:24,  2.47s/it][A
Training...:  39% 5468/13907 [3:19:24<5:40:28,  2.42s/it][A
Training...:  39% 5469/13907 [3:19:27<5:35:32,  2.39s/it][A
Training...:  39% 5470/13907 [3:19:29<5:31:06,  2.35s/it][A
Training...:  39% 5471/13907 [3:19:31<5:27:16,  2.33s/it][A
Training...:  39% 5472/13907 [3:19:33<5:23:46,  2.30s/it][A
Training...:  39% 5473/13907 [3:19:36<5:18:05,  2.26s/it][A
Training...:  39% 5474/13907 [3:19:38<5:13:00,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:19:52<?, ?it/s]
Training...:  39% 5474/13907 [3:19:40<5:13:00,  2.23s/it][A
Training...:  39% 5475/13907 [3:19:40<5:20:54,  2.28s/it][A
Training...:  39% 5476/13907 [3:19:42<5:15:15,  2.24s/it][A
Training...:  39% 5477/13907 [3:19:44<5:07:18,  2.19s/it][A
Training...:  39% 5478/13907 [3:19:46<5:03:09,  2.16s/it][A
Training...:  39% 5479/13907 [3:19:48<4:56:14,  2.11s/it][A
Training...:  39% 5480/13907 [3:19:50<4:50:24,  2.07s/it][A
Training...:  39% 5481/13907 [3:19:52<4:45:04,  2.03s/it][A
Training...:  39% 5482/13907 [3:19:54<4:39:42,  1.99s/it][A
Training...:  39% 5483/13907 [3:19:56<4:35:16,  1.96s/it][A
Training...:  39% 5484/13907 [3:19:58<4:31:03,  1.93s/it][A
Training...:  39% 5485/13907 [3:20:00<4:26:59,  1.90s/it][A
Training...:  39% 5486/13907 [3:20:02<4:22:16,  1.87s/it][A
Training...:  39% 5487/13907 [3:20:03<4:17:24,  1.83s/it][A
Training...:  39% 5488/13907 [3:20:05<4:12:50,  1.80s/it][A
Training...:  39% 5489/13907 [3:20:07<4:08:44,  1.77s/it][A
Training...:  39% 5490/13907 [3:20:08<4:04:06,  1.74s/it][A
Training...:  39% 5491/13907 [3:20:10<3:58:57,  1.70s/it][A
Training...:  39% 5492/13907 [3:20:12<3:53:53,  1.67s/it][A
Training...:  39% 5493/13907 [3:20:13<3:48:35,  1.63s/it][A
Training...:  40% 5494/13907 [3:20:15<3:42:58,  1.59s/it][A
Training...:  40% 5495/13907 [3:20:16<3:37:22,  1.55s/it][A
Training...:  40% 5496/13907 [3:20:18<3:30:21,  1.50s/it][A
Training...:  40% 5497/13907 [3:20:19<3:22:36,  1.45s/it][A
Training...:  40% 5498/13907 [3:20:20<3:13:26,  1.38s/it][A
Training...:  40% 5499/13907 [3:20:21<3:04:01,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:20:35<?, ?it/s]
Training...:  40% 5499/13907 [3:20:22<3:04:01,  1.31s/it][A
Training...:  40% 5500/13907 [3:20:22<2:59:15,  1.28s/it][A
Training...:  40% 5501/13907 [3:20:26<4:44:20,  2.03s/it][A
Training...:  40% 5502/13907 [3:20:30<5:40:49,  2.43s/it][A
Training...:  40% 5503/13907 [3:20:33<6:12:12,  2.66s/it][A
Training...:  40% 5504/13907 [3:20:36<6:28:06,  2.77s/it][A
Training...:  40% 5505/13907 [3:20:39<6:36:59,  2.84s/it][A
Training...:  40% 5506/13907 [3:20:42<6:38:33,  2.85s/it][A
Training...:  40% 5507/13907 [3:20:45<6:36:21,  2.83s/it][A
Training...:  40% 5508/13907 [3:20:47<6:32:49,  2.81s/it][A
Training...:  40% 5509/13907 [3:20:50<6:31:39,  2.80s/it][A
Training...:  40% 5510/13907 [3:20:53<6:25:53,  2.76s/it][A
Training...:  40% 5511/13907 [3:20:55<6:18:30,  2.70s/it][A
Training...:  40% 5512/13907 [3:20:58<6:10:47,  2.65s/it][A
Training...:  40% 5513/13907 [3:21:00<6:03:47,  2.60s/it][A
Training...:  40% 5514/13907 [3:21:03<5:57:04,  2.55s/it][A
Training...:  40% 5515/13907 [3:21:05<5:52:22,  2.52s/it][A
Training...:  40% 5516/13907 [3:21:08<5:47:11,  2.48s/it][A
Training...:  40% 5517/13907 [3:21:10<5:42:55,  2.45s/it][A
Training...:  40% 5518/13907 [3:21:12<5:37:23,  2.41s/it][A
Training...:  40% 5519/13907 [3:21:15<5:32:35,  2.38s/it][A
Training...:  40% 5520/13907 [3:21:17<5:27:17,  2.34s/it][A
Training...:  40% 5521/13907 [3:21:19<5:22:35,  2.31s/it][A
Training...:  40% 5522/13907 [3:21:21<5:18:55,  2.28s/it][A
Training...:  40% 5523/13907 [3:21:23<5:13:51,  2.25s/it][A
Training...:  40% 5524/13907 [3:21:26<5:07:29,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:21:40<?, ?it/s]
Training...:  40% 5524/13907 [3:21:28<5:07:29,  2.20s/it][A
Training...:  40% 5525/13907 [3:21:28<5:14:56,  2.25s/it][A
Training...:  40% 5526/13907 [3:21:30<5:09:09,  2.21s/it][A
Training...:  40% 5527/13907 [3:21:32<5:01:18,  2.16s/it][A
Training...:  40% 5528/13907 [3:21:34<4:54:53,  2.11s/it][A
Training...:  40% 5529/13907 [3:21:36<4:50:53,  2.08s/it][A
Training...:  40% 5530/13907 [3:21:38<4:45:43,  2.05s/it][A
Training...:  40% 5531/13907 [3:21:40<4:41:43,  2.02s/it][A
Training...:  40% 5532/13907 [3:21:42<4:36:48,  1.98s/it][A
Training...:  40% 5533/13907 [3:21:44<4:32:26,  1.95s/it][A
Training...:  40% 5534/13907 [3:21:46<4:28:23,  1.92s/it][A
Training...:  40% 5535/13907 [3:21:47<4:23:46,  1.89s/it][A
Training...:  40% 5536/13907 [3:21:49<4:19:13,  1.86s/it][A
Training...:  40% 5537/13907 [3:21:51<4:15:01,  1.83s/it][A
Training...:  40% 5538/13907 [3:21:53<4:10:08,  1.79s/it][A
Training...:  40% 5539/13907 [3:21:54<4:05:39,  1.76s/it][A
Training...:  40% 5540/13907 [3:21:56<4:00:35,  1.73s/it][A
Training...:  40% 5541/13907 [3:21:58<3:55:45,  1.69s/it][A
Training...:  40% 5542/13907 [3:21:59<3:50:46,  1.66s/it][A
Training...:  40% 5543/13907 [3:22:01<3:45:34,  1.62s/it][A
Training...:  40% 5544/13907 [3:22:02<3:40:07,  1.58s/it][A
Training...:  40% 5545/13907 [3:22:04<3:34:01,  1.54s/it][A
Training...:  40% 5546/13907 [3:22:05<3:27:04,  1.49s/it][A
Training...:  40% 5547/13907 [3:22:06<3:20:07,  1.44s/it][A
Training...:  40% 5548/13907 [3:22:08<3:12:09,  1.38s/it][A
Training...:  40% 5549/13907 [3:22:09<3:02:53,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:22:22<?, ?it/s]
Training...:  40% 5549/13907 [3:22:10<3:02:53,  1.31s/it][A
Training...:  40% 5550/13907 [3:22:10<2:58:43,  1.28s/it][A
Training...:  40% 5551/13907 [3:22:14<4:39:57,  2.01s/it][A
Training...:  40% 5552/13907 [3:22:17<5:38:35,  2.43s/it][A
Training...:  40% 5553/13907 [3:22:20<6:08:29,  2.65s/it][A
Training...:  40% 5554/13907 [3:22:23<6:26:17,  2.77s/it][A
Training...:  40% 5555/13907 [3:22:26<6:37:07,  2.85s/it][A
Training...:  40% 5556/13907 [3:22:29<6:39:55,  2.87s/it][A
Training...:  40% 5557/13907 [3:22:32<6:37:50,  2.86s/it][A
Training...:  40% 5558/13907 [3:22:35<6:32:41,  2.82s/it][A
Training...:  40% 5559/13907 [3:22:38<6:27:42,  2.79s/it][A
Training...:  40% 5560/13907 [3:22:40<6:23:12,  2.75s/it][A
Training...:  40% 5561/13907 [3:22:43<6:20:50,  2.74s/it][A
Training...:  40% 5562/13907 [3:22:46<6:17:03,  2.71s/it][A
Training...:  40% 5563/13907 [3:22:48<6:10:01,  2.66s/it][A
Training...:  40% 5564/13907 [3:22:51<6:00:47,  2.59s/it][A
Training...:  40% 5565/13907 [3:22:53<5:54:57,  2.55s/it][A
Training...:  40% 5566/13907 [3:22:55<5:48:16,  2.51s/it][A
Training...:  40% 5567/13907 [3:22:58<5:44:54,  2.48s/it][A
Training...:  40% 5568/13907 [3:23:00<5:40:47,  2.45s/it][A
Training...:  40% 5569/13907 [3:23:03<5:35:56,  2.42s/it][A
Training...:  40% 5570/13907 [3:23:05<5:33:40,  2.40s/it][A
Training...:  40% 5571/13907 [3:23:07<5:30:32,  2.38s/it][A
Training...:  40% 5572/13907 [3:23:09<5:23:21,  2.33s/it][A
Training...:  40% 5573/13907 [3:23:12<5:18:35,  2.29s/it][A
Training...:  40% 5574/13907 [3:23:14<5:14:16,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:23:29<?, ?it/s]
Training...:  40% 5574/13907 [3:23:16<5:14:16,  2.26s/it][A
Training...:  40% 5575/13907 [3:23:16<5:21:54,  2.32s/it][A
Training...:  40% 5576/13907 [3:23:18<5:14:04,  2.26s/it][A
Training...:  40% 5577/13907 [3:23:20<5:05:23,  2.20s/it][A
Training...:  40% 5578/13907 [3:23:22<4:57:54,  2.15s/it][A
Training...:  40% 5579/13907 [3:23:24<4:51:48,  2.10s/it][A
Training...:  40% 5580/13907 [3:23:26<4:46:13,  2.06s/it][A
Training...:  40% 5581/13907 [3:23:28<4:42:44,  2.04s/it][A
Training...:  40% 5582/13907 [3:23:30<4:37:24,  2.00s/it][A
Training...:  40% 5583/13907 [3:23:32<4:32:56,  1.97s/it][A
Training...:  40% 5584/13907 [3:23:34<4:28:08,  1.93s/it][A
Training...:  40% 5585/13907 [3:23:36<4:22:56,  1.90s/it][A
Training...:  40% 5586/13907 [3:23:38<4:18:33,  1.86s/it][A
Training...:  40% 5587/13907 [3:23:39<4:14:24,  1.83s/it][A
Training...:  40% 5588/13907 [3:23:41<4:09:58,  1.80s/it][A
Training...:  40% 5589/13907 [3:23:43<4:05:04,  1.77s/it][A
Training...:  40% 5590/13907 [3:23:45<4:00:33,  1.74s/it][A
Training...:  40% 5591/13907 [3:23:46<3:55:35,  1.70s/it][A
Training...:  40% 5592/13907 [3:23:48<3:50:20,  1.66s/it][A
Training...:  40% 5593/13907 [3:23:49<3:45:05,  1.62s/it][A
Training...:  40% 5594/13907 [3:23:51<3:39:25,  1.58s/it][A
Training...:  40% 5595/13907 [3:23:52<3:32:48,  1.54s/it][A
Training...:  40% 5596/13907 [3:23:54<3:25:59,  1.49s/it][A
Training...:  40% 5597/13907 [3:23:55<3:18:37,  1.43s/it][A
Training...:  40% 5598/13907 [3:23:56<3:10:20,  1.37s/it][A
Training...:  40% 5599/13907 [3:23:57<3:01:13,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:24:11<?, ?it/s]
Training...:  40% 5599/13907 [3:23:58<3:01:13,  1.31s/it][A
Training...:  40% 5600/13907 [3:23:58<2:57:20,  1.28s/it][A
Training...:  40% 5601/13907 [3:24:02<4:39:30,  2.02s/it][A
Training...:  40% 5602/13907 [3:24:06<5:37:45,  2.44s/it][A
Training...:  40% 5603/13907 [3:24:09<6:08:14,  2.66s/it][A
Training...:  40% 5604/13907 [3:24:12<6:26:01,  2.79s/it][A
Training...:  40% 5605/13907 [3:24:15<6:35:05,  2.86s/it][A
Training...:  40% 5606/13907 [3:24:18<6:38:42,  2.88s/it][A
Training...:  40% 5607/13907 [3:24:21<6:40:15,  2.89s/it][A
Training...:  40% 5608/13907 [3:24:24<6:37:06,  2.87s/it][A
Training...:  40% 5609/13907 [3:24:26<6:33:31,  2.85s/it][A
Training...:  40% 5610/13907 [3:24:29<6:24:45,  2.78s/it][A
Training...:  40% 5611/13907 [3:24:32<6:16:31,  2.72s/it][A
Training...:  40% 5612/13907 [3:24:34<6:10:10,  2.68s/it][A
Training...:  40% 5613/13907 [3:24:37<6:03:38,  2.63s/it][A
Training...:  40% 5614/13907 [3:24:39<5:56:31,  2.58s/it][A
Training...:  40% 5615/13907 [3:24:42<5:50:55,  2.54s/it][A
Training...:  40% 5616/13907 [3:24:44<5:44:18,  2.49s/it][A
Training...:  40% 5617/13907 [3:24:46<5:39:25,  2.46s/it][A
Training...:  40% 5618/13907 [3:24:49<5:33:43,  2.42s/it][A
Training...:  40% 5619/13907 [3:24:51<5:30:50,  2.40s/it][A
Training...:  40% 5620/13907 [3:24:53<5:26:51,  2.37s/it][A
Training...:  40% 5621/13907 [3:24:56<5:22:44,  2.34s/it][A
Training...:  40% 5622/13907 [3:24:58<5:17:18,  2.30s/it][A
Training...:  40% 5623/13907 [3:25:00<5:11:09,  2.25s/it][A
Training...:  40% 5624/13907 [3:25:02<5:05:21,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:25:17<?, ?it/s]
Training...:  40% 5624/13907 [3:25:04<5:05:21,  2.21s/it][A
Training...:  40% 5625/13907 [3:25:04<5:14:32,  2.28s/it][A
Training...:  40% 5626/13907 [3:25:07<5:07:32,  2.23s/it][A
Training...:  40% 5627/13907 [3:25:09<4:59:30,  2.17s/it][A
Training...:  40% 5628/13907 [3:25:11<4:52:14,  2.12s/it][A
Training...:  40% 5629/13907 [3:25:13<4:46:14,  2.07s/it][A
Training...:  40% 5630/13907 [3:25:15<4:40:32,  2.03s/it][A
Training...:  40% 5631/13907 [3:25:17<4:37:46,  2.01s/it][A
Training...:  40% 5632/13907 [3:25:18<4:33:35,  1.98s/it][A
Training...:  41% 5633/13907 [3:25:20<4:27:44,  1.94s/it][A
Training...:  41% 5634/13907 [3:25:22<4:24:17,  1.92s/it][A
Training...:  41% 5635/13907 [3:25:24<4:19:16,  1.88s/it][A
Training...:  41% 5636/13907 [3:25:26<4:14:38,  1.85s/it][A
Training...:  41% 5637/13907 [3:25:27<4:10:18,  1.82s/it][A
Training...:  41% 5638/13907 [3:25:29<4:05:42,  1.78s/it][A
Training...:  41% 5639/13907 [3:25:31<4:00:30,  1.75s/it][A
Training...:  41% 5640/13907 [3:25:32<3:56:26,  1.72s/it][A
Training...:  41% 5641/13907 [3:25:34<3:51:49,  1.68s/it][A
Training...:  41% 5642/13907 [3:25:36<3:46:31,  1.64s/it][A
Training...:  41% 5643/13907 [3:25:37<3:42:52,  1.62s/it][A
Training...:  41% 5644/13907 [3:25:39<3:38:25,  1.59s/it][A
Training...:  41% 5645/13907 [3:25:40<3:33:46,  1.55s/it][A
Training...:  41% 5646/13907 [3:25:42<3:26:42,  1.50s/it][A
Training...:  41% 5647/13907 [3:25:43<3:19:21,  1.45s/it][A
Training...:  41% 5648/13907 [3:25:44<3:11:09,  1.39s/it][A
Training...:  41% 5649/13907 [3:25:45<3:01:36,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:25:59<?, ?it/s]
Training...:  41% 5649/13907 [3:25:47<3:01:36,  1.32s/it][A
Training...:  41% 5650/13907 [3:25:47<2:58:26,  1.30s/it][A
Training...:  41% 5651/13907 [3:25:50<4:35:47,  2.00s/it][A
Training...:  41% 5652/13907 [3:25:53<5:29:36,  2.40s/it][A
Training...:  41% 5653/13907 [3:25:57<6:00:53,  2.62s/it][A
Training...:  41% 5654/13907 [3:26:00<6:19:17,  2.76s/it][A
Training...:  41% 5655/13907 [3:26:03<6:30:55,  2.84s/it][A
Training...:  41% 5656/13907 [3:26:06<6:34:01,  2.87s/it][A
Training...:  41% 5657/13907 [3:26:08<6:31:57,  2.85s/it][A
Training...:  41% 5658/13907 [3:26:11<6:26:14,  2.81s/it][A
Training...:  41% 5659/13907 [3:26:14<6:22:38,  2.78s/it][A
Training...:  41% 5660/13907 [3:26:17<6:16:07,  2.74s/it][A
Training...:  41% 5661/13907 [3:26:19<6:12:17,  2.71s/it][A
Training...:  41% 5662/13907 [3:26:22<6:05:32,  2.66s/it][A
Training...:  41% 5663/13907 [3:26:24<5:59:50,  2.62s/it][A
Training...:  41% 5664/13907 [3:26:27<5:53:09,  2.57s/it][A
Training...:  41% 5665/13907 [3:26:29<5:48:11,  2.53s/it][A
Training...:  41% 5666/13907 [3:26:32<5:41:44,  2.49s/it][A
Training...:  41% 5667/13907 [3:26:34<5:36:18,  2.45s/it][A
Training...:  41% 5668/13907 [3:26:36<5:30:21,  2.41s/it][A
Training...:  41% 5669/13907 [3:26:38<5:24:59,  2.37s/it][A
Training...:  41% 5670/13907 [3:26:41<5:19:25,  2.33s/it][A
Training...:  41% 5671/13907 [3:26:43<5:15:35,  2.30s/it][A
Training...:  41% 5672/13907 [3:26:45<5:10:20,  2.26s/it][A
Training...:  41% 5673/13907 [3:26:47<5:05:36,  2.23s/it][A
Training...:  41% 5674/13907 [3:26:49<4:59:43,  2.18s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:27:04<?, ?it/s]
Training...:  41% 5674/13907 [3:26:52<4:59:43,  2.18s/it][A
Training...:  41% 5675/13907 [3:26:52<5:10:42,  2.26s/it][A
Training...:  41% 5676/13907 [3:26:54<5:03:54,  2.22s/it][A
Training...:  41% 5677/13907 [3:26:56<4:57:30,  2.17s/it][A
Training...:  41% 5678/13907 [3:26:58<4:52:32,  2.13s/it][A
Training...:  41% 5679/13907 [3:27:00<4:46:36,  2.09s/it][A
Training...:  41% 5680/13907 [3:27:02<4:40:43,  2.05s/it][A
Training...:  41% 5681/13907 [3:27:04<4:36:25,  2.02s/it][A
Training...:  41% 5682/13907 [3:27:06<4:34:32,  2.00s/it][A
Training...:  41% 5683/13907 [3:27:08<4:31:19,  1.98s/it][A
Training...:  41% 5684/13907 [3:27:10<4:27:18,  1.95s/it][A
Training...:  41% 5685/13907 [3:27:11<4:21:22,  1.91s/it][A
Training...:  41% 5686/13907 [3:27:13<4:15:53,  1.87s/it][A
Training...:  41% 5687/13907 [3:27:15<4:10:29,  1.83s/it][A
Training...:  41% 5688/13907 [3:27:17<4:04:57,  1.79s/it][A
Training...:  41% 5689/13907 [3:27:18<4:02:17,  1.77s/it][A
Training...:  41% 5690/13907 [3:27:20<3:56:41,  1.73s/it][A
Training...:  41% 5691/13907 [3:27:22<3:51:13,  1.69s/it][A
Training...:  41% 5692/13907 [3:27:23<3:45:18,  1.65s/it][A
Training...:  41% 5693/13907 [3:27:25<3:40:13,  1.61s/it][A
Training...:  41% 5694/13907 [3:27:26<3:35:50,  1.58s/it][A
Training...:  41% 5695/13907 [3:27:28<3:29:44,  1.53s/it][A
Training...:  41% 5696/13907 [3:27:29<3:23:18,  1.49s/it][A
Training...:  41% 5697/13907 [3:27:30<3:16:45,  1.44s/it][A
Training...:  41% 5698/13907 [3:27:32<3:08:52,  1.38s/it][A
Training...:  41% 5699/13907 [3:27:33<3:00:16,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:27:46<?, ?it/s]
Training...:  41% 5699/13907 [3:27:34<3:00:16,  1.32s/it][A
Training...:  41% 5700/13907 [3:27:34<2:55:49,  1.29s/it][A
Training...:  41% 5701/13907 [3:27:38<4:37:34,  2.03s/it][A
Training...:  41% 5702/13907 [3:27:41<5:31:12,  2.42s/it][A
Training...:  41% 5703/13907 [3:27:44<6:04:01,  2.66s/it][A
Training...:  41% 5704/13907 [3:27:47<6:22:28,  2.80s/it][A
Training...:  41% 5705/13907 [3:27:50<6:31:11,  2.86s/it][A
Training...:  41% 5706/13907 [3:27:53<6:31:44,  2.87s/it][A
Training...:  41% 5707/13907 [3:27:56<6:28:53,  2.85s/it][A
Training...:  41% 5708/13907 [3:27:59<6:23:49,  2.81s/it][A
Training...:  41% 5709/13907 [3:28:02<6:18:58,  2.77s/it][A
Training...:  41% 5710/13907 [3:28:04<6:12:23,  2.73s/it][A
Training...:  41% 5711/13907 [3:28:07<6:05:26,  2.68s/it][A
Training...:  41% 5712/13907 [3:28:09<5:58:43,  2.63s/it][A
Training...:  41% 5713/13907 [3:28:12<5:54:46,  2.60s/it][A
Training...:  41% 5714/13907 [3:28:14<5:49:11,  2.56s/it][A
Training...:  41% 5715/13907 [3:28:17<5:43:54,  2.52s/it][A
Training...:  41% 5716/13907 [3:28:19<5:39:33,  2.49s/it][A
Training...:  41% 5717/13907 [3:28:21<5:34:57,  2.45s/it][A
Training...:  41% 5718/13907 [3:28:24<5:30:46,  2.42s/it][A
Training...:  41% 5719/13907 [3:28:26<5:26:00,  2.39s/it][A
Training...:  41% 5720/13907 [3:28:28<5:20:50,  2.35s/it][A
Training...:  41% 5721/13907 [3:28:31<5:17:24,  2.33s/it][A
Training...:  41% 5722/13907 [3:28:33<5:12:13,  2.29s/it][A
Training...:  41% 5723/13907 [3:28:35<5:07:07,  2.25s/it][A
Training...:  41% 5724/13907 [3:28:37<5:02:03,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:28:52<?, ?it/s]
Training...:  41% 5724/13907 [3:28:40<5:02:03,  2.21s/it][A
Training...:  41% 5725/13907 [3:28:40<5:10:05,  2.27s/it][A
Training...:  41% 5726/13907 [3:28:42<5:04:08,  2.23s/it][A
Training...:  41% 5727/13907 [3:28:44<4:56:37,  2.18s/it][A
Training...:  41% 5728/13907 [3:28:46<4:50:26,  2.13s/it][A
Training...:  41% 5729/13907 [3:28:48<4:44:58,  2.09s/it][A
Training...:  41% 5730/13907 [3:28:50<4:40:12,  2.06s/it][A
Training...:  41% 5731/13907 [3:28:52<4:35:42,  2.02s/it][A
Training...:  41% 5732/13907 [3:28:54<4:31:48,  1.99s/it][A
Training...:  41% 5733/13907 [3:28:55<4:28:20,  1.97s/it][A
Training...:  41% 5734/13907 [3:28:57<4:23:51,  1.94s/it][A
Training...:  41% 5735/13907 [3:28:59<4:18:52,  1.90s/it][A
Training...:  41% 5736/13907 [3:29:01<4:13:47,  1.86s/it][A
Training...:  41% 5737/13907 [3:29:03<4:09:19,  1.83s/it][A
Training...:  41% 5738/13907 [3:29:04<4:05:00,  1.80s/it][A
Training...:  41% 5739/13907 [3:29:06<4:01:27,  1.77s/it][A
Training...:  41% 5740/13907 [3:29:08<3:57:04,  1.74s/it][A
Training...:  41% 5741/13907 [3:29:09<3:51:19,  1.70s/it][A
Training...:  41% 5742/13907 [3:29:11<3:46:29,  1.66s/it][A
Training...:  41% 5743/13907 [3:29:13<3:41:25,  1.63s/it][A
Training...:  41% 5744/13907 [3:29:14<3:36:37,  1.59s/it][A
Training...:  41% 5745/13907 [3:29:15<3:31:02,  1.55s/it][A
Training...:  41% 5746/13907 [3:29:17<3:24:30,  1.50s/it][A
Training...:  41% 5747/13907 [3:29:18<3:17:35,  1.45s/it][A
Training...:  41% 5748/13907 [3:29:19<3:10:16,  1.40s/it][A
Training...:  41% 5749/13907 [3:29:21<2:59:52,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:29:34<?, ?it/s]
Training...:  41% 5749/13907 [3:29:22<2:59:52,  1.32s/it][A
Training...:  41% 5750/13907 [3:29:22<2:55:14,  1.29s/it][A
Training...:  41% 5751/13907 [3:29:26<4:36:25,  2.03s/it][A
Training...:  41% 5752/13907 [3:29:29<5:30:04,  2.43s/it][A
Training...:  41% 5753/13907 [3:29:32<6:02:25,  2.67s/it][A
Training...:  41% 5754/13907 [3:29:35<6:19:23,  2.79s/it][A
Training...:  41% 5755/13907 [3:29:38<6:35:52,  2.91s/it][A
Training...:  41% 5756/13907 [3:29:41<6:40:33,  2.95s/it][A
Training...:  41% 5757/13907 [3:29:44<6:39:32,  2.94s/it][A
Training...:  41% 5758/13907 [3:29:47<6:31:52,  2.89s/it][A
Training...:  41% 5759/13907 [3:29:50<6:24:47,  2.83s/it][A
Training...:  41% 5760/13907 [3:29:53<6:16:37,  2.77s/it][A
Training...:  41% 5761/13907 [3:29:55<6:09:04,  2.72s/it][A
Training...:  41% 5762/13907 [3:29:58<6:01:34,  2.66s/it][A
Training...:  41% 5763/13907 [3:30:00<5:55:08,  2.62s/it][A
Training...:  41% 5764/13907 [3:30:03<5:51:06,  2.59s/it][A
Training...:  41% 5765/13907 [3:30:05<5:45:58,  2.55s/it][A
Training...:  41% 5766/13907 [3:30:08<5:40:08,  2.51s/it][A
Training...:  41% 5767/13907 [3:30:10<5:34:16,  2.46s/it][A
Training...:  41% 5768/13907 [3:30:12<5:28:13,  2.42s/it][A
Training...:  41% 5769/13907 [3:30:15<5:23:22,  2.38s/it][A
Training...:  41% 5770/13907 [3:30:17<5:17:09,  2.34s/it][A
Training...:  41% 5771/13907 [3:30:19<5:13:10,  2.31s/it][A
Training...:  42% 5772/13907 [3:30:21<5:08:51,  2.28s/it][A
Training...:  42% 5773/13907 [3:30:23<5:04:09,  2.24s/it][A
Training...:  42% 5774/13907 [3:30:26<5:00:24,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:30:40<?, ?it/s]
Training...:  42% 5774/13907 [3:30:28<5:00:24,  2.22s/it][A
Training...:  42% 5775/13907 [3:30:28<5:09:46,  2.29s/it][A
Training...:  42% 5776/13907 [3:30:30<5:02:58,  2.24s/it][A
Training...:  42% 5777/13907 [3:30:32<4:55:25,  2.18s/it][A
Training...:  42% 5778/13907 [3:30:34<4:48:56,  2.13s/it][A
Training...:  42% 5779/13907 [3:30:36<4:43:02,  2.09s/it][A
Training...:  42% 5780/13907 [3:30:38<4:38:16,  2.05s/it][A
Training...:  42% 5781/13907 [3:30:40<4:33:29,  2.02s/it][A
Training...:  42% 5782/13907 [3:30:42<4:28:44,  1.98s/it][A
Training...:  42% 5783/13907 [3:30:44<4:24:10,  1.95s/it][A
Training...:  42% 5784/13907 [3:30:46<4:20:19,  1.92s/it][A
Training...:  42% 5785/13907 [3:30:48<4:16:46,  1.90s/it][A
Training...:  42% 5786/13907 [3:30:49<4:13:12,  1.87s/it][A
Training...:  42% 5787/13907 [3:30:51<4:10:13,  1.85s/it][A
Training...:  42% 5788/13907 [3:30:53<4:05:09,  1.81s/it][A
Training...:  42% 5789/13907 [3:30:55<4:01:24,  1.78s/it][A
Training...:  42% 5790/13907 [3:30:56<3:57:17,  1.75s/it][A
Training...:  42% 5791/13907 [3:30:58<3:53:09,  1.72s/it][A
Training...:  42% 5792/13907 [3:30:59<3:47:59,  1.69s/it][A
Training...:  42% 5793/13907 [3:31:01<3:43:00,  1.65s/it][A
Training...:  42% 5794/13907 [3:31:03<3:37:27,  1.61s/it][A
Training...:  42% 5795/13907 [3:31:04<3:32:59,  1.58s/it][A
Training...:  42% 5796/13907 [3:31:05<3:26:01,  1.52s/it][A
Training...:  42% 5797/13907 [3:31:07<3:18:32,  1.47s/it][A
Training...:  42% 5798/13907 [3:31:08<3:10:58,  1.41s/it][A
Training...:  42% 5799/13907 [3:31:09<3:01:58,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:31:23<?, ?it/s]
Training...:  42% 5799/13907 [3:31:11<3:01:58,  1.35s/it][A
Training...:  42% 5800/13907 [3:31:11<2:57:07,  1.31s/it][A
Training...:  42% 5801/13907 [3:31:14<4:38:06,  2.06s/it][A
Training...:  42% 5802/13907 [3:31:18<5:30:24,  2.45s/it][A
Training...:  42% 5803/13907 [3:31:21<6:02:10,  2.68s/it][A
Training...:  42% 5804/13907 [3:31:24<6:19:04,  2.81s/it][A
Training...:  42% 5805/13907 [3:31:27<6:26:29,  2.86s/it][A
Training...:  42% 5806/13907 [3:31:30<6:29:04,  2.88s/it][A
Training...:  42% 5807/13907 [3:31:33<6:29:24,  2.88s/it][A
Training...:  42% 5808/13907 [3:31:36<6:28:14,  2.88s/it][A
Training...:  42% 5809/13907 [3:31:38<6:25:20,  2.86s/it][A
Training...:  42% 5810/13907 [3:31:41<6:16:39,  2.79s/it][A
Training...:  42% 5811/13907 [3:31:44<6:08:34,  2.73s/it][A
Training...:  42% 5812/13907 [3:31:46<6:00:48,  2.67s/it][A
Training...:  42% 5813/13907 [3:31:49<5:55:17,  2.63s/it][A
Training...:  42% 5814/13907 [3:31:51<5:49:12,  2.59s/it][A
Training...:  42% 5815/13907 [3:31:54<5:43:19,  2.55s/it][A
Training...:  42% 5816/13907 [3:31:56<5:38:38,  2.51s/it][A
Training...:  42% 5817/13907 [3:31:59<5:34:47,  2.48s/it][A
Training...:  42% 5818/13907 [3:32:01<5:30:12,  2.45s/it][A
Training...:  42% 5819/13907 [3:32:03<5:24:55,  2.41s/it][A
Training...:  42% 5820/13907 [3:32:06<5:19:13,  2.37s/it][A
Training...:  42% 5821/13907 [3:32:08<5:13:53,  2.33s/it][A
Training...:  42% 5822/13907 [3:32:10<5:09:30,  2.30s/it][A
Training...:  42% 5823/13907 [3:32:12<5:06:10,  2.27s/it][A
Training...:  42% 5824/13907 [3:32:14<5:03:00,  2.25s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:32:29<?, ?it/s]
Training...:  42% 5824/13907 [3:32:17<5:03:00,  2.25s/it][A
Training...:  42% 5825/13907 [3:32:17<5:11:21,  2.31s/it][A
Training...:  42% 5826/13907 [3:32:19<5:05:14,  2.27s/it][A
Training...:  42% 5827/13907 [3:32:21<4:58:16,  2.21s/it][A
Training...:  42% 5828/13907 [3:32:23<4:51:22,  2.16s/it][A
Training...:  42% 5829/13907 [3:32:25<4:46:01,  2.12s/it][A
Training...:  42% 5830/13907 [3:32:27<4:40:45,  2.09s/it][A
Training...:  42% 5831/13907 [3:32:29<4:35:56,  2.05s/it][A
Training...:  42% 5832/13907 [3:32:31<4:31:03,  2.01s/it][A
Training...:  42% 5833/13907 [3:32:33<4:27:07,  1.99s/it][A
Training...:  42% 5834/13907 [3:32:35<4:22:52,  1.95s/it][A
Training...:  42% 5835/13907 [3:32:37<4:17:24,  1.91s/it][A
Training...:  42% 5836/13907 [3:32:38<4:12:40,  1.88s/it][A
Training...:  42% 5837/13907 [3:32:40<4:08:05,  1.84s/it][A
Training...:  42% 5838/13907 [3:32:42<4:03:05,  1.81s/it][A
Training...:  42% 5839/13907 [3:32:44<3:58:41,  1.78s/it][A
Training...:  42% 5840/13907 [3:32:45<3:53:57,  1.74s/it][A
Training...:  42% 5841/13907 [3:32:47<3:49:13,  1.71s/it][A
Training...:  42% 5842/13907 [3:32:49<3:44:28,  1.67s/it][A
Training...:  42% 5843/13907 [3:32:50<3:39:23,  1.63s/it][A
Training...:  42% 5844/13907 [3:32:52<3:33:36,  1.59s/it][A
Training...:  42% 5845/13907 [3:32:53<3:28:14,  1.55s/it][A
Training...:  42% 5846/13907 [3:32:54<3:21:45,  1.50s/it][A
Training...:  42% 5847/13907 [3:32:56<3:15:14,  1.45s/it][A
Training...:  42% 5848/13907 [3:32:57<3:07:25,  1.40s/it][A
Training...:  42% 5849/13907 [3:32:58<2:57:39,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:33:12<?, ?it/s]
Training...:  42% 5849/13907 [3:32:59<2:57:39,  1.32s/it][A
Training...:  42% 5850/13907 [3:32:59<2:52:23,  1.28s/it][A
Training...:  42% 5851/13907 [3:33:03<4:33:49,  2.04s/it][A
Training...:  42% 5852/13907 [3:33:07<5:27:24,  2.44s/it][A
Training...:  42% 5853/13907 [3:33:10<5:59:33,  2.68s/it][A
Training...:  42% 5854/13907 [3:33:13<6:14:16,  2.79s/it][A
Training...:  42% 5855/13907 [3:33:16<6:22:06,  2.85s/it][A
Training...:  42% 5856/13907 [3:33:19<6:22:09,  2.85s/it][A
Training...:  42% 5857/13907 [3:33:21<6:20:01,  2.83s/it][A
Training...:  42% 5858/13907 [3:33:24<6:15:13,  2.80s/it][A
Training...:  42% 5859/13907 [3:33:27<6:10:24,  2.76s/it][A
Training...:  42% 5860/13907 [3:33:29<6:03:39,  2.71s/it][A
Training...:  42% 5861/13907 [3:33:32<5:58:25,  2.67s/it][A
Training...:  42% 5862/13907 [3:33:35<5:51:58,  2.63s/it][A
Training...:  42% 5863/13907 [3:33:37<5:46:24,  2.58s/it][A
Training...:  42% 5864/13907 [3:33:40<5:41:50,  2.55s/it][A
Training...:  42% 5865/13907 [3:33:42<5:39:39,  2.53s/it][A
Training...:  42% 5866/13907 [3:33:44<5:36:56,  2.51s/it][A
Training...:  42% 5867/13907 [3:33:47<5:31:48,  2.48s/it][A
Training...:  42% 5868/13907 [3:33:49<5:25:48,  2.43s/it][A
Training...:  42% 5869/13907 [3:33:52<5:21:44,  2.40s/it][A
Training...:  42% 5870/13907 [3:33:54<5:16:11,  2.36s/it][A
Training...:  42% 5871/13907 [3:33:56<5:11:45,  2.33s/it][A
Training...:  42% 5872/13907 [3:33:58<5:05:48,  2.28s/it][A
Training...:  42% 5873/13907 [3:34:00<5:00:37,  2.25s/it][A
Training...:  42% 5874/13907 [3:34:03<4:56:19,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:34:17<?, ?it/s]
Training...:  42% 5874/13907 [3:34:05<4:56:19,  2.21s/it][A
Training...:  42% 5875/13907 [3:34:05<5:04:52,  2.28s/it][A
Training...:  42% 5876/13907 [3:34:07<4:57:54,  2.23s/it][A
Training...:  42% 5877/13907 [3:34:09<4:50:44,  2.17s/it][A
Training...:  42% 5878/13907 [3:34:11<4:44:27,  2.13s/it][A
Training...:  42% 5879/13907 [3:34:13<4:39:43,  2.09s/it][A
Training...:  42% 5880/13907 [3:34:15<4:34:03,  2.05s/it][A
Training...:  42% 5881/13907 [3:34:17<4:29:11,  2.01s/it][A
Training...:  42% 5882/13907 [3:34:19<4:24:45,  1.98s/it][A
Training...:  42% 5883/13907 [3:34:21<4:19:49,  1.94s/it][A
Training...:  42% 5884/13907 [3:34:23<4:15:01,  1.91s/it][A
Training...:  42% 5885/13907 [3:34:24<4:10:52,  1.88s/it][A
Training...:  42% 5886/13907 [3:34:26<4:06:59,  1.85s/it][A
Training...:  42% 5887/13907 [3:34:28<4:03:20,  1.82s/it][A
Training...:  42% 5888/13907 [3:34:30<3:59:09,  1.79s/it][A
Training...:  42% 5889/13907 [3:34:31<3:54:56,  1.76s/it][A
Training...:  42% 5890/13907 [3:34:33<3:50:11,  1.72s/it][A
Training...:  42% 5891/13907 [3:34:35<3:45:20,  1.69s/it][A
Training...:  42% 5892/13907 [3:34:36<3:40:13,  1.65s/it][A
Training...:  42% 5893/13907 [3:34:38<3:36:08,  1.62s/it][A
Training...:  42% 5894/13907 [3:34:39<3:31:05,  1.58s/it][A
Training...:  42% 5895/13907 [3:34:41<3:24:51,  1.53s/it][A
Training...:  42% 5896/13907 [3:34:42<3:18:24,  1.49s/it][A
Training...:  42% 5897/13907 [3:34:43<3:12:17,  1.44s/it][A
Training...:  42% 5898/13907 [3:34:45<3:05:03,  1.39s/it][A
Training...:  42% 5899/13907 [3:34:46<2:56:27,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:34:59<?, ?it/s]
Training...:  42% 5899/13907 [3:34:47<2:56:27,  1.32s/it][A
Training...:  42% 5900/13907 [3:34:47<2:53:29,  1.30s/it][A
Training...:  42% 5901/13907 [3:34:51<4:28:21,  2.01s/it][A
Training...:  42% 5902/13907 [3:34:54<5:22:49,  2.42s/it][A
Training...:  42% 5903/13907 [3:34:57<5:53:40,  2.65s/it][A
Training...:  42% 5904/13907 [3:35:00<6:08:30,  2.76s/it][A
Training...:  42% 5905/13907 [3:35:03<6:21:01,  2.86s/it][A
Training...:  42% 5906/13907 [3:35:06<6:20:56,  2.86s/it][A
Training...:  42% 5907/13907 [3:35:09<6:19:30,  2.85s/it][A
Training...:  42% 5908/13907 [3:35:12<6:15:24,  2.82s/it][A
Training...:  42% 5909/13907 [3:35:14<6:10:06,  2.78s/it][A
Training...:  42% 5910/13907 [3:35:17<6:03:26,  2.73s/it][A
Training...:  43% 5911/13907 [3:35:20<5:57:22,  2.68s/it][A
Training...:  43% 5912/13907 [3:35:22<5:49:50,  2.63s/it][A
Training...:  43% 5913/13907 [3:35:25<5:43:19,  2.58s/it][A
Training...:  43% 5914/13907 [3:35:27<5:38:22,  2.54s/it][A
Training...:  43% 5915/13907 [3:35:29<5:33:59,  2.51s/it][A
Training...:  43% 5916/13907 [3:35:32<5:29:53,  2.48s/it][A
Training...:  43% 5917/13907 [3:35:34<5:26:04,  2.45s/it][A
Training...:  43% 5918/13907 [3:35:37<5:20:26,  2.41s/it][A
Training...:  43% 5919/13907 [3:35:39<5:15:02,  2.37s/it][A
Training...:  43% 5920/13907 [3:35:41<5:09:14,  2.32s/it][A
Training...:  43% 5921/13907 [3:35:43<5:05:58,  2.30s/it][A
Training...:  43% 5922/13907 [3:35:45<4:59:59,  2.25s/it][A
Training...:  43% 5923/13907 [3:35:48<4:55:08,  2.22s/it][A
Training...:  43% 5924/13907 [3:35:50<4:50:31,  2.18s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:36:04<?, ?it/s]
Training...:  43% 5924/13907 [3:35:52<4:50:31,  2.18s/it][A
Training...:  43% 5925/13907 [3:35:52<4:58:52,  2.25s/it][A
Training...:  43% 5926/13907 [3:35:54<4:53:47,  2.21s/it][A
Training...:  43% 5927/13907 [3:35:56<4:45:43,  2.15s/it][A
Training...:  43% 5928/13907 [3:35:58<4:40:15,  2.11s/it][A
Training...:  43% 5929/13907 [3:36:00<4:34:49,  2.07s/it][A
Training...:  43% 5930/13907 [3:36:02<4:29:21,  2.03s/it][A
Training...:  43% 5931/13907 [3:36:04<4:24:41,  1.99s/it][A
Training...:  43% 5932/13907 [3:36:06<4:20:56,  1.96s/it][A
Training...:  43% 5933/13907 [3:36:08<4:17:00,  1.93s/it][A
Training...:  43% 5934/13907 [3:36:10<4:12:18,  1.90s/it][A
Training...:  43% 5935/13907 [3:36:11<4:08:33,  1.87s/it][A
Training...:  43% 5936/13907 [3:36:13<4:05:19,  1.85s/it][A
Training...:  43% 5937/13907 [3:36:15<4:02:10,  1.82s/it][A
Training...:  43% 5938/13907 [3:36:17<3:59:25,  1.80s/it][A
Training...:  43% 5939/13907 [3:36:18<3:55:02,  1.77s/it][A
Training...:  43% 5940/13907 [3:36:20<3:49:40,  1.73s/it][A
Training...:  43% 5941/13907 [3:36:22<3:44:32,  1.69s/it][A
Training...:  43% 5942/13907 [3:36:23<3:40:04,  1.66s/it][A
Training...:  43% 5943/13907 [3:36:25<3:36:07,  1.63s/it][A
Training...:  43% 5944/13907 [3:36:26<3:31:29,  1.59s/it][A
Training...:  43% 5945/13907 [3:36:28<3:26:05,  1.55s/it][A
Training...:  43% 5946/13907 [3:36:29<3:20:31,  1.51s/it][A
Training...:  43% 5947/13907 [3:36:31<3:13:40,  1.46s/it][A
Training...:  43% 5948/13907 [3:36:32<3:05:32,  1.40s/it][A
Training...:  43% 5949/13907 [3:36:33<2:56:51,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:36:46<?, ?it/s]
Training...:  43% 5949/13907 [3:36:34<2:56:51,  1.33s/it][A
Training...:  43% 5950/13907 [3:36:34<2:52:34,  1.30s/it][A
Training...:  43% 5951/13907 [3:36:38<4:32:35,  2.06s/it][A
Training...:  43% 5952/13907 [3:36:41<5:26:34,  2.46s/it][A
Training...:  43% 5953/13907 [3:36:45<5:59:49,  2.71s/it][A
Training...:  43% 5954/13907 [3:36:48<6:13:27,  2.82s/it][A
Training...:  43% 5955/13907 [3:36:51<6:20:02,  2.87s/it][A
Training...:  43% 5956/13907 [3:36:54<6:20:58,  2.87s/it][A
Training...:  43% 5957/13907 [3:36:56<6:19:26,  2.86s/it][A
Training...:  43% 5958/13907 [3:36:59<6:14:43,  2.83s/it][A
Training...:  43% 5959/13907 [3:37:02<6:09:11,  2.79s/it][A
Training...:  43% 5960/13907 [3:37:05<6:03:01,  2.74s/it][A
Training...:  43% 5961/13907 [3:37:07<5:59:28,  2.71s/it][A
Training...:  43% 5962/13907 [3:37:10<5:54:51,  2.68s/it][A
Training...:  43% 5963/13907 [3:37:12<5:49:26,  2.64s/it][A
Training...:  43% 5964/13907 [3:37:15<5:42:12,  2.58s/it][A
Training...:  43% 5965/13907 [3:37:17<5:36:07,  2.54s/it][A
Training...:  43% 5966/13907 [3:37:20<5:30:46,  2.50s/it][A
Training...:  43% 5967/13907 [3:37:22<5:25:56,  2.46s/it][A
Training...:  43% 5968/13907 [3:37:24<5:20:24,  2.42s/it][A
Training...:  43% 5969/13907 [3:37:27<5:15:03,  2.38s/it][A
Training...:  43% 5970/13907 [3:37:29<5:10:30,  2.35s/it][A
Training...:  43% 5971/13907 [3:37:31<5:05:27,  2.31s/it][A
Training...:  43% 5972/13907 [3:37:33<5:01:27,  2.28s/it][A
Training...:  43% 5973/13907 [3:37:35<4:56:41,  2.24s/it][A
Training...:  43% 5974/13907 [3:37:38<4:52:07,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:37:52<?, ?it/s]
Training...:  43% 5974/13907 [3:37:40<4:52:07,  2.21s/it][A
Training...:  43% 5975/13907 [3:37:40<5:00:24,  2.27s/it][A
Training...:  43% 5976/13907 [3:37:42<4:54:45,  2.23s/it][A
Training...:  43% 5977/13907 [3:37:44<4:47:59,  2.18s/it][A
Training...:  43% 5978/13907 [3:37:46<4:42:17,  2.14s/it][A
Training...:  43% 5979/13907 [3:37:48<4:37:05,  2.10s/it][A
Training...:  43% 5980/13907 [3:37:50<4:32:43,  2.06s/it][A
Training...:  43% 5981/13907 [3:37:52<4:28:17,  2.03s/it][A
Training...:  43% 5982/13907 [3:37:54<4:23:10,  1.99s/it][A
Training...:  43% 5983/13907 [3:37:56<4:19:11,  1.96s/it][A
Training...:  43% 5984/13907 [3:37:58<4:14:45,  1.93s/it][A
Training...:  43% 5985/13907 [3:38:00<4:10:52,  1.90s/it][A
Training...:  43% 5986/13907 [3:38:01<4:06:23,  1.87s/it][A
Training...:  43% 5987/13907 [3:38:03<4:02:16,  1.84s/it][A
Training...:  43% 5988/13907 [3:38:05<3:57:55,  1.80s/it][A
Training...:  43% 5989/13907 [3:38:07<3:53:39,  1.77s/it][A
Training...:  43% 5990/13907 [3:38:08<3:49:18,  1.74s/it][A
Training...:  43% 5991/13907 [3:38:10<3:45:02,  1.71s/it][A
Training...:  43% 5992/13907 [3:38:12<3:40:51,  1.67s/it][A
Training...:  43% 5993/13907 [3:38:13<3:35:37,  1.63s/it][A
Training...:  43% 5994/13907 [3:38:15<3:30:42,  1.60s/it][A
Training...:  43% 5995/13907 [3:38:16<3:25:52,  1.56s/it][A
Training...:  43% 5996/13907 [3:38:18<3:20:36,  1.52s/it][A
Training...:  43% 5997/13907 [3:38:19<3:14:06,  1.47s/it][A
Training...:  43% 5998/13907 [3:38:20<3:07:02,  1.42s/it][A
Training...:  43% 5999/13907 [3:38:21<2:58:20,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:38:35<?, ?it/s]
Training...:  43% 5999/13907 [3:38:23<2:58:20,  1.35s/it][A
Training...:  43% 6000/13907 [3:38:23<2:54:23,  1.32s/it][A
Training...:  43% 6001/13907 [3:38:26<4:27:38,  2.03s/it][A
Training...:  43% 6002/13907 [3:38:30<5:20:10,  2.43s/it][A
Training...:  43% 6003/13907 [3:38:33<5:47:55,  2.64s/it][A
Training...:  43% 6004/13907 [3:38:36<6:04:38,  2.77s/it][A
Training...:  43% 6005/13907 [3:38:39<6:16:05,  2.86s/it][A
Training...:  43% 6006/13907 [3:38:42<6:17:58,  2.87s/it][A
Training...:  43% 6007/13907 [3:38:45<6:15:00,  2.85s/it][A
Training...:  43% 6008/13907 [3:38:47<6:08:54,  2.80s/it][A
Training...:  43% 6009/13907 [3:38:50<6:02:59,  2.76s/it][A
Training...:  43% 6010/13907 [3:38:53<5:55:46,  2.70s/it][A
Training...:  43% 6011/13907 [3:38:55<5:52:38,  2.68s/it][A
Training...:  43% 6012/13907 [3:38:58<5:46:21,  2.63s/it][A
Training...:  43% 6013/13907 [3:39:00<5:41:22,  2.59s/it][A
Training...:  43% 6014/13907 [3:39:03<5:36:43,  2.56s/it][A
Training...:  43% 6015/13907 [3:39:05<5:33:04,  2.53s/it][A
Training...:  43% 6016/13907 [3:39:08<5:27:31,  2.49s/it][A
Training...:  43% 6017/13907 [3:39:10<5:22:35,  2.45s/it][A
Training...:  43% 6018/13907 [3:39:12<5:17:55,  2.42s/it][A
Training...:  43% 6019/13907 [3:39:15<5:13:17,  2.38s/it][A
Training...:  43% 6020/13907 [3:39:17<5:07:24,  2.34s/it][A
Training...:  43% 6021/13907 [3:39:19<5:03:55,  2.31s/it][A
Training...:  43% 6022/13907 [3:39:21<4:59:34,  2.28s/it][A
Training...:  43% 6023/13907 [3:39:23<4:55:33,  2.25s/it][A
Training...:  43% 6024/13907 [3:39:26<4:50:53,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:39:40<?, ?it/s]
Training...:  43% 6024/13907 [3:39:28<4:50:53,  2.21s/it][A
Training...:  43% 6025/13907 [3:39:28<4:59:50,  2.28s/it][A
Training...:  43% 6026/13907 [3:39:30<4:54:30,  2.24s/it][A
Training...:  43% 6027/13907 [3:39:32<4:47:54,  2.19s/it][A
Training...:  43% 6028/13907 [3:39:34<4:42:05,  2.15s/it][A
Training...:  43% 6029/13907 [3:39:36<4:39:13,  2.13s/it][A
Training...:  43% 6030/13907 [3:39:38<4:34:47,  2.09s/it][A
Training...:  43% 6031/13907 [3:39:40<4:28:58,  2.05s/it][A
Training...:  43% 6032/13907 [3:39:42<4:24:12,  2.01s/it][A
Training...:  43% 6033/13907 [3:39:44<4:19:38,  1.98s/it][A
Training...:  43% 6034/13907 [3:39:46<4:14:15,  1.94s/it][A
Training...:  43% 6035/13907 [3:39:48<4:09:36,  1.90s/it][A
Training...:  43% 6036/13907 [3:39:50<4:04:56,  1.87s/it][A
Training...:  43% 6037/13907 [3:39:51<4:00:15,  1.83s/it][A
Training...:  43% 6038/13907 [3:39:53<3:54:53,  1.79s/it][A
Training...:  43% 6039/13907 [3:39:55<3:50:42,  1.76s/it][A
Training...:  43% 6040/13907 [3:39:56<3:46:19,  1.73s/it][A
Training...:  43% 6041/13907 [3:39:58<3:42:33,  1.70s/it][A
Training...:  43% 6042/13907 [3:40:00<3:37:31,  1.66s/it][A
Training...:  43% 6043/13907 [3:40:01<3:33:29,  1.63s/it][A
Training...:  43% 6044/13907 [3:40:03<3:29:23,  1.60s/it][A
Training...:  43% 6045/13907 [3:40:04<3:23:26,  1.55s/it][A
Training...:  43% 6046/13907 [3:40:05<3:16:21,  1.50s/it][A
Training...:  43% 6047/13907 [3:40:07<3:09:22,  1.45s/it][A
Training...:  43% 6048/13907 [3:40:08<3:01:26,  1.39s/it][A
Training...:  43% 6049/13907 [3:40:09<2:51:42,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:40:23<?, ?it/s]
Training...:  43% 6049/13907 [3:40:10<2:51:42,  1.31s/it][A
Training...:  44% 6050/13907 [3:40:10<2:47:26,  1.28s/it][A
Training...:  44% 6051/13907 [3:40:14<4:25:58,  2.03s/it][A
Training...:  44% 6052/13907 [3:40:18<5:18:57,  2.44s/it][A
Training...:  44% 6053/13907 [3:40:21<5:49:09,  2.67s/it][A
Training...:  44% 6054/13907 [3:40:24<6:04:35,  2.79s/it][A
Training...:  44% 6055/13907 [3:40:27<6:12:45,  2.85s/it][A
Training...:  44% 6056/13907 [3:40:30<6:14:35,  2.86s/it][A
Training...:  44% 6057/13907 [3:40:33<6:14:54,  2.87s/it][A
Training...:  44% 6058/13907 [3:40:35<6:10:08,  2.83s/it][A
Training...:  44% 6059/13907 [3:40:38<6:06:31,  2.80s/it][A
Training...:  44% 6060/13907 [3:40:41<5:59:19,  2.75s/it][A
Training...:  44% 6061/13907 [3:40:43<5:54:28,  2.71s/it][A
Training...:  44% 6062/13907 [3:40:46<5:48:04,  2.66s/it][A
Training...:  44% 6063/13907 [3:40:48<5:42:41,  2.62s/it][A
Training...:  44% 6064/13907 [3:40:51<5:35:30,  2.57s/it][A
Training...:  44% 6065/13907 [3:40:53<5:29:37,  2.52s/it][A
Training...:  44% 6066/13907 [3:40:56<5:24:47,  2.49s/it][A
Training...:  44% 6067/13907 [3:40:58<5:18:42,  2.44s/it][A
Training...:  44% 6068/13907 [3:41:00<5:14:44,  2.41s/it][A
Training...:  44% 6069/13907 [3:41:03<5:10:48,  2.38s/it][A
Training...:  44% 6070/13907 [3:41:05<5:06:29,  2.35s/it][A
Training...:  44% 6071/13907 [3:41:07<5:02:37,  2.32s/it][A
Training...:  44% 6072/13907 [3:41:09<4:57:21,  2.28s/it][A
Training...:  44% 6073/13907 [3:41:11<4:53:18,  2.25s/it][A
Training...:  44% 6074/13907 [3:41:14<4:48:18,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:41:28<?, ?it/s]
Training...:  44% 6074/13907 [3:41:16<4:48:18,  2.21s/it][A
Training...:  44% 6075/13907 [3:41:16<4:56:39,  2.27s/it][A
Training...:  44% 6076/13907 [3:41:18<4:51:41,  2.23s/it][A
Training...:  44% 6077/13907 [3:41:20<4:43:56,  2.18s/it][A
Training...:  44% 6078/13907 [3:41:22<4:36:49,  2.12s/it][A
Training...:  44% 6079/13907 [3:41:24<4:31:35,  2.08s/it][A
Training...:  44% 6080/13907 [3:41:26<4:26:39,  2.04s/it][A
Training...:  44% 6081/13907 [3:41:28<4:21:49,  2.01s/it][A
Training...:  44% 6082/13907 [3:41:30<4:17:17,  1.97s/it][A
Training...:  44% 6083/13907 [3:41:32<4:13:11,  1.94s/it][A
Training...:  44% 6084/13907 [3:41:34<4:08:55,  1.91s/it][A
Training...:  44% 6085/13907 [3:41:35<4:05:04,  1.88s/it][A
Training...:  44% 6086/13907 [3:41:37<4:02:32,  1.86s/it][A
Training...:  44% 6087/13907 [3:41:39<3:59:57,  1.84s/it][A
Training...:  44% 6088/13907 [3:41:41<3:56:47,  1.82s/it][A
Training...:  44% 6089/13907 [3:41:43<3:51:33,  1.78s/it][A
Training...:  44% 6090/13907 [3:41:44<3:47:48,  1.75s/it][A
Training...:  44% 6091/13907 [3:41:46<3:43:06,  1.71s/it][A
Training...:  44% 6092/13907 [3:41:47<3:38:18,  1.68s/it][A
Training...:  44% 6093/13907 [3:41:49<3:34:02,  1.64s/it][A
Training...:  44% 6094/13907 [3:41:51<3:28:41,  1.60s/it][A
Training...:  44% 6095/13907 [3:41:52<3:23:48,  1.57s/it][A
Training...:  44% 6096/13907 [3:41:53<3:17:17,  1.52s/it][A
Training...:  44% 6097/13907 [3:41:55<3:10:34,  1.46s/it][A
Training...:  44% 6098/13907 [3:41:56<3:02:38,  1.40s/it][A
Training...:  44% 6099/13907 [3:41:57<2:53:39,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:42:11<?, ?it/s]
Training...:  44% 6099/13907 [3:41:58<2:53:39,  1.33s/it][A
Training...:  44% 6100/13907 [3:41:58<2:49:13,  1.30s/it][A
Training...:  44% 6101/13907 [3:42:02<4:23:58,  2.03s/it][A
Training...:  44% 6102/13907 [3:42:06<5:16:57,  2.44s/it][A
Training...:  44% 6103/13907 [3:42:09<5:45:12,  2.65s/it][A
Training...:  44% 6104/13907 [3:42:12<5:59:03,  2.76s/it][A
Training...:  44% 6105/13907 [3:42:15<6:07:09,  2.82s/it][A
Training...:  44% 6106/13907 [3:42:17<6:07:55,  2.83s/it][A
Training...:  44% 6107/13907 [3:42:20<6:08:01,  2.83s/it][A
Training...:  44% 6108/13907 [3:42:23<6:03:13,  2.79s/it][A
Training...:  44% 6109/13907 [3:42:26<5:58:37,  2.76s/it][A
Training...:  44% 6110/13907 [3:42:28<5:52:40,  2.71s/it][A
Training...:  44% 6111/13907 [3:42:31<5:47:08,  2.67s/it][A
Training...:  44% 6112/13907 [3:42:33<5:40:56,  2.62s/it][A
Training...:  44% 6113/13907 [3:42:36<5:35:43,  2.58s/it][A
Training...:  44% 6114/13907 [3:42:38<5:31:08,  2.55s/it][A
Training...:  44% 6115/13907 [3:42:41<5:25:50,  2.51s/it][A
Training...:  44% 6116/13907 [3:42:43<5:20:39,  2.47s/it][A
Training...:  44% 6117/13907 [3:42:46<5:16:01,  2.43s/it][A
Training...:  44% 6118/13907 [3:42:48<5:11:33,  2.40s/it][A
Training...:  44% 6119/13907 [3:42:50<5:06:54,  2.36s/it][A
Training...:  44% 6120/13907 [3:42:52<5:02:22,  2.33s/it][A
Training...:  44% 6121/13907 [3:42:55<4:57:53,  2.30s/it][A
Training...:  44% 6122/13907 [3:42:57<4:53:37,  2.26s/it][A
Training...:  44% 6123/13907 [3:42:59<4:50:10,  2.24s/it][A
Training...:  44% 6124/13907 [3:43:01<4:46:28,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:43:16<?, ?it/s]
Training...:  44% 6124/13907 [3:43:03<4:46:28,  2.21s/it][A
Training...:  44% 6125/13907 [3:43:03<4:54:37,  2.27s/it][A
Training...:  44% 6126/13907 [3:43:06<4:49:17,  2.23s/it][A
Training...:  44% 6127/13907 [3:43:08<4:44:27,  2.19s/it][A
Training...:  44% 6128/13907 [3:43:10<4:38:15,  2.15s/it][A
Training...:  44% 6129/13907 [3:43:12<4:32:15,  2.10s/it][A
Training...:  44% 6130/13907 [3:43:14<4:26:30,  2.06s/it][A
Training...:  44% 6131/13907 [3:43:16<4:21:01,  2.01s/it][A
Training...:  44% 6132/13907 [3:43:18<4:15:59,  1.98s/it][A
Training...:  44% 6133/13907 [3:43:19<4:11:45,  1.94s/it][A
Training...:  44% 6134/13907 [3:43:21<4:07:20,  1.91s/it][A
Training...:  44% 6135/13907 [3:43:23<4:03:12,  1.88s/it][A
Training...:  44% 6136/13907 [3:43:25<3:58:30,  1.84s/it][A
Training...:  44% 6137/13907 [3:43:27<3:55:24,  1.82s/it][A
Training...:  44% 6138/13907 [3:43:28<3:52:43,  1.80s/it][A
Training...:  44% 6139/13907 [3:43:30<3:47:30,  1.76s/it][A
Training...:  44% 6140/13907 [3:43:32<3:43:59,  1.73s/it][A
Training...:  44% 6141/13907 [3:43:33<3:38:59,  1.69s/it][A
Training...:  44% 6142/13907 [3:43:35<3:34:37,  1.66s/it][A
Training...:  44% 6143/13907 [3:43:36<3:29:21,  1.62s/it][A
Training...:  44% 6144/13907 [3:43:38<3:25:11,  1.59s/it][A
Training...:  44% 6145/13907 [3:43:39<3:19:16,  1.54s/it][A
Training...:  44% 6146/13907 [3:43:41<3:12:59,  1.49s/it][A
Training...:  44% 6147/13907 [3:43:42<3:06:30,  1.44s/it][A
Training...:  44% 6148/13907 [3:43:43<2:59:01,  1.38s/it][A
Training...:  44% 6149/13907 [3:43:44<2:50:46,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:43:58<?, ?it/s]
Training...:  44% 6149/13907 [3:43:46<2:50:46,  1.32s/it][A
Training...:  44% 6150/13907 [3:43:46<2:47:14,  1.29s/it][A
Training...:  44% 6151/13907 [3:43:49<4:21:22,  2.02s/it][A
Training...:  44% 6152/13907 [3:43:53<5:12:34,  2.42s/it][A
Training...:  44% 6153/13907 [3:43:56<5:41:22,  2.64s/it][A
Training...:  44% 6154/13907 [3:43:59<5:55:48,  2.75s/it][A
Training...:  44% 6155/13907 [3:44:02<6:04:42,  2.82s/it][A
Training...:  44% 6156/13907 [3:44:05<6:05:29,  2.83s/it][A
Training...:  44% 6157/13907 [3:44:07<6:04:04,  2.82s/it][A
Training...:  44% 6158/13907 [3:44:10<5:59:48,  2.79s/it][A
Training...:  44% 6159/13907 [3:44:13<5:55:09,  2.75s/it][A
Training...:  44% 6160/13907 [3:44:15<5:50:15,  2.71s/it][A
Training...:  44% 6161/13907 [3:44:18<5:44:20,  2.67s/it][A
Training...:  44% 6162/13907 [3:44:21<5:39:08,  2.63s/it][A
Training...:  44% 6163/13907 [3:44:23<5:33:22,  2.58s/it][A
Training...:  44% 6164/13907 [3:44:26<5:28:36,  2.55s/it][A
Training...:  44% 6165/13907 [3:44:28<5:24:39,  2.52s/it][A
Training...:  44% 6166/13907 [3:44:30<5:21:06,  2.49s/it][A
Training...:  44% 6167/13907 [3:44:33<5:19:18,  2.48s/it][A
Training...:  44% 6168/13907 [3:44:35<5:14:59,  2.44s/it][A
Training...:  44% 6169/13907 [3:44:38<5:10:54,  2.41s/it][A
Training...:  44% 6170/13907 [3:44:40<5:05:33,  2.37s/it][A
Training...:  44% 6171/13907 [3:44:42<5:01:45,  2.34s/it][A
Training...:  44% 6172/13907 [3:44:44<4:55:38,  2.29s/it][A
Training...:  44% 6173/13907 [3:44:46<4:50:35,  2.25s/it][A
Training...:  44% 6174/13907 [3:44:49<4:45:00,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:45:03<?, ?it/s]
Training...:  44% 6174/13907 [3:44:51<4:45:00,  2.21s/it][A
Training...:  44% 6175/13907 [3:44:51<4:53:05,  2.27s/it][A
Training...:  44% 6176/13907 [3:44:53<4:49:03,  2.24s/it][A
Training...:  44% 6177/13907 [3:44:55<4:43:41,  2.20s/it][A
Training...:  44% 6178/13907 [3:44:57<4:38:55,  2.17s/it][A
Training...:  44% 6179/13907 [3:44:59<4:32:14,  2.11s/it][A
Training...:  44% 6180/13907 [3:45:01<4:27:32,  2.08s/it][A
Training...:  44% 6181/13907 [3:45:03<4:23:04,  2.04s/it][A
Training...:  44% 6182/13907 [3:45:05<4:19:03,  2.01s/it][A
Training...:  44% 6183/13907 [3:45:07<4:13:28,  1.97s/it][A
Training...:  44% 6184/13907 [3:45:09<4:10:08,  1.94s/it][A
Training...:  44% 6185/13907 [3:45:11<4:04:47,  1.90s/it][A
Training...:  44% 6186/13907 [3:45:13<3:59:25,  1.86s/it][A
Training...:  44% 6187/13907 [3:45:14<3:55:35,  1.83s/it][A
Training...:  44% 6188/13907 [3:45:16<3:50:55,  1.79s/it][A
Training...:  45% 6189/13907 [3:45:18<3:47:50,  1.77s/it][A
Training...:  45% 6190/13907 [3:45:19<3:43:26,  1.74s/it][A
Training...:  45% 6191/13907 [3:45:21<3:38:34,  1.70s/it][A
Training...:  45% 6192/13907 [3:45:23<3:35:38,  1.68s/it][A
Training...:  45% 6193/13907 [3:45:24<3:29:50,  1.63s/it][A
Training...:  45% 6194/13907 [3:45:26<3:24:30,  1.59s/it][A
Training...:  45% 6195/13907 [3:45:27<3:18:07,  1.54s/it][A
Training...:  45% 6196/13907 [3:45:28<3:12:05,  1.49s/it][A
Training...:  45% 6197/13907 [3:45:30<3:04:44,  1.44s/it][A
Training...:  45% 6198/13907 [3:45:31<2:56:45,  1.38s/it][A
Training...:  45% 6199/13907 [3:45:32<2:48:40,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:45:46<?, ?it/s]
Training...:  45% 6199/13907 [3:45:33<2:48:40,  1.31s/it][A
Training...:  45% 6200/13907 [3:45:33<2:44:19,  1.28s/it][A
Training...:  45% 6201/13907 [3:45:37<4:19:13,  2.02s/it][A
Training...:  45% 6202/13907 [3:45:41<5:12:35,  2.43s/it][A
Training...:  45% 6203/13907 [3:45:44<5:40:27,  2.65s/it][A
Training...:  45% 6204/13907 [3:45:47<5:55:07,  2.77s/it][A
Training...:  45% 6205/13907 [3:45:50<6:03:16,  2.83s/it][A
Training...:  45% 6206/13907 [3:45:53<6:05:50,  2.85s/it][A
Training...:  45% 6207/13907 [3:45:55<6:05:05,  2.84s/it][A
Training...:  45% 6208/13907 [3:45:58<6:00:52,  2.81s/it][A
Training...:  45% 6209/13907 [3:46:01<5:56:58,  2.78s/it][A
Training...:  45% 6210/13907 [3:46:03<5:51:23,  2.74s/it][A
Training...:  45% 6211/13907 [3:46:06<5:47:53,  2.71s/it][A
Training...:  45% 6212/13907 [3:46:09<5:41:04,  2.66s/it][A
Training...:  45% 6213/13907 [3:46:11<5:35:33,  2.62s/it][A
Training...:  45% 6214/13907 [3:46:14<5:30:05,  2.57s/it][A
Training...:  45% 6215/13907 [3:46:16<5:24:03,  2.53s/it][A
Training...:  45% 6216/13907 [3:46:18<5:18:11,  2.48s/it][A
Training...:  45% 6217/13907 [3:46:21<5:13:11,  2.44s/it][A
Training...:  45% 6218/13907 [3:46:23<5:08:26,  2.41s/it][A
Training...:  45% 6219/13907 [3:46:25<5:05:38,  2.39s/it][A
Training...:  45% 6220/13907 [3:46:28<5:02:48,  2.36s/it][A
Training...:  45% 6221/13907 [3:46:30<4:59:54,  2.34s/it][A
Training...:  45% 6222/13907 [3:46:32<4:53:48,  2.29s/it][A
Training...:  45% 6223/13907 [3:46:34<4:48:56,  2.26s/it][A
Training...:  45% 6224/13907 [3:46:37<4:44:01,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:46:51<?, ?it/s]
Training...:  45% 6224/13907 [3:46:39<4:44:01,  2.22s/it][A
Training...:  45% 6225/13907 [3:46:39<4:51:34,  2.28s/it][A
Training...:  45% 6226/13907 [3:46:41<4:46:01,  2.23s/it][A
Training...:  45% 6227/13907 [3:46:43<4:40:06,  2.19s/it][A
Training...:  45% 6228/13907 [3:46:45<4:34:59,  2.15s/it][A
Training...:  45% 6229/13907 [3:46:47<4:28:40,  2.10s/it][A
Training...:  45% 6230/13907 [3:46:49<4:22:51,  2.05s/it][A
Training...:  45% 6231/13907 [3:46:51<4:17:43,  2.01s/it][A
Training...:  45% 6232/13907 [3:46:53<4:13:27,  1.98s/it][A
Training...:  45% 6233/13907 [3:46:55<4:08:42,  1.94s/it][A
Training...:  45% 6234/13907 [3:46:57<4:05:22,  1.92s/it][A
Training...:  45% 6235/13907 [3:46:59<4:01:08,  1.89s/it][A
Training...:  45% 6236/13907 [3:47:00<3:57:11,  1.86s/it][A
Training...:  45% 6237/13907 [3:47:02<3:54:59,  1.84s/it][A
Training...:  45% 6238/13907 [3:47:04<3:50:24,  1.80s/it][A
Training...:  45% 6239/13907 [3:47:05<3:44:47,  1.76s/it][A
Training...:  45% 6240/13907 [3:47:07<3:40:53,  1.73s/it][A
Training...:  45% 6241/13907 [3:47:09<3:36:18,  1.69s/it][A
Training...:  45% 6242/13907 [3:47:10<3:31:51,  1.66s/it][A
Training...:  45% 6243/13907 [3:47:12<3:27:06,  1.62s/it][A
Training...:  45% 6244/13907 [3:47:13<3:23:32,  1.59s/it][A
Training...:  45% 6245/13907 [3:47:15<3:17:07,  1.54s/it][A
Training...:  45% 6246/13907 [3:47:16<3:11:06,  1.50s/it][A
Training...:  45% 6247/13907 [3:47:18<3:05:14,  1.45s/it][A
Training...:  45% 6248/13907 [3:47:19<2:59:20,  1.40s/it][A
Training...:  45% 6249/13907 [3:47:20<2:50:07,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:47:34<?, ?it/s]
Training...:  45% 6249/13907 [3:47:21<2:50:07,  1.33s/it][A
Training...:  45% 6250/13907 [3:47:21<2:44:39,  1.29s/it][A
Training...:  45% 6251/13907 [3:47:25<4:15:31,  2.00s/it][A
Training...:  45% 6252/13907 [3:47:28<5:09:33,  2.43s/it][A
Training...:  45% 6253/13907 [3:47:31<5:37:27,  2.65s/it][A
Training...:  45% 6254/13907 [3:47:34<5:52:11,  2.76s/it][A
Training...:  45% 6255/13907 [3:47:37<6:01:20,  2.83s/it][A
Training...:  45% 6256/13907 [3:47:40<6:02:07,  2.84s/it][A
Training...:  45% 6257/13907 [3:47:43<6:00:40,  2.83s/it][A
Training...:  45% 6258/13907 [3:47:46<5:56:26,  2.80s/it][A
Training...:  45% 6259/13907 [3:47:49<5:51:41,  2.76s/it][A
Training...:  45% 6260/13907 [3:47:51<5:45:43,  2.71s/it][A
Training...:  45% 6261/13907 [3:47:54<5:41:24,  2.68s/it][A
Training...:  45% 6262/13907 [3:47:56<5:36:24,  2.64s/it][A
Training...:  45% 6263/13907 [3:47:59<5:33:26,  2.62s/it][A
Training...:  45% 6264/13907 [3:48:01<5:29:47,  2.59s/it][A
Training...:  45% 6265/13907 [3:48:04<5:22:33,  2.53s/it][A
Training...:  45% 6266/13907 [3:48:06<5:16:16,  2.48s/it][A
Training...:  45% 6267/13907 [3:48:08<5:11:07,  2.44s/it][A
Training...:  45% 6268/13907 [3:48:11<5:06:02,  2.40s/it][A
Training...:  45% 6269/13907 [3:48:13<5:01:44,  2.37s/it][A
Training...:  45% 6270/13907 [3:48:15<4:56:10,  2.33s/it][A
Training...:  45% 6271/13907 [3:48:18<4:52:45,  2.30s/it][A
Training...:  45% 6272/13907 [3:48:20<4:48:39,  2.27s/it][A
Training...:  45% 6273/13907 [3:48:22<4:44:53,  2.24s/it][A
Training...:  45% 6274/13907 [3:48:24<4:39:44,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:48:39<?, ?it/s]
Training...:  45% 6274/13907 [3:48:26<4:39:44,  2.20s/it][A
Training...:  45% 6275/13907 [3:48:26<4:47:42,  2.26s/it][A
Training...:  45% 6276/13907 [3:48:29<4:43:01,  2.23s/it][A
Training...:  45% 6277/13907 [3:48:31<4:36:39,  2.18s/it][A
Training...:  45% 6278/13907 [3:48:33<4:30:33,  2.13s/it][A
Training...:  45% 6279/13907 [3:48:35<4:25:01,  2.08s/it][A
Training...:  45% 6280/13907 [3:48:37<4:19:51,  2.04s/it][A
Training...:  45% 6281/13907 [3:48:39<4:15:06,  2.01s/it][A
Training...:  45% 6282/13907 [3:48:40<4:10:25,  1.97s/it][A
Training...:  45% 6283/13907 [3:48:42<4:06:25,  1.94s/it][A
Training...:  45% 6284/13907 [3:48:44<4:03:03,  1.91s/it][A
Training...:  45% 6285/13907 [3:48:46<3:58:59,  1.88s/it][A
Training...:  45% 6286/13907 [3:48:48<3:55:23,  1.85s/it][A
Training...:  45% 6287/13907 [3:48:49<3:51:40,  1.82s/it][A
Training...:  45% 6288/13907 [3:48:51<3:47:59,  1.80s/it][A
Training...:  45% 6289/13907 [3:48:53<3:44:30,  1.77s/it][A
Training...:  45% 6290/13907 [3:48:55<3:41:00,  1.74s/it][A
Training...:  45% 6291/13907 [3:48:56<3:36:34,  1.71s/it][A
Training...:  45% 6292/13907 [3:48:58<3:31:07,  1.66s/it][A
Training...:  45% 6293/13907 [3:48:59<3:26:22,  1.63s/it][A
Training...:  45% 6294/13907 [3:49:01<3:22:37,  1.60s/it][A
Training...:  45% 6295/13907 [3:49:02<3:16:29,  1.55s/it][A
Training...:  45% 6296/13907 [3:49:04<3:11:06,  1.51s/it][A
Training...:  45% 6297/13907 [3:49:05<3:04:53,  1.46s/it][A
Training...:  45% 6298/13907 [3:49:06<2:57:45,  1.40s/it][A
Training...:  45% 6299/13907 [3:49:07<2:49:46,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:49:21<?, ?it/s]
Training...:  45% 6299/13907 [3:49:09<2:49:46,  1.34s/it][A
Training...:  45% 6300/13907 [3:49:09<2:44:30,  1.30s/it][A
Training...:  45% 6301/13907 [3:49:12<4:18:05,  2.04s/it][A
Training...:  45% 6302/13907 [3:49:16<5:08:02,  2.43s/it][A
Training...:  45% 6303/13907 [3:49:19<5:37:21,  2.66s/it][A
Training...:  45% 6304/13907 [3:49:22<5:55:10,  2.80s/it][A
Training...:  45% 6305/13907 [3:49:25<6:07:22,  2.90s/it][A
Training...:  45% 6306/13907 [3:49:28<6:07:42,  2.90s/it][A
Training...:  45% 6307/13907 [3:49:31<6:05:05,  2.88s/it][A
Training...:  45% 6308/13907 [3:49:34<5:59:15,  2.84s/it][A
Training...:  45% 6309/13907 [3:49:36<5:53:11,  2.79s/it][A
Training...:  45% 6310/13907 [3:49:39<5:46:23,  2.74s/it][A
Training...:  45% 6311/13907 [3:49:42<5:39:52,  2.68s/it][A
Training...:  45% 6312/13907 [3:49:44<5:33:38,  2.64s/it][A
Training...:  45% 6313/13907 [3:49:47<5:27:07,  2.58s/it][A
Training...:  45% 6314/13907 [3:49:49<5:22:13,  2.55s/it][A
Training...:  45% 6315/13907 [3:49:51<5:17:52,  2.51s/it][A
Training...:  45% 6316/13907 [3:49:54<5:13:03,  2.47s/it][A
Training...:  45% 6317/13907 [3:49:56<5:08:33,  2.44s/it][A
Training...:  45% 6318/13907 [3:49:59<5:04:01,  2.40s/it][A
Training...:  45% 6319/13907 [3:50:01<4:59:11,  2.37s/it][A
Training...:  45% 6320/13907 [3:50:03<4:53:50,  2.32s/it][A
Training...:  45% 6321/13907 [3:50:05<4:49:47,  2.29s/it][A
Training...:  45% 6322/13907 [3:50:07<4:45:59,  2.26s/it][A
Training...:  45% 6323/13907 [3:50:10<4:41:55,  2.23s/it][A
Training...:  45% 6324/13907 [3:50:12<4:38:32,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:50:26<?, ?it/s]
Training...:  45% 6324/13907 [3:50:14<4:38:32,  2.20s/it][A
Training...:  45% 6325/13907 [3:50:14<4:46:53,  2.27s/it][A
Training...:  45% 6326/13907 [3:50:16<4:41:07,  2.22s/it][A
Training...:  45% 6327/13907 [3:50:18<4:34:03,  2.17s/it][A
Training...:  46% 6328/13907 [3:50:20<4:28:28,  2.13s/it][A
Training...:  46% 6329/13907 [3:50:22<4:23:28,  2.09s/it][A
Training...:  46% 6330/13907 [3:50:24<4:18:27,  2.05s/it][A
Training...:  46% 6331/13907 [3:50:26<4:14:38,  2.02s/it][A
Training...:  46% 6332/13907 [3:50:28<4:10:38,  1.99s/it][A
Training...:  46% 6333/13907 [3:50:30<4:06:42,  1.95s/it][A
Training...:  46% 6334/13907 [3:50:32<4:03:06,  1.93s/it][A
Training...:  46% 6335/13907 [3:50:34<4:01:13,  1.91s/it][A
Training...:  46% 6336/13907 [3:50:36<3:58:08,  1.89s/it][A
Training...:  46% 6337/13907 [3:50:37<3:53:31,  1.85s/it][A
Training...:  46% 6338/13907 [3:50:39<3:48:29,  1.81s/it][A
Training...:  46% 6339/13907 [3:50:41<3:43:36,  1.77s/it][A
Training...:  46% 6340/13907 [3:50:42<3:40:26,  1.75s/it][A
Training...:  46% 6341/13907 [3:50:44<3:36:13,  1.71s/it][A
Training...:  46% 6342/13907 [3:50:46<3:31:30,  1.68s/it][A
Training...:  46% 6343/13907 [3:50:47<3:26:26,  1.64s/it][A
Training...:  46% 6344/13907 [3:50:49<3:21:41,  1.60s/it][A
Training...:  46% 6345/13907 [3:50:50<3:16:16,  1.56s/it][A
Training...:  46% 6346/13907 [3:50:52<3:10:46,  1.51s/it][A
Training...:  46% 6347/13907 [3:50:53<3:04:27,  1.46s/it][A
Training...:  46% 6348/13907 [3:50:54<2:57:26,  1.41s/it][A
Training...:  46% 6349/13907 [3:50:55<2:48:41,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:51:09<?, ?it/s]
Training...:  46% 6349/13907 [3:50:57<2:48:41,  1.34s/it][A
Training...:  46% 6350/13907 [3:50:57<2:43:52,  1.30s/it][A
Training...:  46% 6351/13907 [3:51:00<4:20:44,  2.07s/it][A
Training...:  46% 6352/13907 [3:51:04<5:11:03,  2.47s/it][A
Training...:  46% 6353/13907 [3:51:07<5:38:58,  2.69s/it][A
Training...:  46% 6354/13907 [3:51:10<5:53:41,  2.81s/it][A
Training...:  46% 6355/13907 [3:51:13<6:00:25,  2.86s/it][A
Training...:  46% 6356/13907 [3:51:16<6:02:09,  2.88s/it][A
Training...:  46% 6357/13907 [3:51:19<6:01:04,  2.87s/it][A
Training...:  46% 6358/13907 [3:51:22<5:56:06,  2.83s/it][A
Training...:  46% 6359/13907 [3:51:24<5:51:17,  2.79s/it][A
Training...:  46% 6360/13907 [3:51:27<5:44:56,  2.74s/it][A
Training...:  46% 6361/13907 [3:51:30<5:40:22,  2.71s/it][A
Training...:  46% 6362/13907 [3:51:32<5:34:23,  2.66s/it][A
Training...:  46% 6363/13907 [3:51:35<5:29:15,  2.62s/it][A
Training...:  46% 6364/13907 [3:51:37<5:24:06,  2.58s/it][A
Training...:  46% 6365/13907 [3:51:40<5:19:19,  2.54s/it][A
Training...:  46% 6366/13907 [3:51:42<5:14:18,  2.50s/it][A
Training...:  46% 6367/13907 [3:51:44<5:09:43,  2.46s/it][A
Training...:  46% 6368/13907 [3:51:47<5:04:38,  2.42s/it][A
Training...:  46% 6369/13907 [3:51:49<5:00:46,  2.39s/it][A
Training...:  46% 6370/13907 [3:51:51<4:56:06,  2.36s/it][A
Training...:  46% 6371/13907 [3:51:54<4:51:32,  2.32s/it][A
Training...:  46% 6372/13907 [3:51:56<4:47:10,  2.29s/it][A
Training...:  46% 6373/13907 [3:51:58<4:42:54,  2.25s/it][A
Training...:  46% 6374/13907 [3:52:00<4:39:09,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:52:15<?, ?it/s]
Training...:  46% 6374/13907 [3:52:03<4:39:09,  2.22s/it][A
Training...:  46% 6375/13907 [3:52:03<4:46:05,  2.28s/it][A
Training...:  46% 6376/13907 [3:52:05<4:41:45,  2.24s/it][A
Training...:  46% 6377/13907 [3:52:07<4:34:49,  2.19s/it][A
Training...:  46% 6378/13907 [3:52:09<4:28:56,  2.14s/it][A
Training...:  46% 6379/13907 [3:52:11<4:23:54,  2.10s/it][A
Training...:  46% 6380/13907 [3:52:13<4:18:32,  2.06s/it][A
Training...:  46% 6381/13907 [3:52:15<4:14:50,  2.03s/it][A
Training...:  46% 6382/13907 [3:52:17<4:10:55,  2.00s/it][A
Training...:  46% 6383/13907 [3:52:19<4:06:23,  1.96s/it][A
Training...:  46% 6384/13907 [3:52:20<4:02:49,  1.94s/it][A
Training...:  46% 6385/13907 [3:52:22<4:01:15,  1.92s/it][A
Training...:  46% 6386/13907 [3:52:24<3:57:57,  1.90s/it][A
Training...:  46% 6387/13907 [3:52:26<3:53:00,  1.86s/it][A
Training...:  46% 6388/13907 [3:52:28<3:47:35,  1.82s/it][A
Training...:  46% 6389/13907 [3:52:29<3:43:04,  1.78s/it][A
Training...:  46% 6390/13907 [3:52:31<3:39:11,  1.75s/it][A
Training...:  46% 6391/13907 [3:52:33<3:35:03,  1.72s/it][A
Training...:  46% 6392/13907 [3:52:34<3:30:21,  1.68s/it][A
Training...:  46% 6393/13907 [3:52:36<3:26:09,  1.65s/it][A
Training...:  46% 6394/13907 [3:52:37<3:21:33,  1.61s/it][A
Training...:  46% 6395/13907 [3:52:39<3:15:12,  1.56s/it][A
Training...:  46% 6396/13907 [3:52:40<3:07:46,  1.50s/it][A
Training...:  46% 6397/13907 [3:52:41<3:00:43,  1.44s/it][A
Training...:  46% 6398/13907 [3:52:43<2:53:41,  1.39s/it][A
Training...:  46% 6399/13907 [3:52:44<2:46:11,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:52:57<?, ?it/s]
Training...:  46% 6399/13907 [3:52:45<2:46:11,  1.33s/it][A
Training...:  46% 6400/13907 [3:52:45<2:41:33,  1.29s/it][A
Training...:  46% 6401/13907 [3:52:49<4:13:55,  2.03s/it][A
Training...:  46% 6402/13907 [3:52:52<5:05:06,  2.44s/it][A
Training...:  46% 6403/13907 [3:52:55<5:30:42,  2.64s/it][A
Training...:  46% 6404/13907 [3:52:58<5:45:23,  2.76s/it][A
Training...:  46% 6405/13907 [3:53:01<5:51:37,  2.81s/it][A
Training...:  46% 6406/13907 [3:53:04<5:52:07,  2.82s/it][A
Training...:  46% 6407/13907 [3:53:07<5:50:49,  2.81s/it][A
Training...:  46% 6408/13907 [3:53:10<5:46:47,  2.77s/it][A
Training...:  46% 6409/13907 [3:53:12<5:42:44,  2.74s/it][A
Training...:  46% 6410/13907 [3:53:15<5:38:50,  2.71s/it][A
Training...:  46% 6411/13907 [3:53:18<5:34:13,  2.68s/it][A
Training...:  46% 6412/13907 [3:53:20<5:30:48,  2.65s/it][A
Training...:  46% 6413/13907 [3:53:23<5:26:00,  2.61s/it][A
Training...:  46% 6414/13907 [3:53:25<5:21:49,  2.58s/it][A
Training...:  46% 6415/13907 [3:53:28<5:16:19,  2.53s/it][A
Training...:  46% 6416/13907 [3:53:30<5:10:30,  2.49s/it][A
Training...:  46% 6417/13907 [3:53:32<5:06:14,  2.45s/it][A
Training...:  46% 6418/13907 [3:53:35<5:01:10,  2.41s/it][A
Training...:  46% 6419/13907 [3:53:37<4:56:41,  2.38s/it][A
Training...:  46% 6420/13907 [3:53:39<4:52:36,  2.34s/it][A
Training...:  46% 6421/13907 [3:53:42<4:50:57,  2.33s/it][A
Training...:  46% 6422/13907 [3:53:44<4:46:57,  2.30s/it][A
Training...:  46% 6423/13907 [3:53:46<4:41:09,  2.25s/it][A
Training...:  46% 6424/13907 [3:53:48<4:35:58,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:54:03<?, ?it/s]
Training...:  46% 6424/13907 [3:53:50<4:35:58,  2.21s/it][A
Training...:  46% 6425/13907 [3:53:50<4:43:54,  2.28s/it][A
Training...:  46% 6426/13907 [3:53:53<4:38:34,  2.23s/it][A
Training...:  46% 6427/13907 [3:53:55<4:31:45,  2.18s/it][A
Training...:  46% 6428/13907 [3:53:57<4:25:44,  2.13s/it][A
Training...:  46% 6429/13907 [3:53:59<4:20:30,  2.09s/it][A
Training...:  46% 6430/13907 [3:54:01<4:16:14,  2.06s/it][A
Training...:  46% 6431/13907 [3:54:03<4:11:04,  2.01s/it][A
Training...:  46% 6432/13907 [3:54:04<4:05:59,  1.97s/it][A
Training...:  46% 6433/13907 [3:54:06<4:01:19,  1.94s/it][A
Training...:  46% 6434/13907 [3:54:08<3:57:46,  1.91s/it][A
Training...:  46% 6435/13907 [3:54:10<3:53:44,  1.88s/it][A
Training...:  46% 6436/13907 [3:54:12<3:48:58,  1.84s/it][A
Training...:  46% 6437/13907 [3:54:13<3:45:05,  1.81s/it][A
Training...:  46% 6438/13907 [3:54:15<3:40:54,  1.77s/it][A
Training...:  46% 6439/13907 [3:54:17<3:36:57,  1.74s/it][A
Training...:  46% 6440/13907 [3:54:18<3:32:30,  1.71s/it][A
Training...:  46% 6441/13907 [3:54:20<3:28:51,  1.68s/it][A
Training...:  46% 6442/13907 [3:54:22<3:24:09,  1.64s/it][A
Training...:  46% 6443/13907 [3:54:23<3:19:19,  1.60s/it][A
Training...:  46% 6444/13907 [3:54:25<3:14:13,  1.56s/it][A
Training...:  46% 6445/13907 [3:54:26<3:08:22,  1.51s/it][A
Training...:  46% 6446/13907 [3:54:27<3:02:39,  1.47s/it][A
Training...:  46% 6447/13907 [3:54:29<2:56:34,  1.42s/it][A
Training...:  46% 6448/13907 [3:54:30<2:49:47,  1.37s/it][A
Training...:  46% 6449/13907 [3:54:31<2:42:17,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:54:45<?, ?it/s]
Training...:  46% 6449/13907 [3:54:32<2:42:17,  1.31s/it][A
Training...:  46% 6450/13907 [3:54:32<2:38:54,  1.28s/it][A
Training...:  46% 6451/13907 [3:54:36<4:10:44,  2.02s/it][A
Training...:  46% 6452/13907 [3:54:39<5:01:22,  2.43s/it][A
Training...:  46% 6453/13907 [3:54:42<5:27:41,  2.64s/it][A
Training...:  46% 6454/13907 [3:54:46<5:43:18,  2.76s/it][A
Training...:  46% 6455/13907 [3:54:48<5:50:46,  2.82s/it][A
Training...:  46% 6456/13907 [3:54:51<5:51:59,  2.83s/it][A
Training...:  46% 6457/13907 [3:54:54<5:50:32,  2.82s/it][A
Training...:  46% 6458/13907 [3:54:57<5:47:00,  2.80s/it][A
Training...:  46% 6459/13907 [3:55:00<5:43:47,  2.77s/it][A
Training...:  46% 6460/13907 [3:55:02<5:42:22,  2.76s/it][A
Training...:  46% 6461/13907 [3:55:05<5:39:46,  2.74s/it][A
Training...:  46% 6462/13907 [3:55:08<5:32:08,  2.68s/it][A
Training...:  46% 6463/13907 [3:55:10<5:26:36,  2.63s/it][A
Training...:  46% 6464/13907 [3:55:13<5:21:18,  2.59s/it][A
Training...:  46% 6465/13907 [3:55:15<5:16:22,  2.55s/it][A
Training...:  46% 6466/13907 [3:55:17<5:11:11,  2.51s/it][A
Training...:  47% 6467/13907 [3:55:20<5:06:10,  2.47s/it][A
Training...:  47% 6468/13907 [3:55:22<5:01:57,  2.44s/it][A
Training...:  47% 6469/13907 [3:55:24<4:57:19,  2.40s/it][A
Training...:  47% 6470/13907 [3:55:27<4:52:25,  2.36s/it][A
Training...:  47% 6471/13907 [3:55:29<4:48:11,  2.33s/it][A
Training...:  47% 6472/13907 [3:55:31<4:43:51,  2.29s/it][A
Training...:  47% 6473/13907 [3:55:33<4:40:00,  2.26s/it][A
Training...:  47% 6474/13907 [3:55:36<4:35:43,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:55:50<?, ?it/s]
Training...:  47% 6474/13907 [3:55:38<4:35:43,  2.23s/it][A
Training...:  47% 6475/13907 [3:55:38<4:42:48,  2.28s/it][A
Training...:  47% 6476/13907 [3:55:40<4:37:29,  2.24s/it][A
Training...:  47% 6477/13907 [3:55:42<4:30:56,  2.19s/it][A
Training...:  47% 6478/13907 [3:55:44<4:25:44,  2.15s/it][A
Training...:  47% 6479/13907 [3:55:46<4:20:42,  2.11s/it][A
Training...:  47% 6480/13907 [3:55:48<4:15:17,  2.06s/it][A
Training...:  47% 6481/13907 [3:55:50<4:11:36,  2.03s/it][A
Training...:  47% 6482/13907 [3:55:52<4:08:07,  2.01s/it][A
Training...:  47% 6483/13907 [3:55:54<4:04:34,  1.98s/it][A
Training...:  47% 6484/13907 [3:55:56<4:00:50,  1.95s/it][A
Training...:  47% 6485/13907 [3:55:58<3:57:19,  1.92s/it][A
Training...:  47% 6486/13907 [3:56:00<3:52:47,  1.88s/it][A
Training...:  47% 6487/13907 [3:56:01<3:50:04,  1.86s/it][A
Training...:  47% 6488/13907 [3:56:03<3:46:34,  1.83s/it][A
Training...:  47% 6489/13907 [3:56:05<3:42:26,  1.80s/it][A
Training...:  47% 6490/13907 [3:56:06<3:37:29,  1.76s/it][A
Training...:  47% 6491/13907 [3:56:08<3:33:02,  1.72s/it][A
Training...:  47% 6492/13907 [3:56:10<3:28:50,  1.69s/it][A
Training...:  47% 6493/13907 [3:56:11<3:24:01,  1.65s/it][A
Training...:  47% 6494/13907 [3:56:13<3:19:18,  1.61s/it][A
Training...:  47% 6495/13907 [3:56:14<3:13:09,  1.56s/it][A
Training...:  47% 6496/13907 [3:56:16<3:06:46,  1.51s/it][A
Training...:  47% 6497/13907 [3:56:17<3:00:12,  1.46s/it][A
Training...:  47% 6498/13907 [3:56:18<2:53:25,  1.40s/it][A
Training...:  47% 6499/13907 [3:56:20<2:46:28,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:56:33<?, ?it/s]
Training...:  47% 6499/13907 [3:56:21<2:46:28,  1.35s/it][A
Training...:  47% 6500/13907 [3:56:21<2:42:04,  1.31s/it][A
Training...:  47% 6501/13907 [3:56:25<4:15:45,  2.07s/it][A
Training...:  47% 6502/13907 [3:56:28<5:02:29,  2.45s/it][A
Training...:  47% 6503/13907 [3:56:31<5:28:17,  2.66s/it][A
Training...:  47% 6504/13907 [3:56:34<5:41:46,  2.77s/it][A
Training...:  47% 6505/13907 [3:56:37<5:48:03,  2.82s/it][A
Training...:  47% 6506/13907 [3:56:40<5:48:33,  2.83s/it][A
Training...:  47% 6507/13907 [3:56:43<5:45:53,  2.80s/it][A
Training...:  47% 6508/13907 [3:56:45<5:40:55,  2.76s/it][A
Training...:  47% 6509/13907 [3:56:48<5:36:41,  2.73s/it][A
Training...:  47% 6510/13907 [3:56:51<5:30:38,  2.68s/it][A
Training...:  47% 6511/13907 [3:56:53<5:25:19,  2.64s/it][A
Training...:  47% 6512/13907 [3:56:56<5:19:10,  2.59s/it][A
Training...:  47% 6513/13907 [3:56:58<5:14:43,  2.55s/it][A
Training...:  47% 6514/13907 [3:57:00<5:09:14,  2.51s/it][A
Training...:  47% 6515/13907 [3:57:03<5:04:50,  2.47s/it][A
Training...:  47% 6516/13907 [3:57:05<5:00:23,  2.44s/it][A
Training...:  47% 6517/13907 [3:57:07<4:55:52,  2.40s/it][A
Training...:  47% 6518/13907 [3:57:10<4:52:53,  2.38s/it][A
Training...:  47% 6519/13907 [3:57:12<4:50:05,  2.36s/it][A
Training...:  47% 6520/13907 [3:57:14<4:46:18,  2.33s/it][A
Training...:  47% 6521/13907 [3:57:17<4:41:46,  2.29s/it][A
Training...:  47% 6522/13907 [3:57:19<4:36:51,  2.25s/it][A
Training...:  47% 6523/13907 [3:57:21<4:34:40,  2.23s/it][A
Training...:  47% 6524/13907 [3:57:23<4:30:44,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:57:38<?, ?it/s]
Training...:  47% 6524/13907 [3:57:25<4:30:44,  2.20s/it][A
Training...:  47% 6525/13907 [3:57:25<4:37:47,  2.26s/it][A
Training...:  47% 6526/13907 [3:57:28<4:32:14,  2.21s/it][A
Training...:  47% 6527/13907 [3:57:30<4:25:41,  2.16s/it][A
Training...:  47% 6528/13907 [3:57:32<4:19:38,  2.11s/it][A
Training...:  47% 6529/13907 [3:57:34<4:15:15,  2.08s/it][A
Training...:  47% 6530/13907 [3:57:36<4:10:39,  2.04s/it][A
Training...:  47% 6531/13907 [3:57:37<4:07:26,  2.01s/it][A
Training...:  47% 6532/13907 [3:57:39<4:04:12,  1.99s/it][A
Training...:  47% 6533/13907 [3:57:41<3:59:32,  1.95s/it][A
Training...:  47% 6534/13907 [3:57:43<3:54:42,  1.91s/it][A
Training...:  47% 6535/13907 [3:57:45<3:50:35,  1.88s/it][A
Training...:  47% 6536/13907 [3:57:47<3:46:08,  1.84s/it][A
Training...:  47% 6537/13907 [3:57:48<3:42:14,  1.81s/it][A
Training...:  47% 6538/13907 [3:57:50<3:37:25,  1.77s/it][A
Training...:  47% 6539/13907 [3:57:52<3:33:42,  1.74s/it][A
Training...:  47% 6540/13907 [3:57:53<3:29:48,  1.71s/it][A
Training...:  47% 6541/13907 [3:57:55<3:24:56,  1.67s/it][A
Training...:  47% 6542/13907 [3:57:56<3:20:37,  1.63s/it][A
Training...:  47% 6543/13907 [3:57:58<3:16:48,  1.60s/it][A
Training...:  47% 6544/13907 [3:58:00<3:13:06,  1.57s/it][A
Training...:  47% 6545/13907 [3:58:01<3:08:06,  1.53s/it][A
Training...:  47% 6546/13907 [3:58:02<3:02:16,  1.49s/it][A
Training...:  47% 6547/13907 [3:58:04<2:55:37,  1.43s/it][A
Training...:  47% 6548/13907 [3:58:05<2:48:52,  1.38s/it][A
Training...:  47% 6549/13907 [3:58:06<2:41:31,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:58:20<?, ?it/s]
Training...:  47% 6549/13907 [3:58:07<2:41:31,  1.32s/it][A
Training...:  47% 6550/13907 [3:58:07<2:38:52,  1.30s/it][A
Training...:  47% 6551/13907 [3:58:11<4:07:57,  2.02s/it][A
Training...:  47% 6552/13907 [3:58:14<4:56:53,  2.42s/it][A
Training...:  47% 6553/13907 [3:58:18<5:25:23,  2.65s/it][A
Training...:  47% 6554/13907 [3:58:21<5:39:21,  2.77s/it][A
Training...:  47% 6555/13907 [3:58:24<5:47:56,  2.84s/it][A
Training...:  47% 6556/13907 [3:58:26<5:47:39,  2.84s/it][A
Training...:  47% 6557/13907 [3:58:29<5:46:33,  2.83s/it][A
Training...:  47% 6558/13907 [3:58:32<5:43:42,  2.81s/it][A
Training...:  47% 6559/13907 [3:58:35<5:41:38,  2.79s/it][A
Training...:  47% 6560/13907 [3:58:37<5:35:36,  2.74s/it][A
Training...:  47% 6561/13907 [3:58:40<5:30:28,  2.70s/it][A
Training...:  47% 6562/13907 [3:58:43<5:24:25,  2.65s/it][A
Training...:  47% 6563/13907 [3:58:45<5:19:30,  2.61s/it][A
Training...:  47% 6564/13907 [3:58:47<5:13:56,  2.57s/it][A
Training...:  47% 6565/13907 [3:58:50<5:09:10,  2.53s/it][A
Training...:  47% 6566/13907 [3:58:52<5:05:24,  2.50s/it][A
Training...:  47% 6567/13907 [3:58:55<5:04:09,  2.49s/it][A
Training...:  47% 6568/13907 [3:58:57<4:59:57,  2.45s/it][A
Training...:  47% 6569/13907 [3:59:00<4:55:43,  2.42s/it][A
Training...:  47% 6570/13907 [3:59:02<4:50:25,  2.38s/it][A
Training...:  47% 6571/13907 [3:59:04<4:45:56,  2.34s/it][A
Training...:  47% 6572/13907 [3:59:06<4:41:13,  2.30s/it][A
Training...:  47% 6573/13907 [3:59:08<4:36:53,  2.27s/it][A
Training...:  47% 6574/13907 [3:59:11<4:32:50,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [3:59:25<?, ?it/s]
Training...:  47% 6574/13907 [3:59:13<4:32:50,  2.23s/it][A
Training...:  47% 6575/13907 [3:59:13<4:39:31,  2.29s/it][A
Training...:  47% 6576/13907 [3:59:15<4:34:51,  2.25s/it][A
Training...:  47% 6577/13907 [3:59:17<4:29:08,  2.20s/it][A
Training...:  47% 6578/13907 [3:59:19<4:23:52,  2.16s/it][A
Training...:  47% 6579/13907 [3:59:21<4:18:34,  2.12s/it][A
Training...:  47% 6580/13907 [3:59:23<4:13:43,  2.08s/it][A
Training...:  47% 6581/13907 [3:59:25<4:09:03,  2.04s/it][A
Training...:  47% 6582/13907 [3:59:27<4:04:00,  2.00s/it][A
Training...:  47% 6583/13907 [3:59:29<3:59:27,  1.96s/it][A
Training...:  47% 6584/13907 [3:59:31<3:55:41,  1.93s/it][A
Training...:  47% 6585/13907 [3:59:33<3:51:16,  1.90s/it][A
Training...:  47% 6586/13907 [3:59:35<3:47:18,  1.86s/it][A
Training...:  47% 6587/13907 [3:59:36<3:44:16,  1.84s/it][A
Training...:  47% 6588/13907 [3:59:38<3:40:32,  1.81s/it][A
Training...:  47% 6589/13907 [3:59:40<3:36:25,  1.77s/it][A
Training...:  47% 6590/13907 [3:59:41<3:32:13,  1.74s/it][A
Training...:  47% 6591/13907 [3:59:43<3:27:14,  1.70s/it][A
Training...:  47% 6592/13907 [3:59:45<3:22:54,  1.66s/it][A
Training...:  47% 6593/13907 [3:59:46<3:17:54,  1.62s/it][A
Training...:  47% 6594/13907 [3:59:48<3:13:20,  1.59s/it][A
Training...:  47% 6595/13907 [3:59:49<3:07:12,  1.54s/it][A
Training...:  47% 6596/13907 [3:59:50<3:01:51,  1.49s/it][A
Training...:  47% 6597/13907 [3:59:52<2:55:48,  1.44s/it][A
Training...:  47% 6598/13907 [3:59:53<2:48:43,  1.39s/it][A
Training...:  47% 6599/13907 [3:59:54<2:40:37,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:00:08<?, ?it/s]
Training...:  47% 6599/13907 [3:59:55<2:40:37,  1.32s/it][A
Training...:  47% 6600/13907 [3:59:55<2:37:47,  1.30s/it][A
Training...:  47% 6601/13907 [3:59:59<4:05:09,  2.01s/it][A
Training...:  47% 6602/13907 [4:00:02<4:55:26,  2.43s/it][A
Training...:  47% 6603/13907 [4:00:06<5:25:17,  2.67s/it][A
Training...:  47% 6604/13907 [4:00:09<5:40:32,  2.80s/it][A
Training...:  47% 6605/13907 [4:00:12<5:48:06,  2.86s/it][A
Training...:  48% 6606/13907 [4:00:15<5:47:59,  2.86s/it][A
Training...:  48% 6607/13907 [4:00:17<5:45:58,  2.84s/it][A
Training...:  48% 6608/13907 [4:00:20<5:41:05,  2.80s/it][A
Training...:  48% 6609/13907 [4:00:23<5:37:00,  2.77s/it][A
Training...:  48% 6610/13907 [4:00:26<5:31:41,  2.73s/it][A
Training...:  48% 6611/13907 [4:00:28<5:27:35,  2.69s/it][A
Training...:  48% 6612/13907 [4:00:31<5:24:34,  2.67s/it][A
Training...:  48% 6613/13907 [4:00:33<5:20:07,  2.63s/it][A
Training...:  48% 6614/13907 [4:00:36<5:14:43,  2.59s/it][A
Training...:  48% 6615/13907 [4:00:38<5:08:41,  2.54s/it][A
Training...:  48% 6616/13907 [4:00:41<5:03:49,  2.50s/it][A
Training...:  48% 6617/13907 [4:00:43<4:58:58,  2.46s/it][A
Training...:  48% 6618/13907 [4:00:45<4:53:52,  2.42s/it][A
Training...:  48% 6619/13907 [4:00:48<4:49:06,  2.38s/it][A
Training...:  48% 6620/13907 [4:00:50<4:45:06,  2.35s/it][A
Training...:  48% 6621/13907 [4:00:52<4:40:26,  2.31s/it][A
Training...:  48% 6622/13907 [4:00:54<4:37:35,  2.29s/it][A
Training...:  48% 6623/13907 [4:00:57<4:33:42,  2.25s/it][A
Training...:  48% 6624/13907 [4:00:59<4:28:49,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:01:13<?, ?it/s]
Training...:  48% 6624/13907 [4:01:01<4:28:49,  2.21s/it][A
Training...:  48% 6625/13907 [4:01:01<4:35:42,  2.27s/it][A
Training...:  48% 6626/13907 [4:01:03<4:31:31,  2.24s/it][A
Training...:  48% 6627/13907 [4:01:05<4:23:59,  2.18s/it][A
Training...:  48% 6628/13907 [4:01:07<4:18:41,  2.13s/it][A
Training...:  48% 6629/13907 [4:01:09<4:14:04,  2.09s/it][A
Training...:  48% 6630/13907 [4:01:11<4:09:08,  2.05s/it][A
Training...:  48% 6631/13907 [4:01:13<4:06:01,  2.03s/it][A
Training...:  48% 6632/13907 [4:01:15<4:01:35,  1.99s/it][A
Training...:  48% 6633/13907 [4:01:17<3:56:36,  1.95s/it][A
Training...:  48% 6634/13907 [4:01:19<3:53:38,  1.93s/it][A
Training...:  48% 6635/13907 [4:01:21<3:50:39,  1.90s/it][A
Training...:  48% 6636/13907 [4:01:22<3:47:02,  1.87s/it][A
Training...:  48% 6637/13907 [4:01:24<3:44:10,  1.85s/it][A
Training...:  48% 6638/13907 [4:01:26<3:40:24,  1.82s/it][A
Training...:  48% 6639/13907 [4:01:28<3:36:01,  1.78s/it][A
Training...:  48% 6640/13907 [4:01:29<3:32:23,  1.75s/it][A
Training...:  48% 6641/13907 [4:01:31<3:27:47,  1.72s/it][A
Training...:  48% 6642/13907 [4:01:33<3:23:23,  1.68s/it][A
Training...:  48% 6643/13907 [4:01:34<3:18:44,  1.64s/it][A
Training...:  48% 6644/13907 [4:01:36<3:14:44,  1.61s/it][A
Training...:  48% 6645/13907 [4:01:37<3:09:11,  1.56s/it][A
Training...:  48% 6646/13907 [4:01:39<3:04:11,  1.52s/it][A
Training...:  48% 6647/13907 [4:01:40<2:58:24,  1.47s/it][A
Training...:  48% 6648/13907 [4:01:41<2:52:47,  1.43s/it][A
Training...:  48% 6649/13907 [4:01:42<2:44:36,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:01:56<?, ?it/s]
Training...:  48% 6649/13907 [4:01:44<2:44:36,  1.36s/it][A
Training...:  48% 6650/13907 [4:01:44<2:41:38,  1.34s/it][A
Training...:  48% 6651/13907 [4:01:48<4:10:32,  2.07s/it][A
Training...:  48% 6652/13907 [4:01:51<4:58:52,  2.47s/it][A
Training...:  48% 6653/13907 [4:01:54<5:26:56,  2.70s/it][A
Training...:  48% 6654/13907 [4:01:57<5:40:33,  2.82s/it][A
Training...:  48% 6655/13907 [4:02:00<5:48:18,  2.88s/it][A
Training...:  48% 6656/13907 [4:02:03<5:51:11,  2.91s/it][A
Training...:  48% 6657/13907 [4:02:06<5:50:25,  2.90s/it][A
Training...:  48% 6658/13907 [4:02:09<5:44:23,  2.85s/it][A
Training...:  48% 6659/13907 [4:02:12<5:37:40,  2.80s/it][A
Training...:  48% 6660/13907 [4:02:14<5:31:09,  2.74s/it][A
Training...:  48% 6661/13907 [4:02:17<5:25:34,  2.70s/it][A
Training...:  48% 6662/13907 [4:02:19<5:19:22,  2.64s/it][A
Training...:  48% 6663/13907 [4:02:22<5:14:10,  2.60s/it][A
Training...:  48% 6664/13907 [4:02:24<5:08:02,  2.55s/it][A
Training...:  48% 6665/13907 [4:02:27<5:03:52,  2.52s/it][A
Training...:  48% 6666/13907 [4:02:29<4:58:27,  2.47s/it][A
Training...:  48% 6667/13907 [4:02:31<4:53:24,  2.43s/it][A
Training...:  48% 6668/13907 [4:02:34<4:49:01,  2.40s/it][A
Training...:  48% 6669/13907 [4:02:36<4:45:50,  2.37s/it][A
Training...:  48% 6670/13907 [4:02:38<4:41:46,  2.34s/it][A
Training...:  48% 6671/13907 [4:02:40<4:38:06,  2.31s/it][A
Training...:  48% 6672/13907 [4:02:43<4:34:00,  2.27s/it][A
Training...:  48% 6673/13907 [4:02:45<4:29:54,  2.24s/it][A
Training...:  48% 6674/13907 [4:02:47<4:25:07,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:03:02<?, ?it/s]
Training...:  48% 6674/13907 [4:02:49<4:25:07,  2.20s/it][A
Training...:  48% 6675/13907 [4:02:49<4:33:02,  2.27s/it][A
Training...:  48% 6676/13907 [4:02:51<4:27:31,  2.22s/it][A
Training...:  48% 6677/13907 [4:02:54<4:21:02,  2.17s/it][A
Training...:  48% 6678/13907 [4:02:56<4:17:00,  2.13s/it][A
Training...:  48% 6679/13907 [4:02:58<4:11:37,  2.09s/it][A
Training...:  48% 6680/13907 [4:03:00<4:07:14,  2.05s/it][A
Training...:  48% 6681/13907 [4:03:01<4:02:43,  2.02s/it][A
Training...:  48% 6682/13907 [4:03:03<3:58:43,  1.98s/it][A
Training...:  48% 6683/13907 [4:03:05<3:54:26,  1.95s/it][A
Training...:  48% 6684/13907 [4:03:07<3:49:48,  1.91s/it][A
Training...:  48% 6685/13907 [4:03:09<3:46:54,  1.89s/it][A
Training...:  48% 6686/13907 [4:03:11<3:43:12,  1.85s/it][A
Training...:  48% 6687/13907 [4:03:12<3:40:39,  1.83s/it][A
Training...:  48% 6688/13907 [4:03:14<3:36:42,  1.80s/it][A
Training...:  48% 6689/13907 [4:03:16<3:32:49,  1.77s/it][A
Training...:  48% 6690/13907 [4:03:18<3:28:36,  1.73s/it][A
Training...:  48% 6691/13907 [4:03:19<3:24:45,  1.70s/it][A
Training...:  48% 6692/13907 [4:03:21<3:22:04,  1.68s/it][A
Training...:  48% 6693/13907 [4:03:22<3:18:42,  1.65s/it][A
Training...:  48% 6694/13907 [4:03:24<3:13:29,  1.61s/it][A
Training...:  48% 6695/13907 [4:03:25<3:06:44,  1.55s/it][A
Training...:  48% 6696/13907 [4:03:27<3:01:19,  1.51s/it][A
Training...:  48% 6697/13907 [4:03:28<2:54:15,  1.45s/it][A
Training...:  48% 6698/13907 [4:03:29<2:46:47,  1.39s/it][A
Training...:  48% 6699/13907 [4:03:30<2:39:46,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:03:44<?, ?it/s]
Training...:  48% 6699/13907 [4:03:32<2:39:46,  1.33s/it][A
Training...:  48% 6700/13907 [4:03:32<2:36:17,  1.30s/it][A
Training...:  48% 6701/13907 [4:03:35<4:03:36,  2.03s/it][A
Training...:  48% 6702/13907 [4:03:39<4:51:51,  2.43s/it][A
Training...:  48% 6703/13907 [4:03:42<5:19:24,  2.66s/it][A
Training...:  48% 6704/13907 [4:03:45<5:34:17,  2.78s/it][A
Training...:  48% 6705/13907 [4:03:48<5:41:52,  2.85s/it][A
Training...:  48% 6706/13907 [4:03:51<5:42:27,  2.85s/it][A
Training...:  48% 6707/13907 [4:03:54<5:42:19,  2.85s/it][A
Training...:  48% 6708/13907 [4:03:57<5:38:36,  2.82s/it][A
Training...:  48% 6709/13907 [4:03:59<5:35:53,  2.80s/it][A
Training...:  48% 6710/13907 [4:04:02<5:32:18,  2.77s/it][A
Training...:  48% 6711/13907 [4:04:05<5:27:27,  2.73s/it][A
Training...:  48% 6712/13907 [4:04:07<5:23:42,  2.70s/it][A
Training...:  48% 6713/13907 [4:04:10<5:18:48,  2.66s/it][A
Training...:  48% 6714/13907 [4:04:12<5:14:38,  2.62s/it][A
Training...:  48% 6715/13907 [4:04:15<5:10:19,  2.59s/it][A
Training...:  48% 6716/13907 [4:04:17<5:05:40,  2.55s/it][A
Training...:  48% 6717/13907 [4:04:20<5:02:03,  2.52s/it][A
Training...:  48% 6718/13907 [4:04:22<4:57:39,  2.48s/it][A
Training...:  48% 6719/13907 [4:04:25<4:54:05,  2.45s/it][A
Training...:  48% 6720/13907 [4:04:27<4:49:30,  2.42s/it][A
Training...:  48% 6721/13907 [4:04:29<4:44:44,  2.38s/it][A
Training...:  48% 6722/13907 [4:04:31<4:40:48,  2.34s/it][A
Training...:  48% 6723/13907 [4:04:34<4:36:05,  2.31s/it][A
Training...:  48% 6724/13907 [4:04:36<4:33:09,  2.28s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:04:51<?, ?it/s]
Training...:  48% 6724/13907 [4:04:38<4:33:09,  2.28s/it][A
Training...:  48% 6725/13907 [4:04:38<4:44:15,  2.37s/it][A
Training...:  48% 6726/13907 [4:04:41<4:35:42,  2.30s/it][A
Training...:  48% 6727/13907 [4:04:43<4:27:32,  2.24s/it][A
Training...:  48% 6728/13907 [4:04:45<4:20:55,  2.18s/it][A
Training...:  48% 6729/13907 [4:04:47<4:13:41,  2.12s/it][A
Training...:  48% 6730/13907 [4:04:49<4:06:57,  2.06s/it][A
Training...:  48% 6731/13907 [4:04:51<4:01:14,  2.02s/it][A
Training...:  48% 6732/13907 [4:04:52<3:56:04,  1.97s/it][A
Training...:  48% 6733/13907 [4:04:54<3:51:28,  1.94s/it][A
Training...:  48% 6734/13907 [4:04:56<3:47:14,  1.90s/it][A
Training...:  48% 6735/13907 [4:04:58<3:43:06,  1.87s/it][A
Training...:  48% 6736/13907 [4:05:00<3:38:37,  1.83s/it][A
Training...:  48% 6737/13907 [4:05:01<3:35:38,  1.80s/it][A
Training...:  48% 6738/13907 [4:05:03<3:31:39,  1.77s/it][A
Training...:  48% 6739/13907 [4:05:05<3:27:36,  1.74s/it][A
Training...:  48% 6740/13907 [4:05:06<3:23:41,  1.71s/it][A
Training...:  48% 6741/13907 [4:05:08<3:19:12,  1.67s/it][A
Training...:  48% 6742/13907 [4:05:09<3:14:46,  1.63s/it][A
Training...:  48% 6743/13907 [4:05:11<3:11:00,  1.60s/it][A
Training...:  48% 6744/13907 [4:05:12<3:06:35,  1.56s/it][A
Training...:  49% 6745/13907 [4:05:14<3:01:56,  1.52s/it][A
Training...:  49% 6746/13907 [4:05:15<2:56:34,  1.48s/it][A
Training...:  49% 6747/13907 [4:05:17<2:50:51,  1.43s/it][A
Training...:  49% 6748/13907 [4:05:18<2:44:05,  1.38s/it][A
Training...:  49% 6749/13907 [4:05:19<2:37:57,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:05:33<?, ?it/s]
Training...:  49% 6749/13907 [4:05:20<2:37:57,  1.32s/it][A
Training...:  49% 6750/13907 [4:05:20<2:34:33,  1.30s/it][A
Training...:  49% 6751/13907 [4:05:24<4:02:38,  2.03s/it][A
Training...:  49% 6752/13907 [4:05:27<4:51:55,  2.45s/it][A
Training...:  49% 6753/13907 [4:05:31<5:19:14,  2.68s/it][A
Training...:  49% 6754/13907 [4:05:34<5:32:43,  2.79s/it][A
Training...:  49% 6755/13907 [4:05:37<5:39:19,  2.85s/it][A
Training...:  49% 6756/13907 [4:05:40<5:40:21,  2.86s/it][A
Training...:  49% 6757/13907 [4:05:42<5:39:13,  2.85s/it][A
Training...:  49% 6758/13907 [4:05:45<5:35:42,  2.82s/it][A
Training...:  49% 6759/13907 [4:05:48<5:32:07,  2.79s/it][A
Training...:  49% 6760/13907 [4:05:50<5:25:56,  2.74s/it][A
Training...:  49% 6761/13907 [4:05:53<5:21:56,  2.70s/it][A
Training...:  49% 6762/13907 [4:05:56<5:16:42,  2.66s/it][A
Training...:  49% 6763/13907 [4:05:58<5:11:14,  2.61s/it][A
Training...:  49% 6764/13907 [4:06:01<5:05:57,  2.57s/it][A
Training...:  49% 6765/13907 [4:06:03<5:02:53,  2.54s/it][A
Training...:  49% 6766/13907 [4:06:06<4:58:05,  2.50s/it][A
Training...:  49% 6767/13907 [4:06:08<4:54:25,  2.47s/it][A
Training...:  49% 6768/13907 [4:06:10<4:49:11,  2.43s/it][A
Training...:  49% 6769/13907 [4:06:13<4:43:47,  2.39s/it][A
Training...:  49% 6770/13907 [4:06:15<4:40:03,  2.35s/it][A
Training...:  49% 6771/13907 [4:06:17<4:36:55,  2.33s/it][A
Training...:  49% 6772/13907 [4:06:19<4:31:33,  2.28s/it][A
Training...:  49% 6773/13907 [4:06:21<4:28:02,  2.25s/it][A
Training...:  49% 6774/13907 [4:06:24<4:24:48,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:06:38<?, ?it/s]
Training...:  49% 6774/13907 [4:06:26<4:24:48,  2.23s/it][A
Training...:  49% 6775/13907 [4:06:26<4:33:34,  2.30s/it][A
Training...:  49% 6776/13907 [4:06:28<4:29:31,  2.27s/it][A
Training...:  49% 6777/13907 [4:06:30<4:23:55,  2.22s/it][A
Training...:  49% 6778/13907 [4:06:32<4:16:39,  2.16s/it][A
Training...:  49% 6779/13907 [4:06:34<4:10:53,  2.11s/it][A
Training...:  49% 6780/13907 [4:06:36<4:05:45,  2.07s/it][A
Training...:  49% 6781/13907 [4:06:38<4:00:30,  2.03s/it][A
Training...:  49% 6782/13907 [4:06:40<3:55:48,  1.99s/it][A
Training...:  49% 6783/13907 [4:06:42<3:51:46,  1.95s/it][A
Training...:  49% 6784/13907 [4:06:44<3:47:12,  1.91s/it][A
Training...:  49% 6785/13907 [4:06:46<3:43:46,  1.89s/it][A
Training...:  49% 6786/13907 [4:06:47<3:39:14,  1.85s/it][A
Training...:  49% 6787/13907 [4:06:49<3:34:56,  1.81s/it][A
Training...:  49% 6788/13907 [4:06:51<3:30:47,  1.78s/it][A
Training...:  49% 6789/13907 [4:06:53<3:27:00,  1.74s/it][A
Training...:  49% 6790/13907 [4:06:54<3:22:51,  1.71s/it][A
Training...:  49% 6791/13907 [4:06:56<3:19:36,  1.68s/it][A
Training...:  49% 6792/13907 [4:06:57<3:15:14,  1.65s/it][A
Training...:  49% 6793/13907 [4:06:59<3:10:35,  1.61s/it][A
Training...:  49% 6794/13907 [4:07:00<3:06:00,  1.57s/it][A
Training...:  49% 6795/13907 [4:07:02<3:01:43,  1.53s/it][A
Training...:  49% 6796/13907 [4:07:03<2:56:46,  1.49s/it][A
Training...:  49% 6797/13907 [4:07:05<2:50:20,  1.44s/it][A
Training...:  49% 6798/13907 [4:07:06<2:43:11,  1.38s/it][A
Training...:  49% 6799/13907 [4:07:07<2:34:44,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:07:20<?, ?it/s]
Training...:  49% 6799/13907 [4:07:08<2:34:44,  1.31s/it][A
Training...:  49% 6800/13907 [4:07:08<2:30:09,  1.27s/it][A
Training...:  49% 6801/13907 [4:07:12<3:57:33,  2.01s/it][A
Training...:  49% 6802/13907 [4:07:15<4:48:38,  2.44s/it][A
Training...:  49% 6803/13907 [4:07:18<5:16:13,  2.67s/it][A
Training...:  49% 6804/13907 [4:07:22<5:29:41,  2.78s/it][A
Training...:  49% 6805/13907 [4:07:25<5:39:05,  2.86s/it][A
Training...:  49% 6806/13907 [4:07:27<5:38:42,  2.86s/it][A
Training...:  49% 6807/13907 [4:07:30<5:37:31,  2.85s/it][A
Training...:  49% 6808/13907 [4:07:33<5:32:17,  2.81s/it][A
Training...:  49% 6809/13907 [4:07:36<5:27:44,  2.77s/it][A
Training...:  49% 6810/13907 [4:07:38<5:21:46,  2.72s/it][A
Training...:  49% 6811/13907 [4:07:41<5:16:44,  2.68s/it][A
Training...:  49% 6812/13907 [4:07:43<5:10:50,  2.63s/it][A
Training...:  49% 6813/13907 [4:07:46<5:08:29,  2.61s/it][A
Training...:  49% 6814/13907 [4:07:48<5:05:26,  2.58s/it][A
Training...:  49% 6815/13907 [4:07:51<4:59:10,  2.53s/it][A
Training...:  49% 6816/13907 [4:07:53<4:54:02,  2.49s/it][A
Training...:  49% 6817/13907 [4:07:56<4:49:21,  2.45s/it][A
Training...:  49% 6818/13907 [4:07:58<4:44:17,  2.41s/it][A
Training...:  49% 6819/13907 [4:08:00<4:39:54,  2.37s/it][A
Training...:  49% 6820/13907 [4:08:02<4:35:20,  2.33s/it][A
Training...:  49% 6821/13907 [4:08:05<4:33:32,  2.32s/it][A
Training...:  49% 6822/13907 [4:08:07<4:28:34,  2.27s/it][A
Training...:  49% 6823/13907 [4:08:09<4:25:21,  2.25s/it][A
Training...:  49% 6824/13907 [4:08:11<4:20:26,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:08:26<?, ?it/s]
Training...:  49% 6824/13907 [4:08:14<4:20:26,  2.21s/it][A
Training...:  49% 6825/13907 [4:08:14<4:27:27,  2.27s/it][A
Training...:  49% 6826/13907 [4:08:16<4:22:04,  2.22s/it][A
Training...:  49% 6827/13907 [4:08:18<4:15:55,  2.17s/it][A
Training...:  49% 6828/13907 [4:08:20<4:12:08,  2.14s/it][A
Training...:  49% 6829/13907 [4:08:22<4:07:27,  2.10s/it][A
Training...:  49% 6830/13907 [4:08:24<4:03:07,  2.06s/it][A
Training...:  49% 6831/13907 [4:08:26<3:58:19,  2.02s/it][A
Training...:  49% 6832/13907 [4:08:28<3:54:09,  1.99s/it][A
Training...:  49% 6833/13907 [4:08:29<3:49:56,  1.95s/it][A
Training...:  49% 6834/13907 [4:08:31<3:46:02,  1.92s/it][A
Training...:  49% 6835/13907 [4:08:33<3:42:38,  1.89s/it][A
Training...:  49% 6836/13907 [4:08:35<3:39:56,  1.87s/it][A
Training...:  49% 6837/13907 [4:08:37<3:37:26,  1.85s/it][A
Training...:  49% 6838/13907 [4:08:39<3:33:26,  1.81s/it][A
Training...:  49% 6839/13907 [4:08:40<3:29:46,  1.78s/it][A
Training...:  49% 6840/13907 [4:08:42<3:26:12,  1.75s/it][A
Training...:  49% 6841/13907 [4:08:44<3:21:58,  1.71s/it][A
Training...:  49% 6842/13907 [4:08:45<3:17:31,  1.68s/it][A
Training...:  49% 6843/13907 [4:08:47<3:13:15,  1.64s/it][A
Training...:  49% 6844/13907 [4:08:48<3:08:27,  1.60s/it][A
Training...:  49% 6845/13907 [4:08:50<3:02:10,  1.55s/it][A
Training...:  49% 6846/13907 [4:08:51<2:56:04,  1.50s/it][A
Training...:  49% 6847/13907 [4:08:52<2:49:24,  1.44s/it][A
Training...:  49% 6848/13907 [4:08:54<2:41:55,  1.38s/it][A
Training...:  49% 6849/13907 [4:08:55<2:34:24,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:09:08<?, ?it/s]
Training...:  49% 6849/13907 [4:08:56<2:34:24,  1.31s/it][A
Training...:  49% 6850/13907 [4:08:56<2:30:56,  1.28s/it][A
Training...:  49% 6851/13907 [4:09:00<4:07:08,  2.10s/it][A
Training...:  49% 6852/13907 [4:09:03<4:50:52,  2.47s/it][A
Training...:  49% 6853/13907 [4:09:06<5:16:51,  2.70s/it][A
Training...:  49% 6854/13907 [4:09:09<5:27:54,  2.79s/it][A
Training...:  49% 6855/13907 [4:09:12<5:32:33,  2.83s/it][A
Training...:  49% 6856/13907 [4:09:15<5:32:11,  2.83s/it][A
Training...:  49% 6857/13907 [4:09:18<5:30:25,  2.81s/it][A
Training...:  49% 6858/13907 [4:09:21<5:26:16,  2.78s/it][A
Training...:  49% 6859/13907 [4:09:23<5:21:30,  2.74s/it][A
Training...:  49% 6860/13907 [4:09:26<5:15:36,  2.69s/it][A
Training...:  49% 6861/13907 [4:09:28<5:11:34,  2.65s/it][A
Training...:  49% 6862/13907 [4:09:31<5:06:48,  2.61s/it][A
Training...:  49% 6863/13907 [4:09:33<5:02:41,  2.58s/it][A
Training...:  49% 6864/13907 [4:09:36<4:58:13,  2.54s/it][A
Training...:  49% 6865/13907 [4:09:38<4:53:50,  2.50s/it][A
Training...:  49% 6866/13907 [4:09:41<4:49:13,  2.46s/it][A
Training...:  49% 6867/13907 [4:09:43<4:44:57,  2.43s/it][A
Training...:  49% 6868/13907 [4:09:45<4:40:24,  2.39s/it][A
Training...:  49% 6869/13907 [4:09:48<4:36:38,  2.36s/it][A
Training...:  49% 6870/13907 [4:09:50<4:33:03,  2.33s/it][A
Training...:  49% 6871/13907 [4:09:52<4:29:26,  2.30s/it][A
Training...:  49% 6872/13907 [4:09:54<4:24:37,  2.26s/it][A
Training...:  49% 6873/13907 [4:09:56<4:21:05,  2.23s/it][A
Training...:  49% 6874/13907 [4:09:59<4:18:01,  2.20s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:10:13<?, ?it/s]
Training...:  49% 6874/13907 [4:10:01<4:18:01,  2.20s/it][A
Training...:  49% 6875/13907 [4:10:01<4:25:00,  2.26s/it][A
Training...:  49% 6876/13907 [4:10:03<4:19:31,  2.21s/it][A
Training...:  49% 6877/13907 [4:10:05<4:14:42,  2.17s/it][A
Training...:  49% 6878/13907 [4:10:07<4:09:50,  2.13s/it][A
Training...:  49% 6879/13907 [4:10:09<4:04:10,  2.08s/it][A
Training...:  49% 6880/13907 [4:10:11<3:59:30,  2.05s/it][A
Training...:  49% 6881/13907 [4:10:13<3:55:35,  2.01s/it][A
Training...:  49% 6882/13907 [4:10:15<3:51:46,  1.98s/it][A
Training...:  49% 6883/13907 [4:10:17<3:47:12,  1.94s/it][A
Training...:  50% 6884/13907 [4:10:19<3:42:56,  1.90s/it][A
Training...:  50% 6885/13907 [4:10:20<3:39:45,  1.88s/it][A
Training...:  50% 6886/13907 [4:10:22<3:36:34,  1.85s/it][A
Training...:  50% 6887/13907 [4:10:24<3:32:32,  1.82s/it][A
Training...:  50% 6888/13907 [4:10:26<3:28:35,  1.78s/it][A
Training...:  50% 6889/13907 [4:10:27<3:24:35,  1.75s/it][A
Training...:  50% 6890/13907 [4:10:29<3:20:24,  1.71s/it][A
Training...:  50% 6891/13907 [4:10:31<3:16:42,  1.68s/it][A
Training...:  50% 6892/13907 [4:10:32<3:13:31,  1.66s/it][A
Training...:  50% 6893/13907 [4:10:34<3:09:22,  1.62s/it][A
Training...:  50% 6894/13907 [4:10:35<3:06:56,  1.60s/it][A
Training...:  50% 6895/13907 [4:10:37<3:01:47,  1.56s/it][A
Training...:  50% 6896/13907 [4:10:38<2:55:39,  1.50s/it][A
Training...:  50% 6897/13907 [4:10:39<2:49:27,  1.45s/it][A
Training...:  50% 6898/13907 [4:10:41<2:42:31,  1.39s/it][A
Training...:  50% 6899/13907 [4:10:42<2:34:46,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:10:55<?, ?it/s]
Training...:  50% 6899/13907 [4:10:43<2:34:46,  1.33s/it][A
Training...:  50% 6900/13907 [4:10:43<2:30:18,  1.29s/it][A
Training...:  50% 6901/13907 [4:10:47<4:00:02,  2.06s/it][A
Training...:  50% 6902/13907 [4:10:50<4:46:19,  2.45s/it][A
Training...:  50% 6903/13907 [4:10:53<5:11:00,  2.66s/it][A
Training...:  50% 6904/13907 [4:10:56<5:22:56,  2.77s/it][A
Training...:  50% 6905/13907 [4:10:59<5:29:50,  2.83s/it][A
Training...:  50% 6906/13907 [4:11:02<5:30:30,  2.83s/it][A
Training...:  50% 6907/13907 [4:11:05<5:29:12,  2.82s/it][A
Training...:  50% 6908/13907 [4:11:08<5:27:01,  2.80s/it][A
Training...:  50% 6909/13907 [4:11:11<5:23:03,  2.77s/it][A
Training...:  50% 6910/13907 [4:11:13<5:18:31,  2.73s/it][A
Training...:  50% 6911/13907 [4:11:16<5:14:07,  2.69s/it][A
Training...:  50% 6912/13907 [4:11:18<5:09:29,  2.65s/it][A
Training...:  50% 6913/13907 [4:11:21<5:05:18,  2.62s/it][A
Training...:  50% 6914/13907 [4:11:23<5:01:28,  2.59s/it][A
Training...:  50% 6915/13907 [4:11:26<4:59:07,  2.57s/it][A
Training...:  50% 6916/13907 [4:11:28<4:54:25,  2.53s/it][A
Training...:  50% 6917/13907 [4:11:31<4:48:36,  2.48s/it][A
Training...:  50% 6918/13907 [4:11:33<4:43:26,  2.43s/it][A
Training...:  50% 6919/13907 [4:11:35<4:38:51,  2.39s/it][A
Training...:  50% 6920/13907 [4:11:38<4:35:36,  2.37s/it][A
Training...:  50% 6921/13907 [4:11:40<4:31:56,  2.34s/it][A
Training...:  50% 6922/13907 [4:11:42<4:27:13,  2.30s/it][A
Training...:  50% 6923/13907 [4:11:44<4:23:02,  2.26s/it][A
Training...:  50% 6924/13907 [4:11:46<4:18:37,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:12:01<?, ?it/s]
Training...:  50% 6924/13907 [4:11:49<4:18:37,  2.22s/it][A
Training...:  50% 6925/13907 [4:11:49<4:25:36,  2.28s/it][A
Training...:  50% 6926/13907 [4:11:51<4:20:10,  2.24s/it][A
Training...:  50% 6927/13907 [4:11:53<4:13:27,  2.18s/it][A
Training...:  50% 6928/13907 [4:11:55<4:07:27,  2.13s/it][A
Training...:  50% 6929/13907 [4:11:57<4:03:34,  2.09s/it][A
Training...:  50% 6930/13907 [4:11:59<3:59:42,  2.06s/it][A
Training...:  50% 6931/13907 [4:12:01<3:56:55,  2.04s/it][A
Training...:  50% 6932/13907 [4:12:03<3:53:34,  2.01s/it][A
Training...:  50% 6933/13907 [4:12:05<3:50:50,  1.99s/it][A
Training...:  50% 6934/13907 [4:12:07<3:47:00,  1.95s/it][A
Training...:  50% 6935/13907 [4:12:09<3:45:12,  1.94s/it][A
Training...:  50% 6936/13907 [4:12:11<3:42:42,  1.92s/it][A
Training...:  50% 6937/13907 [4:12:12<3:38:04,  1.88s/it][A
Training...:  50% 6938/13907 [4:12:14<3:34:14,  1.84s/it][A
Training...:  50% 6939/13907 [4:12:16<3:29:27,  1.80s/it][A
Training...:  50% 6940/13907 [4:12:17<3:25:37,  1.77s/it][A
Training...:  50% 6941/13907 [4:12:19<3:21:05,  1.73s/it][A
Training...:  50% 6942/13907 [4:12:21<3:17:32,  1.70s/it][A
Training...:  50% 6943/13907 [4:12:22<3:12:20,  1.66s/it][A
Training...:  50% 6944/13907 [4:12:24<3:07:09,  1.61s/it][A
Training...:  50% 6945/13907 [4:12:25<3:02:44,  1.57s/it][A
Training...:  50% 6946/13907 [4:12:27<2:57:11,  1.53s/it][A
Training...:  50% 6947/13907 [4:12:28<2:51:53,  1.48s/it][A
Training...:  50% 6948/13907 [4:12:29<2:44:51,  1.42s/it][A
Training...:  50% 6949/13907 [4:12:31<2:37:17,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:12:44<?, ?it/s]
Training...:  50% 6949/13907 [4:12:32<2:37:17,  1.36s/it][A
Training...:  50% 6950/13907 [4:12:32<2:33:13,  1.32s/it][A
Training...:  50% 6951/13907 [4:12:36<3:57:33,  2.05s/it][A
Training...:  50% 6952/13907 [4:12:39<4:44:01,  2.45s/it][A
Training...:  50% 6953/13907 [4:12:42<5:11:41,  2.69s/it][A
Training...:  50% 6954/13907 [4:12:45<5:23:55,  2.80s/it][A
Training...:  50% 6955/13907 [4:12:48<5:29:33,  2.84s/it][A
Training...:  50% 6956/13907 [4:12:51<5:28:23,  2.83s/it][A
Training...:  50% 6957/13907 [4:12:54<5:26:44,  2.82s/it][A
Training...:  50% 6958/13907 [4:12:57<5:23:13,  2.79s/it][A
Training...:  50% 6959/13907 [4:12:59<5:19:21,  2.76s/it][A
Training...:  50% 6960/13907 [4:13:02<5:14:00,  2.71s/it][A
Training...:  50% 6961/13907 [4:13:04<5:09:56,  2.68s/it][A
Training...:  50% 6962/13907 [4:13:07<5:04:26,  2.63s/it][A
Training...:  50% 6963/13907 [4:13:09<5:00:54,  2.60s/it][A
Training...:  50% 6964/13907 [4:13:12<4:57:33,  2.57s/it][A
Training...:  50% 6965/13907 [4:13:14<4:52:50,  2.53s/it][A
Training...:  50% 6966/13907 [4:13:17<4:48:34,  2.49s/it][A
Training...:  50% 6967/13907 [4:13:19<4:44:08,  2.46s/it][A
Training...:  50% 6968/13907 [4:13:22<4:39:55,  2.42s/it][A
Training...:  50% 6969/13907 [4:13:24<4:35:59,  2.39s/it][A
Training...:  50% 6970/13907 [4:13:26<4:31:49,  2.35s/it][A
Training...:  50% 6971/13907 [4:13:28<4:29:31,  2.33s/it][A
Training...:  50% 6972/13907 [4:13:31<4:27:39,  2.32s/it][A
Training...:  50% 6973/13907 [4:13:33<4:22:26,  2.27s/it][A
Training...:  50% 6974/13907 [4:13:35<4:16:28,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:13:50<?, ?it/s]
Training...:  50% 6974/13907 [4:13:37<4:16:28,  2.22s/it][A
Training...:  50% 6975/13907 [4:13:37<4:22:57,  2.28s/it][A
Training...:  50% 6976/13907 [4:13:39<4:18:00,  2.23s/it][A
Training...:  50% 6977/13907 [4:13:42<4:11:58,  2.18s/it][A
Training...:  50% 6978/13907 [4:13:44<4:07:46,  2.15s/it][A
Training...:  50% 6979/13907 [4:13:46<4:02:02,  2.10s/it][A
Training...:  50% 6980/13907 [4:13:48<3:56:54,  2.05s/it][A
Training...:  50% 6981/13907 [4:13:49<3:51:49,  2.01s/it][A
Training...:  50% 6982/13907 [4:13:51<3:47:45,  1.97s/it][A
Training...:  50% 6983/13907 [4:13:53<3:44:09,  1.94s/it][A
Training...:  50% 6984/13907 [4:13:55<3:40:12,  1.91s/it][A
Training...:  50% 6985/13907 [4:13:57<3:36:29,  1.88s/it][A
Training...:  50% 6986/13907 [4:13:59<3:33:19,  1.85s/it][A
Training...:  50% 6987/13907 [4:14:00<3:29:48,  1.82s/it][A
Training...:  50% 6988/13907 [4:14:02<3:26:48,  1.79s/it][A
Training...:  50% 6989/13907 [4:14:04<3:22:49,  1.76s/it][A
Training...:  50% 6990/13907 [4:14:05<3:19:13,  1.73s/it][A
Training...:  50% 6991/13907 [4:14:07<3:15:00,  1.69s/it][A
Training...:  50% 6992/13907 [4:14:09<3:10:44,  1.66s/it][A
Training...:  50% 6993/13907 [4:14:10<3:05:43,  1.61s/it][A
Training...:  50% 6994/13907 [4:14:12<3:01:19,  1.57s/it][A
Training...:  50% 6995/13907 [4:14:13<2:56:38,  1.53s/it][A
Training...:  50% 6996/13907 [4:14:14<2:51:29,  1.49s/it][A
Training...:  50% 6997/13907 [4:14:16<2:46:07,  1.44s/it][A
Training...:  50% 6998/13907 [4:14:17<2:40:24,  1.39s/it][A
Training...:  50% 6999/13907 [4:14:18<2:32:58,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:14:32<?, ?it/s]
Training...:  50% 6999/13907 [4:14:19<2:32:58,  1.33s/it][A
Training...:  50% 7000/13907 [4:14:19<2:29:00,  1.29s/it][A
Training...:  50% 7001/13907 [4:14:23<3:52:36,  2.02s/it][A
Training...:  50% 7002/13907 [4:14:27<4:40:23,  2.44s/it][A
Training...:  50% 7003/13907 [4:14:30<5:05:32,  2.66s/it][A
Training...:  50% 7004/13907 [4:14:33<5:21:03,  2.79s/it][A
Training...:  50% 7005/13907 [4:14:36<5:29:00,  2.86s/it][A
Training...:  50% 7006/13907 [4:14:39<5:28:53,  2.86s/it][A
Training...:  50% 7007/13907 [4:14:42<5:27:54,  2.85s/it][A
Training...:  50% 7008/13907 [4:14:44<5:24:23,  2.82s/it][A
Training...:  50% 7009/13907 [4:14:47<5:21:19,  2.79s/it][A
Training...:  50% 7010/13907 [4:14:50<5:16:46,  2.76s/it][A
Training...:  50% 7011/13907 [4:14:52<5:13:40,  2.73s/it][A
Training...:  50% 7012/13907 [4:14:55<5:09:09,  2.69s/it][A
Training...:  50% 7013/13907 [4:14:57<5:03:09,  2.64s/it][A
Training...:  50% 7014/13907 [4:15:00<4:56:33,  2.58s/it][A
Training...:  50% 7015/13907 [4:15:02<4:51:22,  2.54s/it][A
Training...:  50% 7016/13907 [4:15:05<4:45:52,  2.49s/it][A
Training...:  50% 7017/13907 [4:15:07<4:41:22,  2.45s/it][A
Training...:  50% 7018/13907 [4:15:09<4:36:24,  2.41s/it][A
Training...:  50% 7019/13907 [4:15:12<4:32:57,  2.38s/it][A
Training...:  50% 7020/13907 [4:15:14<4:29:58,  2.35s/it][A
Training...:  50% 7021/13907 [4:15:16<4:26:11,  2.32s/it][A
Training...:  50% 7022/13907 [4:15:18<4:23:21,  2.30s/it][A
Training...:  50% 7023/13907 [4:15:21<4:19:30,  2.26s/it][A
Training...:  51% 7024/13907 [4:15:23<4:15:17,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:15:38<?, ?it/s]
Training...:  51% 7024/13907 [4:15:25<4:15:17,  2.23s/it][A
Training...:  51% 7025/13907 [4:15:25<4:22:59,  2.29s/it][A
Training...:  51% 7026/13907 [4:15:27<4:17:29,  2.25s/it][A
Training...:  51% 7027/13907 [4:15:29<4:10:49,  2.19s/it][A
Training...:  51% 7028/13907 [4:15:31<4:04:11,  2.13s/it][A
Training...:  51% 7029/13907 [4:15:33<3:59:48,  2.09s/it][A
Training...:  51% 7030/13907 [4:15:35<3:56:25,  2.06s/it][A
Training...:  51% 7031/13907 [4:15:37<3:51:26,  2.02s/it][A
Training...:  51% 7032/13907 [4:15:39<3:47:49,  1.99s/it][A
Training...:  51% 7033/13907 [4:15:41<3:44:12,  1.96s/it][A
Training...:  51% 7034/13907 [4:15:43<3:40:20,  1.92s/it][A
Training...:  51% 7035/13907 [4:15:45<3:36:58,  1.89s/it][A
Training...:  51% 7036/13907 [4:15:47<3:33:35,  1.87s/it][A
Training...:  51% 7037/13907 [4:15:48<3:30:12,  1.84s/it][A
Training...:  51% 7038/13907 [4:15:50<3:26:43,  1.81s/it][A
Training...:  51% 7039/13907 [4:15:52<3:23:02,  1.77s/it][A
Training...:  51% 7040/13907 [4:15:53<3:19:29,  1.74s/it][A
Training...:  51% 7041/13907 [4:15:55<3:15:23,  1.71s/it][A
Training...:  51% 7042/13907 [4:15:57<3:10:38,  1.67s/it][A
Training...:  51% 7043/13907 [4:15:58<3:06:10,  1.63s/it][A
Training...:  51% 7044/13907 [4:16:00<3:01:49,  1.59s/it][A
Training...:  51% 7045/13907 [4:16:01<2:56:29,  1.54s/it][A
Training...:  51% 7046/13907 [4:16:03<2:51:17,  1.50s/it][A
Training...:  51% 7047/13907 [4:16:04<2:45:49,  1.45s/it][A
Training...:  51% 7048/13907 [4:16:05<2:39:03,  1.39s/it][A
Training...:  51% 7049/13907 [4:16:06<2:31:23,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:16:20<?, ?it/s]
Training...:  51% 7049/13907 [4:16:08<2:31:23,  1.32s/it][A
Training...:  51% 7050/13907 [4:16:08<2:27:28,  1.29s/it][A
Training...:  51% 7051/13907 [4:16:11<3:56:53,  2.07s/it][A
Training...:  51% 7052/13907 [4:16:15<4:43:21,  2.48s/it][A
Training...:  51% 7053/13907 [4:16:18<5:08:15,  2.70s/it][A
Training...:  51% 7054/13907 [4:16:21<5:20:23,  2.81s/it][A
Training...:  51% 7055/13907 [4:16:24<5:26:44,  2.86s/it][A
Training...:  51% 7056/13907 [4:16:27<5:27:18,  2.87s/it][A
Training...:  51% 7057/13907 [4:16:30<5:25:04,  2.85s/it][A
Training...:  51% 7058/13907 [4:16:32<5:20:37,  2.81s/it][A
Training...:  51% 7059/13907 [4:16:35<5:18:26,  2.79s/it][A
Training...:  51% 7060/13907 [4:16:38<5:12:05,  2.73s/it][A
Training...:  51% 7061/13907 [4:16:40<5:06:43,  2.69s/it][A
Training...:  51% 7062/13907 [4:16:43<5:02:24,  2.65s/it][A
Training...:  51% 7063/13907 [4:16:46<4:58:35,  2.62s/it][A
Training...:  51% 7064/13907 [4:16:48<4:53:49,  2.58s/it][A
Training...:  51% 7065/13907 [4:16:50<4:49:26,  2.54s/it][A
Training...:  51% 7066/13907 [4:16:53<4:45:36,  2.50s/it][A
Training...:  51% 7067/13907 [4:16:55<4:42:22,  2.48s/it][A
Training...:  51% 7068/13907 [4:16:58<4:37:46,  2.44s/it][A
Training...:  51% 7069/13907 [4:17:00<4:33:23,  2.40s/it][A
Training...:  51% 7070/13907 [4:17:02<4:28:45,  2.36s/it][A
Training...:  51% 7071/13907 [4:17:04<4:24:48,  2.32s/it][A
Training...:  51% 7072/13907 [4:17:07<4:21:54,  2.30s/it][A
Training...:  51% 7073/13907 [4:17:09<4:19:00,  2.27s/it][A
Training...:  51% 7074/13907 [4:17:11<4:17:21,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:17:26<?, ?it/s]
Training...:  51% 7074/13907 [4:17:14<4:17:21,  2.26s/it][A
Training...:  51% 7075/13907 [4:17:14<4:22:28,  2.31s/it][A
Training...:  51% 7076/13907 [4:17:16<4:16:51,  2.26s/it][A
Training...:  51% 7077/13907 [4:17:18<4:09:28,  2.19s/it][A
Training...:  51% 7078/13907 [4:17:20<4:03:59,  2.14s/it][A
Training...:  51% 7079/13907 [4:17:22<3:59:03,  2.10s/it][A
Training...:  51% 7080/13907 [4:17:24<3:54:23,  2.06s/it][A
Training...:  51% 7081/13907 [4:17:26<3:50:00,  2.02s/it][A
Training...:  51% 7082/13907 [4:17:28<3:45:47,  1.98s/it][A
Training...:  51% 7083/13907 [4:17:29<3:41:53,  1.95s/it][A
Training...:  51% 7084/13907 [4:17:31<3:38:11,  1.92s/it][A
Training...:  51% 7085/13907 [4:17:33<3:34:42,  1.89s/it][A
Training...:  51% 7086/13907 [4:17:35<3:31:35,  1.86s/it][A
Training...:  51% 7087/13907 [4:17:37<3:27:31,  1.83s/it][A
Training...:  51% 7088/13907 [4:17:38<3:24:21,  1.80s/it][A
Training...:  51% 7089/13907 [4:17:40<3:20:35,  1.77s/it][A
Training...:  51% 7090/13907 [4:17:42<3:16:19,  1.73s/it][A
Training...:  51% 7091/13907 [4:17:43<3:12:35,  1.70s/it][A
Training...:  51% 7092/13907 [4:17:45<3:08:29,  1.66s/it][A
Training...:  51% 7093/13907 [4:17:46<3:04:09,  1.62s/it][A
Training...:  51% 7094/13907 [4:17:48<3:00:10,  1.59s/it][A
Training...:  51% 7095/13907 [4:17:49<2:54:37,  1.54s/it][A
Training...:  51% 7096/13907 [4:17:51<2:48:52,  1.49s/it][A
Training...:  51% 7097/13907 [4:17:52<2:42:51,  1.43s/it][A
Training...:  51% 7098/13907 [4:17:53<2:36:19,  1.38s/it][A
Training...:  51% 7099/13907 [4:17:54<2:28:23,  1.31s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:18:08<?, ?it/s]
Training...:  51% 7099/13907 [4:17:56<2:28:23,  1.31s/it][A
Training...:  51% 7100/13907 [4:17:56<2:24:20,  1.27s/it][A
Training...:  51% 7101/13907 [4:17:59<3:48:33,  2.01s/it][A
Training...:  51% 7102/13907 [4:18:03<4:34:02,  2.42s/it][A
Training...:  51% 7103/13907 [4:18:06<4:59:24,  2.64s/it][A
Training...:  51% 7104/13907 [4:18:09<5:11:54,  2.75s/it][A
Training...:  51% 7105/13907 [4:18:12<5:18:20,  2.81s/it][A
Training...:  51% 7106/13907 [4:18:15<5:19:19,  2.82s/it][A
Training...:  51% 7107/13907 [4:18:17<5:18:26,  2.81s/it][A
Training...:  51% 7108/13907 [4:18:20<5:15:36,  2.79s/it][A
Training...:  51% 7109/13907 [4:18:23<5:13:49,  2.77s/it][A
Training...:  51% 7110/13907 [4:18:26<5:08:39,  2.72s/it][A
Training...:  51% 7111/13907 [4:18:28<5:04:04,  2.68s/it][A
Training...:  51% 7112/13907 [4:18:31<4:58:18,  2.63s/it][A
Training...:  51% 7113/13907 [4:18:33<4:52:50,  2.59s/it][A
Training...:  51% 7114/13907 [4:18:36<4:49:05,  2.55s/it][A
Training...:  51% 7115/13907 [4:18:38<4:45:24,  2.52s/it][A
Training...:  51% 7116/13907 [4:18:41<4:43:12,  2.50s/it][A
Training...:  51% 7117/13907 [4:18:43<4:40:51,  2.48s/it][A
Training...:  51% 7118/13907 [4:18:45<4:35:36,  2.44s/it][A
Training...:  51% 7119/13907 [4:18:48<4:31:18,  2.40s/it][A
Training...:  51% 7120/13907 [4:18:50<4:26:39,  2.36s/it][A
Training...:  51% 7121/13907 [4:18:52<4:22:42,  2.32s/it][A
Training...:  51% 7122/13907 [4:18:54<4:18:17,  2.28s/it][A
Training...:  51% 7123/13907 [4:18:56<4:14:29,  2.25s/it][A
Training...:  51% 7124/13907 [4:18:59<4:09:18,  2.21s/it][A                                            
                                                         [A
Step... (5350 | Loss: 0.3931671380996704, Learning Rate: 0.00027061213040724397, Gradient Norm: 1.9662742614746094)
Step... (5375 | Loss: 0.3890867233276367, Learning Rate: 0.0002704606158658862, Gradient Norm: 1.0372258424758911)
Step... (5400 | Loss: 0.5122745633125305, Learning Rate: 0.00027030910132452846, Gradient Norm: 2.314480781555176)
Step... (5425 | Loss: 0.4279056191444397, Learning Rate: 0.0002701575867831707, Gradient Norm: 1.275814414024353)
Step... (5450 | Loss: 0.4670325815677643, Learning Rate: 0.00027000607224181294, Gradient Norm: 2.1610524654388428)
Step... (5475 | Loss: 0.3505018949508667, Learning Rate: 0.0002698545577004552, Gradient Norm: 1.0474350452423096)
Step... (5500 | Loss: 0.517728328704834, Learning Rate: 0.00026970304315909743, Gradient Norm: 2.2441396713256836)
Step... (5525 | Loss: 0.33652251958847046, Learning Rate: 0.0002695515286177397, Gradient Norm: 1.085044264793396)
Step... (5550 | Loss: 0.47267305850982666, Learning Rate: 0.0002694000140763819, Gradient Norm: 1.8536540269851685)
Step... (5575 | Loss: 0.2931271195411682, Learning Rate: 0.00026924849953502417, Gradient Norm: 1.1136703491210938)
Step... (5600 | Loss: 0.4493843913078308, Learning Rate: 0.0002690969849936664, Gradient Norm: 1.7271686792373657)
Step... (5625 | Loss: 0.4186018109321594, Learning Rate: 0.00026894547045230865, Gradient Norm: 1.2586129903793335)
Step... (5650 | Loss: 0.6095842123031616, Learning Rate: 0.0002687939559109509, Gradient Norm: 2.8455333709716797)
Step... (5675 | Loss: 0.353893905878067, Learning Rate: 0.00026864244136959314, Gradient Norm: 1.0449227094650269)
Step... (5700 | Loss: 0.570328950881958, Learning Rate: 0.0002684909268282354, Gradient Norm: 2.685950517654419)
Step... (5725 | Loss: 0.33354049921035767, Learning Rate: 0.00026833941228687763, Gradient Norm: 1.2050845623016357)
Step... (5750 | Loss: 0.43101298809051514, Learning Rate: 0.0002681878977455199, Gradient Norm: 1.6390551328659058)
Step... (5775 | Loss: 0.3856419026851654, Learning Rate: 0.0002680363832041621, Gradient Norm: 1.0584087371826172)
Step... (5800 | Loss: 0.43239688873291016, Learning Rate: 0.00026788486866280437, Gradient Norm: 2.2630531787872314)
Step... (5825 | Loss: 0.34258759021759033, Learning Rate: 0.0002677333541214466, Gradient Norm: 0.8843297958374023)
Step... (5850 | Loss: 0.45875272154808044, Learning Rate: 0.00026758183958008885, Gradient Norm: 1.9917840957641602)
Step... (5875 | Loss: 0.32099562883377075, Learning Rate: 0.00026743029593490064, Gradient Norm: 1.0203857421875)
Step... (5900 | Loss: 0.40012258291244507, Learning Rate: 0.00026727881049737334, Gradient Norm: 2.16736102104187)
Step... (5925 | Loss: 0.36666035652160645, Learning Rate: 0.0002671272959560156, Gradient Norm: 1.0147192478179932)
Step... (5950 | Loss: 0.447494238615036, Learning Rate: 0.0002669757523108274, Gradient Norm: 1.9806718826293945)
Step... (5975 | Loss: 0.3670136332511902, Learning Rate: 0.0002668242377694696, Gradient Norm: 1.0696181058883667)
Step... (6000 | Loss: 0.5072406530380249, Learning Rate: 0.0002666727523319423, Gradient Norm: 2.846219062805176)
Step... (6025 | Loss: 0.3776012659072876, Learning Rate: 0.0002665212086867541, Gradient Norm: 1.3175091743469238)
Step... (6050 | Loss: 0.3829551041126251, Learning Rate: 0.00026636969414539635, Gradient Norm: 1.6150996685028076)
Step... (6075 | Loss: 0.35757726430892944, Learning Rate: 0.00026621820870786905, Gradient Norm: 1.0553665161132812)
Step... (6100 | Loss: 0.5269861221313477, Learning Rate: 0.00026606666506268084, Gradient Norm: 1.64520263671875)
Step... (6125 | Loss: 0.3326588273048401, Learning Rate: 0.0002659151505213231, Gradient Norm: 0.9216002821922302)
Step... (6150 | Loss: 0.4310632646083832, Learning Rate: 0.0002657636650837958, Gradient Norm: 2.345306158065796)
Step... (6175 | Loss: 0.3468143343925476, Learning Rate: 0.0002656121214386076, Gradient Norm: 1.1262001991271973)
Step... (6200 | Loss: 0.5833766460418701, Learning Rate: 0.0002654606068972498, Gradient Norm: 2.097574234008789)
Step... (6225 | Loss: 0.25407925248146057, Learning Rate: 0.0002653091214597225, Gradient Norm: 1.007644772529602)
Step... (6250 | Loss: 0.4957510828971863, Learning Rate: 0.0002651575778145343, Gradient Norm: 2.085690975189209)
Step... (6275 | Loss: 0.35542815923690796, Learning Rate: 0.00026500606327317655, Gradient Norm: 1.5094163417816162)
Step... (6300 | Loss: 0.5226694941520691, Learning Rate: 0.0002648545487318188, Gradient Norm: 1.8499321937561035)
Step... (6325 | Loss: 0.38306885957717896, Learning Rate: 0.00026470303419046104, Gradient Norm: 1.0500879287719727)
Step... (6350 | Loss: 0.4551120400428772, Learning Rate: 0.0002645515196491033, Gradient Norm: 1.4222363233566284)
Step... (6375 | Loss: 0.29519960284233093, Learning Rate: 0.00026440000510774553, Gradient Norm: 0.8392356634140015)
Step... (6400 | Loss: 0.4609968960285187, Learning Rate: 0.00026424849056638777, Gradient Norm: 2.0099802017211914)
Step... (6425 | Loss: 0.3432852625846863, Learning Rate: 0.00026409697602503, Gradient Norm: 0.9517688155174255)
Step... (6450 | Loss: 0.4426727890968323, Learning Rate: 0.00026394546148367226, Gradient Norm: 2.562577486038208)
Step... (6475 | Loss: 0.3345624506473541, Learning Rate: 0.0002637939469423145, Gradient Norm: 1.1548243761062622)
Step... (6500 | Loss: 0.5384436845779419, Learning Rate: 0.00026364243240095675, Gradient Norm: 2.6159651279449463)
Step... (6525 | Loss: 0.32994383573532104, Learning Rate: 0.000263490917859599, Gradient Norm: 1.0122357606887817)
Step... (6550 | Loss: 0.5071877241134644, Learning Rate: 0.00026333940331824124, Gradient Norm: 1.7974889278411865)
Step... (6575 | Loss: 0.294771283864975, Learning Rate: 0.0002631878887768835, Gradient Norm: 1.0474560260772705)
Step... (6600 | Loss: 0.5489828586578369, Learning Rate: 0.00026303637423552573, Gradient Norm: 2.5771265029907227)
Step... (6625 | Loss: 0.3287675082683563, Learning Rate: 0.00026288485969416797, Gradient Norm: 1.0072269439697266)
Step... (6650 | Loss: 0.46736592054367065, Learning Rate: 0.0002627333451528102, Gradient Norm: 2.081145763397217)
Step... (6675 | Loss: 0.36421316862106323, Learning Rate: 0.00026258183061145246, Gradient Norm: 1.4009287357330322)
Step... (6700 | Loss: 0.4954763948917389, Learning Rate: 0.0002624303160700947, Gradient Norm: 2.1206204891204834)
Step... (6725 | Loss: 0.30543291568756104, Learning Rate: 0.00026227880152873695, Gradient Norm: 1.12632417678833)
Step... (6750 | Loss: 0.3887005150318146, Learning Rate: 0.0002621272869873792, Gradient Norm: 2.170602321624756)
Step... (6775 | Loss: 0.260464072227478, Learning Rate: 0.00026197577244602144, Gradient Norm: 0.7901862263679504)
Step... (6800 | Loss: 0.3947485387325287, Learning Rate: 0.0002618242579046637, Gradient Norm: 1.7712167501449585)
Step... (6825 | Loss: 0.36056602001190186, Learning Rate: 0.0002616727433633059, Gradient Norm: 1.110276222229004)
Step... (6850 | Loss: 0.45396724343299866, Learning Rate: 0.00026152122882194817, Gradient Norm: 2.1869521141052246)
Step... (6875 | Loss: 0.31392693519592285, Learning Rate: 0.0002613697142805904, Gradient Norm: 1.1115350723266602)
Step... (6900 | Loss: 0.468300998210907, Learning Rate: 0.00026121819973923266, Gradient Norm: 1.6418187618255615)
Step... (6925 | Loss: 0.3271387815475464, Learning Rate: 0.0002610666851978749, Gradient Norm: 1.0269889831542969)
Step... (6950 | Loss: 0.32372772693634033, Learning Rate: 0.00026091517065651715, Gradient Norm: 1.440704107284546)
Step... (6975 | Loss: 0.34034842252731323, Learning Rate: 0.0002607636561151594, Gradient Norm: 1.2223622798919678)
Step... (7000 | Loss: 0.5343132019042969, Learning Rate: 0.00026061214157380164, Gradient Norm: 1.9285303354263306)
Step... (7025 | Loss: 0.2805771231651306, Learning Rate: 0.0002604606270324439, Gradient Norm: 0.8598672151565552)
Step... (7050 | Loss: 0.43346595764160156, Learning Rate: 0.0002603091124910861, Gradient Norm: 1.9131598472595215)
Step... (7075 | Loss: 0.3475063443183899, Learning Rate: 0.00026015759794972837, Gradient Norm: 0.9663054943084717)
Step... (7100 | Loss: 0.4794505536556244, LeaEpoch ... (1/4):   0% 0/4 [4:19:13<?, ?it/s]
Training...:  51% 7124/13907 [4:19:01<4:09:18,  2.21s/it][A
Training...:  51% 7125/13907 [4:19:01<4:15:40,  2.26s/it][Arning Rate: 0.0002600060834083706, Gradient Norm: 2.1890499591827393)

Training...:  51% 7126/13907 [4:19:03<4:16:17,  2.27s/it][A
Training...:  51% 7127/13907 [4:19:05<4:08:09,  2.20s/it][A
Training...:  51% 7128/13907 [4:19:07<4:01:51,  2.14s/it][A
Training...:  51% 7129/13907 [4:19:09<3:57:05,  2.10s/it][A
Training...:  51% 7130/13907 [4:19:11<3:52:29,  2.06s/it][A
Training...:  51% 7131/13907 [4:19:13<3:48:10,  2.02s/it][A
Training...:  51% 7132/13907 [4:19:15<3:43:38,  1.98s/it][A
Training...:  51% 7133/13907 [4:19:17<3:39:36,  1.95s/it][A
Training...:  51% 7134/13907 [4:19:19<3:35:49,  1.91s/it][A
Training...:  51% 7135/13907 [4:19:21<3:32:18,  1.88s/it][A
Training...:  51% 7136/13907 [4:19:22<3:29:11,  1.85s/it][A
Training...:  51% 7137/13907 [4:19:24<3:25:53,  1.82s/it][A
Training...:  51% 7138/13907 [4:19:26<3:21:59,  1.79s/it][A
Training...:  51% 7139/13907 [4:19:27<3:18:03,  1.76s/it][A
Training...:  51% 7140/13907 [4:19:29<3:14:10,  1.72s/it][A
Training...:  51% 7141/13907 [4:19:31<3:10:26,  1.69s/it][A
Training...:  51% 7142/13907 [4:19:32<3:05:22,  1.64s/it][A
Training...:  51% 7143/13907 [4:19:34<3:01:18,  1.61s/it][A
Training...:  51% 7144/13907 [4:19:35<2:56:53,  1.57s/it][A
Training...:  51% 7145/13907 [4:19:37<2:51:31,  1.52s/it][A
Training...:  51% 7146/13907 [4:19:38<2:45:29,  1.47s/it][A
Training...:  51% 7147/13907 [4:19:39<2:39:51,  1.42s/it][A
Training...:  51% 7148/13907 [4:19:41<2:33:36,  1.36s/it][A
Training...:  51% 7149/13907 [4:19:42<2:26:10,  1.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:19:55<?, ?it/s]
Training...:  51% 7149/13907 [4:19:43<2:26:10,  1.30s/it][A
Training...:  51% 7150/13907 [4:19:43<2:23:12,  1.27s/it][A
Training...:  51% 7151/13907 [4:19:47<3:46:55,  2.02s/it][A
Training...:  51% 7152/13907 [4:19:50<4:32:23,  2.42s/it][A
Training...:  51% 7153/13907 [4:19:53<4:57:34,  2.64s/it][A
Training...:  51% 7154/13907 [4:19:56<5:10:31,  2.76s/it][A
Training...:  51% 7155/13907 [4:19:59<5:18:14,  2.83s/it][A
Training...:  51% 7156/13907 [4:20:02<5:18:26,  2.83s/it][A
Training...:  51% 7157/13907 [4:20:05<5:18:05,  2.83s/it][A
Training...:  51% 7158/13907 [4:20:08<5:15:25,  2.80s/it][A
Training...:  51% 7159/13907 [4:20:10<5:14:14,  2.79s/it][A
Training...:  51% 7160/13907 [4:20:13<5:10:52,  2.76s/it][A
Training...:  51% 7161/13907 [4:20:16<5:05:57,  2.72s/it][A
Training...:  51% 7162/13907 [4:20:18<5:00:35,  2.67s/it][A
Training...:  52% 7163/13907 [4:20:21<4:54:49,  2.62s/it][A
Training...:  52% 7164/13907 [4:20:23<4:49:36,  2.58s/it][A
Training...:  52% 7165/13907 [4:20:26<4:44:48,  2.53s/it][A
Training...:  52% 7166/13907 [4:20:28<4:39:58,  2.49s/it][A
Training...:  52% 7167/13907 [4:20:30<4:35:25,  2.45s/it][A
Training...:  52% 7168/13907 [4:20:33<4:30:57,  2.41s/it][A
Training...:  52% 7169/13907 [4:20:35<4:26:49,  2.38s/it][A
Training...:  52% 7170/13907 [4:20:37<4:23:21,  2.35s/it][A
Training...:  52% 7171/13907 [4:20:40<4:20:34,  2.32s/it][A
Training...:  52% 7172/13907 [4:20:42<4:17:36,  2.30s/it][A
Training...:  52% 7173/13907 [4:20:44<4:13:07,  2.26s/it][A
Training...:  52% 7174/13907 [4:20:46<4:09:22,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:21:01<?, ?it/s]
Training...:  52% 7174/13907 [4:20:49<4:09:22,  2.22s/it][A
Training...:  52% 7175/13907 [4:20:49<4:16:38,  2.29s/it][A
Training...:  52% 7176/13907 [4:20:51<4:11:42,  2.24s/it][A
Training...:  52% 7177/13907 [4:20:53<4:04:51,  2.18s/it][A
Training...:  52% 7178/13907 [4:20:55<3:59:54,  2.14s/it][A
Training...:  52% 7179/13907 [4:20:57<3:55:04,  2.10s/it][A
Training...:  52% 7180/13907 [4:20:59<3:49:51,  2.05s/it][A
Training...:  52% 7181/13907 [4:21:01<3:45:46,  2.01s/it][A
Training...:  52% 7182/13907 [4:21:03<3:42:29,  1.99s/it][A
Training...:  52% 7183/13907 [4:21:04<3:38:29,  1.95s/it][A
Training...:  52% 7184/13907 [4:21:06<3:35:46,  1.93s/it][A
Training...:  52% 7185/13907 [4:21:08<3:32:20,  1.90s/it][A
Training...:  52% 7186/13907 [4:21:10<3:28:22,  1.86s/it][A
Training...:  52% 7187/13907 [4:21:12<3:24:47,  1.83s/it][A
Training...:  52% 7188/13907 [4:21:13<3:21:49,  1.80s/it][A
Training...:  52% 7189/13907 [4:21:15<3:18:32,  1.77s/it][A
Training...:  52% 7190/13907 [4:21:17<3:14:43,  1.74s/it][A
Training...:  52% 7191/13907 [4:21:18<3:11:43,  1.71s/it][A
Training...:  52% 7192/13907 [4:21:20<3:07:20,  1.67s/it][A
Training...:  52% 7193/13907 [4:21:22<3:03:40,  1.64s/it][A
Training...:  52% 7194/13907 [4:21:23<3:00:03,  1.61s/it][A
Training...:  52% 7195/13907 [4:21:25<2:54:50,  1.56s/it][A
Training...:  52% 7196/13907 [4:21:26<2:50:12,  1.52s/it][A
Training...:  52% 7197/13907 [4:21:27<2:44:11,  1.47s/it][A
Training...:  52% 7198/13907 [4:21:29<2:37:52,  1.41s/it][A
Training...:  52% 7199/13907 [4:21:30<2:30:30,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:21:43<?, ?it/s]
Training...:  52% 7199/13907 [4:21:31<2:30:30,  1.35s/it][A
Training...:  52% 7200/13907 [4:21:31<2:27:45,  1.32s/it][A
Training...:  52% 7201/13907 [4:21:35<3:51:40,  2.07s/it][A
Training...:  52% 7202/13907 [4:21:38<4:32:53,  2.44s/it][A
Training...:  52% 7203/13907 [4:21:41<4:57:10,  2.66s/it][A
Training...:  52% 7204/13907 [4:21:44<5:11:46,  2.79s/it][A
Training...:  52% 7205/13907 [4:21:48<5:23:13,  2.89s/it][A
Training...:  52% 7206/13907 [4:21:50<5:22:51,  2.89s/it][A
Training...:  52% 7207/13907 [4:21:53<5:19:49,  2.86s/it][A
Training...:  52% 7208/13907 [4:21:56<5:15:21,  2.82s/it][A
Training...:  52% 7209/13907 [4:21:59<5:10:05,  2.78s/it][A
Training...:  52% 7210/13907 [4:22:01<5:05:07,  2.73s/it][A
Training...:  52% 7211/13907 [4:22:04<5:00:55,  2.70s/it][A
Training...:  52% 7212/13907 [4:22:06<4:55:52,  2.65s/it][A
Training...:  52% 7213/13907 [4:22:09<4:51:29,  2.61s/it][A
Training...:  52% 7214/13907 [4:22:11<4:46:44,  2.57s/it][A
Training...:  52% 7215/13907 [4:22:14<4:41:19,  2.52s/it][A
Training...:  52% 7216/13907 [4:22:16<4:35:34,  2.47s/it][A
Training...:  52% 7217/13907 [4:22:19<4:30:58,  2.43s/it][A
Training...:  52% 7218/13907 [4:22:21<4:27:50,  2.40s/it][A
Training...:  52% 7219/13907 [4:22:23<4:24:11,  2.37s/it][A
Training...:  52% 7220/13907 [4:22:25<4:19:28,  2.33s/it][A
Training...:  52% 7221/13907 [4:22:28<4:16:06,  2.30s/it][A
Training...:  52% 7222/13907 [4:22:30<4:12:18,  2.26s/it][A
Training...:  52% 7223/13907 [4:22:32<4:07:55,  2.23s/it][A
Training...:  52% 7224/13907 [4:22:34<4:04:00,  2.19s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:22:49<?, ?it/s]
Training...:  52% 7224/13907 [4:22:36<4:04:00,  2.19s/it][A
Training...:  52% 7225/13907 [4:22:36<4:10:44,  2.25s/it][A
Training...:  52% 7226/13907 [4:22:39<4:06:48,  2.22s/it][A
Training...:  52% 7227/13907 [4:22:41<4:01:45,  2.17s/it][A
Training...:  52% 7228/13907 [4:22:43<3:56:20,  2.12s/it][A
Training...:  52% 7229/13907 [4:22:45<3:51:37,  2.08s/it][A
Training...:  52% 7230/13907 [4:22:47<3:47:37,  2.05s/it][A
Training...:  52% 7231/13907 [4:22:49<3:44:01,  2.01s/it][A
Training...:  52% 7232/13907 [4:22:50<3:40:15,  1.98s/it][A
Training...:  52% 7233/13907 [4:22:52<3:36:43,  1.95s/it][A
Training...:  52% 7234/13907 [4:22:54<3:34:50,  1.93s/it][A
Training...:  52% 7235/13907 [4:22:56<3:30:51,  1.90s/it][A
Training...:  52% 7236/13907 [4:22:58<3:27:09,  1.86s/it][A
Training...:  52% 7237/13907 [4:23:00<3:24:26,  1.84s/it][A
Training...:  52% 7238/13907 [4:23:01<3:20:18,  1.80s/it][A
Training...:  52% 7239/13907 [4:23:03<3:16:28,  1.77s/it][A
Training...:  52% 7240/13907 [4:23:05<3:13:18,  1.74s/it][A
Training...:  52% 7241/13907 [4:23:06<3:09:39,  1.71s/it][A
Training...:  52% 7242/13907 [4:23:08<3:05:07,  1.67s/it][A
Training...:  52% 7243/13907 [4:23:10<3:02:25,  1.64s/it][A
Training...:  52% 7244/13907 [4:23:11<2:59:18,  1.61s/it][A
Training...:  52% 7245/13907 [4:23:13<2:54:04,  1.57s/it][A
Training...:  52% 7246/13907 [4:23:14<2:49:46,  1.53s/it][A
Training...:  52% 7247/13907 [4:23:15<2:43:30,  1.47s/it][A
Training...:  52% 7248/13907 [4:23:17<2:36:31,  1.41s/it][A
Training...:  52% 7249/13907 [4:23:18<2:28:43,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:23:31<?, ?it/s]
Training...:  52% 7249/13907 [4:23:19<2:28:43,  1.34s/it][A
Training...:  52% 7250/13907 [4:23:19<2:25:07,  1.31s/it][A
Training...:  52% 7251/13907 [4:23:23<3:48:19,  2.06s/it][A
Training...:  52% 7252/13907 [4:23:26<4:35:03,  2.48s/it][A
Training...:  52% 7253/13907 [4:23:29<4:59:06,  2.70s/it][A
Training...:  52% 7254/13907 [4:23:32<5:10:37,  2.80s/it][A
Training...:  52% 7255/13907 [4:23:35<5:15:53,  2.85s/it][A
Training...:  52% 7256/13907 [4:23:38<5:15:03,  2.84s/it][A
Training...:  52% 7257/13907 [4:23:41<5:14:19,  2.84s/it][A
Training...:  52% 7258/13907 [4:23:44<5:10:37,  2.80s/it][A
Training...:  52% 7259/13907 [4:23:47<5:06:37,  2.77s/it][A
Training...:  52% 7260/13907 [4:23:49<5:01:21,  2.72s/it][A
Training...:  52% 7261/13907 [4:23:52<4:56:51,  2.68s/it][A
Training...:  52% 7262/13907 [4:23:54<4:52:37,  2.64s/it][A
Training...:  52% 7263/13907 [4:23:57<4:48:14,  2.60s/it][A
Training...:  52% 7264/13907 [4:23:59<4:43:19,  2.56s/it][A
Training...:  52% 7265/13907 [4:24:02<4:38:01,  2.51s/it][A
Training...:  52% 7266/13907 [4:24:04<4:34:28,  2.48s/it][A
Training...:  52% 7267/13907 [4:24:06<4:30:58,  2.45s/it][A
Training...:  52% 7268/13907 [4:24:09<4:26:29,  2.41s/it][A
Training...:  52% 7269/13907 [4:24:11<4:23:06,  2.38s/it][A
Training...:  52% 7270/13907 [4:24:13<4:19:32,  2.35s/it][A
Training...:  52% 7271/13907 [4:24:16<4:15:35,  2.31s/it][A
Training...:  52% 7272/13907 [4:24:18<4:11:47,  2.28s/it][A
Training...:  52% 7273/13907 [4:24:20<4:07:10,  2.24s/it][A
Training...:  52% 7274/13907 [4:24:22<4:03:58,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:24:37<?, ?it/s]
Training...:  52% 7274/13907 [4:24:24<4:03:58,  2.21s/it][A
Training...:  52% 7275/13907 [4:24:24<4:11:20,  2.27s/it][A
Training...:  52% 7276/13907 [4:24:27<4:06:27,  2.23s/it][A
Training...:  52% 7277/13907 [4:24:29<3:59:56,  2.17s/it][A
Training...:  52% 7278/13907 [4:24:31<3:54:30,  2.12s/it][A
Training...:  52% 7279/13907 [4:24:33<3:50:18,  2.08s/it][A
Training...:  52% 7280/13907 [4:24:35<3:46:25,  2.05s/it][A
Training...:  52% 7281/13907 [4:24:37<3:43:00,  2.02s/it][A
Training...:  52% 7282/13907 [4:24:38<3:39:20,  1.99s/it][A
Training...:  52% 7283/13907 [4:24:40<3:36:12,  1.96s/it][A
Training...:  52% 7284/13907 [4:24:42<3:33:12,  1.93s/it][A
Training...:  52% 7285/13907 [4:24:44<3:30:15,  1.91s/it][A
Training...:  52% 7286/13907 [4:24:46<3:26:51,  1.87s/it][A
Training...:  52% 7287/13907 [4:24:48<3:23:01,  1.84s/it][A
Training...:  52% 7288/13907 [4:24:49<3:19:35,  1.81s/it][A
Training...:  52% 7289/13907 [4:24:51<3:16:02,  1.78s/it][A
Training...:  52% 7290/13907 [4:24:53<3:12:58,  1.75s/it][A
Training...:  52% 7291/13907 [4:24:54<3:10:48,  1.73s/it][A
Training...:  52% 7292/13907 [4:24:56<3:06:21,  1.69s/it][A
Training...:  52% 7293/13907 [4:24:58<3:03:15,  1.66s/it][A
Training...:  52% 7294/13907 [4:24:59<2:57:57,  1.61s/it][A
Training...:  52% 7295/13907 [4:25:01<2:54:06,  1.58s/it][A
Training...:  52% 7296/13907 [4:25:02<2:47:35,  1.52s/it][A
Training...:  52% 7297/13907 [4:25:03<2:41:14,  1.46s/it][A
Training...:  52% 7298/13907 [4:25:05<2:34:47,  1.41s/it][A
Training...:  52% 7299/13907 [4:25:06<2:27:23,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:25:19<?, ?it/s]
Training...:  52% 7299/13907 [4:25:07<2:27:23,  1.34s/it][A
Training...:  52% 7300/13907 [4:25:07<2:23:47,  1.31s/it][A
Training...:  52% 7301/13907 [4:25:11<3:44:54,  2.04s/it][A
Training...:  53% 7302/13907 [4:25:14<4:30:09,  2.45s/it][A
Training...:  53% 7303/13907 [4:25:17<4:54:04,  2.67s/it][A
Training...:  53% 7304/13907 [4:25:20<5:06:03,  2.78s/it][A
Training...:  53% 7305/13907 [4:25:23<5:12:59,  2.84s/it][A
Training...:  53% 7306/13907 [4:25:26<5:13:45,  2.85s/it][A
Training...:  53% 7307/13907 [4:25:29<5:12:06,  2.84s/it][A
Training...:  53% 7308/13907 [4:25:32<5:08:24,  2.80s/it][A
Training...:  53% 7309/13907 [4:25:34<5:04:19,  2.77s/it][A
Training...:  53% 7310/13907 [4:25:37<4:58:31,  2.72s/it][A
Training...:  53% 7311/13907 [4:25:40<4:53:34,  2.67s/it][A
Training...:  53% 7312/13907 [4:25:42<4:48:28,  2.62s/it][A
Training...:  53% 7313/13907 [4:25:45<4:44:26,  2.59s/it][A
Training...:  53% 7314/13907 [4:25:47<4:40:20,  2.55s/it][A
Training...:  53% 7315/13907 [4:25:50<4:36:52,  2.52s/it][A
Training...:  53% 7316/13907 [4:25:52<4:32:24,  2.48s/it][A
Training...:  53% 7317/13907 [4:25:54<4:28:44,  2.45s/it][A
Training...:  53% 7318/13907 [4:25:57<4:25:41,  2.42s/it][A
Training...:  53% 7319/13907 [4:25:59<4:23:06,  2.40s/it][A
Training...:  53% 7320/13907 [4:26:01<4:18:27,  2.35s/it][A
Training...:  53% 7321/13907 [4:26:04<4:14:42,  2.32s/it][A
Training...:  53% 7322/13907 [4:26:06<4:12:42,  2.30s/it][A
Training...:  53% 7323/13907 [4:26:08<4:09:31,  2.27s/it][A
Training...:  53% 7324/13907 [4:26:10<4:05:46,  2.24s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:26:25<?, ?it/s]
Training...:  53% 7324/13907 [4:26:13<4:05:46,  2.24s/it][A
Training...:  53% 7325/13907 [4:26:13<4:12:32,  2.30s/it][A
Training...:  53% 7326/13907 [4:26:15<4:07:00,  2.25s/it][A
Training...:  53% 7327/13907 [4:26:17<3:59:30,  2.18s/it][A
Training...:  53% 7328/13907 [4:26:19<3:53:28,  2.13s/it][A
Training...:  53% 7329/13907 [4:26:21<3:48:45,  2.09s/it][A
Training...:  53% 7330/13907 [4:26:23<3:44:47,  2.05s/it][A
Training...:  53% 7331/13907 [4:26:25<3:40:45,  2.01s/it][A
Training...:  53% 7332/13907 [4:26:27<3:37:06,  1.98s/it][A
Training...:  53% 7333/13907 [4:26:28<3:32:53,  1.94s/it][A
Training...:  53% 7334/13907 [4:26:30<3:30:27,  1.92s/it][A
Training...:  53% 7335/13907 [4:26:32<3:29:35,  1.91s/it][A
Training...:  53% 7336/13907 [4:26:34<3:27:56,  1.90s/it][A
Training...:  53% 7337/13907 [4:26:36<3:24:07,  1.86s/it][A
Training...:  53% 7338/13907 [4:26:38<3:20:19,  1.83s/it][A
Training...:  53% 7339/13907 [4:26:39<3:17:09,  1.80s/it][A
Training...:  53% 7340/13907 [4:26:41<3:13:34,  1.77s/it][A
Training...:  53% 7341/13907 [4:26:43<3:09:30,  1.73s/it][A
Training...:  53% 7342/13907 [4:26:44<3:06:10,  1.70s/it][A
Training...:  53% 7343/13907 [4:26:46<3:02:08,  1.66s/it][A
Training...:  53% 7344/13907 [4:26:47<2:58:08,  1.63s/it][A
Training...:  53% 7345/13907 [4:26:49<2:53:03,  1.58s/it][A
Training...:  53% 7346/13907 [4:26:50<2:48:10,  1.54s/it][A
Training...:  53% 7347/13907 [4:26:52<2:42:43,  1.49s/it][A
Training...:  53% 7348/13907 [4:26:53<2:36:11,  1.43s/it][A
Training...:  53% 7349/13907 [4:26:54<2:29:49,  1.37s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:27:08<?, ?it/s]
Training...:  53% 7349/13907 [4:26:55<2:29:49,  1.37s/it][A
Training...:  53% 7350/13907 [4:26:55<2:26:42,  1.34s/it][A
Training...:  53% 7351/13907 [4:26:59<3:46:56,  2.08s/it][A
Training...:  53% 7352/13907 [4:27:03<4:27:19,  2.45s/it][A
Training...:  53% 7353/13907 [4:27:06<4:50:52,  2.66s/it][A
Training...:  53% 7354/13907 [4:27:09<5:00:39,  2.75s/it][A
Training...:  53% 7355/13907 [4:27:12<5:06:47,  2.81s/it][A
Training...:  53% 7356/13907 [4:27:14<5:07:41,  2.82s/it][A
Training...:  53% 7357/13907 [4:27:17<5:06:03,  2.80s/it][A
Training...:  53% 7358/13907 [4:27:20<5:02:23,  2.77s/it][A
Training...:  53% 7359/13907 [4:27:23<4:59:12,  2.74s/it][A
Training...:  53% 7360/13907 [4:27:25<4:55:30,  2.71s/it][A
Training...:  53% 7361/13907 [4:27:28<4:52:15,  2.68s/it][A
Training...:  53% 7362/13907 [4:27:30<4:47:44,  2.64s/it][A
Training...:  53% 7363/13907 [4:27:33<4:44:08,  2.61s/it][A
Training...:  53% 7364/13907 [4:27:35<4:39:01,  2.56s/it][A
Training...:  53% 7365/13907 [4:27:38<4:35:00,  2.52s/it][A
Training...:  53% 7366/13907 [4:27:40<4:31:32,  2.49s/it][A
Training...:  53% 7367/13907 [4:27:43<4:27:44,  2.46s/it][A
Training...:  53% 7368/13907 [4:27:45<4:23:08,  2.41s/it][A
Training...:  53% 7369/13907 [4:27:47<4:20:40,  2.39s/it][A
Training...:  53% 7370/13907 [4:27:50<4:17:07,  2.36s/it][A
Training...:  53% 7371/13907 [4:27:52<4:12:53,  2.32s/it][A
Training...:  53% 7372/13907 [4:27:54<4:08:48,  2.28s/it][A
Training...:  53% 7373/13907 [4:27:56<4:05:15,  2.25s/it][A
Training...:  53% 7374/13907 [4:27:58<4:01:48,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:28:13<?, ?it/s]
Training...:  53% 7374/13907 [4:28:01<4:01:48,  2.22s/it][A
Training...:  53% 7375/13907 [4:28:01<4:10:06,  2.30s/it][A
Training...:  53% 7376/13907 [4:28:03<4:06:35,  2.27s/it][A
Training...:  53% 7377/13907 [4:28:05<3:59:55,  2.20s/it][A
Training...:  53% 7378/13907 [4:28:07<3:53:51,  2.15s/it][A
Training...:  53% 7379/13907 [4:28:09<3:48:31,  2.10s/it][A
Training...:  53% 7380/13907 [4:28:11<3:44:01,  2.06s/it][A
Training...:  53% 7381/13907 [4:28:13<3:41:28,  2.04s/it][A
Training...:  53% 7382/13907 [4:28:15<3:38:42,  2.01s/it][A
Training...:  53% 7383/13907 [4:28:17<3:36:11,  1.99s/it][A
Training...:  53% 7384/13907 [4:28:19<3:33:22,  1.96s/it][A
Training...:  53% 7385/13907 [4:28:21<3:29:57,  1.93s/it][A
Training...:  53% 7386/13907 [4:28:23<3:28:04,  1.91s/it][A
Training...:  53% 7387/13907 [4:28:24<3:24:25,  1.88s/it][A
Training...:  53% 7388/13907 [4:28:26<3:20:41,  1.85s/it][A
Training...:  53% 7389/13907 [4:28:28<3:17:13,  1.82s/it][A
Training...:  53% 7390/13907 [4:28:30<3:13:16,  1.78s/it][A
Training...:  53% 7391/13907 [4:28:31<3:09:00,  1.74s/it][A
Training...:  53% 7392/13907 [4:28:33<3:05:08,  1.71s/it][A
Training...:  53% 7393/13907 [4:28:34<3:01:31,  1.67s/it][A
Training...:  53% 7394/13907 [4:28:36<2:57:38,  1.64s/it][A
Training...:  53% 7395/13907 [4:28:37<2:52:30,  1.59s/it][A
Training...:  53% 7396/13907 [4:28:39<2:47:05,  1.54s/it][A
Training...:  53% 7397/13907 [4:28:40<2:41:34,  1.49s/it][A
Training...:  53% 7398/13907 [4:28:41<2:34:58,  1.43s/it][A
Training...:  53% 7399/13907 [4:28:43<2:27:18,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:28:56<?, ?it/s]
Training...:  53% 7399/13907 [4:28:44<2:27:18,  1.36s/it][A
Training...:  53% 7400/13907 [4:28:44<2:21:40,  1.31s/it][A
Training...:  53% 7401/13907 [4:28:48<3:43:04,  2.06s/it][A
Training...:  53% 7402/13907 [4:28:51<4:25:18,  2.45s/it][A
Training...:  53% 7403/13907 [4:28:54<4:48:55,  2.67s/it][A
Training...:  53% 7404/13907 [4:28:57<5:01:46,  2.78s/it][A
Training...:  53% 7405/13907 [4:29:00<5:08:03,  2.84s/it][A
Training...:  53% 7406/13907 [4:29:03<5:09:14,  2.85s/it][A
Training...:  53% 7407/13907 [4:29:06<5:07:34,  2.84s/it][A
Training...:  53% 7408/13907 [4:29:09<5:03:14,  2.80s/it][A
Training...:  53% 7409/13907 [4:29:11<4:59:50,  2.77s/it][A
Training...:  53% 7410/13907 [4:29:14<4:54:02,  2.72s/it][A
Training...:  53% 7411/13907 [4:29:17<4:50:20,  2.68s/it][A
Training...:  53% 7412/13907 [4:29:19<4:48:17,  2.66s/it][A
Training...:  53% 7413/13907 [4:29:22<4:44:16,  2.63s/it][A
Training...:  53% 7414/13907 [4:29:24<4:38:50,  2.58s/it][A
Training...:  53% 7415/13907 [4:29:27<4:33:40,  2.53s/it][A
Training...:  53% 7416/13907 [4:29:29<4:29:07,  2.49s/it][A
Training...:  53% 7417/13907 [4:29:31<4:24:25,  2.44s/it][A
Training...:  53% 7418/13907 [4:29:34<4:20:06,  2.40s/it][A
Training...:  53% 7419/13907 [4:29:36<4:15:37,  2.36s/it][A
Training...:  53% 7420/13907 [4:29:38<4:12:10,  2.33s/it][A
Training...:  53% 7421/13907 [4:29:40<4:09:06,  2.30s/it][A
Training...:  53% 7422/13907 [4:29:43<4:04:33,  2.26s/it][A
Training...:  53% 7423/13907 [4:29:45<4:01:14,  2.23s/it][A
Training...:  53% 7424/13907 [4:29:47<3:57:03,  2.19s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:30:02<?, ?it/s]
Training...:  53% 7424/13907 [4:29:49<3:57:03,  2.19s/it][A
Training...:  53% 7425/13907 [4:29:49<4:03:44,  2.26s/it][A
Training...:  53% 7426/13907 [4:29:51<3:59:31,  2.22s/it][A
Training...:  53% 7427/13907 [4:29:53<3:53:06,  2.16s/it][A
Training...:  53% 7428/13907 [4:29:55<3:49:12,  2.12s/it][A
Training...:  53% 7429/13907 [4:29:57<3:44:41,  2.08s/it][A
Training...:  53% 7430/13907 [4:29:59<3:40:56,  2.05s/it][A
Training...:  53% 7431/13907 [4:30:01<3:36:51,  2.01s/it][A
Training...:  53% 7432/13907 [4:30:03<3:33:06,  1.97s/it][A
Training...:  53% 7433/13907 [4:30:05<3:30:03,  1.95s/it][A
Training...:  53% 7434/13907 [4:30:07<3:26:37,  1.92s/it][A
Training...:  53% 7435/13907 [4:30:09<3:24:26,  1.90s/it][A
Training...:  53% 7436/13907 [4:30:11<3:21:14,  1.87s/it][A
Training...:  53% 7437/13907 [4:30:12<3:17:56,  1.84s/it][A
Training...:  53% 7438/13907 [4:30:14<3:15:04,  1.81s/it][A
Training...:  53% 7439/13907 [4:30:16<3:11:47,  1.78s/it][A
Training...:  53% 7440/13907 [4:30:17<3:07:09,  1.74s/it][A
Training...:  54% 7441/13907 [4:30:19<3:03:31,  1.70s/it][A
Training...:  54% 7442/13907 [4:30:21<2:59:39,  1.67s/it][A
Training...:  54% 7443/13907 [4:30:22<2:56:05,  1.63s/it][A
Training...:  54% 7444/13907 [4:30:24<2:52:17,  1.60s/it][A
Training...:  54% 7445/13907 [4:30:25<2:47:29,  1.56s/it][A
Training...:  54% 7446/13907 [4:30:27<2:41:54,  1.50s/it][A
Training...:  54% 7447/13907 [4:30:28<2:36:39,  1.46s/it][A
Training...:  54% 7448/13907 [4:30:29<2:31:54,  1.41s/it][A
Training...:  54% 7449/13907 [4:30:30<2:25:15,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:30:44<?, ?it/s]
Training...:  54% 7449/13907 [4:30:32<2:25:15,  1.35s/it][A
Training...:  54% 7450/13907 [4:30:32<2:21:52,  1.32s/it][A
Training...:  54% 7451/13907 [4:30:36<3:47:51,  2.12s/it][A
Training...:  54% 7452/13907 [4:30:39<4:30:10,  2.51s/it][A
Training...:  54% 7453/13907 [4:30:42<4:52:42,  2.72s/it][A
Training...:  54% 7454/13907 [4:30:45<5:04:17,  2.83s/it][A
Training...:  54% 7455/13907 [4:30:48<5:12:59,  2.91s/it][A
Training...:  54% 7456/13907 [4:30:51<5:12:11,  2.90s/it][A
Training...:  54% 7457/13907 [4:30:54<5:10:13,  2.89s/it][A
Training...:  54% 7458/13907 [4:30:57<5:06:29,  2.85s/it][A
Training...:  54% 7459/13907 [4:31:00<5:03:06,  2.82s/it][A
Training...:  54% 7460/13907 [4:31:02<4:57:45,  2.77s/it][A
Training...:  54% 7461/13907 [4:31:05<4:52:26,  2.72s/it][A
Training...:  54% 7462/13907 [4:31:08<4:47:25,  2.68s/it][A
Training...:  54% 7463/13907 [4:31:10<4:43:01,  2.64s/it][A
Training...:  54% 7464/13907 [4:31:13<4:37:53,  2.59s/it][A
Training...:  54% 7465/13907 [4:31:15<4:33:41,  2.55s/it][A
Training...:  54% 7466/13907 [4:31:17<4:30:08,  2.52s/it][A
Training...:  54% 7467/13907 [4:31:20<4:25:45,  2.48s/it][A
Training...:  54% 7468/13907 [4:31:22<4:21:43,  2.44s/it][A
Training...:  54% 7469/13907 [4:31:25<4:19:12,  2.42s/it][A
Training...:  54% 7470/13907 [4:31:27<4:16:29,  2.39s/it][A
Training...:  54% 7471/13907 [4:31:29<4:12:42,  2.36s/it][A
Training...:  54% 7472/13907 [4:31:31<4:09:16,  2.32s/it][A
Training...:  54% 7473/13907 [4:31:34<4:05:43,  2.29s/it][A
Training...:  54% 7474/13907 [4:31:36<4:01:22,  2.25s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:31:51<?, ?it/s]
Training...:  54% 7474/13907 [4:31:38<4:01:22,  2.25s/it][A
Training...:  54% 7475/13907 [4:31:38<4:06:42,  2.30s/it][A
Training...:  54% 7476/13907 [4:31:40<4:01:34,  2.25s/it][A
Training...:  54% 7477/13907 [4:31:42<3:55:33,  2.20s/it][A
Training...:  54% 7478/13907 [4:31:44<3:52:04,  2.17s/it][A
Training...:  54% 7479/13907 [4:31:46<3:47:09,  2.12s/it][A
Training...:  54% 7480/13907 [4:31:49<3:43:51,  2.09s/it][A
Training...:  54% 7481/13907 [4:31:51<3:42:36,  2.08s/it][A
Training...:  54% 7482/13907 [4:31:53<3:39:26,  2.05s/it][A
Training...:  54% 7483/13907 [4:31:54<3:35:21,  2.01s/it][A
Training...:  54% 7484/13907 [4:31:56<3:31:09,  1.97s/it][A
Training...:  54% 7485/13907 [4:31:58<3:26:29,  1.93s/it][A
Training...:  54% 7486/13907 [4:32:00<3:22:51,  1.90s/it][A
Training...:  54% 7487/13907 [4:32:02<3:19:07,  1.86s/it][A
Training...:  54% 7488/13907 [4:32:04<3:16:09,  1.83s/it][A
Training...:  54% 7489/13907 [4:32:05<3:12:34,  1.80s/it][A
Training...:  54% 7490/13907 [4:32:07<3:08:41,  1.76s/it][A
Training...:  54% 7491/13907 [4:32:09<3:04:43,  1.73s/it][A
Training...:  54% 7492/13907 [4:32:10<3:00:28,  1.69s/it][A
Training...:  54% 7493/13907 [4:32:12<2:56:08,  1.65s/it][A
Training...:  54% 7494/13907 [4:32:13<2:51:51,  1.61s/it][A
Training...:  54% 7495/13907 [4:32:15<2:46:36,  1.56s/it][A
Training...:  54% 7496/13907 [4:32:16<2:40:48,  1.50s/it][A
Training...:  54% 7497/13907 [4:32:17<2:35:31,  1.46s/it][A
Training...:  54% 7498/13907 [4:32:19<2:29:03,  1.40s/it][A
Training...:  54% 7499/13907 [4:32:20<2:21:25,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:32:33<?, ?it/s]
Training...:  54% 7499/13907 [4:32:21<2:21:25,  1.32s/it][A
Training...:  54% 7500/13907 [4:32:21<2:17:30,  1.29s/it][A
Training...:  54% 7501/13907 [4:32:25<3:37:33,  2.04s/it][A
Training...:  54% 7502/13907 [4:32:28<4:20:23,  2.44s/it][A
Training...:  54% 7503/13907 [4:32:31<4:43:14,  2.65s/it][A
Training...:  54% 7504/13907 [4:32:34<4:54:54,  2.76s/it][A
Training...:  54% 7505/13907 [4:32:37<5:00:51,  2.82s/it][A
Training...:  54% 7506/13907 [4:32:40<5:01:27,  2.83s/it][A
Training...:  54% 7507/13907 [4:32:43<5:01:26,  2.83s/it][A
Training...:  54% 7508/13907 [4:32:46<4:59:26,  2.81s/it][A
Training...:  54% 7509/13907 [4:32:48<4:57:10,  2.79s/it][A
Training...:  54% 7510/13907 [4:32:51<4:53:41,  2.75s/it][A
Training...:  54% 7511/13907 [4:32:54<4:49:16,  2.71s/it][A
Training...:  54% 7512/13907 [4:32:56<4:44:44,  2.67s/it][A
Training...:  54% 7513/13907 [4:32:59<4:39:47,  2.63s/it][A
Training...:  54% 7514/13907 [4:33:01<4:34:34,  2.58s/it][A
Training...:  54% 7515/13907 [4:33:04<4:29:59,  2.53s/it][A
Training...:  54% 7516/13907 [4:33:06<4:26:36,  2.50s/it][A
Training...:  54% 7517/13907 [4:33:09<4:23:01,  2.47s/it][A
Training...:  54% 7518/13907 [4:33:11<4:21:48,  2.46s/it][A
Training...:  54% 7519/13907 [4:33:13<4:17:14,  2.42s/it][A
Training...:  54% 7520/13907 [4:33:16<4:12:36,  2.37s/it][A
Training...:  54% 7521/13907 [4:33:18<4:08:22,  2.33s/it][A
Training...:  54% 7522/13907 [4:33:20<4:04:52,  2.30s/it][A
Training...:  54% 7523/13907 [4:33:22<4:01:20,  2.27s/it][A
Training...:  54% 7524/13907 [4:33:24<3:56:55,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:33:39<?, ?it/s]
Training...:  54% 7524/13907 [4:33:27<3:56:55,  2.23s/it][A
Training...:  54% 7525/13907 [4:33:27<4:03:02,  2.29s/it][A
Training...:  54% 7526/13907 [4:33:29<3:58:23,  2.24s/it][A
Training...:  54% 7527/13907 [4:33:31<3:53:01,  2.19s/it][A
Training...:  54% 7528/13907 [4:33:33<3:47:43,  2.14s/it][A
Training...:  54% 7529/13907 [4:33:35<3:44:05,  2.11s/it][A
Training...:  54% 7530/13907 [4:33:37<3:40:19,  2.07s/it][A
Training...:  54% 7531/13907 [4:33:39<3:36:06,  2.03s/it][A
Training...:  54% 7532/13907 [4:33:41<3:32:28,  2.00s/it][A
Training...:  54% 7533/13907 [4:33:43<3:28:36,  1.96s/it][A
Training...:  54% 7534/13907 [4:33:45<3:25:34,  1.94s/it][A
Training...:  54% 7535/13907 [4:33:47<3:21:51,  1.90s/it][A
Training...:  54% 7536/13907 [4:33:48<3:19:02,  1.87s/it][A
Training...:  54% 7537/13907 [4:33:50<3:16:02,  1.85s/it][A
Training...:  54% 7538/13907 [4:33:52<3:12:30,  1.81s/it][A
Training...:  54% 7539/13907 [4:33:54<3:10:14,  1.79s/it][A
Training...:  54% 7540/13907 [4:33:55<3:06:41,  1.76s/it][A
Training...:  54% 7541/13907 [4:33:57<3:03:16,  1.73s/it][A
Training...:  54% 7542/13907 [4:33:59<2:59:42,  1.69s/it][A
Training...:  54% 7543/13907 [4:34:00<2:55:28,  1.65s/it][A
Training...:  54% 7544/13907 [4:34:02<2:50:55,  1.61s/it][A
Training...:  54% 7545/13907 [4:34:03<2:46:21,  1.57s/it][A
Training...:  54% 7546/13907 [4:34:05<2:41:31,  1.52s/it][A
Training...:  54% 7547/13907 [4:34:06<2:35:44,  1.47s/it][A
Training...:  54% 7548/13907 [4:34:07<2:30:03,  1.42s/it][A
Training...:  54% 7549/13907 [4:34:08<2:22:13,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:34:22<?, ?it/s]
Training...:  54% 7549/13907 [4:34:10<2:22:13,  1.34s/it][A
Training...:  54% 7550/13907 [4:34:10<2:19:10,  1.31s/it][A
Training...:  54% 7551/13907 [4:34:13<3:39:52,  2.08s/it][A
Training...:  54% 7552/13907 [4:34:17<4:23:25,  2.49s/it][A
Training...:  54% 7553/13907 [4:34:20<4:47:50,  2.72s/it][A
Training...:  54% 7554/13907 [4:34:23<4:59:55,  2.83s/it][A
Training...:  54% 7555/13907 [4:34:26<5:05:20,  2.88s/it][A
Training...:  54% 7556/13907 [4:34:29<5:04:53,  2.88s/it][A
Training...:  54% 7557/13907 [4:34:32<5:02:47,  2.86s/it][A
Training...:  54% 7558/13907 [4:34:35<4:58:45,  2.82s/it][A
Training...:  54% 7559/13907 [4:34:37<4:56:43,  2.80s/it][A
Training...:  54% 7560/13907 [4:34:40<4:54:48,  2.79s/it][A
Training...:  54% 7561/13907 [4:34:43<4:49:46,  2.74s/it][A
Training...:  54% 7562/13907 [4:34:45<4:43:33,  2.68s/it][A
Training...:  54% 7563/13907 [4:34:48<4:38:37,  2.64s/it][A
Training...:  54% 7564/13907 [4:34:50<4:32:43,  2.58s/it][A
Training...:  54% 7565/13907 [4:34:53<4:28:27,  2.54s/it][A
Training...:  54% 7566/13907 [4:34:55<4:27:03,  2.53s/it][A
Training...:  54% 7567/13907 [4:34:58<4:22:12,  2.48s/it][A
Training...:  54% 7568/13907 [4:35:00<4:17:23,  2.44s/it][A
Training...:  54% 7569/13907 [4:35:02<4:12:38,  2.39s/it][A
Training...:  54% 7570/13907 [4:35:05<4:08:59,  2.36s/it][A
Training...:  54% 7571/13907 [4:35:07<4:05:46,  2.33s/it][A
Training...:  54% 7572/13907 [4:35:09<4:02:11,  2.29s/it][A
Training...:  54% 7573/13907 [4:35:11<3:58:20,  2.26s/it][A
Training...:  54% 7574/13907 [4:35:13<3:54:47,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:35:28<?, ?it/s]
Training...:  54% 7574/13907 [4:35:16<3:54:47,  2.22s/it][A
Training...:  54% 7575/13907 [4:35:16<4:01:54,  2.29s/it][A
Training...:  54% 7576/13907 [4:35:18<3:57:14,  2.25s/it][A
Training...:  54% 7577/13907 [4:35:20<3:52:07,  2.20s/it][A
Training...:  54% 7578/13907 [4:35:22<3:46:51,  2.15s/it][A
Training...:  54% 7579/13907 [4:35:24<3:43:50,  2.12s/it][A
Training...:  55% 7580/13907 [4:35:26<3:39:54,  2.09s/it][A
Training...:  55% 7581/13907 [4:35:28<3:35:34,  2.04s/it][A
Training...:  55% 7582/13907 [4:35:30<3:32:19,  2.01s/it][A
Training...:  55% 7583/13907 [4:35:32<3:29:43,  1.99s/it][A
Training...:  55% 7584/13907 [4:35:34<3:26:33,  1.96s/it][A
Training...:  55% 7585/13907 [4:35:36<3:23:15,  1.93s/it][A
Training...:  55% 7586/13907 [4:35:38<3:20:22,  1.90s/it][A
Training...:  55% 7587/13907 [4:35:39<3:16:37,  1.87s/it][A
Training...:  55% 7588/13907 [4:35:41<3:12:18,  1.83s/it][A
Training...:  55% 7589/13907 [4:35:43<3:09:06,  1.80s/it][A
Training...:  55% 7590/13907 [4:35:44<3:05:42,  1.76s/it][A
Training...:  55% 7591/13907 [4:35:46<3:01:51,  1.73s/it][A
Training...:  55% 7592/13907 [4:35:48<2:57:35,  1.69s/it][A
Training...:  55% 7593/13907 [4:35:49<2:53:56,  1.65s/it][A
Training...:  55% 7594/13907 [4:35:51<2:50:58,  1.63s/it][A
Training...:  55% 7595/13907 [4:35:52<2:46:57,  1.59s/it][A
Training...:  55% 7596/13907 [4:35:54<2:42:53,  1.55s/it][A
Training...:  55% 7597/13907 [4:35:55<2:36:28,  1.49s/it][A
Training...:  55% 7598/13907 [4:35:56<2:29:50,  1.43s/it][A
Training...:  55% 7599/13907 [4:35:58<2:22:25,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:36:11<?, ?it/s]
Training...:  55% 7599/13907 [4:35:59<2:22:25,  1.35s/it][A
Training...:  55% 7600/13907 [4:35:59<2:18:40,  1.32s/it][A
Training...:  55% 7601/13907 [4:36:03<3:38:45,  2.08s/it][A
Training...:  55% 7602/13907 [4:36:06<4:20:36,  2.48s/it][A
Training...:  55% 7603/13907 [4:36:09<4:43:42,  2.70s/it][A
Training...:  55% 7604/13907 [4:36:12<4:53:35,  2.79s/it][A
Training...:  55% 7605/13907 [4:36:15<4:57:40,  2.83s/it][A
Training...:  55% 7606/13907 [4:36:18<4:57:37,  2.83s/it][A
Training...:  55% 7607/13907 [4:36:21<4:56:07,  2.82s/it][A
Training...:  55% 7608/13907 [4:36:24<4:52:47,  2.79s/it][A
Training...:  55% 7609/13907 [4:36:26<4:49:18,  2.76s/it][A
Training...:  55% 7610/13907 [4:36:29<4:43:49,  2.70s/it][A
Training...:  55% 7611/13907 [4:36:31<4:39:22,  2.66s/it][A
Training...:  55% 7612/13907 [4:36:34<4:34:35,  2.62s/it][A
Training...:  55% 7613/13907 [4:36:36<4:30:18,  2.58s/it][A
Training...:  55% 7614/13907 [4:36:39<4:25:58,  2.54s/it][A
Training...:  55% 7615/13907 [4:36:41<4:22:50,  2.51s/it][A
Training...:  55% 7616/13907 [4:36:44<4:18:23,  2.46s/it][A
Training...:  55% 7617/13907 [4:36:46<4:14:34,  2.43s/it][A
Training...:  55% 7618/13907 [4:36:48<4:12:02,  2.40s/it][A
Training...:  55% 7619/13907 [4:36:51<4:09:35,  2.38s/it][A
Training...:  55% 7620/13907 [4:36:53<4:05:42,  2.34s/it][A
Training...:  55% 7621/13907 [4:36:55<4:02:58,  2.32s/it][A
Training...:  55% 7622/13907 [4:36:57<3:59:08,  2.28s/it][A
Training...:  55% 7623/13907 [4:37:00<3:55:18,  2.25s/it][A
Training...:  55% 7624/13907 [4:37:02<3:51:01,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:37:16<?, ?it/s]
Training...:  55% 7624/13907 [4:37:04<3:51:01,  2.21s/it][A
Training...:  55% 7625/13907 [4:37:04<3:57:54,  2.27s/it][A
Training...:  55% 7626/13907 [4:37:06<3:53:49,  2.23s/it][A
Training...:  55% 7627/13907 [4:37:08<3:49:28,  2.19s/it][A
Training...:  55% 7628/13907 [4:37:10<3:44:16,  2.14s/it][A
Training...:  55% 7629/13907 [4:37:12<3:40:27,  2.11s/it][A
Training...:  55% 7630/13907 [4:37:14<3:38:34,  2.09s/it][A
Training...:  55% 7631/13907 [4:37:16<3:36:42,  2.07s/it][A
Training...:  55% 7632/13907 [4:37:18<3:33:06,  2.04s/it][A
Training...:  55% 7633/13907 [4:37:20<3:28:22,  1.99s/it][A
Training...:  55% 7634/13907 [4:37:22<3:23:46,  1.95s/it][A
Training...:  55% 7635/13907 [4:37:24<3:19:39,  1.91s/it][A
Training...:  55% 7636/13907 [4:37:26<3:15:42,  1.87s/it][A
Training...:  55% 7637/13907 [4:37:28<3:13:12,  1.85s/it][A
Training...:  55% 7638/13907 [4:37:29<3:09:11,  1.81s/it][A
Training...:  55% 7639/13907 [4:37:31<3:04:43,  1.77s/it][A
Training...:  55% 7640/13907 [4:37:33<3:00:49,  1.73s/it][A
Training...:  55% 7641/13907 [4:37:34<2:57:18,  1.70s/it][A
Training...:  55% 7642/13907 [4:37:36<2:53:04,  1.66s/it][A
Training...:  55% 7643/13907 [4:37:37<2:49:28,  1.62s/it][A
Training...:  55% 7644/13907 [4:37:39<2:46:29,  1.60s/it][A
Training...:  55% 7645/13907 [4:37:40<2:42:17,  1.56s/it][A
Training...:  55% 7646/13907 [4:37:42<2:37:15,  1.51s/it][A
Training...:  55% 7647/13907 [4:37:43<2:33:03,  1.47s/it][A
Training...:  55% 7648/13907 [4:37:44<2:26:46,  1.41s/it][A
Training...:  55% 7649/13907 [4:37:46<2:20:23,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:37:59<?, ?it/s]
Training...:  55% 7649/13907 [4:37:47<2:20:23,  1.35s/it][A
Training...:  55% 7650/13907 [4:37:47<2:16:11,  1.31s/it][A
Training...:  55% 7651/13907 [4:37:51<3:36:47,  2.08s/it][A
Training...:  55% 7652/13907 [4:37:54<4:17:09,  2.47s/it][A
Training...:  55% 7653/13907 [4:37:57<4:40:50,  2.69s/it][A
Training...:  55% 7654/13907 [4:38:00<4:51:32,  2.80s/it][A
Training...:  55% 7655/13907 [4:38:03<4:56:52,  2.85s/it][A
Training...:  55% 7656/13907 [4:38:06<4:58:17,  2.86s/it][A
Training...:  55% 7657/13907 [4:38:09<4:56:46,  2.85s/it][A
Training...:  55% 7658/13907 [4:38:12<4:54:19,  2.83s/it][A
Training...:  55% 7659/13907 [4:38:14<4:50:43,  2.79s/it][A
Training...:  55% 7660/13907 [4:38:17<4:46:06,  2.75s/it][A
Training...:  55% 7661/13907 [4:38:20<4:40:26,  2.69s/it][A
Training...:  55% 7662/13907 [4:38:22<4:34:20,  2.64s/it][A
Training...:  55% 7663/13907 [4:38:25<4:29:29,  2.59s/it][A
Training...:  55% 7664/13907 [4:38:27<4:25:42,  2.55s/it][A
Training...:  55% 7665/13907 [4:38:30<4:21:42,  2.52s/it][A
Training...:  55% 7666/13907 [4:38:32<4:17:27,  2.48s/it][A
Training...:  55% 7667/13907 [4:38:34<4:13:10,  2.43s/it][A
Training...:  55% 7668/13907 [4:38:37<4:09:12,  2.40s/it][A
Training...:  55% 7669/13907 [4:38:39<4:06:49,  2.37s/it][A
Training...:  55% 7670/13907 [4:38:41<4:03:30,  2.34s/it][A
Training...:  55% 7671/13907 [4:38:43<4:00:14,  2.31s/it][A
Training...:  55% 7672/13907 [4:38:46<3:56:32,  2.28s/it][A
Training...:  55% 7673/13907 [4:38:48<3:52:28,  2.24s/it][A
Training...:  55% 7674/13907 [4:38:50<3:49:12,  2.21s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:39:05<?, ?it/s]
Training...:  55% 7674/13907 [4:38:52<3:49:12,  2.21s/it][A
Training...:  55% 7675/13907 [4:38:52<3:55:49,  2.27s/it][A
Training...:  55% 7676/13907 [4:38:54<3:51:39,  2.23s/it][A
Training...:  55% 7677/13907 [4:38:56<3:45:58,  2.18s/it][A
Training...:  55% 7678/13907 [4:38:59<3:43:52,  2.16s/it][A
Training...:  55% 7679/13907 [4:39:01<3:38:11,  2.10s/it][A
Training...:  55% 7680/13907 [4:39:03<3:34:09,  2.06s/it][A
Training...:  55% 7681/13907 [4:39:05<3:31:25,  2.04s/it][A
Training...:  55% 7682/13907 [4:39:06<3:28:49,  2.01s/it][A
Training...:  55% 7683/13907 [4:39:08<3:23:55,  1.97s/it][A
Training...:  55% 7684/13907 [4:39:10<3:22:15,  1.95s/it][A
Training...:  55% 7685/13907 [4:39:12<3:18:21,  1.91s/it][A
Training...:  55% 7686/13907 [4:39:14<3:14:06,  1.87s/it][A
Training...:  55% 7687/13907 [4:39:16<3:10:12,  1.83s/it][A
Training...:  55% 7688/13907 [4:39:17<3:06:27,  1.80s/it][A
Training...:  55% 7689/13907 [4:39:19<3:02:53,  1.76s/it][A
Training...:  55% 7690/13907 [4:39:21<2:59:01,  1.73s/it][A
Training...:  55% 7691/13907 [4:39:22<2:55:30,  1.69s/it][A
Training...:  55% 7692/13907 [4:39:24<2:51:52,  1.66s/it][A
Training...:  55% 7693/13907 [4:39:25<2:48:50,  1.63s/it][A
Training...:  55% 7694/13907 [4:39:27<2:45:23,  1.60s/it][A
Training...:  55% 7695/13907 [4:39:28<2:40:11,  1.55s/it][A
Training...:  55% 7696/13907 [4:39:30<2:34:52,  1.50s/it][A
Training...:  55% 7697/13907 [4:39:31<2:29:59,  1.45s/it][A
Training...:  55% 7698/13907 [4:39:32<2:23:50,  1.39s/it][A
Training...:  55% 7699/13907 [4:39:33<2:16:43,  1.32s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:39:47<?, ?it/s]
Training...:  55% 7699/13907 [4:39:35<2:16:43,  1.32s/it][A
Training...:  55% 7700/13907 [4:39:35<2:13:33,  1.29s/it][A
Training...:  55% 7701/13907 [4:39:38<3:30:06,  2.03s/it][A
Training...:  55% 7702/13907 [4:39:42<4:12:52,  2.45s/it][A
Training...:  55% 7703/13907 [4:39:45<4:37:20,  2.68s/it][A
Training...:  55% 7704/13907 [4:39:48<4:49:54,  2.80s/it][A
Training...:  55% 7705/13907 [4:39:51<4:57:28,  2.88s/it][A
Training...:  55% 7706/13907 [4:39:54<4:57:40,  2.88s/it][A
Training...:  55% 7707/13907 [4:39:57<4:59:17,  2.90s/it][A
Training...:  55% 7708/13907 [4:40:00<4:56:08,  2.87s/it][A
Training...:  55% 7709/13907 [4:40:03<4:54:31,  2.85s/it][A
Training...:  55% 7710/13907 [4:40:05<4:48:48,  2.80s/it][A
Training...:  55% 7711/13907 [4:40:08<4:45:02,  2.76s/it][A
Training...:  55% 7712/13907 [4:40:11<4:38:46,  2.70s/it][A
Training...:  55% 7713/13907 [4:40:13<4:35:00,  2.66s/it][A
Training...:  55% 7714/13907 [4:40:16<4:29:35,  2.61s/it][A
Training...:  55% 7715/13907 [4:40:18<4:25:17,  2.57s/it][A
Training...:  55% 7716/13907 [4:40:21<4:20:14,  2.52s/it][A
Training...:  55% 7717/13907 [4:40:23<4:16:03,  2.48s/it][A
Training...:  55% 7718/13907 [4:40:25<4:11:42,  2.44s/it][A
Training...:  56% 7719/13907 [4:40:28<4:07:14,  2.40s/it][A
Training...:  56% 7720/13907 [4:40:30<4:03:48,  2.36s/it][A
Training...:  56% 7721/13907 [4:40:32<4:00:10,  2.33s/it][A
Training...:  56% 7722/13907 [4:40:34<3:57:34,  2.30s/it][A
Training...:  56% 7723/13907 [4:40:37<3:55:51,  2.29s/it][A
Training...:  56% 7724/13907 [4:40:39<3:53:05,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:40:54<?, ?it/s]
Training...:  56% 7724/13907 [4:40:41<3:53:05,  2.26s/it][A
Training...:  56% 7725/13907 [4:40:41<3:59:02,  2.32s/it][A
Training...:  56% 7726/13907 [4:40:43<3:54:24,  2.28s/it][A
Training...:  56% 7727/13907 [4:40:46<3:49:47,  2.23s/it][A
Training...:  56% 7728/13907 [4:40:48<3:43:39,  2.17s/it][A
Training...:  56% 7729/13907 [4:40:50<3:38:56,  2.13s/it][A
Training...:  56% 7730/13907 [4:40:52<3:34:46,  2.09s/it][A
Training...:  56% 7731/13907 [4:40:54<3:31:16,  2.05s/it][A
Training...:  56% 7732/13907 [4:40:55<3:27:25,  2.02s/it][A
Training...:  56% 7733/13907 [4:40:57<3:25:09,  1.99s/it][A
Training...:  56% 7734/13907 [4:40:59<3:21:41,  1.96s/it][A
Training...:  56% 7735/13907 [4:41:01<3:18:46,  1.93s/it][A
Training...:  56% 7736/13907 [4:41:03<3:15:20,  1.90s/it][A
Training...:  56% 7737/13907 [4:41:05<3:12:22,  1.87s/it][A
Training...:  56% 7738/13907 [4:41:07<3:08:38,  1.83s/it][A
Training...:  56% 7739/13907 [4:41:08<3:04:42,  1.80s/it][A
Training...:  56% 7740/13907 [4:41:10<3:00:46,  1.76s/it][A
Training...:  56% 7741/13907 [4:41:12<2:57:05,  1.72s/it][A
Training...:  56% 7742/13907 [4:41:13<2:53:34,  1.69s/it][A
Training...:  56% 7743/13907 [4:41:15<2:50:10,  1.66s/it][A
Training...:  56% 7744/13907 [4:41:16<2:46:55,  1.63s/it][A
Training...:  56% 7745/13907 [4:41:18<2:42:36,  1.58s/it][A
Training...:  56% 7746/13907 [4:41:19<2:38:32,  1.54s/it][A
Training...:  56% 7747/13907 [4:41:21<2:33:06,  1.49s/it][A
Training...:  56% 7748/13907 [4:41:22<2:27:02,  1.43s/it][A
Training...:  56% 7749/13907 [4:41:23<2:20:29,  1.37s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:41:37<?, ?it/s]
Training...:  56% 7749/13907 [4:41:24<2:20:29,  1.37s/it][A
Training...:  56% 7750/13907 [4:41:24<2:16:26,  1.33s/it][A
Training...:  56% 7751/13907 [4:41:28<3:34:01,  2.09s/it][A
Training...:  56% 7752/13907 [4:41:32<4:15:03,  2.49s/it][A
Training...:  56% 7753/13907 [4:41:35<4:38:17,  2.71s/it][A
Training...:  56% 7754/13907 [4:41:38<4:49:27,  2.82s/it][A
Training...:  56% 7755/13907 [4:41:41<4:56:23,  2.89s/it][A
Training...:  56% 7756/13907 [4:41:44<4:57:19,  2.90s/it][A
Training...:  56% 7757/13907 [4:41:47<4:55:24,  2.88s/it][A
Training...:  56% 7758/13907 [4:41:50<4:52:16,  2.85s/it][A
Training...:  56% 7759/13907 [4:41:52<4:48:02,  2.81s/it][A
Training...:  56% 7760/13907 [4:41:55<4:42:11,  2.75s/it][A
Training...:  56% 7761/13907 [4:41:58<4:38:21,  2.72s/it][A
Training...:  56% 7762/13907 [4:42:00<4:36:22,  2.70s/it][A
Training...:  56% 7763/13907 [4:42:03<4:31:59,  2.66s/it][A
Training...:  56% 7764/13907 [4:42:05<4:27:28,  2.61s/it][A
Training...:  56% 7765/13907 [4:42:08<4:23:42,  2.58s/it][A
Training...:  56% 7766/13907 [4:42:10<4:18:57,  2.53s/it][A
Training...:  56% 7767/13907 [4:42:13<4:15:41,  2.50s/it][A
Training...:  56% 7768/13907 [4:42:15<4:11:10,  2.45s/it][A
Training...:  56% 7769/13907 [4:42:17<4:07:38,  2.42s/it][A
Training...:  56% 7770/13907 [4:42:20<4:04:45,  2.39s/it][A
Training...:  56% 7771/13907 [4:42:22<4:00:36,  2.35s/it][A
Training...:  56% 7772/13907 [4:42:24<3:57:21,  2.32s/it][A
Training...:  56% 7773/13907 [4:42:26<3:54:12,  2.29s/it][A
Training...:  56% 7774/13907 [4:42:28<3:50:14,  2.25s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:42:43<?, ?it/s]
Training...:  56% 7774/13907 [4:42:31<3:50:14,  2.25s/it][A
Training...:  56% 7775/13907 [4:42:31<3:56:53,  2.32s/it][A
Training...:  56% 7776/13907 [4:42:33<3:53:12,  2.28s/it][A
Training...:  56% 7777/13907 [4:42:35<3:48:28,  2.24s/it][A
Training...:  56% 7778/13907 [4:42:37<3:42:34,  2.18s/it][A
Training...:  56% 7779/13907 [4:42:39<3:37:51,  2.13s/it][A
Training...:  56% 7780/13907 [4:42:41<3:34:05,  2.10s/it][A
Training...:  56% 7781/13907 [4:42:43<3:29:45,  2.05s/it][A
Training...:  56% 7782/13907 [4:42:45<3:26:37,  2.02s/it][A
Training...:  56% 7783/13907 [4:42:47<3:23:27,  1.99s/it][A
Training...:  56% 7784/13907 [4:42:49<3:19:30,  1.96s/it][A
Training...:  56% 7785/13907 [4:42:51<3:16:12,  1.92s/it][A
Training...:  56% 7786/13907 [4:42:53<3:13:28,  1.90s/it][A
Training...:  56% 7787/13907 [4:42:55<3:10:21,  1.87s/it][A
Training...:  56% 7788/13907 [4:42:56<3:07:13,  1.84s/it][A
Training...:  56% 7789/13907 [4:42:58<3:04:27,  1.81s/it][A
Training...:  56% 7790/13907 [4:43:00<3:00:56,  1.77s/it][A
Training...:  56% 7791/13907 [4:43:01<2:57:17,  1.74s/it][A
Training...:  56% 7792/13907 [4:43:03<2:54:42,  1.71s/it][A
Training...:  56% 7793/13907 [4:43:05<2:50:58,  1.68s/it][A
Training...:  56% 7794/13907 [4:43:06<2:47:29,  1.64s/it][A
Training...:  56% 7795/13907 [4:43:08<2:43:35,  1.61s/it][A
Training...:  56% 7796/13907 [4:43:09<2:38:22,  1.56s/it][A
Training...:  56% 7797/13907 [4:43:11<2:33:17,  1.51s/it][A
Training...:  56% 7798/13907 [4:43:12<2:27:31,  1.45s/it][A
Training...:  56% 7799/13907 [4:43:13<2:20:23,  1.38s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:43:27<?, ?it/s]
Training...:  56% 7799/13907 [4:43:14<2:20:23,  1.38s/it][A
Training...:  56% 7800/13907 [4:43:14<2:16:47,  1.34s/it][A
Training...:  56% 7801/13907 [4:43:18<3:33:42,  2.10s/it][A
Training...:  56% 7802/13907 [4:43:22<4:13:56,  2.50s/it][A
Training...:  56% 7803/13907 [4:43:25<4:35:58,  2.71s/it][A
Training...:  56% 7804/13907 [4:43:28<4:46:03,  2.81s/it][A
Training...:  56% 7805/13907 [4:43:31<4:51:17,  2.86s/it][A
Training...:  56% 7806/13907 [4:43:34<4:51:22,  2.87s/it][A
Training...:  56% 7807/13907 [4:43:37<4:50:10,  2.85s/it][A
Training...:  56% 7808/13907 [4:43:39<4:47:49,  2.83s/it][A
Training...:  56% 7809/13907 [4:43:42<4:44:11,  2.80s/it][A
Training...:  56% 7810/13907 [4:43:45<4:39:56,  2.75s/it][A
Training...:  56% 7811/13907 [4:43:47<4:36:18,  2.72s/it][A
Training...:  56% 7812/13907 [4:43:50<4:33:14,  2.69s/it][A
Training...:  56% 7813/13907 [4:43:53<4:29:15,  2.65s/it][A
Training...:  56% 7814/13907 [4:43:55<4:25:09,  2.61s/it][A
Training...:  56% 7815/13907 [4:43:58<4:21:04,  2.57s/it][A
Training...:  56% 7816/13907 [4:44:00<4:17:11,  2.53s/it][A
Training...:  56% 7817/13907 [4:44:02<4:13:46,  2.50s/it][A
Training...:  56% 7818/13907 [4:44:05<4:10:28,  2.47s/it][A
Training...:  56% 7819/13907 [4:44:07<4:06:45,  2.43s/it][A
Training...:  56% 7820/13907 [4:44:09<4:02:36,  2.39s/it][A
Training...:  56% 7821/13907 [4:44:12<3:59:56,  2.37s/it][A
Training...:  56% 7822/13907 [4:44:14<3:56:15,  2.33s/it][A
Training...:  56% 7823/13907 [4:44:16<3:52:23,  2.29s/it][A
Training...:  56% 7824/13907 [4:44:18<3:48:48,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:44:33<?, ?it/s]
Training...:  56% 7824/13907 [4:44:21<3:48:48,  2.26s/it][A
Training...:  56% 7825/13907 [4:44:21<3:54:42,  2.32s/it][A
Training...:  56% 7826/13907 [4:44:23<3:50:49,  2.28s/it][A
Training...:  56% 7827/13907 [4:44:25<3:45:05,  2.22s/it][A
Training...:  56% 7828/13907 [4:44:27<3:39:52,  2.17s/it][A
Training...:  56% 7829/13907 [4:44:29<3:36:59,  2.14s/it][A
Training...:  56% 7830/13907 [4:44:31<3:35:38,  2.13s/it][A
Training...:  56% 7831/13907 [4:44:33<3:32:52,  2.10s/it][A
Training...:  56% 7832/13907 [4:44:35<3:28:28,  2.06s/it][A
Training...:  56% 7833/13907 [4:44:37<3:24:06,  2.02s/it][A
Training...:  56% 7834/13907 [4:44:39<3:20:08,  1.98s/it][A
Training...:  56% 7835/13907 [4:44:41<3:16:33,  1.94s/it][A
Training...:  56% 7836/13907 [4:44:43<3:13:31,  1.91s/it][A
Training...:  56% 7837/13907 [4:44:45<3:10:37,  1.88s/it][A
Training...:  56% 7838/13907 [4:44:46<3:07:19,  1.85s/it][A
Training...:  56% 7839/13907 [4:44:48<3:04:26,  1.82s/it][A
Training...:  56% 7840/13907 [4:44:50<3:01:10,  1.79s/it][A
Training...:  56% 7841/13907 [4:44:52<2:57:56,  1.76s/it][A
Training...:  56% 7842/13907 [4:44:53<2:53:39,  1.72s/it][A
Training...:  56% 7843/13907 [4:44:55<2:50:32,  1.69s/it][A
Training...:  56% 7844/13907 [4:44:56<2:46:38,  1.65s/it][A
Training...:  56% 7845/13907 [4:44:58<2:43:06,  1.61s/it][A
Training...:  56% 7846/13907 [4:44:59<2:38:01,  1.56s/it][A
Training...:  56% 7847/13907 [4:45:01<2:32:33,  1.51s/it][A
Training...:  56% 7848/13907 [4:45:02<2:25:50,  1.44s/it][A
Training...:  56% 7849/13907 [4:45:03<2:18:34,  1.37s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:45:17<?, ?it/s]
Training...:  56% 7849/13907 [4:45:05<2:18:34,  1.37s/it][A
Training...:  56% 7850/13907 [4:45:05<2:14:44,  1.33s/it][A
Training...:  56% 7851/13907 [4:45:08<3:29:08,  2.07s/it][A
Training...:  56% 7852/13907 [4:45:12<4:12:06,  2.50s/it][A
Training...:  56% 7853/13907 [4:45:15<4:34:46,  2.72s/it][A
Training...:  56% 7854/13907 [4:45:18<4:46:41,  2.84s/it][A
Training...:  56% 7855/13907 [4:45:21<4:52:51,  2.90s/it][A
Training...:  56% 7856/13907 [4:45:24<4:54:32,  2.92s/it][A
Training...:  56% 7857/13907 [4:45:27<4:53:42,  2.91s/it][A
Training...:  57% 7858/13907 [4:45:30<4:50:17,  2.88s/it][A
Training...:  57% 7859/13907 [4:45:33<4:46:53,  2.85s/it][A
Training...:  57% 7860/13907 [4:45:35<4:41:29,  2.79s/it][A
Training...:  57% 7861/13907 [4:45:38<4:38:44,  2.77s/it][A
Training...:  57% 7862/13907 [4:45:41<4:34:52,  2.73s/it][A
Training...:  57% 7863/13907 [4:45:43<4:29:37,  2.68s/it][A
Training...:  57% 7864/13907 [4:45:46<4:26:02,  2.64s/it][A
Training...:  57% 7865/13907 [4:45:48<4:21:37,  2.60s/it][A
Training...:  57% 7866/13907 [4:45:51<4:17:45,  2.56s/it][A
Training...:  57% 7867/13907 [4:45:53<4:13:00,  2.51s/it][A
Training...:  57% 7868/13907 [4:45:56<4:08:34,  2.47s/it][A
Training...:  57% 7869/13907 [4:45:58<4:05:07,  2.44s/it][A
Training...:  57% 7870/13907 [4:46:00<4:01:52,  2.40s/it][A
Training...:  57% 7871/13907 [4:46:03<4:00:14,  2.39s/it][A
Training...:  57% 7872/13907 [4:46:05<3:58:36,  2.37s/it][A
Training...:  57% 7873/13907 [4:46:07<3:54:52,  2.34s/it][A
Training...:  57% 7874/13907 [4:46:09<3:49:53,  2.29s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:46:24<?, ?it/s]
Training...:  57% 7874/13907 [4:46:12<3:49:53,  2.29s/it][A
Training...:  57% 7875/13907 [4:46:12<3:56:09,  2.35s/it][A
Training...:  57% 7876/13907 [4:46:14<3:52:00,  2.31s/it][A
Training...:  57% 7877/13907 [4:46:16<3:46:20,  2.25s/it][A
Training...:  57% 7878/13907 [4:46:18<3:43:19,  2.22s/it][A
Training...:  57% 7879/13907 [4:46:20<3:38:52,  2.18s/it][A
Training...:  57% 7880/13907 [4:46:22<3:34:32,  2.14s/it][A
Training...:  57% 7881/13907 [4:46:24<3:30:49,  2.10s/it][A
Training...:  57% 7882/13907 [4:46:26<3:26:50,  2.06s/it][A
Training...:  57% 7883/13907 [4:46:28<3:22:37,  2.02s/it][A
Training...:  57% 7884/13907 [4:46:30<3:18:43,  1.98s/it][A
Training...:  57% 7885/13907 [4:46:32<3:14:53,  1.94s/it][A
Training...:  57% 7886/13907 [4:46:34<3:11:28,  1.91s/it][A
Training...:  57% 7887/13907 [4:46:36<3:08:04,  1.87s/it][A
Training...:  57% 7888/13907 [4:46:37<3:05:27,  1.85s/it][A
Training...:  57% 7889/13907 [4:46:39<3:01:40,  1.81s/it][A
Training...:  57% 7890/13907 [4:46:41<2:57:43,  1.77s/it][A
Training...:  57% 7891/13907 [4:46:43<2:54:30,  1.74s/it][A
Training...:  57% 7892/13907 [4:46:44<2:49:56,  1.70s/it][A
Training...:  57% 7893/13907 [4:46:46<2:45:58,  1.66s/it][A
Training...:  57% 7894/13907 [4:46:47<2:42:17,  1.62s/it][A
Training...:  57% 7895/13907 [4:46:49<2:38:20,  1.58s/it][A
Training...:  57% 7896/13907 [4:46:50<2:33:41,  1.53s/it][A
Training...:  57% 7897/13907 [4:46:51<2:27:43,  1.47s/it][A
Training...:  57% 7898/13907 [4:46:53<2:21:24,  1.41s/it][A
Training...:  57% 7899/13907 [4:46:54<2:14:22,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:47:07<?, ?it/s]
Training...:  57% 7899/13907 [4:46:55<2:14:22,  1.34s/it][A
Training...:  57% 7900/13907 [4:46:55<2:11:15,  1.31s/it][A
Training...:  57% 7901/13907 [4:46:59<3:26:53,  2.07s/it][A
Training...:  57% 7902/13907 [4:47:02<4:08:37,  2.48s/it][A
Training...:  57% 7903/13907 [4:47:06<4:30:59,  2.71s/it][A
Training...:  57% 7904/13907 [4:47:09<4:40:45,  2.81s/it][A
Training...:  57% 7905/13907 [4:47:12<4:46:41,  2.87s/it][A
Training...:  57% 7906/13907 [4:47:15<4:47:15,  2.87s/it][A
Training...:  57% 7907/13907 [4:47:17<4:47:05,  2.87s/it][A
Training...:  57% 7908/13907 [4:47:20<4:43:00,  2.83s/it][A
Training...:  57% 7909/13907 [4:47:23<4:39:32,  2.80s/it][A
Training...:  57% 7910/13907 [4:47:26<4:34:58,  2.75s/it][A
Training...:  57% 7911/13907 [4:47:28<4:30:25,  2.71s/it][A
Training...:  57% 7912/13907 [4:47:31<4:25:15,  2.65s/it][A
Training...:  57% 7913/13907 [4:47:33<4:21:26,  2.62s/it][A
Training...:  57% 7914/13907 [4:47:36<4:17:54,  2.58s/it][A
Training...:  57% 7915/13907 [4:47:38<4:14:22,  2.55s/it][A
Training...:  57% 7916/13907 [4:47:41<4:10:52,  2.51s/it][A
Training...:  57% 7917/13907 [4:47:43<4:09:06,  2.50s/it][A
Training...:  57% 7918/13907 [4:47:45<4:06:34,  2.47s/it][A
Training...:  57% 7919/13907 [4:47:48<4:01:34,  2.42s/it][A
Training...:  57% 7920/13907 [4:47:50<3:56:55,  2.37s/it][A
Training...:  57% 7921/13907 [4:47:52<3:53:46,  2.34s/it][A
Training...:  57% 7922/13907 [4:47:55<3:49:20,  2.30s/it][A
Training...:  57% 7923/13907 [4:47:57<3:45:44,  2.26s/it][A
Training...:  57% 7924/13907 [4:47:59<3:41:28,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:48:14<?, ?it/s]
Training...:  57% 7924/13907 [4:48:01<3:41:28,  2.22s/it][A
Training...:  57% 7925/13907 [4:48:01<3:47:17,  2.28s/it][A
Training...:  57% 7926/13907 [4:48:03<3:43:13,  2.24s/it][A
Training...:  57% 7927/13907 [4:48:05<3:37:24,  2.18s/it][A
Training...:  57% 7928/13907 [4:48:07<3:32:28,  2.13s/it][A
Training...:  57% 7929/13907 [4:48:09<3:28:52,  2.10s/it][A
Training...:  57% 7930/13907 [4:48:11<3:24:20,  2.05s/it][A
Training...:  57% 7931/13907 [4:48:13<3:19:32,  2.00s/it][A
Training...:  57% 7932/13907 [4:48:15<3:15:24,  1.96s/it][A
Training...:  57% 7933/13907 [4:48:17<3:12:40,  1.94s/it][A
Training...:  57% 7934/13907 [4:48:19<3:09:24,  1.90s/it][A
Training...:  57% 7935/13907 [4:48:21<3:06:00,  1.87s/it][A
Training...:  57% 7936/13907 [4:48:22<3:03:09,  1.84s/it][A
Training...:  57% 7937/13907 [4:48:24<3:00:54,  1.82s/it][A
Training...:  57% 7938/13907 [4:48:26<2:56:42,  1.78s/it][A
Training...:  57% 7939/13907 [4:48:28<2:53:27,  1.74s/it][A
Training...:  57% 7940/13907 [4:48:29<2:50:34,  1.72s/it][A
Training...:  57% 7941/13907 [4:48:31<2:46:54,  1.68s/it][A
Training...:  57% 7942/13907 [4:48:32<2:43:19,  1.64s/it][A
Training...:  57% 7943/13907 [4:48:34<2:40:25,  1.61s/it][A
Training...:  57% 7944/13907 [4:48:35<2:37:06,  1.58s/it][A
Training...:  57% 7945/13907 [4:48:37<2:33:38,  1.55s/it][A
Training...:  57% 7946/13907 [4:48:38<2:29:44,  1.51s/it][A
Training...:  57% 7947/13907 [4:48:40<2:24:50,  1.46s/it][A
Training...:  57% 7948/13907 [4:48:41<2:19:41,  1.41s/it][A
Training...:  57% 7949/13907 [4:48:42<2:13:35,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:48:56<?, ?it/s]
Training...:  57% 7949/13907 [4:48:43<2:13:35,  1.35s/it][A
Training...:  57% 7950/13907 [4:48:43<2:10:02,  1.31s/it][A
Training...:  57% 7951/13907 [4:48:47<3:21:47,  2.03s/it][A
Training...:  57% 7952/13907 [4:48:50<4:03:27,  2.45s/it][A
Training...:  57% 7953/13907 [4:48:54<4:27:30,  2.70s/it][A
Training...:  57% 7954/13907 [4:48:57<4:39:11,  2.81s/it][A
Training...:  57% 7955/13907 [4:49:00<4:46:27,  2.89s/it][A
Training...:  57% 7956/13907 [4:49:03<4:48:18,  2.91s/it][A
Training...:  57% 7957/13907 [4:49:06<4:45:58,  2.88s/it][A
Training...:  57% 7958/13907 [4:49:08<4:42:31,  2.85s/it][A
Training...:  57% 7959/13907 [4:49:11<4:39:53,  2.82s/it][A
Training...:  57% 7960/13907 [4:49:14<4:34:58,  2.77s/it][A
Training...:  57% 7961/13907 [4:49:17<4:30:36,  2.73s/it][A
Training...:  57% 7962/13907 [4:49:19<4:29:10,  2.72s/it][A
Training...:  57% 7963/13907 [4:49:22<4:25:34,  2.68s/it][A
Training...:  57% 7964/13907 [4:49:24<4:21:15,  2.64s/it][A
Training...:  57% 7965/13907 [4:49:27<4:16:07,  2.59s/it][A
Training...:  57% 7966/13907 [4:49:29<4:11:38,  2.54s/it][A
Training...:  57% 7967/13907 [4:49:32<4:06:38,  2.49s/it][A
Training...:  57% 7968/13907 [4:49:34<4:02:25,  2.45s/it][A
Training...:  57% 7969/13907 [4:49:36<3:58:09,  2.41s/it][A
Training...:  57% 7970/13907 [4:49:39<3:54:30,  2.37s/it][A
Training...:  57% 7971/13907 [4:49:41<3:51:07,  2.34s/it][A
Training...:  57% 7972/13907 [4:49:43<3:47:03,  2.30s/it][A
Training...:  57% 7973/13907 [4:49:45<3:43:45,  2.26s/it][A
Training...:  57% 7974/13907 [4:49:47<3:40:13,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:50:02<?, ?it/s]
Training...:  57% 7974/13907 [4:49:50<3:40:13,  2.23s/it][A
Training...:  57% 7975/13907 [4:49:50<3:46:47,  2.29s/it][A
Training...:  57% 7976/13907 [4:49:52<3:42:38,  2.25s/it][A
Training...:  57% 7977/13907 [4:49:54<3:37:02,  2.20s/it][A
Training...:  57% 7978/13907 [4:49:56<3:32:00,  2.15s/it][A
Training...:  57% 7979/13907 [4:49:58<3:28:12,  2.11s/it][A
Training...:  57% 7980/13907 [4:50:00<3:24:53,  2.07s/it][A
Training...:  57% 7981/13907 [4:50:02<3:21:45,  2.04s/it][A
Training...:  57% 7982/13907 [4:50:04<3:20:29,  2.03s/it][A
Training...:  57% 7983/13907 [4:50:06<3:18:03,  2.01s/it][A
Training...:  57% 7984/13907 [4:50:08<3:14:38,  1.97s/it][A
Training...:  57% 7985/13907 [4:50:10<3:11:38,  1.94s/it][A
Training...:  57% 7986/13907 [4:50:12<3:08:16,  1.91s/it][A
Training...:  57% 7987/13907 [4:50:13<3:06:46,  1.89s/it][A
Training...:  57% 7988/13907 [4:50:15<3:04:03,  1.87s/it][A
Training...:  57% 7989/13907 [4:50:17<3:01:06,  1.84s/it][A
Training...:  57% 7990/13907 [4:50:19<2:56:47,  1.79s/it][A
Training...:  57% 7991/13907 [4:50:20<2:53:18,  1.76s/it][A
Training...:  57% 7992/13907 [4:50:22<2:49:59,  1.72s/it][A
Training...:  57% 7993/13907 [4:50:24<2:45:21,  1.68s/it][A
Training...:  57% 7994/13907 [4:50:25<2:40:42,  1.63s/it][A
Training...:  57% 7995/13907 [4:50:27<2:35:59,  1.58s/it][A
Training...:  57% 7996/13907 [4:50:28<2:30:50,  1.53s/it][A
Training...:  58% 7997/13907 [4:50:29<2:24:42,  1.47s/it][A
Training...:  58% 7998/13907 [4:50:31<2:18:13,  1.40s/it][A
Training...:  58% 7999/13907 [4:50:32<2:11:09,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:50:45<?, ?it/s]
Training...:  58% 7999/13907 [4:50:33<2:11:09,  1.33s/it][A
Training...:  58% 8000/13907 [4:50:33<2:08:45,  1.31s/it][A
Training...:  58% 8001/13907 [4:50:37<3:20:07,  2.03s/it][A
Training...:  58% 8002/13907 [4:50:40<4:03:02,  2.47s/it][A
Training...:  58% 8003/13907 [4:50:43<4:26:44,  2.71s/it][A
Training...:  58% 8004/13907 [4:50:47<4:37:42,  2.82s/it][A
Training...:  58% 8005/13907 [4:50:50<4:42:02,  2.87s/it][A
Training...:  58% 8006/13907 [4:50:52<4:42:08,  2.87s/it][A
Training...:  58% 8007/13907 [4:50:55<4:41:16,  2.86s/it][A
Training...:  58% 8008/13907 [4:50:58<4:38:09,  2.83s/it][A
Training...:  58% 8009/13907 [4:51:01<4:35:11,  2.80s/it][A
Training...:  58% 8010/13907 [4:51:03<4:30:56,  2.76s/it][A
Training...:  58% 8011/13907 [4:51:06<4:27:31,  2.72s/it][A
Training...:  58% 8012/13907 [4:51:09<4:23:52,  2.69s/it][A
Training...:  58% 8013/13907 [4:51:11<4:19:42,  2.64s/it][A
Training...:  58% 8014/13907 [4:51:14<4:16:05,  2.61s/it][A
Training...:  58% 8015/13907 [4:51:16<4:11:22,  2.56s/it][A
Training...:  58% 8016/13907 [4:51:19<4:06:02,  2.51s/it][A
Training...:  58% 8017/13907 [4:51:21<4:03:05,  2.48s/it][A
Training...:  58% 8018/13907 [4:51:23<4:00:46,  2.45s/it][A
Training...:  58% 8019/13907 [4:51:26<3:57:15,  2.42s/it][A
Training...:  58% 8020/13907 [4:51:28<3:54:00,  2.38s/it][A
Training...:  58% 8021/13907 [4:51:30<3:49:49,  2.34s/it][A
Training...:  58% 8022/13907 [4:51:32<3:45:45,  2.30s/it][A
Training...:  58% 8023/13907 [4:51:35<3:42:54,  2.27s/it][A
Training...:  58% 8024/13907 [4:51:37<3:40:14,  2.25s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:51:52<?, ?it/s]
Training...:  58% 8024/13907 [4:51:39<3:40:14,  2.25s/it][A
Training...:  58% 8025/13907 [4:51:39<3:45:53,  2.30s/it][A
Training...:  58% 8026/13907 [4:51:41<3:42:01,  2.27s/it][A
Training...:  58% 8027/13907 [4:51:43<3:36:04,  2.20s/it][A
Training...:  58% 8028/13907 [4:51:45<3:30:45,  2.15s/it][A
Training...:  58% 8029/13907 [4:51:48<3:26:27,  2.11s/it][A
Training...:  58% 8030/13907 [4:51:49<3:22:09,  2.06s/it][A
Training...:  58% 8031/13907 [4:51:51<3:18:27,  2.03s/it][A
Training...:  58% 8032/13907 [4:51:53<3:15:40,  2.00s/it][A
Training...:  58% 8033/13907 [4:51:55<3:12:32,  1.97s/it][A
Training...:  58% 8034/13907 [4:51:57<3:09:01,  1.93s/it][A
Training...:  58% 8035/13907 [4:51:59<3:06:45,  1.91s/it][A
Training...:  58% 8036/13907 [4:52:01<3:02:51,  1.87s/it][A
Training...:  58% 8037/13907 [4:52:03<3:00:39,  1.85s/it][A
Training...:  58% 8038/13907 [4:52:04<2:58:40,  1.83s/it][A
Training...:  58% 8039/13907 [4:52:06<2:55:36,  1.80s/it][A
Training...:  58% 8040/13907 [4:52:08<2:51:52,  1.76s/it][A
Training...:  58% 8041/13907 [4:52:09<2:48:31,  1.72s/it][A
Training...:  58% 8042/13907 [4:52:11<2:44:17,  1.68s/it][A
Training...:  58% 8043/13907 [4:52:12<2:40:18,  1.64s/it][A
Training...:  58% 8044/13907 [4:52:14<2:37:09,  1.61s/it][A
Training...:  58% 8045/13907 [4:52:15<2:32:59,  1.57s/it][A
Training...:  58% 8046/13907 [4:52:17<2:27:29,  1.51s/it][A
Training...:  58% 8047/13907 [4:52:18<2:22:12,  1.46s/it][A
Training...:  58% 8048/13907 [4:52:19<2:16:10,  1.39s/it][A
Training...:  58% 8049/13907 [4:52:21<2:10:13,  1.33s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:52:34<?, ?it/s]
Training...:  58% 8049/13907 [4:52:22<2:10:13,  1.33s/it][A
Training...:  58% 8050/13907 [4:52:22<2:07:23,  1.30s/it][A
Training...:  58% 8051/13907 [4:52:26<3:27:07,  2.12s/it][A
Training...:  58% 8052/13907 [4:52:29<4:06:41,  2.53s/it][A
Training...:  58% 8053/13907 [4:52:33<4:28:19,  2.75s/it][A
Training...:  58% 8054/13907 [4:52:36<4:40:21,  2.87s/it][A
Training...:  58% 8055/13907 [4:52:39<4:45:51,  2.93s/it][A
Training...:  58% 8056/13907 [4:52:42<4:46:07,  2.93s/it][A
Training...:  58% 8057/13907 [4:52:45<4:46:43,  2.94s/it][A
Training...:  58% 8058/13907 [4:52:48<4:43:14,  2.91s/it][A
Training...:  58% 8059/13907 [4:52:50<4:39:17,  2.87s/it][A
Training...:  58% 8060/13907 [4:52:53<4:34:08,  2.81s/it][A
Training...:  58% 8061/13907 [4:52:56<4:30:14,  2.77s/it][A
Training...:  58% 8062/13907 [4:52:58<4:26:13,  2.73s/it][A
Training...:  58% 8063/13907 [4:53:01<4:21:40,  2.69s/it][A
Training...:  58% 8064/13907 [4:53:03<4:17:55,  2.65s/it][A
Training...:  58% 8065/13907 [4:53:06<4:13:04,  2.60s/it][A
Training...:  58% 8066/13907 [4:53:08<4:08:54,  2.56s/it][A
Training...:  58% 8067/13907 [4:53:11<4:05:39,  2.52s/it][A
Training...:  58% 8068/13907 [4:53:13<4:02:02,  2.49s/it][A
Training...:  58% 8069/13907 [4:53:16<3:57:52,  2.44s/it][A
Training...:  58% 8070/13907 [4:53:18<3:55:57,  2.43s/it][A
Training...:  58% 8071/13907 [4:53:20<3:54:50,  2.41s/it][A
Training...:  58% 8072/13907 [4:53:23<3:51:13,  2.38s/it][A
Training...:  58% 8073/13907 [4:53:25<3:47:39,  2.34s/it][A
Training...:  58% 8074/13907 [4:53:27<3:43:23,  2.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:53:42<?, ?it/s]
Training...:  58% 8074/13907 [4:53:30<3:43:23,  2.30s/it][A
Training...:  58% 8075/13907 [4:53:30<3:48:26,  2.35s/it][A
Training...:  58% 8076/13907 [4:53:32<3:42:16,  2.29s/it][A
Training...:  58% 8077/13907 [4:53:34<3:36:01,  2.22s/it][A
Training...:  58% 8078/13907 [4:53:36<3:29:47,  2.16s/it][A
Training...:  58% 8079/13907 [4:53:38<3:24:44,  2.11s/it][A
Training...:  58% 8080/13907 [4:53:40<3:21:15,  2.07s/it][A
Training...:  58% 8081/13907 [4:53:42<3:17:57,  2.04s/it][A
Training...:  58% 8082/13907 [4:53:44<3:15:18,  2.01s/it][A
Training...:  58% 8083/13907 [4:53:46<3:13:07,  1.99s/it][A
Training...:  58% 8084/13907 [4:53:48<3:09:24,  1.95s/it][A
Training...:  58% 8085/13907 [4:53:49<3:06:29,  1.92s/it][A
Training...:  58% 8086/13907 [4:53:51<3:03:15,  1.89s/it][A
Training...:  58% 8087/13907 [4:53:53<2:59:59,  1.86s/it][A
Training...:  58% 8088/13907 [4:53:55<2:56:50,  1.82s/it][A
Training...:  58% 8089/13907 [4:53:56<2:52:56,  1.78s/it][A
Training...:  58% 8090/13907 [4:53:58<2:49:45,  1.75s/it][A
Training...:  58% 8091/13907 [4:54:00<2:46:42,  1.72s/it][A
Training...:  58% 8092/13907 [4:54:01<2:42:54,  1.68s/it][A
Training...:  58% 8093/13907 [4:54:03<2:39:22,  1.64s/it][A
Training...:  58% 8094/13907 [4:54:04<2:35:48,  1.61s/it][A
Training...:  58% 8095/13907 [4:54:06<2:31:33,  1.56s/it][A
Training...:  58% 8096/13907 [4:54:07<2:26:27,  1.51s/it][A
Training...:  58% 8097/13907 [4:54:09<2:21:34,  1.46s/it][A
Training...:  58% 8098/13907 [4:54:10<2:15:55,  1.40s/it][A
Training...:  58% 8099/13907 [4:54:11<2:09:39,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:54:25<?, ?it/s]
Training...:  58% 8099/13907 [4:54:12<2:09:39,  1.34s/it][A
Training...:  58% 8100/13907 [4:54:12<2:07:09,  1.31s/it][A
Training...:  58% 8101/13907 [4:54:16<3:22:14,  2.09s/it][A
Training...:  58% 8102/13907 [4:54:20<4:00:53,  2.49s/it][A
Training...:  58% 8103/13907 [4:54:23<4:24:37,  2.74s/it][A
Training...:  58% 8104/13907 [4:54:26<4:34:54,  2.84s/it][A
Training...:  58% 8105/13907 [4:54:29<4:41:41,  2.91s/it][A
Training...:  58% 8106/13907 [4:54:32<4:41:33,  2.91s/it][A
Training...:  58% 8107/13907 [4:54:35<4:39:23,  2.89s/it][A
Training...:  58% 8108/13907 [4:54:38<4:35:38,  2.85s/it][A
Training...:  58% 8109/13907 [4:54:40<4:31:45,  2.81s/it][A
Training...:  58% 8110/13907 [4:54:43<4:26:48,  2.76s/it][A
Training...:  58% 8111/13907 [4:54:46<4:22:46,  2.72s/it][A
Training...:  58% 8112/13907 [4:54:48<4:18:06,  2.67s/it][A
Training...:  58% 8113/13907 [4:54:51<4:14:47,  2.64s/it][A
Training...:  58% 8114/13907 [4:54:53<4:11:40,  2.61s/it][A
Training...:  58% 8115/13907 [4:54:56<4:09:49,  2.59s/it][A
Training...:  58% 8116/13907 [4:54:58<4:05:19,  2.54s/it][A
Training...:  58% 8117/13907 [4:55:01<4:01:32,  2.50s/it][A
Training...:  58% 8118/13907 [4:55:03<3:58:23,  2.47s/it][A
Training...:  58% 8119/13907 [4:55:05<3:54:02,  2.43s/it][A
Training...:  58% 8120/13907 [4:55:08<3:50:10,  2.39s/it][A
Training...:  58% 8121/13907 [4:55:10<3:47:42,  2.36s/it][A
Training...:  58% 8122/13907 [4:55:12<3:45:11,  2.34s/it][A
Training...:  58% 8123/13907 [4:55:14<3:41:35,  2.30s/it][A
Training...:  58% 8124/13907 [4:55:17<3:37:54,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:55:31<?, ?it/s]
Training...:  58% 8124/13907 [4:55:19<3:37:54,  2.26s/it][A
Training...:  58% 8125/13907 [4:55:19<3:43:43,  2.32s/it][A
Training...:  58% 8126/13907 [4:55:21<3:39:06,  2.27s/it][A
Training...:  58% 8127/13907 [4:55:23<3:34:28,  2.23s/it][A
Training...:  58% 8128/13907 [4:55:25<3:29:46,  2.18s/it][A
Training...:  58% 8129/13907 [4:55:27<3:25:17,  2.13s/it][A
Training...:  58% 8130/13907 [4:55:29<3:21:11,  2.09s/it][A
Training...:  58% 8131/13907 [4:55:31<3:17:13,  2.05s/it][A
Training...:  58% 8132/13907 [4:55:33<3:13:13,  2.01s/it][A
Training...:  58% 8133/13907 [4:55:35<3:10:07,  1.98s/it][A
Training...:  58% 8134/13907 [4:55:37<3:07:15,  1.95s/it][A
Training...:  58% 8135/13907 [4:55:39<3:04:21,  1.92s/it][A
Training...:  59% 8136/13907 [4:55:41<3:01:15,  1.88s/it][A
Training...:  59% 8137/13907 [4:55:43<2:58:04,  1.85s/it][A
Training...:  59% 8138/13907 [4:55:44<2:55:10,  1.82s/it][A
Training...:  59% 8139/13907 [4:55:46<2:52:01,  1.79s/it][A
Training...:  59% 8140/13907 [4:55:48<2:48:30,  1.75s/it][A
Training...:  59% 8141/13907 [4:55:49<2:45:09,  1.72s/it][A
Training...:  59% 8142/13907 [4:55:51<2:41:23,  1.68s/it][A
Training...:  59% 8143/13907 [4:55:52<2:38:12,  1.65s/it][A
Training...:  59% 8144/13907 [4:55:54<2:34:35,  1.61s/it][A
Training...:  59% 8145/13907 [4:55:55<2:30:15,  1.56s/it][A
Training...:  59% 8146/13907 [4:55:57<2:25:47,  1.52s/it][A
Training...:  59% 8147/13907 [4:55:58<2:21:02,  1.47s/it][A
Training...:  59% 8148/13907 [4:55:59<2:16:02,  1.42s/it][A
Training...:  59% 8149/13907 [4:56:01<2:09:48,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:56:14<?, ?it/s]
Training...:  59% 8149/13907 [4:56:02<2:09:48,  1.35s/it][A
Training...:  59% 8150/13907 [4:56:02<2:06:55,  1.32s/it][A
Training...:  59% 8151/13907 [4:56:06<3:18:22,  2.07s/it][A
Training...:  59% 8152/13907 [4:56:09<3:57:43,  2.48s/it][A
Training...:  59% 8153/13907 [4:56:12<4:18:10,  2.69s/it][A
Training...:  59% 8154/13907 [4:56:15<4:29:28,  2.81s/it][A
Training...:  59% 8155/13907 [4:56:19<4:37:11,  2.89s/it][A
Training...:  59% 8156/13907 [4:56:22<4:40:20,  2.92s/it][A
Training...:  59% 8157/13907 [4:56:24<4:38:28,  2.91s/it][A
Training...:  59% 8158/13907 [4:56:27<4:34:19,  2.86s/it][A
Training...:  59% 8159/13907 [4:56:30<4:30:27,  2.82s/it][A
Training...:  59% 8160/13907 [4:56:33<4:25:46,  2.77s/it][A
Training...:  59% 8161/13907 [4:56:35<4:21:35,  2.73s/it][A
Training...:  59% 8162/13907 [4:56:38<4:17:15,  2.69s/it][A
Training...:  59% 8163/13907 [4:56:40<4:12:45,  2.64s/it][A
Training...:  59% 8164/13907 [4:56:43<4:09:06,  2.60s/it][A
Training...:  59% 8165/13907 [4:56:45<4:05:40,  2.57s/it][A
Training...:  59% 8166/13907 [4:56:48<4:01:46,  2.53s/it][A
Training...:  59% 8167/13907 [4:56:50<3:58:02,  2.49s/it][A
Training...:  59% 8168/13907 [4:56:53<3:55:44,  2.46s/it][A
Training...:  59% 8169/13907 [4:56:55<3:53:25,  2.44s/it][A
Training...:  59% 8170/13907 [4:56:57<3:48:54,  2.39s/it][A
Training...:  59% 8171/13907 [4:56:59<3:45:35,  2.36s/it][A
Training...:  59% 8172/13907 [4:57:02<3:42:29,  2.33s/it][A
Training...:  59% 8173/13907 [4:57:04<3:38:47,  2.29s/it][A
Training...:  59% 8174/13907 [4:57:06<3:35:04,  2.25s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:57:21<?, ?it/s]
Training...:  59% 8174/13907 [4:57:09<3:35:04,  2.25s/it][A
Training...:  59% 8175/13907 [4:57:09<3:40:59,  2.31s/it][A
Training...:  59% 8176/13907 [4:57:11<3:36:14,  2.26s/it][A
Training...:  59% 8177/13907 [4:57:13<3:30:20,  2.20s/it][A
Training...:  59% 8178/13907 [4:57:15<3:26:58,  2.17s/it][A
Training...:  59% 8179/13907 [4:57:17<3:22:29,  2.12s/it][A
Training...:  59% 8180/13907 [4:57:19<3:18:49,  2.08s/it][A
Training...:  59% 8181/13907 [4:57:21<3:16:13,  2.06s/it][A
Training...:  59% 8182/13907 [4:57:23<3:12:00,  2.01s/it][A
Training...:  59% 8183/13907 [4:57:25<3:09:32,  1.99s/it][A
Training...:  59% 8184/13907 [4:57:27<3:06:44,  1.96s/it][A
Training...:  59% 8185/13907 [4:57:28<3:03:06,  1.92s/it][A
Training...:  59% 8186/13907 [4:57:30<2:59:38,  1.88s/it][A
Training...:  59% 8187/13907 [4:57:32<2:56:36,  1.85s/it][A
Training...:  59% 8188/13907 [4:57:34<2:53:37,  1.82s/it][A
Training...:  59% 8189/13907 [4:57:35<2:51:24,  1.80s/it][A
Training...:  59% 8190/13907 [4:57:37<2:48:55,  1.77s/it][A
Training...:  59% 8191/13907 [4:57:39<2:45:33,  1.74s/it][A
Training...:  59% 8192/13907 [4:57:40<2:41:47,  1.70s/it][A
Training...:  59% 8193/13907 [4:57:42<2:37:56,  1.66s/it][A
Training...:  59% 8194/13907 [4:57:44<2:34:23,  1.62s/it][A
Training...:  59% 8195/13907 [4:57:45<2:30:15,  1.58s/it][A
Training...:  59% 8196/13907 [4:57:47<2:26:41,  1.54s/it][A
Training...:  59% 8197/13907 [4:57:48<2:21:29,  1.49s/it][A
Training...:  59% 8198/13907 [4:57:49<2:16:21,  1.43s/it][A
Training...:  59% 8199/13907 [4:57:50<2:09:23,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:58:04<?, ?it/s]
Training...:  59% 8199/13907 [4:57:52<2:09:23,  1.36s/it][A
Training...:  59% 8200/13907 [4:57:52<2:05:43,  1.32s/it][A
Training...:  59% 8201/13907 [4:57:55<3:17:24,  2.08s/it][A
Training...:  59% 8202/13907 [4:57:59<3:56:26,  2.49s/it][A
Training...:  59% 8203/13907 [4:58:02<4:17:23,  2.71s/it][A
Training...:  59% 8204/13907 [4:58:05<4:27:01,  2.81s/it][A
Training...:  59% 8205/13907 [4:58:08<4:32:14,  2.86s/it][A
Training...:  59% 8206/13907 [4:58:11<4:33:45,  2.88s/it][A
Training...:  59% 8207/13907 [4:58:14<4:31:54,  2.86s/it][A
Training...:  59% 8208/13907 [4:58:17<4:29:25,  2.84s/it][A
Training...:  59% 8209/13907 [4:58:19<4:27:55,  2.82s/it][A
Training...:  59% 8210/13907 [4:58:22<4:24:14,  2.78s/it][A
Training...:  59% 8211/13907 [4:58:25<4:21:49,  2.76s/it][A
Training...:  59% 8212/13907 [4:58:27<4:16:35,  2.70s/it][A
Training...:  59% 8213/13907 [4:58:30<4:12:01,  2.66s/it][A
Training...:  59% 8214/13907 [4:58:32<4:08:01,  2.61s/it][A
Training...:  59% 8215/13907 [4:58:35<4:05:17,  2.59s/it][A
Training...:  59% 8216/13907 [4:58:37<4:00:45,  2.54s/it][A
Training...:  59% 8217/13907 [4:58:40<3:57:13,  2.50s/it][A
Training...:  59% 8218/13907 [4:58:42<3:53:51,  2.47s/it][A
Training...:  59% 8219/13907 [4:58:45<3:53:24,  2.46s/it][A
Training...:  59% 8220/13907 [4:58:47<3:49:20,  2.42s/it][A
Training...:  59% 8221/13907 [4:58:49<3:45:15,  2.38s/it][A
Training...:  59% 8222/13907 [4:58:52<3:41:24,  2.34s/it][A
Training...:  59% 8223/13907 [4:58:54<3:37:43,  2.30s/it][A
Training...:  59% 8224/13907 [4:58:56<3:33:47,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:59:11<?, ?it/s]
Training...:  59% 8224/13907 [4:58:58<3:33:47,  2.26s/it][A
Training...:  59% 8225/13907 [4:58:58<3:39:09,  2.31s/it][A
Training...:  59% 8226/13907 [4:59:00<3:34:44,  2.27s/it][A
Training...:  59% 8227/13907 [4:59:03<3:30:26,  2.22s/it][A
Training...:  59% 8228/13907 [4:59:05<3:27:21,  2.19s/it][A
Training...:  59% 8229/13907 [4:59:07<3:22:22,  2.14s/it][A
Training...:  59% 8230/13907 [4:59:09<3:17:48,  2.09s/it][A
Training...:  59% 8231/13907 [4:59:11<3:14:11,  2.05s/it][A
Training...:  59% 8232/13907 [4:59:13<3:10:40,  2.02s/it][A
Training...:  59% 8233/13907 [4:59:15<3:07:55,  1.99s/it][A
Training...:  59% 8234/13907 [4:59:16<3:04:50,  1.96s/it][A
Training...:  59% 8235/13907 [4:59:18<3:02:06,  1.93s/it][A
Training...:  59% 8236/13907 [4:59:20<3:00:19,  1.91s/it][A
Training...:  59% 8237/13907 [4:59:22<2:57:08,  1.87s/it][A
Training...:  59% 8238/13907 [4:59:24<2:53:48,  1.84s/it][A
Training...:  59% 8239/13907 [4:59:25<2:50:39,  1.81s/it][A
Training...:  59% 8240/13907 [4:59:27<2:47:18,  1.77s/it][A
Training...:  59% 8241/13907 [4:59:29<2:43:49,  1.73s/it][A
Training...:  59% 8242/13907 [4:59:30<2:40:19,  1.70s/it][A
Training...:  59% 8243/13907 [4:59:32<2:37:00,  1.66s/it][A
Training...:  59% 8244/13907 [4:59:33<2:32:53,  1.62s/it][A
Training...:  59% 8245/13907 [4:59:35<2:28:36,  1.57s/it][A
Training...:  59% 8246/13907 [4:59:36<2:24:12,  1.53s/it][A
Training...:  59% 8247/13907 [4:59:38<2:19:29,  1.48s/it][A
Training...:  59% 8248/13907 [4:59:39<2:13:50,  1.42s/it][A
Training...:  59% 8249/13907 [4:59:40<2:07:30,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [4:59:54<?, ?it/s]
Training...:  59% 8249/13907 [4:59:41<2:07:30,  1.35s/it][A
Training...:  59% 8250/13907 [4:59:41<2:04:54,  1.32s/it][A
Training...:  59% 8251/13907 [4:59:45<3:19:23,  2.12s/it][A
Training...:  59% 8252/13907 [4:59:49<3:57:29,  2.52s/it][A
Training...:  59% 8253/13907 [4:59:52<4:18:57,  2.75s/it][A
Training...:  59% 8254/13907 [4:59:55<4:28:01,  2.84s/it][A
Training...:  59% 8255/13907 [4:59:58<4:32:03,  2.89s/it][A
Training...:  59% 8256/13907 [5:00:01<4:32:10,  2.89s/it][A
Training...:  59% 8257/13907 [5:00:04<4:30:52,  2.88s/it][A
Training...:  59% 8258/13907 [5:00:07<4:27:52,  2.85s/it][A
Training...:  59% 8259/13907 [5:00:09<4:25:16,  2.82s/it][A
Training...:  59% 8260/13907 [5:00:12<4:22:16,  2.79s/it][A
Training...:  59% 8261/13907 [5:00:15<4:19:10,  2.75s/it][A
Training...:  59% 8262/13907 [5:00:17<4:14:27,  2.70s/it][A
Training...:  59% 8263/13907 [5:00:20<4:10:44,  2.67s/it][A
Training...:  59% 8264/13907 [5:00:23<4:06:14,  2.62s/it][A
Training...:  59% 8265/13907 [5:00:25<4:02:29,  2.58s/it][A
Training...:  59% 8266/13907 [5:00:27<3:57:14,  2.52s/it][A
Training...:  59% 8267/13907 [5:00:30<3:53:07,  2.48s/it][A
Training...:  59% 8268/13907 [5:00:32<3:50:04,  2.45s/it][A
Training...:  59% 8269/13907 [5:00:35<3:46:54,  2.41s/it][A
Training...:  59% 8270/13907 [5:00:37<3:42:53,  2.37s/it][A
Training...:  59% 8271/13907 [5:00:39<3:39:02,  2.33s/it][A
Training...:  59% 8272/13907 [5:00:41<3:35:20,  2.29s/it][A
Training...:  59% 8273/13907 [5:00:43<3:31:45,  2.26s/it][A
Training...:  59% 8274/13907 [5:00:46<3:27:59,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:01:00<?, ?it/s]
Training...:  59% 8274/13907 [5:00:48<3:27:59,  2.22s/it][A
Training...:  60% 8275/13907 [5:00:48<3:33:28,  2.27s/it][A
Training...:  60% 8276/13907 [5:00:50<3:29:23,  2.23s/it][A
Training...:  60% 8277/13907 [5:00:52<3:24:25,  2.18s/it][A
Training...:  60% 8278/13907 [5:00:54<3:20:00,  2.13s/it][A
Training...:  60% 8279/13907 [5:00:56<3:16:44,  2.10s/it][A
Training...:  60% 8280/13907 [5:00:58<3:13:47,  2.07s/it][A
Training...:  60% 8281/13907 [5:01:00<3:11:06,  2.04s/it][A
Training...:  60% 8282/13907 [5:01:02<3:07:41,  2.00s/it][A
Training...:  60% 8283/13907 [5:01:04<3:04:50,  1.97s/it][A
Training...:  60% 8284/13907 [5:01:06<3:02:58,  1.95s/it][A
Training...:  60% 8285/13907 [5:01:08<3:00:42,  1.93s/it][A
Training...:  60% 8286/13907 [5:01:10<2:57:40,  1.90s/it][A
Training...:  60% 8287/13907 [5:01:11<2:54:27,  1.86s/it][A
Training...:  60% 8288/13907 [5:01:13<2:51:07,  1.83s/it][A
Training...:  60% 8289/13907 [5:01:15<2:48:01,  1.79s/it][A
Training...:  60% 8290/13907 [5:01:17<2:45:26,  1.77s/it][A
Training...:  60% 8291/13907 [5:01:18<2:42:16,  1.73s/it][A
Training...:  60% 8292/13907 [5:01:20<2:37:58,  1.69s/it][A
Training...:  60% 8293/13907 [5:01:21<2:34:04,  1.65s/it][A
Training...:  60% 8294/13907 [5:01:23<2:30:24,  1.61s/it][A
Training...:  60% 8295/13907 [5:01:24<2:26:27,  1.57s/it][A
Training...:  60% 8296/13907 [5:01:26<2:22:38,  1.53s/it][A
Training...:  60% 8297/13907 [5:01:27<2:17:58,  1.48s/it][A
Training...:  60% 8298/13907 [5:01:28<2:12:51,  1.42s/it][A
Training...:  60% 8299/13907 [5:01:30<2:06:14,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:01:43<?, ?it/s]
Training...:  60% 8299/13907 [5:01:31<2:06:14,  1.35s/it][A
Training...:  60% 8300/13907 [5:01:31<2:03:24,  1.32s/it][A
Training...:  60% 8301/13907 [5:01:35<3:22:39,  2.17s/it][A
Training...:  60% 8302/13907 [5:01:38<3:58:49,  2.56s/it][A
Training...:  60% 8303/13907 [5:01:42<4:20:42,  2.79s/it][A
Training...:  60% 8304/13907 [5:01:45<4:34:38,  2.94s/it][A
Training...:  60% 8305/13907 [5:01:48<4:38:31,  2.98s/it][A
Training...:  60% 8306/13907 [5:01:51<4:36:59,  2.97s/it][A
Training...:  60% 8307/13907 [5:01:54<4:34:15,  2.94s/it][A
Training...:  60% 8308/13907 [5:01:57<4:29:59,  2.89s/it][A
Training...:  60% 8309/13907 [5:01:59<4:25:53,  2.85s/it][A
Training...:  60% 8310/13907 [5:02:02<4:20:39,  2.79s/it][A
Training...:  60% 8311/13907 [5:02:05<4:16:55,  2.75s/it][A
Training...:  60% 8312/13907 [5:02:07<4:12:16,  2.71s/it][A
Training...:  60% 8313/13907 [5:02:10<4:07:08,  2.65s/it][A
Training...:  60% 8314/13907 [5:02:12<4:02:10,  2.60s/it][A
Training...:  60% 8315/13907 [5:02:15<3:59:01,  2.56s/it][A
Training...:  60% 8316/13907 [5:02:17<3:55:28,  2.53s/it][A
Training...:  60% 8317/13907 [5:02:20<3:51:28,  2.48s/it][A
Training...:  60% 8318/13907 [5:02:22<3:48:11,  2.45s/it][A
Training...:  60% 8319/13907 [5:02:24<3:44:39,  2.41s/it][A
Training...:  60% 8320/13907 [5:02:27<3:40:58,  2.37s/it][A
Training...:  60% 8321/13907 [5:02:29<3:37:54,  2.34s/it][A
Training...:  60% 8322/13907 [5:02:31<3:34:23,  2.30s/it][A
Training...:  60% 8323/13907 [5:02:33<3:31:21,  2.27s/it][A
Training...:  60% 8324/13907 [5:02:36<3:28:36,  2.24s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:02:50<?, ?it/s]
Training...:  60% 8324/13907 [5:02:38<3:28:36,  2.24s/it][A
Training...:  60% 8325/13907 [5:02:38<3:34:03,  2.30s/it][A
Training...:  60% 8326/13907 [5:02:40<3:30:26,  2.26s/it][A
Training...:  60% 8327/13907 [5:02:42<3:25:34,  2.21s/it][A
Training...:  60% 8328/13907 [5:02:44<3:21:32,  2.17s/it][A
Training...:  60% 8329/13907 [5:02:46<3:18:04,  2.13s/it][A
Training...:  60% 8330/13907 [5:02:48<3:14:02,  2.09s/it][A
Training...:  60% 8331/13907 [5:02:50<3:10:34,  2.05s/it][A
Training...:  60% 8332/13907 [5:02:52<3:06:58,  2.01s/it][A
Training...:  60% 8333/13907 [5:02:54<3:03:42,  1.98s/it][A
Training...:  60% 8334/13907 [5:02:56<3:01:22,  1.95s/it][A
Training...:  60% 8335/13907 [5:02:58<2:58:42,  1.92s/it][A
Training...:  60% 8336/13907 [5:03:00<2:56:21,  1.90s/it][A
Training...:  60% 8337/13907 [5:03:02<2:55:50,  1.89s/it][A
Training...:  60% 8338/13907 [5:03:03<2:52:10,  1.86s/it][A
Training...:  60% 8339/13907 [5:03:05<2:48:55,  1.82s/it][A
Training...:  60% 8340/13907 [5:03:07<2:45:31,  1.78s/it][A
Training...:  60% 8341/13907 [5:03:08<2:41:25,  1.74s/it][A
Training...:  60% 8342/13907 [5:03:10<2:37:53,  1.70s/it][A
Training...:  60% 8343/13907 [5:03:12<2:34:59,  1.67s/it][A
Training...:  60% 8344/13907 [5:03:13<2:32:31,  1.65s/it][A
Training...:  60% 8345/13907 [5:03:15<2:27:32,  1.59s/it][A
Training...:  60% 8346/13907 [5:03:16<2:22:17,  1.54s/it][A
Training...:  60% 8347/13907 [5:03:17<2:17:02,  1.48s/it][A
Training...:  60% 8348/13907 [5:03:19<2:12:29,  1.43s/it][A
Training...:  60% 8349/13907 [5:03:20<2:05:58,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:03:34<?, ?it/s]
Training...:  60% 8349/13907 [5:03:21<2:05:58,  1.36s/it][A
Training...:  60% 8350/13907 [5:03:21<2:03:02,  1.33s/it][A
Training...:  60% 8351/13907 [5:03:25<3:14:16,  2.10s/it][A
Training...:  60% 8352/13907 [5:03:29<3:54:22,  2.53s/it][A
Training...:  60% 8353/13907 [5:03:32<4:16:00,  2.77s/it][A
Training...:  60% 8354/13907 [5:03:35<4:26:36,  2.88s/it][A
Training...:  60% 8355/13907 [5:03:38<4:32:46,  2.95s/it][A
Training...:  60% 8356/13907 [5:03:41<4:34:05,  2.96s/it][A
Training...:  60% 8357/13907 [5:03:44<4:34:01,  2.96s/it][A
Training...:  60% 8358/13907 [5:03:47<4:30:37,  2.93s/it][A
Training...:  60% 8359/13907 [5:03:50<4:25:59,  2.88s/it][A
Training...:  60% 8360/13907 [5:03:52<4:20:09,  2.81s/it][A
Training...:  60% 8361/13907 [5:03:55<4:15:47,  2.77s/it][A
Training...:  60% 8362/13907 [5:03:58<4:11:02,  2.72s/it][A
Training...:  60% 8363/13907 [5:04:00<4:06:35,  2.67s/it][A
Training...:  60% 8364/13907 [5:04:03<4:03:04,  2.63s/it][A
Training...:  60% 8365/13907 [5:04:05<4:00:28,  2.60s/it][A
Training...:  60% 8366/13907 [5:04:08<3:56:09,  2.56s/it][A
Training...:  60% 8367/13907 [5:04:10<3:52:53,  2.52s/it][A
Training...:  60% 8368/13907 [5:04:13<3:49:39,  2.49s/it][A
Training...:  60% 8369/13907 [5:04:15<3:47:08,  2.46s/it][A
Training...:  60% 8370/13907 [5:04:17<3:43:34,  2.42s/it][A
Training...:  60% 8371/13907 [5:04:20<3:40:34,  2.39s/it][A
Training...:  60% 8372/13907 [5:04:22<3:37:52,  2.36s/it][A
Training...:  60% 8373/13907 [5:04:24<3:35:23,  2.34s/it][A
Training...:  60% 8374/13907 [5:04:26<3:32:25,  2.30s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:04:41<?, ?it/s]
Training...:  60% 8374/13907 [5:04:29<3:32:25,  2.30s/it][A
Training...:  60% 8375/13907 [5:04:29<3:38:04,  2.37s/it][A
Training...:  60% 8376/13907 [5:04:31<3:34:26,  2.33s/it][A
Training...:  60% 8377/13907 [5:04:33<3:29:24,  2.27s/it][A
Training...:  60% 8378/13907 [5:04:35<3:25:29,  2.23s/it][A
Training...:  60% 8379/13907 [5:04:38<3:22:24,  2.20s/it][A
Training...:  60% 8380/13907 [5:04:40<3:18:10,  2.15s/it][A
Training...:  60% 8381/13907 [5:04:42<3:14:14,  2.11s/it][A
Training...:  60% 8382/13907 [5:04:44<3:10:02,  2.06s/it][A
Training...:  60% 8383/13907 [5:04:46<3:06:02,  2.02s/it][A
Training...:  60% 8384/13907 [5:04:47<3:02:27,  1.98s/it][A
Training...:  60% 8385/13907 [5:04:49<2:59:42,  1.95s/it][A
Training...:  60% 8386/13907 [5:04:51<2:56:44,  1.92s/it][A
Training...:  60% 8387/13907 [5:04:53<2:53:42,  1.89s/it][A
Training...:  60% 8388/13907 [5:04:55<2:50:33,  1.85s/it][A
Training...:  60% 8389/13907 [5:04:56<2:47:41,  1.82s/it][A
Training...:  60% 8390/13907 [5:04:58<2:44:52,  1.79s/it][A
Training...:  60% 8391/13907 [5:05:00<2:42:21,  1.77s/it][A
Training...:  60% 8392/13907 [5:05:02<2:39:16,  1.73s/it][A
Training...:  60% 8393/13907 [5:05:03<2:36:10,  1.70s/it][A
Training...:  60% 8394/13907 [5:05:05<2:32:40,  1.66s/it][A
Training...:  60% 8395/13907 [5:05:06<2:29:15,  1.62s/it][A
Training...:  60% 8396/13907 [5:05:08<2:24:06,  1.57s/it][A
Training...:  60% 8397/13907 [5:05:09<2:18:37,  1.51s/it][A
Training...:  60% 8398/13907 [5:05:10<2:12:07,  1.44s/it][A
Training...:  60% 8399/13907 [5:05:12<2:06:03,  1.37s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:05:25<?, ?it/s]
Training...:  60% 8399/13907 [5:05:13<2:06:03,  1.37s/it][A
Training...:  60% 8400/13907 [5:05:13<2:02:40,  1.34s/it][A
Training...:  60% 8401/13907 [5:05:17<3:12:27,  2.10s/it][A
Training...:  60% 8402/13907 [5:05:20<3:50:17,  2.51s/it][A
Training...:  60% 8403/13907 [5:05:23<4:10:38,  2.73s/it][A
Training...:  60% 8404/13907 [5:05:27<4:21:50,  2.85s/it][A
Training...:  60% 8405/13907 [5:05:30<4:27:34,  2.92s/it][A
Training...:  60% 8406/13907 [5:05:33<4:27:39,  2.92s/it][A
Training...:  60% 8407/13907 [5:05:35<4:26:36,  2.91s/it][A
Training...:  60% 8408/13907 [5:05:38<4:23:25,  2.87s/it][A
Training...:  60% 8409/13907 [5:05:41<4:21:17,  2.85s/it][A
Training...:  60% 8410/13907 [5:05:44<4:17:15,  2.81s/it][A
Training...:  60% 8411/13907 [5:05:46<4:14:41,  2.78s/it][A
Training...:  60% 8412/13907 [5:05:49<4:11:07,  2.74s/it][A
Training...:  60% 8413/13907 [5:05:52<4:06:22,  2.69s/it][A
Training...:  61% 8414/13907 [5:05:54<4:01:59,  2.64s/it][A
Training...:  61% 8415/13907 [5:05:57<3:58:04,  2.60s/it][A
Training...:  61% 8416/13907 [5:05:59<3:53:41,  2.55s/it][A
Training...:  61% 8417/13907 [5:06:02<3:51:08,  2.53s/it][A
Training...:  61% 8418/13907 [5:06:04<3:48:30,  2.50s/it][A
Training...:  61% 8419/13907 [5:06:07<3:47:18,  2.49s/it][A
Training...:  61% 8420/13907 [5:06:09<3:43:12,  2.44s/it][A
Training...:  61% 8421/13907 [5:06:11<3:38:45,  2.39s/it][A
Training...:  61% 8422/13907 [5:06:13<3:36:03,  2.36s/it][A
Training...:  61% 8423/13907 [5:06:16<3:32:19,  2.32s/it][A
Training...:  61% 8424/13907 [5:06:18<3:28:20,  2.28s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:06:33<?, ?it/s]
Training...:  61% 8424/13907 [5:06:20<3:28:20,  2.28s/it][A
Training...:  61% 8425/13907 [5:06:20<3:33:12,  2.33s/it][A
Training...:  61% 8426/13907 [5:06:22<3:28:59,  2.29s/it][A
Training...:  61% 8427/13907 [5:06:25<3:25:18,  2.25s/it][A
Training...:  61% 8428/13907 [5:06:27<3:19:43,  2.19s/it][A
Training...:  61% 8429/13907 [5:06:29<3:15:04,  2.14s/it][A
Training...:  61% 8430/13907 [5:06:31<3:12:01,  2.10s/it][A
Training...:  61% 8431/13907 [5:06:33<3:08:12,  2.06s/it][A
Training...:  61% 8432/13907 [5:06:35<3:04:07,  2.02s/it][A
Training...:  61% 8433/13907 [5:06:37<3:00:32,  1.98s/it][A
Training...:  61% 8434/13907 [5:06:38<2:57:26,  1.95s/it][A
Training...:  61% 8435/13907 [5:06:40<2:54:05,  1.91s/it][A
Training...:  61% 8436/13907 [5:06:42<2:51:34,  1.88s/it][A
Training...:  61% 8437/13907 [5:06:44<2:48:48,  1.85s/it][A
Training...:  61% 8438/13907 [5:06:46<2:45:56,  1.82s/it][A
Training...:  61% 8439/13907 [5:06:47<2:42:58,  1.79s/it][A
Training...:  61% 8440/13907 [5:06:49<2:39:59,  1.76s/it][A
Training...:  61% 8441/13907 [5:06:51<2:36:34,  1.72s/it][A
Training...:  61% 8442/13907 [5:06:52<2:33:46,  1.69s/it][A
Training...:  61% 8443/13907 [5:06:54<2:30:46,  1.66s/it][A
Training...:  61% 8444/13907 [5:06:55<2:27:09,  1.62s/it][A
Training...:  61% 8445/13907 [5:06:57<2:23:01,  1.57s/it][A
Training...:  61% 8446/13907 [5:06:58<2:18:23,  1.52s/it][A
Training...:  61% 8447/13907 [5:07:00<2:14:06,  1.47s/it][A
Training...:  61% 8448/13907 [5:07:01<2:08:20,  1.41s/it][A
Training...:  61% 8449/13907 [5:07:02<2:02:41,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:07:16<?, ?it/s]
Training...:  61% 8449/13907 [5:07:03<2:02:41,  1.35s/it][A
Training...:  61% 8450/13907 [5:07:03<2:00:06,  1.32s/it][A
Training...:  61% 8451/13907 [5:07:07<3:10:19,  2.09s/it][A
Training...:  61% 8452/13907 [5:07:11<3:46:26,  2.49s/it][A
Training...:  61% 8453/13907 [5:07:14<4:06:10,  2.71s/it][A
Training...:  61% 8454/13907 [5:07:17<4:15:53,  2.82s/it][A
Training...:  61% 8455/13907 [5:07:20<4:21:35,  2.88s/it][A
Training...:  61% 8456/13907 [5:07:23<4:23:36,  2.90s/it][A
Training...:  61% 8457/13907 [5:07:26<4:23:53,  2.91s/it][A
Training...:  61% 8458/13907 [5:07:29<4:19:57,  2.86s/it][A
Training...:  61% 8459/13907 [5:07:31<4:15:36,  2.82s/it][A
Training...:  61% 8460/13907 [5:07:34<4:11:56,  2.78s/it][A
Training...:  61% 8461/13907 [5:07:37<4:08:06,  2.73s/it][A
Training...:  61% 8462/13907 [5:07:39<4:03:39,  2.68s/it][A
Training...:  61% 8463/13907 [5:07:42<4:00:28,  2.65s/it][A
Training...:  61% 8464/13907 [5:07:44<3:56:09,  2.60s/it][A
Training...:  61% 8465/13907 [5:07:47<3:52:51,  2.57s/it][A
Training...:  61% 8466/13907 [5:07:49<3:49:12,  2.53s/it][A
Training...:  61% 8467/13907 [5:07:51<3:45:27,  2.49s/it][A
Training...:  61% 8468/13907 [5:07:54<3:41:56,  2.45s/it][A
Training...:  61% 8469/13907 [5:07:56<3:37:55,  2.40s/it][A
Training...:  61% 8470/13907 [5:07:58<3:34:05,  2.36s/it][A
Training...:  61% 8471/13907 [5:08:01<3:33:01,  2.35s/it][A
Training...:  61% 8472/13907 [5:08:03<3:29:19,  2.31s/it][A
Training...:  61% 8473/13907 [5:08:05<3:26:26,  2.28s/it][A
Training...:  61% 8474/13907 [5:08:07<3:23:47,  2.25s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:08:22<?, ?it/s]
Training...:  61% 8474/13907 [5:08:10<3:23:47,  2.25s/it][A
Training...:  61% 8475/13907 [5:08:10<3:29:19,  2.31s/it][A
Training...:  61% 8476/13907 [5:08:12<3:27:47,  2.30s/it][A
Training...:  61% 8477/13907 [5:08:14<3:22:11,  2.23s/it][A
Training...:  61% 8478/13907 [5:08:16<3:17:43,  2.19s/it][A
Training...:  61% 8479/13907 [5:08:18<3:14:09,  2.15s/it][A
Training...:  61% 8480/13907 [5:08:20<3:11:23,  2.12s/it][A
Training...:  61% 8481/13907 [5:08:22<3:07:40,  2.08s/it][A
Training...:  61% 8482/13907 [5:08:24<3:03:25,  2.03s/it][A
Training...:  61% 8483/13907 [5:08:26<2:59:32,  1.99s/it][A
Training...:  61% 8484/13907 [5:08:28<2:57:03,  1.96s/it][A
Training...:  61% 8485/13907 [5:08:30<2:53:53,  1.92s/it][A
Training...:  61% 8486/13907 [5:08:32<2:50:57,  1.89s/it][A
Training...:  61% 8487/13907 [5:08:33<2:48:09,  1.86s/it][A
Training...:  61% 8488/13907 [5:08:35<2:45:27,  1.83s/it][A
Training...:  61% 8489/13907 [5:08:37<2:42:31,  1.80s/it][A
Training...:  61% 8490/13907 [5:08:39<2:39:49,  1.77s/it][A
Training...:  61% 8491/13907 [5:08:40<2:37:51,  1.75s/it][A
Training...:  61% 8492/13907 [5:08:42<2:34:43,  1.71s/it][A
Training...:  61% 8493/13907 [5:08:44<2:31:56,  1.68s/it][A
Training...:  61% 8494/13907 [5:08:45<2:28:03,  1.64s/it][A
Training...:  61% 8495/13907 [5:08:47<2:23:00,  1.59s/it][A
Training...:  61% 8496/13907 [5:08:48<2:17:53,  1.53s/it][A
Training...:  61% 8497/13907 [5:08:49<2:12:17,  1.47s/it][A
Training...:  61% 8498/13907 [5:08:51<2:07:14,  1.41s/it][A
Training...:  61% 8499/13907 [5:08:52<2:01:34,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:09:05<?, ?it/s]
Training...:  61% 8499/13907 [5:08:53<2:01:34,  1.35s/it][A
Training...:  61% 8500/13907 [5:08:53<1:58:44,  1.32s/it][A
Training...:  61% 8501/13907 [5:08:57<3:07:51,  2.09s/it][A
Training...:  61% 8502/13907 [5:09:00<3:43:31,  2.48s/it][A
Training...:  61% 8503/13907 [5:09:04<4:04:34,  2.72s/it][A
Training...:  61% 8504/13907 [5:09:07<4:13:50,  2.82s/it][A
Training...:  61% 8505/13907 [5:09:10<4:19:33,  2.88s/it][A
Training...:  61% 8506/13907 [5:09:13<4:19:26,  2.88s/it][A
Training...:  61% 8507/13907 [5:09:15<4:18:53,  2.88s/it][A
Training...:  61% 8508/13907 [5:09:18<4:15:43,  2.84s/it][A
Training...:  61% 8509/13907 [5:09:21<4:12:03,  2.80s/it][A
Training...:  61% 8510/13907 [5:09:24<4:08:48,  2.77s/it][A
Training...:  61% 8511/13907 [5:09:26<4:05:55,  2.73s/it][A
Training...:  61% 8512/13907 [5:09:29<4:02:14,  2.69s/it][A
Training...:  61% 8513/13907 [5:09:31<3:57:47,  2.64s/it][A
Training...:  61% 8514/13907 [5:09:34<3:56:58,  2.64s/it][A
Training...:  61% 8515/13907 [5:09:36<3:52:49,  2.59s/it][A
Training...:  61% 8516/13907 [5:09:39<3:49:18,  2.55s/it][A
Training...:  61% 8517/13907 [5:09:41<3:46:17,  2.52s/it][A
Training...:  61% 8518/13907 [5:09:44<3:42:37,  2.48s/it][A
Training...:  61% 8519/13907 [5:09:46<3:39:16,  2.44s/it][A
Training...:  61% 8520/13907 [5:09:48<3:36:30,  2.41s/it][A
Training...:  61% 8521/13907 [5:09:51<3:35:39,  2.40s/it][A
Training...:  61% 8522/13907 [5:09:53<3:32:39,  2.37s/it][A
Training...:  61% 8523/13907 [5:09:55<3:28:15,  2.32s/it][A
Training...:  61% 8524/13907 [5:09:58<3:25:04,  2.29s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:10:12<?, ?it/s]
Training...:  61% 8524/13907 [5:10:00<3:25:04,  2.29s/it][A
Training...:  61% 8525/13907 [5:10:00<3:28:55,  2.33s/it][A
Training...:  61% 8526/13907 [5:10:02<3:24:50,  2.28s/it][A
Training...:  61% 8527/13907 [5:10:04<3:19:43,  2.23s/it][A
Training...:  61% 8528/13907 [5:10:06<3:16:12,  2.19s/it][A
Training...:  61% 8529/13907 [5:10:08<3:12:06,  2.14s/it][A
Training...:  61% 8530/13907 [5:10:10<3:07:46,  2.10s/it][A
Training...:  61% 8531/13907 [5:10:12<3:04:47,  2.06s/it][A
Training...:  61% 8532/13907 [5:10:14<3:01:41,  2.03s/it][A
Training...:  61% 8533/13907 [5:10:16<2:59:51,  2.01s/it][A
Training...:  61% 8534/13907 [5:10:18<2:57:50,  1.99s/it][A
Training...:  61% 8535/13907 [5:10:20<2:56:59,  1.98s/it][A
Training...:  61% 8536/13907 [5:10:22<2:53:43,  1.94s/it][A
Training...:  61% 8537/13907 [5:10:24<2:50:17,  1.90s/it][A
Training...:  61% 8538/13907 [5:10:26<2:47:18,  1.87s/it][A
Training...:  61% 8539/13907 [5:10:27<2:43:57,  1.83s/it][A
Training...:  61% 8540/13907 [5:10:29<2:39:49,  1.79s/it][A
Training...:  61% 8541/13907 [5:10:31<2:36:09,  1.75s/it][A
Training...:  61% 8542/13907 [5:10:32<2:33:02,  1.71s/it][A
Training...:  61% 8543/13907 [5:10:34<2:29:40,  1.67s/it][A
Training...:  61% 8544/13907 [5:10:35<2:25:40,  1.63s/it][A
Training...:  61% 8545/13907 [5:10:37<2:21:19,  1.58s/it][A
Training...:  61% 8546/13907 [5:10:38<2:16:33,  1.53s/it][A
Training...:  61% 8547/13907 [5:10:40<2:11:29,  1.47s/it][A
Training...:  61% 8548/13907 [5:10:41<2:05:48,  1.41s/it][A
Training...:  61% 8549/13907 [5:10:42<1:59:35,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:10:56<?, ?it/s]
Training...:  61% 8549/13907 [5:10:43<1:59:35,  1.34s/it][A
Training...:  61% 8550/13907 [5:10:43<1:56:33,  1.31s/it][A
Training...:  61% 8551/13907 [5:10:47<3:06:43,  2.09s/it][A
Training...:  61% 8552/13907 [5:10:51<3:41:39,  2.48s/it][A
Training...:  62% 8553/13907 [5:10:54<4:01:05,  2.70s/it][A
Training...:  62% 8554/13907 [5:10:57<4:11:16,  2.82s/it][A
Training...:  62% 8555/13907 [5:11:00<4:17:34,  2.89s/it][A
Training...:  62% 8556/13907 [5:11:03<4:20:13,  2.92s/it][A
Training...:  62% 8557/13907 [5:11:06<4:17:59,  2.89s/it][A
Training...:  62% 8558/13907 [5:11:09<4:14:34,  2.86s/it][A
Training...:  62% 8559/13907 [5:11:11<4:11:17,  2.82s/it][A
Training...:  62% 8560/13907 [5:11:14<4:08:10,  2.78s/it][A
Training...:  62% 8561/13907 [5:11:17<4:05:14,  2.75s/it][A
Training...:  62% 8562/13907 [5:11:19<4:00:38,  2.70s/it][A
Training...:  62% 8563/13907 [5:11:22<3:57:20,  2.66s/it][A
Training...:  62% 8564/13907 [5:11:24<3:53:16,  2.62s/it][A
Training...:  62% 8565/13907 [5:11:27<3:53:12,  2.62s/it][A
Training...:  62% 8566/13907 [5:11:29<3:47:48,  2.56s/it][A
Training...:  62% 8567/13907 [5:11:32<3:43:55,  2.52s/it][A
Training...:  62% 8568/13907 [5:11:34<3:40:03,  2.47s/it][A
Training...:  62% 8569/13907 [5:11:37<3:36:20,  2.43s/it][A
Training...:  62% 8570/13907 [5:11:39<3:32:12,  2.39s/it][A
Training...:  62% 8571/13907 [5:11:41<3:30:08,  2.36s/it][A
Training...:  62% 8572/13907 [5:11:43<3:26:58,  2.33s/it][A
Training...:  62% 8573/13907 [5:11:46<3:24:28,  2.30s/it][A
Training...:  62% 8574/13907 [5:11:48<3:22:20,  2.28s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:12:03<?, ?it/s]
Training...:  62% 8574/13907 [5:11:50<3:22:20,  2.28s/it][A
Training...:  62% 8575/13907 [5:11:50<3:27:44,  2.34s/it][A
Training...:  62% 8576/13907 [5:11:52<3:23:46,  2.29s/it][A
Training...:  62% 8577/13907 [5:11:55<3:19:25,  2.24s/it][A
Training...:  62% 8578/13907 [5:11:57<3:14:19,  2.19s/it][A
Training...:  62% 8579/13907 [5:11:59<3:10:26,  2.14s/it][A
Training...:  62% 8580/13907 [5:12:01<3:07:26,  2.11s/it][A
Training...:  62% 8581/13907 [5:12:03<3:03:54,  2.07s/it][A
Training...:  62% 8582/13907 [5:12:05<3:00:36,  2.04s/it][A
Training...:  62% 8583/13907 [5:12:07<2:57:32,  2.00s/it][A
Training...:  62% 8584/13907 [5:12:09<2:56:27,  1.99s/it][A
Training...:  62% 8585/13907 [5:12:10<2:52:50,  1.95s/it][A
Training...:  62% 8586/13907 [5:12:12<2:50:18,  1.92s/it][A
Training...:  62% 8587/13907 [5:12:14<2:47:42,  1.89s/it][A
Training...:  62% 8588/13907 [5:12:16<2:45:43,  1.87s/it][A
Training...:  62% 8589/13907 [5:12:18<2:42:41,  1.84s/it][A
Training...:  62% 8590/13907 [5:12:19<2:39:49,  1.80s/it][A
Training...:  62% 8591/13907 [5:12:21<2:35:43,  1.76s/it][A
Training...:  62% 8592/13907 [5:12:23<2:32:23,  1.72s/it][A
Training...:  62% 8593/13907 [5:12:24<2:28:24,  1.68s/it][A
Training...:  62% 8594/13907 [5:12:26<2:25:38,  1.64s/it][A
Training...:  62% 8595/13907 [5:12:27<2:20:55,  1.59s/it][A
Training...:  62% 8596/13907 [5:12:29<2:16:22,  1.54s/it][A
Training...:  62% 8597/13907 [5:12:30<2:11:16,  1.48s/it][A
Training...:  62% 8598/13907 [5:12:31<2:05:34,  1.42s/it][A
Training...:  62% 8599/13907 [5:12:33<1:59:33,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:12:46<?, ?it/s]
Training...:  62% 8599/13907 [5:12:34<1:59:33,  1.35s/it][A
Training...:  62% 8600/13907 [5:12:34<1:56:14,  1.31s/it][A
Training...:  62% 8601/13907 [5:12:38<3:02:39,  2.07s/it][A
Training...:  62% 8602/13907 [5:12:41<3:39:04,  2.48s/it][A
Training...:  62% 8603/13907 [5:12:44<3:58:30,  2.70s/it][A
Training...:  62% 8604/13907 [5:12:47<4:09:22,  2.82s/it][A
Training...:  62% 8605/13907 [5:12:50<4:14:34,  2.88s/it][A
Training...:  62% 8606/13907 [5:12:53<4:15:08,  2.89s/it][A
Training...:  62% 8607/13907 [5:12:56<4:13:47,  2.87s/it][A
Training...:  62% 8608/13907 [5:12:59<4:11:21,  2.85s/it][A
Training...:  62% 8609/13907 [5:13:02<4:09:19,  2.82s/it][A
Training...:  62% 8610/13907 [5:13:04<4:07:06,  2.80s/it][A
Training...:  62% 8611/13907 [5:13:07<4:03:07,  2.75s/it][A
Training...:  62% 8612/13907 [5:13:10<3:59:11,  2.71s/it][A
Training...:  62% 8613/13907 [5:13:12<3:56:16,  2.68s/it][A
Training...:  62% 8614/13907 [5:13:15<3:51:27,  2.62s/it][A
Training...:  62% 8615/13907 [5:13:17<3:47:42,  2.58s/it][A
Training...:  62% 8616/13907 [5:13:20<3:43:37,  2.54s/it][A
Training...:  62% 8617/13907 [5:13:22<3:41:12,  2.51s/it][A
Training...:  62% 8618/13907 [5:13:24<3:36:47,  2.46s/it][A
Training...:  62% 8619/13907 [5:13:27<3:33:31,  2.42s/it][A
Training...:  62% 8620/13907 [5:13:29<3:30:21,  2.39s/it][A
Training...:  62% 8621/13907 [5:13:31<3:29:07,  2.37s/it][A
Training...:  62% 8622/13907 [5:13:34<3:27:03,  2.35s/it][A
Training...:  62% 8623/13907 [5:13:36<3:23:18,  2.31s/it][A
Training...:  62% 8624/13907 [5:13:38<3:19:59,  2.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:13:53<?, ?it/s]
Training...:  62% 8624/13907 [5:13:41<3:19:59,  2.27s/it][A
Training...:  62% 8625/13907 [5:13:41<3:24:41,  2.33s/it][A
Training...:  62% 8626/13907 [5:13:43<3:20:16,  2.28s/it][A
Training...:  62% 8627/13907 [5:13:45<3:16:58,  2.24s/it][A
Training...:  62% 8628/13907 [5:13:47<3:12:21,  2.19s/it][A
Training...:  62% 8629/13907 [5:13:49<3:08:27,  2.14s/it][A
Training...:  62% 8630/13907 [5:13:51<3:04:54,  2.10s/it][A
Training...:  62% 8631/13907 [5:13:53<3:01:43,  2.07s/it][A
Training...:  62% 8632/13907 [5:13:55<2:58:50,  2.03s/it][A
Training...:  62% 8633/13907 [5:13:57<2:55:44,  2.00s/it][A
Training...:  62% 8634/13907 [5:13:59<2:52:16,  1.96s/it][A
Training...:  62% 8635/13907 [5:14:01<2:49:25,  1.93s/it][A
Training...:  62% 8636/13907 [5:14:02<2:46:34,  1.90s/it][A
Training...:  62% 8637/13907 [5:14:04<2:44:12,  1.87s/it][A
Training...:  62% 8638/13907 [5:14:06<2:41:16,  1.84s/it][A
Training...:  62% 8639/13907 [5:14:08<2:38:02,  1.80s/it][A
Training...:  62% 8640/13907 [5:14:09<2:34:45,  1.76s/it][A
Training...:  62% 8641/13907 [5:14:11<2:31:44,  1.73s/it][A
Training...:  62% 8642/13907 [5:14:13<2:28:59,  1.70s/it][A
Training...:  62% 8643/13907 [5:14:14<2:26:01,  1.66s/it][A
Training...:  62% 8644/13907 [5:14:16<2:22:25,  1.62s/it][A
Training...:  62% 8645/13907 [5:14:17<2:19:07,  1.59s/it][A
Training...:  62% 8646/13907 [5:14:19<2:15:06,  1.54s/it][A
Training...:  62% 8647/13907 [5:14:20<2:10:10,  1.48s/it][A
Training...:  62% 8648/13907 [5:14:21<2:05:40,  1.43s/it][A
Training...:  62% 8649/13907 [5:14:23<1:59:41,  1.37s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:14:36<?, ?it/s]
Training...:  62% 8649/13907 [5:14:24<1:59:41,  1.37s/it][A
Training...:  62% 8650/13907 [5:14:24<1:57:36,  1.34s/it][A
Training...:  62% 8651/13907 [5:14:28<3:05:08,  2.11s/it][A
Training...:  62% 8652/13907 [5:14:31<3:42:17,  2.54s/it][A
Training...:  62% 8653/13907 [5:14:35<4:02:43,  2.77s/it][A
Training...:  62% 8654/13907 [5:14:38<4:10:47,  2.86s/it][A
Training...:  62% 8655/13907 [5:14:41<4:17:13,  2.94s/it][A
Training...:  62% 8656/13907 [5:14:44<4:19:45,  2.97s/it][A
Training...:  62% 8657/13907 [5:14:47<4:18:03,  2.95s/it][A
Training...:  62% 8658/13907 [5:14:50<4:14:26,  2.91s/it][A
Training...:  62% 8659/13907 [5:14:52<4:10:45,  2.87s/it][A
Training...:  62% 8660/13907 [5:14:55<4:05:41,  2.81s/it][A
Training...:  62% 8661/13907 [5:14:58<4:01:31,  2.76s/it][A
Training...:  62% 8662/13907 [5:15:00<3:56:43,  2.71s/it][A
Training...:  62% 8663/13907 [5:15:03<3:52:23,  2.66s/it][A
Training...:  62% 8664/13907 [5:15:05<3:48:22,  2.61s/it][A
Training...:  62% 8665/13907 [5:15:08<3:43:59,  2.56s/it][A
Training...:  62% 8666/13907 [5:15:10<3:39:55,  2.52s/it][A
Training...:  62% 8667/13907 [5:15:13<3:36:53,  2.48s/it][A
Training...:  62% 8668/13907 [5:15:15<3:33:49,  2.45s/it][A
Training...:  62% 8669/13907 [5:15:17<3:31:13,  2.42s/it][A
Training...:  62% 8670/13907 [5:15:20<3:27:51,  2.38s/it][A
Training...:  62% 8671/13907 [5:15:22<3:25:28,  2.35s/it][A
Training...:  62% 8672/13907 [5:15:24<3:22:27,  2.32s/it][A
Training...:  62% 8673/13907 [5:15:26<3:19:46,  2.29s/it][A
Training...:  62% 8674/13907 [5:15:28<3:17:01,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:15:43<?, ?it/s]
Training...:  62% 8674/13907 [5:15:31<3:17:01,  2.26s/it][A
Training...:  62% 8675/13907 [5:15:31<3:22:24,  2.32s/it][A
Training...:  62% 8676/13907 [5:15:33<3:18:23,  2.28s/it][A
Training...:  62% 8677/13907 [5:15:35<3:12:55,  2.21s/it][A
Training...:  62% 8678/13907 [5:15:37<3:08:44,  2.17s/it][A
Training...:  62% 8679/13907 [5:15:39<3:04:47,  2.12s/it][A
Training...:  62% 8680/13907 [5:15:41<3:02:18,  2.09s/it][A
Training...:  62% 8681/13907 [5:15:43<2:59:25,  2.06s/it][A
Training...:  62% 8682/13907 [5:15:45<2:56:36,  2.03s/it][A
Training...:  62% 8683/13907 [5:15:47<2:54:14,  2.00s/it][A
Training...:  62% 8684/13907 [5:15:49<2:51:38,  1.97s/it][A
Training...:  62% 8685/13907 [5:15:51<2:49:33,  1.95s/it][A
Training...:  62% 8686/13907 [5:15:53<2:47:59,  1.93s/it][A
Training...:  62% 8687/13907 [5:15:55<2:45:59,  1.91s/it][A
Training...:  62% 8688/13907 [5:15:57<2:44:04,  1.89s/it][A
Training...:  62% 8689/13907 [5:15:58<2:41:04,  1.85s/it][A
Training...:  62% 8690/13907 [5:16:00<2:36:54,  1.80s/it][A
Training...:  62% 8691/13907 [5:16:02<2:32:45,  1.76s/it][A
Training...:  63% 8692/13907 [5:16:03<2:29:29,  1.72s/it][A
Training...:  63% 8693/13907 [5:16:05<2:26:00,  1.68s/it][A
Training...:  63% 8694/13907 [5:16:06<2:22:51,  1.64s/it][A
Training...:  63% 8695/13907 [5:16:08<2:19:09,  1.60s/it][A
Training...:  63% 8696/13907 [5:16:09<2:14:33,  1.55s/it][A
Training...:  63% 8697/13907 [5:16:11<2:10:23,  1.50s/it][A
Training...:  63% 8698/13907 [5:16:12<2:05:22,  1.44s/it][A
Training...:  63% 8699/13907 [5:16:13<1:59:20,  1.37s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:16:27<?, ?it/s]
Training...:  63% 8699/13907 [5:16:15<1:59:20,  1.37s/it][A
Training...:  63% 8700/13907 [5:16:15<1:56:09,  1.34s/it][A
Training...:  63% 8701/13907 [5:16:18<3:01:49,  2.10s/it][A
Training...:  63% 8702/13907 [5:16:22<3:37:57,  2.51s/it][A
Training...:  63% 8703/13907 [5:16:25<3:57:04,  2.73s/it][A
Training...:  63% 8704/13907 [5:16:28<4:05:53,  2.84s/it][A
Training...:  63% 8705/13907 [5:16:31<4:12:02,  2.91s/it][A
Training...:  63% 8706/13907 [5:16:34<4:11:12,  2.90s/it][A
Training...:  63% 8707/13907 [5:16:37<4:08:35,  2.87s/it][A
Training...:  63% 8708/13907 [5:16:40<4:04:34,  2.82s/it][A
Training...:  63% 8709/13907 [5:16:42<4:00:29,  2.78s/it][A
Training...:  63% 8710/13907 [5:16:45<3:57:04,  2.74s/it][A
Training...:  63% 8711/13907 [5:16:48<3:53:14,  2.69s/it][A
Training...:  63% 8712/13907 [5:16:50<3:50:17,  2.66s/it][A
Training...:  63% 8713/13907 [5:16:53<3:47:23,  2.63s/it][A
Training...:  63% 8714/13907 [5:16:55<3:44:54,  2.60s/it][A
Training...:  63% 8715/13907 [5:16:58<3:41:57,  2.57s/it][A
Training...:  63% 8716/13907 [5:17:00<3:38:18,  2.52s/it][A
Training...:  63% 8717/13907 [5:17:03<3:34:22,  2.48s/it][A
Training...:  63% 8718/13907 [5:17:05<3:30:57,  2.44s/it][A
Training...:  63% 8719/13907 [5:17:07<3:28:07,  2.41s/it][A
Training...:  63% 8720/13907 [5:17:10<3:26:02,  2.38s/it][A
Training...:  63% 8721/13907 [5:17:12<3:23:34,  2.36s/it][A
Training...:  63% 8722/13907 [5:17:14<3:20:47,  2.32s/it][A
Training...:  63% 8723/13907 [5:17:16<3:17:57,  2.29s/it][A
Training...:  63% 8724/13907 [5:17:18<3:15:03,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:17:33<?, ?it/s]
Training...:  63% 8724/13907 [5:17:21<3:15:03,  2.26s/it][A
Training...:  63% 8725/13907 [5:17:21<3:21:30,  2.33s/it][A
Training...:  63% 8726/13907 [5:17:23<3:17:25,  2.29s/it][A
Training...:  63% 8727/13907 [5:17:25<3:13:03,  2.24s/it][A
Training...:  63% 8728/13907 [5:17:27<3:10:10,  2.20s/it][A
Training...:  63% 8729/13907 [5:17:29<3:06:20,  2.16s/it][A
Training...:  63% 8730/13907 [5:17:31<3:01:49,  2.11s/it][A
Training...:  63% 8731/13907 [5:17:33<2:57:52,  2.06s/it][A
Training...:  63% 8732/13907 [5:17:35<2:53:28,  2.01s/it][A
Training...:  63% 8733/13907 [5:17:37<2:49:58,  1.97s/it][A
Training...:  63% 8734/13907 [5:17:39<2:46:52,  1.94s/it][A
Training...:  63% 8735/13907 [5:17:41<2:44:49,  1.91s/it][A
Training...:  63% 8736/13907 [5:17:43<2:42:13,  1.88s/it][A
Training...:  63% 8737/13907 [5:17:44<2:39:04,  1.85s/it][A
Training...:  63% 8738/13907 [5:17:46<2:35:40,  1.81s/it][A
Training...:  63% 8739/13907 [5:17:48<2:32:45,  1.77s/it][A
Training...:  63% 8740/13907 [5:17:50<2:29:36,  1.74s/it][A
Training...:  63% 8741/13907 [5:17:51<2:26:54,  1.71s/it][A
Training...:  63% 8742/13907 [5:17:53<2:23:45,  1.67s/it][A
Training...:  63% 8743/13907 [5:17:54<2:21:01,  1.64s/it][A
Training...:  63% 8744/13907 [5:17:56<2:18:38,  1.61s/it][A
Training...:  63% 8745/13907 [5:17:57<2:14:40,  1.57s/it][A
Training...:  63% 8746/13907 [5:17:59<2:10:32,  1.52s/it][A
Training...:  63% 8747/13907 [5:18:00<2:06:37,  1.47s/it][A
Training...:  63% 8748/13907 [5:18:01<2:02:09,  1.42s/it][A
Training...:  63% 8749/13907 [5:18:03<1:56:49,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:18:16<?, ?it/s]
Training...:  63% 8749/13907 [5:18:04<1:56:49,  1.36s/it][A
Training...:  63% 8750/13907 [5:18:04<1:54:29,  1.33s/it][A
Training...:  63% 8751/13907 [5:18:08<2:58:30,  2.08s/it][A
Training...:  63% 8752/13907 [5:18:11<3:35:51,  2.51s/it][A
Training...:  63% 8753/13907 [5:18:15<3:57:52,  2.77s/it][A
Training...:  63% 8754/13907 [5:18:18<4:06:15,  2.87s/it][A
Training...:  63% 8755/13907 [5:18:21<4:11:40,  2.93s/it][A
Training...:  63% 8756/13907 [5:18:24<4:11:24,  2.93s/it][A
Training...:  63% 8757/13907 [5:18:27<4:10:28,  2.92s/it][A
Training...:  63% 8758/13907 [5:18:29<4:07:55,  2.89s/it][A
Training...:  63% 8759/13907 [5:18:32<4:04:33,  2.85s/it][A
Training...:  63% 8760/13907 [5:18:35<4:00:21,  2.80s/it][A
Training...:  63% 8761/13907 [5:18:38<3:57:16,  2.77s/it][A
Training...:  63% 8762/13907 [5:18:40<3:54:11,  2.73s/it][A
Training...:  63% 8763/13907 [5:18:43<3:50:26,  2.69s/it][A
Training...:  63% 8764/13907 [5:18:45<3:46:25,  2.64s/it][A
Training...:  63% 8765/13907 [5:18:48<3:42:38,  2.60s/it][A
Training...:  63% 8766/13907 [5:18:50<3:38:23,  2.55s/it][A
Training...:  63% 8767/13907 [5:18:53<3:34:42,  2.51s/it][A
Training...:  63% 8768/13907 [5:18:55<3:31:40,  2.47s/it][A
Training...:  63% 8769/13907 [5:18:57<3:28:52,  2.44s/it][A
Training...:  63% 8770/13907 [5:19:00<3:25:36,  2.40s/it][A
Training...:  63% 8771/13907 [5:19:02<3:22:52,  2.37s/it][A
Training...:  63% 8772/13907 [5:19:04<3:20:36,  2.34s/it][A
Training...:  63% 8773/13907 [5:19:06<3:17:34,  2.31s/it][A
Training...:  63% 8774/13907 [5:19:09<3:14:06,  2.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:19:23<?, ?it/s]
Training...:  63% 8774/13907 [5:19:11<3:14:06,  2.27s/it][A
Training...:  63% 8775/13907 [5:19:11<3:18:50,  2.32s/it][A
Training...:  63% 8776/13907 [5:19:13<3:14:33,  2.28s/it][A
Training...:  63% 8777/13907 [5:19:15<3:09:04,  2.21s/it][A
Training...:  63% 8778/13907 [5:19:17<3:04:34,  2.16s/it][A
Training...:  63% 8779/13907 [5:19:19<3:00:29,  2.11s/it][A
Training...:  63% 8780/13907 [5:19:21<2:56:48,  2.07s/it][A
Training...:  63% 8781/13907 [5:19:23<2:53:35,  2.03s/it][A
Training...:  63% 8782/13907 [5:19:25<2:51:26,  2.01s/it][A
Training...:  63% 8783/13907 [5:19:27<2:49:01,  1.98s/it][A
Training...:  63% 8784/13907 [5:19:29<2:46:01,  1.94s/it][A
Training...:  63% 8785/13907 [5:19:31<2:43:32,  1.92s/it][A
Training...:  63% 8786/13907 [5:19:33<2:40:48,  1.88s/it][A
Training...:  63% 8787/13907 [5:19:34<2:38:54,  1.86s/it][A
Training...:  63% 8788/13907 [5:19:36<2:36:09,  1.83s/it][A
Training...:  63% 8789/13907 [5:19:38<2:33:49,  1.80s/it][A
Training...:  63% 8790/13907 [5:19:40<2:31:25,  1.78s/it][A
Training...:  63% 8791/13907 [5:19:41<2:28:53,  1.75s/it][A
Training...:  63% 8792/13907 [5:19:43<2:26:10,  1.71s/it][A
Training...:  63% 8793/13907 [5:19:45<2:24:45,  1.70s/it][A
Training...:  63% 8794/13907 [5:19:46<2:21:05,  1.66s/it][A
Training...:  63% 8795/13907 [5:19:48<2:17:37,  1.62s/it][A
Training...:  63% 8796/13907 [5:19:49<2:13:45,  1.57s/it][A
Training...:  63% 8797/13907 [5:19:51<2:08:53,  1.51s/it][A
Training...:  63% 8798/13907 [5:19:52<2:03:32,  1.45s/it][A
Training...:  63% 8799/13907 [5:19:53<1:57:57,  1.39s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:20:07<?, ?it/s]
Training...:  63% 8799/13907 [5:19:54<1:57:57,  1.39s/it][A
Training...:  63% 8800/13907 [5:19:54<1:54:33,  1.35s/it][A
Training...:  63% 8801/13907 [5:19:58<2:58:23,  2.10s/it][A
Training...:  63% 8802/13907 [5:20:02<3:33:03,  2.50s/it][A
Training...:  63% 8803/13907 [5:20:05<3:50:24,  2.71s/it][A
Training...:  63% 8804/13907 [5:20:08<3:58:25,  2.80s/it][A
Training...:  63% 8805/13907 [5:20:11<4:02:29,  2.85s/it][A
Training...:  63% 8806/13907 [5:20:14<4:03:00,  2.86s/it][A
Training...:  63% 8807/13907 [5:20:17<4:01:29,  2.84s/it][A
Training...:  63% 8808/13907 [5:20:19<3:59:40,  2.82s/it][A
Training...:  63% 8809/13907 [5:20:22<3:56:47,  2.79s/it][A
Training...:  63% 8810/13907 [5:20:25<3:53:42,  2.75s/it][A
Training...:  63% 8811/13907 [5:20:27<3:51:14,  2.72s/it][A
Training...:  63% 8812/13907 [5:20:30<3:47:25,  2.68s/it][A
Training...:  63% 8813/13907 [5:20:33<3:44:45,  2.65s/it][A
Training...:  63% 8814/13907 [5:20:35<3:40:31,  2.60s/it][A
Training...:  63% 8815/13907 [5:20:37<3:37:46,  2.57s/it][A
Training...:  63% 8816/13907 [5:20:40<3:34:00,  2.52s/it][A
Training...:  63% 8817/13907 [5:20:42<3:31:37,  2.49s/it][A
Training...:  63% 8818/13907 [5:20:45<3:29:40,  2.47s/it][A
Training...:  63% 8819/13907 [5:20:47<3:27:30,  2.45s/it][A
Training...:  63% 8820/13907 [5:20:49<3:23:15,  2.40s/it][A
Training...:  63% 8821/13907 [5:20:52<3:20:19,  2.36s/it][A
Training...:  63% 8822/13907 [5:20:54<3:17:03,  2.33s/it][A
Training...:  63% 8823/13907 [5:20:56<3:14:02,  2.29s/it][A
Training...:  63% 8824/13907 [5:20:58<3:10:48,  2.25s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:21:13<?, ?it/s]
Training...:  63% 8824/13907 [5:21:01<3:10:48,  2.25s/it][A
Training...:  63% 8825/13907 [5:21:01<3:14:59,  2.30s/it][A
Training...:  63% 8826/13907 [5:21:03<3:10:52,  2.25s/it][A
Training...:  63% 8827/13907 [5:21:05<3:05:54,  2.20s/it][A
Training...:  63% 8828/13907 [5:21:07<3:02:01,  2.15s/it][A
Training...:  63% 8829/13907 [5:21:09<2:58:27,  2.11s/it][A
Training...:  63% 8830/13907 [5:21:11<2:54:39,  2.06s/it][A
Training...:  64% 8831/13907 [5:21:13<2:51:57,  2.03s/it][A
Training...:  64% 8832/13907 [5:21:15<2:50:03,  2.01s/it][A
Training...:  64% 8833/13907 [5:21:17<2:46:30,  1.97s/it][A
Training...:  64% 8834/13907 [5:21:19<2:44:32,  1.95s/it][A
Training...:  64% 8835/13907 [5:21:20<2:41:53,  1.92s/it][A
Training...:  64% 8836/13907 [5:21:22<2:38:39,  1.88s/it][A
Training...:  64% 8837/13907 [5:21:24<2:36:01,  1.85s/it][A
Training...:  64% 8838/13907 [5:21:26<2:33:50,  1.82s/it][A
Training...:  64% 8839/13907 [5:21:28<2:31:03,  1.79s/it][A
Training...:  64% 8840/13907 [5:21:29<2:27:57,  1.75s/it][A
Training...:  64% 8841/13907 [5:21:31<2:24:51,  1.72s/it][A
Training...:  64% 8842/13907 [5:21:32<2:20:55,  1.67s/it][A
Training...:  64% 8843/13907 [5:21:34<2:17:44,  1.63s/it][A
Training...:  64% 8844/13907 [5:21:35<2:15:01,  1.60s/it][A
Training...:  64% 8845/13907 [5:21:37<2:12:08,  1.57s/it][A
Training...:  64% 8846/13907 [5:21:38<2:07:43,  1.51s/it][A
Training...:  64% 8847/13907 [5:21:40<2:03:59,  1.47s/it][A
Training...:  64% 8848/13907 [5:21:41<1:59:21,  1.42s/it][A
Training...:  64% 8849/13907 [5:21:42<1:53:52,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:21:56<?, ?it/s]
Training...:  64% 8849/13907 [5:21:43<1:53:52,  1.35s/it][A
Training...:  64% 8850/13907 [5:21:43<1:51:12,  1.32s/it][A
Training...:  64% 8851/13907 [5:21:47<2:52:09,  2.04s/it][A
Training...:  64% 8852/13907 [5:21:51<3:27:25,  2.46s/it][A
Training...:  64% 8853/13907 [5:21:54<3:46:14,  2.69s/it][A
Training...:  64% 8854/13907 [5:21:57<3:56:21,  2.81s/it][A
Training...:  64% 8855/13907 [5:22:00<4:01:50,  2.87s/it][A
Training...:  64% 8856/13907 [5:22:03<4:02:14,  2.88s/it][A
Training...:  64% 8857/13907 [5:22:06<4:01:01,  2.86s/it][A
Training...:  64% 8858/13907 [5:22:08<3:58:32,  2.83s/it][A
Training...:  64% 8859/13907 [5:22:11<3:55:52,  2.80s/it][A
Training...:  64% 8860/13907 [5:22:14<3:52:07,  2.76s/it][A
Training...:  64% 8861/13907 [5:22:16<3:49:03,  2.72s/it][A
Training...:  64% 8862/13907 [5:22:19<3:46:39,  2.70s/it][A
Training...:  64% 8863/13907 [5:22:22<3:43:17,  2.66s/it][A
Training...:  64% 8864/13907 [5:22:24<3:41:05,  2.63s/it][A
Training...:  64% 8865/13907 [5:22:27<3:39:13,  2.61s/it][A
Training...:  64% 8866/13907 [5:22:29<3:37:24,  2.59s/it][A
Training...:  64% 8867/13907 [5:22:32<3:34:29,  2.55s/it][A
Training...:  64% 8868/13907 [5:22:34<3:30:06,  2.50s/it][A
Training...:  64% 8869/13907 [5:22:37<3:26:24,  2.46s/it][A
Training...:  64% 8870/13907 [5:22:39<3:22:06,  2.41s/it][A
Training...:  64% 8871/13907 [5:22:41<3:18:38,  2.37s/it][A
Training...:  64% 8872/13907 [5:22:43<3:16:07,  2.34s/it][A
Training...:  64% 8873/13907 [5:22:46<3:12:54,  2.30s/it][A
Training...:  64% 8874/13907 [5:22:48<3:09:30,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:23:02<?, ?it/s]
Training...:  64% 8874/13907 [5:22:50<3:09:30,  2.26s/it][A
Training...:  64% 8875/13907 [5:22:50<3:13:54,  2.31s/it][AStep... (7125 | Loss: 0.307661235332489, Learning Rate: 0.00025985456886701286, Gradient Norm: 1.013303279876709)
Step... (7150 | Loss: 0.4941703677177429, Learning Rate: 0.0002597030543256551, Gradient Norm: 2.1537575721740723)
Step... (7175 | Loss: 0.31862127780914307, Learning Rate: 0.00025955153978429735, Gradient Norm: 1.1265912055969238)
Step... (7200 | Loss: 0.3589068651199341, Learning Rate: 0.0002594000252429396, Gradient Norm: 1.532848596572876)
Step... (7225 | Loss: 0.41096431016921997, Learning Rate: 0.0002592484815977514, Gradient Norm: 1.1830034255981445)
Step... (7250 | Loss: 0.4086379408836365, Learning Rate: 0.0002590969961602241, Gradient Norm: 1.9260774850845337)
Step... (7275 | Loss: 0.33775943517684937, Learning Rate: 0.0002589454816188663, Gradient Norm: 1.185468316078186)
Step... (7300 | Loss: 0.5354580879211426, Learning Rate: 0.0002587939379736781, Gradient Norm: 2.8026835918426514)
Step... (7325 | Loss: 0.42483365535736084, Learning Rate: 0.0002586424525361508, Gradient Norm: 1.0860295295715332)
Step... (7350 | Loss: 0.4202449321746826, Learning Rate: 0.00025849093799479306, Gradient Norm: 2.6008479595184326)
Step... (7375 | Loss: 0.32770323753356934, Learning Rate: 0.00025833939434960485, Gradient Norm: 1.4022672176361084)
Step... (7400 | Loss: 0.42645397782325745, Learning Rate: 0.00025818790891207755, Gradient Norm: 2.3020260334014893)
Step... (7425 | Loss: 0.38280820846557617, Learning Rate: 0.00025803636526688933, Gradient Norm: 1.0619087219238281)
Step... (7450 | Loss: 0.3523094654083252, Learning Rate: 0.0002578848507255316, Gradient Norm: 1.531745195388794)
Step... (7475 | Loss: 0.28246623277664185, Learning Rate: 0.0002577333652880043, Gradient Norm: 0.9822344183921814)
Step... (7500 | Loss: 0.5899155139923096, Learning Rate: 0.00025758182164281607, Gradient Norm: 1.9621822834014893)
Step... (7525 | Loss: 0.3288383185863495, Learning Rate: 0.0002574303071014583, Gradient Norm: 1.0461199283599854)
Step... (7550 | Loss: 0.3979758620262146, Learning Rate: 0.00025727879256010056, Gradient Norm: 2.064563751220703)
Step... (7575 | Loss: 0.33881276845932007, Learning Rate: 0.0002571272780187428, Gradient Norm: 0.9203700423240662)
Step... (7600 | Loss: 0.36583566665649414, Learning Rate: 0.00025697576347738504, Gradient Norm: 2.1389169692993164)
Step... (7625 | Loss: 0.3221988081932068, Learning Rate: 0.0002568242489360273, Gradient Norm: 1.0612883567810059)
Step... (7650 | Loss: 0.3880317807197571, Learning Rate: 0.00025667273439466953, Gradient Norm: 2.063385009765625)
Step... (7675 | Loss: 0.2824314534664154, Learning Rate: 0.0002565212198533118, Gradient Norm: 1.024917721748352)
Step... (7700 | Loss: 0.4164242148399353, Learning Rate: 0.000256369705311954, Gradient Norm: 1.7855373620986938)
Step... (7725 | Loss: 0.2957538962364197, Learning Rate: 0.00025621819077059627, Gradient Norm: 0.9401410818099976)
Step... (7750 | Loss: 0.5079885721206665, Learning Rate: 0.0002560666762292385, Gradient Norm: 2.149709701538086)
Step... (7775 | Loss: 0.3346906900405884, Learning Rate: 0.00025591516168788075, Gradient Norm: 0.9480050802230835)
Step... (7800 | Loss: 0.4379838705062866, Learning Rate: 0.000255763647146523, Gradient Norm: 2.3185815811157227)
Step... (7825 | Loss: 0.29144060611724854, Learning Rate: 0.00025561213260516524, Gradient Norm: 0.9631642699241638)
Step... (7850 | Loss: 0.5003695487976074, Learning Rate: 0.0002554606180638075, Gradient Norm: 2.0126819610595703)
Step... (7875 | Loss: 0.3566896915435791, Learning Rate: 0.00025530910352244973, Gradient Norm: 1.2065110206604004)
Step... (7900 | Loss: 0.5078599452972412, Learning Rate: 0.000255157588981092, Gradient Norm: 2.705900192260742)
Step... (7925 | Loss: 0.3195728361606598, Learning Rate: 0.0002550060744397342, Gradient Norm: 0.8808228969573975)
Step... (7950 | Loss: 0.49672526121139526, Learning Rate: 0.00025485455989837646, Gradient Norm: 2.5126376152038574)
Step... (7975 | Loss: 0.3392496705055237, Learning Rate: 0.0002547030453570187, Gradient Norm: 0.8670568466186523)
Step... (8000 | Loss: 0.4337170124053955, Learning Rate: 0.00025455153081566095, Gradient Norm: 2.5053963661193848)
Step... (8025 | Loss: 0.36427241563796997, Learning Rate: 0.0002544000162743032, Gradient Norm: 1.0685062408447266)
Step... (8050 | Loss: 0.5437881946563721, Learning Rate: 0.00025424850173294544, Gradient Norm: 2.202847480773926)
Step... (8075 | Loss: 0.3113037645816803, Learning Rate: 0.0002540969871915877, Gradient Norm: 1.0300066471099854)
Step... (8100 | Loss: 0.49087464809417725, Learning Rate: 0.00025394547265022993, Gradient Norm: 2.0116357803344727)
Step... (8125 | Loss: 0.3745228052139282, Learning Rate: 0.0002537939581088722, Gradient Norm: 1.0481863021850586)
Step... (8150 | Loss: 0.4484630525112152, Learning Rate: 0.00025364241446368396, Gradient Norm: 2.006582260131836)
Step... (8175 | Loss: 0.2889065742492676, Learning Rate: 0.00025349092902615666, Gradient Norm: 1.2850375175476074)
Step... (8200 | Loss: 0.3758189380168915, Learning Rate: 0.0002533394144847989, Gradient Norm: 1.7790908813476562)
Step... (8225 | Loss: 0.27059516310691833, Learning Rate: 0.0002531878708396107, Gradient Norm: 0.96686851978302)
Step... (8250 | Loss: 0.38670891523361206, Learning Rate: 0.0002530363854020834, Gradient Norm: 1.6854400634765625)
Step... (8275 | Loss: 0.24358639121055603, Learning Rate: 0.00025288487086072564, Gradient Norm: 0.8880627155303955)
Step... (8300 | Loss: 0.4545358419418335, Learning Rate: 0.00025273332721553743, Gradient Norm: 2.2212512493133545)
Step... (8325 | Loss: 0.30006012320518494, Learning Rate: 0.00025258184177801013, Gradient Norm: 0.9290492534637451)
Step... (8350 | Loss: 0.4764225482940674, Learning Rate: 0.0002524303272366524, Gradient Norm: 2.2554383277893066)
Step... (8375 | Loss: 0.3571893572807312, Learning Rate: 0.00025227878359146416, Gradient Norm: 0.8814353346824646)
Step... (8400 | Loss: 0.4750644564628601, Learning Rate: 0.00025212729815393686, Gradient Norm: 1.9192817211151123)
Step... (8425 | Loss: 0.31408458948135376, Learning Rate: 0.0002519757836125791, Gradient Norm: 1.0760307312011719)
Step... (8450 | Loss: 0.3585625886917114, Learning Rate: 0.0002518242399673909, Gradient Norm: 1.9975099563598633)
Step... (8475 | Loss: 0.32452085614204407, Learning Rate: 0.00025167272542603314, Gradient Norm: 1.0029611587524414)
Step... (8500 | Loss: 0.3709074854850769, Learning Rate: 0.00025152123998850584, Gradient Norm: 1.6121063232421875)
Step... (8525 | Loss: 0.31798362731933594, Learning Rate: 0.00025136969634331763, Gradient Norm: 1.0538759231567383)
Step... (8550 | Loss: 0.5413790941238403, Learning Rate: 0.00025121818180195987, Gradient Norm: 2.5309858322143555)
Step... (8575 | Loss: 0.28972122073173523, Learning Rate: 0.0002510666963644326, Gradient Norm: 0.8769581913948059)
Step... (8600 | Loss: 0.6276968121528625, Learning Rate: 0.00025091515271924436, Gradient Norm: 2.2854952812194824)
Step... (8625 | Loss: 0.30758827924728394, Learning Rate: 0.0002507636381778866, Gradient Norm: 0.9982009530067444)
Step... (8650 | Loss: 0.41911423206329346, Learning Rate: 0.0002506121527403593, Gradient Norm: 2.120570659637451)
Step... (8675 | Loss: 0.2187030017375946, Learning Rate: 0.0002504606090951711, Gradient Norm: 0.7918398380279541)
Step... (8700 | Loss: 0.49004065990448, Learning Rate: 0.00025030909455381334, Gradient Norm: 2.7373766899108887)
Step... (8725 | Loss: 0.2577607035636902, Learning Rate: 0.00025015760911628604, Gradient Norm: 0.8356513977050781)
Step... (8750 | Loss: 0.34816253185272217, Learning Rate: 0.0002500060654710978, Gradient Norm: 1.8232759237289429)
Step... (8775 | Loss: 0.29829204082489014, Learning Rate: 0.00024985455092974007, Gradient Norm: 1.035805344581604)
Step... (8800 | Loss: 0.45823657512664795, Learning Rate: 0.0002497030363883823, Gradient Norm: 2.0064024925231934)
Step... (8825 | Loss: 0.3703595697879791, Learning Rate: 0.00024955152184702456, Gradient Norm: 0.9559512734413147)
Step... (8850 | Loss: 0.4858643412590027, Learning Rate: 0.0002494000073056668, Gradient Norm: 2.056906223297119)

Training...:  64% 8876/13907 [5:22:52<3:13:21,  2.31s/it][A
Training...:  64% 8877/13907 [5:22:55<3:07:20,  2.23s/it][A
Training...:  64% 8878/13907 [5:22:57<3:02:28,  2.18s/it][A
Training...:  64% 8879/13907 [5:22:59<2:57:38,  2.12s/it][A
Training...:  64% 8880/13907 [5:23:01<2:53:54,  2.08s/it][A
Training...:  64% 8881/13907 [5:23:02<2:50:50,  2.04s/it][A
Training...:  64% 8882/13907 [5:23:04<2:47:46,  2.00s/it][A
Training...:  64% 8883/13907 [5:23:06<2:45:07,  1.97s/it][A
Training...:  64% 8884/13907 [5:23:08<2:42:45,  1.94s/it][A
Training...:  64% 8885/13907 [5:23:10<2:40:14,  1.91s/it][A
Training...:  64% 8886/13907 [5:23:12<2:38:05,  1.89s/it][A
Training...:  64% 8887/13907 [5:23:14<2:35:59,  1.86s/it][A
Training...:  64% 8888/13907 [5:23:15<2:33:42,  1.84s/it][A
Training...:  64% 8889/13907 [5:23:17<2:31:17,  1.81s/it][A
Training...:  64% 8890/13907 [5:23:19<2:29:03,  1.78s/it][A
Training...:  64% 8891/13907 [5:23:21<2:26:43,  1.76s/it][A
Training...:  64% 8892/13907 [5:23:22<2:23:44,  1.72s/it][A
Training...:  64% 8893/13907 [5:23:24<2:20:47,  1.68s/it][A
Training...:  64% 8894/13907 [5:23:25<2:17:02,  1.64s/it][A
Training...:  64% 8895/13907 [5:23:27<2:14:04,  1.61s/it][A
Training...:  64% 8896/13907 [5:23:28<2:10:19,  1.56s/it][A
Training...:  64% 8897/13907 [5:23:30<2:06:03,  1.51s/it][A
Training...:  64% 8898/13907 [5:23:31<2:01:27,  1.45s/it][A
Training...:  64% 8899/13907 [5:23:32<1:55:26,  1.38s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:23:46<?, ?it/s]
Training...:  64% 8899/13907 [5:23:33<1:55:26,  1.38s/it][A
Training...:  64% 8900/13907 [5:23:33<1:51:50,  1.34s/it][A
Training...:  64% 8901/13907 [5:23:37<2:53:30,  2.08s/it][A
Training...:  64% 8902/13907 [5:23:41<3:27:16,  2.48s/it][A
Training...:  64% 8903/13907 [5:23:44<3:45:54,  2.71s/it][A
Training...:  64% 8904/13907 [5:23:47<3:59:48,  2.88s/it][A
Training...:  64% 8905/13907 [5:23:50<4:06:38,  2.96s/it][A
Training...:  64% 8906/13907 [5:23:53<4:07:56,  2.97s/it][A
Training...:  64% 8907/13907 [5:23:56<4:06:11,  2.95s/it][A
Training...:  64% 8908/13907 [5:23:59<4:01:35,  2.90s/it][A
Training...:  64% 8909/13907 [5:24:02<3:57:02,  2.85s/it][A
Training...:  64% 8910/13907 [5:24:04<3:53:05,  2.80s/it][A
Training...:  64% 8911/13907 [5:24:07<3:47:56,  2.74s/it][A
Training...:  64% 8912/13907 [5:24:10<3:43:47,  2.69s/it][A
Training...:  64% 8913/13907 [5:24:12<3:40:12,  2.65s/it][A
Training...:  64% 8914/13907 [5:24:15<3:36:34,  2.60s/it][A
Training...:  64% 8915/13907 [5:24:17<3:33:19,  2.56s/it][A
Training...:  64% 8916/13907 [5:24:20<3:29:44,  2.52s/it][A
Training...:  64% 8917/13907 [5:24:22<3:27:02,  2.49s/it][A
Training...:  64% 8918/13907 [5:24:24<3:23:48,  2.45s/it][A
Training...:  64% 8919/13907 [5:24:27<3:21:12,  2.42s/it][A
Training...:  64% 8920/13907 [5:24:29<3:18:06,  2.38s/it][A
Training...:  64% 8921/13907 [5:24:31<3:15:10,  2.35s/it][A
Training...:  64% 8922/13907 [5:24:34<3:12:18,  2.31s/it][A
Training...:  64% 8923/13907 [5:24:36<3:09:29,  2.28s/it][A
Training...:  64% 8924/13907 [5:24:38<3:06:46,  2.25s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:24:53<?, ?it/s]
Training...:  64% 8924/13907 [5:24:40<3:06:46,  2.25s/it][A
Training...:  64% 8925/13907 [5:24:40<3:12:13,  2.32s/it][A
Training...:  64% 8926/13907 [5:24:43<3:08:17,  2.27s/it][A
Training...:  64% 8927/13907 [5:24:45<3:04:01,  2.22s/it][A
Training...:  64% 8928/13907 [5:24:47<3:00:00,  2.17s/it][A
Training...:  64% 8929/13907 [5:24:49<2:56:46,  2.13s/it][A
Training...:  64% 8930/13907 [5:24:51<2:53:39,  2.09s/it][A
Training...:  64% 8931/13907 [5:24:53<2:50:33,  2.06s/it][A
Training...:  64% 8932/13907 [5:24:55<2:46:44,  2.01s/it][A
Training...:  64% 8933/13907 [5:24:57<2:44:31,  1.98s/it][A
Training...:  64% 8934/13907 [5:24:58<2:42:01,  1.95s/it][A
Training...:  64% 8935/13907 [5:25:00<2:39:37,  1.93s/it][A
Training...:  64% 8936/13907 [5:25:02<2:37:16,  1.90s/it][A
Training...:  64% 8937/13907 [5:25:04<2:35:03,  1.87s/it][A
Training...:  64% 8938/13907 [5:25:06<2:32:44,  1.84s/it][A
Training...:  64% 8939/13907 [5:25:07<2:30:41,  1.82s/it][A
Training...:  64% 8940/13907 [5:25:09<2:28:05,  1.79s/it][A
Training...:  64% 8941/13907 [5:25:11<2:24:10,  1.74s/it][A
Training...:  64% 8942/13907 [5:25:12<2:20:31,  1.70s/it][A
Training...:  64% 8943/13907 [5:25:14<2:17:19,  1.66s/it][A
Training...:  64% 8944/13907 [5:25:16<2:14:03,  1.62s/it][A
Training...:  64% 8945/13907 [5:25:17<2:09:44,  1.57s/it][A
Training...:  64% 8946/13907 [5:25:18<2:05:46,  1.52s/it][A
Training...:  64% 8947/13907 [5:25:20<2:01:23,  1.47s/it][A
Training...:  64% 8948/13907 [5:25:21<1:57:10,  1.42s/it][A
Training...:  64% 8949/13907 [5:25:22<1:51:18,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:25:36<?, ?it/s]
Training...:  64% 8949/13907 [5:25:23<1:51:18,  1.35s/it][A
Training...:  64% 8950/13907 [5:25:23<1:48:01,  1.31s/it][A
Training...:  64% 8951/13907 [5:25:27<2:49:26,  2.05s/it][A
Training...:  64% 8952/13907 [5:25:31<3:26:10,  2.50s/it][A
Training...:  64% 8953/13907 [5:25:34<3:45:07,  2.73s/it][A
Training...:  64% 8954/13907 [5:25:37<3:54:23,  2.84s/it][A
Training...:  64% 8955/13907 [5:25:40<3:59:50,  2.91s/it][A
Training...:  64% 8956/13907 [5:25:43<3:59:53,  2.91s/it][A
Training...:  64% 8957/13907 [5:25:46<3:58:53,  2.90s/it][A
Training...:  64% 8958/13907 [5:25:49<3:55:42,  2.86s/it][A
Training...:  64% 8959/13907 [5:25:51<3:52:27,  2.82s/it][A
Training...:  64% 8960/13907 [5:25:54<3:48:31,  2.77s/it][A
Training...:  64% 8961/13907 [5:25:57<3:44:40,  2.73s/it][A
Training...:  64% 8962/13907 [5:25:59<3:40:50,  2.68s/it][A
Training...:  64% 8963/13907 [5:26:02<3:36:59,  2.63s/it][A
Training...:  64% 8964/13907 [5:26:04<3:33:40,  2.59s/it][A
Training...:  64% 8965/13907 [5:26:07<3:31:10,  2.56s/it][A
Training...:  64% 8966/13907 [5:26:09<3:27:43,  2.52s/it][A
Training...:  64% 8967/13907 [5:26:12<3:24:07,  2.48s/it][A
Training...:  64% 8968/13907 [5:26:14<3:20:40,  2.44s/it][A
Training...:  64% 8969/13907 [5:26:16<3:17:33,  2.40s/it][A
Training...:  64% 8970/13907 [5:26:19<3:14:57,  2.37s/it][A
Training...:  65% 8971/13907 [5:26:21<3:12:40,  2.34s/it][A
Training...:  65% 8972/13907 [5:26:23<3:10:11,  2.31s/it][A
Training...:  65% 8973/13907 [5:26:25<3:07:45,  2.28s/it][A
Training...:  65% 8974/13907 [5:26:27<3:05:41,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:26:42<?, ?it/s]
Training...:  65% 8974/13907 [5:26:30<3:05:41,  2.26s/it][A
Training...:  65% 8975/13907 [5:26:30<3:11:42,  2.33s/it][A
Training...:  65% 8976/13907 [5:26:32<3:08:05,  2.29s/it][A
Training...:  65% 8977/13907 [5:26:34<3:03:44,  2.24s/it][A
Training...:  65% 8978/13907 [5:26:36<3:00:05,  2.19s/it][A
Training...:  65% 8979/13907 [5:26:38<2:57:06,  2.16s/it][A
Training...:  65% 8980/13907 [5:26:40<2:53:43,  2.12s/it][A
Training...:  65% 8981/13907 [5:26:42<2:50:44,  2.08s/it][A
Training...:  65% 8982/13907 [5:26:44<2:47:34,  2.04s/it][A
Training...:  65% 8983/13907 [5:26:46<2:44:29,  2.00s/it][A
Training...:  65% 8984/13907 [5:26:48<2:40:59,  1.96s/it][A
Training...:  65% 8985/13907 [5:26:50<2:37:53,  1.92s/it][A
Training...:  65% 8986/13907 [5:26:52<2:34:58,  1.89s/it][A
Training...:  65% 8987/13907 [5:26:54<2:32:32,  1.86s/it][A
Training...:  65% 8988/13907 [5:26:55<2:29:58,  1.83s/it][A
Training...:  65% 8989/13907 [5:26:57<2:27:36,  1.80s/it][A
Training...:  65% 8990/13907 [5:26:59<2:24:25,  1.76s/it][A
Training...:  65% 8991/13907 [5:27:00<2:20:53,  1.72s/it][A
Training...:  65% 8992/13907 [5:27:02<2:17:28,  1.68s/it][A
Training...:  65% 8993/13907 [5:27:04<2:14:28,  1.64s/it][A
Training...:  65% 8994/13907 [5:27:05<2:11:44,  1.61s/it][A
Training...:  65% 8995/13907 [5:27:07<2:08:34,  1.57s/it][A
Training...:  65% 8996/13907 [5:27:08<2:05:26,  1.53s/it][A
Training...:  65% 8997/13907 [5:27:09<2:01:52,  1.49s/it][A
Training...:  65% 8998/13907 [5:27:11<1:57:28,  1.44s/it][A
Training...:  65% 8999/13907 [5:27:12<1:52:36,  1.38s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:27:26<?, ?it/s]
Training...:  65% 8999/13907 [5:27:13<1:52:36,  1.38s/it][A
Training...:  65% 9000/13907 [5:27:13<1:50:27,  1.35s/it][A
Training...:  65% 9001/13907 [5:27:17<2:51:26,  2.10s/it][A
Training...:  65% 9002/13907 [5:27:21<3:25:48,  2.52s/it][A
Training...:  65% 9003/13907 [5:27:24<3:44:06,  2.74s/it][A
Training...:  65% 9004/13907 [5:27:27<3:53:26,  2.86s/it][A
Training...:  65% 9005/13907 [5:27:30<3:58:12,  2.92s/it][A
Training...:  65% 9006/13907 [5:27:33<3:58:15,  2.92s/it][A
Training...:  65% 9007/13907 [5:27:36<3:57:50,  2.91s/it][A
Training...:  65% 9008/13907 [5:27:39<3:54:04,  2.87s/it][A
Training...:  65% 9009/13907 [5:27:41<3:51:48,  2.84s/it][A
Training...:  65% 9010/13907 [5:27:44<3:47:50,  2.79s/it][A
Training...:  65% 9011/13907 [5:27:47<3:45:01,  2.76s/it][A
Training...:  65% 9012/13907 [5:27:49<3:42:02,  2.72s/it][A
Training...:  65% 9013/13907 [5:27:52<3:39:52,  2.70s/it][A
Training...:  65% 9014/13907 [5:27:55<3:35:35,  2.64s/it][A
Training...:  65% 9015/13907 [5:27:57<3:31:33,  2.59s/it][A
Training...:  65% 9016/13907 [5:27:59<3:27:12,  2.54s/it][A
Training...:  65% 9017/13907 [5:28:02<3:22:50,  2.49s/it][A
Training...:  65% 9018/13907 [5:28:04<3:19:41,  2.45s/it][A
Training...:  65% 9019/13907 [5:28:07<3:17:11,  2.42s/it][A
Training...:  65% 9020/13907 [5:28:09<3:15:08,  2.40s/it][A
Training...:  65% 9021/13907 [5:28:11<3:13:49,  2.38s/it][A
Training...:  65% 9022/13907 [5:28:13<3:10:47,  2.34s/it][A
Training...:  65% 9023/13907 [5:28:16<3:07:09,  2.30s/it][A
Training...:  65% 9024/13907 [5:28:18<3:03:51,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:28:33<?, ?it/s]
Training...:  65% 9024/13907 [5:28:20<3:03:51,  2.26s/it][A
Training...:  65% 9025/13907 [5:28:20<3:08:55,  2.32s/it][A
Training...:  65% 9026/13907 [5:28:22<3:05:55,  2.29s/it][A
Training...:  65% 9027/13907 [5:28:25<3:01:01,  2.23s/it][A
Training...:  65% 9028/13907 [5:28:27<2:58:27,  2.19s/it][A
Training...:  65% 9029/13907 [5:28:29<2:54:36,  2.15s/it][A
Training...:  65% 9030/13907 [5:28:31<2:50:07,  2.09s/it][A
Training...:  65% 9031/13907 [5:28:33<2:46:16,  2.05s/it][A
Training...:  65% 9032/13907 [5:28:35<2:43:11,  2.01s/it][A
Training...:  65% 9033/13907 [5:28:36<2:40:51,  1.98s/it][A
Training...:  65% 9034/13907 [5:28:38<2:38:05,  1.95s/it][A
Training...:  65% 9035/13907 [5:28:40<2:35:24,  1.91s/it][A
Training...:  65% 9036/13907 [5:28:42<2:32:44,  1.88s/it][A
Training...:  65% 9037/13907 [5:28:44<2:30:44,  1.86s/it][A
Training...:  65% 9038/13907 [5:28:46<2:28:13,  1.83s/it][A
Training...:  65% 9039/13907 [5:28:47<2:25:59,  1.80s/it][A
Training...:  65% 9040/13907 [5:28:49<2:23:10,  1.77s/it][A
Training...:  65% 9041/13907 [5:28:51<2:20:53,  1.74s/it][A
Training...:  65% 9042/13907 [5:28:52<2:17:35,  1.70s/it][A
Training...:  65% 9043/13907 [5:28:54<2:14:46,  1.66s/it][A
Training...:  65% 9044/13907 [5:28:55<2:11:39,  1.62s/it][A
Training...:  65% 9045/13907 [5:28:57<2:07:36,  1.57s/it][A
Training...:  65% 9046/13907 [5:28:58<2:04:28,  1.54s/it][A
Training...:  65% 9047/13907 [5:29:00<2:00:21,  1.49s/it][A
Training...:  65% 9048/13907 [5:29:01<1:55:25,  1.43s/it][A
Training...:  65% 9049/13907 [5:29:02<1:49:47,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:29:16<?, ?it/s]
Training...:  65% 9049/13907 [5:29:03<1:49:47,  1.36s/it][A
Training...:  65% 9050/13907 [5:29:03<1:47:47,  1.33s/it][A
Training...:  65% 9051/13907 [5:29:07<2:49:57,  2.10s/it][A
Training...:  65% 9052/13907 [5:29:11<3:20:52,  2.48s/it][A
Training...:  65% 9053/13907 [5:29:14<3:38:04,  2.70s/it][A
Training...:  65% 9054/13907 [5:29:17<3:49:33,  2.84s/it][A
Training...:  65% 9055/13907 [5:29:20<3:54:35,  2.90s/it][A
Training...:  65% 9056/13907 [5:29:23<3:53:37,  2.89s/it][A
Training...:  65% 9057/13907 [5:29:26<3:51:46,  2.87s/it][A
Training...:  65% 9058/13907 [5:29:28<3:48:17,  2.82s/it][A
Training...:  65% 9059/13907 [5:29:31<3:44:16,  2.78s/it][A
Training...:  65% 9060/13907 [5:29:34<3:40:13,  2.73s/it][A
Training...:  65% 9061/13907 [5:29:36<3:36:46,  2.68s/it][A
Training...:  65% 9062/13907 [5:29:39<3:33:20,  2.64s/it][A
Training...:  65% 9063/13907 [5:29:41<3:28:39,  2.58s/it][A
Training...:  65% 9064/13907 [5:29:44<3:25:08,  2.54s/it][A
Training...:  65% 9065/13907 [5:29:46<3:22:22,  2.51s/it][A
Training...:  65% 9066/13907 [5:29:49<3:19:25,  2.47s/it][A
Training...:  65% 9067/13907 [5:29:51<3:16:39,  2.44s/it][A
Training...:  65% 9068/13907 [5:29:53<3:14:00,  2.41s/it][A
Training...:  65% 9069/13907 [5:29:56<3:11:52,  2.38s/it][A
Training...:  65% 9070/13907 [5:29:58<3:09:37,  2.35s/it][A
Training...:  65% 9071/13907 [5:30:00<3:07:47,  2.33s/it][A
Training...:  65% 9072/13907 [5:30:02<3:04:36,  2.29s/it][A
Training...:  65% 9073/13907 [5:30:05<3:02:59,  2.27s/it][A
Training...:  65% 9074/13907 [5:30:07<3:00:32,  2.24s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:30:22<?, ?it/s]
Training...:  65% 9074/13907 [5:30:09<3:00:32,  2.24s/it][A
Training...:  65% 9075/13907 [5:30:09<3:05:33,  2.30s/it][A
Training...:  65% 9076/13907 [5:30:11<3:02:52,  2.27s/it][A
Training...:  65% 9077/13907 [5:30:13<2:58:18,  2.22s/it][A
Training...:  65% 9078/13907 [5:30:16<2:54:21,  2.17s/it][A
Training...:  65% 9079/13907 [5:30:18<2:51:23,  2.13s/it][A
Training...:  65% 9080/13907 [5:30:20<2:47:46,  2.09s/it][A
Training...:  65% 9081/13907 [5:30:22<2:44:45,  2.05s/it][A
Training...:  65% 9082/13907 [5:30:23<2:41:38,  2.01s/it][A
Training...:  65% 9083/13907 [5:30:25<2:39:55,  1.99s/it][A
Training...:  65% 9084/13907 [5:30:27<2:39:01,  1.98s/it][A
Training...:  65% 9085/13907 [5:30:29<2:36:08,  1.94s/it][A
Training...:  65% 9086/13907 [5:30:31<2:33:07,  1.91s/it][A
Training...:  65% 9087/13907 [5:30:33<2:30:16,  1.87s/it][A
Training...:  65% 9088/13907 [5:30:35<2:27:30,  1.84s/it][A
Training...:  65% 9089/13907 [5:30:36<2:24:36,  1.80s/it][A
Training...:  65% 9090/13907 [5:30:38<2:21:43,  1.77s/it][A
Training...:  65% 9091/13907 [5:30:40<2:18:43,  1.73s/it][A
Training...:  65% 9092/13907 [5:30:41<2:15:34,  1.69s/it][A
Training...:  65% 9093/13907 [5:30:43<2:12:44,  1.65s/it][A
Training...:  65% 9094/13907 [5:30:44<2:09:56,  1.62s/it][A
Training...:  65% 9095/13907 [5:30:46<2:07:04,  1.58s/it][A
Training...:  65% 9096/13907 [5:30:47<2:03:15,  1.54s/it][A
Training...:  65% 9097/13907 [5:30:49<1:58:58,  1.48s/it][A
Training...:  65% 9098/13907 [5:30:50<1:54:12,  1.42s/it][A
Training...:  65% 9099/13907 [5:30:51<1:49:19,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:31:05<?, ?it/s]
Training...:  65% 9099/13907 [5:30:52<1:49:19,  1.36s/it][A
Training...:  65% 9100/13907 [5:30:52<1:47:18,  1.34s/it][A
Training...:  65% 9101/13907 [5:30:56<2:45:22,  2.06s/it][A
Training...:  65% 9102/13907 [5:31:00<3:19:44,  2.49s/it][A
Training...:  65% 9103/13907 [5:31:03<3:36:07,  2.70s/it][A
Training...:  65% 9104/13907 [5:31:06<3:44:01,  2.80s/it][A
Training...:  65% 9105/13907 [5:31:09<3:49:21,  2.87s/it][A
Training...:  65% 9106/13907 [5:31:12<3:49:50,  2.87s/it][A
Training...:  65% 9107/13907 [5:31:15<3:50:19,  2.88s/it][A
Training...:  65% 9108/13907 [5:31:17<3:47:46,  2.85s/it][A
Training...:  65% 9109/13907 [5:31:20<3:45:57,  2.83s/it][A
Training...:  66% 9110/13907 [5:31:23<3:42:09,  2.78s/it][A
Training...:  66% 9111/13907 [5:31:25<3:38:01,  2.73s/it][A
Training...:  66% 9112/13907 [5:31:28<3:33:55,  2.68s/it][A
Training...:  66% 9113/13907 [5:31:31<3:29:49,  2.63s/it][A
Training...:  66% 9114/13907 [5:31:33<3:27:26,  2.60s/it][A
Training...:  66% 9115/13907 [5:31:36<3:24:47,  2.56s/it][A
Training...:  66% 9116/13907 [5:31:38<3:22:06,  2.53s/it][A
Training...:  66% 9117/13907 [5:31:41<3:21:55,  2.53s/it][A
Training...:  66% 9118/13907 [5:31:43<3:18:06,  2.48s/it][A
Training...:  66% 9119/13907 [5:31:45<3:14:41,  2.44s/it][A
Training...:  66% 9120/13907 [5:31:48<3:11:59,  2.41s/it][A
Training...:  66% 9121/13907 [5:31:50<3:09:31,  2.38s/it][A
Training...:  66% 9122/13907 [5:31:52<3:06:43,  2.34s/it][A
Training...:  66% 9123/13907 [5:31:54<3:04:41,  2.32s/it][A
Training...:  66% 9124/13907 [5:31:57<3:01:49,  2.28s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:32:11<?, ?it/s]
Training...:  66% 9124/13907 [5:31:59<3:01:49,  2.28s/it][A
Training...:  66% 9125/13907 [5:31:59<3:06:04,  2.33s/it][A
Training...:  66% 9126/13907 [5:32:01<3:02:31,  2.29s/it][A
Training...:  66% 9127/13907 [5:32:03<2:57:10,  2.22s/it][A
Training...:  66% 9128/13907 [5:32:05<2:52:47,  2.17s/it][A
Training...:  66% 9129/13907 [5:32:07<2:50:15,  2.14s/it][A
Training...:  66% 9130/13907 [5:32:09<2:46:47,  2.09s/it][A
Training...:  66% 9131/13907 [5:32:11<2:43:12,  2.05s/it][A
Training...:  66% 9132/13907 [5:32:13<2:39:44,  2.01s/it][A
Training...:  66% 9133/13907 [5:32:15<2:38:26,  1.99s/it][A
Training...:  66% 9134/13907 [5:32:17<2:35:14,  1.95s/it][A
Training...:  66% 9135/13907 [5:32:19<2:32:43,  1.92s/it][A
Training...:  66% 9136/13907 [5:32:21<2:29:41,  1.88s/it][A
Training...:  66% 9137/13907 [5:32:23<2:27:01,  1.85s/it][A
Training...:  66% 9138/13907 [5:32:24<2:24:22,  1.82s/it][A
Training...:  66% 9139/13907 [5:32:26<2:21:47,  1.78s/it][A
Training...:  66% 9140/13907 [5:32:28<2:19:03,  1.75s/it][A
Training...:  66% 9141/13907 [5:32:29<2:16:05,  1.71s/it][A
Training...:  66% 9142/13907 [5:32:31<2:13:18,  1.68s/it][A
Training...:  66% 9143/13907 [5:32:32<2:10:04,  1.64s/it][A
Training...:  66% 9144/13907 [5:32:34<2:07:21,  1.60s/it][A
Training...:  66% 9145/13907 [5:32:35<2:03:23,  1.55s/it][A
Training...:  66% 9146/13907 [5:32:37<1:59:46,  1.51s/it][A
Training...:  66% 9147/13907 [5:32:38<1:55:57,  1.46s/it][A
Training...:  66% 9148/13907 [5:32:39<1:51:30,  1.41s/it][A
Training...:  66% 9149/13907 [5:32:41<1:46:10,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:32:54<?, ?it/s]
Training...:  66% 9149/13907 [5:32:42<1:46:10,  1.34s/it][A
Training...:  66% 9150/13907 [5:32:42<1:43:30,  1.31s/it][A
Training...:  66% 9151/13907 [5:32:46<2:43:51,  2.07s/it][A
Training...:  66% 9152/13907 [5:32:49<3:16:44,  2.48s/it][A
Training...:  66% 9153/13907 [5:32:52<3:34:14,  2.70s/it][A
Training...:  66% 9154/13907 [5:32:56<3:46:28,  2.86s/it][A
Training...:  66% 9155/13907 [5:32:59<3:52:13,  2.93s/it][A
Training...:  66% 9156/13907 [5:33:02<3:51:18,  2.92s/it][A
Training...:  66% 9157/13907 [5:33:04<3:48:55,  2.89s/it][A
Training...:  66% 9158/13907 [5:33:07<3:45:29,  2.85s/it][A
Training...:  66% 9159/13907 [5:33:10<3:43:09,  2.82s/it][A
Training...:  66% 9160/13907 [5:33:13<3:40:16,  2.78s/it][A
Training...:  66% 9161/13907 [5:33:15<3:37:01,  2.74s/it][A
Training...:  66% 9162/13907 [5:33:18<3:32:11,  2.68s/it][A
Training...:  66% 9163/13907 [5:33:20<3:28:26,  2.64s/it][A
Training...:  66% 9164/13907 [5:33:23<3:24:22,  2.59s/it][A
Training...:  66% 9165/13907 [5:33:25<3:21:43,  2.55s/it][A
Training...:  66% 9166/13907 [5:33:28<3:18:18,  2.51s/it][A
Training...:  66% 9167/13907 [5:33:30<3:15:11,  2.47s/it][A
Training...:  66% 9168/13907 [5:33:32<3:11:47,  2.43s/it][A
Training...:  66% 9169/13907 [5:33:35<3:09:33,  2.40s/it][A
Training...:  66% 9170/13907 [5:33:37<3:06:59,  2.37s/it][A
Training...:  66% 9171/13907 [5:33:39<3:04:58,  2.34s/it][A
Training...:  66% 9172/13907 [5:33:41<3:02:16,  2.31s/it][A
Training...:  66% 9173/13907 [5:33:44<3:00:47,  2.29s/it][A
Training...:  66% 9174/13907 [5:33:46<2:58:42,  2.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:34:01<?, ?it/s]
Training...:  66% 9174/13907 [5:33:48<2:58:42,  2.27s/it][A
Training...:  66% 9175/13907 [5:33:48<3:03:46,  2.33s/it][A
Training...:  66% 9176/13907 [5:33:51<2:59:54,  2.28s/it][A
Training...:  66% 9177/13907 [5:33:53<2:55:14,  2.22s/it][A
Training...:  66% 9178/13907 [5:33:55<2:51:48,  2.18s/it][A
Training...:  66% 9179/13907 [5:33:57<2:48:26,  2.14s/it][A
Training...:  66% 9180/13907 [5:33:59<2:46:10,  2.11s/it][A
Training...:  66% 9181/13907 [5:34:01<2:44:21,  2.09s/it][A
Training...:  66% 9182/13907 [5:34:03<2:42:22,  2.06s/it][A
Training...:  66% 9183/13907 [5:34:05<2:39:02,  2.02s/it][A
Training...:  66% 9184/13907 [5:34:07<2:35:58,  1.98s/it][A
Training...:  66% 9185/13907 [5:34:09<2:33:27,  1.95s/it][A
Training...:  66% 9186/13907 [5:34:10<2:29:26,  1.90s/it][A
Training...:  66% 9187/13907 [5:34:12<2:26:29,  1.86s/it][A
Training...:  66% 9188/13907 [5:34:14<2:24:10,  1.83s/it][A
Training...:  66% 9189/13907 [5:34:16<2:21:04,  1.79s/it][A
Training...:  66% 9190/13907 [5:34:17<2:17:40,  1.75s/it][A
Training...:  66% 9191/13907 [5:34:19<2:15:01,  1.72s/it][A
Training...:  66% 9192/13907 [5:34:20<2:11:45,  1.68s/it][A
Training...:  66% 9193/13907 [5:34:22<2:09:03,  1.64s/it][A
Training...:  66% 9194/13907 [5:34:24<2:06:36,  1.61s/it][A
Training...:  66% 9195/13907 [5:34:25<2:03:15,  1.57s/it][A
Training...:  66% 9196/13907 [5:34:26<1:59:18,  1.52s/it][A
Training...:  66% 9197/13907 [5:34:28<1:55:25,  1.47s/it][A
Training...:  66% 9198/13907 [5:34:29<1:50:47,  1.41s/it][A
Training...:  66% 9199/13907 [5:34:30<1:45:45,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:34:44<?, ?it/s]
Training...:  66% 9199/13907 [5:34:32<1:45:45,  1.35s/it][A
Training...:  66% 9200/13907 [5:34:32<1:43:27,  1.32s/it][A
Training...:  66% 9201/13907 [5:34:35<2:40:59,  2.05s/it][A
Training...:  66% 9202/13907 [5:34:39<3:13:29,  2.47s/it][A
Training...:  66% 9203/13907 [5:34:42<3:31:28,  2.70s/it][A
Training...:  66% 9204/13907 [5:34:45<3:39:35,  2.80s/it][A
Training...:  66% 9205/13907 [5:34:48<3:43:37,  2.85s/it][A
Training...:  66% 9206/13907 [5:34:51<3:46:17,  2.89s/it][A
Training...:  66% 9207/13907 [5:34:54<3:44:27,  2.87s/it][A
Training...:  66% 9208/13907 [5:34:57<3:42:07,  2.84s/it][A
Training...:  66% 9209/13907 [5:34:59<3:39:31,  2.80s/it][A
Training...:  66% 9210/13907 [5:35:02<3:36:22,  2.76s/it][A
Training...:  66% 9211/13907 [5:35:05<3:32:42,  2.72s/it][A
Training...:  66% 9212/13907 [5:35:07<3:29:23,  2.68s/it][A
Training...:  66% 9213/13907 [5:35:10<3:26:18,  2.64s/it][A
Training...:  66% 9214/13907 [5:35:12<3:24:21,  2.61s/it][A
Training...:  66% 9215/13907 [5:35:15<3:21:50,  2.58s/it][A
Training...:  66% 9216/13907 [5:35:17<3:18:03,  2.53s/it][A
Training...:  66% 9217/13907 [5:35:20<3:14:23,  2.49s/it][A
Training...:  66% 9218/13907 [5:35:22<3:11:37,  2.45s/it][A
Training...:  66% 9219/13907 [5:35:24<3:08:43,  2.42s/it][A
Training...:  66% 9220/13907 [5:35:27<3:06:04,  2.38s/it][A
Training...:  66% 9221/13907 [5:35:29<3:03:22,  2.35s/it][A
Training...:  66% 9222/13907 [5:35:31<2:59:38,  2.30s/it][A
Training...:  66% 9223/13907 [5:35:33<2:56:49,  2.27s/it][A
Training...:  66% 9224/13907 [5:35:35<2:54:18,  2.23s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:35:50<?, ?it/s]
Training...:  66% 9224/13907 [5:35:38<2:54:18,  2.23s/it][A
Training...:  66% 9225/13907 [5:35:38<2:58:40,  2.29s/it][A
Training...:  66% 9226/13907 [5:35:40<2:55:47,  2.25s/it][A
Training...:  66% 9227/13907 [5:35:42<2:51:51,  2.20s/it][A
Training...:  66% 9228/13907 [5:35:44<2:48:30,  2.16s/it][A
Training...:  66% 9229/13907 [5:35:46<2:46:08,  2.13s/it][A
Training...:  66% 9230/13907 [5:35:48<2:43:00,  2.09s/it][A
Training...:  66% 9231/13907 [5:35:50<2:40:18,  2.06s/it][A
Training...:  66% 9232/13907 [5:35:52<2:37:24,  2.02s/it][A
Training...:  66% 9233/13907 [5:35:54<2:35:40,  2.00s/it][A
Training...:  66% 9234/13907 [5:35:56<2:33:15,  1.97s/it][A
Training...:  66% 9235/13907 [5:35:58<2:30:36,  1.93s/it][A
Training...:  66% 9236/13907 [5:36:00<2:28:46,  1.91s/it][A
Training...:  66% 9237/13907 [5:36:01<2:26:17,  1.88s/it][A
Training...:  66% 9238/13907 [5:36:03<2:23:38,  1.85s/it][A
Training...:  66% 9239/13907 [5:36:05<2:21:02,  1.81s/it][A
Training...:  66% 9240/13907 [5:36:07<2:18:52,  1.79s/it][A
Training...:  66% 9241/13907 [5:36:08<2:15:54,  1.75s/it][A
Training...:  66% 9242/13907 [5:36:10<2:12:38,  1.71s/it][A
Training...:  66% 9243/13907 [5:36:11<2:09:40,  1.67s/it][A
Training...:  66% 9244/13907 [5:36:13<2:06:43,  1.63s/it][A
Training...:  66% 9245/13907 [5:36:14<2:03:12,  1.59s/it][A
Training...:  66% 9246/13907 [5:36:16<1:59:14,  1.54s/it][A
Training...:  66% 9247/13907 [5:36:17<1:56:15,  1.50s/it][A
Training...:  66% 9248/13907 [5:36:19<1:51:19,  1.43s/it][A
Training...:  67% 9249/13907 [5:36:20<1:45:54,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:36:33<?, ?it/s]
Training...:  67% 9249/13907 [5:36:21<1:45:54,  1.36s/it][A
Training...:  67% 9250/13907 [5:36:21<1:43:32,  1.33s/it][A
Training...:  67% 9251/13907 [5:36:25<2:41:28,  2.08s/it][A
Training...:  67% 9252/13907 [5:36:28<3:12:24,  2.48s/it][A
Training...:  67% 9253/13907 [5:36:32<3:31:28,  2.73s/it][A
Training...:  67% 9254/13907 [5:36:35<3:43:07,  2.88s/it][A
Training...:  67% 9255/13907 [5:36:38<3:47:10,  2.93s/it][A
Training...:  67% 9256/13907 [5:36:41<3:47:28,  2.93s/it][A
Training...:  67% 9257/13907 [5:36:44<3:45:31,  2.91s/it][A
Training...:  67% 9258/13907 [5:36:46<3:42:10,  2.87s/it][A
Training...:  67% 9259/13907 [5:36:49<3:39:14,  2.83s/it][A
Training...:  67% 9260/13907 [5:36:52<3:35:22,  2.78s/it][A
Training...:  67% 9261/13907 [5:36:54<3:31:18,  2.73s/it][A
Training...:  67% 9262/13907 [5:36:57<3:27:44,  2.68s/it][A
Training...:  67% 9263/13907 [5:37:00<3:24:40,  2.64s/it][A
Training...:  67% 9264/13907 [5:37:02<3:20:28,  2.59s/it][A
Training...:  67% 9265/13907 [5:37:05<3:17:05,  2.55s/it][A
Training...:  67% 9266/13907 [5:37:07<3:13:44,  2.50s/it][A
Training...:  67% 9267/13907 [5:37:09<3:11:40,  2.48s/it][A
Training...:  67% 9268/13907 [5:37:12<3:09:13,  2.45s/it][A
Training...:  67% 9269/13907 [5:37:14<3:06:44,  2.42s/it][A
Training...:  67% 9270/13907 [5:37:16<3:04:13,  2.38s/it][A
Training...:  67% 9271/13907 [5:37:19<3:01:51,  2.35s/it][A
Training...:  67% 9272/13907 [5:37:21<2:59:15,  2.32s/it][A
Training...:  67% 9273/13907 [5:37:23<2:56:08,  2.28s/it][A
Training...:  67% 9274/13907 [5:37:25<2:53:11,  2.24s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:37:40<?, ?it/s]
Training...:  67% 9274/13907 [5:37:28<2:53:11,  2.24s/it][A
Training...:  67% 9275/13907 [5:37:28<2:57:50,  2.30s/it][A
Training...:  67% 9276/13907 [5:37:30<2:55:02,  2.27s/it][A
Training...:  67% 9277/13907 [5:37:32<2:50:58,  2.22s/it][A
Training...:  67% 9278/13907 [5:37:34<2:47:19,  2.17s/it][A
Training...:  67% 9279/13907 [5:37:36<2:45:57,  2.15s/it][A
Training...:  67% 9280/13907 [5:37:38<2:43:36,  2.12s/it][A
Training...:  67% 9281/13907 [5:37:40<2:40:57,  2.09s/it][A
Training...:  67% 9282/13907 [5:37:42<2:38:27,  2.06s/it][A
Training...:  67% 9283/13907 [5:37:44<2:35:06,  2.01s/it][A
Training...:  67% 9284/13907 [5:37:46<2:32:07,  1.97s/it][A
Training...:  67% 9285/13907 [5:37:48<2:29:55,  1.95s/it][A
Training...:  67% 9286/13907 [5:37:50<2:27:18,  1.91s/it][A
Training...:  67% 9287/13907 [5:37:51<2:24:53,  1.88s/it][A
Training...:  67% 9288/13907 [5:37:53<2:23:07,  1.86s/it][A
Training...:  67% 9289/13907 [5:37:55<2:20:10,  1.82s/it][A
Training...:  67% 9290/13907 [5:37:57<2:17:57,  1.79s/it][A
Training...:  67% 9291/13907 [5:37:58<2:15:21,  1.76s/it][A
Training...:  67% 9292/13907 [5:38:00<2:11:37,  1.71s/it][A
Training...:  67% 9293/13907 [5:38:02<2:08:30,  1.67s/it][A
Training...:  67% 9294/13907 [5:38:03<2:05:15,  1.63s/it][A
Training...:  67% 9295/13907 [5:38:05<2:01:35,  1.58s/it][A
Training...:  67% 9296/13907 [5:38:06<1:57:34,  1.53s/it][A
Training...:  67% 9297/13907 [5:38:07<1:53:23,  1.48s/it][A
Training...:  67% 9298/13907 [5:38:09<1:48:30,  1.41s/it][A
Training...:  67% 9299/13907 [5:38:10<1:43:07,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:38:23<?, ?it/s]
Training...:  67% 9299/13907 [5:38:11<1:43:07,  1.34s/it][A
Training...:  67% 9300/13907 [5:38:11<1:41:02,  1.32s/it][A
Training...:  67% 9301/13907 [5:38:15<2:39:04,  2.07s/it][A
Training...:  67% 9302/13907 [5:38:18<3:10:28,  2.48s/it][A
Training...:  67% 9303/13907 [5:38:22<3:26:23,  2.69s/it][A
Training...:  67% 9304/13907 [5:38:25<3:34:40,  2.80s/it][A
Training...:  67% 9305/13907 [5:38:28<3:39:19,  2.86s/it][A
Training...:  67% 9306/13907 [5:38:30<3:40:51,  2.88s/it][A
Training...:  67% 9307/13907 [5:38:33<3:41:55,  2.89s/it][A
Training...:  67% 9308/13907 [5:38:36<3:41:12,  2.89s/it][A
Training...:  67% 9309/13907 [5:38:39<3:37:57,  2.84s/it][A
Training...:  67% 9310/13907 [5:38:42<3:35:19,  2.81s/it][A
Training...:  67% 9311/13907 [5:38:44<3:31:35,  2.76s/it][A
Training...:  67% 9312/13907 [5:38:47<3:27:13,  2.71s/it][A
Training...:  67% 9313/13907 [5:38:50<3:23:05,  2.65s/it][A
Training...:  67% 9314/13907 [5:38:52<3:19:19,  2.60s/it][A
Training...:  67% 9315/13907 [5:38:55<3:16:42,  2.57s/it][A
Training...:  67% 9316/13907 [5:38:57<3:13:21,  2.53s/it][A
Training...:  67% 9317/13907 [5:38:59<3:09:34,  2.48s/it][A
Training...:  67% 9318/13907 [5:39:02<3:07:49,  2.46s/it][A
Training...:  67% 9319/13907 [5:39:04<3:05:23,  2.42s/it][A
Training...:  67% 9320/13907 [5:39:06<3:02:27,  2.39s/it][A
Training...:  67% 9321/13907 [5:39:09<2:59:42,  2.35s/it][A
Training...:  67% 9322/13907 [5:39:11<2:56:18,  2.31s/it][A
Training...:  67% 9323/13907 [5:39:13<2:53:44,  2.27s/it][A
Training...:  67% 9324/13907 [5:39:15<2:51:20,  2.24s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:39:30<?, ?it/s]
Training...:  67% 9324/13907 [5:39:18<2:51:20,  2.24s/it][A
Training...:  67% 9325/13907 [5:39:18<2:55:52,  2.30s/it][A
Training...:  67% 9326/13907 [5:39:20<2:53:47,  2.28s/it][A
Training...:  67% 9327/13907 [5:39:22<2:49:49,  2.22s/it][A
Training...:  67% 9328/13907 [5:39:24<2:46:16,  2.18s/it][A
Training...:  67% 9329/13907 [5:39:26<2:43:12,  2.14s/it][A
Training...:  67% 9330/13907 [5:39:28<2:40:26,  2.10s/it][A
Training...:  67% 9331/13907 [5:39:30<2:37:40,  2.07s/it][A
Training...:  67% 9332/13907 [5:39:32<2:35:15,  2.04s/it][A
Training...:  67% 9333/13907 [5:39:34<2:33:10,  2.01s/it][A
Training...:  67% 9334/13907 [5:39:36<2:30:37,  1.98s/it][A
Training...:  67% 9335/13907 [5:39:38<2:29:28,  1.96s/it][A
Training...:  67% 9336/13907 [5:39:40<2:26:56,  1.93s/it][A
Training...:  67% 9337/13907 [5:39:42<2:25:04,  1.90s/it][A
Training...:  67% 9338/13907 [5:39:43<2:22:35,  1.87s/it][A
Training...:  67% 9339/13907 [5:39:45<2:19:33,  1.83s/it][A
Training...:  67% 9340/13907 [5:39:47<2:16:19,  1.79s/it][A
Training...:  67% 9341/13907 [5:39:48<2:13:15,  1.75s/it][A
Training...:  67% 9342/13907 [5:39:50<2:10:01,  1.71s/it][A
Training...:  67% 9343/13907 [5:39:52<2:06:49,  1.67s/it][A
Training...:  67% 9344/13907 [5:39:53<2:03:52,  1.63s/it][A
Training...:  67% 9345/13907 [5:39:55<2:00:05,  1.58s/it][A
Training...:  67% 9346/13907 [5:39:56<1:56:43,  1.54s/it][A
Training...:  67% 9347/13907 [5:39:57<1:52:46,  1.48s/it][A
Training...:  67% 9348/13907 [5:39:59<1:48:26,  1.43s/it][A
Training...:  67% 9349/13907 [5:40:00<1:42:55,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:40:13<?, ?it/s]
Training...:  67% 9349/13907 [5:40:01<1:42:55,  1.35s/it][A
Training...:  67% 9350/13907 [5:40:01<1:41:09,  1.33s/it][A
Training...:  67% 9351/13907 [5:40:05<2:37:57,  2.08s/it][A
Training...:  67% 9352/13907 [5:40:08<3:10:18,  2.51s/it][A
Training...:  67% 9353/13907 [5:40:12<3:26:45,  2.72s/it][A
Training...:  67% 9354/13907 [5:40:15<3:35:54,  2.85s/it][A
Training...:  67% 9355/13907 [5:40:18<3:39:59,  2.90s/it][A
Training...:  67% 9356/13907 [5:40:21<3:40:22,  2.91s/it][A
Training...:  67% 9357/13907 [5:40:24<3:39:04,  2.89s/it][A
Training...:  67% 9358/13907 [5:40:26<3:36:02,  2.85s/it][A
Training...:  67% 9359/13907 [5:40:29<3:34:17,  2.83s/it][A
Training...:  67% 9360/13907 [5:40:32<3:30:58,  2.78s/it][A
Training...:  67% 9361/13907 [5:40:34<3:28:00,  2.75s/it][A
Training...:  67% 9362/13907 [5:40:37<3:24:38,  2.70s/it][A
Training...:  67% 9363/13907 [5:40:40<3:21:00,  2.65s/it][A
Training...:  67% 9364/13907 [5:40:42<3:17:35,  2.61s/it][A
Training...:  67% 9365/13907 [5:40:45<3:14:12,  2.57s/it][A
Training...:  67% 9366/13907 [5:40:47<3:11:36,  2.53s/it][A
Training...:  67% 9367/13907 [5:40:49<3:08:43,  2.49s/it][A
Training...:  67% 9368/13907 [5:40:52<3:05:46,  2.46s/it][A
Training...:  67% 9369/13907 [5:40:54<3:02:54,  2.42s/it][A
Training...:  67% 9370/13907 [5:40:56<3:00:02,  2.38s/it][A
Training...:  67% 9371/13907 [5:40:59<2:57:27,  2.35s/it][A
Training...:  67% 9372/13907 [5:41:01<2:56:37,  2.34s/it][A
Training...:  67% 9373/13907 [5:41:03<2:54:02,  2.30s/it][A
Training...:  67% 9374/13907 [5:41:05<2:50:42,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:41:20<?, ?it/s]
Training...:  67% 9374/13907 [5:41:08<2:50:42,  2.26s/it][A
Training...:  67% 9375/13907 [5:41:08<2:54:28,  2.31s/it][A
Training...:  67% 9376/13907 [5:41:10<2:50:48,  2.26s/it][A
Training...:  67% 9377/13907 [5:41:12<2:46:20,  2.20s/it][A
Training...:  67% 9378/13907 [5:41:14<2:43:19,  2.16s/it][A
Training...:  67% 9379/13907 [5:41:16<2:40:05,  2.12s/it][A
Training...:  67% 9380/13907 [5:41:18<2:37:09,  2.08s/it][A
Training...:  67% 9381/13907 [5:41:20<2:35:07,  2.06s/it][A
Training...:  67% 9382/13907 [5:41:22<2:32:56,  2.03s/it][A
Training...:  67% 9383/13907 [5:41:24<2:30:01,  1.99s/it][A
Training...:  67% 9384/13907 [5:41:26<2:28:04,  1.96s/it][A
Training...:  67% 9385/13907 [5:41:28<2:25:56,  1.94s/it][A
Training...:  67% 9386/13907 [5:41:30<2:23:26,  1.90s/it][A
Training...:  67% 9387/13907 [5:41:31<2:21:12,  1.87s/it][A
Training...:  68% 9388/13907 [5:41:33<2:18:41,  1.84s/it][A
Training...:  68% 9389/13907 [5:41:35<2:16:02,  1.81s/it][A
Training...:  68% 9390/13907 [5:41:37<2:13:30,  1.77s/it][A
Training...:  68% 9391/13907 [5:41:38<2:10:36,  1.74s/it][A
Training...:  68% 9392/13907 [5:41:40<2:07:26,  1.69s/it][A
Training...:  68% 9393/13907 [5:41:41<2:04:37,  1.66s/it][A
Training...:  68% 9394/13907 [5:41:43<2:02:42,  1.63s/it][A
Training...:  68% 9395/13907 [5:41:44<1:59:10,  1.58s/it][A
Training...:  68% 9396/13907 [5:41:46<1:55:14,  1.53s/it][A
Training...:  68% 9397/13907 [5:41:47<1:51:07,  1.48s/it][A
Training...:  68% 9398/13907 [5:41:49<1:46:57,  1.42s/it][A
Training...:  68% 9399/13907 [5:41:50<1:41:42,  1.35s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:42:03<?, ?it/s]
Training...:  68% 9399/13907 [5:41:51<1:41:42,  1.35s/it][A
Training...:  68% 9400/13907 [5:41:51<1:39:04,  1.32s/it][A
Training...:  68% 9401/13907 [5:41:55<2:36:37,  2.09s/it][A
Training...:  68% 9402/13907 [5:41:58<3:08:31,  2.51s/it][A
Training...:  68% 9403/13907 [5:42:02<3:24:37,  2.73s/it][A
Training...:  68% 9404/13907 [5:42:05<3:33:00,  2.84s/it][A
Training...:  68% 9405/13907 [5:42:08<3:40:58,  2.94s/it][A
Training...:  68% 9406/13907 [5:42:11<3:40:59,  2.95s/it][A
Training...:  68% 9407/13907 [5:42:14<3:38:34,  2.91s/it][A
Training...:  68% 9408/13907 [5:42:16<3:34:58,  2.87s/it][A
Training...:  68% 9409/13907 [5:42:19<3:32:21,  2.83s/it][A
Training...:  68% 9410/13907 [5:42:22<3:29:03,  2.79s/it][A
Training...:  68% 9411/13907 [5:42:24<3:25:29,  2.74s/it][A
Training...:  68% 9412/13907 [5:42:27<3:21:31,  2.69s/it][A
Training...:  68% 9413/13907 [5:42:30<3:18:05,  2.64s/it][A
Training...:  68% 9414/13907 [5:42:32<3:14:59,  2.60s/it][A
Training...:  68% 9415/13907 [5:42:35<3:11:51,  2.56s/it][A
Training...:  68% 9416/13907 [5:42:37<3:09:19,  2.53s/it][A
Training...:  68% 9417/13907 [5:42:39<3:06:37,  2.49s/it][A
Training...:  68% 9418/13907 [5:42:42<3:04:22,  2.46s/it][A
Training...:  68% 9419/13907 [5:42:44<3:01:05,  2.42s/it][A
Training...:  68% 9420/13907 [5:42:46<2:58:42,  2.39s/it][A
Training...:  68% 9421/13907 [5:42:49<2:56:48,  2.36s/it][A
Training...:  68% 9422/13907 [5:42:51<2:54:24,  2.33s/it][A
Training...:  68% 9423/13907 [5:42:53<2:51:59,  2.30s/it][A
Training...:  68% 9424/13907 [5:42:55<2:49:09,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:43:10<?, ?it/s]
Training...:  68% 9424/13907 [5:42:58<2:49:09,  2.26s/it][A
Training...:  68% 9425/13907 [5:42:58<2:52:43,  2.31s/it][A
Training...:  68% 9426/13907 [5:43:00<2:48:58,  2.26s/it][A
Training...:  68% 9427/13907 [5:43:02<2:44:30,  2.20s/it][A
Training...:  68% 9428/13907 [5:43:04<2:40:27,  2.15s/it][A
Training...:  68% 9429/13907 [5:43:06<2:37:22,  2.11s/it][A
Training...:  68% 9430/13907 [5:43:08<2:35:35,  2.09s/it][A
Training...:  68% 9431/13907 [5:43:10<2:34:10,  2.07s/it][A
Training...:  68% 9432/13907 [5:43:12<2:31:25,  2.03s/it][A
Training...:  68% 9433/13907 [5:43:14<2:28:36,  1.99s/it][A
Training...:  68% 9434/13907 [5:43:16<2:25:38,  1.95s/it][A
Training...:  68% 9435/13907 [5:43:18<2:22:46,  1.92s/it][A
Training...:  68% 9436/13907 [5:43:20<2:20:37,  1.89s/it][A
Training...:  68% 9437/13907 [5:43:21<2:17:48,  1.85s/it][A
Training...:  68% 9438/13907 [5:43:23<2:15:12,  1.82s/it][A
Training...:  68% 9439/13907 [5:43:25<2:12:49,  1.78s/it][A
Training...:  68% 9440/13907 [5:43:26<2:10:34,  1.75s/it][A
Training...:  68% 9441/13907 [5:43:28<2:08:08,  1.72s/it][A
Training...:  68% 9442/13907 [5:43:30<2:05:44,  1.69s/it][A
Training...:  68% 9443/13907 [5:43:31<2:03:19,  1.66s/it][A
Training...:  68% 9444/13907 [5:43:33<2:00:55,  1.63s/it][A
Training...:  68% 9445/13907 [5:43:34<1:58:23,  1.59s/it][A
Training...:  68% 9446/13907 [5:43:36<1:54:34,  1.54s/it][A
Training...:  68% 9447/13907 [5:43:37<1:50:57,  1.49s/it][A
Training...:  68% 9448/13907 [5:43:38<1:46:52,  1.44s/it][A
Training...:  68% 9449/13907 [5:43:40<1:41:53,  1.37s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:43:53<?, ?it/s]
Training...:  68% 9449/13907 [5:43:41<1:41:53,  1.37s/it][A
Training...:  68% 9450/13907 [5:43:41<1:39:12,  1.34s/it][A
Training...:  68% 9451/13907 [5:43:45<2:36:27,  2.11s/it][A
Training...:  68% 9452/13907 [5:43:48<3:06:06,  2.51s/it][A
Training...:  68% 9453/13907 [5:43:51<3:21:43,  2.72s/it][A
Training...:  68% 9454/13907 [5:43:55<3:30:13,  2.83s/it][A
Training...:  68% 9455/13907 [5:43:58<3:34:46,  2.89s/it][A
Training...:  68% 9456/13907 [5:44:00<3:35:05,  2.90s/it][A
Training...:  68% 9457/13907 [5:44:03<3:35:03,  2.90s/it][A
Training...:  68% 9458/13907 [5:44:06<3:32:48,  2.87s/it][A
Training...:  68% 9459/13907 [5:44:09<3:29:44,  2.83s/it][A
Training...:  68% 9460/13907 [5:44:12<3:26:44,  2.79s/it][A
Training...:  68% 9461/13907 [5:44:14<3:23:13,  2.74s/it][A
Training...:  68% 9462/13907 [5:44:17<3:19:43,  2.70s/it][A
Training...:  68% 9463/13907 [5:44:19<3:17:22,  2.66s/it][A
Training...:  68% 9464/13907 [5:44:22<3:14:14,  2.62s/it][A
Training...:  68% 9465/13907 [5:44:24<3:10:47,  2.58s/it][A
Training...:  68% 9466/13907 [5:44:27<3:08:24,  2.55s/it][A
Training...:  68% 9467/13907 [5:44:29<3:06:48,  2.52s/it][A
Training...:  68% 9468/13907 [5:44:32<3:03:28,  2.48s/it][A
Training...:  68% 9469/13907 [5:44:34<3:01:53,  2.46s/it][A
Training...:  68% 9470/13907 [5:44:37<2:59:23,  2.43s/it][A
Training...:  68% 9471/13907 [5:44:39<2:55:56,  2.38s/it][A
Training...:  68% 9472/13907 [5:44:41<2:52:51,  2.34s/it][A
Training...:  68% 9473/13907 [5:44:43<2:50:04,  2.30s/it][A
Training...:  68% 9474/13907 [5:44:45<2:47:43,  2.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:45:00<?, ?it/s]
Training...:  68% 9474/13907 [5:44:48<2:47:43,  2.27s/it][A
Training...:  68% 9475/13907 [5:44:48<2:51:36,  2.32s/it][A
Training...:  68% 9476/13907 [5:44:50<2:48:14,  2.28s/it][A
Training...:  68% 9477/13907 [5:44:52<2:43:55,  2.22s/it][A
Training...:  68% 9478/13907 [5:44:54<2:40:16,  2.17s/it][A
Training...:  68% 9479/13907 [5:44:56<2:37:06,  2.13s/it][A
Training...:  68% 9480/13907 [5:44:58<2:34:25,  2.09s/it][A
Training...:  68% 9481/13907 [5:45:00<2:31:42,  2.06s/it][A
Training...:  68% 9482/13907 [5:45:02<2:28:41,  2.02s/it][A
Training...:  68% 9483/13907 [5:45:04<2:26:43,  1.99s/it][A
Training...:  68% 9484/13907 [5:45:06<2:24:30,  1.96s/it][A
Training...:  68% 9485/13907 [5:45:08<2:22:22,  1.93s/it][A
Training...:  68% 9486/13907 [5:45:10<2:19:44,  1.90s/it][A
Training...:  68% 9487/13907 [5:45:11<2:17:14,  1.86s/it][A
Training...:  68% 9488/13907 [5:45:13<2:14:35,  1.83s/it][A
Training...:  68% 9489/13907 [5:45:15<2:12:47,  1.80s/it][A
Training...:  68% 9490/13907 [5:45:17<2:10:03,  1.77s/it][A
Training...:  68% 9491/13907 [5:45:18<2:07:35,  1.73s/it][A
Training...:  68% 9492/13907 [5:45:20<2:04:37,  1.69s/it][A
Training...:  68% 9493/13907 [5:45:21<2:02:23,  1.66s/it][A
Training...:  68% 9494/13907 [5:45:23<1:59:50,  1.63s/it][A
Training...:  68% 9495/13907 [5:45:24<1:56:57,  1.59s/it][A
Training...:  68% 9496/13907 [5:45:26<1:53:27,  1.54s/it][A
Training...:  68% 9497/13907 [5:45:27<1:49:36,  1.49s/it][A
Training...:  68% 9498/13907 [5:45:29<1:45:02,  1.43s/it][A
Training...:  68% 9499/13907 [5:45:30<1:40:05,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:45:43<?, ?it/s]
Training...:  68% 9499/13907 [5:45:31<1:40:05,  1.36s/it][A
Training...:  68% 9500/13907 [5:45:31<1:38:25,  1.34s/it][A
Training...:  68% 9501/13907 [5:45:35<2:33:22,  2.09s/it][A
Training...:  68% 9502/13907 [5:45:38<3:05:36,  2.53s/it][A
Training...:  68% 9503/13907 [5:45:42<3:22:40,  2.76s/it][A
Training...:  68% 9504/13907 [5:45:45<3:30:21,  2.87s/it][A
Training...:  68% 9505/13907 [5:45:48<3:34:23,  2.92s/it][A
Training...:  68% 9506/13907 [5:45:51<3:35:00,  2.93s/it][A
Training...:  68% 9507/13907 [5:45:54<3:35:02,  2.93s/it][A
Training...:  68% 9508/13907 [5:45:57<3:34:25,  2.92s/it][A
Training...:  68% 9509/13907 [5:46:00<3:31:43,  2.89s/it][A
Training...:  68% 9510/13907 [5:46:02<3:27:21,  2.83s/it][A
Training...:  68% 9511/13907 [5:46:05<3:23:37,  2.78s/it][A
Training...:  68% 9512/13907 [5:46:07<3:19:09,  2.72s/it][A
Training...:  68% 9513/13907 [5:46:10<3:15:55,  2.68s/it][A
Training...:  68% 9514/13907 [5:46:13<3:11:56,  2.62s/it][A
Training...:  68% 9515/13907 [5:46:15<3:08:36,  2.58s/it][A
Training...:  68% 9516/13907 [5:46:17<3:05:20,  2.53s/it][A
Training...:  68% 9517/13907 [5:46:20<3:02:41,  2.50s/it][A
Training...:  68% 9518/13907 [5:46:22<3:00:11,  2.46s/it][A
Training...:  68% 9519/13907 [5:46:25<2:57:50,  2.43s/it][A
Training...:  68% 9520/13907 [5:46:27<2:55:02,  2.39s/it][A
Training...:  68% 9521/13907 [5:46:29<2:52:47,  2.36s/it][A
Training...:  68% 9522/13907 [5:46:31<2:49:58,  2.33s/it][A
Training...:  68% 9523/13907 [5:46:34<2:47:48,  2.30s/it][A
Training...:  68% 9524/13907 [5:46:36<2:45:22,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:46:51<?, ?it/s]
Training...:  68% 9524/13907 [5:46:38<2:45:22,  2.26s/it][A
Training...:  68% 9525/13907 [5:46:38<2:49:54,  2.33s/it][A
Training...:  68% 9526/13907 [5:46:41<2:47:48,  2.30s/it][A
Training...:  69% 9527/13907 [5:46:43<2:44:29,  2.25s/it][A
Training...:  69% 9528/13907 [5:46:45<2:41:31,  2.21s/it][A
Training...:  69% 9529/13907 [5:46:47<2:38:27,  2.17s/it][A
Training...:  69% 9530/13907 [5:46:49<2:36:19,  2.14s/it][A
Training...:  69% 9531/13907 [5:46:51<2:34:26,  2.12s/it][A
Training...:  69% 9532/13907 [5:46:53<2:32:24,  2.09s/it][A
Training...:  69% 9533/13907 [5:46:55<2:29:47,  2.05s/it][A
Training...:  69% 9534/13907 [5:46:57<2:28:02,  2.03s/it][A
Training...:  69% 9535/13907 [5:46:59<2:26:21,  2.01s/it][A
Training...:  69% 9536/13907 [5:47:01<2:23:24,  1.97s/it][A
Training...:  69% 9537/13907 [5:47:03<2:20:39,  1.93s/it][A
Training...:  69% 9538/13907 [5:47:04<2:17:31,  1.89s/it][A
Training...:  69% 9539/13907 [5:47:06<2:15:33,  1.86s/it][A
Training...:  69% 9540/13907 [5:47:08<2:13:04,  1.83s/it][A
Training...:  69% 9541/13907 [5:47:10<2:08:49,  1.77s/it][A
Training...:  69% 9542/13907 [5:47:11<2:05:20,  1.72s/it][A
Training...:  69% 9543/13907 [5:47:13<2:01:43,  1.67s/it][A
Training...:  69% 9544/13907 [5:47:14<1:58:50,  1.63s/it][A
Training...:  69% 9545/13907 [5:47:16<1:55:07,  1.58s/it][A
Training...:  69% 9546/13907 [5:47:17<1:51:09,  1.53s/it][A
Training...:  69% 9547/13907 [5:47:19<1:47:23,  1.48s/it][A
Training...:  69% 9548/13907 [5:47:20<1:42:51,  1.42s/it][A
Training...:  69% 9549/13907 [5:47:21<1:37:41,  1.34s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:47:35<?, ?it/s]
Training...:  69% 9549/13907 [5:47:22<1:37:41,  1.34s/it][A
Training...:  69% 9550/13907 [5:47:22<1:35:39,  1.32s/it][A
Training...:  69% 9551/13907 [5:47:26<2:30:48,  2.08s/it][A
Training...:  69% 9552/13907 [5:47:30<3:01:07,  2.50s/it][A
Training...:  69% 9553/13907 [5:47:33<3:16:41,  2.71s/it][A
Training...:  69% 9554/13907 [5:47:36<3:24:00,  2.81s/it][A
Training...:  69% 9555/13907 [5:47:39<3:28:30,  2.87s/it][A
Training...:  69% 9556/13907 [5:47:42<3:28:45,  2.88s/it][A
Training...:  69% 9557/13907 [5:47:45<3:29:49,  2.89s/it][A
Training...:  69% 9558/13907 [5:47:48<3:27:43,  2.87s/it][A
Training...:  69% 9559/13907 [5:47:50<3:25:46,  2.84s/it][A
Training...:  69% 9560/13907 [5:47:53<3:22:35,  2.80s/it][A
Training...:  69% 9561/13907 [5:47:56<3:19:48,  2.76s/it][A
Training...:  69% 9562/13907 [5:47:58<3:16:55,  2.72s/it][A
Training...:  69% 9563/13907 [5:48:01<3:14:53,  2.69s/it][A
Training...:  69% 9564/13907 [5:48:03<3:11:45,  2.65s/it][A
Training...:  69% 9565/13907 [5:48:06<3:09:15,  2.62s/it][A
Training...:  69% 9566/13907 [5:48:08<3:06:06,  2.57s/it][A
Training...:  69% 9567/13907 [5:48:11<3:03:00,  2.53s/it][A
Training...:  69% 9568/13907 [5:48:13<3:00:10,  2.49s/it][A
Training...:  69% 9569/13907 [5:48:16<2:58:54,  2.47s/it][A
Training...:  69% 9570/13907 [5:48:18<2:56:39,  2.44s/it][A
Training...:  69% 9571/13907 [5:48:20<2:53:06,  2.40s/it][A
Training...:  69% 9572/13907 [5:48:23<2:50:07,  2.35s/it][A
Training...:  69% 9573/13907 [5:48:25<2:47:17,  2.32s/it][A
Training...:  69% 9574/13907 [5:48:27<2:44:17,  2.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:48:42<?, ?it/s]
Training...:  69% 9574/13907 [5:48:30<2:44:17,  2.27s/it][A
Training...:  69% 9575/13907 [5:48:30<2:48:46,  2.34s/it][A
Training...:  69% 9576/13907 [5:48:32<2:46:18,  2.30s/it][A
Training...:  69% 9577/13907 [5:48:34<2:42:28,  2.25s/it][A
Training...:  69% 9578/13907 [5:48:36<2:38:36,  2.20s/it][A
Training...:  69% 9579/13907 [5:48:38<2:36:05,  2.16s/it][A
Training...:  69% 9580/13907 [5:48:40<2:33:29,  2.13s/it][A
Training...:  69% 9581/13907 [5:48:42<2:31:00,  2.09s/it][A
Training...:  69% 9582/13907 [5:48:44<2:28:15,  2.06s/it][A
Training...:  69% 9583/13907 [5:48:46<2:25:39,  2.02s/it][A
Training...:  69% 9584/13907 [5:48:48<2:23:22,  1.99s/it][A
Training...:  69% 9585/13907 [5:48:50<2:21:28,  1.96s/it][A
Training...:  69% 9586/13907 [5:48:52<2:18:53,  1.93s/it][A
Training...:  69% 9587/13907 [5:48:54<2:16:49,  1.90s/it][A
Training...:  69% 9588/13907 [5:48:55<2:14:00,  1.86s/it][A
Training...:  69% 9589/13907 [5:48:57<2:11:40,  1.83s/it][A
Training...:  69% 9590/13907 [5:48:59<2:08:46,  1.79s/it][A
Training...:  69% 9591/13907 [5:49:00<2:06:27,  1.76s/it][A
Training...:  69% 9592/13907 [5:49:02<2:03:47,  1.72s/it][A
Training...:  69% 9593/13907 [5:49:04<2:01:26,  1.69s/it][A
Training...:  69% 9594/13907 [5:49:05<1:58:44,  1.65s/it][A
Training...:  69% 9595/13907 [5:49:07<1:55:51,  1.61s/it][A
Training...:  69% 9596/13907 [5:49:08<1:52:01,  1.56s/it][A
Training...:  69% 9597/13907 [5:49:10<1:48:11,  1.51s/it][A
Training...:  69% 9598/13907 [5:49:11<1:43:23,  1.44s/it][A
Training...:  69% 9599/13907 [5:49:12<1:38:19,  1.37s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:49:26<?, ?it/s]
Training...:  69% 9599/13907 [5:49:13<1:38:19,  1.37s/it][A
Training...:  69% 9600/13907 [5:49:13<1:36:09,  1.34s/it][A
Training...:  69% 9601/13907 [5:49:17<2:30:44,  2.10s/it][A
Training...:  69% 9602/13907 [5:49:21<3:00:34,  2.52s/it][A
Training...:  69% 9603/13907 [5:49:24<3:16:56,  2.75s/it][A
Training...:  69% 9604/13907 [5:49:27<3:24:19,  2.85s/it][A
Training...:  69% 9605/13907 [5:49:30<3:29:54,  2.93s/it][A
Training...:  69% 9606/13907 [5:49:33<3:30:20,  2.93s/it][A
Training...:  69% 9607/13907 [5:49:36<3:28:38,  2.91s/it][A
Training...:  69% 9608/13907 [5:49:39<3:27:06,  2.89s/it][A
Training...:  69% 9609/13907 [5:49:42<3:26:02,  2.88s/it][A
Training...:  69% 9610/13907 [5:49:44<3:21:31,  2.81s/it][A
Training...:  69% 9611/13907 [5:49:47<3:17:24,  2.76s/it][A
Training...:  69% 9612/13907 [5:49:50<3:13:47,  2.71s/it][A
Training...:  69% 9613/13907 [5:49:52<3:10:18,  2.66s/it][A
Training...:  69% 9614/13907 [5:49:55<3:07:11,  2.62s/it][A
Training...:  69% 9615/13907 [5:49:57<3:03:56,  2.57s/it][A
Training...:  69% 9616/13907 [5:50:00<3:00:35,  2.53s/it][A
Training...:  69% 9617/13907 [5:50:02<2:58:24,  2.50s/it][A
Training...:  69% 9618/13907 [5:50:04<2:54:55,  2.45s/it][A
Training...:  69% 9619/13907 [5:50:07<2:52:06,  2.41s/it][A
Training...:  69% 9620/13907 [5:50:09<2:49:00,  2.37s/it][A
Training...:  69% 9621/13907 [5:50:11<2:46:34,  2.33s/it][A
Training...:  69% 9622/13907 [5:50:13<2:43:35,  2.29s/it][A
Training...:  69% 9623/13907 [5:50:15<2:40:35,  2.25s/it][A
Training...:  69% 9624/13907 [5:50:18<2:38:16,  2.22s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:50:32<?, ?it/s]
Training...:  69% 9624/13907 [5:50:20<2:38:16,  2.22s/it][A
Training...:  69% 9625/13907 [5:50:20<2:42:16,  2.27s/it][A
Training...:  69% 9626/13907 [5:50:22<2:39:23,  2.23s/it][A
Training...:  69% 9627/13907 [5:50:24<2:35:36,  2.18s/it][A
Training...:  69% 9628/13907 [5:50:26<2:32:18,  2.14s/it][A
Training...:  69% 9629/13907 [5:50:28<2:30:18,  2.11s/it][A
Training...:  69% 9630/13907 [5:50:30<2:28:48,  2.09s/it][A
Training...:  69% 9631/13907 [5:50:32<2:26:53,  2.06s/it][A
Training...:  69% 9632/13907 [5:50:34<2:24:16,  2.02s/it][A
Training...:  69% 9633/13907 [5:50:36<2:22:33,  2.00s/it][A
Training...:  69% 9634/13907 [5:50:38<2:20:36,  1.97s/it][A
Training...:  69% 9635/13907 [5:50:40<2:18:45,  1.95s/it][A
Training...:  69% 9636/13907 [5:50:42<2:16:19,  1.92s/it][A
Training...:  69% 9637/13907 [5:50:44<2:14:17,  1.89s/it][A
Training...:  69% 9638/13907 [5:50:45<2:12:12,  1.86s/it][A
Training...:  69% 9639/13907 [5:50:47<2:09:12,  1.82s/it][A
Training...:  69% 9640/13907 [5:50:49<2:06:23,  1.78s/it][A
Training...:  69% 9641/13907 [5:50:51<2:03:53,  1.74s/it][A
Training...:  69% 9642/13907 [5:50:52<2:01:01,  1.70s/it][A
Training...:  69% 9643/13907 [5:50:54<1:58:54,  1.67s/it][A
Training...:  69% 9644/13907 [5:50:55<1:57:11,  1.65s/it][A
Training...:  69% 9645/13907 [5:50:57<1:53:00,  1.59s/it][A
Training...:  69% 9646/13907 [5:50:58<1:49:41,  1.54s/it][A
Training...:  69% 9647/13907 [5:51:00<1:45:46,  1.49s/it][A
Training...:  69% 9648/13907 [5:51:01<1:41:13,  1.43s/it][A
Training...:  69% 9649/13907 [5:51:02<1:36:35,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:51:16<?, ?it/s]
Training...:  69% 9649/13907 [5:51:03<1:36:35,  1.36s/it][A
Training...:  69% 9650/13907 [5:51:03<1:33:44,  1.32s/it][A
Training...:  69% 9651/13907 [5:51:07<2:27:12,  2.08s/it][A
Training...:  69% 9652/13907 [5:51:10<2:54:47,  2.46s/it][A
Training...:  69% 9653/13907 [5:51:14<3:11:39,  2.70s/it][A
Training...:  69% 9654/13907 [5:51:17<3:18:44,  2.80s/it][A
Training...:  69% 9655/13907 [5:51:20<3:22:05,  2.85s/it][A
Training...:  69% 9656/13907 [5:51:23<3:22:52,  2.86s/it][A
Training...:  69% 9657/13907 [5:51:26<3:22:33,  2.86s/it][A
Training...:  69% 9658/13907 [5:51:28<3:20:52,  2.84s/it][A
Training...:  69% 9659/13907 [5:51:31<3:18:32,  2.80s/it][A
Training...:  69% 9660/13907 [5:51:34<3:15:52,  2.77s/it][A
Training...:  69% 9661/13907 [5:51:36<3:13:20,  2.73s/it][A
Training...:  69% 9662/13907 [5:51:39<3:10:43,  2.70s/it][A
Training...:  69% 9663/13907 [5:51:42<3:07:40,  2.65s/it][A
Training...:  69% 9664/13907 [5:51:44<3:04:40,  2.61s/it][A
Training...:  69% 9665/13907 [5:51:47<3:02:14,  2.58s/it][A
Training...:  70% 9666/13907 [5:51:49<2:59:34,  2.54s/it][A
Training...:  70% 9667/13907 [5:51:51<2:57:23,  2.51s/it][A
Training...:  70% 9668/13907 [5:51:54<2:55:15,  2.48s/it][A
Training...:  70% 9669/13907 [5:51:56<2:55:01,  2.48s/it][A
Training...:  70% 9670/13907 [5:51:59<2:51:53,  2.43s/it][A
Training...:  70% 9671/13907 [5:52:01<2:49:00,  2.39s/it][A
Training...:  70% 9672/13907 [5:52:03<2:46:21,  2.36s/it][A
Training...:  70% 9673/13907 [5:52:05<2:43:26,  2.32s/it][A
Training...:  70% 9674/13907 [5:52:08<2:40:09,  2.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:52:22<?, ?it/s]
Training...:  70% 9674/13907 [5:52:10<2:40:09,  2.27s/it][A
Training...:  70% 9675/13907 [5:52:10<2:44:23,  2.33s/it][A
Training...:  70% 9676/13907 [5:52:12<2:41:24,  2.29s/it][A
Training...:  70% 9677/13907 [5:52:14<2:36:48,  2.22s/it][A
Training...:  70% 9678/13907 [5:52:16<2:33:34,  2.18s/it][A
Training...:  70% 9679/13907 [5:52:18<2:30:44,  2.14s/it][A
Training...:  70% 9680/13907 [5:52:20<2:28:04,  2.10s/it][A
Training...:  70% 9681/13907 [5:52:22<2:25:51,  2.07s/it][A
Training...:  70% 9682/13907 [5:52:24<2:24:05,  2.05s/it][A
Training...:  70% 9683/13907 [5:52:26<2:21:29,  2.01s/it][A
Training...:  70% 9684/13907 [5:52:28<2:19:42,  1.99s/it][A
Training...:  70% 9685/13907 [5:52:30<2:17:21,  1.95s/it][A
Training...:  70% 9686/13907 [5:52:32<2:14:53,  1.92s/it][A
Training...:  70% 9687/13907 [5:52:34<2:12:47,  1.89s/it][A
Training...:  70% 9688/13907 [5:52:36<2:10:30,  1.86s/it][A
Training...:  70% 9689/13907 [5:52:37<2:07:50,  1.82s/it][A
Training...:  70% 9690/13907 [5:52:39<2:05:18,  1.78s/it][A
Training...:  70% 9691/13907 [5:52:41<2:02:47,  1.75s/it][A
Training...:  70% 9692/13907 [5:52:42<2:00:08,  1.71s/it][A
Training...:  70% 9693/13907 [5:52:44<1:57:27,  1.67s/it][A
Training...:  70% 9694/13907 [5:52:45<1:54:33,  1.63s/it][A
Training...:  70% 9695/13907 [5:52:47<1:51:24,  1.59s/it][A
Training...:  70% 9696/13907 [5:52:48<1:48:05,  1.54s/it][A
Training...:  70% 9697/13907 [5:52:50<1:44:10,  1.48s/it][A
Training...:  70% 9698/13907 [5:52:51<1:39:49,  1.42s/it][A
Training...:  70% 9699/13907 [5:52:52<1:35:09,  1.36s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:53:06<?, ?it/s]
Training...:  70% 9699/13907 [5:52:53<1:35:09,  1.36s/it][A
Training...:  70% 9700/13907 [5:52:53<1:32:43,  1.32s/it][A
Training...:  70% 9701/13907 [5:52:57<2:27:30,  2.10s/it][A
Training...:  70% 9702/13907 [5:53:01<2:56:00,  2.51s/it][A
Training...:  70% 9703/13907 [5:53:04<3:11:47,  2.74s/it][A
Training...:  70% 9704/13907 [5:53:07<3:19:38,  2.85s/it][A
Training...:  70% 9705/13907 [5:53:10<3:23:20,  2.90s/it][A
Training...:  70% 9706/13907 [5:53:13<3:24:24,  2.92s/it][A
Training...:  70% 9707/13907 [5:53:16<3:25:11,  2.93s/it][A
Training...:  70% 9708/13907 [5:53:19<3:26:03,  2.94s/it][A
Training...:  70% 9709/13907 [5:53:22<3:23:54,  2.91s/it][A
Training...:  70% 9710/13907 [5:53:25<3:20:29,  2.87s/it][A
Training...:  70% 9711/13907 [5:53:27<3:16:33,  2.81s/it][A
Training...:  70% 9712/13907 [5:53:30<3:12:35,  2.75s/it][A
Training...:  70% 9713/13907 [5:53:33<3:08:39,  2.70s/it][A
Training...:  70% 9714/13907 [5:53:35<3:05:47,  2.66s/it][A
Training...:  70% 9715/13907 [5:53:38<3:02:48,  2.62s/it][A
Training...:  70% 9716/13907 [5:53:40<2:59:32,  2.57s/it][A
Training...:  70% 9717/13907 [5:53:43<2:56:21,  2.53s/it][A
Training...:  70% 9718/13907 [5:53:45<2:53:34,  2.49s/it][A
Training...:  70% 9719/13907 [5:53:47<2:50:35,  2.44s/it][A
Training...:  70% 9720/13907 [5:53:50<2:47:55,  2.41s/it][A
Training...:  70% 9721/13907 [5:53:52<2:45:45,  2.38s/it][A
Training...:  70% 9722/13907 [5:53:54<2:43:47,  2.35s/it][A
Training...:  70% 9723/13907 [5:53:56<2:41:13,  2.31s/it][A
Training...:  70% 9724/13907 [5:53:59<2:37:53,  2.26s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:54:13<?, ?it/s]
Training...:  70% 9724/13907 [5:54:01<2:37:53,  2.26s/it][A
Training...:  70% 9725/13907 [5:54:01<2:42:18,  2.33s/it][A
Training...:  70% 9726/13907 [5:54:03<2:39:19,  2.29s/it][A
Training...:  70% 9727/13907 [5:54:05<2:35:00,  2.22s/it][A
Training...:  70% 9728/13907 [5:54:07<2:32:17,  2.19s/it][A
Training...:  70% 9729/13907 [5:54:09<2:29:18,  2.14s/it][A
Training...:  70% 9730/13907 [5:54:12<2:27:41,  2.12s/it][A
Training...:  70% 9731/13907 [5:54:14<2:26:13,  2.10s/it][A
Training...:  70% 9732/13907 [5:54:16<2:23:07,  2.06s/it][A
Training...:  70% 9733/13907 [5:54:17<2:20:23,  2.02s/it][A
Training...:  70% 9734/13907 [5:54:19<2:18:21,  1.99s/it][A
Training...:  70% 9735/13907 [5:54:21<2:16:37,  1.96s/it][A
Training...:  70% 9736/13907 [5:54:23<2:14:20,  1.93s/it][A
Training...:  70% 9737/13907 [5:54:25<2:11:52,  1.90s/it][A
Training...:  70% 9738/13907 [5:54:27<2:09:34,  1.86s/it][A
Training...:  70% 9739/13907 [5:54:29<2:07:25,  1.83s/it][A
Training...:  70% 9740/13907 [5:54:30<2:05:17,  1.80s/it][A
Training...:  70% 9741/13907 [5:54:32<2:04:04,  1.79s/it][A
Training...:  70% 9742/13907 [5:54:34<2:02:17,  1.76s/it][A
Training...:  70% 9743/13907 [5:54:35<1:58:57,  1.71s/it][A
Training...:  70% 9744/13907 [5:54:37<1:55:42,  1.67s/it][A
Training...:  70% 9745/13907 [5:54:38<1:52:54,  1.63s/it][A
Training...:  70% 9746/13907 [5:54:40<1:49:34,  1.58s/it][A
Training...:  70% 9747/13907 [5:54:41<1:45:28,  1.52s/it][A
Training...:  70% 9748/13907 [5:54:43<1:41:16,  1.46s/it][A
Training...:  70% 9749/13907 [5:54:44<1:36:13,  1.39s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:54:57<?, ?it/s]
Training...:  70% 9749/13907 [5:54:45<1:36:13,  1.39s/it][A
Training...:  70% 9750/13907 [5:54:45<1:33:37,  1.35s/it][A
Training...:  70% 9751/13907 [5:54:49<2:27:11,  2.13s/it][A
Training...:  70% 9752/13907 [5:54:52<2:55:26,  2.53s/it][A
Training...:  70% 9753/13907 [5:54:56<3:11:36,  2.77s/it][A
Training...:  70% 9754/13907 [5:54:59<3:19:53,  2.89s/it][A
Training...:  70% 9755/13907 [5:55:02<3:23:35,  2.94s/it][A
Training...:  70% 9756/13907 [5:55:05<3:24:10,  2.95s/it][A
Training...:  70% 9757/13907 [5:55:08<3:23:20,  2.94s/it][A
Training...:  70% 9758/13907 [5:55:11<3:21:36,  2.92s/it][A
Training...:  70% 9759/13907 [5:55:14<3:18:29,  2.87s/it][A
Training...:  70% 9760/13907 [5:55:16<3:15:29,  2.83s/it][A
Training...:  70% 9761/13907 [5:55:19<3:12:04,  2.78s/it][A
Training...:  70% 9762/13907 [5:55:22<3:08:14,  2.72s/it][A
Training...:  70% 9763/13907 [5:55:24<3:05:51,  2.69s/it][A
Training...:  70% 9764/13907 [5:55:27<3:03:00,  2.65s/it][A
Training...:  70% 9765/13907 [5:55:29<3:00:13,  2.61s/it][A
Training...:  70% 9766/13907 [5:55:32<2:57:27,  2.57s/it][A
Training...:  70% 9767/13907 [5:55:34<2:55:40,  2.55s/it][A
Training...:  70% 9768/13907 [5:55:37<2:53:46,  2.52s/it][A
Training...:  70% 9769/13907 [5:55:39<2:51:16,  2.48s/it][A
Training...:  70% 9770/13907 [5:55:41<2:48:01,  2.44s/it][A
Training...:  70% 9771/13907 [5:55:44<2:44:47,  2.39s/it][A
Training...:  70% 9772/13907 [5:55:46<2:42:01,  2.35s/it][A
Training...:  70% 9773/13907 [5:55:48<2:38:52,  2.31s/it][A
Training...:  70% 9774/13907 [5:55:50<2:36:38,  2.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:56:05<?, ?it/s]
Training...:  70% 9774/13907 [5:55:53<2:36:38,  2.27s/it][A
Training...:  70% 9775/13907 [5:55:53<2:41:31,  2.35s/it][A
Training...:  70% 9776/13907 [5:55:55<2:38:32,  2.30s/it][A
Training...:  70% 9777/13907 [5:55:57<2:34:30,  2.24s/it][A
Training...:  70% 9778/13907 [5:55:59<2:32:14,  2.21s/it][A
Training...:  70% 9779/13907 [5:56:01<2:28:48,  2.16s/it][A
Training...:  70% 9780/13907 [5:56:03<2:26:26,  2.13s/it][A
Training...:  70% 9781/13907 [5:56:05<2:23:26,  2.09s/it][A
Training...:  70% 9782/13907 [5:56:07<2:21:04,  2.05s/it][A
Training...:  70% 9783/13907 [5:56:09<2:18:29,  2.01s/it][A
Training...:  70% 9784/13907 [5:56:11<2:16:04,  1.98s/it][A
Training...:  70% 9785/13907 [5:56:13<2:14:01,  1.95s/it][A
Training...:  70% 9786/13907 [5:56:15<2:12:17,  1.93s/it][A
Training...:  70% 9787/13907 [5:56:17<2:09:30,  1.89s/it][A
Training...:  70% 9788/13907 [5:56:19<2:07:23,  1.86s/it][A
Training...:  70% 9789/13907 [5:56:20<2:05:28,  1.83s/it][A
Training...:  70% 9790/13907 [5:56:22<2:03:19,  1.80s/it][A
Training...:  70% 9791/13907 [5:56:24<2:01:24,  1.77s/it][A
Training...:  70% 9792/13907 [5:56:25<1:58:36,  1.73s/it][A
Training...:  70% 9793/13907 [5:56:27<1:56:20,  1.70s/it][A
Training...:  70% 9794/13907 [5:56:29<1:53:31,  1.66s/it][A
Training...:  70% 9795/13907 [5:56:30<1:51:10,  1.62s/it][A
Training...:  70% 9796/13907 [5:56:32<1:47:39,  1.57s/it][A
Training...:  70% 9797/13907 [5:56:33<1:44:30,  1.53s/it][A
Training...:  70% 9798/13907 [5:56:34<1:40:04,  1.46s/it][A
Training...:  70% 9799/13907 [5:56:35<1:35:35,  1.40s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:56:49<?, ?it/s]
Training...:  70% 9799/13907 [5:56:37<1:35:35,  1.40s/it][A
Training...:  70% 9800/13907 [5:56:37<1:33:42,  1.37s/it][A
Training...:  70% 9801/13907 [5:56:41<2:23:28,  2.10s/it][A
Training...:  70% 9802/13907 [5:56:44<2:50:10,  2.49s/it][A
Training...:  70% 9803/13907 [5:56:47<3:05:31,  2.71s/it][A
Training...:  70% 9804/13907 [5:56:50<3:13:39,  2.83s/it][A
Training...:  71% 9805/13907 [5:56:53<3:18:50,  2.91s/it][A
Training...:  71% 9806/13907 [5:56:56<3:20:45,  2.94s/it][A
Training...:  71% 9807/13907 [5:56:59<3:18:59,  2.91s/it][A
Training...:  71% 9808/13907 [5:57:02<3:15:40,  2.86s/it][A
Training...:  71% 9809/13907 [5:57:05<3:11:57,  2.81s/it][A
Training...:  71% 9810/13907 [5:57:07<3:08:33,  2.76s/it][A
Training...:  71% 9811/13907 [5:57:10<3:05:31,  2.72s/it][A
Training...:  71% 9812/13907 [5:57:13<3:02:30,  2.67s/it][A
Training...:  71% 9813/13907 [5:57:15<2:59:45,  2.63s/it][A
Training...:  71% 9814/13907 [5:57:18<2:57:10,  2.60s/it][A
Training...:  71% 9815/13907 [5:57:20<2:54:58,  2.57s/it][A
Training...:  71% 9816/13907 [5:57:23<2:52:27,  2.53s/it][A
Training...:  71% 9817/13907 [5:57:25<2:50:00,  2.49s/it][A
Training...:  71% 9818/13907 [5:57:27<2:46:59,  2.45s/it][A
Training...:  71% 9819/13907 [5:57:30<2:44:30,  2.41s/it][A
Training...:  71% 9820/13907 [5:57:32<2:42:01,  2.38s/it][A
Training...:  71% 9821/13907 [5:57:34<2:39:43,  2.35s/it][A
Training...:  71% 9822/13907 [5:57:36<2:37:05,  2.31s/it][A
Training...:  71% 9823/13907 [5:57:39<2:34:26,  2.27s/it][A
Training...:  71% 9824/13907 [5:57:41<2:32:32,  2.24s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:57:56<?, ?it/s]
Training...:  71% 9824/13907 [5:57:43<2:32:32,  2.24s/it][A
Training...:  71% 9825/13907 [5:57:43<2:36:13,  2.30s/it][A
Training...:  71% 9826/13907 [5:57:45<2:33:21,  2.25s/it][A
Training...:  71% 9827/13907 [5:57:47<2:29:56,  2.20s/it][A
Training...:  71% 9828/13907 [5:57:50<2:27:31,  2.17s/it][A
Training...:  71% 9829/13907 [5:57:52<2:24:33,  2.13s/it][A
Training...:  71% 9830/13907 [5:57:54<2:22:00,  2.09s/it][A
Training...:  71% 9831/13907 [5:57:56<2:20:46,  2.07s/it][A
Training...:  71% 9832/13907 [5:57:58<2:19:10,  2.05s/it][A
Training...:  71% 9833/13907 [5:58:00<2:17:45,  2.03s/it][A
Training...:  71% 9834/13907 [5:58:01<2:15:30,  2.00s/it][A
Training...:  71% 9835/13907 [5:58:03<2:13:21,  1.97s/it][A
Training...:  71% 9836/13907 [5:58:05<2:10:58,  1.93s/it][A
Training...:  71% 9837/13907 [5:58:07<2:08:24,  1.89s/it][A
Training...:  71% 9838/13907 [5:58:09<2:05:36,  1.85s/it][A
Training...:  71% 9839/13907 [5:58:11<2:03:23,  1.82s/it][A
Training...:  71% 9840/13907 [5:58:12<2:01:02,  1.79s/it][A
Training...:  71% 9841/13907 [5:58:14<1:58:14,  1.74s/it][A
Training...:  71% 9842/13907 [5:58:16<1:55:45,  1.71s/it][A
Training...:  71% 9843/13907 [5:58:17<1:53:34,  1.68s/it][A
Training...:  71% 9844/13907 [5:58:19<1:52:07,  1.66s/it][A
Training...:  71% 9845/13907 [5:58:20<1:49:42,  1.62s/it][A
Training...:  71% 9846/13907 [5:58:22<1:46:24,  1.57s/it][A
Training...:  71% 9847/13907 [5:58:23<1:42:44,  1.52s/it][A
Training...:  71% 9848/13907 [5:58:24<1:38:51,  1.46s/it][A
Training...:  71% 9849/13907 [5:58:26<1:34:04,  1.39s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:58:39<?, ?it/s]
Training...:  71% 9849/13907 [5:58:27<1:34:04,  1.39s/it][A
Training...:  71% 9850/13907 [5:58:27<1:32:26,  1.37s/it][A
Training...:  71% 9851/13907 [5:58:31<2:22:02,  2.10s/it][A
Training...:  71% 9852/13907 [5:58:34<2:49:38,  2.51s/it][A
Training...:  71% 9853/13907 [5:58:38<3:05:18,  2.74s/it][A
Training...:  71% 9854/13907 [5:58:41<3:12:38,  2.85s/it][A
Training...:  71% 9855/13907 [5:58:44<3:16:41,  2.91s/it][A
Training...:  71% 9856/13907 [5:58:47<3:16:58,  2.92s/it][A
Training...:  71% 9857/13907 [5:58:49<3:15:45,  2.90s/it][A
Training...:  71% 9858/13907 [5:58:52<3:13:34,  2.87s/it][A
Training...:  71% 9859/13907 [5:58:55<3:10:49,  2.83s/it][A
Training...:  71% 9860/13907 [5:58:58<3:07:30,  2.78s/it][A
Training...:  71% 9861/13907 [5:59:00<3:04:31,  2.74s/it][A
Training...:  71% 9862/13907 [5:59:03<3:01:46,  2.70s/it][A
Training...:  71% 9863/13907 [5:59:05<2:58:38,  2.65s/it][A
Training...:  71% 9864/13907 [5:59:08<2:55:36,  2.61s/it][A
Training...:  71% 9865/13907 [5:59:10<2:53:03,  2.57s/it][A
Training...:  71% 9866/13907 [5:59:13<2:50:48,  2.54s/it][A
Training...:  71% 9867/13907 [5:59:15<2:48:45,  2.51s/it][A
Training...:  71% 9868/13907 [5:59:18<2:45:50,  2.46s/it][A
Training...:  71% 9869/13907 [5:59:20<2:45:02,  2.45s/it][A
Training...:  71% 9870/13907 [5:59:22<2:42:07,  2.41s/it][A
Training...:  71% 9871/13907 [5:59:25<2:39:44,  2.37s/it][A
Training...:  71% 9872/13907 [5:59:27<2:37:05,  2.34s/it][A
Training...:  71% 9873/13907 [5:59:29<2:34:49,  2.30s/it][A
Training...:  71% 9874/13907 [5:59:31<2:32:26,  2.27s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [5:59:46<?, ?it/s]
Training...:  71% 9874/13907 [5:59:34<2:32:26,  2.27s/it][A
Training...:  71% 9875/13907 [5:59:34<2:35:49,  2.32s/it][A
Training...:  71% 9876/13907 [5:59:36<2:33:07,  2.28s/it][A
Training...:  71% 9877/13907 [5:59:38<2:29:14,  2.22s/it][A
Training...:  71% 9878/13907 [5:59:40<2:26:16,  2.18s/it][A
Training...:  71% 9879/13907 [5:59:42<2:23:20,  2.14s/it][A
Training...:  71% 9880/13907 [5:59:44<2:21:38,  2.11s/it][A
Training...:  71% 9881/13907 [5:59:46<2:19:54,  2.09s/it][A
Training...:  71% 9882/13907 [5:59:48<2:18:05,  2.06s/it][A
Training...:  71% 9883/13907 [5:59:50<2:17:20,  2.05s/it][A
Training...:  71% 9884/13907 [5:59:52<2:16:51,  2.04s/it][A
Training...:  71% 9885/13907 [5:59:54<2:14:50,  2.01s/it][A
Training...:  71% 9886/13907 [5:59:56<2:13:01,  1.98s/it][A
Training...:  71% 9887/13907 [5:59:58<2:10:08,  1.94s/it][A
Training...:  71% 9888/13907 [6:00:00<2:07:51,  1.91s/it][A
Training...:  71% 9889/13907 [6:00:02<2:05:08,  1.87s/it][A
Training...:  71% 9890/13907 [6:00:03<2:03:00,  1.84s/it][A
Training...:  71% 9891/13907 [6:00:05<2:00:59,  1.81s/it][A
Training...:  71% 9892/13907 [6:00:07<1:58:20,  1.77s/it][A
Training...:  71% 9893/13907 [6:00:08<1:54:55,  1.72s/it][A
Training...:  71% 9894/13907 [6:00:10<1:51:41,  1.67s/it][A
Training...:  71% 9895/13907 [6:00:12<1:48:20,  1.62s/it][A
Training...:  71% 9896/13907 [6:00:13<1:44:51,  1.57s/it][A
Training...:  71% 9897/13907 [6:00:14<1:41:05,  1.51s/it][A
Training...:  71% 9898/13907 [6:00:16<1:36:48,  1.45s/it][A
Training...:  71% 9899/13907 [6:00:17<1:32:34,  1.39s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [6:00:30<?, ?it/s]
Training...:  71% 9899/13907 [6:00:18<1:32:34,  1.39s/it][A
Training...:  71% 9900/13907 [6:00:18<1:29:41,  1.34s/it][A
Training...:  71% 9901/13907 [6:00:22<2:18:07,  2.07s/it][A
Training...:  71% 9902/13907 [6:00:25<2:44:48,  2.47s/it][A
Training...:  71% 9903/13907 [6:00:29<3:00:42,  2.71s/it][A
Training...:  71% 9904/13907 [6:00:32<3:08:07,  2.82s/it][A
Training...:  71% 9905/13907 [6:00:35<3:12:22,  2.88s/it][A
Training...:  71% 9906/13907 [6:00:38<3:12:39,  2.89s/it][A
Training...:  71% 9907/13907 [6:00:40<3:12:15,  2.88s/it][A
Training...:  71% 9908/13907 [6:00:43<3:10:30,  2.86s/it][A
Training...:  71% 9909/13907 [6:00:46<3:09:06,  2.84s/it][A
Training...:  71% 9910/13907 [6:00:49<3:05:48,  2.79s/it][A
Training...:  71% 9911/13907 [6:00:51<3:03:20,  2.75s/it][A
Training...:  71% 9912/13907 [6:00:54<3:00:57,  2.72s/it][A
Training...:  71% 9913/13907 [6:00:57<2:58:20,  2.68s/it][A
Training...:  71% 9914/13907 [6:00:59<2:55:54,  2.64s/it][A
Training...:  71% 9915/13907 [6:01:02<2:52:56,  2.60s/it][A
Training...:  71% 9916/13907 [6:01:04<2:51:55,  2.58s/it][A
Training...:  71% 9917/13907 [6:01:07<2:50:51,  2.57s/it][A
Training...:  71% 9918/13907 [6:01:09<2:47:33,  2.52s/it][A
Training...:  71% 9919/13907 [6:01:11<2:44:03,  2.47s/it][A
Training...:  71% 9920/13907 [6:01:14<2:41:33,  2.43s/it][A
Training...:  71% 9921/13907 [6:01:16<2:38:41,  2.39s/it][A
Training...:  71% 9922/13907 [6:01:18<2:36:29,  2.36s/it][A
Training...:  71% 9923/13907 [6:01:21<2:34:10,  2.32s/it][A
Training...:  71% 9924/13907 [6:01:23<2:31:51,  2.29s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [6:01:38<?, ?it/s]
Training...:  71% 9924/13907 [6:01:25<2:31:51,  2.29s/it][A
Training...:  71% 9925/13907 [6:01:25<2:35:51,  2.35s/it][A
Training...:  71% 9926/13907 [6:01:28<2:33:21,  2.31s/it][A
Training...:  71% 9927/13907 [6:01:30<2:29:59,  2.26s/it][A
Training...:  71% 9928/13907 [6:01:32<2:26:13,  2.20s/it][A
Training...:  71% 9929/13907 [6:01:34<2:23:39,  2.17s/it][A
Training...:  71% 9930/13907 [6:01:36<2:20:17,  2.12s/it][A
Training...:  71% 9931/13907 [6:01:38<2:17:23,  2.07s/it][A
Training...:  71% 9932/13907 [6:01:40<2:15:03,  2.04s/it][A
Training...:  71% 9933/13907 [6:01:42<2:13:03,  2.01s/it][A
Training...:  71% 9934/13907 [6:01:44<2:10:59,  1.98s/it][A
Training...:  71% 9935/13907 [6:01:46<2:08:50,  1.95s/it][A
Training...:  71% 9936/13907 [6:01:47<2:06:41,  1.91s/it][A
Training...:  71% 9937/13907 [6:01:49<2:04:26,  1.88s/it][A
Training...:  71% 9938/13907 [6:01:51<2:02:38,  1.85s/it][A
Training...:  71% 9939/13907 [6:01:53<2:00:31,  1.82s/it][A
Training...:  71% 9940/13907 [6:01:54<1:58:34,  1.79s/it][A
Training...:  71% 9941/13907 [6:01:56<1:56:40,  1.77s/it][A
Training...:  71% 9942/13907 [6:01:58<1:55:05,  1.74s/it][A
Training...:  71% 9943/13907 [6:01:59<1:53:00,  1.71s/it][A
Training...:  72% 9944/13907 [6:02:01<1:50:35,  1.67s/it][A
Training...:  72% 9945/13907 [6:02:03<1:48:07,  1.64s/it][A
Training...:  72% 9946/13907 [6:02:04<1:45:01,  1.59s/it][A
Training...:  72% 9947/13907 [6:02:05<1:40:57,  1.53s/it][A
Training...:  72% 9948/13907 [6:02:07<1:37:15,  1.47s/it][A
Training...:  72% 9949/13907 [6:02:08<1:33:14,  1.41s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [6:02:22<?, ?it/s]
Training...:  72% 9949/13907 [6:02:09<1:33:14,  1.41s/it][A
Training...:  72% 9950/13907 [6:02:09<1:30:39,  1.37s/it][A
Training...:  72% 9951/13907 [6:02:13<2:20:05,  2.12s/it][A
Training...:  72% 9952/13907 [6:02:17<2:46:57,  2.53s/it][A
Training...:  72% 9953/13907 [6:02:20<3:01:41,  2.76s/it][A
Training...:  72% 9954/13907 [6:02:23<3:08:45,  2.87s/it][A
Training...:  72% 9955/13907 [6:02:26<3:12:37,  2.92s/it][A
Training...:  72% 9956/13907 [6:02:29<3:12:51,  2.93s/it][A
Training...:  72% 9957/13907 [6:02:32<3:11:40,  2.91s/it][A
Training...:  72% 9958/13907 [6:02:35<3:09:18,  2.88s/it][A
Training...:  72% 9959/13907 [6:02:38<3:06:28,  2.83s/it][A
Training...:  72% 9960/13907 [6:02:40<3:03:35,  2.79s/it][A
Training...:  72% 9961/13907 [6:02:43<3:00:41,  2.75s/it][A
Training...:  72% 9962/13907 [6:02:45<2:58:32,  2.72s/it][A
Training...:  72% 9963/13907 [6:02:48<2:55:53,  2.68s/it][A
Training...:  72% 9964/13907 [6:02:51<2:53:19,  2.64s/it][A
Training...:  72% 9965/13907 [6:02:53<2:50:07,  2.59s/it][A
Training...:  72% 9966/13907 [6:02:56<2:47:50,  2.56s/it][A
Training...:  72% 9967/13907 [6:02:58<2:45:27,  2.52s/it][A
Training...:  72% 9968/13907 [6:03:00<2:42:44,  2.48s/it][A
Training...:  72% 9969/13907 [6:03:03<2:39:55,  2.44s/it][A
Training...:  72% 9970/13907 [6:03:05<2:37:08,  2.39s/it][A
Training...:  72% 9971/13907 [6:03:07<2:35:18,  2.37s/it][A
Training...:  72% 9972/13907 [6:03:10<2:35:17,  2.37s/it][A
Training...:  72% 9973/13907 [6:03:12<2:32:31,  2.33s/it][A
Training...:  72% 9974/13907 [6:03:14<2:29:33,  2.28s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [6:03:29<?, ?it/s]
Training...:  72% 9974/13907 [6:03:17<2:29:33,  2.28s/it][A
Training...:  72% 9975/13907 [6:03:17<2:32:58,  2.33s/it][A
Training...:  72% 9976/13907 [6:03:19<2:29:43,  2.29s/it][A
Training...:  72% 9977/13907 [6:03:21<2:25:02,  2.21s/it][A
Training...:  72% 9978/13907 [6:03:23<2:21:18,  2.16s/it][A
Training...:  72% 9979/13907 [6:03:25<2:18:02,  2.11s/it][A
Training...:  72% 9980/13907 [6:03:27<2:15:52,  2.08s/it][A
Training...:  72% 9981/13907 [6:03:29<2:13:21,  2.04s/it][A
Training...:  72% 9982/13907 [6:03:31<2:11:39,  2.01s/it][A
Training...:  72% 9983/13907 [6:03:33<2:09:29,  1.98s/it][A
Training...:  72% 9984/13907 [6:03:34<2:07:17,  1.95s/it][A
Training...:  72% 9985/13907 [6:03:36<2:05:11,  1.92s/it][A
Training...:  72% 9986/13907 [6:03:38<2:02:41,  1.88s/it][A
Training...:  72% 9987/13907 [6:03:40<2:00:41,  1.85s/it][A
Training...:  72% 9988/13907 [6:03:42<1:58:58,  1.82s/it][A
Training...:  72% 9989/13907 [6:03:43<1:57:32,  1.80s/it][A
Training...:  72% 9990/13907 [6:03:45<1:56:02,  1.78s/it][A
Training...:  72% 9991/13907 [6:03:47<1:54:06,  1.75s/it][A
Training...:  72% 9992/13907 [6:03:48<1:51:54,  1.72s/it][A
Training...:  72% 9993/13907 [6:03:50<1:50:07,  1.69s/it][A
Training...:  72% 9994/13907 [6:03:52<1:48:04,  1.66s/it][A
Training...:  72% 9995/13907 [6:03:53<1:45:01,  1.61s/it][A
Training...:  72% 9996/13907 [6:03:55<1:42:22,  1.57s/it][A
Training...:  72% 9997/13907 [6:03:56<1:39:19,  1.52s/it][A
Training...:  72% 9998/13907 [6:03:57<1:35:52,  1.47s/it][A
Training...:  72% 9999/13907 [6:03:59<1:31:17,  1.40s/it][A                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [6:04:12<?, ?it/s]
Training...:  72% 9999/13907 [6:04:00<1:31:17,  1.40s/it][A

Step... (8875 | Loss: 0.3098061680793762, Learning Rate: 0.00024924849276430905, Gradient Norm: 1.1497108936309814)
Step... (8900 | Loss: 0.558022141456604, Learning Rate: 0.0002490969782229513, Gradient Norm: 2.4874930381774902)
Step... (8925 | Loss: 0.37478771805763245, Learning Rate: 0.00024894546368159354, Gradient Norm: 1.459930658340454)
Step... (8950 | Loss: 0.45686984062194824, Learning Rate: 0.0002487939491402358, Gradient Norm: 2.0097687244415283)
Step... (8975 | Loss: 0.26796019077301025, Learning Rate: 0.000248642434598878, Gradient Norm: 0.8722457885742188)
Step... (9000 | Loss: 0.34560978412628174, Learning Rate: 0.00024849092005752027, Gradient Norm: 2.0504908561706543)
Step... (9025 | Loss: 0.2508326470851898, Learning Rate: 0.0002483394055161625, Gradient Norm: 0.9208568334579468)
Step... (9050 | Loss: 0.317452996969223, Learning Rate: 0.00024818789097480476, Gradient Norm: 1.5628957748413086)
Step... (9075 | Loss: 0.2889084815979004, Learning Rate: 0.000248036376433447, Gradient Norm: 0.9125327467918396)
Step... (9100 | Loss: 0.37440159916877747, Learning Rate: 0.00024788486189208925, Gradient Norm: 1.405688762664795)
Step... (9125 | Loss: 0.2968275547027588, Learning Rate: 0.0002477333473507315, Gradient Norm: 1.1702629327774048)
Step... (9150 | Loss: 0.4139101505279541, Learning Rate: 0.00024758183280937374, Gradient Norm: 1.5365686416625977)
Step... (9175 | Loss: 0.3126169443130493, Learning Rate: 0.000247430318268016, Gradient Norm: 0.9276225566864014)
Step... (9200 | Loss: 0.42463743686676025, Learning Rate: 0.0002472788037266582, Gradient Norm: 1.7658767700195312)
Step... (9225 | Loss: 0.36454588174819946, Learning Rate: 0.00024712728918530047, Gradient Norm: 1.2206802368164062)
Step... (9250 | Loss: 0.35252463817596436, Learning Rate: 0.0002469757746439427, Gradient Norm: 1.4780025482177734)
Step... (9275 | Loss: 0.2919711470603943, Learning Rate: 0.00024682426010258496, Gradient Norm: 0.9644292593002319)
Step... (9300 | Loss: 0.34192976355552673, Learning Rate: 0.0002466727455612272, Gradient Norm: 1.6129709482192993)
Step... (9325 | Loss: 0.3618379831314087, Learning Rate: 0.00024652123101986945, Gradient Norm: 1.0319509506225586)
Step... (9350 | Loss: 0.4401002824306488, Learning Rate: 0.0002463697164785117, Gradient Norm: 1.654270887374878)
Step... (9375 | Loss: 0.33411091566085815, Learning Rate: 0.00024621820193715394, Gradient Norm: 0.905052900314331)
Step... (9400 | Loss: 0.4204164743423462, Learning Rate: 0.0002460666873957962, Gradient Norm: 1.965492844581604)
Step... (9425 | Loss: 0.30876290798187256, Learning Rate: 0.0002459151728544384, Gradient Norm: 1.1455243825912476)
Step... (9450 | Loss: 0.36944079399108887, Learning Rate: 0.00024576365831308067, Gradient Norm: 2.1693897247314453)
Step... (9475 | Loss: 0.30315887928009033, Learning Rate: 0.0002456121437717229, Gradient Norm: 0.8058872818946838)
Step... (9500 | Loss: 0.4922630488872528, Learning Rate: 0.00024546062923036516, Gradient Norm: 2.6198582649230957)
Step... (9525 | Loss: 0.24996891617774963, Learning Rate: 0.0002453091146890074, Gradient Norm: 1.1311019659042358)
Step... (9550 | Loss: 0.42654138803482056, Learning Rate: 0.0002451575710438192, Gradient Norm: 2.8696861267089844)
Step... (9575 | Loss: 0.24223512411117554, Learning Rate: 0.0002450060856062919, Gradient Norm: 0.8820202350616455)
Step... (9600 | Loss: 0.5077723264694214, Learning Rate: 0.00024485457106493413, Gradient Norm: 1.95198655128479)
Step... (9625 | Loss: 0.26618316769599915, Learning Rate: 0.0002447030274197459, Gradient Norm: 0.9058341979980469)
Step... (9650 | Loss: 0.3908669948577881, Learning Rate: 0.00024455151287838817, Gradient Norm: 2.405898094177246)
Step... (9675 | Loss: 0.28659725189208984, Learning Rate: 0.00024440002744086087, Gradient Norm: 0.9521510601043701)
Step... (9700 | Loss: 0.3190035820007324, Learning Rate: 0.00024424848379567266, Gradient Norm: 1.9333611726760864)
Step... (9725 | Loss: 0.31906208395957947, Learning Rate: 0.00024409698380623013, Gradient Norm: 0.9861425161361694)
Step... (975Evaluating ...:   0% 0/255 [00:00<?, ?it/s][A[A0 | Loss: 0.4805920422077179, Learning Rate: 0.00024394546926487237, Gradient Norm: 1.7763129472732544)
Step... (9775 | Loss: 0.30700886249542236, Learning Rate: 0.0002437939401715994, Gradient Norm: 0.8283060789108276)
Step... (9800 | Loss: 0.5281053781509399, Learning Rate: 0.00024364244018215686, Gradient Norm: 2.4125099182128906)
Step... (9825 | Loss: 0.2551959753036499, Learning Rate: 0.00024349091108888388, Gradient Norm: 0.9052514433860779)
Step... (9850 | Loss: 0.3738892078399658, Learning Rate: 0.00024333939654752612, Gradient Norm: 1.992679238319397)
Step... (9875 | Loss: 0.3082529604434967, Learning Rate: 0.0002431878965580836, Gradient Norm: 0.8329021334648132)
Step... (9900 | Loss: 0.5893111228942871, Learning Rate: 0.0002430363674648106, Gradient Norm: 1.9614523649215698)
Step... (9925 | Loss: 0.24438807368278503, Learning Rate: 0.00024288485292345285, Gradient Norm: 0.9133672118186951)
Step... (9950 | Loss: 0.460349977016449, Learning Rate: 0.00024273335293401033, Gradient Norm: 1.9735393524169922)
Step... (9975 | Loss: 0.2538469731807709, Learning Rate: 0.00024258182384073734, Gradient Norm: 0.966986894607544)
Step... (10000 | Loss: 0.35545092821121216, Learning Rate: 0.0002424303092993796, Gradient Norm: 1.4802825450897217)


Evaluating ...:   0% 1/255 [00:11<49:51, 11.78s/it][A[A

Evaluating ...:   1% 2/255 [00:22<47:03, 11.16s/it][A[A

Evaluating ...:   1% 3/255 [00:26<32:36,  7.76s/it][A[A

Evaluating ...:   2% 4/255 [00:29<25:20,  6.06s/it][A[A

Evaluating ...:   2% 5/255 [00:33<21:17,  5.11s/it][A[A

Evaluating ...:   2% 6/255 [00:36<18:30,  4.46s/it][A[A

Evaluating ...:   3% 7/255 [00:46<26:26,  6.40s/it][A[A

Evaluating ...:   3% 8/255 [00:49<22:17,  5.41s/it][A[A

Evaluating ...:   4% 9/255 [00:52<19:06,  4.66s/it][A[A

Evaluating ...:   4% 10/255 [00:55<16:47,  4.11s/it][A[A

Evaluating ...:   4% 11/255 [00:58<15:08,  3.72s/it][A[A

Evaluating ...:   5% 12/255 [01:01<13:53,  3.43s/it][A[A

Evaluating ...:   5% 13/255 [01:04<13:00,  3.22s/it][A[A

Evaluating ...:   5% 14/255 [01:06<12:15,  3.05s/it][A[A

Evaluating ...:   6% 15/255 [01:09<11:46,  2.94s/it][A[A

Evaluating ...:   6% 16/255 [01:12<11:18,  2.84s/it][A[A

Evaluating ...:   7% 17/255 [01:14<10:57,  2.76s/it][A[A

Evaluating ...:   7% 18/255 [01:17<10:35,  2.68s/it][A[A

Evaluating ...:   7% 19/255 [01:19<10:22,  2.64s/it][A[A

Evaluating ...:   8% 20/255 [01:22<10:10,  2.60s/it][A[A

Evaluating ...:   8% 21/255 [01:31<17:49,  4.57s/it][A[A

Evaluating ...:   9% 22/255 [01:33<15:19,  3.95s/it][A[A

Evaluating ...:   9% 23/255 [01:36<13:18,  3.44s/it][A[A

Evaluating ...:   9% 24/255 [01:38<11:50,  3.07s/it][A[A

Evaluating ...:  10% 25/255 [01:40<10:45,  2.81s/it][A[A

Evaluating ...:  10% 26/255 [01:42<09:58,  2.61s/it][A[A

Evaluating ...:  11% 27/255 [01:44<09:22,  2.47s/it][A[A

Evaluating ...:  11% 28/255 [01:46<08:52,  2.34s/it][A[A

Evaluating ...:  11% 29/255 [01:49<08:29,  2.25s/it][A[A

Evaluating ...:  12% 30/255 [01:50<08:09,  2.18s/it][A[A

Evaluating ...:  12% 31/255 [01:52<07:54,  2.12s/it][A[A

Evaluating ...:  13% 32/255 [01:54<07:37,  2.05s/it][A[A

Evaluating ...:  13% 33/255 [01:56<07:26,  2.01s/it][A[A

Evaluating ...:  13% 34/255 [01:58<07:11,  1.95s/it][A[A

Evaluating ...:  14% 35/255 [02:00<07:01,  1.92s/it][A[A

Evaluating ...:  14% 36/255 [02:02<06:49,  1.87s/it][A[A

Evaluating ...:  15% 37/255 [02:03<06:39,  1.83s/it][A[A

Evaluating ...:  15% 38/255 [02:05<06:27,  1.79s/it][A[A

Evaluating ...:  15% 39/255 [02:07<06:19,  1.76s/it][A[A

Evaluating ...:  16% 40/255 [02:08<06:06,  1.71s/it][A[A

Evaluating ...:  16% 41/255 [02:16<12:18,  3.45s/it][A[A

Evaluating ...:  16% 42/255 [02:17<10:08,  2.86s/it][A[A

Evaluating ...:  17% 43/255 [02:19<08:36,  2.44s/it][A[A

Evaluating ...:  17% 44/255 [02:20<07:27,  2.12s/it][A[A

Evaluating ...:  18% 45/255 [02:22<06:38,  1.90s/it][A[A

Evaluating ...:  18% 46/255 [02:23<05:58,  1.72s/it][A[A

Evaluating ...:  18% 47/255 [02:24<05:27,  1.57s/it][A[A

Evaluating ...:  19% 48/255 [02:25<05:00,  1.45s/it][A[A

Evaluating ...:  19% 49/255 [02:26<04:37,  1.34s/it][A[A

Evaluating ...:  20% 50/255 [02:27<04:09,  1.22s/it][A[A

Evaluating ...:  20% 51/255 [02:38<14:11,  4.18s/it][A[A

Evaluating ...:  20% 52/255 [02:42<13:54,  4.11s/it][A[A

Evaluating ...:  21% 53/255 [02:46<13:26,  3.99s/it][A[A

Evaluating ...:  21% 54/255 [02:50<12:57,  3.87s/it][A[A

Evaluating ...:  22% 55/255 [02:53<12:35,  3.78s/it][A[A

Evaluating ...:  22% 56/255 [02:57<12:08,  3.66s/it][A[A

Evaluating ...:  22% 57/255 [03:00<11:46,  3.57s/it][A[A

Evaluating ...:  23% 58/255 [03:03<11:24,  3.47s/it][A[A

Evaluating ...:  23% 59/255 [03:06<11:06,  3.40s/it][A[A

Evaluating ...:  24% 60/255 [03:10<10:48,  3.33s/it][A[A

Evaluating ...:  24% 61/255 [03:13<10:34,  3.27s/it][A[A

Evaluating ...:  24% 62/255 [03:16<10:15,  3.19s/it][A[A

Evaluating ...:  25% 63/255 [03:19<10:02,  3.14s/it][A[A

Evaluating ...:  25% 64/255 [03:22<09:46,  3.07s/it][A[A

Evaluating ...:  25% 65/255 [03:25<09:36,  3.03s/it][A[A

Evaluating ...:  26% 66/255 [03:27<09:21,  2.97s/it][A[A

Evaluating ...:  26% 67/255 [03:30<09:11,  2.94s/it][A[A

Evaluating ...:  27% 68/255 [03:33<08:58,  2.88s/it][A[A

Evaluating ...:  27% 69/255 [03:36<08:49,  2.85s/it][A[A

Evaluating ...:  27% 70/255 [03:39<08:37,  2.80s/it][A[A

Evaluating ...:  28% 71/255 [03:41<08:28,  2.77s/it][A[A

Evaluating ...:  28% 72/255 [03:44<08:18,  2.72s/it][A[A

Evaluating ...:  29% 73/255 [03:46<08:11,  2.70s/it][A[A

Evaluating ...:  29% 74/255 [03:49<08:00,  2.66s/it][A[A

Evaluating ...:  29% 75/255 [03:52<07:52,  2.63s/it][A[A

Evaluating ...:  30% 76/255 [03:54<07:43,  2.59s/it][A[A

Evaluating ...:  30% 77/255 [03:57<07:37,  2.57s/it][A[A

Evaluating ...:  31% 78/255 [03:59<07:26,  2.52s/it][A[A

Evaluating ...:  31% 79/255 [04:01<07:20,  2.50s/it][A[A

Evaluating ...:  31% 80/255 [04:04<07:12,  2.47s/it][A[A

Evaluating ...:  32% 81/255 [04:06<07:05,  2.45s/it][A[A

Evaluating ...:  32% 82/255 [04:09<06:55,  2.40s/it][A[A

Evaluating ...:  33% 83/255 [04:11<06:47,  2.37s/it][A[A

Evaluating ...:  33% 84/255 [04:13<06:35,  2.31s/it][A[A

Evaluating ...:  33% 85/255 [04:15<06:27,  2.28s/it][A[A

Evaluating ...:  34% 86/255 [04:17<06:18,  2.24s/it][A[A

Evaluating ...:  34% 87/255 [04:20<06:11,  2.21s/it][A[A

Evaluating ...:  35% 88/255 [04:22<06:01,  2.16s/it][A[A

Evaluating ...:  35% 89/255 [04:24<05:55,  2.14s/it][A[A

Evaluating ...:  35% 90/255 [04:26<05:45,  2.09s/it][A[A

Evaluating ...:  36% 91/255 [04:28<05:37,  2.06s/it][A[A

Evaluating ...:  36% 92/255 [04:30<05:29,  2.02s/it][A[A

Evaluating ...:  36% 93/255 [04:31<05:20,  1.98s/it][A[A

Evaluating ...:  37% 94/255 [04:33<05:09,  1.92s/it][A[A

Evaluating ...:  37% 95/255 [04:35<05:01,  1.89s/it][A[A

Evaluating ...:  38% 96/255 [04:37<04:51,  1.83s/it][A[A

Evaluating ...:  38% 97/255 [04:38<04:40,  1.77s/it][A[A

Evaluating ...:  38% 98/255 [04:40<04:25,  1.69s/it][A[A

Evaluating ...:  39% 99/255 [04:41<04:08,  1.60s/it][A[A

Evaluating ...:  39% 100/255 [04:42<03:47,  1.46s/it][A[A

Evaluating ...:  40% 101/255 [04:54<11:22,  4.43s/it][A[A

Evaluating ...:  40% 102/255 [04:58<10:51,  4.26s/it][A[A

Evaluating ...:  40% 103/255 [05:01<10:24,  4.11s/it][A[A

Evaluating ...:  41% 104/255 [05:05<09:54,  3.94s/it][A[A

Evaluating ...:  41% 105/255 [05:08<09:29,  3.79s/it][A[A

Evaluating ...:  42% 106/255 [05:12<09:04,  3.66s/it][A[A

Evaluating ...:  42% 107/255 [05:15<08:45,  3.55s/it][A[A

Evaluating ...:  42% 108/255 [05:18<08:26,  3.45s/it][A[A

Evaluating ...:  43% 109/255 [05:21<08:15,  3.39s/it][A[A

Evaluating ...:  43% 110/255 [05:25<07:59,  3.31s/it][A[A

Evaluating ...:  44% 111/255 [05:28<07:47,  3.25s/it][A[A

Evaluating ...:  44% 112/255 [05:31<07:32,  3.17s/it][A[A

Evaluating ...:  44% 113/255 [05:34<07:22,  3.11s/it][A[A

Evaluating ...:  45% 114/255 [05:37<07:09,  3.05s/it][A[A

Evaluating ...:  45% 115/255 [05:39<06:59,  2.99s/it][A[A

Evaluating ...:  45% 116/255 [05:42<06:47,  2.93s/it][A[A

Evaluating ...:  46% 117/255 [05:45<06:39,  2.89s/it][A[A

Evaluating ...:  46% 118/255 [05:48<06:30,  2.85s/it][A[A

Evaluating ...:  47% 119/255 [05:51<06:24,  2.83s/it][A[A

Evaluating ...:  47% 120/255 [05:53<06:15,  2.78s/it][A[A

Evaluating ...:  47% 121/255 [05:56<06:08,  2.75s/it][A[A

Evaluating ...:  48% 122/255 [05:58<05:59,  2.70s/it][A[A

Evaluating ...:  48% 123/255 [06:01<05:51,  2.66s/it][A[A

Evaluating ...:  49% 124/255 [06:04<05:43,  2.62s/it][A[A

Evaluating ...:  49% 125/255 [06:06<05:35,  2.58s/it][A[A

Evaluating ...:  49% 126/255 [06:08<05:26,  2.53s/it][A[A

Evaluating ...:  50% 127/255 [06:11<05:20,  2.51s/it][A[A

Evaluating ...:  50% 128/255 [06:13<05:10,  2.45s/it][A[A

Evaluating ...:  51% 129/255 [06:16<05:03,  2.40s/it][A[A

Evaluating ...:  51% 130/255 [06:18<04:55,  2.36s/it][A[A

Evaluating ...:  51% 131/255 [06:20<04:49,  2.34s/it][A[A

Evaluating ...:  52% 132/255 [06:22<04:41,  2.29s/it][A[A

Evaluating ...:  52% 133/255 [06:24<04:36,  2.27s/it][A[A

Evaluating ...:  53% 134/255 [06:27<04:30,  2.23s/it][A[A

Evaluating ...:  53% 135/255 [06:29<04:26,  2.22s/it][A[A

Evaluating ...:  53% 136/255 [06:31<04:18,  2.17s/it][A[A

Evaluating ...:  54% 137/255 [06:33<04:12,  2.14s/it][A[A

Evaluating ...:  54% 138/255 [06:35<04:04,  2.09s/it][A[A

Evaluating ...:  55% 139/255 [06:37<03:57,  2.05s/it][A[A

Evaluating ...:  55% 140/255 [06:39<03:50,  2.00s/it][A[A

Evaluating ...:  55% 141/255 [06:41<03:43,  1.96s/it][A[A

Evaluating ...:  56% 142/255 [06:42<03:35,  1.91s/it][A[A

Evaluating ...:  56% 143/255 [06:44<03:29,  1.87s/it][A[A

Evaluating ...:  56% 144/255 [06:46<03:21,  1.82s/it][A[A

Evaluating ...:  57% 145/255 [06:48<03:15,  1.77s/it][A[A

Evaluating ...:  57% 146/255 [06:49<03:06,  1.71s/it][A[A

Evaluating ...:  58% 147/255 [06:51<02:58,  1.65s/it][A[A

Evaluating ...:  58% 148/255 [06:52<02:48,  1.58s/it][A[A

Evaluating ...:  58% 149/255 [06:53<02:38,  1.49s/it][A[A

Evaluating ...:  59% 150/255 [06:54<02:23,  1.36s/it][A[A

Evaluating ...:  59% 151/255 [07:05<07:19,  4.23s/it][A[A

Evaluating ...:  60% 152/255 [07:09<07:08,  4.16s/it][A[A

Evaluating ...:  60% 153/255 [07:13<06:51,  4.04s/it][A[A

Evaluating ...:  60% 154/255 [07:17<06:36,  3.93s/it][A[A

Evaluating ...:  61% 155/255 [07:20<06:21,  3.82s/it][A[A

Evaluating ...:  61% 156/255 [07:24<06:04,  3.68s/it][A[A

Evaluating ...:  62% 157/255 [07:27<05:52,  3.60s/it][A[A

Evaluating ...:  62% 158/255 [07:30<05:37,  3.48s/it][A[A

Evaluating ...:  62% 159/255 [07:34<05:28,  3.42s/it][A[A

Evaluating ...:  63% 160/255 [07:37<05:17,  3.34s/it][A[A

Evaluating ...:  63% 161/255 [07:40<05:09,  3.29s/it][A[A

Evaluating ...:  64% 162/255 [07:43<04:57,  3.20s/it][A[A

Evaluating ...:  64% 163/255 [07:46<04:49,  3.15s/it][A[A

Evaluating ...:  64% 164/255 [07:49<04:41,  3.09s/it][A[A

Evaluating ...:  65% 165/255 [07:52<04:33,  3.04s/it][A[A

Evaluating ...:  65% 166/255 [07:55<04:25,  2.99s/it][A[A

Evaluating ...:  65% 167/255 [07:58<04:20,  2.96s/it][A[A

Evaluating ...:  66% 168/255 [08:00<04:13,  2.91s/it][A[A

Evaluating ...:  66% 169/255 [08:03<04:08,  2.89s/it][A[A

Evaluating ...:  67% 170/255 [08:06<04:02,  2.85s/it][A[A

Evaluating ...:  67% 171/255 [08:09<03:56,  2.82s/it][A[A

Evaluating ...:  67% 172/255 [08:11<03:51,  2.79s/it][A[A

Evaluating ...:  68% 173/255 [08:14<03:44,  2.73s/it][A[A

Evaluating ...:  68% 174/255 [08:17<03:38,  2.70s/it][A[A

Evaluating ...:  69% 175/255 [08:19<03:33,  2.66s/it][A[A

Evaluating ...:  69% 176/255 [08:22<03:25,  2.61s/it][A[A

Evaluating ...:  69% 177/255 [08:24<03:21,  2.58s/it][A[A

Evaluating ...:  70% 178/255 [08:27<03:14,  2.53s/it][A[A

Evaluating ...:  70% 179/255 [08:29<03:09,  2.50s/it][A[A

Evaluating ...:  71% 180/255 [08:31<03:03,  2.44s/it][A[A

Evaluating ...:  71% 181/255 [08:34<02:57,  2.40s/it][A[A

Evaluating ...:  71% 182/255 [08:36<02:50,  2.34s/it][A[A

Evaluating ...:  72% 183/255 [08:38<02:45,  2.30s/it][A[A

Evaluating ...:  72% 184/255 [08:40<02:40,  2.25s/it][A[A

Evaluating ...:  73% 185/255 [08:42<02:35,  2.22s/it][A[A

Evaluating ...:  73% 186/255 [08:44<02:31,  2.19s/it][A[A

Evaluating ...:  73% 187/255 [08:47<02:26,  2.16s/it][A[A

Evaluating ...:  74% 188/255 [08:49<02:22,  2.12s/it][A[A

Evaluating ...:  74% 189/255 [08:51<02:18,  2.11s/it][A[A

Evaluating ...:  75% 190/255 [08:53<02:14,  2.07s/it][A[A

Evaluating ...:  75% 191/255 [08:55<02:09,  2.03s/it][A[A

Evaluating ...:  75% 192/255 [08:56<02:04,  1.98s/it][A[A

Evaluating ...:  76% 193/255 [08:58<02:00,  1.94s/it][A[A

Evaluating ...:  76% 194/255 [09:00<01:55,  1.89s/it][A[A

Evaluating ...:  76% 195/255 [09:02<01:51,  1.86s/it][A[A

Evaluating ...:  77% 196/255 [09:03<01:45,  1.80s/it][A[A

Evaluating ...:  77% 197/255 [09:05<01:40,  1.74s/it][A[A

Evaluating ...:  78% 198/255 [09:07<01:34,  1.66s/it][A[A

Evaluating ...:  78% 199/255 [09:08<01:27,  1.57s/it][A[A

Evaluating ...:  78% 200/255 [09:09<01:19,  1.44s/it][A[A

Evaluating ...:  79% 201/255 [09:13<02:05,  2.32s/it][A[A

Evaluating ...:  79% 202/255 [09:17<02:27,  2.79s/it][A[A

Evaluating ...:  80% 203/255 [09:21<02:39,  3.06s/it][A[A

Evaluating ...:  80% 204/255 [09:24<02:42,  3.18s/it][A[A

Evaluating ...:  80% 205/255 [09:28<02:42,  3.25s/it][A[A

Evaluating ...:  81% 206/255 [09:31<02:39,  3.25s/it][A[A

Evaluating ...:  81% 207/255 [09:34<02:34,  3.22s/it][A[A

Evaluating ...:  82% 208/255 [09:37<02:27,  3.14s/it][A[A

Evaluating ...:  82% 209/255 [09:40<02:21,  3.08s/it][A[A

Evaluating ...:  82% 210/255 [09:43<02:15,  3.01s/it][A[A

Evaluating ...:  83% 211/255 [09:46<02:11,  2.98s/it][A[A

Evaluating ...:  83% 212/255 [09:49<02:07,  2.96s/it][A[A

Evaluating ...:  84% 213/255 [09:52<02:01,  2.90s/it][A[A

Evaluating ...:  84% 214/255 [09:54<01:56,  2.84s/it][A[A

Evaluating ...:  84% 215/255 [09:57<01:51,  2.78s/it][A[A

Evaluating ...:  85% 216/255 [10:00<01:46,  2.72s/it][A[A

Evaluating ...:  85% 217/255 [10:02<01:42,  2.69s/it][A[A

Evaluating ...:  85% 218/255 [10:05<01:38,  2.65s/it][A[A

Evaluating ...:  86% 219/255 [10:07<01:33,  2.60s/it][A[A

Evaluating ...:  86% 220/255 [10:10<01:29,  2.55s/it][A[A

Evaluating ...:  87% 221/255 [10:12<01:25,  2.51s/it][A[A

Evaluating ...:  87% 222/255 [10:14<01:20,  2.45s/it][A[A

Evaluating ...:  87% 223/255 [10:17<01:17,  2.42s/it][A[A

Evaluating ...:  88% 224/255 [10:19<01:13,  2.37s/it][A[A

Evaluating ...:  88% 225/255 [10:21<01:10,  2.35s/it][A[A

Evaluating ...:  89% 226/255 [10:23<01:06,  2.29s/it][A[A

Evaluating ...:  89% 227/255 [10:26<01:03,  2.28s/it][A[A

Evaluating ...:  89% 228/255 [10:28<01:00,  2.22s/it][A[A

Evaluating ...:  90% 229/255 [10:30<00:57,  2.19s/it][A[A

Evaluating ...:  90% 230/255 [10:32<00:53,  2.14s/it][A[A

Evaluating ...:  91% 231/255 [10:34<00:50,  2.09s/it][A[A

Evaluating ...:  91% 232/255 [10:36<00:46,  2.04s/it][A[A

Evaluating ...:  91% 233/255 [10:38<00:43,  1.99s/it][A[A

Evaluating ...:  92% 234/255 [10:39<00:40,  1.94s/it][A[A

Evaluating ...:  92% 235/255 [10:41<00:38,  1.91s/it][A[A

Evaluating ...:  93% 236/255 [10:43<00:35,  1.86s/it][A[A

Evaluating ...:  93% 237/255 [10:45<00:32,  1.83s/it][A[A

Evaluating ...:  93% 238/255 [10:47<00:30,  1.79s/it][A[A

Evaluating ...:  94% 239/255 [10:48<00:28,  1.77s/it][A[A

Evaluating ...:  94% 240/255 [10:50<00:25,  1.72s/it][A[A

Evaluating ...:  95% 241/255 [10:51<00:23,  1.68s/it][A[A

Evaluating ...:  95% 242/255 [10:53<00:21,  1.63s/it][A[A

Evaluating ...:  95% 243/255 [10:54<00:18,  1.58s/it][A[A

Evaluating ...:  96% 244/255 [10:56<00:16,  1.53s/it][A[A

Evaluating ...:  96% 245/255 [10:57<00:14,  1.48s/it][A[A

Evaluating ...:  96% 246/255 [10:58<00:12,  1.42s/it][A[A

Evaluating ...:  97% 247/255 [11:00<00:11,  1.38s/it][A[A

Evaluating ...:  97% 248/255 [11:01<00:09,  1.32s/it][A[A

Evaluating ...:  98% 249/255 [11:02<00:07,  1.24s/it][A[A

Evaluating ...:  98% 250/255 [11:03<00:05,  1.14s/it][A[A

Evaluating ...:  98% 251/255 [11:07<00:07,  1.89s/it][A[A

Evaluating ...:  99% 252/255 [11:09<00:06,  2.05s/it][A[A

Evaluating ...:  99% 253/255 [11:11<00:04,  2.03s/it][A[A

Evaluating ...: 100% 254/255 [11:13<00:01,  1.91s/it][A[A

Evaluating ...: 100% 255/255 [11:14<00:00,  1.72s/it][A[AEvaluating ...: 100% 255/255 [11:14<00:00,  2.64s/it]
                                            
                                                         [AEpoch ... (1/4):   0% 0/4 [6:15:39<?, ?it/s]
Training...:  72% 9999/13907 [6:15:27<1:31:17,  1.40s/it][AConfiguration saved in /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/flax-wav2vec2-ctc-cv9-baseline/config.json
tcmalloc: large alloc 1612521472 bytes == 0x25e278000 @  0x7f6b45402680 0x7f6b45422bdd 0x7f69ddd191ff 0x7f69ddd2842c 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd23164 0x7f69ddd2391e 0x503fb6 0x56b1da 0x56939a 0x5f6a13 0x56c28c 0x56939a 0x5f6a13 0x56c28c 0x5f6836 0x56b0ae 0x56939a 0x50aaa0 0x56c28c 0x56939a 0x5f6a13 0x56b0ae 0x56939a 0x5f6a13
Model weights saved in /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/flax-wav2vec2-ctc-cv9-baseline/flax_model.msgpack
tokenizer config file saved in ./flax-wav2vec2-ctc-cv9-baseline/tokenizer_config.json
Special tokens file saved in ./flax-wav2vec2-ctc-cv9-baseline/special_tokens_map.json

Training...:  72% 10000/13907 [6:15:47<231:34:30, 213.38s/it][A
Training...:  72% 10001/13907 [6:15:51<163:24:53, 150.61s/it][A
Training...:  72% 10002/13907 [6:15:54<115:32:21, 106.52s/it][A
Training...:  72% 10003/13907 [6:15:58<81:56:26, 75.56s/it]  [A
Training...:  72% 10004/13907 [6:16:01<58:22:47, 53.85s/it][A
Training...:  72% 10005/13907 [6:16:04<41:53:01, 38.64s/it][A
Training...:  72% 10006/13907 [6:16:07<30:17:51, 27.96s/it][A
Training...:  72% 10007/13907 [6:16:10<22:11:32, 20.49s/it][A
Training...:  72% 10008/13907 [6:16:13<16:28:23, 15.21s/it][A
Training...:  72% 10009/13907 [6:16:16<12:27:34, 11.51s/it][A
Training...:  72% 10010/13907 [6:16:19<9:37:19,  8.89s/it] [A
Training...:  72% 10011/13907 [6:16:21<7:37:23,  7.04s/it][A
Training...:  72% 10012/13907 [6:16:24<6:11:50,  5.73s/it][A
Training...:  72% 10013/13907 [6:16:27<5:12:29,  4.81s/it][A
Training...:  72% 10014/13907 [6:16:29<4:29:54,  4.16s/it][A
Training...:  72% 10015/13907 [6:16:32<3:59:44,  3.70s/it][A
Training...:  72% 10016/13907 [6:16:35<3:39:45,  3.39s/it][A
Training...:  72% 10017/13907 [6:16:37<3:23:17,  3.14s/it][A
Training...:  72% 10018/13907 [6:16:40<3:11:20,  2.95s/it][A
Training...:  72% 10019/13907 [6:16:42<3:02:56,  2.82s/it][A
Training...:  72% 10020/13907 [6:16:45<2:55:24,  2.71s/it][A
Training...:  72% 10021/13907 [6:16:47<2:49:39,  2.62s/it][A
Training...:  72% 10022/13907 [6:16:50<2:45:11,  2.55s/it][A
Training...:  72% 10023/13907 [6:16:52<2:40:32,  2.48s/it][A
Training...:  72% 10024/13907 [6:16:54<2:36:37,  2.42s/it][A                                            
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:17:09<?, ?it/s]
Training...:  72% 10024/13907 [6:16:57<2:36:37,  2.42s/it][A
Training...:  72% 10025/13907 [6:16:57<2:39:59,  2.47s/it][A
Training...:  72% 10026/13907 [6:16:59<2:36:23,  2.42s/it][A
Training...:  72% 10027/13907 [6:17:01<2:32:30,  2.36s/it][A
Training...:  72% 10028/13907 [6:17:03<2:30:07,  2.32s/it][A
Training...:  72% 10029/13907 [6:17:06<2:27:24,  2.28s/it][A
Training...:  72% 10030/13907 [6:17:08<2:25:24,  2.25s/it][A
Training...:  72% 10031/13907 [6:17:10<2:22:46,  2.21s/it][A
Training...:  72% 10032/13907 [6:17:12<2:19:55,  2.17s/it][A
Training...:  72% 10033/13907 [6:17:14<2:14:52,  2.09s/it][A
Training...:  72% 10034/13907 [6:17:16<2:10:35,  2.02s/it][A
Training...:  72% 10035/13907 [6:17:18<2:07:27,  1.98s/it][A
Training...:  72% 10036/13907 [6:17:19<2:04:30,  1.93s/it][A
Training...:  72% 10037/13907 [6:17:21<2:01:39,  1.89s/it][A
Training...:  72% 10038/13907 [6:17:23<1:59:28,  1.85s/it][A
Training...:  72% 10039/13907 [6:17:25<1:56:40,  1.81s/it][A
Training...:  72% 10040/13907 [6:17:26<1:55:06,  1.79s/it][A
Training...:  72% 10041/13907 [6:17:28<1:52:48,  1.75s/it][A
Training...:  72% 10042/13907 [6:17:30<1:51:02,  1.72s/it][A
Training...:  72% 10043/13907 [6:17:31<1:48:30,  1.68s/it][A
Training...:  72% 10044/13907 [6:17:33<1:45:49,  1.64s/it][A
Training...:  72% 10045/13907 [6:17:34<1:43:03,  1.60s/it][A
Training...:  72% 10046/13907 [6:17:36<1:39:40,  1.55s/it][A
Training...:  72% 10047/13907 [6:17:37<1:36:22,  1.50s/it][A
Training...:  72% 10048/13907 [6:17:39<1:32:49,  1.44s/it][A
Training...:  72% 10049/13907 [6:17:40<1:28:21,  1.37s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:17:53<?, ?it/s]
Training...:  72% 10049/13907 [6:17:41<1:28:21,  1.37s/it][A
Training...:  72% 10050/13907 [6:17:41<1:26:29,  1.35s/it][A
Training...:  72% 10051/13907 [6:17:45<2:11:51,  2.05s/it][A
Training...:  72% 10052/13907 [6:17:48<2:37:10,  2.45s/it][A
Training...:  72% 10053/13907 [6:17:51<2:52:26,  2.68s/it][A
Training...:  72% 10054/13907 [6:17:54<3:00:02,  2.80s/it][A
Training...:  72% 10055/13907 [6:17:57<3:03:37,  2.86s/it][A
Training...:  72% 10056/13907 [6:18:00<3:03:56,  2.87s/it][A
Training...:  72% 10057/13907 [6:18:03<3:03:14,  2.86s/it][A
Training...:  72% 10058/13907 [6:18:06<3:01:22,  2.83s/it][A
Training...:  72% 10059/13907 [6:18:09<2:59:42,  2.80s/it][A
Training...:  72% 10060/13907 [6:18:11<2:56:43,  2.76s/it][A
Training...:  72% 10061/13907 [6:18:14<2:54:14,  2.72s/it][A
Training...:  72% 10062/13907 [6:18:17<2:51:15,  2.67s/it][A
Training...:  72% 10063/13907 [6:18:19<2:50:05,  2.65s/it][A
Training...:  72% 10064/13907 [6:18:22<2:47:15,  2.61s/it][A
Training...:  72% 10065/13907 [6:18:24<2:45:08,  2.58s/it][A
Training...:  72% 10066/13907 [6:18:27<2:42:50,  2.54s/it][A
Training...:  72% 10067/13907 [6:18:29<2:40:06,  2.50s/it][A
Training...:  72% 10068/13907 [6:18:31<2:37:46,  2.47s/it][A
Training...:  72% 10069/13907 [6:18:34<2:35:14,  2.43s/it][A
Training...:  72% 10070/13907 [6:18:36<2:33:18,  2.40s/it][A
Training...:  72% 10071/13907 [6:18:38<2:31:27,  2.37s/it][A
Training...:  72% 10072/13907 [6:18:41<2:29:00,  2.33s/it][A
Training...:  72% 10073/13907 [6:18:43<2:26:34,  2.29s/it][A
Training...:  72% 10074/13907 [6:18:45<2:24:17,  2.26s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:19:00<?, ?it/s]
Training...:  72% 10074/13907 [6:18:47<2:24:17,  2.26s/it][A
Training...:  72% 10075/13907 [6:18:47<2:28:42,  2.33s/it][A
Training...:  72% 10076/13907 [6:18:50<2:26:55,  2.30s/it][A
Training...:  72% 10077/13907 [6:18:52<2:23:20,  2.25s/it][A
Training...:  72% 10078/13907 [6:18:54<2:20:00,  2.19s/it][A
Training...:  72% 10079/13907 [6:18:56<2:17:00,  2.15s/it][A
Training...:  72% 10080/13907 [6:18:58<2:14:09,  2.10s/it][A
Training...:  72% 10081/13907 [6:19:00<2:11:21,  2.06s/it][A
Training...:  72% 10082/13907 [6:19:02<2:08:41,  2.02s/it][A
Training...:  73% 10083/13907 [6:19:04<2:06:18,  1.98s/it][A
Training...:  73% 10084/13907 [6:19:06<2:04:49,  1.96s/it][A
Training...:  73% 10085/13907 [6:19:08<2:03:29,  1.94s/it][A
Training...:  73% 10086/13907 [6:19:09<2:01:15,  1.90s/it][A
Training...:  73% 10087/13907 [6:19:11<1:58:42,  1.86s/it][A
Training...:  73% 10088/13907 [6:19:13<1:56:33,  1.83s/it][A
Training...:  73% 10089/13907 [6:19:15<1:54:30,  1.80s/it][A
Training...:  73% 10090/13907 [6:19:16<1:52:25,  1.77s/it][A
Training...:  73% 10091/13907 [6:19:18<1:50:23,  1.74s/it][A
Training...:  73% 10092/13907 [6:19:20<1:48:49,  1.71s/it][A
Training...:  73% 10093/13907 [6:19:21<1:46:59,  1.68s/it][A
Training...:  73% 10094/13907 [6:19:23<1:44:44,  1.65s/it][A
Training...:  73% 10095/13907 [6:19:24<1:42:12,  1.61s/it][A
Training...:  73% 10096/13907 [6:19:26<1:39:05,  1.56s/it][A
Training...:  73% 10097/13907 [6:19:27<1:35:34,  1.50s/it][A
Training...:  73% 10098/13907 [6:19:28<1:31:40,  1.44s/it][A
Training...:  73% 10099/13907 [6:19:30<1:27:28,  1.38s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:19:43<?, ?it/s]
Training...:  73% 10099/13907 [6:19:31<1:27:28,  1.38s/it][A
Training...:  73% 10100/13907 [6:19:31<1:25:27,  1.35s/it][A
Training...:  73% 10101/13907 [6:19:35<2:11:34,  2.07s/it][A
Training...:  73% 10102/13907 [6:19:38<2:36:53,  2.47s/it][A
Training...:  73% 10103/13907 [6:19:41<2:51:13,  2.70s/it][A
Training...:  73% 10104/13907 [6:19:44<2:58:38,  2.82s/it][A
Training...:  73% 10105/13907 [6:19:47<3:02:45,  2.88s/it][A
Training...:  73% 10106/13907 [6:19:50<3:03:20,  2.89s/it][A
Training...:  73% 10107/13907 [6:19:53<3:02:51,  2.89s/it][A
Training...:  73% 10108/13907 [6:19:56<3:02:14,  2.88s/it][A
Training...:  73% 10109/13907 [6:19:59<2:59:42,  2.84s/it][A
Training...:  73% 10110/13907 [6:20:02<2:57:05,  2.80s/it][A
Training...:  73% 10111/13907 [6:20:04<2:55:50,  2.78s/it][A
Training...:  73% 10112/13907 [6:20:07<2:53:29,  2.74s/it][A
Training...:  73% 10113/13907 [6:20:10<2:50:48,  2.70s/it][A
Training...:  73% 10114/13907 [6:20:12<2:48:19,  2.66s/it][A
Training...:  73% 10115/13907 [6:20:15<2:45:26,  2.62s/it][A
Training...:  73% 10116/13907 [6:20:17<2:42:46,  2.58s/it][A
Training...:  73% 10117/13907 [6:20:20<2:40:22,  2.54s/it][A
Training...:  73% 10118/13907 [6:20:22<2:37:39,  2.50s/it][A
Training...:  73% 10119/13907 [6:20:24<2:35:17,  2.46s/it][A
Training...:  73% 10120/13907 [6:20:27<2:33:18,  2.43s/it][A
Training...:  73% 10121/13907 [6:20:29<2:30:50,  2.39s/it][A
Training...:  73% 10122/13907 [6:20:31<2:29:05,  2.36s/it][A
Training...:  73% 10123/13907 [6:20:34<2:27:02,  2.33s/it][A
Training...:  73% 10124/13907 [6:20:36<2:24:43,  2.30s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:20:51<?, ?it/s]
Training...:  73% 10124/13907 [6:20:38<2:24:43,  2.30s/it][A
Training...:  73% 10125/13907 [6:20:38<2:28:26,  2.35s/it][A
Training...:  73% 10126/13907 [6:20:40<2:26:05,  2.32s/it][A
Training...:  73% 10127/13907 [6:20:43<2:21:46,  2.25s/it][A
Training...:  73% 10128/13907 [6:20:45<2:19:03,  2.21s/it][A
Training...:  73% 10129/13907 [6:20:47<2:15:34,  2.15s/it][A
Training...:  73% 10130/13907 [6:20:49<2:12:51,  2.11s/it][A
Training...:  73% 10131/13907 [6:20:51<2:10:35,  2.08s/it][A
Training...:  73% 10132/13907 [6:20:53<2:08:00,  2.03s/it][A
Training...:  73% 10133/13907 [6:20:55<2:05:44,  2.00s/it][A
Training...:  73% 10134/13907 [6:20:56<2:03:32,  1.96s/it][A
Training...:  73% 10135/13907 [6:20:58<2:01:25,  1.93s/it][A
Training...:  73% 10136/13907 [6:21:00<1:59:47,  1.91s/it][A
Training...:  73% 10137/13907 [6:21:02<1:57:31,  1.87s/it][A
Training...:  73% 10138/13907 [6:21:04<1:55:06,  1.83s/it][A
Training...:  73% 10139/13907 [6:21:05<1:52:37,  1.79s/it][A
Training...:  73% 10140/13907 [6:21:07<1:50:26,  1.76s/it][A
Training...:  73% 10141/13907 [6:21:09<1:47:48,  1.72s/it][A
Training...:  73% 10142/13907 [6:21:10<1:45:34,  1.68s/it][A
Training...:  73% 10143/13907 [6:21:12<1:43:04,  1.64s/it][A
Training...:  73% 10144/13907 [6:21:13<1:40:12,  1.60s/it][A
Training...:  73% 10145/13907 [6:21:15<1:37:28,  1.55s/it][A
Training...:  73% 10146/13907 [6:21:16<1:35:00,  1.52s/it][A
Training...:  73% 10147/13907 [6:21:18<1:31:22,  1.46s/it][A
Training...:  73% 10148/13907 [6:21:19<1:27:51,  1.40s/it][A
Training...:  73% 10149/13907 [6:21:20<1:23:44,  1.34s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:21:34<?, ?it/s]
Training...:  73% 10149/13907 [6:21:21<1:23:44,  1.34s/it][A
Training...:  73% 10150/13907 [6:21:21<1:21:25,  1.30s/it][A
Training...:  73% 10151/13907 [6:21:25<2:08:45,  2.06s/it][A
Training...:  73% 10152/13907 [6:21:29<2:36:11,  2.50s/it][A
Training...:  73% 10153/13907 [6:21:32<2:51:25,  2.74s/it][A
Training...:  73% 10154/13907 [6:21:35<2:59:49,  2.87s/it][A
Training...:  73% 10155/13907 [6:21:38<3:04:35,  2.95s/it][A
Training...:  73% 10156/13907 [6:21:41<3:04:39,  2.95s/it][A
Training...:  73% 10157/13907 [6:21:44<3:03:07,  2.93s/it][A
Training...:  73% 10158/13907 [6:21:47<3:01:07,  2.90s/it][A
Training...:  73% 10159/13907 [6:21:50<2:58:27,  2.86s/it][A
Training...:  73% 10160/13907 [6:21:52<2:55:52,  2.82s/it][A
Training...:  73% 10161/13907 [6:21:55<2:53:04,  2.77s/it][A
Training...:  73% 10162/13907 [6:21:58<2:50:04,  2.72s/it][A
Training...:  73% 10163/13907 [6:22:00<2:47:35,  2.69s/it][A
Training...:  73% 10164/13907 [6:22:03<2:45:16,  2.65s/it][A
Training...:  73% 10165/13907 [6:22:05<2:42:40,  2.61s/it][A
Training...:  73% 10166/13907 [6:22:08<2:40:15,  2.57s/it][A
Training...:  73% 10167/13907 [6:22:10<2:38:05,  2.54s/it][A
Training...:  73% 10168/13907 [6:22:13<2:35:31,  2.50s/it][A
Training...:  73% 10169/13907 [6:22:15<2:33:28,  2.46s/it][A
Training...:  73% 10170/13907 [6:22:17<2:31:21,  2.43s/it][A
Training...:  73% 10171/13907 [6:22:20<2:29:25,  2.40s/it][A
Training...:  73% 10172/13907 [6:22:22<2:27:09,  2.36s/it][A
Training...:  73% 10173/13907 [6:22:24<2:25:03,  2.33s/it][A
Training...:  73% 10174/13907 [6:22:26<2:23:38,  2.31s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:22:41<?, ?it/s]
Training...:  73% 10174/13907 [6:22:29<2:23:38,  2.31s/it][A
Training...:  73% 10175/13907 [6:22:29<2:27:13,  2.37s/it][A
Training...:  73% 10176/13907 [6:22:31<2:24:18,  2.32s/it][A
Training...:  73% 10177/13907 [6:22:33<2:21:02,  2.27s/it][A
Training...:  73% 10178/13907 [6:22:35<2:17:59,  2.22s/it][A
Training...:  73% 10179/13907 [6:22:38<2:15:39,  2.18s/it][A
Training...:  73% 10180/13907 [6:22:40<2:12:51,  2.14s/it][A
Training...:  73% 10181/13907 [6:22:42<2:10:59,  2.11s/it][A
Training...:  73% 10182/13907 [6:22:44<2:08:34,  2.07s/it][A
Training...:  73% 10183/13907 [6:22:46<2:06:38,  2.04s/it][A
Training...:  73% 10184/13907 [6:22:48<2:04:51,  2.01s/it][A
Training...:  73% 10185/13907 [6:22:49<2:03:03,  1.98s/it][A
Training...:  73% 10186/13907 [6:22:51<2:01:27,  1.96s/it][A
Training...:  73% 10187/13907 [6:22:53<1:59:40,  1.93s/it][A
Training...:  73% 10188/13907 [6:22:55<1:57:40,  1.90s/it][A
Training...:  73% 10189/13907 [6:22:57<1:55:29,  1.86s/it][A
Training...:  73% 10190/13907 [6:22:59<1:52:56,  1.82s/it][A
Training...:  73% 10191/13907 [6:23:00<1:50:22,  1.78s/it][A
Training...:  73% 10192/13907 [6:23:02<1:47:57,  1.74s/it][A
Training...:  73% 10193/13907 [6:23:03<1:45:33,  1.71s/it][A
Training...:  73% 10194/13907 [6:23:05<1:42:41,  1.66s/it][A
Training...:  73% 10195/13907 [6:23:07<1:40:04,  1.62s/it][A
Training...:  73% 10196/13907 [6:23:08<1:36:48,  1.57s/it][A
Training...:  73% 10197/13907 [6:23:09<1:33:36,  1.51s/it][A
Training...:  73% 10198/13907 [6:23:11<1:30:03,  1.46s/it][A
Training...:  73% 10199/13907 [6:23:12<1:25:59,  1.39s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:23:26<?, ?it/s]
Training...:  73% 10199/13907 [6:23:13<1:25:59,  1.39s/it][A
Training...:  73% 10200/13907 [6:23:13<1:23:44,  1.36s/it][A
Training...:  73% 10201/13907 [6:23:17<2:08:40,  2.08s/it][A
Training...:  73% 10202/13907 [6:23:20<2:34:21,  2.50s/it][A
Training...:  73% 10203/13907 [6:23:24<2:48:20,  2.73s/it][A
Training...:  73% 10204/13907 [6:23:27<2:56:08,  2.85s/it][A
Training...:  73% 10205/13907 [6:23:30<3:00:53,  2.93s/it][A
Training...:  73% 10206/13907 [6:23:33<3:01:26,  2.94s/it][A
Training...:  73% 10207/13907 [6:23:36<3:00:01,  2.92s/it][A
Training...:  73% 10208/13907 [6:23:39<2:57:43,  2.88s/it][A
Training...:  73% 10209/13907 [6:23:41<2:55:08,  2.84s/it][A
Training...:  73% 10210/13907 [6:23:44<2:52:34,  2.80s/it][A
Training...:  73% 10211/13907 [6:23:47<2:50:25,  2.77s/it][A
Training...:  73% 10212/13907 [6:23:49<2:47:48,  2.72s/it][A
Training...:  73% 10213/13907 [6:23:52<2:44:57,  2.68s/it][A
Training...:  73% 10214/13907 [6:23:55<2:42:14,  2.64s/it][A
Training...:  73% 10215/13907 [6:23:57<2:39:40,  2.59s/it][A
Training...:  73% 10216/13907 [6:23:59<2:37:20,  2.56s/it][A
Training...:  73% 10217/13907 [6:24:02<2:34:47,  2.52s/it][A
Training...:  73% 10218/13907 [6:24:04<2:32:17,  2.48s/it][A
Training...:  73% 10219/13907 [6:24:07<2:30:28,  2.45s/it][A
Training...:  73% 10220/13907 [6:24:09<2:28:20,  2.41s/it][A
Training...:  73% 10221/13907 [6:24:11<2:26:30,  2.38s/it][A
Training...:  74% 10222/13907 [6:24:14<2:24:41,  2.36s/it][A
Training...:  74% 10223/13907 [6:24:16<2:22:45,  2.32s/it][A
Training...:  74% 10224/13907 [6:24:18<2:20:24,  2.29s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:24:33<?, ?it/s]
Training...:  74% 10224/13907 [6:24:21<2:20:24,  2.29s/it][A
Training...:  74% 10225/13907 [6:24:21<2:23:46,  2.34s/it][A
Training...:  74% 10226/13907 [6:24:23<2:21:26,  2.31s/it][A
Training...:  74% 10227/13907 [6:24:25<2:18:27,  2.26s/it][A
Training...:  74% 10228/13907 [6:24:27<2:15:12,  2.21s/it][A
Training...:  74% 10229/13907 [6:24:29<2:12:24,  2.16s/it][A
Training...:  74% 10230/13907 [6:24:31<2:10:10,  2.12s/it][A
Training...:  74% 10231/13907 [6:24:33<2:07:49,  2.09s/it][A
Training...:  74% 10232/13907 [6:24:35<2:06:13,  2.06s/it][A
Training...:  74% 10233/13907 [6:24:37<2:04:20,  2.03s/it][A
Training...:  74% 10234/13907 [6:24:39<2:02:12,  2.00s/it][A
Training...:  74% 10235/13907 [6:24:41<2:00:17,  1.97s/it][A
Training...:  74% 10236/13907 [6:24:43<1:58:34,  1.94s/it][A
Training...:  74% 10237/13907 [6:24:45<1:56:28,  1.90s/it][A
Training...:  74% 10238/13907 [6:24:46<1:54:46,  1.88s/it][A
Training...:  74% 10239/13907 [6:24:48<1:53:02,  1.85s/it][A
Training...:  74% 10240/13907 [6:24:50<1:50:31,  1.81s/it][A
Training...:  74% 10241/13907 [6:24:52<1:48:02,  1.77s/it][A
Training...:  74% 10242/13907 [6:24:53<1:45:45,  1.73s/it][A
Training...:  74% 10243/13907 [6:24:55<1:43:03,  1.69s/it][A
Training...:  74% 10244/13907 [6:24:56<1:40:29,  1.65s/it][A
Training...:  74% 10245/13907 [6:24:58<1:37:37,  1.60s/it][A
Training...:  74% 10246/13907 [6:24:59<1:34:54,  1.56s/it][A
Training...:  74% 10247/13907 [6:25:01<1:31:58,  1.51s/it][A
Training...:  74% 10248/13907 [6:25:02<1:28:37,  1.45s/it][A
Training...:  74% 10249/13907 [6:25:03<1:24:20,  1.38s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:25:17<?, ?it/s]
Training...:  74% 10249/13907 [6:25:04<1:24:20,  1.38s/it][A
Training...:  74% 10250/13907 [6:25:04<1:21:55,  1.34s/it][A
Training...:  74% 10251/13907 [6:25:08<2:06:14,  2.07s/it][A
Training...:  74% 10252/13907 [6:25:12<2:30:05,  2.46s/it][A
Training...:  74% 10253/13907 [6:25:15<2:45:18,  2.71s/it][A
Training...:  74% 10254/13907 [6:25:18<2:52:16,  2.83s/it][A
Training...:  74% 10255/13907 [6:25:21<2:55:52,  2.89s/it][A
Training...:  74% 10256/13907 [6:25:24<2:56:54,  2.91s/it][A
Training...:  74% 10257/13907 [6:25:27<2:56:18,  2.90s/it][A
Training...:  74% 10258/13907 [6:25:30<2:55:10,  2.88s/it][A
Training...:  74% 10259/13907 [6:25:33<2:54:35,  2.87s/it][A
Training...:  74% 10260/13907 [6:25:35<2:52:32,  2.84s/it][A
Training...:  74% 10261/13907 [6:25:38<2:50:31,  2.81s/it][A
Training...:  74% 10262/13907 [6:25:41<2:47:00,  2.75s/it][A
Training...:  74% 10263/13907 [6:25:43<2:44:21,  2.71s/it][A
Training...:  74% 10264/13907 [6:25:46<2:41:39,  2.66s/it][A
Training...:  74% 10265/13907 [6:25:48<2:39:10,  2.62s/it][A
Training...:  74% 10266/13907 [6:25:51<2:36:54,  2.59s/it][A
Training...:  74% 10267/13907 [6:25:53<2:34:05,  2.54s/it][A
Training...:  74% 10268/13907 [6:25:56<2:31:31,  2.50s/it][A
Training...:  74% 10269/13907 [6:25:58<2:28:52,  2.46s/it][A
Training...:  74% 10270/13907 [6:26:00<2:26:27,  2.42s/it][A
Training...:  74% 10271/13907 [6:26:03<2:24:42,  2.39s/it][A
Training...:  74% 10272/13907 [6:26:05<2:22:20,  2.35s/it][A
Training...:  74% 10273/13907 [6:26:07<2:19:39,  2.31s/it][A
Training...:  74% 10274/13907 [6:26:09<2:17:33,  2.27s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:26:24<?, ?it/s]
Training...:  74% 10274/13907 [6:26:12<2:17:33,  2.27s/it][A
Training...:  74% 10275/13907 [6:26:12<2:21:00,  2.33s/it][A
Training...:  74% 10276/13907 [6:26:14<2:18:43,  2.29s/it][A
Training...:  74% 10277/13907 [6:26:16<2:15:30,  2.24s/it][A
Training...:  74% 10278/13907 [6:26:18<2:13:13,  2.20s/it][A
Training...:  74% 10279/13907 [6:26:20<2:09:57,  2.15s/it][A
Training...:  74% 10280/13907 [6:26:22<2:07:24,  2.11s/it][A
Training...:  74% 10281/13907 [6:26:24<2:05:41,  2.08s/it][A
Training...:  74% 10282/13907 [6:26:26<2:03:40,  2.05s/it][A
Training...:  74% 10283/13907 [6:26:28<2:01:39,  2.01s/it][A
Training...:  74% 10284/13907 [6:26:30<1:59:50,  1.98s/it][A
Training...:  74% 10285/13907 [6:26:32<1:57:58,  1.95s/it][A
Training...:  74% 10286/13907 [6:26:34<1:56:06,  1.92s/it][A
Training...:  74% 10287/13907 [6:26:36<1:54:35,  1.90s/it][A
Training...:  74% 10288/13907 [6:26:37<1:52:18,  1.86s/it][A
Training...:  74% 10289/13907 [6:26:39<1:50:08,  1.83s/it][A
Training...:  74% 10290/13907 [6:26:41<1:47:58,  1.79s/it][A
Training...:  74% 10291/13907 [6:26:43<1:46:07,  1.76s/it][A
Training...:  74% 10292/13907 [6:26:44<1:44:04,  1.73s/it][A
Training...:  74% 10293/13907 [6:26:46<1:41:56,  1.69s/it][A
Training...:  74% 10294/13907 [6:26:47<1:39:41,  1.66s/it][A
Training...:  74% 10295/13907 [6:26:49<1:37:14,  1.62s/it][A
Training...:  74% 10296/13907 [6:26:50<1:34:06,  1.56s/it][A
Training...:  74% 10297/13907 [6:26:52<1:31:09,  1.51s/it][A
Training...:  74% 10298/13907 [6:26:53<1:27:53,  1.46s/it][A
Training...:  74% 10299/13907 [6:26:54<1:23:59,  1.40s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:27:08<?, ?it/s]
Training...:  74% 10299/13907 [6:26:56<1:23:59,  1.40s/it][A
Training...:  74% 10300/13907 [6:26:56<1:22:21,  1.37s/it][A
Training...:  74% 10301/13907 [6:27:00<2:09:41,  2.16s/it][A
Training...:  74% 10302/13907 [6:27:03<2:33:06,  2.55s/it][A
Training...:  74% 10303/13907 [6:27:06<2:46:44,  2.78s/it][A
Training...:  74% 10304/13907 [6:27:10<2:51:54,  2.86s/it][A
Training...:  74% 10305/13907 [6:27:13<2:55:01,  2.92s/it][A
Training...:  74% 10306/13907 [6:27:16<2:55:46,  2.93s/it][A
Training...:  74% 10307/13907 [6:27:18<2:55:22,  2.92s/it][A
Training...:  74% 10308/13907 [6:27:21<2:52:58,  2.88s/it][A
Training...:  74% 10309/13907 [6:27:24<2:50:05,  2.84s/it][A
Training...:  74% 10310/13907 [6:27:27<2:47:14,  2.79s/it][A
Training...:  74% 10311/13907 [6:27:29<2:44:51,  2.75s/it][A
Training...:  74% 10312/13907 [6:27:32<2:42:12,  2.71s/it][A
Training...:  74% 10313/13907 [6:27:34<2:39:31,  2.66s/it][A
Training...:  74% 10314/13907 [6:27:37<2:37:16,  2.63s/it][A
Training...:  74% 10315/13907 [6:27:39<2:34:46,  2.59s/it][A
Training...:  74% 10316/13907 [6:27:42<2:32:42,  2.55s/it][A
Training...:  74% 10317/13907 [6:27:44<2:31:02,  2.52s/it][A
Training...:  74% 10318/13907 [6:27:47<2:29:01,  2.49s/it][A
Training...:  74% 10319/13907 [6:27:49<2:26:23,  2.45s/it][A
Training...:  74% 10320/13907 [6:27:52<2:24:30,  2.42s/it][A
Training...:  74% 10321/13907 [6:27:54<2:22:11,  2.38s/it][A
Training...:  74% 10322/13907 [6:27:56<2:19:53,  2.34s/it][A
Training...:  74% 10323/13907 [6:27:58<2:18:26,  2.32s/it][A
Training...:  74% 10324/13907 [6:28:01<2:15:46,  2.27s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:28:15<?, ?it/s]
Training...:  74% 10324/13907 [6:28:03<2:15:46,  2.27s/it][A
Training...:  74% 10325/13907 [6:28:03<2:20:25,  2.35s/it][A
Training...:  74% 10326/13907 [6:28:05<2:18:02,  2.31s/it][A
Training...:  74% 10327/13907 [6:28:07<2:14:33,  2.26s/it][A
Training...:  74% 10328/13907 [6:28:09<2:11:39,  2.21s/it][A
Training...:  74% 10329/13907 [6:28:12<2:09:03,  2.16s/it][A
Training...:  74% 10330/13907 [6:28:14<2:06:50,  2.13s/it][A
Training...:  74% 10331/13907 [6:28:16<2:04:49,  2.09s/it][A
Training...:  74% 10332/13907 [6:28:18<2:02:37,  2.06s/it][A
Training...:  74% 10333/13907 [6:28:20<2:00:30,  2.02s/it][A
Training...:  74% 10334/13907 [6:28:21<1:58:05,  1.98s/it][A
Training...:  74% 10335/13907 [6:28:23<1:56:04,  1.95s/it][A
Training...:  74% 10336/13907 [6:28:25<1:54:26,  1.92s/it][A
Training...:  74% 10337/13907 [6:28:27<1:51:59,  1.88s/it][A
Training...:  74% 10338/13907 [6:28:29<1:49:13,  1.84s/it][A
Training...:  74% 10339/13907 [6:28:30<1:47:15,  1.80s/it][A
Training...:  74% 10340/13907 [6:28:32<1:45:04,  1.77s/it][A
Training...:  74% 10341/13907 [6:28:34<1:43:20,  1.74s/it][A
Training...:  74% 10342/13907 [6:28:35<1:41:23,  1.71s/it][A
Training...:  74% 10343/13907 [6:28:37<1:39:34,  1.68s/it][A
Training...:  74% 10344/13907 [6:28:39<1:37:31,  1.64s/it][A
Training...:  74% 10345/13907 [6:28:40<1:34:59,  1.60s/it][A
Training...:  74% 10346/13907 [6:28:42<1:33:10,  1.57s/it][A
Training...:  74% 10347/13907 [6:28:43<1:29:57,  1.52s/it][A
Training...:  74% 10348/13907 [6:28:44<1:26:23,  1.46s/it][A
Training...:  74% 10349/13907 [6:28:45<1:22:16,  1.39s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:28:59<?, ?it/s]
Training...:  74% 10349/13907 [6:28:47<1:22:16,  1.39s/it][A
Training...:  74% 10350/13907 [6:28:47<1:20:06,  1.35s/it][A
Training...:  74% 10351/13907 [6:28:51<2:03:46,  2.09s/it][A
Training...:  74% 10352/13907 [6:28:54<2:29:14,  2.52s/it][A
Training...:  74% 10353/13907 [6:28:57<2:43:11,  2.76s/it][A
Training...:  74% 10354/13907 [6:29:01<2:50:41,  2.88s/it][A
Training...:  74% 10355/13907 [6:29:04<2:54:09,  2.94s/it][A
Training...:  74% 10356/13907 [6:29:07<2:53:42,  2.94s/it][A
Training...:  74% 10357/13907 [6:29:09<2:52:32,  2.92s/it][A
Training...:  74% 10358/13907 [6:29:12<2:49:56,  2.87s/it][A
Training...:  74% 10359/13907 [6:29:15<2:47:36,  2.83s/it][A
Training...:  74% 10360/13907 [6:29:18<2:45:18,  2.80s/it][A
Training...:  75% 10361/13907 [6:29:20<2:43:23,  2.76s/it][A
Training...:  75% 10362/13907 [6:29:23<2:40:28,  2.72s/it][A
Training...:  75% 10363/13907 [6:29:26<2:38:16,  2.68s/it][A
Training...:  75% 10364/13907 [6:29:28<2:35:53,  2.64s/it][A
Training...:  75% 10365/13907 [6:29:31<2:34:09,  2.61s/it][A
Training...:  75% 10366/13907 [6:29:33<2:31:37,  2.57s/it][A
Training...:  75% 10367/13907 [6:29:36<2:28:59,  2.53s/it][A
Training...:  75% 10368/13907 [6:29:38<2:26:50,  2.49s/it][A
Training...:  75% 10369/13907 [6:29:40<2:24:41,  2.45s/it][A
Training...:  75% 10370/13907 [6:29:43<2:22:18,  2.41s/it][A
Training...:  75% 10371/13907 [6:29:45<2:20:21,  2.38s/it][A
Training...:  75% 10372/13907 [6:29:47<2:18:50,  2.36s/it][A
Training...:  75% 10373/13907 [6:29:49<2:16:37,  2.32s/it][A
Training...:  75% 10374/13907 [6:29:52<2:15:14,  2.30s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:30:07<?, ?it/s]
Training...:  75% 10374/13907 [6:29:54<2:15:14,  2.30s/it][A
Training...:  75% 10375/13907 [6:29:54<2:19:22,  2.37s/it][A
Training...:  75% 10376/13907 [6:29:56<2:16:50,  2.33s/it][A
Training...:  75% 10377/13907 [6:29:59<2:13:20,  2.27s/it][A
Training...:  75% 10378/13907 [6:30:01<2:09:36,  2.20s/it][A
Training...:  75% 10379/13907 [6:30:03<2:06:37,  2.15s/it][A
Training...:  75% 10380/13907 [6:30:05<2:04:37,  2.12s/it][A
Training...:  75% 10381/13907 [6:30:07<2:02:22,  2.08s/it][A
Training...:  75% 10382/13907 [6:30:09<1:59:50,  2.04s/it][A
Training...:  75% 10383/13907 [6:30:11<1:57:25,  2.00s/it][A
Training...:  75% 10384/13907 [6:30:12<1:55:05,  1.96s/it][A
Training...:  75% 10385/13907 [6:30:14<1:53:09,  1.93s/it][A
Training...:  75% 10386/13907 [6:30:16<1:51:10,  1.89s/it][A
Training...:  75% 10387/13907 [6:30:18<1:49:20,  1.86s/it][A
Training...:  75% 10388/13907 [6:30:20<1:47:06,  1.83s/it][A
Training...:  75% 10389/13907 [6:30:21<1:45:07,  1.79s/it][A
Training...:  75% 10390/13907 [6:30:23<1:42:35,  1.75s/it][A
Training...:  75% 10391/13907 [6:30:25<1:40:45,  1.72s/it][A
Training...:  75% 10392/13907 [6:30:26<1:38:26,  1.68s/it][A
Training...:  75% 10393/13907 [6:30:28<1:36:22,  1.65s/it][A
Training...:  75% 10394/13907 [6:30:29<1:34:17,  1.61s/it][A
Training...:  75% 10395/13907 [6:30:31<1:32:35,  1.58s/it][A
Training...:  75% 10396/13907 [6:30:32<1:29:40,  1.53s/it][A
Training...:  75% 10397/13907 [6:30:34<1:26:34,  1.48s/it][A
Training...:  75% 10398/13907 [6:30:35<1:23:11,  1.42s/it][A
Training...:  75% 10399/13907 [6:30:36<1:19:10,  1.35s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:30:50<?, ?it/s]
Training...:  75% 10399/13907 [6:30:37<1:19:10,  1.35s/it][A
Training...:  75% 10400/13907 [6:30:37<1:17:13,  1.32s/it][A
Training...:  75% 10401/13907 [6:30:41<2:00:21,  2.06s/it][A
Training...:  75% 10402/13907 [6:30:45<2:25:23,  2.49s/it][A
Training...:  75% 10403/13907 [6:30:48<2:38:42,  2.72s/it][A
Training...:  75% 10404/13907 [6:30:51<2:46:16,  2.85s/it][A
Training...:  75% 10405/13907 [6:30:54<2:49:45,  2.91s/it][A
Training...:  75% 10406/13907 [6:30:57<2:51:01,  2.93s/it][A
Training...:  75% 10407/13907 [6:31:00<2:51:31,  2.94s/it][A
Training...:  75% 10408/13907 [6:31:03<2:49:28,  2.91s/it][A
Training...:  75% 10409/13907 [6:31:06<2:47:28,  2.87s/it][A
Training...:  75% 10410/13907 [6:31:08<2:44:36,  2.82s/it][A
Training...:  75% 10411/13907 [6:31:11<2:41:51,  2.78s/it][A
Training...:  75% 10412/13907 [6:31:14<2:39:05,  2.73s/it][A
Training...:  75% 10413/13907 [6:31:16<2:36:53,  2.69s/it][A
Training...:  75% 10414/13907 [6:31:19<2:34:04,  2.65s/it][A
Training...:  75% 10415/13907 [6:31:21<2:31:23,  2.60s/it][A
Training...:  75% 10416/13907 [6:31:24<2:28:43,  2.56s/it][A
Training...:  75% 10417/13907 [6:31:26<2:26:18,  2.52s/it][A
Training...:  75% 10418/13907 [6:31:29<2:24:24,  2.48s/it][A
Training...:  75% 10419/13907 [6:31:31<2:22:23,  2.45s/it][A
Training...:  75% 10420/13907 [6:31:33<2:20:11,  2.41s/it][A
Training...:  75% 10421/13907 [6:31:36<2:18:28,  2.38s/it][A
Training...:  75% 10422/13907 [6:31:38<2:17:01,  2.36s/it][A
Training...:  75% 10423/13907 [6:31:40<2:15:10,  2.33s/it][A
Training...:  75% 10424/13907 [6:31:42<2:12:36,  2.28s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:31:57<?, ?it/s]
Training...:  75% 10424/13907 [6:31:45<2:12:36,  2.28s/it][A
Training...:  75% 10425/13907 [6:31:45<2:16:04,  2.34s/it][A
Training...:  75% 10426/13907 [6:31:47<2:13:39,  2.30s/it][A
Training...:  75% 10427/13907 [6:31:49<2:10:24,  2.25s/it][A
Training...:  75% 10428/13907 [6:31:51<2:07:44,  2.20s/it][A
Training...:  75% 10429/13907 [6:31:53<2:05:20,  2.16s/it][A
Training...:  75% 10430/13907 [6:31:55<2:02:34,  2.12s/it][A
Training...:  75% 10431/13907 [6:31:57<2:00:45,  2.08s/it][A
Training...:  75% 10432/13907 [6:31:59<1:58:51,  2.05s/it][A
Training...:  75% 10433/13907 [6:32:01<1:58:00,  2.04s/it][A
Training...:  75% 10434/13907 [6:32:03<1:55:37,  2.00s/it][A
Training...:  75% 10435/13907 [6:32:05<1:53:24,  1.96s/it][A
Training...:  75% 10436/13907 [6:32:07<1:51:34,  1.93s/it][A
Training...:  75% 10437/13907 [6:32:09<1:49:08,  1.89s/it][A
Training...:  75% 10438/13907 [6:32:11<1:47:34,  1.86s/it][A
Training...:  75% 10439/13907 [6:32:12<1:45:12,  1.82s/it][A
Training...:  75% 10440/13907 [6:32:14<1:43:59,  1.80s/it][A
Training...:  75% 10441/13907 [6:32:16<1:41:41,  1.76s/it][A
Training...:  75% 10442/13907 [6:32:17<1:39:57,  1.73s/it][A
Training...:  75% 10443/13907 [6:32:19<1:37:46,  1.69s/it][A
Training...:  75% 10444/13907 [6:32:21<1:35:40,  1.66s/it][A
Training...:  75% 10445/13907 [6:32:22<1:33:06,  1.61s/it][A
Training...:  75% 10446/13907 [6:32:23<1:30:15,  1.56s/it][A
Training...:  75% 10447/13907 [6:32:25<1:27:09,  1.51s/it][A
Training...:  75% 10448/13907 [6:32:26<1:23:34,  1.45s/it][A
Training...:  75% 10449/13907 [6:32:27<1:19:28,  1.38s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:32:41<?, ?it/s]
Training...:  75% 10449/13907 [6:32:29<1:19:28,  1.38s/it][A
Training...:  75% 10450/13907 [6:32:29<1:17:12,  1.34s/it][A
Training...:  75% 10451/13907 [6:32:32<1:59:08,  2.07s/it][A
Training...:  75% 10452/13907 [6:32:36<2:22:47,  2.48s/it][A
Training...:  75% 10453/13907 [6:32:39<2:36:11,  2.71s/it][A
Training...:  75% 10454/13907 [6:32:42<2:42:24,  2.82s/it][A
Training...:  75% 10455/13907 [6:32:45<2:45:58,  2.88s/it][A
Training...:  75% 10456/13907 [6:32:48<2:46:48,  2.90s/it][A
Training...:  75% 10457/13907 [6:32:51<2:46:24,  2.89s/it][A
Training...:  75% 10458/13907 [6:32:54<2:45:25,  2.88s/it][A
Training...:  75% 10459/13907 [6:32:57<2:43:20,  2.84s/it][A
Training...:  75% 10460/13907 [6:32:59<2:40:41,  2.80s/it][A
Training...:  75% 10461/13907 [6:33:02<2:38:34,  2.76s/it][A
Training...:  75% 10462/13907 [6:33:05<2:35:47,  2.71s/it][A
Training...:  75% 10463/13907 [6:33:07<2:33:06,  2.67s/it][A
Training...:  75% 10464/13907 [6:33:10<2:30:45,  2.63s/it][A
Training...:  75% 10465/13907 [6:33:12<2:27:43,  2.58s/it][A
Training...:  75% 10466/13907 [6:33:15<2:25:24,  2.54s/it][A
Training...:  75% 10467/13907 [6:33:17<2:23:13,  2.50s/it][A
Training...:  75% 10468/13907 [6:33:19<2:21:09,  2.46s/it][A
Training...:  75% 10469/13907 [6:33:22<2:19:15,  2.43s/it][A
Training...:  75% 10470/13907 [6:33:24<2:17:49,  2.41s/it][A
Training...:  75% 10471/13907 [6:33:26<2:16:21,  2.38s/it][A
Training...:  75% 10472/13907 [6:33:29<2:14:14,  2.34s/it][A
Training...:  75% 10473/13907 [6:33:31<2:13:06,  2.33s/it][A
Training...:  75% 10474/13907 [6:33:33<2:10:47,  2.29s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:33:48<?, ?it/s]
Training...:  75% 10474/13907 [6:33:36<2:10:47,  2.29s/it][A
Training...:  75% 10475/13907 [6:33:36<2:13:57,  2.34s/it][A
Training...:  75% 10476/13907 [6:33:38<2:11:24,  2.30s/it][A
Training...:  75% 10477/13907 [6:33:40<2:08:35,  2.25s/it][A
Training...:  75% 10478/13907 [6:33:42<2:06:53,  2.22s/it][A
Training...:  75% 10479/13907 [6:33:44<2:03:38,  2.16s/it][A
Training...:  75% 10480/13907 [6:33:46<2:00:49,  2.12s/it][A
Training...:  75% 10481/13907 [6:33:48<1:58:27,  2.07s/it][A
Training...:  75% 10482/13907 [6:33:50<1:56:04,  2.03s/it][A
Training...:  75% 10483/13907 [6:33:52<1:53:55,  2.00s/it][A
Training...:  75% 10484/13907 [6:33:54<1:52:22,  1.97s/it][A
Training...:  75% 10485/13907 [6:33:56<1:50:14,  1.93s/it][A
Training...:  75% 10486/13907 [6:33:58<1:48:32,  1.90s/it][A
Training...:  75% 10487/13907 [6:33:59<1:47:04,  1.88s/it][A
Training...:  75% 10488/13907 [6:34:01<1:45:06,  1.84s/it][A
Training...:  75% 10489/13907 [6:34:03<1:43:05,  1.81s/it][A
Training...:  75% 10490/13907 [6:34:05<1:41:16,  1.78s/it][A
Training...:  75% 10491/13907 [6:34:06<1:38:46,  1.73s/it][A
Training...:  75% 10492/13907 [6:34:08<1:36:41,  1.70s/it][A
Training...:  75% 10493/13907 [6:34:09<1:34:39,  1.66s/it][A
Training...:  75% 10494/13907 [6:34:11<1:32:27,  1.63s/it][A
Training...:  75% 10495/13907 [6:34:12<1:29:40,  1.58s/it][A
Training...:  75% 10496/13907 [6:34:14<1:27:03,  1.53s/it][A
Training...:  75% 10497/13907 [6:34:15<1:24:13,  1.48s/it][A
Training...:  75% 10498/13907 [6:34:16<1:21:11,  1.43s/it][A
Training...:  75% 10499/13907 [6:34:18<1:17:45,  1.37s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:34:31<?, ?it/s]
Training...:  75% 10499/13907 [6:34:19<1:17:45,  1.37s/it][A
Training...:  76% 10500/13907 [6:34:19<1:16:02,  1.34s/it][A
Training...:  76% 10501/13907 [6:34:23<1:58:22,  2.09s/it][A
Training...:  76% 10502/13907 [6:34:26<2:22:09,  2.50s/it][A
Training...:  76% 10503/13907 [6:34:30<2:35:48,  2.75s/it][A
Training...:  76% 10504/13907 [6:34:33<2:42:48,  2.87s/it][A
Training...:  76% 10505/13907 [6:34:36<2:45:57,  2.93s/it][A
Training...:  76% 10506/13907 [6:34:39<2:46:16,  2.93s/it][A
Training...:  76% 10507/13907 [6:34:42<2:45:16,  2.92s/it][A
Training...:  76% 10508/13907 [6:34:44<2:42:52,  2.88s/it][A
Training...:  76% 10509/13907 [6:34:47<2:40:59,  2.84s/it][A
Training...:  76% 10510/13907 [6:34:50<2:39:06,  2.81s/it][A
Training...:  76% 10511/13907 [6:34:53<2:36:45,  2.77s/it][A
Training...:  76% 10512/13907 [6:34:55<2:34:58,  2.74s/it][A
Training...:  76% 10513/13907 [6:34:58<2:32:11,  2.69s/it][A
Training...:  76% 10514/13907 [6:35:00<2:30:20,  2.66s/it][A
Training...:  76% 10515/13907 [6:35:03<2:27:41,  2.61s/it][A
Training...:  76% 10516/13907 [6:35:05<2:25:18,  2.57s/it][A
Training...:  76% 10517/13907 [6:35:08<2:22:22,  2.52s/it][A
Training...:  76% 10518/13907 [6:35:10<2:20:07,  2.48s/it][A
Training...:  76% 10519/13907 [6:35:13<2:17:34,  2.44s/it][A
Training...:  76% 10520/13907 [6:35:15<2:15:35,  2.40s/it][A
Training...:  76% 10521/13907 [6:35:17<2:14:02,  2.38s/it][A
Training...:  76% 10522/13907 [6:35:19<2:11:52,  2.34s/it][A
Training...:  76% 10523/13907 [6:35:22<2:09:52,  2.30s/it][A
Training...:  76% 10524/13907 [6:35:24<2:07:06,  2.25s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:35:39<?, ?it/s]
Training...:  76% 10524/13907 [6:35:26<2:07:06,  2.25s/it][A
Training...:  76% 10525/13907 [6:35:26<2:10:26,  2.31s/it][A
Training...:  76% 10526/13907 [6:35:28<2:08:09,  2.27s/it][A
Training...:  76% 10527/13907 [6:35:31<2:05:36,  2.23s/it][A
Training...:  76% 10528/13907 [6:35:33<2:02:55,  2.18s/it][A
Training...:  76% 10529/13907 [6:35:35<2:01:29,  2.16s/it][A
Training...:  76% 10530/13907 [6:35:37<1:59:32,  2.12s/it][A
Training...:  76% 10531/13907 [6:35:39<1:57:27,  2.09s/it][A
Training...:  76% 10532/13907 [6:35:41<1:55:54,  2.06s/it][A
Training...:  76% 10533/13907 [6:35:43<1:54:14,  2.03s/it][A
Training...:  76% 10534/13907 [6:35:45<1:52:23,  2.00s/it][A
Training...:  76% 10535/13907 [6:35:47<1:50:24,  1.96s/it][A
Training...:  76% 10536/13907 [6:35:48<1:48:16,  1.93s/it][A
Training...:  76% 10537/13907 [6:35:50<1:46:20,  1.89s/it][A
Training...:  76% 10538/13907 [6:35:52<1:44:23,  1.86s/it][A
Training...:  76% 10539/13907 [6:35:54<1:42:32,  1.83s/it][A
Training...:  76% 10540/13907 [6:35:55<1:40:49,  1.80s/it][A
Training...:  76% 10541/13907 [6:35:57<1:38:46,  1.76s/it][A
Training...:  76% 10542/13907 [6:35:59<1:36:20,  1.72s/it][A
Training...:  76% 10543/13907 [6:36:00<1:34:09,  1.68s/it][A
Training...:  76% 10544/13907 [6:36:02<1:32:16,  1.65s/it][A
Training...:  76% 10545/13907 [6:36:03<1:30:21,  1.61s/it][A
Training...:  76% 10546/13907 [6:36:05<1:27:21,  1.56s/it][A
Training...:  76% 10547/13907 [6:36:06<1:24:31,  1.51s/it][A
Training...:  76% 10548/13907 [6:36:08<1:21:27,  1.46s/it][A
Training...:  76% 10549/13907 [6:36:09<1:18:01,  1.39s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:36:22<?, ?it/s]
Training...:  76% 10549/13907 [6:36:10<1:18:01,  1.39s/it][A
Training...:  76% 10550/13907 [6:36:10<1:15:53,  1.36s/it][A
Training...:  76% 10551/13907 [6:36:14<1:58:04,  2.11s/it][A
Training...:  76% 10552/13907 [6:36:17<2:20:57,  2.52s/it][A
Training...:  76% 10553/13907 [6:36:21<2:34:03,  2.76s/it][A
Training...:  76% 10554/13907 [6:36:24<2:40:04,  2.86s/it][A
Training...:  76% 10555/13907 [6:36:27<2:43:32,  2.93s/it][A
Training...:  76% 10556/13907 [6:36:30<2:43:24,  2.93s/it][A
Training...:  76% 10557/13907 [6:36:33<2:42:46,  2.92s/it][A
Training...:  76% 10558/13907 [6:36:36<2:40:41,  2.88s/it][A
Training...:  76% 10559/13907 [6:36:38<2:38:39,  2.84s/it][A
Training...:  76% 10560/13907 [6:36:41<2:35:46,  2.79s/it][A
Training...:  76% 10561/13907 [6:36:44<2:33:11,  2.75s/it][A
Training...:  76% 10562/13907 [6:36:46<2:30:47,  2.70s/it][A
Training...:  76% 10563/13907 [6:36:49<2:28:14,  2.66s/it][A
Training...:  76% 10564/13907 [6:36:51<2:25:41,  2.61s/it][A
Training...:  76% 10565/13907 [6:36:54<2:23:08,  2.57s/it][A
Training...:  76% 10566/13907 [6:36:56<2:21:24,  2.54s/it][A
Training...:  76% 10567/13907 [6:36:59<2:19:02,  2.50s/it][A
Training...:  76% 10568/13907 [6:37:01<2:17:10,  2.47s/it][A
Training...:  76% 10569/13907 [6:37:03<2:14:56,  2.43s/it][A
Training...:  76% 10570/13907 [6:37:06<2:13:17,  2.40s/it][A
Training...:  76% 10571/13907 [6:37:08<2:11:17,  2.36s/it][A
Training...:  76% 10572/13907 [6:37:10<2:09:16,  2.33s/it][A
Training...:  76% 10573/13907 [6:37:12<2:07:01,  2.29s/it][A
Training...:  76% 10574/13907 [6:37:15<2:04:52,  2.25s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:37:29<?, ?it/s]
Training...:  76% 10574/13907 [6:37:17<2:04:52,  2.25s/it][A
Training...:  76% 10575/13907 [6:37:17<2:08:42,  2.32s/it][A
Training...:  76% 10576/13907 [6:37:19<2:06:50,  2.28s/it][A
Training...:  76% 10577/13907 [6:37:21<2:03:31,  2.23s/it][A
Training...:  76% 10578/13907 [6:37:23<2:00:37,  2.17s/it][A
Training...:  76% 10579/13907 [6:37:25<1:57:53,  2.13s/it][A
Training...:  76% 10580/13907 [6:37:27<1:56:06,  2.09s/it][A
Training...:  76% 10581/13907 [6:37:29<1:53:55,  2.06s/it][A
Training...:  76% 10582/13907 [6:37:31<1:52:21,  2.03s/it][A
Training...:  76% 10583/13907 [6:37:33<1:50:52,  2.00s/it][A
Training...:  76% 10584/13907 [6:37:35<1:49:06,  1.97s/it][A
Training...:  76% 10585/13907 [6:37:37<1:47:45,  1.95s/it][A
Training...:  76% 10586/13907 [6:37:39<1:46:19,  1.92s/it][A
Training...:  76% 10587/13907 [6:37:41<1:44:34,  1.89s/it][A
Training...:  76% 10588/13907 [6:37:43<1:42:49,  1.86s/it][A
Training...:  76% 10589/13907 [6:37:44<1:40:40,  1.82s/it][A
Training...:  76% 10590/13907 [6:37:46<1:39:08,  1.79s/it][A
Training...:  76% 10591/13907 [6:37:48<1:36:49,  1.75s/it][A
Training...:  76% 10592/13907 [6:37:49<1:35:13,  1.72s/it][A
Training...:  76% 10593/13907 [6:37:51<1:32:41,  1.68s/it][A
Training...:  76% 10594/13907 [6:37:52<1:30:58,  1.65s/it][A
Training...:  76% 10595/13907 [6:37:54<1:28:14,  1.60s/it][A
Training...:  76% 10596/13907 [6:37:55<1:25:21,  1.55s/it][A
Training...:  76% 10597/13907 [6:37:57<1:22:32,  1.50s/it][A
Training...:  76% 10598/13907 [6:37:58<1:19:12,  1.44s/it][A
Training...:  76% 10599/13907 [6:37:59<1:14:52,  1.36s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:38:13<?, ?it/s]
Training...:  76% 10599/13907 [6:38:00<1:14:52,  1.36s/it][A
Training...:  76% 10600/13907 [6:38:00<1:12:58,  1.32s/it][A
Training...:  76% 10601/13907 [6:38:04<1:55:05,  2.09s/it][A
Training...:  76% 10602/13907 [6:38:08<2:17:26,  2.50s/it][A
Training...:  76% 10603/13907 [6:38:11<2:29:30,  2.71s/it][A
Training...:  76% 10604/13907 [6:38:14<2:35:20,  2.82s/it][A
Training...:  76% 10605/13907 [6:38:17<2:38:50,  2.89s/it][A
Training...:  76% 10606/13907 [6:38:20<2:39:07,  2.89s/it][A
Training...:  76% 10607/13907 [6:38:23<2:38:50,  2.89s/it][A
Training...:  76% 10608/13907 [6:38:26<2:37:33,  2.87s/it][A
Training...:  76% 10609/13907 [6:38:28<2:35:33,  2.83s/it][A
Training...:  76% 10610/13907 [6:38:31<2:33:13,  2.79s/it][A
Training...:  76% 10611/13907 [6:38:34<2:30:58,  2.75s/it][A
Training...:  76% 10612/13907 [6:38:36<2:28:22,  2.70s/it][A
Training...:  76% 10613/13907 [6:38:39<2:26:13,  2.66s/it][A
Training...:  76% 10614/13907 [6:38:42<2:24:06,  2.63s/it][A
Training...:  76% 10615/13907 [6:38:44<2:22:37,  2.60s/it][A
Training...:  76% 10616/13907 [6:38:47<2:20:04,  2.55s/it][A
Training...:  76% 10617/13907 [6:38:49<2:18:24,  2.52s/it][A
Training...:  76% 10618/13907 [6:38:51<2:16:05,  2.48s/it][A
Training...:  76% 10619/13907 [6:38:54<2:14:19,  2.45s/it][A
Training...:  76% 10620/13907 [6:38:56<2:12:29,  2.42s/it][A
Training...:  76% 10621/13907 [6:38:58<2:10:54,  2.39s/it][A
Training...:  76% 10622/13907 [6:39:01<2:08:57,  2.36s/it][A
Training...:  76% 10623/13907 [6:39:03<2:07:37,  2.33s/it][A
Training...:  76% 10624/13907 [6:39:05<2:05:14,  2.29s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:39:20<?, ?it/s]
Training...:  76% 10624/13907 [6:39:08<2:05:14,  2.29s/it][A
Training...:  76% 10625/13907 [6:39:08<2:08:25,  2.35s/it][A
Training...:  76% 10626/13907 [6:39:10<2:05:40,  2.30s/it][A
Training...:  76% 10627/13907 [6:39:12<2:02:54,  2.25s/it][A
Training...:  76% 10628/13907 [6:39:14<1:59:46,  2.19s/it][A
Training...:  76% 10629/13907 [6:39:16<1:58:26,  2.17s/it][A
Training...:  76% 10630/13907 [6:39:18<1:56:22,  2.13s/it][A
Training...:  76% 10631/13907 [6:39:20<1:54:07,  2.09s/it][A
Training...:  76% 10632/13907 [6:39:22<1:51:42,  2.05s/it][A
Training...:  76% 10633/13907 [6:39:24<1:49:37,  2.01s/it][A
Training...:  76% 10634/13907 [6:39:26<1:47:34,  1.97s/it][A
Training...:  76% 10635/13907 [6:39:28<1:45:44,  1.94s/it][A
Training...:  76% 10636/13907 [6:39:30<1:44:17,  1.91s/it][A
Training...:  76% 10637/13907 [6:39:31<1:42:07,  1.87s/it][A
Training...:  76% 10638/13907 [6:39:33<1:40:04,  1.84s/it][A
Training...:  77% 10639/13907 [6:39:35<1:38:32,  1.81s/it][A
Training...:  77% 10640/13907 [6:39:37<1:36:32,  1.77s/it][A
Training...:  77% 10641/13907 [6:39:38<1:34:35,  1.74s/it][A
Training...:  77% 10642/13907 [6:39:40<1:32:17,  1.70s/it][A
Training...:  77% 10643/13907 [6:39:41<1:30:11,  1.66s/it][A
Training...:  77% 10644/13907 [6:39:43<1:28:12,  1.62s/it][A
Training...:  77% 10645/13907 [6:39:44<1:25:51,  1.58s/it][A
Training...:  77% 10646/13907 [6:39:46<1:23:38,  1.54s/it][A
Training...:  77% 10647/13907 [6:39:47<1:20:54,  1.49s/it][A
Training...:  77% 10648/13907 [6:39:49<1:17:48,  1.43s/it][A
Training...:  77% 10649/13907 [6:39:50<1:14:58,  1.38s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:40:03<?, ?it/s]
Training...:  77% 10649/13907 [6:39:51<1:14:58,  1.38s/it][A
Training...:  77% 10650/13907 [6:39:51<1:13:28,  1.35s/it][A
Training...:  77% 10651/13907 [6:39:55<1:53:25,  2.09s/it][A
Training...:  77% 10652/13907 [6:39:58<2:16:42,  2.52s/it][A
Training...:  77% 10653/13907 [6:40:02<2:28:47,  2.74s/it][A
Training...:  77% 10654/13907 [6:40:05<2:35:18,  2.86s/it][A
Training...:  77% 10655/13907 [6:40:08<2:38:21,  2.92s/it][A
Training...:  77% 10656/13907 [6:40:11<2:39:32,  2.94s/it][A
Training...:  77% 10657/13907 [6:40:14<2:39:51,  2.95s/it][A
Training...:  77% 10658/13907 [6:40:17<2:37:44,  2.91s/it][A
Training...:  77% 10659/13907 [6:40:19<2:35:40,  2.88s/it][A
Training...:  77% 10660/13907 [6:40:22<2:33:23,  2.83s/it][A
Training...:  77% 10661/13907 [6:40:25<2:30:33,  2.78s/it][A
Training...:  77% 10662/13907 [6:40:27<2:27:29,  2.73s/it][A
Training...:  77% 10663/13907 [6:40:30<2:24:42,  2.68s/it][A
Training...:  77% 10664/13907 [6:40:33<2:21:57,  2.63s/it][A
Training...:  77% 10665/13907 [6:40:35<2:19:47,  2.59s/it][A
Training...:  77% 10666/13907 [6:40:37<2:17:49,  2.55s/it][A
Training...:  77% 10667/13907 [6:40:40<2:15:24,  2.51s/it][A
Training...:  77% 10668/13907 [6:40:42<2:12:51,  2.46s/it][A
Training...:  77% 10669/13907 [6:40:45<2:10:48,  2.42s/it][A
Training...:  77% 10670/13907 [6:40:47<2:09:26,  2.40s/it][A
Training...:  77% 10671/13907 [6:40:49<2:07:24,  2.36s/it][A
Training...:  77% 10672/13907 [6:40:51<2:04:14,  2.30s/it][A
Training...:  77% 10673/13907 [6:40:54<2:01:52,  2.26s/it][A
Training...:  77% 10674/13907 [6:40:56<1:59:41,  2.22s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:41:10<?, ?it/s]
Training...:  77% 10674/13907 [6:40:58<1:59:41,  2.22s/it][A
Training...:  77% 10675/13907 [6:40:58<2:02:59,  2.28s/it][A
Training...:  77% 10676/13907 [6:41:00<2:00:52,  2.24s/it][A
Training...:  77% 10677/13907 [6:41:02<1:59:02,  2.21s/it][A
Training...:  77% 10678/13907 [6:41:04<1:56:15,  2.16s/it][A
Training...:  77% 10679/13907 [6:41:06<1:54:47,  2.13s/it][A
Training...:  77% 10680/13907 [6:41:09<1:53:04,  2.10s/it][A
Training...:  77% 10681/13907 [6:41:10<1:51:03,  2.07s/it][A
Training...:  77% 10682/13907 [6:41:12<1:49:24,  2.04s/it][A
Training...:  77% 10683/13907 [6:41:14<1:47:30,  2.00s/it][A
Training...:  77% 10684/13907 [6:41:16<1:45:48,  1.97s/it][A
Training...:  77% 10685/13907 [6:41:18<1:44:55,  1.95s/it][A
Training...:  77% 10686/13907 [6:41:20<1:43:19,  1.92s/it][A
Training...:  77% 10687/13907 [6:41:22<1:42:15,  1.91s/it][A
Training...:  77% 10688/13907 [6:41:24<1:39:47,  1.86s/it][A
Training...:  77% 10689/13907 [6:41:25<1:37:28,  1.82s/it][A
Training...:  77% 10690/13907 [6:41:27<1:35:36,  1.78s/it][A
Training...:  77% 10691/13907 [6:41:29<1:33:18,  1.74s/it][A
Training...:  77% 10692/13907 [6:41:30<1:31:29,  1.71s/it][A
Training...:  77% 10693/13907 [6:41:32<1:29:51,  1.68s/it][A
Training...:  77% 10694/13907 [6:41:34<1:27:54,  1.64s/it][A
Training...:  77% 10695/13907 [6:41:35<1:25:48,  1.60s/it][A
Training...:  77% 10696/13907 [6:41:36<1:23:14,  1.56s/it][A
Training...:  77% 10697/13907 [6:41:38<1:20:29,  1.50s/it][A
Training...:  77% 10698/13907 [6:41:39<1:17:39,  1.45s/it][A
Training...:  77% 10699/13907 [6:41:40<1:14:04,  1.39s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:41:54<?, ?it/s]
Training...:  77% 10699/13907 [6:41:42<1:14:04,  1.39s/it][A
Training...:  77% 10700/13907 [6:41:42<1:12:02,  1.35s/it][A
Training...:  77% 10701/13907 [6:41:46<1:52:40,  2.11s/it][A
Training...:  77% 10702/13907 [6:41:49<2:14:30,  2.52s/it][A
Training...:  77% 10703/13907 [6:41:52<2:26:21,  2.74s/it][A
Training...:  77% 10704/13907 [6:41:55<2:32:18,  2.85s/it][A
Training...:  77% 10705/13907 [6:41:58<2:35:34,  2.92s/it][A
Training...:  77% 10706/13907 [6:42:01<2:35:46,  2.92s/it][A
Training...:  77% 10707/13907 [6:42:04<2:35:15,  2.91s/it][A
Training...:  77% 10708/13907 [6:42:07<2:34:21,  2.90s/it][A
Training...:  77% 10709/13907 [6:42:10<2:34:07,  2.89s/it][A
Training...:  77% 10710/13907 [6:42:13<2:31:36,  2.85s/it][A
Training...:  77% 10711/13907 [6:42:15<2:28:28,  2.79s/it][A
Training...:  77% 10712/13907 [6:42:18<2:25:34,  2.73s/it][A
Training...:  77% 10713/13907 [6:42:21<2:22:57,  2.69s/it][A
Training...:  77% 10714/13907 [6:42:23<2:20:15,  2.64s/it][A
Training...:  77% 10715/13907 [6:42:26<2:17:52,  2.59s/it][A
Training...:  77% 10716/13907 [6:42:28<2:15:35,  2.55s/it][A
Training...:  77% 10717/13907 [6:42:31<2:13:52,  2.52s/it][A
Training...:  77% 10718/13907 [6:42:33<2:11:42,  2.48s/it][A
Training...:  77% 10719/13907 [6:42:35<2:10:06,  2.45s/it][A
Training...:  77% 10720/13907 [6:42:38<2:08:44,  2.42s/it][A
Training...:  77% 10721/13907 [6:42:40<2:07:41,  2.40s/it][A
Training...:  77% 10722/13907 [6:42:42<2:05:47,  2.37s/it][A
Training...:  77% 10723/13907 [6:42:45<2:03:55,  2.34s/it][A
Training...:  77% 10724/13907 [6:42:47<2:02:01,  2.30s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:43:02<?, ?it/s]
Training...:  77% 10724/13907 [6:42:49<2:02:01,  2.30s/it][A
Training...:  77% 10725/13907 [6:42:49<2:05:06,  2.36s/it][A
Training...:  77% 10726/13907 [6:42:51<2:02:34,  2.31s/it][A
Training...:  77% 10727/13907 [6:42:54<2:00:36,  2.28s/it][A
Training...:  77% 10728/13907 [6:42:56<1:58:42,  2.24s/it][A
Training...:  77% 10729/13907 [6:42:58<1:56:04,  2.19s/it][A
Training...:  77% 10730/13907 [6:43:00<1:53:23,  2.14s/it][A
Training...:  77% 10731/13907 [6:43:02<1:51:16,  2.10s/it][A
Training...:  77% 10732/13907 [6:43:04<1:49:41,  2.07s/it][A
Training...:  77% 10733/13907 [6:43:06<1:48:12,  2.05s/it][A
Training...:  77% 10734/13907 [6:43:08<1:46:46,  2.02s/it][A
Training...:  77% 10735/13907 [6:43:10<1:45:02,  1.99s/it][A
Training...:  77% 10736/13907 [6:43:12<1:43:50,  1.96s/it][A
Training...:  77% 10737/13907 [6:43:14<1:41:48,  1.93s/it][A
Training...:  77% 10738/13907 [6:43:15<1:39:34,  1.89s/it][A
Training...:  77% 10739/13907 [6:43:17<1:37:51,  1.85s/it][A
Training...:  77% 10740/13907 [6:43:19<1:35:43,  1.81s/it][A
Training...:  77% 10741/13907 [6:43:20<1:33:10,  1.77s/it][A
Training...:  77% 10742/13907 [6:43:22<1:30:42,  1.72s/it][A
Training...:  77% 10743/13907 [6:43:24<1:28:49,  1.68s/it][A
Training...:  77% 10744/13907 [6:43:25<1:26:48,  1.65s/it][A
Training...:  77% 10745/13907 [6:43:27<1:24:13,  1.60s/it][A
Training...:  77% 10746/13907 [6:43:28<1:21:20,  1.54s/it][A
Training...:  77% 10747/13907 [6:43:30<1:18:31,  1.49s/it][A
Training...:  77% 10748/13907 [6:43:31<1:15:41,  1.44s/it][A
Training...:  77% 10749/13907 [6:43:32<1:12:46,  1.38s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:43:46<?, ?it/s]
Training...:  77% 10749/13907 [6:43:33<1:12:46,  1.38s/it][A
Training...:  77% 10750/13907 [6:43:33<1:11:48,  1.36s/it][A
Training...:  77% 10751/13907 [6:43:37<1:54:18,  2.17s/it][A
Training...:  77% 10752/13907 [6:43:41<2:14:42,  2.56s/it][A
Training...:  77% 10753/13907 [6:43:44<2:25:53,  2.78s/it][A
Training...:  77% 10754/13907 [6:43:47<2:30:32,  2.86s/it][A
Training...:  77% 10755/13907 [6:43:50<2:33:40,  2.93s/it][A
Training...:  77% 10756/13907 [6:43:53<2:33:01,  2.91s/it][A
Training...:  77% 10757/13907 [6:43:56<2:32:09,  2.90s/it][A
Training...:  77% 10758/13907 [6:43:59<2:30:05,  2.86s/it][A
Training...:  77% 10759/13907 [6:44:02<2:28:18,  2.83s/it][A
Training...:  77% 10760/13907 [6:44:04<2:25:43,  2.78s/it][A
Training...:  77% 10761/13907 [6:44:07<2:23:54,  2.74s/it][A
Training...:  77% 10762/13907 [6:44:10<2:21:03,  2.69s/it][A
Training...:  77% 10763/13907 [6:44:12<2:18:43,  2.65s/it][A
Training...:  77% 10764/13907 [6:44:15<2:16:34,  2.61s/it][A
Training...:  77% 10765/13907 [6:44:17<2:14:23,  2.57s/it][A
Training...:  77% 10766/13907 [6:44:20<2:12:42,  2.53s/it][A
Training...:  77% 10767/13907 [6:44:22<2:11:03,  2.50s/it][A
Training...:  77% 10768/13907 [6:44:24<2:09:38,  2.48s/it][A
Training...:  77% 10769/13907 [6:44:27<2:07:46,  2.44s/it][A
Training...:  77% 10770/13907 [6:44:29<2:05:47,  2.41s/it][A
Training...:  77% 10771/13907 [6:44:31<2:04:21,  2.38s/it][A
Training...:  77% 10772/13907 [6:44:34<2:02:24,  2.34s/it][A
Training...:  77% 10773/13907 [6:44:36<2:01:06,  2.32s/it][A
Training...:  77% 10774/13907 [6:44:38<1:59:16,  2.28s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:44:53<?, ?it/s]
Training...:  77% 10774/13907 [6:44:41<1:59:16,  2.28s/it][A
Training...:  77% 10775/13907 [6:44:41<2:02:12,  2.34s/it][A
Training...:  77% 10776/13907 [6:44:43<1:59:55,  2.30s/it][A
Training...:  77% 10777/13907 [6:44:45<1:57:01,  2.24s/it][A
Training...:  78% 10778/13907 [6:44:47<1:54:18,  2.19s/it][A
Training...:  78% 10779/13907 [6:44:49<1:51:51,  2.15s/it][A
Training...:  78% 10780/13907 [6:44:51<1:50:07,  2.11s/it][A
Training...:  78% 10781/13907 [6:44:53<1:48:21,  2.08s/it][A
Training...:  78% 10782/13907 [6:44:55<1:46:35,  2.05s/it][A
Training...:  78% 10783/13907 [6:44:57<1:44:32,  2.01s/it][A
Training...:  78% 10784/13907 [6:44:59<1:42:44,  1.97s/it][A
Training...:  78% 10785/13907 [6:45:01<1:40:53,  1.94s/it][A
Training...:  78% 10786/13907 [6:45:02<1:38:39,  1.90s/it][A
Training...:  78% 10787/13907 [6:45:04<1:36:42,  1.86s/it][A
Training...:  78% 10788/13907 [6:45:06<1:34:46,  1.82s/it][A
Training...:  78% 10789/13907 [6:45:08<1:33:17,  1.80s/it][A
Training...:  78% 10790/13907 [6:45:09<1:31:32,  1.76s/it][A
Training...:  78% 10791/13907 [6:45:11<1:29:50,  1.73s/it][A
Training...:  78% 10792/13907 [6:45:13<1:27:45,  1.69s/it][A
Training...:  78% 10793/13907 [6:45:14<1:25:57,  1.66s/it][A
Training...:  78% 10794/13907 [6:45:16<1:23:38,  1.61s/it][A
Training...:  78% 10795/13907 [6:45:17<1:21:04,  1.56s/it][A
Training...:  78% 10796/13907 [6:45:19<1:18:23,  1.51s/it][A
Training...:  78% 10797/13907 [6:45:20<1:16:02,  1.47s/it][A
Training...:  78% 10798/13907 [6:45:21<1:13:25,  1.42s/it][A
Training...:  78% 10799/13907 [6:45:22<1:09:52,  1.35s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:45:36<?, ?it/s]
Training...:  78% 10799/13907 [6:45:24<1:09:52,  1.35s/it][A
Training...:  78% 10800/13907 [6:45:24<1:08:14,  1.32s/it][A
Training...:  78% 10801/13907 [6:45:27<1:46:48,  2.06s/it][A
Training...:  78% 10802/13907 [6:45:31<2:07:32,  2.46s/it][A
Training...:  78% 10803/13907 [6:45:34<2:19:57,  2.71s/it][A
Training...:  78% 10804/13907 [6:45:37<2:25:52,  2.82s/it][A
Training...:  78% 10805/13907 [6:45:40<2:29:37,  2.89s/it][A
Training...:  78% 10806/13907 [6:45:43<2:31:17,  2.93s/it][A
Training...:  78% 10807/13907 [6:45:46<2:30:43,  2.92s/it][A
Training...:  78% 10808/13907 [6:45:49<2:28:34,  2.88s/it][A
Training...:  78% 10809/13907 [6:45:52<2:26:11,  2.83s/it][A
Training...:  78% 10810/13907 [6:45:54<2:23:34,  2.78s/it][A
Training...:  78% 10811/13907 [6:45:57<2:21:11,  2.74s/it][A
Training...:  78% 10812/13907 [6:46:00<2:18:45,  2.69s/it][A
Training...:  78% 10813/13907 [6:46:02<2:16:35,  2.65s/it][A
Training...:  78% 10814/13907 [6:46:05<2:14:10,  2.60s/it][A
Training...:  78% 10815/13907 [6:46:07<2:12:07,  2.56s/it][A
Training...:  78% 10816/13907 [6:46:10<2:09:47,  2.52s/it][A
Training...:  78% 10817/13907 [6:46:12<2:07:37,  2.48s/it][A
Training...:  78% 10818/13907 [6:46:14<2:05:19,  2.43s/it][A
Training...:  78% 10819/13907 [6:46:17<2:03:39,  2.40s/it][A
Training...:  78% 10820/13907 [6:46:19<2:01:31,  2.36s/it][A
Training...:  78% 10821/13907 [6:46:21<1:59:58,  2.33s/it][A
Training...:  78% 10822/13907 [6:46:23<1:58:43,  2.31s/it][A
Training...:  78% 10823/13907 [6:46:26<1:57:13,  2.28s/it][A
Training...:  78% 10824/13907 [6:46:28<1:54:49,  2.23s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:46:42<?, ?it/s]
Training...:  78% 10824/13907 [6:46:30<1:54:49,  2.23s/it][A
Training...:  78% 10825/13907 [6:46:30<1:57:50,  2.29s/it][A
Training...:  78% 10826/13907 [6:46:32<1:56:08,  2.26s/it][A
Training...:  78% 10827/13907 [6:46:34<1:53:30,  2.21s/it][A
Training...:  78% 10828/13907 [6:46:36<1:51:18,  2.17s/it][A
Training...:  78% 10829/13907 [6:46:39<1:49:16,  2.13s/it][A
Training...:  78% 10830/13907 [6:46:41<1:47:39,  2.10s/it][A
Training...:  78% 10831/13907 [6:46:42<1:45:30,  2.06s/it][A
Training...:  78% 10832/13907 [6:46:44<1:43:45,  2.02s/it][A
Training...:  78% 10833/13907 [6:46:46<1:43:04,  2.01s/it][A
Training...:  78% 10834/13907 [6:46:48<1:42:52,  2.01s/it][A
Training...:  78% 10835/13907 [6:46:50<1:41:52,  1.99s/it][A
Training...:  78% 10836/13907 [6:46:52<1:39:47,  1.95s/it][A
Training...:  78% 10837/13907 [6:46:54<1:38:26,  1.92s/it][A
Training...:  78% 10838/13907 [6:46:56<1:36:59,  1.90s/it][A
Training...:  78% 10839/13907 [6:46:58<1:35:38,  1.87s/it][A
Training...:  78% 10840/13907 [6:46:59<1:34:04,  1.84s/it][A
Training...:  78% 10841/13907 [6:47:01<1:32:24,  1.81s/it][A
Training...:  78% 10842/13907 [6:47:03<1:30:54,  1.78s/it][A
Training...:  78% 10843/13907 [6:47:05<1:29:24,  1.75s/it][A
Training...:  78% 10844/13907 [6:47:06<1:27:14,  1.71s/it][A
Training...:  78% 10845/13907 [6:47:08<1:24:40,  1.66s/it][A
Training...:  78% 10846/13907 [6:47:09<1:22:01,  1.61s/it][A
Training...:  78% 10847/13907 [6:47:11<1:19:03,  1.55s/it][A
Training...:  78% 10848/13907 [6:47:12<1:15:44,  1.49s/it][A
Training...:  78% 10849/13907 [6:47:13<1:12:05,  1.41s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:47:27<?, ?it/s]
Training...:  78% 10849/13907 [6:47:15<1:12:05,  1.41s/it][A
Training...:  78% 10850/13907 [6:47:15<1:10:03,  1.38s/it][A
Training...:  78% 10851/13907 [6:47:18<1:46:51,  2.10s/it][A
Training...:  78% 10852/13907 [6:47:22<2:06:33,  2.49s/it][A
Training...:  78% 10853/13907 [6:47:25<2:18:02,  2.71s/it][A
Training...:  78% 10854/13907 [6:47:28<2:23:43,  2.82s/it][A
Training...:  78% 10855/13907 [6:47:31<2:26:34,  2.88s/it][A
Training...:  78% 10856/13907 [6:47:34<2:26:41,  2.88s/it][A
Training...:  78% 10857/13907 [6:47:37<2:25:45,  2.87s/it][A
Training...:  78% 10858/13907 [6:47:40<2:24:13,  2.84s/it][A
Training...:  78% 10859/13907 [6:47:42<2:22:21,  2.80s/it][A
Training...:  78% 10860/13907 [6:47:45<2:19:50,  2.75s/it][A
Training...:  78% 10861/13907 [6:47:48<2:17:34,  2.71s/it][A
Training...:  78% 10862/13907 [6:47:50<2:15:32,  2.67s/it][A
Training...:  78% 10863/13907 [6:47:53<2:13:47,  2.64s/it][A
Training...:  78% 10864/13907 [6:47:55<2:12:19,  2.61s/it][A
Training...:  78% 10865/13907 [6:47:58<2:10:33,  2.58s/it][A
Training...:  78% 10866/13907 [6:48:00<2:09:25,  2.55s/it][A
Training...:  78% 10867/13907 [6:48:03<2:07:34,  2.52s/it][A
Training...:  78% 10868/13907 [6:48:05<2:05:15,  2.47s/it][A
Training...:  78% 10869/13907 [6:48:07<2:03:42,  2.44s/it][A
Training...:  78% 10870/13907 [6:48:10<2:01:56,  2.41s/it][A
Training...:  78% 10871/13907 [6:48:12<1:59:54,  2.37s/it][A
Training...:  78% 10872/13907 [6:48:14<1:57:46,  2.33s/it][A
Training...:  78% 10873/13907 [6:48:16<1:55:48,  2.29s/it][A
Training...:  78% 10874/13907 [6:48:19<1:53:55,  2.25s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:48:33<?, ?it/s]
Training...:  78% 10874/13907 [6:48:21<1:53:55,  2.25s/it][A
Training...:  78% 10875/13907 [6:48:21<1:57:12,  2.32s/it][A
Training...:  78% 10876/13907 [6:48:23<1:55:12,  2.28s/it][A
Training...:  78% 10877/13907 [6:48:25<1:52:26,  2.23s/it][A
Training...:  78% 10878/13907 [6:48:27<1:49:34,  2.17s/it][A
Training...:  78% 10879/13907 [6:48:29<1:47:38,  2.13s/it][A
Training...:  78% 10880/13907 [6:48:31<1:45:53,  2.10s/it][A
Training...:  78% 10881/13907 [6:48:33<1:44:04,  2.06s/it][A
Training...:  78% 10882/13907 [6:48:35<1:42:10,  2.03s/it][A
Training...:  78% 10883/13907 [6:48:37<1:40:50,  2.00s/it][A
Training...:  78% 10884/13907 [6:48:39<1:39:05,  1.97s/it][A
Training...:  78% 10885/13907 [6:48:41<1:37:30,  1.94s/it][A
Training...:  78% 10886/13907 [6:48:43<1:35:53,  1.90s/it][A
Training...:  78% 10887/13907 [6:48:45<1:33:59,  1.87s/it][A
Training...:  78% 10888/13907 [6:48:46<1:32:12,  1.83s/it][A
Training...:  78% 10889/13907 [6:48:48<1:30:44,  1.80s/it][A
Training...:  78% 10890/13907 [6:48:50<1:29:01,  1.77s/it][A
Training...:  78% 10891/13907 [6:48:52<1:27:38,  1.74s/it][A
Training...:  78% 10892/13907 [6:48:53<1:26:00,  1.71s/it][A
Training...:  78% 10893/13907 [6:48:55<1:24:06,  1.67s/it][A
Training...:  78% 10894/13907 [6:48:56<1:21:45,  1.63s/it][A
Training...:  78% 10895/13907 [6:48:58<1:19:20,  1.58s/it][A
Training...:  78% 10896/13907 [6:48:59<1:16:39,  1.53s/it][A
Training...:  78% 10897/13907 [6:49:01<1:14:21,  1.48s/it][A
Training...:  78% 10898/13907 [6:49:02<1:12:10,  1.44s/it][A
Training...:  78% 10899/13907 [6:49:03<1:08:59,  1.38s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:49:17<?, ?it/s]
Training...:  78% 10899/13907 [6:49:04<1:08:59,  1.38s/it][A
Training...:  78% 10900/13907 [6:49:04<1:07:54,  1.35s/it][A
Training...:  78% 10901/13907 [6:49:08<1:44:14,  2.08s/it][A
Training...:  78% 10902/13907 [6:49:12<2:04:59,  2.50s/it][A
Training...:  78% 10903/13907 [6:49:15<2:16:47,  2.73s/it][A
Training...:  78% 10904/13907 [6:49:18<2:23:19,  2.86s/it][A
Training...:  78% 10905/13907 [6:49:21<2:26:49,  2.93s/it][A
Training...:  78% 10906/13907 [6:49:24<2:28:28,  2.97s/it][A
Training...:  78% 10907/13907 [6:49:27<2:29:01,  2.98s/it][A
Training...:  78% 10908/13907 [6:49:30<2:28:33,  2.97s/it][A
Training...:  78% 10909/13907 [6:49:33<2:25:55,  2.92s/it][A
Training...:  78% 10910/13907 [6:49:36<2:22:30,  2.85s/it][A
Training...:  78% 10911/13907 [6:49:38<2:19:54,  2.80s/it][A
Training...:  78% 10912/13907 [6:49:41<2:17:12,  2.75s/it][A
Training...:  78% 10913/13907 [6:49:44<2:14:55,  2.70s/it][A
Training...:  78% 10914/13907 [6:49:46<2:13:51,  2.68s/it][A
Training...:  78% 10915/13907 [6:49:49<2:12:02,  2.65s/it][A
Training...:  78% 10916/13907 [6:49:51<2:10:15,  2.61s/it][A
Training...:  79% 10917/13907 [6:49:54<2:08:19,  2.58s/it][A
Training...:  79% 10918/13907 [6:49:56<2:06:20,  2.54s/it][A
Training...:  79% 10919/13907 [6:49:59<2:04:43,  2.50s/it][A
Training...:  79% 10920/13907 [6:50:01<2:02:42,  2.46s/it][A
Training...:  79% 10921/13907 [6:50:03<2:01:09,  2.43s/it][A
Training...:  79% 10922/13907 [6:50:06<1:59:27,  2.40s/it][A
Training...:  79% 10923/13907 [6:50:08<1:57:56,  2.37s/it][A
Training...:  79% 10924/13907 [6:50:10<1:56:20,  2.34s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:50:25<?, ?it/s]
Training...:  79% 10924/13907 [6:50:13<1:56:20,  2.34s/it][A
Training...:  79% 10925/13907 [6:50:13<1:59:09,  2.40s/it][A
Training...:  79% 10926/13907 [6:50:15<1:56:09,  2.34s/it][A
Training...:  79% 10927/13907 [6:50:17<1:52:30,  2.27s/it][A
Training...:  79% 10928/13907 [6:50:19<1:49:50,  2.21s/it][A
Training...:  79% 10929/13907 [6:50:21<1:47:49,  2.17s/it][A
Training...:  79% 10930/13907 [6:50:23<1:45:27,  2.13s/it][A
Training...:  79% 10931/13907 [6:50:25<1:43:37,  2.09s/it][A
Training...:  79% 10932/13907 [6:50:27<1:41:38,  2.05s/it][A
Training...:  79% 10933/13907 [6:50:29<1:39:53,  2.02s/it][A
Training...:  79% 10934/13907 [6:50:31<1:38:15,  1.98s/it][A
Training...:  79% 10935/13907 [6:50:33<1:36:54,  1.96s/it][A
Training...:  79% 10936/13907 [6:50:35<1:34:57,  1.92s/it][A
Training...:  79% 10937/13907 [6:50:37<1:33:08,  1.88s/it][A
Training...:  79% 10938/13907 [6:50:38<1:31:14,  1.84s/it][A
Training...:  79% 10939/13907 [6:50:40<1:29:36,  1.81s/it][A
Training...:  79% 10940/13907 [6:50:42<1:27:45,  1.77s/it][A
Training...:  79% 10941/13907 [6:50:44<1:25:51,  1.74s/it][A
Training...:  79% 10942/13907 [6:50:45<1:23:54,  1.70s/it][A
Training...:  79% 10943/13907 [6:50:47<1:21:49,  1.66s/it][A
Training...:  79% 10944/13907 [6:50:48<1:19:57,  1.62s/it][A
Training...:  79% 10945/13907 [6:50:50<1:17:37,  1.57s/it][A
Training...:  79% 10946/13907 [6:50:51<1:15:11,  1.52s/it][A
Training...:  79% 10947/13907 [6:50:52<1:12:35,  1.47s/it][A
Training...:  79% 10948/13907 [6:50:54<1:09:39,  1.41s/it][A
Training...:  79% 10949/13907 [6:50:55<1:06:33,  1.35s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:51:09<?, ?it/s]
Training...:  79% 10949/13907 [6:50:56<1:06:33,  1.35s/it][A
Training...:  79% 10950/13907 [6:50:56<1:05:30,  1.33s/it][A
Training...:  79% 10951/13907 [6:51:00<1:44:00,  2.11s/it][A
Training...:  79% 10952/13907 [6:51:04<2:03:53,  2.52s/it][A
Training...:  79% 10953/13907 [6:51:07<2:14:18,  2.73s/it][A
Training...:  79% 10954/13907 [6:51:10<2:20:02,  2.85s/it][A
Training...:  79% 10955/13907 [6:51:13<2:23:21,  2.91s/it][A
Training...:  79% 10956/13907 [6:51:16<2:24:06,  2.93s/it][A
Training...:  79% 10957/13907 [6:51:19<2:23:26,  2.92s/it][A
Training...:  79% 10958/13907 [6:51:22<2:21:25,  2.88s/it][A
Training...:  79% 10959/13907 [6:51:24<2:19:54,  2.85s/it][A
Training...:  79% 10960/13907 [6:51:27<2:17:20,  2.80s/it][A
Training...:  79% 10961/13907 [6:51:30<2:15:07,  2.75s/it][A
Training...:  79% 10962/13907 [6:51:32<2:13:21,  2.72s/it][A
Training...:  79% 10963/13907 [6:51:35<2:11:21,  2.68s/it][A
Training...:  79% 10964/13907 [6:51:38<2:09:31,  2.64s/it][A
Training...:  79% 10965/13907 [6:51:40<2:06:59,  2.59s/it][A
Training...:  79% 10966/13907 [6:51:42<2:05:46,  2.57s/it][A
Training...:  79% 10967/13907 [6:51:45<2:04:07,  2.53s/it][A
Training...:  79% 10968/13907 [6:51:47<2:01:53,  2.49s/it][A
Training...:  79% 10969/13907 [6:51:50<1:59:56,  2.45s/it][A
Training...:  79% 10970/13907 [6:51:52<1:58:07,  2.41s/it][A
Training...:  79% 10971/13907 [6:51:54<1:56:29,  2.38s/it][A
Training...:  79% 10972/13907 [6:51:57<1:54:19,  2.34s/it][A
Training...:  79% 10973/13907 [6:51:59<1:52:50,  2.31s/it][A
Training...:  79% 10974/13907 [6:52:01<1:51:15,  2.28s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:52:16<?, ?it/s]
Training...:  79% 10974/13907 [6:52:03<1:51:15,  2.28s/it][A
Training...:  79% 10975/13907 [6:52:03<1:54:16,  2.34s/it][A
Training...:  79% 10976/13907 [6:52:06<1:52:30,  2.30s/it][A
Training...:  79% 10977/13907 [6:52:08<1:49:43,  2.25s/it][A
Training...:  79% 10978/13907 [6:52:10<1:47:48,  2.21s/it][A
Training...:  79% 10979/13907 [6:52:12<1:45:18,  2.16s/it][A
Training...:  79% 10980/13907 [6:52:14<1:43:58,  2.13s/it][A
Training...:  79% 10981/13907 [6:52:16<1:41:35,  2.08s/it][A
Training...:  79% 10982/13907 [6:52:18<1:39:39,  2.04s/it][A
Training...:  79% 10983/13907 [6:52:20<1:38:11,  2.01s/it][A
Training...:  79% 10984/13907 [6:52:22<1:36:28,  1.98s/it][A
Training...:  79% 10985/13907 [6:52:24<1:34:46,  1.95s/it][A
Training...:  79% 10986/13907 [6:52:26<1:33:48,  1.93s/it][A
Training...:  79% 10987/13907 [6:52:27<1:32:11,  1.89s/it][A
Training...:  79% 10988/13907 [6:52:29<1:30:30,  1.86s/it][A
Training...:  79% 10989/13907 [6:52:31<1:28:52,  1.83s/it][A
Training...:  79% 10990/13907 [6:52:33<1:27:07,  1.79s/it][A
Training...:  79% 10991/13907 [6:52:34<1:25:28,  1.76s/it][A
Training...:  79% 10992/13907 [6:52:36<1:23:51,  1.73s/it][A
Training...:  79% 10993/13907 [6:52:38<1:21:59,  1.69s/it][A
Training...:  79% 10994/13907 [6:52:39<1:20:19,  1.65s/it][A
Training...:  79% 10995/13907 [6:52:41<1:18:04,  1.61s/it][A
Training...:  79% 10996/13907 [6:52:42<1:15:58,  1.57s/it][A
Training...:  79% 10997/13907 [6:52:44<1:13:36,  1.52s/it][A
Training...:  79% 10998/13907 [6:52:45<1:10:53,  1.46s/it][A
Training...:  79% 10999/13907 [6:52:46<1:07:46,  1.40s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:53:00<?, ?it/s]
Training...:  79% 10999/13907 [6:52:47<1:07:46,  1.40s/it][A
Training...:  79% 11000/13907 [6:52:47<1:05:44,  1.36s/it][A
Training...:  79% 11001/13907 [6:52:51<1:43:11,  2.13s/it][A
Training...:  79% 11002/13907 [6:52:55<2:03:48,  2.56s/it][A
Training...:  79% 11003/13907 [6:52:58<2:14:43,  2.78s/it][A
Training...:  79% 11004/13907 [6:53:01<2:20:20,  2.90s/it][A
Training...:  79% 11005/13907 [6:53:04<2:23:04,  2.96s/it][A
Training...:  79% 11006/13907 [6:53:07<2:22:42,  2.95s/it][A
Training...:  79% 11007/13907 [6:53:10<2:22:29,  2.95s/it][A
Training...:  79% 11008/13907 [6:53:13<2:20:37,  2.91s/it][A
Training...:  79% 11009/13907 [6:53:16<2:19:07,  2.88s/it][A
Training...:  79% 11010/13907 [6:53:19<2:16:30,  2.83s/it][A
Training...:  79% 11011/13907 [6:53:21<2:14:21,  2.78s/it][A
Training...:  79% 11012/13907 [6:53:24<2:11:51,  2.73s/it][A
Training...:  79% 11013/13907 [6:53:26<2:09:04,  2.68s/it][A
Training...:  79% 11014/13907 [6:53:29<2:06:53,  2.63s/it][A
Training...:  79% 11015/13907 [6:53:31<2:04:28,  2.58s/it][A
Training...:  79% 11016/13907 [6:53:34<2:02:45,  2.55s/it][A
Training...:  79% 11017/13907 [6:53:36<2:01:30,  2.52s/it][A
Training...:  79% 11018/13907 [6:53:39<1:59:32,  2.48s/it][A
Training...:  79% 11019/13907 [6:53:41<1:58:01,  2.45s/it][A
Training...:  79% 11020/13907 [6:53:44<1:56:17,  2.42s/it][A
Training...:  79% 11021/13907 [6:53:46<1:55:00,  2.39s/it][A
Training...:  79% 11022/13907 [6:53:48<1:53:24,  2.36s/it][A
Training...:  79% 11023/13907 [6:53:50<1:51:05,  2.31s/it][A
Training...:  79% 11024/13907 [6:53:53<1:49:24,  2.28s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:54:07<?, ?it/s]
Training...:  79% 11024/13907 [6:53:55<1:49:24,  2.28s/it][A
Training...:  79% 11025/13907 [6:53:55<1:52:33,  2.34s/it][A
Training...:  79% 11026/13907 [6:53:57<1:50:30,  2.30s/it][A
Training...:  79% 11027/13907 [6:53:59<1:48:06,  2.25s/it][A
Training...:  79% 11028/13907 [6:54:01<1:45:48,  2.21s/it][A
Training...:  79% 11029/13907 [6:54:04<1:43:45,  2.16s/it][A
Training...:  79% 11030/13907 [6:54:06<1:41:26,  2.12s/it][A
Training...:  79% 11031/13907 [6:54:08<1:40:31,  2.10s/it][A
Training...:  79% 11032/13907 [6:54:10<1:39:06,  2.07s/it][A
Training...:  79% 11033/13907 [6:54:12<1:37:09,  2.03s/it][A
Training...:  79% 11034/13907 [6:54:13<1:35:15,  1.99s/it][A
Training...:  79% 11035/13907 [6:54:15<1:33:22,  1.95s/it][A
Training...:  79% 11036/13907 [6:54:17<1:32:01,  1.92s/it][A
Training...:  79% 11037/13907 [6:54:19<1:30:25,  1.89s/it][A
Training...:  79% 11038/13907 [6:54:21<1:29:24,  1.87s/it][A
Training...:  79% 11039/13907 [6:54:23<1:27:36,  1.83s/it][A
Training...:  79% 11040/13907 [6:54:24<1:25:42,  1.79s/it][A
Training...:  79% 11041/13907 [6:54:26<1:23:51,  1.76s/it][A
Training...:  79% 11042/13907 [6:54:27<1:21:51,  1.71s/it][A
Training...:  79% 11043/13907 [6:54:29<1:19:54,  1.67s/it][A
Training...:  79% 11044/13907 [6:54:31<1:18:18,  1.64s/it][A
Training...:  79% 11045/13907 [6:54:32<1:16:04,  1.59s/it][A
Training...:  79% 11046/13907 [6:54:34<1:13:49,  1.55s/it][A
Training...:  79% 11047/13907 [6:54:35<1:11:20,  1.50s/it][A
Training...:  79% 11048/13907 [6:54:36<1:08:04,  1.43s/it][A
Training...:  79% 11049/13907 [6:54:37<1:04:39,  1.36s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:54:51<?, ?it/s]
Training...:  79% 11049/13907 [6:54:39<1:04:39,  1.36s/it][A
Training...:  79% 11050/13907 [6:54:39<1:03:14,  1.33s/it][A
Training...:  79% 11051/13907 [6:54:43<1:40:54,  2.12s/it][A
Training...:  79% 11052/13907 [6:54:46<2:00:32,  2.53s/it][A
Training...:  79% 11053/13907 [6:54:49<2:11:18,  2.76s/it][A
Training...:  79% 11054/13907 [6:54:53<2:16:14,  2.87s/it][A
Training...:  79% 11055/13907 [6:54:56<2:18:40,  2.92s/it][A
Training...:  79% 11056/13907 [6:54:58<2:18:27,  2.91s/it][A
Training...:  80% 11057/13907 [6:55:01<2:18:14,  2.91s/it][A
Training...:  80% 11058/13907 [6:55:04<2:16:45,  2.88s/it][A
Training...:  80% 11059/13907 [6:55:07<2:15:24,  2.85s/it][A
Training...:  80% 11060/13907 [6:55:10<2:14:03,  2.83s/it][A
Training...:  80% 11061/13907 [6:55:12<2:11:35,  2.77s/it][A
Training...:  80% 11062/13907 [6:55:15<2:09:30,  2.73s/it][A
Training...:  80% 11063/13907 [6:55:18<2:07:21,  2.69s/it][A
Training...:  80% 11064/13907 [6:55:20<2:05:08,  2.64s/it][A
Training...:  80% 11065/13907 [6:55:23<2:03:16,  2.60s/it][A
Training...:  80% 11066/13907 [6:55:25<2:01:12,  2.56s/it][A
Training...:  80% 11067/13907 [6:55:28<1:59:27,  2.52s/it][A
Training...:  80% 11068/13907 [6:55:30<1:58:17,  2.50s/it][A
Training...:  80% 11069/13907 [6:55:32<1:56:55,  2.47s/it][A
Training...:  80% 11070/13907 [6:55:35<1:54:45,  2.43s/it][A
Training...:  80% 11071/13907 [6:55:37<1:52:52,  2.39s/it][A
Training...:  80% 11072/13907 [6:55:39<1:50:32,  2.34s/it][A
Training...:  80% 11073/13907 [6:55:41<1:48:51,  2.30s/it][A
Training...:  80% 11074/13907 [6:55:44<1:47:44,  2.28s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:55:59<?, ?it/s]
Training...:  80% 11074/13907 [6:55:46<1:47:44,  2.28s/it][A
Training...:  80% 11075/13907 [6:55:46<1:50:50,  2.35s/it][A
Training...:  80% 11076/13907 [6:55:48<1:48:30,  2.30s/it][A
Training...:  80% 11077/13907 [6:55:50<1:45:15,  2.23s/it][A
Training...:  80% 11078/13907 [6:55:53<1:42:57,  2.18s/it][A
Training...:  80% 11079/13907 [6:55:55<1:40:31,  2.13s/it][A
Training...:  80% 11080/13907 [6:55:57<1:38:13,  2.08s/it][A
Training...:  80% 11081/13907 [6:55:58<1:36:17,  2.04s/it][A
Training...:  80% 11082/13907 [6:56:00<1:34:26,  2.01s/it][A
Training...:  80% 11083/13907 [6:56:02<1:32:37,  1.97s/it][A
Training...:  80% 11084/13907 [6:56:04<1:31:13,  1.94s/it][A
Training...:  80% 11085/13907 [6:56:06<1:30:09,  1.92s/it][A
Training...:  80% 11086/13907 [6:56:08<1:28:34,  1.88s/it][A
Training...:  80% 11087/13907 [6:56:10<1:27:26,  1.86s/it][A
Training...:  80% 11088/13907 [6:56:11<1:26:17,  1.84s/it][A
Training...:  80% 11089/13907 [6:56:13<1:24:45,  1.80s/it][A
Training...:  80% 11090/13907 [6:56:15<1:23:14,  1.77s/it][A
Training...:  80% 11091/13907 [6:56:17<1:21:45,  1.74s/it][A
Training...:  80% 11092/13907 [6:56:18<1:20:12,  1.71s/it][A
Training...:  80% 11093/13907 [6:56:20<1:18:54,  1.68s/it][A
Training...:  80% 11094/13907 [6:56:21<1:17:23,  1.65s/it][A
Training...:  80% 11095/13907 [6:56:23<1:15:15,  1.61s/it][A
Training...:  80% 11096/13907 [6:56:24<1:13:19,  1.57s/it][A
Training...:  80% 11097/13907 [6:56:26<1:11:23,  1.52s/it][A
Training...:  80% 11098/13907 [6:56:27<1:08:43,  1.47s/it][A
Training...:  80% 11099/13907 [6:56:28<1:05:43,  1.40s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:56:42<?, ?it/s]
Training...:  80% 11099/13907 [6:56:30<1:05:43,  1.40s/it][A
Training...:  80% 11100/13907 [6:56:30<1:04:53,  1.39s/it][A
Training...:  80% 11101/13907 [6:56:33<1:38:28,  2.11s/it][A
Training...:  80% 11102/13907 [6:56:37<1:57:51,  2.52s/it][A
Training...:  80% 11103/13907 [6:56:40<2:08:01,  2.74s/it][A
Training...:  80% 11104/13907 [6:56:43<2:13:56,  2.87s/it][A
Training...:  80% 11105/13907 [6:56:46<2:16:56,  2.93s/it][A
Training...:  80% 11106/13907 [6:56:49<2:18:21,  2.96s/it][A
Training...:  80% 11107/13907 [6:56:52<2:18:12,  2.96s/it][A
Training...:  80% 11108/13907 [6:56:55<2:16:16,  2.92s/it][A
Training...:  80% 11109/13907 [6:56:58<2:14:18,  2.88s/it][A
Training...:  80% 11110/13907 [6:57:01<2:11:50,  2.83s/it][A
Training...:  80% 11111/13907 [6:57:03<2:09:31,  2.78s/it][A
Training...:  80% 11112/13907 [6:57:06<2:07:29,  2.74s/it][A
Training...:  80% 11113/13907 [6:57:09<2:05:09,  2.69s/it][A
Training...:  80% 11114/13907 [6:57:11<2:03:32,  2.65s/it][A
Training...:  80% 11115/13907 [6:57:14<2:02:07,  2.62s/it][A
Training...:  80% 11116/13907 [6:57:16<2:00:10,  2.58s/it][A
Training...:  80% 11117/13907 [6:57:19<1:57:54,  2.54s/it][A
Training...:  80% 11118/13907 [6:57:21<1:55:42,  2.49s/it][A
Training...:  80% 11119/13907 [6:57:23<1:53:50,  2.45s/it][A
Training...:  80% 11120/13907 [6:57:26<1:52:00,  2.41s/it][A
Training...:  80% 11121/13907 [6:57:28<1:50:18,  2.38s/it][A
Training...:  80% 11122/13907 [6:57:30<1:48:32,  2.34s/it][A
Training...:  80% 11123/13907 [6:57:33<1:47:01,  2.31s/it][A
Training...:  80% 11124/13907 [6:57:35<1:45:28,  2.27s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:57:50<?, ?it/s]
Training...:  80% 11124/13907 [6:57:37<1:45:28,  2.27s/it][A
Training...:  80% 11125/13907 [6:57:37<1:48:24,  2.34s/it][A
Training...:  80% 11126/13907 [6:57:39<1:46:19,  2.29s/it][A
Training...:  80% 11127/13907 [6:57:42<1:43:58,  2.24s/it][A
Training...:  80% 11128/13907 [6:57:44<1:41:43,  2.20s/it][A
Training...:  80% 11129/13907 [6:57:46<1:39:45,  2.15s/it][A
Training...:  80% 11130/13907 [6:57:48<1:37:59,  2.12s/it][A
Training...:  80% 11131/13907 [6:57:50<1:36:21,  2.08s/it][A
Training...:  80% 11132/13907 [6:57:52<1:34:41,  2.05s/it][A
Training...:  80% 11133/13907 [6:57:54<1:32:57,  2.01s/it][A
Training...:  80% 11134/13907 [6:57:55<1:31:08,  1.97s/it][A
Training...:  80% 11135/13907 [6:57:57<1:29:41,  1.94s/it][A
Training...:  80% 11136/13907 [6:57:59<1:27:56,  1.90s/it][A
Training...:  80% 11137/13907 [6:58:01<1:26:07,  1.87s/it][A
Training...:  80% 11138/13907 [6:58:03<1:24:38,  1.83s/it][A
Training...:  80% 11139/13907 [6:58:04<1:23:11,  1.80s/it][A
Training...:  80% 11140/13907 [6:58:06<1:21:40,  1.77s/it][A
Training...:  80% 11141/13907 [6:58:08<1:19:55,  1.73s/it][A
Training...:  80% 11142/13907 [6:58:09<1:18:25,  1.70s/it][A
Training...:  80% 11143/13907 [6:58:11<1:16:34,  1.66s/it][A
Training...:  80% 11144/13907 [6:58:13<1:14:58,  1.63s/it][A
Training...:  80% 11145/13907 [6:58:14<1:12:36,  1.58s/it][A
Training...:  80% 11146/13907 [6:58:15<1:10:50,  1.54s/it][A
Training...:  80% 11147/13907 [6:58:17<1:08:30,  1.49s/it][A
Training...:  80% 11148/13907 [6:58:18<1:06:03,  1.44s/it][A
Training...:  80% 11149/13907 [6:58:19<1:02:53,  1.37s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:58:33<?, ?it/s]
Training...:  80% 11149/13907 [6:58:21<1:02:53,  1.37s/it][A
Training...:  80% 11150/13907 [6:58:21<1:01:38,  1.34s/it][A
Training...:  80% 11151/13907 [6:58:24<1:35:52,  2.09s/it][A
Training...:  80% 11152/13907 [6:58:28<1:53:54,  2.48s/it][A
Training...:  80% 11153/13907 [6:58:31<2:04:09,  2.71s/it][A
Training...:  80% 11154/13907 [6:58:34<2:10:37,  2.85s/it][A
Training...:  80% 11155/13907 [6:58:37<2:13:35,  2.91s/it][A
Training...:  80% 11156/13907 [6:58:40<2:14:05,  2.92s/it][A
Training...:  80% 11157/13907 [6:58:43<2:14:53,  2.94s/it][A
Training...:  80% 11158/13907 [6:58:46<2:14:30,  2.94s/it][A
Training...:  80% 11159/13907 [6:58:49<2:12:24,  2.89s/it][A
Training...:  80% 11160/13907 [6:58:52<2:09:53,  2.84s/it][A
Training...:  80% 11161/13907 [6:58:54<2:07:35,  2.79s/it][A
Training...:  80% 11162/13907 [6:58:57<2:05:16,  2.74s/it][A
Training...:  80% 11163/13907 [6:59:00<2:03:14,  2.69s/it][A
Training...:  80% 11164/13907 [6:59:02<2:00:57,  2.65s/it][A
Training...:  80% 11165/13907 [6:59:05<1:59:06,  2.61s/it][A
Training...:  80% 11166/13907 [6:59:07<1:56:58,  2.56s/it][A
Training...:  80% 11167/13907 [6:59:09<1:55:09,  2.52s/it][A
Training...:  80% 11168/13907 [6:59:12<1:53:05,  2.48s/it][A
Training...:  80% 11169/13907 [6:59:14<1:51:12,  2.44s/it][A
Training...:  80% 11170/13907 [6:59:16<1:49:21,  2.40s/it][A
Training...:  80% 11171/13907 [6:59:19<1:47:20,  2.35s/it][A
Training...:  80% 11172/13907 [6:59:21<1:45:26,  2.31s/it][A
Training...:  80% 11173/13907 [6:59:23<1:44:00,  2.28s/it][A
Training...:  80% 11174/13907 [6:59:25<1:42:40,  2.25s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [6:59:40<?, ?it/s]
Training...:  80% 11174/13907 [6:59:28<1:42:40,  2.25s/it][A
Training...:  80% 11175/13907 [6:59:28<1:45:15,  2.31s/it][A
Training...:  80% 11176/13907 [6:59:30<1:43:05,  2.26s/it][A
Training...:  80% 11177/13907 [6:59:32<1:41:01,  2.22s/it][A
Training...:  80% 11178/13907 [6:59:34<1:39:24,  2.19s/it][A
Training...:  80% 11179/13907 [6:59:36<1:38:00,  2.16s/it][A
Training...:  80% 11180/13907 [6:59:38<1:35:57,  2.11s/it][A
Training...:  80% 11181/13907 [6:59:40<1:33:52,  2.07s/it][A
Training...:  80% 11182/13907 [6:59:42<1:32:03,  2.03s/it][A
Training...:  80% 11183/13907 [6:59:44<1:30:26,  1.99s/it][A
Training...:  80% 11184/13907 [6:59:46<1:28:49,  1.96s/it][A
Training...:  80% 11185/13907 [6:59:48<1:27:28,  1.93s/it][A
Training...:  80% 11186/13907 [6:59:50<1:25:51,  1.89s/it][A
Training...:  80% 11187/13907 [6:59:51<1:24:26,  1.86s/it][A
Training...:  80% 11188/13907 [6:59:53<1:23:02,  1.83s/it][A
Training...:  80% 11189/13907 [6:59:55<1:21:37,  1.80s/it][A
Training...:  80% 11190/13907 [6:59:57<1:20:02,  1.77s/it][A
Training...:  80% 11191/13907 [6:59:58<1:18:23,  1.73s/it][A
Training...:  80% 11192/13907 [7:00:00<1:16:36,  1.69s/it][A
Training...:  80% 11193/13907 [7:00:01<1:15:07,  1.66s/it][A
Training...:  80% 11194/13907 [7:00:03<1:13:31,  1.63s/it][A
Training...:  80% 11195/13907 [7:00:04<1:11:27,  1.58s/it][A
Training...:  81% 11196/13907 [7:00:06<1:09:24,  1.54s/it][A
Training...:  81% 11197/13907 [7:00:07<1:07:07,  1.49s/it][A
Training...:  81% 11198/13907 [7:00:09<1:04:05,  1.42s/it][A
Training...:  81% 11199/13907 [7:00:10<1:00:55,  1.35s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:00:23<?, ?it/s]
Training...:  81% 11199/13907 [7:00:11<1:00:55,  1.35s/it][A
Training...:  81% 11200/13907 [7:00:11<59:55,  1.33s/it]  [A
Training...:  81% 11201/13907 [7:00:15<1:33:17,  2.07s/it][A
Training...:  81% 11202/13907 [7:00:18<1:51:57,  2.48s/it][A
Training...:  81% 11203/13907 [7:00:22<2:02:52,  2.73s/it][A
Training...:  81% 11204/13907 [7:00:25<2:09:04,  2.87s/it][A
Training...:  81% 11205/13907 [7:00:28<2:13:20,  2.96s/it][A
Training...:  81% 11206/13907 [7:00:31<2:12:55,  2.95s/it][A
Training...:  81% 11207/13907 [7:00:34<2:11:29,  2.92s/it][A
Training...:  81% 11208/13907 [7:00:36<2:09:55,  2.89s/it][A
Training...:  81% 11209/13907 [7:00:39<2:07:33,  2.84s/it][A
Training...:  81% 11210/13907 [7:00:42<2:05:20,  2.79s/it][A
Training...:  81% 11211/13907 [7:00:45<2:03:29,  2.75s/it][A
Training...:  81% 11212/13907 [7:00:47<2:01:18,  2.70s/it][A
Training...:  81% 11213/13907 [7:00:50<1:59:14,  2.66s/it][A
Training...:  81% 11214/13907 [7:00:52<1:57:21,  2.61s/it][A
Training...:  81% 11215/13907 [7:00:55<1:55:46,  2.58s/it][A
Training...:  81% 11216/13907 [7:00:57<1:53:39,  2.53s/it][A
Training...:  81% 11217/13907 [7:01:00<1:51:47,  2.49s/it][A
Training...:  81% 11218/13907 [7:01:02<1:49:59,  2.45s/it][A
Training...:  81% 11219/13907 [7:01:04<1:48:22,  2.42s/it][A
Training...:  81% 11220/13907 [7:01:07<1:46:52,  2.39s/it][A
Training...:  81% 11221/13907 [7:01:09<1:45:36,  2.36s/it][A
Training...:  81% 11222/13907 [7:01:11<1:44:11,  2.33s/it][A
Training...:  81% 11223/13907 [7:01:13<1:42:53,  2.30s/it][A
Training...:  81% 11224/13907 [7:01:16<1:41:22,  2.27s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:01:30<?, ?it/s]
Training...:  81% 11224/13907 [7:01:18<1:41:22,  2.27s/it][A
Training...:  81% 11225/13907 [7:01:18<1:44:22,  2.33s/it][A
Training...:  81% 11226/13907 [7:01:20<1:42:39,  2.30s/it][A
Training...:  81% 11227/13907 [7:01:22<1:39:56,  2.24s/it][A
Training...:  81% 11228/13907 [7:01:24<1:38:02,  2.20s/it][A
Training...:  81% 11229/13907 [7:01:26<1:36:21,  2.16s/it][A
Training...:  81% 11230/13907 [7:01:29<1:34:33,  2.12s/it][A
Training...:  81% 11231/13907 [7:01:31<1:33:04,  2.09s/it][A
Training...:  81% 11232/13907 [7:01:33<1:31:51,  2.06s/it][A
Training...:  81% 11233/13907 [7:01:34<1:30:15,  2.03s/it][A
Training...:  81% 11234/13907 [7:01:36<1:28:34,  1.99s/it][A
Training...:  81% 11235/13907 [7:01:38<1:26:50,  1.95s/it][A
Training...:  81% 11236/13907 [7:01:40<1:25:06,  1.91s/it][A
Training...:  81% 11237/13907 [7:01:42<1:23:40,  1.88s/it][A
Training...:  81% 11238/13907 [7:01:44<1:22:12,  1.85s/it][A
Training...:  81% 11239/13907 [7:01:45<1:20:40,  1.81s/it][A
Training...:  81% 11240/13907 [7:01:47<1:19:12,  1.78s/it][A
Training...:  81% 11241/13907 [7:01:49<1:17:49,  1.75s/it][A
Training...:  81% 11242/13907 [7:01:50<1:16:49,  1.73s/it][A
Training...:  81% 11243/13907 [7:01:52<1:14:58,  1.69s/it][A
Training...:  81% 11244/13907 [7:01:54<1:13:31,  1.66s/it][A
Training...:  81% 11245/13907 [7:01:55<1:10:53,  1.60s/it][A
Training...:  81% 11246/13907 [7:01:56<1:08:13,  1.54s/it][A
Training...:  81% 11247/13907 [7:01:58<1:05:19,  1.47s/it][A
Training...:  81% 11248/13907 [7:01:59<1:02:37,  1.41s/it][A
Training...:  81% 11249/13907 [7:02:00<59:32,  1.34s/it]  [A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:02:14<?, ?it/s]
Training...:  81% 11249/13907 [7:02:01<59:32,  1.34s/it][A
Training...:  81% 11250/13907 [7:02:01<58:00,  1.31s/it][A
Training...:  81% 11251/13907 [7:02:05<1:32:30,  2.09s/it][A
Training...:  81% 11252/13907 [7:02:09<1:51:10,  2.51s/it][A
Training...:  81% 11253/13907 [7:02:12<2:01:10,  2.74s/it][A
Training...:  81% 11254/13907 [7:02:15<2:06:38,  2.86s/it][A
Training...:  81% 11255/13907 [7:02:18<2:08:56,  2.92s/it][A
Training...:  81% 11256/13907 [7:02:21<2:08:43,  2.91s/it][A
Training...:  81% 11257/13907 [7:02:24<2:08:31,  2.91s/it][A
Training...:  81% 11258/13907 [7:02:27<2:07:10,  2.88s/it][A
Training...:  81% 11259/13907 [7:02:30<2:05:43,  2.85s/it][A
Training...:  81% 11260/13907 [7:02:32<2:03:40,  2.80s/it][A
Training...:  81% 11261/13907 [7:02:35<2:01:58,  2.77s/it][A
Training...:  81% 11262/13907 [7:02:38<2:00:30,  2.73s/it][A
Training...:  81% 11263/13907 [7:02:40<1:58:39,  2.69s/it][A
Training...:  81% 11264/13907 [7:02:43<1:57:03,  2.66s/it][A
Training...:  81% 11265/13907 [7:02:45<1:55:18,  2.62s/it][A
Training...:  81% 11266/13907 [7:02:48<1:53:14,  2.57s/it][A
Training...:  81% 11267/13907 [7:02:50<1:50:51,  2.52s/it][A
Training...:  81% 11268/13907 [7:02:53<1:49:39,  2.49s/it][A
Training...:  81% 11269/13907 [7:02:55<1:47:51,  2.45s/it][A
Training...:  81% 11270/13907 [7:02:57<1:46:32,  2.42s/it][A
Training...:  81% 11271/13907 [7:03:00<1:44:53,  2.39s/it][A
Training...:  81% 11272/13907 [7:03:02<1:43:40,  2.36s/it][A
Training...:  81% 11273/13907 [7:03:04<1:42:03,  2.32s/it][A
Training...:  81% 11274/13907 [7:03:06<1:39:57,  2.28s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:03:21<?, ?it/s]
Training...:  81% 11274/13907 [7:03:09<1:39:57,  2.28s/it][A
Training...:  81% 11275/13907 [7:03:09<1:42:12,  2.33s/it][A
Training...:  81% 11276/13907 [7:03:11<1:40:20,  2.29s/it][A
Training...:  81% 11277/13907 [7:03:13<1:37:30,  2.22s/it][A
Training...:  81% 11278/13907 [7:03:15<1:35:15,  2.17s/it][A
Training...:  81% 11279/13907 [7:03:17<1:33:14,  2.13s/it][A
Training...:  81% 11280/13907 [7:03:19<1:31:24,  2.09s/it][A
Training...:  81% 11281/13907 [7:03:21<1:29:41,  2.05s/it][A
Training...:  81% 11282/13907 [7:03:23<1:28:33,  2.02s/it][A
Training...:  81% 11283/13907 [7:03:25<1:27:02,  1.99s/it][A
Training...:  81% 11284/13907 [7:03:27<1:25:36,  1.96s/it][A
Training...:  81% 11285/13907 [7:03:29<1:24:18,  1.93s/it][A
Training...:  81% 11286/13907 [7:03:31<1:22:44,  1.89s/it][A
Training...:  81% 11287/13907 [7:03:32<1:21:11,  1.86s/it][A
Training...:  81% 11288/13907 [7:03:34<1:20:13,  1.84s/it][A
Training...:  81% 11289/13907 [7:03:36<1:18:36,  1.80s/it][A
Training...:  81% 11290/13907 [7:03:38<1:16:52,  1.76s/it][A
Training...:  81% 11291/13907 [7:03:39<1:15:26,  1.73s/it][A
Training...:  81% 11292/13907 [7:03:41<1:13:56,  1.70s/it][A
Training...:  81% 11293/13907 [7:03:42<1:12:19,  1.66s/it][A
Training...:  81% 11294/13907 [7:03:44<1:10:48,  1.63s/it][A
Training...:  81% 11295/13907 [7:03:45<1:08:45,  1.58s/it][A
Training...:  81% 11296/13907 [7:03:47<1:06:27,  1.53s/it][A
Training...:  81% 11297/13907 [7:03:48<1:03:59,  1.47s/it][A
Training...:  81% 11298/13907 [7:03:50<1:01:40,  1.42s/it][A
Training...:  81% 11299/13907 [7:03:51<58:58,  1.36s/it]  [A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:04:04<?, ?it/s]
Training...:  81% 11299/13907 [7:03:52<58:58,  1.36s/it][A
Training...:  81% 11300/13907 [7:03:52<57:44,  1.33s/it][A
Training...:  81% 11301/13907 [7:03:56<1:31:52,  2.12s/it][A
Training...:  81% 11302/13907 [7:03:59<1:49:48,  2.53s/it][A
Training...:  81% 11303/13907 [7:04:03<1:59:25,  2.75s/it][A
Training...:  81% 11304/13907 [7:04:06<2:04:21,  2.87s/it][A
Training...:  81% 11305/13907 [7:04:09<2:06:07,  2.91s/it][A
Training...:  81% 11306/13907 [7:04:12<2:06:17,  2.91s/it][A
Training...:  81% 11307/13907 [7:04:15<2:05:48,  2.90s/it][A
Training...:  81% 11308/13907 [7:04:17<2:04:33,  2.88s/it][A
Training...:  81% 11309/13907 [7:04:20<2:03:10,  2.84s/it][A
Training...:  81% 11310/13907 [7:04:23<2:01:28,  2.81s/it][A
Training...:  81% 11311/13907 [7:04:26<2:00:00,  2.77s/it][A
Training...:  81% 11312/13907 [7:04:28<1:58:41,  2.74s/it][A
Training...:  81% 11313/13907 [7:04:31<1:56:50,  2.70s/it][A
Training...:  81% 11314/13907 [7:04:34<1:55:18,  2.67s/it][A
Training...:  81% 11315/13907 [7:04:36<1:52:56,  2.61s/it][A
Training...:  81% 11316/13907 [7:04:38<1:50:47,  2.57s/it][A
Training...:  81% 11317/13907 [7:04:41<1:48:57,  2.52s/it][A
Training...:  81% 11318/13907 [7:04:43<1:46:57,  2.48s/it][A
Training...:  81% 11319/13907 [7:04:46<1:45:22,  2.44s/it][A
Training...:  81% 11320/13907 [7:04:48<1:43:42,  2.41s/it][A
Training...:  81% 11321/13907 [7:04:50<1:42:08,  2.37s/it][A
Training...:  81% 11322/13907 [7:04:52<1:40:07,  2.32s/it][A
Training...:  81% 11323/13907 [7:04:55<1:38:42,  2.29s/it][A
Training...:  81% 11324/13907 [7:04:57<1:37:10,  2.26s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:05:12<?, ?it/s]
Training...:  81% 11324/13907 [7:04:59<1:37:10,  2.26s/it][A
Training...:  81% 11325/13907 [7:04:59<1:40:03,  2.33s/it][A
Training...:  81% 11326/13907 [7:05:02<1:38:36,  2.29s/it][A
Training...:  81% 11327/13907 [7:05:04<1:36:43,  2.25s/it][A
Training...:  81% 11328/13907 [7:05:06<1:35:05,  2.21s/it][A
Training...:  81% 11329/13907 [7:05:08<1:33:54,  2.19s/it][A
Training...:  81% 11330/13907 [7:05:10<1:32:20,  2.15s/it][A
Training...:  81% 11331/13907 [7:05:12<1:30:49,  2.12s/it][A
Training...:  81% 11332/13907 [7:05:14<1:28:55,  2.07s/it][A
Training...:  81% 11333/13907 [7:05:16<1:27:00,  2.03s/it][A
Training...:  81% 11334/13907 [7:05:18<1:25:04,  1.98s/it][A
Training...:  82% 11335/13907 [7:05:20<1:23:33,  1.95s/it][A
Training...:  82% 11336/13907 [7:05:22<1:22:28,  1.92s/it][A
Training...:  82% 11337/13907 [7:05:23<1:20:58,  1.89s/it][A
Training...:  82% 11338/13907 [7:05:25<1:19:56,  1.87s/it][A
Training...:  82% 11339/13907 [7:05:27<1:18:18,  1.83s/it][A
Training...:  82% 11340/13907 [7:05:29<1:16:42,  1.79s/it][A
Training...:  82% 11341/13907 [7:05:30<1:14:55,  1.75s/it][A
Training...:  82% 11342/13907 [7:05:32<1:13:04,  1.71s/it][A
Training...:  82% 11343/13907 [7:05:33<1:11:20,  1.67s/it][A
Training...:  82% 11344/13907 [7:05:35<1:09:42,  1.63s/it][A
Training...:  82% 11345/13907 [7:05:37<1:07:49,  1.59s/it][A
Training...:  82% 11346/13907 [7:05:38<1:05:56,  1.54s/it][A
Training...:  82% 11347/13907 [7:05:39<1:03:58,  1.50s/it][A
Training...:  82% 11348/13907 [7:05:41<1:01:27,  1.44s/it][A
Training...:  82% 11349/13907 [7:05:42<58:43,  1.38s/it]  [A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:05:55<?, ?it/s]
Training...:  82% 11349/13907 [7:05:43<58:43,  1.38s/it][A
Training...:  82% 11350/13907 [7:05:43<57:26,  1.35s/it][A
Training...:  82% 11351/13907 [7:05:47<1:31:33,  2.15s/it][A
Training...:  82% 11352/13907 [7:05:51<1:48:38,  2.55s/it][A
Training...:  82% 11353/13907 [7:05:54<1:57:53,  2.77s/it][A
Training...:  82% 11354/13907 [7:05:57<2:02:01,  2.87s/it][A
Training...:  82% 11355/13907 [7:06:00<2:04:42,  2.93s/it][A
Training...:  82% 11356/13907 [7:06:03<2:04:42,  2.93s/it][A
Training...:  82% 11357/13907 [7:06:06<2:04:24,  2.93s/it][A
Training...:  82% 11358/13907 [7:06:09<2:02:55,  2.89s/it][A
Training...:  82% 11359/13907 [7:06:12<2:01:10,  2.85s/it][A
Training...:  82% 11360/13907 [7:06:14<1:58:44,  2.80s/it][A
Training...:  82% 11361/13907 [7:06:17<1:56:47,  2.75s/it][A
Training...:  82% 11362/13907 [7:06:19<1:54:18,  2.70s/it][A
Training...:  82% 11363/13907 [7:06:22<1:52:40,  2.66s/it][A
Training...:  82% 11364/13907 [7:06:25<1:50:56,  2.62s/it][A
Training...:  82% 11365/13907 [7:06:27<1:48:46,  2.57s/it][A
Training...:  82% 11366/13907 [7:06:29<1:46:59,  2.53s/it][A
Training...:  82% 11367/13907 [7:06:32<1:45:25,  2.49s/it][A
Training...:  82% 11368/13907 [7:06:34<1:44:09,  2.46s/it][A
Training...:  82% 11369/13907 [7:06:37<1:42:43,  2.43s/it][A
Training...:  82% 11370/13907 [7:06:39<1:41:02,  2.39s/it][A
Training...:  82% 11371/13907 [7:06:41<1:39:43,  2.36s/it][A
Training...:  82% 11372/13907 [7:06:43<1:38:39,  2.34s/it][A
Training...:  82% 11373/13907 [7:06:46<1:37:52,  2.32s/it][A
Training...:  82% 11374/13907 [7:06:48<1:36:13,  2.28s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:07:03<?, ?it/s]
Training...:  82% 11374/13907 [7:06:50<1:36:13,  2.28s/it][A
Training...:  82% 11375/13907 [7:06:50<1:38:29,  2.33s/it][A
Training...:  82% 11376/13907 [7:06:53<1:36:57,  2.30s/it][A
Training...:  82% 11377/13907 [7:06:55<1:35:02,  2.25s/it][A
Training...:  82% 11378/13907 [7:06:57<1:33:08,  2.21s/it][A
Training...:  82% 11379/13907 [7:06:59<1:31:39,  2.18s/it][A
Training...:  82% 11380/13907 [7:07:01<1:30:08,  2.14s/it][A
Training...:  82% 11381/13907 [7:07:03<1:28:42,  2.11s/it][A
Training...:  82% 11382/13907 [7:07:05<1:26:40,  2.06s/it][A
Training...:  82% 11383/13907 [7:07:07<1:24:53,  2.02s/it][A
Training...:  82% 11384/13907 [7:07:09<1:23:09,  1.98s/it][A
Training...:  82% 11385/13907 [7:07:11<1:22:00,  1.95s/it][A
Training...:  82% 11386/13907 [7:07:12<1:20:34,  1.92s/it][A
Training...:  82% 11387/13907 [7:07:14<1:19:11,  1.89s/it][A
Training...:  82% 11388/13907 [7:07:16<1:17:29,  1.85s/it][A
Training...:  82% 11389/13907 [7:07:18<1:16:08,  1.81s/it][A
Training...:  82% 11390/13907 [7:07:19<1:14:30,  1.78s/it][A
Training...:  82% 11391/13907 [7:07:21<1:12:49,  1.74s/it][A
Training...:  82% 11392/13907 [7:07:23<1:11:14,  1.70s/it][A
Training...:  82% 11393/13907 [7:07:24<1:09:55,  1.67s/it][A
Training...:  82% 11394/13907 [7:07:26<1:08:30,  1.64s/it][A
Training...:  82% 11395/13907 [7:07:28<1:08:32,  1.64s/it][A
Training...:  82% 11396/13907 [7:07:29<1:07:23,  1.61s/it][A
Training...:  82% 11397/13907 [7:07:31<1:05:43,  1.57s/it][A
Training...:  82% 11398/13907 [7:07:32<1:03:37,  1.52s/it][A
Training...:  82% 11399/13907 [7:07:33<1:00:55,  1.46s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:07:47<?, ?it/s]
Training...:  82% 11399/13907 [7:07:35<1:00:55,  1.46s/it][A
Training...:  82% 11400/13907 [7:07:35<59:37,  1.43s/it]  [A
Training...:  82% 11401/13907 [7:07:39<1:32:25,  2.21s/it][A
Training...:  82% 11402/13907 [7:07:42<1:50:19,  2.64s/it][A
Training...:  82% 11403/13907 [7:07:46<2:00:19,  2.88s/it][A
Training...:  82% 11404/13907 [7:07:49<2:05:14,  3.00s/it][A
Training...:  82% 11405/13907 [7:07:52<2:07:58,  3.07s/it][A
Training...:  82% 11406/13907 [7:07:55<2:08:24,  3.08s/it][A
Training...:  82% 11407/13907 [7:07:58<2:08:18,  3.08s/it][A
Training...:  82% 11408/13907 [7:08:01<2:06:42,  3.04s/it][A
Training...:  82% 11409/13907 [7:08:04<2:05:36,  3.02s/it][A
Training...:  82% 11410/13907 [7:08:07<2:03:43,  2.97s/it][A
Training...:  82% 11411/13907 [7:08:10<2:01:59,  2.93s/it][A
Training...:  82% 11412/13907 [7:08:13<1:59:36,  2.88s/it][A
Training...:  82% 11413/13907 [7:08:16<1:59:00,  2.86s/it][A
Training...:  82% 11414/13907 [7:08:18<1:56:58,  2.82s/it][A
Training...:  82% 11415/13907 [7:08:21<1:55:08,  2.77s/it][A
Training...:  82% 11416/13907 [7:08:24<1:53:36,  2.74s/it][A
Training...:  82% 11417/13907 [7:08:26<1:53:31,  2.74s/it][A
Training...:  82% 11418/13907 [7:08:29<1:51:42,  2.69s/it][A
Training...:  82% 11419/13907 [7:08:32<1:50:13,  2.66s/it][A
Training...:  82% 11420/13907 [7:08:34<1:48:36,  2.62s/it][A
Training...:  82% 11421/13907 [7:08:37<1:46:02,  2.56s/it][A
Training...:  82% 11422/13907 [7:08:39<1:45:03,  2.54s/it][A
Training...:  82% 11423/13907 [7:08:42<1:44:24,  2.52s/it][A
Training...:  82% 11424/13907 [7:08:44<1:42:36,  2.48s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:08:59<?, ?it/s]
Training...:  82% 11424/13907 [7:08:47<1:42:36,  2.48s/it][A
Training...:  82% 11425/13907 [7:08:47<1:44:44,  2.53s/it][A
Training...:  82% 11426/13907 [7:08:49<1:42:07,  2.47s/it][A
Training...:  82% 11427/13907 [7:08:51<1:38:52,  2.39s/it][A
Training...:  82% 11428/13907 [7:08:53<1:37:10,  2.35s/it][A
Training...:  82% 11429/13907 [7:08:55<1:33:47,  2.27s/it][A
Training...:  82% 11430/13907 [7:08:57<1:30:28,  2.19s/it][A
Training...:  82% 11431/13907 [7:08:59<1:28:01,  2.13s/it][A
Training...:  82% 11432/13907 [7:09:01<1:25:48,  2.08s/it][A
Training...:  82% 11433/13907 [7:09:03<1:24:29,  2.05s/it][A
Training...:  82% 11434/13907 [7:09:05<1:22:40,  2.01s/it][A
Training...:  82% 11435/13907 [7:09:07<1:20:55,  1.96s/it][A
Training...:  82% 11436/13907 [7:09:09<1:19:19,  1.93s/it][A
Training...:  82% 11437/13907 [7:09:11<1:17:49,  1.89s/it][A
Training...:  82% 11438/13907 [7:09:13<1:16:31,  1.86s/it][A
Training...:  82% 11439/13907 [7:09:14<1:15:07,  1.83s/it][A
Training...:  82% 11440/13907 [7:09:16<1:13:53,  1.80s/it][A
Training...:  82% 11441/13907 [7:09:18<1:12:30,  1.76s/it][A
Training...:  82% 11442/13907 [7:09:19<1:10:56,  1.73s/it][A
Training...:  82% 11443/13907 [7:09:21<1:09:25,  1.69s/it][A
Training...:  82% 11444/13907 [7:09:23<1:07:57,  1.66s/it][A
Training...:  82% 11445/13907 [7:09:24<1:06:11,  1.61s/it][A
Training...:  82% 11446/13907 [7:09:26<1:04:26,  1.57s/it][A
Training...:  82% 11447/13907 [7:09:27<1:02:23,  1.52s/it][A
Training...:  82% 11448/13907 [7:09:28<1:00:16,  1.47s/it][A
Training...:  82% 11449/13907 [7:09:30<57:34,  1.41s/it]  [A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:09:43<?, ?it/s]
Training...:  82% 11449/13907 [7:09:31<57:34,  1.41s/it][A
Training...:  82% 11450/13907 [7:09:31<55:58,  1.37s/it][A
Training...:  82% 11451/13907 [7:09:35<1:26:48,  2.12s/it][A
Training...:  82% 11452/13907 [7:09:38<1:43:59,  2.54s/it][A
Training...:  82% 11453/13907 [7:09:42<1:53:03,  2.76s/it][A
Training...:  82% 11454/13907 [7:09:45<1:57:44,  2.88s/it][A
Training...:  82% 11455/13907 [7:09:48<1:59:57,  2.94s/it][A
Training...:  82% 11456/13907 [7:09:51<2:00:35,  2.95s/it][A
Training...:  82% 11457/13907 [7:09:54<2:01:59,  2.99s/it][A
Training...:  82% 11458/13907 [7:09:57<2:01:45,  2.98s/it][A
Training...:  82% 11459/13907 [7:10:00<1:59:55,  2.94s/it][A
Training...:  82% 11460/13907 [7:10:02<1:57:51,  2.89s/it][A
Training...:  82% 11461/13907 [7:10:05<1:56:09,  2.85s/it][A
Training...:  82% 11462/13907 [7:10:08<1:54:00,  2.80s/it][A
Training...:  82% 11463/13907 [7:10:11<1:53:07,  2.78s/it][A
Training...:  82% 11464/13907 [7:10:13<1:50:55,  2.72s/it][A
Training...:  82% 11465/13907 [7:10:16<1:48:56,  2.68s/it][A
Training...:  82% 11466/13907 [7:10:18<1:47:08,  2.63s/it][A
Training...:  82% 11467/13907 [7:10:21<1:45:33,  2.60s/it][A
Training...:  82% 11468/13907 [7:10:23<1:44:04,  2.56s/it][A
Training...:  82% 11469/13907 [7:10:26<1:42:56,  2.53s/it][A
Training...:  82% 11470/13907 [7:10:28<1:41:28,  2.50s/it][A
Training...:  82% 11471/13907 [7:10:31<1:40:18,  2.47s/it][A
Training...:  82% 11472/13907 [7:10:33<1:39:16,  2.45s/it][A
Training...:  82% 11473/13907 [7:10:35<1:38:00,  2.42s/it][A
Training...:  83% 11474/13907 [7:10:38<1:36:31,  2.38s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:10:52<?, ?it/s]
Training...:  83% 11474/13907 [7:10:40<1:36:31,  2.38s/it][A
Training...:  83% 11475/13907 [7:10:40<1:38:40,  2.43s/it][A
Training...:  83% 11476/13907 [7:10:42<1:36:07,  2.37s/it][A
Training...:  83% 11477/13907 [7:10:44<1:33:26,  2.31s/it][A
Training...:  83% 11478/13907 [7:10:47<1:30:58,  2.25s/it][A
Training...:  83% 11479/13907 [7:10:49<1:29:05,  2.20s/it][A
Training...:  83% 11480/13907 [7:10:51<1:27:20,  2.16s/it][A
Training...:  83% 11481/13907 [7:10:53<1:25:37,  2.12s/it][A
Training...:  83% 11482/13907 [7:10:55<1:24:18,  2.09s/it][A
Training...:  83% 11483/13907 [7:10:57<1:22:31,  2.04s/it][A
Training...:  83% 11484/13907 [7:10:59<1:21:08,  2.01s/it][A
Training...:  83% 11485/13907 [7:11:01<1:20:06,  1.98s/it][A
Training...:  83% 11486/13907 [7:11:02<1:18:41,  1.95s/it][A
Training...:  83% 11487/13907 [7:11:04<1:17:07,  1.91s/it][A
Training...:  83% 11488/13907 [7:11:06<1:15:35,  1.88s/it][A
Training...:  83% 11489/13907 [7:11:08<1:13:59,  1.84s/it][A
Training...:  83% 11490/13907 [7:11:09<1:12:12,  1.79s/it][A
Training...:  83% 11491/13907 [7:11:11<1:10:34,  1.75s/it][A
Training...:  83% 11492/13907 [7:11:13<1:08:55,  1.71s/it][A
Training...:  83% 11493/13907 [7:11:14<1:07:17,  1.67s/it][A
Training...:  83% 11494/13907 [7:11:16<1:05:50,  1.64s/it][A
Training...:  83% 11495/13907 [7:11:17<1:04:05,  1.59s/it][A
Training...:  83% 11496/13907 [7:11:19<1:02:08,  1.55s/it][A
Training...:  83% 11497/13907 [7:11:20<1:00:00,  1.49s/it][A
Training...:  83% 11498/13907 [7:11:22<57:37,  1.44s/it]  [A
Training...:  83% 11499/13907 [7:11:23<54:50,  1.37s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:11:36<?, ?it/s]
Training...:  83% 11499/13907 [7:11:24<54:50,  1.37s/it][A
Training...:  83% 11500/13907 [7:11:24<53:54,  1.34s/it][A
Training...:  83% 11501/13907 [7:11:28<1:24:19,  2.10s/it][A
Training...:  83% 11502/13907 [7:11:31<1:41:23,  2.53s/it][A
Training...:  83% 11503/13907 [7:11:35<1:52:30,  2.81s/it][A
Training...:  83% 11504/13907 [7:11:38<1:57:08,  2.92s/it][A
Training...:  83% 11505/13907 [7:11:41<1:59:09,  2.98s/it][A
Training...:  83% 11506/13907 [7:11:44<1:59:14,  2.98s/it][A
Training...:  83% 11507/13907 [7:11:47<1:58:17,  2.96s/it][A
Training...:  83% 11508/13907 [7:11:50<1:57:11,  2.93s/it][A
Training...:  83% 11509/13907 [7:11:53<1:55:51,  2.90s/it][A
Training...:  83% 11510/13907 [7:11:56<1:54:20,  2.86s/it][A
Training...:  83% 11511/13907 [7:11:58<1:52:19,  2.81s/it][A
Training...:  83% 11512/13907 [7:12:01<1:50:19,  2.76s/it][A
Training...:  83% 11513/13907 [7:12:04<1:49:12,  2.74s/it][A
Training...:  83% 11514/13907 [7:12:06<1:47:33,  2.70s/it][A
Training...:  83% 11515/13907 [7:12:09<1:45:33,  2.65s/it][A
Training...:  83% 11516/13907 [7:12:11<1:43:34,  2.60s/it][A
Training...:  83% 11517/13907 [7:12:14<1:41:40,  2.55s/it][A
Training...:  83% 11518/13907 [7:12:16<1:40:19,  2.52s/it][A
Training...:  83% 11519/13907 [7:12:18<1:38:43,  2.48s/it][A
Training...:  83% 11520/13907 [7:12:21<1:37:14,  2.44s/it][A
Training...:  83% 11521/13907 [7:12:23<1:36:55,  2.44s/it][A
Training...:  83% 11522/13907 [7:12:26<1:35:38,  2.41s/it][A
Training...:  83% 11523/13907 [7:12:28<1:34:08,  2.37s/it][A
Training...:  83% 11524/13907 [7:12:30<1:32:36,  2.33s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:12:45<?, ?it/s]
Training...:  83% 11524/13907 [7:12:33<1:32:36,  2.33s/it][A
Training...:  83% 11525/13907 [7:12:33<1:34:33,  2.38s/it][A
Training...:  83% 11526/13907 [7:12:35<1:33:01,  2.34s/it][A
Training...:  83% 11527/13907 [7:12:37<1:30:36,  2.28s/it][A
Training...:  83% 11528/13907 [7:12:39<1:28:42,  2.24s/it][A
Training...:  83% 11529/13907 [7:12:41<1:26:43,  2.19s/it][A
Training...:  83% 11530/13907 [7:12:43<1:24:49,  2.14s/it][A
Training...:  83% 11531/13907 [7:12:45<1:23:04,  2.10s/it][A
Training...:  83% 11532/13907 [7:12:47<1:21:37,  2.06s/it][A
Training...:  83% 11533/13907 [7:12:49<1:20:25,  2.03s/it][A
Training...:  83% 11534/13907 [7:12:51<1:18:59,  2.00s/it][A
Training...:  83% 11535/13907 [7:12:53<1:17:39,  1.96s/it][A
Training...:  83% 11536/13907 [7:12:55<1:16:07,  1.93s/it][A
Training...:  83% 11537/13907 [7:12:57<1:14:48,  1.89s/it][A
Training...:  83% 11538/13907 [7:12:58<1:13:36,  1.86s/it][A
Training...:  83% 11539/13907 [7:13:00<1:12:04,  1.83s/it][A
Training...:  83% 11540/13907 [7:13:02<1:10:34,  1.79s/it][A
Training...:  83% 11541/13907 [7:13:04<1:09:10,  1.75s/it][A
Training...:  83% 11542/13907 [7:13:05<1:07:46,  1.72s/it][A
Training...:  83% 11543/13907 [7:13:07<1:06:28,  1.69s/it][A
Training...:  83% 11544/13907 [7:13:08<1:05:08,  1.65s/it][A
Training...:  83% 11545/13907 [7:13:10<1:03:28,  1.61s/it][A
Training...:  83% 11546/13907 [7:13:11<1:01:16,  1.56s/it][A
Training...:  83% 11547/13907 [7:13:13<59:15,  1.51s/it]  [A
Training...:  83% 11548/13907 [7:13:14<56:54,  1.45s/it][A
Training...:  83% 11549/13907 [7:13:15<54:26,  1.39s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:13:29<?, ?it/s]
Training...:  83% 11549/13907 [7:13:16<54:26,  1.39s/it][A
Training...:  83% 11550/13907 [7:13:16<53:09,  1.35s/it][A
Training...:  83% 11551/13907 [7:13:20<1:23:55,  2.14s/it][A
Training...:  83% 11552/13907 [7:13:24<1:39:50,  2.54s/it][A
Training...:  83% 11553/13907 [7:13:27<1:48:43,  2.77s/it][A
Training...:  83% 11554/13907 [7:13:30<1:53:30,  2.89s/it][A
Training...:  83% 11555/13907 [7:13:33<1:55:03,  2.94s/it][A
Training...:  83% 11556/13907 [7:13:36<1:55:29,  2.95s/it][A
Training...:  83% 11557/13907 [7:13:39<1:54:34,  2.93s/it][A
Training...:  83% 11558/13907 [7:13:42<1:53:30,  2.90s/it][A
Training...:  83% 11559/13907 [7:13:45<1:51:56,  2.86s/it][A
Training...:  83% 11560/13907 [7:13:48<1:50:58,  2.84s/it][A
Training...:  83% 11561/13907 [7:13:50<1:49:07,  2.79s/it][A
Training...:  83% 11562/13907 [7:13:53<1:47:36,  2.75s/it][A
Training...:  83% 11563/13907 [7:13:56<1:45:24,  2.70s/it][A
Training...:  83% 11564/13907 [7:13:58<1:44:16,  2.67s/it][A
Training...:  83% 11565/13907 [7:14:01<1:43:07,  2.64s/it][A
Training...:  83% 11566/13907 [7:14:03<1:41:32,  2.60s/it][A
Training...:  83% 11567/13907 [7:14:06<1:39:49,  2.56s/it][A
Training...:  83% 11568/13907 [7:14:08<1:37:57,  2.51s/it][A
Training...:  83% 11569/13907 [7:14:11<1:36:36,  2.48s/it][A
Training...:  83% 11570/13907 [7:14:13<1:35:27,  2.45s/it][A
Training...:  83% 11571/13907 [7:14:15<1:34:05,  2.42s/it][A
Training...:  83% 11572/13907 [7:14:18<1:32:29,  2.38s/it][A
Training...:  83% 11573/13907 [7:14:20<1:31:06,  2.34s/it][A
Training...:  83% 11574/13907 [7:14:22<1:29:37,  2.30s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:14:37<?, ?it/s]
Training...:  83% 11574/13907 [7:14:25<1:29:37,  2.30s/it][A
Training...:  83% 11575/13907 [7:14:25<1:32:02,  2.37s/it][A
Training...:  83% 11576/13907 [7:14:27<1:30:13,  2.32s/it][A
Training...:  83% 11577/13907 [7:14:29<1:27:44,  2.26s/it][A
Training...:  83% 11578/13907 [7:14:31<1:25:44,  2.21s/it][A
Training...:  83% 11579/13907 [7:14:33<1:23:56,  2.16s/it][A
Training...:  83% 11580/13907 [7:14:35<1:22:29,  2.13s/it][A
Training...:  83% 11581/13907 [7:14:37<1:21:21,  2.10s/it][A
Training...:  83% 11582/13907 [7:14:39<1:19:30,  2.05s/it][A
Training...:  83% 11583/13907 [7:14:41<1:18:08,  2.02s/it][A
Training...:  83% 11584/13907 [7:14:43<1:16:43,  1.98s/it][A
Training...:  83% 11585/13907 [7:14:45<1:15:19,  1.95s/it][A
Training...:  83% 11586/13907 [7:14:47<1:14:09,  1.92s/it][A
Training...:  83% 11587/13907 [7:14:48<1:12:49,  1.88s/it][A
Training...:  83% 11588/13907 [7:14:50<1:11:29,  1.85s/it][A
Training...:  83% 11589/13907 [7:14:52<1:10:07,  1.81s/it][A
Training...:  83% 11590/13907 [7:14:54<1:08:51,  1.78s/it][A
Training...:  83% 11591/13907 [7:14:55<1:07:47,  1.76s/it][A
Training...:  83% 11592/13907 [7:14:57<1:06:29,  1.72s/it][A
Training...:  83% 11593/13907 [7:14:59<1:05:07,  1.69s/it][A
Training...:  83% 11594/13907 [7:15:00<1:03:49,  1.66s/it][A
Training...:  83% 11595/13907 [7:15:02<1:02:00,  1.61s/it][A
Training...:  83% 11596/13907 [7:15:03<1:00:06,  1.56s/it][A
Training...:  83% 11597/13907 [7:15:04<57:57,  1.51s/it]  [A
Training...:  83% 11598/13907 [7:15:06<55:48,  1.45s/it][A
Training...:  83% 11599/13907 [7:15:07<53:28,  1.39s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:15:21<?, ?it/s]
Training...:  83% 11599/13907 [7:15:08<53:28,  1.39s/it][A
Training...:  83% 11600/13907 [7:15:08<52:25,  1.36s/it][A
Training...:  83% 11601/13907 [7:15:12<1:22:47,  2.15s/it][A
Training...:  83% 11602/13907 [7:15:16<1:38:14,  2.56s/it][A
Training...:  83% 11603/13907 [7:15:19<1:46:42,  2.78s/it][A
Training...:  83% 11604/13907 [7:15:22<1:51:02,  2.89s/it][A
Training...:  83% 11605/13907 [7:15:25<1:53:16,  2.95s/it][A
Training...:  83% 11606/13907 [7:15:28<1:54:24,  2.98s/it][A
Training...:  83% 11607/13907 [7:15:31<1:54:04,  2.98s/it][A
Training...:  83% 11608/13907 [7:15:34<1:54:13,  2.98s/it][A
Training...:  83% 11609/13907 [7:15:37<1:52:12,  2.93s/it][A
Training...:  83% 11610/13907 [7:15:40<1:49:54,  2.87s/it][A
Training...:  83% 11611/13907 [7:15:43<1:47:33,  2.81s/it][A
Training...:  83% 11612/13907 [7:15:45<1:45:19,  2.75s/it][A
Training...:  84% 11613/13907 [7:15:48<1:43:02,  2.70s/it][A
Training...:  84% 11614/13907 [7:15:50<1:41:09,  2.65s/it][A
Training...:  84% 11615/13907 [7:15:53<1:39:02,  2.59s/it][A
Training...:  84% 11616/13907 [7:15:55<1:37:24,  2.55s/it][A
Training...:  84% 11617/13907 [7:15:58<1:35:55,  2.51s/it][A
Training...:  84% 11618/13907 [7:16:00<1:34:19,  2.47s/it][A
Training...:  84% 11619/13907 [7:16:02<1:32:53,  2.44s/it][A
Training...:  84% 11620/13907 [7:16:05<1:31:43,  2.41s/it][A
Training...:  84% 11621/13907 [7:16:07<1:30:31,  2.38s/it][A
Training...:  84% 11622/13907 [7:16:09<1:29:16,  2.34s/it][A
Training...:  84% 11623/13907 [7:16:12<1:27:59,  2.31s/it][A
Training...:  84% 11624/13907 [7:16:14<1:26:55,  2.28s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:16:29<?, ?it/s]
Training...:  84% 11624/13907 [7:16:16<1:26:55,  2.28s/it][A
Training...:  84% 11625/13907 [7:16:16<1:29:08,  2.34s/it][A
Training...:  84% 11626/13907 [7:16:19<1:27:51,  2.31s/it][A
Training...:  84% 11627/13907 [7:16:21<1:25:35,  2.25s/it][A
Training...:  84% 11628/13907 [7:16:23<1:23:33,  2.20s/it][A
Training...:  84% 11629/13907 [7:16:25<1:21:51,  2.16s/it][A
Training...:  84% 11630/13907 [7:16:27<1:20:24,  2.12s/it][A
Training...:  84% 11631/13907 [7:16:29<1:19:12,  2.09s/it][A
Training...:  84% 11632/13907 [7:16:31<1:18:14,  2.06s/it][A
Training...:  84% 11633/13907 [7:16:33<1:17:07,  2.03s/it][A
Training...:  84% 11634/13907 [7:16:35<1:15:53,  2.00s/it][A
Training...:  84% 11635/13907 [7:16:37<1:14:20,  1.96s/it][A
Training...:  84% 11636/13907 [7:16:38<1:13:06,  1.93s/it][A
Training...:  84% 11637/13907 [7:16:40<1:11:59,  1.90s/it][A
Training...:  84% 11638/13907 [7:16:42<1:10:56,  1.88s/it][A
Training...:  84% 11639/13907 [7:16:44<1:09:23,  1.84s/it][A
Training...:  84% 11640/13907 [7:16:46<1:07:58,  1.80s/it][A
Training...:  84% 11641/13907 [7:16:47<1:06:17,  1.76s/it][A
Training...:  84% 11642/13907 [7:16:49<1:04:37,  1.71s/it][A
Training...:  84% 11643/13907 [7:16:50<1:03:17,  1.68s/it][A
Training...:  84% 11644/13907 [7:16:52<1:02:11,  1.65s/it][A
Training...:  84% 11645/13907 [7:16:53<1:00:12,  1.60s/it][A
Training...:  84% 11646/13907 [7:16:55<58:12,  1.54s/it]  [A
Training...:  84% 11647/13907 [7:16:56<56:04,  1.49s/it][A
Training...:  84% 11648/13907 [7:16:58<54:16,  1.44s/it][A
Training...:  84% 11649/13907 [7:16:59<52:02,  1.38s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:17:12<?, ?it/s]
Training...:  84% 11649/13907 [7:17:00<52:02,  1.38s/it][A
Training...:  84% 11650/13907 [7:17:00<50:36,  1.35s/it][A
Training...:  84% 11651/13907 [7:17:04<1:18:59,  2.10s/it][A
Training...:  84% 11652/13907 [7:17:07<1:34:12,  2.51s/it][A
Training...:  84% 11653/13907 [7:17:11<1:43:49,  2.76s/it][A
Training...:  84% 11654/13907 [7:17:14<1:47:45,  2.87s/it][A
Training...:  84% 11655/13907 [7:17:17<1:49:36,  2.92s/it][A
Training...:  84% 11656/13907 [7:17:20<1:49:38,  2.92s/it][A
Training...:  84% 11657/13907 [7:17:23<1:49:23,  2.92s/it][A
Training...:  84% 11658/13907 [7:17:26<1:48:39,  2.90s/it][A
Training...:  84% 11659/13907 [7:17:28<1:47:13,  2.86s/it][A
Training...:  84% 11660/13907 [7:17:31<1:45:15,  2.81s/it][A
Training...:  84% 11661/13907 [7:17:34<1:44:16,  2.79s/it][A
Training...:  84% 11662/13907 [7:17:36<1:42:23,  2.74s/it][A
Training...:  84% 11663/13907 [7:17:39<1:40:52,  2.70s/it][A
Training...:  84% 11664/13907 [7:17:42<1:39:04,  2.65s/it][A
Training...:  84% 11665/13907 [7:17:44<1:37:33,  2.61s/it][A
Training...:  84% 11666/13907 [7:17:47<1:35:33,  2.56s/it][A
Training...:  84% 11667/13907 [7:17:49<1:34:00,  2.52s/it][A
Training...:  84% 11668/13907 [7:17:51<1:32:32,  2.48s/it][A
Training...:  84% 11669/13907 [7:17:54<1:31:28,  2.45s/it][A
Training...:  84% 11670/13907 [7:17:56<1:30:12,  2.42s/it][A
Training...:  84% 11671/13907 [7:17:58<1:28:58,  2.39s/it][A
Training...:  84% 11672/13907 [7:18:01<1:27:29,  2.35s/it][A
Training...:  84% 11673/13907 [7:18:03<1:26:07,  2.31s/it][A
Training...:  84% 11674/13907 [7:18:05<1:24:43,  2.28s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:18:20<?, ?it/s]
Training...:  84% 11674/13907 [7:18:08<1:24:43,  2.28s/it][A
Training...:  84% 11675/13907 [7:18:08<1:27:15,  2.35s/it][A
Training...:  84% 11676/13907 [7:18:10<1:25:23,  2.30s/it][A
Training...:  84% 11677/13907 [7:18:12<1:23:22,  2.24s/it][A
Training...:  84% 11678/13907 [7:18:14<1:21:20,  2.19s/it][A
Training...:  84% 11679/13907 [7:18:16<1:19:31,  2.14s/it][A
Training...:  84% 11680/13907 [7:18:18<1:18:02,  2.10s/it][A
Training...:  84% 11681/13907 [7:18:20<1:17:00,  2.08s/it][A
Training...:  84% 11682/13907 [7:18:22<1:16:19,  2.06s/it][A
Training...:  84% 11683/13907 [7:18:24<1:15:16,  2.03s/it][A
Training...:  84% 11684/13907 [7:18:26<1:13:56,  2.00s/it][A
Training...:  84% 11685/13907 [7:18:28<1:12:56,  1.97s/it][A
Training...:  84% 11686/13907 [7:18:30<1:11:50,  1.94s/it][A
Training...:  84% 11687/13907 [7:18:31<1:10:36,  1.91s/it][A
Training...:  84% 11688/13907 [7:18:33<1:09:29,  1.88s/it][A
Training...:  84% 11689/13907 [7:18:35<1:08:22,  1.85s/it][A
Training...:  84% 11690/13907 [7:18:37<1:07:15,  1.82s/it][A
Training...:  84% 11691/13907 [7:18:39<1:06:11,  1.79s/it][A
Training...:  84% 11692/13907 [7:18:40<1:05:03,  1.76s/it][A
Training...:  84% 11693/13907 [7:18:42<1:03:44,  1.73s/it][A
Training...:  84% 11694/13907 [7:18:44<1:02:25,  1.69s/it][A
Training...:  84% 11695/13907 [7:18:45<1:00:41,  1.65s/it][A
Training...:  84% 11696/13907 [7:18:47<59:01,  1.60s/it]  [A
Training...:  84% 11697/13907 [7:18:48<56:53,  1.54s/it][A
Training...:  84% 11698/13907 [7:18:49<54:46,  1.49s/it][A
Training...:  84% 11699/13907 [7:18:51<52:11,  1.42s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:19:04<?, ?it/s]
Training...:  84% 11699/13907 [7:18:52<52:11,  1.42s/it][A
Training...:  84% 11700/13907 [7:18:52<50:52,  1.38s/it][A
Training...:  84% 11701/13907 [7:18:56<1:17:51,  2.12s/it][A
Training...:  84% 11702/13907 [7:18:59<1:32:56,  2.53s/it][A
Training...:  84% 11703/13907 [7:19:02<1:40:27,  2.73s/it][A
Training...:  84% 11704/13907 [7:19:06<1:44:33,  2.85s/it][A
Training...:  84% 11705/13907 [7:19:09<1:46:13,  2.89s/it][A
Training...:  84% 11706/13907 [7:19:11<1:46:22,  2.90s/it][A
Training...:  84% 11707/13907 [7:19:14<1:46:15,  2.90s/it][A
Training...:  84% 11708/13907 [7:19:17<1:45:09,  2.87s/it][A
Training...:  84% 11709/13907 [7:19:20<1:43:37,  2.83s/it][A
Training...:  84% 11710/13907 [7:19:23<1:42:20,  2.79s/it][A
Training...:  84% 11711/13907 [7:19:25<1:40:45,  2.75s/it][A
Training...:  84% 11712/13907 [7:19:28<1:38:49,  2.70s/it][A
Training...:  84% 11713/13907 [7:19:30<1:37:13,  2.66s/it][A
Training...:  84% 11714/13907 [7:19:33<1:35:40,  2.62s/it][A
Training...:  84% 11715/13907 [7:19:35<1:34:33,  2.59s/it][A
Training...:  84% 11716/13907 [7:19:38<1:33:07,  2.55s/it][A
Training...:  84% 11717/13907 [7:19:40<1:32:14,  2.53s/it][A
Training...:  84% 11718/13907 [7:19:43<1:30:55,  2.49s/it][A
Training...:  84% 11719/13907 [7:19:45<1:30:03,  2.47s/it][A
Training...:  84% 11720/13907 [7:19:48<1:29:29,  2.46s/it][A
Training...:  84% 11721/13907 [7:19:50<1:28:38,  2.43s/it][A
Training...:  84% 11722/13907 [7:19:52<1:27:07,  2.39s/it][A
Training...:  84% 11723/13907 [7:19:55<1:25:27,  2.35s/it][A
Training...:  84% 11724/13907 [7:19:57<1:24:15,  2.32s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:20:12<?, ?it/s]
Training...:  84% 11724/13907 [7:19:59<1:24:15,  2.32s/it][A
Training...:  84% 11725/13907 [7:19:59<1:26:28,  2.38s/it][A
Training...:  84% 11726/13907 [7:20:02<1:24:52,  2.33s/it][A
Training...:  84% 11727/13907 [7:20:04<1:22:47,  2.28s/it][A
Training...:  84% 11728/13907 [7:20:06<1:20:51,  2.23s/it][A
Training...:  84% 11729/13907 [7:20:08<1:19:23,  2.19s/it][A
Training...:  84% 11730/13907 [7:20:10<1:18:02,  2.15s/it][A
Training...:  84% 11731/13907 [7:20:12<1:16:49,  2.12s/it][A
Training...:  84% 11732/13907 [7:20:14<1:15:13,  2.08s/it][A
Training...:  84% 11733/13907 [7:20:16<1:14:06,  2.05s/it][A
Training...:  84% 11734/13907 [7:20:18<1:12:46,  2.01s/it][A
Training...:  84% 11735/13907 [7:20:20<1:11:13,  1.97s/it][A
Training...:  84% 11736/13907 [7:20:22<1:09:56,  1.93s/it][A
Training...:  84% 11737/13907 [7:20:23<1:08:37,  1.90s/it][A
Training...:  84% 11738/13907 [7:20:25<1:07:24,  1.86s/it][A
Training...:  84% 11739/13907 [7:20:27<1:06:06,  1.83s/it][A
Training...:  84% 11740/13907 [7:20:29<1:04:41,  1.79s/it][A
Training...:  84% 11741/13907 [7:20:30<1:04:34,  1.79s/it][A
Training...:  84% 11742/13907 [7:20:32<1:02:52,  1.74s/it][A
Training...:  84% 11743/13907 [7:20:34<1:01:18,  1.70s/it][A
Training...:  84% 11744/13907 [7:20:35<59:54,  1.66s/it]  [A
Training...:  84% 11745/13907 [7:20:37<58:11,  1.61s/it][A
Training...:  84% 11746/13907 [7:20:38<56:19,  1.56s/it][A
Training...:  84% 11747/13907 [7:20:40<54:05,  1.50s/it][A
Training...:  84% 11748/13907 [7:20:41<52:01,  1.45s/it][A
Training...:  84% 11749/13907 [7:20:42<49:38,  1.38s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:20:56<?, ?it/s]
Training...:  84% 11749/13907 [7:20:43<49:38,  1.38s/it][A
Training...:  84% 11750/13907 [7:20:43<48:21,  1.35s/it][AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |)
Step... (10025 | Loss: 0.28512170910835266, Learning Rate: 0.00024227879475802183, Gradient Norm: 0.9364982843399048)
Step... (10050 | Loss: 0.3564455211162567, Learning Rate: 0.00024212728021666408, Gradient Norm: 1.604210615158081)
Step... (10075 | Loss: 0.21322369575500488, Learning Rate: 0.00024197576567530632, Gradient Norm: 1.0115269422531128)
Step... (10100 | Loss: 0.3939068913459778, Learning Rate: 0.00024182425113394856, Gradient Norm: 1.4211947917938232)
Step... (10125 | Loss: 0.2976307272911072, Learning Rate: 0.0002416727365925908, Gradient Norm: 1.0097569227218628)
Step... (10150 | Loss: 0.38568490743637085, Learning Rate: 0.00024152122205123305, Gradient Norm: 1.922451376914978)
Step... (10175 | Loss: 0.31057560443878174, Learning Rate: 0.0002413697075098753, Gradient Norm: 1.2705118656158447)
Step... (10200 | Loss: 0.3509364724159241, Learning Rate: 0.0002412181784166023, Gradient Norm: 1.638836145401001)
Step... (10225 | Loss: 0.2683131694793701, Learning Rate: 0.00024106667842715979, Gradient Norm: 0.8944661617279053)
Step... (10250 | Loss: 0.45493006706237793, Learning Rate: 0.00024091516388580203, Gradient Norm: 2.130521774291992)
Step... (10275 | Loss: 0.3018870949745178, Learning Rate: 0.00024076363479252905, Gradient Norm: 1.0796616077423096)
Step... (10300 | Loss: 0.3080269694328308, Learning Rate: 0.00024061213480308652, Gradient Norm: 1.4850819110870361)
Step... (10325 | Loss: 0.2636061906814575, Learning Rate: 0.00024046062026172876, Gradient Norm: 0.944359540939331)
Step... (10350 | Loss: 0.47434332966804504, Learning Rate: 0.00024030909116845578, Gradient Norm: 2.364464044570923)
Step... (10375 | Loss: 0.2699946463108063, Learning Rate: 0.00024015759117901325, Gradient Norm: 0.889255166053772)
Step... (10400 | Loss: 0.32487958669662476, Learning Rate: 0.0002400060766376555, Gradient Norm: 1.9227056503295898)
Step... (10425 | Loss: 0.3049437701702118, Learning Rate: 0.0002398545475443825, Gradient Norm: 0.9910764694213867)
Step... (10450 | Loss: 0.5077496767044067, Learning Rate: 0.00023970304755493999, Gradient Norm: 2.3357319831848145)
Step... (10475 | Loss: 0.3272961974143982, Learning Rate: 0.00023955153301358223, Gradient Norm: 1.1657016277313232)
Step... (10500 | Loss: 19.925029754638672, Learning Rate: 0.00023940000392030925, Gradient Norm: 1.697110891342163)
Step... (10525 | Loss: 0.23977772891521454, Learning Rate: 0.0002392484893789515, Gradient Norm: 0.8774819374084473)
Step... (10550 | Loss: 0.376512348651886, Learning Rate: 0.00023909698938950896, Gradient Norm: 1.664048671722412)
Step... (10575 | Loss: 0.31252121925354004, Learning Rate: 0.00023894546029623598, Gradient Norm: 0.9173030853271484)
Step... (10600 | Loss: 0.5726463794708252, Learning Rate: 0.00023879394575487822, Gradient Norm: 2.838994026184082)
Step... (10625 | Loss: 0.326903760433197, Learning Rate: 0.0002386424457654357, Gradient Norm: 1.03639817237854)
Step... (10650 | Loss: 0.35011258721351624, Learning Rate: 0.0002384909166721627, Gradient Norm: 2.064307928085327)
Step... (10675 | Loss: 0.31581631302833557, Learning Rate: 0.00023833940213080496, Gradient Norm: 0.970822274684906)
Step... (10700 | Loss: 0.3621583580970764, Learning Rate: 0.00023818790214136243, Gradient Norm: 1.8620284795761108)
Step... (10725 | Loss: 0.30137258768081665, Learning Rate: 0.00023803637304808944, Gradient Norm: 1.111262559890747)
Step... (10750 | Loss: 0.46350306272506714, Learning Rate: 0.0002378848585067317, Gradient Norm: 1.5580511093139648)
Step... (10775 | Loss: 0.31384286284446716, Learning Rate: 0.00023773335851728916, Gradient Norm: 1.110449194908142)
Step... (10800 | Loss: 20.89573860168457, Learning Rate: 0.00023758182942401618, Gradient Norm: 1.487768292427063)
Step... (10825 | Loss: 0.3315330743789673, Learning Rate: 0.00023743031488265842, Gradient Norm: 1.046431064605713)
Step... (10850 | Loss: 0.42897552251815796, Learning Rate: 0.00023727880034130067, Gradient Norm: 2.8078644275665283)
Step... (10875 | Loss: 0.28783848881721497, Learning Rate: 0.0002371272857999429, Gradient Norm: 0.9686294794082642)
Step... (10900 | Loss: 0.4291156530380249, Learning Rate: 0.00023697577125858516, Gradient Norm: 1.7362785339355469)
Step... (10925 | Loss: 0.3309996724128723, Learning Rate: 0.0002368242567172274, Gradient Norm: 0.9189126491546631)
Step... (10950 | Loss: 0.3546411097049713, Learning Rate: 0.00023667272762395442, Gradient Norm: 1.7032374143600464)
Step... (10975 | Loss: 0.25050532817840576, Learning Rate: 0.0002365212276345119, Gradient Norm: 1.2066245079040527)
Step... (11000 | Loss: 0.47386252880096436, Learning Rate: 0.00023636971309315413, Gradient Norm: 2.165451765060425)
Step... (11025 | Loss: 0.24378937482833862, Learning Rate: 0.00023621818399988115, Gradient Norm: 0.873253345489502)
Step... (11050 | Loss: 0.29087400436401367, Learning Rate: 0.00023606668401043862, Gradient Norm: 1.8997962474822998)
Step... (11075 | Loss: 0.3068019151687622, Learning Rate: 0.00023591516946908087, Gradient Norm: 0.8631746768951416)
Step... (11100 | Loss: 0.4332331717014313, Learning Rate: 0.00023576364037580788, Gradient Norm: 2.100006341934204)
Step... (11125 | Loss: 0.2928539216518402, Learning Rate: 0.00023561214038636535, Gradient Norm: 0.8824319243431091)
Step... (11150 | Loss: 0.2920592427253723, Learning Rate: 0.0002354606258450076, Gradient Norm: 1.8037636280059814)
Step... (11175 | Loss: 0.2914584279060364, Learning Rate: 0.00023530909675173461, Gradient Norm: 0.8474386930465698)
Step... (11200 | Loss: 0.6470805406570435, Learning Rate: 0.0002351575967622921, Gradient Norm: 4.070619583129883)
Step... (11225 | Loss: 0.26200443506240845, Learning Rate: 0.00023500608222093433, Gradient Norm: 0.8933937549591064)
Step... (11250 | Loss: 0.4093053936958313, Learning Rate: 0.00023485455312766135, Gradient Norm: 1.5852245092391968)
Step... (11275 | Loss: 0.3414642810821533, Learning Rate: 0.0002347030385863036, Gradient Norm: 0.9093161821365356)
Step... (11300 | Loss: 0.36465632915496826, Learning Rate: 0.00023455153859686106, Gradient Norm: 1.2853291034698486)
Step... (11325 | Loss: 0.2970399856567383, Learning Rate: 0.00023440000950358808, Gradient Norm: 1.0172749757766724)
Step... (11350 | Loss: 0.4003063440322876, Learning Rate: 0.00023424849496223032, Gradient Norm: 2.161357879638672)
Step... (11375 | Loss: 0.24873165786266327, Learning Rate: 0.0002340969949727878, Gradient Norm: 0.8472667932510376)
Step... (11400 | Loss: 0.3490214943885803, Learning Rate: 0.0002339454658795148, Gradient Norm: 1.711737036705017)
Step... (11425 | Loss: 0.2745959758758545, Learning Rate: 0.00023379395133815706, Gradient Norm: 1.0856397151947021)
Step... (11450 | Loss: 0.37068092823028564, Learning Rate: 0.00023364245134871453, Gradient Norm: 1.9904441833496094)
Step... (11475 | Loss: 0.24682191014289856, Learning Rate: 0.00023349092225544155, Gradient Norm: 0.8861087560653687)
Step... (11500 | Loss: 0.228443905711174, Learning Rate: 0.0002333394077140838, Gradient Norm: 1.1237072944641113)
Step... (11525 | Loss: 0.3001553416252136, Learning Rate: 0.00023318790772464126, Gradient Norm: 0.9050099849700928)
Step... (11550 | Loss: 0.3557063937187195, Learning Rate: 0.00023303637863136828, Gradient Norm: 1.3495209217071533)
Step... (11575 | Loss: 0.24244190752506256, Learning Rate: 0.00023288486409001052, Gradient Norm: 0.918213963508606)
Step... (11600 | Loss: 0.3902135491371155, Learning Rate: 0.00023273333499673754, Gradient Norm: 1.6066484451293945)
Step... (11625 | Loss: 0.26231586933135986, Learning Rate: 0.000232581835007295, Gradient Norm: 1.0747255086898804)
Step... (11650 | Loss: 0.41527342796325684, Learning Rate: 0.00023243032046593726, Gradient Norm: 2.1293575763702393)
Step... (11675 | Loss: 0.3103637099266052, Learning Rate: 0.00023227879137266427, Gradient Norm: 1.1345901489257812)
Step... (11700 | Loss: 0.3348138630390167, Learning Rate: 0.00023212729138322175, Gradient Norm: 2.128854751586914)
Step... (11725 | Loss: 0.2530916631221771, Learning Rate: 0.000231975776841864, Gradient Norm: 0.8765957355499268)

Training...:  84% 11751/13907 [7:20:48<1:20:54,  2.25s/it][A
Training...:  85% 11752/13907 [7:20:51<1:36:36,  2.69s/it][A
Training...:  85% 11753/13907 [7:20:55<1:46:27,  2.97s/it][A
Training...:  85% 11754/13907 [7:20:58<1:51:41,  3.11s/it][A
Training...:  85% 11755/13907 [7:21:02<1:55:13,  3.21s/it][A
Training...:  85% 11756/13907 [7:21:05<1:56:19,  3.24s/it][A
Training...:  85% 11757/13907 [7:21:08<1:55:39,  3.23s/it][A
Training...:  85% 11758/13907 [7:21:11<1:53:14,  3.16s/it][A
Training...:  85% 11759/13907 [7:21:14<1:51:05,  3.10s/it][A
Training...:  85% 11760/13907 [7:21:17<1:49:00,  3.05s/it][A
Training...:  85% 11761/13907 [7:21:20<1:46:58,  2.99s/it][A
Training...:  85% 11762/13907 [7:21:23<1:44:52,  2.93s/it][A
Training...:  85% 11763/13907 [7:21:26<1:43:14,  2.89s/it][A
Training...:  85% 11764/13907 [7:21:28<1:40:51,  2.82s/it][A
Training...:  85% 11765/13907 [7:21:31<1:39:11,  2.78s/it][A
Training...:  85% 11766/13907 [7:21:34<1:37:44,  2.74s/it][A
Training...:  85% 11767/13907 [7:21:36<1:36:14,  2.70s/it][A
Training...:  85% 11768/13907 [7:21:39<1:34:18,  2.65s/it][A
Training...:  85% 11769/13907 [7:21:41<1:32:45,  2.60s/it][A
Training...:  85% 11770/13907 [7:21:44<1:31:15,  2.56s/it][A
Training...:  85% 11771/13907 [7:21:46<1:29:44,  2.52s/it][A
Training...:  85% 11772/13907 [7:21:49<1:28:17,  2.48s/it][A
Training...:  85% 11773/13907 [7:21:51<1:27:39,  2.46s/it][A
Training...:  85% 11774/13907 [7:21:53<1:25:59,  2.42s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:22:08<?, ?it/s]
Training...:  85% 11774/13907 [7:21:56<1:25:59,  2.42s/it][A
Training...:  85% 11775/13907 [7:21:56<1:27:55,  2.47s/it][A
Training...:  85% 11776/13907 [7:21:58<1:27:24,  2.46s/it][A
Training...:  85% 11777/13907 [7:22:01<1:25:37,  2.41s/it][A
Training...:  85% 11778/13907 [7:22:03<1:23:17,  2.35s/it][A
Training...:  85% 11779/13907 [7:22:05<1:21:34,  2.30s/it][A
Training...:  85% 11780/13907 [7:22:07<1:19:41,  2.25s/it][A
Training...:  85% 11781/13907 [7:22:09<1:18:56,  2.23s/it][A
Training...:  85% 11782/13907 [7:22:12<1:17:42,  2.19s/it][A
Training...:  85% 11783/13907 [7:22:14<1:15:53,  2.14s/it][A
Training...:  85% 11784/13907 [7:22:16<1:13:42,  2.08s/it][A
Training...:  85% 11785/13907 [7:22:17<1:12:01,  2.04s/it][A
Training...:  85% 11786/13907 [7:22:19<1:10:17,  1.99s/it][A
Training...:  85% 11787/13907 [7:22:21<1:08:49,  1.95s/it][A
Training...:  85% 11788/13907 [7:22:23<1:07:11,  1.90s/it][A
Training...:  85% 11789/13907 [7:22:25<1:05:55,  1.87s/it][A
Training...:  85% 11790/13907 [7:22:26<1:04:23,  1.83s/it][A
Training...:  85% 11791/13907 [7:22:28<1:02:59,  1.79s/it][A
Training...:  85% 11792/13907 [7:22:30<1:02:01,  1.76s/it][A
Training...:  85% 11793/13907 [7:22:32<1:00:48,  1.73s/it][A
Training...:  85% 11794/13907 [7:22:33<59:33,  1.69s/it]  [A
Training...:  85% 11795/13907 [7:22:35<58:32,  1.66s/it][A
Training...:  85% 11796/13907 [7:22:36<56:44,  1.61s/it][A
Training...:  85% 11797/13907 [7:22:38<54:43,  1.56s/it][A
Training...:  85% 11798/13907 [7:22:39<52:32,  1.49s/it][A
Training...:  85% 11799/13907 [7:22:40<50:11,  1.43s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:22:54<?, ?it/s]
Training...:  85% 11799/13907 [7:22:42<50:11,  1.43s/it][A
Training...:  85% 11800/13907 [7:22:42<49:12,  1.40s/it][A
Training...:  85% 11801/13907 [7:22:45<1:15:11,  2.14s/it][A
Training...:  85% 11802/13907 [7:22:49<1:29:20,  2.55s/it][A
Training...:  85% 11803/13907 [7:22:52<1:36:41,  2.76s/it][A
Training...:  85% 11804/13907 [7:22:55<1:40:13,  2.86s/it][A
Training...:  85% 11805/13907 [7:22:58<1:42:08,  2.92s/it][A
Training...:  85% 11806/13907 [7:23:01<1:42:32,  2.93s/it][A
Training...:  85% 11807/13907 [7:23:04<1:41:58,  2.91s/it][A
Training...:  85% 11808/13907 [7:23:07<1:40:52,  2.88s/it][A
Training...:  85% 11809/13907 [7:23:10<1:39:24,  2.84s/it][A
Training...:  85% 11810/13907 [7:23:12<1:38:13,  2.81s/it][A
Training...:  85% 11811/13907 [7:23:15<1:36:53,  2.77s/it][A
Training...:  85% 11812/13907 [7:23:18<1:35:17,  2.73s/it][A
Training...:  85% 11813/13907 [7:23:20<1:33:46,  2.69s/it][A
Training...:  85% 11814/13907 [7:23:23<1:32:09,  2.64s/it][A
Training...:  85% 11815/13907 [7:23:25<1:30:46,  2.60s/it][A
Training...:  85% 11816/13907 [7:23:28<1:29:21,  2.56s/it][A
Training...:  85% 11817/13907 [7:23:30<1:28:29,  2.54s/it][A
Training...:  85% 11818/13907 [7:23:33<1:27:44,  2.52s/it][A
Training...:  85% 11819/13907 [7:23:35<1:26:39,  2.49s/it][A
Training...:  85% 11820/13907 [7:23:38<1:25:21,  2.45s/it][A
Training...:  85% 11821/13907 [7:23:40<1:24:17,  2.42s/it][A
Training...:  85% 11822/13907 [7:23:42<1:23:18,  2.40s/it][A
Training...:  85% 11823/13907 [7:23:45<1:21:55,  2.36s/it][A
Training...:  85% 11824/13907 [7:23:47<1:20:30,  2.32s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:24:02<?, ?it/s]
Training...:  85% 11824/13907 [7:23:49<1:20:30,  2.32s/it][A
Training...:  85% 11825/13907 [7:23:49<1:22:25,  2.38s/it][A
Training...:  85% 11826/13907 [7:23:52<1:21:03,  2.34s/it][A
Training...:  85% 11827/13907 [7:23:54<1:19:20,  2.29s/it][A
Training...:  85% 11828/13907 [7:23:56<1:18:28,  2.27s/it][A
Training...:  85% 11829/13907 [7:23:58<1:16:47,  2.22s/it][A
Training...:  85% 11830/13907 [7:24:00<1:15:11,  2.17s/it][A
Training...:  85% 11831/13907 [7:24:02<1:13:52,  2.14s/it][A
Training...:  85% 11832/13907 [7:24:04<1:12:32,  2.10s/it][A
Training...:  85% 11833/13907 [7:24:06<1:11:24,  2.07s/it][A
Training...:  85% 11834/13907 [7:24:08<1:09:56,  2.02s/it][A
Training...:  85% 11835/13907 [7:24:10<1:08:36,  1.99s/it][A
Training...:  85% 11836/13907 [7:24:12<1:07:17,  1.95s/it][A
Training...:  85% 11837/13907 [7:24:14<1:06:06,  1.92s/it][A
Training...:  85% 11838/13907 [7:24:16<1:04:49,  1.88s/it][A
Training...:  85% 11839/13907 [7:24:17<1:03:43,  1.85s/it][A
Training...:  85% 11840/13907 [7:24:19<1:02:37,  1.82s/it][A
Training...:  85% 11841/13907 [7:24:21<1:01:17,  1.78s/it][A
Training...:  85% 11842/13907 [7:24:22<59:57,  1.74s/it]  [A
Training...:  85% 11843/13907 [7:24:24<58:48,  1.71s/it][A
Training...:  85% 11844/13907 [7:24:26<57:14,  1.66s/it][A
Training...:  85% 11845/13907 [7:24:27<56:08,  1.63s/it][A
Training...:  85% 11846/13907 [7:24:29<54:22,  1.58s/it][A
Training...:  85% 11847/13907 [7:24:30<52:47,  1.54s/it][A
Training...:  85% 11848/13907 [7:24:31<50:53,  1.48s/it][A
Training...:  85% 11849/13907 [7:24:33<48:37,  1.42s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:24:46<?, ?it/s]
Training...:  85% 11849/13907 [7:24:34<48:37,  1.42s/it][A
Training...:  85% 11850/13907 [7:24:34<47:33,  1.39s/it][A
Training...:  85% 11851/13907 [7:24:38<1:13:08,  2.13s/it][A
Training...:  85% 11852/13907 [7:24:42<1:28:29,  2.58s/it][A
Training...:  85% 11853/13907 [7:24:45<1:36:02,  2.81s/it][A
Training...:  85% 11854/13907 [7:24:48<1:39:44,  2.92s/it][A
Training...:  85% 11855/13907 [7:24:51<1:41:52,  2.98s/it][A
Training...:  85% 11856/13907 [7:24:54<1:42:16,  2.99s/it][A
Training...:  85% 11857/13907 [7:24:57<1:41:41,  2.98s/it][A
Training...:  85% 11858/13907 [7:25:00<1:40:25,  2.94s/it][A
Training...:  85% 11859/13907 [7:25:03<1:38:48,  2.89s/it][A
Training...:  85% 11860/13907 [7:25:05<1:36:57,  2.84s/it][A
Training...:  85% 11861/13907 [7:25:08<1:35:06,  2.79s/it][A
Training...:  85% 11862/13907 [7:25:11<1:33:31,  2.74s/it][A
Training...:  85% 11863/13907 [7:25:13<1:32:36,  2.72s/it][A
Training...:  85% 11864/13907 [7:25:16<1:30:55,  2.67s/it][A
Training...:  85% 11865/13907 [7:25:18<1:29:01,  2.62s/it][A
Training...:  85% 11866/13907 [7:25:21<1:27:17,  2.57s/it][A
Training...:  85% 11867/13907 [7:25:23<1:26:17,  2.54s/it][A
Training...:  85% 11868/13907 [7:25:26<1:25:23,  2.51s/it][A
Training...:  85% 11869/13907 [7:25:28<1:23:59,  2.47s/it][A
Training...:  85% 11870/13907 [7:25:31<1:22:20,  2.43s/it][A
Training...:  85% 11871/13907 [7:25:33<1:21:39,  2.41s/it][A
Training...:  85% 11872/13907 [7:25:35<1:20:02,  2.36s/it][A
Training...:  85% 11873/13907 [7:25:37<1:18:35,  2.32s/it][A
Training...:  85% 11874/13907 [7:25:40<1:17:00,  2.27s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:25:54<?, ?it/s]
Training...:  85% 11874/13907 [7:25:42<1:17:00,  2.27s/it][A
Training...:  85% 11875/13907 [7:25:42<1:18:54,  2.33s/it][A
Training...:  85% 11876/13907 [7:25:44<1:17:35,  2.29s/it][A
Training...:  85% 11877/13907 [7:25:46<1:15:47,  2.24s/it][A
Training...:  85% 11878/13907 [7:25:48<1:14:06,  2.19s/it][A
Training...:  85% 11879/13907 [7:25:50<1:12:46,  2.15s/it][A
Training...:  85% 11880/13907 [7:25:53<1:12:13,  2.14s/it][A
Training...:  85% 11881/13907 [7:25:55<1:11:06,  2.11s/it][A
Training...:  85% 11882/13907 [7:25:57<1:09:49,  2.07s/it][A
Training...:  85% 11883/13907 [7:25:59<1:08:55,  2.04s/it][A
Training...:  85% 11884/13907 [7:26:00<1:07:48,  2.01s/it][A
Training...:  85% 11885/13907 [7:26:02<1:06:33,  1.98s/it][A
Training...:  85% 11886/13907 [7:26:04<1:05:22,  1.94s/it][A
Training...:  85% 11887/13907 [7:26:06<1:04:25,  1.91s/it][A
Training...:  85% 11888/13907 [7:26:08<1:03:14,  1.88s/it][A
Training...:  85% 11889/13907 [7:26:10<1:02:17,  1.85s/it][A
Training...:  85% 11890/13907 [7:26:11<1:01:06,  1.82s/it][A
Training...:  86% 11891/13907 [7:26:13<59:56,  1.78s/it]  [A
Training...:  86% 11892/13907 [7:26:15<58:40,  1.75s/it][A
Training...:  86% 11893/13907 [7:26:16<57:23,  1.71s/it][A
Training...:  86% 11894/13907 [7:26:18<56:18,  1.68s/it][A
Training...:  86% 11895/13907 [7:26:20<54:49,  1.63s/it][A
Training...:  86% 11896/13907 [7:26:21<53:32,  1.60s/it][A
Training...:  86% 11897/13907 [7:26:23<51:58,  1.55s/it][A
Training...:  86% 11898/13907 [7:26:24<49:51,  1.49s/it][A
Training...:  86% 11899/13907 [7:26:25<47:19,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:26:39<?, ?it/s]
Training...:  86% 11899/13907 [7:26:26<47:19,  1.41s/it][A
Training...:  86% 11900/13907 [7:26:26<46:08,  1.38s/it][A
Training...:  86% 11901/13907 [7:26:30<1:12:31,  2.17s/it][A
Training...:  86% 11902/13907 [7:26:34<1:26:02,  2.57s/it][A
Training...:  86% 11903/13907 [7:26:37<1:33:16,  2.79s/it][A
Training...:  86% 11904/13907 [7:26:40<1:37:07,  2.91s/it][A
Training...:  86% 11905/13907 [7:26:43<1:38:37,  2.96s/it][A
Training...:  86% 11906/13907 [7:26:46<1:38:30,  2.95s/it][A
Training...:  86% 11907/13907 [7:26:49<1:38:00,  2.94s/it][A
Training...:  86% 11908/13907 [7:26:52<1:37:38,  2.93s/it][A
Training...:  86% 11909/13907 [7:26:55<1:37:02,  2.91s/it][A
Training...:  86% 11910/13907 [7:26:58<1:35:31,  2.87s/it][A
Training...:  86% 11911/13907 [7:27:01<1:33:43,  2.82s/it][A
Training...:  86% 11912/13907 [7:27:03<1:32:18,  2.78s/it][A
Training...:  86% 11913/13907 [7:27:06<1:30:36,  2.73s/it][A
Training...:  86% 11914/13907 [7:27:08<1:28:35,  2.67s/it][A
Training...:  86% 11915/13907 [7:27:11<1:27:18,  2.63s/it][A
Training...:  86% 11916/13907 [7:27:13<1:26:14,  2.60s/it][A
Training...:  86% 11917/13907 [7:27:16<1:25:09,  2.57s/it][A
Training...:  86% 11918/13907 [7:27:18<1:24:02,  2.54s/it][A
Training...:  86% 11919/13907 [7:27:21<1:23:08,  2.51s/it][A
Training...:  86% 11920/13907 [7:27:23<1:21:46,  2.47s/it][A
Training...:  86% 11921/13907 [7:27:26<1:20:21,  2.43s/it][A
Training...:  86% 11922/13907 [7:27:28<1:19:10,  2.39s/it][A
Training...:  86% 11923/13907 [7:27:30<1:17:50,  2.35s/it][A
Training...:  86% 11924/13907 [7:27:32<1:16:30,  2.31s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:27:47<?, ?it/s]
Training...:  86% 11924/13907 [7:27:35<1:16:30,  2.31s/it][A
Training...:  86% 11925/13907 [7:27:35<1:18:43,  2.38s/it][A
Training...:  86% 11926/13907 [7:27:37<1:17:21,  2.34s/it][A
Training...:  86% 11927/13907 [7:27:39<1:15:58,  2.30s/it][A
Training...:  86% 11928/13907 [7:27:41<1:14:02,  2.24s/it][A
Training...:  86% 11929/13907 [7:27:44<1:12:31,  2.20s/it][A
Training...:  86% 11930/13907 [7:27:46<1:11:27,  2.17s/it][A
Training...:  86% 11931/13907 [7:27:48<1:10:30,  2.14s/it][A
Training...:  86% 11932/13907 [7:27:50<1:09:43,  2.12s/it][A
Training...:  86% 11933/13907 [7:27:52<1:08:29,  2.08s/it][A
Training...:  86% 11934/13907 [7:27:54<1:07:07,  2.04s/it][A
Training...:  86% 11935/13907 [7:27:56<1:05:35,  2.00s/it][A
Training...:  86% 11936/13907 [7:27:58<1:04:13,  1.96s/it][A
Training...:  86% 11937/13907 [7:27:59<1:03:11,  1.92s/it][A
Training...:  86% 11938/13907 [7:28:01<1:01:46,  1.88s/it][A
Training...:  86% 11939/13907 [7:28:03<1:00:30,  1.84s/it][A
Training...:  86% 11940/13907 [7:28:05<59:18,  1.81s/it]  [A
Training...:  86% 11941/13907 [7:28:06<58:18,  1.78s/it][A
Training...:  86% 11942/13907 [7:28:08<57:09,  1.75s/it][A
Training...:  86% 11943/13907 [7:28:10<55:49,  1.71s/it][A
Training...:  86% 11944/13907 [7:28:11<54:25,  1.66s/it][A
Training...:  86% 11945/13907 [7:28:13<53:04,  1.62s/it][A
Training...:  86% 11946/13907 [7:28:14<51:32,  1.58s/it][A
Training...:  86% 11947/13907 [7:28:16<49:53,  1.53s/it][A
Training...:  86% 11948/13907 [7:28:17<47:59,  1.47s/it][A
Training...:  86% 11949/13907 [7:28:18<46:10,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:28:32<?, ?it/s]
Training...:  86% 11949/13907 [7:28:19<46:10,  1.41s/it][A
Training...:  86% 11950/13907 [7:28:19<44:50,  1.37s/it][A
Training...:  86% 11951/13907 [7:28:23<1:08:24,  2.10s/it][A
Training...:  86% 11952/13907 [7:28:27<1:21:18,  2.50s/it][A
Training...:  86% 11953/13907 [7:28:30<1:29:00,  2.73s/it][A
Training...:  86% 11954/13907 [7:28:33<1:33:04,  2.86s/it][A
Training...:  86% 11955/13907 [7:28:36<1:35:32,  2.94s/it][A
Training...:  86% 11956/13907 [7:28:39<1:36:06,  2.96s/it][A
Training...:  86% 11957/13907 [7:28:42<1:36:13,  2.96s/it][A
Training...:  86% 11958/13907 [7:28:45<1:35:13,  2.93s/it][A
Training...:  86% 11959/13907 [7:28:48<1:34:08,  2.90s/it][A
Training...:  86% 11960/13907 [7:28:51<1:32:46,  2.86s/it][A
Training...:  86% 11961/13907 [7:28:53<1:31:26,  2.82s/it][A
Training...:  86% 11962/13907 [7:28:56<1:30:02,  2.78s/it][A
Training...:  86% 11963/13907 [7:28:59<1:28:13,  2.72s/it][A
Training...:  86% 11964/13907 [7:29:01<1:26:28,  2.67s/it][A
Training...:  86% 11965/13907 [7:29:04<1:25:27,  2.64s/it][A
Training...:  86% 11966/13907 [7:29:06<1:23:49,  2.59s/it][A
Training...:  86% 11967/13907 [7:29:09<1:22:34,  2.55s/it][A
Training...:  86% 11968/13907 [7:29:11<1:21:02,  2.51s/it][A
Training...:  86% 11969/13907 [7:29:14<1:19:30,  2.46s/it][A
Training...:  86% 11970/13907 [7:29:16<1:18:05,  2.42s/it][A
Training...:  86% 11971/13907 [7:29:18<1:16:53,  2.38s/it][A
Training...:  86% 11972/13907 [7:29:20<1:15:26,  2.34s/it][A
Training...:  86% 11973/13907 [7:29:23<1:14:05,  2.30s/it][A
Training...:  86% 11974/13907 [7:29:25<1:13:00,  2.27s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:29:40<?, ?it/s]
Training...:  86% 11974/13907 [7:29:27<1:13:00,  2.27s/it][A
Training...:  86% 11975/13907 [7:29:27<1:15:03,  2.33s/it][A
Training...:  86% 11976/13907 [7:29:29<1:13:35,  2.29s/it][A
Training...:  86% 11977/13907 [7:29:32<1:11:50,  2.23s/it][A
Training...:  86% 11978/13907 [7:29:34<1:10:38,  2.20s/it][A
Training...:  86% 11979/13907 [7:29:36<1:09:17,  2.16s/it][A
Training...:  86% 11980/13907 [7:29:38<1:07:50,  2.11s/it][A
Training...:  86% 11981/13907 [7:29:40<1:07:04,  2.09s/it][A
Training...:  86% 11982/13907 [7:29:42<1:06:15,  2.07s/it][A
Training...:  86% 11983/13907 [7:29:44<1:05:15,  2.03s/it][A
Training...:  86% 11984/13907 [7:29:46<1:04:11,  2.00s/it][A
Training...:  86% 11985/13907 [7:29:48<1:03:21,  1.98s/it][A
Training...:  86% 11986/13907 [7:29:50<1:02:57,  1.97s/it][A
Training...:  86% 11987/13907 [7:29:51<1:02:02,  1.94s/it][A
Training...:  86% 11988/13907 [7:29:53<1:00:56,  1.91s/it][A
Training...:  86% 11989/13907 [7:29:55<59:44,  1.87s/it]  [A
Training...:  86% 11990/13907 [7:29:57<58:35,  1.83s/it][A
Training...:  86% 11991/13907 [7:29:59<57:47,  1.81s/it][A
Training...:  86% 11992/13907 [7:30:00<56:33,  1.77s/it][A
Training...:  86% 11993/13907 [7:30:02<55:15,  1.73s/it][A
Training...:  86% 11994/13907 [7:30:03<53:46,  1.69s/it][A
Training...:  86% 11995/13907 [7:30:05<52:17,  1.64s/it][A
Training...:  86% 11996/13907 [7:30:06<50:51,  1.60s/it][A
Training...:  86% 11997/13907 [7:30:08<49:09,  1.54s/it][A
Training...:  86% 11998/13907 [7:30:09<47:19,  1.49s/it][A
Training...:  86% 11999/13907 [7:30:10<44:51,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:30:24<?, ?it/s]
Training...:  86% 11999/13907 [7:30:12<44:51,  1.41s/it][A
Training...:  86% 12000/13907 [7:30:12<43:27,  1.37s/it][A
Training...:  86% 12001/13907 [7:30:16<1:06:46,  2.10s/it][A
Training...:  86% 12002/13907 [7:30:19<1:19:39,  2.51s/it][A
Training...:  86% 12003/13907 [7:30:22<1:26:39,  2.73s/it][A
Training...:  86% 12004/13907 [7:30:25<1:30:16,  2.85s/it][A
Training...:  86% 12005/13907 [7:30:28<1:32:09,  2.91s/it][A
Training...:  86% 12006/13907 [7:30:31<1:32:32,  2.92s/it][A
Training...:  86% 12007/13907 [7:30:34<1:32:15,  2.91s/it][A
Training...:  86% 12008/13907 [7:30:37<1:31:33,  2.89s/it][A
Training...:  86% 12009/13907 [7:30:40<1:30:38,  2.87s/it][A
Training...:  86% 12010/13907 [7:30:43<1:29:32,  2.83s/it][A
Training...:  86% 12011/13907 [7:30:45<1:28:32,  2.80s/it][A
Training...:  86% 12012/13907 [7:30:48<1:27:29,  2.77s/it][A
Training...:  86% 12013/13907 [7:30:51<1:26:01,  2.73s/it][A
Training...:  86% 12014/13907 [7:30:53<1:24:38,  2.68s/it][A
Training...:  86% 12015/13907 [7:30:56<1:23:26,  2.65s/it][A
Training...:  86% 12016/13907 [7:30:58<1:22:02,  2.60s/it][A
Training...:  86% 12017/13907 [7:31:01<1:21:40,  2.59s/it][A
Training...:  86% 12018/13907 [7:31:03<1:20:37,  2.56s/it][A
Training...:  86% 12019/13907 [7:31:06<1:19:13,  2.52s/it][A
Training...:  86% 12020/13907 [7:31:08<1:17:55,  2.48s/it][A
Training...:  86% 12021/13907 [7:31:11<1:16:30,  2.43s/it][A
Training...:  86% 12022/13907 [7:31:13<1:15:27,  2.40s/it][A
Training...:  86% 12023/13907 [7:31:15<1:14:32,  2.37s/it][A
Training...:  86% 12024/13907 [7:31:17<1:13:29,  2.34s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:31:32<?, ?it/s]
Training...:  86% 12024/13907 [7:31:20<1:13:29,  2.34s/it][A
Training...:  86% 12025/13907 [7:31:20<1:15:37,  2.41s/it][A
Training...:  86% 12026/13907 [7:31:22<1:14:19,  2.37s/it][A
Training...:  86% 12027/13907 [7:31:24<1:12:19,  2.31s/it][A
Training...:  86% 12028/13907 [7:31:27<1:10:29,  2.25s/it][A
Training...:  86% 12029/13907 [7:31:29<1:08:46,  2.20s/it][A
Training...:  87% 12030/13907 [7:31:31<1:07:11,  2.15s/it][A
Training...:  87% 12031/13907 [7:31:33<1:05:43,  2.10s/it][A
Training...:  87% 12032/13907 [7:31:35<1:04:33,  2.07s/it][A
Training...:  87% 12033/13907 [7:31:37<1:03:32,  2.03s/it][A
Training...:  87% 12034/13907 [7:31:39<1:02:32,  2.00s/it][A
Training...:  87% 12035/13907 [7:31:40<1:01:27,  1.97s/it][A
Training...:  87% 12036/13907 [7:31:42<1:00:09,  1.93s/it][A
Training...:  87% 12037/13907 [7:31:44<59:01,  1.89s/it]  [A
Training...:  87% 12038/13907 [7:31:46<58:05,  1.86s/it][A
Training...:  87% 12039/13907 [7:31:48<56:57,  1.83s/it][A
Training...:  87% 12040/13907 [7:31:49<55:48,  1.79s/it][A
Training...:  87% 12041/13907 [7:31:51<54:36,  1.76s/it][A
Training...:  87% 12042/13907 [7:31:53<53:44,  1.73s/it][A
Training...:  87% 12043/13907 [7:31:54<52:31,  1.69s/it][A
Training...:  87% 12044/13907 [7:31:56<51:05,  1.65s/it][A
Training...:  87% 12045/13907 [7:31:57<49:35,  1.60s/it][A
Training...:  87% 12046/13907 [7:31:59<48:14,  1.56s/it][A
Training...:  87% 12047/13907 [7:32:00<46:45,  1.51s/it][A
Training...:  87% 12048/13907 [7:32:01<44:55,  1.45s/it][A
Training...:  87% 12049/13907 [7:32:03<43:02,  1.39s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:32:16<?, ?it/s]
Training...:  87% 12049/13907 [7:32:04<43:02,  1.39s/it][A
Training...:  87% 12050/13907 [7:32:04<42:09,  1.36s/it][A
Training...:  87% 12051/13907 [7:32:08<1:04:35,  2.09s/it][A
Training...:  87% 12052/13907 [7:32:11<1:17:22,  2.50s/it][A
Training...:  87% 12053/13907 [7:32:15<1:24:51,  2.75s/it][A
Training...:  87% 12054/13907 [7:32:18<1:28:44,  2.87s/it][A
Training...:  87% 12055/13907 [7:32:21<1:31:12,  2.96s/it][A
Training...:  87% 12056/13907 [7:32:24<1:32:46,  3.01s/it][A
Training...:  87% 12057/13907 [7:32:27<1:32:36,  3.00s/it][A
Training...:  87% 12058/13907 [7:32:30<1:31:21,  2.96s/it][A
Training...:  87% 12059/13907 [7:32:33<1:29:57,  2.92s/it][A
Training...:  87% 12060/13907 [7:32:36<1:28:57,  2.89s/it][A
Training...:  87% 12061/13907 [7:32:38<1:27:24,  2.84s/it][A
Training...:  87% 12062/13907 [7:32:41<1:25:35,  2.78s/it][A
Training...:  87% 12063/13907 [7:32:43<1:23:51,  2.73s/it][A
Training...:  87% 12064/13907 [7:32:46<1:23:17,  2.71s/it][A
Training...:  87% 12065/13907 [7:32:49<1:21:11,  2.64s/it][A
Training...:  87% 12066/13907 [7:32:51<1:19:21,  2.59s/it][A
Training...:  87% 12067/13907 [7:32:54<1:18:06,  2.55s/it][A
Training...:  87% 12068/13907 [7:32:56<1:16:53,  2.51s/it][A
Training...:  87% 12069/13907 [7:32:58<1:15:33,  2.47s/it][A
Training...:  87% 12070/13907 [7:33:01<1:14:27,  2.43s/it][A
Training...:  87% 12071/13907 [7:33:03<1:13:20,  2.40s/it][A
Training...:  87% 12072/13907 [7:33:05<1:12:29,  2.37s/it][A
Training...:  87% 12073/13907 [7:33:08<1:11:27,  2.34s/it][A
Training...:  87% 12074/13907 [7:33:10<1:10:28,  2.31s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:33:25<?, ?it/s]
Training...:  87% 12074/13907 [7:33:12<1:10:28,  2.31s/it][A
Training...:  87% 12075/13907 [7:33:12<1:12:36,  2.38s/it][A
Training...:  87% 12076/13907 [7:33:15<1:11:31,  2.34s/it][A
Training...:  87% 12077/13907 [7:33:17<1:10:07,  2.30s/it][A
Training...:  87% 12078/13907 [7:33:19<1:08:33,  2.25s/it][A
Training...:  87% 12079/13907 [7:33:21<1:07:09,  2.20s/it][A
Training...:  87% 12080/13907 [7:33:23<1:05:45,  2.16s/it][A
Training...:  87% 12081/13907 [7:33:25<1:04:31,  2.12s/it][A
Training...:  87% 12082/13907 [7:33:27<1:03:37,  2.09s/it][A
Training...:  87% 12083/13907 [7:33:29<1:02:34,  2.06s/it][A
Training...:  87% 12084/13907 [7:33:31<1:01:24,  2.02s/it][A
Training...:  87% 12085/13907 [7:33:33<1:00:43,  2.00s/it][A
Training...:  87% 12086/13907 [7:33:35<59:50,  1.97s/it]  [A
Training...:  87% 12087/13907 [7:33:37<59:01,  1.95s/it][A
Training...:  87% 12088/13907 [7:33:39<57:41,  1.90s/it][A
Training...:  87% 12089/13907 [7:33:40<56:39,  1.87s/it][A
Training...:  87% 12090/13907 [7:33:42<55:34,  1.84s/it][A
Training...:  87% 12091/13907 [7:33:44<54:51,  1.81s/it][A
Training...:  87% 12092/13907 [7:33:46<53:42,  1.78s/it][A
Training...:  87% 12093/13907 [7:33:47<52:28,  1.74s/it][A
Training...:  87% 12094/13907 [7:33:49<51:17,  1.70s/it][A
Training...:  87% 12095/13907 [7:33:50<49:48,  1.65s/it][A
Training...:  87% 12096/13907 [7:33:52<47:58,  1.59s/it][A
Training...:  87% 12097/13907 [7:33:53<46:16,  1.53s/it][A
Training...:  87% 12098/13907 [7:33:55<44:13,  1.47s/it][A
Training...:  87% 12099/13907 [7:33:56<42:03,  1.40s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:34:09<?, ?it/s]
Training...:  87% 12099/13907 [7:33:57<42:03,  1.40s/it][A
Training...:  87% 12100/13907 [7:33:57<41:04,  1.36s/it][A
Training...:  87% 12101/13907 [7:34:01<1:03:10,  2.10s/it][A
Training...:  87% 12102/13907 [7:34:04<1:15:54,  2.52s/it][A
Training...:  87% 12103/13907 [7:34:08<1:22:40,  2.75s/it][A
Training...:  87% 12104/13907 [7:34:11<1:25:49,  2.86s/it][A
Training...:  87% 12105/13907 [7:34:14<1:27:28,  2.91s/it][A
Training...:  87% 12106/13907 [7:34:17<1:27:43,  2.92s/it][A
Training...:  87% 12107/13907 [7:34:20<1:27:41,  2.92s/it][A
Training...:  87% 12108/13907 [7:34:23<1:27:00,  2.90s/it][A
Training...:  87% 12109/13907 [7:34:25<1:25:59,  2.87s/it][A
Training...:  87% 12110/13907 [7:34:28<1:24:59,  2.84s/it][A
Training...:  87% 12111/13907 [7:34:31<1:23:35,  2.79s/it][A
Training...:  87% 12112/13907 [7:34:33<1:22:25,  2.76s/it][A
Training...:  87% 12113/13907 [7:34:36<1:21:12,  2.72s/it][A
Training...:  87% 12114/13907 [7:34:39<1:19:56,  2.67s/it][A
Training...:  87% 12115/13907 [7:34:41<1:18:45,  2.64s/it][A
Training...:  87% 12116/13907 [7:34:44<1:17:21,  2.59s/it][A
Training...:  87% 12117/13907 [7:34:46<1:16:14,  2.56s/it][A
Training...:  87% 12118/13907 [7:34:49<1:14:48,  2.51s/it][A
Training...:  87% 12119/13907 [7:34:51<1:13:46,  2.48s/it][A
Training...:  87% 12120/13907 [7:34:53<1:12:36,  2.44s/it][A
Training...:  87% 12121/13907 [7:34:56<1:11:45,  2.41s/it][A
Training...:  87% 12122/13907 [7:34:58<1:10:41,  2.38s/it][A
Training...:  87% 12123/13907 [7:35:00<1:09:51,  2.35s/it][A
Training...:  87% 12124/13907 [7:35:02<1:08:35,  2.31s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:35:17<?, ?it/s]
Training...:  87% 12124/13907 [7:35:05<1:08:35,  2.31s/it][A
Training...:  87% 12125/13907 [7:35:05<1:10:20,  2.37s/it][A
Training...:  87% 12126/13907 [7:35:07<1:08:58,  2.32s/it][A
Training...:  87% 12127/13907 [7:35:09<1:07:32,  2.28s/it][A
Training...:  87% 12128/13907 [7:35:12<1:06:12,  2.23s/it][A
Training...:  87% 12129/13907 [7:35:14<1:05:08,  2.20s/it][A
Training...:  87% 12130/13907 [7:35:16<1:03:53,  2.16s/it][A
Training...:  87% 12131/13907 [7:35:18<1:02:32,  2.11s/it][A
Training...:  87% 12132/13907 [7:35:20<1:01:24,  2.08s/it][A
Training...:  87% 12133/13907 [7:35:22<1:00:25,  2.04s/it][A
Training...:  87% 12134/13907 [7:35:24<59:39,  2.02s/it]  [A
Training...:  87% 12135/13907 [7:35:26<58:51,  1.99s/it][A
Training...:  87% 12136/13907 [7:35:27<57:50,  1.96s/it][A
Training...:  87% 12137/13907 [7:35:29<57:11,  1.94s/it][A
Training...:  87% 12138/13907 [7:35:31<56:04,  1.90s/it][A
Training...:  87% 12139/13907 [7:35:33<55:02,  1.87s/it][A
Training...:  87% 12140/13907 [7:35:35<54:02,  1.84s/it][A
Training...:  87% 12141/13907 [7:35:36<53:02,  1.80s/it][A
Training...:  87% 12142/13907 [7:35:38<51:53,  1.76s/it][A
Training...:  87% 12143/13907 [7:35:40<50:46,  1.73s/it][A
Training...:  87% 12144/13907 [7:35:41<49:34,  1.69s/it][A
Training...:  87% 12145/13907 [7:35:43<48:29,  1.65s/it][A
Training...:  87% 12146/13907 [7:35:44<47:01,  1.60s/it][A
Training...:  87% 12147/13907 [7:35:46<45:18,  1.54s/it][A
Training...:  87% 12148/13907 [7:35:47<43:31,  1.48s/it][A
Training...:  87% 12149/13907 [7:35:48<41:17,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:36:02<?, ?it/s]
Training...:  87% 12149/13907 [7:35:50<41:17,  1.41s/it][A
Training...:  87% 12150/13907 [7:35:50<40:11,  1.37s/it][A
Training...:  87% 12151/13907 [7:35:53<1:01:44,  2.11s/it][A
Training...:  87% 12152/13907 [7:35:57<1:14:02,  2.53s/it][A
Training...:  87% 12153/13907 [7:36:00<1:20:40,  2.76s/it][A
Training...:  87% 12154/13907 [7:36:03<1:23:57,  2.87s/it][A
Training...:  87% 12155/13907 [7:36:06<1:25:34,  2.93s/it][A
Training...:  87% 12156/13907 [7:36:09<1:25:38,  2.93s/it][A
Training...:  87% 12157/13907 [7:36:12<1:25:11,  2.92s/it][A
Training...:  87% 12158/13907 [7:36:15<1:24:01,  2.88s/it][A
Training...:  87% 12159/13907 [7:36:18<1:23:01,  2.85s/it][A
Training...:  87% 12160/13907 [7:36:21<1:21:27,  2.80s/it][A
Training...:  87% 12161/13907 [7:36:23<1:19:52,  2.74s/it][A
Training...:  87% 12162/13907 [7:36:26<1:18:27,  2.70s/it][A
Training...:  87% 12163/13907 [7:36:28<1:17:16,  2.66s/it][A
Training...:  87% 12164/13907 [7:36:31<1:16:10,  2.62s/it][A
Training...:  87% 12165/13907 [7:36:33<1:15:02,  2.58s/it][A
Training...:  87% 12166/13907 [7:36:36<1:14:16,  2.56s/it][A
Training...:  87% 12167/13907 [7:36:38<1:13:20,  2.53s/it][A
Training...:  87% 12168/13907 [7:36:41<1:12:11,  2.49s/it][A
Training...:  88% 12169/13907 [7:36:43<1:11:20,  2.46s/it][A
Training...:  88% 12170/13907 [7:36:45<1:10:21,  2.43s/it][A
Training...:  88% 12171/13907 [7:36:48<1:09:20,  2.40s/it][A
Training...:  88% 12172/13907 [7:36:50<1:08:12,  2.36s/it][A
Training...:  88% 12173/13907 [7:36:52<1:07:11,  2.33s/it][A
Training...:  88% 12174/13907 [7:36:55<1:06:15,  2.29s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:37:09<?, ?it/s]
Training...:  88% 12174/13907 [7:36:57<1:06:15,  2.29s/it][A
Training...:  88% 12175/13907 [7:36:57<1:07:59,  2.36s/it][A
Training...:  88% 12176/13907 [7:36:59<1:06:40,  2.31s/it][A
Training...:  88% 12177/13907 [7:37:01<1:05:03,  2.26s/it][A
Training...:  88% 12178/13907 [7:37:03<1:03:39,  2.21s/it][A
Training...:  88% 12179/13907 [7:37:06<1:02:26,  2.17s/it][A
Training...:  88% 12180/13907 [7:37:08<1:01:25,  2.13s/it][A
Training...:  88% 12181/13907 [7:37:10<1:00:46,  2.11s/it][A
Training...:  88% 12182/13907 [7:37:12<59:41,  2.08s/it]  [A
Training...:  88% 12183/13907 [7:37:14<58:31,  2.04s/it][A
Training...:  88% 12184/13907 [7:37:16<57:28,  2.00s/it][A
Training...:  88% 12185/13907 [7:37:17<56:25,  1.97s/it][A
Training...:  88% 12186/13907 [7:37:19<55:33,  1.94s/it][A
Training...:  88% 12187/13907 [7:37:21<54:17,  1.89s/it][A
Training...:  88% 12188/13907 [7:37:23<53:05,  1.85s/it][A
Training...:  88% 12189/13907 [7:37:25<52:01,  1.82s/it][A
Training...:  88% 12190/13907 [7:37:26<50:56,  1.78s/it][A
Training...:  88% 12191/13907 [7:37:28<49:57,  1.75s/it][A
Training...:  88% 12192/13907 [7:37:30<48:50,  1.71s/it][A
Training...:  88% 12193/13907 [7:37:31<47:42,  1.67s/it][A
Training...:  88% 12194/13907 [7:37:33<46:44,  1.64s/it][A
Training...:  88% 12195/13907 [7:37:34<45:39,  1.60s/it][A
Training...:  88% 12196/13907 [7:37:36<44:35,  1.56s/it][A
Training...:  88% 12197/13907 [7:37:37<43:01,  1.51s/it][A
Training...:  88% 12198/13907 [7:37:38<41:08,  1.44s/it][A
Training...:  88% 12199/13907 [7:37:40<39:07,  1.37s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:37:53<?, ?it/s]
Training...:  88% 12199/13907 [7:37:41<39:07,  1.37s/it][A
Training...:  88% 12200/13907 [7:37:41<38:19,  1.35s/it][A
Training...:  88% 12201/13907 [7:37:45<59:06,  2.08s/it][A
Training...:  88% 12202/13907 [7:37:48<1:11:37,  2.52s/it][A
Training...:  88% 12203/13907 [7:37:51<1:17:56,  2.74s/it][A
Training...:  88% 12204/13907 [7:37:55<1:21:16,  2.86s/it][A
Training...:  88% 12205/13907 [7:37:58<1:23:10,  2.93s/it][A
Training...:  88% 12206/13907 [7:38:01<1:23:46,  2.95s/it][A
Training...:  88% 12207/13907 [7:38:04<1:23:56,  2.96s/it][A
Training...:  88% 12208/13907 [7:38:07<1:24:54,  3.00s/it][A
Training...:  88% 12209/13907 [7:38:10<1:23:27,  2.95s/it][A
Training...:  88% 12210/13907 [7:38:12<1:21:50,  2.89s/it][A
Training...:  88% 12211/13907 [7:38:15<1:20:25,  2.85s/it][A
Training...:  88% 12212/13907 [7:38:18<1:18:59,  2.80s/it][A
Training...:  88% 12213/13907 [7:38:20<1:17:55,  2.76s/it][A
Training...:  88% 12214/13907 [7:38:23<1:16:25,  2.71s/it][A
Training...:  88% 12215/13907 [7:38:26<1:15:28,  2.68s/it][A
Training...:  88% 12216/13907 [7:38:28<1:14:09,  2.63s/it][A
Training...:  88% 12217/13907 [7:38:31<1:12:45,  2.58s/it][A
Training...:  88% 12218/13907 [7:38:33<1:11:35,  2.54s/it][A
Training...:  88% 12219/13907 [7:38:36<1:10:38,  2.51s/it][A
Training...:  88% 12220/13907 [7:38:38<1:09:41,  2.48s/it][A
Training...:  88% 12221/13907 [7:38:40<1:08:23,  2.43s/it][A
Training...:  88% 12222/13907 [7:38:43<1:06:55,  2.38s/it][A
Training...:  88% 12223/13907 [7:38:45<1:05:53,  2.35s/it][A
Training...:  88% 12224/13907 [7:38:47<1:05:06,  2.32s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:39:02<?, ?it/s]
Training...:  88% 12224/13907 [7:38:50<1:05:06,  2.32s/it][A
Training...:  88% 12225/13907 [7:38:50<1:06:48,  2.38s/it][A
Training...:  88% 12226/13907 [7:38:52<1:05:17,  2.33s/it][A
Training...:  88% 12227/13907 [7:38:54<1:03:46,  2.28s/it][A
Training...:  88% 12228/13907 [7:38:56<1:02:01,  2.22s/it][A
Training...:  88% 12229/13907 [7:38:58<1:00:48,  2.17s/it][A
Training...:  88% 12230/13907 [7:39:00<59:41,  2.14s/it]  [A
Training...:  88% 12231/13907 [7:39:02<58:32,  2.10s/it][A
Training...:  88% 12232/13907 [7:39:04<57:46,  2.07s/it][A
Training...:  88% 12233/13907 [7:39:06<56:53,  2.04s/it][A
Training...:  88% 12234/13907 [7:39:08<55:53,  2.00s/it][A
Training...:  88% 12235/13907 [7:39:10<55:09,  1.98s/it][A
Training...:  88% 12236/13907 [7:39:12<54:19,  1.95s/it][A
Training...:  88% 12237/13907 [7:39:14<53:17,  1.91s/it][A
Training...:  88% 12238/13907 [7:39:15<52:29,  1.89s/it][A
Training...:  88% 12239/13907 [7:39:17<51:29,  1.85s/it][A
Training...:  88% 12240/13907 [7:39:19<50:49,  1.83s/it][A
Training...:  88% 12241/13907 [7:39:21<50:01,  1.80s/it][A
Training...:  88% 12242/13907 [7:39:22<49:05,  1.77s/it][A
Training...:  88% 12243/13907 [7:39:24<48:16,  1.74s/it][A
Training...:  88% 12244/13907 [7:39:26<47:07,  1.70s/it][A
Training...:  88% 12245/13907 [7:39:27<45:53,  1.66s/it][A
Training...:  88% 12246/13907 [7:39:29<44:21,  1.60s/it][A
Training...:  88% 12247/13907 [7:39:30<42:53,  1.55s/it][A
Training...:  88% 12248/13907 [7:39:32<41:10,  1.49s/it][A
Training...:  88% 12249/13907 [7:39:33<39:00,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:39:46<?, ?it/s]
Training...:  88% 12249/13907 [7:39:34<39:00,  1.41s/it][A
Training...:  88% 12250/13907 [7:39:34<38:01,  1.38s/it][A
Training...:  88% 12251/13907 [7:39:38<58:07,  2.11s/it][A
Training...:  88% 12252/13907 [7:39:41<1:09:48,  2.53s/it][A
Training...:  88% 12253/13907 [7:39:45<1:16:20,  2.77s/it][A
Training...:  88% 12254/13907 [7:39:48<1:19:40,  2.89s/it][A
Training...:  88% 12255/13907 [7:39:51<1:21:29,  2.96s/it][A
Training...:  88% 12256/13907 [7:39:54<1:22:07,  2.98s/it][A
Training...:  88% 12257/13907 [7:39:57<1:21:59,  2.98s/it][A
Training...:  88% 12258/13907 [7:40:00<1:21:25,  2.96s/it][A
Training...:  88% 12259/13907 [7:40:03<1:20:21,  2.93s/it][A
Training...:  88% 12260/13907 [7:40:06<1:19:18,  2.89s/it][A
Training...:  88% 12261/13907 [7:40:08<1:18:05,  2.85s/it][A
Training...:  88% 12262/13907 [7:40:11<1:16:44,  2.80s/it][A
Training...:  88% 12263/13907 [7:40:14<1:15:19,  2.75s/it][A
Training...:  88% 12264/13907 [7:40:16<1:14:09,  2.71s/it][A
Training...:  88% 12265/13907 [7:40:19<1:13:22,  2.68s/it][A
Training...:  88% 12266/13907 [7:40:21<1:12:03,  2.63s/it][A
Training...:  88% 12267/13907 [7:40:24<1:10:33,  2.58s/it][A
Training...:  88% 12268/13907 [7:40:26<1:09:14,  2.54s/it][A
Training...:  88% 12269/13907 [7:40:29<1:08:05,  2.49s/it][A
Training...:  88% 12270/13907 [7:40:31<1:07:06,  2.46s/it][A
Training...:  88% 12271/13907 [7:40:33<1:06:32,  2.44s/it][A
Training...:  88% 12272/13907 [7:40:36<1:05:55,  2.42s/it][A
Training...:  88% 12273/13907 [7:40:38<1:04:33,  2.37s/it][A
Training...:  88% 12274/13907 [7:40:40<1:03:22,  2.33s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:40:55<?, ?it/s]
Training...:  88% 12274/13907 [7:40:43<1:03:22,  2.33s/it][A
Training...:  88% 12275/13907 [7:40:43<1:04:55,  2.39s/it][A
Training...:  88% 12276/13907 [7:40:45<1:03:50,  2.35s/it][A
Training...:  88% 12277/13907 [7:40:47<1:02:27,  2.30s/it][A
Training...:  88% 12278/13907 [7:40:49<1:00:53,  2.24s/it][A
Training...:  88% 12279/13907 [7:40:51<59:31,  2.19s/it]  [A
Training...:  88% 12280/13907 [7:40:54<58:33,  2.16s/it][A
Training...:  88% 12281/13907 [7:40:56<57:36,  2.13s/it][A
Training...:  88% 12282/13907 [7:40:58<56:44,  2.10s/it][A
Training...:  88% 12283/13907 [7:41:00<56:00,  2.07s/it][A
Training...:  88% 12284/13907 [7:41:02<55:08,  2.04s/it][A
Training...:  88% 12285/13907 [7:41:04<54:25,  2.01s/it][A
Training...:  88% 12286/13907 [7:41:05<53:37,  1.98s/it][A
Training...:  88% 12287/13907 [7:41:07<52:50,  1.96s/it][A
Training...:  88% 12288/13907 [7:41:09<52:04,  1.93s/it][A
Training...:  88% 12289/13907 [7:41:11<51:07,  1.90s/it][A
Training...:  88% 12290/13907 [7:41:13<50:15,  1.87s/it][A
Training...:  88% 12291/13907 [7:41:15<49:14,  1.83s/it][A
Training...:  88% 12292/13907 [7:41:16<48:17,  1.79s/it][A
Training...:  88% 12293/13907 [7:41:18<47:10,  1.75s/it][A
Training...:  88% 12294/13907 [7:41:20<46:10,  1.72s/it][A
Training...:  88% 12295/13907 [7:41:21<44:43,  1.66s/it][A
Training...:  88% 12296/13907 [7:41:23<43:11,  1.61s/it][A
Training...:  88% 12297/13907 [7:41:24<41:32,  1.55s/it][A
Training...:  88% 12298/13907 [7:41:25<39:41,  1.48s/it][A
Training...:  88% 12299/13907 [7:41:27<37:35,  1.40s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:41:40<?, ?it/s]
Training...:  88% 12299/13907 [7:41:28<37:35,  1.40s/it][A
Training...:  88% 12300/13907 [7:41:28<36:28,  1.36s/it][A
Training...:  88% 12301/13907 [7:41:32<56:52,  2.12s/it][A
Training...:  88% 12302/13907 [7:41:35<1:07:15,  2.51s/it][A
Training...:  88% 12303/13907 [7:41:38<1:13:35,  2.75s/it][A
Training...:  88% 12304/13907 [7:41:42<1:16:35,  2.87s/it][A
Training...:  88% 12305/13907 [7:41:45<1:18:13,  2.93s/it][A
Training...:  88% 12306/13907 [7:41:48<1:18:55,  2.96s/it][A
Training...:  88% 12307/13907 [7:41:51<1:19:01,  2.96s/it][A
Training...:  89% 12308/13907 [7:41:54<1:18:08,  2.93s/it][A
Training...:  89% 12309/13907 [7:41:56<1:17:02,  2.89s/it][A
Training...:  89% 12310/13907 [7:41:59<1:15:49,  2.85s/it][A
Training...:  89% 12311/13907 [7:42:02<1:14:29,  2.80s/it][A
Training...:  89% 12312/13907 [7:42:04<1:13:01,  2.75s/it][A
Training...:  89% 12313/13907 [7:42:07<1:12:15,  2.72s/it][A
Training...:  89% 12314/13907 [7:42:10<1:11:18,  2.69s/it][A
Training...:  89% 12315/13907 [7:42:12<1:10:04,  2.64s/it][A
Training...:  89% 12316/13907 [7:42:15<1:09:04,  2.61s/it][A
Training...:  89% 12317/13907 [7:42:17<1:07:51,  2.56s/it][A
Training...:  89% 12318/13907 [7:42:20<1:07:00,  2.53s/it][A
Training...:  89% 12319/13907 [7:42:22<1:06:30,  2.51s/it][A
Training...:  89% 12320/13907 [7:42:25<1:05:24,  2.47s/it][A
Training...:  89% 12321/13907 [7:42:27<1:04:29,  2.44s/it][A
Training...:  89% 12322/13907 [7:42:29<1:03:40,  2.41s/it][A
Training...:  89% 12323/13907 [7:42:31<1:02:26,  2.37s/it][A
Training...:  89% 12324/13907 [7:42:34<1:01:16,  2.32s/it][A                                                                                                             
                                                          [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:42:49<?, ?it/s]
Training...:  89% 12324/13907 [7:42:36<1:01:16,  2.32s/it][A
Training...:  89% 12325/13907 [7:42:36<1:02:40,  2.38s/it][A
Training...:  89% 12326/13907 [7:42:38<1:01:31,  2.33s/it][A
Training...:  89% 12327/13907 [7:42:41<1:00:04,  2.28s/it][A
Training...:  89% 12328/13907 [7:42:43<58:26,  2.22s/it]  [A
Training...:  89% 12329/13907 [7:42:45<57:02,  2.17s/it][A
Training...:  89% 12330/13907 [7:42:47<55:50,  2.12s/it][A
Training...:  89% 12331/13907 [7:42:49<54:40,  2.08s/it][A
Training...:  89% 12332/13907 [7:42:51<53:40,  2.04s/it][A
Training...:  89% 12333/13907 [7:42:53<52:54,  2.02s/it][A
Training...:  89% 12334/13907 [7:42:55<51:56,  1.98s/it][A
Training...:  89% 12335/13907 [7:42:56<51:03,  1.95s/it][A
Training...:  89% 12336/13907 [7:42:58<50:22,  1.92s/it][A
Training...:  89% 12337/13907 [7:43:00<49:33,  1.89s/it][A
Training...:  89% 12338/13907 [7:43:02<48:43,  1.86s/it][A
Training...:  89% 12339/13907 [7:43:04<47:44,  1.83s/it][A
Training...:  89% 12340/13907 [7:43:05<46:46,  1.79s/it][A
Training...:  89% 12341/13907 [7:43:07<45:52,  1.76s/it][A
Training...:  89% 12342/13907 [7:43:09<45:00,  1.73s/it][A
Training...:  89% 12343/13907 [7:43:10<44:10,  1.69s/it][A
Training...:  89% 12344/13907 [7:43:12<43:17,  1.66s/it][A
Training...:  89% 12345/13907 [7:43:13<42:14,  1.62s/it][A
Training...:  89% 12346/13907 [7:43:15<41:08,  1.58s/it][A
Training...:  89% 12347/13907 [7:43:16<39:43,  1.53s/it][A
Training...:  89% 12348/13907 [7:43:18<38:07,  1.47s/it][A
Training...:  89% 12349/13907 [7:43:19<36:36,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:43:33<?, ?it/s]
Training...:  89% 12349/13907 [7:43:20<36:36,  1.41s/it][A
Training...:  89% 12350/13907 [7:43:20<35:41,  1.38s/it][A
Training...:  89% 12351/13907 [7:43:24<54:32,  2.10s/it][A
Training...:  89% 12352/13907 [7:43:28<1:05:38,  2.53s/it][A
Training...:  89% 12353/13907 [7:43:31<1:11:31,  2.76s/it][A
Training...:  89% 12354/13907 [7:43:34<1:15:00,  2.90s/it][A
Training...:  89% 12355/13907 [7:43:37<1:16:26,  2.96s/it][A
Training...:  89% 12356/13907 [7:43:40<1:16:45,  2.97s/it][A
Training...:  89% 12357/13907 [7:43:43<1:16:25,  2.96s/it][A
Training...:  89% 12358/13907 [7:43:46<1:15:47,  2.94s/it][A
Training...:  89% 12359/13907 [7:43:49<1:14:31,  2.89s/it][A
Training...:  89% 12360/13907 [7:43:51<1:13:20,  2.84s/it][A
Training...:  89% 12361/13907 [7:43:54<1:13:55,  2.87s/it][A
Training...:  89% 12362/13907 [7:43:57<1:12:39,  2.82s/it][A
Training...:  89% 12363/13907 [7:44:00<1:10:56,  2.76s/it][A
Training...:  89% 12364/13907 [7:44:02<1:09:23,  2.70s/it][A
Training...:  89% 12365/13907 [7:44:05<1:07:53,  2.64s/it][A
Training...:  89% 12366/13907 [7:44:07<1:06:37,  2.59s/it][A
Training...:  89% 12367/13907 [7:44:10<1:05:18,  2.54s/it][A
Training...:  89% 12368/13907 [7:44:12<1:04:17,  2.51s/it][A
Training...:  89% 12369/13907 [7:44:14<1:03:23,  2.47s/it][A
Training...:  89% 12370/13907 [7:44:17<1:02:16,  2.43s/it][A
Training...:  89% 12371/13907 [7:44:19<1:01:17,  2.39s/it][A
Training...:  89% 12372/13907 [7:44:21<1:00:31,  2.37s/it][A
Training...:  89% 12373/13907 [7:44:24<59:52,  2.34s/it]  [A
Training...:  89% 12374/13907 [7:44:26<59:05,  2.31s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:44:41<?, ?it/s]
Training...:  89% 12374/13907 [7:44:29<59:05,  2.31s/it][A
Training...:  89% 12375/13907 [7:44:29<1:00:50,  2.38s/it][A
Training...:  89% 12376/13907 [7:44:31<59:43,  2.34s/it]  [A
Training...:  89% 12377/13907 [7:44:33<58:23,  2.29s/it][A
Training...:  89% 12378/13907 [7:44:35<57:06,  2.24s/it][A
Training...:  89% 12379/13907 [7:44:37<55:59,  2.20s/it][A
Training...:  89% 12380/13907 [7:44:39<54:59,  2.16s/it][A
Training...:  89% 12381/13907 [7:44:41<54:04,  2.13s/it][A
Training...:  89% 12382/13907 [7:44:43<53:08,  2.09s/it][A
Training...:  89% 12383/13907 [7:44:45<52:23,  2.06s/it][A
Training...:  89% 12384/13907 [7:44:47<51:30,  2.03s/it][A
Training...:  89% 12385/13907 [7:44:49<50:29,  1.99s/it][A
Training...:  89% 12386/13907 [7:44:51<49:22,  1.95s/it][A
Training...:  89% 12387/13907 [7:44:53<48:29,  1.91s/it][A
Training...:  89% 12388/13907 [7:44:55<47:32,  1.88s/it][A
Training...:  89% 12389/13907 [7:44:56<46:35,  1.84s/it][A
Training...:  89% 12390/13907 [7:44:58<45:44,  1.81s/it][A
Training...:  89% 12391/13907 [7:45:00<44:34,  1.76s/it][A
Training...:  89% 12392/13907 [7:45:01<43:44,  1.73s/it][A
Training...:  89% 12393/13907 [7:45:03<42:41,  1.69s/it][A
Training...:  89% 12394/13907 [7:45:05<41:47,  1.66s/it][A
Training...:  89% 12395/13907 [7:45:06<40:33,  1.61s/it][A
Training...:  89% 12396/13907 [7:45:08<39:10,  1.56s/it][A
Training...:  89% 12397/13907 [7:45:09<37:57,  1.51s/it][A
Training...:  89% 12398/13907 [7:45:10<36:21,  1.45s/it][A
Training...:  89% 12399/13907 [7:45:11<34:47,  1.38s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:45:25<?, ?it/s]
Training...:  89% 12399/13907 [7:45:13<34:47,  1.38s/it][A
Training...:  89% 12400/13907 [7:45:13<33:50,  1.35s/it][A
Training...:  89% 12401/13907 [7:45:17<52:44,  2.10s/it][A
Training...:  89% 12402/13907 [7:45:20<1:02:54,  2.51s/it][A
Training...:  89% 12403/13907 [7:45:23<1:09:32,  2.77s/it][A
Training...:  89% 12404/13907 [7:45:27<1:13:07,  2.92s/it][A
Training...:  89% 12405/13907 [7:45:30<1:14:49,  2.99s/it][A
Training...:  89% 12406/13907 [7:45:33<1:15:04,  3.00s/it][A
Training...:  89% 12407/13907 [7:45:36<1:15:04,  3.00s/it][A
Training...:  89% 12408/13907 [7:45:39<1:14:05,  2.97s/it][A
Training...:  89% 12409/13907 [7:45:42<1:13:05,  2.93s/it][A
Training...:  89% 12410/13907 [7:45:44<1:11:51,  2.88s/it][A
Training...:  89% 12411/13907 [7:45:47<1:10:48,  2.84s/it][A
Training...:  89% 12412/13907 [7:45:50<1:09:32,  2.79s/it][A
Training...:  89% 12413/13907 [7:45:52<1:08:15,  2.74s/it][A
Training...:  89% 12414/13907 [7:45:55<1:07:03,  2.70s/it][A
Training...:  89% 12415/13907 [7:45:58<1:06:15,  2.66s/it][A
Training...:  89% 12416/13907 [7:46:00<1:05:20,  2.63s/it][A
Training...:  89% 12417/13907 [7:46:03<1:04:31,  2.60s/it][A
Training...:  89% 12418/13907 [7:46:05<1:03:36,  2.56s/it][A
Training...:  89% 12419/13907 [7:46:08<1:02:58,  2.54s/it][A
Training...:  89% 12420/13907 [7:46:10<1:01:38,  2.49s/it][A
Training...:  89% 12421/13907 [7:46:12<1:00:26,  2.44s/it][A
Training...:  89% 12422/13907 [7:46:15<59:05,  2.39s/it]  [A
Training...:  89% 12423/13907 [7:46:17<58:23,  2.36s/it][A
Training...:  89% 12424/13907 [7:46:19<57:24,  2.32s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:46:34<?, ?it/s]
Training...:  89% 12424/13907 [7:46:22<57:24,  2.32s/it][A
Training...:  89% 12425/13907 [7:46:22<58:51,  2.38s/it][A
Training...:  89% 12426/13907 [7:46:24<57:35,  2.33s/it][A
Training...:  89% 12427/13907 [7:46:26<56:01,  2.27s/it][A
Training...:  89% 12428/13907 [7:46:28<54:49,  2.22s/it][A
Training...:  89% 12429/13907 [7:46:30<53:36,  2.18s/it][A
Training...:  89% 12430/13907 [7:46:32<52:32,  2.13s/it][A
Training...:  89% 12431/13907 [7:46:34<51:39,  2.10s/it][A
Training...:  89% 12432/13907 [7:46:36<50:52,  2.07s/it][A
Training...:  89% 12433/13907 [7:46:38<50:01,  2.04s/it][A
Training...:  89% 12434/13907 [7:46:40<49:02,  2.00s/it][A
Training...:  89% 12435/13907 [7:46:42<48:13,  1.97s/it][A
Training...:  89% 12436/13907 [7:46:44<47:30,  1.94s/it][A
Training...:  89% 12437/13907 [7:46:46<46:39,  1.90s/it][A
Training...:  89% 12438/13907 [7:46:48<46:00,  1.88s/it][A
Training...:  89% 12439/13907 [7:46:49<45:23,  1.86s/it][A
Training...:  89% 12440/13907 [7:46:51<44:31,  1.82s/it][A
Training...:  89% 12441/13907 [7:46:53<43:45,  1.79s/it][A
Training...:  89% 12442/13907 [7:46:54<42:55,  1.76s/it][A
Training...:  89% 12443/13907 [7:46:56<41:55,  1.72s/it][A
Training...:  89% 12444/13907 [7:46:58<40:54,  1.68s/it][A
Training...:  89% 12445/13907 [7:46:59<39:49,  1.63s/it][A
Training...:  89% 12446/13907 [7:47:01<38:23,  1.58s/it][A
Training...:  90% 12447/13907 [7:47:02<36:55,  1.52s/it][A
Training...:  90% 12448/13907 [7:47:03<35:32,  1.46s/it][A
Training...:  90% 12449/13907 [7:47:05<33:53,  1.40s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:47:18<?, ?it/s]
Training...:  90% 12449/13907 [7:47:06<33:53,  1.40s/it][A
Training...:  90% 12450/13907 [7:47:06<33:16,  1.37s/it][A
Training...:  90% 12451/13907 [7:47:10<51:40,  2.13s/it][A
Training...:  90% 12452/13907 [7:47:13<1:02:07,  2.56s/it][A
Training...:  90% 12453/13907 [7:47:17<1:07:35,  2.79s/it][A
Training...:  90% 12454/13907 [7:47:20<1:10:06,  2.90s/it][A
Training...:  90% 12455/13907 [7:47:23<1:11:45,  2.97s/it][A
Training...:  90% 12456/13907 [7:47:26<1:11:44,  2.97s/it][A
Training...:  90% 12457/13907 [7:47:29<1:11:20,  2.95s/it][A
Training...:  90% 12458/13907 [7:47:32<1:10:13,  2.91s/it][A
Training...:  90% 12459/13907 [7:47:34<1:09:11,  2.87s/it][A
Training...:  90% 12460/13907 [7:47:37<1:08:09,  2.83s/it][A
Training...:  90% 12461/13907 [7:47:40<1:06:55,  2.78s/it][A
Training...:  90% 12462/13907 [7:47:42<1:05:53,  2.74s/it][A
Training...:  90% 12463/13907 [7:47:45<1:04:46,  2.69s/it][A
Training...:  90% 12464/13907 [7:47:48<1:03:51,  2.66s/it][A
Training...:  90% 12465/13907 [7:47:50<1:02:52,  2.62s/it][A
Training...:  90% 12466/13907 [7:47:53<1:01:46,  2.57s/it][A
Training...:  90% 12467/13907 [7:47:55<1:00:50,  2.53s/it][A
Training...:  90% 12468/13907 [7:47:57<1:00:04,  2.50s/it][A
Training...:  90% 12469/13907 [7:48:00<59:25,  2.48s/it]  [A
Training...:  90% 12470/13907 [7:48:02<59:01,  2.46s/it][A
Training...:  90% 12471/13907 [7:48:05<58:19,  2.44s/it][A
Training...:  90% 12472/13907 [7:48:07<57:13,  2.39s/it][A
Training...:  90% 12473/13907 [7:48:09<56:53,  2.38s/it][A
Training...:  90% 12474/13907 [7:48:12<55:37,  2.33s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:48:26<?, ?it/s]
Training...:  90% 12474/13907 [7:48:14<55:37,  2.33s/it][A
Training...:  90% 12475/13907 [7:48:14<56:46,  2.38s/it][A
Training...:  90% 12476/13907 [7:48:16<55:19,  2.32s/it][A
Training...:  90% 12477/13907 [7:48:18<53:48,  2.26s/it][A
Training...:  90% 12478/13907 [7:48:20<52:29,  2.20s/it][A
Training...:  90% 12479/13907 [7:48:22<51:09,  2.15s/it][A
Training...:  90% 12480/13907 [7:48:24<50:21,  2.12s/it][A
Training...:  90% 12481/13907 [7:48:27<49:43,  2.09s/it][A
Training...:  90% 12482/13907 [7:48:29<49:00,  2.06s/it][A
Training...:  90% 12483/13907 [7:48:31<48:33,  2.05s/it][A
Training...:  90% 12484/13907 [7:48:32<47:47,  2.01s/it][A
Training...:  90% 12485/13907 [7:48:34<46:57,  1.98s/it][A
Training...:  90% 12486/13907 [7:48:36<46:29,  1.96s/it][A
Training...:  90% 12487/13907 [7:48:38<45:40,  1.93s/it][A
Training...:  90% 12488/13907 [7:48:40<44:53,  1.90s/it][A
Training...:  90% 12489/13907 [7:48:42<44:01,  1.86s/it][A
Training...:  90% 12490/13907 [7:48:43<43:06,  1.83s/it][A
Training...:  90% 12491/13907 [7:48:45<42:09,  1.79s/it][A
Training...:  90% 12492/13907 [7:48:47<41:22,  1.75s/it][A
Training...:  90% 12493/13907 [7:48:48<40:24,  1.71s/it][A
Training...:  90% 12494/13907 [7:48:50<39:27,  1.68s/it][A
Training...:  90% 12495/13907 [7:48:52<38:14,  1.62s/it][A
Training...:  90% 12496/13907 [7:48:53<37:15,  1.58s/it][A
Training...:  90% 12497/13907 [7:48:54<35:59,  1.53s/it][A
Training...:  90% 12498/13907 [7:48:56<34:27,  1.47s/it][A
Training...:  90% 12499/13907 [7:48:57<32:40,  1.39s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:49:11<?, ?it/s]
Training...:  90% 12499/13907 [7:48:58<32:40,  1.39s/it][A
Training...:  90% 12500/13907 [7:48:58<32:07,  1.37s/it][A
Training...:  90% 12501/13907 [7:49:02<49:37,  2.12s/it][A
Training...:  90% 12502/13907 [7:49:06<1:00:10,  2.57s/it][A
Training...:  90% 12503/13907 [7:49:09<1:05:18,  2.79s/it][A
Training...:  90% 12504/13907 [7:49:12<1:08:02,  2.91s/it][A
Training...:  90% 12505/13907 [7:49:15<1:08:57,  2.95s/it][A
Training...:  90% 12506/13907 [7:49:18<1:09:01,  2.96s/it][A
Training...:  90% 12507/13907 [7:49:21<1:08:45,  2.95s/it][A
Training...:  90% 12508/13907 [7:49:24<1:07:55,  2.91s/it][A
Training...:  90% 12509/13907 [7:49:27<1:07:02,  2.88s/it][A
Training...:  90% 12510/13907 [7:49:30<1:06:03,  2.84s/it][A
Training...:  90% 12511/13907 [7:49:32<1:05:13,  2.80s/it][A
Training...:  90% 12512/13907 [7:49:35<1:04:17,  2.77s/it][A
Training...:  90% 12513/13907 [7:49:38<1:03:05,  2.72s/it][A
Training...:  90% 12514/13907 [7:49:40<1:01:50,  2.66s/it][A
Training...:  90% 12515/13907 [7:49:43<1:00:44,  2.62s/it][A
Training...:  90% 12516/13907 [7:49:45<59:35,  2.57s/it]  [A
Training...:  90% 12517/13907 [7:49:48<58:53,  2.54s/it][A
Training...:  90% 12518/13907 [7:49:50<57:56,  2.50s/it][A
Training...:  90% 12519/13907 [7:49:52<57:10,  2.47s/it][A
Training...:  90% 12520/13907 [7:49:55<56:22,  2.44s/it][A
Training...:  90% 12521/13907 [7:49:57<55:34,  2.41s/it][A
Training...:  90% 12522/13907 [7:49:59<54:58,  2.38s/it][A
Training...:  90% 12523/13907 [7:50:02<54:21,  2.36s/it][A
Training...:  90% 12524/13907 [7:50:04<53:39,  2.33s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:50:19<?, ?it/s]
Training...:  90% 12524/13907 [7:50:07<53:39,  2.33s/it][A
Training...:  90% 12525/13907 [7:50:07<54:59,  2.39s/it][A
Training...:  90% 12526/13907 [7:50:09<54:05,  2.35s/it][A
Training...:  90% 12527/13907 [7:50:11<52:43,  2.29s/it][A
Training...:  90% 12528/13907 [7:50:13<51:16,  2.23s/it][A
Training...:  90% 12529/13907 [7:50:15<49:59,  2.18s/it][A
Training...:  90% 12530/13907 [7:50:17<48:57,  2.13s/it][A
Training...:  90% 12531/13907 [7:50:19<48:12,  2.10s/it][A
Training...:  90% 12532/13907 [7:50:21<47:42,  2.08s/it][A
Training...:  90% 12533/13907 [7:50:23<47:10,  2.06s/it][A
Training...:  90% 12534/13907 [7:50:25<46:11,  2.02s/it][A
Training...:  90% 12535/13907 [7:50:27<45:25,  1.99s/it][A
Training...:  90% 12536/13907 [7:50:29<44:38,  1.95s/it][A
Training...:  90% 12537/13907 [7:50:31<43:57,  1.93s/it][A
Training...:  90% 12538/13907 [7:50:33<43:18,  1.90s/it][A
Training...:  90% 12539/13907 [7:50:34<42:32,  1.87s/it][A
Training...:  90% 12540/13907 [7:50:36<41:56,  1.84s/it][A
Training...:  90% 12541/13907 [7:50:38<41:02,  1.80s/it][A
Training...:  90% 12542/13907 [7:50:40<39:57,  1.76s/it][A
Training...:  90% 12543/13907 [7:50:41<38:52,  1.71s/it][A
Training...:  90% 12544/13907 [7:50:43<37:52,  1.67s/it][A
Training...:  90% 12545/13907 [7:50:44<36:55,  1.63s/it][A
Training...:  90% 12546/13907 [7:50:46<35:42,  1.57s/it][A
Training...:  90% 12547/13907 [7:50:47<34:23,  1.52s/it][A
Training...:  90% 12548/13907 [7:50:48<33:08,  1.46s/it][A
Training...:  90% 12549/13907 [7:50:50<31:30,  1.39s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:51:03<?, ?it/s]
Training...:  90% 12549/13907 [7:50:51<31:30,  1.39s/it][A
Training...:  90% 12550/13907 [7:50:51<30:45,  1.36s/it][A
Training...:  90% 12551/13907 [7:50:55<47:40,  2.11s/it][A
Training...:  90% 12552/13907 [7:50:58<56:39,  2.51s/it][A
Training...:  90% 12553/13907 [7:51:02<1:02:08,  2.75s/it][A
Training...:  90% 12554/13907 [7:51:05<1:05:13,  2.89s/it][A
Training...:  90% 12555/13907 [7:51:08<1:06:59,  2.97s/it][A
Training...:  90% 12556/13907 [7:51:11<1:07:05,  2.98s/it][A
Training...:  90% 12557/13907 [7:51:14<1:06:48,  2.97s/it][A
Training...:  90% 12558/13907 [7:51:17<1:05:59,  2.93s/it][A
Training...:  90% 12559/13907 [7:51:20<1:05:12,  2.90s/it][A
Training...:  90% 12560/13907 [7:51:22<1:04:14,  2.86s/it][A
Training...:  90% 12561/13907 [7:51:25<1:03:27,  2.83s/it][A
Training...:  90% 12562/13907 [7:51:28<1:02:19,  2.78s/it][A
Training...:  90% 12563/13907 [7:51:30<1:01:20,  2.74s/it][A
Training...:  90% 12564/13907 [7:51:33<1:00:16,  2.69s/it][A
Training...:  90% 12565/13907 [7:51:36<59:30,  2.66s/it]  [A
Training...:  90% 12566/13907 [7:51:38<58:29,  2.62s/it][A
Training...:  90% 12567/13907 [7:51:41<57:22,  2.57s/it][A
Training...:  90% 12568/13907 [7:51:43<56:23,  2.53s/it][A
Training...:  90% 12569/13907 [7:51:45<55:23,  2.48s/it][A
Training...:  90% 12570/13907 [7:51:48<54:24,  2.44s/it][A
Training...:  90% 12571/13907 [7:51:50<53:32,  2.40s/it][A
Training...:  90% 12572/13907 [7:51:52<52:46,  2.37s/it][A
Training...:  90% 12573/13907 [7:51:55<52:02,  2.34s/it][A
Training...:  90% 12574/13907 [7:51:57<51:16,  2.31s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:52:12<?, ?it/s]
Training...:  90% 12574/13907 [7:51:59<51:16,  2.31s/it][A
Training...:  90% 12575/13907 [7:51:59<52:26,  2.36s/it][A
Training...:  90% 12576/13907 [7:52:01<51:26,  2.32s/it][A
Training...:  90% 12577/13907 [7:52:04<50:23,  2.27s/it][A
Training...:  90% 12578/13907 [7:52:06<49:18,  2.23s/it][A
Training...:  90% 12579/13907 [7:52:08<48:22,  2.19s/it][A
Training...:  90% 12580/13907 [7:52:10<47:32,  2.15s/it][A
Training...:  90% 12581/13907 [7:52:12<46:30,  2.10s/it][A
Training...:  90% 12582/13907 [7:52:14<45:41,  2.07s/it][A
Training...:  90% 12583/13907 [7:52:16<45:10,  2.05s/it][A
Training...:  90% 12584/13907 [7:52:18<44:24,  2.01s/it][A
Training...:  90% 12585/13907 [7:52:20<43:39,  1.98s/it][A
Training...:  91% 12586/13907 [7:52:22<42:51,  1.95s/it][A
Training...:  91% 12587/13907 [7:52:23<42:15,  1.92s/it][A
Training...:  91% 12588/13907 [7:52:25<41:38,  1.89s/it][A
Training...:  91% 12589/13907 [7:52:27<41:03,  1.87s/it][A
Training...:  91% 12590/13907 [7:52:29<40:15,  1.83s/it][A
Training...:  91% 12591/13907 [7:52:31<39:24,  1.80s/it][A
Training...:  91% 12592/13907 [7:52:32<38:28,  1.76s/it][A
Training...:  91% 12593/13907 [7:52:34<37:38,  1.72s/it][A
Training...:  91% 12594/13907 [7:52:35<36:47,  1.68s/it][A
Training...:  91% 12595/13907 [7:52:37<35:52,  1.64s/it][A
Training...:  91% 12596/13907 [7:52:38<34:45,  1.59s/it][A
Training...:  91% 12597/13907 [7:52:40<33:32,  1.54s/it][A
Training...:  91% 12598/13907 [7:52:41<32:22,  1.48s/it][A
Training...:  91% 12599/13907 [7:52:43<30:53,  1.42s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:52:56<?, ?it/s]
Training...:  91% 12599/13907 [7:52:44<30:53,  1.42s/it][A
Training...:  91% 12600/13907 [7:52:44<30:00,  1.38s/it][A
Training...:  91% 12601/13907 [7:52:48<46:46,  2.15s/it][A
Training...:  91% 12602/13907 [7:52:51<56:04,  2.58s/it][A
Training...:  91% 12603/13907 [7:52:55<1:00:27,  2.78s/it][A
Training...:  91% 12604/13907 [7:52:58<1:02:39,  2.89s/it][A
Training...:  91% 12605/13907 [7:53:01<1:03:46,  2.94s/it][A
Training...:  91% 12606/13907 [7:53:04<1:03:33,  2.93s/it][A
Training...:  91% 12607/13907 [7:53:07<1:02:56,  2.91s/it][A
Training...:  91% 12608/13907 [7:53:09<1:02:17,  2.88s/it][A
Training...:  91% 12609/13907 [7:53:12<1:01:22,  2.84s/it][A
Training...:  91% 12610/13907 [7:53:15<1:00:18,  2.79s/it][A
Training...:  91% 12611/13907 [7:53:17<59:23,  2.75s/it]  [A
Training...:  91% 12612/13907 [7:53:20<58:26,  2.71s/it][A
Training...:  91% 12613/13907 [7:53:23<57:40,  2.67s/it][A
Training...:  91% 12614/13907 [7:53:25<56:52,  2.64s/it][A
Training...:  91% 12615/13907 [7:53:28<56:02,  2.60s/it][A
Training...:  91% 12616/13907 [7:53:30<55:08,  2.56s/it][A
Training...:  91% 12617/13907 [7:53:33<54:24,  2.53s/it][A
Training...:  91% 12618/13907 [7:53:35<53:42,  2.50s/it][A
Training...:  91% 12619/13907 [7:53:37<53:10,  2.48s/it][A
Training...:  91% 12620/13907 [7:53:40<52:16,  2.44s/it][A
Training...:  91% 12621/13907 [7:53:42<51:30,  2.40s/it][A
Training...:  91% 12622/13907 [7:53:44<50:47,  2.37s/it][A
Training...:  91% 12623/13907 [7:53:47<50:19,  2.35s/it][A
Training...:  91% 12624/13907 [7:53:49<49:23,  2.31s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:54:04<?, ?it/s]
Training...:  91% 12624/13907 [7:53:51<49:23,  2.31s/it][A
Training...:  91% 12625/13907 [7:53:51<50:32,  2.37s/it][A
Training...:  91% 12626/13907 [7:53:54<49:40,  2.33s/it][A
Training...:  91% 12627/13907 [7:53:56<48:30,  2.27s/it][A
Training...:  91% 12628/13907 [7:53:58<47:28,  2.23s/it][A
Training...:  91% 12629/13907 [7:54:00<46:31,  2.18s/it][A
Training...:  91% 12630/13907 [7:54:02<45:33,  2.14s/it][A
Training...:  91% 12631/13907 [7:54:04<44:50,  2.11s/it][A
Training...:  91% 12632/13907 [7:54:06<44:11,  2.08s/it][A
Training...:  91% 12633/13907 [7:54:08<43:57,  2.07s/it][A
Training...:  91% 12634/13907 [7:54:10<43:18,  2.04s/it][A
Training...:  91% 12635/13907 [7:54:12<42:26,  2.00s/it][A
Training...:  91% 12636/13907 [7:54:14<41:44,  1.97s/it][A
Training...:  91% 12637/13907 [7:54:16<41:01,  1.94s/it][A
Training...:  91% 12638/13907 [7:54:18<40:13,  1.90s/it][A
Training...:  91% 12639/13907 [7:54:19<39:43,  1.88s/it][A
Training...:  91% 12640/13907 [7:54:21<38:48,  1.84s/it][A
Training...:  91% 12641/13907 [7:54:23<38:03,  1.80s/it][A
Training...:  91% 12642/13907 [7:54:25<37:30,  1.78s/it][A
Training...:  91% 12643/13907 [7:54:26<36:35,  1.74s/it][A
Training...:  91% 12644/13907 [7:54:28<35:29,  1.69s/it][A
Training...:  91% 12645/13907 [7:54:29<34:37,  1.65s/it][A
Training...:  91% 12646/13907 [7:54:31<33:26,  1.59s/it][A
Training...:  91% 12647/13907 [7:54:32<32:12,  1.53s/it][A
Training...:  91% 12648/13907 [7:54:34<30:57,  1.48s/it][A
Training...:  91% 12649/13907 [7:54:35<29:30,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:54:48<?, ?it/s]
Training...:  91% 12649/13907 [7:54:36<29:30,  1.41s/it][A
Training...:  91% 12650/13907 [7:54:36<28:39,  1.37s/it][A
Training...:  91% 12651/13907 [7:54:40<45:02,  2.15s/it][A
Training...:  91% 12652/13907 [7:54:44<53:15,  2.55s/it][A
Training...:  91% 12653/13907 [7:54:47<57:47,  2.77s/it][A
Training...:  91% 12654/13907 [7:54:50<1:00:10,  2.88s/it][A
Training...:  91% 12655/13907 [7:54:53<1:01:12,  2.93s/it][A
Training...:  91% 12656/13907 [7:54:56<1:01:12,  2.94s/it][A
Training...:  91% 12657/13907 [7:54:59<1:01:02,  2.93s/it][A
Training...:  91% 12658/13907 [7:55:02<1:00:22,  2.90s/it][A
Training...:  91% 12659/13907 [7:55:05<59:26,  2.86s/it]  [A
Training...:  91% 12660/13907 [7:55:07<58:43,  2.83s/it][A
Training...:  91% 12661/13907 [7:55:10<57:46,  2.78s/it][A
Training...:  91% 12662/13907 [7:55:13<56:53,  2.74s/it][A
Training...:  91% 12663/13907 [7:55:15<55:55,  2.70s/it][A
Training...:  91% 12664/13907 [7:55:18<54:58,  2.65s/it][A
Training...:  91% 12665/13907 [7:55:20<54:10,  2.62s/it][A
Training...:  91% 12666/13907 [7:55:23<53:21,  2.58s/it][A
Training...:  91% 12667/13907 [7:55:25<52:44,  2.55s/it][A
Training...:  91% 12668/13907 [7:55:28<52:07,  2.52s/it][A
Training...:  91% 12669/13907 [7:55:30<51:24,  2.49s/it][A
Training...:  91% 12670/13907 [7:55:32<50:33,  2.45s/it][A
Training...:  91% 12671/13907 [7:55:35<49:45,  2.42s/it][A
Training...:  91% 12672/13907 [7:55:37<49:28,  2.40s/it][A
Training...:  91% 12673/13907 [7:55:39<48:30,  2.36s/it][A
Training...:  91% 12674/13907 [7:55:42<47:36,  2.32s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:55:56<?, ?it/s]
Training...:  91% 12674/13907 [7:55:44<47:36,  2.32s/it][A
Training...:  91% 12675/13907 [7:55:44<48:32,  2.36s/it][A
Training...:  91% 12676/13907 [7:55:46<47:37,  2.32s/it][A
Training...:  91% 12677/13907 [7:55:49<46:53,  2.29s/it][A
Training...:  91% 12678/13907 [7:55:51<45:24,  2.22s/it][A
Training...:  91% 12679/13907 [7:55:53<44:34,  2.18s/it][A
Training...:  91% 12680/13907 [7:55:55<43:35,  2.13s/it][A
Training...:  91% 12681/13907 [7:55:57<42:53,  2.10s/it][A
Training...:  91% 12682/13907 [7:55:59<42:12,  2.07s/it][A
Training...:  91% 12683/13907 [7:56:01<41:13,  2.02s/it][A
Training...:  91% 12684/13907 [7:56:03<40:28,  1.99s/it][A
Training...:  91% 12685/13907 [7:56:04<39:51,  1.96s/it][A
Training...:  91% 12686/13907 [7:56:06<39:06,  1.92s/it][A
Training...:  91% 12687/13907 [7:56:08<38:24,  1.89s/it][A
Training...:  91% 12688/13907 [7:56:10<37:39,  1.85s/it][A
Training...:  91% 12689/13907 [7:56:12<36:53,  1.82s/it][A
Training...:  91% 12690/13907 [7:56:13<36:12,  1.79s/it][A
Training...:  91% 12691/13907 [7:56:15<35:37,  1.76s/it][A
Training...:  91% 12692/13907 [7:56:17<34:59,  1.73s/it][A
Training...:  91% 12693/13907 [7:56:18<34:18,  1.70s/it][A
Training...:  91% 12694/13907 [7:56:20<33:38,  1.66s/it][A
Training...:  91% 12695/13907 [7:56:21<32:41,  1.62s/it][A
Training...:  91% 12696/13907 [7:56:23<31:36,  1.57s/it][A
Training...:  91% 12697/13907 [7:56:24<30:28,  1.51s/it][A
Training...:  91% 12698/13907 [7:56:26<29:18,  1.45s/it][A
Training...:  91% 12699/13907 [7:56:27<27:53,  1.39s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:56:40<?, ?it/s]
Training...:  91% 12699/13907 [7:56:28<27:53,  1.39s/it][A
Training...:  91% 12700/13907 [7:56:28<27:20,  1.36s/it][A
Training...:  91% 12701/13907 [7:56:32<41:52,  2.08s/it][A
Training...:  91% 12702/13907 [7:56:35<50:05,  2.49s/it][A
Training...:  91% 12703/13907 [7:56:39<54:47,  2.73s/it][A
Training...:  91% 12704/13907 [7:56:42<57:29,  2.87s/it][A
Training...:  91% 12705/13907 [7:56:45<58:56,  2.94s/it][A
Training...:  91% 12706/13907 [7:56:48<59:35,  2.98s/it][A
Training...:  91% 12707/13907 [7:56:51<1:00:06,  3.01s/it][A
Training...:  91% 12708/13907 [7:56:54<59:46,  2.99s/it]  [A
Training...:  91% 12709/13907 [7:56:57<59:01,  2.96s/it][A
Training...:  91% 12710/13907 [7:57:00<58:05,  2.91s/it][A
Training...:  91% 12711/13907 [7:57:02<56:57,  2.86s/it][A
Training...:  91% 12712/13907 [7:57:05<55:59,  2.81s/it][A
Training...:  91% 12713/13907 [7:57:08<54:54,  2.76s/it][A
Training...:  91% 12714/13907 [7:57:10<53:59,  2.72s/it][A
Training...:  91% 12715/13907 [7:57:13<53:09,  2.68s/it][A
Training...:  91% 12716/13907 [7:57:15<52:28,  2.64s/it][A
Training...:  91% 12717/13907 [7:57:18<51:46,  2.61s/it][A
Training...:  91% 12718/13907 [7:57:20<50:42,  2.56s/it][A
Training...:  91% 12719/13907 [7:57:23<49:38,  2.51s/it][A
Training...:  91% 12720/13907 [7:57:25<48:46,  2.47s/it][A
Training...:  91% 12721/13907 [7:57:28<48:03,  2.43s/it][A
Training...:  91% 12722/13907 [7:57:30<47:28,  2.40s/it][A
Training...:  91% 12723/13907 [7:57:32<46:32,  2.36s/it][A
Training...:  91% 12724/13907 [7:57:34<45:39,  2.32s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:57:49<?, ?it/s]
Training...:  91% 12724/13907 [7:57:37<45:39,  2.32s/it][A
Training...:  92% 12725/13907 [7:57:37<46:42,  2.37s/it][A
Training...:  92% 12726/13907 [7:57:39<45:52,  2.33s/it][A
Training...:  92% 12727/13907 [7:57:41<44:46,  2.28s/it][A
Training...:  92% 12728/13907 [7:57:43<43:36,  2.22s/it][A
Training...:  92% 12729/13907 [7:57:45<43:05,  2.19s/it][A
Training...:  92% 12730/13907 [7:57:48<42:27,  2.16s/it][A
Training...:  92% 12731/13907 [7:57:50<41:32,  2.12s/it][A
Training...:  92% 12732/13907 [7:57:52<40:36,  2.07s/it][A
Training...:  92% 12733/13907 [7:57:54<39:51,  2.04s/it][A
Training...:  92% 12734/13907 [7:57:55<39:05,  2.00s/it][A
Training...:  92% 12735/13907 [7:57:57<38:29,  1.97s/it][A
Training...:  92% 12736/13907 [7:57:59<37:45,  1.93s/it][A
Training...:  92% 12737/13907 [7:58:01<37:04,  1.90s/it][A
Training...:  92% 12738/13907 [7:58:03<36:46,  1.89s/it][A
Training...:  92% 12739/13907 [7:58:05<35:54,  1.84s/it][A
Training...:  92% 12740/13907 [7:58:06<35:11,  1.81s/it][A
Training...:  92% 12741/13907 [7:58:08<34:36,  1.78s/it][A
Training...:  92% 12742/13907 [7:58:10<34:01,  1.75s/it][A
Training...:  92% 12743/13907 [7:58:11<33:30,  1.73s/it][A
Training...:  92% 12744/13907 [7:58:13<32:49,  1.69s/it][A
Training...:  92% 12745/13907 [7:58:15<32:06,  1.66s/it][A
Training...:  92% 12746/13907 [7:58:16<31:06,  1.61s/it][A
Training...:  92% 12747/13907 [7:58:17<29:56,  1.55s/it][A
Training...:  92% 12748/13907 [7:58:19<28:39,  1.48s/it][A
Training...:  92% 12749/13907 [7:58:20<27:22,  1.42s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:58:34<?, ?it/s]
Training...:  92% 12749/13907 [7:58:21<27:22,  1.42s/it][A
Training...:  92% 12750/13907 [7:58:21<26:44,  1.39s/it][A
Training...:  92% 12751/13907 [7:58:25<41:21,  2.15s/it][A
Training...:  92% 12752/13907 [7:58:29<49:08,  2.55s/it][A
Training...:  92% 12753/13907 [7:58:32<54:02,  2.81s/it][A
Training...:  92% 12754/13907 [7:58:35<56:32,  2.94s/it][A
Training...:  92% 12755/13907 [7:58:39<57:26,  2.99s/it][A
Training...:  92% 12756/13907 [7:58:42<57:20,  2.99s/it][A
Training...:  92% 12757/13907 [7:58:44<56:43,  2.96s/it][A
Training...:  92% 12758/13907 [7:58:47<55:59,  2.92s/it][A
Training...:  92% 12759/13907 [7:58:50<55:05,  2.88s/it][A
Training...:  92% 12760/13907 [7:58:53<54:02,  2.83s/it][A
Training...:  92% 12761/13907 [7:58:55<53:06,  2.78s/it][A
Training...:  92% 12762/13907 [7:58:58<52:07,  2.73s/it][A
Training...:  92% 12763/13907 [7:59:01<51:12,  2.69s/it][A
Training...:  92% 12764/13907 [7:59:03<50:11,  2.63s/it][A
Training...:  92% 12765/13907 [7:59:06<49:22,  2.59s/it][A
Training...:  92% 12766/13907 [7:59:08<48:36,  2.56s/it][A
Training...:  92% 12767/13907 [7:59:11<47:54,  2.52s/it][A
Training...:  92% 12768/13907 [7:59:13<47:18,  2.49s/it][A
Training...:  92% 12769/13907 [7:59:15<46:37,  2.46s/it][A
Training...:  92% 12770/13907 [7:59:18<45:57,  2.43s/it][A
Training...:  92% 12771/13907 [7:59:20<45:21,  2.40s/it][A
Training...:  92% 12772/13907 [7:59:22<44:37,  2.36s/it][A
Training...:  92% 12773/13907 [7:59:25<43:59,  2.33s/it][A
Training...:  92% 12774/13907 [7:59:27<43:20,  2.30s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [7:59:42<?, ?it/s]
Training...:  92% 12774/13907 [7:59:29<43:20,  2.30s/it][A
Training...:  92% 12775/13907 [7:59:29<44:23,  2.35s/it][A
Training...:  92% 12776/13907 [7:59:31<43:29,  2.31s/it][A
Training...:  92% 12777/13907 [7:59:34<42:21,  2.25s/it][A
Training...:  92% 12778/13907 [7:59:36<41:15,  2.19s/it][A
Training...:  92% 12779/13907 [7:59:38<40:18,  2.14s/it][A
Training...:  92% 12780/13907 [7:59:40<39:32,  2.11s/it][A
Training...:  92% 12781/13907 [7:59:42<38:58,  2.08s/it][A
Training...:  92% 12782/13907 [7:59:44<38:20,  2.04s/it][A
Training...:  92% 12783/13907 [7:59:46<37:43,  2.01s/it][A
Training...:  92% 12784/13907 [7:59:48<37:06,  1.98s/it][A
Training...:  92% 12785/13907 [7:59:49<36:35,  1.96s/it][A
Training...:  92% 12786/13907 [7:59:51<36:05,  1.93s/it][A
Training...:  92% 12787/13907 [7:59:53<35:24,  1.90s/it][A
Training...:  92% 12788/13907 [7:59:55<34:45,  1.86s/it][A
Training...:  92% 12789/13907 [7:59:57<34:00,  1.82s/it][A
Training...:  92% 12790/13907 [7:59:58<33:22,  1.79s/it][A
Training...:  92% 12791/13907 [8:00:00<32:42,  1.76s/it][A
Training...:  92% 12792/13907 [8:00:02<32:06,  1.73s/it][A
Training...:  92% 12793/13907 [8:00:03<31:27,  1.69s/it][A
Training...:  92% 12794/13907 [8:00:05<30:50,  1.66s/it][A
Training...:  92% 12795/13907 [8:00:06<30:08,  1.63s/it][A
Training...:  92% 12796/13907 [8:00:08<29:14,  1.58s/it][A
Training...:  92% 12797/13907 [8:00:09<28:12,  1.53s/it][A
Training...:  92% 12798/13907 [8:00:11<27:04,  1.46s/it][A
Training...:  92% 12799/13907 [8:00:12<25:48,  1.40s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:00:26<?, ?it/s]
Training...:  92% 12799/13907 [8:00:13<25:48,  1.40s/it][A
Training...:  92% 12800/13907 [8:00:13<25:22,  1.38s/it][A
Training...:  92% 12801/13907 [8:00:17<39:12,  2.13s/it][A
Training...:  92% 12802/13907 [8:00:21<46:19,  2.52s/it][A
Training...:  92% 12803/13907 [8:00:24<50:32,  2.75s/it][A
Training...:  92% 12804/13907 [8:00:27<52:39,  2.86s/it][A
Training...:  92% 12805/13907 [8:00:30<53:44,  2.93s/it][A
Training...:  92% 12806/13907 [8:00:33<53:49,  2.93s/it][A
Training...:  92% 12807/13907 [8:00:36<53:42,  2.93s/it][A
Training...:  92% 12808/13907 [8:00:39<53:09,  2.90s/it][A
Training...:  92% 12809/13907 [8:00:41<52:17,  2.86s/it][A
Training...:  92% 12810/13907 [8:00:44<51:27,  2.81s/it][A
Training...:  92% 12811/13907 [8:00:47<50:49,  2.78s/it][A
Training...:  92% 12812/13907 [8:00:50<49:55,  2.74s/it][A
Training...:  92% 12813/13907 [8:00:52<49:19,  2.71s/it][A
Training...:  92% 12814/13907 [8:00:55<48:34,  2.67s/it][A
Training...:  92% 12815/13907 [8:00:57<47:50,  2.63s/it][A
Training...:  92% 12816/13907 [8:01:00<46:58,  2.58s/it][A
Training...:  92% 12817/13907 [8:01:02<46:31,  2.56s/it][A
Training...:  92% 12818/13907 [8:01:05<45:53,  2.53s/it][A
Training...:  92% 12819/13907 [8:01:07<45:06,  2.49s/it][A
Training...:  92% 12820/13907 [8:01:10<44:48,  2.47s/it][A
Training...:  92% 12821/13907 [8:01:12<44:17,  2.45s/it][A
Training...:  92% 12822/13907 [8:01:14<43:33,  2.41s/it][A
Training...:  92% 12823/13907 [8:01:16<42:43,  2.36s/it][A
Training...:  92% 12824/13907 [8:01:19<42:02,  2.33s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:01:34<?, ?it/s]
Training...:  92% 12824/13907 [8:01:21<42:02,  2.33s/it][A
Training...:  92% 12825/13907 [8:01:21<43:05,  2.39s/it][A
Training...:  92% 12826/13907 [8:01:24<42:23,  2.35s/it][A
Training...:  92% 12827/13907 [8:01:26<41:19,  2.30s/it][A
Training...:  92% 12828/13907 [8:01:28<40:22,  2.24s/it][A
Training...:  92% 12829/13907 [8:01:30<39:31,  2.20s/it][A
Training...:  92% 12830/13907 [8:01:32<38:44,  2.16s/it][A
Training...:  92% 12831/13907 [8:01:34<38:06,  2.12s/it][A
Training...:  92% 12832/13907 [8:01:36<37:25,  2.09s/it][A
Training...:  92% 12833/13907 [8:01:38<36:50,  2.06s/it][A
Training...:  92% 12834/13907 [8:01:40<36:11,  2.02s/it][A
Training...:  92% 12835/13907 [8:01:42<35:26,  1.98s/it][A
Training...:  92% 12836/13907 [8:01:44<34:46,  1.95s/it][A
Training...:  92% 12837/13907 [8:01:46<34:09,  1.92s/it][A
Training...:  92% 12838/13907 [8:01:47<33:22,  1.87s/it][A
Training...:  92% 12839/13907 [8:01:49<32:38,  1.83s/it][A
Training...:  92% 12840/13907 [8:01:51<31:58,  1.80s/it][A
Training...:  92% 12841/13907 [8:01:52<31:17,  1.76s/it][A
Training...:  92% 12842/13907 [8:01:54<30:40,  1.73s/it][A
Training...:  92% 12843/13907 [8:01:56<30:02,  1.69s/it][A
Training...:  92% 12844/13907 [8:01:57<29:41,  1.68s/it][A
Training...:  92% 12845/13907 [8:01:59<28:42,  1.62s/it][A
Training...:  92% 12846/13907 [8:02:00<27:45,  1.57s/it][A
Training...:  92% 12847/13907 [8:02:02<26:45,  1.51s/it][A
Training...:  92% 12848/13907 [8:02:03<25:39,  1.45s/it][A
Training...:  92% 12849/13907 [8:02:04<24:27,  1.39s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:02:18<?, ?it/s]
Training...:  92% 12849/13907 [8:02:06<24:27,  1.39s/it][A
Training...:  92% 12850/13907 [8:02:06<23:56,  1.36s/it][A
Training...:  92% 12851/13907 [8:02:09<36:54,  2.10s/it][A
Training...:  92% 12852/13907 [8:02:13<44:20,  2.52s/it][A
Training...:  92% 12853/13907 [8:02:16<48:12,  2.74s/it][A
Training...:  92% 12854/13907 [8:02:19<50:34,  2.88s/it][A
Training...:  92% 12855/13907 [8:02:22<51:32,  2.94s/it][A
Training...:  92% 12856/13907 [8:02:25<51:38,  2.95s/it][A
Training...:  92% 12857/13907 [8:02:28<51:33,  2.95s/it][A
Training...:  92% 12858/13907 [8:02:31<51:04,  2.92s/it][A
Training...:  92% 12859/13907 [8:02:34<50:22,  2.88s/it][A
Training...:  92% 12860/13907 [8:02:37<49:35,  2.84s/it][A
Training...:  92% 12861/13907 [8:02:39<48:49,  2.80s/it][A
Training...:  92% 12862/13907 [8:02:42<48:00,  2.76s/it][A
Training...:  92% 12863/13907 [8:02:45<47:13,  2.71s/it][A
Training...:  93% 12864/13907 [8:02:47<46:10,  2.66s/it][A
Training...:  93% 12865/13907 [8:02:50<45:19,  2.61s/it][A
Training...:  93% 12866/13907 [8:02:52<44:32,  2.57s/it][A
Training...:  93% 12867/13907 [8:02:55<43:43,  2.52s/it][A
Training...:  93% 12868/13907 [8:02:57<43:08,  2.49s/it][A
Training...:  93% 12869/13907 [8:02:59<42:42,  2.47s/it][A
Training...:  93% 12870/13907 [8:03:02<42:06,  2.44s/it][A
Training...:  93% 12871/13907 [8:03:04<41:23,  2.40s/it][A
Training...:  93% 12872/13907 [8:03:06<40:44,  2.36s/it][A
Training...:  93% 12873/13907 [8:03:09<39:57,  2.32s/it][A
Training...:  93% 12874/13907 [8:03:11<39:13,  2.28s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:03:26<?, ?it/s]
Training...:  93% 12874/13907 [8:03:13<39:13,  2.28s/it][A
Training...:  93% 12875/13907 [8:03:13<40:05,  2.33s/it][A
Training...:  93% 12876/13907 [8:03:15<39:24,  2.29s/it][A
Training...:  93% 12877/13907 [8:03:18<38:20,  2.23s/it][A
Training...:  93% 12878/13907 [8:03:20<37:27,  2.18s/it][A
Training...:  93% 12879/13907 [8:03:22<36:45,  2.15s/it][A
Training...:  93% 12880/13907 [8:03:24<36:15,  2.12s/it][A
Training...:  93% 12881/13907 [8:03:26<35:43,  2.09s/it][A
Training...:  93% 12882/13907 [8:03:28<35:17,  2.07s/it][A
Training...:  93% 12883/13907 [8:03:30<34:40,  2.03s/it][A
Training...:  93% 12884/13907 [8:03:32<34:12,  2.01s/it][A
Training...:  93% 12885/13907 [8:03:34<33:45,  1.98s/it][A
Training...:  93% 12886/13907 [8:03:35<33:15,  1.95s/it][A
Training...:  93% 12887/13907 [8:03:37<32:48,  1.93s/it][A
Training...:  93% 12888/13907 [8:03:39<32:10,  1.89s/it][A
Training...:  93% 12889/13907 [8:03:41<31:40,  1.87s/it][A
Training...:  93% 12890/13907 [8:03:43<30:57,  1.83s/it][A
Training...:  93% 12891/13907 [8:03:44<30:20,  1.79s/it][A
Training...:  93% 12892/13907 [8:03:46<29:50,  1.76s/it][A
Training...:  93% 12893/13907 [8:03:48<29:03,  1.72s/it][A
Training...:  93% 12894/13907 [8:03:49<28:24,  1.68s/it][A
Training...:  93% 12895/13907 [8:03:51<27:30,  1.63s/it][A
Training...:  93% 12896/13907 [8:03:52<26:44,  1.59s/it][A
Training...:  93% 12897/13907 [8:03:54<25:51,  1.54s/it][A
Training...:  93% 12898/13907 [8:03:55<24:50,  1.48s/it][A
Training...:  93% 12899/13907 [8:03:56<23:39,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:04:10<?, ?it/s]
Training...:  93% 12899/13907 [8:03:58<23:39,  1.41s/it][A
Training...:  93% 12900/13907 [8:03:58<23:07,  1.38s/it][A
Training...:  93% 12901/13907 [8:04:01<35:32,  2.12s/it][A
Training...:  93% 12902/13907 [8:04:05<42:14,  2.52s/it][A
Training...:  93% 12903/13907 [8:04:08<46:11,  2.76s/it][A
Training...:  93% 12904/13907 [8:04:11<48:19,  2.89s/it][A
Training...:  93% 12905/13907 [8:04:14<49:05,  2.94s/it][A
Training...:  93% 12906/13907 [8:04:18<49:40,  2.98s/it][A
Training...:  93% 12907/13907 [8:04:21<49:28,  2.97s/it][A
Training...:  93% 12908/13907 [8:04:23<48:37,  2.92s/it][A
Training...:  93% 12909/13907 [8:04:26<48:06,  2.89s/it][A
Training...:  93% 12910/13907 [8:04:29<47:05,  2.83s/it][A
Training...:  93% 12911/13907 [8:04:32<46:12,  2.78s/it][A
Training...:  93% 12912/13907 [8:04:34<45:27,  2.74s/it][A
Training...:  93% 12913/13907 [8:04:37<44:44,  2.70s/it][A
Training...:  93% 12914/13907 [8:04:39<44:05,  2.66s/it][A
Training...:  93% 12915/13907 [8:04:42<43:20,  2.62s/it][A
Training...:  93% 12916/13907 [8:04:44<42:37,  2.58s/it][A
Training...:  93% 12917/13907 [8:04:47<42:10,  2.56s/it][A
Training...:  93% 12918/13907 [8:04:49<41:29,  2.52s/it][A
Training...:  93% 12919/13907 [8:04:52<40:55,  2.49s/it][A
Training...:  93% 12920/13907 [8:04:54<40:21,  2.45s/it][A
Training...:  93% 12921/13907 [8:04:56<39:43,  2.42s/it][A
Training...:  93% 12922/13907 [8:04:59<39:01,  2.38s/it][A
Training...:  93% 12923/13907 [8:05:01<38:38,  2.36s/it][A
Training...:  93% 12924/13907 [8:05:03<38:12,  2.33s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:05:18<?, ?it/s]
Training...:  93% 12924/13907 [8:05:06<38:12,  2.33s/it][A
Training...:  93% 12925/13907 [8:05:06<39:10,  2.39s/it][A
Training...:  93% 12926/13907 [8:05:08<38:29,  2.35s/it][A
Training...:  93% 12927/13907 [8:05:10<37:41,  2.31s/it][A
Training...:  93% 12928/13907 [8:05:12<36:41,  2.25s/it][A
Training...:  93% 12929/13907 [8:05:14<35:50,  2.20s/it][A
Training...:  93% 12930/13907 [8:05:17<35:07,  2.16s/it][A
Training...:  93% 12931/13907 [8:05:19<34:30,  2.12s/it][A
Training...:  93% 12932/13907 [8:05:21<33:53,  2.09s/it][A
Training...:  93% 12933/13907 [8:05:23<33:23,  2.06s/it][A
Training...:  93% 12934/13907 [8:05:25<32:57,  2.03s/it][A
Training...:  93% 12935/13907 [8:05:26<32:13,  1.99s/it][A
Training...:  93% 12936/13907 [8:05:28<31:50,  1.97s/it][A
Training...:  93% 12937/13907 [8:05:30<31:20,  1.94s/it][A
Training...:  93% 12938/13907 [8:05:32<30:52,  1.91s/it][A
Training...:  93% 12939/13907 [8:05:34<30:11,  1.87s/it][A
Training...:  93% 12940/13907 [8:05:36<29:30,  1.83s/it][A
Training...:  93% 12941/13907 [8:05:37<29:02,  1.80s/it][A
Training...:  93% 12942/13907 [8:05:39<28:31,  1.77s/it][A
Training...:  93% 12943/13907 [8:05:41<28:04,  1.75s/it][A
Training...:  93% 12944/13907 [8:05:42<27:26,  1.71s/it][A
Training...:  93% 12945/13907 [8:05:44<26:41,  1.66s/it][A
Training...:  93% 12946/13907 [8:05:45<25:42,  1.60s/it][A
Training...:  93% 12947/13907 [8:05:47<24:45,  1.55s/it][A
Training...:  93% 12948/13907 [8:05:48<23:51,  1.49s/it][A
Training...:  93% 12949/13907 [8:05:49<22:46,  1.43s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:06:03<?, ?it/s]
Training...:  93% 12949/13907 [8:05:51<22:46,  1.43s/it][A
Training...:  93% 12950/13907 [8:05:51<22:11,  1.39s/it][A
Training...:  93% 12951/13907 [8:05:55<33:58,  2.13s/it][A
Training...:  93% 12952/13907 [8:05:58<40:17,  2.53s/it][A
Training...:  93% 12953/13907 [8:06:01<44:12,  2.78s/it][A
Training...:  93% 12954/13907 [8:06:04<45:47,  2.88s/it][A
Training...:  93% 12955/13907 [8:06:08<46:41,  2.94s/it][A
Training...:  93% 12956/13907 [8:06:11<46:50,  2.96s/it][A
Training...:  93% 12957/13907 [8:06:14<47:05,  2.97s/it][A
Training...:  93% 12958/13907 [8:06:16<46:20,  2.93s/it][A
Training...:  93% 12959/13907 [8:06:19<45:43,  2.89s/it][A
Training...:  93% 12960/13907 [8:06:22<44:56,  2.85s/it][A
Training...:  93% 12961/13907 [8:06:25<44:14,  2.81s/it][A
Training...:  93% 12962/13907 [8:06:27<43:34,  2.77s/it][A
Training...:  93% 12963/13907 [8:06:30<42:55,  2.73s/it][A
Training...:  93% 12964/13907 [8:06:33<42:25,  2.70s/it][A
Training...:  93% 12965/13907 [8:06:35<42:12,  2.69s/it][A
Training...:  93% 12966/13907 [8:06:38<41:20,  2.64s/it][A
Training...:  93% 12967/13907 [8:06:40<40:31,  2.59s/it][A
Training...:  93% 12968/13907 [8:06:43<39:42,  2.54s/it][A
Training...:  93% 12969/13907 [8:06:45<39:00,  2.49s/it][A
Training...:  93% 12970/13907 [8:06:47<38:26,  2.46s/it][A
Training...:  93% 12971/13907 [8:06:50<37:55,  2.43s/it][A
Training...:  93% 12972/13907 [8:06:52<37:21,  2.40s/it][A
Training...:  93% 12973/13907 [8:06:54<36:56,  2.37s/it][A
Training...:  93% 12974/13907 [8:06:57<36:22,  2.34s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:07:12<?, ?it/s]
Training...:  93% 12974/13907 [8:06:59<36:22,  2.34s/it][A
Training...:  93% 12975/13907 [8:06:59<37:13,  2.40s/it][A
Training...:  93% 12976/13907 [8:07:01<36:27,  2.35s/it][A
Training...:  93% 12977/13907 [8:07:04<35:38,  2.30s/it][A
Training...:  93% 12978/13907 [8:07:06<34:53,  2.25s/it][A
Training...:  93% 12979/13907 [8:07:08<34:04,  2.20s/it][A
Training...:  93% 12980/13907 [8:07:10<33:25,  2.16s/it][A
Training...:  93% 12981/13907 [8:07:12<32:47,  2.13s/it][A
Training...:  93% 12982/13907 [8:07:14<32:17,  2.09s/it][A
Training...:  93% 12983/13907 [8:07:16<31:56,  2.07s/it][A
Training...:  93% 12984/13907 [8:07:18<31:24,  2.04s/it][A
Training...:  93% 12985/13907 [8:07:20<30:53,  2.01s/it][A
Training...:  93% 12986/13907 [8:07:22<30:19,  1.98s/it][A
Training...:  93% 12987/13907 [8:07:24<29:47,  1.94s/it][A
Training...:  93% 12988/13907 [8:07:26<29:17,  1.91s/it][A
Training...:  93% 12989/13907 [8:07:27<28:56,  1.89s/it][A
Training...:  93% 12990/13907 [8:07:29<28:23,  1.86s/it][A
Training...:  93% 12991/13907 [8:07:31<27:46,  1.82s/it][A
Training...:  93% 12992/13907 [8:07:33<27:11,  1.78s/it][A
Training...:  93% 12993/13907 [8:07:34<26:34,  1.74s/it][A
Training...:  93% 12994/13907 [8:07:36<25:55,  1.70s/it][A
Training...:  93% 12995/13907 [8:07:37<25:14,  1.66s/it][A
Training...:  93% 12996/13907 [8:07:39<24:25,  1.61s/it][A
Training...:  93% 12997/13907 [8:07:40<23:38,  1.56s/it][A
Training...:  93% 12998/13907 [8:07:42<22:42,  1.50s/it][A
Training...:  93% 12999/13907 [8:07:43<21:30,  1.42s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:07:57<?, ?it/s]
Training...:  93% 12999/13907 [8:07:44<21:30,  1.42s/it][A
Training...:  93% 13000/13907 [8:07:44<20:52,  1.38s/it][A
Training...:  93% 13001/13907 [8:07:48<31:55,  2.11s/it][A
Training...:  93% 13002/13907 [8:07:52<38:02,  2.52s/it][A
Training...:  93% 13003/13907 [8:07:55<41:50,  2.78s/it][A
Training...:  94% 13004/13907 [8:07:58<43:28,  2.89s/it][A
Training...:  94% 13005/13907 [8:08:01<44:16,  2.94s/it][A
Training...:  94% 13006/13907 [8:08:04<44:39,  2.97s/it][A
Training...:  94% 13007/13907 [8:08:07<44:35,  2.97s/it][A
Training...:  94% 13008/13907 [8:08:10<44:13,  2.95s/it][A
Training...:  94% 13009/13907 [8:08:13<44:06,  2.95s/it][A
Training...:  94% 13010/13907 [8:08:16<43:24,  2.90s/it][A
Training...:  94% 13011/13907 [8:08:19<42:28,  2.84s/it][A
Training...:  94% 13012/13907 [8:08:21<41:39,  2.79s/it][A
Training...:  94% 13013/13907 [8:08:24<40:53,  2.74s/it][A
Training...:  94% 13014/13907 [8:08:26<40:21,  2.71s/it][A
Training...:  94% 13015/13907 [8:08:29<39:25,  2.65s/it][A
Training...:  94% 13016/13907 [8:08:31<38:31,  2.59s/it][A
Training...:  94% 13017/13907 [8:08:34<37:53,  2.55s/it][A
Training...:  94% 13018/13907 [8:08:36<37:09,  2.51s/it][A
Training...:  94% 13019/13907 [8:08:39<36:34,  2.47s/it][A
Training...:  94% 13020/13907 [8:08:41<35:56,  2.43s/it][A
Training...:  94% 13021/13907 [8:08:43<35:25,  2.40s/it][A
Training...:  94% 13022/13907 [8:08:46<34:43,  2.35s/it][A
Training...:  94% 13023/13907 [8:08:48<34:15,  2.33s/it][A
Training...:  94% 13024/13907 [8:08:50<33:45,  2.29s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:09:05<?, ?it/s]
Training...:  94% 13024/13907 [8:08:53<33:45,  2.29s/it][A
Training...:  94% 13025/13907 [8:08:53<34:37,  2.36s/it][A
Training...:  94% 13026/13907 [8:08:55<33:57,  2.31s/it][A
Training...:  94% 13027/13907 [8:08:57<33:07,  2.26s/it][A
Training...:  94% 13028/13907 [8:08:59<32:21,  2.21s/it][A
Training...:  94% 13029/13907 [8:09:01<31:44,  2.17s/it][A
Training...:  94% 13030/13907 [8:09:03<31:22,  2.15s/it][A
Training...:  94% 13031/13907 [8:09:05<30:57,  2.12s/it][A
Training...:  94% 13032/13907 [8:09:07<30:38,  2.10s/it][A
Training...:  94% 13033/13907 [8:09:09<30:07,  2.07s/it][A
Training...:  94% 13034/13907 [8:09:11<29:36,  2.04s/it][A
Training...:  94% 13035/13907 [8:09:13<29:02,  2.00s/it][A
Training...:  94% 13036/13907 [8:09:15<28:28,  1.96s/it][A
Training...:  94% 13037/13907 [8:09:17<28:13,  1.95s/it][A
Training...:  94% 13038/13907 [8:09:19<27:40,  1.91s/it][A
Training...:  94% 13039/13907 [8:09:21<27:06,  1.87s/it][A
Training...:  94% 13040/13907 [8:09:22<26:35,  1.84s/it][A
Training...:  94% 13041/13907 [8:09:24<26:02,  1.80s/it][A
Training...:  94% 13042/13907 [8:09:26<25:26,  1.76s/it][A
Training...:  94% 13043/13907 [8:09:27<24:48,  1.72s/it][A
Training...:  94% 13044/13907 [8:09:29<24:17,  1.69s/it][A
Training...:  94% 13045/13907 [8:09:30<23:40,  1.65s/it][A
Training...:  94% 13046/13907 [8:09:32<23:01,  1.60s/it][A
Training...:  94% 13047/13907 [8:09:33<22:09,  1.55s/it][A
Training...:  94% 13048/13907 [8:09:35<21:19,  1.49s/it][A
Training...:  94% 13049/13907 [8:09:36<20:13,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:09:50<?, ?it/s]
Training...:  94% 13049/13907 [8:09:37<20:13,  1.41s/it][A
Training...:  94% 13050/13907 [8:09:37<19:37,  1.37s/it][A
Training...:  94% 13051/13907 [8:09:41<30:23,  2.13s/it][A
Training...:  94% 13052/13907 [8:09:45<36:04,  2.53s/it][A
Training...:  94% 13053/13907 [8:09:48<39:11,  2.75s/it][A
Training...:  94% 13054/13907 [8:09:51<40:56,  2.88s/it][A
Training...:  94% 13055/13907 [8:09:54<41:44,  2.94s/it][A
Training...:  94% 13056/13907 [8:09:57<41:46,  2.95s/it][A
Training...:  94% 13057/13907 [8:10:00<41:44,  2.95s/it][A
Training...:  94% 13058/13907 [8:10:03<41:33,  2.94s/it][A
Training...:  94% 13059/13907 [8:10:06<41:09,  2.91s/it][A
Training...:  94% 13060/13907 [8:10:09<40:39,  2.88s/it][A
Training...:  94% 13061/13907 [8:10:11<40:12,  2.85s/it][A
Training...:  94% 13062/13907 [8:10:14<39:18,  2.79s/it][A
Training...:  94% 13063/13907 [8:10:17<38:34,  2.74s/it][A
Training...:  94% 13064/13907 [8:10:19<37:57,  2.70s/it][A
Training...:  94% 13065/13907 [8:10:22<37:10,  2.65s/it][A
Training...:  94% 13066/13907 [8:10:24<36:30,  2.60s/it][A
Training...:  94% 13067/13907 [8:10:27<35:49,  2.56s/it][A
Training...:  94% 13068/13907 [8:10:29<35:16,  2.52s/it][A
Training...:  94% 13069/13907 [8:10:32<34:40,  2.48s/it][A
Training...:  94% 13070/13907 [8:10:34<34:07,  2.45s/it][A
Training...:  94% 13071/13907 [8:10:36<33:48,  2.43s/it][A
Training...:  94% 13072/13907 [8:10:39<33:15,  2.39s/it][A
Training...:  94% 13073/13907 [8:10:41<32:52,  2.36s/it][A
Training...:  94% 13074/13907 [8:10:43<32:22,  2.33s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:10:58<?, ?it/s]
Training...:  94% 13074/13907 [8:10:46<32:22,  2.33s/it][A
Training...:  94% 13075/13907 [8:10:46<33:05,  2.39s/it][A
Training...:  94% 13076/13907 [8:10:48<32:23,  2.34s/it][A
Training...:  94% 13077/13907 [8:10:50<31:29,  2.28s/it][A
Training...:  94% 13078/13907 [8:10:52<30:50,  2.23s/it][A
Training...:  94% 13079/13907 [8:10:54<30:13,  2.19s/it][A
Training...:  94% 13080/13907 [8:10:56<29:37,  2.15s/it][A
Training...:  94% 13081/13907 [8:10:58<29:12,  2.12s/it][A
Training...:  94% 13082/13907 [8:11:00<28:50,  2.10s/it][A
Training...:  94% 13083/13907 [8:11:02<28:25,  2.07s/it][A
Training...:  94% 13084/13907 [8:11:04<27:54,  2.03s/it][A
Training...:  94% 13085/13907 [8:11:06<27:23,  2.00s/it][A
Training...:  94% 13086/13907 [8:11:08<26:53,  1.96s/it][A
Training...:  94% 13087/13907 [8:11:10<26:20,  1.93s/it][A
Training...:  94% 13088/13907 [8:11:12<25:46,  1.89s/it][A
Training...:  94% 13089/13907 [8:11:14<25:20,  1.86s/it][A
Training...:  94% 13090/13907 [8:11:15<24:46,  1.82s/it][A
Training...:  94% 13091/13907 [8:11:17<24:17,  1.79s/it][A
Training...:  94% 13092/13907 [8:11:19<23:46,  1.75s/it][A
Training...:  94% 13093/13907 [8:11:20<23:15,  1.71s/it][A
Training...:  94% 13094/13907 [8:11:22<22:49,  1.68s/it][A
Training...:  94% 13095/13907 [8:11:24<22:06,  1.63s/it][A
Training...:  94% 13096/13907 [8:11:25<21:19,  1.58s/it][A
Training...:  94% 13097/13907 [8:11:26<20:36,  1.53s/it][A
Training...:  94% 13098/13907 [8:11:28<19:43,  1.46s/it][A
Training...:  94% 13099/13907 [8:11:29<18:43,  1.39s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:11:42<?, ?it/s]
Training...:  94% 13099/13907 [8:11:30<18:43,  1.39s/it][A
Training...:  94% 13100/13907 [8:11:30<18:10,  1.35s/it][A
Training...:  94% 13101/13907 [8:11:34<28:03,  2.09s/it][A
Training...:  94% 13102/13907 [8:11:38<34:07,  2.54s/it][A
Training...:  94% 13103/13907 [8:11:41<36:59,  2.76s/it][A
Training...:  94% 13104/13907 [8:11:44<38:28,  2.87s/it][A
Training...:  94% 13105/13907 [8:11:47<39:15,  2.94s/it][A
Training...:  94% 13106/13907 [8:11:50<39:23,  2.95s/it][A
Training...:  94% 13107/13907 [8:11:53<39:17,  2.95s/it][A
Training...:  94% 13108/13907 [8:11:56<38:54,  2.92s/it][A
Training...:  94% 13109/13907 [8:11:59<38:34,  2.90s/it][A
Training...:  94% 13110/13907 [8:12:01<37:46,  2.84s/it][A
Training...:  94% 13111/13907 [8:12:04<37:09,  2.80s/it][A
Training...:  94% 13112/13907 [8:12:07<36:56,  2.79s/it][A
Training...:  94% 13113/13907 [8:12:10<36:36,  2.77s/it][A
Training...:  94% 13114/13907 [8:12:12<36:07,  2.73s/it][A
Training...:  94% 13115/13907 [8:12:15<35:43,  2.71s/it][A
Training...:  94% 13116/13907 [8:12:17<35:16,  2.68s/it][A
Training...:  94% 13117/13907 [8:12:20<34:45,  2.64s/it][A
Training...:  94% 13118/13907 [8:12:23<34:16,  2.61s/it][A
Training...:  94% 13119/13907 [8:12:25<33:47,  2.57s/it][A
Training...:  94% 13120/13907 [8:12:28<33:14,  2.53s/it][A
Training...:  94% 13121/13907 [8:12:30<32:48,  2.50s/it][A
Training...:  94% 13122/13907 [8:12:32<32:14,  2.46s/it][A
Training...:  94% 13123/13907 [8:12:35<31:54,  2.44s/it][A
Training...:  94% 13124/13907 [8:12:37<31:22,  2.40s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:12:52<?, ?it/s]
Training...:  94% 13124/13907 [8:12:40<31:22,  2.40s/it][A
Training...:  94% 13125/13907 [8:12:40<32:07,  2.46s/it][A
Training...:  94% 13126/13907 [8:12:42<31:17,  2.40s/it][A
Training...:  94% 13127/13907 [8:12:44<30:22,  2.34s/it][A
Training...:  94% 13128/13907 [8:12:46<29:31,  2.27s/it][A
Training...:  94% 13129/13907 [8:12:48<28:53,  2.23s/it][A
Training...:  94% 13130/13907 [8:12:50<28:13,  2.18s/it][A
Training...:  94% 13131/13907 [8:12:52<27:38,  2.14s/it][A
Training...:  94% 13132/13907 [8:12:54<27:17,  2.11s/it][A
Training...:  94% 13133/13907 [8:12:56<26:45,  2.07s/it][A
Training...:  94% 13134/13907 [8:12:58<26:14,  2.04s/it][A
Training...:  94% 13135/13907 [8:13:00<25:41,  2.00s/it][A
Training...:  94% 13136/13907 [8:13:02<25:14,  1.96s/it][A
Training...:  94% 13137/13907 [8:13:04<24:44,  1.93s/it][A
Training...:  94% 13138/13907 [8:13:06<24:20,  1.90s/it][A
Training...:  94% 13139/13907 [8:13:08<23:52,  1.87s/it][A
Training...:  94% 13140/13907 [8:13:09<23:30,  1.84s/it][A
Training...:  94% 13141/13907 [8:13:11<23:06,  1.81s/it][A
Training...:  94% 13142/13907 [8:13:13<22:30,  1.77s/it][A
Training...:  95% 13143/13907 [8:13:14<21:54,  1.72s/it][A
Training...:  95% 13144/13907 [8:13:16<21:23,  1.68s/it][A
Training...:  95% 13145/13907 [8:13:18<20:54,  1.65s/it][A
Training...:  95% 13146/13907 [8:13:19<20:16,  1.60s/it][A
Training...:  95% 13147/13907 [8:13:21<19:35,  1.55s/it][A
Training...:  95% 13148/13907 [8:13:22<18:44,  1.48s/it][A
Training...:  95% 13149/13907 [8:13:23<17:47,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:13:37<?, ?it/s]
Training...:  95% 13149/13907 [8:13:24<17:47,  1.41s/it][A
Training...:  95% 13150/13907 [8:13:24<17:26,  1.38s/it][A
Training...:  95% 13151/13907 [8:13:28<26:52,  2.13s/it][A
Training...:  95% 13152/13907 [8:13:32<31:45,  2.52s/it][A
Training...:  95% 13153/13907 [8:13:35<34:57,  2.78s/it][A
Training...:  95% 13154/13907 [8:13:38<36:17,  2.89s/it][A
Training...:  95% 13155/13907 [8:13:41<36:52,  2.94s/it][A
Training...:  95% 13156/13907 [8:13:44<36:59,  2.95s/it][A
Training...:  95% 13157/13907 [8:13:47<36:47,  2.94s/it][A
Training...:  95% 13158/13907 [8:13:50<36:24,  2.92s/it][A
Training...:  95% 13159/13907 [8:13:53<35:58,  2.89s/it][A
Training...:  95% 13160/13907 [8:13:56<35:28,  2.85s/it][A
Training...:  95% 13161/13907 [8:13:58<34:55,  2.81s/it][A
Training...:  95% 13162/13907 [8:14:01<34:20,  2.77s/it][A
Training...:  95% 13163/13907 [8:14:04<33:55,  2.74s/it][A
Training...:  95% 13164/13907 [8:14:06<33:21,  2.69s/it][A
Training...:  95% 13165/13907 [8:14:09<33:00,  2.67s/it][A
Training...:  95% 13166/13907 [8:14:11<32:26,  2.63s/it][A
Training...:  95% 13167/13907 [8:14:14<31:44,  2.57s/it][A
Training...:  95% 13168/13907 [8:14:16<31:15,  2.54s/it][A
Training...:  95% 13169/13907 [8:14:19<30:42,  2.50s/it][A
Training...:  95% 13170/13907 [8:14:21<30:11,  2.46s/it][A
Training...:  95% 13171/13907 [8:14:23<29:34,  2.41s/it][A
Training...:  95% 13172/13907 [8:14:26<28:56,  2.36s/it][A
Training...:  95% 13173/13907 [8:14:28<28:28,  2.33s/it][A
Training...:  95% 13174/13907 [8:14:30<28:05,  2.30s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:14:45<?, ?it/s]
Training...:  95% 13174/13907 [8:14:33<28:05,  2.30s/it][A
Training...:  95% 13175/13907 [8:14:33<28:53,  2.37s/it][A
Training...:  95% 13176/13907 [8:14:35<28:16,  2.32s/it][A
Training...:  95% 13177/13907 [8:14:37<27:26,  2.26s/it][A
Training...:  95% 13178/13907 [8:14:39<26:51,  2.21s/it][A
Training...:  95% 13179/13907 [8:14:41<26:25,  2.18s/it][A
Training...:  95% 13180/13907 [8:14:43<25:48,  2.13s/it][A
Training...:  95% 13181/13907 [8:14:45<25:16,  2.09s/it][A
Training...:  95% 13182/13907 [8:14:47<24:44,  2.05s/it][A
Training...:  95% 13183/13907 [8:14:49<24:19,  2.02s/it][A
Training...:  95% 13184/13907 [8:14:51<23:46,  1.97s/it][A
Training...:  95% 13185/13907 [8:14:53<23:23,  1.94s/it][A
Training...:  95% 13186/13907 [8:14:55<22:56,  1.91s/it][A
Training...:  95% 13187/13907 [8:14:57<22:33,  1.88s/it][A
Training...:  95% 13188/13907 [8:14:58<22:07,  1.85s/it][A
Training...:  95% 13189/13907 [8:15:00<21:41,  1.81s/it][A
Training...:  95% 13190/13907 [8:15:02<21:22,  1.79s/it][A
Training...:  95% 13191/13907 [8:15:03<21:00,  1.76s/it][A
Training...:  95% 13192/13907 [8:15:05<20:35,  1.73s/it][A
Training...:  95% 13193/13907 [8:15:07<20:11,  1.70s/it][A
Training...:  95% 13194/13907 [8:15:08<19:47,  1.67s/it][A
Training...:  95% 13195/13907 [8:15:10<19:18,  1.63s/it][A
Training...:  95% 13196/13907 [8:15:11<18:43,  1.58s/it][A
Training...:  95% 13197/13907 [8:15:13<18:08,  1.53s/it][A
Training...:  95% 13198/13907 [8:15:14<17:26,  1.48s/it][A
Training...:  95% 13199/13907 [8:15:15<16:39,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:15:29<?, ?it/s]
Training...:  95% 13199/13907 [8:15:17<16:39,  1.41s/it][A
Training...:  95% 13200/13907 [8:15:17<16:12,  1.37s/it][A
Training...:  95% 13201/13907 [8:15:21<24:59,  2.12s/it][A
Training...:  95% 13202/13907 [8:15:24<29:57,  2.55s/it][A
Training...:  95% 13203/13907 [8:15:27<32:31,  2.77s/it][A
Training...:  95% 13204/13907 [8:15:31<33:56,  2.90s/it][A
Training...:  95% 13205/13907 [8:15:34<34:56,  2.99s/it][A
Training...:  95% 13206/13907 [8:15:37<35:17,  3.02s/it][A
Training...:  95% 13207/13907 [8:15:40<35:12,  3.02s/it][A
Training...:  95% 13208/13907 [8:15:43<34:39,  2.98s/it][A
Training...:  95% 13209/13907 [8:15:46<34:05,  2.93s/it][A
Training...:  95% 13210/13907 [8:15:48<33:24,  2.88s/it][A
Training...:  95% 13211/13907 [8:15:51<32:52,  2.83s/it][A
Training...:  95% 13212/13907 [8:15:54<32:20,  2.79s/it][A
Training...:  95% 13213/13907 [8:15:56<31:36,  2.73s/it][A
Training...:  95% 13214/13907 [8:15:59<30:54,  2.68s/it][A
Training...:  95% 13215/13907 [8:16:01<30:18,  2.63s/it][A
Training...:  95% 13216/13907 [8:16:04<29:36,  2.57s/it][A
Training...:  95% 13217/13907 [8:16:06<29:08,  2.53s/it][A
Training...:  95% 13218/13907 [8:16:09<28:38,  2.49s/it][A
Training...:  95% 13219/13907 [8:16:11<28:11,  2.46s/it][A
Training...:  95% 13220/13907 [8:16:13<27:38,  2.41s/it][A
Training...:  95% 13221/13907 [8:16:16<27:14,  2.38s/it][A
Training...:  95% 13222/13907 [8:16:18<26:56,  2.36s/it][A
Training...:  95% 13223/13907 [8:16:20<26:31,  2.33s/it][A
Training...:  95% 13224/13907 [8:16:22<26:06,  2.29s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:16:37<?, ?it/s]
Training...:  95% 13224/13907 [8:16:25<26:06,  2.29s/it][A
Training...:  95% 13225/13907 [8:16:25<26:46,  2.36s/it][A
Training...:  95% 13226/13907 [8:16:27<26:20,  2.32s/it][A
Training...:  95% 13227/13907 [8:16:29<25:41,  2.27s/it][A
Training...:  95% 13228/13907 [8:16:31<25:11,  2.23s/it][A
Training...:  95% 13229/13907 [8:16:34<24:47,  2.19s/it][A
Training...:  95% 13230/13907 [8:16:36<24:22,  2.16s/it][A
Training...:  95% 13231/13907 [8:16:38<23:57,  2.13s/it][A
Training...:  95% 13232/13907 [8:16:40<23:35,  2.10s/it][A
Training...:  95% 13233/13907 [8:16:42<23:17,  2.07s/it][A
Training...:  95% 13234/13907 [8:16:44<22:56,  2.05s/it][A
Training...:  95% 13235/13907 [8:16:46<22:36,  2.02s/it][A
Training...:  95% 13236/13907 [8:16:48<22:16,  1.99s/it][A
Training...:  95% 13237/13907 [8:16:49<21:53,  1.96s/it][A
Training...:  95% 13238/13907 [8:16:51<21:33,  1.93s/it][A
Training...:  95% 13239/13907 [8:16:53<21:10,  1.90s/it][A
Training...:  95% 13240/13907 [8:16:55<20:43,  1.86s/it][A
Training...:  95% 13241/13907 [8:16:57<20:22,  1.84s/it][A
Training...:  95% 13242/13907 [8:16:58<20:01,  1.81s/it][A
Training...:  95% 13243/13907 [8:17:00<19:29,  1.76s/it][A
Training...:  95% 13244/13907 [8:17:02<18:50,  1.70s/it][A
Training...:  95% 13245/13907 [8:17:03<18:14,  1.65s/it][A
Training...:  95% 13246/13907 [8:17:05<17:38,  1.60s/it][A
Training...:  95% 13247/13907 [8:17:06<17:05,  1.55s/it][A
Training...:  95% 13248/13907 [8:17:07<16:22,  1.49s/it][A
Training...:  95% 13249/13907 [8:17:09<15:37,  1.42s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:17:22<?, ?it/s]
Training...:  95% 13249/13907 [8:17:10<15:37,  1.42s/it][A
Training...:  95% 13250/13907 [8:17:10<15:10,  1.39s/it][A
Training...:  95% 13251/13907 [8:17:14<23:12,  2.12s/it][A
Training...:  95% 13252/13907 [8:17:17<27:40,  2.53s/it][A
Training...:  95% 13253/13907 [8:17:21<30:21,  2.78s/it][A
Training...:  95% 13254/13907 [8:17:24<31:40,  2.91s/it][A
Training...:  95% 13255/13907 [8:17:27<32:10,  2.96s/it][A
Training...:  95% 13256/13907 [8:17:30<32:14,  2.97s/it][A
Training...:  95% 13257/13907 [8:17:33<32:24,  2.99s/it][A
Training...:  95% 13258/13907 [8:17:36<31:55,  2.95s/it][A
Training...:  95% 13259/13907 [8:17:39<31:28,  2.91s/it][A
Training...:  95% 13260/13907 [8:17:42<30:52,  2.86s/it][A
Training...:  95% 13261/13907 [8:17:44<30:16,  2.81s/it][A
Training...:  95% 13262/13907 [8:17:47<29:40,  2.76s/it][A
Training...:  95% 13263/13907 [8:17:49<29:09,  2.72s/it][A
Training...:  95% 13264/13907 [8:17:52<28:36,  2.67s/it][A
Training...:  95% 13265/13907 [8:17:55<28:05,  2.63s/it][A
Training...:  95% 13266/13907 [8:17:57<27:42,  2.59s/it][A
Training...:  95% 13267/13907 [8:18:00<27:17,  2.56s/it][A
Training...:  95% 13268/13907 [8:18:02<26:59,  2.54s/it][A
Training...:  95% 13269/13907 [8:18:04<26:32,  2.50s/it][A
Training...:  95% 13270/13907 [8:18:07<26:06,  2.46s/it][A
Training...:  95% 13271/13907 [8:18:09<25:43,  2.43s/it][A
Training...:  95% 13272/13907 [8:18:11<25:22,  2.40s/it][A
Training...:  95% 13273/13907 [8:18:14<24:56,  2.36s/it][A
Training...:  95% 13274/13907 [8:18:16<24:36,  2.33s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:18:31<?, ?it/s]
Training...:  95% 13274/13907 [8:18:19<24:36,  2.33s/it][A
Training...:  95% 13275/13907 [8:18:19<25:19,  2.40s/it][A
Training...:  95% 13276/13907 [8:18:21<24:44,  2.35s/it][A
Training...:  95% 13277/13907 [8:18:23<24:01,  2.29s/it][A
Training...:  95% 13278/13907 [8:18:25<23:31,  2.24s/it][A
Training...:  95% 13279/13907 [8:18:27<23:09,  2.21s/it][A
Training...:  95% 13280/13907 [8:18:29<22:45,  2.18s/it][A
Training...:  95% 13281/13907 [8:18:31<22:12,  2.13s/it][A
Training...:  96% 13282/13907 [8:18:33<21:40,  2.08s/it][A
Training...:  96% 13283/13907 [8:18:35<21:15,  2.04s/it][A
Training...:  96% 13284/13907 [8:18:37<20:48,  2.00s/it][A
Training...:  96% 13285/13907 [8:18:39<20:29,  1.98s/it][A
Training...:  96% 13286/13907 [8:18:41<20:04,  1.94s/it][A
Training...:  96% 13287/13907 [8:18:43<19:44,  1.91s/it][A
Training...:  96% 13288/13907 [8:18:45<19:26,  1.88s/it][A
Training...:  96% 13289/13907 [8:18:46<19:04,  1.85s/it][A
Training...:  96% 13290/13907 [8:18:48<18:38,  1.81s/it][A
Training...:  96% 13291/13907 [8:18:50<18:19,  1.78s/it][A
Training...:  96% 13292/13907 [8:18:52<18:01,  1.76s/it][A
Training...:  96% 13293/13907 [8:18:53<17:39,  1.73s/it][A
Training...:  96% 13294/13907 [8:18:55<17:16,  1.69s/it][A
Training...:  96% 13295/13907 [8:18:56<16:44,  1.64s/it][A
Training...:  96% 13296/13907 [8:18:58<16:07,  1.58s/it][A
Training...:  96% 13297/13907 [8:18:59<15:30,  1.53s/it][A
Training...:  96% 13298/13907 [8:19:00<14:49,  1.46s/it][A
Training...:  96% 13299/13907 [8:19:02<14:07,  1.39s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:19:15<?, ?it/s]
Training...:  96% 13299/13907 [8:19:03<14:07,  1.39s/it][A
Training...:  96% 13300/13907 [8:19:03<13:50,  1.37s/it][A
Training...:  96% 13301/13907 [8:19:07<21:59,  2.18s/it][A
Training...:  96% 13302/13907 [8:19:11<26:03,  2.58s/it][A
Training...:  96% 13303/13907 [8:19:14<28:32,  2.84s/it][A
Training...:  96% 13304/13907 [8:19:17<29:33,  2.94s/it][A
Training...:  96% 13305/13907 [8:19:20<29:57,  2.99s/it][A
Training...:  96% 13306/13907 [8:19:23<29:52,  2.98s/it][A
Training...:  96% 13307/13907 [8:19:26<29:43,  2.97s/it][A
Training...:  96% 13308/13907 [8:19:29<29:21,  2.94s/it][A
Training...:  96% 13309/13907 [8:19:32<29:00,  2.91s/it][A
Training...:  96% 13310/13907 [8:19:35<28:33,  2.87s/it][A
Training...:  96% 13311/13907 [8:19:37<28:09,  2.83s/it][A
Training...:  96% 13312/13907 [8:19:40<27:37,  2.79s/it][A
Training...:  96% 13313/13907 [8:19:43<27:06,  2.74s/it][A
Training...:  96% 13314/13907 [8:19:45<26:30,  2.68s/it][A
Training...:  96% 13315/13907 [8:19:48<26:00,  2.64s/it][A
Training...:  96% 13316/13907 [8:19:50<25:28,  2.59s/it][A
Training...:  96% 13317/13907 [8:19:53<25:07,  2.55s/it][A
Training...:  96% 13318/13907 [8:19:55<24:41,  2.51s/it][A
Training...:  96% 13319/13907 [8:19:58<24:15,  2.48s/it][A
Training...:  96% 13320/13907 [8:20:00<23:55,  2.45s/it][A
Training...:  96% 13321/13907 [8:20:02<23:26,  2.40s/it][A
Training...:  96% 13322/13907 [8:20:05<23:04,  2.37s/it][A
Training...:  96% 13323/13907 [8:20:07<22:39,  2.33s/it][A
Training...:  96% 13324/13907 [8:20:09<22:20,  2.30s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:20:24<?, ?it/s]
Training...:  96% 13324/13907 [8:20:11<22:20,  2.30s/it][A
Training...:  96% 13325/13907 [8:20:11<22:46,  2.35s/it][A
Training...:  96% 13326/13907 [8:20:14<22:20,  2.31s/it][A
Training...:  96% 13327/13907 [8:20:16<21:53,  2.26s/it][A
Training...:  96% 13328/13907 [8:20:18<21:23,  2.22s/it][A
Training...:  96% 13329/13907 [8:20:20<21:12,  2.20s/it][A
Training...:  96% 13330/13907 [8:20:22<20:44,  2.16s/it][A
Training...:  96% 13331/13907 [8:20:24<20:22,  2.12s/it][A
Training...:  96% 13332/13907 [8:20:26<19:59,  2.09s/it][A
Training...:  96% 13333/13907 [8:20:28<19:47,  2.07s/it][A
Training...:  96% 13334/13907 [8:20:30<19:24,  2.03s/it][A
Training...:  96% 13335/13907 [8:20:32<19:00,  1.99s/it][A
Training...:  96% 13336/13907 [8:20:34<18:36,  1.96s/it][A
Training...:  96% 13337/13907 [8:20:36<18:12,  1.92s/it][A
Training...:  96% 13338/13907 [8:20:38<18:03,  1.90s/it][A
Training...:  96% 13339/13907 [8:20:39<17:39,  1.87s/it][A
Training...:  96% 13340/13907 [8:20:41<17:12,  1.82s/it][A
Training...:  96% 13341/13907 [8:20:43<16:57,  1.80s/it][A
Training...:  96% 13342/13907 [8:20:45<16:29,  1.75s/it][A
Training...:  96% 13343/13907 [8:20:46<16:03,  1.71s/it][A
Training...:  96% 13344/13907 [8:20:48<15:42,  1.67s/it][A
Training...:  96% 13345/13907 [8:20:49<15:18,  1.63s/it][A
Training...:  96% 13346/13907 [8:20:51<14:55,  1.60s/it][A
Training...:  96% 13347/13907 [8:20:52<14:36,  1.57s/it][A
Training...:  96% 13348/13907 [8:20:54<14:02,  1.51s/it][A
Training...:  96% 13349/13907 [8:20:55<13:25,  1.44s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:21:09<?, ?it/s]
Training...:  96% 13349/13907 [8:20:56<13:25,  1.44s/it][A
Training...:  96% 13350/13907 [8:20:56<13:01,  1.40s/it][A
Training...:  96% 13351/13907 [8:21:00<20:12,  2.18s/it][A
Training...:  96% 13352/13907 [8:21:04<24:02,  2.60s/it][A
Training...:  96% 13353/13907 [8:21:07<26:01,  2.82s/it][A
Training...:  96% 13354/13907 [8:21:10<26:51,  2.91s/it][A
Training...:  96% 13355/13907 [8:21:13<27:15,  2.96s/it][A
Training...:  96% 13356/13907 [8:21:16<27:06,  2.95s/it][A
Training...:  96% 13357/13907 [8:21:19<26:52,  2.93s/it][A
Training...:  96% 13358/13907 [8:21:22<26:32,  2.90s/it][A
Training...:  96% 13359/13907 [8:21:25<26:11,  2.87s/it][A
Training...:  96% 13360/13907 [8:21:28<25:41,  2.82s/it][A
Training...:  96% 13361/13907 [8:21:30<25:14,  2.77s/it][A
Training...:  96% 13362/13907 [8:21:33<24:44,  2.72s/it][A
Training...:  96% 13363/13907 [8:21:35<24:19,  2.68s/it][A
Training...:  96% 13364/13907 [8:21:38<23:54,  2.64s/it][A
Training...:  96% 13365/13907 [8:21:40<23:37,  2.61s/it][A
Training...:  96% 13366/13907 [8:21:43<23:08,  2.57s/it][A
Training...:  96% 13367/13907 [8:21:45<22:46,  2.53s/it][A
Training...:  96% 13368/13907 [8:21:48<22:16,  2.48s/it][A
Training...:  96% 13369/13907 [8:21:50<21:54,  2.44s/it][A
Training...:  96% 13370/13907 [8:21:52<21:32,  2.41s/it][A
Training...:  96% 13371/13907 [8:21:55<21:11,  2.37s/it][A
Training...:  96% 13372/13907 [8:21:57<20:56,  2.35s/it][A
Training...:  96% 13373/13907 [8:21:59<20:34,  2.31s/it][A
Training...:  96% 13374/13907 [8:22:01<20:09,  2.27s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:22:16<?, ?it/s]
Training...:  96% 13374/13907 [8:22:04<20:09,  2.27s/it][A
Training...:  96% 13375/13907 [8:22:04<20:41,  2.33s/it][A
Training...:  96% 13376/13907 [8:22:06<20:15,  2.29s/it][A
Training...:  96% 13377/13907 [8:22:08<19:50,  2.25s/it][A
Training...:  96% 13378/13907 [8:22:10<19:19,  2.19s/it][A
Training...:  96% 13379/13907 [8:22:12<18:57,  2.15s/it][A
Training...:  96% 13380/13907 [8:22:14<18:34,  2.11s/it][A
Training...:  96% 13381/13907 [8:22:16<18:11,  2.07s/it][A
Training...:  96% 13382/13907 [8:22:18<17:53,  2.04s/it][A
Training...:  96% 13383/13907 [8:22:20<17:32,  2.01s/it][A
Training...:  96% 13384/13907 [8:22:22<17:17,  1.98s/it][A
Training...:  96% 13385/13907 [8:22:24<17:01,  1.96s/it][A
Training...:  96% 13386/13907 [8:22:26<16:48,  1.94s/it][A
Training...:  96% 13387/13907 [8:22:28<16:33,  1.91s/it][A
Training...:  96% 13388/13907 [8:22:30<16:15,  1.88s/it][A
Training...:  96% 13389/13907 [8:22:31<15:57,  1.85s/it][A
Training...:  96% 13390/13907 [8:22:33<15:45,  1.83s/it][A
Training...:  96% 13391/13907 [8:22:35<15:24,  1.79s/it][A
Training...:  96% 13392/13907 [8:22:37<15:04,  1.76s/it][A
Training...:  96% 13393/13907 [8:22:38<14:43,  1.72s/it][A
Training...:  96% 13394/13907 [8:22:40<14:27,  1.69s/it][A
Training...:  96% 13395/13907 [8:22:41<14:05,  1.65s/it][A
Training...:  96% 13396/13907 [8:22:43<13:37,  1.60s/it][A
Training...:  96% 13397/13907 [8:22:44<13:14,  1.56s/it][A
Training...:  96% 13398/13907 [8:22:46<12:36,  1.49s/it][A
Training...:  96% 13399/13907 [8:22:47<11:56,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:23:00<?, ?it/s]
Training...:  96% 13399/13907 [8:22:48<11:56,  1.41s/it][A
Training...:  96% 13400/13907 [8:22:48<11:38,  1.38s/it][A
Training...:  96% 13401/13907 [8:22:52<18:07,  2.15s/it][A
Training...:  96% 13402/13907 [8:22:56<21:28,  2.55s/it][A
Training...:  96% 13403/13907 [8:22:59<23:17,  2.77s/it][A
Training...:  96% 13404/13907 [8:23:02<24:14,  2.89s/it][A
Training...:  96% 13405/13907 [8:23:05<24:42,  2.95s/it][A
Training...:  96% 13406/13907 [8:23:08<24:42,  2.96s/it][A
Training...:  96% 13407/13907 [8:23:11<24:29,  2.94s/it][A
Training...:  96% 13408/13907 [8:23:14<24:11,  2.91s/it][A
Training...:  96% 13409/13907 [8:23:17<23:49,  2.87s/it][A
Training...:  96% 13410/13907 [8:23:19<23:19,  2.82s/it][A
Training...:  96% 13411/13907 [8:23:22<23:02,  2.79s/it][A
Training...:  96% 13412/13907 [8:23:25<22:34,  2.74s/it][A
Training...:  96% 13413/13907 [8:23:27<22:17,  2.71s/it][A
Training...:  96% 13414/13907 [8:23:30<21:59,  2.68s/it][A
Training...:  96% 13415/13907 [8:23:32<21:36,  2.64s/it][A
Training...:  96% 13416/13907 [8:23:35<21:11,  2.59s/it][A
Training...:  96% 13417/13907 [8:23:37<20:52,  2.56s/it][A
Training...:  96% 13418/13907 [8:23:40<20:35,  2.53s/it][A
Training...:  96% 13419/13907 [8:23:42<20:13,  2.49s/it][A
Training...:  96% 13420/13907 [8:23:45<19:51,  2.45s/it][A
Training...:  97% 13421/13907 [8:23:47<19:31,  2.41s/it][A
Training...:  97% 13422/13907 [8:23:49<19:09,  2.37s/it][A
Training...:  97% 13423/13907 [8:23:51<18:49,  2.33s/it][A
Training...:  97% 13424/13907 [8:23:54<18:34,  2.31s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:24:09<?, ?it/s]
Training...:  97% 13424/13907 [8:23:56<18:34,  2.31s/it][A
Training...:  97% 13425/13907 [8:23:56<19:14,  2.40s/it][A
Training...:  97% 13426/13907 [8:23:59<18:52,  2.35s/it][A
Training...:  97% 13427/13907 [8:24:01<18:23,  2.30s/it][A
Training...:  97% 13428/13907 [8:24:03<17:55,  2.24s/it][A
Training...:  97% 13429/13907 [8:24:05<17:30,  2.20s/it][A
Training...:  97% 13430/13907 [8:24:07<17:07,  2.15s/it][A
Training...:  97% 13431/13907 [8:24:09<16:48,  2.12s/it][A
Training...:  97% 13432/13907 [8:24:11<16:28,  2.08s/it][A
Training...:  97% 13433/13907 [8:24:13<16:07,  2.04s/it][A
Training...:  97% 13434/13907 [8:24:15<15:51,  2.01s/it][A
Training...:  97% 13435/13907 [8:24:17<15:35,  1.98s/it][A
Training...:  97% 13436/13907 [8:24:19<15:20,  1.95s/it][A
Training...:  97% 13437/13907 [8:24:21<15:03,  1.92s/it][A
Training...:  97% 13438/13907 [8:24:22<14:43,  1.88s/it][A
Training...:  97% 13439/13907 [8:24:24<14:24,  1.85s/it][A
Training...:  97% 13440/13907 [8:24:26<14:08,  1.82s/it][A
Training...:  97% 13441/13907 [8:24:28<13:48,  1.78s/it][A
Training...:  97% 13442/13907 [8:24:29<13:29,  1.74s/it][A
Training...:  97% 13443/13907 [8:24:31<13:09,  1.70s/it][A
Training...:  97% 13444/13907 [8:24:32<12:51,  1.67s/it][A
Training...:  97% 13445/13907 [8:24:34<12:30,  1.62s/it][A
Training...:  97% 13446/13907 [8:24:35<12:05,  1.57s/it][A
Training...:  97% 13447/13907 [8:24:37<11:42,  1.53s/it][A
Training...:  97% 13448/13907 [8:24:38<11:13,  1.47s/it][A
Training...:  97% 13449/13907 [8:24:39<10:40,  1.40s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:24:53<?, ?it/s]
Training...:  97% 13449/13907 [8:24:41<10:40,  1.40s/it][A
Training...:  97% 13450/13907 [8:24:41<10:24,  1.37s/it][A
Training...:  97% 13451/13907 [8:24:45<16:05,  2.12s/it][A
Training...:  97% 13452/13907 [8:24:48<19:31,  2.57s/it][A
Training...:  97% 13453/13907 [8:24:51<21:05,  2.79s/it][A
Training...:  97% 13454/13907 [8:24:55<22:10,  2.94s/it][A
Training...:  97% 13455/13907 [8:24:58<22:46,  3.02s/it][A
Training...:  97% 13456/13907 [8:25:01<22:48,  3.04s/it][A
Training...:  97% 13457/13907 [8:25:04<22:45,  3.04s/it][A
Training...:  97% 13458/13907 [8:25:07<22:31,  3.01s/it][A
Training...:  97% 13459/13907 [8:25:10<22:07,  2.96s/it][A
Training...:  97% 13460/13907 [8:25:13<21:36,  2.90s/it][A
Training...:  97% 13461/13907 [8:25:15<21:07,  2.84s/it][A
Training...:  97% 13462/13907 [8:25:18<20:39,  2.79s/it][A
Training...:  97% 13463/13907 [8:25:21<20:12,  2.73s/it][A
Training...:  97% 13464/13907 [8:25:23<19:51,  2.69s/it][A
Training...:  97% 13465/13907 [8:25:26<19:30,  2.65s/it][A
Training...:  97% 13466/13907 [8:25:28<19:09,  2.61s/it][A
Training...:  97% 13467/13907 [8:25:31<18:53,  2.58s/it][A
Training...:  97% 13468/13907 [8:25:33<18:32,  2.53s/it][A
Training...:  97% 13469/13907 [8:25:36<18:15,  2.50s/it][A
Training...:  97% 13470/13907 [8:25:38<17:59,  2.47s/it][A
Training...:  97% 13471/13907 [8:25:40<17:46,  2.45s/it][A
Training...:  97% 13472/13907 [8:25:43<17:34,  2.42s/it][A
Training...:  97% 13473/13907 [8:25:45<17:21,  2.40s/it][A
Training...:  97% 13474/13907 [8:25:47<16:59,  2.35s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:26:02<?, ?it/s]
Training...:  97% 13474/13907 [8:25:50<16:59,  2.35s/it][A
Training...:  97% 13475/13907 [8:25:50<17:18,  2.40s/it][A
Training...:  97% 13476/13907 [8:25:52<16:55,  2.36s/it][A
Training...:  97% 13477/13907 [8:25:54<16:31,  2.31s/it][A
Training...:  97% 13478/13907 [8:25:56<16:03,  2.25s/it][A
Training...:  97% 13479/13907 [8:25:59<15:42,  2.20s/it][A
Training...:  97% 13480/13907 [8:26:01<15:19,  2.15s/it][A
Training...:  97% 13481/13907 [8:26:03<15:03,  2.12s/it][A
Training...:  97% 13482/13907 [8:26:05<14:44,  2.08s/it][A
Training...:  97% 13483/13907 [8:26:07<14:28,  2.05s/it][A
Training...:  97% 13484/13907 [8:26:08<14:11,  2.01s/it][A
Training...:  97% 13485/13907 [8:26:10<13:55,  1.98s/it][A
Training...:  97% 13486/13907 [8:26:12<13:43,  1.96s/it][A
Training...:  97% 13487/13907 [8:26:14<13:25,  1.92s/it][A
Training...:  97% 13488/13907 [8:26:16<13:13,  1.89s/it][A
Training...:  97% 13489/13907 [8:26:18<12:54,  1.85s/it][A
Training...:  97% 13490/13907 [8:26:19<12:34,  1.81s/it][A
Training...:  97% 13491/13907 [8:26:21<12:18,  1.78s/it][A
Training...:  97% 13492/13907 [8:26:23<12:00,  1.74s/it][A
Training...:  97% 13493/13907 [8:26:24<11:43,  1.70s/it][A
Training...:  97% 13494/13907 [8:26:26<11:26,  1.66s/it][A
Training...:  97% 13495/13907 [8:26:27<11:06,  1.62s/it][A
Training...:  97% 13496/13907 [8:26:29<10:47,  1.58s/it][A
Training...:  97% 13497/13907 [8:26:30<10:22,  1.52s/it][A
Training...:  97% 13498/13907 [8:26:32<10:03,  1.48s/it][A
Training...:  97% 13499/13907 [8:26:33<09:30,  1.40s/it][A                                                                                                             
                                                        [AStep... (11750 | Loss: 0.3601468503475189, Learning Rate: 0.000231824247748591, Gradient Norm: 1.782747507095337)
Step... (11775 | Loss: 0.2576169967651367, Learning Rate: 0.00023167273320723325, Gradient Norm: 0.7452210187911987)
Step... (11800 | Loss: 0.5179762840270996, Learning Rate: 0.00023152123321779072, Gradient Norm: 2.1705002784729004)
Step... (11825 | Loss: 0.21768049895763397, Learning Rate: 0.00023136970412451774, Gradient Norm: 0.8614259958267212)
Step... (11850 | Loss: 0.35815727710723877, Learning Rate: 0.00023121818958315998, Gradient Norm: 1.74210524559021)
Step... (11875 | Loss: 0.23696106672286987, Learning Rate: 0.000231066660489887, Gradient Norm: 0.7796157598495483)
Step... (11900 | Loss: 0.426995187997818, Learning Rate: 0.00023091516050044447, Gradient Norm: 2.2654061317443848)
Step... (11925 | Loss: 0.2797818183898926, Learning Rate: 0.00023076364595908672, Gradient Norm: 0.8441869616508484)
Step... (11950 | Loss: 0.3799034357070923, Learning Rate: 0.00023061211686581373, Gradient Norm: 1.882650375366211)
Step... (11975 | Loss: 0.2977263927459717, Learning Rate: 0.0002304606168763712, Gradient Norm: 1.187180757522583)
Step... (12000 | Loss: 0.3356935977935791, Learning Rate: 0.00023030910233501345, Gradient Norm: 1.6472182273864746)
Step... (12025 | Loss: 0.25573664903640747, Learning Rate: 0.00023015757324174047, Gradient Norm: 0.8496554493904114)
Step... (12050 | Loss: 0.3124101161956787, Learning Rate: 0.00023000607325229794, Gradient Norm: 2.811530113220215)
Step... (12075 | Loss: 0.36415165662765503, Learning Rate: 0.00022985455871094018, Gradient Norm: 1.1363657712936401)
Step... (12100 | Loss: 0.3260040283203125, Learning Rate: 0.0002297030296176672, Gradient Norm: 1.6971111297607422)
Step... (12125 | Loss: 0.27505308389663696, Learning Rate: 0.00022955152962822467, Gradient Norm: 0.9594858884811401)
Step... (12150 | Loss: 0.4248519539833069, Learning Rate: 0.00022940001508686692, Gradient Norm: 3.180976629257202)
Step... (12175 | Loss: 0.3365246653556824, Learning Rate: 0.00022924848599359393, Gradient Norm: 1.026231050491333)
Step... (12200 | Loss: 0.3133605420589447, Learning Rate: 0.00022909697145223618, Gradient Norm: 1.8430033922195435)
Step... (12225 | Loss: 0.26192542910575867, Learning Rate: 0.00022894547146279365, Gradient Norm: 0.8547849655151367)
Step... (12250 | Loss: 0.4080664813518524, Learning Rate: 0.00022879394236952066, Gradient Norm: 1.6683588027954102)
Step... (12275 | Loss: 0.3166603446006775, Learning Rate: 0.0002286424278281629, Gradient Norm: 1.1261992454528809)
Step... (12300 | Loss: 0.40065842866897583, Learning Rate: 0.00022849092783872038, Gradient Norm: 2.517411231994629)
Step... (12325 | Loss: 0.25236737728118896, Learning Rate: 0.0002283393987454474, Gradient Norm: 0.7798783779144287)
Step... (12350 | Loss: 0.6178535223007202, Learning Rate: 0.00022818788420408964, Gradient Norm: 2.078526735305786)
Step... (12375 | Loss: 0.2466982901096344, Learning Rate: 0.00022803638421464711, Gradient Norm: 0.9692559838294983)
Step... (12400 | Loss: 0.3886246383190155, Learning Rate: 0.00022788485512137413, Gradient Norm: 1.8263578414916992)
Step... (12425 | Loss: 0.2537376880645752, Learning Rate: 0.00022773334058001637, Gradient Norm: 0.8788800239562988)
Step... (12450 | Loss: 0.36901432275772095, Learning Rate: 0.00022758184059057385, Gradient Norm: 1.6546202898025513)
Step... (12475 | Loss: 0.27261894941329956, Learning Rate: 0.00022743031149730086, Gradient Norm: 1.1546852588653564)
Step... (12500 | Loss: 0.4566414952278137, Learning Rate: 0.0002272787969559431, Gradient Norm: 1.8941771984100342)
Step... (12525 | Loss: 0.28732019662857056, Learning Rate: 0.00022712728241458535, Gradient Norm: 0.8512692451477051)
Step... (12550 | Loss: 0.4285077154636383, Learning Rate: 0.0002269757678732276, Gradient Norm: 2.2139203548431396)
Step... (12575 | Loss: 0.32072076201438904, Learning Rate: 0.00022682425333186984, Gradient Norm: 0.9545934200286865)
Step... (12600 | Loss: 0.3744503855705261, Learning Rate: 0.00022667273879051208, Gradient NEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:26:47<?, ?it/s]
Training...:  97% 13499/13907 [8:26:34<09:30,  1.40s/it][A
Training...:  97% 13500/13907 [8:26:34<09:14,  1.36s/it][Aorm: 1.8099114894866943)
Step... (12625 | Loss: 0.29837778210639954, Learning Rate: 0.0002265212096972391, Gradient Norm: 0.8762614727020264)
Step... (12650 | Loss: 0.43167635798454285, Learning Rate: 0.00022636970970779657, Gradient Norm: 1.6934677362442017)
Step... (12675 | Loss: 0.3281700313091278, Learning Rate: 0.00022621819516643882, Gradient Norm: 1.274794578552246)
Step... (12700 | Loss: 0.627480149269104, Learning Rate: 0.00022606666607316583, Gradient Norm: 2.04648756980896)
Step... (12725 | Loss: 0.21519452333450317, Learning Rate: 0.0002259151660837233, Gradient Norm: 0.7525385618209839)
Step... (12750 | Loss: 0.43074944615364075, Learning Rate: 0.00022576365154236555, Gradient Norm: 2.0036089420318604)
Step... (12775 | Loss: 0.2664545774459839, Learning Rate: 0.00022561212244909257, Gradient Norm: 0.9745113849639893)
Step... (12800 | Loss: 0.46129822731018066, Learning Rate: 0.00022546062245965004, Gradient Norm: 1.8578224182128906)
Step... (12825 | Loss: 0.27362060546875, Learning Rate: 0.00022530910791829228, Gradient Norm: 0.9252380132675171)
Step... (12850 | Loss: 0.3158443570137024, Learning Rate: 0.0002251575788250193, Gradient Norm: 1.9798481464385986)
Step... (12875 | Loss: 0.25845497846603394, Learning Rate: 0.00022500607883557677, Gradient Norm: 0.9713244438171387)
Step... (12900 | Loss: 0.5261822938919067, Learning Rate: 0.00022485456429421902, Gradient Norm: 2.334655284881592)
Step... (12925 | Loss: 0.24402359127998352, Learning Rate: 0.00022470303520094603, Gradient Norm: 0.8521481156349182)
Step... (12950 | Loss: 0.2081804871559143, Learning Rate: 0.00022455152065958828, Gradient Norm: 1.1610167026519775)
Step... (12975 | Loss: 0.2655707001686096, Learning Rate: 0.00022440002067014575, Gradient Norm: 0.9239615797996521)
Step... (13000 | Loss: 0.44981300830841064, Learning Rate: 0.00022424849157687277, Gradient Norm: 2.0707108974456787)
Step... (13025 | Loss: 0.3146674931049347, Learning Rate: 0.000224096977035515, Gradient Norm: 1.0899174213409424)
Step... (13050 | Loss: 0.5023034811019897, Learning Rate: 0.00022394547704607248, Gradient Norm: 2.0093438625335693)
Step... (13075 | Loss: 0.29077664017677307, Learning Rate: 0.0002237939479527995, Gradient Norm: 1.1260050535202026)
Step... (13100 | Loss: 0.4815371036529541, Learning Rate: 0.00022364243341144174, Gradient Norm: 2.111021041870117)
Step... (13125 | Loss: 0.26692715287208557, Learning Rate: 0.00022349093342199922, Gradient Norm: 1.071164846420288)
Step... (13150 | Loss: 0.328576922416687, Learning Rate: 0.00022333940432872623, Gradient Norm: 1.71307373046875)
Step... (13175 | Loss: 0.3335272967815399, Learning Rate: 0.00022318788978736848, Gradient Norm: 0.898375391960144)
Step... (13200 | Loss: 0.37494078278541565, Learning Rate: 0.00022303638979792595, Gradient Norm: 2.0803544521331787)
Step... (13225 | Loss: 0.2684614658355713, Learning Rate: 0.00022288486070465297, Gradient Norm: 0.8581060767173767)
Step... (13250 | Loss: 0.314633309841156, Learning Rate: 0.0002227333461632952, Gradient Norm: 1.3620072603225708)
Step... (13275 | Loss: 0.2560212314128876, Learning Rate: 0.00022258183162193745, Gradient Norm: 1.1043682098388672)
Step... (13300 | Loss: 0.40362364053726196, Learning Rate: 0.0002224303170805797, Gradient Norm: 1.6906752586364746)
Step... (13325 | Loss: 0.2513943612575531, Learning Rate: 0.00022227880253922194, Gradient Norm: 0.9604976773262024)
Step... (13350 | Loss: 0.3603402376174927, Learning Rate: 0.0002221272879978642, Gradient Norm: 1.7889262437820435)
Step... (13375 | Loss: 0.3016534447669983, Learning Rate: 0.00022197577345650643, Gradient Norm: 0.9692807793617249)
Step... (13400 | Loss: 0.36910635232925415, Learning Rate: 0.00022182425891514868, Gradient Norm: 1.67490816116333)
Step... (13425 | Loss: 0.2533850073814392, Learning Rate: 0.00022167274437379092, Gradient Norm: 0.9600877165794373)
Step... (13450 | Loss: 0.406283438205719, Learning Rate: 0.00022152121528051794, Gradient Norm: 1.9111045598983765)
Step... (13475 | Loss: 0.282414048910141, Learning Rate: 0.0002213697152910754, Gradient Norm: 1.109459638595581)

Training...:  97% 13501/13907 [8:26:38<14:32,  2.15s/it][A
Training...:  97% 13502/13907 [8:26:42<17:22,  2.58s/it][A
Training...:  97% 13503/13907 [8:26:45<18:45,  2.79s/it][A
Training...:  97% 13504/13907 [8:26:48<19:28,  2.90s/it][A
Training...:  97% 13505/13907 [8:26:51<19:44,  2.95s/it][A
Training...:  97% 13506/13907 [8:26:54<19:44,  2.95s/it][A
Training...:  97% 13507/13907 [8:26:57<19:40,  2.95s/it][A
Training...:  97% 13508/13907 [8:27:00<19:25,  2.92s/it][A
Training...:  97% 13509/13907 [8:27:03<19:12,  2.89s/it][A
Training...:  97% 13510/13907 [8:27:06<18:51,  2.85s/it][A
Training...:  97% 13511/13907 [8:27:08<18:32,  2.81s/it][A
Training...:  97% 13512/13907 [8:27:11<18:13,  2.77s/it][A
Training...:  97% 13513/13907 [8:27:14<17:53,  2.73s/it][A
Training...:  97% 13514/13907 [8:27:16<17:32,  2.68s/it][A
Training...:  97% 13515/13907 [8:27:19<17:16,  2.64s/it][A
Training...:  97% 13516/13907 [8:27:21<16:59,  2.61s/it][A
Training...:  97% 13517/13907 [8:27:24<16:47,  2.58s/it][A
Training...:  97% 13518/13907 [8:27:26<16:28,  2.54s/it][A
Training...:  97% 13519/13907 [8:27:29<16:09,  2.50s/it][A
Training...:  97% 13520/13907 [8:27:31<15:48,  2.45s/it][A
Training...:  97% 13521/13907 [8:27:33<15:30,  2.41s/it][A
Training...:  97% 13522/13907 [8:27:36<15:15,  2.38s/it][A
Training...:  97% 13523/13907 [8:27:38<15:02,  2.35s/it][A
Training...:  97% 13524/13907 [8:27:40<14:44,  2.31s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:27:55<?, ?it/s]
Training...:  97% 13524/13907 [8:27:43<14:44,  2.31s/it][A
Training...:  97% 13525/13907 [8:27:43<15:06,  2.37s/it][A
Training...:  97% 13526/13907 [8:27:45<14:48,  2.33s/it][A
Training...:  97% 13527/13907 [8:27:47<14:28,  2.29s/it][A
Training...:  97% 13528/13907 [8:27:49<14:11,  2.25s/it][A
Training...:  97% 13529/13907 [8:27:51<13:51,  2.20s/it][A
Training...:  97% 13530/13907 [8:27:53<13:29,  2.15s/it][A
Training...:  97% 13531/13907 [8:27:55<13:10,  2.10s/it][A
Training...:  97% 13532/13907 [8:27:57<12:54,  2.06s/it][A
Training...:  97% 13533/13907 [8:27:59<12:41,  2.04s/it][A
Training...:  97% 13534/13907 [8:28:01<12:25,  2.00s/it][A
Training...:  97% 13535/13907 [8:28:03<12:13,  1.97s/it][A
Training...:  97% 13536/13907 [8:28:05<11:59,  1.94s/it][A
Training...:  97% 13537/13907 [8:28:07<11:49,  1.92s/it][A
Training...:  97% 13538/13907 [8:28:09<11:39,  1.89s/it][A
Training...:  97% 13539/13907 [8:28:10<11:24,  1.86s/it][A
Training...:  97% 13540/13907 [8:28:12<11:08,  1.82s/it][A
Training...:  97% 13541/13907 [8:28:14<10:53,  1.79s/it][A
Training...:  97% 13542/13907 [8:28:16<10:41,  1.76s/it][A
Training...:  97% 13543/13907 [8:28:17<10:29,  1.73s/it][A
Training...:  97% 13544/13907 [8:28:19<10:15,  1.69s/it][A
Training...:  97% 13545/13907 [8:28:20<09:57,  1.65s/it][A
Training...:  97% 13546/13907 [8:28:22<09:39,  1.60s/it][A
Training...:  97% 13547/13907 [8:28:23<09:21,  1.56s/it][A
Training...:  97% 13548/13907 [8:28:25<09:00,  1.51s/it][A
Training...:  97% 13549/13907 [8:28:26<08:36,  1.44s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:28:40<?, ?it/s]
Training...:  97% 13549/13907 [8:28:27<08:36,  1.44s/it][A
Training...:  97% 13550/13907 [8:28:27<08:23,  1.41s/it][A
Training...:  97% 13551/13907 [8:28:31<12:49,  2.16s/it][A
Training...:  97% 13552/13907 [8:28:35<15:13,  2.57s/it][A
Training...:  97% 13553/13907 [8:28:38<16:40,  2.83s/it][A
Training...:  97% 13554/13907 [8:28:41<17:16,  2.94s/it][A
Training...:  97% 13555/13907 [8:28:45<17:31,  2.99s/it][A
Training...:  97% 13556/13907 [8:28:48<17:30,  2.99s/it][A
Training...:  97% 13557/13907 [8:28:50<17:21,  2.98s/it][A
Training...:  97% 13558/13907 [8:28:53<17:13,  2.96s/it][A
Training...:  97% 13559/13907 [8:28:56<17:01,  2.94s/it][A
Training...:  98% 13560/13907 [8:28:59<16:40,  2.88s/it][A
Training...:  98% 13561/13907 [8:29:02<16:20,  2.83s/it][A
Training...:  98% 13562/13907 [8:29:04<16:01,  2.79s/it][A
Training...:  98% 13563/13907 [8:29:07<15:41,  2.74s/it][A
Training...:  98% 13564/13907 [8:29:10<15:23,  2.69s/it][A
Training...:  98% 13565/13907 [8:29:12<15:06,  2.65s/it][A
Training...:  98% 13566/13907 [8:29:15<14:48,  2.61s/it][A
Training...:  98% 13567/13907 [8:29:17<14:42,  2.60s/it][A
Training...:  98% 13568/13907 [8:29:20<14:23,  2.55s/it][A
Training...:  98% 13569/13907 [8:29:22<14:06,  2.51s/it][A
Training...:  98% 13570/13907 [8:29:24<13:48,  2.46s/it][A
Training...:  98% 13571/13907 [8:29:27<13:33,  2.42s/it][A
Training...:  98% 13572/13907 [8:29:29<13:20,  2.39s/it][A
Training...:  98% 13573/13907 [8:29:31<13:07,  2.36s/it][A
Training...:  98% 13574/13907 [8:29:34<12:53,  2.32s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:29:48<?, ?it/s]
Training...:  98% 13574/13907 [8:29:36<12:53,  2.32s/it][A
Training...:  98% 13575/13907 [8:29:36<13:10,  2.38s/it][A
Training...:  98% 13576/13907 [8:29:38<12:55,  2.34s/it][A
Training...:  98% 13577/13907 [8:29:41<12:36,  2.29s/it][A
Training...:  98% 13578/13907 [8:29:43<12:18,  2.25s/it][A
Training...:  98% 13579/13907 [8:29:45<12:01,  2.20s/it][A
Training...:  98% 13580/13907 [8:29:47<11:47,  2.16s/it][A
Training...:  98% 13581/13907 [8:29:49<11:33,  2.13s/it][A
Training...:  98% 13582/13907 [8:29:51<11:20,  2.09s/it][A
Training...:  98% 13583/13907 [8:29:53<11:06,  2.06s/it][A
Training...:  98% 13584/13907 [8:29:55<10:53,  2.02s/it][A
Training...:  98% 13585/13907 [8:29:57<10:39,  1.99s/it][A
Training...:  98% 13586/13907 [8:29:59<10:29,  1.96s/it][A
Training...:  98% 13587/13907 [8:30:00<10:16,  1.93s/it][A
Training...:  98% 13588/13907 [8:30:02<10:06,  1.90s/it][A
Training...:  98% 13589/13907 [8:30:04<09:50,  1.86s/it][A
Training...:  98% 13590/13907 [8:30:06<09:38,  1.82s/it][A
Training...:  98% 13591/13907 [8:30:08<09:24,  1.79s/it][A
Training...:  98% 13592/13907 [8:30:09<09:10,  1.75s/it][A
Training...:  98% 13593/13907 [8:30:11<08:58,  1.71s/it][A
Training...:  98% 13594/13907 [8:30:12<08:43,  1.67s/it][A
Training...:  98% 13595/13907 [8:30:14<08:25,  1.62s/it][A
Training...:  98% 13596/13907 [8:30:15<08:08,  1.57s/it][A
Training...:  98% 13597/13907 [8:30:17<07:50,  1.52s/it][A
Training...:  98% 13598/13907 [8:30:18<07:29,  1.46s/it][A
Training...:  98% 13599/13907 [8:30:19<07:07,  1.39s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:30:33<?, ?it/s]
Training...:  98% 13599/13907 [8:30:21<07:07,  1.39s/it][A
Training...:  98% 13600/13907 [8:30:21<06:56,  1.36s/it][A
Training...:  98% 13601/13907 [8:30:24<10:43,  2.10s/it][A
Training...:  98% 13602/13907 [8:30:28<12:51,  2.53s/it][A
Training...:  98% 13603/13907 [8:30:31<14:05,  2.78s/it][A
Training...:  98% 13604/13907 [8:30:35<14:38,  2.90s/it][A
Training...:  98% 13605/13907 [8:30:38<14:56,  2.97s/it][A
Training...:  98% 13606/13907 [8:30:41<14:56,  2.98s/it][A
Training...:  98% 13607/13907 [8:30:44<14:53,  2.98s/it][A
Training...:  98% 13608/13907 [8:30:46<14:36,  2.93s/it][A
Training...:  98% 13609/13907 [8:30:49<14:19,  2.88s/it][A
Training...:  98% 13610/13907 [8:30:52<14:02,  2.84s/it][A
Training...:  98% 13611/13907 [8:30:55<13:52,  2.81s/it][A
Training...:  98% 13612/13907 [8:30:57<13:29,  2.74s/it][A
Training...:  98% 13613/13907 [8:31:00<13:13,  2.70s/it][A
Training...:  98% 13614/13907 [8:31:02<12:56,  2.65s/it][A
Training...:  98% 13615/13907 [8:31:05<12:39,  2.60s/it][A
Training...:  98% 13616/13907 [8:31:07<12:23,  2.56s/it][A
Training...:  98% 13617/13907 [8:31:10<12:12,  2.52s/it][A
Training...:  98% 13618/13907 [8:31:12<11:59,  2.49s/it][A
Training...:  98% 13619/13907 [8:31:15<11:46,  2.45s/it][A
Training...:  98% 13620/13907 [8:31:17<11:35,  2.42s/it][A
Training...:  98% 13621/13907 [8:31:19<11:25,  2.40s/it][A
Training...:  98% 13622/13907 [8:31:22<11:13,  2.36s/it][A
Training...:  98% 13623/13907 [8:31:24<11:02,  2.33s/it][A
Training...:  98% 13624/13907 [8:31:26<10:53,  2.31s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:31:41<?, ?it/s]
Training...:  98% 13624/13907 [8:31:29<10:53,  2.31s/it][A
Training...:  98% 13625/13907 [8:31:29<11:09,  2.37s/it][A
Training...:  98% 13626/13907 [8:31:31<10:54,  2.33s/it][A
Training...:  98% 13627/13907 [8:31:33<10:41,  2.29s/it][A
Training...:  98% 13628/13907 [8:31:35<10:24,  2.24s/it][A
Training...:  98% 13629/13907 [8:31:37<10:10,  2.19s/it][A
Training...:  98% 13630/13907 [8:31:39<09:57,  2.16s/it][A
Training...:  98% 13631/13907 [8:31:41<09:47,  2.13s/it][A
Training...:  98% 13632/13907 [8:31:43<09:35,  2.09s/it][A
Training...:  98% 13633/13907 [8:31:45<09:25,  2.06s/it][A
Training...:  98% 13634/13907 [8:31:47<09:11,  2.02s/it][A
Training...:  98% 13635/13907 [8:31:49<08:59,  1.98s/it][A
Training...:  98% 13636/13907 [8:31:51<08:49,  1.96s/it][A
Training...:  98% 13637/13907 [8:31:53<08:39,  1.92s/it][A
Training...:  98% 13638/13907 [8:31:55<08:29,  1.89s/it][A
Training...:  98% 13639/13907 [8:31:57<08:19,  1.86s/it][A
Training...:  98% 13640/13907 [8:31:58<08:09,  1.83s/it][A
Training...:  98% 13641/13907 [8:32:00<08:00,  1.81s/it][A
Training...:  98% 13642/13907 [8:32:02<07:49,  1.77s/it][A
Training...:  98% 13643/13907 [8:32:03<07:36,  1.73s/it][A
Training...:  98% 13644/13907 [8:32:05<07:21,  1.68s/it][A
Training...:  98% 13645/13907 [8:32:06<07:05,  1.62s/it][A
Training...:  98% 13646/13907 [8:32:08<06:47,  1.56s/it][A
Training...:  98% 13647/13907 [8:32:09<06:31,  1.50s/it][A
Training...:  98% 13648/13907 [8:32:11<06:15,  1.45s/it][A
Training...:  98% 13649/13907 [8:32:12<05:56,  1.38s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:32:25<?, ?it/s]
Training...:  98% 13649/13907 [8:32:13<05:56,  1.38s/it][A
Training...:  98% 13650/13907 [8:32:13<05:47,  1.35s/it][A
Training...:  98% 13651/13907 [8:32:17<08:59,  2.11s/it][A
Training...:  98% 13652/13907 [8:32:20<10:45,  2.53s/it][A
Training...:  98% 13653/13907 [8:32:24<11:42,  2.77s/it][A
Training...:  98% 13654/13907 [8:32:27<12:11,  2.89s/it][A
Training...:  98% 13655/13907 [8:32:30<12:19,  2.93s/it][A
Training...:  98% 13656/13907 [8:32:33<12:14,  2.93s/it][A
Training...:  98% 13657/13907 [8:32:36<12:09,  2.92s/it][A
Training...:  98% 13658/13907 [8:32:39<11:56,  2.88s/it][A
Training...:  98% 13659/13907 [8:32:41<11:43,  2.84s/it][A
Training...:  98% 13660/13907 [8:32:44<11:29,  2.79s/it][A
Training...:  98% 13661/13907 [8:32:47<11:15,  2.74s/it][A
Training...:  98% 13662/13907 [8:32:49<11:01,  2.70s/it][A
Training...:  98% 13663/13907 [8:32:52<10:50,  2.66s/it][A
Training...:  98% 13664/13907 [8:32:54<10:38,  2.63s/it][A
Training...:  98% 13665/13907 [8:32:57<10:34,  2.62s/it][A
Training...:  98% 13666/13907 [8:32:59<10:23,  2.59s/it][A
Training...:  98% 13667/13907 [8:33:02<10:15,  2.57s/it][A
Training...:  98% 13668/13907 [8:33:04<10:03,  2.52s/it][A
Training...:  98% 13669/13907 [8:33:07<09:52,  2.49s/it][A
Training...:  98% 13670/13907 [8:33:09<09:40,  2.45s/it][A
Training...:  98% 13671/13907 [8:33:11<09:31,  2.42s/it][A
Training...:  98% 13672/13907 [8:33:14<09:19,  2.38s/it][A
Training...:  98% 13673/13907 [8:33:16<09:08,  2.35s/it][A
Training...:  98% 13674/13907 [8:33:18<08:59,  2.31s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:33:33<?, ?it/s]
Training...:  98% 13674/13907 [8:33:21<08:59,  2.31s/it][A
Training...:  98% 13675/13907 [8:33:21<09:10,  2.37s/it][A
Training...:  98% 13676/13907 [8:33:23<08:57,  2.33s/it][A
Training...:  98% 13677/13907 [8:33:25<08:43,  2.28s/it][A
Training...:  98% 13678/13907 [8:33:27<08:30,  2.23s/it][A
Training...:  98% 13679/13907 [8:33:29<08:23,  2.21s/it][A
Training...:  98% 13680/13907 [8:33:32<08:19,  2.20s/it][A
Training...:  98% 13681/13907 [8:33:34<08:08,  2.16s/it][A
Training...:  98% 13682/13907 [8:33:36<07:56,  2.12s/it][A
Training...:  98% 13683/13907 [8:33:38<07:45,  2.08s/it][A
Training...:  98% 13684/13907 [8:33:40<07:34,  2.04s/it][A
Training...:  98% 13685/13907 [8:33:42<07:25,  2.01s/it][A
Training...:  98% 13686/13907 [8:33:43<07:16,  1.97s/it][A
Training...:  98% 13687/13907 [8:33:45<07:03,  1.93s/it][A
Training...:  98% 13688/13907 [8:33:47<06:51,  1.88s/it][A
Training...:  98% 13689/13907 [8:33:49<06:40,  1.84s/it][A
Training...:  98% 13690/13907 [8:33:51<06:30,  1.80s/it][A
Training...:  98% 13691/13907 [8:33:52<06:20,  1.76s/it][A
Training...:  98% 13692/13907 [8:33:54<06:11,  1.73s/it][A
Training...:  98% 13693/13907 [8:33:55<06:01,  1.69s/it][A
Training...:  98% 13694/13907 [8:33:57<05:53,  1.66s/it][A
Training...:  98% 13695/13907 [8:33:59<05:43,  1.62s/it][A
Training...:  98% 13696/13907 [8:34:00<05:32,  1.58s/it][A
Training...:  98% 13697/13907 [8:34:01<05:19,  1.52s/it][A
Training...:  98% 13698/13907 [8:34:03<05:06,  1.46s/it][A
Training...:  99% 13699/13907 [8:34:04<04:51,  1.40s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:34:18<?, ?it/s]
Training...:  99% 13699/13907 [8:34:05<04:51,  1.40s/it][A
Training...:  99% 13700/13907 [8:34:05<04:45,  1.38s/it][A
Training...:  99% 13701/13907 [8:34:09<07:13,  2.10s/it][A
Training...:  99% 13702/13907 [8:34:13<08:37,  2.53s/it][A
Training...:  99% 13703/13907 [8:34:16<09:19,  2.74s/it][A
Training...:  99% 13704/13907 [8:34:19<09:41,  2.87s/it][A
Training...:  99% 13705/13907 [8:34:22<09:49,  2.92s/it][A
Training...:  99% 13706/13907 [8:34:25<09:46,  2.92s/it][A
Training...:  99% 13707/13907 [8:34:28<09:41,  2.91s/it][A
Training...:  99% 13708/13907 [8:34:31<09:33,  2.88s/it][A
Training...:  99% 13709/13907 [8:34:34<09:26,  2.86s/it][A
Training...:  99% 13710/13907 [8:34:36<09:17,  2.83s/it][A
Training...:  99% 13711/13907 [8:34:39<09:08,  2.80s/it][A
Training...:  99% 13712/13907 [8:34:42<09:00,  2.77s/it][A
Training...:  99% 13713/13907 [8:34:44<08:50,  2.74s/it][A
Training...:  99% 13714/13907 [8:34:47<08:40,  2.70s/it][A
Training...:  99% 13715/13907 [8:34:50<08:32,  2.67s/it][A
Training...:  99% 13716/13907 [8:34:52<08:21,  2.62s/it][A
Training...:  99% 13717/13907 [8:34:55<08:13,  2.60s/it][A
Training...:  99% 13718/13907 [8:34:57<08:03,  2.56s/it][A
Training...:  99% 13719/13907 [8:35:00<07:53,  2.52s/it][A
Training...:  99% 13720/13907 [8:35:02<07:44,  2.48s/it][A
Training...:  99% 13721/13907 [8:35:04<07:35,  2.45s/it][A
Training...:  99% 13722/13907 [8:35:07<07:27,  2.42s/it][A
Training...:  99% 13723/13907 [8:35:09<07:20,  2.39s/it][A
Training...:  99% 13724/13907 [8:35:11<07:11,  2.36s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:35:26<?, ?it/s]
Training...:  99% 13724/13907 [8:35:14<07:11,  2.36s/it][A
Training...:  99% 13725/13907 [8:35:14<07:20,  2.42s/it][A
Training...:  99% 13726/13907 [8:35:16<07:07,  2.36s/it][A
Training...:  99% 13727/13907 [8:35:18<06:51,  2.29s/it][A
Training...:  99% 13728/13907 [8:35:20<06:39,  2.23s/it][A
Training...:  99% 13729/13907 [8:35:22<06:31,  2.20s/it][A
Training...:  99% 13730/13907 [8:35:24<06:24,  2.17s/it][A
Training...:  99% 13731/13907 [8:35:27<06:18,  2.15s/it][A
Training...:  99% 13732/13907 [8:35:29<06:09,  2.11s/it][A
Training...:  99% 13733/13907 [8:35:31<06:01,  2.08s/it][A
Training...:  99% 13734/13907 [8:35:33<05:53,  2.04s/it][A
Training...:  99% 13735/13907 [8:35:34<05:43,  2.00s/it][A
Training...:  99% 13736/13907 [8:35:36<05:35,  1.96s/it][A
Training...:  99% 13737/13907 [8:35:38<05:28,  1.93s/it][A
Training...:  99% 13738/13907 [8:35:40<05:21,  1.90s/it][A
Training...:  99% 13739/13907 [8:35:42<05:15,  1.88s/it][A
Training...:  99% 13740/13907 [8:35:44<05:09,  1.85s/it][A
Training...:  99% 13741/13907 [8:35:46<05:07,  1.85s/it][A
Training...:  99% 13742/13907 [8:35:47<04:56,  1.80s/it][A
Training...:  99% 13743/13907 [8:35:49<04:46,  1.75s/it][A
Training...:  99% 13744/13907 [8:35:50<04:36,  1.70s/it][A
Training...:  99% 13745/13907 [8:35:52<04:27,  1.65s/it][A
Training...:  99% 13746/13907 [8:35:53<04:18,  1.60s/it][A
Training...:  99% 13747/13907 [8:35:55<04:07,  1.55s/it][A
Training...:  99% 13748/13907 [8:35:56<03:54,  1.48s/it][A
Training...:  99% 13749/13907 [8:35:57<03:44,  1.42s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:36:11<?, ?it/s]
Training...:  99% 13749/13907 [8:35:59<03:44,  1.42s/it][A
Training...:  99% 13750/13907 [8:35:59<03:38,  1.39s/it][A
Training...:  99% 13751/13907 [8:36:03<05:31,  2.13s/it][A
Training...:  99% 13752/13907 [8:36:06<06:32,  2.53s/it][A
Training...:  99% 13753/13907 [8:36:09<07:02,  2.74s/it][A
Training...:  99% 13754/13907 [8:36:12<07:17,  2.86s/it][A
Training...:  99% 13755/13907 [8:36:16<07:24,  2.92s/it][A
Training...:  99% 13756/13907 [8:36:18<07:23,  2.94s/it][A
Training...:  99% 13757/13907 [8:36:21<07:20,  2.94s/it][A
Training...:  99% 13758/13907 [8:36:24<07:15,  2.92s/it][A
Training...:  99% 13759/13907 [8:36:27<07:08,  2.90s/it][A
Training...:  99% 13760/13907 [8:36:30<06:59,  2.85s/it][A
Training...:  99% 13761/13907 [8:36:33<06:50,  2.81s/it][A
Training...:  99% 13762/13907 [8:36:35<06:39,  2.75s/it][A
Training...:  99% 13763/13907 [8:36:38<06:31,  2.72s/it][A
Training...:  99% 13764/13907 [8:36:40<06:23,  2.69s/it][A
Training...:  99% 13765/13907 [8:36:43<06:16,  2.65s/it][A
Training...:  99% 13766/13907 [8:36:46<06:06,  2.60s/it][A
Training...:  99% 13767/13907 [8:36:48<05:59,  2.57s/it][A
Training...:  99% 13768/13907 [8:36:50<05:51,  2.53s/it][A
Training...:  99% 13769/13907 [8:36:53<05:42,  2.48s/it][A
Training...:  99% 13770/13907 [8:36:55<05:35,  2.45s/it][A
Training...:  99% 13771/13907 [8:36:58<05:28,  2.42s/it][A
Training...:  99% 13772/13907 [8:37:00<05:21,  2.38s/it][A
Training...:  99% 13773/13907 [8:37:02<05:14,  2.35s/it][A
Training...:  99% 13774/13907 [8:37:04<05:08,  2.32s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:37:19<?, ?it/s]
Training...:  99% 13774/13907 [8:37:07<05:08,  2.32s/it][A
Training...:  99% 13775/13907 [8:37:07<05:18,  2.41s/it][A
Training...:  99% 13776/13907 [8:37:09<05:09,  2.37s/it][A
Training...:  99% 13777/13907 [8:37:11<04:57,  2.29s/it][A
Training...:  99% 13778/13907 [8:37:13<04:48,  2.23s/it][A
Training...:  99% 13779/13907 [8:37:16<04:39,  2.18s/it][A
Training...:  99% 13780/13907 [8:37:18<04:31,  2.14s/it][A
Training...:  99% 13781/13907 [8:37:20<04:23,  2.09s/it][A
Training...:  99% 13782/13907 [8:37:22<04:16,  2.06s/it][A
Training...:  99% 13783/13907 [8:37:23<04:10,  2.02s/it][A
Training...:  99% 13784/13907 [8:37:25<04:05,  1.99s/it][A
Training...:  99% 13785/13907 [8:37:27<04:00,  1.97s/it][A
Training...:  99% 13786/13907 [8:37:29<03:55,  1.95s/it][A
Training...:  99% 13787/13907 [8:37:31<03:49,  1.91s/it][A
Training...:  99% 13788/13907 [8:37:33<03:43,  1.88s/it][A
Training...:  99% 13789/13907 [8:37:35<03:37,  1.84s/it][A
Training...:  99% 13790/13907 [8:37:36<03:30,  1.80s/it][A
Training...:  99% 13791/13907 [8:37:38<03:25,  1.77s/it][A
Training...:  99% 13792/13907 [8:37:40<03:18,  1.73s/it][A
Training...:  99% 13793/13907 [8:37:41<03:12,  1.69s/it][A
Training...:  99% 13794/13907 [8:37:43<03:06,  1.65s/it][A
Training...:  99% 13795/13907 [8:37:44<03:00,  1.61s/it][A
Training...:  99% 13796/13907 [8:37:46<02:55,  1.58s/it][A
Training...:  99% 13797/13907 [8:37:47<02:47,  1.52s/it][A
Training...:  99% 13798/13907 [8:37:49<02:39,  1.47s/it][A
Training...:  99% 13799/13907 [8:37:50<02:30,  1.40s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:38:03<?, ?it/s]
Training...:  99% 13799/13907 [8:37:51<02:30,  1.40s/it][A
Training...:  99% 13800/13907 [8:37:51<02:25,  1.36s/it][A
Training...:  99% 13801/13907 [8:37:55<03:44,  2.12s/it][A
Training...:  99% 13802/13907 [8:37:58<04:26,  2.54s/it][A
Training...:  99% 13803/13907 [8:38:02<04:48,  2.77s/it][A
Training...:  99% 13804/13907 [8:38:05<04:56,  2.88s/it][A
Training...:  99% 13805/13907 [8:38:08<05:00,  2.94s/it][A
Training...:  99% 13806/13907 [8:38:11<04:58,  2.96s/it][A
Training...:  99% 13807/13907 [8:38:14<04:54,  2.95s/it][A
Training...:  99% 13808/13907 [8:38:17<04:49,  2.92s/it][A
Training...:  99% 13809/13907 [8:38:20<04:43,  2.90s/it][A
Training...:  99% 13810/13907 [8:38:22<04:36,  2.85s/it][A
Training...:  99% 13811/13907 [8:38:25<04:30,  2.82s/it][A
Training...:  99% 13812/13907 [8:38:28<04:23,  2.78s/it][A
Training...:  99% 13813/13907 [8:38:30<04:18,  2.75s/it][A
Training...:  99% 13814/13907 [8:38:33<04:10,  2.70s/it][A
Training...:  99% 13815/13907 [8:38:36<04:04,  2.66s/it][A
Training...:  99% 13816/13907 [8:38:38<03:58,  2.62s/it][A
Training...:  99% 13817/13907 [8:38:41<03:51,  2.58s/it][A
Training...:  99% 13818/13907 [8:38:43<03:44,  2.53s/it][A
Training...:  99% 13819/13907 [8:38:45<03:39,  2.49s/it][A
Training...:  99% 13820/13907 [8:38:48<03:32,  2.44s/it][A
Training...:  99% 13821/13907 [8:38:50<03:27,  2.41s/it][A
Training...:  99% 13822/13907 [8:38:52<03:21,  2.37s/it][A
Training...:  99% 13823/13907 [8:38:55<03:16,  2.34s/it][A
Training...:  99% 13824/13907 [8:38:57<03:11,  2.30s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:39:12<?, ?it/s]
Training...:  99% 13824/13907 [8:38:59<03:11,  2.30s/it][A
Training...:  99% 13825/13907 [8:38:59<03:14,  2.37s/it][A
Training...:  99% 13826/13907 [8:39:02<03:09,  2.33s/it][A
Training...:  99% 13827/13907 [8:39:04<03:03,  2.29s/it][A
Training...:  99% 13828/13907 [8:39:06<02:56,  2.24s/it][A
Training...:  99% 13829/13907 [8:39:08<02:51,  2.19s/it][A
Training...:  99% 13830/13907 [8:39:10<02:45,  2.15s/it][A
Training...:  99% 13831/13907 [8:39:12<02:40,  2.11s/it][A
Training...:  99% 13832/13907 [8:39:14<02:35,  2.08s/it][A
Training...:  99% 13833/13907 [8:39:16<02:31,  2.04s/it][A
Training...:  99% 13834/13907 [8:39:18<02:26,  2.01s/it][A
Training...:  99% 13835/13907 [8:39:20<02:22,  1.98s/it][A
Training...:  99% 13836/13907 [8:39:22<02:18,  1.95s/it][A
Training...:  99% 13837/13907 [8:39:24<02:14,  1.92s/it][A
Training...: 100% 13838/13907 [8:39:25<02:10,  1.89s/it][A
Training...: 100% 13839/13907 [8:39:27<02:06,  1.86s/it][A
Training...: 100% 13840/13907 [8:39:29<02:02,  1.83s/it][A
Training...: 100% 13841/13907 [8:39:31<01:58,  1.79s/it][A
Training...: 100% 13842/13907 [8:39:32<01:53,  1.75s/it][A
Training...: 100% 13843/13907 [8:39:34<01:49,  1.72s/it][A
Training...: 100% 13844/13907 [8:39:36<01:45,  1.68s/it][A
Training...: 100% 13845/13907 [8:39:37<01:41,  1.63s/it][A
Training...: 100% 13846/13907 [8:39:39<01:36,  1.58s/it][A
Training...: 100% 13847/13907 [8:39:40<01:32,  1.54s/it][A
Training...: 100% 13848/13907 [8:39:41<01:27,  1.48s/it][A
Training...: 100% 13849/13907 [8:39:43<01:21,  1.41s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:39:56<?, ?it/s]
Training...: 100% 13849/13907 [8:39:44<01:21,  1.41s/it][A
Training...: 100% 13850/13907 [8:39:44<01:18,  1.38s/it][A
Training...: 100% 13851/13907 [8:39:48<01:58,  2.12s/it][A
Training...: 100% 13852/13907 [8:39:51<02:19,  2.54s/it][A
Training...: 100% 13853/13907 [8:39:55<02:30,  2.79s/it][A
Training...: 100% 13854/13907 [8:39:58<02:33,  2.90s/it][A
Training...: 100% 13855/13907 [8:40:01<02:36,  3.01s/it][A
Training...: 100% 13856/13907 [8:40:04<02:35,  3.04s/it][A
Training...: 100% 13857/13907 [8:40:07<02:31,  3.03s/it][A
Training...: 100% 13858/13907 [8:40:10<02:26,  2.99s/it][A
Training...: 100% 13859/13907 [8:40:13<02:21,  2.95s/it][A
Training...: 100% 13860/13907 [8:40:16<02:15,  2.87s/it][A
Training...: 100% 13861/13907 [8:40:18<02:10,  2.83s/it][A
Training...: 100% 13862/13907 [8:40:21<02:04,  2.76s/it][A
Training...: 100% 13863/13907 [8:40:24<02:00,  2.73s/it][A
Training...: 100% 13864/13907 [8:40:26<01:55,  2.69s/it][A
Training...: 100% 13865/13907 [8:40:29<01:51,  2.65s/it][A
Training...: 100% 13866/13907 [8:40:31<01:46,  2.60s/it][A
Training...: 100% 13867/13907 [8:40:34<01:42,  2.55s/it][A
Training...: 100% 13868/13907 [8:40:36<01:38,  2.52s/it][A
Training...: 100% 13869/13907 [8:40:39<01:34,  2.49s/it][A
Training...: 100% 13870/13907 [8:40:41<01:30,  2.46s/it][A
Training...: 100% 13871/13907 [8:40:43<01:27,  2.44s/it][A
Training...: 100% 13872/13907 [8:40:46<01:24,  2.41s/it][A
Training...: 100% 13873/13907 [8:40:48<01:20,  2.37s/it][A
Training...: 100% 13874/13907 [8:40:50<01:16,  2.33s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:41:05<?, ?it/s]
Training...: 100% 13874/13907 [8:40:53<01:16,  2.33s/it][A
Training...: 100% 13875/13907 [8:40:53<01:16,  2.39s/it][A
Training...: 100% 13876/13907 [8:40:55<01:12,  2.34s/it][A
Training...: 100% 13877/13907 [8:40:57<01:08,  2.29s/it][A
Training...: 100% 13878/13907 [8:40:59<01:04,  2.24s/it][A
Training...: 100% 13879/13907 [8:41:01<01:01,  2.19s/it][A
Training...: 100% 13880/13907 [8:41:03<00:58,  2.16s/it][A
Training...: 100% 13881/13907 [8:41:05<00:55,  2.12s/it][A
Training...: 100% 13882/13907 [8:41:07<00:52,  2.10s/it][A
Training...: 100% 13883/13907 [8:41:09<00:49,  2.07s/it][A
Training...: 100% 13884/13907 [8:41:11<00:46,  2.04s/it][A
Training...: 100% 13885/13907 [8:41:13<00:44,  2.01s/it][A
Training...: 100% 13886/13907 [8:41:15<00:41,  1.97s/it][A
Training...: 100% 13887/13907 [8:41:17<00:38,  1.93s/it][A
Training...: 100% 13888/13907 [8:41:19<00:35,  1.89s/it][A
Training...: 100% 13889/13907 [8:41:21<00:33,  1.86s/it][A
Training...: 100% 13890/13907 [8:41:22<00:30,  1.82s/it][A
Training...: 100% 13891/13907 [8:41:24<00:28,  1.77s/it][A
Training...: 100% 13892/13907 [8:41:26<00:26,  1.74s/it][A
Training...: 100% 13893/13907 [8:41:27<00:23,  1.70s/it][A
Training...: 100% 13894/13907 [8:41:29<00:21,  1.66s/it][A
Training...: 100% 13895/13907 [8:41:30<00:19,  1.61s/it][A
Training...: 100% 13896/13907 [8:41:32<00:17,  1.56s/it][A
Training...: 100% 13897/13907 [8:41:33<00:15,  1.51s/it][A
Training...: 100% 13898/13907 [8:41:35<00:13,  1.45s/it][A
Training...: 100% 13899/13907 [8:41:36<00:11,  1.38s/it][A                                                                                                             
                                                        [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):   0% 0/4 [8:41:49<?, ?it/s]
Training...: 100% 13899/13907 [8:41:37<00:11,  1.38s/it][A
Training...: 100% 13900/13907 [8:41:37<00:09,  1.35s/it][A
Training...: 100% 13901/13907 [8:41:40<00:11,  1.93s/it][A
Training...: 100% 13902/13907 [8:41:43<00:10,  2.19s/it][A
Training...: 100% 13903/13907 [8:41:46<00:09,  2.27s/it][A
Training...: 100% 13904/13907 [8:41:48<00:06,  2.23s/it][A
Training...: 100% 13905/13907 [8:41:50<00:04,  2.16s/it][A
Training...: 100% 13906/13907 [8:41:51<00:02,  2.05s/it][A
Training...: 100% 13907/13907 [8:41:53<00:00,  1.90s/it][ATraining...: 100% 13907/13907 [8:41:53<00:00,  2.25s/it]
Epoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:42:05<26:06:17, 31325.86s/it]
Step... (13500 | Loss: 0.3625442385673523, Learning Rate: 0.00022121820074971765, Gradient Norm: 2.33795166015625)
Step... (13525 | Loss: 0.27527904510498047, Learning Rate: 0.00022106667165644467, Gradient Norm: 0.8914955258369446)
Step... (13550 | Loss: 0.47867611050605774, Learning Rate: 0.00022091514256317168, Gradient Norm: 2.1786930561065674)
Step... (13575 | Loss: 0.2423909604549408, Learning Rate: 0.00022076365712564439, Gradient Norm: 0.7856084108352661)
Step... (13600 | Loss: 0.2717794179916382, Learning Rate: 0.0002206121280323714, Gradient Norm: 1.4326794147491455)
Step... (13625 | Loss: 0.24984213709831238, Learning Rate: 0.00022046059893909842, Gradient Norm: 0.7518393993377686)
Step... (13650 | Loss: 0.3567523956298828, Learning Rate: 0.00022030911350157112, Gradient Norm: 1.714453101158142)
Step... (13675 | Loss: 0.327450692653656, Learning Rate: 0.00022015758440829813, Gradient Norm: 0.9890821576118469)
Step... (13700 | Loss: 0.29413095116615295, Learning Rate: 0.00022000605531502515, Gradient Norm: 1.3826639652252197)
Step... (13725 | Loss: 0.2742525041103363, Learning Rate: 0.00021985456987749785, Gradient Norm: 0.9026072025299072)
Step... (13750 | Loss: 0.4090430736541748, Learning Rate: 0.00021970304078422487, Gradient Norm: 2.2422938346862793)
Step... (13775 | Loss: 0.3306131064891815, Learning Rate: 0.00021955151169095188, Gradient Norm: 1.2478587627410889)
Step... (13800 | Loss: 0.5249607563018799, Learning Rate: 0.00021940002625342458, Gradient Norm: 2.533796548843384)
Step... (13825 | Loss: 0.25076955556869507, Learning Rate: 0.0002192484971601516, Gradient Norm: 0.8154927492141724)
Step... (13850 | Loss: 0.4540572762489319, Learning Rate: 0.00021909696806687862, Gradient Norm: 1.859734058380127)
Step... (13875 | Loss: 0.2977261543273926, Learning Rate: 0.00021894548262935132, Gradient Norm: 1.0342990159988403)
Step... (13900 | Loss: 0.38337695598602295, Learning Rate: 0.00021879395353607833, Gradient Norm: 1.9766499996185303)
Training...:   0% 0/13907 [00:00<?, ?it/s][A
Training...:   0% 1/13907 [00:03<15:01:26,  3.89s/it][A
Training...:   0% 2/13907 [00:07<14:10:08,  3.67s/it][A
Training...:   0% 3/13907 [00:10<13:30:01,  3.50s/it][A
Training...:   0% 4/13907 [00:13<13:00:14,  3.37s/it][A
Training...:   0% 5/13907 [00:16<12:36:14,  3.26s/it][A
Training...:   0% 6/13907 [00:19<12:17:44,  3.18s/it][A
Training...:   0% 7/13907 [00:22<12:00:55,  3.11s/it][A
Training...:   0% 8/13907 [00:25<11:39:53,  3.02s/it][A
Training...:   0% 9/13907 [00:28<11:30:13,  2.98s/it][A
Training...:   0% 10/13907 [00:31<11:13:40,  2.91s/it][A
Training...:   0% 11/13907 [00:34<10:54:33,  2.83s/it][A
Training...:   0% 12/13907 [00:36<10:39:40,  2.76s/it][A
Training...:   0% 13/13907 [00:39<10:22:28,  2.69s/it][A
Training...:   0% 14/13907 [00:41<10:11:35,  2.64s/it][A
Training...:   0% 15/13907 [00:44<9:58:47,  2.59s/it] [A
Training...:   0% 16/13907 [00:46<9:47:45,  2.54s/it][A
Training...:   0% 17/13907 [00:49<9:39:21,  2.50s/it][A                                                                                                                           
                                                     [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:43:02<26:06:17, 31325.86s/it]
Training...:   0% 17/13907 [00:51<9:39:21,  2.50s/it][A
Training...:   0% 18/13907 [00:51<9:58:08,  2.58s/it][A
Training...:   0% 19/13907 [00:54<9:47:31,  2.54s/it][A
Training...:   0% 20/13907 [00:56<9:31:36,  2.47s/it][A
Training...:   0% 21/13907 [00:58<9:17:58,  2.41s/it][A
Training...:   0% 22/13907 [01:01<9:07:00,  2.36s/it][A
Training...:   0% 23/13907 [01:03<8:55:36,  2.31s/it][A
Training...:   0% 24/13907 [01:05<8:46:40,  2.28s/it][A
Training...:   0% 25/13907 [01:07<8:37:09,  2.24s/it][A
Training...:   0% 26/13907 [01:09<8:30:02,  2.20s/it][A
Training...:   0% 27/13907 [01:11<8:21:37,  2.17s/it][A
Training...:   0% 28/13907 [01:13<8:16:14,  2.15s/it][A
Training...:   0% 29/13907 [01:15<8:07:26,  2.11s/it][A
Training...:   0% 30/13907 [01:17<8:00:37,  2.08s/it][A
Training...:   0% 31/13907 [01:19<7:52:58,  2.05s/it][A
Training...:   0% 32/13907 [01:21<7:47:33,  2.02s/it][A
Training...:   0% 33/13907 [01:23<7:40:58,  1.99s/it][A
Training...:   0% 34/13907 [01:25<7:34:04,  1.96s/it][A
Training...:   0% 35/13907 [01:27<7:26:13,  1.93s/it][A
Training...:   0% 36/13907 [01:29<7:19:10,  1.90s/it][A
Training...:   0% 37/13907 [01:31<7:11:17,  1.87s/it][A
Training...:   0% 38/13907 [01:32<7:04:00,  1.83s/it][A
Training...:   0% 39/13907 [01:34<6:55:44,  1.80s/it][A
Training...:   0% 40/13907 [01:36<6:48:58,  1.77s/it][A
Training...:   0% 41/13907 [01:37<6:40:20,  1.73s/it][A
Training...:   0% 42/13907 [01:39<6:31:27,  1.69s/it][A                                                                                                                           
                                                     [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:43:52<26:06:17, 31325.86s/it]
Training...:   0% 42/13907 [01:41<6:31:27,  1.69s/it][A
Training...:   0% 43/13907 [01:41<6:46:29,  1.76s/it][A
Training...:   0% 44/13907 [01:43<6:36:17,  1.72s/it][A
Training...:   0% 45/13907 [01:44<6:19:56,  1.64s/it][A
Training...:   0% 46/13907 [01:46<6:04:51,  1.58s/it][A
Training...:   0% 47/13907 [01:47<5:49:13,  1.51s/it][A
Training...:   0% 48/13907 [01:48<5:34:54,  1.45s/it][A
Training...:   0% 49/13907 [01:49<5:18:44,  1.38s/it][A
Training...:   0% 50/13907 [01:50<4:56:18,  1.28s/it][A
Training...:   0% 51/13907 [01:54<7:58:41,  2.07s/it][A
Training...:   0% 52/13907 [01:58<9:33:18,  2.48s/it][A
Training...:   0% 53/13907 [02:01<10:24:11,  2.70s/it][A
Training...:   0% 54/13907 [02:04<10:48:28,  2.81s/it][A
Training...:   0% 55/13907 [02:07<11:03:32,  2.87s/it][A
Training...:   0% 56/13907 [02:10<11:05:17,  2.88s/it][A
Training...:   0% 57/13907 [02:13<11:02:12,  2.87s/it][A
Training...:   0% 58/13907 [02:16<10:56:11,  2.84s/it][A
Training...:   0% 59/13907 [02:18<10:47:22,  2.80s/it][A
Training...:   0% 60/13907 [02:21<10:37:23,  2.76s/it][A
Training...:   0% 61/13907 [02:24<10:26:39,  2.72s/it][A
Training...:   0% 62/13907 [02:26<10:17:04,  2.67s/it][A
Training...:   0% 63/13907 [02:29<10:07:00,  2.63s/it][A
Training...:   0% 64/13907 [02:31<9:57:35,  2.59s/it] [A
Training...:   0% 65/13907 [02:34<9:46:59,  2.54s/it][A
Training...:   0% 66/13907 [02:36<9:39:26,  2.51s/it][A
Training...:   0% 67/13907 [02:38<9:29:17,  2.47s/it][A                                                                                                                           
                                                     [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:44:52<26:06:17, 31325.86s/it]
Training...:   0% 67/13907 [02:41<9:29:17,  2.47s/it][A
Training...:   0% 68/13907 [02:41<9:50:28,  2.56s/it][A
Training...:   0% 69/13907 [02:44<9:39:01,  2.51s/it][A
Training...:   1% 70/13907 [02:46<9:24:12,  2.45s/it][A
Training...:   1% 71/13907 [02:48<9:10:07,  2.39s/it][A
Training...:   1% 72/13907 [02:50<8:59:40,  2.34s/it][A
Training...:   1% 73/13907 [02:53<8:49:48,  2.30s/it][A
Training...:   1% 74/13907 [02:55<8:40:59,  2.26s/it][A
Training...:   1% 75/13907 [02:57<8:31:26,  2.22s/it][A
Training...:   1% 76/13907 [02:59<8:25:36,  2.19s/it][A
Training...:   1% 77/13907 [03:01<8:17:09,  2.16s/it][A
Training...:   1% 78/13907 [03:03<8:09:38,  2.12s/it][A
Training...:   1% 79/13907 [03:05<8:02:51,  2.10s/it][A
Training...:   1% 80/13907 [03:07<7:56:45,  2.07s/it][A
Training...:   1% 81/13907 [03:09<7:50:05,  2.04s/it][A
Training...:   1% 82/13907 [03:11<7:43:47,  2.01s/it][A
Training...:   1% 83/13907 [03:13<7:36:19,  1.98s/it][A
Training...:   1% 84/13907 [03:15<7:29:08,  1.95s/it][A
Training...:   1% 85/13907 [03:17<7:23:16,  1.92s/it][A
Training...:   1% 86/13907 [03:19<7:17:16,  1.90s/it][A
Training...:   1% 87/13907 [03:20<7:11:01,  1.87s/it][A
Training...:   1% 88/13907 [03:22<7:02:19,  1.83s/it][A
Training...:   1% 89/13907 [03:24<6:54:51,  1.80s/it][A
Training...:   1% 90/13907 [03:26<6:49:56,  1.78s/it][A
Training...:   1% 91/13907 [03:27<6:44:54,  1.76s/it][A
Training...:   1% 92/13907 [03:29<6:37:34,  1.73s/it][A                                                                                                                           
                                                     [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:45:42<26:06:17, 31325.86s/it]
Training...:   1% 92/13907 [03:31<6:37:34,  1.73s/it][A
Training...:   1% 93/13907 [03:31<6:51:35,  1.79s/it][A
Training...:   1% 94/13907 [03:32<6:39:01,  1.73s/it][A
Training...:   1% 95/13907 [03:34<6:24:32,  1.67s/it][A
Training...:   1% 96/13907 [03:35<6:08:30,  1.60s/it][A
Training...:   1% 97/13907 [03:37<5:52:09,  1.53s/it][A
Training...:   1% 98/13907 [03:38<5:35:09,  1.46s/it][A
Training...:   1% 99/13907 [03:39<5:17:36,  1.38s/it][A
Training...:   1% 100/13907 [03:40<4:54:30,  1.28s/it][A
Training...:   1% 101/13907 [03:44<7:39:13,  2.00s/it][A
Training...:   1% 102/13907 [03:47<9:17:19,  2.42s/it][A
Training...:   1% 103/13907 [03:51<10:08:55,  2.65s/it][A
Training...:   1% 104/13907 [03:54<10:38:03,  2.77s/it][A
Training...:   1% 105/13907 [03:57<10:53:53,  2.84s/it][A
Training...:   1% 106/13907 [04:00<10:57:10,  2.86s/it][A
Training...:   1% 107/13907 [04:02<10:56:15,  2.85s/it][A
Training...:   1% 108/13907 [04:05<10:52:33,  2.84s/it][A
Training...:   1% 109/13907 [04:08<10:44:32,  2.80s/it][A
Training...:   1% 110/13907 [04:11<10:36:33,  2.77s/it][A
Training...:   1% 111/13907 [04:13<10:26:10,  2.72s/it][A
Training...:   1% 112/13907 [04:16<10:19:03,  2.69s/it][A
Training...:   1% 113/13907 [04:18<10:09:38,  2.65s/it][A
Training...:   1% 114/13907 [04:21<10:00:14,  2.61s/it][A
Training...:   1% 115/13907 [04:23<9:50:48,  2.57s/it] [A
Training...:   1% 116/13907 [04:26<9:42:59,  2.54s/it][A
Training...:   1% 117/13907 [04:28<9:33:31,  2.50s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:46:42<26:06:17, 31325.86s/it]
Training...:   1% 117/13907 [04:31<9:33:31,  2.50s/it][A
Training...:   1% 118/13907 [04:31<9:53:07,  2.58s/it][A
Training...:   1% 119/13907 [04:33<9:40:18,  2.53s/it][A
Training...:   1% 120/13907 [04:36<9:24:31,  2.46s/it][A
Training...:   1% 121/13907 [04:38<9:10:43,  2.40s/it][A
Training...:   1% 122/13907 [04:40<8:58:44,  2.34s/it][A
Training...:   1% 123/13907 [04:42<8:47:29,  2.30s/it][A
Training...:   1% 124/13907 [04:45<8:36:58,  2.25s/it][A
Training...:   1% 125/13907 [04:47<8:30:44,  2.22s/it][A
Training...:   1% 126/13907 [04:49<8:23:02,  2.19s/it][A
Training...:   1% 127/13907 [04:51<8:15:19,  2.16s/it][A
Training...:   1% 128/13907 [04:53<8:08:48,  2.13s/it][A
Training...:   1% 129/13907 [04:55<8:02:16,  2.10s/it][A
Training...:   1% 130/13907 [04:57<7:55:32,  2.07s/it][A
Training...:   1% 131/13907 [04:59<7:49:42,  2.05s/it][A
Training...:   1% 132/13907 [05:01<7:43:55,  2.02s/it][A
Training...:   1% 133/13907 [05:03<7:36:28,  1.99s/it][A
Training...:   1% 134/13907 [05:05<7:28:37,  1.95s/it][A
Training...:   1% 135/13907 [05:07<7:20:36,  1.92s/it][A
Training...:   1% 136/13907 [05:08<7:11:51,  1.88s/it][A
Training...:   1% 137/13907 [05:10<7:04:39,  1.85s/it][A
Training...:   1% 138/13907 [05:12<6:55:34,  1.81s/it][A
Training...:   1% 139/13907 [05:14<6:48:34,  1.78s/it][A
Training...:   1% 140/13907 [05:15<6:41:12,  1.75s/it][A
Training...:   1% 141/13907 [05:17<6:33:41,  1.72s/it][A
Training...:   1% 142/13907 [05:18<6:26:15,  1.68s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:47:32<26:06:17, 31325.86s/it]
Training...:   1% 142/13907 [05:20<6:26:15,  1.68s/it][A
Training...:   1% 143/13907 [05:20<6:40:50,  1.75s/it][A
Training...:   1% 144/13907 [05:22<6:27:37,  1.69s/it][A
Training...:   1% 145/13907 [05:23<6:12:04,  1.62s/it][A
Training...:   1% 146/13907 [05:25<5:57:23,  1.56s/it][A
Training...:   1% 147/13907 [05:26<5:42:33,  1.49s/it][A
Training...:   1% 148/13907 [05:27<5:27:57,  1.43s/it][A
Training...:   1% 149/13907 [05:29<5:11:26,  1.36s/it][A
Training...:   1% 150/13907 [05:30<4:47:48,  1.26s/it][A
Training...:   1% 151/13907 [05:33<7:36:09,  1.99s/it][A
Training...:   1% 152/13907 [05:37<9:11:58,  2.41s/it][A
Training...:   1% 153/13907 [05:40<10:08:25,  2.65s/it][A
Training...:   1% 154/13907 [05:43<10:41:46,  2.80s/it][A
Training...:   1% 155/13907 [05:46<10:55:47,  2.86s/it][A
Training...:   1% 156/13907 [05:49<11:00:45,  2.88s/it][A
Training...:   1% 157/13907 [05:52<11:00:05,  2.88s/it][A
Training...:   1% 158/13907 [05:55<10:54:43,  2.86s/it][A
Training...:   1% 159/13907 [05:57<10:45:01,  2.82s/it][A
Training...:   1% 160/13907 [06:00<10:41:17,  2.80s/it][A
Training...:   1% 161/13907 [06:03<10:31:52,  2.76s/it][A
Training...:   1% 162/13907 [06:05<10:21:05,  2.71s/it][A
Training...:   1% 163/13907 [06:08<10:09:39,  2.66s/it][A
Training...:   1% 164/13907 [06:11<10:00:25,  2.62s/it][A
Training...:   1% 165/13907 [06:13<9:52:08,  2.59s/it] [A
Training...:   1% 166/13907 [06:15<9:42:50,  2.54s/it][A
Training...:   1% 167/13907 [06:18<9:33:03,  2.50s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:48:32<26:06:17, 31325.86s/it]
Training...:   1% 167/13907 [06:21<9:33:03,  2.50s/it][A
Training...:   1% 168/13907 [06:21<9:53:54,  2.59s/it][A
Training...:   1% 169/13907 [06:23<9:39:58,  2.53s/it][A
Training...:   1% 170/13907 [06:25<9:23:47,  2.46s/it][A
Training...:   1% 171/13907 [06:28<9:09:55,  2.40s/it][A
Training...:   1% 172/13907 [06:30<8:56:43,  2.34s/it][A
Training...:   1% 173/13907 [06:32<8:46:36,  2.30s/it][A
Training...:   1% 174/13907 [06:34<8:37:32,  2.26s/it][A
Training...:   1% 175/13907 [06:36<8:28:21,  2.22s/it][A
Training...:   1% 176/13907 [06:38<8:20:09,  2.19s/it][A
Training...:   1% 177/13907 [06:41<8:12:25,  2.15s/it][A
Training...:   1% 178/13907 [06:43<8:04:14,  2.12s/it][A
Training...:   1% 179/13907 [06:45<7:57:08,  2.09s/it][A
Training...:   1% 180/13907 [06:47<7:50:06,  2.05s/it][A
Training...:   1% 181/13907 [06:49<7:42:53,  2.02s/it][A
Training...:   1% 182/13907 [06:50<7:36:50,  2.00s/it][A
Training...:   1% 183/13907 [06:52<7:30:13,  1.97s/it][A
Training...:   1% 184/13907 [06:54<7:23:18,  1.94s/it][A
Training...:   1% 185/13907 [06:56<7:18:35,  1.92s/it][A
Training...:   1% 186/13907 [06:58<7:10:04,  1.88s/it][A
Training...:   1% 187/13907 [07:00<7:05:25,  1.86s/it][A
Training...:   1% 188/13907 [07:01<6:57:38,  1.83s/it][A
Training...:   1% 189/13907 [07:03<6:51:23,  1.80s/it][A
Training...:   1% 190/13907 [07:05<6:43:40,  1.77s/it][A
Training...:   1% 191/13907 [07:07<6:36:37,  1.74s/it][A
Training...:   1% 192/13907 [07:08<6:28:32,  1.70s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:49:21<26:06:17, 31325.86s/it]
Training...:   1% 192/13907 [07:10<6:28:32,  1.70s/it][A
Training...:   1% 193/13907 [07:10<6:41:59,  1.76s/it][A
Training...:   1% 194/13907 [07:12<6:30:59,  1.71s/it][A
Training...:   1% 195/13907 [07:13<6:16:19,  1.65s/it][A
Training...:   1% 196/13907 [07:15<6:02:48,  1.59s/it][A
Training...:   1% 197/13907 [07:16<5:48:02,  1.52s/it][A
Training...:   1% 198/13907 [07:17<5:35:40,  1.47s/it][A
Training...:   1% 199/13907 [07:19<5:19:03,  1.40s/it][A
Training...:   1% 200/13907 [07:20<4:55:44,  1.29s/it][A
Training...:   1% 201/13907 [07:23<7:36:43,  2.00s/it][A
Training...:   1% 202/13907 [07:27<9:13:39,  2.42s/it][A
Training...:   1% 203/13907 [07:30<10:09:05,  2.67s/it][A
Training...:   1% 204/13907 [07:33<10:38:29,  2.80s/it][A
Training...:   1% 205/13907 [07:36<10:53:12,  2.86s/it][A
Training...:   1% 206/13907 [07:39<10:56:26,  2.87s/it][A
Training...:   1% 207/13907 [07:42<10:55:19,  2.87s/it][A
Training...:   1% 208/13907 [07:45<10:50:40,  2.85s/it][A
Training...:   2% 209/13907 [07:47<10:43:45,  2.82s/it][A
Training...:   2% 210/13907 [07:50<10:34:09,  2.78s/it][A
Training...:   2% 211/13907 [07:53<10:26:01,  2.74s/it][A
Training...:   2% 212/13907 [07:55<10:18:51,  2.71s/it][A
Training...:   2% 213/13907 [07:58<10:14:32,  2.69s/it][A
Training...:   2% 214/13907 [08:00<10:06:16,  2.66s/it][A
Training...:   2% 215/13907 [08:03<9:57:01,  2.62s/it] [A
Training...:   2% 216/13907 [08:05<9:45:41,  2.57s/it][A
Training...:   2% 217/13907 [08:08<9:35:39,  2.52s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:50:22<26:06:17, 31325.86s/it]
Training...:   2% 217/13907 [08:11<9:35:39,  2.52s/it][A
Training...:   2% 218/13907 [08:11<9:55:14,  2.61s/it][A
Training...:   2% 219/13907 [08:13<9:41:22,  2.55s/it][A
Training...:   2% 220/13907 [08:15<9:26:18,  2.48s/it][A
Training...:   2% 221/13907 [08:18<9:12:16,  2.42s/it][A
Training...:   2% 222/13907 [08:20<9:02:23,  2.38s/it][A
Training...:   2% 223/13907 [08:22<8:51:45,  2.33s/it][A
Training...:   2% 224/13907 [08:24<8:43:26,  2.30s/it][A
Training...:   2% 225/13907 [08:27<8:33:15,  2.25s/it][A
Training...:   2% 226/13907 [08:29<8:24:41,  2.21s/it][A
Training...:   2% 227/13907 [08:31<8:18:18,  2.19s/it][A
Training...:   2% 228/13907 [08:33<8:11:26,  2.16s/it][A
Training...:   2% 229/13907 [08:35<8:04:01,  2.12s/it][A
Training...:   2% 230/13907 [08:37<7:56:17,  2.09s/it][A
Training...:   2% 231/13907 [08:39<7:48:52,  2.06s/it][A
Training...:   2% 232/13907 [08:41<7:42:12,  2.03s/it][A
Training...:   2% 233/13907 [08:43<7:36:01,  2.00s/it][A
Training...:   2% 234/13907 [08:45<7:29:02,  1.97s/it][A
Training...:   2% 235/13907 [08:47<7:21:54,  1.94s/it][A
Training...:   2% 236/13907 [08:48<7:14:55,  1.91s/it][A
Training...:   2% 237/13907 [08:50<7:08:17,  1.88s/it][A
Training...:   2% 238/13907 [08:52<7:01:59,  1.85s/it][A
Training...:   2% 239/13907 [08:54<6:54:29,  1.82s/it][A
Training...:   2% 240/13907 [08:56<6:47:41,  1.79s/it][A
Training...:   2% 241/13907 [08:57<6:40:46,  1.76s/it][A
Training...:   2% 242/13907 [08:59<6:31:09,  1.72s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:51:12<26:06:17, 31325.86s/it]
Training...:   2% 242/13907 [09:01<6:31:09,  1.72s/it][A
Training...:   2% 243/13907 [09:01<6:44:18,  1.78s/it][A
Training...:   2% 244/13907 [09:02<6:32:00,  1.72s/it][A
Training...:   2% 245/13907 [09:04<6:16:58,  1.66s/it][A
Training...:   2% 246/13907 [09:05<6:00:04,  1.58s/it][A
Training...:   2% 247/13907 [09:07<5:43:39,  1.51s/it][A
Training...:   2% 248/13907 [09:08<5:28:05,  1.44s/it][A
Training...:   2% 249/13907 [09:09<5:11:43,  1.37s/it][A
Training...:   2% 250/13907 [09:10<4:47:13,  1.26s/it][A
Training...:   2% 251/13907 [09:14<7:29:33,  1.98s/it][A
Training...:   2% 252/13907 [09:17<9:06:52,  2.40s/it][A
Training...:   2% 253/13907 [09:20<10:01:10,  2.64s/it][A
Training...:   2% 254/13907 [09:23<10:33:09,  2.78s/it][A
Training...:   2% 255/13907 [09:26<10:49:17,  2.85s/it][A
Training...:   2% 256/13907 [09:29<10:55:36,  2.88s/it][A
Training...:   2% 257/13907 [09:32<10:55:44,  2.88s/it][A
Training...:   2% 258/13907 [09:35<10:52:20,  2.87s/it][A
Training...:   2% 259/13907 [09:38<10:46:23,  2.84s/it][A
Training...:   2% 260/13907 [09:41<10:37:44,  2.80s/it][A
Training...:   2% 261/13907 [09:43<10:33:45,  2.79s/it][A
Training...:   2% 262/13907 [09:46<10:23:38,  2.74s/it][A
Training...:   2% 263/13907 [09:49<10:11:08,  2.69s/it][A
Training...:   2% 264/13907 [09:51<10:01:12,  2.64s/it][A
Training...:   2% 265/13907 [09:54<9:49:24,  2.59s/it] [A
Training...:   2% 266/13907 [09:56<9:39:42,  2.55s/it][A
Training...:   2% 267/13907 [09:58<9:30:29,  2.51s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:52:12<26:06:17, 31325.86s/it]
Training...:   2% 267/13907 [10:01<9:30:29,  2.51s/it][A
Training...:   2% 268/13907 [10:01<9:48:58,  2.59s/it][A
Training...:   2% 269/13907 [10:04<9:37:42,  2.54s/it][A
Training...:   2% 270/13907 [10:06<9:22:17,  2.47s/it][A
Training...:   2% 271/13907 [10:08<9:09:32,  2.42s/it][A
Training...:   2% 272/13907 [10:10<8:57:52,  2.37s/it][A
Training...:   2% 273/13907 [10:13<8:46:51,  2.32s/it][A
Training...:   2% 274/13907 [10:15<8:37:08,  2.28s/it][A
Training...:   2% 275/13907 [10:17<8:28:22,  2.24s/it][A
Training...:   2% 276/13907 [10:19<8:20:57,  2.21s/it][A
Training...:   2% 277/13907 [10:21<8:13:02,  2.17s/it][A
Training...:   2% 278/13907 [10:23<8:08:05,  2.15s/it][A
Training...:   2% 279/13907 [10:25<7:59:44,  2.11s/it][A
Training...:   2% 280/13907 [10:27<7:51:11,  2.07s/it][A
Training...:   2% 281/13907 [10:29<7:44:40,  2.05s/it][A
Training...:   2% 282/13907 [10:31<7:37:12,  2.01s/it][A
Training...:   2% 283/13907 [10:33<7:31:04,  1.99s/it][A
Training...:   2% 284/13907 [10:35<7:25:27,  1.96s/it][A
Training...:   2% 285/13907 [10:37<7:18:29,  1.93s/it][A
Training...:   2% 286/13907 [10:39<7:11:04,  1.90s/it][A
Training...:   2% 287/13907 [10:41<7:04:51,  1.87s/it][A
Training...:   2% 288/13907 [10:42<6:56:36,  1.84s/it][A
Training...:   2% 289/13907 [10:44<6:48:14,  1.80s/it][A
Training...:   2% 290/13907 [10:46<6:39:44,  1.76s/it][A
Training...:   2% 291/13907 [10:47<6:31:53,  1.73s/it][A
Training...:   2% 292/13907 [10:49<6:24:58,  1.70s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:53:02<26:06:17, 31325.86s/it]
Training...:   2% 292/13907 [10:51<6:24:58,  1.70s/it][A
Training...:   2% 293/13907 [10:51<6:37:37,  1.75s/it][A
Training...:   2% 294/13907 [10:52<6:26:14,  1.70s/it][A
Training...:   2% 295/13907 [10:54<6:10:32,  1.63s/it][A
Training...:   2% 296/13907 [10:55<5:55:51,  1.57s/it][A
Training...:   2% 297/13907 [10:57<5:41:41,  1.51s/it][A
Training...:   2% 298/13907 [10:58<5:27:21,  1.44s/it][A
Training...:   2% 299/13907 [10:59<5:11:18,  1.37s/it][A
Training...:   2% 300/13907 [11:00<4:48:50,  1.27s/it][A
Training...:   2% 301/13907 [11:04<7:38:54,  2.02s/it][A
Training...:   2% 302/13907 [11:07<9:14:22,  2.44s/it][A
Training...:   2% 303/13907 [11:11<10:10:10,  2.69s/it][A
Training...:   2% 304/13907 [11:14<10:39:32,  2.82s/it][A
Training...:   2% 305/13907 [11:17<10:59:01,  2.91s/it][A
Training...:   2% 306/13907 [11:20<11:08:14,  2.95s/it][A
Training...:   2% 307/13907 [11:23<11:03:59,  2.93s/it][A
Training...:   2% 308/13907 [11:26<10:55:02,  2.89s/it][A
Training...:   2% 309/13907 [11:28<10:45:58,  2.85s/it][A
Training...:   2% 310/13907 [11:31<10:34:25,  2.80s/it][A
Training...:   2% 311/13907 [11:34<10:22:42,  2.75s/it][A
Training...:   2% 312/13907 [11:36<10:14:02,  2.71s/it][A
Training...:   2% 313/13907 [11:39<10:03:01,  2.66s/it][A
Training...:   2% 314/13907 [11:41<9:52:04,  2.61s/it] [A
Training...:   2% 315/13907 [11:44<9:41:51,  2.57s/it][A
Training...:   2% 316/13907 [11:46<9:34:10,  2.53s/it][A
Training...:   2% 317/13907 [11:49<9:26:32,  2.50s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:54:03<26:06:17, 31325.86s/it]
Training...:   2% 317/13907 [11:52<9:26:32,  2.50s/it][A
Training...:   2% 318/13907 [11:52<9:46:54,  2.59s/it][A
Training...:   2% 319/13907 [11:54<9:36:07,  2.54s/it][A
Training...:   2% 320/13907 [11:56<9:20:13,  2.47s/it][A
Training...:   2% 321/13907 [11:59<9:06:31,  2.41s/it][A
Training...:   2% 322/13907 [12:01<8:54:23,  2.36s/it][A
Training...:   2% 323/13907 [12:03<8:44:35,  2.32s/it][A
Training...:   2% 324/13907 [12:05<8:34:50,  2.27s/it][A
Training...:   2% 325/13907 [12:07<8:29:11,  2.25s/it][A
Training...:   2% 326/13907 [12:10<8:21:14,  2.21s/it][A
Training...:   2% 327/13907 [12:12<8:15:30,  2.19s/it][A
Training...:   2% 328/13907 [12:14<8:08:33,  2.16s/it][A
Training...:   2% 329/13907 [12:16<8:00:14,  2.12s/it][A
Training...:   2% 330/13907 [12:18<7:52:59,  2.09s/it][A
Training...:   2% 331/13907 [12:20<7:45:40,  2.06s/it][A
Training...:   2% 332/13907 [12:22<7:41:01,  2.04s/it][A
Training...:   2% 333/13907 [12:24<7:34:23,  2.01s/it][A
Training...:   2% 334/13907 [12:26<7:28:21,  1.98s/it][A
Training...:   2% 335/13907 [12:28<7:22:15,  1.96s/it][A
Training...:   2% 336/13907 [12:29<7:14:17,  1.92s/it][A
Training...:   2% 337/13907 [12:31<7:07:55,  1.89s/it][A
Training...:   2% 338/13907 [12:33<7:02:01,  1.87s/it][A
Training...:   2% 339/13907 [12:35<6:53:12,  1.83s/it][A
Training...:   2% 340/13907 [12:36<6:45:10,  1.79s/it][A
Training...:   2% 341/13907 [12:38<6:37:35,  1.76s/it][A
Training...:   2% 342/13907 [12:40<6:33:36,  1.74s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:54:53<26:06:17, 31325.86s/it]
Training...:   2% 342/13907 [12:42<6:33:36,  1.74s/it][A
Training...:   2% 343/13907 [12:42<6:47:23,  1.80s/it][A
Training...:   2% 344/13907 [12:43<6:35:18,  1.75s/it][A
Training...:   2% 345/13907 [12:45<6:19:50,  1.68s/it][A
Training...:   2% 346/13907 [12:46<6:02:33,  1.60s/it][A
Training...:   2% 347/13907 [12:48<5:47:46,  1.54s/it][A
Training...:   3% 348/13907 [12:49<5:31:59,  1.47s/it][A
Training...:   3% 349/13907 [12:50<5:13:51,  1.39s/it][A
Training...:   3% 350/13907 [12:51<4:48:56,  1.28s/it][A
Training...:   3% 351/13907 [12:55<7:32:07,  2.00s/it][A
Training...:   3% 352/13907 [12:58<9:08:19,  2.43s/it][A
Training...:   3% 353/13907 [13:02<10:00:25,  2.66s/it][A
Training...:   3% 354/13907 [13:05<10:27:11,  2.78s/it][A
Training...:   3% 355/13907 [13:08<10:42:24,  2.84s/it][A
Training...:   3% 356/13907 [13:11<10:45:16,  2.86s/it][A
Training...:   3% 357/13907 [13:13<10:44:23,  2.85s/it][A
Training...:   3% 358/13907 [13:16<10:39:15,  2.83s/it][A
Training...:   3% 359/13907 [13:19<10:32:03,  2.80s/it][A
Training...:   3% 360/13907 [13:22<10:23:03,  2.76s/it][A
Training...:   3% 361/13907 [13:24<10:11:53,  2.71s/it][A
Training...:   3% 362/13907 [13:27<10:02:11,  2.67s/it][A
Training...:   3% 363/13907 [13:29<9:53:59,  2.63s/it] [A
Training...:   3% 364/13907 [13:32<9:46:53,  2.60s/it][A
Training...:   3% 365/13907 [13:34<9:37:25,  2.56s/it][A
Training...:   3% 366/13907 [13:37<9:29:59,  2.53s/it][A
Training...:   3% 367/13907 [13:39<9:22:11,  2.49s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:55:53<26:06:17, 31325.86s/it]
Training...:   3% 367/13907 [13:42<9:22:11,  2.49s/it][A
Training...:   3% 368/13907 [13:42<9:45:13,  2.59s/it][A
Training...:   3% 369/13907 [13:44<9:32:23,  2.54s/it][A
Training...:   3% 370/13907 [13:47<9:17:31,  2.47s/it][A
Training...:   3% 371/13907 [13:49<9:03:41,  2.41s/it][A
Training...:   3% 372/13907 [13:51<8:54:53,  2.37s/it][A
Training...:   3% 373/13907 [13:53<8:42:37,  2.32s/it][A
Training...:   3% 374/13907 [13:56<8:32:45,  2.27s/it][A
Training...:   3% 375/13907 [13:58<8:22:22,  2.23s/it][A
Training...:   3% 376/13907 [14:00<8:13:53,  2.19s/it][A
Training...:   3% 377/13907 [14:02<8:05:09,  2.15s/it][A
Training...:   3% 378/13907 [14:04<7:56:29,  2.11s/it][A
Training...:   3% 379/13907 [14:06<7:48:48,  2.08s/it][A
Training...:   3% 380/13907 [14:08<7:45:02,  2.06s/it][A
Training...:   3% 381/13907 [14:10<7:40:15,  2.04s/it][A
Training...:   3% 382/13907 [14:12<7:35:30,  2.02s/it][A
Training...:   3% 383/13907 [14:14<7:27:19,  1.98s/it][A
Training...:   3% 384/13907 [14:16<7:20:06,  1.95s/it][A
Training...:   3% 385/13907 [14:17<7:12:09,  1.92s/it][A
Training...:   3% 386/13907 [14:19<7:03:57,  1.88s/it][A
Training...:   3% 387/13907 [14:21<6:57:02,  1.85s/it][A
Training...:   3% 388/13907 [14:23<6:48:05,  1.81s/it][A
Training...:   3% 389/13907 [14:24<6:40:30,  1.78s/it][A
Training...:   3% 390/13907 [14:26<6:33:46,  1.75s/it][A
Training...:   3% 391/13907 [14:28<6:26:38,  1.72s/it][A
Training...:   3% 392/13907 [14:29<6:18:01,  1.68s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:56:42<26:06:17, 31325.86s/it]
Training...:   3% 392/13907 [14:31<6:18:01,  1.68s/it][A
Training...:   3% 393/13907 [14:31<6:31:34,  1.74s/it][A
Training...:   3% 394/13907 [14:33<6:20:34,  1.69s/it][A
Training...:   3% 395/13907 [14:34<6:06:31,  1.63s/it][A
Training...:   3% 396/13907 [14:36<5:51:45,  1.56s/it][A
Training...:   3% 397/13907 [14:37<5:39:11,  1.51s/it][A
Training...:   3% 398/13907 [14:38<5:25:02,  1.44s/it][A
Training...:   3% 399/13907 [14:40<5:08:58,  1.37s/it][A
Training...:   3% 400/13907 [14:41<4:48:02,  1.28s/it][A
Training...:   3% 401/13907 [14:44<7:31:27,  2.01s/it][A
Training...:   3% 402/13907 [14:48<9:08:08,  2.44s/it][A
Training...:   3% 403/13907 [14:51<10:04:03,  2.68s/it][A
Training...:   3% 404/13907 [14:54<10:31:27,  2.81s/it][A
Training...:   3% 405/13907 [14:57<10:46:44,  2.87s/it][A
Training...:   3% 406/13907 [15:00<10:48:56,  2.88s/it][A
Training...:   3% 407/13907 [15:03<10:47:20,  2.88s/it][A
Training...:   3% 408/13907 [15:06<10:45:07,  2.87s/it][A
Training...:   3% 409/13907 [15:09<10:36:46,  2.83s/it][A
Training...:   3% 410/13907 [15:11<10:28:17,  2.79s/it][A
Training...:   3% 411/13907 [15:14<10:19:59,  2.76s/it][A
Training...:   3% 412/13907 [15:17<10:09:43,  2.71s/it][A
Training...:   3% 413/13907 [15:19<10:00:20,  2.67s/it][A
Training...:   3% 414/13907 [15:22<9:51:53,  2.63s/it] [A
Training...:   3% 415/13907 [15:24<9:40:49,  2.58s/it][A
Training...:   3% 416/13907 [15:27<9:34:24,  2.55s/it][A
Training...:   3% 417/13907 [15:29<9:24:58,  2.51s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:57:43<26:06:17, 31325.86s/it]
Training...:   3% 417/13907 [15:32<9:24:58,  2.51s/it][A
Training...:   3% 418/13907 [15:32<9:45:11,  2.60s/it][A
Training...:   3% 419/13907 [15:34<9:32:07,  2.55s/it][A
Training...:   3% 420/13907 [15:37<9:16:38,  2.48s/it][A
Training...:   3% 421/13907 [15:39<9:03:15,  2.42s/it][A
Training...:   3% 422/13907 [15:41<8:51:08,  2.36s/it][A
Training...:   3% 423/13907 [15:43<8:42:09,  2.32s/it][A
Training...:   3% 424/13907 [15:45<8:33:21,  2.28s/it][A
Training...:   3% 425/13907 [15:48<8:23:43,  2.24s/it][A
Training...:   3% 426/13907 [15:50<8:14:47,  2.20s/it][A
Training...:   3% 427/13907 [15:52<8:06:07,  2.16s/it][A
Training...:   3% 428/13907 [15:54<8:00:35,  2.14s/it][A
Training...:   3% 429/13907 [15:56<7:57:31,  2.13s/it][A
Training...:   3% 430/13907 [15:58<7:49:57,  2.09s/it][A
Training...:   3% 431/13907 [16:00<7:42:50,  2.06s/it][A
Training...:   3% 432/13907 [16:02<7:34:07,  2.02s/it][A
Training...:   3% 433/13907 [16:04<7:25:21,  1.98s/it][A
Training...:   3% 434/13907 [16:06<7:18:06,  1.95s/it][A
Training...:   3% 435/13907 [16:08<7:09:26,  1.91s/it][A
Training...:   3% 436/13907 [16:09<7:01:59,  1.88s/it][A
Training...:   3% 437/13907 [16:11<6:57:05,  1.86s/it][A
Training...:   3% 438/13907 [16:13<6:48:37,  1.82s/it][A
Training...:   3% 439/13907 [16:15<6:41:57,  1.79s/it][A
Training...:   3% 440/13907 [16:16<6:34:15,  1.76s/it][A
Training...:   3% 441/13907 [16:18<6:26:27,  1.72s/it][A
Training...:   3% 442/13907 [16:19<6:18:02,  1.68s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:58:33<26:06:17, 31325.86s/it]
Training...:   3% 442/13907 [16:21<6:18:02,  1.68s/it][A
Training...:   3% 443/13907 [16:21<6:31:42,  1.75s/it][A
Training...:   3% 444/13907 [16:23<6:20:31,  1.70s/it][A
Training...:   3% 445/13907 [16:24<6:04:47,  1.63s/it][A
Training...:   3% 446/13907 [16:26<5:50:04,  1.56s/it][A
Training...:   3% 447/13907 [16:27<5:36:28,  1.50s/it][A
Training...:   3% 448/13907 [16:28<5:22:15,  1.44s/it][A
Training...:   3% 449/13907 [16:30<5:06:50,  1.37s/it][A
Training...:   3% 450/13907 [16:31<4:45:49,  1.27s/it][A
Training...:   3% 451/13907 [16:34<7:28:35,  2.00s/it][A
Training...:   3% 452/13907 [16:38<9:05:14,  2.43s/it][A
Training...:   3% 453/13907 [16:41<9:59:06,  2.67s/it][A
Training...:   3% 454/13907 [16:44<10:26:09,  2.79s/it][A
Training...:   3% 455/13907 [16:47<10:39:46,  2.85s/it][A
Training...:   3% 456/13907 [16:50<10:41:32,  2.86s/it][A
Training...:   3% 457/13907 [16:53<10:37:56,  2.85s/it][A
Training...:   3% 458/13907 [16:56<10:32:21,  2.82s/it][A
Training...:   3% 459/13907 [16:58<10:23:39,  2.78s/it][A
Training...:   3% 460/13907 [17:01<10:13:43,  2.74s/it][A
Training...:   3% 461/13907 [17:04<10:03:14,  2.69s/it][A
Training...:   3% 462/13907 [17:06<9:55:59,  2.66s/it] [A
Training...:   3% 463/13907 [17:09<9:46:01,  2.62s/it][A
Training...:   3% 464/13907 [17:11<9:38:38,  2.58s/it][A
Training...:   3% 465/13907 [17:14<9:30:32,  2.55s/it][A
Training...:   3% 466/13907 [17:16<9:22:03,  2.51s/it][A
Training...:   3% 467/13907 [17:18<9:15:40,  2.48s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [8:59:32<26:06:17, 31325.86s/it]
Training...:   3% 467/13907 [17:21<9:15:40,  2.48s/it][A
Training...:   3% 468/13907 [17:21<9:39:46,  2.59s/it][A
Training...:   3% 469/13907 [17:24<9:26:49,  2.53s/it][A
Training...:   3% 470/13907 [17:26<9:09:08,  2.45s/it][A
Training...:   3% 471/13907 [17:28<8:55:34,  2.39s/it][A
Training...:   3% 472/13907 [17:30<8:43:20,  2.34s/it][A
Training...:   3% 473/13907 [17:33<8:33:55,  2.30s/it][A
Training...:   3% 474/13907 [17:35<8:23:05,  2.25s/it][A
Training...:   3% 475/13907 [17:37<8:12:55,  2.20s/it][A
Training...:   3% 476/13907 [17:39<8:06:00,  2.17s/it][A
Training...:   3% 477/13907 [17:41<7:58:52,  2.14s/it][A
Training...:   3% 478/13907 [17:43<7:51:39,  2.11s/it][A
Training...:   3% 479/13907 [17:45<7:44:30,  2.08s/it][A
Training...:   3% 480/13907 [17:47<7:37:48,  2.05s/it][A
Training...:   3% 481/13907 [17:49<7:31:22,  2.02s/it][A
Training...:   3% 482/13907 [17:51<7:24:20,  1.99s/it][A
Training...:   3% 483/13907 [17:53<7:18:54,  1.96s/it][A
Training...:   3% 484/13907 [17:55<7:12:52,  1.93s/it][A
Training...:   3% 485/13907 [17:56<7:06:32,  1.91s/it][A
Training...:   3% 486/13907 [17:58<6:59:34,  1.88s/it][A
Training...:   4% 487/13907 [18:00<6:52:15,  1.84s/it][A
Training...:   4% 488/13907 [18:02<6:44:52,  1.81s/it][A
Training...:   4% 489/13907 [18:04<6:38:17,  1.78s/it][A
Training...:   4% 490/13907 [18:05<6:31:50,  1.75s/it][A
Training...:   4% 491/13907 [18:07<6:23:56,  1.72s/it][A
Training...:   4% 492/13907 [18:08<6:15:37,  1.68s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:00:22<26:06:17, 31325.86s/it]
Training...:   4% 492/13907 [18:10<6:15:37,  1.68s/it][A
Training...:   4% 493/13907 [18:10<6:31:00,  1.75s/it][A
Training...:   4% 494/13907 [18:12<6:20:43,  1.70s/it][A
Training...:   4% 495/13907 [18:13<6:04:44,  1.63s/it][A
Training...:   4% 496/13907 [18:15<5:49:33,  1.56s/it][A
Training...:   4% 497/13907 [18:16<5:36:19,  1.50s/it][A
Training...:   4% 498/13907 [18:17<5:22:30,  1.44s/it][A
Training...:   4% 499/13907 [18:19<5:07:26,  1.38s/it][A
Training...:   4% 500/13907 [18:20<4:45:17,  1.28s/it][A
Training...:   4% 501/13907 [18:23<7:24:57,  1.99s/it][A
Training...:   4% 502/13907 [18:27<9:01:30,  2.42s/it][A
Training...:   4% 503/13907 [18:30<9:54:40,  2.66s/it][A
Training...:   4% 504/13907 [18:33<10:24:11,  2.79s/it][A
Training...:   4% 505/13907 [18:36<10:40:43,  2.87s/it][A
Training...:   4% 506/13907 [18:39<10:42:30,  2.88s/it][A
Training...:   4% 507/13907 [18:42<10:42:57,  2.88s/it][A
Training...:   4% 508/13907 [18:45<10:38:35,  2.86s/it][A
Training...:   4% 509/13907 [18:48<10:33:14,  2.84s/it][A
Training...:   4% 510/13907 [18:50<10:26:34,  2.81s/it][A
Training...:   4% 511/13907 [18:53<10:18:18,  2.77s/it][A
Training...:   4% 512/13907 [18:56<10:06:20,  2.72s/it][A
Training...:   4% 513/13907 [18:58<9:53:03,  2.66s/it] [A
Training...:   4% 514/13907 [19:01<9:44:15,  2.62s/it][A
Training...:   4% 515/13907 [19:03<9:33:34,  2.57s/it][A
Training...:   4% 516/13907 [19:06<9:26:01,  2.54s/it][A
Training...:   4% 517/13907 [19:08<9:16:23,  2.49s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:01:22<26:06:17, 31325.86s/it]
Training...:   4% 517/13907 [19:11<9:16:23,  2.49s/it][A
Training...:   4% 518/13907 [19:11<9:36:02,  2.58s/it][A
Training...:   4% 519/13907 [19:13<9:26:31,  2.54s/it][A
Training...:   4% 520/13907 [19:15<9:12:02,  2.47s/it][A
Training...:   4% 521/13907 [19:18<9:00:19,  2.42s/it][A
Training...:   4% 522/13907 [19:20<8:47:18,  2.36s/it][A
Training...:   4% 523/13907 [19:22<8:36:38,  2.32s/it][A
Training...:   4% 524/13907 [19:24<8:27:04,  2.27s/it][A
Training...:   4% 525/13907 [19:27<8:18:41,  2.24s/it][A
Training...:   4% 526/13907 [19:29<8:09:46,  2.20s/it][A
Training...:   4% 527/13907 [19:31<8:01:57,  2.16s/it][A
Training...:   4% 528/13907 [19:33<7:55:24,  2.13s/it][A
Training...:   4% 529/13907 [19:35<7:48:03,  2.10s/it][A
Training...:   4% 530/13907 [19:37<7:41:01,  2.07s/it][A
Training...:   4% 531/13907 [19:39<7:33:57,  2.04s/it][A
Training...:   4% 532/13907 [19:41<7:26:52,  2.00s/it][A
Training...:   4% 533/13907 [19:43<7:21:19,  1.98s/it][A
Training...:   4% 534/13907 [19:44<7:14:41,  1.95s/it][A
Training...:   4% 535/13907 [19:46<7:07:56,  1.92s/it][A
Training...:   4% 536/13907 [19:48<7:01:11,  1.89s/it][A
Training...:   4% 537/13907 [19:50<6:54:14,  1.86s/it][A
Training...:   4% 538/13907 [19:52<6:45:38,  1.82s/it][A
Training...:   4% 539/13907 [19:53<6:38:13,  1.79s/it][A
Training...:   4% 540/13907 [19:55<6:29:48,  1.75s/it][A
Training...:   4% 541/13907 [19:57<6:23:18,  1.72s/it][A
Training...:   4% 542/13907 [19:58<6:15:35,  1.69s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:02:11<26:06:17, 31325.86s/it]
Training...:   4% 542/13907 [20:00<6:15:35,  1.69s/it][A
Training...:   4% 543/13907 [20:00<6:28:33,  1.74s/it][A
Training...:   4% 544/13907 [20:02<6:17:37,  1.70s/it][A
Training...:   4% 545/13907 [20:03<6:05:24,  1.64s/it][A
Training...:   4% 546/13907 [20:05<5:53:19,  1.59s/it][A
Training...:   4% 547/13907 [20:06<5:41:02,  1.53s/it][A
Training...:   4% 548/13907 [20:07<5:25:00,  1.46s/it][A
Training...:   4% 549/13907 [20:09<5:09:08,  1.39s/it][A
Training...:   4% 550/13907 [20:10<4:45:42,  1.28s/it][A
Training...:   4% 551/13907 [20:13<7:27:38,  2.01s/it][A
Training...:   4% 552/13907 [20:17<9:04:46,  2.45s/it][A
Training...:   4% 553/13907 [20:20<9:57:33,  2.68s/it][A
Training...:   4% 554/13907 [20:23<10:25:18,  2.81s/it][A
Training...:   4% 555/13907 [20:26<10:39:06,  2.87s/it][A
Training...:   4% 556/13907 [20:29<10:43:21,  2.89s/it][A
Training...:   4% 557/13907 [20:32<10:39:12,  2.87s/it][A
Training...:   4% 558/13907 [20:35<10:34:08,  2.85s/it][A
Training...:   4% 559/13907 [20:38<10:26:46,  2.82s/it][A
Training...:   4% 560/13907 [20:40<10:16:33,  2.77s/it][A
Training...:   4% 561/13907 [20:43<10:08:12,  2.73s/it][A
Training...:   4% 562/13907 [20:45<9:57:59,  2.69s/it] [A
Training...:   4% 563/13907 [20:48<9:49:48,  2.65s/it][A
Training...:   4% 564/13907 [20:51<9:39:52,  2.61s/it][A
Training...:   4% 565/13907 [20:53<9:31:00,  2.57s/it][A
Training...:   4% 566/13907 [20:55<9:24:15,  2.54s/it][A
Training...:   4% 567/13907 [20:58<9:15:26,  2.50s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:03:12<26:06:17, 31325.86s/it]
Training...:   4% 567/13907 [21:01<9:15:26,  2.50s/it][A
Training...:   4% 568/13907 [21:01<9:35:09,  2.59s/it][A
Training...:   4% 569/13907 [21:03<9:22:17,  2.53s/it][A
Training...:   4% 570/13907 [21:05<9:09:18,  2.47s/it][A
Training...:   4% 571/13907 [21:08<8:56:58,  2.42s/it][A
Training...:   4% 572/13907 [21:10<8:45:24,  2.36s/it][A
Training...:   4% 573/13907 [21:12<8:34:14,  2.31s/it][A
Training...:   4% 574/13907 [21:14<8:29:05,  2.29s/it][A
Training...:   4% 575/13907 [21:17<8:24:08,  2.27s/it][A
Training...:   4% 576/13907 [21:19<8:14:19,  2.22s/it][A
Training...:   4% 577/13907 [21:21<8:04:29,  2.18s/it][A
Training...:   4% 578/13907 [21:23<7:55:42,  2.14s/it][A
Training...:   4% 579/13907 [21:25<7:48:33,  2.11s/it][A
Training...:   4% 580/13907 [21:27<7:40:17,  2.07s/it][A
Training...:   4% 581/13907 [21:29<7:33:15,  2.04s/it][A
Training...:   4% 582/13907 [21:31<7:26:23,  2.01s/it][A
Training...:   4% 583/13907 [21:33<7:18:58,  1.98s/it][A
Training...:   4% 584/13907 [21:35<7:14:41,  1.96s/it][A
Training...:   4% 585/13907 [21:36<7:07:25,  1.93s/it][A
Training...:   4% 586/13907 [21:38<6:59:55,  1.89s/it][A
Training...:   4% 587/13907 [21:40<6:54:16,  1.87s/it][A
Training...:   4% 588/13907 [21:42<6:47:06,  1.83s/it][A
Training...:   4% 589/13907 [21:44<6:40:04,  1.80s/it][A
Training...:   4% 590/13907 [21:45<6:31:21,  1.76s/it][A
Training...:   4% 591/13907 [21:47<6:23:24,  1.73s/it][A
Training...:   4% 592/13907 [21:48<6:16:23,  1.70s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:04:02<26:06:17, 31325.86s/it]
Training...:   4% 592/13907 [21:50<6:16:23,  1.70s/it][A
Training...:   4% 593/13907 [21:50<6:30:02,  1.76s/it][A
Training...:   4% 594/13907 [21:52<6:18:04,  1.70s/it][A
Training...:   4% 595/13907 [21:53<6:02:34,  1.63s/it][A
Training...:   4% 596/13907 [21:55<5:48:38,  1.57s/it][A
Training...:   4% 597/13907 [21:56<5:35:51,  1.51s/it][A
Training...:   4% 598/13907 [21:57<5:21:39,  1.45s/it][A
Training...:   4% 599/13907 [21:59<5:05:51,  1.38s/it][A
Training...:   4% 600/13907 [22:00<4:40:56,  1.27s/it][A
Training...:   4% 601/13907 [22:03<7:20:40,  1.99s/it][A
Training...:   4% 602/13907 [22:07<8:55:04,  2.41s/it][A
Training...:   4% 603/13907 [22:10<9:48:13,  2.65s/it][A
Training...:   4% 604/13907 [22:13<10:12:43,  2.76s/it][A
Training...:   4% 605/13907 [22:16<10:26:37,  2.83s/it][A
Training...:   4% 606/13907 [22:19<10:32:27,  2.85s/it][A
Training...:   4% 607/13907 [22:22<10:30:58,  2.85s/it][A
Training...:   4% 608/13907 [22:25<10:25:55,  2.82s/it][A
Training...:   4% 609/13907 [22:27<10:19:11,  2.79s/it][A
Training...:   4% 610/13907 [22:30<10:12:46,  2.76s/it][A
Training...:   4% 611/13907 [22:33<10:02:55,  2.72s/it][A
Training...:   4% 612/13907 [22:35<9:57:45,  2.70s/it] [A
Training...:   4% 613/13907 [22:38<9:51:59,  2.67s/it][A
Training...:   4% 614/13907 [22:40<9:42:14,  2.63s/it][A
Training...:   4% 615/13907 [22:43<9:28:57,  2.57s/it][A
Training...:   4% 616/13907 [22:45<9:18:37,  2.52s/it][A
Training...:   4% 617/13907 [22:48<9:06:53,  2.47s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:05:02<26:06:17, 31325.86s/it]
Training...:   4% 617/13907 [22:50<9:06:53,  2.47s/it][A
Training...:   4% 618/13907 [22:50<9:27:02,  2.56s/it][A
Training...:   4% 619/13907 [22:53<9:14:02,  2.50s/it][A
Training...:   4% 620/13907 [22:55<8:59:00,  2.43s/it][A
Training...:   4% 621/13907 [22:57<8:46:09,  2.38s/it][A
Training...:   4% 622/13907 [22:59<8:33:07,  2.32s/it][A
Training...:   4% 623/13907 [23:02<8:22:58,  2.27s/it][A
Training...:   4% 624/13907 [23:04<8:15:50,  2.24s/it][A
Training...:   4% 625/13907 [23:06<8:08:35,  2.21s/it][A
Training...:   5% 626/13907 [23:08<8:01:10,  2.17s/it][A
Training...:   5% 627/13907 [23:10<7:56:47,  2.15s/it][A
Training...:   5% 628/13907 [23:12<7:50:55,  2.13s/it][A
Training...:   5% 629/13907 [23:14<7:44:41,  2.10s/it][A
Training...:   5% 630/13907 [23:16<7:38:46,  2.07s/it][A
Training...:   5% 631/13907 [23:18<7:34:49,  2.06s/it][A
Training...:   5% 632/13907 [23:20<7:26:48,  2.02s/it][A
Training...:   5% 633/13907 [23:22<7:21:46,  2.00s/it][A
Training...:   5% 634/13907 [23:24<7:14:11,  1.96s/it][A
Training...:   5% 635/13907 [23:26<7:06:48,  1.93s/it][A
Training...:   5% 636/13907 [23:28<7:00:10,  1.90s/it][A
Training...:   5% 637/13907 [23:29<6:52:37,  1.87s/it][A
Training...:   5% 638/13907 [23:31<6:44:21,  1.83s/it][A
Training...:   5% 639/13907 [23:33<6:37:11,  1.80s/it][A
Training...:   5% 640/13907 [23:35<6:30:37,  1.77s/it][A
Training...:   5% 641/13907 [23:36<6:24:01,  1.74s/it][A
Training...:   5% 642/13907 [23:38<6:16:09,  1.70s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:05:51<26:06:17, 31325.86s/it]
Training...:   5% 642/13907 [23:40<6:16:09,  1.70s/it][A
Training...:   5% 643/13907 [23:40<6:30:04,  1.76s/it][A
Training...:   5% 644/13907 [23:41<6:17:57,  1.71s/it][A
Training...:   5% 645/13907 [23:43<6:02:50,  1.64s/it][A
Training...:   5% 646/13907 [23:44<5:49:01,  1.58s/it][A
Training...:   5% 647/13907 [23:46<5:34:38,  1.51s/it][A
Training...:   5% 648/13907 [23:47<5:18:38,  1.44s/it][A
Training...:   5% 649/13907 [23:48<5:01:16,  1.36s/it][A
Training...:   5% 650/13907 [23:49<4:40:00,  1.27s/it][A
Training...:   5% 651/13907 [23:53<7:18:50,  1.99s/it][A
Training...:   5% 652/13907 [23:56<8:53:05,  2.41s/it][A
Training...:   5% 653/13907 [23:59<9:45:30,  2.65s/it][A
Training...:   5% 654/13907 [24:03<10:17:14,  2.79s/it][A
Training...:   5% 655/13907 [24:06<10:33:25,  2.87s/it][A
Training...:   5% 656/13907 [24:08<10:37:15,  2.89s/it][A
Training...:   5% 657/13907 [24:11<10:38:22,  2.89s/it][A
Training...:   5% 658/13907 [24:14<10:33:42,  2.87s/it][A
Training...:   5% 659/13907 [24:17<10:34:54,  2.88s/it][A
Training...:   5% 660/13907 [24:20<10:24:35,  2.83s/it][A
Training...:   5% 661/13907 [24:22<10:11:51,  2.77s/it][A
Training...:   5% 662/13907 [24:25<9:59:36,  2.72s/it] [A
Training...:   5% 663/13907 [24:28<9:46:08,  2.66s/it][A
Training...:   5% 664/13907 [24:30<9:35:49,  2.61s/it][A
Training...:   5% 665/13907 [24:33<9:25:44,  2.56s/it][A
Training...:   5% 666/13907 [24:35<9:16:13,  2.52s/it][A
Training...:   5% 667/13907 [24:37<9:07:23,  2.48s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:06:51<26:06:17, 31325.86s/it]
Training...:   5% 667/13907 [24:40<9:07:23,  2.48s/it][A
Training...:   5% 668/13907 [24:40<9:27:23,  2.57s/it][A
Training...:   5% 669/13907 [24:42<9:16:20,  2.52s/it][A
Training...:   5% 670/13907 [24:45<9:00:07,  2.45s/it][A
Training...:   5% 671/13907 [24:47<8:47:22,  2.39s/it][A
Training...:   5% 672/13907 [24:49<8:36:55,  2.34s/it][A
Training...:   5% 673/13907 [24:51<8:26:35,  2.30s/it][A
Training...:   5% 674/13907 [24:54<8:16:38,  2.25s/it][A
Training...:   5% 675/13907 [24:56<8:08:34,  2.22s/it][A
Training...:   5% 676/13907 [24:58<7:59:24,  2.17s/it][A
Training...:   5% 677/13907 [25:00<7:51:39,  2.14s/it][A
Training...:   5% 678/13907 [25:02<7:45:46,  2.11s/it][A
Training...:   5% 679/13907 [25:04<7:39:32,  2.08s/it][A
Training...:   5% 680/13907 [25:06<7:33:30,  2.06s/it][A
Training...:   5% 681/13907 [25:08<7:27:16,  2.03s/it][A
Training...:   5% 682/13907 [25:10<7:19:52,  2.00s/it][A
Training...:   5% 683/13907 [25:12<7:13:23,  1.97s/it][A
Training...:   5% 684/13907 [25:14<7:06:39,  1.94s/it][A
Training...:   5% 685/13907 [25:15<7:02:14,  1.92s/it][A
Training...:   5% 686/13907 [25:17<6:54:41,  1.88s/it][A
Training...:   5% 687/13907 [25:19<6:47:57,  1.85s/it][A
Training...:   5% 688/13907 [25:21<6:39:52,  1.81s/it][A
Training...:   5% 689/13907 [25:22<6:32:31,  1.78s/it][A
Training...:   5% 690/13907 [25:24<6:25:01,  1.75s/it][A
Training...:   5% 691/13907 [25:26<6:19:07,  1.72s/it][A
Training...:   5% 692/13907 [25:27<6:11:18,  1.69s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:07:40<26:06:17, 31325.86s/it]
Training...:   5% 692/13907 [25:29<6:11:18,  1.69s/it][A
Training...:   5% 693/13907 [25:29<6:25:36,  1.75s/it][A
Training...:   5% 694/13907 [25:31<6:15:52,  1.71s/it][A
Training...:   5% 695/13907 [25:32<6:00:11,  1.64s/it][A
Training...:   5% 696/13907 [25:34<5:44:41,  1.57s/it][A
Training...:   5% 697/13907 [25:35<5:31:46,  1.51s/it][A
Training...:   5% 698/13907 [25:36<5:16:48,  1.44s/it][A
Training...:   5% 699/13907 [25:38<4:59:40,  1.36s/it][A
Training...:   5% 700/13907 [25:39<4:38:34,  1.27s/it][A
Training...:   5% 701/13907 [25:43<7:33:27,  2.06s/it][A
Training...:   5% 702/13907 [25:46<9:07:40,  2.49s/it][A
Training...:   5% 703/13907 [25:49<9:57:22,  2.71s/it][A
Training...:   5% 704/13907 [25:52<10:23:54,  2.84s/it][A
Training...:   5% 705/13907 [25:55<10:35:55,  2.89s/it][A
Training...:   5% 706/13907 [25:58<10:36:24,  2.89s/it][A
Training...:   5% 707/13907 [26:01<10:34:09,  2.88s/it][A
Training...:   5% 708/13907 [26:04<10:25:54,  2.85s/it][A
Training...:   5% 709/13907 [26:07<10:16:13,  2.80s/it][A
Training...:   5% 710/13907 [26:09<10:07:27,  2.76s/it][A
Training...:   5% 711/13907 [26:12<9:58:08,  2.72s/it] [A
Training...:   5% 712/13907 [26:15<9:50:54,  2.69s/it][A
Training...:   5% 713/13907 [26:17<9:41:38,  2.65s/it][A
Training...:   5% 714/13907 [26:20<9:31:17,  2.60s/it][A
Training...:   5% 715/13907 [26:22<9:24:29,  2.57s/it][A
Training...:   5% 716/13907 [26:24<9:14:02,  2.52s/it][A
Training...:   5% 717/13907 [26:27<9:06:33,  2.49s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:08:41<26:06:17, 31325.86s/it]
Training...:   5% 717/13907 [26:30<9:06:33,  2.49s/it][A
Training...:   5% 718/13907 [26:30<9:25:35,  2.57s/it][A
Training...:   5% 719/13907 [26:32<9:12:58,  2.52s/it][A
Training...:   5% 720/13907 [26:34<8:58:29,  2.45s/it][A
Training...:   5% 721/13907 [26:37<8:46:51,  2.40s/it][A
Training...:   5% 722/13907 [26:39<8:35:12,  2.34s/it][A
Training...:   5% 723/13907 [26:41<8:25:33,  2.30s/it][A
Training...:   5% 724/13907 [26:43<8:18:56,  2.27s/it][A
Training...:   5% 725/13907 [26:45<8:09:48,  2.23s/it][A
Training...:   5% 726/13907 [26:47<8:01:26,  2.19s/it][A
Training...:   5% 727/13907 [26:50<7:59:06,  2.18s/it][A
Training...:   5% 728/13907 [26:52<7:53:07,  2.15s/it][A
Training...:   5% 729/13907 [26:54<7:44:07,  2.11s/it][A
Training...:   5% 730/13907 [26:56<7:37:55,  2.09s/it][A
Training...:   5% 731/13907 [26:58<7:28:39,  2.04s/it][A
Training...:   5% 732/13907 [27:00<7:19:33,  2.00s/it][A
Training...:   5% 733/13907 [27:02<7:12:28,  1.97s/it][A
Training...:   5% 734/13907 [27:03<7:05:47,  1.94s/it][A
Training...:   5% 735/13907 [27:05<7:00:10,  1.91s/it][A
Training...:   5% 736/13907 [27:07<6:52:49,  1.88s/it][A
Training...:   5% 737/13907 [27:09<6:46:05,  1.85s/it][A
Training...:   5% 738/13907 [27:11<6:39:03,  1.82s/it][A
Training...:   5% 739/13907 [27:12<6:34:01,  1.80s/it][A
Training...:   5% 740/13907 [27:14<6:26:23,  1.76s/it][A
Training...:   5% 741/13907 [27:16<6:18:47,  1.73s/it][A
Training...:   5% 742/13907 [27:17<6:10:50,  1.69s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:09:30<26:06:17, 31325.86s/it]
Training...:   5% 742/13907 [27:19<6:10:50,  1.69s/it][A
Training...:   5% 743/13907 [27:19<6:22:46,  1.74s/it][A
Training...:   5% 744/13907 [27:21<6:11:14,  1.69s/it][A
Training...:   5% 745/13907 [27:22<5:55:56,  1.62s/it][A
Training...:   5% 746/13907 [27:24<5:40:30,  1.55s/it][A
Training...:   5% 747/13907 [27:25<5:26:42,  1.49s/it][A
Training...:   5% 748/13907 [27:26<5:13:10,  1.43s/it][A
Training...:   5% 749/13907 [27:27<4:59:07,  1.36s/it][A
Training...:   5% 750/13907 [27:28<4:37:14,  1.26s/it][A
Training...:   5% 751/13907 [27:32<7:12:58,  1.97s/it][A
Training...:   5% 752/13907 [27:35<8:46:18,  2.40s/it][A
Training...:   5% 753/13907 [27:39<9:38:21,  2.64s/it][A
Training...:   5% 754/13907 [27:42<10:06:48,  2.77s/it][A
Training...:   5% 755/13907 [27:45<10:22:54,  2.84s/it][A
Training...:   5% 756/13907 [27:48<10:28:14,  2.87s/it][A
Training...:   5% 757/13907 [27:50<10:25:44,  2.86s/it][A
Training...:   5% 758/13907 [27:53<10:21:02,  2.83s/it][A
Training...:   5% 759/13907 [27:56<10:12:42,  2.80s/it][A
Training...:   5% 760/13907 [27:59<10:05:55,  2.77s/it][A
Training...:   5% 761/13907 [28:01<9:56:09,  2.72s/it] [A
Training...:   5% 762/13907 [28:04<9:46:11,  2.68s/it][A
Training...:   5% 763/13907 [28:06<9:38:03,  2.64s/it][A
Training...:   5% 764/13907 [28:09<9:27:25,  2.59s/it][A
Training...:   6% 765/13907 [28:11<9:17:50,  2.55s/it][A
Training...:   6% 766/13907 [28:14<9:09:46,  2.51s/it][A
Training...:   6% 767/13907 [28:16<9:02:30,  2.48s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:10:30<26:06:17, 31325.86s/it]
Training...:   6% 767/13907 [28:19<9:02:30,  2.48s/it][A
Training...:   6% 768/13907 [28:19<9:21:35,  2.56s/it][A
Training...:   6% 769/13907 [28:21<9:09:03,  2.51s/it][A
Training...:   6% 770/13907 [28:24<8:54:02,  2.44s/it][A
Training...:   6% 771/13907 [28:26<8:43:39,  2.39s/it][A
Training...:   6% 772/13907 [28:28<8:34:44,  2.35s/it][A
Training...:   6% 773/13907 [28:30<8:28:05,  2.32s/it][A
Training...:   6% 774/13907 [28:33<8:20:16,  2.29s/it][A
Training...:   6% 775/13907 [28:35<8:12:53,  2.25s/it][A
Training...:   6% 776/13907 [28:37<8:03:00,  2.21s/it][A
Training...:   6% 777/13907 [28:39<7:55:20,  2.17s/it][A
Training...:   6% 778/13907 [28:41<7:46:22,  2.13s/it][A
Training...:   6% 779/13907 [28:43<7:38:19,  2.09s/it][A
Training...:   6% 780/13907 [28:45<7:31:18,  2.06s/it][A
Training...:   6% 781/13907 [28:47<7:23:22,  2.03s/it][A
Training...:   6% 782/13907 [28:49<7:16:39,  2.00s/it][A
Training...:   6% 783/13907 [28:51<7:10:14,  1.97s/it][A
Training...:   6% 784/13907 [28:53<7:04:39,  1.94s/it][A
Training...:   6% 785/13907 [28:54<6:59:36,  1.92s/it][A
Training...:   6% 786/13907 [28:56<6:52:36,  1.89s/it][A
Training...:   6% 787/13907 [28:58<6:45:33,  1.85s/it][A
Training...:   6% 788/13907 [29:00<6:37:54,  1.82s/it][A
Training...:   6% 789/13907 [29:01<6:30:46,  1.79s/it][A
Training...:   6% 790/13907 [29:03<6:24:10,  1.76s/it][A
Training...:   6% 791/13907 [29:05<6:17:03,  1.72s/it][A
Training...:   6% 792/13907 [29:06<6:09:15,  1.69s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:11:20<26:06:17, 31325.86s/it]
Training...:   6% 792/13907 [29:08<6:09:15,  1.69s/it][A
Training...:   6% 793/13907 [29:08<6:22:51,  1.75s/it][A
Training...:   6% 794/13907 [29:10<6:12:44,  1.71s/it][A
Training...:   6% 795/13907 [29:11<6:01:47,  1.66s/it][A
Training...:   6% 796/13907 [29:13<5:47:02,  1.59s/it][A
Training...:   6% 797/13907 [29:14<5:33:49,  1.53s/it][A
Training...:   6% 798/13907 [29:16<5:18:57,  1.46s/it][A
Training...:   6% 799/13907 [29:17<5:03:14,  1.39s/it][A
Training...:   6% 800/13907 [29:18<4:41:52,  1.29s/it][A
Training...:   6% 801/13907 [29:22<7:17:06,  2.00s/it][A
Training...:   6% 802/13907 [29:25<8:51:06,  2.43s/it][A
Training...:   6% 803/13907 [29:28<9:43:00,  2.67s/it][A
Training...:   6% 804/13907 [29:31<10:12:33,  2.80s/it][A
Training...:   6% 805/13907 [29:34<10:27:53,  2.88s/it][A
Training...:   6% 806/13907 [29:37<10:31:48,  2.89s/it][A
Training...:   6% 807/13907 [29:40<10:30:53,  2.89s/it][A
Training...:   6% 808/13907 [29:43<10:24:52,  2.86s/it][A
Training...:   6% 809/13907 [29:46<10:17:54,  2.83s/it][A
Training...:   6% 810/13907 [29:48<10:09:07,  2.79s/it][A
Training...:   6% 811/13907 [29:51<9:59:55,  2.75s/it] [A
Training...:   6% 812/13907 [29:54<9:51:37,  2.71s/it][A
Training...:   6% 813/13907 [29:56<9:43:48,  2.68s/it][A
Training...:   6% 814/13907 [29:59<9:35:30,  2.64s/it][A
Training...:   6% 815/13907 [30:01<9:29:20,  2.61s/it][A
Training...:   6% 816/13907 [30:04<9:20:23,  2.57s/it][A
Training...:   6% 817/13907 [30:06<9:10:06,  2.52s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:12:20<26:06:17, 31325.86s/it]
Training...:   6% 817/13907 [30:09<9:10:06,  2.52s/it][A
Training...:   6% 818/13907 [30:09<9:27:06,  2.60s/it][A
Training...:   6% 819/13907 [30:11<9:14:31,  2.54s/it][A
Training...:   6% 820/13907 [30:14<8:58:14,  2.47s/it][A
Training...:   6% 821/13907 [30:16<8:44:26,  2.40s/it][A
Training...:   6% 822/13907 [30:18<8:32:19,  2.35s/it][A
Training...:   6% 823/13907 [30:20<8:22:08,  2.30s/it][A
Training...:   6% 824/13907 [30:23<8:13:35,  2.26s/it][A
Training...:   6% 825/13907 [30:25<8:03:55,  2.22s/it][A
Training...:   6% 826/13907 [30:27<7:55:50,  2.18s/it][A
Training...:   6% 827/13907 [30:29<7:48:25,  2.15s/it][A
Training...:   6% 828/13907 [30:31<7:40:04,  2.11s/it][A
Training...:   6% 829/13907 [30:33<7:33:16,  2.08s/it][A
Training...:   6% 830/13907 [30:35<7:26:38,  2.05s/it][A
Training...:   6% 831/13907 [30:37<7:22:03,  2.03s/it][A
Training...:   6% 832/13907 [30:39<7:15:37,  2.00s/it][A
Training...:   6% 833/13907 [30:41<7:10:46,  1.98s/it][A
Training...:   6% 834/13907 [30:43<7:05:18,  1.95s/it][A
Training...:   6% 835/13907 [30:44<7:00:08,  1.93s/it][A
Training...:   6% 836/13907 [30:46<6:52:32,  1.89s/it][A
Training...:   6% 837/13907 [30:48<6:46:05,  1.86s/it][A
Training...:   6% 838/13907 [30:50<6:39:20,  1.83s/it][A
Training...:   6% 839/13907 [30:52<6:31:20,  1.80s/it][A
Training...:   6% 840/13907 [30:53<6:24:14,  1.76s/it][A
Training...:   6% 841/13907 [30:55<6:16:36,  1.73s/it][A
Training...:   6% 842/13907 [30:57<6:09:37,  1.70s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:13:10<26:06:17, 31325.86s/it]
Training...:   6% 842/13907 [30:58<6:09:37,  1.70s/it][A
Training...:   6% 843/13907 [30:58<6:22:26,  1.76s/it][A
Training...:   6% 844/13907 [31:00<6:11:58,  1.71s/it][A
Training...:   6% 845/13907 [31:01<5:57:12,  1.64s/it][A
Training...:   6% 846/13907 [31:03<5:43:19,  1.58s/it][A
Training...:   6% 847/13907 [31:04<5:30:04,  1.52s/it][A
Training...:   6% 848/13907 [31:06<5:16:05,  1.45s/it][A
Training...:   6% 849/13907 [31:07<4:59:32,  1.38s/it][A
Training...:   6% 850/13907 [31:08<4:36:28,  1.27s/it][A
Training...:   6% 851/13907 [31:12<7:26:50,  2.05s/it][A
Training...:   6% 852/13907 [31:15<9:02:16,  2.49s/it][A
Training...:   6% 853/13907 [31:18<9:53:24,  2.73s/it][A
Training...:   6% 854/13907 [31:22<10:21:21,  2.86s/it][A
Training...:   6% 855/13907 [31:25<10:36:03,  2.92s/it][A
Training...:   6% 856/13907 [31:28<10:37:05,  2.93s/it][A
Training...:   6% 857/13907 [31:31<10:33:16,  2.91s/it][A
Training...:   6% 858/13907 [31:33<10:25:49,  2.88s/it][A
Training...:   6% 859/13907 [31:36<10:23:53,  2.87s/it][A
Training...:   6% 860/13907 [31:39<10:15:25,  2.83s/it][A
Training...:   6% 861/13907 [31:42<10:02:25,  2.77s/it][A
Training...:   6% 862/13907 [31:44<9:49:38,  2.71s/it] [A
Training...:   6% 863/13907 [31:47<9:40:14,  2.67s/it][A
Training...:   6% 864/13907 [31:49<9:29:05,  2.62s/it][A
Training...:   6% 865/13907 [31:52<9:18:24,  2.57s/it][A
Training...:   6% 866/13907 [31:54<9:09:45,  2.53s/it][A
Training...:   6% 867/13907 [31:56<9:00:20,  2.49s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:14:10<26:06:17, 31325.86s/it]
Training...:   6% 867/13907 [31:59<9:00:20,  2.49s/it][A
Training...:   6% 868/13907 [31:59<9:19:16,  2.57s/it][A
Training...:   6% 869/13907 [32:02<9:06:49,  2.52s/it][A
Training...:   6% 870/13907 [32:04<8:51:50,  2.45s/it][A
Training...:   6% 871/13907 [32:06<8:39:34,  2.39s/it][A
Training...:   6% 872/13907 [32:08<8:30:33,  2.35s/it][A
Training...:   6% 873/13907 [32:11<8:21:25,  2.31s/it][A
Training...:   6% 874/13907 [32:13<8:12:41,  2.27s/it][A
Training...:   6% 875/13907 [32:15<8:04:18,  2.23s/it][A
Training...:   6% 876/13907 [32:17<7:57:10,  2.20s/it][A
Training...:   6% 877/13907 [32:19<7:48:39,  2.16s/it][A
Training...:   6% 878/13907 [32:21<7:40:44,  2.12s/it][A
Training...:   6% 879/13907 [32:23<7:33:13,  2.09s/it][A
Training...:   6% 880/13907 [32:25<7:26:57,  2.06s/it][A
Training...:   6% 881/13907 [32:27<7:20:51,  2.03s/it][A
Training...:   6% 882/13907 [32:29<7:15:42,  2.01s/it][A
Training...:   6% 883/13907 [32:31<7:09:57,  1.98s/it][A
Training...:   6% 884/13907 [32:33<7:04:29,  1.96s/it][A
Training...:   6% 885/13907 [32:35<7:00:26,  1.94s/it][A
Training...:   6% 886/13907 [32:37<6:54:04,  1.91s/it][A
Training...:   6% 887/13907 [32:38<6:47:37,  1.88s/it][A
Training...:   6% 888/13907 [32:40<6:40:25,  1.85s/it][A
Training...:   6% 889/13907 [32:42<6:33:10,  1.81s/it][A
Training...:   6% 890/13907 [32:44<6:24:04,  1.77s/it][A
Training...:   6% 891/13907 [32:45<6:16:20,  1.73s/it][A
Training...:   6% 892/13907 [32:47<6:07:44,  1.70s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:15:00<26:06:17, 31325.86s/it]
Training...:   6% 892/13907 [32:49<6:07:44,  1.70s/it][A
Training...:   6% 893/13907 [32:49<6:20:47,  1.76s/it][A
Training...:   6% 894/13907 [32:50<6:08:47,  1.70s/it][A
Training...:   6% 895/13907 [32:52<5:53:13,  1.63s/it][A
Training...:   6% 896/13907 [32:53<5:38:26,  1.56s/it][A
Training...:   6% 897/13907 [32:55<5:26:11,  1.50s/it][A
Training...:   6% 898/13907 [32:56<5:11:53,  1.44s/it][A
Training...:   6% 899/13907 [32:57<4:56:04,  1.37s/it][A
Training...:   6% 900/13907 [32:58<4:34:06,  1.26s/it][A
Training...:   6% 901/13907 [33:02<7:24:59,  2.05s/it][A
Training...:   6% 902/13907 [33:06<9:02:40,  2.50s/it][A
Training...:   6% 903/13907 [33:09<9:48:22,  2.71s/it][A
Training...:   7% 904/13907 [33:12<10:12:46,  2.83s/it][A
Training...:   7% 905/13907 [33:15<10:26:04,  2.89s/it][A
Training...:   7% 906/13907 [33:18<10:29:36,  2.91s/it][A
Training...:   7% 907/13907 [33:21<10:25:49,  2.89s/it][A
Training...:   7% 908/13907 [33:24<10:21:30,  2.87s/it][A
Training...:   7% 909/13907 [33:26<10:14:23,  2.84s/it][A
Training...:   7% 910/13907 [33:29<10:05:19,  2.79s/it][A
Training...:   7% 911/13907 [33:32<9:56:23,  2.75s/it] [A
Training...:   7% 912/13907 [33:34<9:45:16,  2.70s/it][A
Training...:   7% 913/13907 [33:37<9:37:54,  2.67s/it][A
Training...:   7% 914/13907 [33:39<9:27:51,  2.62s/it][A
Training...:   7% 915/13907 [33:42<9:18:23,  2.58s/it][A
Training...:   7% 916/13907 [33:44<9:10:38,  2.54s/it][A
Training...:   7% 917/13907 [33:47<9:02:24,  2.51s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:16:01<26:06:17, 31325.86s/it]
Training...:   7% 917/13907 [33:49<9:02:24,  2.51s/it][A
Training...:   7% 918/13907 [33:49<9:21:53,  2.60s/it][A
Training...:   7% 919/13907 [33:52<9:11:10,  2.55s/it][A
Training...:   7% 920/13907 [33:54<8:56:58,  2.48s/it][A
Training...:   7% 921/13907 [33:57<8:44:52,  2.43s/it][A
Training...:   7% 922/13907 [33:59<8:33:13,  2.37s/it][A
Training...:   7% 923/13907 [34:01<8:22:58,  2.32s/it][A
Training...:   7% 924/13907 [34:03<8:13:54,  2.28s/it][A
Training...:   7% 925/13907 [34:05<8:04:23,  2.24s/it][A
Training...:   7% 926/13907 [34:07<7:55:40,  2.20s/it][A
Training...:   7% 927/13907 [34:09<7:47:17,  2.16s/it][A
Training...:   7% 928/13907 [34:12<7:39:24,  2.12s/it][A
Training...:   7% 929/13907 [34:14<7:33:54,  2.10s/it][A
Training...:   7% 930/13907 [34:16<7:26:52,  2.07s/it][A
Training...:   7% 931/13907 [34:18<7:20:18,  2.04s/it][A
Training...:   7% 932/13907 [34:20<7:17:05,  2.02s/it][A
Training...:   7% 933/13907 [34:22<7:15:31,  2.01s/it][A
Training...:   7% 934/13907 [34:23<7:09:53,  1.99s/it][A
Training...:   7% 935/13907 [34:25<7:03:20,  1.96s/it][A
Training...:   7% 936/13907 [34:27<6:54:24,  1.92s/it][A
Training...:   7% 937/13907 [34:29<6:45:54,  1.88s/it][A
Training...:   7% 938/13907 [34:31<6:39:54,  1.85s/it][A
Training...:   7% 939/13907 [34:32<6:32:36,  1.82s/it][A
Training...:   7% 940/13907 [34:34<6:24:48,  1.78s/it][A
Training...:   7% 941/13907 [34:36<6:19:40,  1.76s/it][A
Training...:   7% 942/13907 [34:37<6:11:05,  1.72s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:16:51<26:06:17, 31325.86s/it]
Training...:   7% 942/13907 [34:39<6:11:05,  1.72s/it][A
Training...:   7% 943/13907 [34:39<6:23:20,  1.77s/it][A
Training...:   7% 944/13907 [34:41<6:12:21,  1.72s/it][A
Training...:   7% 945/13907 [34:43<5:59:02,  1.66s/it][A
Training...:   7% 946/13907 [34:44<5:44:41,  1.60s/it][A
Training...:   7% 947/13907 [34:45<5:30:03,  1.53s/it][A
Training...:   7% 948/13907 [34:47<5:15:25,  1.46s/it][A
Training...:   7% 949/13907 [34:48<4:59:02,  1.38s/it][A
Training...:   7% 950/13907 [34:49<4:38:01,  1.29s/it][A
Training...:   7% 951/13907 [34:53<7:13:26,  2.01s/it][A
Training...:   7% 952/13907 [34:56<8:44:33,  2.43s/it][A
Training...:   7% 953/13907 [34:59<9:35:40,  2.67s/it][A
Training...:   7% 954/13907 [35:02<10:01:58,  2.79s/it][A
Training...:   7% 955/13907 [35:05<10:15:12,  2.85s/it][A
Training...:   7% 956/13907 [35:08<10:15:56,  2.85s/it][A
Training...:   7% 957/13907 [35:11<10:15:24,  2.85s/it][A
Training...:   7% 958/13907 [35:14<10:10:35,  2.83s/it][A
Training...:   7% 959/13907 [35:16<10:04:05,  2.80s/it][A
Training...:   7% 960/13907 [35:19<9:59:59,  2.78s/it] [A
Training...:   7% 961/13907 [35:22<9:52:24,  2.75s/it][A
Training...:   7% 962/13907 [35:24<9:40:47,  2.69s/it][A
Training...:   7% 963/13907 [35:27<9:30:47,  2.65s/it][A
Training...:   7% 964/13907 [35:30<9:22:43,  2.61s/it][A
Training...:   7% 965/13907 [35:32<9:12:45,  2.56s/it][A
Training...:   7% 966/13907 [35:34<9:02:57,  2.52s/it][A
Training...:   7% 967/13907 [35:37<8:56:45,  2.49s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:17:51<26:06:17, 31325.86s/it]
Training...:   7% 967/13907 [35:40<8:56:45,  2.49s/it][A
Training...:   7% 968/13907 [35:40<9:14:32,  2.57s/it][A
Training...:   7% 969/13907 [35:42<9:01:31,  2.51s/it][A
Training...:   7% 970/13907 [35:44<8:49:00,  2.45s/it][A
Training...:   7% 971/13907 [35:47<8:40:44,  2.42s/it][A
Training...:   7% 972/13907 [35:49<8:26:39,  2.35s/it][A
Training...:   7% 973/13907 [35:51<8:15:26,  2.30s/it][A
Training...:   7% 974/13907 [35:53<8:06:21,  2.26s/it][A
Training...:   7% 975/13907 [35:55<7:57:41,  2.22s/it][A
Training...:   7% 976/13907 [35:57<7:48:31,  2.17s/it][A
Training...:   7% 977/13907 [35:59<7:40:50,  2.14s/it][A
Training...:   7% 978/13907 [36:01<7:32:57,  2.10s/it][A
Training...:   7% 979/13907 [36:03<7:27:31,  2.08s/it][A
Training...:   7% 980/13907 [36:05<7:20:14,  2.04s/it][A
Training...:   7% 981/13907 [36:07<7:14:43,  2.02s/it][A
Training...:   7% 982/13907 [36:09<7:07:18,  1.98s/it][A
Training...:   7% 983/13907 [36:11<7:01:15,  1.96s/it][A
Training...:   7% 984/13907 [36:13<6:54:00,  1.92s/it][A
Training...:   7% 985/13907 [36:15<6:46:53,  1.89s/it][A
Training...:   7% 986/13907 [36:17<6:40:00,  1.86s/it][A
Training...:   7% 987/13907 [36:18<6:35:26,  1.84s/it][A
Training...:   7% 988/13907 [36:20<6:30:11,  1.81s/it][A
Training...:   7% 989/13907 [36:22<6:23:47,  1.78s/it][A
Training...:   7% 990/13907 [36:23<6:16:19,  1.75s/it][A
Training...:   7% 991/13907 [36:25<6:09:31,  1.72s/it][A
Training...:   7% 992/13907 [36:27<6:01:46,  1.68s/it][A                                                                                                                           
                                                      [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:18:40<26:06:17, 31325.86s/it]
Training...:   7% 992/13907 [36:29<6:01:46,  1.68s/it][A
Training...:   7% 993/13907 [36:29<6:14:10,  1.74s/it][A
Training...:   7% 994/13907 [36:30<6:04:47,  1.69s/it][A
Training...:   7% 995/13907 [36:32<5:51:35,  1.63s/it][A
Training...:   7% 996/13907 [36:33<5:38:46,  1.57s/it][A
Training...:   7% 997/13907 [36:34<5:25:16,  1.51s/it][A
Training...:   7% 998/13907 [36:36<5:12:39,  1.45s/it][A
Training...:   7% 999/13907 [36:37<4:58:30,  1.39s/it][A
Training...:   7% 1000/13907 [36:38<4:38:16,  1.29s/it][A
Training...:   7% 1001/13907 [36:42<7:09:21,  2.00s/it][A
Training...:   7% 1002/13907 [36:45<8:40:25,  2.42s/it][A
Training...:   7% 1003/13907 [36:48<9:30:20,  2.65s/it][A
Training...:   7% 1004/13907 [36:52<10:03:20,  2.81s/it][A
Training...:   7% 1005/13907 [36:55<10:15:58,  2.86s/it][A
Training...:   7% 1006/13907 [36:57<10:23:24,  2.90s/it][A
Training...:   7% 1007/13907 [37:00<10:21:43,  2.89s/it][A
Training...:   7% 1008/13907 [37:03<10:16:05,  2.87s/it][A
Training...:   7% 1009/13907 [37:06<10:09:07,  2.83s/it][A
Training...:   7% 1010/13907 [37:09<9:58:52,  2.79s/it] [A
Training...:   7% 1011/13907 [37:11<9:49:26,  2.74s/it][A
Training...:   7% 1012/13907 [37:14<9:38:18,  2.69s/it][A
Training...:   7% 1013/13907 [37:16<9:33:16,  2.67s/it][A
Training...:   7% 1014/13907 [37:19<9:27:44,  2.64s/it][A
Training...:   7% 1015/13907 [37:22<9:17:54,  2.60s/it][A
Training...:   7% 1016/13907 [37:24<9:06:16,  2.54s/it][A
Training...:   7% 1017/13907 [37:26<8:56:56,  2.50s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:19:40<26:06:17, 31325.86s/it]
Training...:   7% 1017/13907 [37:29<8:56:56,  2.50s/it][A
Training...:   7% 1018/13907 [37:29<9:15:27,  2.59s/it][A
Training...:   7% 1019/13907 [37:31<9:02:23,  2.53s/it][A
Training...:   7% 1020/13907 [37:34<8:47:28,  2.46s/it][A
Training...:   7% 1021/13907 [37:36<8:35:54,  2.40s/it][A
Training...:   7% 1022/13907 [37:38<8:24:14,  2.35s/it][A
Training...:   7% 1023/13907 [37:40<8:14:25,  2.30s/it][A
Training...:   7% 1024/13907 [37:43<8:05:29,  2.26s/it][A
Training...:   7% 1025/13907 [37:45<7:57:16,  2.22s/it][A
Training...:   7% 1026/13907 [37:47<7:51:02,  2.19s/it][A
Training...:   7% 1027/13907 [37:49<7:44:44,  2.16s/it][A
Training...:   7% 1028/13907 [37:51<7:37:29,  2.13s/it][A
Training...:   7% 1029/13907 [37:53<7:31:07,  2.10s/it][A
Training...:   7% 1030/13907 [37:55<7:24:21,  2.07s/it][A
Training...:   7% 1031/13907 [37:57<7:19:33,  2.05s/it][A
Training...:   7% 1032/13907 [37:59<7:15:10,  2.03s/it][A
Training...:   7% 1033/13907 [38:01<7:08:51,  2.00s/it][A
Training...:   7% 1034/13907 [38:03<7:00:29,  1.96s/it][A
Training...:   7% 1035/13907 [38:05<6:55:23,  1.94s/it][A
Training...:   7% 1036/13907 [38:07<6:47:08,  1.90s/it][A
Training...:   7% 1037/13907 [38:08<6:40:10,  1.87s/it][A
Training...:   7% 1038/13907 [38:10<6:31:51,  1.83s/it][A
Training...:   7% 1039/13907 [38:12<6:24:24,  1.79s/it][A
Training...:   7% 1040/13907 [38:13<6:17:17,  1.76s/it][A
Training...:   7% 1041/13907 [38:15<6:09:59,  1.73s/it][A
Training...:   7% 1042/13907 [38:17<6:02:08,  1.69s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:20:30<26:06:17, 31325.86s/it]
Training...:   7% 1042/13907 [38:19<6:02:08,  1.69s/it][A
Training...:   7% 1043/13907 [38:19<6:15:19,  1.75s/it][A
Training...:   8% 1044/13907 [38:20<6:05:57,  1.71s/it][A
Training...:   8% 1045/13907 [38:22<5:52:32,  1.64s/it][A
Training...:   8% 1046/13907 [38:23<5:39:19,  1.58s/it][A
Training...:   8% 1047/13907 [38:25<5:25:32,  1.52s/it][A
Training...:   8% 1048/13907 [38:26<5:11:51,  1.46s/it][A
Training...:   8% 1049/13907 [38:27<4:58:23,  1.39s/it][A
Training...:   8% 1050/13907 [38:28<4:38:09,  1.30s/it][A
Training...:   8% 1051/13907 [38:32<7:12:25,  2.02s/it][A
Training...:   8% 1052/13907 [38:35<8:44:24,  2.45s/it][A
Training...:   8% 1053/13907 [38:39<9:34:11,  2.68s/it][A
Training...:   8% 1054/13907 [38:42<10:01:29,  2.81s/it][A
Training...:   8% 1055/13907 [38:45<10:19:44,  2.89s/it][A
Training...:   8% 1056/13907 [38:48<10:30:48,  2.95s/it][A
Training...:   8% 1057/13907 [38:51<10:28:59,  2.94s/it][A
Training...:   8% 1058/13907 [38:54<10:22:19,  2.91s/it][A
Training...:   8% 1059/13907 [38:56<10:13:26,  2.86s/it][A
Training...:   8% 1060/13907 [38:59<10:01:18,  2.81s/it][A
Training...:   8% 1061/13907 [39:02<9:51:02,  2.76s/it] [A
Training...:   8% 1062/13907 [39:04<9:40:12,  2.71s/it][A
Training...:   8% 1063/13907 [39:07<9:31:12,  2.67s/it][A
Training...:   8% 1064/13907 [39:09<9:20:02,  2.62s/it][A
Training...:   8% 1065/13907 [39:12<9:10:12,  2.57s/it][A
Training...:   8% 1066/13907 [39:14<9:03:02,  2.54s/it][A
Training...:   8% 1067/13907 [39:17<8:56:42,  2.51s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:21:31<26:06:17, 31325.86s/it]
Training...:   8% 1067/13907 [39:19<8:56:42,  2.51s/it][A
Training...:   8% 1068/13907 [39:19<9:14:28,  2.59s/it][A
Training...:   8% 1069/13907 [39:22<9:03:59,  2.54s/it][A
Training...:   8% 1070/13907 [39:24<8:50:28,  2.48s/it][A
Training...:   8% 1071/13907 [39:27<8:38:32,  2.42s/it][A
Training...:   8% 1072/13907 [39:29<8:26:43,  2.37s/it][A
Training...:   8% 1073/13907 [39:31<8:18:05,  2.33s/it][A
Training...:   8% 1074/13907 [39:33<8:08:55,  2.29s/it][A
Training...:   8% 1075/13907 [39:35<8:02:21,  2.26s/it][A
Training...:   8% 1076/13907 [39:37<7:54:35,  2.22s/it][A
Training...:   8% 1077/13907 [39:40<7:47:19,  2.19s/it][A
Training...:   8% 1078/13907 [39:42<7:42:22,  2.16s/it][A
Training...:   8% 1079/13907 [39:44<7:33:30,  2.12s/it][A
Training...:   8% 1080/13907 [39:46<7:28:16,  2.10s/it][A
Training...:   8% 1081/13907 [39:48<7:21:06,  2.06s/it][A
Training...:   8% 1082/13907 [39:50<7:13:35,  2.03s/it][A
Training...:   8% 1083/13907 [39:52<7:07:45,  2.00s/it][A
Training...:   8% 1084/13907 [39:54<6:59:25,  1.96s/it][A
Training...:   8% 1085/13907 [39:55<6:52:59,  1.93s/it][A
Training...:   8% 1086/13907 [39:57<6:45:46,  1.90s/it][A
Training...:   8% 1087/13907 [39:59<6:41:29,  1.88s/it][A
Training...:   8% 1088/13907 [40:01<6:34:32,  1.85s/it][A
Training...:   8% 1089/13907 [40:03<6:26:26,  1.81s/it][A
Training...:   8% 1090/13907 [40:04<6:17:19,  1.77s/it][A
Training...:   8% 1091/13907 [40:06<6:08:38,  1.73s/it][A
Training...:   8% 1092/13907 [40:07<6:01:51,  1.69s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:22:21<26:06:17, 31325.86s/it]
Training...:   8% 1092/13907 [40:09<6:01:51,  1.69s/it][A
Training...:   8% 1093/13907 [40:09<6:12:52,  1.75s/it][A
Training...:   8% 1094/13907 [40:11<6:01:45,  1.69s/it][A
Training...:   8% 1095/13907 [40:12<5:45:36,  1.62s/it][A
Training...:   8% 1096/13907 [40:14<5:30:44,  1.55s/it][A
Training...:   8% 1097/13907 [40:15<5:16:49,  1.48s/it][A
Training...:   8% 1098/13907 [40:16<5:03:36,  1.42s/it][A
Training...:   8% 1099/13907 [40:18<4:49:10,  1.35s/it][A
Training...:   8% 1100/13907 [40:19<4:28:55,  1.26s/it][A
Training...:   8% 1101/13907 [40:22<7:16:22,  2.04s/it][A
Training...:   8% 1102/13907 [40:26<8:46:44,  2.47s/it][A
Training...:   8% 1103/13907 [40:29<9:37:07,  2.70s/it][A
Training...:   8% 1104/13907 [40:32<10:02:06,  2.82s/it][A
Training...:   8% 1105/13907 [40:35<10:16:20,  2.89s/it][A
Training...:   8% 1106/13907 [40:38<10:21:45,  2.91s/it][A
Training...:   8% 1107/13907 [40:41<10:22:42,  2.92s/it][A
Training...:   8% 1108/13907 [40:44<10:16:15,  2.89s/it][A
Training...:   8% 1109/13907 [40:47<10:09:39,  2.86s/it][A
Training...:   8% 1110/13907 [40:50<10:00:40,  2.82s/it][A
Training...:   8% 1111/13907 [40:52<9:52:35,  2.78s/it] [A
Training...:   8% 1112/13907 [40:55<9:42:22,  2.73s/it][A
Training...:   8% 1113/13907 [40:57<9:33:54,  2.69s/it][A
Training...:   8% 1114/13907 [41:00<9:24:34,  2.65s/it][A
Training...:   8% 1115/13907 [41:02<9:14:15,  2.60s/it][A
Training...:   8% 1116/13907 [41:05<9:05:52,  2.56s/it][A
Training...:   8% 1117/13907 [41:07<8:56:39,  2.52s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:23:21<26:06:17, 31325.86s/it]
Training...:   8% 1117/13907 [41:10<8:56:39,  2.52s/it][A
Training...:   8% 1118/13907 [41:10<9:16:14,  2.61s/it][A
Training...:   8% 1119/13907 [41:13<9:07:55,  2.57s/it][A
Training...:   8% 1120/13907 [41:15<8:55:42,  2.51s/it][A
Training...:   8% 1121/13907 [41:17<8:39:47,  2.44s/it][A
Training...:   8% 1122/13907 [41:20<8:28:19,  2.39s/it][A
Training...:   8% 1123/13907 [41:22<8:17:39,  2.34s/it][A
Training...:   8% 1124/13907 [41:24<8:07:35,  2.29s/it][A
Training...:   8% 1125/13907 [41:26<7:58:52,  2.25s/it][A
Training...:   8% 1126/13907 [41:28<7:49:57,  2.21s/it][A
Training...:   8% 1127/13907 [41:30<7:40:52,  2.16s/it][A
Training...:   8% 1128/13907 [41:32<7:34:35,  2.13s/it][A
Training...:   8% 1129/13907 [41:34<7:27:55,  2.10s/it][A
Training...:   8% 1130/13907 [41:36<7:20:21,  2.07s/it][A
Training...:   8% 1131/13907 [41:38<7:13:58,  2.04s/it][A
Training...:   8% 1132/13907 [41:40<7:07:42,  2.01s/it][A
Training...:   8% 1133/13907 [41:42<7:00:01,  1.97s/it][A
Training...:   8% 1134/13907 [41:44<6:52:00,  1.94s/it][A
Training...:   8% 1135/13907 [41:46<6:46:44,  1.91s/it][A
Training...:   8% 1136/13907 [41:48<6:39:10,  1.88s/it][A
Training...:   8% 1137/13907 [41:49<6:33:23,  1.85s/it][A
Training...:   8% 1138/13907 [41:51<6:26:09,  1.81s/it][A
Training...:   8% 1139/13907 [41:53<6:19:56,  1.79s/it][A
Training...:   8% 1140/13907 [41:55<6:13:17,  1.75s/it][A
Training...:   8% 1141/13907 [41:56<6:05:55,  1.72s/it][A
Training...:   8% 1142/13907 [41:58<6:00:09,  1.69s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:24:11<26:06:17, 31325.86s/it]
Training...:   8% 1142/13907 [42:00<6:00:09,  1.69s/it][A
Training...:   8% 1143/13907 [42:00<6:13:18,  1.75s/it][A
Training...:   8% 1144/13907 [42:01<6:03:19,  1.71s/it][A
Training...:   8% 1145/13907 [42:03<5:49:38,  1.64s/it][A
Training...:   8% 1146/13907 [42:04<5:36:36,  1.58s/it][A
Training...:   8% 1147/13907 [42:06<5:22:48,  1.52s/it][A
Training...:   8% 1148/13907 [42:07<5:08:59,  1.45s/it][A
Training...:   8% 1149/13907 [42:08<4:52:04,  1.37s/it][A
Training...:   8% 1150/13907 [42:09<4:30:45,  1.27s/it][A
Training...:   8% 1151/13907 [42:13<7:05:02,  2.00s/it][A
Training...:   8% 1152/13907 [42:16<8:38:30,  2.44s/it][A
Training...:   8% 1153/13907 [42:20<9:31:49,  2.69s/it][A
Training...:   8% 1154/13907 [42:23<9:58:11,  2.81s/it][A
Training...:   8% 1155/13907 [42:26<10:11:39,  2.88s/it][A
Training...:   8% 1156/13907 [42:29<10:13:33,  2.89s/it][A
Training...:   8% 1157/13907 [42:32<10:11:52,  2.88s/it][A
Training...:   8% 1158/13907 [42:34<10:07:27,  2.86s/it][A
Training...:   8% 1159/13907 [42:37<10:02:19,  2.83s/it][A
Training...:   8% 1160/13907 [42:40<9:53:00,  2.79s/it] [A
Training...:   8% 1161/13907 [42:42<9:45:35,  2.76s/it][A
Training...:   8% 1162/13907 [42:45<9:34:41,  2.71s/it][A
Training...:   8% 1163/13907 [42:48<9:25:48,  2.66s/it][A
Training...:   8% 1164/13907 [42:50<9:18:53,  2.63s/it][A
Training...:   8% 1165/13907 [42:53<9:11:21,  2.60s/it][A
Training...:   8% 1166/13907 [42:55<9:01:51,  2.55s/it][A
Training...:   8% 1167/13907 [42:58<8:52:11,  2.51s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:25:12<26:06:17, 31325.86s/it]
Training...:   8% 1167/13907 [43:00<8:52:11,  2.51s/it][A
Training...:   8% 1168/13907 [43:00<9:09:54,  2.59s/it][A
Training...:   8% 1169/13907 [43:03<8:57:39,  2.53s/it][A
Training...:   8% 1170/13907 [43:05<8:42:53,  2.46s/it][A
Training...:   8% 1171/13907 [43:07<8:32:40,  2.42s/it][A
Training...:   8% 1172/13907 [43:10<8:21:31,  2.36s/it][A
Training...:   8% 1173/13907 [43:12<8:14:40,  2.33s/it][A
Training...:   8% 1174/13907 [43:14<8:04:52,  2.28s/it][A
Training...:   8% 1175/13907 [43:16<7:57:03,  2.25s/it][A
Training...:   8% 1176/13907 [43:18<7:49:27,  2.21s/it][A
Training...:   8% 1177/13907 [43:20<7:42:54,  2.18s/it][A
Training...:   8% 1178/13907 [43:22<7:35:48,  2.15s/it][A
Training...:   8% 1179/13907 [43:25<7:30:35,  2.12s/it][A
Training...:   8% 1180/13907 [43:27<7:24:12,  2.09s/it][A
Training...:   8% 1181/13907 [43:29<7:17:36,  2.06s/it][A
Training...:   8% 1182/13907 [43:31<7:10:46,  2.03s/it][A
Training...:   9% 1183/13907 [43:32<7:03:59,  2.00s/it][A
Training...:   9% 1184/13907 [43:34<6:56:51,  1.97s/it][A
Training...:   9% 1185/13907 [43:36<6:51:18,  1.94s/it][A
Training...:   9% 1186/13907 [43:38<6:44:37,  1.91s/it][A
Training...:   9% 1187/13907 [43:40<6:37:29,  1.87s/it][A
Training...:   9% 1188/13907 [43:42<6:32:14,  1.85s/it][A
Training...:   9% 1189/13907 [43:43<6:25:19,  1.82s/it][A
Training...:   9% 1190/13907 [43:45<6:16:52,  1.78s/it][A
Training...:   9% 1191/13907 [43:47<6:08:57,  1.74s/it][A
Training...:   9% 1192/13907 [43:48<6:01:25,  1.71s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:26:01<26:06:17, 31325.86s/it]
Training...:   9% 1192/13907 [43:50<6:01:25,  1.71s/it][A
Training...:   9% 1193/13907 [43:50<6:13:04,  1.76s/it][A
Training...:   9% 1194/13907 [43:52<6:03:22,  1.71s/it][A
Training...:   9% 1195/13907 [43:53<5:49:47,  1.65s/it][A
Training...:   9% 1196/13907 [43:55<5:36:07,  1.59s/it][A
Training...:   9% 1197/13907 [43:56<5:22:53,  1.52s/it][A
Training...:   9% 1198/13907 [43:57<5:07:31,  1.45s/it][A
Training...:   9% 1199/13907 [43:59<4:51:37,  1.38s/it][A
Training...:   9% 1200/13907 [44:00<4:30:10,  1.28s/it][A
Training...:   9% 1201/13907 [44:03<7:07:24,  2.02s/it][A
Training...:   9% 1202/13907 [44:07<8:35:27,  2.43s/it][A
Training...:   9% 1203/13907 [44:10<9:24:22,  2.67s/it][A
Training...:   9% 1204/13907 [44:13<9:53:49,  2.80s/it][A
Training...:   9% 1205/13907 [44:16<10:07:47,  2.87s/it][A
Training...:   9% 1206/13907 [44:19<10:08:35,  2.88s/it][A
Training...:   9% 1207/13907 [44:22<10:09:40,  2.88s/it][A
Training...:   9% 1208/13907 [44:25<10:07:46,  2.87s/it][A
Training...:   9% 1209/13907 [44:28<10:00:43,  2.84s/it][A
Training...:   9% 1210/13907 [44:30<9:49:41,  2.79s/it] [A
Training...:   9% 1211/13907 [44:33<9:39:33,  2.74s/it][A
Training...:   9% 1212/13907 [44:35<9:31:14,  2.70s/it][A
Training...:   9% 1213/13907 [44:38<9:20:32,  2.65s/it][A
Training...:   9% 1214/13907 [44:41<9:11:44,  2.61s/it][A
Training...:   9% 1215/13907 [44:43<9:04:53,  2.58s/it][A
Training...:   9% 1216/13907 [44:45<8:57:13,  2.54s/it][A
Training...:   9% 1217/13907 [44:48<8:49:04,  2.50s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:27:02<26:06:17, 31325.86s/it]
Training...:   9% 1217/13907 [44:51<8:49:04,  2.50s/it][A
Training...:   9% 1218/13907 [44:51<9:05:39,  2.58s/it][A
Training...:   9% 1219/13907 [44:53<8:56:31,  2.54s/it][A
Training...:   9% 1220/13907 [44:55<8:41:04,  2.46s/it][A
Training...:   9% 1221/13907 [44:58<8:29:25,  2.41s/it][A
Training...:   9% 1222/13907 [45:00<8:16:39,  2.35s/it][A
Training...:   9% 1223/13907 [45:02<8:06:11,  2.30s/it][A
Training...:   9% 1224/13907 [45:04<7:57:44,  2.26s/it][A
Training...:   9% 1225/13907 [45:06<7:48:28,  2.22s/it][A
Training...:   9% 1226/13907 [45:08<7:42:31,  2.19s/it][A
Training...:   9% 1227/13907 [45:11<7:36:18,  2.16s/it][A
Training...:   9% 1228/13907 [45:13<7:28:58,  2.12s/it][A
Training...:   9% 1229/13907 [45:15<7:24:54,  2.11s/it][A
Training...:   9% 1230/13907 [45:17<7:17:01,  2.07s/it][A
Training...:   9% 1231/13907 [45:19<7:11:46,  2.04s/it][A
Training...:   9% 1232/13907 [45:21<7:06:59,  2.02s/it][A
Training...:   9% 1233/13907 [45:23<7:00:29,  1.99s/it][A
Training...:   9% 1234/13907 [45:24<6:53:07,  1.96s/it][A
Training...:   9% 1235/13907 [45:26<6:47:58,  1.93s/it][A
Training...:   9% 1236/13907 [45:28<6:41:29,  1.90s/it][A
Training...:   9% 1237/13907 [45:30<6:35:52,  1.87s/it][A
Training...:   9% 1238/13907 [45:32<6:28:51,  1.84s/it][A
Training...:   9% 1239/13907 [45:33<6:22:33,  1.81s/it][A
Training...:   9% 1240/13907 [45:35<6:15:59,  1.78s/it][A
Training...:   9% 1241/13907 [45:37<6:08:25,  1.75s/it][A
Training...:   9% 1242/13907 [45:38<6:01:03,  1.71s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:27:52<26:06:17, 31325.86s/it]
Training...:   9% 1242/13907 [45:40<6:01:03,  1.71s/it][A
Training...:   9% 1243/13907 [45:40<6:14:14,  1.77s/it][A
Training...:   9% 1244/13907 [45:42<6:03:01,  1.72s/it][A
Training...:   9% 1245/13907 [45:43<5:47:42,  1.65s/it][A
Training...:   9% 1246/13907 [45:45<5:35:48,  1.59s/it][A
Training...:   9% 1247/13907 [45:46<5:24:48,  1.54s/it][A
Training...:   9% 1248/13907 [45:48<5:11:04,  1.47s/it][A
Training...:   9% 1249/13907 [45:49<4:55:57,  1.40s/it][A
Training...:   9% 1250/13907 [45:50<4:34:01,  1.30s/it][A
Training...:   9% 1251/13907 [45:54<7:15:38,  2.07s/it][A
Training...:   9% 1252/13907 [45:57<8:42:17,  2.48s/it][A
Training...:   9% 1253/13907 [46:00<9:29:53,  2.70s/it][A
Training...:   9% 1254/13907 [46:04<9:54:52,  2.82s/it][A
Training...:   9% 1255/13907 [46:07<10:06:16,  2.88s/it][A
Training...:   9% 1256/13907 [46:09<10:06:46,  2.88s/it][A
Training...:   9% 1257/13907 [46:12<10:07:02,  2.88s/it][A
Training...:   9% 1258/13907 [46:15<10:00:53,  2.85s/it][A
Training...:   9% 1259/13907 [46:18<9:53:14,  2.81s/it] [A
Training...:   9% 1260/13907 [46:20<9:42:59,  2.77s/it][A
Training...:   9% 1261/13907 [46:23<9:33:59,  2.72s/it][A
Training...:   9% 1262/13907 [46:26<9:24:33,  2.68s/it][A
Training...:   9% 1263/13907 [46:28<9:15:20,  2.64s/it][A
Training...:   9% 1264/13907 [46:31<9:06:18,  2.59s/it][A
Training...:   9% 1265/13907 [46:33<8:59:24,  2.56s/it][A
Training...:   9% 1266/13907 [46:36<8:52:59,  2.53s/it][A
Training...:   9% 1267/13907 [46:38<8:47:46,  2.51s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:28:52<26:06:17, 31325.86s/it]
Training...:   9% 1267/13907 [46:41<8:47:46,  2.51s/it][A
Training...:   9% 1268/13907 [46:41<9:05:58,  2.59s/it][A
Training...:   9% 1269/13907 [46:43<8:55:29,  2.54s/it][A
Training...:   9% 1270/13907 [46:46<8:42:01,  2.48s/it][A
Training...:   9% 1271/13907 [46:48<8:30:36,  2.42s/it][A
Training...:   9% 1272/13907 [46:50<8:17:54,  2.36s/it][A
Training...:   9% 1273/13907 [46:52<8:08:23,  2.32s/it][A
Training...:   9% 1274/13907 [46:55<7:58:51,  2.27s/it][A
Training...:   9% 1275/13907 [46:57<7:50:55,  2.24s/it][A
Training...:   9% 1276/13907 [46:59<7:44:09,  2.20s/it][A
Training...:   9% 1277/13907 [47:01<7:37:21,  2.17s/it][A
Training...:   9% 1278/13907 [47:03<7:30:13,  2.14s/it][A
Training...:   9% 1279/13907 [47:05<7:24:36,  2.11s/it][A
Training...:   9% 1280/13907 [47:07<7:19:50,  2.09s/it][A
Training...:   9% 1281/13907 [47:09<7:14:46,  2.07s/it][A
Training...:   9% 1282/13907 [47:11<7:08:06,  2.03s/it][A
Training...:   9% 1283/13907 [47:13<7:00:01,  2.00s/it][A
Training...:   9% 1284/13907 [47:15<6:51:59,  1.96s/it][A
Training...:   9% 1285/13907 [47:17<6:46:21,  1.93s/it][A
Training...:   9% 1286/13907 [47:18<6:39:17,  1.90s/it][A
Training...:   9% 1287/13907 [47:20<6:32:38,  1.87s/it][A
Training...:   9% 1288/13907 [47:22<6:26:08,  1.84s/it][A
Training...:   9% 1289/13907 [47:24<6:19:49,  1.81s/it][A
Training...:   9% 1290/13907 [47:25<6:12:04,  1.77s/it][A
Training...:   9% 1291/13907 [47:27<6:05:23,  1.74s/it][A
Training...:   9% 1292/13907 [47:29<5:58:10,  1.70s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:29:42<26:06:17, 31325.86s/it]
Training...:   9% 1292/13907 [47:31<5:58:10,  1.70s/it][A
Training...:   9% 1293/13907 [47:31<6:12:31,  1.77s/it][A
Training...:   9% 1294/13907 [47:32<6:02:24,  1.72s/it][A
Training...:   9% 1295/13907 [47:34<5:47:00,  1.65s/it][A
Training...:   9% 1296/13907 [47:35<5:33:07,  1.58s/it][A
Training...:   9% 1297/13907 [47:37<5:19:38,  1.52s/it][A
Training...:   9% 1298/13907 [47:38<5:06:29,  1.46s/it][A
Training...:   9% 1299/13907 [47:39<4:52:23,  1.39s/it][A
Training...:   9% 1300/13907 [47:40<4:31:51,  1.29s/it][A
Training...:   9% 1301/13907 [47:44<7:01:20,  2.01s/it][A
Training...:   9% 1302/13907 [47:47<8:31:42,  2.44s/it][A
Training...:   9% 1303/13907 [47:50<9:19:08,  2.66s/it][A
Training...:   9% 1304/13907 [47:54<9:44:07,  2.78s/it][A
Training...:   9% 1305/13907 [47:57<9:56:12,  2.84s/it][A
Training...:   9% 1306/13907 [47:59<9:59:26,  2.85s/it][A
Training...:   9% 1307/13907 [48:02<10:00:16,  2.86s/it][A
Training...:   9% 1308/13907 [48:05<9:53:55,  2.83s/it] [A
Training...:   9% 1309/13907 [48:08<9:49:48,  2.81s/it][A
Training...:   9% 1310/13907 [48:10<9:41:36,  2.77s/it][A
Training...:   9% 1311/13907 [48:13<9:31:46,  2.72s/it][A
Training...:   9% 1312/13907 [48:16<9:24:24,  2.69s/it][A
Training...:   9% 1313/13907 [48:18<9:17:32,  2.66s/it][A
Training...:   9% 1314/13907 [48:21<9:06:08,  2.60s/it][A
Training...:   9% 1315/13907 [48:23<9:00:40,  2.58s/it][A
Training...:   9% 1316/13907 [48:26<8:52:46,  2.54s/it][A
Training...:   9% 1317/13907 [48:28<8:44:46,  2.50s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:30:42<26:06:17, 31325.86s/it]
Training...:   9% 1317/13907 [48:31<8:44:46,  2.50s/it][A
Training...:   9% 1318/13907 [48:31<9:00:47,  2.58s/it][A
Training...:   9% 1319/13907 [48:33<8:49:08,  2.52s/it][A
Training...:   9% 1320/13907 [48:36<8:33:29,  2.45s/it][A
Training...:   9% 1321/13907 [48:38<8:22:43,  2.40s/it][A
Training...:  10% 1322/13907 [48:40<8:13:30,  2.35s/it][A
Training...:  10% 1323/13907 [48:42<8:03:47,  2.31s/it][A
Training...:  10% 1324/13907 [48:44<7:54:16,  2.26s/it][A
Training...:  10% 1325/13907 [48:47<7:50:08,  2.24s/it][A
Training...:  10% 1326/13907 [48:49<7:45:14,  2.22s/it][A
Training...:  10% 1327/13907 [48:51<7:40:05,  2.19s/it][A
Training...:  10% 1328/13907 [48:53<7:32:18,  2.16s/it][A
Training...:  10% 1329/13907 [48:55<7:24:18,  2.12s/it][A
Training...:  10% 1330/13907 [48:57<7:16:45,  2.08s/it][A
Training...:  10% 1331/13907 [48:59<7:09:59,  2.05s/it][A
Training...:  10% 1332/13907 [49:01<7:02:29,  2.02s/it][A
Training...:  10% 1333/13907 [49:03<6:55:37,  1.98s/it][A
Training...:  10% 1334/13907 [49:05<6:49:19,  1.95s/it][A
Training...:  10% 1335/13907 [49:07<6:43:39,  1.93s/it][A
Training...:  10% 1336/13907 [49:08<6:38:23,  1.90s/it][A
Training...:  10% 1337/13907 [49:10<6:32:31,  1.87s/it][A
Training...:  10% 1338/13907 [49:12<6:25:18,  1.84s/it][A
Training...:  10% 1339/13907 [49:14<6:18:20,  1.81s/it][A
Training...:  10% 1340/13907 [49:15<6:10:43,  1.77s/it][A
Training...:  10% 1341/13907 [49:17<6:04:43,  1.74s/it][A
Training...:  10% 1342/13907 [49:19<5:56:29,  1.70s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:31:32<26:06:17, 31325.86s/it]
Training...:  10% 1342/13907 [49:21<5:56:29,  1.70s/it][A
Training...:  10% 1343/13907 [49:21<6:08:39,  1.76s/it][A
Training...:  10% 1344/13907 [49:22<5:58:16,  1.71s/it][A
Training...:  10% 1345/13907 [49:24<5:43:19,  1.64s/it][A
Training...:  10% 1346/13907 [49:25<5:30:00,  1.58s/it][A
Training...:  10% 1347/13907 [49:26<5:17:36,  1.52s/it][A
Training...:  10% 1348/13907 [49:28<5:04:33,  1.46s/it][A
Training...:  10% 1349/13907 [49:29<4:50:28,  1.39s/it][A
Training...:  10% 1350/13907 [49:30<4:30:29,  1.29s/it][A
Training...:  10% 1351/13907 [49:34<6:57:58,  2.00s/it][A
Training...:  10% 1352/13907 [49:37<8:28:26,  2.43s/it][A
Training...:  10% 1353/13907 [49:40<9:18:37,  2.67s/it][A
Training...:  10% 1354/13907 [49:43<9:44:40,  2.79s/it][A
Training...:  10% 1355/13907 [49:47<9:58:39,  2.86s/it][A
Training...:  10% 1356/13907 [49:49<10:02:45,  2.88s/it][A
Training...:  10% 1357/13907 [49:52<10:01:54,  2.88s/it][A
Training...:  10% 1358/13907 [49:55<9:54:53,  2.84s/it] [A
Training...:  10% 1359/13907 [49:58<9:45:26,  2.80s/it][A
Training...:  10% 1360/13907 [50:00<9:36:55,  2.76s/it][A
Training...:  10% 1361/13907 [50:03<9:30:19,  2.73s/it][A
Training...:  10% 1362/13907 [50:06<9:22:12,  2.69s/it][A
Training...:  10% 1363/13907 [50:08<9:15:43,  2.66s/it][A
Training...:  10% 1364/13907 [50:11<9:06:27,  2.61s/it][A
Training...:  10% 1365/13907 [50:13<8:57:26,  2.57s/it][A
Training...:  10% 1366/13907 [50:16<8:48:13,  2.53s/it][A
Training...:  10% 1367/13907 [50:18<8:40:42,  2.49s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:32:32<26:06:17, 31325.86s/it]
Training...:  10% 1367/13907 [50:21<8:40:42,  2.49s/it][A
Training...:  10% 1368/13907 [50:21<9:02:07,  2.59s/it][A
Training...:  10% 1369/13907 [50:23<8:51:33,  2.54s/it][A
Training...:  10% 1370/13907 [50:26<8:35:53,  2.47s/it][A
Training...:  10% 1371/13907 [50:28<8:23:49,  2.41s/it][A
Training...:  10% 1372/13907 [50:30<8:14:07,  2.37s/it][A
Training...:  10% 1373/13907 [50:32<8:05:06,  2.32s/it][A
Training...:  10% 1374/13907 [50:35<7:56:24,  2.28s/it][A
Training...:  10% 1375/13907 [50:37<7:48:36,  2.24s/it][A
Training...:  10% 1376/13907 [50:39<7:41:17,  2.21s/it][A
Training...:  10% 1377/13907 [50:41<7:33:43,  2.17s/it][A
Training...:  10% 1378/13907 [50:43<7:25:59,  2.14s/it][A
Training...:  10% 1379/13907 [50:45<7:21:11,  2.11s/it][A
Training...:  10% 1380/13907 [50:47<7:13:37,  2.08s/it][A
Training...:  10% 1381/13907 [50:49<7:07:59,  2.05s/it][A
Training...:  10% 1382/13907 [50:51<7:02:25,  2.02s/it][A
Training...:  10% 1383/13907 [50:53<6:56:45,  2.00s/it][A
Training...:  10% 1384/13907 [50:55<6:50:11,  1.97s/it][A
Training...:  10% 1385/13907 [50:57<6:44:44,  1.94s/it][A
Training...:  10% 1386/13907 [50:59<6:38:12,  1.91s/it][A
Training...:  10% 1387/13907 [51:00<6:31:15,  1.88s/it][A
Training...:  10% 1388/13907 [51:02<6:24:09,  1.84s/it][A
Training...:  10% 1389/13907 [51:04<6:17:34,  1.81s/it][A
Training...:  10% 1390/13907 [51:06<6:09:59,  1.77s/it][A
Training...:  10% 1391/13907 [51:07<6:03:33,  1.74s/it][A
Training...:  10% 1392/13907 [51:09<5:57:08,  1.71s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:33:22<26:06:17, 31325.86s/it]
Training...:  10% 1392/13907 [51:11<5:57:08,  1.71s/it][A
Training...:  10% 1393/13907 [51:11<6:09:49,  1.77s/it][A
Training...:  10% 1394/13907 [51:12<6:00:07,  1.73s/it][A
Training...:  10% 1395/13907 [51:14<5:44:33,  1.65s/it][A
Training...:  10% 1396/13907 [51:15<5:29:11,  1.58s/it][A
Training...:  10% 1397/13907 [51:17<5:15:28,  1.51s/it][A
Training...:  10% 1398/13907 [51:18<5:01:26,  1.45s/it][A
Training...:  10% 1399/13907 [51:19<4:46:38,  1.37s/it][A
Training...:  10% 1400/13907 [51:20<4:25:42,  1.27s/it][A
Training...:  10% 1401/13907 [51:24<6:58:34,  2.01s/it][A
Training...:  10% 1402/13907 [51:27<8:24:27,  2.42s/it][A
Training...:  10% 1403/13907 [51:31<9:15:04,  2.66s/it][A
Training...:  10% 1404/13907 [51:34<9:40:50,  2.79s/it][A
Training...:  10% 1405/13907 [51:37<9:56:56,  2.86s/it][A
Training...:  10% 1406/13907 [51:40<9:59:45,  2.88s/it][A
Training...:  10% 1407/13907 [51:42<10:02:53,  2.89s/it][A
Training...:  10% 1408/13907 [51:45<10:01:40,  2.89s/it][A
Training...:  10% 1409/13907 [51:48<9:52:38,  2.85s/it] [A
Training...:  10% 1410/13907 [51:51<9:44:40,  2.81s/it][A
Training...:  10% 1411/13907 [51:53<9:35:25,  2.76s/it][A
Training...:  10% 1412/13907 [51:56<9:24:54,  2.71s/it][A
Training...:  10% 1413/13907 [51:59<9:16:14,  2.67s/it][A
Training...:  10% 1414/13907 [52:01<9:08:04,  2.63s/it][A
Training...:  10% 1415/13907 [52:04<8:58:54,  2.59s/it][A
Training...:  10% 1416/13907 [52:06<8:48:48,  2.54s/it][A
Training...:  10% 1417/13907 [52:09<8:40:56,  2.50s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:34:23<26:06:17, 31325.86s/it]
Training...:  10% 1417/13907 [52:11<8:40:56,  2.50s/it][A
Training...:  10% 1418/13907 [52:11<8:59:55,  2.59s/it][A
Training...:  10% 1419/13907 [52:14<8:48:43,  2.54s/it][A
Training...:  10% 1420/13907 [52:16<8:32:50,  2.46s/it][A
Training...:  10% 1421/13907 [52:18<8:20:59,  2.41s/it][A
Training...:  10% 1422/13907 [52:21<8:08:55,  2.35s/it][A
Training...:  10% 1423/13907 [52:23<8:00:07,  2.31s/it][A
Training...:  10% 1424/13907 [52:25<7:52:38,  2.27s/it][A
Training...:  10% 1425/13907 [52:27<7:44:02,  2.23s/it][A
Training...:  10% 1426/13907 [52:29<7:37:59,  2.20s/it][A
Training...:  10% 1427/13907 [52:31<7:31:22,  2.17s/it][A
Training...:  10% 1428/13907 [52:33<7:23:04,  2.13s/it][A
Training...:  10% 1429/13907 [52:35<7:18:36,  2.11s/it][A
Training...:  10% 1430/13907 [52:37<7:12:45,  2.08s/it][A
Training...:  10% 1431/13907 [52:39<7:06:56,  2.05s/it][A
Training...:  10% 1432/13907 [52:41<7:00:24,  2.02s/it][A
Training...:  10% 1433/13907 [52:43<6:54:18,  1.99s/it][A
Training...:  10% 1434/13907 [52:45<6:49:29,  1.97s/it][A
Training...:  10% 1435/13907 [52:47<6:43:44,  1.94s/it][A
Training...:  10% 1436/13907 [52:49<6:37:16,  1.91s/it][A
Training...:  10% 1437/13907 [52:51<6:29:27,  1.87s/it][A
Training...:  10% 1438/13907 [52:52<6:21:58,  1.84s/it][A
Training...:  10% 1439/13907 [52:54<6:15:08,  1.81s/it][A
Training...:  10% 1440/13907 [52:56<6:09:37,  1.78s/it][A
Training...:  10% 1441/13907 [52:58<6:02:18,  1.74s/it][A
Training...:  10% 1442/13907 [52:59<5:54:16,  1.71s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:35:12<26:06:17, 31325.86s/it]
Training...:  10% 1442/13907 [53:01<5:54:16,  1.71s/it][A
Training...:  10% 1443/13907 [53:01<6:06:04,  1.76s/it][A
Training...:  10% 1444/13907 [53:03<5:57:25,  1.72s/it][A
Training...:  10% 1445/13907 [53:04<5:45:54,  1.67s/it][A
Training...:  10% 1446/13907 [53:06<5:34:17,  1.61s/it][A
Training...:  10% 1447/13907 [53:07<5:20:10,  1.54s/it][A
Training...:  10% 1448/13907 [53:08<5:05:40,  1.47s/it][A
Training...:  10% 1449/13907 [53:10<4:48:57,  1.39s/it][A
Training...:  10% 1450/13907 [53:11<4:26:34,  1.28s/it][A
Training...:  10% 1451/13907 [53:14<6:58:39,  2.02s/it][A
Training...:  10% 1452/13907 [53:18<8:25:10,  2.43s/it][A
Training...:  10% 1453/13907 [53:21<9:12:54,  2.66s/it][A
Training...:  10% 1454/13907 [53:24<9:38:44,  2.79s/it][A
Training...:  10% 1455/13907 [53:27<9:53:18,  2.86s/it][A
Training...:  10% 1456/13907 [53:30<9:55:55,  2.87s/it][A
Training...:  10% 1457/13907 [53:33<9:56:50,  2.88s/it][A
Training...:  10% 1458/13907 [53:36<9:51:26,  2.85s/it][A
Training...:  10% 1459/13907 [53:38<9:44:42,  2.82s/it][A
Training...:  10% 1460/13907 [53:41<9:35:44,  2.78s/it][A
Training...:  11% 1461/13907 [53:44<9:27:47,  2.74s/it][A
Training...:  11% 1462/13907 [53:46<9:21:00,  2.70s/it][A
Training...:  11% 1463/13907 [53:49<9:13:34,  2.67s/it][A
Training...:  11% 1464/13907 [53:51<9:04:16,  2.62s/it][A
Training...:  11% 1465/13907 [53:54<8:56:08,  2.59s/it][A
Training...:  11% 1466/13907 [53:56<8:47:01,  2.54s/it][A
Training...:  11% 1467/13907 [53:59<8:38:00,  2.50s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:36:13<26:06:17, 31325.86s/it]
Training...:  11% 1467/13907 [54:02<8:38:00,  2.50s/it][A
Training...:  11% 1468/13907 [54:02<8:55:05,  2.58s/it][A
Training...:  11% 1469/13907 [54:04<8:46:32,  2.54s/it][A
Training...:  11% 1470/13907 [54:06<8:34:14,  2.48s/it][A
Training...:  11% 1471/13907 [54:09<8:24:38,  2.43s/it][A
Training...:  11% 1472/13907 [54:11<8:13:07,  2.38s/it][A
Training...:  11% 1473/13907 [54:13<8:02:30,  2.33s/it][A
Training...:  11% 1474/13907 [54:15<7:53:57,  2.29s/it][A
Training...:  11% 1475/13907 [54:17<7:48:59,  2.26s/it][A
Training...:  11% 1476/13907 [54:20<7:42:31,  2.23s/it][A
Training...:  11% 1477/13907 [54:22<7:33:12,  2.19s/it][A
Training...:  11% 1478/13907 [54:24<7:26:54,  2.16s/it][A
Training...:  11% 1479/13907 [54:26<7:19:10,  2.12s/it][A
Training...:  11% 1480/13907 [54:28<7:11:45,  2.08s/it][A
Training...:  11% 1481/13907 [54:30<7:05:28,  2.05s/it][A
Training...:  11% 1482/13907 [54:32<6:57:03,  2.01s/it][A
Training...:  11% 1483/13907 [54:34<6:50:10,  1.98s/it][A
Training...:  11% 1484/13907 [54:36<6:43:43,  1.95s/it][A
Training...:  11% 1485/13907 [54:37<6:36:57,  1.92s/it][A
Training...:  11% 1486/13907 [54:39<6:30:45,  1.89s/it][A
Training...:  11% 1487/13907 [54:41<6:24:56,  1.86s/it][A
Training...:  11% 1488/13907 [54:43<6:17:08,  1.82s/it][A
Training...:  11% 1489/13907 [54:44<6:11:09,  1.79s/it][A
Training...:  11% 1490/13907 [54:46<6:05:22,  1.77s/it][A
Training...:  11% 1491/13907 [54:48<5:58:20,  1.73s/it][A
Training...:  11% 1492/13907 [54:49<5:50:34,  1.69s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:37:03<26:06:17, 31325.86s/it]
Training...:  11% 1492/13907 [54:51<5:50:34,  1.69s/it][A
Training...:  11% 1493/13907 [54:51<6:02:38,  1.75s/it][A
Training...:  11% 1494/13907 [54:53<5:52:02,  1.70s/it][A
Training...:  11% 1495/13907 [54:54<5:38:51,  1.64s/it][A
Training...:  11% 1496/13907 [54:56<5:24:59,  1.57s/it][A
Training...:  11% 1497/13907 [54:57<5:10:32,  1.50s/it][A
Training...:  11% 1498/13907 [54:58<4:56:50,  1.44s/it][A
Training...:  11% 1499/13907 [55:00<4:42:50,  1.37s/it][A
Training...:  11% 1500/13907 [55:01<4:21:34,  1.26s/it][A
Training...:  11% 1501/13907 [55:04<6:57:09,  2.02s/it][A
Training...:  11% 1502/13907 [55:08<8:25:18,  2.44s/it][A
Training...:  11% 1503/13907 [55:11<9:11:59,  2.67s/it][A
Training...:  11% 1504/13907 [55:14<9:40:54,  2.81s/it][A
Training...:  11% 1505/13907 [55:17<9:54:17,  2.88s/it][A
Training...:  11% 1506/13907 [55:20<9:57:29,  2.89s/it][A
Training...:  11% 1507/13907 [55:23<9:55:37,  2.88s/it][A
Training...:  11% 1508/13907 [55:26<9:52:31,  2.87s/it][A
Training...:  11% 1509/13907 [55:29<9:46:11,  2.84s/it][A
Training...:  11% 1510/13907 [55:31<9:36:49,  2.79s/it][A
Training...:  11% 1511/13907 [55:34<9:26:59,  2.74s/it][A
Training...:  11% 1512/13907 [55:37<9:19:49,  2.71s/it][A
Training...:  11% 1513/13907 [55:39<9:17:11,  2.70s/it][A
Training...:  11% 1514/13907 [55:42<9:06:11,  2.64s/it][A
Training...:  11% 1515/13907 [55:44<8:54:09,  2.59s/it][A
Training...:  11% 1516/13907 [55:47<8:44:28,  2.54s/it][A
Training...:  11% 1517/13907 [55:49<8:35:03,  2.49s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:38:03<26:06:17, 31325.86s/it]
Training...:  11% 1517/13907 [55:52<8:35:03,  2.49s/it][A
Training...:  11% 1518/13907 [55:52<8:51:36,  2.57s/it][A
Training...:  11% 1519/13907 [55:54<8:39:26,  2.52s/it][A
Training...:  11% 1520/13907 [55:56<8:26:01,  2.45s/it][A
Training...:  11% 1521/13907 [55:59<8:14:35,  2.40s/it][A
Training...:  11% 1522/13907 [56:01<8:02:46,  2.34s/it][A
Training...:  11% 1523/13907 [56:03<7:52:32,  2.29s/it][A
Training...:  11% 1524/13907 [56:05<7:43:31,  2.25s/it][A
Training...:  11% 1525/13907 [56:07<7:35:15,  2.21s/it][A
Training...:  11% 1526/13907 [56:09<7:27:16,  2.17s/it][A
Training...:  11% 1527/13907 [56:12<7:20:52,  2.14s/it][A
Training...:  11% 1528/13907 [56:14<7:14:08,  2.10s/it][A
Training...:  11% 1529/13907 [56:16<7:07:20,  2.07s/it][A
Training...:  11% 1530/13907 [56:18<7:02:24,  2.05s/it][A
Training...:  11% 1531/13907 [56:20<6:57:58,  2.03s/it][A
Training...:  11% 1532/13907 [56:21<6:53:04,  2.00s/it][A
Training...:  11% 1533/13907 [56:23<6:47:51,  1.98s/it][A
Training...:  11% 1534/13907 [56:25<6:42:59,  1.95s/it][A
Training...:  11% 1535/13907 [56:27<6:38:11,  1.93s/it][A
Training...:  11% 1536/13907 [56:29<6:32:15,  1.90s/it][A
Training...:  11% 1537/13907 [56:31<6:24:59,  1.87s/it][A
Training...:  11% 1538/13907 [56:33<6:18:51,  1.84s/it][A
Training...:  11% 1539/13907 [56:34<6:11:33,  1.80s/it][A
Training...:  11% 1540/13907 [56:36<6:03:46,  1.76s/it][A
Training...:  11% 1541/13907 [56:38<5:56:46,  1.73s/it][A
Training...:  11% 1542/13907 [56:39<5:51:33,  1.71s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:38:52<26:06:17, 31325.86s/it]
Training...:  11% 1542/13907 [56:41<5:51:33,  1.71s/it][A
Training...:  11% 1543/13907 [56:41<6:03:58,  1.77s/it][A
Training...:  11% 1544/13907 [56:43<5:54:10,  1.72s/it][A
Training...:  11% 1545/13907 [56:44<5:40:17,  1.65s/it][A
Training...:  11% 1546/13907 [56:46<5:27:24,  1.59s/it][A
Training...:  11% 1547/13907 [56:47<5:16:02,  1.53s/it][A
Training...:  11% 1548/13907 [56:48<5:04:32,  1.48s/it][A
Training...:  11% 1549/13907 [56:50<4:48:54,  1.40s/it][A
Training...:  11% 1550/13907 [56:51<4:29:20,  1.31s/it][A
Training...:  11% 1551/13907 [56:55<7:01:33,  2.05s/it][A
Training...:  11% 1552/13907 [56:58<8:28:31,  2.47s/it][A
Training...:  11% 1553/13907 [57:01<9:14:51,  2.69s/it][A
Training...:  11% 1554/13907 [57:04<9:37:25,  2.80s/it][A
Training...:  11% 1555/13907 [57:07<9:47:51,  2.86s/it][A
Training...:  11% 1556/13907 [57:10<9:48:10,  2.86s/it][A
Training...:  11% 1557/13907 [57:13<9:47:00,  2.85s/it][A
Training...:  11% 1558/13907 [57:16<9:42:52,  2.83s/it][A
Training...:  11% 1559/13907 [57:18<9:35:47,  2.80s/it][A
Training...:  11% 1560/13907 [57:21<9:27:43,  2.76s/it][A
Training...:  11% 1561/13907 [57:24<9:18:52,  2.72s/it][A
Training...:  11% 1562/13907 [57:26<9:11:29,  2.68s/it][A
Training...:  11% 1563/13907 [57:29<9:04:38,  2.65s/it][A
Training...:  11% 1564/13907 [57:31<8:55:54,  2.61s/it][A
Training...:  11% 1565/13907 [57:34<8:47:46,  2.57s/it][A
Training...:  11% 1566/13907 [57:36<8:39:32,  2.53s/it][A
Training...:  11% 1567/13907 [57:39<8:32:24,  2.49s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:39:53<26:06:17, 31325.86s/it]
Training...:  11% 1567/13907 [57:41<8:32:24,  2.49s/it][A
Training...:  11% 1568/13907 [57:42<8:50:24,  2.58s/it][A
Training...:  11% 1569/13907 [57:44<8:39:41,  2.53s/it][A
Training...:  11% 1570/13907 [57:46<8:26:28,  2.46s/it][A
Training...:  11% 1571/13907 [57:48<8:14:46,  2.41s/it][A
Training...:  11% 1572/13907 [57:51<8:04:24,  2.36s/it][A
Training...:  11% 1573/13907 [57:53<7:55:42,  2.31s/it][A
Training...:  11% 1574/13907 [57:55<7:47:49,  2.28s/it][A
Training...:  11% 1575/13907 [57:57<7:39:59,  2.24s/it][A
Training...:  11% 1576/13907 [57:59<7:31:55,  2.20s/it][A
Training...:  11% 1577/13907 [58:01<7:25:43,  2.17s/it][A
Training...:  11% 1578/13907 [58:04<7:18:23,  2.13s/it][A
Training...:  11% 1579/13907 [58:06<7:12:42,  2.11s/it][A
Training...:  11% 1580/13907 [58:08<7:06:38,  2.08s/it][A
Training...:  11% 1581/13907 [58:10<7:02:46,  2.06s/it][A
Training...:  11% 1582/13907 [58:12<6:58:02,  2.04s/it][A
Training...:  11% 1583/13907 [58:14<6:53:54,  2.02s/it][A
Training...:  11% 1584/13907 [58:15<6:45:41,  1.98s/it][A
Training...:  11% 1585/13907 [58:17<6:37:09,  1.93s/it][A
Training...:  11% 1586/13907 [58:19<6:29:02,  1.89s/it][A
Training...:  11% 1587/13907 [58:21<6:20:58,  1.86s/it][A
Training...:  11% 1588/13907 [58:23<6:13:19,  1.82s/it][A
Training...:  11% 1589/13907 [58:24<6:06:42,  1.79s/it][A
Training...:  11% 1590/13907 [58:26<5:59:04,  1.75s/it][A
Training...:  11% 1591/13907 [58:28<5:51:52,  1.71s/it][A
Training...:  11% 1592/13907 [58:29<5:43:23,  1.67s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:40:42<26:06:17, 31325.86s/it]
Training...:  11% 1592/13907 [58:31<5:43:23,  1.67s/it][A
Training...:  11% 1593/13907 [58:31<5:49:53,  1.70s/it][A
Training...:  11% 1594/13907 [58:32<5:39:36,  1.65s/it][A
Training...:  11% 1595/13907 [58:34<5:26:44,  1.59s/it][A
Training...:  11% 1596/13907 [58:35<5:14:22,  1.53s/it][A
Training...:  11% 1597/13907 [58:37<5:02:24,  1.47s/it][A
Training...:  11% 1598/13907 [58:38<4:49:45,  1.41s/it][A
Training...:  11% 1599/13907 [58:39<4:34:56,  1.34s/it][A
Training...:  12% 1600/13907 [58:40<4:14:47,  1.24s/it][A
Training...:  12% 1601/13907 [58:44<6:46:27,  1.98s/it][A
Training...:  12% 1602/13907 [58:47<8:18:31,  2.43s/it][A
Training...:  12% 1603/13907 [58:51<9:06:25,  2.66s/it][A
Training...:  12% 1604/13907 [58:54<9:33:47,  2.80s/it][A
Training...:  12% 1605/13907 [58:57<9:49:01,  2.87s/it][A
Training...:  12% 1606/13907 [59:00<9:51:39,  2.89s/it][A
Training...:  12% 1607/13907 [59:02<9:51:59,  2.89s/it][A
Training...:  12% 1608/13907 [59:05<9:46:45,  2.86s/it][A
Training...:  12% 1609/13907 [59:08<9:40:27,  2.83s/it][A
Training...:  12% 1610/13907 [59:11<9:31:06,  2.79s/it][A
Training...:  12% 1611/13907 [59:13<9:22:21,  2.74s/it][A
Training...:  12% 1612/13907 [59:16<9:15:33,  2.71s/it][A
Training...:  12% 1613/13907 [59:19<9:04:55,  2.66s/it][A
Training...:  12% 1614/13907 [59:21<8:56:21,  2.62s/it][A
Training...:  12% 1615/13907 [59:24<8:49:41,  2.59s/it][A
Training...:  12% 1616/13907 [59:26<8:43:40,  2.56s/it][A
Training...:  12% 1617/13907 [59:29<8:38:11,  2.53s/it][A                                                                                                                           
                                                       [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:41:43<26:06:17, 31325.86s/it]
Training...:  12% 1617/13907 [59:31<8:38:11,  2.53s/it][A
Training...:  12% 1618/13907 [59:31<8:57:21,  2.62s/it][A
Training...:  12% 1619/13907 [59:34<8:52:01,  2.60s/it][A
Training...:  12% 1620/13907 [59:36<8:36:14,  2.52s/it][A
Training...:  12% 1621/13907 [59:39<8:22:41,  2.45s/it][A
Training...:  12% 1622/13907 [59:41<8:11:20,  2.40s/it][A
Training...:  12% 1623/13907 [59:43<8:00:20,  2.35s/it][A
Training...:  12% 1624/13907 [59:45<7:49:31,  2.29s/it][A
Training...:  12% 1625/13907 [59:47<7:41:25,  2.25s/it][A
Training...:  12% 1626/13907 [59:49<7:32:06,  2.21s/it][A
Training...:  12% 1627/13907 [59:52<7:24:49,  2.17s/it][A
Training...:  12% 1628/13907 [59:54<7:17:15,  2.14s/it][A
Training...:  12% 1629/13907 [59:56<7:11:44,  2.11s/it][A
Training...:  12% 1630/13907 [59:58<7:05:26,  2.08s/it][A
Training...:  12% 1631/13907 [1:00:00<7:00:56,  2.06s/it][A
Training...:  12% 1632/13907 [1:00:02<6:55:02,  2.03s/it][A
Training...:  12% 1633/13907 [1:00:04<6:47:26,  1.99s/it][A
Training...:  12% 1634/13907 [1:00:05<6:40:24,  1.96s/it][A
Training...:  12% 1635/13907 [1:00:07<6:34:56,  1.93s/it][A
Training...:  12% 1636/13907 [1:00:09<6:28:11,  1.90s/it][A
Training...:  12% 1637/13907 [1:00:11<6:23:09,  1.87s/it][A
Training...:  12% 1638/13907 [1:00:13<6:18:24,  1.85s/it][A
Training...:  12% 1639/13907 [1:00:14<6:10:45,  1.81s/it][A
Training...:  12% 1640/13907 [1:00:16<6:04:58,  1.79s/it][A
Training...:  12% 1641/13907 [1:00:18<5:58:53,  1.76s/it][A
Training...:  12% 1642/13907 [1:00:19<5:51:16,  1.72s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:42:33<26:06:17, 31325.86s/it]
Training...:  12% 1642/13907 [1:00:21<5:51:16,  1.72s/it][A
Training...:  12% 1643/13907 [1:00:21<6:03:23,  1.78s/it][A
Training...:  12% 1644/13907 [1:00:23<5:54:52,  1.74s/it][A
Training...:  12% 1645/13907 [1:00:25<5:43:00,  1.68s/it][A
Training...:  12% 1646/13907 [1:00:26<5:29:03,  1.61s/it][A
Training...:  12% 1647/13907 [1:00:27<5:15:05,  1.54s/it][A
Training...:  12% 1648/13907 [1:00:29<5:01:21,  1.47s/it][A
Training...:  12% 1649/13907 [1:00:30<4:44:31,  1.39s/it][A
Training...:  12% 1650/13907 [1:00:31<4:21:21,  1.28s/it][A
Training...:  12% 1651/13907 [1:00:35<6:48:58,  2.00s/it][A
Training...:  12% 1652/13907 [1:00:38<8:14:26,  2.42s/it][A
Training...:  12% 1653/13907 [1:00:41<9:04:48,  2.67s/it][A
Training...:  12% 1654/13907 [1:00:44<9:33:54,  2.81s/it][A
Training...:  12% 1655/13907 [1:00:47<9:49:40,  2.89s/it][A
Training...:  12% 1656/13907 [1:00:50<9:52:46,  2.90s/it][A
Training...:  12% 1657/13907 [1:00:53<9:51:32,  2.90s/it][A
Training...:  12% 1658/13907 [1:00:56<9:44:44,  2.86s/it][A
Training...:  12% 1659/13907 [1:00:59<9:37:21,  2.83s/it][A
Training...:  12% 1660/13907 [1:01:02<9:29:14,  2.79s/it][A
Training...:  12% 1661/13907 [1:01:04<9:22:04,  2.75s/it][A
Training...:  12% 1662/13907 [1:01:07<9:13:05,  2.71s/it][A
Training...:  12% 1663/13907 [1:01:09<9:03:05,  2.66s/it][A
Training...:  12% 1664/13907 [1:01:12<8:57:10,  2.63s/it][A
Training...:  12% 1665/13907 [1:01:14<8:50:40,  2.60s/it][A
Training...:  12% 1666/13907 [1:01:17<8:44:18,  2.57s/it][A
Training...:  12% 1667/13907 [1:01:19<8:36:05,  2.53s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:43:33<26:06:17, 31325.86s/it]
Training...:  12% 1667/13907 [1:01:22<8:36:05,  2.53s/it][A
Training...:  12% 1668/13907 [1:01:22<8:51:44,  2.61s/it][A
Training...:  12% 1669/13907 [1:01:25<8:39:40,  2.55s/it][A
Training...:  12% 1670/13907 [1:01:27<8:25:59,  2.48s/it][A
Training...:  12% 1671/13907 [1:01:29<8:14:29,  2.42s/it][A
Training...:  12% 1672/13907 [1:01:31<8:03:52,  2.37s/it][A
Training...:  12% 1673/13907 [1:01:34<7:56:19,  2.34s/it][A
Training...:  12% 1674/13907 [1:01:36<7:48:26,  2.30s/it][A
Training...:  12% 1675/13907 [1:01:38<7:39:54,  2.26s/it][A
Training...:  12% 1676/13907 [1:01:40<7:32:49,  2.22s/it][A
Training...:  12% 1677/13907 [1:01:42<7:25:20,  2.18s/it][A
Training...:  12% 1678/13907 [1:01:44<7:17:31,  2.15s/it][A
Training...:  12% 1679/13907 [1:01:46<7:11:25,  2.12s/it][A
Training...:  12% 1680/13907 [1:01:48<7:04:21,  2.08s/it][A
Training...:  12% 1681/13907 [1:01:50<6:58:28,  2.05s/it][A
Training...:  12% 1682/13907 [1:01:52<6:51:31,  2.02s/it][A
Training...:  12% 1683/13907 [1:01:54<6:45:09,  1.99s/it][A
Training...:  12% 1684/13907 [1:01:56<6:38:13,  1.95s/it][A
Training...:  12% 1685/13907 [1:01:58<6:32:05,  1.92s/it][A
Training...:  12% 1686/13907 [1:02:00<6:25:48,  1.89s/it][A
Training...:  12% 1687/13907 [1:02:02<6:20:01,  1.87s/it][A
Training...:  12% 1688/13907 [1:02:03<6:13:52,  1.84s/it][A
Training...:  12% 1689/13907 [1:02:05<6:08:34,  1.81s/it][A
Training...:  12% 1690/13907 [1:02:07<6:02:52,  1.78s/it][A
Training...:  12% 1691/13907 [1:02:09<5:55:24,  1.75s/it][A
Training...:  12% 1692/13907 [1:02:10<5:50:54,  1.72s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:44:23<26:06:17, 31325.86s/it]
Training...:  12% 1692/13907 [1:02:12<5:50:54,  1.72s/it][A
Training...:  12% 1693/13907 [1:02:12<6:03:39,  1.79s/it][A
Training...:  12% 1694/13907 [1:02:14<5:52:27,  1.73s/it][A
Training...:  12% 1695/13907 [1:02:15<5:38:30,  1.66s/it][A
Training...:  12% 1696/13907 [1:02:17<5:23:05,  1.59s/it][A
Training...:  12% 1697/13907 [1:02:18<5:09:24,  1.52s/it][A
Training...:  12% 1698/13907 [1:02:19<4:54:58,  1.45s/it][A
Training...:  12% 1699/13907 [1:02:20<4:39:56,  1.38s/it][A
Training...:  12% 1700/13907 [1:02:22<4:19:08,  1.27s/it][A
Training...:  12% 1701/13907 [1:02:25<6:48:39,  2.01s/it][A
Training...:  12% 1702/13907 [1:02:29<8:15:12,  2.43s/it][A
Training...:  12% 1703/13907 [1:02:32<9:07:18,  2.69s/it][A
Training...:  12% 1704/13907 [1:02:35<9:40:47,  2.86s/it][A
Training...:  12% 1705/13907 [1:02:38<9:51:53,  2.91s/it][A
Training...:  12% 1706/13907 [1:02:41<9:55:00,  2.93s/it][A
Training...:  12% 1707/13907 [1:02:44<9:54:00,  2.92s/it][A
Training...:  12% 1708/13907 [1:02:47<9:46:03,  2.88s/it][A
Training...:  12% 1709/13907 [1:02:50<9:38:34,  2.85s/it][A
Training...:  12% 1710/13907 [1:02:52<9:28:57,  2.80s/it][A
Training...:  12% 1711/13907 [1:02:55<9:17:44,  2.74s/it][A
Training...:  12% 1712/13907 [1:02:58<9:09:01,  2.70s/it][A
Training...:  12% 1713/13907 [1:03:00<9:00:30,  2.66s/it][A
Training...:  12% 1714/13907 [1:03:03<8:50:56,  2.61s/it][A
Training...:  12% 1715/13907 [1:03:05<8:44:34,  2.58s/it][A
Training...:  12% 1716/13907 [1:03:08<8:37:12,  2.55s/it][A
Training...:  12% 1717/13907 [1:03:10<8:28:19,  2.50s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:45:24<26:06:17, 31325.86s/it]
Training...:  12% 1717/13907 [1:03:13<8:28:19,  2.50s/it][A
Training...:  12% 1718/13907 [1:03:13<8:45:52,  2.59s/it][A
Training...:  12% 1719/13907 [1:03:15<8:34:43,  2.53s/it][A
Training...:  12% 1720/13907 [1:03:18<8:21:00,  2.47s/it][A
Training...:  12% 1721/13907 [1:03:20<8:09:30,  2.41s/it][A
Training...:  12% 1722/13907 [1:03:22<7:57:56,  2.35s/it][A
Training...:  12% 1723/13907 [1:03:24<7:47:32,  2.30s/it][A
Training...:  12% 1724/13907 [1:03:26<7:40:27,  2.27s/it][A
Training...:  12% 1725/13907 [1:03:29<7:32:28,  2.23s/it][A
Training...:  12% 1726/13907 [1:03:31<7:25:21,  2.19s/it][A
Training...:  12% 1727/13907 [1:03:33<7:19:20,  2.16s/it][A
Training...:  12% 1728/13907 [1:03:35<7:14:29,  2.14s/it][A
Training...:  12% 1729/13907 [1:03:37<7:08:41,  2.11s/it][A
Training...:  12% 1730/13907 [1:03:39<7:00:57,  2.07s/it][A
Training...:  12% 1731/13907 [1:03:41<6:54:39,  2.04s/it][A
Training...:  12% 1732/13907 [1:03:43<6:47:34,  2.01s/it][A
Training...:  12% 1733/13907 [1:03:45<6:41:43,  1.98s/it][A
Training...:  12% 1734/13907 [1:03:47<6:37:14,  1.96s/it][A
Training...:  12% 1735/13907 [1:03:48<6:33:20,  1.94s/it][A
Training...:  12% 1736/13907 [1:03:50<6:29:31,  1.92s/it][A
Training...:  12% 1737/13907 [1:03:52<6:21:44,  1.88s/it][A
Training...:  12% 1738/13907 [1:03:54<6:13:50,  1.84s/it][A
Training...:  13% 1739/13907 [1:03:56<6:06:44,  1.81s/it][A
Training...:  13% 1740/13907 [1:03:57<6:00:01,  1.78s/it][A
Training...:  13% 1741/13907 [1:03:59<5:53:09,  1.74s/it][A
Training...:  13% 1742/13907 [1:04:01<5:44:35,  1.70s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:46:14<26:06:17, 31325.86s/it]
Step... (13925 | Loss: 0.2535097599029541, Learning Rate: 0.00021864242444280535, Gradient Norm: 0.8572623133659363)
Step... (13950 | Loss: 0.35347285866737366, Learning Rate: 0.00021849093900527805, Gradient Norm: 1.5084713697433472)
Step... (13975 | Loss: 0.23632942140102386, Learning Rate: 0.00021833940991200507, Gradient Norm: 0.8279259204864502)
Step... (14000 | Loss: 0.226437047123909, Learning Rate: 0.00021818788081873208, Gradient Norm: 0.9318179488182068)
Step... (14025 | Loss: 0.17713984847068787, Learning Rate: 0.00021803638082928956, Gradient Norm: 0.7633461356163025)
Step... (14050 | Loss: 0.2754269242286682, Learning Rate: 0.0002178848662879318, Gradient Norm: 1.2493993043899536)
Step... (14075 | Loss: 0.29119932651519775, Learning Rate: 0.00021773333719465882, Gradient Norm: 0.9800304174423218)
Step... (14100 | Loss: 0.2328369915485382, Learning Rate: 0.00021758182265330106, Gradient Norm: 1.0306553840637207)
Step... (14125 | Loss: 0.26947009563446045, Learning Rate: 0.00021743032266385853, Gradient Norm: 0.9671823978424072)
Step... (14150 | Loss: 0.31316307187080383, Learning Rate: 0.00021727879357058555, Gradient Norm: 1.3284027576446533)
Step... (14175 | Loss: 0.2510508894920349, Learning Rate: 0.0002171272790292278, Gradient Norm: 0.7685360312461853)
Step... (14200 | Loss: 0.29485878348350525, Learning Rate: 0.00021697576448787004, Gradient Norm: 1.1279343366622925)
Step... (14225 | Loss: 0.2637232542037964, Learning Rate: 0.00021682424994651228, Gradient Norm: 0.7435874938964844)
Step... (14250 | Loss: 0.19202479720115662, Learning Rate: 0.00021667273540515453, Gradient Norm: 0.7655205130577087)
Step... (14275 | Loss: 0.3097238540649414, Learning Rate: 0.00021652122086379677, Gradient Norm: 0.7761567831039429)
Step... (14300 | Loss: 0.2480950951576233, Learning Rate: 0.0002163696917705238, Gradient Norm: 1.0460786819458008)
Step... (14325 | Loss: 0.26694566011428833, Learning Rate: 0.00021621819178108126, Gradient Norm: 0.9455958604812622)
Step... (14350 | Loss: 0.28000083565711975, Learning Rate: 0.0002160666772397235, Gradient Norm: 1.0116136074066162)
Step... (14375 | Loss: 0.22902648150920868, Learning Rate: 0.00021591514814645052, Gradient Norm: 0.8806672096252441)
Step... (14400 | Loss: 0.19589558243751526, Learning Rate: 0.000215763648157008, Gradient Norm: 0.934658944606781)
Step... (14425 | Loss: 0.3340238332748413, Learning Rate: 0.00021561213361565024, Gradient Norm: 1.124204158782959)
Step... (14450 | Loss: 0.2332192212343216, Learning Rate: 0.00021546060452237725, Gradient Norm: 0.8677842617034912)
Step... (14475 | Loss: 0.2958260178565979, Learning Rate: 0.00021530910453293473, Gradient Norm: 0.8982374668121338)
Step... (14500 | Loss: 0.27599620819091797, Learning Rate: 0.00021515758999157697, Gradient Norm: 1.387101650238037)
Step... (14525 | Loss: 0.25946342945098877, Learning Rate: 0.00021500606089830399, Gradient Norm: 0.8249841928482056)
Step... (14550 | Loss: 0.18787705898284912, Learning Rate: 0.00021485456090886146, Gradient Norm: 0.8054288625717163)
Step... (14575 | Loss: 0.2664436101913452, Learning Rate: 0.0002147030463675037, Gradient Norm: 0.95074862241745)
Step... (14600 | Loss: 0.21277160942554474, Learning Rate: 0.00021455151727423072, Gradient Norm: 0.9816071391105652)
Step... (14625 | Loss: 0.28444308042526245, Learning Rate: 0.00021440000273287296, Gradient Norm: 1.0144085884094238)
Step... (14650 | Loss: 0.19826555252075195, Learning Rate: 0.00021424850274343044, Gradient Norm: 0.7624990940093994)
Step... (14675 | Loss: 0.29561173915863037, Learning Rate: 0.00021409697365015745, Gradient Norm: 1.16307532787323)
Step... (14700 | Loss: 0.17402201890945435, Learning Rate: 0.0002139454591087997, Gradient Norm: 0.9519858360290527)
Step... (14725 | Loss: 0.2126118540763855, Learning Rate: 0.00021379395911935717, Gradient Norm: 0.7557727694511414)
Step... (14750 | Loss: 0.320600688457489, Learning Rate: 0.00021364243002608418, Gradient Norm: 1.183924913406372)
Step... (14775 | Loss: 0.31434911489486694, Learning Rate: 0.00021349091548472643,Training...:  13% 1742/13907 [1:04:02<5:44:35,  1.70s/it][A
Training...:  13% 1743/13907 [1:04:02<5:56:18,  1.76s/it][A Gradient Norm: 1.4248183965682983)
Step... (14800 | Loss: 0.27063217759132385, Learning Rate: 0.0002133394154952839, Gradient Norm: 1.2665562629699707)
Step... (14825 | Loss: 0.2341482937335968, Learning Rate: 0.00021318788640201092, Gradient Norm: 0.7858161926269531)
Step... (14850 | Loss: 0.23449105024337769, Learning Rate: 0.00021303637186065316, Gradient Norm: 0.9616357088088989)
Step... (14875 | Loss: 0.2155066430568695, Learning Rate: 0.00021288487187121063, Gradient Norm: 0.6971430778503418)
Step... (14900 | Loss: 0.207331120967865, Learning Rate: 0.00021273334277793765, Gradient Norm: 1.0972611904144287)
Step... (14925 | Loss: 0.2559854984283447, Learning Rate: 0.0002125818282365799, Gradient Norm: 1.0121666193008423)
Step... (14950 | Loss: 0.22869443893432617, Learning Rate: 0.00021243031369522214, Gradient Norm: 1.3361331224441528)
Step... (14975 | Loss: 0.2979559898376465, Learning Rate: 0.00021227879915386438, Gradient Norm: 1.1332123279571533)
Step... (15000 | Loss: 0.25799182057380676, Learning Rate: 0.00021212728461250663, Gradient Norm: 1.0596914291381836)
Step... (15025 | Loss: 0.2971429228782654, Learning Rate: 0.00021197577007114887, Gradient Norm: 0.9346359968185425)
Step... (15050 | Loss: 0.22841927409172058, Learning Rate: 0.00021182425552979112, Gradient Norm: 1.142153024673462)
Step... (15075 | Loss: 0.3461695909500122, Learning Rate: 0.00021167274098843336, Gradient Norm: 0.914898693561554)
Step... (15100 | Loss: 0.2300124168395996, Learning Rate: 0.0002115212264470756, Gradient Norm: 1.203127145767212)
Step... (15125 | Loss: 0.23458272218704224, Learning Rate: 0.00021136969735380262, Gradient Norm: 0.8174549341201782)
Step... (15150 | Loss: 0.2261677086353302, Learning Rate: 0.0002112181973643601, Gradient Norm: 1.076098084449768)
Step... (15175 | Loss: 0.2370593398809433, Learning Rate: 0.00021106668282300234, Gradient Norm: 0.8904751539230347)
Step... (15200 | Loss: 0.30308425426483154, Learning Rate: 0.00021091515372972935, Gradient Norm: 1.5938971042633057)
Step... (15225 | Loss: 0.22872866690158844, Learning Rate: 0.00021076365374028683, Gradient Norm: 0.7195963859558105)
Step... (15250 | Loss: 0.25436437129974365, Learning Rate: 0.00021061213919892907, Gradient Norm: 1.1750421524047852)
Step... (15275 | Loss: 0.21540895104408264, Learning Rate: 0.0002104606101056561, Gradient Norm: 0.7701097726821899)
Step... (15300 | Loss: 0.226002037525177, Learning Rate: 0.00021030911011621356, Gradient Norm: 1.028779149055481)
Step... (15325 | Loss: 0.23994989693164825, Learning Rate: 0.0002101575955748558, Gradient Norm: 0.8721576929092407)
Step... (15350 | Loss: 0.23646637797355652, Learning Rate: 0.00021000606648158282, Gradient Norm: 1.052966594696045)
Step... (15375 | Loss: 0.22914695739746094, Learning Rate: 0.00020985455194022506, Gradient Norm: 0.7374802231788635)
Step... (15400 | Loss: 0.24587102234363556, Learning Rate: 0.00020970305195078254, Gradient Norm: 0.972432017326355)
Step... (15425 | Loss: 0.34652137756347656, Learning Rate: 0.00020955152285750955, Gradient Norm: 0.9025478363037109)
Step... (15450 | Loss: 0.22965198755264282, Learning Rate: 0.0002094000083161518, Gradient Norm: 1.1080529689788818)
Step... (15475 | Loss: 0.3138245940208435, Learning Rate: 0.00020924850832670927, Gradient Norm: 0.947085976600647)
Step... (15500 | Loss: 0.19570297002792358, Learning Rate: 0.0002090969792334363, Gradient Norm: 0.8982380628585815)
Step... (15525 | Loss: 0.2403647005558014, Learning Rate: 0.00020894546469207853, Gradient Norm: 0.8222886323928833)
Step... (15550 | Loss: 0.2210984230041504, Learning Rate: 0.000208793964702636, Gradient Norm: 0.9028803110122681)
Step... (15575 | Loss: 0.21355096995830536, Learning Rate: 0.00020864243560936302, Gradient Norm: 0.7122482061386108)
Step... (15600 | Loss: 0.35944655537605286, Learning Rate: 0.00020849090651609004, Gradient Norm: 1.4683003425598145)
Step... (15625 | Loss: 0.2454211264848709, Learning Rate: 0.00020833942107856274, Gradient Norm: 0.9354043006896973)
Step... (15650 | Loss: 0.24449194967746735, Learning Rate: 0.00020818789198528975, Gradient Norm: 1.1531423330307007)
Training...:  13% 1744/13907 [1:04:04<5:52:53,  1.74s/it][A
Training...:  13% 1745/13907 [1:04:06<5:37:45,  1.67s/it][A
Training...:  13% 1746/13907 [1:04:07<5:22:59,  1.59s/it][A
Training...:  13% 1747/13907 [1:04:08<5:09:21,  1.53s/it][A
Training...:  13% 1748/13907 [1:04:10<4:54:21,  1.45s/it][A
Training...:  13% 1749/13907 [1:04:11<4:39:33,  1.38s/it][A
Training...:  13% 1750/13907 [1:04:12<4:16:31,  1.27s/it][A
Training...:  13% 1751/13907 [1:04:16<6:43:24,  1.99s/it][A
Training...:  13% 1752/13907 [1:04:19<8:16:47,  2.45s/it][A
Training...:  13% 1753/13907 [1:04:22<9:03:57,  2.69s/it][A
Training...:  13% 1754/13907 [1:04:25<9:24:41,  2.79s/it][A
Training...:  13% 1755/13907 [1:04:28<9:35:38,  2.84s/it][A
Training...:  13% 1756/13907 [1:04:31<9:39:20,  2.86s/it][A
Training...:  13% 1757/13907 [1:04:34<9:37:59,  2.85s/it][A
Training...:  13% 1758/13907 [1:04:37<9:33:37,  2.83s/it][A
Training...:  13% 1759/13907 [1:04:40<9:25:57,  2.80s/it][A
Training...:  13% 1760/13907 [1:04:42<9:17:38,  2.75s/it][A
Training...:  13% 1761/13907 [1:04:45<9:11:13,  2.72s/it][A
Training...:  13% 1762/13907 [1:04:48<9:03:04,  2.68s/it][A
Training...:  13% 1763/13907 [1:04:50<8:55:59,  2.65s/it][A
Training...:  13% 1764/13907 [1:04:53<8:47:23,  2.61s/it][A
Training...:  13% 1765/13907 [1:04:55<8:40:28,  2.57s/it][A
Training...:  13% 1766/13907 [1:04:58<8:33:02,  2.54s/it][A
Training...:  13% 1767/13907 [1:05:00<8:23:47,  2.49s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:47:14<26:06:17, 31325.86s/it]
Training...:  13% 1767/13907 [1:05:03<8:23:47,  2.49s/it][A
Training...:  13% 1768/13907 [1:05:03<8:41:20,  2.58s/it][A
Training...:  13% 1769/13907 [1:05:05<8:35:06,  2.55s/it][A
Training...:  13% 1770/13907 [1:05:08<8:22:43,  2.49s/it][A
Training...:  13% 1771/13907 [1:05:10<8:11:18,  2.43s/it][A
Training...:  13% 1772/13907 [1:05:12<7:58:05,  2.36s/it][A
Training...:  13% 1773/13907 [1:05:14<7:47:17,  2.31s/it][A
Training...:  13% 1774/13907 [1:05:16<7:38:12,  2.27s/it][A
Training...:  13% 1775/13907 [1:05:19<7:30:26,  2.23s/it][A
Training...:  13% 1776/13907 [1:05:21<7:23:52,  2.20s/it][A
Training...:  13% 1777/13907 [1:05:23<7:18:34,  2.17s/it][A
Training...:  13% 1778/13907 [1:05:25<7:11:46,  2.14s/it][A
Training...:  13% 1779/13907 [1:05:27<7:05:20,  2.10s/it][A
Training...:  13% 1780/13907 [1:05:29<6:58:07,  2.07s/it][A
Training...:  13% 1781/13907 [1:05:31<6:50:47,  2.03s/it][A
Training...:  13% 1782/13907 [1:05:33<6:45:39,  2.01s/it][A
Training...:  13% 1783/13907 [1:05:35<6:39:31,  1.98s/it][A
Training...:  13% 1784/13907 [1:05:37<6:33:37,  1.95s/it][A
Training...:  13% 1785/13907 [1:05:38<6:29:31,  1.93s/it][A
Training...:  13% 1786/13907 [1:05:40<6:22:29,  1.89s/it][A
Training...:  13% 1787/13907 [1:05:42<6:15:37,  1.86s/it][A
Training...:  13% 1788/13907 [1:05:44<6:09:15,  1.83s/it][A
Training...:  13% 1789/13907 [1:05:45<6:03:07,  1.80s/it][A
Training...:  13% 1790/13907 [1:05:47<5:56:29,  1.77s/it][A
Training...:  13% 1791/13907 [1:05:49<5:49:06,  1.73s/it][A
Training...:  13% 1792/13907 [1:05:50<5:41:26,  1.69s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:48:03<26:06:17, 31325.86s/it]
Training...:  13% 1792/13907 [1:05:52<5:41:26,  1.69s/it][A
Training...:  13% 1793/13907 [1:05:52<5:52:43,  1.75s/it][A
Training...:  13% 1794/13907 [1:05:54<5:42:29,  1.70s/it][A
Training...:  13% 1795/13907 [1:05:55<5:29:03,  1.63s/it][A
Training...:  13% 1796/13907 [1:05:57<5:14:16,  1.56s/it][A
Training...:  13% 1797/13907 [1:05:58<5:00:40,  1.49s/it][A
Training...:  13% 1798/13907 [1:05:59<4:46:29,  1.42s/it][A
Training...:  13% 1799/13907 [1:06:00<4:31:11,  1.34s/it][A
Training...:  13% 1800/13907 [1:06:01<4:10:40,  1.24s/it][A
Training...:  13% 1801/13907 [1:06:05<6:43:28,  2.00s/it][A
Training...:  13% 1802/13907 [1:06:09<8:10:27,  2.43s/it][A
Training...:  13% 1803/13907 [1:06:12<9:00:40,  2.68s/it][A
Training...:  13% 1804/13907 [1:06:15<9:26:31,  2.81s/it][A
Training...:  13% 1805/13907 [1:06:18<9:41:02,  2.88s/it][A
Training...:  13% 1806/13907 [1:06:21<9:44:25,  2.90s/it][A
Training...:  13% 1807/13907 [1:06:24<9:44:31,  2.90s/it][A
Training...:  13% 1808/13907 [1:06:27<9:40:57,  2.88s/it][A
Training...:  13% 1809/13907 [1:06:30<9:35:35,  2.85s/it][A
Training...:  13% 1810/13907 [1:06:32<9:24:47,  2.80s/it][A
Training...:  13% 1811/13907 [1:06:35<9:15:19,  2.75s/it][A
Training...:  13% 1812/13907 [1:06:38<9:06:55,  2.71s/it][A
Training...:  13% 1813/13907 [1:06:40<8:57:30,  2.67s/it][A
Training...:  13% 1814/13907 [1:06:43<8:47:17,  2.62s/it][A
Training...:  13% 1815/13907 [1:06:45<8:41:11,  2.59s/it][A
Training...:  13% 1816/13907 [1:06:48<8:32:26,  2.54s/it][A
Training...:  13% 1817/13907 [1:06:50<8:26:24,  2.51s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:49:04<26:06:17, 31325.86s/it]
Training...:  13% 1817/13907 [1:06:53<8:26:24,  2.51s/it][A
Training...:  13% 1818/13907 [1:06:53<8:44:32,  2.60s/it][A
Training...:  13% 1819/13907 [1:06:55<8:35:59,  2.56s/it][A
Training...:  13% 1820/13907 [1:06:58<8:22:43,  2.50s/it][A
Training...:  13% 1821/13907 [1:07:00<8:11:32,  2.44s/it][A
Training...:  13% 1822/13907 [1:07:02<8:01:43,  2.39s/it][A
Training...:  13% 1823/13907 [1:07:04<7:52:42,  2.35s/it][A
Training...:  13% 1824/13907 [1:07:07<7:43:26,  2.30s/it][A
Training...:  13% 1825/13907 [1:07:09<7:35:43,  2.26s/it][A
Training...:  13% 1826/13907 [1:07:11<7:26:58,  2.22s/it][A
Training...:  13% 1827/13907 [1:07:13<7:19:06,  2.18s/it][A
Training...:  13% 1828/13907 [1:07:15<7:11:14,  2.14s/it][A
Training...:  13% 1829/13907 [1:07:17<7:06:04,  2.12s/it][A
Training...:  13% 1830/13907 [1:07:19<6:59:43,  2.09s/it][A
Training...:  13% 1831/13907 [1:07:21<6:52:32,  2.05s/it][A
Training...:  13% 1832/13907 [1:07:23<6:47:15,  2.02s/it][A
Training...:  13% 1833/13907 [1:07:25<6:41:11,  1.99s/it][A
Training...:  13% 1834/13907 [1:07:27<6:34:47,  1.96s/it][A
Training...:  13% 1835/13907 [1:07:29<6:29:22,  1.94s/it][A
Training...:  13% 1836/13907 [1:07:31<6:23:51,  1.91s/it][A
Training...:  13% 1837/13907 [1:07:32<6:16:26,  1.87s/it][A
Training...:  13% 1838/13907 [1:07:34<6:09:10,  1.84s/it][A
Training...:  13% 1839/13907 [1:07:36<6:03:31,  1.81s/it][A
Training...:  13% 1840/13907 [1:07:38<5:55:17,  1.77s/it][A
Training...:  13% 1841/13907 [1:07:39<5:49:47,  1.74s/it][A
Training...:  13% 1842/13907 [1:07:41<5:41:57,  1.70s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:49:54<26:06:17, 31325.86s/it]
Training...:  13% 1842/13907 [1:07:43<5:41:57,  1.70s/it][A
Training...:  13% 1843/13907 [1:07:43<5:53:51,  1.76s/it][A
Training...:  13% 1844/13907 [1:07:44<5:43:47,  1.71s/it][A
Training...:  13% 1845/13907 [1:07:46<5:28:53,  1.64s/it][A
Training...:  13% 1846/13907 [1:07:47<5:16:00,  1.57s/it][A
Training...:  13% 1847/13907 [1:07:49<5:04:12,  1.51s/it][A
Training...:  13% 1848/13907 [1:07:50<4:49:44,  1.44s/it][A
Training...:  13% 1849/13907 [1:07:51<4:34:31,  1.37s/it][A
Training...:  13% 1850/13907 [1:07:52<4:14:05,  1.26s/it][A
Training...:  13% 1851/13907 [1:07:56<6:34:37,  1.96s/it][A
Training...:  13% 1852/13907 [1:07:59<8:01:51,  2.40s/it][A
Training...:  13% 1853/13907 [1:08:02<8:53:55,  2.66s/it][A
Training...:  13% 1854/13907 [1:08:05<9:16:46,  2.77s/it][A
Training...:  13% 1855/13907 [1:08:08<9:30:18,  2.84s/it][A
Training...:  13% 1856/13907 [1:08:11<9:34:25,  2.86s/it][A
Training...:  13% 1857/13907 [1:08:14<9:35:25,  2.87s/it][A
Training...:  13% 1858/13907 [1:08:17<9:28:26,  2.83s/it][A
Training...:  13% 1859/13907 [1:08:20<9:21:49,  2.80s/it][A
Training...:  13% 1860/13907 [1:08:22<9:14:02,  2.76s/it][A
Training...:  13% 1861/13907 [1:08:25<9:06:42,  2.72s/it][A
Training...:  13% 1862/13907 [1:08:28<8:57:51,  2.68s/it][A
Training...:  13% 1863/13907 [1:08:30<8:48:37,  2.63s/it][A
Training...:  13% 1864/13907 [1:08:33<8:40:48,  2.59s/it][A
Training...:  13% 1865/13907 [1:08:35<8:33:38,  2.56s/it][A
Training...:  13% 1866/13907 [1:08:37<8:25:17,  2.52s/it][A
Training...:  13% 1867/13907 [1:08:40<8:19:56,  2.49s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:50:54<26:06:17, 31325.86s/it]
Training...:  13% 1867/13907 [1:08:43<8:19:56,  2.49s/it][A
Training...:  13% 1868/13907 [1:08:43<8:38:57,  2.59s/it][A
Training...:  13% 1869/13907 [1:08:45<8:30:03,  2.54s/it][A
Training...:  13% 1870/13907 [1:08:47<8:15:38,  2.47s/it][A
Training...:  13% 1871/13907 [1:08:50<8:05:00,  2.42s/it][A
Training...:  13% 1872/13907 [1:08:52<7:54:53,  2.37s/it][A
Training...:  13% 1873/13907 [1:08:54<7:47:06,  2.33s/it][A
Training...:  13% 1874/13907 [1:08:56<7:38:20,  2.29s/it][A
Training...:  13% 1875/13907 [1:08:59<7:32:10,  2.25s/it][A
Training...:  13% 1876/13907 [1:09:01<7:22:51,  2.21s/it][A
Training...:  13% 1877/13907 [1:09:03<7:15:45,  2.17s/it][A
Training...:  14% 1878/13907 [1:09:05<7:08:36,  2.14s/it][A
Training...:  14% 1879/13907 [1:09:07<7:02:32,  2.11s/it][A
Training...:  14% 1880/13907 [1:09:09<6:56:39,  2.08s/it][A
Training...:  14% 1881/13907 [1:09:11<6:49:59,  2.05s/it][A
Training...:  14% 1882/13907 [1:09:13<6:42:50,  2.01s/it][A
Training...:  14% 1883/13907 [1:09:15<6:39:36,  1.99s/it][A
Training...:  14% 1884/13907 [1:09:17<6:37:13,  1.98s/it][A
Training...:  14% 1885/13907 [1:09:19<6:29:45,  1.95s/it][A
Training...:  14% 1886/13907 [1:09:20<6:21:18,  1.90s/it][A
Training...:  14% 1887/13907 [1:09:22<6:14:31,  1.87s/it][A
Training...:  14% 1888/13907 [1:09:24<6:07:20,  1.83s/it][A
Training...:  14% 1889/13907 [1:09:26<6:00:19,  1.80s/it][A
Training...:  14% 1890/13907 [1:09:27<5:53:06,  1.76s/it][A
Training...:  14% 1891/13907 [1:09:29<5:45:51,  1.73s/it][A
Training...:  14% 1892/13907 [1:09:31<5:37:38,  1.69s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:51:44<26:06:17, 31325.86s/it]
Training...:  14% 1892/13907 [1:09:32<5:37:38,  1.69s/it][A
Training...:  14% 1893/13907 [1:09:32<5:49:59,  1.75s/it][A
Training...:  14% 1894/13907 [1:09:34<5:40:55,  1.70s/it][A
Training...:  14% 1895/13907 [1:09:35<5:26:54,  1.63s/it][A
Training...:  14% 1896/13907 [1:09:37<5:13:44,  1.57s/it][A
Training...:  14% 1897/13907 [1:09:38<5:01:29,  1.51s/it][A
Training...:  14% 1898/13907 [1:09:40<4:48:00,  1.44s/it][A
Training...:  14% 1899/13907 [1:09:41<4:33:34,  1.37s/it][A
Training...:  14% 1900/13907 [1:09:42<4:12:30,  1.26s/it][A
Training...:  14% 1901/13907 [1:09:45<6:38:19,  1.99s/it][A
Training...:  14% 1902/13907 [1:09:49<8:05:33,  2.43s/it][A
Training...:  14% 1903/13907 [1:09:52<8:50:56,  2.65s/it][A
Training...:  14% 1904/13907 [1:09:55<9:15:51,  2.78s/it][A
Training...:  14% 1905/13907 [1:09:58<9:31:09,  2.86s/it][A
Training...:  14% 1906/13907 [1:10:01<9:32:59,  2.86s/it][A
Training...:  14% 1907/13907 [1:10:04<9:31:18,  2.86s/it][A
Training...:  14% 1908/13907 [1:10:07<9:27:52,  2.84s/it][A
Training...:  14% 1909/13907 [1:10:09<9:20:50,  2.80s/it][A
Training...:  14% 1910/13907 [1:10:12<9:16:56,  2.79s/it][A
Training...:  14% 1911/13907 [1:10:15<9:07:55,  2.74s/it][A
Training...:  14% 1912/13907 [1:10:17<8:59:55,  2.70s/it][A
Training...:  14% 1913/13907 [1:10:20<8:49:51,  2.65s/it][A
Training...:  14% 1914/13907 [1:10:22<8:40:28,  2.60s/it][A
Training...:  14% 1915/13907 [1:10:25<8:31:54,  2.56s/it][A
Training...:  14% 1916/13907 [1:10:27<8:25:13,  2.53s/it][A
Training...:  14% 1917/13907 [1:10:30<8:17:10,  2.49s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:52:44<26:06:17, 31325.86s/it]
Training...:  14% 1917/13907 [1:10:33<8:17:10,  2.49s/it][A
Training...:  14% 1918/13907 [1:10:33<8:35:25,  2.58s/it][A
Training...:  14% 1919/13907 [1:10:35<8:30:37,  2.56s/it][A
Training...:  14% 1920/13907 [1:10:37<8:17:50,  2.49s/it][A
Training...:  14% 1921/13907 [1:10:40<8:03:40,  2.42s/it][A
Training...:  14% 1922/13907 [1:10:42<7:52:46,  2.37s/it][A
Training...:  14% 1923/13907 [1:10:44<7:44:47,  2.33s/it][A
Training...:  14% 1924/13907 [1:10:46<7:35:45,  2.28s/it][A
Training...:  14% 1925/13907 [1:10:48<7:26:42,  2.24s/it][A
Training...:  14% 1926/13907 [1:10:50<7:17:49,  2.19s/it][A
Training...:  14% 1927/13907 [1:10:53<7:12:11,  2.16s/it][A
Training...:  14% 1928/13907 [1:10:55<7:04:00,  2.12s/it][A
Training...:  14% 1929/13907 [1:10:57<6:57:18,  2.09s/it][A
Training...:  14% 1930/13907 [1:10:59<6:50:46,  2.06s/it][A
Training...:  14% 1931/13907 [1:11:01<6:45:29,  2.03s/it][A
Training...:  14% 1932/13907 [1:11:03<6:39:40,  2.00s/it][A
Training...:  14% 1933/13907 [1:11:04<6:34:11,  1.98s/it][A
Training...:  14% 1934/13907 [1:11:06<6:27:43,  1.94s/it][A
Training...:  14% 1935/13907 [1:11:08<6:22:32,  1.92s/it][A
Training...:  14% 1936/13907 [1:11:10<6:17:54,  1.89s/it][A
Training...:  14% 1937/13907 [1:11:12<6:12:58,  1.87s/it][A
Training...:  14% 1938/13907 [1:11:14<6:07:25,  1.84s/it][A
Training...:  14% 1939/13907 [1:11:15<6:04:10,  1.83s/it][A
Training...:  14% 1940/13907 [1:11:17<5:57:25,  1.79s/it][A
Training...:  14% 1941/13907 [1:11:19<5:50:41,  1.76s/it][A
Training...:  14% 1942/13907 [1:11:20<5:45:58,  1.73s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:53:34<26:06:17, 31325.86s/it]
Training...:  14% 1942/13907 [1:11:22<5:45:58,  1.73s/it][A
Training...:  14% 1943/13907 [1:11:22<5:57:24,  1.79s/it][A
Training...:  14% 1944/13907 [1:11:24<5:46:34,  1.74s/it][A
Training...:  14% 1945/13907 [1:11:26<5:35:40,  1.68s/it][A
Training...:  14% 1946/13907 [1:11:27<5:21:50,  1.61s/it][A
Training...:  14% 1947/13907 [1:11:28<5:09:03,  1.55s/it][A
Training...:  14% 1948/13907 [1:11:30<4:55:54,  1.48s/it][A
Training...:  14% 1949/13907 [1:11:31<4:42:14,  1.42s/it][A
Training...:  14% 1950/13907 [1:11:32<4:20:29,  1.31s/it][A
Training...:  14% 1951/13907 [1:11:36<6:42:51,  2.02s/it][A
Training...:  14% 1952/13907 [1:11:39<8:11:42,  2.47s/it][A
Training...:  14% 1953/13907 [1:11:43<8:59:43,  2.71s/it][A
Training...:  14% 1954/13907 [1:11:46<9:26:41,  2.84s/it][A
Training...:  14% 1955/13907 [1:11:49<9:37:51,  2.90s/it][A
Training...:  14% 1956/13907 [1:11:52<9:39:18,  2.91s/it][A
Training...:  14% 1957/13907 [1:11:55<9:38:12,  2.90s/it][A
Training...:  14% 1958/13907 [1:11:57<9:32:24,  2.87s/it][A
Training...:  14% 1959/13907 [1:12:00<9:26:52,  2.85s/it][A
Training...:  14% 1960/13907 [1:12:03<9:16:54,  2.80s/it][A
Training...:  14% 1961/13907 [1:12:05<9:09:27,  2.76s/it][A
Training...:  14% 1962/13907 [1:12:08<8:59:38,  2.71s/it][A
Training...:  14% 1963/13907 [1:12:11<8:51:34,  2.67s/it][A
Training...:  14% 1964/13907 [1:12:13<8:43:04,  2.63s/it][A
Training...:  14% 1965/13907 [1:12:16<8:38:05,  2.60s/it][A
Training...:  14% 1966/13907 [1:12:18<8:30:34,  2.57s/it][A
Training...:  14% 1967/13907 [1:12:21<8:22:39,  2.53s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:54:35<26:06:17, 31325.86s/it]
Training...:  14% 1967/13907 [1:12:23<8:22:39,  2.53s/it][A
Training...:  14% 1968/13907 [1:12:23<8:36:55,  2.60s/it][A
Training...:  14% 1969/13907 [1:12:26<8:27:04,  2.55s/it][A
Training...:  14% 1970/13907 [1:12:28<8:13:13,  2.48s/it][A
Training...:  14% 1971/13907 [1:12:30<8:00:58,  2.42s/it][A
Training...:  14% 1972/13907 [1:12:33<7:49:21,  2.36s/it][A
Training...:  14% 1973/13907 [1:12:35<7:40:16,  2.31s/it][A
Training...:  14% 1974/13907 [1:12:37<7:31:07,  2.27s/it][A
Training...:  14% 1975/13907 [1:12:39<7:23:55,  2.23s/it][A
Training...:  14% 1976/13907 [1:12:41<7:15:56,  2.19s/it][A
Training...:  14% 1977/13907 [1:12:43<7:08:33,  2.16s/it][A
Training...:  14% 1978/13907 [1:12:45<7:01:19,  2.12s/it][A
Training...:  14% 1979/13907 [1:12:47<6:57:26,  2.10s/it][A
Training...:  14% 1980/13907 [1:12:49<6:51:28,  2.07s/it][A
Training...:  14% 1981/13907 [1:12:51<6:46:16,  2.04s/it][A
Training...:  14% 1982/13907 [1:12:53<6:40:54,  2.02s/it][A
Training...:  14% 1983/13907 [1:12:55<6:35:40,  1.99s/it][A
Training...:  14% 1984/13907 [1:12:57<6:29:32,  1.96s/it][A
Training...:  14% 1985/13907 [1:12:59<6:23:48,  1.93s/it][A
Training...:  14% 1986/13907 [1:13:01<6:17:22,  1.90s/it][A
Training...:  14% 1987/13907 [1:13:03<6:11:24,  1.87s/it][A
Training...:  14% 1988/13907 [1:13:04<6:04:24,  1.83s/it][A
Training...:  14% 1989/13907 [1:13:06<5:57:40,  1.80s/it][A
Training...:  14% 1990/13907 [1:13:08<5:49:34,  1.76s/it][A
Training...:  14% 1991/13907 [1:13:09<5:43:11,  1.73s/it][A
Training...:  14% 1992/13907 [1:13:11<5:35:13,  1.69s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:55:24<26:06:17, 31325.86s/it]
Training...:  14% 1992/13907 [1:13:13<5:35:13,  1.69s/it][A
Training...:  14% 1993/13907 [1:13:13<5:46:49,  1.75s/it][A
Training...:  14% 1994/13907 [1:13:15<5:37:38,  1.70s/it][A
Training...:  14% 1995/13907 [1:13:16<5:24:13,  1.63s/it][A
Training...:  14% 1996/13907 [1:13:17<5:12:19,  1.57s/it][A
Training...:  14% 1997/13907 [1:13:19<5:00:05,  1.51s/it][A
Training...:  14% 1998/13907 [1:13:20<4:46:38,  1.44s/it][A
Training...:  14% 1999/13907 [1:13:21<4:30:48,  1.36s/it][A
Training...:  14% 2000/13907 [1:13:22<4:11:15,  1.27s/it][A
Training...:  14% 2001/13907 [1:13:26<6:35:25,  1.99s/it][A
Training...:  14% 2002/13907 [1:13:29<8:01:25,  2.43s/it][A
Training...:  14% 2003/13907 [1:13:33<8:48:31,  2.66s/it][A
Training...:  14% 2004/13907 [1:13:36<9:12:47,  2.79s/it][A
Training...:  14% 2005/13907 [1:13:39<9:27:38,  2.86s/it][A
Training...:  14% 2006/13907 [1:13:42<9:30:24,  2.88s/it][A
Training...:  14% 2007/13907 [1:13:45<9:29:40,  2.87s/it][A
Training...:  14% 2008/13907 [1:13:47<9:25:29,  2.85s/it][A
Training...:  14% 2009/13907 [1:13:50<9:21:27,  2.83s/it][A
Training...:  14% 2010/13907 [1:13:53<9:14:44,  2.80s/it][A
Training...:  14% 2011/13907 [1:13:56<9:07:25,  2.76s/it][A
Training...:  14% 2012/13907 [1:13:58<8:57:21,  2.71s/it][A
Training...:  14% 2013/13907 [1:14:01<8:47:38,  2.66s/it][A
Training...:  14% 2014/13907 [1:14:03<8:38:37,  2.62s/it][A
Training...:  14% 2015/13907 [1:14:06<8:30:41,  2.58s/it][A
Training...:  14% 2016/13907 [1:14:08<8:24:02,  2.54s/it][A
Training...:  15% 2017/13907 [1:14:11<8:17:21,  2.51s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:56:25<26:06:17, 31325.86s/it]
Training...:  15% 2017/13907 [1:14:13<8:17:21,  2.51s/it][A
Training...:  15% 2018/13907 [1:14:13<8:35:53,  2.60s/it][A
Training...:  15% 2019/13907 [1:14:16<8:27:18,  2.56s/it][A
Training...:  15% 2020/13907 [1:14:18<8:15:24,  2.50s/it][A
Training...:  15% 2021/13907 [1:14:21<8:04:37,  2.45s/it][A
Training...:  15% 2022/13907 [1:14:23<7:52:51,  2.39s/it][A
Training...:  15% 2023/13907 [1:14:25<7:43:01,  2.34s/it][A
Training...:  15% 2024/13907 [1:14:27<7:31:55,  2.28s/it][A
Training...:  15% 2025/13907 [1:14:29<7:22:53,  2.24s/it][A
Training...:  15% 2026/13907 [1:14:31<7:17:26,  2.21s/it][A
Training...:  15% 2027/13907 [1:14:33<7:10:46,  2.18s/it][A
Training...:  15% 2028/13907 [1:14:36<7:07:08,  2.16s/it][A
Training...:  15% 2029/13907 [1:14:38<6:58:29,  2.11s/it][A
Training...:  15% 2030/13907 [1:14:40<6:54:04,  2.09s/it][A
Training...:  15% 2031/13907 [1:14:42<6:47:41,  2.06s/it][A
Training...:  15% 2032/13907 [1:14:44<6:41:14,  2.03s/it][A
Training...:  15% 2033/13907 [1:14:46<6:35:23,  2.00s/it][A
Training...:  15% 2034/13907 [1:14:47<6:31:03,  1.98s/it][A
Training...:  15% 2035/13907 [1:14:49<6:25:10,  1.95s/it][A
Training...:  15% 2036/13907 [1:14:51<6:19:17,  1.92s/it][A
Training...:  15% 2037/13907 [1:14:53<6:12:40,  1.88s/it][A
Training...:  15% 2038/13907 [1:14:55<6:06:11,  1.85s/it][A
Training...:  15% 2039/13907 [1:14:56<5:59:23,  1.82s/it][A
Training...:  15% 2040/13907 [1:14:58<5:52:02,  1.78s/it][A
Training...:  15% 2041/13907 [1:15:00<5:45:17,  1.75s/it][A
Training...:  15% 2042/13907 [1:15:01<5:38:09,  1.71s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:57:15<26:06:17, 31325.86s/it]
Training...:  15% 2042/13907 [1:15:03<5:38:09,  1.71s/it][A
Training...:  15% 2043/13907 [1:15:03<5:48:50,  1.76s/it][A
Training...:  15% 2044/13907 [1:15:05<5:39:12,  1.72s/it][A
Training...:  15% 2045/13907 [1:15:06<5:27:10,  1.65s/it][A
Training...:  15% 2046/13907 [1:15:08<5:13:48,  1.59s/it][A
Training...:  15% 2047/13907 [1:15:09<5:01:38,  1.53s/it][A
Training...:  15% 2048/13907 [1:15:11<4:47:29,  1.45s/it][A
Training...:  15% 2049/13907 [1:15:12<4:31:28,  1.37s/it][A
Training...:  15% 2050/13907 [1:15:13<4:09:14,  1.26s/it][A
Training...:  15% 2051/13907 [1:15:16<6:32:37,  1.99s/it][A
Training...:  15% 2052/13907 [1:15:20<7:58:35,  2.42s/it][A
Training...:  15% 2053/13907 [1:15:23<8:47:32,  2.67s/it][A
Training...:  15% 2054/13907 [1:15:26<9:14:38,  2.81s/it][A
Training...:  15% 2055/13907 [1:15:29<9:28:45,  2.88s/it][A
Training...:  15% 2056/13907 [1:15:32<9:32:15,  2.90s/it][A
Training...:  15% 2057/13907 [1:15:35<9:32:32,  2.90s/it][A
Training...:  15% 2058/13907 [1:15:38<9:28:39,  2.88s/it][A
Training...:  15% 2059/13907 [1:15:41<9:21:53,  2.85s/it][A
Training...:  15% 2060/13907 [1:15:44<9:16:03,  2.82s/it][A
Training...:  15% 2061/13907 [1:15:46<9:07:14,  2.77s/it][A
Training...:  15% 2062/13907 [1:15:49<8:57:54,  2.72s/it][A
Training...:  15% 2063/13907 [1:15:51<8:50:00,  2.68s/it][A
Training...:  15% 2064/13907 [1:15:54<8:42:12,  2.65s/it][A
Training...:  15% 2065/13907 [1:15:56<8:33:08,  2.60s/it][A
Training...:  15% 2066/13907 [1:15:59<8:26:02,  2.56s/it][A
Training...:  15% 2067/13907 [1:16:01<8:17:19,  2.52s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:58:15<26:06:17, 31325.86s/it]
Training...:  15% 2067/13907 [1:16:04<8:17:19,  2.52s/it][A
Training...:  15% 2068/13907 [1:16:04<8:33:32,  2.60s/it][A
Training...:  15% 2069/13907 [1:16:07<8:22:54,  2.55s/it][A
Training...:  15% 2070/13907 [1:16:09<8:12:16,  2.50s/it][A
Training...:  15% 2071/13907 [1:16:11<7:59:16,  2.43s/it][A
Training...:  15% 2072/13907 [1:16:13<7:49:17,  2.38s/it][A
Training...:  15% 2073/13907 [1:16:16<7:40:02,  2.33s/it][A
Training...:  15% 2074/13907 [1:16:18<7:30:38,  2.29s/it][A
Training...:  15% 2075/13907 [1:16:20<7:22:22,  2.24s/it][A
Training...:  15% 2076/13907 [1:16:22<7:13:29,  2.20s/it][A
Training...:  15% 2077/13907 [1:16:24<7:06:36,  2.16s/it][A
Training...:  15% 2078/13907 [1:16:26<7:00:51,  2.13s/it][A
Training...:  15% 2079/13907 [1:16:28<6:54:56,  2.10s/it][A
Training...:  15% 2080/13907 [1:16:30<6:48:53,  2.07s/it][A
Training...:  15% 2081/13907 [1:16:32<6:41:47,  2.04s/it][A
Training...:  15% 2082/13907 [1:16:34<6:35:21,  2.01s/it][A
Training...:  15% 2083/13907 [1:16:36<6:29:29,  1.98s/it][A
Training...:  15% 2084/13907 [1:16:38<6:24:40,  1.95s/it][A
Training...:  15% 2085/13907 [1:16:40<6:18:08,  1.92s/it][A
Training...:  15% 2086/13907 [1:16:42<6:11:59,  1.89s/it][A
Training...:  15% 2087/13907 [1:16:43<6:07:03,  1.86s/it][A
Training...:  15% 2088/13907 [1:16:45<5:59:51,  1.83s/it][A
Training...:  15% 2089/13907 [1:16:47<5:54:15,  1.80s/it][A
Training...:  15% 2090/13907 [1:16:49<5:46:56,  1.76s/it][A
Training...:  15% 2091/13907 [1:16:50<5:41:29,  1.73s/it][A
Training...:  15% 2092/13907 [1:16:52<5:35:34,  1.70s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [9:59:05<26:06:17, 31325.86s/it]
Training...:  15% 2092/13907 [1:16:54<5:35:34,  1.70s/it][A
Training...:  15% 2093/13907 [1:16:54<5:47:21,  1.76s/it][A
Training...:  15% 2094/13907 [1:16:55<5:39:27,  1.72s/it][A
Training...:  15% 2095/13907 [1:16:57<5:25:52,  1.66s/it][A
Training...:  15% 2096/13907 [1:16:58<5:12:26,  1.59s/it][A
Training...:  15% 2097/13907 [1:17:00<5:00:07,  1.52s/it][A
Training...:  15% 2098/13907 [1:17:01<4:46:36,  1.46s/it][A
Training...:  15% 2099/13907 [1:17:02<4:32:11,  1.38s/it][A
Training...:  15% 2100/13907 [1:17:03<4:11:47,  1.28s/it][A
Training...:  15% 2101/13907 [1:17:07<6:32:19,  1.99s/it][A
Training...:  15% 2102/13907 [1:17:10<7:58:04,  2.43s/it][A
Training...:  15% 2103/13907 [1:17:14<8:45:01,  2.67s/it][A
Training...:  15% 2104/13907 [1:17:17<9:10:24,  2.80s/it][A
Training...:  15% 2105/13907 [1:17:20<9:26:16,  2.88s/it][A
Training...:  15% 2106/13907 [1:17:23<9:31:30,  2.91s/it][A
Training...:  15% 2107/13907 [1:17:26<9:32:53,  2.91s/it][A
Training...:  15% 2108/13907 [1:17:29<9:28:43,  2.89s/it][A
Training...:  15% 2109/13907 [1:17:31<9:22:09,  2.86s/it][A
Training...:  15% 2110/13907 [1:17:34<9:15:38,  2.83s/it][A
Training...:  15% 2111/13907 [1:17:37<9:05:37,  2.78s/it][A
Training...:  15% 2112/13907 [1:17:39<8:58:06,  2.74s/it][A
Training...:  15% 2113/13907 [1:17:42<8:52:23,  2.71s/it][A
Training...:  15% 2114/13907 [1:17:45<8:43:39,  2.66s/it][A
Training...:  15% 2115/13907 [1:17:47<8:33:25,  2.61s/it][A
Training...:  15% 2116/13907 [1:17:50<8:24:43,  2.57s/it][A
Training...:  15% 2117/13907 [1:17:52<8:15:46,  2.52s/it][A                                                                                                                           
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:00:06<26:06:17, 31325.86s/it]
Training...:  15% 2117/13907 [1:17:55<8:15:46,  2.52s/it][A
Training...:  15% 2118/13907 [1:17:55<8:32:03,  2.61s/it][A
Training...:  15% 2119/13907 [1:17:57<8:21:13,  2.55s/it][A
Training...:  15% 2120/13907 [1:17:59<8:06:26,  2.48s/it][A
Training...:  15% 2121/13907 [1:18:02<7:55:17,  2.42s/it][A
Training...:  15% 2122/13907 [1:18:04<7:46:11,  2.37s/it][A
Training...:  15% 2123/13907 [1:18:06<7:37:25,  2.33s/it][A
Training...:  15% 2124/13907 [1:18:08<7:29:39,  2.29s/it][A
Training...:  15% 2125/13907 [1:18:11<7:22:16,  2.25s/it][A
Training...:  15% 2126/13907 [1:18:13<7:15:56,  2.22s/it][A
Training...:  15% 2127/13907 [1:18:15<7:10:01,  2.19s/it][A
Training...:  15% 2128/13907 [1:18:17<7:04:13,  2.16s/it][A
Training...:  15% 2129/13907 [1:18:19<6:59:54,  2.14s/it][A
Training...:  15% 2130/13907 [1:18:21<6:52:40,  2.10s/it][A
Training...:  15% 2131/13907 [1:18:23<6:46:39,  2.07s/it][A
Training...:  15% 2132/13907 [1:18:25<6:40:02,  2.04s/it][A
Training...:  15% 2133/13907 [1:18:27<6:34:31,  2.01s/it][A
Training...:  15% 2134/13907 [1:18:29<6:26:44,  1.97s/it][A
Training...:  15% 2135/13907 [1:18:31<6:19:57,  1.94s/it][A
Training...:  15% 2136/13907 [1:18:33<6:14:58,  1.91s/it][A
Training...:  15% 2137/13907 [1:18:34<6:09:42,  1.88s/it][A
Training...:  15% 2138/13907 [1:18:36<6:02:18,  1.85s/it][A
Training...:  15% 2139/13907 [1:18:38<5:55:15,  1.81s/it][A
Training...:  15% 2140/13907 [1:18:40<5:49:03,  1.78s/it][A
Training...:  15% 2141/13907 [1:18:41<5:42:30,  1.75s/it][A
Training...:  15% 2142/13907 [1:18:43<5:35:25,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:00:56<26:06:17, 31325.86s/it]
Training...:  15% 2142/13907 [1:18:45<5:35:25,  1.71s/it][A
Training...:  15% 2143/13907 [1:18:45<5:46:58,  1.77s/it][A
Training...:  15% 2144/13907 [1:18:46<5:39:29,  1.73s/it][A
Training...:  15% 2145/13907 [1:18:48<5:26:05,  1.66s/it][A
Training...:  15% 2146/13907 [1:18:49<5:11:25,  1.59s/it][A
Training...:  15% 2147/13907 [1:18:51<4:58:23,  1.52s/it][A
Training...:  15% 2148/13907 [1:18:52<4:45:17,  1.46s/it][A
Training...:  15% 2149/13907 [1:18:53<4:30:11,  1.38s/it][A
Training...:  15% 2150/13907 [1:18:54<4:09:59,  1.28s/it][A
Training...:  15% 2151/13907 [1:18:58<6:36:17,  2.02s/it][A
Training...:  15% 2152/13907 [1:19:02<8:03:22,  2.47s/it][A
Training...:  15% 2153/13907 [1:19:05<8:51:10,  2.71s/it][A
Training...:  15% 2154/13907 [1:19:08<9:16:07,  2.84s/it][A
Training...:  15% 2155/13907 [1:19:11<9:28:34,  2.90s/it][A
Training...:  16% 2156/13907 [1:19:14<9:29:35,  2.91s/it][A
Training...:  16% 2157/13907 [1:19:17<9:24:41,  2.88s/it][A
Training...:  16% 2158/13907 [1:19:20<9:19:00,  2.85s/it][A
Training...:  16% 2159/13907 [1:19:22<9:12:53,  2.82s/it][A
Training...:  16% 2160/13907 [1:19:25<9:03:23,  2.78s/it][A
Training...:  16% 2161/13907 [1:19:28<8:55:31,  2.74s/it][A
Training...:  16% 2162/13907 [1:19:30<8:45:50,  2.69s/it][A
Training...:  16% 2163/13907 [1:19:33<8:39:30,  2.65s/it][A
Training...:  16% 2164/13907 [1:19:35<8:32:56,  2.62s/it][A
Training...:  16% 2165/13907 [1:19:38<8:27:08,  2.59s/it][A
Training...:  16% 2166/13907 [1:19:40<8:18:56,  2.55s/it][A
Training...:  16% 2167/13907 [1:19:43<8:11:36,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:01:57<26:06:17, 31325.86s/it]
Training...:  16% 2167/13907 [1:19:45<8:11:36,  2.51s/it][A
Training...:  16% 2168/13907 [1:19:45<8:26:34,  2.59s/it][A
Training...:  16% 2169/13907 [1:19:48<8:17:44,  2.54s/it][A
Training...:  16% 2170/13907 [1:19:50<8:05:50,  2.48s/it][A
Training...:  16% 2171/13907 [1:19:53<7:56:01,  2.43s/it][A
Training...:  16% 2172/13907 [1:19:55<7:44:50,  2.38s/it][A
Training...:  16% 2173/13907 [1:19:57<7:35:05,  2.33s/it][A
Training...:  16% 2174/13907 [1:19:59<7:25:51,  2.28s/it][A
Training...:  16% 2175/13907 [1:20:01<7:18:53,  2.24s/it][A
Training...:  16% 2176/13907 [1:20:03<7:11:39,  2.21s/it][A
Training...:  16% 2177/13907 [1:20:06<7:05:55,  2.18s/it][A
Training...:  16% 2178/13907 [1:20:08<7:00:10,  2.15s/it][A
Training...:  16% 2179/13907 [1:20:10<6:53:12,  2.11s/it][A
Training...:  16% 2180/13907 [1:20:12<6:46:25,  2.08s/it][A
Training...:  16% 2181/13907 [1:20:14<6:40:01,  2.05s/it][A
Training...:  16% 2182/13907 [1:20:16<6:34:00,  2.02s/it][A
Training...:  16% 2183/13907 [1:20:17<6:28:21,  1.99s/it][A
Training...:  16% 2184/13907 [1:20:19<6:23:13,  1.96s/it][A
Training...:  16% 2185/13907 [1:20:21<6:18:27,  1.94s/it][A
Training...:  16% 2186/13907 [1:20:23<6:12:44,  1.91s/it][A
Training...:  16% 2187/13907 [1:20:25<6:07:55,  1.88s/it][A
Training...:  16% 2188/13907 [1:20:27<6:01:22,  1.85s/it][A
Training...:  16% 2189/13907 [1:20:28<5:54:28,  1.82s/it][A
Training...:  16% 2190/13907 [1:20:30<5:48:22,  1.78s/it][A
Training...:  16% 2191/13907 [1:20:32<5:42:17,  1.75s/it][A
Training...:  16% 2192/13907 [1:20:33<5:34:36,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:02:47<26:06:17, 31325.86s/it]
Training...:  16% 2192/13907 [1:20:35<5:34:36,  1.71s/it][A
Training...:  16% 2193/13907 [1:20:35<5:45:26,  1.77s/it][A
Training...:  16% 2194/13907 [1:20:37<5:36:13,  1.72s/it][A
Training...:  16% 2195/13907 [1:20:38<5:22:24,  1.65s/it][A
Training...:  16% 2196/13907 [1:20:40<5:09:11,  1.58s/it][A
Training...:  16% 2197/13907 [1:20:41<4:57:26,  1.52s/it][A
Training...:  16% 2198/13907 [1:20:43<4:44:08,  1.46s/it][A
Training...:  16% 2199/13907 [1:20:44<4:30:59,  1.39s/it][A
Training...:  16% 2200/13907 [1:20:45<4:11:59,  1.29s/it][A
Training...:  16% 2201/13907 [1:20:48<6:25:58,  1.98s/it][A
Training...:  16% 2202/13907 [1:20:52<7:45:17,  2.39s/it][A
Training...:  16% 2203/13907 [1:20:55<8:36:43,  2.65s/it][A
Training...:  16% 2204/13907 [1:20:58<9:03:04,  2.78s/it][A
Training...:  16% 2205/13907 [1:21:01<9:17:57,  2.86s/it][A
Training...:  16% 2206/13907 [1:21:04<9:23:03,  2.89s/it][A
Training...:  16% 2207/13907 [1:21:07<9:22:52,  2.89s/it][A
Training...:  16% 2208/13907 [1:21:10<9:16:06,  2.85s/it][A
Training...:  16% 2209/13907 [1:21:13<9:08:38,  2.81s/it][A
Training...:  16% 2210/13907 [1:21:15<9:02:57,  2.79s/it][A
Training...:  16% 2211/13907 [1:21:18<8:54:38,  2.74s/it][A
Training...:  16% 2212/13907 [1:21:21<8:49:10,  2.71s/it][A
Training...:  16% 2213/13907 [1:21:23<8:45:27,  2.70s/it][A
Training...:  16% 2214/13907 [1:21:26<8:36:12,  2.65s/it][A
Training...:  16% 2215/13907 [1:21:28<8:28:32,  2.61s/it][A
Training...:  16% 2216/13907 [1:21:31<8:18:20,  2.56s/it][A
Training...:  16% 2217/13907 [1:21:33<8:10:02,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:03:47<26:06:17, 31325.86s/it]
Training...:  16% 2217/13907 [1:21:36<8:10:02,  2.52s/it][A
Training...:  16% 2218/13907 [1:21:36<8:26:04,  2.60s/it][A
Training...:  16% 2219/13907 [1:21:38<8:15:36,  2.54s/it][A
Training...:  16% 2220/13907 [1:21:41<8:02:25,  2.48s/it][A
Training...:  16% 2221/13907 [1:21:43<7:52:04,  2.42s/it][A
Training...:  16% 2222/13907 [1:21:45<7:40:55,  2.37s/it][A
Training...:  16% 2223/13907 [1:21:47<7:32:17,  2.32s/it][A
Training...:  16% 2224/13907 [1:21:50<7:24:45,  2.28s/it][A
Training...:  16% 2225/13907 [1:21:52<7:17:08,  2.25s/it][A
Training...:  16% 2226/13907 [1:21:54<7:10:34,  2.21s/it][A
Training...:  16% 2227/13907 [1:21:56<7:05:26,  2.19s/it][A
Training...:  16% 2228/13907 [1:21:58<6:59:16,  2.15s/it][A
Training...:  16% 2229/13907 [1:22:00<6:52:23,  2.12s/it][A
Training...:  16% 2230/13907 [1:22:02<6:46:37,  2.09s/it][A
Training...:  16% 2231/13907 [1:22:04<6:40:29,  2.06s/it][A
Training...:  16% 2232/13907 [1:22:06<6:34:47,  2.03s/it][A
Training...:  16% 2233/13907 [1:22:08<6:29:24,  2.00s/it][A
Training...:  16% 2234/13907 [1:22:10<6:23:01,  1.97s/it][A
Training...:  16% 2235/13907 [1:22:12<6:17:22,  1.94s/it][A
Training...:  16% 2236/13907 [1:22:14<6:12:12,  1.91s/it][A
Training...:  16% 2237/13907 [1:22:15<6:06:08,  1.88s/it][A
Training...:  16% 2238/13907 [1:22:17<6:00:55,  1.86s/it][A
Training...:  16% 2239/13907 [1:22:19<5:55:40,  1.83s/it][A
Training...:  16% 2240/13907 [1:22:21<5:50:03,  1.80s/it][A
Training...:  16% 2241/13907 [1:22:22<5:44:12,  1.77s/it][A
Training...:  16% 2242/13907 [1:22:24<5:36:21,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:04:37<26:06:17, 31325.86s/it]
Training...:  16% 2242/13907 [1:22:26<5:36:21,  1.73s/it][A
Training...:  16% 2243/13907 [1:22:26<5:46:32,  1.78s/it][A
Training...:  16% 2244/13907 [1:22:28<5:35:28,  1.73s/it][A
Training...:  16% 2245/13907 [1:22:29<5:21:31,  1.65s/it][A
Training...:  16% 2246/13907 [1:22:30<5:08:49,  1.59s/it][A
Training...:  16% 2247/13907 [1:22:32<4:56:54,  1.53s/it][A
Training...:  16% 2248/13907 [1:22:33<4:45:02,  1.47s/it][A
Training...:  16% 2249/13907 [1:22:34<4:31:09,  1.40s/it][A
Training...:  16% 2250/13907 [1:22:35<4:11:09,  1.29s/it][A
Training...:  16% 2251/13907 [1:22:39<6:28:55,  2.00s/it][A
Training...:  16% 2252/13907 [1:22:43<7:51:47,  2.43s/it][A
Training...:  16% 2253/13907 [1:22:46<8:40:44,  2.68s/it][A
Training...:  16% 2254/13907 [1:22:49<9:07:06,  2.82s/it][A
Training...:  16% 2255/13907 [1:22:52<9:19:45,  2.88s/it][A
Training...:  16% 2256/13907 [1:22:55<9:20:39,  2.89s/it][A
Training...:  16% 2257/13907 [1:22:58<9:19:44,  2.88s/it][A
Training...:  16% 2258/13907 [1:23:01<9:13:38,  2.85s/it][A
Training...:  16% 2259/13907 [1:23:03<9:05:56,  2.81s/it][A
Training...:  16% 2260/13907 [1:23:06<8:58:27,  2.77s/it][A
Training...:  16% 2261/13907 [1:23:09<8:51:16,  2.74s/it][A
Training...:  16% 2262/13907 [1:23:11<8:42:50,  2.69s/it][A
Training...:  16% 2263/13907 [1:23:14<8:33:49,  2.65s/it][A
Training...:  16% 2264/13907 [1:23:16<8:25:39,  2.61s/it][A
Training...:  16% 2265/13907 [1:23:19<8:17:20,  2.56s/it][A
Training...:  16% 2266/13907 [1:23:21<8:09:33,  2.52s/it][A
Training...:  16% 2267/13907 [1:23:24<8:04:54,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:05:38<26:06:17, 31325.86s/it]
Training...:  16% 2267/13907 [1:23:26<8:04:54,  2.50s/it][A
Training...:  16% 2268/13907 [1:23:26<8:25:33,  2.61s/it][A
Training...:  16% 2269/13907 [1:23:29<8:18:34,  2.57s/it][A
Training...:  16% 2270/13907 [1:23:31<8:03:18,  2.49s/it][A
Training...:  16% 2271/13907 [1:23:34<7:51:57,  2.43s/it][A
Training...:  16% 2272/13907 [1:23:36<7:41:00,  2.38s/it][A
Training...:  16% 2273/13907 [1:23:38<7:31:26,  2.33s/it][A
Training...:  16% 2274/13907 [1:23:40<7:23:18,  2.29s/it][A
Training...:  16% 2275/13907 [1:23:42<7:15:19,  2.25s/it][A
Training...:  16% 2276/13907 [1:23:44<7:07:56,  2.21s/it][A
Training...:  16% 2277/13907 [1:23:47<7:01:28,  2.17s/it][A
Training...:  16% 2278/13907 [1:23:49<6:53:44,  2.13s/it][A
Training...:  16% 2279/13907 [1:23:51<6:47:32,  2.10s/it][A
Training...:  16% 2280/13907 [1:23:53<6:41:43,  2.07s/it][A
Training...:  16% 2281/13907 [1:23:55<6:37:35,  2.05s/it][A
Training...:  16% 2282/13907 [1:23:57<6:31:12,  2.02s/it][A
Training...:  16% 2283/13907 [1:23:58<6:25:32,  1.99s/it][A
Training...:  16% 2284/13907 [1:24:00<6:18:35,  1.95s/it][A
Training...:  16% 2285/13907 [1:24:02<6:13:36,  1.93s/it][A
Training...:  16% 2286/13907 [1:24:04<6:07:48,  1.90s/it][A
Training...:  16% 2287/13907 [1:24:06<6:02:45,  1.87s/it][A
Training...:  16% 2288/13907 [1:24:08<5:56:44,  1.84s/it][A
Training...:  16% 2289/13907 [1:24:09<5:50:32,  1.81s/it][A
Training...:  16% 2290/13907 [1:24:11<5:44:53,  1.78s/it][A
Training...:  16% 2291/13907 [1:24:13<5:38:21,  1.75s/it][A
Training...:  16% 2292/13907 [1:24:14<5:30:54,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:06:27<26:06:17, 31325.86s/it]
Training...:  16% 2292/13907 [1:24:16<5:30:54,  1.71s/it][A
Training...:  16% 2293/13907 [1:24:16<5:42:25,  1.77s/it][A
Training...:  16% 2294/13907 [1:24:18<5:32:39,  1.72s/it][A
Training...:  17% 2295/13907 [1:24:19<5:19:28,  1.65s/it][A
Training...:  17% 2296/13907 [1:24:21<5:06:50,  1.59s/it][A
Training...:  17% 2297/13907 [1:24:22<4:53:43,  1.52s/it][A
Training...:  17% 2298/13907 [1:24:23<4:41:10,  1.45s/it][A
Training...:  17% 2299/13907 [1:24:25<4:26:39,  1.38s/it][A
Training...:  17% 2300/13907 [1:24:26<4:05:11,  1.27s/it][A
Training...:  17% 2301/13907 [1:24:29<6:26:57,  2.00s/it][A
Training...:  17% 2302/13907 [1:24:33<7:51:39,  2.44s/it][A
Training...:  17% 2303/13907 [1:24:36<8:42:58,  2.70s/it][A
Training...:  17% 2304/13907 [1:24:39<9:06:50,  2.83s/it][A
Training...:  17% 2305/13907 [1:24:42<9:20:37,  2.90s/it][A
Training...:  17% 2306/13907 [1:24:45<9:25:25,  2.92s/it][A
Training...:  17% 2307/13907 [1:24:48<9:23:47,  2.92s/it][A
Training...:  17% 2308/13907 [1:24:51<9:19:58,  2.90s/it][A
Training...:  17% 2309/13907 [1:24:54<9:14:35,  2.87s/it][A
Training...:  17% 2310/13907 [1:24:57<9:08:53,  2.84s/it][A
Training...:  17% 2311/13907 [1:24:59<9:00:30,  2.80s/it][A
Training...:  17% 2312/13907 [1:25:02<8:51:24,  2.75s/it][A
Training...:  17% 2313/13907 [1:25:05<8:46:15,  2.72s/it][A
Training...:  17% 2314/13907 [1:25:07<8:40:27,  2.69s/it][A
Training...:  17% 2315/13907 [1:25:10<8:31:14,  2.65s/it][A
Training...:  17% 2316/13907 [1:25:12<8:20:14,  2.59s/it][A
Training...:  17% 2317/13907 [1:25:15<8:11:21,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:07:29<26:06:17, 31325.86s/it]
Training...:  17% 2317/13907 [1:25:17<8:11:21,  2.54s/it][A
Training...:  17% 2318/13907 [1:25:17<8:25:01,  2.61s/it][A
Training...:  17% 2319/13907 [1:25:20<8:14:16,  2.56s/it][A
Training...:  17% 2320/13907 [1:25:22<7:59:13,  2.48s/it][A
Training...:  17% 2321/13907 [1:25:25<7:49:05,  2.43s/it][A
Training...:  17% 2322/13907 [1:25:27<7:39:05,  2.38s/it][A
Training...:  17% 2323/13907 [1:25:29<7:29:19,  2.33s/it][A
Training...:  17% 2324/13907 [1:25:31<7:20:40,  2.28s/it][A
Training...:  17% 2325/13907 [1:25:33<7:13:22,  2.25s/it][A
Training...:  17% 2326/13907 [1:25:35<7:06:57,  2.21s/it][A
Training...:  17% 2327/13907 [1:25:38<6:59:19,  2.17s/it][A
Training...:  17% 2328/13907 [1:25:40<6:52:25,  2.14s/it][A
Training...:  17% 2329/13907 [1:25:42<6:46:35,  2.11s/it][A
Training...:  17% 2330/13907 [1:25:44<6:40:40,  2.08s/it][A
Training...:  17% 2331/13907 [1:25:46<6:35:23,  2.05s/it][A
Training...:  17% 2332/13907 [1:25:48<6:28:59,  2.02s/it][A
Training...:  17% 2333/13907 [1:25:50<6:24:34,  1.99s/it][A
Training...:  17% 2334/13907 [1:25:51<6:18:08,  1.96s/it][A
Training...:  17% 2335/13907 [1:25:53<6:11:45,  1.93s/it][A
Training...:  17% 2336/13907 [1:25:55<6:07:10,  1.90s/it][A
Training...:  17% 2337/13907 [1:25:57<6:01:28,  1.87s/it][A
Training...:  17% 2338/13907 [1:25:59<5:55:36,  1.84s/it][A
Training...:  17% 2339/13907 [1:26:00<5:50:16,  1.82s/it][A
Training...:  17% 2340/13907 [1:26:02<5:42:40,  1.78s/it][A
Training...:  17% 2341/13907 [1:26:04<5:36:30,  1.75s/it][A
Training...:  17% 2342/13907 [1:26:05<5:29:53,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:08:19<26:06:17, 31325.86s/it]
Training...:  17% 2342/13907 [1:26:07<5:29:53,  1.71s/it][A
Training...:  17% 2343/13907 [1:26:07<5:40:48,  1.77s/it][A
Training...:  17% 2344/13907 [1:26:09<5:30:49,  1.72s/it][A
Training...:  17% 2345/13907 [1:26:10<5:17:51,  1.65s/it][A
Training...:  17% 2346/13907 [1:26:12<5:04:42,  1.58s/it][A
Training...:  17% 2347/13907 [1:26:13<4:53:29,  1.52s/it][A
Training...:  17% 2348/13907 [1:26:15<4:43:21,  1.47s/it][A
Training...:  17% 2349/13907 [1:26:16<4:28:12,  1.39s/it][A
Training...:  17% 2350/13907 [1:26:17<4:08:36,  1.29s/it][A
Training...:  17% 2351/13907 [1:26:21<6:26:26,  2.01s/it][A
Training...:  17% 2352/13907 [1:26:24<7:48:55,  2.43s/it][A
Training...:  17% 2353/13907 [1:26:27<8:34:49,  2.67s/it][A
Training...:  17% 2354/13907 [1:26:30<9:00:53,  2.81s/it][A
Training...:  17% 2355/13907 [1:26:33<9:14:59,  2.88s/it][A
Training...:  17% 2356/13907 [1:26:36<9:18:23,  2.90s/it][A
Training...:  17% 2357/13907 [1:26:39<9:18:41,  2.90s/it][A
Training...:  17% 2358/13907 [1:26:42<9:19:01,  2.90s/it][A
Training...:  17% 2359/13907 [1:26:45<9:11:40,  2.87s/it][A
Training...:  17% 2360/13907 [1:26:48<9:03:17,  2.82s/it][A
Training...:  17% 2361/13907 [1:26:50<8:53:25,  2.77s/it][A
Training...:  17% 2362/13907 [1:26:53<8:43:23,  2.72s/it][A
Training...:  17% 2363/13907 [1:26:55<8:34:28,  2.67s/it][A
Training...:  17% 2364/13907 [1:26:58<8:24:09,  2.62s/it][A
Training...:  17% 2365/13907 [1:27:00<8:15:37,  2.58s/it][A
Training...:  17% 2366/13907 [1:27:03<8:08:17,  2.54s/it][A
Training...:  17% 2367/13907 [1:27:05<8:02:45,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:09:19<26:06:17, 31325.86s/it]
Training...:  17% 2367/13907 [1:27:08<8:02:45,  2.51s/it][A
Training...:  17% 2368/13907 [1:27:08<8:16:36,  2.58s/it][A
Training...:  17% 2369/13907 [1:27:10<8:07:36,  2.54s/it][A
Training...:  17% 2370/13907 [1:27:13<7:52:49,  2.46s/it][A
Training...:  17% 2371/13907 [1:27:15<7:42:39,  2.41s/it][A
Training...:  17% 2372/13907 [1:27:17<7:32:13,  2.35s/it][A
Training...:  17% 2373/13907 [1:27:19<7:23:15,  2.31s/it][A
Training...:  17% 2374/13907 [1:27:22<7:16:10,  2.27s/it][A
Training...:  17% 2375/13907 [1:27:24<7:10:08,  2.24s/it][A
Training...:  17% 2376/13907 [1:27:26<7:03:12,  2.20s/it][A
Training...:  17% 2377/13907 [1:27:28<6:56:35,  2.17s/it][A
Training...:  17% 2378/13907 [1:27:30<6:51:23,  2.14s/it][A
Training...:  17% 2379/13907 [1:27:32<6:45:48,  2.11s/it][A
Training...:  17% 2380/13907 [1:27:34<6:40:32,  2.08s/it][A
Training...:  17% 2381/13907 [1:27:36<6:36:01,  2.06s/it][A
Training...:  17% 2382/13907 [1:27:38<6:31:43,  2.04s/it][A
Training...:  17% 2383/13907 [1:27:40<6:26:26,  2.01s/it][A
Training...:  17% 2384/13907 [1:27:42<6:19:28,  1.98s/it][A
Training...:  17% 2385/13907 [1:27:44<6:13:35,  1.95s/it][A
Training...:  17% 2386/13907 [1:27:46<6:07:43,  1.92s/it][A
Training...:  17% 2387/13907 [1:27:48<6:01:35,  1.88s/it][A
Training...:  17% 2388/13907 [1:27:49<5:53:43,  1.84s/it][A
Training...:  17% 2389/13907 [1:27:51<5:46:10,  1.80s/it][A
Training...:  17% 2390/13907 [1:27:53<5:37:55,  1.76s/it][A
Training...:  17% 2391/13907 [1:27:54<5:30:44,  1.72s/it][A
Training...:  17% 2392/13907 [1:27:56<5:24:25,  1.69s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:10:09<26:06:17, 31325.86s/it]
Training...:  17% 2392/13907 [1:27:58<5:24:25,  1.69s/it][A
Training...:  17% 2393/13907 [1:27:58<5:38:51,  1.77s/it][A
Training...:  17% 2394/13907 [1:27:59<5:31:14,  1.73s/it][A
Training...:  17% 2395/13907 [1:28:01<5:17:26,  1.65s/it][A
Training...:  17% 2396/13907 [1:28:02<5:03:40,  1.58s/it][A
Training...:  17% 2397/13907 [1:28:04<4:50:10,  1.51s/it][A
Training...:  17% 2398/13907 [1:28:05<4:36:29,  1.44s/it][A
Training...:  17% 2399/13907 [1:28:06<4:22:25,  1.37s/it][A
Training...:  17% 2400/13907 [1:28:07<4:03:21,  1.27s/it][A
Training...:  17% 2401/13907 [1:28:11<6:26:19,  2.01s/it][A
Training...:  17% 2402/13907 [1:28:14<7:47:55,  2.44s/it][A
Training...:  17% 2403/13907 [1:28:18<8:33:34,  2.68s/it][A
Training...:  17% 2404/13907 [1:28:21<8:56:38,  2.80s/it][A
Training...:  17% 2405/13907 [1:28:24<9:10:27,  2.87s/it][A
Training...:  17% 2406/13907 [1:28:27<9:14:28,  2.89s/it][A
Training...:  17% 2407/13907 [1:28:30<9:13:28,  2.89s/it][A
Training...:  17% 2408/13907 [1:28:32<9:09:36,  2.87s/it][A
Training...:  17% 2409/13907 [1:28:35<9:03:51,  2.84s/it][A
Training...:  17% 2410/13907 [1:28:38<8:56:38,  2.80s/it][A
Training...:  17% 2411/13907 [1:28:41<8:50:02,  2.77s/it][A
Training...:  17% 2412/13907 [1:28:43<8:42:10,  2.73s/it][A
Training...:  17% 2413/13907 [1:28:46<8:31:36,  2.67s/it][A
Training...:  17% 2414/13907 [1:28:48<8:23:50,  2.63s/it][A
Training...:  17% 2415/13907 [1:28:51<8:15:41,  2.59s/it][A
Training...:  17% 2416/13907 [1:28:53<8:06:16,  2.54s/it][A
Training...:  17% 2417/13907 [1:28:56<7:58:44,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:11:10<26:06:17, 31325.86s/it]
Training...:  17% 2417/13907 [1:28:58<7:58:44,  2.50s/it][A
Training...:  17% 2418/13907 [1:28:58<8:15:09,  2.59s/it][A
Training...:  17% 2419/13907 [1:29:01<8:06:10,  2.54s/it][A
Training...:  17% 2420/13907 [1:29:03<7:52:57,  2.47s/it][A
Training...:  17% 2421/13907 [1:29:05<7:42:55,  2.42s/it][A
Training...:  17% 2422/13907 [1:29:08<7:32:43,  2.37s/it][A
Training...:  17% 2423/13907 [1:29:10<7:24:53,  2.32s/it][A
Training...:  17% 2424/13907 [1:29:12<7:15:36,  2.28s/it][A
Training...:  17% 2425/13907 [1:29:14<7:07:26,  2.23s/it][A
Training...:  17% 2426/13907 [1:29:16<7:03:07,  2.21s/it][A
Training...:  17% 2427/13907 [1:29:19<7:00:37,  2.20s/it][A
Training...:  17% 2428/13907 [1:29:21<6:53:00,  2.16s/it][A
Training...:  17% 2429/13907 [1:29:23<6:46:06,  2.12s/it][A
Training...:  17% 2430/13907 [1:29:25<6:37:33,  2.08s/it][A
Training...:  17% 2431/13907 [1:29:27<6:30:40,  2.04s/it][A
Training...:  17% 2432/13907 [1:29:28<6:23:51,  2.01s/it][A
Training...:  17% 2433/13907 [1:29:30<6:17:39,  1.97s/it][A
Training...:  18% 2434/13907 [1:29:32<6:11:16,  1.94s/it][A
Training...:  18% 2435/13907 [1:29:34<6:07:14,  1.92s/it][A
Training...:  18% 2436/13907 [1:29:36<6:01:29,  1.89s/it][A
Training...:  18% 2437/13907 [1:29:38<5:54:56,  1.86s/it][A
Training...:  18% 2438/13907 [1:29:39<5:49:55,  1.83s/it][A
Training...:  18% 2439/13907 [1:29:41<5:45:09,  1.81s/it][A
Training...:  18% 2440/13907 [1:29:43<5:38:19,  1.77s/it][A
Training...:  18% 2441/13907 [1:29:45<5:33:05,  1.74s/it][A
Training...:  18% 2442/13907 [1:29:46<5:26:25,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:11:59<26:06:17, 31325.86s/it]
Training...:  18% 2442/13907 [1:29:48<5:26:25,  1.71s/it][A
Training...:  18% 2443/13907 [1:29:48<5:37:43,  1.77s/it][A
Training...:  18% 2444/13907 [1:29:50<5:27:20,  1.71s/it][A
Training...:  18% 2445/13907 [1:29:51<5:14:42,  1.65s/it][A
Training...:  18% 2446/13907 [1:29:53<5:02:37,  1.58s/it][A
Training...:  18% 2447/13907 [1:29:54<4:50:33,  1.52s/it][A
Training...:  18% 2448/13907 [1:29:55<4:36:42,  1.45s/it][A
Training...:  18% 2449/13907 [1:29:57<4:23:16,  1.38s/it][A
Training...:  18% 2450/13907 [1:29:58<4:03:22,  1.27s/it][A
Training...:  18% 2451/13907 [1:30:01<6:21:58,  2.00s/it][A
Training...:  18% 2452/13907 [1:30:05<7:42:35,  2.42s/it][A
Training...:  18% 2453/13907 [1:30:08<8:27:11,  2.66s/it][A
Training...:  18% 2454/13907 [1:30:11<8:51:48,  2.79s/it][A
Training...:  18% 2455/13907 [1:30:14<9:05:20,  2.86s/it][A
Training...:  18% 2456/13907 [1:30:17<9:05:43,  2.86s/it][A
Training...:  18% 2457/13907 [1:30:20<9:04:56,  2.86s/it][A
Training...:  18% 2458/13907 [1:30:22<8:58:54,  2.82s/it][A
Training...:  18% 2459/13907 [1:30:25<8:54:18,  2.80s/it][A
Training...:  18% 2460/13907 [1:30:28<8:46:29,  2.76s/it][A
Training...:  18% 2461/13907 [1:30:30<8:38:57,  2.72s/it][A
Training...:  18% 2462/13907 [1:30:33<8:31:00,  2.68s/it][A
Training...:  18% 2463/13907 [1:30:36<8:23:13,  2.64s/it][A
Training...:  18% 2464/13907 [1:30:38<8:16:43,  2.60s/it][A
Training...:  18% 2465/13907 [1:30:41<8:10:39,  2.57s/it][A
Training...:  18% 2466/13907 [1:30:43<8:02:39,  2.53s/it][A
Training...:  18% 2467/13907 [1:30:45<7:53:40,  2.48s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:12:59<26:06:17, 31325.86s/it]
Training...:  18% 2467/13907 [1:30:48<7:53:40,  2.48s/it][A
Training...:  18% 2468/13907 [1:30:48<8:11:04,  2.58s/it][A
Training...:  18% 2469/13907 [1:30:51<8:06:45,  2.55s/it][A
Training...:  18% 2470/13907 [1:30:53<7:52:53,  2.48s/it][A
Training...:  18% 2471/13907 [1:30:55<7:41:57,  2.42s/it][A
Training...:  18% 2472/13907 [1:30:58<7:30:59,  2.37s/it][A
Training...:  18% 2473/13907 [1:31:00<7:23:20,  2.33s/it][A
Training...:  18% 2474/13907 [1:31:02<7:13:52,  2.28s/it][A
Training...:  18% 2475/13907 [1:31:04<7:06:54,  2.24s/it][A
Training...:  18% 2476/13907 [1:31:06<6:59:47,  2.20s/it][A
Training...:  18% 2477/13907 [1:31:08<6:55:19,  2.18s/it][A
Training...:  18% 2478/13907 [1:31:10<6:47:27,  2.14s/it][A
Training...:  18% 2479/13907 [1:31:12<6:40:45,  2.10s/it][A
Training...:  18% 2480/13907 [1:31:14<6:36:29,  2.08s/it][A
Training...:  18% 2481/13907 [1:31:16<6:29:43,  2.05s/it][A
Training...:  18% 2482/13907 [1:31:18<6:24:44,  2.02s/it][A
Training...:  18% 2483/13907 [1:31:20<6:20:08,  2.00s/it][A
Training...:  18% 2484/13907 [1:31:22<6:14:16,  1.97s/it][A
Training...:  18% 2485/13907 [1:31:24<6:09:08,  1.94s/it][A
Training...:  18% 2486/13907 [1:31:26<6:02:33,  1.90s/it][A
Training...:  18% 2487/13907 [1:31:28<5:55:58,  1.87s/it][A
Training...:  18% 2488/13907 [1:31:29<5:50:19,  1.84s/it][A
Training...:  18% 2489/13907 [1:31:31<5:44:31,  1.81s/it][A
Training...:  18% 2490/13907 [1:31:33<5:38:02,  1.78s/it][A
Training...:  18% 2491/13907 [1:31:35<5:32:23,  1.75s/it][A
Training...:  18% 2492/13907 [1:31:36<5:25:03,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:13:49<26:06:17, 31325.86s/it]
Training...:  18% 2492/13907 [1:31:38<5:25:03,  1.71s/it][A
Training...:  18% 2493/13907 [1:31:38<5:36:49,  1.77s/it][A
Training...:  18% 2494/13907 [1:31:40<5:44:41,  1.81s/it][A
Training...:  18% 2495/13907 [1:31:42<5:31:35,  1.74s/it][A
Training...:  18% 2496/13907 [1:31:43<5:16:23,  1.66s/it][A
Training...:  18% 2497/13907 [1:31:45<5:03:30,  1.60s/it][A
Training...:  18% 2498/13907 [1:31:46<4:50:24,  1.53s/it][A
Training...:  18% 2499/13907 [1:31:47<4:35:10,  1.45s/it][A
Training...:  18% 2500/13907 [1:31:48<4:14:17,  1.34s/it][A
Training...:  18% 2501/13907 [1:31:52<6:32:55,  2.07s/it][A
Training...:  18% 2502/13907 [1:31:56<7:56:38,  2.51s/it][A
Training...:  18% 2503/13907 [1:31:59<8:42:46,  2.75s/it][A
Training...:  18% 2504/13907 [1:32:02<9:03:43,  2.86s/it][A
Training...:  18% 2505/13907 [1:32:05<9:13:37,  2.91s/it][A
Training...:  18% 2506/13907 [1:32:08<9:13:50,  2.91s/it][A
Training...:  18% 2507/13907 [1:32:11<9:09:40,  2.89s/it][A
Training...:  18% 2508/13907 [1:32:14<9:03:24,  2.86s/it][A
Training...:  18% 2509/13907 [1:32:16<8:57:15,  2.83s/it][A
Training...:  18% 2510/13907 [1:32:19<8:48:37,  2.78s/it][A
Training...:  18% 2511/13907 [1:32:22<8:39:48,  2.74s/it][A
Training...:  18% 2512/13907 [1:32:24<8:32:33,  2.70s/it][A
Training...:  18% 2513/13907 [1:32:27<8:25:30,  2.66s/it][A
Training...:  18% 2514/13907 [1:32:29<8:20:55,  2.64s/it][A
Training...:  18% 2515/13907 [1:32:32<8:14:45,  2.61s/it][A
Training...:  18% 2516/13907 [1:32:34<8:06:06,  2.56s/it][A
Training...:  18% 2517/13907 [1:32:37<7:57:52,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:14:51<26:06:17, 31325.86s/it]
Training...:  18% 2517/13907 [1:32:40<7:57:52,  2.52s/it][A
Training...:  18% 2518/13907 [1:32:40<8:13:03,  2.60s/it][A
Training...:  18% 2519/13907 [1:32:42<8:02:26,  2.54s/it][A
Training...:  18% 2520/13907 [1:32:44<7:47:35,  2.46s/it][A
Training...:  18% 2521/13907 [1:32:47<7:36:59,  2.41s/it][A
Training...:  18% 2522/13907 [1:32:49<7:27:06,  2.36s/it][A
Training...:  18% 2523/13907 [1:32:51<7:18:53,  2.31s/it][A
Training...:  18% 2524/13907 [1:32:53<7:09:20,  2.26s/it][A
Training...:  18% 2525/13907 [1:32:55<7:01:44,  2.22s/it][A
Training...:  18% 2526/13907 [1:32:57<6:55:03,  2.19s/it][A
Training...:  18% 2527/13907 [1:32:59<6:50:19,  2.16s/it][A
Training...:  18% 2528/13907 [1:33:02<6:44:32,  2.13s/it][A
Training...:  18% 2529/13907 [1:33:04<6:39:02,  2.10s/it][A
Training...:  18% 2530/13907 [1:33:06<6:33:43,  2.08s/it][A
Training...:  18% 2531/13907 [1:33:08<6:30:02,  2.06s/it][A
Training...:  18% 2532/13907 [1:33:10<6:23:44,  2.02s/it][A
Training...:  18% 2533/13907 [1:33:11<6:16:13,  1.98s/it][A
Training...:  18% 2534/13907 [1:33:13<6:09:03,  1.95s/it][A
Training...:  18% 2535/13907 [1:33:15<6:03:33,  1.92s/it][A
Training...:  18% 2536/13907 [1:33:17<5:56:38,  1.88s/it][A
Training...:  18% 2537/13907 [1:33:19<5:51:52,  1.86s/it][A
Training...:  18% 2538/13907 [1:33:20<5:45:11,  1.82s/it][A
Training...:  18% 2539/13907 [1:33:22<5:41:01,  1.80s/it][A
Training...:  18% 2540/13907 [1:33:24<5:35:51,  1.77s/it][A
Training...:  18% 2541/13907 [1:33:26<5:29:31,  1.74s/it][A
Training...:  18% 2542/13907 [1:33:27<5:22:29,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:15:40<26:06:17, 31325.86s/it]
Training...:  18% 2542/13907 [1:33:29<5:22:29,  1.70s/it][A
Training...:  18% 2543/13907 [1:33:29<5:33:04,  1.76s/it][A
Training...:  18% 2544/13907 [1:33:31<5:24:07,  1.71s/it][A
Training...:  18% 2545/13907 [1:33:32<5:11:42,  1.65s/it][A
Training...:  18% 2546/13907 [1:33:34<4:59:04,  1.58s/it][A
Training...:  18% 2547/13907 [1:33:35<4:45:56,  1.51s/it][A
Training...:  18% 2548/13907 [1:33:36<4:33:26,  1.44s/it][A
Training...:  18% 2549/13907 [1:33:37<4:20:11,  1.37s/it][A
Training...:  18% 2550/13907 [1:33:39<4:00:32,  1.27s/it][A
Training...:  18% 2551/13907 [1:33:42<6:23:00,  2.02s/it][A
Training...:  18% 2552/13907 [1:33:46<7:44:38,  2.46s/it][A
Training...:  18% 2553/13907 [1:33:49<8:35:08,  2.72s/it][A
Training...:  18% 2554/13907 [1:33:52<9:03:01,  2.87s/it][A
Training...:  18% 2555/13907 [1:33:55<9:12:10,  2.92s/it][A
Training...:  18% 2556/13907 [1:33:58<9:10:52,  2.91s/it][A
Training...:  18% 2557/13907 [1:34:01<9:08:23,  2.90s/it][A
Training...:  18% 2558/13907 [1:34:04<9:03:28,  2.87s/it][A
Training...:  18% 2559/13907 [1:34:07<8:54:06,  2.82s/it][A
Training...:  18% 2560/13907 [1:34:09<8:44:02,  2.77s/it][A
Training...:  18% 2561/13907 [1:34:12<8:36:04,  2.73s/it][A
Training...:  18% 2562/13907 [1:34:14<8:27:52,  2.69s/it][A
Training...:  18% 2563/13907 [1:34:17<8:19:47,  2.64s/it][A
Training...:  18% 2564/13907 [1:34:20<8:12:48,  2.61s/it][A
Training...:  18% 2565/13907 [1:34:22<8:05:24,  2.57s/it][A
Training...:  18% 2566/13907 [1:34:24<7:58:20,  2.53s/it][A
Training...:  18% 2567/13907 [1:34:27<7:52:07,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:16:41<26:06:17, 31325.86s/it]
Training...:  18% 2567/13907 [1:34:30<7:52:07,  2.50s/it][A
Training...:  18% 2568/13907 [1:34:30<8:08:05,  2.58s/it][A
Training...:  18% 2569/13907 [1:34:32<7:59:02,  2.54s/it][A
Training...:  18% 2570/13907 [1:34:34<7:46:48,  2.47s/it][A
Training...:  18% 2571/13907 [1:34:37<7:35:27,  2.41s/it][A
Training...:  18% 2572/13907 [1:34:39<7:25:57,  2.36s/it][A
Training...:  19% 2573/13907 [1:34:41<7:19:26,  2.33s/it][A
Training...:  19% 2574/13907 [1:34:43<7:09:56,  2.28s/it][A
Training...:  19% 2575/13907 [1:34:46<7:03:41,  2.24s/it][A
Training...:  19% 2576/13907 [1:34:48<6:56:45,  2.21s/it][A
Training...:  19% 2577/13907 [1:34:50<6:52:22,  2.18s/it][A
Training...:  19% 2578/13907 [1:34:52<6:46:03,  2.15s/it][A
Training...:  19% 2579/13907 [1:34:54<6:41:06,  2.12s/it][A
Training...:  19% 2580/13907 [1:34:56<6:35:30,  2.10s/it][A
Training...:  19% 2581/13907 [1:34:58<6:29:08,  2.06s/it][A
Training...:  19% 2582/13907 [1:35:00<6:23:43,  2.03s/it][A
Training...:  19% 2583/13907 [1:35:02<6:19:49,  2.01s/it][A
Training...:  19% 2584/13907 [1:35:04<6:15:30,  1.99s/it][A
Training...:  19% 2585/13907 [1:35:06<6:09:50,  1.96s/it][A
Training...:  19% 2586/13907 [1:35:08<6:02:32,  1.92s/it][A
Training...:  19% 2587/13907 [1:35:09<5:56:13,  1.89s/it][A
Training...:  19% 2588/13907 [1:35:11<5:50:16,  1.86s/it][A
Training...:  19% 2589/13907 [1:35:13<5:43:01,  1.82s/it][A
Training...:  19% 2590/13907 [1:35:14<5:34:31,  1.77s/it][A
Training...:  19% 2591/13907 [1:35:16<5:26:45,  1.73s/it][A
Training...:  19% 2592/13907 [1:35:18<5:19:28,  1.69s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:17:31<26:06:17, 31325.86s/it]
Training...:  19% 2592/13907 [1:35:20<5:19:28,  1.69s/it][A
Training...:  19% 2593/13907 [1:35:20<5:30:47,  1.75s/it][A
Training...:  19% 2594/13907 [1:35:21<5:21:56,  1.71s/it][A
Training...:  19% 2595/13907 [1:35:23<5:11:30,  1.65s/it][A
Training...:  19% 2596/13907 [1:35:24<4:59:20,  1.59s/it][A
Training...:  19% 2597/13907 [1:35:26<4:47:32,  1.53s/it][A
Training...:  19% 2598/13907 [1:35:27<4:34:11,  1.45s/it][A
Training...:  19% 2599/13907 [1:35:28<4:19:15,  1.38s/it][A
Training...:  19% 2600/13907 [1:35:29<3:59:06,  1.27s/it][A
Training...:  19% 2601/13907 [1:35:33<6:21:26,  2.02s/it][A
Training...:  19% 2602/13907 [1:35:36<7:41:48,  2.45s/it][A
Training...:  19% 2603/13907 [1:35:40<8:25:30,  2.68s/it][A
Training...:  19% 2604/13907 [1:35:43<8:50:20,  2.82s/it][A
Training...:  19% 2605/13907 [1:35:46<9:02:02,  2.88s/it][A
Training...:  19% 2606/13907 [1:35:49<9:05:37,  2.90s/it][A
Training...:  19% 2607/13907 [1:35:52<9:04:52,  2.89s/it][A
Training...:  19% 2608/13907 [1:35:54<9:02:30,  2.88s/it][A
Training...:  19% 2609/13907 [1:35:57<8:56:33,  2.85s/it][A
Training...:  19% 2610/13907 [1:36:00<8:47:24,  2.80s/it][A
Training...:  19% 2611/13907 [1:36:02<8:39:43,  2.76s/it][A
Training...:  19% 2612/13907 [1:36:05<8:30:13,  2.71s/it][A
Training...:  19% 2613/13907 [1:36:08<8:21:48,  2.67s/it][A
Training...:  19% 2614/13907 [1:36:10<8:13:16,  2.62s/it][A
Training...:  19% 2615/13907 [1:36:13<8:08:21,  2.59s/it][A
Training...:  19% 2616/13907 [1:36:15<8:00:44,  2.55s/it][A
Training...:  19% 2617/13907 [1:36:18<7:53:09,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:18:32<26:06:17, 31325.86s/it]
Training...:  19% 2617/13907 [1:36:20<7:53:09,  2.51s/it][A
Training...:  19% 2618/13907 [1:36:20<8:11:40,  2.61s/it][A
Training...:  19% 2619/13907 [1:36:23<8:05:04,  2.58s/it][A
Training...:  19% 2620/13907 [1:36:25<7:53:44,  2.52s/it][A
Training...:  19% 2621/13907 [1:36:28<7:41:32,  2.45s/it][A
Training...:  19% 2622/13907 [1:36:30<7:29:59,  2.39s/it][A
Training...:  19% 2623/13907 [1:36:32<7:20:33,  2.34s/it][A
Training...:  19% 2624/13907 [1:36:34<7:11:26,  2.29s/it][A
Training...:  19% 2625/13907 [1:36:36<7:02:40,  2.25s/it][A
Training...:  19% 2626/13907 [1:36:39<6:56:01,  2.21s/it][A
Training...:  19% 2627/13907 [1:36:41<6:50:17,  2.18s/it][A
Training...:  19% 2628/13907 [1:36:43<6:44:26,  2.15s/it][A
Training...:  19% 2629/13907 [1:36:45<6:38:40,  2.12s/it][A
Training...:  19% 2630/13907 [1:36:47<6:30:49,  2.08s/it][A
Training...:  19% 2631/13907 [1:36:49<6:27:16,  2.06s/it][A
Training...:  19% 2632/13907 [1:36:51<6:21:41,  2.03s/it][A
Training...:  19% 2633/13907 [1:36:53<6:15:44,  2.00s/it][A
Training...:  19% 2634/13907 [1:36:55<6:10:02,  1.97s/it][A
Training...:  19% 2635/13907 [1:36:56<6:05:32,  1.95s/it][A
Training...:  19% 2636/13907 [1:36:58<5:59:55,  1.92s/it][A
Training...:  19% 2637/13907 [1:37:00<5:55:26,  1.89s/it][A
Training...:  19% 2638/13907 [1:37:02<5:49:50,  1.86s/it][A
Training...:  19% 2639/13907 [1:37:04<5:44:12,  1.83s/it][A
Training...:  19% 2640/13907 [1:37:05<5:38:20,  1.80s/it][A
Training...:  19% 2641/13907 [1:37:07<5:33:37,  1.78s/it][A
Training...:  19% 2642/13907 [1:37:09<5:26:47,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:19:22<26:06:17, 31325.86s/it]
Training...:  19% 2642/13907 [1:37:11<5:26:47,  1.74s/it][A
Training...:  19% 2643/13907 [1:37:11<5:37:03,  1.80s/it][A
Training...:  19% 2644/13907 [1:37:12<5:27:44,  1.75s/it][A
Training...:  19% 2645/13907 [1:37:14<5:16:46,  1.69s/it][A
Training...:  19% 2646/13907 [1:37:15<5:04:54,  1.62s/it][A
Training...:  19% 2647/13907 [1:37:17<4:52:40,  1.56s/it][A
Training...:  19% 2648/13907 [1:37:18<4:38:53,  1.49s/it][A
Training...:  19% 2649/13907 [1:37:19<4:25:06,  1.41s/it][A
Training...:  19% 2650/13907 [1:37:20<4:05:53,  1.31s/it][A
Training...:  19% 2651/13907 [1:37:24<6:21:29,  2.03s/it][A
Training...:  19% 2652/13907 [1:37:28<7:36:53,  2.44s/it][A
Training...:  19% 2653/13907 [1:37:31<8:21:24,  2.67s/it][A
Training...:  19% 2654/13907 [1:37:34<8:44:05,  2.79s/it][A
Training...:  19% 2655/13907 [1:37:37<8:56:35,  2.86s/it][A
Training...:  19% 2656/13907 [1:37:40<9:00:38,  2.88s/it][A
Training...:  19% 2657/13907 [1:37:43<8:59:05,  2.88s/it][A
Training...:  19% 2658/13907 [1:37:45<8:55:07,  2.85s/it][A
Training...:  19% 2659/13907 [1:37:48<8:47:40,  2.81s/it][A
Training...:  19% 2660/13907 [1:37:51<8:39:53,  2.77s/it][A
Training...:  19% 2661/13907 [1:37:53<8:32:55,  2.74s/it][A
Training...:  19% 2662/13907 [1:37:56<8:24:39,  2.69s/it][A
Training...:  19% 2663/13907 [1:37:59<8:17:33,  2.66s/it][A
Training...:  19% 2664/13907 [1:38:01<8:10:13,  2.62s/it][A
Training...:  19% 2665/13907 [1:38:04<8:03:12,  2.58s/it][A
Training...:  19% 2666/13907 [1:38:06<7:56:19,  2.54s/it][A
Training...:  19% 2667/13907 [1:38:09<7:48:20,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:20:22<26:06:17, 31325.86s/it]
Training...:  19% 2667/13907 [1:38:11<7:48:20,  2.50s/it][A
Training...:  19% 2668/13907 [1:38:11<8:04:14,  2.59s/it][A
Training...:  19% 2669/13907 [1:38:14<7:55:47,  2.54s/it][A
Training...:  19% 2670/13907 [1:38:16<7:43:38,  2.48s/it][A
Training...:  19% 2671/13907 [1:38:18<7:37:26,  2.44s/it][A
Training...:  19% 2672/13907 [1:38:21<7:27:08,  2.39s/it][A
Training...:  19% 2673/13907 [1:38:23<7:17:49,  2.34s/it][A
Training...:  19% 2674/13907 [1:38:25<7:08:44,  2.29s/it][A
Training...:  19% 2675/13907 [1:38:27<6:59:43,  2.24s/it][A
Training...:  19% 2676/13907 [1:38:29<6:51:37,  2.20s/it][A
Training...:  19% 2677/13907 [1:38:31<6:45:50,  2.17s/it][A
Training...:  19% 2678/13907 [1:38:33<6:37:39,  2.12s/it][A
Training...:  19% 2679/13907 [1:38:35<6:30:38,  2.09s/it][A
Training...:  19% 2680/13907 [1:38:37<6:25:27,  2.06s/it][A
Training...:  19% 2681/13907 [1:38:39<6:20:06,  2.03s/it][A
Training...:  19% 2682/13907 [1:38:41<6:14:38,  2.00s/it][A
Training...:  19% 2683/13907 [1:38:43<6:08:37,  1.97s/it][A
Training...:  19% 2684/13907 [1:38:45<6:03:02,  1.94s/it][A
Training...:  19% 2685/13907 [1:38:47<5:58:27,  1.92s/it][A
Training...:  19% 2686/13907 [1:38:49<5:52:52,  1.89s/it][A
Training...:  19% 2687/13907 [1:38:51<5:46:36,  1.85s/it][A
Training...:  19% 2688/13907 [1:38:52<5:40:44,  1.82s/it][A
Training...:  19% 2689/13907 [1:38:54<5:34:48,  1.79s/it][A
Training...:  19% 2690/13907 [1:38:56<5:28:26,  1.76s/it][A
Training...:  19% 2691/13907 [1:38:57<5:23:16,  1.73s/it][A
Training...:  19% 2692/13907 [1:38:59<5:15:44,  1.69s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:21:12<26:06:17, 31325.86s/it]
Training...:  19% 2692/13907 [1:39:01<5:15:44,  1.69s/it][A
Training...:  19% 2693/13907 [1:39:01<5:26:14,  1.75s/it][A
Training...:  19% 2694/13907 [1:39:02<5:17:32,  1.70s/it][A
Training...:  19% 2695/13907 [1:39:04<5:04:53,  1.63s/it][A
Training...:  19% 2696/13907 [1:39:05<4:52:39,  1.57s/it][A
Training...:  19% 2697/13907 [1:39:07<4:41:28,  1.51s/it][A
Training...:  19% 2698/13907 [1:39:08<4:29:59,  1.45s/it][A
Training...:  19% 2699/13907 [1:39:09<4:16:55,  1.38s/it][A
Training...:  19% 2700/13907 [1:39:10<3:57:59,  1.27s/it][A
Training...:  19% 2701/13907 [1:39:14<6:20:57,  2.04s/it][A
Training...:  19% 2702/13907 [1:39:18<7:41:01,  2.47s/it][A
Training...:  19% 2703/13907 [1:39:21<8:23:54,  2.70s/it][A
Training...:  19% 2704/13907 [1:39:24<8:48:43,  2.83s/it][A
Training...:  19% 2705/13907 [1:39:27<8:59:47,  2.89s/it][A
Training...:  19% 2706/13907 [1:39:30<9:02:36,  2.91s/it][A
Training...:  19% 2707/13907 [1:39:33<9:01:45,  2.90s/it][A
Training...:  19% 2708/13907 [1:39:36<8:57:12,  2.88s/it][A
Training...:  19% 2709/13907 [1:39:38<8:52:24,  2.85s/it][A
Training...:  19% 2710/13907 [1:39:41<8:46:28,  2.82s/it][A
Training...:  19% 2711/13907 [1:39:44<8:41:16,  2.79s/it][A
Training...:  20% 2712/13907 [1:39:46<8:32:14,  2.75s/it][A
Training...:  20% 2713/13907 [1:39:49<8:25:40,  2.71s/it][A
Training...:  20% 2714/13907 [1:39:52<8:22:44,  2.69s/it][A
Training...:  20% 2715/13907 [1:39:54<8:14:55,  2.65s/it][A
Training...:  20% 2716/13907 [1:39:57<8:03:06,  2.59s/it][A
Training...:  20% 2717/13907 [1:39:59<7:53:58,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:22:13<26:06:17, 31325.86s/it]
Training...:  20% 2717/13907 [1:40:02<7:53:58,  2.54s/it][A
Training...:  20% 2718/13907 [1:40:02<8:08:07,  2.62s/it][A
Training...:  20% 2719/13907 [1:40:04<7:57:21,  2.56s/it][A
Training...:  20% 2720/13907 [1:40:07<7:42:59,  2.48s/it][A
Training...:  20% 2721/13907 [1:40:09<7:32:41,  2.43s/it][A
Training...:  20% 2722/13907 [1:40:11<7:22:58,  2.38s/it][A
Training...:  20% 2723/13907 [1:40:13<7:14:03,  2.33s/it][A
Training...:  20% 2724/13907 [1:40:16<7:06:32,  2.29s/it][A
Training...:  20% 2725/13907 [1:40:18<6:59:52,  2.25s/it][A
Training...:  20% 2726/13907 [1:40:20<6:54:26,  2.22s/it][A
Training...:  20% 2727/13907 [1:40:22<6:46:48,  2.18s/it][A
Training...:  20% 2728/13907 [1:40:24<6:40:23,  2.15s/it][A
Training...:  20% 2729/13907 [1:40:26<6:33:20,  2.11s/it][A
Training...:  20% 2730/13907 [1:40:28<6:27:48,  2.08s/it][A
Training...:  20% 2731/13907 [1:40:30<6:23:00,  2.06s/it][A
Training...:  20% 2732/13907 [1:40:32<6:16:22,  2.02s/it][A
Training...:  20% 2733/13907 [1:40:34<6:12:03,  2.00s/it][A
Training...:  20% 2734/13907 [1:40:36<6:05:34,  1.96s/it][A
Training...:  20% 2735/13907 [1:40:38<6:00:56,  1.94s/it][A
Training...:  20% 2736/13907 [1:40:40<5:55:29,  1.91s/it][A
Training...:  20% 2737/13907 [1:40:41<5:49:33,  1.88s/it][A
Training...:  20% 2738/13907 [1:40:43<5:42:30,  1.84s/it][A
Training...:  20% 2739/13907 [1:40:45<5:37:28,  1.81s/it][A
Training...:  20% 2740/13907 [1:40:47<5:30:17,  1.77s/it][A
Training...:  20% 2741/13907 [1:40:48<5:24:20,  1.74s/it][A
Training...:  20% 2742/13907 [1:40:50<5:18:02,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:23:03<26:06:17, 31325.86s/it]
Training...:  20% 2742/13907 [1:40:52<5:18:02,  1.71s/it][A
Training...:  20% 2743/13907 [1:40:52<5:28:03,  1.76s/it][A
Training...:  20% 2744/13907 [1:40:53<5:18:27,  1.71s/it][A
Training...:  20% 2745/13907 [1:40:55<5:06:04,  1.65s/it][A
Training...:  20% 2746/13907 [1:40:56<4:53:53,  1.58s/it][A
Training...:  20% 2747/13907 [1:40:58<4:42:27,  1.52s/it][A
Training...:  20% 2748/13907 [1:40:59<4:29:50,  1.45s/it][A
Training...:  20% 2749/13907 [1:41:00<4:16:08,  1.38s/it][A
Training...:  20% 2750/13907 [1:41:01<3:58:20,  1.28s/it][A
Training...:  20% 2751/13907 [1:41:05<6:26:05,  2.08s/it][A
Training...:  20% 2752/13907 [1:41:09<7:48:46,  2.52s/it][A
Training...:  20% 2753/13907 [1:41:12<8:33:59,  2.76s/it][A
Training...:  20% 2754/13907 [1:41:15<8:53:39,  2.87s/it][A
Training...:  20% 2755/13907 [1:41:18<9:01:57,  2.92s/it][A
Training...:  20% 2756/13907 [1:41:21<9:04:29,  2.93s/it][A
Training...:  20% 2757/13907 [1:41:24<9:01:34,  2.91s/it][A
Training...:  20% 2758/13907 [1:41:27<8:54:11,  2.87s/it][A
Training...:  20% 2759/13907 [1:41:30<8:47:08,  2.84s/it][A
Training...:  20% 2760/13907 [1:41:32<8:38:12,  2.79s/it][A
Training...:  20% 2761/13907 [1:41:35<8:31:44,  2.75s/it][A
Training...:  20% 2762/13907 [1:41:38<8:22:52,  2.71s/it][A
Training...:  20% 2763/13907 [1:41:40<8:15:45,  2.67s/it][A
Training...:  20% 2764/13907 [1:41:43<8:06:19,  2.62s/it][A
Training...:  20% 2765/13907 [1:41:45<8:01:51,  2.59s/it][A
Training...:  20% 2766/13907 [1:41:48<7:54:10,  2.55s/it][A
Training...:  20% 2767/13907 [1:41:50<7:49:57,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:24:04<26:06:17, 31325.86s/it]
Training...:  20% 2767/13907 [1:41:53<7:49:57,  2.53s/it][A
Training...:  20% 2768/13907 [1:41:53<8:07:03,  2.62s/it][A
Training...:  20% 2769/13907 [1:41:55<7:57:28,  2.57s/it][A
Training...:  20% 2770/13907 [1:41:58<7:43:41,  2.50s/it][A
Training...:  20% 2771/13907 [1:42:00<7:33:53,  2.45s/it][A
Training...:  20% 2772/13907 [1:42:02<7:22:32,  2.38s/it][A
Training...:  20% 2773/13907 [1:42:05<7:12:51,  2.33s/it][A
Training...:  20% 2774/13907 [1:42:07<7:06:21,  2.30s/it][A
Training...:  20% 2775/13907 [1:42:09<6:59:23,  2.26s/it][A
Training...:  20% 2776/13907 [1:42:11<6:52:21,  2.22s/it][A
Training...:  20% 2777/13907 [1:42:13<6:46:27,  2.19s/it][A
Training...:  20% 2778/13907 [1:42:15<6:39:05,  2.15s/it][A
Training...:  20% 2779/13907 [1:42:17<6:35:02,  2.13s/it][A
Training...:  20% 2780/13907 [1:42:19<6:29:31,  2.10s/it][A
Training...:  20% 2781/13907 [1:42:21<6:23:33,  2.07s/it][A
Training...:  20% 2782/13907 [1:42:23<6:18:55,  2.04s/it][A
Training...:  20% 2783/13907 [1:42:25<6:13:44,  2.02s/it][A
Training...:  20% 2784/13907 [1:42:27<6:08:27,  1.99s/it][A
Training...:  20% 2785/13907 [1:42:29<6:02:52,  1.96s/it][A
Training...:  20% 2786/13907 [1:42:31<5:57:06,  1.93s/it][A
Training...:  20% 2787/13907 [1:42:33<5:50:43,  1.89s/it][A
Training...:  20% 2788/13907 [1:42:35<5:43:29,  1.85s/it][A
Training...:  20% 2789/13907 [1:42:36<5:38:19,  1.83s/it][A
Training...:  20% 2790/13907 [1:42:38<5:31:22,  1.79s/it][A
Training...:  20% 2791/13907 [1:42:40<5:24:06,  1.75s/it][A
Training...:  20% 2792/13907 [1:42:41<5:16:43,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:24:54<26:06:17, 31325.86s/it]
Training...:  20% 2792/13907 [1:42:43<5:16:43,  1.71s/it][A
Training...:  20% 2793/13907 [1:42:43<5:26:25,  1.76s/it][A
Training...:  20% 2794/13907 [1:42:45<5:17:57,  1.72s/it][A
Training...:  20% 2795/13907 [1:42:46<5:05:34,  1.65s/it][A
Training...:  20% 2796/13907 [1:42:48<4:53:07,  1.58s/it][A
Training...:  20% 2797/13907 [1:42:49<4:42:34,  1.53s/it][A
Training...:  20% 2798/13907 [1:42:50<4:30:07,  1.46s/it][A
Training...:  20% 2799/13907 [1:42:52<4:16:32,  1.39s/it][A
Training...:  20% 2800/13907 [1:42:53<3:59:15,  1.29s/it][A
Training...:  20% 2801/13907 [1:42:56<6:17:51,  2.04s/it][A
Training...:  20% 2802/13907 [1:43:00<7:34:45,  2.46s/it][A
Training...:  20% 2803/13907 [1:43:03<8:18:31,  2.69s/it][A
Training...:  20% 2804/13907 [1:43:06<8:40:24,  2.81s/it][A
Training...:  20% 2805/13907 [1:43:09<8:50:43,  2.87s/it][A
Training...:  20% 2806/13907 [1:43:12<8:52:37,  2.88s/it][A
Training...:  20% 2807/13907 [1:43:15<8:50:23,  2.87s/it][A
Training...:  20% 2808/13907 [1:43:18<8:45:45,  2.84s/it][A
Training...:  20% 2809/13907 [1:43:21<8:41:20,  2.82s/it][A
Training...:  20% 2810/13907 [1:43:23<8:32:41,  2.77s/it][A
Training...:  20% 2811/13907 [1:43:26<8:25:52,  2.74s/it][A
Training...:  20% 2812/13907 [1:43:28<8:17:49,  2.69s/it][A
Training...:  20% 2813/13907 [1:43:31<8:10:27,  2.65s/it][A
Training...:  20% 2814/13907 [1:43:33<8:01:05,  2.60s/it][A
Training...:  20% 2815/13907 [1:43:36<7:54:37,  2.57s/it][A
Training...:  20% 2816/13907 [1:43:38<7:46:12,  2.52s/it][A
Training...:  20% 2817/13907 [1:43:41<7:39:48,  2.49s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:25:55<26:06:17, 31325.86s/it]
Training...:  20% 2817/13907 [1:43:44<7:39:48,  2.49s/it][A
Training...:  20% 2818/13907 [1:43:44<7:56:48,  2.58s/it][A
Training...:  20% 2819/13907 [1:43:46<7:50:07,  2.54s/it][A
Training...:  20% 2820/13907 [1:43:48<7:37:58,  2.48s/it][A
Training...:  20% 2821/13907 [1:43:51<7:28:26,  2.43s/it][A
Training...:  20% 2822/13907 [1:43:53<7:21:03,  2.39s/it][A
Training...:  20% 2823/13907 [1:43:55<7:11:51,  2.34s/it][A
Training...:  20% 2824/13907 [1:43:57<7:02:55,  2.29s/it][A
Training...:  20% 2825/13907 [1:44:00<6:56:36,  2.26s/it][A
Training...:  20% 2826/13907 [1:44:02<6:48:55,  2.21s/it][A
Training...:  20% 2827/13907 [1:44:04<6:43:19,  2.18s/it][A
Training...:  20% 2828/13907 [1:44:06<6:36:45,  2.15s/it][A
Training...:  20% 2829/13907 [1:44:08<6:31:27,  2.12s/it][A
Training...:  20% 2830/13907 [1:44:10<6:26:00,  2.09s/it][A
Training...:  20% 2831/13907 [1:44:12<6:19:44,  2.06s/it][A
Training...:  20% 2832/13907 [1:44:14<6:14:19,  2.03s/it][A
Training...:  20% 2833/13907 [1:44:16<6:08:33,  2.00s/it][A
Training...:  20% 2834/13907 [1:44:18<6:03:22,  1.97s/it][A
Training...:  20% 2835/13907 [1:44:20<5:58:03,  1.94s/it][A
Training...:  20% 2836/13907 [1:44:21<5:52:02,  1.91s/it][A
Training...:  20% 2837/13907 [1:44:23<5:48:22,  1.89s/it][A
Training...:  20% 2838/13907 [1:44:25<5:43:20,  1.86s/it][A
Training...:  20% 2839/13907 [1:44:27<5:37:53,  1.83s/it][A
Training...:  20% 2840/13907 [1:44:28<5:30:58,  1.79s/it][A
Training...:  20% 2841/13907 [1:44:30<5:23:30,  1.75s/it][A
Training...:  20% 2842/13907 [1:44:32<5:16:24,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:26:45<26:06:17, 31325.86s/it]
Training...:  20% 2842/13907 [1:44:34<5:16:24,  1.72s/it][A
Training...:  20% 2843/13907 [1:44:34<5:28:28,  1.78s/it][A
Training...:  20% 2844/13907 [1:44:35<5:19:10,  1.73s/it][A
Training...:  20% 2845/13907 [1:44:37<5:09:48,  1.68s/it][A
Training...:  20% 2846/13907 [1:44:38<4:57:32,  1.61s/it][A
Training...:  20% 2847/13907 [1:44:40<4:47:03,  1.56s/it][A
Training...:  20% 2848/13907 [1:44:41<4:33:40,  1.48s/it][A
Training...:  20% 2849/13907 [1:44:42<4:19:36,  1.41s/it][A
Training...:  20% 2850/13907 [1:44:43<4:00:59,  1.31s/it][A
Training...:  21% 2851/13907 [1:44:47<6:17:17,  2.05s/it][A
Training...:  21% 2852/13907 [1:44:51<7:34:47,  2.47s/it][A
Training...:  21% 2853/13907 [1:44:54<8:18:27,  2.71s/it][A
Training...:  21% 2854/13907 [1:44:57<8:40:46,  2.83s/it][A
Training...:  21% 2855/13907 [1:45:00<8:53:11,  2.89s/it][A
Training...:  21% 2856/13907 [1:45:03<8:54:04,  2.90s/it][A
Training...:  21% 2857/13907 [1:45:06<8:52:59,  2.89s/it][A
Training...:  21% 2858/13907 [1:45:09<8:48:24,  2.87s/it][A
Training...:  21% 2859/13907 [1:45:11<8:41:58,  2.83s/it][A
Training...:  21% 2860/13907 [1:45:14<8:35:50,  2.80s/it][A
Training...:  21% 2861/13907 [1:45:17<8:28:25,  2.76s/it][A
Training...:  21% 2862/13907 [1:45:19<8:20:15,  2.72s/it][A
Training...:  21% 2863/13907 [1:45:22<8:12:02,  2.67s/it][A
Training...:  21% 2864/13907 [1:45:25<8:04:34,  2.63s/it][A
Training...:  21% 2865/13907 [1:45:27<7:57:55,  2.60s/it][A
Training...:  21% 2866/13907 [1:45:29<7:49:35,  2.55s/it][A
Training...:  21% 2867/13907 [1:45:32<7:43:25,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:27:46<26:06:17, 31325.86s/it]
Training...:  21% 2867/13907 [1:45:35<7:43:25,  2.52s/it][A
Training...:  21% 2868/13907 [1:45:35<8:00:05,  2.61s/it][A
Training...:  21% 2869/13907 [1:45:37<7:50:07,  2.56s/it][A
Training...:  21% 2870/13907 [1:45:40<7:39:53,  2.50s/it][A
Training...:  21% 2871/13907 [1:45:42<7:30:12,  2.45s/it][A
Training...:  21% 2872/13907 [1:45:44<7:20:38,  2.40s/it][A
Training...:  21% 2873/13907 [1:45:46<7:10:27,  2.34s/it][A
Training...:  21% 2874/13907 [1:45:49<7:01:00,  2.29s/it][A
Training...:  21% 2875/13907 [1:45:51<6:53:35,  2.25s/it][A
Training...:  21% 2876/13907 [1:45:53<6:47:05,  2.21s/it][A
Training...:  21% 2877/13907 [1:45:55<6:41:16,  2.18s/it][A
Training...:  21% 2878/13907 [1:45:57<6:34:02,  2.14s/it][A
Training...:  21% 2879/13907 [1:45:59<6:28:48,  2.12s/it][A
Training...:  21% 2880/13907 [1:46:01<6:22:34,  2.08s/it][A
Training...:  21% 2881/13907 [1:46:03<6:17:12,  2.05s/it][A
Training...:  21% 2882/13907 [1:46:05<6:11:31,  2.02s/it][A
Training...:  21% 2883/13907 [1:46:07<6:05:54,  1.99s/it][A
Training...:  21% 2884/13907 [1:46:09<5:59:30,  1.96s/it][A
Training...:  21% 2885/13907 [1:46:11<5:55:45,  1.94s/it][A
Training...:  21% 2886/13907 [1:46:12<5:49:24,  1.90s/it][A
Training...:  21% 2887/13907 [1:46:14<5:43:07,  1.87s/it][A
Training...:  21% 2888/13907 [1:46:16<5:36:41,  1.83s/it][A
Training...:  21% 2889/13907 [1:46:18<5:30:25,  1.80s/it][A
Training...:  21% 2890/13907 [1:46:19<5:23:42,  1.76s/it][A
Training...:  21% 2891/13907 [1:46:21<5:17:50,  1.73s/it][A
Training...:  21% 2892/13907 [1:46:23<5:11:52,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:28:36<26:06:17, 31325.86s/it]
Training...:  21% 2892/13907 [1:46:25<5:11:52,  1.70s/it][A
Training...:  21% 2893/13907 [1:46:25<5:23:30,  1.76s/it][A
Training...:  21% 2894/13907 [1:46:26<5:15:47,  1.72s/it][A
Training...:  21% 2895/13907 [1:46:28<5:03:16,  1.65s/it][A
Training...:  21% 2896/13907 [1:46:29<4:50:33,  1.58s/it][A
Training...:  21% 2897/13907 [1:46:30<4:39:19,  1.52s/it][A
Training...:  21% 2898/13907 [1:46:32<4:27:01,  1.46s/it][A
Training...:  21% 2899/13907 [1:46:33<4:14:25,  1.39s/it][A
Training...:  21% 2900/13907 [1:46:34<3:55:20,  1.28s/it][A
Training...:  21% 2901/13907 [1:46:38<6:09:48,  2.02s/it][A
Training...:  21% 2902/13907 [1:46:41<7:33:01,  2.47s/it][A
Training...:  21% 2903/13907 [1:46:45<8:20:32,  2.73s/it][A
Training...:  21% 2904/13907 [1:46:48<8:41:29,  2.84s/it][A
Training...:  21% 2905/13907 [1:46:51<8:54:43,  2.92s/it][A
Training...:  21% 2906/13907 [1:46:54<8:56:57,  2.93s/it][A
Training...:  21% 2907/13907 [1:46:57<8:56:10,  2.92s/it][A
Training...:  21% 2908/13907 [1:47:00<8:51:21,  2.90s/it][A
Training...:  21% 2909/13907 [1:47:02<8:47:14,  2.88s/it][A
Training...:  21% 2910/13907 [1:47:05<8:41:17,  2.84s/it][A
Training...:  21% 2911/13907 [1:47:08<8:32:25,  2.80s/it][A
Training...:  21% 2912/13907 [1:47:10<8:22:19,  2.74s/it][A
Training...:  21% 2913/13907 [1:47:13<8:13:28,  2.69s/it][A
Training...:  21% 2914/13907 [1:47:16<8:05:36,  2.65s/it][A
Training...:  21% 2915/13907 [1:47:18<7:56:02,  2.60s/it][A
Training...:  21% 2916/13907 [1:47:21<7:48:20,  2.56s/it][A
Training...:  21% 2917/13907 [1:47:23<7:40:35,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:29:37<26:06:17, 31325.86s/it]
Training...:  21% 2917/13907 [1:47:26<7:40:35,  2.51s/it][A
Training...:  21% 2918/13907 [1:47:26<7:56:53,  2.60s/it][A
Training...:  21% 2919/13907 [1:47:28<7:47:13,  2.55s/it][A
Training...:  21% 2920/13907 [1:47:31<7:35:53,  2.49s/it][A
Training...:  21% 2921/13907 [1:47:33<7:24:49,  2.43s/it][A
Training...:  21% 2922/13907 [1:47:35<7:15:59,  2.38s/it][A
Training...:  21% 2923/13907 [1:47:37<7:08:28,  2.34s/it][A
Training...:  21% 2924/13907 [1:47:40<6:59:36,  2.29s/it][A
Training...:  21% 2925/13907 [1:47:42<6:51:31,  2.25s/it][A
Training...:  21% 2926/13907 [1:47:44<6:44:07,  2.21s/it][A
Training...:  21% 2927/13907 [1:47:46<6:39:06,  2.18s/it][A
Training...:  21% 2928/13907 [1:47:48<6:33:11,  2.15s/it][A
Training...:  21% 2929/13907 [1:47:50<6:29:59,  2.13s/it][A
Training...:  21% 2930/13907 [1:47:52<6:24:12,  2.10s/it][A
Training...:  21% 2931/13907 [1:47:54<6:18:32,  2.07s/it][A
Training...:  21% 2932/13907 [1:47:56<6:14:05,  2.05s/it][A
Training...:  21% 2933/13907 [1:47:58<6:06:35,  2.00s/it][A
Training...:  21% 2934/13907 [1:48:00<5:59:52,  1.97s/it][A
Training...:  21% 2935/13907 [1:48:02<5:55:08,  1.94s/it][A
Training...:  21% 2936/13907 [1:48:04<5:48:13,  1.90s/it][A
Training...:  21% 2937/13907 [1:48:05<5:42:17,  1.87s/it][A
Training...:  21% 2938/13907 [1:48:07<5:36:59,  1.84s/it][A
Training...:  21% 2939/13907 [1:48:09<5:31:52,  1.82s/it][A
Training...:  21% 2940/13907 [1:48:11<5:25:25,  1.78s/it][A
Training...:  21% 2941/13907 [1:48:12<5:20:13,  1.75s/it][A
Training...:  21% 2942/13907 [1:48:14<5:12:49,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:30:27<26:06:17, 31325.86s/it]
Training...:  21% 2942/13907 [1:48:16<5:12:49,  1.71s/it][A
Training...:  21% 2943/13907 [1:48:16<5:23:41,  1.77s/it][A
Training...:  21% 2944/13907 [1:48:17<5:14:43,  1.72s/it][A
Training...:  21% 2945/13907 [1:48:19<5:04:15,  1.67s/it][A
Training...:  21% 2946/13907 [1:48:20<4:51:42,  1.60s/it][A
Training...:  21% 2947/13907 [1:48:22<4:39:20,  1.53s/it][A
Training...:  21% 2948/13907 [1:48:23<4:26:47,  1.46s/it][A
Training...:  21% 2949/13907 [1:48:24<4:13:32,  1.39s/it][A
Training...:  21% 2950/13907 [1:48:25<3:55:51,  1.29s/it][A
Training...:  21% 2951/13907 [1:48:29<6:10:06,  2.03s/it][A
Training...:  21% 2952/13907 [1:48:33<7:29:03,  2.46s/it][A
Training...:  21% 2953/13907 [1:48:36<8:18:09,  2.73s/it][A
Training...:  21% 2954/13907 [1:48:39<8:45:48,  2.88s/it][A
Training...:  21% 2955/13907 [1:48:42<8:57:14,  2.94s/it][A
Training...:  21% 2956/13907 [1:48:45<8:58:20,  2.95s/it][A
Training...:  21% 2957/13907 [1:48:48<8:56:37,  2.94s/it][A
Training...:  21% 2958/13907 [1:48:51<8:49:55,  2.90s/it][A
Training...:  21% 2959/13907 [1:48:54<8:42:53,  2.87s/it][A
Training...:  21% 2960/13907 [1:48:56<8:35:23,  2.82s/it][A
Training...:  21% 2961/13907 [1:48:59<8:26:49,  2.78s/it][A
Training...:  21% 2962/13907 [1:49:02<8:18:53,  2.73s/it][A
Training...:  21% 2963/13907 [1:49:04<8:10:22,  2.69s/it][A
Training...:  21% 2964/13907 [1:49:07<8:02:06,  2.64s/it][A
Training...:  21% 2965/13907 [1:49:09<7:54:26,  2.60s/it][A
Training...:  21% 2966/13907 [1:49:12<7:47:47,  2.57s/it][A
Training...:  21% 2967/13907 [1:49:14<7:40:34,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:31:28<26:06:17, 31325.86s/it]
Training...:  21% 2967/13907 [1:49:17<7:40:34,  2.53s/it][A
Training...:  21% 2968/13907 [1:49:17<7:57:32,  2.62s/it][A
Training...:  21% 2969/13907 [1:49:20<7:47:45,  2.57s/it][A
Training...:  21% 2970/13907 [1:49:22<7:34:25,  2.49s/it][A
Training...:  21% 2971/13907 [1:49:24<7:24:16,  2.44s/it][A
Training...:  21% 2972/13907 [1:49:26<7:15:40,  2.39s/it][A
Training...:  21% 2973/13907 [1:49:29<7:05:16,  2.33s/it][A
Training...:  21% 2974/13907 [1:49:31<6:57:59,  2.29s/it][A
Training...:  21% 2975/13907 [1:49:33<6:50:13,  2.25s/it][A
Training...:  21% 2976/13907 [1:49:35<6:43:09,  2.21s/it][A
Training...:  21% 2977/13907 [1:49:37<6:36:43,  2.18s/it][A
Training...:  21% 2978/13907 [1:49:39<6:29:16,  2.14s/it][A
Training...:  21% 2979/13907 [1:49:41<6:23:44,  2.11s/it][A
Training...:  21% 2980/13907 [1:49:43<6:17:55,  2.08s/it][A
Training...:  21% 2981/13907 [1:49:45<6:12:12,  2.04s/it][A
Training...:  21% 2982/13907 [1:49:47<6:05:47,  2.01s/it][A
Training...:  21% 2983/13907 [1:49:49<6:00:41,  1.98s/it][A
Training...:  21% 2984/13907 [1:49:51<5:56:28,  1.96s/it][A
Training...:  21% 2985/13907 [1:49:53<5:52:57,  1.94s/it][A
Training...:  21% 2986/13907 [1:49:55<5:47:24,  1.91s/it][A
Training...:  21% 2987/13907 [1:49:57<5:42:36,  1.88s/it][A
Training...:  21% 2988/13907 [1:49:58<5:36:30,  1.85s/it][A
Training...:  21% 2989/13907 [1:50:00<5:30:56,  1.82s/it][A
Training...:  21% 2990/13907 [1:50:02<5:24:09,  1.78s/it][A
Training...:  22% 2991/13907 [1:50:03<5:17:34,  1.75s/it][A
Training...:  22% 2992/13907 [1:50:05<5:11:14,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:32:18<26:06:17, 31325.86s/it]
Training...:  22% 2992/13907 [1:50:07<5:11:14,  1.71s/it][A
Training...:  22% 2993/13907 [1:50:07<5:22:30,  1.77s/it][A
Training...:  22% 2994/13907 [1:50:09<5:14:34,  1.73s/it][A
Training...:  22% 2995/13907 [1:50:10<5:02:51,  1.67s/it][A
Training...:  22% 2996/13907 [1:50:12<4:49:52,  1.59s/it][A
Training...:  22% 2997/13907 [1:50:13<4:37:40,  1.53s/it][A
Training...:  22% 2998/13907 [1:50:14<4:25:22,  1.46s/it][A
Training...:  22% 2999/13907 [1:50:15<4:11:43,  1.38s/it][A
Training...:  22% 3000/13907 [1:50:16<3:51:32,  1.27s/it][A
Training...:  22% 3001/13907 [1:50:20<6:13:57,  2.06s/it][A
Training...:  22% 3002/13907 [1:50:24<7:31:19,  2.48s/it][A
Training...:  22% 3003/13907 [1:50:27<8:13:53,  2.72s/it][A
Training...:  22% 3004/13907 [1:50:30<8:37:25,  2.85s/it][A
Training...:  22% 3005/13907 [1:50:33<8:48:32,  2.91s/it][A
Training...:  22% 3006/13907 [1:50:36<8:50:49,  2.92s/it][A
Training...:  22% 3007/13907 [1:50:39<8:47:34,  2.90s/it][A
Training...:  22% 3008/13907 [1:50:42<8:41:17,  2.87s/it][A
Training...:  22% 3009/13907 [1:50:45<8:36:11,  2.84s/it][A
Training...:  22% 3010/13907 [1:50:47<8:27:53,  2.80s/it][A
Training...:  22% 3011/13907 [1:50:50<8:21:17,  2.76s/it][A
Training...:  22% 3012/13907 [1:50:53<8:13:30,  2.72s/it][A
Training...:  22% 3013/13907 [1:50:55<8:06:30,  2.68s/it][A
Training...:  22% 3014/13907 [1:50:58<7:58:09,  2.63s/it][A
Training...:  22% 3015/13907 [1:51:00<7:50:30,  2.59s/it][A
Training...:  22% 3016/13907 [1:51:03<7:42:44,  2.55s/it][A
Training...:  22% 3017/13907 [1:51:05<7:35:37,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:33:19<26:06:17, 31325.86s/it]
Training...:  22% 3017/13907 [1:51:08<7:35:37,  2.51s/it][A
Training...:  22% 3018/13907 [1:51:08<7:51:24,  2.60s/it][A
Training...:  22% 3019/13907 [1:51:10<7:42:04,  2.55s/it][A
Training...:  22% 3020/13907 [1:51:13<7:29:04,  2.47s/it][A
Training...:  22% 3021/13907 [1:51:15<7:17:40,  2.41s/it][A
Training...:  22% 3022/13907 [1:51:17<7:08:17,  2.36s/it][A
Training...:  22% 3023/13907 [1:51:19<6:59:51,  2.31s/it][A
Training...:  22% 3024/13907 [1:51:22<6:51:42,  2.27s/it][A
Training...:  22% 3025/13907 [1:51:24<6:44:50,  2.23s/it][A
Training...:  22% 3026/13907 [1:51:26<6:37:48,  2.19s/it][A
Training...:  22% 3027/13907 [1:51:28<6:33:06,  2.17s/it][A
Training...:  22% 3028/13907 [1:51:30<6:27:51,  2.14s/it][A
Training...:  22% 3029/13907 [1:51:32<6:21:23,  2.10s/it][A
Training...:  22% 3030/13907 [1:51:34<6:15:36,  2.07s/it][A
Training...:  22% 3031/13907 [1:51:36<6:11:15,  2.05s/it][A
Training...:  22% 3032/13907 [1:51:38<6:06:53,  2.02s/it][A
Training...:  22% 3033/13907 [1:51:40<6:02:12,  2.00s/it][A
Training...:  22% 3034/13907 [1:51:42<5:56:53,  1.97s/it][A
Training...:  22% 3035/13907 [1:51:44<5:50:38,  1.94s/it][A
Training...:  22% 3036/13907 [1:51:46<5:45:17,  1.91s/it][A
Training...:  22% 3037/13907 [1:51:47<5:40:55,  1.88s/it][A
Training...:  22% 3038/13907 [1:51:49<5:36:03,  1.86s/it][A
Training...:  22% 3039/13907 [1:51:51<5:30:41,  1.83s/it][A
Training...:  22% 3040/13907 [1:51:53<5:24:51,  1.79s/it][A
Training...:  22% 3041/13907 [1:51:54<5:19:34,  1.76s/it][A
Training...:  22% 3042/13907 [1:51:56<5:13:16,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:34:09<26:06:17, 31325.86s/it]
Training...:  22% 3042/13907 [1:51:58<5:13:16,  1.73s/it][A
Training...:  22% 3043/13907 [1:51:58<5:23:33,  1.79s/it][A
Training...:  22% 3044/13907 [1:51:59<5:14:06,  1.73s/it][A
Training...:  22% 3045/13907 [1:52:01<5:02:49,  1.67s/it][A
Training...:  22% 3046/13907 [1:52:02<4:49:36,  1.60s/it][A
Training...:  22% 3047/13907 [1:52:04<4:37:55,  1.54s/it][A
Training...:  22% 3048/13907 [1:52:05<4:28:06,  1.48s/it][A
Training...:  22% 3049/13907 [1:52:06<4:14:45,  1.41s/it][A
Training...:  22% 3050/13907 [1:52:08<3:57:37,  1.31s/it][A
Training...:  22% 3051/13907 [1:52:11<6:13:29,  2.06s/it][A
Training...:  22% 3052/13907 [1:52:15<7:28:23,  2.48s/it][A
Training...:  22% 3053/13907 [1:52:18<8:11:07,  2.71s/it][A
Training...:  22% 3054/13907 [1:52:21<8:32:33,  2.83s/it][A
Training...:  22% 3055/13907 [1:52:24<8:42:23,  2.89s/it][A
Training...:  22% 3056/13907 [1:52:27<8:42:40,  2.89s/it][A
Training...:  22% 3057/13907 [1:52:30<8:41:38,  2.88s/it][A
Training...:  22% 3058/13907 [1:52:33<8:37:48,  2.86s/it][A
Training...:  22% 3059/13907 [1:52:36<8:32:38,  2.84s/it][A
Training...:  22% 3060/13907 [1:52:38<8:25:32,  2.80s/it][A
Training...:  22% 3061/13907 [1:52:41<8:19:00,  2.76s/it][A
Training...:  22% 3062/13907 [1:52:43<8:08:40,  2.70s/it][A
Training...:  22% 3063/13907 [1:52:46<7:59:59,  2.66s/it][A
Training...:  22% 3064/13907 [1:52:49<7:52:01,  2.61s/it][A
Training...:  22% 3065/13907 [1:52:51<7:46:39,  2.58s/it][A
Training...:  22% 3066/13907 [1:52:53<7:38:17,  2.54s/it][A
Training...:  22% 3067/13907 [1:52:56<7:31:28,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:35:10<26:06:17, 31325.86s/it]
Training...:  22% 3067/13907 [1:52:59<7:31:28,  2.50s/it][A
Training...:  22% 3068/13907 [1:52:59<7:47:34,  2.59s/it][A
Training...:  22% 3069/13907 [1:53:01<7:37:44,  2.53s/it][A
Training...:  22% 3070/13907 [1:53:03<7:26:38,  2.47s/it][A
Training...:  22% 3071/13907 [1:53:06<7:15:39,  2.41s/it][A
Training...:  22% 3072/13907 [1:53:08<7:05:36,  2.36s/it][A
Training...:  22% 3073/13907 [1:53:10<6:59:22,  2.32s/it][A
Training...:  22% 3074/13907 [1:53:12<6:51:53,  2.28s/it][A
Training...:  22% 3075/13907 [1:53:14<6:43:57,  2.24s/it][A
Training...:  22% 3076/13907 [1:53:17<6:38:40,  2.21s/it][A
Training...:  22% 3077/13907 [1:53:19<6:33:13,  2.18s/it][A
Training...:  22% 3078/13907 [1:53:21<6:26:33,  2.14s/it][A
Training...:  22% 3079/13907 [1:53:23<6:21:30,  2.11s/it][A
Training...:  22% 3080/13907 [1:53:25<6:16:31,  2.09s/it][A
Training...:  22% 3081/13907 [1:53:27<6:10:31,  2.05s/it][A
Training...:  22% 3082/13907 [1:53:29<6:05:48,  2.03s/it][A
Training...:  22% 3083/13907 [1:53:31<6:00:29,  2.00s/it][A
Training...:  22% 3084/13907 [1:53:33<5:55:34,  1.97s/it][A
Training...:  22% 3085/13907 [1:53:35<5:50:58,  1.95s/it][A
Training...:  22% 3086/13907 [1:53:36<5:44:26,  1.91s/it][A
Training...:  22% 3087/13907 [1:53:38<5:37:47,  1.87s/it][A
Training...:  22% 3088/13907 [1:53:40<5:32:42,  1.85s/it][A
Training...:  22% 3089/13907 [1:53:42<5:26:57,  1.81s/it][A
Training...:  22% 3090/13907 [1:53:43<5:21:11,  1.78s/it][A
Training...:  22% 3091/13907 [1:53:45<5:16:13,  1.75s/it][A
Training...:  22% 3092/13907 [1:53:47<5:09:21,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:36:00<26:06:17, 31325.86s/it]
Training...:  22% 3092/13907 [1:53:49<5:09:21,  1.72s/it][A
Training...:  22% 3093/13907 [1:53:49<5:19:11,  1.77s/it][A
Training...:  22% 3094/13907 [1:53:50<5:12:23,  1.73s/it][A
Training...:  22% 3095/13907 [1:53:52<4:59:51,  1.66s/it][A
Training...:  22% 3096/13907 [1:53:53<4:47:25,  1.60s/it][A
Training...:  22% 3097/13907 [1:53:55<4:35:59,  1.53s/it][A
Training...:  22% 3098/13907 [1:53:56<4:25:30,  1.47s/it][A
Training...:  22% 3099/13907 [1:53:57<4:11:35,  1.40s/it][A
Training...:  22% 3100/13907 [1:53:58<3:52:56,  1.29s/it][A
Training...:  22% 3101/13907 [1:54:02<6:08:13,  2.04s/it][A
Training...:  22% 3102/13907 [1:54:05<7:26:55,  2.48s/it][A
Training...:  22% 3103/13907 [1:54:09<8:11:14,  2.73s/it][A
Training...:  22% 3104/13907 [1:54:12<8:34:22,  2.86s/it][A
Training...:  22% 3105/13907 [1:54:15<8:46:12,  2.92s/it][A
Training...:  22% 3106/13907 [1:54:18<8:50:00,  2.94s/it][A
Training...:  22% 3107/13907 [1:54:21<8:48:26,  2.94s/it][A
Training...:  22% 3108/13907 [1:54:24<8:42:20,  2.90s/it][A
Training...:  22% 3109/13907 [1:54:27<8:36:36,  2.87s/it][A
Training...:  22% 3110/13907 [1:54:29<8:30:11,  2.84s/it][A
Training...:  22% 3111/13907 [1:54:32<8:24:47,  2.81s/it][A
Training...:  22% 3112/13907 [1:54:35<8:18:31,  2.77s/it][A
Training...:  22% 3113/13907 [1:54:37<8:12:33,  2.74s/it][A
Training...:  22% 3114/13907 [1:54:40<8:01:48,  2.68s/it][A
Training...:  22% 3115/13907 [1:54:42<7:56:11,  2.65s/it][A
Training...:  22% 3116/13907 [1:54:45<7:47:43,  2.60s/it][A
Training...:  22% 3117/13907 [1:54:47<7:42:20,  2.57s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:37:01<26:06:17, 31325.86s/it]
Training...:  22% 3117/13907 [1:54:50<7:42:20,  2.57s/it][A
Training...:  22% 3118/13907 [1:54:50<7:56:14,  2.65s/it][A
Training...:  22% 3119/13907 [1:54:53<7:44:59,  2.59s/it][A
Training...:  22% 3120/13907 [1:54:55<7:29:56,  2.50s/it][A
Training...:  22% 3121/13907 [1:54:57<7:19:11,  2.44s/it][A
Training...:  22% 3122/13907 [1:55:00<7:11:57,  2.40s/it][A
Training...:  22% 3123/13907 [1:55:02<7:02:42,  2.35s/it][A
Training...:  22% 3124/13907 [1:55:04<6:54:42,  2.31s/it][A
Training...:  22% 3125/13907 [1:55:06<6:48:49,  2.28s/it][A
Training...:  22% 3126/13907 [1:55:08<6:41:21,  2.23s/it][A
Training...:  22% 3127/13907 [1:55:11<6:35:48,  2.20s/it][A
Training...:  22% 3128/13907 [1:55:13<6:28:32,  2.16s/it][A
Training...:  22% 3129/13907 [1:55:15<6:25:44,  2.15s/it][A
Training...:  23% 3130/13907 [1:55:17<6:21:10,  2.12s/it][A
Training...:  23% 3131/13907 [1:55:19<6:15:35,  2.09s/it][A
Training...:  23% 3132/13907 [1:55:21<6:09:10,  2.06s/it][A
Training...:  23% 3133/13907 [1:55:23<6:01:29,  2.01s/it][A
Training...:  23% 3134/13907 [1:55:25<5:54:42,  1.98s/it][A
Training...:  23% 3135/13907 [1:55:26<5:48:02,  1.94s/it][A
Training...:  23% 3136/13907 [1:55:28<5:41:05,  1.90s/it][A
Training...:  23% 3137/13907 [1:55:30<5:36:06,  1.87s/it][A
Training...:  23% 3138/13907 [1:55:32<5:29:48,  1.84s/it][A
Training...:  23% 3139/13907 [1:55:34<5:24:26,  1.81s/it][A
Training...:  23% 3140/13907 [1:55:35<5:18:56,  1.78s/it][A
Training...:  23% 3141/13907 [1:55:37<5:12:50,  1.74s/it][A
Training...:  23% 3142/13907 [1:55:39<5:06:39,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:37:52<26:06:17, 31325.86s/it]
Training...:  23% 3142/13907 [1:55:40<5:06:39,  1.71s/it][A
Training...:  23% 3143/13907 [1:55:40<5:17:14,  1.77s/it][A
Training...:  23% 3144/13907 [1:55:42<5:08:20,  1.72s/it][A
Training...:  23% 3145/13907 [1:55:44<4:57:50,  1.66s/it][A
Training...:  23% 3146/13907 [1:55:45<4:46:44,  1.60s/it][A
Training...:  23% 3147/13907 [1:55:46<4:35:57,  1.54s/it][A
Training...:  23% 3148/13907 [1:55:48<4:25:54,  1.48s/it][A
Training...:  23% 3149/13907 [1:55:49<4:14:05,  1.42s/it][A
Training...:  23% 3150/13907 [1:55:50<3:54:47,  1.31s/it][A
Training...:  23% 3151/13907 [1:55:54<6:04:29,  2.03s/it][A
Training...:  23% 3152/13907 [1:55:57<7:22:28,  2.47s/it][A
Training...:  23% 3153/13907 [1:56:01<8:03:52,  2.70s/it][A
Training...:  23% 3154/13907 [1:56:04<8:27:01,  2.83s/it][A
Training...:  23% 3155/13907 [1:56:07<8:38:36,  2.89s/it][A
Training...:  23% 3156/13907 [1:56:10<8:40:10,  2.90s/it][A
Training...:  23% 3157/13907 [1:56:13<8:37:19,  2.89s/it][A
Training...:  23% 3158/13907 [1:56:15<8:32:48,  2.86s/it][A
Training...:  23% 3159/13907 [1:56:18<8:27:45,  2.83s/it][A
Training...:  23% 3160/13907 [1:56:21<8:21:03,  2.80s/it][A
Training...:  23% 3161/13907 [1:56:23<8:13:57,  2.76s/it][A
Training...:  23% 3162/13907 [1:56:26<8:07:28,  2.72s/it][A
Training...:  23% 3163/13907 [1:56:29<7:59:32,  2.68s/it][A
Training...:  23% 3164/13907 [1:56:31<7:52:14,  2.64s/it][A
Training...:  23% 3165/13907 [1:56:34<7:45:18,  2.60s/it][A
Training...:  23% 3166/13907 [1:56:36<7:39:03,  2.56s/it][A
Training...:  23% 3167/13907 [1:56:39<7:32:47,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:38:53<26:06:17, 31325.86s/it]
Training...:  23% 3167/13907 [1:56:41<7:32:47,  2.53s/it][A
Training...:  23% 3168/13907 [1:56:41<7:48:18,  2.62s/it][A
Training...:  23% 3169/13907 [1:56:44<7:41:17,  2.58s/it][A
Training...:  23% 3170/13907 [1:56:46<7:31:50,  2.52s/it][A
Training...:  23% 3171/13907 [1:56:49<7:19:40,  2.46s/it][A
Training...:  23% 3172/13907 [1:56:51<7:09:31,  2.40s/it][A
Training...:  23% 3173/13907 [1:56:53<7:03:52,  2.37s/it][A
Training...:  23% 3174/13907 [1:56:55<6:54:12,  2.32s/it][A
Training...:  23% 3175/13907 [1:56:58<6:45:21,  2.27s/it][A
Training...:  23% 3176/13907 [1:57:00<6:37:28,  2.22s/it][A
Training...:  23% 3177/13907 [1:57:02<6:31:46,  2.19s/it][A
Training...:  23% 3178/13907 [1:57:04<6:26:22,  2.16s/it][A
Training...:  23% 3179/13907 [1:57:06<6:21:37,  2.13s/it][A
Training...:  23% 3180/13907 [1:57:08<6:15:53,  2.10s/it][A
Training...:  23% 3181/13907 [1:57:10<6:11:03,  2.08s/it][A
Training...:  23% 3182/13907 [1:57:12<6:04:13,  2.04s/it][A
Training...:  23% 3183/13907 [1:57:14<5:59:39,  2.01s/it][A
Training...:  23% 3184/13907 [1:57:16<5:54:42,  1.98s/it][A
Training...:  23% 3185/13907 [1:57:18<5:49:28,  1.96s/it][A
Training...:  23% 3186/13907 [1:57:20<5:43:12,  1.92s/it][A
Training...:  23% 3187/13907 [1:57:21<5:38:08,  1.89s/it][A
Training...:  23% 3188/13907 [1:57:23<5:31:30,  1.86s/it][A
Training...:  23% 3189/13907 [1:57:25<5:25:03,  1.82s/it][A
Training...:  23% 3190/13907 [1:57:27<5:18:25,  1.78s/it][A
Training...:  23% 3191/13907 [1:57:28<5:12:36,  1.75s/it][A
Training...:  23% 3192/13907 [1:57:30<5:05:58,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:39:43<26:06:17, 31325.86s/it]
Training...:  23% 3192/13907 [1:57:32<5:05:58,  1.71s/it][A
Training...:  23% 3193/13907 [1:57:32<5:16:03,  1.77s/it][A
Training...:  23% 3194/13907 [1:57:33<5:07:43,  1.72s/it][A
Training...:  23% 3195/13907 [1:57:35<4:56:45,  1.66s/it][A
Training...:  23% 3196/13907 [1:57:36<4:46:07,  1.60s/it][A
Training...:  23% 3197/13907 [1:57:38<4:33:50,  1.53s/it][A
Training...:  23% 3198/13907 [1:57:39<4:21:47,  1.47s/it][A
Training...:  23% 3199/13907 [1:57:40<4:07:11,  1.39s/it][A
Training...:  23% 3200/13907 [1:57:41<3:48:13,  1.28s/it][A
Training...:  23% 3201/13907 [1:57:45<5:55:24,  1.99s/it][A
Training...:  23% 3202/13907 [1:57:48<7:10:49,  2.41s/it][A
Training...:  23% 3203/13907 [1:57:52<7:53:51,  2.66s/it][A
Training...:  23% 3204/13907 [1:57:55<8:18:31,  2.79s/it][A
Training...:  23% 3205/13907 [1:57:58<8:31:22,  2.87s/it][A
Training...:  23% 3206/13907 [1:58:01<8:36:56,  2.90s/it][A
Training...:  23% 3207/13907 [1:58:04<8:37:43,  2.90s/it][A
Training...:  23% 3208/13907 [1:58:06<8:34:38,  2.89s/it][A
Training...:  23% 3209/13907 [1:58:09<8:27:51,  2.85s/it][A
Training...:  23% 3210/13907 [1:58:12<8:20:13,  2.81s/it][A
Training...:  23% 3211/13907 [1:58:15<8:13:15,  2.77s/it][A
Training...:  23% 3212/13907 [1:58:17<8:04:08,  2.72s/it][A
Training...:  23% 3213/13907 [1:58:20<7:59:46,  2.69s/it][A
Training...:  23% 3214/13907 [1:58:22<7:52:06,  2.65s/it][A
Training...:  23% 3215/13907 [1:58:25<7:43:46,  2.60s/it][A
Training...:  23% 3216/13907 [1:58:27<7:37:17,  2.57s/it][A
Training...:  23% 3217/13907 [1:58:30<7:34:29,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:40:44<26:06:17, 31325.86s/it]
Training...:  23% 3217/13907 [1:58:33<7:34:29,  2.55s/it][A
Training...:  23% 3218/13907 [1:58:33<7:52:10,  2.65s/it][A
Training...:  23% 3219/13907 [1:58:35<7:44:57,  2.61s/it][A
Training...:  23% 3220/13907 [1:58:38<7:31:29,  2.53s/it][A
Training...:  23% 3221/13907 [1:58:40<7:19:40,  2.47s/it][A
Training...:  23% 3222/13907 [1:58:42<7:08:54,  2.41s/it][A
Training...:  23% 3223/13907 [1:58:44<6:59:16,  2.35s/it][A
Training...:  23% 3224/13907 [1:58:47<6:50:15,  2.30s/it][A
Training...:  23% 3225/13907 [1:58:49<6:41:53,  2.26s/it][A
Training...:  23% 3226/13907 [1:58:51<6:33:07,  2.21s/it][A
Training...:  23% 3227/13907 [1:58:53<6:27:40,  2.18s/it][A
Training...:  23% 3228/13907 [1:58:55<6:20:33,  2.14s/it][A
Training...:  23% 3229/13907 [1:58:57<6:14:53,  2.11s/it][A
Training...:  23% 3230/13907 [1:58:59<6:08:44,  2.07s/it][A
Training...:  23% 3231/13907 [1:59:01<6:03:06,  2.04s/it][A
Training...:  23% 3232/13907 [1:59:03<5:57:53,  2.01s/it][A
Training...:  23% 3233/13907 [1:59:05<5:52:54,  1.98s/it][A
Training...:  23% 3234/13907 [1:59:07<5:47:23,  1.95s/it][A
Training...:  23% 3235/13907 [1:59:09<5:42:14,  1.92s/it][A
Training...:  23% 3236/13907 [1:59:10<5:35:58,  1.89s/it][A
Training...:  23% 3237/13907 [1:59:12<5:30:57,  1.86s/it][A
Training...:  23% 3238/13907 [1:59:14<5:25:54,  1.83s/it][A
Training...:  23% 3239/13907 [1:59:16<5:21:02,  1.81s/it][A
Training...:  23% 3240/13907 [1:59:17<5:14:24,  1.77s/it][A
Training...:  23% 3241/13907 [1:59:19<5:08:00,  1.73s/it][A
Training...:  23% 3242/13907 [1:59:21<5:02:07,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:41:34<26:06:17, 31325.86s/it]
Training...:  23% 3242/13907 [1:59:23<5:02:07,  1.70s/it][A
Training...:  23% 3243/13907 [1:59:23<5:12:20,  1.76s/it][A
Training...:  23% 3244/13907 [1:59:24<5:02:37,  1.70s/it][A
Training...:  23% 3245/13907 [1:59:26<4:50:53,  1.64s/it][A
Training...:  23% 3246/13907 [1:59:27<4:39:13,  1.57s/it][A
Training...:  23% 3247/13907 [1:59:28<4:28:29,  1.51s/it][A
Training...:  23% 3248/13907 [1:59:30<4:16:54,  1.45s/it][A
Training...:  23% 3249/13907 [1:59:31<4:04:01,  1.37s/it][A
Training...:  23% 3250/13907 [1:59:32<3:47:27,  1.28s/it][A
Training...:  23% 3251/13907 [1:59:36<5:57:18,  2.01s/it][A
Training...:  23% 3252/13907 [1:59:39<7:13:24,  2.44s/it][A
Training...:  23% 3253/13907 [1:59:42<7:55:02,  2.68s/it][A
Training...:  23% 3254/13907 [1:59:45<8:18:12,  2.81s/it][A
Training...:  23% 3255/13907 [1:59:49<8:37:03,  2.91s/it][A
Training...:  23% 3256/13907 [1:59:52<8:42:25,  2.94s/it][A
Training...:  23% 3257/13907 [1:59:55<8:39:42,  2.93s/it][A
Training...:  23% 3258/13907 [1:59:57<8:34:31,  2.90s/it][A
Training...:  23% 3259/13907 [2:00:00<8:26:38,  2.85s/it][A
Training...:  23% 3260/13907 [2:00:03<8:17:54,  2.81s/it][A
Training...:  23% 3261/13907 [2:00:05<8:09:13,  2.76s/it][A
Training...:  23% 3262/13907 [2:00:08<8:02:08,  2.72s/it][A
Training...:  23% 3263/13907 [2:00:11<7:53:50,  2.67s/it][A
Training...:  23% 3264/13907 [2:00:13<7:46:08,  2.63s/it][A
Training...:  23% 3265/13907 [2:00:16<7:37:09,  2.58s/it][A
Training...:  23% 3266/13907 [2:00:18<7:31:53,  2.55s/it][A
Training...:  23% 3267/13907 [2:00:21<7:25:20,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:42:35<26:06:17, 31325.86s/it]
Training...:  23% 3267/13907 [2:00:23<7:25:20,  2.51s/it][A
Training...:  23% 3268/13907 [2:00:23<7:39:53,  2.59s/it][A
Training...:  24% 3269/13907 [2:00:26<7:31:32,  2.55s/it][A
Training...:  24% 3270/13907 [2:00:28<7:17:50,  2.47s/it][A
Training...:  24% 3271/13907 [2:00:30<7:09:27,  2.42s/it][A
Training...:  24% 3272/13907 [2:00:33<6:59:35,  2.37s/it][A
Training...:  24% 3273/13907 [2:00:35<6:52:28,  2.33s/it][A
Training...:  24% 3274/13907 [2:00:37<6:51:53,  2.32s/it][A
Training...:  24% 3275/13907 [2:00:39<6:51:25,  2.32s/it][A
Training...:  24% 3276/13907 [2:00:42<6:50:07,  2.31s/it][A
Training...:  24% 3277/13907 [2:00:44<6:45:40,  2.29s/it][A
Training...:  24% 3278/13907 [2:00:46<6:40:04,  2.26s/it][A
Training...:  24% 3279/13907 [2:00:48<6:35:56,  2.24s/it][A
Training...:  24% 3280/13907 [2:00:51<6:31:45,  2.21s/it][A
Training...:  24% 3281/13907 [2:00:53<6:27:56,  2.19s/it][A
Training...:  24% 3282/13907 [2:00:55<6:22:12,  2.16s/it][A
Training...:  24% 3283/13907 [2:00:57<6:17:04,  2.13s/it][A
Training...:  24% 3284/13907 [2:00:59<6:11:10,  2.10s/it][A
Training...:  24% 3285/13907 [2:01:01<6:05:08,  2.06s/it][A
Training...:  24% 3286/13907 [2:01:03<5:58:55,  2.03s/it][A
Training...:  24% 3287/13907 [2:01:05<5:53:28,  2.00s/it][A
Training...:  24% 3288/13907 [2:01:07<5:48:14,  1.97s/it][A
Training...:  24% 3289/13907 [2:01:08<5:41:37,  1.93s/it][A
Training...:  24% 3290/13907 [2:01:10<5:35:41,  1.90s/it][A
Training...:  24% 3291/13907 [2:01:12<5:29:46,  1.86s/it][A
Training...:  24% 3292/13907 [2:01:14<5:22:53,  1.83s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:43:27<26:06:17, 31325.86s/it]
Training...:  24% 3292/13907 [2:01:16<5:22:53,  1.83s/it][A
Training...:  24% 3293/13907 [2:01:16<5:33:27,  1.89s/it][A
Training...:  24% 3294/13907 [2:01:18<5:24:23,  1.83s/it][A
Training...:  24% 3295/13907 [2:01:19<5:13:35,  1.77s/it][A
Training...:  24% 3296/13907 [2:01:21<5:00:43,  1.70s/it][A
Training...:  24% 3297/13907 [2:01:22<4:50:30,  1.64s/it][A
Training...:  24% 3298/13907 [2:01:24<4:38:20,  1.57s/it][A
Training...:  24% 3299/13907 [2:01:25<4:23:40,  1.49s/it][A
Training...:  24% 3300/13907 [2:01:26<4:03:34,  1.38s/it][A
Training...:  24% 3301/13907 [2:01:30<6:18:31,  2.14s/it][A
Training...:  24% 3302/13907 [2:01:34<7:35:03,  2.57s/it][A
Training...:  24% 3303/13907 [2:01:37<8:21:17,  2.84s/it][A
Training...:  24% 3304/13907 [2:01:40<8:46:49,  2.98s/it][A
Training...:  24% 3305/13907 [2:01:44<9:05:02,  3.08s/it][A
Training...:  24% 3306/13907 [2:01:47<9:09:40,  3.11s/it][A
Training...:  24% 3307/13907 [2:01:50<9:06:38,  3.09s/it][A
Training...:  24% 3308/13907 [2:01:53<9:02:03,  3.07s/it][A
Training...:  24% 3309/13907 [2:01:56<8:57:00,  3.04s/it][A
Training...:  24% 3310/13907 [2:01:59<8:48:37,  2.99s/it][A
Training...:  24% 3311/13907 [2:02:01<8:34:10,  2.91s/it][A
Training...:  24% 3312/13907 [2:02:04<8:19:16,  2.83s/it][A
Training...:  24% 3313/13907 [2:02:07<8:06:59,  2.76s/it][A
Training...:  24% 3314/13907 [2:02:09<7:55:56,  2.70s/it][A
Training...:  24% 3315/13907 [2:02:12<7:45:40,  2.64s/it][A
Training...:  24% 3316/13907 [2:02:14<7:38:08,  2.60s/it][A
Training...:  24% 3317/13907 [2:02:17<7:31:45,  2.56s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:44:31<26:06:17, 31325.86s/it]
Training...:  24% 3317/13907 [2:02:20<7:31:45,  2.56s/it][A
Training...:  24% 3318/13907 [2:02:20<7:45:03,  2.64s/it][A
Training...:  24% 3319/13907 [2:02:22<7:34:56,  2.58s/it][A
Training...:  24% 3320/13907 [2:02:24<7:21:28,  2.50s/it][A
Training...:  24% 3321/13907 [2:02:27<7:12:21,  2.45s/it][A
Training...:  24% 3322/13907 [2:02:29<7:02:27,  2.39s/it][A
Training...:  24% 3323/13907 [2:02:31<6:53:57,  2.35s/it][A
Training...:  24% 3324/13907 [2:02:33<6:46:11,  2.30s/it][A
Training...:  24% 3325/13907 [2:02:35<6:39:18,  2.26s/it][A
Training...:  24% 3326/13907 [2:02:38<6:33:21,  2.23s/it][A
Training...:  24% 3327/13907 [2:02:40<6:27:18,  2.20s/it][A
Training...:  24% 3328/13907 [2:02:42<6:21:00,  2.16s/it][A
Training...:  24% 3329/13907 [2:02:44<6:15:29,  2.13s/it][A
Training...:  24% 3330/13907 [2:02:46<6:09:47,  2.10s/it][A
Training...:  24% 3331/13907 [2:02:48<6:04:11,  2.07s/it][A
Training...:  24% 3332/13907 [2:02:50<5:58:19,  2.03s/it][A
Training...:  24% 3333/13907 [2:02:52<5:55:10,  2.02s/it][A
Training...:  24% 3334/13907 [2:02:54<5:49:27,  1.98s/it][A
Training...:  24% 3335/13907 [2:02:56<5:43:38,  1.95s/it][A
Training...:  24% 3336/13907 [2:02:57<5:39:04,  1.92s/it][A
Training...:  24% 3337/13907 [2:02:59<5:34:29,  1.90s/it][A
Training...:  24% 3338/13907 [2:03:01<5:29:34,  1.87s/it][A
Training...:  24% 3339/13907 [2:03:03<5:23:51,  1.84s/it][A
Training...:  24% 3340/13907 [2:03:05<5:17:46,  1.80s/it][A
Training...:  24% 3341/13907 [2:03:06<5:11:51,  1.77s/it][A
Training...:  24% 3342/13907 [2:03:08<5:05:17,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:45:21<26:06:17, 31325.86s/it]
Training...:  24% 3342/13907 [2:03:10<5:05:17,  1.73s/it][A
Training...:  24% 3343/13907 [2:03:10<5:15:16,  1.79s/it][A
Training...:  24% 3344/13907 [2:03:11<5:06:04,  1.74s/it][A
Training...:  24% 3345/13907 [2:03:13<4:56:18,  1.68s/it][A
Training...:  24% 3346/13907 [2:03:14<4:44:00,  1.61s/it][A
Training...:  24% 3347/13907 [2:03:16<4:32:39,  1.55s/it][A
Training...:  24% 3348/13907 [2:03:17<4:20:11,  1.48s/it][A
Training...:  24% 3349/13907 [2:03:18<4:07:09,  1.40s/it][A
Training...:  24% 3350/13907 [2:03:20<3:49:51,  1.31s/it][A
Training...:  24% 3351/13907 [2:03:23<5:53:24,  2.01s/it][A
Training...:  24% 3352/13907 [2:03:27<7:04:20,  2.41s/it][A
Training...:  24% 3353/13907 [2:03:30<7:47:26,  2.66s/it][A
Training...:  24% 3354/13907 [2:03:33<8:13:57,  2.81s/it][A
Training...:  24% 3355/13907 [2:03:36<8:27:47,  2.89s/it][A
Training...:  24% 3356/13907 [2:03:39<8:30:53,  2.91s/it][A
Training...:  24% 3357/13907 [2:03:42<8:28:52,  2.89s/it][A
Training...:  24% 3358/13907 [2:03:45<8:22:35,  2.86s/it][A
Training...:  24% 3359/13907 [2:03:47<8:15:28,  2.82s/it][A
Training...:  24% 3360/13907 [2:03:50<8:08:09,  2.78s/it][A
Training...:  24% 3361/13907 [2:03:53<8:01:01,  2.74s/it][A
Training...:  24% 3362/13907 [2:03:55<7:52:30,  2.69s/it][A
Training...:  24% 3363/13907 [2:03:58<7:46:19,  2.65s/it][A
Training...:  24% 3364/13907 [2:04:00<7:40:33,  2.62s/it][A
Training...:  24% 3365/13907 [2:04:03<7:34:09,  2.58s/it][A
Training...:  24% 3366/13907 [2:04:05<7:27:26,  2.55s/it][A
Training...:  24% 3367/13907 [2:04:08<7:21:08,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:46:22<26:06:17, 31325.86s/it]
Training...:  24% 3367/13907 [2:04:10<7:21:08,  2.51s/it][A
Training...:  24% 3368/13907 [2:04:10<7:35:41,  2.59s/it][A
Training...:  24% 3369/13907 [2:04:13<7:28:30,  2.55s/it][A
Training...:  24% 3370/13907 [2:04:15<7:16:35,  2.49s/it][A
Training...:  24% 3371/13907 [2:04:18<7:06:02,  2.43s/it][A
Training...:  24% 3372/13907 [2:04:20<6:57:02,  2.38s/it][A
Training...:  24% 3373/13907 [2:04:22<6:50:37,  2.34s/it][A
Training...:  24% 3374/13907 [2:04:24<6:41:56,  2.29s/it][A
Training...:  24% 3375/13907 [2:04:26<6:37:37,  2.27s/it][A
Training...:  24% 3376/13907 [2:04:29<6:31:58,  2.23s/it][A
Training...:  24% 3377/13907 [2:04:31<6:24:57,  2.19s/it][A
Training...:  24% 3378/13907 [2:04:33<6:17:55,  2.15s/it][A
Training...:  24% 3379/13907 [2:04:35<6:12:20,  2.12s/it][A
Training...:  24% 3380/13907 [2:04:37<6:06:57,  2.09s/it][A
Training...:  24% 3381/13907 [2:04:39<6:01:51,  2.06s/it][A
Training...:  24% 3382/13907 [2:04:41<5:57:27,  2.04s/it][A
Training...:  24% 3383/13907 [2:04:43<5:52:00,  2.01s/it][A
Training...:  24% 3384/13907 [2:04:45<5:47:33,  1.98s/it][A
Training...:  24% 3385/13907 [2:04:47<5:42:29,  1.95s/it][A
Training...:  24% 3386/13907 [2:04:48<5:35:55,  1.92s/it][A
Training...:  24% 3387/13907 [2:04:50<5:31:39,  1.89s/it][A
Training...:  24% 3388/13907 [2:04:52<5:26:32,  1.86s/it][A
Training...:  24% 3389/13907 [2:04:54<5:23:17,  1.84s/it][A
Training...:  24% 3390/13907 [2:04:56<5:18:14,  1.82s/it][A
Training...:  24% 3391/13907 [2:04:57<5:12:29,  1.78s/it][A
Training...:  24% 3392/13907 [2:04:59<5:04:40,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:47:12<26:06:17, 31325.86s/it]
Training...:  24% 3392/13907 [2:05:01<5:04:40,  1.74s/it][A
Training...:  24% 3393/13907 [2:05:01<5:14:20,  1.79s/it][A
Training...:  24% 3394/13907 [2:05:02<5:05:16,  1.74s/it][A
Training...:  24% 3395/13907 [2:05:04<4:54:15,  1.68s/it][A
Training...:  24% 3396/13907 [2:05:05<4:41:36,  1.61s/it][A
Training...:  24% 3397/13907 [2:05:07<4:29:24,  1.54s/it][A
Training...:  24% 3398/13907 [2:05:08<4:17:17,  1.47s/it][A
Training...:  24% 3399/13907 [2:05:09<4:03:58,  1.39s/it][A
Training...:  24% 3400/13907 [2:05:10<3:45:26,  1.29s/it][A
Training...:  24% 3401/13907 [2:05:14<5:56:55,  2.04s/it][A
Training...:  24% 3402/13907 [2:05:18<7:14:12,  2.48s/it][A
Training...:  24% 3403/13907 [2:05:21<7:59:16,  2.74s/it][A
Training...:  24% 3404/13907 [2:05:24<8:21:18,  2.86s/it][A
Training...:  24% 3405/13907 [2:05:27<8:31:25,  2.92s/it][A
Training...:  24% 3406/13907 [2:05:30<8:33:17,  2.93s/it][A
Training...:  24% 3407/13907 [2:05:33<8:30:48,  2.92s/it][A
Training...:  25% 3408/13907 [2:05:36<8:25:25,  2.89s/it][A
Training...:  25% 3409/13907 [2:05:39<8:19:45,  2.86s/it][A
Training...:  25% 3410/13907 [2:05:41<8:11:20,  2.81s/it][A
Training...:  25% 3411/13907 [2:05:44<8:04:15,  2.77s/it][A
Training...:  25% 3412/13907 [2:05:47<7:56:10,  2.72s/it][A
Training...:  25% 3413/13907 [2:05:49<7:48:09,  2.68s/it][A
Training...:  25% 3414/13907 [2:05:52<7:41:54,  2.64s/it][A
Training...:  25% 3415/13907 [2:05:54<7:34:57,  2.60s/it][A
Training...:  25% 3416/13907 [2:05:57<7:28:23,  2.56s/it][A
Training...:  25% 3417/13907 [2:05:59<7:22:37,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:48:13<26:06:17, 31325.86s/it]
Training...:  25% 3417/13907 [2:06:02<7:22:37,  2.53s/it][A
Training...:  25% 3418/13907 [2:06:02<7:36:14,  2.61s/it][A
Training...:  25% 3419/13907 [2:06:04<7:26:12,  2.55s/it][A
Training...:  25% 3420/13907 [2:06:07<7:15:18,  2.49s/it][A
Training...:  25% 3421/13907 [2:06:09<7:05:31,  2.43s/it][A
Training...:  25% 3422/13907 [2:06:11<6:55:41,  2.38s/it][A
Training...:  25% 3423/13907 [2:06:14<6:47:49,  2.33s/it][A
Training...:  25% 3424/13907 [2:06:16<6:39:47,  2.29s/it][A
Training...:  25% 3425/13907 [2:06:18<6:33:36,  2.25s/it][A
Training...:  25% 3426/13907 [2:06:20<6:27:38,  2.22s/it][A
Training...:  25% 3427/13907 [2:06:22<6:21:35,  2.18s/it][A
Training...:  25% 3428/13907 [2:06:24<6:16:22,  2.15s/it][A
Training...:  25% 3429/13907 [2:06:26<6:10:13,  2.12s/it][A
Training...:  25% 3430/13907 [2:06:28<6:06:10,  2.10s/it][A
Training...:  25% 3431/13907 [2:06:30<6:03:41,  2.08s/it][A
Training...:  25% 3432/13907 [2:06:32<6:00:18,  2.06s/it][A
Training...:  25% 3433/13907 [2:06:34<5:54:21,  2.03s/it][A
Training...:  25% 3434/13907 [2:06:36<5:48:53,  2.00s/it][A
Training...:  25% 3435/13907 [2:06:38<5:43:15,  1.97s/it][A
Training...:  25% 3436/13907 [2:06:40<5:36:43,  1.93s/it][A
Training...:  25% 3437/13907 [2:06:42<5:30:24,  1.89s/it][A
Training...:  25% 3438/13907 [2:06:44<5:26:59,  1.87s/it][A
Training...:  25% 3439/13907 [2:06:45<5:20:47,  1.84s/it][A
Training...:  25% 3440/13907 [2:06:47<5:13:22,  1.80s/it][A
Training...:  25% 3441/13907 [2:06:49<5:06:14,  1.76s/it][A
Training...:  25% 3442/13907 [2:06:50<4:58:43,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:49:03<26:06:17, 31325.86s/it]
Training...:  25% 3442/13907 [2:06:52<4:58:43,  1.71s/it][A
Training...:  25% 3443/13907 [2:06:52<5:07:39,  1.76s/it][A
Training...:  25% 3444/13907 [2:06:54<4:59:52,  1.72s/it][A
Training...:  25% 3445/13907 [2:06:55<4:49:42,  1.66s/it][A
Training...:  25% 3446/13907 [2:06:57<4:37:52,  1.59s/it][A
Training...:  25% 3447/13907 [2:06:58<4:26:55,  1.53s/it][A
Training...:  25% 3448/13907 [2:07:00<4:14:05,  1.46s/it][A
Training...:  25% 3449/13907 [2:07:01<4:00:51,  1.38s/it][A
Training...:  25% 3450/13907 [2:07:02<3:42:01,  1.27s/it][A
Training...:  25% 3451/13907 [2:07:06<5:54:02,  2.03s/it][A
Training...:  25% 3452/13907 [2:07:09<7:05:25,  2.44s/it][A
Training...:  25% 3453/13907 [2:07:12<7:47:20,  2.68s/it][A
Training...:  25% 3454/13907 [2:07:15<8:07:55,  2.80s/it][A
Training...:  25% 3455/13907 [2:07:18<8:18:48,  2.86s/it][A
Training...:  25% 3456/13907 [2:07:21<8:23:02,  2.89s/it][A
Training...:  25% 3457/13907 [2:07:24<8:24:13,  2.90s/it][A
Training...:  25% 3458/13907 [2:07:27<8:19:06,  2.87s/it][A
Training...:  25% 3459/13907 [2:07:30<8:14:00,  2.84s/it][A
Training...:  25% 3460/13907 [2:07:32<8:05:33,  2.79s/it][A
Training...:  25% 3461/13907 [2:07:35<7:57:17,  2.74s/it][A
Training...:  25% 3462/13907 [2:07:38<7:51:03,  2.71s/it][A
Training...:  25% 3463/13907 [2:07:40<7:43:53,  2.67s/it][A
Training...:  25% 3464/13907 [2:07:43<7:37:23,  2.63s/it][A
Training...:  25% 3465/13907 [2:07:45<7:30:46,  2.59s/it][A
Training...:  25% 3466/13907 [2:07:48<7:23:34,  2.55s/it][A
Training...:  25% 3467/13907 [2:07:50<7:18:53,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:50:04<26:06:17, 31325.86s/it]
Training...:  25% 3467/13907 [2:07:53<7:18:53,  2.52s/it][A
Training...:  25% 3468/13907 [2:07:53<7:37:35,  2.63s/it][A
Training...:  25% 3469/13907 [2:07:56<7:31:48,  2.60s/it][A
Training...:  25% 3470/13907 [2:07:58<7:16:22,  2.51s/it][A
Training...:  25% 3471/13907 [2:08:00<7:05:17,  2.45s/it][A
Training...:  25% 3472/13907 [2:08:02<6:57:33,  2.40s/it][A
Training...:  25% 3473/13907 [2:08:05<6:50:09,  2.36s/it][A
Training...:  25% 3474/13907 [2:08:07<6:45:20,  2.33s/it][A
Training...:  25% 3475/13907 [2:08:09<6:36:11,  2.28s/it][A
Training...:  25% 3476/13907 [2:08:11<6:29:41,  2.24s/it][A
Training...:  25% 3477/13907 [2:08:13<6:23:58,  2.21s/it][A
Training...:  25% 3478/13907 [2:08:15<6:17:36,  2.17s/it][A
Training...:  25% 3479/13907 [2:08:18<6:12:17,  2.14s/it][A
Training...:  25% 3480/13907 [2:08:20<6:05:38,  2.10s/it][A
Training...:  25% 3481/13907 [2:08:22<6:00:34,  2.08s/it][A
Training...:  25% 3482/13907 [2:08:24<5:54:57,  2.04s/it][A
Training...:  25% 3483/13907 [2:08:26<5:49:50,  2.01s/it][A
Training...:  25% 3484/13907 [2:08:27<5:44:32,  1.98s/it][A
Training...:  25% 3485/13907 [2:08:29<5:41:27,  1.97s/it][A
Training...:  25% 3486/13907 [2:08:31<5:35:38,  1.93s/it][A
Training...:  25% 3487/13907 [2:08:33<5:30:34,  1.90s/it][A
Training...:  25% 3488/13907 [2:08:35<5:24:42,  1.87s/it][A
Training...:  25% 3489/13907 [2:08:37<5:18:11,  1.83s/it][A
Training...:  25% 3490/13907 [2:08:38<5:12:32,  1.80s/it][A
Training...:  25% 3491/13907 [2:08:40<5:07:42,  1.77s/it][A
Training...:  25% 3492/13907 [2:08:42<5:00:24,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:50:55<26:06:17, 31325.86s/it]
Training...:  25% 3492/13907 [2:08:44<5:00:24,  1.73s/it][A
Training...:  25% 3493/13907 [2:08:44<5:10:19,  1.79s/it][A
Step... (15675 | Loss: 0.23899394273757935, Learning Rate: 0.00020803636289201677, Gradient Norm: 0.7446734309196472)
Step... (15700 | Loss: 0.2767943739891052, Learning Rate: 0.00020788486290257424, Gradient Norm: 1.1683566570281982)
Step... (15725 | Loss: 0.23728731274604797, Learning Rate: 0.00020773334836121649, Gradient Norm: 0.8792234659194946)
Step... (15750 | Loss: 0.24221912026405334, Learning Rate: 0.0002075818192679435, Gradient Norm: 1.244680643081665)
Step... (15775 | Loss: 0.2067069411277771, Learning Rate: 0.00020743031927850097, Gradient Norm: 1.0367581844329834)
Step... (15800 | Loss: 0.22983884811401367, Learning Rate: 0.00020727880473714322, Gradient Norm: 1.2894974946975708)
Step... (15825 | Loss: 0.19766634702682495, Learning Rate: 0.00020712727564387023, Gradient Norm: 0.895576536655426)
Step... (15850 | Loss: 0.26709938049316406, Learning Rate: 0.0002069757756544277, Gradient Norm: 1.2981696128845215)
Step... (15875 | Loss: 0.2204180657863617, Learning Rate: 0.00020682424656115472, Gradient Norm: 0.9051120281219482)
Step... (15900 | Loss: 0.2562427818775177, Learning Rate: 0.00020667273201979697, Gradient Norm: 0.8530769348144531)
Step... (15925 | Loss: 0.21571649610996246, Learning Rate: 0.00020652123203035444, Gradient Norm: 0.8301934003829956)
Step... (15950 | Loss: 0.20751099288463593, Learning Rate: 0.00020636970293708146, Gradient Norm: 0.8383408784866333)
Step... (15975 | Loss: 0.23392567038536072, Learning Rate: 0.00020621817384380847, Gradient Norm: 0.7812187671661377)
Step... (16000 | Loss: 0.27191802859306335, Learning Rate: 0.00020606668840628117, Gradient Norm: 1.638162612915039)
Step... (16025 | Loss: 0.34039145708084106, Learning Rate: 0.0002059151593130082, Gradient Norm: 1.2659308910369873)
Step... (16050 | Loss: 0.28759974241256714, Learning Rate: 0.0002057636302197352, Gradient Norm: 1.4306750297546387)
Step... (16075 | Loss: 0.28877201676368713, Learning Rate: 0.0002056121447822079, Gradient Norm: 0.9243578910827637)
Step... (16100 | Loss: 0.3019702434539795, Learning Rate: 0.00020546061568893492, Gradient Norm: 1.0495198965072632)
Step... (16125 | Loss: 0.19484353065490723, Learning Rate: 0.00020530908659566194, Gradient Norm: 0.8564289808273315)
Step... (16150 | Loss: 0.23049649596214294, Learning Rate: 0.0002051575866062194, Gradient Norm: 0.9148288369178772)
Step... (16175 | Loss: 0.2252368927001953, Learning Rate: 0.00020500607206486166, Gradient Norm: 0.8183977603912354)
Step... (16200 | Loss: 0.2709178924560547, Learning Rate: 0.00020485454297158867, Gradient Norm: 1.0901097059249878)
Step... (16225 | Loss: 0.3029635548591614, Learning Rate: 0.00020470304298214614, Gradient Norm: 1.004420280456543)
Step... (16250 | Loss: 0.2476978600025177, Learning Rate: 0.0002045515284407884, Gradient Norm: 0.9083600044250488)
Step... (16275 | Loss: 0.25612473487854004, Learning Rate: 0.0002043999993475154, Gradient Norm: 0.8774905204772949)
Step... (16300 | Loss: 0.21695032715797424, Learning Rate: 0.00020424848480615765, Gradient Norm: 0.8152427673339844)
Step... (16325 | Loss: 0.22679591178894043, Learning Rate: 0.00020409698481671512, Gradient Norm: 0.798590898513794)
Step... (16350 | Loss: 0.2616054117679596, Learning Rate: 0.00020394545572344214, Gradient Norm: 1.020999789237976)
Step... (16375 | Loss: 0.23371407389640808, Learning Rate: 0.00020379394118208438, Gradient Norm: 0.824210524559021)
Step... (16400 | Loss: 0.21102064847946167, Learning Rate: 0.00020364244119264185, Gradient Norm: 0.9003337621688843)
Step... (16425 | Loss: 0.25824540853500366, Learning Rate: 0.00020349091209936887, Gradient Norm: 0.758732259273529)
Step... (16450 | Loss: 0.206375390291214, Learning Rate: 0.00020333939755801111, Gradient Norm: 0.8175904750823975)
Step... (16475 | Loss: 0.19683171808719635, Learning Rate: 0.0002031878975685686, Gradient Norm: 0.7750009298324585)
Step... (16500 | Loss: 0.21545454859733582, Learning Rate: 0.0002030363684752956, Gradient Norm: 1.100198745727539)
Step... (16525 | Loss: 0.33187878131866455, Learning Rate: 0.00020288485393393785, Gradient Norm: 1.4293955564498901)
Step... (16550 | Loss: 0.2449641227722168, Learning Rate: 0.00020273335394449532, Gradient Norm: 2.0117764472961426)
Step... (16575 | Loss: 0.19256429374217987, Learning Rate: 0.00020258182485122234, Gradient Norm: 0.626665472984314)
Step... (16600 | Loss: 0.28584617376327515, Learning Rate: 0.00020243031030986458, Gradient Norm: 1.2931299209594727)
Step... (16625 | Loss: 0.25258028507232666, Learning Rate: 0.00020227879576850682, Gradient Norm: 0.7558318376541138)
Step... (16650 | Loss: 0.19886654615402222, Learning Rate: 0.00020212728122714907, Gradient Norm: 0.9736389517784119)
Step... (16675 | Loss: 0.21895653009414673, Learning Rate: 0.00020197576668579131, Gradient Norm: 0.7344491481781006)
Step... (16700 | Loss: 0.20281830430030823, Learning Rate: 0.00020182425214443356, Gradient Norm: 0.9866244792938232)
Step... (16725 | Loss: 0.2675095796585083, Learning Rate: 0.0002016727376030758, Gradient Norm: 0.8606172204017639)
Step... (16750 | Loss: 0.23334936797618866, Learning Rate: 0.00020152122306171805, Gradient Norm: 1.1392747163772583)
Step... (16775 | Loss: 0.2949730455875397, Learning Rate: 0.0002013697085203603, Gradient Norm: 0.9688729047775269)
Step... (16800 | Loss: 0.2036249339580536, Learning Rate: 0.0002012181794270873, Gradient Norm: 0.752309262752533)
Step... (16825 | Loss: 0.3106038570404053, Learning Rate: 0.00020106667943764478, Gradient Norm: 1.0386948585510254)
Step... (16850 | Loss: 0.2727806270122528, Learning Rate: 0.00020091516489628702, Gradient Norm: 1.1202349662780762)
Step... (16875 | Loss: 0.230093315243721, Learning Rate: 0.00020076363580301404, Gradient Norm: 0.6824727058410645)
Step... (16900 | Loss: 0.23221424221992493, Learning Rate: 0.0002006121358135715, Gradient Norm: 1.4329280853271484)
Step... (16925 | Loss: 0.3025619387626648, Learning Rate: 0.00020046062127221376, Gradient Norm: 0.9421378970146179)
Step... (16950 | Loss: 0.3006173372268677, Learning Rate: 0.00020030909217894077, Gradient Norm: 1.5950015783309937)
Step... (16975 | Loss: 0.2859991788864136, Learning Rate: 0.00020015759218949825, Gradient Norm: 0.8499654531478882)
Step... (17000 | Loss: 0.16736090183258057, Learning Rate: 0.0002000060776481405, Gradient Norm: 0.9336321949958801)
Step... (17025 | Loss: 0.2542645037174225, Learning Rate: 0.0001998545485548675, Gradient Norm: 1.07554030418396)
Step... (17050 | Loss: 0.23006778955459595, Learning Rate: 0.00019970303401350975, Gradient Norm: 1.0599949359893799)
Step... (17075 | Loss: 0.24340659379959106, Learning Rate: 0.00019955153402406722, Gradient Norm: 0.8613325953483582)
Step... (17100 | Loss: 0.20604601502418518, Learning Rate: 0.00019940000493079424, Gradient Norm: 1.1271897554397583)
Step... (17125 | Loss: 0.3210880756378174, Learning Rate: 0.00019924849038943648, Gradient Norm: 1.1541547775268555)
Step... (17150 | Loss: 0.21201008558273315, Learning Rate: 0.00019909699039999396, Gradient Norm: 2.07201886177063)
Step... (17175 | Loss: 0.2934955954551697, Learning Rate: 0.00019894546130672097, Gradient Norm: 0.8414566516876221)
Step... (17200 | Loss: 0.1975136399269104, Learning Rate: 0.00019879394676536322, Gradient Norm: 0.9060004949569702)
Step... (17225 | Loss: 0.22946469485759735, Learning Rate: 0.0001986424467759207, Gradient Norm: 0.9294915795326233)
Step... (17250 | Loss: 0.30683407187461853, Learning Rate: 0.0001984909176826477, Gradient Norm: 1.2972073554992676)
Step... (17275 | Loss: 0.2562875747680664, Learning Rate: 0.00019833940314128995, Gradient Norm: 1.08754301071167)
Step... (17300 | Loss: 0.17789150774478912, Learning Rate: 0.00019818790315184742, Gradient Norm: 0.6172562837600708)
Step... (17325 | Loss: 0.2733602523803711, Learning Rate: 0.00019803637405857444, Gradient Norm: 1.3411273956298828)
Step... (17350 | Loss: 0.2540774345397949, Learning Rate: 0.00019788485951721668, Gradient Norm: 1.6023030281066895)
Step... (17375 | Loss: 0.24119970202445984, Learning Rate: 0.00019773334497585893, Gradient Norm: 0.8384938836097717)

Training...:  25% 3494/13907 [2:08:45<5:03:38,  1.75s/it][A
Training...:  25% 3495/13907 [2:08:47<4:51:48,  1.68s/it][A
Training...:  25% 3496/13907 [2:08:48<4:40:27,  1.62s/it][A
Training...:  25% 3497/13907 [2:08:50<4:27:27,  1.54s/it][A
Training...:  25% 3498/13907 [2:08:51<4:16:37,  1.48s/it][A
Training...:  25% 3499/13907 [2:08:52<4:03:39,  1.40s/it][A
Training...:  25% 3500/13907 [2:08:53<3:45:28,  1.30s/it][A
Training...:  25% 3501/13907 [2:08:57<5:55:53,  2.05s/it][A
Training...:  25% 3502/13907 [2:09:00<7:10:22,  2.48s/it][A
Training...:  25% 3503/13907 [2:09:04<7:54:25,  2.74s/it][A
Training...:  25% 3504/13907 [2:09:07<8:17:19,  2.87s/it][A
Training...:  25% 3505/13907 [2:09:10<8:24:46,  2.91s/it][A
Training...:  25% 3506/13907 [2:09:13<8:26:34,  2.92s/it][A
Training...:  25% 3507/13907 [2:09:16<8:24:34,  2.91s/it][A
Training...:  25% 3508/13907 [2:09:19<8:18:25,  2.88s/it][A
Training...:  25% 3509/13907 [2:09:21<8:12:44,  2.84s/it][A
Training...:  25% 3510/13907 [2:09:24<8:04:18,  2.79s/it][A
Training...:  25% 3511/13907 [2:09:27<7:54:58,  2.74s/it][A
Training...:  25% 3512/13907 [2:09:29<7:46:42,  2.69s/it][A
Training...:  25% 3513/13907 [2:09:32<7:40:15,  2.66s/it][A
Training...:  25% 3514/13907 [2:09:34<7:32:29,  2.61s/it][A
Training...:  25% 3515/13907 [2:09:37<7:24:46,  2.57s/it][A
Training...:  25% 3516/13907 [2:09:39<7:19:11,  2.54s/it][A
Training...:  25% 3517/13907 [2:09:42<7:12:33,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:51:56<26:06:17, 31325.86s/it]
Training...:  25% 3517/13907 [2:09:44<7:12:33,  2.50s/it][A
Training...:  25% 3518/13907 [2:09:44<7:26:55,  2.58s/it][A
Training...:  25% 3519/13907 [2:09:47<7:19:16,  2.54s/it][A
Training...:  25% 3520/13907 [2:09:49<7:08:04,  2.47s/it][A
Training...:  25% 3521/13907 [2:09:52<7:01:12,  2.43s/it][A
Training...:  25% 3522/13907 [2:09:54<6:55:04,  2.40s/it][A
Training...:  25% 3523/13907 [2:09:56<6:46:05,  2.35s/it][A
Training...:  25% 3524/13907 [2:09:58<6:39:32,  2.31s/it][A
Training...:  25% 3525/13907 [2:10:00<6:30:50,  2.26s/it][A
Training...:  25% 3526/13907 [2:10:03<6:25:10,  2.23s/it][A
Training...:  25% 3527/13907 [2:10:05<6:19:28,  2.19s/it][A
Training...:  25% 3528/13907 [2:10:07<6:12:29,  2.15s/it][A
Training...:  25% 3529/13907 [2:10:09<6:06:24,  2.12s/it][A
Training...:  25% 3530/13907 [2:10:11<6:01:06,  2.09s/it][A
Training...:  25% 3531/13907 [2:10:13<5:55:25,  2.06s/it][A
Training...:  25% 3532/13907 [2:10:15<5:50:01,  2.02s/it][A
Training...:  25% 3533/13907 [2:10:17<5:44:32,  1.99s/it][A
Training...:  25% 3534/13907 [2:10:19<5:39:49,  1.97s/it][A
Training...:  25% 3535/13907 [2:10:20<5:34:56,  1.94s/it][A
Training...:  25% 3536/13907 [2:10:22<5:29:05,  1.90s/it][A
Training...:  25% 3537/13907 [2:10:24<5:24:58,  1.88s/it][A
Training...:  25% 3538/13907 [2:10:26<5:19:32,  1.85s/it][A
Training...:  25% 3539/13907 [2:10:28<5:13:52,  1.82s/it][A
Training...:  25% 3540/13907 [2:10:29<5:07:46,  1.78s/it][A
Training...:  25% 3541/13907 [2:10:31<5:02:16,  1.75s/it][A
Training...:  25% 3542/13907 [2:10:33<4:57:11,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:52:46<26:06:17, 31325.86s/it]
Training...:  25% 3542/13907 [2:10:35<4:57:11,  1.72s/it][A
Training...:  25% 3543/13907 [2:10:35<5:07:21,  1.78s/it][A
Training...:  25% 3544/13907 [2:10:36<4:58:52,  1.73s/it][A
Training...:  25% 3545/13907 [2:10:38<4:48:29,  1.67s/it][A
Training...:  25% 3546/13907 [2:10:39<4:37:55,  1.61s/it][A
Training...:  26% 3547/13907 [2:10:41<4:26:19,  1.54s/it][A
Training...:  26% 3548/13907 [2:10:42<4:14:55,  1.48s/it][A
Training...:  26% 3549/13907 [2:10:43<4:03:52,  1.41s/it][A
Training...:  26% 3550/13907 [2:10:44<3:45:02,  1.30s/it][A
Training...:  26% 3551/13907 [2:10:48<5:46:22,  2.01s/it][A
Training...:  26% 3552/13907 [2:10:51<7:00:31,  2.44s/it][A
Training...:  26% 3553/13907 [2:10:55<7:41:51,  2.68s/it][A
Training...:  26% 3554/13907 [2:10:58<8:03:55,  2.80s/it][A
Training...:  26% 3555/13907 [2:11:01<8:15:22,  2.87s/it][A
Training...:  26% 3556/13907 [2:11:04<8:18:45,  2.89s/it][A
Training...:  26% 3557/13907 [2:11:06<8:16:18,  2.88s/it][A
Training...:  26% 3558/13907 [2:11:09<8:14:54,  2.87s/it][A
Training...:  26% 3559/13907 [2:11:12<8:08:09,  2.83s/it][A
Training...:  26% 3560/13907 [2:11:15<8:00:31,  2.79s/it][A
Training...:  26% 3561/13907 [2:11:17<7:53:45,  2.75s/it][A
Training...:  26% 3562/13907 [2:11:20<7:45:54,  2.70s/it][A
Training...:  26% 3563/13907 [2:11:23<7:40:14,  2.67s/it][A
Training...:  26% 3564/13907 [2:11:25<7:32:30,  2.63s/it][A
Training...:  26% 3565/13907 [2:11:28<7:30:26,  2.61s/it][A
Training...:  26% 3566/13907 [2:11:30<7:24:51,  2.58s/it][A
Training...:  26% 3567/13907 [2:11:33<7:19:09,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:53:47<26:06:17, 31325.86s/it]
Training...:  26% 3567/13907 [2:11:35<7:19:09,  2.55s/it][A
Training...:  26% 3568/13907 [2:11:35<7:32:23,  2.63s/it][A
Training...:  26% 3569/13907 [2:11:38<7:22:34,  2.57s/it][A
Training...:  26% 3570/13907 [2:11:40<7:09:04,  2.49s/it][A
Training...:  26% 3571/13907 [2:11:42<6:58:09,  2.43s/it][A
Training...:  26% 3572/13907 [2:11:45<6:47:55,  2.37s/it][A
Training...:  26% 3573/13907 [2:11:47<6:38:46,  2.32s/it][A
Training...:  26% 3574/13907 [2:11:49<6:32:06,  2.28s/it][A
Training...:  26% 3575/13907 [2:11:51<6:25:52,  2.24s/it][A
Training...:  26% 3576/13907 [2:11:53<6:20:16,  2.21s/it][A
Training...:  26% 3577/13907 [2:11:55<6:14:31,  2.18s/it][A
Training...:  26% 3578/13907 [2:11:58<6:08:10,  2.14s/it][A
Training...:  26% 3579/13907 [2:12:00<6:02:55,  2.11s/it][A
Training...:  26% 3580/13907 [2:12:02<5:56:46,  2.07s/it][A
Training...:  26% 3581/13907 [2:12:04<5:51:46,  2.04s/it][A
Training...:  26% 3582/13907 [2:12:06<5:47:45,  2.02s/it][A
Training...:  26% 3583/13907 [2:12:07<5:42:58,  1.99s/it][A
Training...:  26% 3584/13907 [2:12:09<5:37:19,  1.96s/it][A
Training...:  26% 3585/13907 [2:12:11<5:31:40,  1.93s/it][A
Training...:  26% 3586/13907 [2:12:13<5:25:46,  1.89s/it][A
Training...:  26% 3587/13907 [2:12:15<5:20:30,  1.86s/it][A
Training...:  26% 3588/13907 [2:12:17<5:14:44,  1.83s/it][A
Training...:  26% 3589/13907 [2:12:18<5:09:54,  1.80s/it][A
Training...:  26% 3590/13907 [2:12:20<5:04:41,  1.77s/it][A
Training...:  26% 3591/13907 [2:12:22<4:58:58,  1.74s/it][A
Training...:  26% 3592/13907 [2:12:23<4:52:48,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:54:36<26:06:17, 31325.86s/it]
Training...:  26% 3592/13907 [2:12:25<4:52:48,  1.70s/it][A
Training...:  26% 3593/13907 [2:12:25<5:02:45,  1.76s/it][A
Training...:  26% 3594/13907 [2:12:27<4:53:44,  1.71s/it][A
Training...:  26% 3595/13907 [2:12:28<4:41:44,  1.64s/it][A
Training...:  26% 3596/13907 [2:12:30<4:29:55,  1.57s/it][A
Training...:  26% 3597/13907 [2:12:31<4:20:04,  1.51s/it][A
Training...:  26% 3598/13907 [2:12:32<4:09:37,  1.45s/it][A
Training...:  26% 3599/13907 [2:12:34<3:59:23,  1.39s/it][A
Training...:  26% 3600/13907 [2:12:35<3:43:57,  1.30s/it][A
Training...:  26% 3601/13907 [2:12:39<5:54:45,  2.07s/it][A
Training...:  26% 3602/13907 [2:12:42<7:04:33,  2.47s/it][A
Training...:  26% 3603/13907 [2:12:45<7:44:15,  2.70s/it][A
Training...:  26% 3604/13907 [2:12:48<8:05:16,  2.83s/it][A
Training...:  26% 3605/13907 [2:12:51<8:15:53,  2.89s/it][A
Training...:  26% 3606/13907 [2:12:54<8:18:20,  2.90s/it][A
Training...:  26% 3607/13907 [2:12:57<8:17:30,  2.90s/it][A
Training...:  26% 3608/13907 [2:13:00<8:11:28,  2.86s/it][A
Training...:  26% 3609/13907 [2:13:03<8:04:56,  2.83s/it][A
Training...:  26% 3610/13907 [2:13:05<7:58:47,  2.79s/it][A
Training...:  26% 3611/13907 [2:13:08<7:50:17,  2.74s/it][A
Training...:  26% 3612/13907 [2:13:11<7:43:05,  2.70s/it][A
Training...:  26% 3613/13907 [2:13:13<7:38:16,  2.67s/it][A
Training...:  26% 3614/13907 [2:13:16<7:30:52,  2.63s/it][A
Training...:  26% 3615/13907 [2:13:18<7:26:59,  2.61s/it][A
Training...:  26% 3616/13907 [2:13:21<7:21:35,  2.57s/it][A
Training...:  26% 3617/13907 [2:13:23<7:15:35,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:55:37<26:06:17, 31325.86s/it]
Training...:  26% 3617/13907 [2:13:26<7:15:35,  2.54s/it][A
Training...:  26% 3618/13907 [2:13:26<7:30:44,  2.63s/it][A
Training...:  26% 3619/13907 [2:13:29<7:20:37,  2.57s/it][A
Training...:  26% 3620/13907 [2:13:31<7:09:40,  2.51s/it][A
Training...:  26% 3621/13907 [2:13:33<6:58:39,  2.44s/it][A
Training...:  26% 3622/13907 [2:13:35<6:51:20,  2.40s/it][A
Training...:  26% 3623/13907 [2:13:38<6:42:43,  2.35s/it][A
Training...:  26% 3624/13907 [2:13:40<6:35:52,  2.31s/it][A
Training...:  26% 3625/13907 [2:13:42<6:29:32,  2.27s/it][A
Training...:  26% 3626/13907 [2:13:44<6:21:25,  2.23s/it][A
Training...:  26% 3627/13907 [2:13:46<6:15:48,  2.19s/it][A
Training...:  26% 3628/13907 [2:13:48<6:09:23,  2.16s/it][A
Training...:  26% 3629/13907 [2:13:50<6:04:28,  2.13s/it][A
Training...:  26% 3630/13907 [2:13:52<5:59:07,  2.10s/it][A
Training...:  26% 3631/13907 [2:13:54<5:53:04,  2.06s/it][A
Training...:  26% 3632/13907 [2:13:56<5:49:48,  2.04s/it][A
Training...:  26% 3633/13907 [2:13:58<5:48:00,  2.03s/it][A
Training...:  26% 3634/13907 [2:14:00<5:41:43,  2.00s/it][A
Training...:  26% 3635/13907 [2:14:02<5:34:13,  1.95s/it][A
Training...:  26% 3636/13907 [2:14:04<5:26:58,  1.91s/it][A
Training...:  26% 3637/13907 [2:14:06<5:20:38,  1.87s/it][A
Training...:  26% 3638/13907 [2:14:08<5:14:49,  1.84s/it][A
Training...:  26% 3639/13907 [2:14:09<5:09:07,  1.81s/it][A
Training...:  26% 3640/13907 [2:14:11<5:01:49,  1.76s/it][A
Training...:  26% 3641/13907 [2:14:13<4:55:06,  1.72s/it][A
Training...:  26% 3642/13907 [2:14:14<4:49:35,  1.69s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:56:27<26:06:17, 31325.86s/it]
Training...:  26% 3642/13907 [2:14:16<4:49:35,  1.69s/it][A
Training...:  26% 3643/13907 [2:14:16<4:59:33,  1.75s/it][A
Training...:  26% 3644/13907 [2:14:18<4:51:31,  1.70s/it][A
Training...:  26% 3645/13907 [2:14:19<4:41:07,  1.64s/it][A
Training...:  26% 3646/13907 [2:14:21<4:31:03,  1.58s/it][A
Training...:  26% 3647/13907 [2:14:22<4:20:51,  1.53s/it][A
Training...:  26% 3648/13907 [2:14:23<4:11:42,  1.47s/it][A
Training...:  26% 3649/13907 [2:14:25<4:00:29,  1.41s/it][A
Training...:  26% 3650/13907 [2:14:26<3:42:21,  1.30s/it][A
Training...:  26% 3651/13907 [2:14:30<5:51:41,  2.06s/it][A
Training...:  26% 3652/13907 [2:14:33<7:04:28,  2.48s/it][A
Training...:  26% 3653/13907 [2:14:36<7:45:39,  2.72s/it][A
Training...:  26% 3654/13907 [2:14:39<8:06:39,  2.85s/it][A
Training...:  26% 3655/13907 [2:14:43<8:20:20,  2.93s/it][A
Training...:  26% 3656/13907 [2:14:46<8:23:16,  2.95s/it][A
Training...:  26% 3657/13907 [2:14:48<8:20:05,  2.93s/it][A
Training...:  26% 3658/13907 [2:14:51<8:13:44,  2.89s/it][A
Training...:  26% 3659/13907 [2:14:54<8:15:43,  2.90s/it][A
Training...:  26% 3660/13907 [2:14:57<8:06:21,  2.85s/it][A
Training...:  26% 3661/13907 [2:15:00<7:56:55,  2.79s/it][A
Training...:  26% 3662/13907 [2:15:02<7:47:58,  2.74s/it][A
Training...:  26% 3663/13907 [2:15:05<7:40:17,  2.70s/it][A
Training...:  26% 3664/13907 [2:15:07<7:32:16,  2.65s/it][A
Training...:  26% 3665/13907 [2:15:10<7:26:03,  2.61s/it][A
Training...:  26% 3666/13907 [2:15:12<7:21:05,  2.58s/it][A
Training...:  26% 3667/13907 [2:15:15<7:12:57,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:57:29<26:06:17, 31325.86s/it]
Training...:  26% 3667/13907 [2:15:18<7:12:57,  2.54s/it][A
Training...:  26% 3668/13907 [2:15:18<7:26:37,  2.62s/it][A
Training...:  26% 3669/13907 [2:15:20<7:19:52,  2.58s/it][A
Training...:  26% 3670/13907 [2:15:22<7:12:23,  2.53s/it][A
Training...:  26% 3671/13907 [2:15:25<7:01:04,  2.47s/it][A
Training...:  26% 3672/13907 [2:15:27<6:52:34,  2.42s/it][A
Training...:  26% 3673/13907 [2:15:29<6:43:02,  2.36s/it][A
Training...:  26% 3674/13907 [2:15:32<6:34:48,  2.31s/it][A
Training...:  26% 3675/13907 [2:15:34<6:26:27,  2.27s/it][A
Training...:  26% 3676/13907 [2:15:36<6:19:18,  2.22s/it][A
Training...:  26% 3677/13907 [2:15:38<6:12:27,  2.18s/it][A
Training...:  26% 3678/13907 [2:15:40<6:04:56,  2.14s/it][A
Training...:  26% 3679/13907 [2:15:42<5:59:30,  2.11s/it][A
Training...:  26% 3680/13907 [2:15:44<5:53:58,  2.08s/it][A
Training...:  26% 3681/13907 [2:15:46<5:50:01,  2.05s/it][A
Training...:  26% 3682/13907 [2:15:48<5:45:26,  2.03s/it][A
Training...:  26% 3683/13907 [2:15:50<5:39:42,  1.99s/it][A
Training...:  26% 3684/13907 [2:15:52<5:35:42,  1.97s/it][A
Training...:  26% 3685/13907 [2:15:54<5:30:23,  1.94s/it][A
Training...:  27% 3686/13907 [2:15:55<5:25:22,  1.91s/it][A
Training...:  27% 3687/13907 [2:15:57<5:20:41,  1.88s/it][A
Training...:  27% 3688/13907 [2:15:59<5:14:51,  1.85s/it][A
Training...:  27% 3689/13907 [2:16:01<5:08:58,  1.81s/it][A
Training...:  27% 3690/13907 [2:16:03<5:03:21,  1.78s/it][A
Training...:  27% 3691/13907 [2:16:04<4:57:36,  1.75s/it][A
Training...:  27% 3692/13907 [2:16:06<4:50:53,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:58:19<26:06:17, 31325.86s/it]
Training...:  27% 3692/13907 [2:16:08<4:50:53,  1.71s/it][A
Training...:  27% 3693/13907 [2:16:08<5:01:25,  1.77s/it][A
Training...:  27% 3694/13907 [2:16:09<4:52:41,  1.72s/it][A
Training...:  27% 3695/13907 [2:16:11<4:41:47,  1.66s/it][A
Training...:  27% 3696/13907 [2:16:12<4:29:59,  1.59s/it][A
Training...:  27% 3697/13907 [2:16:14<4:18:23,  1.52s/it][A
Training...:  27% 3698/13907 [2:16:15<4:06:58,  1.45s/it][A
Training...:  27% 3699/13907 [2:16:16<3:55:18,  1.38s/it][A
Training...:  27% 3700/13907 [2:16:17<3:38:09,  1.28s/it][A
Training...:  27% 3701/13907 [2:16:21<5:41:26,  2.01s/it][A
Training...:  27% 3702/13907 [2:16:24<6:56:08,  2.45s/it][A
Training...:  27% 3703/13907 [2:16:28<7:40:07,  2.71s/it][A
Training...:  27% 3704/13907 [2:16:31<8:00:45,  2.83s/it][A
Training...:  27% 3705/13907 [2:16:34<8:13:25,  2.90s/it][A
Training...:  27% 3706/13907 [2:16:37<8:17:11,  2.92s/it][A
Training...:  27% 3707/13907 [2:16:40<8:15:55,  2.92s/it][A
Training...:  27% 3708/13907 [2:16:43<8:10:31,  2.89s/it][A
Training...:  27% 3709/13907 [2:16:45<8:05:15,  2.86s/it][A
Training...:  27% 3710/13907 [2:16:48<7:58:16,  2.81s/it][A
Training...:  27% 3711/13907 [2:16:51<7:52:31,  2.78s/it][A
Training...:  27% 3712/13907 [2:16:53<7:44:24,  2.73s/it][A
Training...:  27% 3713/13907 [2:16:56<7:39:57,  2.71s/it][A
Training...:  27% 3714/13907 [2:16:59<7:34:48,  2.68s/it][A
Training...:  27% 3715/13907 [2:17:01<7:32:40,  2.66s/it][A
Training...:  27% 3716/13907 [2:17:04<7:23:01,  2.61s/it][A
Training...:  27% 3717/13907 [2:17:06<7:15:22,  2.56s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [10:59:20<26:06:17, 31325.86s/it]
Training...:  27% 3717/13907 [2:17:09<7:15:22,  2.56s/it][A
Training...:  27% 3718/13907 [2:17:09<7:28:20,  2.64s/it][A
Training...:  27% 3719/13907 [2:17:11<7:19:12,  2.59s/it][A
Training...:  27% 3720/13907 [2:17:14<7:07:14,  2.52s/it][A
Training...:  27% 3721/13907 [2:17:16<6:57:33,  2.46s/it][A
Training...:  27% 3722/13907 [2:17:18<6:49:31,  2.41s/it][A
Training...:  27% 3723/13907 [2:17:21<6:41:02,  2.36s/it][A
Training...:  27% 3724/13907 [2:17:23<6:33:03,  2.32s/it][A
Training...:  27% 3725/13907 [2:17:25<6:27:56,  2.29s/it][A
Training...:  27% 3726/13907 [2:17:27<6:19:39,  2.24s/it][A
Training...:  27% 3727/13907 [2:17:29<6:12:51,  2.20s/it][A
Training...:  27% 3728/13907 [2:17:31<6:06:06,  2.16s/it][A
Training...:  27% 3729/13907 [2:17:33<6:00:05,  2.12s/it][A
Training...:  27% 3730/13907 [2:17:35<5:54:22,  2.09s/it][A
Training...:  27% 3731/13907 [2:17:37<5:49:28,  2.06s/it][A
Training...:  27% 3732/13907 [2:17:39<5:44:41,  2.03s/it][A
Training...:  27% 3733/13907 [2:17:41<5:39:21,  2.00s/it][A
Training...:  27% 3734/13907 [2:17:43<5:34:12,  1.97s/it][A
Training...:  27% 3735/13907 [2:17:45<5:29:21,  1.94s/it][A
Training...:  27% 3736/13907 [2:17:47<5:24:46,  1.92s/it][A
Training...:  27% 3737/13907 [2:17:49<5:18:11,  1.88s/it][A
Training...:  27% 3738/13907 [2:17:51<5:11:31,  1.84s/it][A
Training...:  27% 3739/13907 [2:17:52<5:06:32,  1.81s/it][A
Training...:  27% 3740/13907 [2:17:54<5:00:54,  1.78s/it][A
Training...:  27% 3741/13907 [2:17:56<4:55:05,  1.74s/it][A
Training...:  27% 3742/13907 [2:17:57<4:49:59,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:00:10<26:06:17, 31325.86s/it]
Training...:  27% 3742/13907 [2:17:59<4:49:59,  1.71s/it][A
Training...:  27% 3743/13907 [2:17:59<4:59:22,  1.77s/it][A
Training...:  27% 3744/13907 [2:18:01<4:50:01,  1.71s/it][A
Training...:  27% 3745/13907 [2:18:02<4:38:31,  1.64s/it][A
Training...:  27% 3746/13907 [2:18:04<4:26:59,  1.58s/it][A
Training...:  27% 3747/13907 [2:18:05<4:16:01,  1.51s/it][A
Training...:  27% 3748/13907 [2:18:06<4:06:52,  1.46s/it][A
Training...:  27% 3749/13907 [2:18:08<3:54:18,  1.38s/it][A
Training...:  27% 3750/13907 [2:18:09<3:36:41,  1.28s/it][A
Training...:  27% 3751/13907 [2:18:12<5:40:06,  2.01s/it][A
Training...:  27% 3752/13907 [2:18:16<6:49:58,  2.42s/it][A
Training...:  27% 3753/13907 [2:18:19<7:29:27,  2.66s/it][A
Training...:  27% 3754/13907 [2:18:22<7:50:04,  2.78s/it][A
Training...:  27% 3755/13907 [2:18:25<8:00:23,  2.84s/it][A
Training...:  27% 3756/13907 [2:18:28<8:03:57,  2.86s/it][A
Training...:  27% 3757/13907 [2:18:31<8:09:28,  2.89s/it][A
Training...:  27% 3758/13907 [2:18:34<8:06:23,  2.88s/it][A
Training...:  27% 3759/13907 [2:18:36<8:00:21,  2.84s/it][A
Training...:  27% 3760/13907 [2:18:39<7:53:00,  2.80s/it][A
Training...:  27% 3761/13907 [2:18:42<7:47:17,  2.76s/it][A
Training...:  27% 3762/13907 [2:18:44<7:38:08,  2.71s/it][A
Training...:  27% 3763/13907 [2:18:47<7:31:42,  2.67s/it][A
Training...:  27% 3764/13907 [2:18:49<7:23:37,  2.62s/it][A
Training...:  27% 3765/13907 [2:18:52<7:17:47,  2.59s/it][A
Training...:  27% 3766/13907 [2:18:54<7:10:52,  2.55s/it][A
Training...:  27% 3767/13907 [2:18:57<7:05:04,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:01:11<26:06:17, 31325.86s/it]
Training...:  27% 3767/13907 [2:19:00<7:05:04,  2.52s/it][A
Training...:  27% 3768/13907 [2:19:00<7:21:55,  2.62s/it][A
Training...:  27% 3769/13907 [2:19:02<7:13:37,  2.57s/it][A
Training...:  27% 3770/13907 [2:19:05<7:01:31,  2.50s/it][A
Training...:  27% 3771/13907 [2:19:07<6:51:53,  2.44s/it][A
Training...:  27% 3772/13907 [2:19:09<6:42:00,  2.38s/it][A
Training...:  27% 3773/13907 [2:19:11<6:34:03,  2.33s/it][A
Training...:  27% 3774/13907 [2:19:13<6:26:31,  2.29s/it][A
Training...:  27% 3775/13907 [2:19:16<6:20:54,  2.26s/it][A
Training...:  27% 3776/13907 [2:19:18<6:13:39,  2.21s/it][A
Training...:  27% 3777/13907 [2:19:20<6:08:14,  2.18s/it][A
Training...:  27% 3778/13907 [2:19:22<6:03:25,  2.15s/it][A
Training...:  27% 3779/13907 [2:19:24<5:58:12,  2.12s/it][A
Training...:  27% 3780/13907 [2:19:26<5:53:26,  2.09s/it][A
Training...:  27% 3781/13907 [2:19:28<5:50:39,  2.08s/it][A
Training...:  27% 3782/13907 [2:19:30<5:45:47,  2.05s/it][A
Training...:  27% 3783/13907 [2:19:32<5:40:29,  2.02s/it][A
Training...:  27% 3784/13907 [2:19:34<5:35:31,  1.99s/it][A
Training...:  27% 3785/13907 [2:19:36<5:30:17,  1.96s/it][A
Training...:  27% 3786/13907 [2:19:38<5:24:04,  1.92s/it][A
Training...:  27% 3787/13907 [2:19:39<5:19:11,  1.89s/it][A
Training...:  27% 3788/13907 [2:19:41<5:14:23,  1.86s/it][A
Training...:  27% 3789/13907 [2:19:43<5:08:55,  1.83s/it][A
Training...:  27% 3790/13907 [2:19:45<5:03:31,  1.80s/it][A
Training...:  27% 3791/13907 [2:19:46<4:58:27,  1.77s/it][A
Training...:  27% 3792/13907 [2:19:48<4:53:32,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:02:01<26:06:17, 31325.86s/it]
Training...:  27% 3792/13907 [2:19:50<4:53:32,  1.74s/it][A
Training...:  27% 3793/13907 [2:19:50<5:04:13,  1.80s/it][A
Training...:  27% 3794/13907 [2:19:52<4:56:32,  1.76s/it][A
Training...:  27% 3795/13907 [2:19:53<4:46:23,  1.70s/it][A
Training...:  27% 3796/13907 [2:19:55<4:34:17,  1.63s/it][A
Training...:  27% 3797/13907 [2:19:56<4:22:40,  1.56s/it][A
Training...:  27% 3798/13907 [2:19:57<4:11:51,  1.49s/it][A
Training...:  27% 3799/13907 [2:19:59<3:59:19,  1.42s/it][A
Training...:  27% 3800/13907 [2:20:00<3:41:33,  1.32s/it][A
Training...:  27% 3801/13907 [2:20:04<5:47:44,  2.06s/it][A
Training...:  27% 3802/13907 [2:20:07<6:59:46,  2.49s/it][A
Training...:  27% 3803/13907 [2:20:10<7:37:21,  2.72s/it][A
Training...:  27% 3804/13907 [2:20:13<7:57:17,  2.83s/it][A
Training...:  27% 3805/13907 [2:20:16<8:07:28,  2.90s/it][A
Training...:  27% 3806/13907 [2:20:19<8:09:31,  2.91s/it][A
Training...:  27% 3807/13907 [2:20:22<8:10:03,  2.91s/it][A
Training...:  27% 3808/13907 [2:20:25<8:08:41,  2.90s/it][A
Training...:  27% 3809/13907 [2:20:28<8:01:12,  2.86s/it][A
Training...:  27% 3810/13907 [2:20:31<7:53:10,  2.81s/it][A
Training...:  27% 3811/13907 [2:20:33<7:47:02,  2.78s/it][A
Training...:  27% 3812/13907 [2:20:36<7:38:30,  2.73s/it][A
Training...:  27% 3813/13907 [2:20:39<7:30:30,  2.68s/it][A
Training...:  27% 3814/13907 [2:20:41<7:22:46,  2.63s/it][A
Training...:  27% 3815/13907 [2:20:44<7:16:03,  2.59s/it][A
Training...:  27% 3816/13907 [2:20:46<7:10:30,  2.56s/it][A
Training...:  27% 3817/13907 [2:20:48<7:03:00,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:03:02<26:06:17, 31325.86s/it]
Training...:  27% 3817/13907 [2:20:51<7:03:00,  2.52s/it][A
Training...:  27% 3818/13907 [2:20:51<7:17:35,  2.60s/it][A
Training...:  27% 3819/13907 [2:20:54<7:09:06,  2.55s/it][A
Training...:  27% 3820/13907 [2:20:56<6:57:37,  2.48s/it][A
Training...:  27% 3821/13907 [2:20:58<6:48:25,  2.43s/it][A
Training...:  27% 3822/13907 [2:21:01<6:39:38,  2.38s/it][A
Training...:  27% 3823/13907 [2:21:03<6:32:05,  2.33s/it][A
Training...:  27% 3824/13907 [2:21:05<6:25:29,  2.29s/it][A
Training...:  28% 3825/13907 [2:21:07<6:19:39,  2.26s/it][A
Training...:  28% 3826/13907 [2:21:09<6:13:43,  2.22s/it][A
Training...:  28% 3827/13907 [2:21:11<6:07:14,  2.19s/it][A
Training...:  28% 3828/13907 [2:21:14<6:01:31,  2.15s/it][A
Training...:  28% 3829/13907 [2:21:16<5:57:55,  2.13s/it][A
Training...:  28% 3830/13907 [2:21:18<5:51:27,  2.09s/it][A
Training...:  28% 3831/13907 [2:21:20<5:46:00,  2.06s/it][A
Training...:  28% 3832/13907 [2:21:22<5:41:21,  2.03s/it][A
Training...:  28% 3833/13907 [2:21:24<5:37:11,  2.01s/it][A
Training...:  28% 3834/13907 [2:21:25<5:32:43,  1.98s/it][A
Training...:  28% 3835/13907 [2:21:27<5:27:51,  1.95s/it][A
Training...:  28% 3836/13907 [2:21:29<5:22:56,  1.92s/it][A
Training...:  28% 3837/13907 [2:21:31<5:17:48,  1.89s/it][A
Training...:  28% 3838/13907 [2:21:33<5:12:10,  1.86s/it][A
Training...:  28% 3839/13907 [2:21:35<5:07:16,  1.83s/it][A
Training...:  28% 3840/13907 [2:21:36<5:01:28,  1.80s/it][A
Training...:  28% 3841/13907 [2:21:38<4:56:18,  1.77s/it][A
Training...:  28% 3842/13907 [2:21:40<4:50:13,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:03:53<26:06:17, 31325.86s/it]
Training...:  28% 3842/13907 [2:21:42<4:50:13,  1.73s/it][A
Training...:  28% 3843/13907 [2:21:42<5:00:18,  1.79s/it][A
Training...:  28% 3844/13907 [2:21:43<4:51:34,  1.74s/it][A
Training...:  28% 3845/13907 [2:21:45<4:41:22,  1.68s/it][A
Training...:  28% 3846/13907 [2:21:46<4:30:57,  1.62s/it][A
Training...:  28% 3847/13907 [2:21:48<4:20:18,  1.55s/it][A
Training...:  28% 3848/13907 [2:21:49<4:09:16,  1.49s/it][A
Training...:  28% 3849/13907 [2:21:50<3:56:30,  1.41s/it][A
Training...:  28% 3850/13907 [2:21:51<3:38:02,  1.30s/it][A
Training...:  28% 3851/13907 [2:21:55<5:36:58,  2.01s/it][A
Training...:  28% 3852/13907 [2:21:58<6:44:27,  2.41s/it][A
Training...:  28% 3853/13907 [2:22:01<7:23:47,  2.65s/it][A
Training...:  28% 3854/13907 [2:22:04<7:46:07,  2.78s/it][A
Training...:  28% 3855/13907 [2:22:08<7:58:18,  2.86s/it][A
Training...:  28% 3856/13907 [2:22:10<8:01:14,  2.87s/it][A
Training...:  28% 3857/13907 [2:22:13<8:01:31,  2.87s/it][A
Training...:  28% 3858/13907 [2:22:16<7:58:27,  2.86s/it][A
Training...:  28% 3859/13907 [2:22:19<7:54:18,  2.83s/it][A
Training...:  28% 3860/13907 [2:22:22<7:48:35,  2.80s/it][A
Training...:  28% 3861/13907 [2:22:24<7:40:13,  2.75s/it][A
Training...:  28% 3862/13907 [2:22:27<7:31:56,  2.70s/it][A
Training...:  28% 3863/13907 [2:22:29<7:25:13,  2.66s/it][A
Training...:  28% 3864/13907 [2:22:32<7:19:09,  2.62s/it][A
Training...:  28% 3865/13907 [2:22:34<7:13:05,  2.59s/it][A
Training...:  28% 3866/13907 [2:22:37<7:07:01,  2.55s/it][A
Training...:  28% 3867/13907 [2:22:39<7:01:23,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:04:53<26:06:17, 31325.86s/it]
Training...:  28% 3867/13907 [2:22:42<7:01:23,  2.52s/it][A
Training...:  28% 3868/13907 [2:22:42<7:15:01,  2.60s/it][A
Training...:  28% 3869/13907 [2:22:45<7:07:11,  2.55s/it][A
Training...:  28% 3870/13907 [2:22:47<6:56:07,  2.49s/it][A
Training...:  28% 3871/13907 [2:22:49<6:47:17,  2.44s/it][A
Training...:  28% 3872/13907 [2:22:51<6:38:11,  2.38s/it][A
Training...:  28% 3873/13907 [2:22:54<6:30:17,  2.33s/it][A
Training...:  28% 3874/13907 [2:22:56<6:25:30,  2.31s/it][A
Training...:  28% 3875/13907 [2:22:58<6:19:31,  2.27s/it][A
Training...:  28% 3876/13907 [2:23:00<6:15:17,  2.24s/it][A
Training...:  28% 3877/13907 [2:23:02<6:08:04,  2.20s/it][A
Training...:  28% 3878/13907 [2:23:05<6:02:01,  2.17s/it][A
Training...:  28% 3879/13907 [2:23:07<5:57:16,  2.14s/it][A
Training...:  28% 3880/13907 [2:23:09<5:51:23,  2.10s/it][A
Training...:  28% 3881/13907 [2:23:11<5:45:06,  2.07s/it][A
Training...:  28% 3882/13907 [2:23:13<5:38:29,  2.03s/it][A
Training...:  28% 3883/13907 [2:23:14<5:33:58,  2.00s/it][A
Training...:  28% 3884/13907 [2:23:16<5:28:39,  1.97s/it][A
Training...:  28% 3885/13907 [2:23:18<5:23:48,  1.94s/it][A
Training...:  28% 3886/13907 [2:23:20<5:18:31,  1.91s/it][A
Training...:  28% 3887/13907 [2:23:22<5:13:05,  1.87s/it][A
Training...:  28% 3888/13907 [2:23:24<5:07:53,  1.84s/it][A
Training...:  28% 3889/13907 [2:23:25<5:02:37,  1.81s/it][A
Training...:  28% 3890/13907 [2:23:27<4:56:36,  1.78s/it][A
Training...:  28% 3891/13907 [2:23:29<4:51:27,  1.75s/it][A
Training...:  28% 3892/13907 [2:23:30<4:45:48,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:05:43<26:06:17, 31325.86s/it]
Training...:  28% 3892/13907 [2:23:32<4:45:48,  1.71s/it][A
Training...:  28% 3893/13907 [2:23:32<4:54:56,  1.77s/it][A
Training...:  28% 3894/13907 [2:23:34<4:45:50,  1.71s/it][A
Training...:  28% 3895/13907 [2:23:35<4:36:56,  1.66s/it][A
Training...:  28% 3896/13907 [2:23:37<4:27:49,  1.61s/it][A
Training...:  28% 3897/13907 [2:23:38<4:16:21,  1.54s/it][A
Training...:  28% 3898/13907 [2:23:40<4:03:43,  1.46s/it][A
Training...:  28% 3899/13907 [2:23:41<3:51:16,  1.39s/it][A
Training...:  28% 3900/13907 [2:23:42<3:32:30,  1.27s/it][A
Training...:  28% 3901/13907 [2:23:45<5:31:28,  1.99s/it][A
Training...:  28% 3902/13907 [2:23:49<6:43:13,  2.42s/it][A
Training...:  28% 3903/13907 [2:23:52<7:24:26,  2.67s/it][A
Training...:  28% 3904/13907 [2:23:55<7:45:12,  2.79s/it][A
Training...:  28% 3905/13907 [2:23:58<7:56:55,  2.86s/it][A
Training...:  28% 3906/13907 [2:24:01<8:02:03,  2.89s/it][A
Training...:  28% 3907/13907 [2:24:04<8:03:47,  2.90s/it][A
Training...:  28% 3908/13907 [2:24:07<8:01:36,  2.89s/it][A
Training...:  28% 3909/13907 [2:24:10<7:57:45,  2.87s/it][A
Training...:  28% 3910/13907 [2:24:12<7:47:55,  2.81s/it][A
Training...:  28% 3911/13907 [2:24:15<7:41:03,  2.77s/it][A
Training...:  28% 3912/13907 [2:24:18<7:33:20,  2.72s/it][A
Training...:  28% 3913/13907 [2:24:20<7:27:35,  2.69s/it][A
Training...:  28% 3914/13907 [2:24:23<7:20:53,  2.65s/it][A
Training...:  28% 3915/13907 [2:24:25<7:15:41,  2.62s/it][A
Training...:  28% 3916/13907 [2:24:28<7:07:57,  2.57s/it][A
Training...:  28% 3917/13907 [2:24:30<7:01:36,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:06:44<26:06:17, 31325.86s/it]
Training...:  28% 3917/13907 [2:24:33<7:01:36,  2.53s/it][A
Training...:  28% 3918/13907 [2:24:33<7:16:34,  2.62s/it][A
Training...:  28% 3919/13907 [2:24:36<7:07:21,  2.57s/it][A
Training...:  28% 3920/13907 [2:24:38<6:55:43,  2.50s/it][A
Training...:  28% 3921/13907 [2:24:40<6:50:33,  2.47s/it][A
Training...:  28% 3922/13907 [2:24:43<6:43:11,  2.42s/it][A
Training...:  28% 3923/13907 [2:24:45<6:34:23,  2.37s/it][A
Training...:  28% 3924/13907 [2:24:47<6:26:24,  2.32s/it][A
Training...:  28% 3925/13907 [2:24:49<6:17:58,  2.27s/it][A
Training...:  28% 3926/13907 [2:24:51<6:10:30,  2.23s/it][A
Training...:  28% 3927/13907 [2:24:53<6:03:55,  2.19s/it][A
Training...:  28% 3928/13907 [2:24:56<5:58:06,  2.15s/it][A
Training...:  28% 3929/13907 [2:24:58<5:52:24,  2.12s/it][A
Training...:  28% 3930/13907 [2:25:00<5:46:57,  2.09s/it][A
Training...:  28% 3931/13907 [2:25:02<5:42:15,  2.06s/it][A
Training...:  28% 3932/13907 [2:25:04<5:36:32,  2.02s/it][A
Training...:  28% 3933/13907 [2:25:05<5:32:25,  2.00s/it][A
Training...:  28% 3934/13907 [2:25:07<5:26:53,  1.97s/it][A
Training...:  28% 3935/13907 [2:25:09<5:22:35,  1.94s/it][A
Training...:  28% 3936/13907 [2:25:11<5:17:01,  1.91s/it][A
Training...:  28% 3937/13907 [2:25:13<5:11:22,  1.87s/it][A
Training...:  28% 3938/13907 [2:25:15<5:04:43,  1.83s/it][A
Training...:  28% 3939/13907 [2:25:16<4:59:02,  1.80s/it][A
Training...:  28% 3940/13907 [2:25:18<4:52:48,  1.76s/it][A
Training...:  28% 3941/13907 [2:25:20<4:47:15,  1.73s/it][A
Training...:  28% 3942/13907 [2:25:21<4:41:40,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:07:34<26:06:17, 31325.86s/it]
Training...:  28% 3942/13907 [2:25:23<4:41:40,  1.70s/it][A
Training...:  28% 3943/13907 [2:25:23<4:51:10,  1.75s/it][A
Training...:  28% 3944/13907 [2:25:25<4:43:35,  1.71s/it][A
Training...:  28% 3945/13907 [2:25:26<4:33:11,  1.65s/it][A
Training...:  28% 3946/13907 [2:25:28<4:23:23,  1.59s/it][A
Training...:  28% 3947/13907 [2:25:29<4:12:53,  1.52s/it][A
Training...:  28% 3948/13907 [2:25:30<4:02:10,  1.46s/it][A
Training...:  28% 3949/13907 [2:25:32<3:50:02,  1.39s/it][A
Training...:  28% 3950/13907 [2:25:33<3:33:40,  1.29s/it][A
Training...:  28% 3951/13907 [2:25:36<5:33:35,  2.01s/it][A
Training...:  28% 3952/13907 [2:25:40<6:44:37,  2.44s/it][A
Training...:  28% 3953/13907 [2:25:43<7:22:07,  2.66s/it][A
Training...:  28% 3954/13907 [2:25:46<7:42:05,  2.79s/it][A
Training...:  28% 3955/13907 [2:25:49<7:52:01,  2.85s/it][A
Training...:  28% 3956/13907 [2:25:52<7:54:15,  2.86s/it][A
Training...:  28% 3957/13907 [2:25:55<7:52:56,  2.85s/it][A
Training...:  28% 3958/13907 [2:25:58<7:48:17,  2.82s/it][A
Training...:  28% 3959/13907 [2:26:00<7:44:03,  2.80s/it][A
Training...:  28% 3960/13907 [2:26:03<7:37:08,  2.76s/it][A
Training...:  28% 3961/13907 [2:26:06<7:30:26,  2.72s/it][A
Training...:  28% 3962/13907 [2:26:08<7:23:18,  2.67s/it][A
Training...:  28% 3963/13907 [2:26:11<7:16:36,  2.63s/it][A
Training...:  29% 3964/13907 [2:26:13<7:08:11,  2.58s/it][A
Training...:  29% 3965/13907 [2:26:16<7:02:17,  2.55s/it][A
Training...:  29% 3966/13907 [2:26:18<6:57:21,  2.52s/it][A
Training...:  29% 3967/13907 [2:26:20<6:51:56,  2.49s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:08:34<26:06:17, 31325.86s/it]
Training...:  29% 3967/13907 [2:26:23<6:51:56,  2.49s/it][A
Training...:  29% 3968/13907 [2:26:23<7:07:52,  2.58s/it][A
Training...:  29% 3969/13907 [2:26:26<6:58:29,  2.53s/it][A
Training...:  29% 3970/13907 [2:26:28<6:51:46,  2.49s/it][A
Training...:  29% 3971/13907 [2:26:30<6:42:16,  2.43s/it][A
Training...:  29% 3972/13907 [2:26:33<6:33:23,  2.38s/it][A
Training...:  29% 3973/13907 [2:26:35<6:25:30,  2.33s/it][A
Training...:  29% 3974/13907 [2:26:37<6:18:54,  2.29s/it][A
Training...:  29% 3975/13907 [2:26:39<6:12:57,  2.25s/it][A
Training...:  29% 3976/13907 [2:26:41<6:05:44,  2.21s/it][A
Training...:  29% 3977/13907 [2:26:43<6:00:09,  2.18s/it][A
Training...:  29% 3978/13907 [2:26:45<5:54:30,  2.14s/it][A
Training...:  29% 3979/13907 [2:26:47<5:49:31,  2.11s/it][A
Training...:  29% 3980/13907 [2:26:50<5:46:11,  2.09s/it][A
Training...:  29% 3981/13907 [2:26:52<5:40:13,  2.06s/it][A
Training...:  29% 3982/13907 [2:26:53<5:35:13,  2.03s/it][A
Training...:  29% 3983/13907 [2:26:55<5:31:18,  2.00s/it][A
Training...:  29% 3984/13907 [2:26:57<5:24:37,  1.96s/it][A
Training...:  29% 3985/13907 [2:26:59<5:18:39,  1.93s/it][A
Training...:  29% 3986/13907 [2:27:01<5:12:05,  1.89s/it][A
Training...:  29% 3987/13907 [2:27:03<5:06:52,  1.86s/it][A
Training...:  29% 3988/13907 [2:27:04<5:02:46,  1.83s/it][A
Training...:  29% 3989/13907 [2:27:06<4:57:19,  1.80s/it][A
Training...:  29% 3990/13907 [2:27:08<4:50:46,  1.76s/it][A
Training...:  29% 3991/13907 [2:27:10<4:45:48,  1.73s/it][A
Training...:  29% 3992/13907 [2:27:11<4:40:13,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:09:24<26:06:17, 31325.86s/it]
Training...:  29% 3992/13907 [2:27:13<4:40:13,  1.70s/it][A
Training...:  29% 3993/13907 [2:27:13<4:50:12,  1.76s/it][A
Training...:  29% 3994/13907 [2:27:15<4:42:42,  1.71s/it][A
Training...:  29% 3995/13907 [2:27:16<4:32:15,  1.65s/it][A
Training...:  29% 3996/13907 [2:27:18<4:22:17,  1.59s/it][A
Training...:  29% 3997/13907 [2:27:19<4:13:34,  1.54s/it][A
Training...:  29% 3998/13907 [2:27:20<4:01:47,  1.46s/it][A
Training...:  29% 3999/13907 [2:27:22<3:49:30,  1.39s/it][A
Training...:  29% 4000/13907 [2:27:23<3:33:45,  1.29s/it][A
Training...:  29% 4001/13907 [2:27:26<5:38:37,  2.05s/it][A
Training...:  29% 4002/13907 [2:27:30<6:46:55,  2.46s/it][A
Training...:  29% 4003/13907 [2:27:33<7:25:59,  2.70s/it][A
Training...:  29% 4004/13907 [2:27:36<7:47:28,  2.83s/it][A
Training...:  29% 4005/13907 [2:27:39<8:01:57,  2.92s/it][A
Training...:  29% 4006/13907 [2:27:42<8:10:01,  2.97s/it][A
Training...:  29% 4007/13907 [2:27:45<8:08:59,  2.96s/it][A
Training...:  29% 4008/13907 [2:27:48<8:02:36,  2.93s/it][A
Training...:  29% 4009/13907 [2:27:51<7:56:18,  2.89s/it][A
Training...:  29% 4010/13907 [2:27:54<7:47:46,  2.84s/it][A
Training...:  29% 4011/13907 [2:27:56<7:40:25,  2.79s/it][A
Training...:  29% 4012/13907 [2:27:59<7:31:43,  2.74s/it][A
Training...:  29% 4013/13907 [2:28:02<7:25:08,  2.70s/it][A
Training...:  29% 4014/13907 [2:28:04<7:18:31,  2.66s/it][A
Training...:  29% 4015/13907 [2:28:07<7:12:41,  2.62s/it][A
Training...:  29% 4016/13907 [2:28:09<7:06:36,  2.59s/it][A
Training...:  29% 4017/13907 [2:28:12<7:00:39,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:10:26<26:06:17, 31325.86s/it]
Training...:  29% 4017/13907 [2:28:15<7:00:39,  2.55s/it][A
Training...:  29% 4018/13907 [2:28:15<7:14:00,  2.63s/it][A
Training...:  29% 4019/13907 [2:28:17<7:05:41,  2.58s/it][A
Training...:  29% 4020/13907 [2:28:19<6:53:03,  2.51s/it][A
Training...:  29% 4021/13907 [2:28:22<6:43:11,  2.45s/it][A
Training...:  29% 4022/13907 [2:28:24<6:35:18,  2.40s/it][A
Training...:  29% 4023/13907 [2:28:26<6:26:36,  2.35s/it][A
Training...:  29% 4024/13907 [2:28:28<6:18:56,  2.30s/it][A
Training...:  29% 4025/13907 [2:28:31<6:12:42,  2.26s/it][A
Training...:  29% 4026/13907 [2:28:33<6:05:24,  2.22s/it][A
Training...:  29% 4027/13907 [2:28:35<6:00:10,  2.19s/it][A
Training...:  29% 4028/13907 [2:28:37<5:54:15,  2.15s/it][A
Training...:  29% 4029/13907 [2:28:39<5:48:32,  2.12s/it][A
Training...:  29% 4030/13907 [2:28:41<5:43:55,  2.09s/it][A
Training...:  29% 4031/13907 [2:28:43<5:39:59,  2.07s/it][A
Training...:  29% 4032/13907 [2:28:45<5:36:19,  2.04s/it][A
Training...:  29% 4033/13907 [2:28:47<5:31:25,  2.01s/it][A
Training...:  29% 4034/13907 [2:28:49<5:25:48,  1.98s/it][A
Training...:  29% 4035/13907 [2:28:51<5:21:21,  1.95s/it][A
Training...:  29% 4036/13907 [2:28:53<5:17:54,  1.93s/it][A
Training...:  29% 4037/13907 [2:28:54<5:12:55,  1.90s/it][A
Training...:  29% 4038/13907 [2:28:56<5:06:55,  1.87s/it][A
Training...:  29% 4039/13907 [2:28:58<5:03:41,  1.85s/it][A
Training...:  29% 4040/13907 [2:29:00<4:59:08,  1.82s/it][A
Training...:  29% 4041/13907 [2:29:01<4:53:12,  1.78s/it][A
Training...:  29% 4042/13907 [2:29:03<4:46:18,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:11:16<26:06:17, 31325.86s/it]
Training...:  29% 4042/13907 [2:29:05<4:46:18,  1.74s/it][A
Training...:  29% 4043/13907 [2:29:05<4:54:58,  1.79s/it][A
Training...:  29% 4044/13907 [2:29:07<4:46:36,  1.74s/it][A
Training...:  29% 4045/13907 [2:29:08<4:37:20,  1.69s/it][A
Training...:  29% 4046/13907 [2:29:10<4:25:59,  1.62s/it][A
Training...:  29% 4047/13907 [2:29:11<4:15:30,  1.55s/it][A
Training...:  29% 4048/13907 [2:29:12<4:03:52,  1.48s/it][A
Training...:  29% 4049/13907 [2:29:14<3:51:32,  1.41s/it][A
Training...:  29% 4050/13907 [2:29:15<3:34:13,  1.30s/it][A
Training...:  29% 4051/13907 [2:29:18<5:31:51,  2.02s/it][A
Training...:  29% 4052/13907 [2:29:22<6:43:49,  2.46s/it][A
Training...:  29% 4053/13907 [2:29:25<7:23:49,  2.70s/it][A
Training...:  29% 4054/13907 [2:29:28<7:44:52,  2.83s/it][A
Training...:  29% 4055/13907 [2:29:31<7:55:41,  2.90s/it][A
Training...:  29% 4056/13907 [2:29:34<7:56:55,  2.90s/it][A
Training...:  29% 4057/13907 [2:29:37<7:55:24,  2.90s/it][A
Training...:  29% 4058/13907 [2:29:40<7:50:10,  2.86s/it][A
Training...:  29% 4059/13907 [2:29:43<7:44:36,  2.83s/it][A
Training...:  29% 4060/13907 [2:29:45<7:37:00,  2.78s/it][A
Training...:  29% 4061/13907 [2:29:48<7:30:05,  2.74s/it][A
Training...:  29% 4062/13907 [2:29:50<7:22:56,  2.70s/it][A
Training...:  29% 4063/13907 [2:29:53<7:16:59,  2.66s/it][A
Training...:  29% 4064/13907 [2:29:56<7:09:41,  2.62s/it][A
Training...:  29% 4065/13907 [2:29:58<7:02:03,  2.57s/it][A
Training...:  29% 4066/13907 [2:30:00<6:54:52,  2.53s/it][A
Training...:  29% 4067/13907 [2:30:03<6:51:01,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:12:17<26:06:17, 31325.86s/it]
Training...:  29% 4067/13907 [2:30:06<6:51:01,  2.51s/it][A
Training...:  29% 4068/13907 [2:30:06<7:04:03,  2.59s/it][A
Training...:  29% 4069/13907 [2:30:08<6:56:13,  2.54s/it][A
Training...:  29% 4070/13907 [2:30:10<6:45:06,  2.47s/it][A
Training...:  29% 4071/13907 [2:30:13<6:34:57,  2.41s/it][A
Training...:  29% 4072/13907 [2:30:15<6:28:16,  2.37s/it][A
Training...:  29% 4073/13907 [2:30:17<6:20:45,  2.32s/it][A
Training...:  29% 4074/13907 [2:30:19<6:13:51,  2.28s/it][A
Training...:  29% 4075/13907 [2:30:22<6:07:25,  2.24s/it][A
Training...:  29% 4076/13907 [2:30:24<6:02:45,  2.21s/it][A
Training...:  29% 4077/13907 [2:30:26<5:57:17,  2.18s/it][A
Training...:  29% 4078/13907 [2:30:28<5:51:03,  2.14s/it][A
Training...:  29% 4079/13907 [2:30:30<5:46:01,  2.11s/it][A
Training...:  29% 4080/13907 [2:30:32<5:43:09,  2.10s/it][A
Training...:  29% 4081/13907 [2:30:34<5:38:48,  2.07s/it][A
Training...:  29% 4082/13907 [2:30:36<5:33:51,  2.04s/it][A
Training...:  29% 4083/13907 [2:30:38<5:29:11,  2.01s/it][A
Training...:  29% 4084/13907 [2:30:40<5:23:10,  1.97s/it][A
Training...:  29% 4085/13907 [2:30:42<5:17:44,  1.94s/it][A
Training...:  29% 4086/13907 [2:30:43<5:12:23,  1.91s/it][A
Training...:  29% 4087/13907 [2:30:45<5:07:40,  1.88s/it][A
Training...:  29% 4088/13907 [2:30:47<5:02:26,  1.85s/it][A
Training...:  29% 4089/13907 [2:30:49<4:57:21,  1.82s/it][A
Training...:  29% 4090/13907 [2:30:50<4:51:28,  1.78s/it][A
Training...:  29% 4091/13907 [2:30:52<4:46:00,  1.75s/it][A
Training...:  29% 4092/13907 [2:30:54<4:40:06,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:13:07<26:06:17, 31325.86s/it]
Training...:  29% 4092/13907 [2:30:56<4:40:06,  1.71s/it][A
Training...:  29% 4093/13907 [2:30:56<4:49:33,  1.77s/it][A
Training...:  29% 4094/13907 [2:30:57<4:41:40,  1.72s/it][A
Training...:  29% 4095/13907 [2:30:59<4:30:34,  1.65s/it][A
Training...:  29% 4096/13907 [2:31:00<4:20:39,  1.59s/it][A
Training...:  29% 4097/13907 [2:31:02<4:10:39,  1.53s/it][A
Training...:  29% 4098/13907 [2:31:03<4:00:48,  1.47s/it][A
Training...:  29% 4099/13907 [2:31:04<3:50:09,  1.41s/it][A
Training...:  29% 4100/13907 [2:31:05<3:33:09,  1.30s/it][A
Training...:  29% 4101/13907 [2:31:09<5:30:02,  2.02s/it][A
Training...:  29% 4102/13907 [2:31:12<6:39:48,  2.45s/it][A
Training...:  30% 4103/13907 [2:31:16<7:17:14,  2.68s/it][A
Training...:  30% 4104/13907 [2:31:19<7:38:57,  2.81s/it][A
Training...:  30% 4105/13907 [2:31:22<7:47:55,  2.86s/it][A
Training...:  30% 4106/13907 [2:31:25<7:51:22,  2.89s/it][A
Training...:  30% 4107/13907 [2:31:28<7:51:00,  2.88s/it][A
Training...:  30% 4108/13907 [2:31:30<7:46:46,  2.86s/it][A
Training...:  30% 4109/13907 [2:31:33<7:44:20,  2.84s/it][A
Training...:  30% 4110/13907 [2:31:36<7:37:21,  2.80s/it][A
Training...:  30% 4111/13907 [2:31:39<7:31:31,  2.77s/it][A
Training...:  30% 4112/13907 [2:31:41<7:26:09,  2.73s/it][A
Training...:  30% 4113/13907 [2:31:44<7:17:37,  2.68s/it][A
Training...:  30% 4114/13907 [2:31:46<7:09:12,  2.63s/it][A
Training...:  30% 4115/13907 [2:31:49<7:04:01,  2.60s/it][A
Training...:  30% 4116/13907 [2:31:51<6:58:24,  2.56s/it][A
Training...:  30% 4117/13907 [2:31:54<6:53:26,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:14:08<26:06:17, 31325.86s/it]
Training...:  30% 4117/13907 [2:31:57<6:53:26,  2.53s/it][A
Training...:  30% 4118/13907 [2:31:57<7:06:27,  2.61s/it][A
Training...:  30% 4119/13907 [2:31:59<6:58:06,  2.56s/it][A
Training...:  30% 4120/13907 [2:32:01<6:48:19,  2.50s/it][A
Training...:  30% 4121/13907 [2:32:04<6:40:57,  2.46s/it][A
Training...:  30% 4122/13907 [2:32:06<6:36:06,  2.43s/it][A
Training...:  30% 4123/13907 [2:32:08<6:29:34,  2.39s/it][A
Training...:  30% 4124/13907 [2:32:11<6:22:18,  2.34s/it][A
Training...:  30% 4125/13907 [2:32:13<6:14:16,  2.30s/it][A
Training...:  30% 4126/13907 [2:32:15<6:05:44,  2.24s/it][A
Training...:  30% 4127/13907 [2:32:17<5:58:33,  2.20s/it][A
Training...:  30% 4128/13907 [2:32:19<5:53:08,  2.17s/it][A
Training...:  30% 4129/13907 [2:32:21<5:46:52,  2.13s/it][A
Training...:  30% 4130/13907 [2:32:23<5:40:31,  2.09s/it][A
Training...:  30% 4131/13907 [2:32:25<5:35:36,  2.06s/it][A
Training...:  30% 4132/13907 [2:32:27<5:29:42,  2.02s/it][A
Training...:  30% 4133/13907 [2:32:29<5:24:39,  1.99s/it][A
Training...:  30% 4134/13907 [2:32:31<5:18:24,  1.95s/it][A
Training...:  30% 4135/13907 [2:32:33<5:13:07,  1.92s/it][A
Training...:  30% 4136/13907 [2:32:35<5:07:45,  1.89s/it][A
Training...:  30% 4137/13907 [2:32:36<5:03:20,  1.86s/it][A
Training...:  30% 4138/13907 [2:32:38<4:57:55,  1.83s/it][A
Training...:  30% 4139/13907 [2:32:40<4:52:51,  1.80s/it][A
Training...:  30% 4140/13907 [2:32:41<4:47:50,  1.77s/it][A
Training...:  30% 4141/13907 [2:32:43<4:41:51,  1.73s/it][A
Training...:  30% 4142/13907 [2:32:45<4:36:32,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:14:58<26:06:17, 31325.86s/it]
Training...:  30% 4142/13907 [2:32:47<4:36:32,  1.70s/it][A
Training...:  30% 4143/13907 [2:32:47<4:46:14,  1.76s/it][A
Training...:  30% 4144/13907 [2:32:48<4:38:21,  1.71s/it][A
Training...:  30% 4145/13907 [2:32:50<4:29:06,  1.65s/it][A
Training...:  30% 4146/13907 [2:32:51<4:18:08,  1.59s/it][A
Training...:  30% 4147/13907 [2:32:53<4:08:03,  1.52s/it][A
Training...:  30% 4148/13907 [2:32:54<3:57:17,  1.46s/it][A
Training...:  30% 4149/13907 [2:32:55<3:45:34,  1.39s/it][A
Training...:  30% 4150/13907 [2:32:56<3:30:22,  1.29s/it][A
Training...:  30% 4151/13907 [2:33:00<5:25:43,  2.00s/it][A
Training...:  30% 4152/13907 [2:33:03<6:33:57,  2.42s/it][A
Training...:  30% 4153/13907 [2:33:06<7:12:01,  2.66s/it][A
Training...:  30% 4154/13907 [2:33:10<7:33:28,  2.79s/it][A
Training...:  30% 4155/13907 [2:33:13<7:43:40,  2.85s/it][A
Training...:  30% 4156/13907 [2:33:15<7:45:16,  2.86s/it][A
Training...:  30% 4157/13907 [2:33:18<7:44:35,  2.86s/it][A
Training...:  30% 4158/13907 [2:33:21<7:42:53,  2.85s/it][A
Training...:  30% 4159/13907 [2:33:24<7:39:34,  2.83s/it][A
Training...:  30% 4160/13907 [2:33:27<7:33:58,  2.79s/it][A
Training...:  30% 4161/13907 [2:33:29<7:28:47,  2.76s/it][A
Training...:  30% 4162/13907 [2:33:32<7:21:49,  2.72s/it][A
Training...:  30% 4163/13907 [2:33:34<7:14:05,  2.67s/it][A
Training...:  30% 4164/13907 [2:33:37<7:06:13,  2.62s/it][A
Training...:  30% 4165/13907 [2:33:39<6:59:45,  2.59s/it][A
Training...:  30% 4166/13907 [2:33:42<6:52:50,  2.54s/it][A
Training...:  30% 4167/13907 [2:33:44<6:47:14,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:15:58<26:06:17, 31325.86s/it]
Training...:  30% 4167/13907 [2:33:47<6:47:14,  2.51s/it][A
Training...:  30% 4168/13907 [2:33:47<7:02:13,  2.60s/it][A
Training...:  30% 4169/13907 [2:33:50<6:53:46,  2.55s/it][A
Training...:  30% 4170/13907 [2:33:52<6:44:28,  2.49s/it][A
Training...:  30% 4171/13907 [2:33:54<6:35:20,  2.44s/it][A
Training...:  30% 4172/13907 [2:33:57<6:25:44,  2.38s/it][A
Training...:  30% 4173/13907 [2:33:59<6:18:13,  2.33s/it][A
Training...:  30% 4174/13907 [2:34:01<6:10:28,  2.28s/it][A
Training...:  30% 4175/13907 [2:34:03<6:05:49,  2.26s/it][A
Training...:  30% 4176/13907 [2:34:05<6:02:30,  2.24s/it][A
Training...:  30% 4177/13907 [2:34:07<5:57:41,  2.21s/it][A
Training...:  30% 4178/13907 [2:34:10<5:52:32,  2.17s/it][A
Training...:  30% 4179/13907 [2:34:12<5:47:03,  2.14s/it][A
Training...:  30% 4180/13907 [2:34:14<5:40:21,  2.10s/it][A
Training...:  30% 4181/13907 [2:34:16<5:34:47,  2.07s/it][A
Training...:  30% 4182/13907 [2:34:18<5:29:19,  2.03s/it][A
Training...:  30% 4183/13907 [2:34:19<5:24:18,  2.00s/it][A
Training...:  30% 4184/13907 [2:34:21<5:19:40,  1.97s/it][A
Training...:  30% 4185/13907 [2:34:23<5:14:24,  1.94s/it][A
Training...:  30% 4186/13907 [2:34:25<5:09:16,  1.91s/it][A
Training...:  30% 4187/13907 [2:34:27<5:04:23,  1.88s/it][A
Training...:  30% 4188/13907 [2:34:29<4:58:03,  1.84s/it][A
Training...:  30% 4189/13907 [2:34:30<4:53:08,  1.81s/it][A
Training...:  30% 4190/13907 [2:34:32<4:46:59,  1.77s/it][A
Training...:  30% 4191/13907 [2:34:34<4:42:40,  1.75s/it][A
Training...:  30% 4192/13907 [2:34:35<4:36:34,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:16:48<26:06:17, 31325.86s/it]
Training...:  30% 4192/13907 [2:34:37<4:36:34,  1.71s/it][A
Training...:  30% 4193/13907 [2:34:37<4:45:33,  1.76s/it][A
Training...:  30% 4194/13907 [2:34:39<4:37:06,  1.71s/it][A
Training...:  30% 4195/13907 [2:34:40<4:28:11,  1.66s/it][A
Training...:  30% 4196/13907 [2:34:42<4:17:18,  1.59s/it][A
Training...:  30% 4197/13907 [2:34:43<4:08:02,  1.53s/it][A
Training...:  30% 4198/13907 [2:34:45<3:56:53,  1.46s/it][A
Training...:  30% 4199/13907 [2:34:46<3:45:03,  1.39s/it][A
Training...:  30% 4200/13907 [2:34:47<3:28:26,  1.29s/it][A
Training...:  30% 4201/13907 [2:34:50<5:22:26,  1.99s/it][A
Training...:  30% 4202/13907 [2:34:54<6:34:56,  2.44s/it][A
Training...:  30% 4203/13907 [2:34:57<7:15:06,  2.69s/it][A
Training...:  30% 4204/13907 [2:35:00<7:35:52,  2.82s/it][A
Training...:  30% 4205/13907 [2:35:03<7:47:41,  2.89s/it][A
Training...:  30% 4206/13907 [2:35:06<7:51:19,  2.92s/it][A
Training...:  30% 4207/13907 [2:35:09<7:51:14,  2.91s/it][A
Training...:  30% 4208/13907 [2:35:12<7:47:17,  2.89s/it][A
Training...:  30% 4209/13907 [2:35:15<7:42:04,  2.86s/it][A
Training...:  30% 4210/13907 [2:35:18<7:34:20,  2.81s/it][A
Training...:  30% 4211/13907 [2:35:20<7:29:17,  2.78s/it][A
Training...:  30% 4212/13907 [2:35:23<7:21:45,  2.73s/it][A
Training...:  30% 4213/13907 [2:35:25<7:14:50,  2.69s/it][A
Training...:  30% 4214/13907 [2:35:28<7:08:49,  2.65s/it][A
Training...:  30% 4215/13907 [2:35:31<7:02:08,  2.61s/it][A
Training...:  30% 4216/13907 [2:35:33<6:56:10,  2.58s/it][A
Training...:  30% 4217/13907 [2:35:35<6:49:24,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:17:50<26:06:17, 31325.86s/it]
Training...:  30% 4217/13907 [2:35:38<6:49:24,  2.53s/it][A
Training...:  30% 4218/13907 [2:35:38<7:03:04,  2.62s/it][A
Training...:  30% 4219/13907 [2:35:41<6:58:05,  2.59s/it][A
Training...:  30% 4220/13907 [2:35:43<6:48:05,  2.53s/it][A
Training...:  30% 4221/13907 [2:35:46<6:36:42,  2.46s/it][A
Training...:  30% 4222/13907 [2:35:48<6:29:02,  2.41s/it][A
Training...:  30% 4223/13907 [2:35:50<6:20:38,  2.36s/it][A
Training...:  30% 4224/13907 [2:35:52<6:12:05,  2.31s/it][A
Training...:  30% 4225/13907 [2:35:54<6:05:35,  2.27s/it][A
Training...:  30% 4226/13907 [2:35:57<5:58:43,  2.22s/it][A
Training...:  30% 4227/13907 [2:35:59<5:51:45,  2.18s/it][A
Training...:  30% 4228/13907 [2:36:01<5:45:48,  2.14s/it][A
Training...:  30% 4229/13907 [2:36:03<5:40:20,  2.11s/it][A
Training...:  30% 4230/13907 [2:36:05<5:35:08,  2.08s/it][A
Training...:  30% 4231/13907 [2:36:07<5:31:45,  2.06s/it][A
Training...:  30% 4232/13907 [2:36:09<5:27:16,  2.03s/it][A
Training...:  30% 4233/13907 [2:36:11<5:22:52,  2.00s/it][A
Training...:  30% 4234/13907 [2:36:13<5:17:41,  1.97s/it][A
Training...:  30% 4235/13907 [2:36:14<5:13:02,  1.94s/it][A
Training...:  30% 4236/13907 [2:36:16<5:07:40,  1.91s/it][A
Training...:  30% 4237/13907 [2:36:18<5:02:25,  1.88s/it][A
Training...:  30% 4238/13907 [2:36:20<4:56:27,  1.84s/it][A
Training...:  30% 4239/13907 [2:36:22<4:52:02,  1.81s/it][A
Training...:  30% 4240/13907 [2:36:23<4:47:20,  1.78s/it][A
Training...:  30% 4241/13907 [2:36:25<4:43:00,  1.76s/it][A
Training...:  31% 4242/13907 [2:36:27<4:38:04,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:18:40<26:06:17, 31325.86s/it]
Training...:  31% 4242/13907 [2:36:29<4:38:04,  1.73s/it][A
Training...:  31% 4243/13907 [2:36:29<4:47:46,  1.79s/it][A
Training...:  31% 4244/13907 [2:36:30<4:40:11,  1.74s/it][A
Training...:  31% 4245/13907 [2:36:32<4:32:15,  1.69s/it][A
Training...:  31% 4246/13907 [2:36:33<4:21:39,  1.63s/it][A
Training...:  31% 4247/13907 [2:36:35<4:11:15,  1.56s/it][A
Training...:  31% 4248/13907 [2:36:36<3:59:58,  1.49s/it][A
Training...:  31% 4249/13907 [2:36:37<3:48:37,  1.42s/it][A
Training...:  31% 4250/13907 [2:36:38<3:31:44,  1.32s/it][A
Training...:  31% 4251/13907 [2:36:42<5:31:13,  2.06s/it][A
Training...:  31% 4252/13907 [2:36:46<6:40:51,  2.49s/it][A
Training...:  31% 4253/13907 [2:36:49<7:18:38,  2.73s/it][A
Training...:  31% 4254/13907 [2:36:52<7:36:15,  2.84s/it][A
Training...:  31% 4255/13907 [2:36:55<7:47:33,  2.91s/it][A
Training...:  31% 4256/13907 [2:36:58<7:48:33,  2.91s/it][A
Training...:  31% 4257/13907 [2:37:01<7:47:04,  2.90s/it][A
Training...:  31% 4258/13907 [2:37:04<7:47:32,  2.91s/it][A
Training...:  31% 4259/13907 [2:37:07<7:43:14,  2.88s/it][A
Training...:  31% 4260/13907 [2:37:09<7:34:10,  2.82s/it][A
Training...:  31% 4261/13907 [2:37:12<7:25:22,  2.77s/it][A
Training...:  31% 4262/13907 [2:37:14<7:16:37,  2.72s/it][A
Training...:  31% 4263/13907 [2:37:17<7:08:11,  2.66s/it][A
Training...:  31% 4264/13907 [2:37:20<7:01:12,  2.62s/it][A
Training...:  31% 4265/13907 [2:37:22<6:54:17,  2.58s/it][A
Training...:  31% 4266/13907 [2:37:24<6:49:17,  2.55s/it][A
Training...:  31% 4267/13907 [2:37:27<6:45:30,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:19:41<26:06:17, 31325.86s/it]
Training...:  31% 4267/13907 [2:37:30<6:45:30,  2.52s/it][A
Training...:  31% 4268/13907 [2:37:30<7:00:40,  2.62s/it][A
Training...:  31% 4269/13907 [2:37:32<6:53:14,  2.57s/it][A
Training...:  31% 4270/13907 [2:37:35<6:42:24,  2.51s/it][A
Training...:  31% 4271/13907 [2:37:37<6:33:46,  2.45s/it][A
Training...:  31% 4272/13907 [2:37:39<6:25:16,  2.40s/it][A
Training...:  31% 4273/13907 [2:37:41<6:17:10,  2.35s/it][A
Training...:  31% 4274/13907 [2:37:44<6:08:51,  2.30s/it][A
Training...:  31% 4275/13907 [2:37:46<6:03:19,  2.26s/it][A
Training...:  31% 4276/13907 [2:37:48<5:55:57,  2.22s/it][A
Training...:  31% 4277/13907 [2:37:50<5:51:04,  2.19s/it][A
Training...:  31% 4278/13907 [2:37:52<5:46:20,  2.16s/it][A
Training...:  31% 4279/13907 [2:37:54<5:42:10,  2.13s/it][A
Training...:  31% 4280/13907 [2:37:56<5:36:20,  2.10s/it][A
Training...:  31% 4281/13907 [2:37:58<5:32:38,  2.07s/it][A
Training...:  31% 4282/13907 [2:38:00<5:26:57,  2.04s/it][A
Training...:  31% 4283/13907 [2:38:02<5:22:24,  2.01s/it][A
Training...:  31% 4284/13907 [2:38:04<5:18:21,  1.98s/it][A
Training...:  31% 4285/13907 [2:38:06<5:13:38,  1.96s/it][A
Training...:  31% 4286/13907 [2:38:08<5:08:42,  1.93s/it][A
Training...:  31% 4287/13907 [2:38:10<5:04:06,  1.90s/it][A
Training...:  31% 4288/13907 [2:38:11<4:59:17,  1.87s/it][A
Training...:  31% 4289/13907 [2:38:13<4:56:37,  1.85s/it][A
Training...:  31% 4290/13907 [2:38:15<4:51:34,  1.82s/it][A
Training...:  31% 4291/13907 [2:38:17<4:44:37,  1.78s/it][A
Training...:  31% 4292/13907 [2:38:18<4:37:56,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:20:31<26:06:17, 31325.86s/it]
Training...:  31% 4292/13907 [2:38:20<4:37:56,  1.73s/it][A
Training...:  31% 4293/13907 [2:38:20<4:46:31,  1.79s/it][A
Training...:  31% 4294/13907 [2:38:22<4:38:31,  1.74s/it][A
Training...:  31% 4295/13907 [2:38:23<4:27:23,  1.67s/it][A
Training...:  31% 4296/13907 [2:38:25<4:17:02,  1.60s/it][A
Training...:  31% 4297/13907 [2:38:26<4:07:03,  1.54s/it][A
Training...:  31% 4298/13907 [2:38:28<3:57:00,  1.48s/it][A
Training...:  31% 4299/13907 [2:38:29<3:44:36,  1.40s/it][A
Training...:  31% 4300/13907 [2:38:30<3:27:02,  1.29s/it][A
Training...:  31% 4301/13907 [2:38:33<5:21:40,  2.01s/it][A
Training...:  31% 4302/13907 [2:38:37<6:28:02,  2.42s/it][A
Training...:  31% 4303/13907 [2:38:40<7:07:53,  2.67s/it][A
Training...:  31% 4304/13907 [2:38:43<7:28:09,  2.80s/it][A
Training...:  31% 4305/13907 [2:38:46<7:39:00,  2.87s/it][A
Training...:  31% 4306/13907 [2:38:49<7:41:17,  2.88s/it][A
Training...:  31% 4307/13907 [2:38:52<7:41:50,  2.89s/it][A
Training...:  31% 4308/13907 [2:38:55<7:40:09,  2.88s/it][A
Training...:  31% 4309/13907 [2:38:58<7:35:32,  2.85s/it][A
Training...:  31% 4310/13907 [2:39:00<7:28:45,  2.81s/it][A
Training...:  31% 4311/13907 [2:39:03<7:22:24,  2.77s/it][A
Training...:  31% 4312/13907 [2:39:06<7:16:01,  2.73s/it][A
Training...:  31% 4313/13907 [2:39:08<7:08:12,  2.68s/it][A
Training...:  31% 4314/13907 [2:39:11<7:03:14,  2.65s/it][A
Training...:  31% 4315/13907 [2:39:13<6:56:07,  2.60s/it][A
Training...:  31% 4316/13907 [2:39:16<6:48:30,  2.56s/it][A
Training...:  31% 4317/13907 [2:39:18<6:43:00,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:21:32<26:06:17, 31325.86s/it]
Training...:  31% 4317/13907 [2:39:21<6:43:00,  2.52s/it][A
Training...:  31% 4318/13907 [2:39:21<6:56:46,  2.61s/it][A
Training...:  31% 4319/13907 [2:39:23<6:50:38,  2.57s/it][A
Training...:  31% 4320/13907 [2:39:26<6:40:48,  2.51s/it][A
Training...:  31% 4321/13907 [2:39:28<6:35:05,  2.47s/it][A
Training...:  31% 4322/13907 [2:39:31<6:26:57,  2.42s/it][A
Training...:  31% 4323/13907 [2:39:33<6:18:57,  2.37s/it][A
Training...:  31% 4324/13907 [2:39:35<6:10:34,  2.32s/it][A
Training...:  31% 4325/13907 [2:39:37<6:02:28,  2.27s/it][A
Training...:  31% 4326/13907 [2:39:39<5:55:21,  2.23s/it][A
Training...:  31% 4327/13907 [2:39:41<5:49:19,  2.19s/it][A
Training...:  31% 4328/13907 [2:39:43<5:44:11,  2.16s/it][A
Training...:  31% 4329/13907 [2:39:46<5:38:38,  2.12s/it][A
Training...:  31% 4330/13907 [2:39:48<5:34:07,  2.09s/it][A
Training...:  31% 4331/13907 [2:39:50<5:28:31,  2.06s/it][A
Training...:  31% 4332/13907 [2:39:51<5:23:54,  2.03s/it][A
Training...:  31% 4333/13907 [2:39:53<5:20:13,  2.01s/it][A
Training...:  31% 4334/13907 [2:39:55<5:14:14,  1.97s/it][A
Training...:  31% 4335/13907 [2:39:57<5:10:19,  1.95s/it][A
Training...:  31% 4336/13907 [2:39:59<5:03:38,  1.90s/it][A
Training...:  31% 4337/13907 [2:40:01<4:58:22,  1.87s/it][A
Training...:  31% 4338/13907 [2:40:03<4:52:01,  1.83s/it][A
Training...:  31% 4339/13907 [2:40:04<4:46:56,  1.80s/it][A
Training...:  31% 4340/13907 [2:40:06<4:41:51,  1.77s/it][A
Training...:  31% 4341/13907 [2:40:08<4:36:36,  1.73s/it][A
Training...:  31% 4342/13907 [2:40:09<4:30:57,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:22:22<26:06:17, 31325.86s/it]
Training...:  31% 4342/13907 [2:40:11<4:30:57,  1.70s/it][A
Training...:  31% 4343/13907 [2:40:11<4:40:54,  1.76s/it][A
Training...:  31% 4344/13907 [2:40:13<4:33:45,  1.72s/it][A
Training...:  31% 4345/13907 [2:40:14<4:24:21,  1.66s/it][A
Training...:  31% 4346/13907 [2:40:16<4:13:12,  1.59s/it][A
Training...:  31% 4347/13907 [2:40:17<4:02:48,  1.52s/it][A
Training...:  31% 4348/13907 [2:40:18<3:51:15,  1.45s/it][A
Training...:  31% 4349/13907 [2:40:20<3:39:15,  1.38s/it][A
Training...:  31% 4350/13907 [2:40:21<3:22:30,  1.27s/it][A
Training...:  31% 4351/13907 [2:40:24<5:16:05,  1.98s/it][A
Training...:  31% 4352/13907 [2:40:28<6:25:52,  2.42s/it][A
Training...:  31% 4353/13907 [2:40:31<7:05:03,  2.67s/it][A
Training...:  31% 4354/13907 [2:40:34<7:24:57,  2.79s/it][A
Training...:  31% 4355/13907 [2:40:37<7:35:21,  2.86s/it][A
Training...:  31% 4356/13907 [2:40:40<7:39:57,  2.89s/it][A
Training...:  31% 4357/13907 [2:40:43<7:40:58,  2.90s/it][A
Training...:  31% 4358/13907 [2:40:46<7:35:25,  2.86s/it][A
Training...:  31% 4359/13907 [2:40:48<7:30:14,  2.83s/it][A
Training...:  31% 4360/13907 [2:40:51<7:22:16,  2.78s/it][A
Training...:  31% 4361/13907 [2:40:54<7:17:00,  2.75s/it][A
Training...:  31% 4362/13907 [2:40:56<7:10:20,  2.71s/it][A
Training...:  31% 4363/13907 [2:40:59<7:04:15,  2.67s/it][A
Training...:  31% 4364/13907 [2:41:02<7:00:04,  2.64s/it][A
Training...:  31% 4365/13907 [2:41:04<6:54:14,  2.60s/it][A
Training...:  31% 4366/13907 [2:41:07<6:47:30,  2.56s/it][A
Training...:  31% 4367/13907 [2:41:09<6:40:27,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:23:23<26:06:17, 31325.86s/it]
Training...:  31% 4367/13907 [2:41:12<6:40:27,  2.52s/it][A
Training...:  31% 4368/13907 [2:41:12<6:53:46,  2.60s/it][A
Training...:  31% 4369/13907 [2:41:14<6:49:04,  2.57s/it][A
Training...:  31% 4370/13907 [2:41:17<6:39:38,  2.51s/it][A
Training...:  31% 4371/13907 [2:41:19<6:29:05,  2.45s/it][A
Training...:  31% 4372/13907 [2:41:21<6:21:09,  2.40s/it][A
Training...:  31% 4373/13907 [2:41:23<6:12:44,  2.35s/it][A
Training...:  31% 4374/13907 [2:41:26<6:04:15,  2.29s/it][A
Training...:  31% 4375/13907 [2:41:28<5:57:30,  2.25s/it][A
Training...:  31% 4376/13907 [2:41:30<5:51:34,  2.21s/it][A
Training...:  31% 4377/13907 [2:41:32<5:46:40,  2.18s/it][A
Training...:  31% 4378/13907 [2:41:34<5:42:08,  2.15s/it][A
Training...:  31% 4379/13907 [2:41:36<5:37:27,  2.13s/it][A
Training...:  31% 4380/13907 [2:41:38<5:31:10,  2.09s/it][A
Training...:  32% 4381/13907 [2:41:40<5:26:30,  2.06s/it][A
Training...:  32% 4382/13907 [2:41:42<5:20:58,  2.02s/it][A
Training...:  32% 4383/13907 [2:41:44<5:16:38,  1.99s/it][A
Training...:  32% 4384/13907 [2:41:46<5:12:02,  1.97s/it][A
Training...:  32% 4385/13907 [2:41:48<5:07:13,  1.94s/it][A
Training...:  32% 4386/13907 [2:41:50<5:02:44,  1.91s/it][A
Training...:  32% 4387/13907 [2:41:51<4:57:46,  1.88s/it][A
Training...:  32% 4388/13907 [2:41:53<4:53:00,  1.85s/it][A
Training...:  32% 4389/13907 [2:41:55<4:47:29,  1.81s/it][A
Training...:  32% 4390/13907 [2:41:57<4:42:32,  1.78s/it][A
Training...:  32% 4391/13907 [2:41:58<4:37:29,  1.75s/it][A
Training...:  32% 4392/13907 [2:42:00<4:32:00,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:24:13<26:06:17, 31325.86s/it]
Training...:  32% 4392/13907 [2:42:02<4:32:00,  1.72s/it][A
Training...:  32% 4393/13907 [2:42:02<4:41:45,  1.78s/it][A
Training...:  32% 4394/13907 [2:42:03<4:34:02,  1.73s/it][A
Training...:  32% 4395/13907 [2:42:05<4:25:34,  1.68s/it][A
Training...:  32% 4396/13907 [2:42:06<4:14:48,  1.61s/it][A
Training...:  32% 4397/13907 [2:42:08<4:04:43,  1.54s/it][A
Training...:  32% 4398/13907 [2:42:09<3:53:51,  1.48s/it][A
Training...:  32% 4399/13907 [2:42:10<3:41:33,  1.40s/it][A
Training...:  32% 4400/13907 [2:42:11<3:23:55,  1.29s/it][A
Training...:  32% 4401/13907 [2:42:15<5:15:57,  1.99s/it][A
Training...:  32% 4402/13907 [2:42:18<6:23:46,  2.42s/it][A
Training...:  32% 4403/13907 [2:42:22<7:01:21,  2.66s/it][A
Training...:  32% 4404/13907 [2:42:25<7:22:18,  2.79s/it][A
Training...:  32% 4405/13907 [2:42:28<7:32:07,  2.85s/it][A
Training...:  32% 4406/13907 [2:42:31<7:35:36,  2.88s/it][A
Training...:  32% 4407/13907 [2:42:34<7:34:31,  2.87s/it][A
Training...:  32% 4408/13907 [2:42:36<7:29:18,  2.84s/it][A
Training...:  32% 4409/13907 [2:42:39<7:24:07,  2.81s/it][A
Training...:  32% 4410/13907 [2:42:42<7:17:21,  2.76s/it][A
Training...:  32% 4411/13907 [2:42:44<7:13:01,  2.74s/it][A
Training...:  32% 4412/13907 [2:42:47<7:09:46,  2.72s/it][A
Training...:  32% 4413/13907 [2:42:50<7:05:09,  2.69s/it][A
Training...:  32% 4414/13907 [2:42:52<6:56:58,  2.64s/it][A
Training...:  32% 4415/13907 [2:42:55<6:49:03,  2.59s/it][A
Training...:  32% 4416/13907 [2:42:57<6:41:08,  2.54s/it][A
Training...:  32% 4417/13907 [2:42:59<6:34:04,  2.49s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:25:13<26:06:17, 31325.86s/it]
Training...:  32% 4417/13907 [2:43:02<6:34:04,  2.49s/it][A
Training...:  32% 4418/13907 [2:43:02<6:46:07,  2.57s/it][A
Training...:  32% 4419/13907 [2:43:05<6:36:57,  2.51s/it][A
Training...:  32% 4420/13907 [2:43:07<6:25:54,  2.44s/it][A
Training...:  32% 4421/13907 [2:43:09<6:17:39,  2.39s/it][A
Training...:  32% 4422/13907 [2:43:11<6:09:23,  2.34s/it][A
Training...:  32% 4423/13907 [2:43:14<6:02:10,  2.29s/it][A
Training...:  32% 4424/13907 [2:43:16<5:55:40,  2.25s/it][A
Training...:  32% 4425/13907 [2:43:18<5:49:37,  2.21s/it][A
Training...:  32% 4426/13907 [2:43:20<5:43:58,  2.18s/it][A
Training...:  32% 4427/13907 [2:43:22<5:38:53,  2.14s/it][A
Training...:  32% 4428/13907 [2:43:24<5:33:42,  2.11s/it][A
Training...:  32% 4429/13907 [2:43:26<5:29:37,  2.09s/it][A
Training...:  32% 4430/13907 [2:43:28<5:25:13,  2.06s/it][A
Training...:  32% 4431/13907 [2:43:30<5:21:16,  2.03s/it][A
Training...:  32% 4432/13907 [2:43:32<5:16:47,  2.01s/it][A
Training...:  32% 4433/13907 [2:43:34<5:12:46,  1.98s/it][A
Training...:  32% 4434/13907 [2:43:36<5:07:22,  1.95s/it][A
Training...:  32% 4435/13907 [2:43:38<5:04:18,  1.93s/it][A
Training...:  32% 4436/13907 [2:43:39<4:59:52,  1.90s/it][A
Training...:  32% 4437/13907 [2:43:41<4:54:58,  1.87s/it][A
Training...:  32% 4438/13907 [2:43:43<4:50:28,  1.84s/it][A
Training...:  32% 4439/13907 [2:43:45<4:45:45,  1.81s/it][A
Training...:  32% 4440/13907 [2:43:46<4:39:54,  1.77s/it][A
Training...:  32% 4441/13907 [2:43:48<4:36:22,  1.75s/it][A
Training...:  32% 4442/13907 [2:43:50<4:31:17,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:26:03<26:06:17, 31325.86s/it]
Training...:  32% 4442/13907 [2:43:52<4:31:17,  1.72s/it][A
Training...:  32% 4443/13907 [2:43:52<4:41:17,  1.78s/it][A
Training...:  32% 4444/13907 [2:43:53<4:34:46,  1.74s/it][A
Training...:  32% 4445/13907 [2:43:55<4:26:10,  1.69s/it][A
Training...:  32% 4446/13907 [2:43:56<4:14:59,  1.62s/it][A
Training...:  32% 4447/13907 [2:43:58<4:05:13,  1.56s/it][A
Training...:  32% 4448/13907 [2:43:59<3:55:28,  1.49s/it][A
Training...:  32% 4449/13907 [2:44:00<3:44:43,  1.43s/it][A
Training...:  32% 4450/13907 [2:44:02<3:28:48,  1.32s/it][A
Training...:  32% 4451/13907 [2:44:05<5:21:08,  2.04s/it][A
Training...:  32% 4452/13907 [2:44:09<6:29:27,  2.47s/it][A
Training...:  32% 4453/13907 [2:44:12<7:10:22,  2.73s/it][A
Training...:  32% 4454/13907 [2:44:15<7:26:05,  2.83s/it][A
Training...:  32% 4455/13907 [2:44:18<7:32:50,  2.87s/it][A
Training...:  32% 4456/13907 [2:44:21<7:31:22,  2.87s/it][A
Training...:  32% 4457/13907 [2:44:24<7:28:12,  2.85s/it][A
Training...:  32% 4458/13907 [2:44:26<7:23:24,  2.82s/it][A
Training...:  32% 4459/13907 [2:44:29<7:18:02,  2.78s/it][A
Training...:  32% 4460/13907 [2:44:32<7:12:06,  2.74s/it][A
Training...:  32% 4461/13907 [2:44:34<7:07:47,  2.72s/it][A
Training...:  32% 4462/13907 [2:44:37<7:01:24,  2.68s/it][A
Training...:  32% 4463/13907 [2:44:40<6:54:31,  2.63s/it][A
Training...:  32% 4464/13907 [2:44:42<6:49:08,  2.60s/it][A
Training...:  32% 4465/13907 [2:44:45<6:44:30,  2.57s/it][A
Training...:  32% 4466/13907 [2:44:47<6:38:38,  2.53s/it][A
Training...:  32% 4467/13907 [2:44:49<6:33:23,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:27:03<26:06:17, 31325.86s/it]
Training...:  32% 4467/13907 [2:44:52<6:33:23,  2.50s/it][A
Training...:  32% 4468/13907 [2:44:52<6:46:48,  2.59s/it][A
Training...:  32% 4469/13907 [2:44:55<6:39:47,  2.54s/it][A
Training...:  32% 4470/13907 [2:44:57<6:29:47,  2.48s/it][A
Training...:  32% 4471/13907 [2:44:59<6:20:55,  2.42s/it][A
Training...:  32% 4472/13907 [2:45:02<6:13:44,  2.38s/it][A
Training...:  32% 4473/13907 [2:45:04<6:07:38,  2.34s/it][A
Training...:  32% 4474/13907 [2:45:06<6:00:31,  2.29s/it][A
Training...:  32% 4475/13907 [2:45:08<5:56:02,  2.26s/it][A
Training...:  32% 4476/13907 [2:45:10<5:49:58,  2.23s/it][A
Training...:  32% 4477/13907 [2:45:13<5:45:07,  2.20s/it][A
Training...:  32% 4478/13907 [2:45:15<5:40:36,  2.17s/it][A
Training...:  32% 4479/13907 [2:45:17<5:35:52,  2.14s/it][A
Training...:  32% 4480/13907 [2:45:19<5:31:02,  2.11s/it][A
Training...:  32% 4481/13907 [2:45:21<5:26:34,  2.08s/it][A
Training...:  32% 4482/13907 [2:45:23<5:22:11,  2.05s/it][A
Training...:  32% 4483/13907 [2:45:25<5:21:07,  2.04s/it][A
Training...:  32% 4484/13907 [2:45:27<5:17:42,  2.02s/it][A
Training...:  32% 4485/13907 [2:45:29<5:12:37,  1.99s/it][A
Training...:  32% 4486/13907 [2:45:30<5:05:46,  1.95s/it][A
Training...:  32% 4487/13907 [2:45:32<5:00:42,  1.92s/it][A
Training...:  32% 4488/13907 [2:45:34<4:54:58,  1.88s/it][A
Training...:  32% 4489/13907 [2:45:36<4:49:06,  1.84s/it][A
Training...:  32% 4490/13907 [2:45:38<4:42:54,  1.80s/it][A
Training...:  32% 4491/13907 [2:45:39<4:37:02,  1.77s/it][A
Training...:  32% 4492/13907 [2:45:41<4:30:37,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:27:54<26:06:17, 31325.86s/it]
Training...:  32% 4492/13907 [2:45:43<4:30:37,  1.72s/it][A
Training...:  32% 4493/13907 [2:45:43<4:39:13,  1.78s/it][A
Training...:  32% 4494/13907 [2:45:44<4:32:08,  1.73s/it][A
Training...:  32% 4495/13907 [2:45:46<4:21:06,  1.66s/it][A
Training...:  32% 4496/13907 [2:45:47<4:11:07,  1.60s/it][A
Training...:  32% 4497/13907 [2:45:49<4:01:05,  1.54s/it][A
Training...:  32% 4498/13907 [2:45:50<3:49:57,  1.47s/it][A
Training...:  32% 4499/13907 [2:45:51<3:37:58,  1.39s/it][A
Training...:  32% 4500/13907 [2:45:52<3:21:06,  1.28s/it][A
Training...:  32% 4501/13907 [2:45:56<5:16:09,  2.02s/it][A
Training...:  32% 4502/13907 [2:45:59<6:22:07,  2.44s/it][A
Training...:  32% 4503/13907 [2:46:03<6:59:04,  2.67s/it][A
Training...:  32% 4504/13907 [2:46:06<7:18:46,  2.80s/it][A
Training...:  32% 4505/13907 [2:46:09<7:29:42,  2.87s/it][A
Training...:  32% 4506/13907 [2:46:12<7:31:50,  2.88s/it][A
Training...:  32% 4507/13907 [2:46:15<7:32:14,  2.89s/it][A
Training...:  32% 4508/13907 [2:46:17<7:28:54,  2.87s/it][A
Training...:  32% 4509/13907 [2:46:20<7:23:34,  2.83s/it][A
Training...:  32% 4510/13907 [2:46:23<7:17:20,  2.79s/it][A
Training...:  32% 4511/13907 [2:46:26<7:12:33,  2.76s/it][A
Training...:  32% 4512/13907 [2:46:28<7:05:06,  2.71s/it][A
Training...:  32% 4513/13907 [2:46:31<6:59:11,  2.68s/it][A
Training...:  32% 4514/13907 [2:46:33<6:52:06,  2.63s/it][A
Training...:  32% 4515/13907 [2:46:36<6:47:03,  2.60s/it][A
Training...:  32% 4516/13907 [2:46:38<6:40:32,  2.56s/it][A
Training...:  32% 4517/13907 [2:46:41<6:35:19,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:28:55<26:06:17, 31325.86s/it]
Training...:  32% 4517/13907 [2:46:44<6:35:19,  2.53s/it][A
Training...:  32% 4518/13907 [2:46:44<6:49:52,  2.62s/it][A
Training...:  32% 4519/13907 [2:46:46<6:41:58,  2.57s/it][A
Training...:  33% 4520/13907 [2:46:48<6:31:13,  2.50s/it][A
Training...:  33% 4521/13907 [2:46:51<6:24:06,  2.46s/it][A
Training...:  33% 4522/13907 [2:46:53<6:17:17,  2.41s/it][A
Training...:  33% 4523/13907 [2:46:55<6:12:21,  2.38s/it][A
Training...:  33% 4524/13907 [2:46:58<6:06:36,  2.34s/it][A
Training...:  33% 4525/13907 [2:47:00<6:03:15,  2.32s/it][A
Training...:  33% 4526/13907 [2:47:02<5:57:12,  2.28s/it][A
Training...:  33% 4527/13907 [2:47:04<5:49:42,  2.24s/it][A
Training...:  33% 4528/13907 [2:47:06<5:42:18,  2.19s/it][A
Training...:  33% 4529/13907 [2:47:08<5:34:57,  2.14s/it][A
Training...:  33% 4530/13907 [2:47:10<5:28:44,  2.10s/it][A
Training...:  33% 4531/13907 [2:47:12<5:23:15,  2.07s/it][A
Training...:  33% 4532/13907 [2:47:14<5:18:11,  2.04s/it][A
Training...:  33% 4533/13907 [2:47:16<5:14:06,  2.01s/it][A
Training...:  33% 4534/13907 [2:47:18<5:09:11,  1.98s/it][A
Training...:  33% 4535/13907 [2:47:20<5:03:42,  1.94s/it][A
Training...:  33% 4536/13907 [2:47:22<4:58:04,  1.91s/it][A
Training...:  33% 4537/13907 [2:47:24<4:53:42,  1.88s/it][A
Training...:  33% 4538/13907 [2:47:25<4:49:07,  1.85s/it][A
Training...:  33% 4539/13907 [2:47:27<4:43:53,  1.82s/it][A
Training...:  33% 4540/13907 [2:47:29<4:38:06,  1.78s/it][A
Training...:  33% 4541/13907 [2:47:31<4:33:30,  1.75s/it][A
Training...:  33% 4542/13907 [2:47:32<4:27:18,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:29:45<26:06:17, 31325.86s/it]
Training...:  33% 4542/13907 [2:47:34<4:27:18,  1.71s/it][A
Training...:  33% 4543/13907 [2:47:34<4:36:07,  1.77s/it][A
Training...:  33% 4544/13907 [2:47:36<4:28:41,  1.72s/it][A
Training...:  33% 4545/13907 [2:47:37<4:20:25,  1.67s/it][A
Training...:  33% 4546/13907 [2:47:39<4:10:10,  1.60s/it][A
Training...:  33% 4547/13907 [2:47:40<4:00:10,  1.54s/it][A
Training...:  33% 4548/13907 [2:47:41<3:49:21,  1.47s/it][A
Training...:  33% 4549/13907 [2:47:43<3:37:38,  1.40s/it][A
Training...:  33% 4550/13907 [2:47:44<3:21:04,  1.29s/it][A
Training...:  33% 4551/13907 [2:47:47<5:11:06,  2.00s/it][A
Training...:  33% 4552/13907 [2:47:51<6:17:29,  2.42s/it][A
Training...:  33% 4553/13907 [2:47:54<6:55:51,  2.67s/it][A
Training...:  33% 4554/13907 [2:47:57<7:16:33,  2.80s/it][A
Training...:  33% 4555/13907 [2:48:00<7:28:14,  2.88s/it][A
Training...:  33% 4556/13907 [2:48:03<7:30:54,  2.89s/it][A
Training...:  33% 4557/13907 [2:48:06<7:32:05,  2.90s/it][A
Training...:  33% 4558/13907 [2:48:09<7:26:41,  2.87s/it][A
Training...:  33% 4559/13907 [2:48:11<7:22:16,  2.84s/it][A
Training...:  33% 4560/13907 [2:48:14<7:15:37,  2.80s/it][A
Training...:  33% 4561/13907 [2:48:17<7:09:46,  2.76s/it][A
Training...:  33% 4562/13907 [2:48:19<7:02:05,  2.71s/it][A
Training...:  33% 4563/13907 [2:48:22<6:55:04,  2.67s/it][A
Training...:  33% 4564/13907 [2:48:25<6:48:47,  2.63s/it][A
Training...:  33% 4565/13907 [2:48:27<6:41:53,  2.58s/it][A
Training...:  33% 4566/13907 [2:48:30<6:37:03,  2.55s/it][A
Training...:  33% 4567/13907 [2:48:32<6:32:41,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:30:46<26:06:17, 31325.86s/it]
Training...:  33% 4567/13907 [2:48:35<6:32:41,  2.52s/it][A
Training...:  33% 4568/13907 [2:48:35<6:45:54,  2.61s/it][A
Training...:  33% 4569/13907 [2:48:37<6:38:48,  2.56s/it][A
Training...:  33% 4570/13907 [2:48:40<6:26:25,  2.48s/it][A
Training...:  33% 4571/13907 [2:48:42<6:17:56,  2.43s/it][A
Training...:  33% 4572/13907 [2:48:44<6:08:45,  2.37s/it][A
Training...:  33% 4573/13907 [2:48:46<6:02:15,  2.33s/it][A
Training...:  33% 4574/13907 [2:48:49<5:57:00,  2.30s/it][A
Training...:  33% 4575/13907 [2:48:51<5:48:48,  2.24s/it][A
Training...:  33% 4576/13907 [2:48:53<5:43:31,  2.21s/it][A
Training...:  33% 4577/13907 [2:48:55<5:38:58,  2.18s/it][A
Training...:  33% 4578/13907 [2:48:57<5:33:51,  2.15s/it][A
Training...:  33% 4579/13907 [2:48:59<5:29:50,  2.12s/it][A
Training...:  33% 4580/13907 [2:49:01<5:24:12,  2.09s/it][A
Training...:  33% 4581/13907 [2:49:03<5:19:12,  2.05s/it][A
Training...:  33% 4582/13907 [2:49:05<5:13:45,  2.02s/it][A
Training...:  33% 4583/13907 [2:49:07<5:08:49,  1.99s/it][A
Training...:  33% 4584/13907 [2:49:09<5:03:43,  1.95s/it][A
Training...:  33% 4585/13907 [2:49:11<4:59:29,  1.93s/it][A
Training...:  33% 4586/13907 [2:49:12<4:53:59,  1.89s/it][A
Training...:  33% 4587/13907 [2:49:14<4:49:56,  1.87s/it][A
Training...:  33% 4588/13907 [2:49:16<4:45:35,  1.84s/it][A
Training...:  33% 4589/13907 [2:49:18<4:41:29,  1.81s/it][A
Training...:  33% 4590/13907 [2:49:19<4:35:55,  1.78s/it][A
Training...:  33% 4591/13907 [2:49:21<4:30:38,  1.74s/it][A
Training...:  33% 4592/13907 [2:49:23<4:24:58,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:31:36<26:06:17, 31325.86s/it]
Training...:  33% 4592/13907 [2:49:25<4:24:58,  1.71s/it][A
Training...:  33% 4593/13907 [2:49:25<4:34:27,  1.77s/it][A
Training...:  33% 4594/13907 [2:49:26<4:27:25,  1.72s/it][A
Training...:  33% 4595/13907 [2:49:28<4:17:42,  1.66s/it][A
Training...:  33% 4596/13907 [2:49:29<4:07:29,  1.59s/it][A
Training...:  33% 4597/13907 [2:49:31<3:57:36,  1.53s/it][A
Training...:  33% 4598/13907 [2:49:32<3:47:44,  1.47s/it][A
Training...:  33% 4599/13907 [2:49:33<3:36:33,  1.40s/it][A
Training...:  33% 4600/13907 [2:49:34<3:20:00,  1.29s/it][A
Training...:  33% 4601/13907 [2:49:38<5:12:59,  2.02s/it][A
Training...:  33% 4602/13907 [2:49:41<6:20:03,  2.45s/it][A
Training...:  33% 4603/13907 [2:49:45<6:56:31,  2.69s/it][A
Training...:  33% 4604/13907 [2:49:48<7:17:46,  2.82s/it][A
Training...:  33% 4605/13907 [2:49:51<7:28:27,  2.89s/it][A
Training...:  33% 4606/13907 [2:49:54<7:35:16,  2.94s/it][A
Training...:  33% 4607/13907 [2:49:57<7:39:53,  2.97s/it][A
Training...:  33% 4608/13907 [2:50:00<7:34:28,  2.93s/it][A
Training...:  33% 4609/13907 [2:50:02<7:26:56,  2.88s/it][A
Training...:  33% 4610/13907 [2:50:05<7:19:14,  2.83s/it][A
Training...:  33% 4611/13907 [2:50:08<7:11:44,  2.79s/it][A
Training...:  33% 4612/13907 [2:50:11<7:04:55,  2.74s/it][A
Training...:  33% 4613/13907 [2:50:13<6:57:52,  2.70s/it][A
Training...:  33% 4614/13907 [2:50:16<6:51:58,  2.66s/it][A
Training...:  33% 4615/13907 [2:50:18<6:44:52,  2.61s/it][A
Training...:  33% 4616/13907 [2:50:21<6:39:29,  2.58s/it][A
Training...:  33% 4617/13907 [2:50:23<6:33:24,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:32:37<26:06:17, 31325.86s/it]
Training...:  33% 4617/13907 [2:50:26<6:33:24,  2.54s/it][A
Training...:  33% 4618/13907 [2:50:26<6:47:22,  2.63s/it][A
Training...:  33% 4619/13907 [2:50:28<6:39:53,  2.58s/it][A
Training...:  33% 4620/13907 [2:50:31<6:28:22,  2.51s/it][A
Training...:  33% 4621/13907 [2:50:33<6:18:49,  2.45s/it][A
Training...:  33% 4622/13907 [2:50:35<6:10:44,  2.40s/it][A
Training...:  33% 4623/13907 [2:50:38<6:02:31,  2.34s/it][A
Training...:  33% 4624/13907 [2:50:40<5:55:55,  2.30s/it][A
Training...:  33% 4625/13907 [2:50:42<5:50:40,  2.27s/it][A
Training...:  33% 4626/13907 [2:50:44<5:45:07,  2.23s/it][A
Training...:  33% 4627/13907 [2:50:46<5:40:35,  2.20s/it][A
Training...:  33% 4628/13907 [2:50:48<5:34:41,  2.16s/it][A
Training...:  33% 4629/13907 [2:50:50<5:30:01,  2.13s/it][A
Training...:  33% 4630/13907 [2:50:52<5:26:05,  2.11s/it][A
Training...:  33% 4631/13907 [2:50:54<5:22:45,  2.09s/it][A
Training...:  33% 4632/13907 [2:50:56<5:18:57,  2.06s/it][A
Training...:  33% 4633/13907 [2:50:58<5:13:51,  2.03s/it][A
Training...:  33% 4634/13907 [2:51:00<5:08:16,  1.99s/it][A
Training...:  33% 4635/13907 [2:51:02<5:03:40,  1.97s/it][A
Training...:  33% 4636/13907 [2:51:04<4:58:42,  1.93s/it][A
Training...:  33% 4637/13907 [2:51:06<4:53:53,  1.90s/it][A
Training...:  33% 4638/13907 [2:51:08<4:48:05,  1.86s/it][A
Training...:  33% 4639/13907 [2:51:09<4:43:36,  1.84s/it][A
Training...:  33% 4640/13907 [2:51:11<4:40:17,  1.81s/it][A
Training...:  33% 4641/13907 [2:51:13<4:35:23,  1.78s/it][A
Training...:  33% 4642/13907 [2:51:15<4:29:17,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:33:28<26:06:17, 31325.86s/it]
Training...:  33% 4642/13907 [2:51:17<4:29:17,  1.74s/it][A
Training...:  33% 4643/13907 [2:51:17<4:37:32,  1.80s/it][A
Training...:  33% 4644/13907 [2:51:18<4:29:35,  1.75s/it][A
Training...:  33% 4645/13907 [2:51:20<4:20:01,  1.68s/it][A
Training...:  33% 4646/13907 [2:51:21<4:10:19,  1.62s/it][A
Training...:  33% 4647/13907 [2:51:23<4:00:11,  1.56s/it][A
Training...:  33% 4648/13907 [2:51:24<3:48:20,  1.48s/it][A
Training...:  33% 4649/13907 [2:51:25<3:36:14,  1.40s/it][A
Training...:  33% 4650/13907 [2:51:26<3:19:57,  1.30s/it][A
Training...:  33% 4651/13907 [2:51:30<5:15:11,  2.04s/it][A
Training...:  33% 4652/13907 [2:51:33<6:20:51,  2.47s/it][A
Training...:  33% 4653/13907 [2:51:37<6:56:52,  2.70s/it][A
Training...:  33% 4654/13907 [2:51:40<7:15:13,  2.82s/it][A
Training...:  33% 4655/13907 [2:51:43<7:26:02,  2.89s/it][A
Training...:  33% 4656/13907 [2:51:46<7:27:40,  2.90s/it][A
Training...:  33% 4657/13907 [2:51:49<7:26:20,  2.90s/it][A
Training...:  33% 4658/13907 [2:51:51<7:22:14,  2.87s/it][A
Training...:  34% 4659/13907 [2:51:54<7:19:43,  2.85s/it][A
Training...:  34% 4660/13907 [2:51:57<7:14:02,  2.82s/it][A
Training...:  34% 4661/13907 [2:52:00<7:07:13,  2.77s/it][A
Training...:  34% 4662/13907 [2:52:02<6:59:39,  2.72s/it][A
Training...:  34% 4663/13907 [2:52:05<6:52:03,  2.67s/it][A
Training...:  34% 4664/13907 [2:52:07<6:45:55,  2.63s/it][A
Training...:  34% 4665/13907 [2:52:10<6:39:21,  2.59s/it][A
Training...:  34% 4666/13907 [2:52:12<6:34:10,  2.56s/it][A
Training...:  34% 4667/13907 [2:52:15<6:29:28,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:34:29<26:06:17, 31325.86s/it]
Training...:  34% 4667/13907 [2:52:18<6:29:28,  2.53s/it][A
Training...:  34% 4668/13907 [2:52:18<6:42:14,  2.61s/it][A
Training...:  34% 4669/13907 [2:52:20<6:34:30,  2.56s/it][A
Training...:  34% 4670/13907 [2:52:22<6:23:04,  2.49s/it][A
Training...:  34% 4671/13907 [2:52:25<6:14:05,  2.43s/it][A
Training...:  34% 4672/13907 [2:52:27<6:06:56,  2.38s/it][A
Training...:  34% 4673/13907 [2:52:29<6:02:13,  2.35s/it][A
Training...:  34% 4674/13907 [2:52:31<5:55:58,  2.31s/it][A
Training...:  34% 4675/13907 [2:52:34<5:49:06,  2.27s/it][A
Training...:  34% 4676/13907 [2:52:36<5:42:26,  2.23s/it][A
Training...:  34% 4677/13907 [2:52:38<5:36:00,  2.18s/it][A
Training...:  34% 4678/13907 [2:52:40<5:30:00,  2.15s/it][A
Training...:  34% 4679/13907 [2:52:42<5:24:20,  2.11s/it][A
Training...:  34% 4680/13907 [2:52:44<5:19:18,  2.08s/it][A
Training...:  34% 4681/13907 [2:52:46<5:14:08,  2.04s/it][A
Training...:  34% 4682/13907 [2:52:48<5:08:56,  2.01s/it][A
Training...:  34% 4683/13907 [2:52:50<5:04:59,  1.98s/it][A
Training...:  34% 4684/13907 [2:52:52<5:00:14,  1.95s/it][A
Training...:  34% 4685/13907 [2:52:53<4:56:18,  1.93s/it][A
Training...:  34% 4686/13907 [2:52:55<4:52:50,  1.91s/it][A
Training...:  34% 4687/13907 [2:52:57<4:48:30,  1.88s/it][A
Training...:  34% 4688/13907 [2:52:59<4:43:02,  1.84s/it][A
Training...:  34% 4689/13907 [2:53:01<4:38:05,  1.81s/it][A
Training...:  34% 4690/13907 [2:53:02<4:33:15,  1.78s/it][A
Training...:  34% 4691/13907 [2:53:04<4:28:28,  1.75s/it][A
Training...:  34% 4692/13907 [2:53:06<4:22:43,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:35:19<26:06:17, 31325.86s/it]
Training...:  34% 4692/13907 [2:53:08<4:22:43,  1.71s/it][A
Training...:  34% 4693/13907 [2:53:08<4:31:30,  1.77s/it][A
Training...:  34% 4694/13907 [2:53:09<4:24:01,  1.72s/it][A
Training...:  34% 4695/13907 [2:53:11<4:16:14,  1.67s/it][A
Training...:  34% 4696/13907 [2:53:12<4:05:27,  1.60s/it][A
Training...:  34% 4697/13907 [2:53:14<3:56:36,  1.54s/it][A
Training...:  34% 4698/13907 [2:53:15<3:46:24,  1.48s/it][A
Training...:  34% 4699/13907 [2:53:16<3:34:44,  1.40s/it][A
Training...:  34% 4700/13907 [2:53:17<3:18:55,  1.30s/it][A
Training...:  34% 4701/13907 [2:53:21<5:07:06,  2.00s/it][A
Training...:  34% 4702/13907 [2:53:24<6:13:27,  2.43s/it][A
Training...:  34% 4703/13907 [2:53:27<6:51:50,  2.68s/it][A
Training...:  34% 4704/13907 [2:53:31<7:12:52,  2.82s/it][A
Training...:  34% 4705/13907 [2:53:34<7:23:58,  2.89s/it][A
Training...:  34% 4706/13907 [2:53:37<7:25:25,  2.90s/it][A
Training...:  34% 4707/13907 [2:53:39<7:23:36,  2.89s/it][A
Training...:  34% 4708/13907 [2:53:42<7:20:07,  2.87s/it][A
Training...:  34% 4709/13907 [2:53:45<7:14:13,  2.83s/it][A
Training...:  34% 4710/13907 [2:53:48<7:09:10,  2.80s/it][A
Training...:  34% 4711/13907 [2:53:50<7:01:38,  2.75s/it][A
Training...:  34% 4712/13907 [2:53:53<6:55:31,  2.71s/it][A
Training...:  34% 4713/13907 [2:53:56<6:50:52,  2.68s/it][A
Training...:  34% 4714/13907 [2:53:58<6:45:21,  2.65s/it][A
Training...:  34% 4715/13907 [2:54:01<6:39:15,  2.61s/it][A
Training...:  34% 4716/13907 [2:54:03<6:32:46,  2.56s/it][A
Training...:  34% 4717/13907 [2:54:06<6:26:44,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:36:20<26:06:17, 31325.86s/it]
Training...:  34% 4717/13907 [2:54:08<6:26:44,  2.53s/it][A
Training...:  34% 4718/13907 [2:54:08<6:38:39,  2.60s/it][A
Training...:  34% 4719/13907 [2:54:11<6:31:36,  2.56s/it][A
Training...:  34% 4720/13907 [2:54:13<6:22:25,  2.50s/it][A
Training...:  34% 4721/13907 [2:54:16<6:14:15,  2.44s/it][A
Training...:  34% 4722/13907 [2:54:18<6:06:58,  2.40s/it][A
Training...:  34% 4723/13907 [2:54:20<6:00:17,  2.35s/it][A
Training...:  34% 4724/13907 [2:54:22<5:54:11,  2.31s/it][A
Training...:  34% 4725/13907 [2:54:25<5:49:49,  2.29s/it][A
Training...:  34% 4726/13907 [2:54:27<5:44:29,  2.25s/it][A
Training...:  34% 4727/13907 [2:54:29<5:38:23,  2.21s/it][A
Training...:  34% 4728/13907 [2:54:31<5:32:00,  2.17s/it][A
Training...:  34% 4729/13907 [2:54:33<5:26:32,  2.13s/it][A
Training...:  34% 4730/13907 [2:54:35<5:22:02,  2.11s/it][A
Training...:  34% 4731/13907 [2:54:37<5:17:24,  2.08s/it][A
Training...:  34% 4732/13907 [2:54:39<5:11:41,  2.04s/it][A
Training...:  34% 4733/13907 [2:54:41<5:07:16,  2.01s/it][A
Training...:  34% 4734/13907 [2:54:43<5:02:09,  1.98s/it][A
Training...:  34% 4735/13907 [2:54:45<4:57:42,  1.95s/it][A
Training...:  34% 4736/13907 [2:54:46<4:53:17,  1.92s/it][A
Training...:  34% 4737/13907 [2:54:48<4:48:38,  1.89s/it][A
Training...:  34% 4738/13907 [2:54:50<4:44:06,  1.86s/it][A
Training...:  34% 4739/13907 [2:54:52<4:39:34,  1.83s/it][A
Training...:  34% 4740/13907 [2:54:54<4:35:14,  1.80s/it][A
Training...:  34% 4741/13907 [2:54:55<4:30:25,  1.77s/it][A
Training...:  34% 4742/13907 [2:54:57<4:25:53,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:37:10<26:06:17, 31325.86s/it]
Training...:  34% 4742/13907 [2:54:59<4:25:53,  1.74s/it][A
Training...:  34% 4743/13907 [2:54:59<4:33:35,  1.79s/it][A
Training...:  34% 4744/13907 [2:55:01<4:26:24,  1.74s/it][A
Training...:  34% 4745/13907 [2:55:02<4:16:19,  1.68s/it][A
Training...:  34% 4746/13907 [2:55:03<4:04:19,  1.60s/it][A
Training...:  34% 4747/13907 [2:55:05<3:53:21,  1.53s/it][A
Training...:  34% 4748/13907 [2:55:06<3:43:06,  1.46s/it][A
Training...:  34% 4749/13907 [2:55:07<3:31:19,  1.38s/it][A
Training...:  34% 4750/13907 [2:55:08<3:14:09,  1.27s/it][A
Training...:  34% 4751/13907 [2:55:12<5:06:45,  2.01s/it][A
Training...:  34% 4752/13907 [2:55:16<6:13:05,  2.45s/it][A
Training...:  34% 4753/13907 [2:55:19<6:49:59,  2.69s/it][A
Training...:  34% 4754/13907 [2:55:22<7:08:59,  2.81s/it][A
Training...:  34% 4755/13907 [2:55:25<7:19:34,  2.88s/it][A
Training...:  34% 4756/13907 [2:55:28<7:21:35,  2.90s/it][A
Training...:  34% 4757/13907 [2:55:31<7:20:48,  2.89s/it][A
Training...:  34% 4758/13907 [2:55:34<7:16:59,  2.87s/it][A
Training...:  34% 4759/13907 [2:55:36<7:13:51,  2.85s/it][A
Training...:  34% 4760/13907 [2:55:39<7:06:31,  2.80s/it][A
Training...:  34% 4761/13907 [2:55:42<7:01:40,  2.77s/it][A
Training...:  34% 4762/13907 [2:55:44<6:57:59,  2.74s/it][A
Training...:  34% 4763/13907 [2:55:47<6:54:11,  2.72s/it][A
Training...:  34% 4764/13907 [2:55:50<6:45:27,  2.66s/it][A
Training...:  34% 4765/13907 [2:55:52<6:38:39,  2.62s/it][A
Training...:  34% 4766/13907 [2:55:55<6:31:04,  2.57s/it][A
Training...:  34% 4767/13907 [2:55:57<6:24:42,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:38:11<26:06:17, 31325.86s/it]
Training...:  34% 4767/13907 [2:56:00<6:24:42,  2.53s/it][A
Training...:  34% 4768/13907 [2:56:00<6:38:38,  2.62s/it][A
Training...:  34% 4769/13907 [2:56:02<6:30:57,  2.57s/it][A
Training...:  34% 4770/13907 [2:56:05<6:20:39,  2.50s/it][A
Training...:  34% 4771/13907 [2:56:07<6:12:26,  2.45s/it][A
Training...:  34% 4772/13907 [2:56:09<6:04:37,  2.39s/it][A
Training...:  34% 4773/13907 [2:56:11<5:57:47,  2.35s/it][A
Training...:  34% 4774/13907 [2:56:14<5:52:00,  2.31s/it][A
Training...:  34% 4775/13907 [2:56:16<5:47:09,  2.28s/it][A
Training...:  34% 4776/13907 [2:56:18<5:41:18,  2.24s/it][A
Training...:  34% 4777/13907 [2:56:20<5:36:52,  2.21s/it][A
Training...:  34% 4778/13907 [2:56:22<5:30:56,  2.18s/it][A
Training...:  34% 4779/13907 [2:56:24<5:24:59,  2.14s/it][A
Training...:  34% 4780/13907 [2:56:26<5:19:26,  2.10s/it][A
Training...:  34% 4781/13907 [2:56:28<5:15:07,  2.07s/it][A
Training...:  34% 4782/13907 [2:56:30<5:09:54,  2.04s/it][A
Training...:  34% 4783/13907 [2:56:32<5:05:49,  2.01s/it][A
Training...:  34% 4784/13907 [2:56:34<5:00:47,  1.98s/it][A
Training...:  34% 4785/13907 [2:56:36<4:57:22,  1.96s/it][A
Training...:  34% 4786/13907 [2:56:38<4:52:01,  1.92s/it][A
Training...:  34% 4787/13907 [2:56:40<4:47:36,  1.89s/it][A
Training...:  34% 4788/13907 [2:56:41<4:42:20,  1.86s/it][A
Training...:  34% 4789/13907 [2:56:43<4:37:19,  1.82s/it][A
Training...:  34% 4790/13907 [2:56:45<4:31:53,  1.79s/it][A
Training...:  34% 4791/13907 [2:56:47<4:27:22,  1.76s/it][A
Training...:  34% 4792/13907 [2:56:48<4:21:13,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:39:01<26:06:17, 31325.86s/it]
Training...:  34% 4792/13907 [2:56:50<4:21:13,  1.72s/it][A
Training...:  34% 4793/13907 [2:56:50<4:29:50,  1.78s/it][A
Training...:  34% 4794/13907 [2:56:52<4:22:02,  1.73s/it][A
Training...:  34% 4795/13907 [2:56:53<4:11:59,  1.66s/it][A
Training...:  34% 4796/13907 [2:56:55<4:03:42,  1.60s/it][A
Training...:  34% 4797/13907 [2:56:56<3:55:00,  1.55s/it][A
Training...:  35% 4798/13907 [2:56:57<3:43:58,  1.48s/it][A
Training...:  35% 4799/13907 [2:56:59<3:32:42,  1.40s/it][A
Training...:  35% 4800/13907 [2:57:00<3:17:07,  1.30s/it][A
Training...:  35% 4801/13907 [2:57:04<5:09:44,  2.04s/it][A
Training...:  35% 4802/13907 [2:57:07<6:13:27,  2.46s/it][A
Training...:  35% 4803/13907 [2:57:10<6:47:38,  2.69s/it][A
Training...:  35% 4804/13907 [2:57:13<7:06:49,  2.81s/it][A
Training...:  35% 4805/13907 [2:57:16<7:17:18,  2.88s/it][A
Training...:  35% 4806/13907 [2:57:19<7:19:22,  2.90s/it][A
Training...:  35% 4807/13907 [2:57:22<7:18:21,  2.89s/it][A
Training...:  35% 4808/13907 [2:57:25<7:14:39,  2.87s/it][A
Training...:  35% 4809/13907 [2:57:28<7:10:16,  2.84s/it][A
Training...:  35% 4810/13907 [2:57:30<7:03:47,  2.80s/it][A
Training...:  35% 4811/13907 [2:57:33<6:57:28,  2.75s/it][A
Training...:  35% 4812/13907 [2:57:36<6:52:14,  2.72s/it][A
Training...:  35% 4813/13907 [2:57:38<6:45:38,  2.68s/it][A
Training...:  35% 4814/13907 [2:57:41<6:37:58,  2.63s/it][A
Training...:  35% 4815/13907 [2:57:43<6:31:03,  2.58s/it][A
Training...:  35% 4816/13907 [2:57:46<6:25:28,  2.54s/it][A
Training...:  35% 4817/13907 [2:57:48<6:20:02,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:40:02<26:06:17, 31325.86s/it]
Training...:  35% 4817/13907 [2:57:51<6:20:02,  2.51s/it][A
Training...:  35% 4818/13907 [2:57:51<6:31:35,  2.59s/it][A
Training...:  35% 4819/13907 [2:57:53<6:25:22,  2.54s/it][A
Training...:  35% 4820/13907 [2:57:56<6:16:41,  2.49s/it][A
Training...:  35% 4821/13907 [2:57:58<6:08:06,  2.43s/it][A
Training...:  35% 4822/13907 [2:58:00<5:58:53,  2.37s/it][A
Training...:  35% 4823/13907 [2:58:02<5:50:52,  2.32s/it][A
Training...:  35% 4824/13907 [2:58:05<5:45:39,  2.28s/it][A
Training...:  35% 4825/13907 [2:58:07<5:39:34,  2.24s/it][A
Training...:  35% 4826/13907 [2:58:09<5:32:44,  2.20s/it][A
Training...:  35% 4827/13907 [2:58:11<5:28:20,  2.17s/it][A
Training...:  35% 4828/13907 [2:58:13<5:23:06,  2.14s/it][A
Training...:  35% 4829/13907 [2:58:15<5:17:31,  2.10s/it][A
Training...:  35% 4830/13907 [2:58:17<5:13:26,  2.07s/it][A
Training...:  35% 4831/13907 [2:58:19<5:10:26,  2.05s/it][A
Training...:  35% 4832/13907 [2:58:21<5:07:58,  2.04s/it][A
Training...:  35% 4833/13907 [2:58:23<5:05:18,  2.02s/it][A
Training...:  35% 4834/13907 [2:58:25<5:00:27,  1.99s/it][A
Training...:  35% 4835/13907 [2:58:27<4:54:49,  1.95s/it][A
Training...:  35% 4836/13907 [2:58:29<4:48:13,  1.91s/it][A
Training...:  35% 4837/13907 [2:58:30<4:43:47,  1.88s/it][A
Training...:  35% 4838/13907 [2:58:32<4:38:35,  1.84s/it][A
Training...:  35% 4839/13907 [2:58:34<4:33:12,  1.81s/it][A
Training...:  35% 4840/13907 [2:58:36<4:27:44,  1.77s/it][A
Training...:  35% 4841/13907 [2:58:37<4:23:18,  1.74s/it][A
Training...:  35% 4842/13907 [2:58:39<4:17:57,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:40:52<26:06:17, 31325.86s/it]
Training...:  35% 4842/13907 [2:58:41<4:17:57,  1.71s/it][A
Training...:  35% 4843/13907 [2:58:41<4:26:22,  1.76s/it][A
Training...:  35% 4844/13907 [2:58:42<4:19:32,  1.72s/it][A
Training...:  35% 4845/13907 [2:58:44<4:09:17,  1.65s/it][A
Training...:  35% 4846/13907 [2:58:45<3:59:19,  1.58s/it][A
Training...:  35% 4847/13907 [2:58:47<3:51:03,  1.53s/it][A
Training...:  35% 4848/13907 [2:58:48<3:42:01,  1.47s/it][A
Training...:  35% 4849/13907 [2:58:49<3:30:15,  1.39s/it][A
Training...:  35% 4850/13907 [2:58:50<3:14:14,  1.29s/it][A
Training...:  35% 4851/13907 [2:58:54<5:04:19,  2.02s/it][A
Training...:  35% 4852/13907 [2:58:58<6:09:29,  2.45s/it][A
Training...:  35% 4853/13907 [2:59:01<6:46:08,  2.69s/it][A
Training...:  35% 4854/13907 [2:59:04<7:06:23,  2.83s/it][A
Training...:  35% 4855/13907 [2:59:07<7:16:52,  2.90s/it][A
Training...:  35% 4856/13907 [2:59:10<7:20:56,  2.92s/it][A
Training...:  35% 4857/13907 [2:59:13<7:19:38,  2.91s/it][A
Training...:  35% 4858/13907 [2:59:16<7:15:52,  2.89s/it][A
Training...:  35% 4859/13907 [2:59:19<7:14:00,  2.88s/it][A
Training...:  35% 4860/13907 [2:59:21<7:06:48,  2.83s/it][A
Training...:  35% 4861/13907 [2:59:24<7:02:07,  2.80s/it][A
Training...:  35% 4862/13907 [2:59:27<6:54:37,  2.75s/it][A
Training...:  35% 4863/13907 [2:59:29<6:47:56,  2.71s/it][A
Training...:  35% 4864/13907 [2:59:32<6:42:16,  2.67s/it][A
Training...:  35% 4865/13907 [2:59:34<6:36:13,  2.63s/it][A
Training...:  35% 4866/13907 [2:59:37<6:30:41,  2.59s/it][A
Training...:  35% 4867/13907 [2:59:39<6:24:48,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:41:53<26:06:17, 31325.86s/it]
Training...:  35% 4867/13907 [2:59:42<6:24:48,  2.55s/it][A
Training...:  35% 4868/13907 [2:59:42<6:36:44,  2.63s/it][A
Training...:  35% 4869/13907 [2:59:45<6:29:30,  2.59s/it][A
Training...:  35% 4870/13907 [2:59:47<6:18:14,  2.51s/it][A
Training...:  35% 4871/13907 [2:59:49<6:09:42,  2.45s/it][A
Training...:  35% 4872/13907 [2:59:52<6:03:36,  2.41s/it][A
Training...:  35% 4873/13907 [2:59:54<5:59:17,  2.39s/it][A
Training...:  35% 4874/13907 [2:59:56<5:54:58,  2.36s/it][A
Training...:  35% 4875/13907 [2:59:58<5:47:20,  2.31s/it][A
Training...:  35% 4876/13907 [3:00:01<5:40:14,  2.26s/it][A
Training...:  35% 4877/13907 [3:00:03<5:34:16,  2.22s/it][A
Training...:  35% 4878/13907 [3:00:05<5:28:00,  2.18s/it][A
Training...:  35% 4879/13907 [3:00:07<5:22:56,  2.15s/it][A
Training...:  35% 4880/13907 [3:00:09<5:17:50,  2.11s/it][A
Training...:  35% 4881/13907 [3:00:11<5:12:35,  2.08s/it][A
Training...:  35% 4882/13907 [3:00:13<5:06:48,  2.04s/it][A
Training...:  35% 4883/13907 [3:00:15<5:02:44,  2.01s/it][A
Training...:  35% 4884/13907 [3:00:17<4:58:57,  1.99s/it][A
Training...:  35% 4885/13907 [3:00:19<4:56:17,  1.97s/it][A
Training...:  35% 4886/13907 [3:00:20<4:52:07,  1.94s/it][A
Training...:  35% 4887/13907 [3:00:22<4:47:02,  1.91s/it][A
Training...:  35% 4888/13907 [3:00:24<4:42:17,  1.88s/it][A
Training...:  35% 4889/13907 [3:00:26<4:36:43,  1.84s/it][A
Training...:  35% 4890/13907 [3:00:28<4:29:50,  1.80s/it][A
Training...:  35% 4891/13907 [3:00:29<4:25:37,  1.77s/it][A
Training...:  35% 4892/13907 [3:00:31<4:19:13,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:42:44<26:06:17, 31325.86s/it]
Training...:  35% 4892/13907 [3:00:33<4:19:13,  1.73s/it][A
Training...:  35% 4893/13907 [3:00:33<4:27:01,  1.78s/it][A
Training...:  35% 4894/13907 [3:00:34<4:20:40,  1.74s/it][A
Training...:  35% 4895/13907 [3:00:36<4:09:52,  1.66s/it][A
Training...:  35% 4896/13907 [3:00:37<4:00:36,  1.60s/it][A
Training...:  35% 4897/13907 [3:00:39<3:51:09,  1.54s/it][A
Training...:  35% 4898/13907 [3:00:40<3:40:33,  1.47s/it][A
Training...:  35% 4899/13907 [3:00:41<3:28:55,  1.39s/it][A
Training...:  35% 4900/13907 [3:00:42<3:13:15,  1.29s/it][A
Training...:  35% 4901/13907 [3:00:46<5:02:31,  2.02s/it][A
Training...:  35% 4902/13907 [3:00:50<6:07:46,  2.45s/it][A
Training...:  35% 4903/13907 [3:00:53<6:45:51,  2.70s/it][A
Training...:  35% 4904/13907 [3:00:56<7:04:37,  2.83s/it][A
Training...:  35% 4905/13907 [3:00:59<7:12:53,  2.89s/it][A
Training...:  35% 4906/13907 [3:01:02<7:14:14,  2.89s/it][A
Training...:  35% 4907/13907 [3:01:05<7:13:11,  2.89s/it][A
Training...:  35% 4908/13907 [3:01:08<7:08:55,  2.86s/it][A
Training...:  35% 4909/13907 [3:01:10<7:02:49,  2.82s/it][A
Training...:  35% 4910/13907 [3:01:13<6:56:04,  2.77s/it][A
Training...:  35% 4911/13907 [3:01:16<6:51:31,  2.74s/it][A
Training...:  35% 4912/13907 [3:01:18<6:43:40,  2.69s/it][A
Training...:  35% 4913/13907 [3:01:21<6:38:08,  2.66s/it][A
Training...:  35% 4914/13907 [3:01:23<6:33:40,  2.63s/it][A
Training...:  35% 4915/13907 [3:01:26<6:29:48,  2.60s/it][A
Training...:  35% 4916/13907 [3:01:28<6:23:34,  2.56s/it][A
Training...:  35% 4917/13907 [3:01:31<6:17:28,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:43:45<26:06:17, 31325.86s/it]
Training...:  35% 4917/13907 [3:01:34<6:17:28,  2.52s/it][A
Training...:  35% 4918/13907 [3:01:34<6:28:49,  2.60s/it][A
Training...:  35% 4919/13907 [3:01:36<6:22:14,  2.55s/it][A
Training...:  35% 4920/13907 [3:01:38<6:10:52,  2.48s/it][A
Training...:  35% 4921/13907 [3:01:41<6:01:52,  2.42s/it][A
Training...:  35% 4922/13907 [3:01:43<5:52:47,  2.36s/it][A
Training...:  35% 4923/13907 [3:01:45<5:46:52,  2.32s/it][A
Training...:  35% 4924/13907 [3:01:47<5:39:52,  2.27s/it][A
Training...:  35% 4925/13907 [3:01:49<5:35:23,  2.24s/it][A
Training...:  35% 4926/13907 [3:01:51<5:28:19,  2.19s/it][A
Training...:  35% 4927/13907 [3:01:54<5:24:15,  2.17s/it][A
Training...:  35% 4928/13907 [3:01:56<5:19:41,  2.14s/it][A
Training...:  35% 4929/13907 [3:01:58<5:15:08,  2.11s/it][A
Training...:  35% 4930/13907 [3:02:00<5:10:16,  2.07s/it][A
Training...:  35% 4931/13907 [3:02:02<5:05:36,  2.04s/it][A
Training...:  35% 4932/13907 [3:02:04<5:01:34,  2.02s/it][A
Training...:  35% 4933/13907 [3:02:05<4:56:59,  1.99s/it][A
Training...:  35% 4934/13907 [3:02:07<4:52:04,  1.95s/it][A
Training...:  35% 4935/13907 [3:02:09<4:48:00,  1.93s/it][A
Training...:  35% 4936/13907 [3:02:11<4:43:02,  1.89s/it][A
Training...:  36% 4937/13907 [3:02:13<4:38:37,  1.86s/it][A
Training...:  36% 4938/13907 [3:02:15<4:33:22,  1.83s/it][A
Training...:  36% 4939/13907 [3:02:16<4:28:11,  1.79s/it][A
Training...:  36% 4940/13907 [3:02:18<4:23:08,  1.76s/it][A
Training...:  36% 4941/13907 [3:02:20<4:18:36,  1.73s/it][A
Training...:  36% 4942/13907 [3:02:21<4:13:37,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:44:34<26:06:17, 31325.86s/it]
Training...:  36% 4942/13907 [3:02:23<4:13:37,  1.70s/it][A
Training...:  36% 4943/13907 [3:02:23<4:22:48,  1.76s/it][A
Training...:  36% 4944/13907 [3:02:25<4:16:28,  1.72s/it][A
Training...:  36% 4945/13907 [3:02:26<4:06:56,  1.65s/it][A
Training...:  36% 4946/13907 [3:02:28<3:56:52,  1.59s/it][A
Training...:  36% 4947/13907 [3:02:29<3:47:38,  1.52s/it][A
Training...:  36% 4948/13907 [3:02:30<3:38:19,  1.46s/it][A
Training...:  36% 4949/13907 [3:02:32<3:26:22,  1.38s/it][A
Training...:  36% 4950/13907 [3:02:33<3:11:19,  1.28s/it][A
Training...:  36% 4951/13907 [3:02:37<5:07:45,  2.06s/it][A
Training...:  36% 4952/13907 [3:02:40<6:10:53,  2.49s/it][A
Training...:  36% 4953/13907 [3:02:43<6:46:01,  2.72s/it][A
Training...:  36% 4954/13907 [3:02:46<7:03:52,  2.84s/it][A
Training...:  36% 4955/13907 [3:02:49<7:13:33,  2.91s/it][A
Training...:  36% 4956/13907 [3:02:52<7:17:43,  2.93s/it][A
Training...:  36% 4957/13907 [3:02:55<7:18:13,  2.94s/it][A
Training...:  36% 4958/13907 [3:02:58<7:16:30,  2.93s/it][A
Training...:  36% 4959/13907 [3:03:01<7:12:45,  2.90s/it][A
Training...:  36% 4960/13907 [3:03:04<7:07:57,  2.87s/it][A
Training...:  36% 4961/13907 [3:03:07<6:58:40,  2.81s/it][A
Training...:  36% 4962/13907 [3:03:09<6:50:49,  2.76s/it][A
Training...:  36% 4963/13907 [3:03:12<6:43:22,  2.71s/it][A
Training...:  36% 4964/13907 [3:03:14<6:35:24,  2.65s/it][A
Training...:  36% 4965/13907 [3:03:17<6:30:32,  2.62s/it][A
Training...:  36% 4966/13907 [3:03:19<6:23:43,  2.58s/it][A
Training...:  36% 4967/13907 [3:03:22<6:17:04,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:45:36<26:06:17, 31325.86s/it]
Training...:  36% 4967/13907 [3:03:25<6:17:04,  2.53s/it][A
Training...:  36% 4968/13907 [3:03:25<6:30:59,  2.62s/it][A
Training...:  36% 4969/13907 [3:03:27<6:23:15,  2.57s/it][A
Training...:  36% 4970/13907 [3:03:29<6:13:31,  2.51s/it][A
Training...:  36% 4971/13907 [3:03:32<6:04:27,  2.45s/it][A
Training...:  36% 4972/13907 [3:03:34<5:56:53,  2.40s/it][A
Training...:  36% 4973/13907 [3:03:36<5:49:22,  2.35s/it][A
Training...:  36% 4974/13907 [3:03:38<5:42:55,  2.30s/it][A
Training...:  36% 4975/13907 [3:03:41<5:37:24,  2.27s/it][A
Training...:  36% 4976/13907 [3:03:43<5:31:53,  2.23s/it][A
Training...:  36% 4977/13907 [3:03:45<5:27:18,  2.20s/it][A
Training...:  36% 4978/13907 [3:03:47<5:21:22,  2.16s/it][A
Training...:  36% 4979/13907 [3:03:49<5:16:38,  2.13s/it][A
Training...:  36% 4980/13907 [3:03:51<5:12:16,  2.10s/it][A
Training...:  36% 4981/13907 [3:03:53<5:07:45,  2.07s/it][A
Training...:  36% 4982/13907 [3:03:55<5:05:05,  2.05s/it][A
Training...:  36% 4983/13907 [3:03:57<5:01:07,  2.02s/it][A
Training...:  36% 4984/13907 [3:03:59<4:55:35,  1.99s/it][A
Training...:  36% 4985/13907 [3:04:01<4:50:57,  1.96s/it][A
Training...:  36% 4986/13907 [3:04:03<4:46:08,  1.92s/it][A
Training...:  36% 4987/13907 [3:04:04<4:42:20,  1.90s/it][A
Training...:  36% 4988/13907 [3:04:06<4:38:11,  1.87s/it][A
Training...:  36% 4989/13907 [3:04:08<4:34:05,  1.84s/it][A
Training...:  36% 4990/13907 [3:04:10<4:29:41,  1.81s/it][A
Training...:  36% 4991/13907 [3:04:12<4:25:15,  1.78s/it][A
Training...:  36% 4992/13907 [3:04:13<4:19:27,  1.75s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:46:26<26:06:17, 31325.86s/it]
Training...:  36% 4992/13907 [3:04:15<4:19:27,  1.75s/it][A
Training...:  36% 4993/13907 [3:04:15<4:26:11,  1.79s/it][A
Training...:  36% 4994/13907 [3:04:17<4:18:39,  1.74s/it][A
Training...:  36% 4995/13907 [3:04:18<4:08:43,  1.67s/it][A
Training...:  36% 4996/13907 [3:04:20<3:59:06,  1.61s/it][A
Training...:  36% 4997/13907 [3:04:21<3:48:57,  1.54s/it][A
Training...:  36% 4998/13907 [3:04:22<3:38:43,  1.47s/it][A
Training...:  36% 4999/13907 [3:04:24<3:27:49,  1.40s/it][A
Training...:  36% 5000/13907 [3:04:25<3:13:39,  1.30s/it][A
Training...:  36% 5001/13907 [3:04:28<5:01:32,  2.03s/it][A
Training...:  36% 5002/13907 [3:04:32<6:04:53,  2.46s/it][A
Training...:  36% 5003/13907 [3:04:35<6:38:47,  2.69s/it][A
Training...:  36% 5004/13907 [3:04:38<6:56:42,  2.81s/it][A
Training...:  36% 5005/13907 [3:04:41<7:05:27,  2.87s/it][A
Training...:  36% 5006/13907 [3:04:44<7:06:00,  2.87s/it][A
Training...:  36% 5007/13907 [3:04:47<7:05:47,  2.87s/it][A
Training...:  36% 5008/13907 [3:04:50<7:01:58,  2.85s/it][A
Training...:  36% 5009/13907 [3:04:52<6:56:56,  2.81s/it][A
Training...:  36% 5010/13907 [3:04:55<6:52:25,  2.78s/it][A
Training...:  36% 5011/13907 [3:04:58<6:45:24,  2.73s/it][A
Training...:  36% 5012/13907 [3:05:00<6:38:20,  2.69s/it][A
Training...:  36% 5013/13907 [3:05:03<6:31:46,  2.64s/it][A
Training...:  36% 5014/13907 [3:05:05<6:27:07,  2.61s/it][A
Training...:  36% 5015/13907 [3:05:08<6:20:52,  2.57s/it][A
Training...:  36% 5016/13907 [3:05:10<6:14:28,  2.53s/it][A
Training...:  36% 5017/13907 [3:05:13<6:08:36,  2.49s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:47:27<26:06:17, 31325.86s/it]
Training...:  36% 5017/13907 [3:05:16<6:08:36,  2.49s/it][A
Training...:  36% 5018/13907 [3:05:16<6:23:34,  2.59s/it][A
Training...:  36% 5019/13907 [3:05:18<6:15:47,  2.54s/it][A
Training...:  36% 5020/13907 [3:05:20<6:05:24,  2.47s/it][A
Training...:  36% 5021/13907 [3:05:23<5:55:58,  2.40s/it][A
Training...:  36% 5022/13907 [3:05:25<5:49:11,  2.36s/it][A
Training...:  36% 5023/13907 [3:05:27<5:44:28,  2.33s/it][A
Training...:  36% 5024/13907 [3:05:29<5:37:44,  2.28s/it][A
Training...:  36% 5025/13907 [3:05:31<5:32:19,  2.24s/it][A
Training...:  36% 5026/13907 [3:05:34<5:27:56,  2.22s/it][A
Training...:  36% 5027/13907 [3:05:36<5:24:54,  2.20s/it][A
Training...:  36% 5028/13907 [3:05:38<5:18:52,  2.15s/it][A
Training...:  36% 5029/13907 [3:05:40<5:15:44,  2.13s/it][A
Training...:  36% 5030/13907 [3:05:42<5:11:10,  2.10s/it][A
Training...:  36% 5031/13907 [3:05:44<5:06:43,  2.07s/it][A
Training...:  36% 5032/13907 [3:05:46<5:01:50,  2.04s/it][A
Training...:  36% 5033/13907 [3:05:48<4:57:35,  2.01s/it][A
Training...:  36% 5034/13907 [3:05:50<4:51:56,  1.97s/it][A
Training...:  36% 5035/13907 [3:05:52<4:47:12,  1.94s/it][A
Training...:  36% 5036/13907 [3:05:53<4:42:28,  1.91s/it][A
Training...:  36% 5037/13907 [3:05:55<4:39:41,  1.89s/it][A
Training...:  36% 5038/13907 [3:05:57<4:35:53,  1.87s/it][A
Training...:  36% 5039/13907 [3:05:59<4:30:02,  1.83s/it][A
Training...:  36% 5040/13907 [3:06:00<4:24:15,  1.79s/it][A
Training...:  36% 5041/13907 [3:06:02<4:18:56,  1.75s/it][A
Training...:  36% 5042/13907 [3:06:04<4:12:54,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:48:17<26:06:17, 31325.86s/it]
Training...:  36% 5042/13907 [3:06:06<4:12:54,  1.71s/it][A
Training...:  36% 5043/13907 [3:06:06<4:21:25,  1.77s/it][A
Training...:  36% 5044/13907 [3:06:07<4:13:41,  1.72s/it][A
Training...:  36% 5045/13907 [3:06:09<4:03:36,  1.65s/it][A
Training...:  36% 5046/13907 [3:06:10<3:53:23,  1.58s/it][A
Training...:  36% 5047/13907 [3:06:12<3:43:40,  1.51s/it][A
Training...:  36% 5048/13907 [3:06:13<3:35:06,  1.46s/it][A
Training...:  36% 5049/13907 [3:06:14<3:24:27,  1.38s/it][A
Training...:  36% 5050/13907 [3:06:15<3:08:49,  1.28s/it][A
Training...:  36% 5051/13907 [3:06:19<4:57:29,  2.02s/it][A
Training...:  36% 5052/13907 [3:06:22<5:57:47,  2.42s/it][A
Training...:  36% 5053/13907 [3:06:25<6:33:41,  2.67s/it][A
Training...:  36% 5054/13907 [3:06:29<6:53:48,  2.80s/it][A
Training...:  36% 5055/13907 [3:06:32<7:05:32,  2.88s/it][A
Training...:  36% 5056/13907 [3:06:35<7:07:55,  2.90s/it][A
Training...:  36% 5057/13907 [3:06:38<7:09:40,  2.91s/it][A
Training...:  36% 5058/13907 [3:06:40<7:07:06,  2.90s/it][A
Training...:  36% 5059/13907 [3:06:43<7:00:37,  2.85s/it][A
Training...:  36% 5060/13907 [3:06:46<6:53:27,  2.80s/it][A
Training...:  36% 5061/13907 [3:06:48<6:45:44,  2.75s/it][A
Training...:  36% 5062/13907 [3:06:51<6:38:33,  2.70s/it][A
Training...:  36% 5063/13907 [3:06:54<6:32:58,  2.67s/it][A
Training...:  36% 5064/13907 [3:06:56<6:27:39,  2.63s/it][A
Training...:  36% 5065/13907 [3:06:59<6:21:41,  2.59s/it][A
Training...:  36% 5066/13907 [3:07:01<6:15:45,  2.55s/it][A
Training...:  36% 5067/13907 [3:07:04<6:10:54,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:49:18<26:06:17, 31325.86s/it]
Training...:  36% 5067/13907 [3:07:06<6:10:54,  2.52s/it][A
Training...:  36% 5068/13907 [3:07:06<6:25:58,  2.62s/it][A
Training...:  36% 5069/13907 [3:07:09<6:17:52,  2.57s/it][A
Training...:  36% 5070/13907 [3:07:11<6:07:02,  2.49s/it][A
Training...:  36% 5071/13907 [3:07:13<5:59:02,  2.44s/it][A
Training...:  36% 5072/13907 [3:07:16<5:50:24,  2.38s/it][A
Training...:  36% 5073/13907 [3:07:18<5:44:04,  2.34s/it][A
Training...:  36% 5074/13907 [3:07:20<5:37:46,  2.29s/it][A
Training...:  36% 5075/13907 [3:07:22<5:32:38,  2.26s/it][A
Training...:  36% 5076/13907 [3:07:24<5:27:46,  2.23s/it][A
Training...:  37% 5077/13907 [3:07:27<5:22:52,  2.19s/it][A
Training...:  37% 5078/13907 [3:07:29<5:18:10,  2.16s/it][A
Training...:  37% 5079/13907 [3:07:31<5:12:56,  2.13s/it][A
Training...:  37% 5080/13907 [3:07:33<5:07:29,  2.09s/it][A
Training...:  37% 5081/13907 [3:07:35<5:02:45,  2.06s/it][A
Training...:  37% 5082/13907 [3:07:37<4:58:16,  2.03s/it][A
Training...:  37% 5083/13907 [3:07:39<4:54:57,  2.01s/it][A
Training...:  37% 5084/13907 [3:07:41<4:51:03,  1.98s/it][A
Training...:  37% 5085/13907 [3:07:42<4:47:38,  1.96s/it][A
Training...:  37% 5086/13907 [3:07:44<4:42:11,  1.92s/it][A
Training...:  37% 5087/13907 [3:07:46<4:37:39,  1.89s/it][A
Training...:  37% 5088/13907 [3:07:48<4:32:22,  1.85s/it][A
Training...:  37% 5089/13907 [3:07:50<4:28:24,  1.83s/it][A
Training...:  37% 5090/13907 [3:07:51<4:24:30,  1.80s/it][A
Training...:  37% 5091/13907 [3:07:53<4:19:24,  1.77s/it][A
Training...:  37% 5092/13907 [3:07:55<4:13:32,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:50:08<26:06:17, 31325.86s/it]
Training...:  37% 5092/13907 [3:07:57<4:13:32,  1.73s/it][A
Training...:  37% 5093/13907 [3:07:57<4:22:47,  1.79s/it][A
Training...:  37% 5094/13907 [3:07:58<4:16:52,  1.75s/it][A
Training...:  37% 5095/13907 [3:08:00<4:07:37,  1.69s/it][A
Training...:  37% 5096/13907 [3:08:01<3:58:18,  1.62s/it][A
Training...:  37% 5097/13907 [3:08:03<3:49:20,  1.56s/it][A
Training...:  37% 5098/13907 [3:08:04<3:39:37,  1.50s/it][A
Training...:  37% 5099/13907 [3:08:05<3:29:06,  1.42s/it][A
Training...:  37% 5100/13907 [3:08:06<3:13:58,  1.32s/it][A
Training...:  37% 5101/13907 [3:08:10<5:03:21,  2.07s/it][A
Training...:  37% 5102/13907 [3:08:14<6:04:07,  2.48s/it][A
Training...:  37% 5103/13907 [3:08:17<6:37:48,  2.71s/it][A
Training...:  37% 5104/13907 [3:08:20<6:55:03,  2.83s/it][A
Training...:  37% 5105/13907 [3:08:23<7:04:26,  2.89s/it][A
Training...:  37% 5106/13907 [3:08:26<7:05:52,  2.90s/it][A
Training...:  37% 5107/13907 [3:08:29<7:05:03,  2.90s/it][A
Training...:  37% 5108/13907 [3:08:32<6:58:56,  2.86s/it][A
Training...:  37% 5109/13907 [3:08:34<6:54:00,  2.82s/it][A
Training...:  37% 5110/13907 [3:08:37<6:48:05,  2.78s/it][A
Training...:  37% 5111/13907 [3:08:40<6:42:28,  2.75s/it][A
Training...:  37% 5112/13907 [3:08:42<6:35:44,  2.70s/it][A
Training...:  37% 5113/13907 [3:08:45<6:29:22,  2.66s/it][A
Training...:  37% 5114/13907 [3:08:47<6:23:34,  2.62s/it][A
Training...:  37% 5115/13907 [3:08:50<6:17:44,  2.58s/it][A
Training...:  37% 5116/13907 [3:08:52<6:12:56,  2.55s/it][A
Training...:  37% 5117/13907 [3:08:55<6:08:06,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:51:09<26:06:17, 31325.86s/it]
Training...:  37% 5117/13907 [3:08:58<6:08:06,  2.51s/it][A
Training...:  37% 5118/13907 [3:08:58<6:20:28,  2.60s/it][A
Training...:  37% 5119/13907 [3:09:00<6:14:10,  2.55s/it][A
Training...:  37% 5120/13907 [3:09:02<6:02:47,  2.48s/it][A
Training...:  37% 5121/13907 [3:09:05<5:53:47,  2.42s/it][A
Training...:  37% 5122/13907 [3:09:07<5:46:38,  2.37s/it][A
Training...:  37% 5123/13907 [3:09:09<5:39:13,  2.32s/it][A
Training...:  37% 5124/13907 [3:09:11<5:32:44,  2.27s/it][A
Training...:  37% 5125/13907 [3:09:13<5:28:03,  2.24s/it][A
Training...:  37% 5126/13907 [3:09:16<5:24:29,  2.22s/it][A
Training...:  37% 5127/13907 [3:09:18<5:19:26,  2.18s/it][A
Training...:  37% 5128/13907 [3:09:20<5:13:49,  2.14s/it][A
Training...:  37% 5129/13907 [3:09:22<5:08:50,  2.11s/it][A
Training...:  37% 5130/13907 [3:09:24<5:03:24,  2.07s/it][A
Training...:  37% 5131/13907 [3:09:26<4:59:43,  2.05s/it][A
Training...:  37% 5132/13907 [3:09:28<4:56:06,  2.02s/it][A
Training...:  37% 5133/13907 [3:09:30<4:53:02,  2.00s/it][A
Training...:  37% 5134/13907 [3:09:32<4:47:10,  1.96s/it][A
Training...:  37% 5135/13907 [3:09:33<4:42:25,  1.93s/it][A
Training...:  37% 5136/13907 [3:09:35<4:40:05,  1.92s/it][A
Training...:  37% 5137/13907 [3:09:37<4:35:10,  1.88s/it][A
Training...:  37% 5138/13907 [3:09:39<4:32:01,  1.86s/it][A
Training...:  37% 5139/13907 [3:09:41<4:28:16,  1.84s/it][A
Training...:  37% 5140/13907 [3:09:42<4:23:10,  1.80s/it][A
Training...:  37% 5141/13907 [3:09:44<4:18:33,  1.77s/it][A
Training...:  37% 5142/13907 [3:09:46<4:13:52,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:51:59<26:06:17, 31325.86s/it]
Training...:  37% 5142/13907 [3:09:48<4:13:52,  1.74s/it][A
Training...:  37% 5143/13907 [3:09:48<4:23:13,  1.80s/it][A
Training...:  37% 5144/13907 [3:09:49<4:16:03,  1.75s/it][A
Training...:  37% 5145/13907 [3:09:51<4:08:07,  1.70s/it][A
Training...:  37% 5146/13907 [3:09:52<3:56:56,  1.62s/it][A
Training...:  37% 5147/13907 [3:09:54<3:47:33,  1.56s/it][A
Training...:  37% 5148/13907 [3:09:55<3:37:56,  1.49s/it][A
Training...:  37% 5149/13907 [3:09:56<3:26:21,  1.41s/it][A
Training...:  37% 5150/13907 [3:09:57<3:10:29,  1.31s/it][A
Training...:  37% 5151/13907 [3:10:01<4:57:02,  2.04s/it][A
Training...:  37% 5152/13907 [3:10:05<6:01:36,  2.48s/it][A
Training...:  37% 5153/13907 [3:10:08<6:35:50,  2.71s/it][A
Training...:  37% 5154/13907 [3:10:11<6:52:47,  2.83s/it][A
Training...:  37% 5155/13907 [3:10:14<7:03:32,  2.90s/it][A
Training...:  37% 5156/13907 [3:10:17<7:04:46,  2.91s/it][A
Training...:  37% 5157/13907 [3:10:20<7:03:48,  2.91s/it][A
Training...:  37% 5158/13907 [3:10:23<6:59:19,  2.88s/it][A
Training...:  37% 5159/13907 [3:10:25<6:55:47,  2.85s/it][A
Training...:  37% 5160/13907 [3:10:28<6:49:10,  2.81s/it][A
Training...:  37% 5161/13907 [3:10:31<6:42:15,  2.76s/it][A
Training...:  37% 5162/13907 [3:10:33<6:36:07,  2.72s/it][A
Training...:  37% 5163/13907 [3:10:36<6:29:44,  2.67s/it][A
Training...:  37% 5164/13907 [3:10:39<6:22:55,  2.63s/it][A
Training...:  37% 5165/13907 [3:10:41<6:17:53,  2.59s/it][A
Training...:  37% 5166/13907 [3:10:44<6:11:54,  2.55s/it][A
Training...:  37% 5167/13907 [3:10:46<6:06:48,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:53:00<26:06:17, 31325.86s/it]
Training...:  37% 5167/13907 [3:10:49<6:06:48,  2.52s/it][A
Training...:  37% 5168/13907 [3:10:49<6:20:13,  2.61s/it][A
Training...:  37% 5169/13907 [3:10:51<6:12:29,  2.56s/it][A
Training...:  37% 5170/13907 [3:10:54<6:01:53,  2.49s/it][A
Training...:  37% 5171/13907 [3:10:56<5:55:15,  2.44s/it][A
Training...:  37% 5172/13907 [3:10:58<5:47:11,  2.38s/it][A
Training...:  37% 5173/13907 [3:11:00<5:42:11,  2.35s/it][A
Training...:  37% 5174/13907 [3:11:03<5:36:26,  2.31s/it][A
Training...:  37% 5175/13907 [3:11:05<5:32:02,  2.28s/it][A
Training...:  37% 5176/13907 [3:11:07<5:28:29,  2.26s/it][A
Training...:  37% 5177/13907 [3:11:09<5:23:57,  2.23s/it][A
Training...:  37% 5178/13907 [3:11:11<5:18:15,  2.19s/it][A
Training...:  37% 5179/13907 [3:11:13<5:13:10,  2.15s/it][A
Training...:  37% 5180/13907 [3:11:15<5:08:33,  2.12s/it][A
Training...:  37% 5181/13907 [3:11:17<5:03:51,  2.09s/it][A
Training...:  37% 5182/13907 [3:11:19<4:58:34,  2.05s/it][A
Training...:  37% 5183/13907 [3:11:21<4:54:08,  2.02s/it][A
Training...:  37% 5184/13907 [3:11:23<4:49:53,  1.99s/it][A
Training...:  37% 5185/13907 [3:11:25<4:46:10,  1.97s/it][A
Training...:  37% 5186/13907 [3:11:27<4:41:01,  1.93s/it][A
Training...:  37% 5187/13907 [3:11:29<4:35:55,  1.90s/it][A
Training...:  37% 5188/13907 [3:11:31<4:32:49,  1.88s/it][A
Training...:  37% 5189/13907 [3:11:32<4:28:19,  1.85s/it][A
Training...:  37% 5190/13907 [3:11:34<4:23:47,  1.82s/it][A
Training...:  37% 5191/13907 [3:11:36<4:18:57,  1.78s/it][A
Training...:  37% 5192/13907 [3:11:38<4:12:32,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:53:51<26:06:17, 31325.86s/it]
Training...:  37% 5192/13907 [3:11:39<4:12:32,  1.74s/it][A
Training...:  37% 5193/13907 [3:11:39<4:20:37,  1.79s/it][A
Training...:  37% 5194/13907 [3:11:41<4:13:48,  1.75s/it][A
Training...:  37% 5195/13907 [3:11:43<4:04:12,  1.68s/it][A
Training...:  37% 5196/13907 [3:11:44<3:53:44,  1.61s/it][A
Training...:  37% 5197/13907 [3:11:45<3:43:28,  1.54s/it][A
Training...:  37% 5198/13907 [3:11:47<3:34:36,  1.48s/it][A
Training...:  37% 5199/13907 [3:11:48<3:23:09,  1.40s/it][A
Training...:  37% 5200/13907 [3:11:49<3:06:57,  1.29s/it][A
Training...:  37% 5201/13907 [3:11:53<4:56:58,  2.05s/it][A
Training...:  37% 5202/13907 [3:11:56<5:57:04,  2.46s/it][A
Training...:  37% 5203/13907 [3:12:00<6:33:27,  2.71s/it][A
Training...:  37% 5204/13907 [3:12:03<6:50:59,  2.83s/it][A
Training...:  37% 5205/13907 [3:12:06<7:00:04,  2.90s/it][A
Training...:  37% 5206/13907 [3:12:09<7:01:05,  2.90s/it][A
Training...:  37% 5207/13907 [3:12:11<6:59:07,  2.89s/it][A
Training...:  37% 5208/13907 [3:12:14<6:54:23,  2.86s/it][A
Training...:  37% 5209/13907 [3:12:17<6:49:34,  2.83s/it][A
Training...:  37% 5210/13907 [3:12:20<6:44:03,  2.79s/it][A
Training...:  37% 5211/13907 [3:12:22<6:37:46,  2.74s/it][A
Training...:  37% 5212/13907 [3:12:25<6:30:37,  2.70s/it][A
Training...:  37% 5213/13907 [3:12:27<6:24:05,  2.65s/it][A
Training...:  37% 5214/13907 [3:12:30<6:19:04,  2.62s/it][A
Training...:  37% 5215/13907 [3:12:33<6:12:47,  2.57s/it][A
Training...:  38% 5216/13907 [3:12:35<6:07:18,  2.54s/it][A
Training...:  38% 5217/13907 [3:12:37<6:02:05,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:54:51<26:06:17, 31325.86s/it]
Training...:  38% 5217/13907 [3:12:40<6:02:05,  2.50s/it][A
Training...:  38% 5218/13907 [3:12:40<6:14:18,  2.58s/it][A
Training...:  38% 5219/13907 [3:12:43<6:08:40,  2.55s/it][A
Training...:  38% 5220/13907 [3:12:45<5:57:59,  2.47s/it][A
Training...:  38% 5221/13907 [3:12:47<5:49:04,  2.41s/it][A
Training...:  38% 5222/13907 [3:12:49<5:42:20,  2.37s/it][A
Training...:  38% 5223/13907 [3:12:52<5:36:20,  2.32s/it][A
Training...:  38% 5224/13907 [3:12:54<5:31:35,  2.29s/it][A
Training...:  38% 5225/13907 [3:12:56<5:27:28,  2.26s/it][A
Training...:  38% 5226/13907 [3:12:58<5:23:16,  2.23s/it][A
Training...:  38% 5227/13907 [3:13:00<5:18:25,  2.20s/it][A
Training...:  38% 5228/13907 [3:13:02<5:13:23,  2.17s/it][A
Training...:  38% 5229/13907 [3:13:05<5:09:40,  2.14s/it][A
Training...:  38% 5230/13907 [3:13:07<5:05:54,  2.12s/it][A
Training...:  38% 5231/13907 [3:13:09<5:01:50,  2.09s/it][A
Training...:  38% 5232/13907 [3:13:11<4:57:38,  2.06s/it][A
Training...:  38% 5233/13907 [3:13:13<4:53:53,  2.03s/it][A
Training...:  38% 5234/13907 [3:13:14<4:49:10,  2.00s/it][A
Training...:  38% 5235/13907 [3:13:16<4:44:31,  1.97s/it][A
Training...:  38% 5236/13907 [3:13:18<4:40:43,  1.94s/it][A
Training...:  38% 5237/13907 [3:13:20<4:38:27,  1.93s/it][A
Training...:  38% 5238/13907 [3:13:22<4:36:29,  1.91s/it][A
Training...:  38% 5239/13907 [3:13:24<4:30:27,  1.87s/it][A
Training...:  38% 5240/13907 [3:13:26<4:24:03,  1.83s/it][A
Training...:  38% 5241/13907 [3:13:27<4:19:03,  1.79s/it][A
Training...:  38% 5242/13907 [3:13:29<4:13:10,  1.75s/it][A                                                                                                                            
                                                         [AStep... (17400 | Loss: 0.20986860990524292, Learning Rate: 0.00019758183043450117, Gradient Norm: 0.7543262839317322)
Step... (17425 | Loss: 0.26128703355789185, Learning Rate: 0.00019743031589314342, Gradient Norm: 0.946197509765625)
Step... (17450 | Loss: 0.27385973930358887, Learning Rate: 0.00019727880135178566, Gradient Norm: 0.9672892689704895)
Step... (17475 | Loss: 0.2016754448413849, Learning Rate: 0.0001971272868104279, Gradient Norm: 0.8177315592765808)
Step... (17500 | Loss: 0.22914204001426697, Learning Rate: 0.00019697577226907015, Gradient Norm: 1.2647011280059814)
Step... (17525 | Loss: 0.2197059839963913, Learning Rate: 0.0001968242577277124, Gradient Norm: 0.8578084111213684)
Step... (17550 | Loss: 0.2052936851978302, Learning Rate: 0.0001966727286344394, Gradient Norm: 1.2933295965194702)
Step... (17575 | Loss: 0.25708454847335815, Learning Rate: 0.00019652122864499688, Gradient Norm: 0.9843124151229858)
Step... (17600 | Loss: 0.3412100672721863, Learning Rate: 0.00019636971410363913, Gradient Norm: 1.2213187217712402)
Step... (17625 | Loss: 0.3279387056827545, Learning Rate: 0.00019621818501036614, Gradient Norm: 1.145259141921997)
Step... (17650 | Loss: 0.2686021327972412, Learning Rate: 0.00019606668502092361, Gradient Norm: 1.178476095199585)
Step... (17675 | Loss: 0.25774502754211426, Learning Rate: 0.00019591517047956586, Gradient Norm: 0.8454189300537109)
Step... (17700 | Loss: 0.21686847507953644, Learning Rate: 0.00019576364138629287, Gradient Norm: 1.0871535539627075)
Step... (17725 | Loss: 0.24350666999816895, Learning Rate: 0.0001956121122930199, Gradient Norm: 1.071779489517212)
Step... (17750 | Loss: 0.2945038080215454, Learning Rate: 0.0001954606268554926, Gradient Norm: 1.2184758186340332)
Step... (17775 | Loss: 0.2966160774230957, Learning Rate: 0.0001953090977622196, Gradient Norm: 0.8289816379547119)
Step... (17800 | Loss: 0.23228819668293, Learning Rate: 0.00019515756866894662, Gradient Norm: 1.1304361820220947)
Step... (17825 | Loss: 0.23022769391536713, Learning Rate: 0.00019500608323141932, Gradient Norm: 0.8315244913101196)
Step... (17850 | Loss: 0.2513423562049866, Learning Rate: 0.00019485455413814634, Gradient Norm: 0.9493256211280823)
Step... (17875 | Loss: 0.24329686164855957, Learning Rate: 0.00019470302504487336, Gradient Norm: 0.8637142181396484)
Step... (17900 | Loss: 0.20876504480838776, Learning Rate: 0.00019455153960734606, Gradient Norm: 1.2389049530029297)
Step... (17925 | Loss: 0.2656596899032593, Learning Rate: 0.00019440001051407307, Gradient Norm: 1.7371693849563599)
Step... (17950 | Loss: 0.2337440848350525, Learning Rate: 0.0001942484814208001, Gradient Norm: 1.338148593902588)
Step... (17975 | Loss: 0.26145535707473755, Learning Rate: 0.0001940969959832728, Gradient Norm: 1.0952186584472656)
Step... (18000 | Loss: 0.24450409412384033, Learning Rate: 0.0001939454668899998, Gradient Norm: 0.7507619261741638)
Step... (18025 | Loss: 0.29435086250305176, Learning Rate: 0.00019379393779672682, Gradient Norm: 0.9286115765571594)
Step... (18050 | Loss: 0.23788578808307648, Learning Rate: 0.00019364245235919952, Gradient Norm: 1.2998969554901123)
Step... (18075 | Loss: 0.2603091299533844, Learning Rate: 0.00019349092326592654, Gradient Norm: 0.7833796739578247)
Step... (18100 | Loss: 0.17034944891929626, Learning Rate: 0.00019333939417265356, Gradient Norm: 0.9719182848930359)
Step... (18125 | Loss: 0.27542489767074585, Learning Rate: 0.00019318790873512626, Gradient Norm: 1.0980937480926514)
Step... (18150 | Loss: 0.2597798705101013, Learning Rate: 0.00019303637964185327, Gradient Norm: 0.8700869679450989)
Step... (18175 | Loss: 0.31677085161209106, Learning Rate: 0.0001928848505485803, Gradient Norm: 0.9797035455703735)
Step... (18200 | Loss: 0.1798236072063446, Learning Rate: 0.00019273333600722253, Gradient Norm: 0.7167489528656006)
Step... (18225 | Loss: 0.2545256018638611, Learning Rate: 0.00019258183601778, Gradient Norm: 1.050371766090393)
Step... (18250 | Loss: 0.2586486041545868, Learning Rate: 0.00019243030692450702, GradiEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:55:42<26:06:17, 31325.86s/it]
Training...:  38% 5242/13907 [3:13:31<4:13:10,  1.75s/it][A
Training...:  38% 5243/13907 [3:13:31<4:20:24,  1.80s/it][Aent Norm: 1.1012049913406372)
Step... (18275 | Loss: 0.26368820667266846, Learning Rate: 0.00019227879238314927, Gradient Norm: 0.9264082908630371)
Step... (18300 | Loss: 0.25225189328193665, Learning Rate: 0.0001921272778417915, Gradient Norm: 1.0065195560455322)
Step... (18325 | Loss: 0.2789246439933777, Learning Rate: 0.00019197576330043375, Gradient Norm: 0.942538857460022)
Step... (18350 | Loss: 0.20966795086860657, Learning Rate: 0.000191824248759076, Gradient Norm: 0.7660261392593384)
Step... (18375 | Loss: 0.23900040984153748, Learning Rate: 0.00019167273421771824, Gradient Norm: 0.7673358917236328)
Step... (18400 | Loss: 0.2550625503063202, Learning Rate: 0.0001915212196763605, Gradient Norm: 1.2883198261260986)
Step... (18425 | Loss: 0.24641895294189453, Learning Rate: 0.00019136970513500273, Gradient Norm: 1.012923240661621)
Step... (18450 | Loss: 0.21380753815174103, Learning Rate: 0.00019121819059364498, Gradient Norm: 0.7296828627586365)
Step... (18475 | Loss: 0.24290063977241516, Learning Rate: 0.000191066661500372, Gradient Norm: 0.757965087890625)
Step... (18500 | Loss: 0.20973122119903564, Learning Rate: 0.00019091516151092947, Gradient Norm: 0.9525671601295471)
Step... (18525 | Loss: 0.31908512115478516, Learning Rate: 0.0001907636469695717, Gradient Norm: 1.166573405265808)
Step... (18550 | Loss: 0.34518471360206604, Learning Rate: 0.00019061211787629873, Gradient Norm: 1.336597204208374)
Step... (18575 | Loss: 0.24099096655845642, Learning Rate: 0.0001904606178868562, Gradient Norm: 0.848572313785553)
Step... (18600 | Loss: 0.20933125913143158, Learning Rate: 0.00019030910334549844, Gradient Norm: 1.1301125288009644)
Step... (18625 | Loss: 0.23212744295597076, Learning Rate: 0.00019015757425222546, Gradient Norm: 0.7334737181663513)
Step... (18650 | Loss: 0.21553108096122742, Learning Rate: 0.00019000607426278293, Gradient Norm: 0.7398407459259033)
Step... (18675 | Loss: 0.2560436725616455, Learning Rate: 0.00018985455972142518, Gradient Norm: 0.974983811378479)
Step... (18700 | Loss: 0.25357937812805176, Learning Rate: 0.0001897030306281522, Gradient Norm: 0.9759661555290222)
Step... (18725 | Loss: 0.23056244850158691, Learning Rate: 0.00018955153063870966, Gradient Norm: 1.039198637008667)
Step... (18750 | Loss: 0.31062179803848267, Learning Rate: 0.0001894000160973519, Gradient Norm: 1.5206046104431152)
Step... (18775 | Loss: 0.2691361904144287, Learning Rate: 0.00018924848700407892, Gradient Norm: 0.8498005867004395)
Step... (18800 | Loss: 0.23585094511508942, Learning Rate: 0.00018909697246272117, Gradient Norm: 1.3575479984283447)
Step... (18825 | Loss: 0.22615019977092743, Learning Rate: 0.00018894547247327864, Gradient Norm: 0.7499992251396179)
Step... (18850 | Loss: 0.27958324551582336, Learning Rate: 0.00018879394338000566, Gradient Norm: 0.9669513702392578)
Step... (18875 | Loss: 0.2884554862976074, Learning Rate: 0.0001886424288386479, Gradient Norm: 0.9480453729629517)
Step... (18900 | Loss: 0.22735191881656647, Learning Rate: 0.00018849092884920537, Gradient Norm: 0.9434312582015991)
Step... (18925 | Loss: 0.2791370153427124, Learning Rate: 0.0001883393997559324, Gradient Norm: 0.9116787314414978)
Step... (18950 | Loss: 0.2897598147392273, Learning Rate: 0.00018818788521457464, Gradient Norm: 1.119798183441162)
Step... (18975 | Loss: 0.21057723462581635, Learning Rate: 0.0001880363852251321, Gradient Norm: 0.9324102997779846)
Step... (19000 | Loss: 0.29390567541122437, Learning Rate: 0.00018788485613185912, Gradient Norm: 1.0914132595062256)
Step... (19025 | Loss: 0.32371771335601807, Learning Rate: 0.00018773334159050137, Gradient Norm: 1.080733299255371)
Step... (19050 | Loss: 0.21715274453163147, Learning Rate: 0.0001875818270491436, Gradient Norm: 2.16139817237854)
Step... (19075 | Loss: 0.16671083867549896, Learning Rate: 0.00018743031250778586, Gradient Norm: 0.6231592893600464)
Step... (19100 | Loss: 0.21052765846252441, Learning Rate: 0.0001872787979664281, Gradient Norm: 0.9316931962966919)
Step... (19125 | Loss: 0.29162412881851196, Learning Rate: 0.00018712728342507035, Gradient Norm: 1.3272528648376465)

Training...:  38% 5244/13907 [3:13:33<4:18:25,  1.79s/it][A
Training...:  38% 5245/13907 [3:13:34<4:08:29,  1.72s/it][A
Training...:  38% 5246/13907 [3:13:36<3:57:22,  1.64s/it][A
Training...:  38% 5247/13907 [3:13:37<3:47:06,  1.57s/it][A
Training...:  38% 5248/13907 [3:13:38<3:35:45,  1.50s/it][A
Training...:  38% 5249/13907 [3:13:40<3:23:35,  1.41s/it][A
Training...:  38% 5250/13907 [3:13:41<3:07:48,  1.30s/it][A
Training...:  38% 5251/13907 [3:13:44<4:53:36,  2.04s/it][A
Training...:  38% 5252/13907 [3:13:48<5:56:24,  2.47s/it][A
Training...:  38% 5253/13907 [3:13:51<6:28:34,  2.69s/it][A
Training...:  38% 5254/13907 [3:13:54<6:43:46,  2.80s/it][A
Training...:  38% 5255/13907 [3:13:57<6:51:51,  2.86s/it][A
Training...:  38% 5256/13907 [3:14:00<6:52:54,  2.86s/it][A
Training...:  38% 5257/13907 [3:14:03<6:52:51,  2.86s/it][A
Training...:  38% 5258/13907 [3:14:06<6:49:16,  2.84s/it][A
Training...:  38% 5259/13907 [3:14:08<6:46:11,  2.82s/it][A
Training...:  38% 5260/13907 [3:14:11<6:40:08,  2.78s/it][A
Training...:  38% 5261/13907 [3:14:14<6:33:52,  2.73s/it][A
Training...:  38% 5262/13907 [3:14:16<6:28:15,  2.69s/it][A
Training...:  38% 5263/13907 [3:14:19<6:21:56,  2.65s/it][A
Training...:  38% 5264/13907 [3:14:21<6:16:05,  2.61s/it][A
Training...:  38% 5265/13907 [3:14:24<6:11:18,  2.58s/it][A
Training...:  38% 5266/13907 [3:14:26<6:04:27,  2.53s/it][A
Training...:  38% 5267/13907 [3:14:29<6:00:07,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:56:43<26:06:17, 31325.86s/it]
Training...:  38% 5267/13907 [3:14:32<6:00:07,  2.50s/it][A
Training...:  38% 5268/13907 [3:14:32<6:12:13,  2.59s/it][A
Training...:  38% 5269/13907 [3:14:34<6:05:13,  2.54s/it][A
Training...:  38% 5270/13907 [3:14:36<5:55:15,  2.47s/it][A
Training...:  38% 5271/13907 [3:14:39<5:47:16,  2.41s/it][A
Training...:  38% 5272/13907 [3:14:41<5:39:56,  2.36s/it][A
Training...:  38% 5273/13907 [3:14:43<5:34:05,  2.32s/it][A
Training...:  38% 5274/13907 [3:14:45<5:28:28,  2.28s/it][A
Training...:  38% 5275/13907 [3:14:47<5:22:59,  2.25s/it][A
Training...:  38% 5276/13907 [3:14:49<5:18:53,  2.22s/it][A
Training...:  38% 5277/13907 [3:14:52<5:13:19,  2.18s/it][A
Training...:  38% 5278/13907 [3:14:54<5:08:44,  2.15s/it][A
Training...:  38% 5279/13907 [3:14:56<5:04:51,  2.12s/it][A
Training...:  38% 5280/13907 [3:14:58<5:00:28,  2.09s/it][A
Training...:  38% 5281/13907 [3:15:00<4:55:37,  2.06s/it][A
Training...:  38% 5282/13907 [3:15:02<4:52:56,  2.04s/it][A
Training...:  38% 5283/13907 [3:15:04<4:49:07,  2.01s/it][A
Training...:  38% 5284/13907 [3:15:06<4:44:10,  1.98s/it][A
Training...:  38% 5285/13907 [3:15:07<4:40:33,  1.95s/it][A
Training...:  38% 5286/13907 [3:15:09<4:36:20,  1.92s/it][A
Training...:  38% 5287/13907 [3:15:11<4:31:20,  1.89s/it][A
Training...:  38% 5288/13907 [3:15:13<4:26:55,  1.86s/it][A
Training...:  38% 5289/13907 [3:15:15<4:21:56,  1.82s/it][A
Training...:  38% 5290/13907 [3:15:16<4:17:13,  1.79s/it][A
Training...:  38% 5291/13907 [3:15:18<4:12:08,  1.76s/it][A
Training...:  38% 5292/13907 [3:15:20<4:06:44,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:57:33<26:06:17, 31325.86s/it]
Training...:  38% 5292/13907 [3:15:22<4:06:44,  1.72s/it][A
Training...:  38% 5293/13907 [3:15:22<4:14:50,  1.78s/it][A
Training...:  38% 5294/13907 [3:15:23<4:07:37,  1.72s/it][A
Training...:  38% 5295/13907 [3:15:25<3:58:11,  1.66s/it][A
Training...:  38% 5296/13907 [3:15:26<3:48:45,  1.59s/it][A
Training...:  38% 5297/13907 [3:15:28<3:40:23,  1.54s/it][A
Training...:  38% 5298/13907 [3:15:29<3:30:54,  1.47s/it][A
Training...:  38% 5299/13907 [3:15:30<3:20:22,  1.40s/it][A
Training...:  38% 5300/13907 [3:15:31<3:05:04,  1.29s/it][A
Training...:  38% 5301/13907 [3:15:35<4:54:33,  2.05s/it][A
Training...:  38% 5302/13907 [3:15:38<5:56:55,  2.49s/it][A
Training...:  38% 5303/13907 [3:15:42<6:30:12,  2.72s/it][A
Training...:  38% 5304/13907 [3:15:45<6:49:48,  2.86s/it][A
Training...:  38% 5305/13907 [3:15:48<6:58:38,  2.92s/it][A
Training...:  38% 5306/13907 [3:15:51<6:59:12,  2.92s/it][A
Training...:  38% 5307/13907 [3:15:54<6:57:54,  2.92s/it][A
Training...:  38% 5308/13907 [3:15:57<6:54:11,  2.89s/it][A
Training...:  38% 5309/13907 [3:15:59<6:51:02,  2.87s/it][A
Training...:  38% 5310/13907 [3:16:02<6:44:27,  2.82s/it][A
Training...:  38% 5311/13907 [3:16:05<6:39:27,  2.79s/it][A
Training...:  38% 5312/13907 [3:16:07<6:31:11,  2.73s/it][A
Training...:  38% 5313/13907 [3:16:10<6:26:44,  2.70s/it][A
Training...:  38% 5314/13907 [3:16:13<6:18:34,  2.64s/it][A
Training...:  38% 5315/13907 [3:16:15<6:14:42,  2.62s/it][A
Training...:  38% 5316/13907 [3:16:18<6:07:16,  2.57s/it][A
Training...:  38% 5317/13907 [3:16:20<6:01:27,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:58:34<26:06:17, 31325.86s/it]
Training...:  38% 5317/13907 [3:16:23<6:01:27,  2.52s/it][A
Training...:  38% 5318/13907 [3:16:23<6:14:10,  2.61s/it][A
Training...:  38% 5319/13907 [3:16:25<6:06:51,  2.56s/it][A
Training...:  38% 5320/13907 [3:16:28<5:56:23,  2.49s/it][A
Training...:  38% 5321/13907 [3:16:30<5:49:26,  2.44s/it][A
Training...:  38% 5322/13907 [3:16:32<5:42:24,  2.39s/it][A
Training...:  38% 5323/13907 [3:16:34<5:36:05,  2.35s/it][A
Training...:  38% 5324/13907 [3:16:37<5:28:21,  2.30s/it][A
Training...:  38% 5325/13907 [3:16:39<5:24:16,  2.27s/it][A
Training...:  38% 5326/13907 [3:16:41<5:20:17,  2.24s/it][A
Training...:  38% 5327/13907 [3:16:43<5:14:50,  2.20s/it][A
Training...:  38% 5328/13907 [3:16:45<5:10:24,  2.17s/it][A
Training...:  38% 5329/13907 [3:16:47<5:06:22,  2.14s/it][A
Training...:  38% 5330/13907 [3:16:49<5:01:44,  2.11s/it][A
Training...:  38% 5331/13907 [3:16:51<4:57:23,  2.08s/it][A
Training...:  38% 5332/13907 [3:16:53<4:53:27,  2.05s/it][A
Training...:  38% 5333/13907 [3:16:55<4:49:54,  2.03s/it][A
Training...:  38% 5334/13907 [3:16:57<4:44:40,  1.99s/it][A
Training...:  38% 5335/13907 [3:16:59<4:41:33,  1.97s/it][A
Training...:  38% 5336/13907 [3:17:01<4:37:01,  1.94s/it][A
Training...:  38% 5337/13907 [3:17:03<4:32:12,  1.91s/it][A
Training...:  38% 5338/13907 [3:17:05<4:28:10,  1.88s/it][A
Training...:  38% 5339/13907 [3:17:06<4:24:11,  1.85s/it][A
Training...:  38% 5340/13907 [3:17:08<4:20:58,  1.83s/it][A
Training...:  38% 5341/13907 [3:17:10<4:17:27,  1.80s/it][A
Training...:  38% 5342/13907 [3:17:12<4:11:05,  1.76s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [11:59:25<26:06:17, 31325.86s/it]
Training...:  38% 5342/13907 [3:17:14<4:11:05,  1.76s/it][A
Training...:  38% 5343/13907 [3:17:14<4:17:51,  1.81s/it][A
Training...:  38% 5344/13907 [3:17:15<4:10:23,  1.75s/it][A
Training...:  38% 5345/13907 [3:17:17<4:02:16,  1.70s/it][A
Training...:  38% 5346/13907 [3:17:18<3:52:08,  1.63s/it][A
Training...:  38% 5347/13907 [3:17:20<3:42:20,  1.56s/it][A
Training...:  38% 5348/13907 [3:17:21<3:31:36,  1.48s/it][A
Training...:  38% 5349/13907 [3:17:22<3:20:39,  1.41s/it][A
Training...:  38% 5350/13907 [3:17:23<3:04:16,  1.29s/it][A
Training...:  38% 5351/13907 [3:17:27<4:54:37,  2.07s/it][A
Training...:  38% 5352/13907 [3:17:30<5:53:08,  2.48s/it][A
Training...:  38% 5353/13907 [3:17:34<6:27:20,  2.72s/it][A
Training...:  38% 5354/13907 [3:17:37<6:44:24,  2.84s/it][A
Training...:  39% 5355/13907 [3:17:40<6:55:08,  2.91s/it][A
Training...:  39% 5356/13907 [3:17:43<6:58:29,  2.94s/it][A
Training...:  39% 5357/13907 [3:17:46<6:57:11,  2.93s/it][A
Training...:  39% 5358/13907 [3:17:49<6:54:06,  2.91s/it][A
Training...:  39% 5359/13907 [3:17:51<6:50:07,  2.88s/it][A
Training...:  39% 5360/13907 [3:17:54<6:43:31,  2.83s/it][A
Training...:  39% 5361/13907 [3:17:57<6:36:34,  2.78s/it][A
Training...:  39% 5362/13907 [3:18:00<6:29:17,  2.73s/it][A
Training...:  39% 5363/13907 [3:18:02<6:21:34,  2.68s/it][A
Training...:  39% 5364/13907 [3:18:05<6:14:43,  2.63s/it][A
Training...:  39% 5365/13907 [3:18:07<6:08:46,  2.59s/it][A
Training...:  39% 5366/13907 [3:18:10<6:03:11,  2.55s/it][A
Training...:  39% 5367/13907 [3:18:12<5:57:33,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:00:26<26:06:17, 31325.86s/it]
Training...:  39% 5367/13907 [3:18:15<5:57:33,  2.51s/it][A
Training...:  39% 5368/13907 [3:18:15<6:10:19,  2.60s/it][A
Training...:  39% 5369/13907 [3:18:17<6:02:54,  2.55s/it][A
Training...:  39% 5370/13907 [3:18:20<5:53:18,  2.48s/it][A
Training...:  39% 5371/13907 [3:18:22<5:44:20,  2.42s/it][A
Training...:  39% 5372/13907 [3:18:24<5:37:16,  2.37s/it][A
Training...:  39% 5373/13907 [3:18:26<5:30:55,  2.33s/it][A
Training...:  39% 5374/13907 [3:18:28<5:25:23,  2.29s/it][A
Training...:  39% 5375/13907 [3:18:31<5:20:47,  2.26s/it][A
Training...:  39% 5376/13907 [3:18:33<5:16:36,  2.23s/it][A
Training...:  39% 5377/13907 [3:18:35<5:12:07,  2.20s/it][A
Training...:  39% 5378/13907 [3:18:37<5:07:23,  2.16s/it][A
Training...:  39% 5379/13907 [3:18:39<5:02:19,  2.13s/it][A
Training...:  39% 5380/13907 [3:18:41<4:59:05,  2.10s/it][A
Training...:  39% 5381/13907 [3:18:43<4:54:39,  2.07s/it][A
Training...:  39% 5382/13907 [3:18:45<4:50:20,  2.04s/it][A
Training...:  39% 5383/13907 [3:18:47<4:45:49,  2.01s/it][A
Training...:  39% 5384/13907 [3:18:49<4:41:26,  1.98s/it][A
Training...:  39% 5385/13907 [3:18:51<4:36:31,  1.95s/it][A
Training...:  39% 5386/13907 [3:18:53<4:33:22,  1.92s/it][A
Training...:  39% 5387/13907 [3:18:54<4:28:42,  1.89s/it][A
Training...:  39% 5388/13907 [3:18:56<4:24:20,  1.86s/it][A
Training...:  39% 5389/13907 [3:18:58<4:18:40,  1.82s/it][A
Training...:  39% 5390/13907 [3:19:00<4:12:57,  1.78s/it][A
Training...:  39% 5391/13907 [3:19:01<4:08:10,  1.75s/it][A
Training...:  39% 5392/13907 [3:19:03<4:03:39,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:01:16<26:06:17, 31325.86s/it]
Training...:  39% 5392/13907 [3:19:05<4:03:39,  1.72s/it][A
Training...:  39% 5393/13907 [3:19:05<4:12:12,  1.78s/it][A
Training...:  39% 5394/13907 [3:19:07<4:06:42,  1.74s/it][A
Training...:  39% 5395/13907 [3:19:08<3:57:52,  1.68s/it][A
Training...:  39% 5396/13907 [3:19:10<3:49:18,  1.62s/it][A
Training...:  39% 5397/13907 [3:19:11<3:40:28,  1.55s/it][A
Training...:  39% 5398/13907 [3:19:12<3:31:14,  1.49s/it][A
Training...:  39% 5399/13907 [3:19:14<3:19:55,  1.41s/it][A
Training...:  39% 5400/13907 [3:19:15<3:05:49,  1.31s/it][A
Training...:  39% 5401/13907 [3:19:18<4:46:42,  2.02s/it][A
Training...:  39% 5402/13907 [3:19:22<5:43:59,  2.43s/it][A
Training...:  39% 5403/13907 [3:19:25<6:22:10,  2.70s/it][A
Training...:  39% 5404/13907 [3:19:28<6:43:44,  2.85s/it][A
Training...:  39% 5405/13907 [3:19:31<6:53:16,  2.92s/it][A
Training...:  39% 5406/13907 [3:19:34<6:52:59,  2.91s/it][A
Training...:  39% 5407/13907 [3:19:37<6:50:18,  2.90s/it][A
Training...:  39% 5408/13907 [3:19:40<6:43:36,  2.85s/it][A
Training...:  39% 5409/13907 [3:19:43<6:37:52,  2.81s/it][A
Training...:  39% 5410/13907 [3:19:45<6:31:39,  2.77s/it][A
Training...:  39% 5411/13907 [3:19:48<6:25:12,  2.72s/it][A
Training...:  39% 5412/13907 [3:19:50<6:19:12,  2.68s/it][A
Training...:  39% 5413/13907 [3:19:53<6:13:34,  2.64s/it][A
Training...:  39% 5414/13907 [3:19:55<6:08:08,  2.60s/it][A
Training...:  39% 5415/13907 [3:19:58<6:04:47,  2.58s/it][A
Training...:  39% 5416/13907 [3:20:00<6:00:46,  2.55s/it][A
Training...:  39% 5417/13907 [3:20:03<5:55:23,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:02:17<26:06:17, 31325.86s/it]
Training...:  39% 5417/13907 [3:20:06<5:55:23,  2.51s/it][A
Training...:  39% 5418/13907 [3:20:06<6:09:00,  2.61s/it][A
Training...:  39% 5419/13907 [3:20:08<6:01:19,  2.55s/it][A
Training...:  39% 5420/13907 [3:20:10<5:50:59,  2.48s/it][A
Training...:  39% 5421/13907 [3:20:13<5:42:56,  2.42s/it][A
Training...:  39% 5422/13907 [3:20:15<5:35:25,  2.37s/it][A
Training...:  39% 5423/13907 [3:20:17<5:28:33,  2.32s/it][A
Training...:  39% 5424/13907 [3:20:19<5:23:11,  2.29s/it][A
Training...:  39% 5425/13907 [3:20:22<5:17:38,  2.25s/it][A
Training...:  39% 5426/13907 [3:20:24<5:13:25,  2.22s/it][A
Training...:  39% 5427/13907 [3:20:26<5:08:30,  2.18s/it][A
Training...:  39% 5428/13907 [3:20:28<5:03:21,  2.15s/it][A
Training...:  39% 5429/13907 [3:20:30<4:58:38,  2.11s/it][A
Training...:  39% 5430/13907 [3:20:32<4:54:05,  2.08s/it][A
Training...:  39% 5431/13907 [3:20:34<4:49:59,  2.05s/it][A
Training...:  39% 5432/13907 [3:20:36<4:46:09,  2.03s/it][A
Training...:  39% 5433/13907 [3:20:38<4:41:34,  1.99s/it][A
Training...:  39% 5434/13907 [3:20:40<4:37:10,  1.96s/it][A
Training...:  39% 5435/13907 [3:20:42<4:33:12,  1.93s/it][A
Training...:  39% 5436/13907 [3:20:43<4:28:41,  1.90s/it][A
Training...:  39% 5437/13907 [3:20:45<4:25:01,  1.88s/it][A
Training...:  39% 5438/13907 [3:20:47<4:20:06,  1.84s/it][A
Training...:  39% 5439/13907 [3:20:49<4:16:13,  1.82s/it][A
Training...:  39% 5440/13907 [3:20:50<4:11:34,  1.78s/it][A
Training...:  39% 5441/13907 [3:20:52<4:07:33,  1.75s/it][A
Training...:  39% 5442/13907 [3:20:54<4:03:54,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:03:07<26:06:17, 31325.86s/it]
Training...:  39% 5442/13907 [3:20:56<4:03:54,  1.73s/it][A
Training...:  39% 5443/13907 [3:20:56<4:12:23,  1.79s/it][A
Training...:  39% 5444/13907 [3:20:57<4:05:35,  1.74s/it][A
Training...:  39% 5445/13907 [3:20:59<3:55:53,  1.67s/it][A
Training...:  39% 5446/13907 [3:21:00<3:46:07,  1.60s/it][A
Training...:  39% 5447/13907 [3:21:02<3:36:14,  1.53s/it][A
Training...:  39% 5448/13907 [3:21:03<3:26:46,  1.47s/it][A
Training...:  39% 5449/13907 [3:21:04<3:16:35,  1.39s/it][A
Training...:  39% 5450/13907 [3:21:05<3:03:02,  1.30s/it][A
Training...:  39% 5451/13907 [3:21:09<4:43:56,  2.01s/it][A
Training...:  39% 5452/13907 [3:21:12<5:42:29,  2.43s/it][A
Training...:  39% 5453/13907 [3:21:16<6:17:58,  2.68s/it][A
Training...:  39% 5454/13907 [3:21:19<6:35:37,  2.81s/it][A
Training...:  39% 5455/13907 [3:21:22<6:46:28,  2.89s/it][A
Training...:  39% 5456/13907 [3:21:25<6:46:48,  2.89s/it][A
Training...:  39% 5457/13907 [3:21:28<6:45:50,  2.88s/it][A
Training...:  39% 5458/13907 [3:21:30<6:40:53,  2.85s/it][A
Training...:  39% 5459/13907 [3:21:33<6:37:23,  2.82s/it][A
Training...:  39% 5460/13907 [3:21:36<6:30:58,  2.78s/it][A
Training...:  39% 5461/13907 [3:21:38<6:27:50,  2.76s/it][A
Training...:  39% 5462/13907 [3:21:41<6:21:17,  2.71s/it][A
Training...:  39% 5463/13907 [3:21:44<6:15:00,  2.66s/it][A
Training...:  39% 5464/13907 [3:21:46<6:10:54,  2.64s/it][A
Training...:  39% 5465/13907 [3:21:49<6:06:05,  2.60s/it][A
Training...:  39% 5466/13907 [3:21:51<6:00:54,  2.57s/it][A
Training...:  39% 5467/13907 [3:21:54<5:54:46,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:04:08<26:06:17, 31325.86s/it]
Training...:  39% 5467/13907 [3:21:56<5:54:46,  2.52s/it][A
Training...:  39% 5468/13907 [3:21:56<6:07:56,  2.62s/it][A
Training...:  39% 5469/13907 [3:21:59<6:01:30,  2.57s/it][A
Training...:  39% 5470/13907 [3:22:01<5:51:05,  2.50s/it][A
Training...:  39% 5471/13907 [3:22:04<5:43:18,  2.44s/it][A
Training...:  39% 5472/13907 [3:22:06<5:38:33,  2.41s/it][A
Training...:  39% 5473/13907 [3:22:08<5:30:39,  2.35s/it][A
Training...:  39% 5474/13907 [3:22:10<5:22:53,  2.30s/it][A
Training...:  39% 5475/13907 [3:22:12<5:16:23,  2.25s/it][A
Training...:  39% 5476/13907 [3:22:14<5:09:42,  2.20s/it][A
Training...:  39% 5477/13907 [3:22:17<5:05:04,  2.17s/it][A
Training...:  39% 5478/13907 [3:22:19<5:00:36,  2.14s/it][A
Training...:  39% 5479/13907 [3:22:21<4:56:29,  2.11s/it][A
Training...:  39% 5480/13907 [3:22:23<4:51:55,  2.08s/it][A
Training...:  39% 5481/13907 [3:22:25<4:47:53,  2.05s/it][A
Training...:  39% 5482/13907 [3:22:27<4:43:59,  2.02s/it][A
Training...:  39% 5483/13907 [3:22:29<4:40:47,  2.00s/it][A
Training...:  39% 5484/13907 [3:22:30<4:36:23,  1.97s/it][A
Training...:  39% 5485/13907 [3:22:32<4:31:56,  1.94s/it][A
Training...:  39% 5486/13907 [3:22:34<4:27:29,  1.91s/it][A
Training...:  39% 5487/13907 [3:22:36<4:22:49,  1.87s/it][A
Training...:  39% 5488/13907 [3:22:38<4:17:54,  1.84s/it][A
Training...:  39% 5489/13907 [3:22:39<4:13:06,  1.80s/it][A
Training...:  39% 5490/13907 [3:22:41<4:08:31,  1.77s/it][A
Training...:  39% 5491/13907 [3:22:43<4:03:41,  1.74s/it][A
Training...:  39% 5492/13907 [3:22:44<3:58:44,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:04:58<26:06:17, 31325.86s/it]
Training...:  39% 5492/13907 [3:22:46<3:58:44,  1.70s/it][A
Training...:  39% 5493/13907 [3:22:46<4:07:09,  1.76s/it][A
Training...:  40% 5494/13907 [3:22:48<4:00:19,  1.71s/it][A
Training...:  40% 5495/13907 [3:22:49<3:51:36,  1.65s/it][A
Training...:  40% 5496/13907 [3:22:51<3:42:26,  1.59s/it][A
Training...:  40% 5497/13907 [3:22:52<3:33:21,  1.52s/it][A
Training...:  40% 5498/13907 [3:22:54<3:23:43,  1.45s/it][A
Training...:  40% 5499/13907 [3:22:55<3:13:25,  1.38s/it][A
Training...:  40% 5500/13907 [3:22:56<2:58:28,  1.27s/it][A
Training...:  40% 5501/13907 [3:23:00<4:46:25,  2.04s/it][A
Training...:  40% 5502/13907 [3:23:03<5:46:39,  2.47s/it][A
Training...:  40% 5503/13907 [3:23:06<6:23:53,  2.74s/it][A
Training...:  40% 5504/13907 [3:23:10<6:43:39,  2.88s/it][A
Training...:  40% 5505/13907 [3:23:13<6:52:02,  2.94s/it][A
Training...:  40% 5506/13907 [3:23:16<6:53:54,  2.96s/it][A
Training...:  40% 5507/13907 [3:23:19<6:51:53,  2.94s/it][A
Training...:  40% 5508/13907 [3:23:22<6:49:19,  2.92s/it][A
Training...:  40% 5509/13907 [3:23:24<6:43:26,  2.88s/it][A
Training...:  40% 5510/13907 [3:23:27<6:35:59,  2.83s/it][A
Training...:  40% 5511/13907 [3:23:30<6:32:39,  2.81s/it][A
Training...:  40% 5512/13907 [3:23:32<6:27:51,  2.77s/it][A
Training...:  40% 5513/13907 [3:23:35<6:20:08,  2.72s/it][A
Training...:  40% 5514/13907 [3:23:38<6:12:39,  2.66s/it][A
Training...:  40% 5515/13907 [3:23:40<6:06:14,  2.62s/it][A
Training...:  40% 5516/13907 [3:23:43<5:59:34,  2.57s/it][A
Training...:  40% 5517/13907 [3:23:45<5:53:23,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:05:59<26:06:17, 31325.86s/it]
Training...:  40% 5517/13907 [3:23:48<5:53:23,  2.53s/it][A
Training...:  40% 5518/13907 [3:23:48<6:05:42,  2.62s/it][A
Training...:  40% 5519/13907 [3:23:50<5:59:16,  2.57s/it][A
Training...:  40% 5520/13907 [3:23:53<5:48:42,  2.49s/it][A
Training...:  40% 5521/13907 [3:23:55<5:39:54,  2.43s/it][A
Training...:  40% 5522/13907 [3:23:57<5:33:49,  2.39s/it][A
Training...:  40% 5523/13907 [3:23:59<5:26:11,  2.33s/it][A
Training...:  40% 5524/13907 [3:24:02<5:19:50,  2.29s/it][A
Training...:  40% 5525/13907 [3:24:04<5:14:47,  2.25s/it][A
Training...:  40% 5526/13907 [3:24:06<5:09:00,  2.21s/it][A
Training...:  40% 5527/13907 [3:24:08<5:03:38,  2.17s/it][A
Training...:  40% 5528/13907 [3:24:10<4:59:37,  2.15s/it][A
Training...:  40% 5529/13907 [3:24:12<4:55:01,  2.11s/it][A
Training...:  40% 5530/13907 [3:24:14<4:51:10,  2.09s/it][A
Training...:  40% 5531/13907 [3:24:16<4:47:46,  2.06s/it][A
Training...:  40% 5532/13907 [3:24:18<4:45:32,  2.05s/it][A
Training...:  40% 5533/13907 [3:24:20<4:41:47,  2.02s/it][A
Training...:  40% 5534/13907 [3:24:22<4:36:55,  1.98s/it][A
Training...:  40% 5535/13907 [3:24:24<4:33:21,  1.96s/it][A
Training...:  40% 5536/13907 [3:24:26<4:28:23,  1.92s/it][A
Training...:  40% 5537/13907 [3:24:28<4:25:43,  1.90s/it][A
Training...:  40% 5538/13907 [3:24:29<4:21:55,  1.88s/it][A
Training...:  40% 5539/13907 [3:24:31<4:16:44,  1.84s/it][A
Training...:  40% 5540/13907 [3:24:33<4:12:21,  1.81s/it][A
Training...:  40% 5541/13907 [3:24:35<4:07:37,  1.78s/it][A
Training...:  40% 5542/13907 [3:24:36<4:01:37,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:06:49<26:06:17, 31325.86s/it]
Training...:  40% 5542/13907 [3:24:38<4:01:37,  1.73s/it][A
Training...:  40% 5543/13907 [3:24:38<4:08:45,  1.78s/it][A
Training...:  40% 5544/13907 [3:24:40<4:02:10,  1.74s/it][A
Training...:  40% 5545/13907 [3:24:41<3:55:31,  1.69s/it][A
Training...:  40% 5546/13907 [3:24:43<3:46:45,  1.63s/it][A
Training...:  40% 5547/13907 [3:24:44<3:37:36,  1.56s/it][A
Training...:  40% 5548/13907 [3:24:46<3:27:54,  1.49s/it][A
Training...:  40% 5549/13907 [3:24:47<3:17:16,  1.42s/it][A
Training...:  40% 5550/13907 [3:24:48<3:02:03,  1.31s/it][A
Training...:  40% 5551/13907 [3:24:52<4:55:14,  2.12s/it][A
Training...:  40% 5552/13907 [3:24:55<5:52:05,  2.53s/it][A
Training...:  40% 5553/13907 [3:24:59<6:22:42,  2.75s/it][A
Training...:  40% 5554/13907 [3:25:02<6:39:06,  2.87s/it][A
Training...:  40% 5555/13907 [3:25:05<6:45:24,  2.91s/it][A
Training...:  40% 5556/13907 [3:25:08<6:47:24,  2.93s/it][A
Training...:  40% 5557/13907 [3:25:11<6:46:37,  2.92s/it][A
Training...:  40% 5558/13907 [3:25:13<6:42:20,  2.89s/it][A
Training...:  40% 5559/13907 [3:25:16<6:38:17,  2.86s/it][A
Training...:  40% 5560/13907 [3:25:19<6:30:53,  2.81s/it][A
Training...:  40% 5561/13907 [3:25:22<6:24:13,  2.76s/it][A
Training...:  40% 5562/13907 [3:25:24<6:16:31,  2.71s/it][A
Training...:  40% 5563/13907 [3:25:27<6:10:14,  2.66s/it][A
Training...:  40% 5564/13907 [3:25:29<6:03:53,  2.62s/it][A
Training...:  40% 5565/13907 [3:25:32<5:57:28,  2.57s/it][A
Training...:  40% 5566/13907 [3:25:34<5:52:59,  2.54s/it][A
Training...:  40% 5567/13907 [3:25:37<5:47:21,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:07:51<26:06:17, 31325.86s/it]
Training...:  40% 5567/13907 [3:25:39<5:47:21,  2.50s/it][A
Training...:  40% 5568/13907 [3:25:39<5:59:18,  2.59s/it][A
Training...:  40% 5569/13907 [3:25:42<5:53:26,  2.54s/it][A
Training...:  40% 5570/13907 [3:25:44<5:43:33,  2.47s/it][A
Training...:  40% 5571/13907 [3:25:46<5:36:52,  2.42s/it][A
Training...:  40% 5572/13907 [3:25:49<5:29:34,  2.37s/it][A
Training...:  40% 5573/13907 [3:25:51<5:24:39,  2.34s/it][A
Training...:  40% 5574/13907 [3:25:53<5:18:26,  2.29s/it][A
Training...:  40% 5575/13907 [3:25:55<5:12:24,  2.25s/it][A
Training...:  40% 5576/13907 [3:25:57<5:07:25,  2.21s/it][A
Training...:  40% 5577/13907 [3:25:59<5:01:38,  2.17s/it][A
Training...:  40% 5578/13907 [3:26:02<4:56:32,  2.14s/it][A
Training...:  40% 5579/13907 [3:26:04<4:51:44,  2.10s/it][A
Training...:  40% 5580/13907 [3:26:06<4:46:30,  2.06s/it][A
Training...:  40% 5581/13907 [3:26:08<4:43:57,  2.05s/it][A
Training...:  40% 5582/13907 [3:26:09<4:41:48,  2.03s/it][A
Training...:  40% 5583/13907 [3:26:11<4:37:40,  2.00s/it][A
Training...:  40% 5584/13907 [3:26:13<4:32:30,  1.96s/it][A
Training...:  40% 5585/13907 [3:26:15<4:28:12,  1.93s/it][A
Training...:  40% 5586/13907 [3:26:17<4:23:35,  1.90s/it][A
Training...:  40% 5587/13907 [3:26:19<4:19:01,  1.87s/it][A
Training...:  40% 5588/13907 [3:26:21<4:14:14,  1.83s/it][A
Training...:  40% 5589/13907 [3:26:22<4:09:30,  1.80s/it][A
Training...:  40% 5590/13907 [3:26:24<4:03:42,  1.76s/it][A
Training...:  40% 5591/13907 [3:26:26<3:58:48,  1.72s/it][A
Training...:  40% 5592/13907 [3:26:27<3:54:20,  1.69s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:08:40<26:06:17, 31325.86s/it]
Training...:  40% 5592/13907 [3:26:29<3:54:20,  1.69s/it][A
Training...:  40% 5593/13907 [3:26:29<4:02:51,  1.75s/it][A
Training...:  40% 5594/13907 [3:26:31<3:57:09,  1.71s/it][A
Training...:  40% 5595/13907 [3:26:32<3:49:41,  1.66s/it][A
Training...:  40% 5596/13907 [3:26:34<3:40:11,  1.59s/it][A
Training...:  40% 5597/13907 [3:26:35<3:32:13,  1.53s/it][A
Training...:  40% 5598/13907 [3:26:36<3:23:19,  1.47s/it][A
Training...:  40% 5599/13907 [3:26:38<3:13:28,  1.40s/it][A
Training...:  40% 5600/13907 [3:26:39<2:59:40,  1.30s/it][A
Training...:  40% 5601/13907 [3:26:42<4:41:57,  2.04s/it][A
Training...:  40% 5602/13907 [3:26:46<5:41:53,  2.47s/it][A
Training...:  40% 5603/13907 [3:26:49<6:15:56,  2.72s/it][A
Training...:  40% 5604/13907 [3:26:52<6:33:35,  2.84s/it][A
Training...:  40% 5605/13907 [3:26:55<6:44:20,  2.92s/it][A
Training...:  40% 5606/13907 [3:26:58<6:45:30,  2.93s/it][A
Training...:  40% 5607/13907 [3:27:01<6:44:57,  2.93s/it][A
Training...:  40% 5608/13907 [3:27:04<6:41:39,  2.90s/it][A
Training...:  40% 5609/13907 [3:27:07<6:36:17,  2.87s/it][A
Training...:  40% 5610/13907 [3:27:10<6:30:30,  2.82s/it][A
Training...:  40% 5611/13907 [3:27:12<6:24:51,  2.78s/it][A
Training...:  40% 5612/13907 [3:27:15<6:19:34,  2.75s/it][A
Training...:  40% 5613/13907 [3:27:18<6:12:33,  2.70s/it][A
Training...:  40% 5614/13907 [3:27:20<6:05:19,  2.64s/it][A
Training...:  40% 5615/13907 [3:27:23<5:59:24,  2.60s/it][A
Training...:  40% 5616/13907 [3:27:25<5:53:39,  2.56s/it][A
Training...:  40% 5617/13907 [3:27:28<5:47:54,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:09:41<26:06:17, 31325.86s/it]
Training...:  40% 5617/13907 [3:27:30<5:47:54,  2.52s/it][A
Training...:  40% 5618/13907 [3:27:30<5:59:05,  2.60s/it][A
Training...:  40% 5619/13907 [3:27:33<5:51:36,  2.55s/it][A
Training...:  40% 5620/13907 [3:27:35<5:42:34,  2.48s/it][A
Training...:  40% 5621/13907 [3:27:37<5:36:30,  2.44s/it][A
Training...:  40% 5622/13907 [3:27:40<5:29:21,  2.39s/it][A
Training...:  40% 5623/13907 [3:27:42<5:22:45,  2.34s/it][A
Training...:  40% 5624/13907 [3:27:44<5:17:37,  2.30s/it][A
Training...:  40% 5625/13907 [3:27:46<5:12:49,  2.27s/it][A
Training...:  40% 5626/13907 [3:27:48<5:09:10,  2.24s/it][A
Training...:  40% 5627/13907 [3:27:51<5:03:41,  2.20s/it][A
Training...:  40% 5628/13907 [3:27:53<5:00:34,  2.18s/it][A
Training...:  40% 5629/13907 [3:27:55<4:55:23,  2.14s/it][A
Training...:  40% 5630/13907 [3:27:57<4:51:14,  2.11s/it][A
Training...:  40% 5631/13907 [3:27:59<4:45:56,  2.07s/it][A
Training...:  40% 5632/13907 [3:28:01<4:41:03,  2.04s/it][A
Training...:  41% 5633/13907 [3:28:03<4:36:07,  2.00s/it][A
Training...:  41% 5634/13907 [3:28:05<4:31:07,  1.97s/it][A
Training...:  41% 5635/13907 [3:28:06<4:26:52,  1.94s/it][A
Training...:  41% 5636/13907 [3:28:08<4:22:29,  1.90s/it][A
Training...:  41% 5637/13907 [3:28:10<4:18:44,  1.88s/it][A
Training...:  41% 5638/13907 [3:28:12<4:13:50,  1.84s/it][A
Training...:  41% 5639/13907 [3:28:14<4:08:38,  1.80s/it][A
Training...:  41% 5640/13907 [3:28:15<4:04:03,  1.77s/it][A
Training...:  41% 5641/13907 [3:28:17<3:58:38,  1.73s/it][A
Training...:  41% 5642/13907 [3:28:18<3:53:31,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:10:32<26:06:17, 31325.86s/it]
Training...:  41% 5642/13907 [3:28:20<3:53:31,  1.70s/it][A
Training...:  41% 5643/13907 [3:28:20<4:01:06,  1.75s/it][A
Training...:  41% 5644/13907 [3:28:22<3:55:04,  1.71s/it][A
Training...:  41% 5645/13907 [3:28:23<3:45:50,  1.64s/it][A
Training...:  41% 5646/13907 [3:28:25<3:37:22,  1.58s/it][A
Training...:  41% 5647/13907 [3:28:26<3:29:48,  1.52s/it][A
Training...:  41% 5648/13907 [3:28:28<3:20:56,  1.46s/it][A
Training...:  41% 5649/13907 [3:28:29<3:11:06,  1.39s/it][A
Training...:  41% 5650/13907 [3:28:30<2:56:20,  1.28s/it][A
Training...:  41% 5651/13907 [3:28:34<4:38:36,  2.02s/it][A
Training...:  41% 5652/13907 [3:28:37<5:37:12,  2.45s/it][A
Training...:  41% 5653/13907 [3:28:40<6:08:28,  2.68s/it][A
Training...:  41% 5654/13907 [3:28:43<6:25:20,  2.80s/it][A
Training...:  41% 5655/13907 [3:28:46<6:36:18,  2.88s/it][A
Training...:  41% 5656/13907 [3:28:49<6:35:41,  2.88s/it][A
Training...:  41% 5657/13907 [3:28:52<6:36:09,  2.88s/it][A
Training...:  41% 5658/13907 [3:28:55<6:32:23,  2.85s/it][A
Training...:  41% 5659/13907 [3:28:58<6:28:51,  2.83s/it][A
Training...:  41% 5660/13907 [3:29:00<6:24:12,  2.80s/it][A
Training...:  41% 5661/13907 [3:29:03<6:17:49,  2.75s/it][A
Training...:  41% 5662/13907 [3:29:06<6:10:46,  2.70s/it][A
Training...:  41% 5663/13907 [3:29:08<6:04:54,  2.66s/it][A
Training...:  41% 5664/13907 [3:29:11<6:00:06,  2.62s/it][A
Training...:  41% 5665/13907 [3:29:13<5:54:19,  2.58s/it][A
Training...:  41% 5666/13907 [3:29:16<5:48:09,  2.53s/it][A
Training...:  41% 5667/13907 [3:29:18<5:43:27,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:11:32<26:06:17, 31325.86s/it]
Training...:  41% 5667/13907 [3:29:21<5:43:27,  2.50s/it][A
Training...:  41% 5668/13907 [3:29:21<5:54:12,  2.58s/it][A
Training...:  41% 5669/13907 [3:29:23<5:49:20,  2.54s/it][A
Training...:  41% 5670/13907 [3:29:26<5:39:26,  2.47s/it][A
Training...:  41% 5671/13907 [3:29:28<5:32:06,  2.42s/it][A
Training...:  41% 5672/13907 [3:29:30<5:23:57,  2.36s/it][A
Training...:  41% 5673/13907 [3:29:32<5:18:12,  2.32s/it][A
Training...:  41% 5674/13907 [3:29:35<5:14:31,  2.29s/it][A
Training...:  41% 5675/13907 [3:29:37<5:10:44,  2.26s/it][A
Training...:  41% 5676/13907 [3:29:39<5:04:41,  2.22s/it][A
Training...:  41% 5677/13907 [3:29:41<4:58:39,  2.18s/it][A
Training...:  41% 5678/13907 [3:29:43<4:53:37,  2.14s/it][A
Training...:  41% 5679/13907 [3:29:45<4:48:48,  2.11s/it][A
Training...:  41% 5680/13907 [3:29:47<4:45:09,  2.08s/it][A
Training...:  41% 5681/13907 [3:29:49<4:41:24,  2.05s/it][A
Training...:  41% 5682/13907 [3:29:51<4:37:35,  2.02s/it][A
Training...:  41% 5683/13907 [3:29:53<4:33:22,  1.99s/it][A
Training...:  41% 5684/13907 [3:29:55<4:29:13,  1.96s/it][A
Training...:  41% 5685/13907 [3:29:57<4:25:54,  1.94s/it][A
Training...:  41% 5686/13907 [3:29:59<4:20:18,  1.90s/it][A
Training...:  41% 5687/13907 [3:30:00<4:16:05,  1.87s/it][A
Training...:  41% 5688/13907 [3:30:02<4:11:39,  1.84s/it][A
Training...:  41% 5689/13907 [3:30:04<4:07:27,  1.81s/it][A
Training...:  41% 5690/13907 [3:30:06<4:02:56,  1.77s/it][A
Training...:  41% 5691/13907 [3:30:07<3:58:16,  1.74s/it][A
Training...:  41% 5692/13907 [3:30:09<3:53:53,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:12:22<26:06:17, 31325.86s/it]
Training...:  41% 5692/13907 [3:30:11<3:53:53,  1.71s/it][A
Training...:  41% 5693/13907 [3:30:11<4:03:03,  1.78s/it][A
Training...:  41% 5694/13907 [3:30:12<3:56:01,  1.72s/it][A
Training...:  41% 5695/13907 [3:30:14<3:47:30,  1.66s/it][A
Training...:  41% 5696/13907 [3:30:15<3:39:11,  1.60s/it][A
Training...:  41% 5697/13907 [3:30:17<3:30:33,  1.54s/it][A
Training...:  41% 5698/13907 [3:30:18<3:21:17,  1.47s/it][A
Training...:  41% 5699/13907 [3:30:19<3:12:00,  1.40s/it][A
Training...:  41% 5700/13907 [3:30:20<2:59:36,  1.31s/it][A
Training...:  41% 5701/13907 [3:30:24<4:39:46,  2.05s/it][A
Training...:  41% 5702/13907 [3:30:28<5:39:51,  2.49s/it][A
Training...:  41% 5703/13907 [3:30:31<6:14:09,  2.74s/it][A
Training...:  41% 5704/13907 [3:30:34<6:29:55,  2.85s/it][A
Training...:  41% 5705/13907 [3:30:37<6:39:09,  2.92s/it][A
Training...:  41% 5706/13907 [3:30:40<6:41:27,  2.94s/it][A
Training...:  41% 5707/13907 [3:30:43<6:41:17,  2.94s/it][A
Training...:  41% 5708/13907 [3:30:46<6:36:15,  2.90s/it][A
Training...:  41% 5709/13907 [3:30:49<6:32:38,  2.87s/it][A
Training...:  41% 5710/13907 [3:30:51<6:26:10,  2.83s/it][A
Training...:  41% 5711/13907 [3:30:54<6:20:36,  2.79s/it][A
Training...:  41% 5712/13907 [3:30:57<6:15:28,  2.75s/it][A
Training...:  41% 5713/13907 [3:30:59<6:10:38,  2.71s/it][A
Training...:  41% 5714/13907 [3:31:02<6:05:24,  2.68s/it][A
Training...:  41% 5715/13907 [3:31:05<6:03:45,  2.66s/it][A
Training...:  41% 5716/13907 [3:31:07<5:57:05,  2.62s/it][A
Training...:  41% 5717/13907 [3:31:10<5:50:21,  2.57s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:13:24<26:06:17, 31325.86s/it]
Training...:  41% 5717/13907 [3:31:12<5:50:21,  2.57s/it][A
Training...:  41% 5718/13907 [3:31:12<6:01:58,  2.65s/it][A
Training...:  41% 5719/13907 [3:31:15<5:54:10,  2.60s/it][A
Training...:  41% 5720/13907 [3:31:17<5:43:42,  2.52s/it][A
Training...:  41% 5721/13907 [3:31:20<5:35:32,  2.46s/it][A
Training...:  41% 5722/13907 [3:31:22<5:27:30,  2.40s/it][A
Training...:  41% 5723/13907 [3:31:24<5:21:18,  2.36s/it][A
Training...:  41% 5724/13907 [3:31:26<5:15:42,  2.31s/it][A
Training...:  41% 5725/13907 [3:31:28<5:10:26,  2.28s/it][A
Training...:  41% 5726/13907 [3:31:31<5:05:17,  2.24s/it][A
Training...:  41% 5727/13907 [3:31:33<5:00:41,  2.21s/it][A
Training...:  41% 5728/13907 [3:31:35<4:55:34,  2.17s/it][A
Training...:  41% 5729/13907 [3:31:37<4:51:47,  2.14s/it][A
Training...:  41% 5730/13907 [3:31:39<4:46:51,  2.10s/it][A
Training...:  41% 5731/13907 [3:31:41<4:42:59,  2.08s/it][A
Training...:  41% 5732/13907 [3:31:43<4:38:19,  2.04s/it][A
Training...:  41% 5733/13907 [3:31:45<4:35:02,  2.02s/it][A
Training...:  41% 5734/13907 [3:31:47<4:31:13,  1.99s/it][A
Training...:  41% 5735/13907 [3:31:49<4:26:19,  1.96s/it][A
Training...:  41% 5736/13907 [3:31:51<4:21:19,  1.92s/it][A
Training...:  41% 5737/13907 [3:31:52<4:17:00,  1.89s/it][A
Training...:  41% 5738/13907 [3:31:54<4:13:49,  1.86s/it][A
Training...:  41% 5739/13907 [3:31:56<4:10:02,  1.84s/it][A
Training...:  41% 5740/13907 [3:31:58<4:07:15,  1.82s/it][A
Training...:  41% 5741/13907 [3:31:59<4:02:11,  1.78s/it][A
Training...:  41% 5742/13907 [3:32:01<3:56:52,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:14:14<26:06:17, 31325.86s/it]
Training...:  41% 5742/13907 [3:32:03<3:56:52,  1.74s/it][A
Training...:  41% 5743/13907 [3:32:03<4:04:28,  1.80s/it][A
Training...:  41% 5744/13907 [3:32:05<3:57:48,  1.75s/it][A
Training...:  41% 5745/13907 [3:32:06<3:49:26,  1.69s/it][A
Training...:  41% 5746/13907 [3:32:08<3:40:20,  1.62s/it][A
Training...:  41% 5747/13907 [3:32:09<3:32:14,  1.56s/it][A
Training...:  41% 5748/13907 [3:32:10<3:23:22,  1.50s/it][A
Training...:  41% 5749/13907 [3:32:12<3:13:03,  1.42s/it][A
Training...:  41% 5750/13907 [3:32:13<2:59:49,  1.32s/it][A
Training...:  41% 5751/13907 [3:32:16<4:40:34,  2.06s/it][A
Training...:  41% 5752/13907 [3:32:20<5:36:13,  2.47s/it][A
Training...:  41% 5753/13907 [3:32:23<6:08:46,  2.71s/it][A
Training...:  41% 5754/13907 [3:32:26<6:25:49,  2.84s/it][A
Training...:  41% 5755/13907 [3:32:29<6:35:38,  2.91s/it][A
Training...:  41% 5756/13907 [3:32:32<6:38:03,  2.93s/it][A
Training...:  41% 5757/13907 [3:32:35<6:36:31,  2.92s/it][A
Training...:  41% 5758/13907 [3:32:38<6:33:21,  2.90s/it][A
Training...:  41% 5759/13907 [3:32:41<6:27:45,  2.86s/it][A
Training...:  41% 5760/13907 [3:32:44<6:21:34,  2.81s/it][A
Training...:  41% 5761/13907 [3:32:46<6:15:23,  2.76s/it][A
Training...:  41% 5762/13907 [3:32:49<6:08:10,  2.71s/it][A
Training...:  41% 5763/13907 [3:32:51<6:02:15,  2.67s/it][A
Training...:  41% 5764/13907 [3:32:54<5:56:44,  2.63s/it][A
Training...:  41% 5765/13907 [3:32:56<5:51:42,  2.59s/it][A
Training...:  41% 5766/13907 [3:32:59<5:46:25,  2.55s/it][A
Training...:  41% 5767/13907 [3:33:01<5:40:10,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:15:15<26:06:17, 31325.86s/it]
Training...:  41% 5767/13907 [3:33:04<5:40:10,  2.51s/it][A
Training...:  41% 5768/13907 [3:33:04<5:52:13,  2.60s/it][A
Training...:  41% 5769/13907 [3:33:07<5:44:29,  2.54s/it][A
Training...:  41% 5770/13907 [3:33:09<5:35:25,  2.47s/it][A
Training...:  41% 5771/13907 [3:33:11<5:28:21,  2.42s/it][A
Training...:  42% 5772/13907 [3:33:13<5:21:25,  2.37s/it][A
Training...:  42% 5773/13907 [3:33:16<5:15:15,  2.33s/it][A
Training...:  42% 5774/13907 [3:33:18<5:10:05,  2.29s/it][A
Training...:  42% 5775/13907 [3:33:20<5:05:17,  2.25s/it][A
Training...:  42% 5776/13907 [3:33:22<5:00:38,  2.22s/it][A
Training...:  42% 5777/13907 [3:33:24<4:56:10,  2.19s/it][A
Training...:  42% 5778/13907 [3:33:26<4:51:26,  2.15s/it][A
Training...:  42% 5779/13907 [3:33:28<4:47:03,  2.12s/it][A
Training...:  42% 5780/13907 [3:33:30<4:42:50,  2.09s/it][A
Training...:  42% 5781/13907 [3:33:32<4:38:55,  2.06s/it][A
Training...:  42% 5782/13907 [3:33:34<4:34:15,  2.03s/it][A
Training...:  42% 5783/13907 [3:33:36<4:29:59,  1.99s/it][A
Training...:  42% 5784/13907 [3:33:38<4:26:16,  1.97s/it][A
Training...:  42% 5785/13907 [3:33:40<4:22:00,  1.94s/it][A
Training...:  42% 5786/13907 [3:33:42<4:18:24,  1.91s/it][A
Training...:  42% 5787/13907 [3:33:44<4:14:26,  1.88s/it][A
Training...:  42% 5788/13907 [3:33:45<4:09:51,  1.85s/it][A
Training...:  42% 5789/13907 [3:33:47<4:05:37,  1.82s/it][A
Training...:  42% 5790/13907 [3:33:49<4:01:21,  1.78s/it][A
Training...:  42% 5791/13907 [3:33:51<3:56:42,  1.75s/it][A
Training...:  42% 5792/13907 [3:33:52<3:52:21,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:16:05<26:06:17, 31325.86s/it]
Training...:  42% 5792/13907 [3:33:54<3:52:21,  1.72s/it][A
Training...:  42% 5793/13907 [3:33:54<3:59:14,  1.77s/it][A
Training...:  42% 5794/13907 [3:33:56<3:54:01,  1.73s/it][A
Training...:  42% 5795/13907 [3:33:57<3:45:10,  1.67s/it][A
Training...:  42% 5796/13907 [3:33:59<3:34:51,  1.59s/it][A
Training...:  42% 5797/13907 [3:34:00<3:24:48,  1.52s/it][A
Training...:  42% 5798/13907 [3:34:01<3:13:54,  1.43s/it][A
Training...:  42% 5799/13907 [3:34:02<3:03:30,  1.36s/it][A
Training...:  42% 5800/13907 [3:34:03<2:50:02,  1.26s/it][A
Training...:  42% 5801/13907 [3:34:07<4:32:05,  2.01s/it][A
Training...:  42% 5802/13907 [3:34:11<5:30:11,  2.44s/it][A
Training...:  42% 5803/13907 [3:34:14<6:02:47,  2.69s/it][A
Training...:  42% 5804/13907 [3:34:17<6:20:48,  2.82s/it][A
Training...:  42% 5805/13907 [3:34:20<6:30:26,  2.89s/it][A
Training...:  42% 5806/13907 [3:34:23<6:33:52,  2.92s/it][A
Training...:  42% 5807/13907 [3:34:26<6:33:28,  2.91s/it][A
Training...:  42% 5808/13907 [3:34:29<6:29:07,  2.88s/it][A
Training...:  42% 5809/13907 [3:34:32<6:24:35,  2.85s/it][A
Training...:  42% 5810/13907 [3:34:34<6:17:19,  2.80s/it][A
Training...:  42% 5811/13907 [3:34:37<6:11:27,  2.75s/it][A
Training...:  42% 5812/13907 [3:34:40<6:06:01,  2.71s/it][A
Training...:  42% 5813/13907 [3:34:42<6:00:58,  2.68s/it][A
Training...:  42% 5814/13907 [3:34:45<5:54:14,  2.63s/it][A
Training...:  42% 5815/13907 [3:34:47<5:48:38,  2.59s/it][A
Training...:  42% 5816/13907 [3:34:50<5:42:54,  2.54s/it][A
Training...:  42% 5817/13907 [3:34:52<5:37:59,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:17:06<26:06:17, 31325.86s/it]
Training...:  42% 5817/13907 [3:34:55<5:37:59,  2.51s/it][A
Training...:  42% 5818/13907 [3:34:55<5:49:12,  2.59s/it][A
Training...:  42% 5819/13907 [3:34:57<5:42:00,  2.54s/it][A
Training...:  42% 5820/13907 [3:34:59<5:32:40,  2.47s/it][A
Training...:  42% 5821/13907 [3:35:02<5:25:10,  2.41s/it][A
Training...:  42% 5822/13907 [3:35:04<5:18:37,  2.36s/it][A
Training...:  42% 5823/13907 [3:35:06<5:12:11,  2.32s/it][A
Training...:  42% 5824/13907 [3:35:08<5:06:53,  2.28s/it][A
Training...:  42% 5825/13907 [3:35:11<5:01:55,  2.24s/it][A
Training...:  42% 5826/13907 [3:35:13<4:57:54,  2.21s/it][A
Training...:  42% 5827/13907 [3:35:15<4:52:35,  2.17s/it][A
Training...:  42% 5828/13907 [3:35:17<4:48:12,  2.14s/it][A
Training...:  42% 5829/13907 [3:35:19<4:43:52,  2.11s/it][A
Training...:  42% 5830/13907 [3:35:21<4:39:52,  2.08s/it][A
Training...:  42% 5831/13907 [3:35:23<4:35:34,  2.05s/it][A
Training...:  42% 5832/13907 [3:35:25<4:31:52,  2.02s/it][A
Training...:  42% 5833/13907 [3:35:27<4:27:12,  1.99s/it][A
Training...:  42% 5834/13907 [3:35:29<4:23:36,  1.96s/it][A
Training...:  42% 5835/13907 [3:35:31<4:21:21,  1.94s/it][A
Training...:  42% 5836/13907 [3:35:32<4:16:49,  1.91s/it][A
Training...:  42% 5837/13907 [3:35:34<4:13:17,  1.88s/it][A
Training...:  42% 5838/13907 [3:35:36<4:09:25,  1.85s/it][A
Training...:  42% 5839/13907 [3:35:38<4:04:56,  1.82s/it][A
Training...:  42% 5840/13907 [3:35:39<3:59:50,  1.78s/it][A
Training...:  42% 5841/13907 [3:35:41<3:55:03,  1.75s/it][A
Training...:  42% 5842/13907 [3:35:43<3:50:08,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:17:56<26:06:17, 31325.86s/it]
Training...:  42% 5842/13907 [3:35:45<3:50:08,  1.71s/it][A
Training...:  42% 5843/13907 [3:35:45<3:58:38,  1.78s/it][A
Training...:  42% 5844/13907 [3:35:46<3:52:45,  1.73s/it][A
Training...:  42% 5845/13907 [3:35:48<3:44:17,  1.67s/it][A
Training...:  42% 5846/13907 [3:35:49<3:35:33,  1.60s/it][A
Training...:  42% 5847/13907 [3:35:51<3:26:46,  1.54s/it][A
Training...:  42% 5848/13907 [3:35:52<3:18:50,  1.48s/it][A
Training...:  42% 5849/13907 [3:35:53<3:10:31,  1.42s/it][A
Training...:  42% 5850/13907 [3:35:54<2:56:48,  1.32s/it][A
Training...:  42% 5851/13907 [3:35:58<4:36:10,  2.06s/it][A
Training...:  42% 5852/13907 [3:36:02<5:31:38,  2.47s/it][A
Training...:  42% 5853/13907 [3:36:05<6:01:16,  2.69s/it][A
Training...:  42% 5854/13907 [3:36:08<6:17:49,  2.82s/it][A
Training...:  42% 5855/13907 [3:36:11<6:26:34,  2.88s/it][A
Training...:  42% 5856/13907 [3:36:14<6:28:34,  2.90s/it][A
Training...:  42% 5857/13907 [3:36:17<6:29:05,  2.90s/it][A
Training...:  42% 5858/13907 [3:36:20<6:25:15,  2.87s/it][A
Training...:  42% 5859/13907 [3:36:22<6:20:19,  2.84s/it][A
Training...:  42% 5860/13907 [3:36:25<6:15:17,  2.80s/it][A
Training...:  42% 5861/13907 [3:36:28<6:10:01,  2.76s/it][A
Training...:  42% 5862/13907 [3:36:30<6:04:37,  2.72s/it][A
Training...:  42% 5863/13907 [3:36:33<6:00:08,  2.69s/it][A
Training...:  42% 5864/13907 [3:36:35<5:54:48,  2.65s/it][A
Training...:  42% 5865/13907 [3:36:38<5:49:24,  2.61s/it][A
Training...:  42% 5866/13907 [3:36:40<5:43:44,  2.56s/it][A
Training...:  42% 5867/13907 [3:36:43<5:39:38,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:18:57<26:06:17, 31325.86s/it]
Training...:  42% 5867/13907 [3:36:46<5:39:38,  2.53s/it][A
Training...:  42% 5868/13907 [3:36:46<5:51:20,  2.62s/it][A
Training...:  42% 5869/13907 [3:36:48<5:44:17,  2.57s/it][A
Training...:  42% 5870/13907 [3:36:50<5:34:02,  2.49s/it][A
Training...:  42% 5871/13907 [3:36:53<5:26:01,  2.43s/it][A
Training...:  42% 5872/13907 [3:36:55<5:19:28,  2.39s/it][A
Training...:  42% 5873/13907 [3:36:57<5:12:59,  2.34s/it][A
Training...:  42% 5874/13907 [3:36:59<5:07:00,  2.29s/it][A
Training...:  42% 5875/13907 [3:37:02<5:02:12,  2.26s/it][A
Training...:  42% 5876/13907 [3:37:04<4:55:56,  2.21s/it][A
Training...:  42% 5877/13907 [3:37:06<4:51:36,  2.18s/it][A
Training...:  42% 5878/13907 [3:37:08<4:46:25,  2.14s/it][A
Training...:  42% 5879/13907 [3:37:10<4:42:27,  2.11s/it][A
Training...:  42% 5880/13907 [3:37:12<4:37:54,  2.08s/it][A
Training...:  42% 5881/13907 [3:37:14<4:34:06,  2.05s/it][A
Training...:  42% 5882/13907 [3:37:16<4:29:45,  2.02s/it][A
Training...:  42% 5883/13907 [3:37:18<4:26:17,  1.99s/it][A
Training...:  42% 5884/13907 [3:37:20<4:21:22,  1.95s/it][A
Training...:  42% 5885/13907 [3:37:22<4:16:58,  1.92s/it][A
Training...:  42% 5886/13907 [3:37:23<4:12:56,  1.89s/it][A
Training...:  42% 5887/13907 [3:37:25<4:09:29,  1.87s/it][A
Training...:  42% 5888/13907 [3:37:27<4:04:55,  1.83s/it][A
Training...:  42% 5889/13907 [3:37:29<4:00:55,  1.80s/it][A
Training...:  42% 5890/13907 [3:37:30<3:56:22,  1.77s/it][A
Training...:  42% 5891/13907 [3:37:32<3:52:30,  1.74s/it][A
Training...:  42% 5892/13907 [3:37:34<3:48:23,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:19:47<26:06:17, 31325.86s/it]
Training...:  42% 5892/13907 [3:37:35<3:48:23,  1.71s/it][A
Training...:  42% 5893/13907 [3:37:35<3:55:06,  1.76s/it][A
Training...:  42% 5894/13907 [3:37:37<3:47:52,  1.71s/it][A
Training...:  42% 5895/13907 [3:37:39<3:39:39,  1.64s/it][A
Training...:  42% 5896/13907 [3:37:40<3:30:59,  1.58s/it][A
Training...:  42% 5897/13907 [3:37:41<3:23:04,  1.52s/it][A
Training...:  42% 5898/13907 [3:37:43<3:14:11,  1.45s/it][A
Training...:  42% 5899/13907 [3:37:44<3:04:43,  1.38s/it][A
Training...:  42% 5900/13907 [3:37:45<2:49:58,  1.27s/it][A
Training...:  42% 5901/13907 [3:37:49<4:31:38,  2.04s/it][A
Training...:  42% 5902/13907 [3:37:52<5:28:43,  2.46s/it][A
Training...:  42% 5903/13907 [3:37:56<6:04:30,  2.73s/it][A
Training...:  42% 5904/13907 [3:37:59<6:22:17,  2.87s/it][A
Training...:  42% 5905/13907 [3:38:02<6:31:21,  2.93s/it][A
Training...:  42% 5906/13907 [3:38:05<6:35:01,  2.96s/it][A
Training...:  42% 5907/13907 [3:38:08<6:35:54,  2.97s/it][A
Training...:  42% 5908/13907 [3:38:11<6:32:04,  2.94s/it][A
Training...:  42% 5909/13907 [3:38:14<6:25:36,  2.89s/it][A
Training...:  42% 5910/13907 [3:38:16<6:18:04,  2.84s/it][A
Training...:  43% 5911/13907 [3:38:19<6:11:44,  2.79s/it][A
Training...:  43% 5912/13907 [3:38:22<6:04:37,  2.74s/it][A
Training...:  43% 5913/13907 [3:38:24<5:58:35,  2.69s/it][A
Training...:  43% 5914/13907 [3:38:27<5:53:01,  2.65s/it][A
Training...:  43% 5915/13907 [3:38:29<5:47:02,  2.61s/it][A
Training...:  43% 5916/13907 [3:38:32<5:41:48,  2.57s/it][A
Training...:  43% 5917/13907 [3:38:34<5:37:05,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:20:48<26:06:17, 31325.86s/it]
Training...:  43% 5917/13907 [3:38:37<5:37:05,  2.53s/it][A
Training...:  43% 5918/13907 [3:38:37<5:48:12,  2.62s/it][A
Training...:  43% 5919/13907 [3:38:39<5:41:32,  2.57s/it][A
Training...:  43% 5920/13907 [3:38:42<5:32:29,  2.50s/it][A
Training...:  43% 5921/13907 [3:38:44<5:23:49,  2.43s/it][A
Training...:  43% 5922/13907 [3:38:46<5:17:09,  2.38s/it][A
Training...:  43% 5923/13907 [3:38:48<5:11:34,  2.34s/it][A
Training...:  43% 5924/13907 [3:38:51<5:04:27,  2.29s/it][A
Training...:  43% 5925/13907 [3:38:53<4:57:57,  2.24s/it][A
Training...:  43% 5926/13907 [3:38:55<4:52:54,  2.20s/it][A
Training...:  43% 5927/13907 [3:38:57<4:49:32,  2.18s/it][A
Training...:  43% 5928/13907 [3:38:59<4:44:53,  2.14s/it][A
Training...:  43% 5929/13907 [3:39:01<4:41:03,  2.11s/it][A
Training...:  43% 5930/13907 [3:39:03<4:36:48,  2.08s/it][A
Training...:  43% 5931/13907 [3:39:05<4:33:29,  2.06s/it][A
Training...:  43% 5932/13907 [3:39:07<4:29:51,  2.03s/it][A
Training...:  43% 5933/13907 [3:39:09<4:25:51,  2.00s/it][A
Training...:  43% 5934/13907 [3:39:11<4:21:06,  1.96s/it][A
Training...:  43% 5935/13907 [3:39:13<4:18:27,  1.95s/it][A
Training...:  43% 5936/13907 [3:39:15<4:13:20,  1.91s/it][A
Training...:  43% 5937/13907 [3:39:16<4:08:22,  1.87s/it][A
Training...:  43% 5938/13907 [3:39:18<4:04:02,  1.84s/it][A
Training...:  43% 5939/13907 [3:39:20<3:59:05,  1.80s/it][A
Training...:  43% 5940/13907 [3:39:22<3:54:10,  1.76s/it][A
Training...:  43% 5941/13907 [3:39:23<3:48:57,  1.72s/it][A
Training...:  43% 5942/13907 [3:39:25<3:44:01,  1.69s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:21:38<26:06:17, 31325.86s/it]
Training...:  43% 5942/13907 [3:39:27<3:44:01,  1.69s/it][A
Training...:  43% 5943/13907 [3:39:27<3:51:40,  1.75s/it][A
Training...:  43% 5944/13907 [3:39:28<3:45:39,  1.70s/it][A
Training...:  43% 5945/13907 [3:39:30<3:36:47,  1.63s/it][A
Training...:  43% 5946/13907 [3:39:31<3:28:35,  1.57s/it][A
Training...:  43% 5947/13907 [3:39:33<3:20:22,  1.51s/it][A
Training...:  43% 5948/13907 [3:39:34<3:14:39,  1.47s/it][A
Training...:  43% 5949/13907 [3:39:35<3:05:34,  1.40s/it][A
Training...:  43% 5950/13907 [3:39:36<2:51:11,  1.29s/it][A
Training...:  43% 5951/13907 [3:39:40<4:28:48,  2.03s/it][A
Training...:  43% 5952/13907 [3:39:43<5:27:02,  2.47s/it][A
Training...:  43% 5953/13907 [3:39:47<6:02:21,  2.73s/it][A
Training...:  43% 5954/13907 [3:39:50<6:16:54,  2.84s/it][A
Training...:  43% 5955/13907 [3:39:53<6:24:24,  2.90s/it][A
Training...:  43% 5956/13907 [3:39:56<6:23:56,  2.90s/it][A
Training...:  43% 5957/13907 [3:39:59<6:22:55,  2.89s/it][A
Training...:  43% 5958/13907 [3:40:01<6:19:15,  2.86s/it][A
Training...:  43% 5959/13907 [3:40:04<6:15:26,  2.83s/it][A
Training...:  43% 5960/13907 [3:40:07<6:08:38,  2.78s/it][A
Training...:  43% 5961/13907 [3:40:10<6:02:36,  2.74s/it][A
Training...:  43% 5962/13907 [3:40:12<5:56:12,  2.69s/it][A
Training...:  43% 5963/13907 [3:40:15<5:51:43,  2.66s/it][A
Training...:  43% 5964/13907 [3:40:17<5:46:30,  2.62s/it][A
Training...:  43% 5965/13907 [3:40:20<5:40:52,  2.58s/it][A
Training...:  43% 5966/13907 [3:40:22<5:36:12,  2.54s/it][A
Training...:  43% 5967/13907 [3:40:25<5:31:15,  2.50s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:22:39<26:06:17, 31325.86s/it]
Training...:  43% 5967/13907 [3:40:27<5:31:15,  2.50s/it][A
Training...:  43% 5968/13907 [3:40:27<5:43:07,  2.59s/it][A
Training...:  43% 5969/13907 [3:40:30<5:35:36,  2.54s/it][A
Training...:  43% 5970/13907 [3:40:32<5:28:06,  2.48s/it][A
Training...:  43% 5971/13907 [3:40:34<5:20:17,  2.42s/it][A
Training...:  43% 5972/13907 [3:40:37<5:14:22,  2.38s/it][A
Training...:  43% 5973/13907 [3:40:39<5:08:05,  2.33s/it][A
Training...:  43% 5974/13907 [3:40:41<5:02:43,  2.29s/it][A
Training...:  43% 5975/13907 [3:40:43<4:56:38,  2.24s/it][A
Training...:  43% 5976/13907 [3:40:45<4:51:15,  2.20s/it][A
Training...:  43% 5977/13907 [3:40:47<4:48:18,  2.18s/it][A
Training...:  43% 5978/13907 [3:40:50<4:43:37,  2.15s/it][A
Training...:  43% 5979/13907 [3:40:52<4:40:16,  2.12s/it][A
Training...:  43% 5980/13907 [3:40:54<4:36:30,  2.09s/it][A
Training...:  43% 5981/13907 [3:40:56<4:33:04,  2.07s/it][A
Training...:  43% 5982/13907 [3:40:58<4:28:44,  2.03s/it][A
Training...:  43% 5983/13907 [3:40:59<4:23:56,  2.00s/it][A
Training...:  43% 5984/13907 [3:41:01<4:19:14,  1.96s/it][A
Training...:  43% 5985/13907 [3:41:03<4:15:47,  1.94s/it][A
Training...:  43% 5986/13907 [3:41:05<4:11:00,  1.90s/it][A
Training...:  43% 5987/13907 [3:41:07<4:07:39,  1.88s/it][A
Training...:  43% 5988/13907 [3:41:09<4:03:37,  1.85s/it][A
Training...:  43% 5989/13907 [3:41:10<3:58:35,  1.81s/it][A
Training...:  43% 5990/13907 [3:41:12<3:54:07,  1.77s/it][A
Training...:  43% 5991/13907 [3:41:14<3:51:09,  1.75s/it][A
Training...:  43% 5992/13907 [3:41:15<3:45:56,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:23:29<26:06:17, 31325.86s/it]
Training...:  43% 5992/13907 [3:41:17<3:45:56,  1.71s/it][A
Training...:  43% 5993/13907 [3:41:17<3:53:55,  1.77s/it][A
Training...:  43% 5994/13907 [3:41:19<3:47:40,  1.73s/it][A
Training...:  43% 5995/13907 [3:41:20<3:38:24,  1.66s/it][A
Training...:  43% 5996/13907 [3:41:22<3:30:12,  1.59s/it][A
Training...:  43% 5997/13907 [3:41:23<3:21:25,  1.53s/it][A
Training...:  43% 5998/13907 [3:41:25<3:12:15,  1.46s/it][A
Training...:  43% 5999/13907 [3:41:26<3:02:49,  1.39s/it][A
Training...:  43% 6000/13907 [3:41:27<2:49:10,  1.28s/it][A
Training...:  43% 6001/13907 [3:41:31<4:26:19,  2.02s/it][A
Training...:  43% 6002/13907 [3:41:34<5:23:04,  2.45s/it][A
Training...:  43% 6003/13907 [3:41:37<5:53:59,  2.69s/it][A
Training...:  43% 6004/13907 [3:41:40<6:11:42,  2.82s/it][A
Training...:  43% 6005/13907 [3:41:43<6:21:01,  2.89s/it][A
Training...:  43% 6006/13907 [3:41:46<6:23:25,  2.91s/it][A
Training...:  43% 6007/13907 [3:41:49<6:24:14,  2.92s/it][A
Training...:  43% 6008/13907 [3:41:52<6:20:54,  2.89s/it][A
Training...:  43% 6009/13907 [3:41:55<6:16:49,  2.86s/it][A
Training...:  43% 6010/13907 [3:41:58<6:11:16,  2.82s/it][A
Training...:  43% 6011/13907 [3:42:00<6:05:32,  2.78s/it][A
Training...:  43% 6012/13907 [3:42:03<6:00:18,  2.74s/it][A
Training...:  43% 6013/13907 [3:42:06<5:54:11,  2.69s/it][A
Training...:  43% 6014/13907 [3:42:08<5:49:35,  2.66s/it][A
Training...:  43% 6015/13907 [3:42:11<5:44:57,  2.62s/it][A
Training...:  43% 6016/13907 [3:42:13<5:38:53,  2.58s/it][A
Training...:  43% 6017/13907 [3:42:16<5:33:55,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:24:30<26:06:17, 31325.86s/it]
Training...:  43% 6017/13907 [3:42:18<5:33:55,  2.54s/it][A
Training...:  43% 6018/13907 [3:42:18<5:45:08,  2.62s/it][A
Training...:  43% 6019/13907 [3:42:21<5:38:07,  2.57s/it][A
Training...:  43% 6020/13907 [3:42:23<5:28:49,  2.50s/it][A
Training...:  43% 6021/13907 [3:42:26<5:21:06,  2.44s/it][A
Training...:  43% 6022/13907 [3:42:28<5:15:05,  2.40s/it][A
Training...:  43% 6023/13907 [3:42:30<5:09:31,  2.36s/it][A
Training...:  43% 6024/13907 [3:42:32<5:03:18,  2.31s/it][A
Training...:  43% 6025/13907 [3:42:34<4:58:20,  2.27s/it][A
Training...:  43% 6026/13907 [3:42:37<4:54:44,  2.24s/it][A
Training...:  43% 6027/13907 [3:42:39<4:51:24,  2.22s/it][A
Training...:  43% 6028/13907 [3:42:41<4:48:03,  2.19s/it][A
Training...:  43% 6029/13907 [3:42:43<4:42:40,  2.15s/it][A
Training...:  43% 6030/13907 [3:42:45<4:37:00,  2.11s/it][A
Training...:  43% 6031/13907 [3:42:47<4:32:49,  2.08s/it][A
Training...:  43% 6032/13907 [3:42:49<4:28:10,  2.04s/it][A
Training...:  43% 6033/13907 [3:42:51<4:23:18,  2.01s/it][A
Training...:  43% 6034/13907 [3:42:53<4:18:27,  1.97s/it][A
Training...:  43% 6035/13907 [3:42:55<4:14:18,  1.94s/it][A
Training...:  43% 6036/13907 [3:42:56<4:10:12,  1.91s/it][A
Training...:  43% 6037/13907 [3:42:58<4:08:30,  1.89s/it][A
Training...:  43% 6038/13907 [3:43:00<4:03:35,  1.86s/it][A
Training...:  43% 6039/13907 [3:43:02<3:59:29,  1.83s/it][A
Training...:  43% 6040/13907 [3:43:04<3:54:43,  1.79s/it][A
Training...:  43% 6041/13907 [3:43:05<3:50:22,  1.76s/it][A
Training...:  43% 6042/13907 [3:43:07<3:44:48,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:25:20<26:06:17, 31325.86s/it]
Training...:  43% 6042/13907 [3:43:09<3:44:48,  1.72s/it][A
Training...:  43% 6043/13907 [3:43:09<3:52:09,  1.77s/it][A
Training...:  43% 6044/13907 [3:43:10<3:47:35,  1.74s/it][A
Training...:  43% 6045/13907 [3:43:12<3:38:29,  1.67s/it][A
Training...:  43% 6046/13907 [3:43:13<3:28:42,  1.59s/it][A
Training...:  43% 6047/13907 [3:43:15<3:19:34,  1.52s/it][A
Training...:  43% 6048/13907 [3:43:16<3:10:50,  1.46s/it][A
Training...:  43% 6049/13907 [3:43:17<3:01:35,  1.39s/it][A
Training...:  44% 6050/13907 [3:43:18<2:49:16,  1.29s/it][A
Training...:  44% 6051/13907 [3:43:22<4:24:04,  2.02s/it][A
Training...:  44% 6052/13907 [3:43:25<5:18:14,  2.43s/it][A
Training...:  44% 6053/13907 [3:43:29<5:49:54,  2.67s/it][A
Training...:  44% 6054/13907 [3:43:32<6:05:10,  2.79s/it][A
Training...:  44% 6055/13907 [3:43:35<6:14:15,  2.86s/it][A
Training...:  44% 6056/13907 [3:43:38<6:15:02,  2.87s/it][A
Training...:  44% 6057/13907 [3:43:40<6:14:41,  2.86s/it][A
Training...:  44% 6058/13907 [3:43:43<6:10:20,  2.83s/it][A
Training...:  44% 6059/13907 [3:43:46<6:06:31,  2.80s/it][A
Training...:  44% 6060/13907 [3:43:49<6:01:22,  2.76s/it][A
Training...:  44% 6061/13907 [3:43:51<5:56:12,  2.72s/it][A
Training...:  44% 6062/13907 [3:43:54<5:50:24,  2.68s/it][A
Training...:  44% 6063/13907 [3:43:56<5:44:35,  2.64s/it][A
Training...:  44% 6064/13907 [3:43:59<5:39:26,  2.60s/it][A
Training...:  44% 6065/13907 [3:44:01<5:35:08,  2.56s/it][A
Training...:  44% 6066/13907 [3:44:04<5:29:07,  2.52s/it][A
Training...:  44% 6067/13907 [3:44:06<5:25:13,  2.49s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:26:20<26:06:17, 31325.86s/it]
Training...:  44% 6067/13907 [3:44:09<5:25:13,  2.49s/it][A
Training...:  44% 6068/13907 [3:44:09<5:36:59,  2.58s/it][A
Training...:  44% 6069/13907 [3:44:11<5:31:27,  2.54s/it][A
Training...:  44% 6070/13907 [3:44:14<5:21:58,  2.47s/it][A
Training...:  44% 6071/13907 [3:44:16<5:13:47,  2.40s/it][A
Training...:  44% 6072/13907 [3:44:18<5:08:25,  2.36s/it][A
Training...:  44% 6073/13907 [3:44:20<5:02:40,  2.32s/it][A
Training...:  44% 6074/13907 [3:44:23<4:58:11,  2.28s/it][A
Training...:  44% 6075/13907 [3:44:25<4:52:31,  2.24s/it][A
Training...:  44% 6076/13907 [3:44:27<4:47:28,  2.20s/it][A
Training...:  44% 6077/13907 [3:44:29<4:43:33,  2.17s/it][A
Training...:  44% 6078/13907 [3:44:31<4:39:15,  2.14s/it][A
Training...:  44% 6079/13907 [3:44:33<4:35:35,  2.11s/it][A
Training...:  44% 6080/13907 [3:44:35<4:33:14,  2.09s/it][A
Training...:  44% 6081/13907 [3:44:37<4:29:05,  2.06s/it][A
Training...:  44% 6082/13907 [3:44:39<4:25:33,  2.04s/it][A
Training...:  44% 6083/13907 [3:44:41<4:22:36,  2.01s/it][A
Training...:  44% 6084/13907 [3:44:43<4:18:10,  1.98s/it][A
Training...:  44% 6085/13907 [3:44:45<4:13:40,  1.95s/it][A
Training...:  44% 6086/13907 [3:44:47<4:08:41,  1.91s/it][A
Training...:  44% 6087/13907 [3:44:49<4:04:35,  1.88s/it][A
Training...:  44% 6088/13907 [3:44:50<4:00:29,  1.85s/it][A
Training...:  44% 6089/13907 [3:44:52<3:56:23,  1.81s/it][A
Training...:  44% 6090/13907 [3:44:54<3:51:18,  1.78s/it][A
Training...:  44% 6091/13907 [3:44:55<3:47:37,  1.75s/it][A
Training...:  44% 6092/13907 [3:44:57<3:42:27,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:27:10<26:06:17, 31325.86s/it]
Training...:  44% 6092/13907 [3:44:59<3:42:27,  1.71s/it][A

Evaluating ...:   0% 0/255 [00:00<?, ?it/s][A[AStep... (19150 | Loss: 0.19899770617485046, Learning Rate: 0.0001869757688837126, Gradient Norm: 1.085646152496338)
Step... (19175 | Loss: 0.23006638884544373, Learning Rate: 0.00018682425434235483, Gradient Norm: 0.8267069458961487)
Step... (19200 | Loss: 0.30727073550224304, Learning Rate: 0.00018667273980099708, Gradient Norm: 1.6996009349822998)
Step... (19225 | Loss: 0.23787102103233337, Learning Rate: 0.0001865212107077241, Gradient Norm: 0.9277358055114746)
Step... (19250 | Loss: 0.23890547454357147, Learning Rate: 0.00018636971071828157, Gradient Norm: 1.795864224433899)
Step... (19275 | Loss: 0.19958975911140442, Learning Rate: 0.0001862181961769238, Gradient Norm: 0.8102827668190002)
Step... (19300 | Loss: 0.1940518021583557, Learning Rate: 0.00018606666708365083, Gradient Norm: 0.9503757357597351)
Step... (19325 | Loss: 0.2758357524871826, Learning Rate: 0.0001859151670942083, Gradient Norm: 0.8781234622001648)
Step... (19350 | Loss: 0.2756150960922241, Learning Rate: 0.00018576365255285054, Gradient Norm: 1.2632588148117065)
Step... (19375 | Loss: 0.19843065738677979, Learning Rate: 0.00018561212345957756, Gradient Norm: 0.7943055629730225)
Step... (19400 | Loss: 0.2104301005601883, Learning Rate: 0.00018546062347013503, Gradient Norm: 0.9627395868301392)
Step... (19425 | Loss: 0.28791606426239014, Learning Rate: 0.00018530910892877728, Gradient Norm: 0.8185563683509827)
Step... (19450 | Loss: 0.1899678111076355, Learning Rate: 0.0001851575798355043, Gradient Norm: 1.2431391477584839)
Step... (19475 | Loss: 0.24267178773880005, Learning Rate: 0.00018500607984606177, Gradient Norm: 0.7769120931625366)
Step... (19500 | Loss: 0.23830276727676392, Learning Rate: 0.000184854565304704, Gradient Norm: 1.1880557537078857)
Step... (19525 | Loss: 0.26712924242019653, Learning Rate: 0.00018470303621143103, Gradient Norm: 0.9822021126747131)
Step... (19550 | Loss: 0.2147374153137207, Learning Rate: 0.00018455152167007327, Gradient Norm: 0.9392555356025696)
Step... (19575 | Loss: 0.2578152120113373, Learning Rate: 0.00018440002168063074, Gradient Norm: 0.9128132462501526)
Step... (19600 | Loss: 0.2935369908809662, Learning Rate: 0.00018424849258735776, Gradient Norm: 1.1874094009399414)
Step... (19625 | Loss: 0.19670310616493225, Learning Rate: 0.000184096978046, Gradient Norm: 0.8571730852127075)
Step... (19650 | Loss: 0.2501959204673767, Learning Rate: 0.00018394547805655748, Gradient Norm: 1.078188180923462)
Step... (19675 | Loss: 0.2057936191558838, Learning Rate: 0.0001837939489632845, Gradient Norm: 0.8559530377388)
Step... (19700 | Loss: 0.26903271675109863, Learning Rate: 0.00018364243442192674, Gradient Norm: 1.3375462293624878)
Step... (19725 | Loss: 0.25336983799934387, Learning Rate: 0.0001834909344324842, Gradient Norm: 0.9321486353874207)
Step... (19750 | Loss: 0.27786627411842346, Learning Rate: 0.00018333940533921123, Gradient Norm: 1.0581340789794922)
Step... (19775 | Loss: 0.2799428105354309, Learning Rate: 0.00018318787624593824, Gradient Norm: 0.8963663578033447)
Step... (19800 | Loss: 0.17754001915454865, Learning Rate: 0.00018303639080841094, Gradient Norm: 1.2348798513412476)
Step... (19825 | Loss: 0.18962763249874115, Learning Rate: 0.00018288486171513796, Gradient Norm: 0.6650133728981018)
Step... (19850 | Loss: 0.2523159980773926, Learning Rate: 0.00018273333262186497, Gradient Norm: 1.2566211223602295)
Step... (19875 | Loss: 0.23435622453689575, Learning Rate: 0.00018258183263242245, Gradient Norm: 1.0170962810516357)
Step... (19900 | Loss: 0.2468220442533493, Learning Rate: 0.0001824303180910647, Gradient Norm: 0.96147620677948)
Step... (19925 | Loss: 0.25431954860687256, Learning Rate: 0.0001822787889977917, Gradient Norm: 1.1123743057250977)
Step... (19950 | Loss: 0.2420503795146942, Learning Rate: 0.00018212728900834918, Gradient Norm: 1.0658321380615234)
Step... (19975 | Loss: 0.25081270933151245, Learning Rate: 0.0001819757599150762, Gradient Norm: 1.0272985696792603)
Step... (20000 | Loss: 0.25286948680877686, Learning Rate: 0.00018182424537371844, Gradient Norm: 0.9784551858901978)


Evaluating ...:   0% 1/255 [00:04<18:27,  4.36s/it][A[A

Evaluating ...:   1% 2/255 [00:08<16:48,  3.99s/it][A[A

Evaluating ...:   1% 3/255 [00:11<15:55,  3.79s/it][A[A

Evaluating ...:   2% 4/255 [00:15<15:12,  3.64s/it][A[A

Evaluating ...:   2% 5/255 [00:18<14:42,  3.53s/it][A[A

Evaluating ...:   2% 6/255 [00:21<14:11,  3.42s/it][A[A

Evaluating ...:   3% 7/255 [00:24<13:40,  3.31s/it][A[A

Evaluating ...:   3% 8/255 [00:27<13:16,  3.22s/it][A[A

Evaluating ...:   4% 9/255 [00:30<12:51,  3.14s/it][A[A

Evaluating ...:   4% 10/255 [00:33<12:22,  3.03s/it][A[A

Evaluating ...:   4% 11/255 [00:36<12:03,  2.97s/it][A[A

Evaluating ...:   5% 12/255 [00:39<11:43,  2.90s/it][A[A

Evaluating ...:   5% 13/255 [00:41<11:33,  2.86s/it][A[A

Evaluating ...:   5% 14/255 [00:44<11:11,  2.79s/it][A[A

Evaluating ...:   6% 15/255 [00:47<10:58,  2.74s/it][A[A

Evaluating ...:   6% 16/255 [00:49<10:39,  2.68s/it][A[A

Evaluating ...:   7% 17/255 [00:52<10:29,  2.65s/it][A[A

Evaluating ...:   7% 18/255 [00:54<10:13,  2.59s/it][A[A

Evaluating ...:   7% 19/255 [00:57<10:02,  2.55s/it][A[A

Evaluating ...:   8% 20/255 [00:59<09:47,  2.50s/it][A[A

Evaluating ...:   8% 21/255 [01:01<09:33,  2.45s/it][A[A

Evaluating ...:   9% 22/255 [01:04<09:18,  2.40s/it][A[A

Evaluating ...:   9% 23/255 [01:06<09:05,  2.35s/it][A[A

Evaluating ...:   9% 24/255 [01:08<08:49,  2.29s/it][A[A

Evaluating ...:  10% 25/255 [01:10<08:39,  2.26s/it][A[A

Evaluating ...:  10% 26/255 [01:12<08:25,  2.21s/it][A[A

Evaluating ...:  11% 27/255 [01:14<08:16,  2.18s/it][A[A

Evaluating ...:  11% 28/255 [01:16<08:05,  2.14s/it][A[A

Evaluating ...:  11% 29/255 [01:18<07:57,  2.11s/it][A[A

Evaluating ...:  12% 30/255 [01:20<07:44,  2.06s/it][A[A

Evaluating ...:  12% 31/255 [01:22<07:36,  2.04s/it][A[A

Evaluating ...:  13% 32/255 [01:24<07:23,  1.99s/it][A[A

Evaluating ...:  13% 33/255 [01:26<07:15,  1.96s/it][A[A

Evaluating ...:  13% 34/255 [01:28<07:04,  1.92s/it][A[A

Evaluating ...:  14% 35/255 [01:30<06:56,  1.89s/it][A[A

Evaluating ...:  14% 36/255 [01:32<06:44,  1.85s/it][A[A

Evaluating ...:  15% 37/255 [01:33<06:39,  1.83s/it][A[A

Evaluating ...:  15% 38/255 [01:35<06:29,  1.80s/it][A[A

Evaluating ...:  15% 39/255 [01:37<06:23,  1.77s/it][A[A

Evaluating ...:  16% 40/255 [01:38<06:10,  1.73s/it][A[A

Evaluating ...:  16% 41/255 [01:40<06:03,  1.70s/it][A[A

Evaluating ...:  16% 42/255 [01:41<05:48,  1.64s/it][A[A

Evaluating ...:  17% 43/255 [01:43<05:37,  1.59s/it][A[A

Evaluating ...:  17% 44/255 [01:44<05:24,  1.54s/it][A[A

Evaluating ...:  18% 45/255 [01:46<05:14,  1.50s/it][A[A

Evaluating ...:  18% 46/255 [01:47<05:00,  1.44s/it][A[A

Evaluating ...:  18% 47/255 [01:48<04:49,  1.39s/it][A[A

Evaluating ...:  19% 48/255 [01:50<04:34,  1.32s/it][A[A

Evaluating ...:  19% 49/255 [01:51<04:20,  1.27s/it][A[A

Evaluating ...:  20% 50/255 [01:52<03:59,  1.17s/it][A[A

Evaluating ...:  20% 51/255 [01:56<07:05,  2.09s/it][A[A

Evaluating ...:  20% 52/255 [02:00<08:51,  2.62s/it][A[A

Evaluating ...:  21% 53/255 [02:04<10:03,  2.99s/it][A[A

Evaluating ...:  21% 54/255 [02:07<10:37,  3.17s/it][A[A

Evaluating ...:  22% 55/255 [02:11<10:56,  3.28s/it][A[A

Evaluating ...:  22% 56/255 [02:14<10:56,  3.30s/it][A[A

Evaluating ...:  22% 57/255 [02:17<10:56,  3.32s/it][A[A

Evaluating ...:  23% 58/255 [02:21<10:46,  3.28s/it][A[A

Evaluating ...:  23% 59/255 [02:24<10:42,  3.28s/it][A[A

Evaluating ...:  24% 60/255 [02:27<10:28,  3.22s/it][A[A

Evaluating ...:  24% 61/255 [02:30<10:21,  3.20s/it][A[A

Evaluating ...:  24% 62/255 [02:33<10:04,  3.13s/it][A[A

Evaluating ...:  25% 63/255 [02:36<09:57,  3.11s/it][A[A

Evaluating ...:  25% 64/255 [02:39<09:42,  3.05s/it][A[A

Evaluating ...:  25% 65/255 [02:42<09:29,  3.00s/it][A[A

Evaluating ...:  26% 66/255 [02:45<09:15,  2.94s/it][A[A

Evaluating ...:  26% 67/255 [02:48<09:06,  2.91s/it][A[A

Evaluating ...:  27% 68/255 [02:50<08:53,  2.85s/it][A[A

Evaluating ...:  27% 69/255 [02:53<08:45,  2.82s/it][A[A

Evaluating ...:  27% 70/255 [02:56<08:34,  2.78s/it][A[A

Evaluating ...:  28% 71/255 [02:58<08:28,  2.76s/it][A[A

Evaluating ...:  28% 72/255 [03:01<08:16,  2.71s/it][A[A

Evaluating ...:  29% 73/255 [03:04<08:11,  2.70s/it][A[A

Evaluating ...:  29% 74/255 [03:06<07:59,  2.65s/it][A[A

Evaluating ...:  29% 75/255 [03:09<07:52,  2.62s/it][A[A

Evaluating ...:  30% 76/255 [03:11<07:41,  2.58s/it][A[A

Evaluating ...:  30% 77/255 [03:14<07:33,  2.55s/it][A[A

Evaluating ...:  31% 78/255 [03:16<07:25,  2.52s/it][A[A

Evaluating ...:  31% 79/255 [03:19<07:22,  2.51s/it][A[A

Evaluating ...:  31% 80/255 [03:21<07:16,  2.49s/it][A[A

Evaluating ...:  32% 81/255 [03:24<07:07,  2.46s/it][A[A

Evaluating ...:  32% 82/255 [03:26<07:00,  2.43s/it][A[A

Evaluating ...:  33% 83/255 [03:28<06:54,  2.41s/it][A[A

Evaluating ...:  33% 84/255 [03:30<06:42,  2.36s/it][A[A

Evaluating ...:  33% 85/255 [03:33<06:33,  2.31s/it][A[A

Evaluating ...:  34% 86/255 [03:35<06:21,  2.26s/it][A[A

Evaluating ...:  34% 87/255 [03:37<06:15,  2.24s/it][A[A

Evaluating ...:  35% 88/255 [03:39<06:05,  2.19s/it][A[A

Evaluating ...:  35% 89/255 [03:41<05:57,  2.15s/it][A[A

Evaluating ...:  35% 90/255 [03:43<05:47,  2.10s/it][A[A

Evaluating ...:  36% 91/255 [03:45<05:40,  2.08s/it][A[A

Evaluating ...:  36% 92/255 [03:47<05:30,  2.03s/it][A[A

Evaluating ...:  36% 93/255 [03:49<05:22,  1.99s/it][A[A

Evaluating ...:  37% 94/255 [03:51<05:12,  1.94s/it][A[A

Evaluating ...:  37% 95/255 [03:53<05:03,  1.89s/it][A[A

Evaluating ...:  38% 96/255 [03:54<04:51,  1.83s/it][A[A

Evaluating ...:  38% 97/255 [03:56<04:41,  1.78s/it][A[A

Evaluating ...:  38% 98/255 [03:57<04:26,  1.70s/it][A[A

Evaluating ...:  39% 99/255 [03:59<04:12,  1.62s/it][A[A

Evaluating ...:  39% 100/255 [04:00<03:49,  1.48s/it][A[A

Evaluating ...:  40% 101/255 [04:04<05:56,  2.32s/it][A[A

Evaluating ...:  40% 102/255 [04:08<07:03,  2.77s/it][A[A

Evaluating ...:  40% 103/255 [04:12<07:44,  3.06s/it][A[A

Evaluating ...:  41% 104/255 [04:15<08:01,  3.19s/it][A[A

Evaluating ...:  41% 105/255 [04:19<08:11,  3.28s/it][A[A

Evaluating ...:  42% 106/255 [04:22<08:10,  3.29s/it][A[A

Evaluating ...:  42% 107/255 [04:25<08:08,  3.30s/it][A[A

Evaluating ...:  42% 108/255 [04:29<08:00,  3.27s/it][A[A

Evaluating ...:  43% 109/255 [04:32<08:00,  3.29s/it][A[A

Evaluating ...:  43% 110/255 [04:35<07:48,  3.23s/it][A[A

Evaluating ...:  44% 111/255 [04:38<07:35,  3.17s/it][A[A

Evaluating ...:  44% 112/255 [04:41<07:22,  3.09s/it][A[A

Evaluating ...:  44% 113/255 [04:44<07:12,  3.04s/it][A[A

Evaluating ...:  45% 114/255 [04:47<07:00,  2.98s/it][A[A

Evaluating ...:  45% 115/255 [04:50<06:51,  2.94s/it][A[A

Evaluating ...:  45% 116/255 [04:52<06:41,  2.89s/it][A[A

Evaluating ...:  46% 117/255 [04:55<06:33,  2.85s/it][A[A

Evaluating ...:  46% 118/255 [04:58<06:23,  2.80s/it][A[A

Evaluating ...:  47% 119/255 [05:01<06:16,  2.77s/it][A[A

Evaluating ...:  47% 120/255 [05:03<06:07,  2.72s/it][A[A

Evaluating ...:  47% 121/255 [05:06<06:01,  2.70s/it][A[A

Evaluating ...:  48% 122/255 [05:08<05:52,  2.65s/it][A[A

Evaluating ...:  48% 123/255 [05:11<05:45,  2.62s/it][A[A

Evaluating ...:  49% 124/255 [05:13<05:37,  2.57s/it][A[A

Evaluating ...:  49% 125/255 [05:16<05:31,  2.55s/it][A[A

Evaluating ...:  49% 126/255 [05:18<05:22,  2.50s/it][A[A

Evaluating ...:  50% 127/255 [05:21<05:16,  2.48s/it][A[A

Evaluating ...:  50% 128/255 [05:23<05:08,  2.43s/it][A[A

Evaluating ...:  51% 129/255 [05:25<05:02,  2.40s/it][A[A

Evaluating ...:  51% 130/255 [05:28<04:54,  2.36s/it][A[A

Evaluating ...:  51% 131/255 [05:30<04:53,  2.37s/it][A[A

Evaluating ...:  52% 132/255 [05:32<04:44,  2.31s/it][A[A

Evaluating ...:  52% 133/255 [05:34<04:37,  2.27s/it][A[A

Evaluating ...:  53% 134/255 [05:36<04:28,  2.22s/it][A[A

Evaluating ...:  53% 135/255 [05:39<04:22,  2.19s/it][A[A

Evaluating ...:  53% 136/255 [05:41<04:15,  2.15s/it][A[A

Evaluating ...:  54% 137/255 [05:43<04:11,  2.13s/it][A[A

Evaluating ...:  54% 138/255 [05:45<04:03,  2.08s/it][A[A

Evaluating ...:  55% 139/255 [05:47<03:57,  2.05s/it][A[A

Evaluating ...:  55% 140/255 [05:49<03:50,  2.01s/it][A[A

Evaluating ...:  55% 141/255 [05:50<03:45,  1.97s/it][A[A

Evaluating ...:  56% 142/255 [05:52<03:37,  1.92s/it][A[A

Evaluating ...:  56% 143/255 [05:54<03:30,  1.88s/it][A[A

Evaluating ...:  56% 144/255 [05:56<03:23,  1.83s/it][A[A

Evaluating ...:  57% 145/255 [05:57<03:19,  1.81s/it][A[A

Evaluating ...:  57% 146/255 [05:59<03:11,  1.75s/it][A[A

Evaluating ...:  58% 147/255 [06:01<03:02,  1.69s/it][A[A

Evaluating ...:  58% 148/255 [06:02<02:52,  1.61s/it][A[A

Evaluating ...:  58% 149/255 [06:03<02:41,  1.52s/it][A[A

Evaluating ...:  59% 150/255 [06:04<02:26,  1.39s/it][A[A

Evaluating ...:  59% 151/255 [06:09<03:49,  2.20s/it][A[A

Evaluating ...:  60% 152/255 [06:13<04:40,  2.73s/it][A[A

Evaluating ...:  60% 153/255 [06:16<05:08,  3.03s/it][A[A

Evaluating ...:  60% 154/255 [06:20<05:25,  3.22s/it][A[A

Evaluating ...:  61% 155/255 [06:23<05:31,  3.32s/it][A[A

Evaluating ...:  61% 156/255 [06:27<05:30,  3.34s/it][A[A

Evaluating ...:  62% 157/255 [06:30<05:26,  3.33s/it][A[A

Evaluating ...:  62% 158/255 [06:33<05:18,  3.29s/it][A[A

Evaluating ...:  62% 159/255 [06:37<05:12,  3.26s/it][A[A

Evaluating ...:  63% 160/255 [06:40<05:04,  3.20s/it][A[A

Evaluating ...:  63% 161/255 [06:43<04:56,  3.16s/it][A[A

Evaluating ...:  64% 162/255 [06:46<04:48,  3.10s/it][A[A

Evaluating ...:  64% 163/255 [06:49<04:41,  3.06s/it][A[A

Evaluating ...:  64% 164/255 [06:52<04:34,  3.02s/it][A[A

Evaluating ...:  65% 165/255 [06:54<04:28,  2.99s/it][A[A

Evaluating ...:  65% 166/255 [06:57<04:20,  2.92s/it][A[A

Evaluating ...:  65% 167/255 [07:00<04:14,  2.89s/it][A[A

Evaluating ...:  66% 168/255 [07:03<04:05,  2.83s/it][A[A

Evaluating ...:  66% 169/255 [07:05<04:00,  2.80s/it][A[A

Evaluating ...:  67% 170/255 [07:08<03:53,  2.75s/it][A[A

Evaluating ...:  67% 171/255 [07:11<03:48,  2.72s/it][A[A

Evaluating ...:  67% 172/255 [07:13<03:42,  2.68s/it][A[A

Evaluating ...:  68% 173/255 [07:16<03:37,  2.65s/it][A[A

Evaluating ...:  68% 174/255 [07:18<03:31,  2.61s/it][A[A

Evaluating ...:  69% 175/255 [07:21<03:27,  2.59s/it][A[A

Evaluating ...:  69% 176/255 [07:23<03:21,  2.55s/it][A[A

Evaluating ...:  69% 177/255 [07:26<03:17,  2.54s/it][A[A

Evaluating ...:  70% 178/255 [07:28<03:12,  2.49s/it][A[A

Evaluating ...:  70% 179/255 [07:31<03:07,  2.47s/it][A[A

Evaluating ...:  71% 180/255 [07:33<03:01,  2.42s/it][A[A

Evaluating ...:  71% 181/255 [07:35<02:57,  2.40s/it][A[A

Evaluating ...:  71% 182/255 [07:38<02:51,  2.35s/it][A[A

Evaluating ...:  72% 183/255 [07:40<02:46,  2.32s/it][A[A

Evaluating ...:  72% 184/255 [07:42<02:42,  2.28s/it][A[A

Evaluating ...:  73% 185/255 [07:44<02:37,  2.25s/it][A[A

Evaluating ...:  73% 186/255 [07:46<02:32,  2.20s/it][A[A

Evaluating ...:  73% 187/255 [07:48<02:27,  2.18s/it][A[A

Evaluating ...:  74% 188/255 [07:50<02:22,  2.13s/it][A[A

Evaluating ...:  74% 189/255 [07:53<02:19,  2.12s/it][A[A

Evaluating ...:  75% 190/255 [07:55<02:16,  2.10s/it][A[A

Evaluating ...:  75% 191/255 [07:57<02:11,  2.06s/it][A[A

Evaluating ...:  75% 192/255 [07:58<02:06,  2.01s/it][A[A

Evaluating ...:  76% 193/255 [08:00<02:01,  1.96s/it][A[A

Evaluating ...:  76% 194/255 [08:02<01:55,  1.90s/it][A[A

Evaluating ...:  76% 195/255 [08:04<01:51,  1.86s/it][A[A

Evaluating ...:  77% 196/255 [08:05<01:45,  1.79s/it][A[A

Evaluating ...:  77% 197/255 [08:07<01:41,  1.75s/it][A[A

Evaluating ...:  78% 198/255 [08:09<01:34,  1.66s/it][A[A

Evaluating ...:  78% 199/255 [08:10<01:28,  1.58s/it][A[A

Evaluating ...:  78% 200/255 [08:11<01:19,  1.45s/it][A[A

Evaluating ...:  79% 201/255 [08:16<02:07,  2.35s/it][A[A

Evaluating ...:  79% 202/255 [08:19<02:27,  2.78s/it][A[A

Evaluating ...:  80% 203/255 [08:23<02:37,  3.02s/it][A[A

Evaluating ...:  80% 204/255 [08:26<02:39,  3.13s/it][A[A

Evaluating ...:  80% 205/255 [08:30<02:39,  3.19s/it][A[A

Evaluating ...:  81% 206/255 [08:33<02:35,  3.18s/it][A[A

Evaluating ...:  81% 207/255 [08:36<02:31,  3.15s/it][A[A

Evaluating ...:  82% 208/255 [08:39<02:25,  3.10s/it][A[A

Evaluating ...:  82% 209/255 [08:42<02:20,  3.07s/it][A[A

Evaluating ...:  82% 210/255 [08:45<02:15,  3.01s/it][A[A

Evaluating ...:  83% 211/255 [08:48<02:11,  2.98s/it][A[A

Evaluating ...:  83% 212/255 [08:50<02:05,  2.91s/it][A[A

Evaluating ...:  84% 213/255 [08:53<02:00,  2.88s/it][A[A

Evaluating ...:  84% 214/255 [08:56<01:55,  2.81s/it][A[A

Evaluating ...:  84% 215/255 [08:59<01:51,  2.78s/it][A[A

Evaluating ...:  85% 216/255 [09:01<01:45,  2.71s/it][A[A

Evaluating ...:  85% 217/255 [09:04<01:41,  2.67s/it][A[A

Evaluating ...:  85% 218/255 [09:06<01:36,  2.62s/it][A[A

Evaluating ...:  86% 219/255 [09:09<01:33,  2.60s/it][A[A

Evaluating ...:  86% 220/255 [09:11<01:29,  2.54s/it][A[A

Evaluating ...:  87% 221/255 [09:14<01:25,  2.52s/it][A[A

Evaluating ...:  87% 222/255 [09:16<01:21,  2.47s/it][A[A

Evaluating ...:  87% 223/255 [09:18<01:17,  2.42s/it][A[A

Evaluating ...:  88% 224/255 [09:20<01:13,  2.36s/it][A[A

Evaluating ...:  88% 225/255 [09:23<01:09,  2.33s/it][A[A

Evaluating ...:  89% 226/255 [09:25<01:06,  2.28s/it][A[A

Evaluating ...:  89% 227/255 [09:27<01:03,  2.26s/it][A[A

Evaluating ...:  89% 228/255 [09:29<00:59,  2.20s/it][A[A

Evaluating ...:  90% 229/255 [09:31<00:55,  2.15s/it][A[A

Evaluating ...:  90% 230/255 [09:33<00:52,  2.10s/it][A[A

Evaluating ...:  91% 231/255 [09:35<00:49,  2.06s/it][A[A

Evaluating ...:  91% 232/255 [09:37<00:46,  2.01s/it][A[A

Evaluating ...:  91% 233/255 [09:39<00:43,  1.98s/it][A[A

Evaluating ...:  92% 234/255 [09:41<00:40,  1.93s/it][A[A

Evaluating ...:  92% 235/255 [09:43<00:38,  1.90s/it][A[A

Evaluating ...:  93% 236/255 [09:44<00:35,  1.86s/it][A[A

Evaluating ...:  93% 237/255 [09:46<00:32,  1.83s/it][A[A

Evaluating ...:  93% 238/255 [09:48<00:30,  1.78s/it][A[A

Evaluating ...:  94% 239/255 [09:49<00:28,  1.75s/it][A[A

Evaluating ...:  94% 240/255 [09:51<00:25,  1.70s/it][A[A

Evaluating ...:  95% 241/255 [09:53<00:23,  1.66s/it][A[A

Evaluating ...:  95% 242/255 [09:54<00:20,  1.61s/it][A[A

Evaluating ...:  95% 243/255 [09:56<00:18,  1.56s/it][A[A

Evaluating ...:  96% 244/255 [09:57<00:16,  1.51s/it][A[A

Evaluating ...:  96% 245/255 [09:58<00:14,  1.46s/it][A[A

Evaluating ...:  96% 246/255 [10:00<00:12,  1.40s/it][A[A

Evaluating ...:  97% 247/255 [10:01<00:10,  1.36s/it][A[A

Evaluating ...:  97% 248/255 [10:02<00:09,  1.29s/it][A[A

Evaluating ...:  98% 249/255 [10:03<00:07,  1.23s/it][A[A

Evaluating ...:  98% 250/255 [10:04<00:05,  1.13s/it][A[A

Evaluating ...:  98% 251/255 [10:08<00:07,  1.93s/it][A[A

Evaluating ...:  99% 252/255 [10:10<00:06,  2.09s/it][A[A

Evaluating ...:  99% 253/255 [10:12<00:04,  2.07s/it][A[A

Evaluating ...: 100% 254/255 [10:14<00:01,  1.93s/it][A[A

Evaluating ...: 100% 255/255 [10:15<00:00,  1.74s/it][A[AEvaluating ...: 100% 255/255 [10:15<00:00,  2.41s/it]
/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/tree_util.py:188: FutureWarning: jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() instead as a drop-in replacement.
  warnings.warn('jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() '
                                                                                                                            
                                                         [AEpoch... (1/4 | Eval Loss: 0.45369377732276917 | Eval wer: 0.3846371099339743 |):  25% 1/4 [12:37:38<26:06:17, 31325.86s/it]
Training...:  44% 6092/13907 [3:55:27<3:42:27,  1.71s/it][AConfiguration saved in /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/flax-wav2vec2-ctc-cv9-baseline/config.json
tcmalloc: large alloc 1612521472 bytes == 0x25e278000 @  0x7f6b45402680 0x7f6b45422bdd 0x7f69ddd191ff 0x7f69ddd2842c 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd23164 0x7f69ddd2391e 0x503fb6 0x56b1da 0x56939a 0x5f6a13 0x56c28c 0x56939a 0x5f6a13 0x56c28c 0x5f6836 0x56b0ae 0x56939a 0x50aaa0 0x56c28c 0x56939a 0x5f6a13 0x56b0ae 0x56939a 0x5f6a13
Model weights saved in /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/flax-wav2vec2-ctc-cv9-baseline/flax_model.msgpack
tokenizer config file saved in ./flax-wav2vec2-ctc-cv9-baseline/tokenizer_config.json
Special tokens file saved in ./flax-wav2vec2-ctc-cv9-baseline/special_tokens_map.json

Training...:  44% 6093/13907 [3:56:18<445:47:42, 205.38s/it][A
Training...:  44% 6094/13907 [3:56:20<313:14:05, 144.33s/it][A
Training...:  44% 6095/13907 [3:56:21<220:17:22, 101.52s/it][A
Training...:  44% 6096/13907 [3:56:23<155:09:29, 71.51s/it] [A
Training...:  44% 6097/13907 [3:56:24<109:31:36, 50.49s/it][A
Training...:  44% 6098/13907 [3:56:26<77:42:27, 35.82s/it] [A
Training...:  44% 6099/13907 [3:56:27<55:12:13, 25.45s/it][A
Training...:  44% 6100/13907 [3:56:28<39:19:31, 18.13s/it][A
Training...:  44% 6101/13907 [3:56:32<30:05:02, 13.87s/it][A
Training...:  44% 6102/13907 [3:56:36<23:24:19, 10.80s/it][A
Training...:  44% 6103/13907 [3:56:39<18:36:18,  8.58s/it][A
Training...:  44% 6104/13907 [3:56:42<15:08:51,  6.99s/it][A
Training...:  44% 6105/13907 [3:56:45<12:42:31,  5.86s/it][A
Training...:  44% 6106/13907 [3:56:49<10:57:23,  5.06s/it][A
Training...:  44% 6107/13907 [3:56:52<9:37:39,  4.44s/it] [A
Training...:  44% 6108/13907 [3:56:55<8:38:36,  3.99s/it][A
Training...:  44% 6109/13907 [3:56:57<7:56:43,  3.67s/it][A
Training...:  44% 6110/13907 [3:57:00<7:24:19,  3.42s/it][A
Training...:  44% 6111/13907 [3:57:03<7:00:04,  3.23s/it][A
Training...:  44% 6112/13907 [3:57:06<6:40:40,  3.08s/it][A
Training...:  44% 6113/13907 [3:57:09<6:24:29,  2.96s/it][A
Training...:  44% 6114/13907 [3:57:11<6:11:37,  2.86s/it][A
Training...:  44% 6115/13907 [3:57:14<6:02:21,  2.79s/it][A
Training...:  44% 6116/13907 [3:57:16<5:54:18,  2.73s/it][A
Training...:  44% 6117/13907 [3:57:19<5:47:54,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:39:33<26:06:17, 31325.86s/it]
Training...:  44% 6117/13907 [3:57:22<5:47:54,  2.68s/it][A
Training...:  44% 6118/13907 [3:57:22<5:57:24,  2.75s/it][A
Training...:  44% 6119/13907 [3:57:25<5:53:16,  2.72s/it][A
Training...:  44% 6120/13907 [3:57:27<5:44:58,  2.66s/it][A
Training...:  44% 6121/13907 [3:57:29<5:34:30,  2.58s/it][A
Training...:  44% 6122/13907 [3:57:32<5:21:40,  2.48s/it][A
Training...:  44% 6123/13907 [3:57:34<5:11:49,  2.40s/it][A
Training...:  44% 6124/13907 [3:57:36<5:04:08,  2.34s/it][A
Training...:  44% 6125/13907 [3:57:38<4:58:10,  2.30s/it][A
Training...:  44% 6126/13907 [3:57:40<4:52:45,  2.26s/it][A
Training...:  44% 6127/13907 [3:57:43<4:47:34,  2.22s/it][A
Training...:  44% 6128/13907 [3:57:45<4:42:36,  2.18s/it][A
Training...:  44% 6129/13907 [3:57:47<4:38:46,  2.15s/it][A
Training...:  44% 6130/13907 [3:57:49<4:34:37,  2.12s/it][A
Training...:  44% 6131/13907 [3:57:51<4:30:55,  2.09s/it][A
Training...:  44% 6132/13907 [3:57:53<4:27:04,  2.06s/it][A
Training...:  44% 6133/13907 [3:57:55<4:23:21,  2.03s/it][A
Training...:  44% 6134/13907 [3:57:57<4:19:44,  2.00s/it][A
Training...:  44% 6135/13907 [3:57:59<4:15:56,  1.98s/it][A
Training...:  44% 6136/13907 [3:58:00<4:10:50,  1.94s/it][A
Training...:  44% 6137/13907 [3:58:02<4:07:44,  1.91s/it][A
Training...:  44% 6138/13907 [3:58:04<4:02:29,  1.87s/it][A
Training...:  44% 6139/13907 [3:58:06<3:57:31,  1.83s/it][A
Training...:  44% 6140/13907 [3:58:08<3:53:17,  1.80s/it][A
Training...:  44% 6141/13907 [3:58:09<3:48:43,  1.77s/it][A
Training...:  44% 6142/13907 [3:58:11<3:44:50,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:40:24<26:06:17, 31325.86s/it]
Training...:  44% 6142/13907 [3:58:13<3:44:50,  1.74s/it][A
Training...:  44% 6143/13907 [3:58:13<3:51:55,  1.79s/it][A
Training...:  44% 6144/13907 [3:58:14<3:46:06,  1.75s/it][A
Training...:  44% 6145/13907 [3:58:16<3:38:25,  1.69s/it][A
Training...:  44% 6146/13907 [3:58:18<3:30:02,  1.62s/it][A
Training...:  44% 6147/13907 [3:58:19<3:21:41,  1.56s/it][A
Training...:  44% 6148/13907 [3:58:20<3:13:00,  1.49s/it][A
Training...:  44% 6149/13907 [3:58:22<3:03:26,  1.42s/it][A
Training...:  44% 6150/13907 [3:58:23<2:50:29,  1.32s/it][A
Training...:  44% 6151/13907 [3:58:26<4:23:47,  2.04s/it][A
Training...:  44% 6152/13907 [3:58:30<5:20:33,  2.48s/it][A
Training...:  44% 6153/13907 [3:58:33<5:50:34,  2.71s/it][A
Training...:  44% 6154/13907 [3:58:36<6:05:26,  2.83s/it][A
Training...:  44% 6155/13907 [3:58:39<6:11:52,  2.88s/it][A
Training...:  44% 6156/13907 [3:58:42<6:14:21,  2.90s/it][A
Training...:  44% 6157/13907 [3:58:45<6:12:29,  2.88s/it][A
Training...:  44% 6158/13907 [3:58:48<6:08:50,  2.86s/it][A
Training...:  44% 6159/13907 [3:58:50<6:04:17,  2.82s/it][A
Training...:  44% 6160/13907 [3:58:53<5:58:10,  2.77s/it][A
Training...:  44% 6161/13907 [3:58:56<5:54:27,  2.75s/it][A
Training...:  44% 6162/13907 [3:58:59<5:51:50,  2.73s/it][A
Training...:  44% 6163/13907 [3:59:01<5:47:55,  2.70s/it][A
Training...:  44% 6164/13907 [3:59:04<5:41:53,  2.65s/it][A
Training...:  44% 6165/13907 [3:59:06<5:35:46,  2.60s/it][A
Training...:  44% 6166/13907 [3:59:09<5:29:03,  2.55s/it][A
Training...:  44% 6167/13907 [3:59:11<5:23:38,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:41:25<26:06:17, 31325.86s/it]
Training...:  44% 6167/13907 [3:59:14<5:23:38,  2.51s/it][A
Training...:  44% 6168/13907 [3:59:14<5:34:57,  2.60s/it][A
Training...:  44% 6169/13907 [3:59:16<5:29:03,  2.55s/it][A
Training...:  44% 6170/13907 [3:59:19<5:19:54,  2.48s/it][A
Training...:  44% 6171/13907 [3:59:21<5:14:06,  2.44s/it][A
Training...:  44% 6172/13907 [3:59:23<5:07:15,  2.38s/it][A
Training...:  44% 6173/13907 [3:59:25<5:01:27,  2.34s/it][A
Training...:  44% 6174/13907 [3:59:28<4:56:24,  2.30s/it][A
Training...:  44% 6175/13907 [3:59:30<4:50:53,  2.26s/it][A
Training...:  44% 6176/13907 [3:59:32<4:45:42,  2.22s/it][A
Training...:  44% 6177/13907 [3:59:34<4:41:14,  2.18s/it][A
Training...:  44% 6178/13907 [3:59:36<4:37:13,  2.15s/it][A
Training...:  44% 6179/13907 [3:59:38<4:33:10,  2.12s/it][A
Training...:  44% 6180/13907 [3:59:40<4:30:10,  2.10s/it][A
Training...:  44% 6181/13907 [3:59:42<4:26:55,  2.07s/it][A
Training...:  44% 6182/13907 [3:59:44<4:24:11,  2.05s/it][A
Training...:  44% 6183/13907 [3:59:46<4:20:25,  2.02s/it][A
Training...:  44% 6184/13907 [3:59:48<4:15:37,  1.99s/it][A
Training...:  44% 6185/13907 [3:59:50<4:12:06,  1.96s/it][A
Training...:  44% 6186/13907 [3:59:52<4:07:23,  1.92s/it][A
Training...:  44% 6187/13907 [3:59:54<4:03:06,  1.89s/it][A
Training...:  44% 6188/13907 [3:59:55<3:58:49,  1.86s/it][A
Training...:  45% 6189/13907 [3:59:57<3:55:17,  1.83s/it][A
Training...:  45% 6190/13907 [3:59:59<3:51:22,  1.80s/it][A
Training...:  45% 6191/13907 [4:00:01<3:49:54,  1.79s/it][A
Training...:  45% 6192/13907 [4:00:02<3:44:30,  1.75s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:42:15<26:06:17, 31325.86s/it]
Training...:  45% 6192/13907 [4:00:04<3:44:30,  1.75s/it][A
Training...:  45% 6193/13907 [4:00:04<3:50:34,  1.79s/it][A
Training...:  45% 6194/13907 [4:00:06<3:44:18,  1.74s/it][A
Training...:  45% 6195/13907 [4:00:07<3:35:38,  1.68s/it][A
Training...:  45% 6196/13907 [4:00:09<3:26:41,  1.61s/it][A
Training...:  45% 6197/13907 [4:00:10<3:18:06,  1.54s/it][A
Training...:  45% 6198/13907 [4:00:12<3:10:18,  1.48s/it][A
Training...:  45% 6199/13907 [4:00:13<3:00:58,  1.41s/it][A
Training...:  45% 6200/13907 [4:00:14<2:47:49,  1.31s/it][A
Training...:  45% 6201/13907 [4:00:18<4:21:07,  2.03s/it][A
Training...:  45% 6202/13907 [4:00:21<5:15:27,  2.46s/it][A
Training...:  45% 6203/13907 [4:00:24<5:43:59,  2.68s/it][A
Training...:  45% 6204/13907 [4:00:27<6:00:14,  2.81s/it][A
Training...:  45% 6205/13907 [4:00:30<6:09:07,  2.88s/it][A
Training...:  45% 6206/13907 [4:00:33<6:10:38,  2.89s/it][A
Training...:  45% 6207/13907 [4:00:36<6:10:27,  2.89s/it][A
Training...:  45% 6208/13907 [4:00:39<6:08:07,  2.87s/it][A
Training...:  45% 6209/13907 [4:00:42<6:04:13,  2.84s/it][A
Training...:  45% 6210/13907 [4:00:44<5:59:58,  2.81s/it][A
Training...:  45% 6211/13907 [4:00:47<5:55:29,  2.77s/it][A
Training...:  45% 6212/13907 [4:00:50<5:51:08,  2.74s/it][A
Training...:  45% 6213/13907 [4:00:52<5:45:47,  2.70s/it][A
Training...:  45% 6214/13907 [4:00:55<5:40:11,  2.65s/it][A
Training...:  45% 6215/13907 [4:00:57<5:35:27,  2.62s/it][A
Training...:  45% 6216/13907 [4:01:00<5:29:01,  2.57s/it][A
Training...:  45% 6217/13907 [4:01:02<5:23:21,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:43:16<26:06:17, 31325.86s/it]
Training...:  45% 6217/13907 [4:01:05<5:23:21,  2.52s/it][A
Training...:  45% 6218/13907 [4:01:05<5:32:46,  2.60s/it][A
Training...:  45% 6219/13907 [4:01:08<5:26:13,  2.55s/it][A
Training...:  45% 6220/13907 [4:01:10<5:18:27,  2.49s/it][A
Training...:  45% 6221/13907 [4:01:12<5:11:02,  2.43s/it][A
Training...:  45% 6222/13907 [4:01:14<5:04:26,  2.38s/it][A
Training...:  45% 6223/13907 [4:01:17<4:58:44,  2.33s/it][A
Training...:  45% 6224/13907 [4:01:19<4:52:47,  2.29s/it][A
Training...:  45% 6225/13907 [4:01:21<4:48:02,  2.25s/it][A
Training...:  45% 6226/13907 [4:01:23<4:43:43,  2.22s/it][A
Training...:  45% 6227/13907 [4:01:25<4:39:15,  2.18s/it][A
Training...:  45% 6228/13907 [4:01:27<4:35:45,  2.15s/it][A
Training...:  45% 6229/13907 [4:01:29<4:31:28,  2.12s/it][A
Training...:  45% 6230/13907 [4:01:31<4:27:40,  2.09s/it][A
Training...:  45% 6231/13907 [4:01:33<4:23:44,  2.06s/it][A
Training...:  45% 6232/13907 [4:01:35<4:20:36,  2.04s/it][A
Training...:  45% 6233/13907 [4:01:37<4:16:38,  2.01s/it][A
Training...:  45% 6234/13907 [4:01:39<4:12:29,  1.97s/it][A
Training...:  45% 6235/13907 [4:01:41<4:09:45,  1.95s/it][A
Training...:  45% 6236/13907 [4:01:43<4:05:29,  1.92s/it][A
Training...:  45% 6237/13907 [4:01:45<4:01:08,  1.89s/it][A
Training...:  45% 6238/13907 [4:01:47<3:56:17,  1.85s/it][A
Training...:  45% 6239/13907 [4:01:48<3:52:06,  1.82s/it][A
Training...:  45% 6240/13907 [4:01:50<3:47:20,  1.78s/it][A
Training...:  45% 6241/13907 [4:01:52<3:42:46,  1.74s/it][A
Training...:  45% 6242/13907 [4:01:53<3:37:29,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:44:06<26:06:17, 31325.86s/it]
Training...:  45% 6242/13907 [4:01:55<3:37:29,  1.70s/it][A
Training...:  45% 6243/13907 [4:01:55<3:44:41,  1.76s/it][A
Training...:  45% 6244/13907 [4:01:57<3:38:48,  1.71s/it][A
Training...:  45% 6245/13907 [4:01:58<3:30:52,  1.65s/it][A
Training...:  45% 6246/13907 [4:02:00<3:23:49,  1.60s/it][A
Training...:  45% 6247/13907 [4:02:01<3:15:50,  1.53s/it][A
Training...:  45% 6248/13907 [4:02:02<3:08:15,  1.47s/it][A
Training...:  45% 6249/13907 [4:02:04<2:58:57,  1.40s/it][A
Training...:  45% 6250/13907 [4:02:05<2:45:39,  1.30s/it][A
Training...:  45% 6251/13907 [4:02:08<4:16:00,  2.01s/it][A
Training...:  45% 6252/13907 [4:02:12<5:11:47,  2.44s/it][A
Training...:  45% 6253/13907 [4:02:15<5:45:43,  2.71s/it][A
Training...:  45% 6254/13907 [4:02:18<6:02:13,  2.84s/it][A
Training...:  45% 6255/13907 [4:02:21<6:10:17,  2.90s/it][A
Training...:  45% 6256/13907 [4:02:24<6:10:19,  2.90s/it][A
Training...:  45% 6257/13907 [4:02:27<6:08:30,  2.89s/it][A
Training...:  45% 6258/13907 [4:02:30<6:04:58,  2.86s/it][A
Training...:  45% 6259/13907 [4:02:33<6:01:34,  2.84s/it][A
Training...:  45% 6260/13907 [4:02:35<5:55:32,  2.79s/it][A
Training...:  45% 6261/13907 [4:02:38<5:51:10,  2.76s/it][A
Training...:  45% 6262/13907 [4:02:41<5:45:27,  2.71s/it][A
Training...:  45% 6263/13907 [4:02:43<5:40:00,  2.67s/it][A
Training...:  45% 6264/13907 [4:02:46<5:35:37,  2.63s/it][A
Training...:  45% 6265/13907 [4:02:48<5:30:32,  2.60s/it][A
Training...:  45% 6266/13907 [4:02:51<5:25:47,  2.56s/it][A
Training...:  45% 6267/13907 [4:02:53<5:20:44,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:45:07<26:06:17, 31325.86s/it]
Training...:  45% 6267/13907 [4:02:56<5:20:44,  2.52s/it][A
Training...:  45% 6268/13907 [4:02:56<5:31:37,  2.60s/it][A
Training...:  45% 6269/13907 [4:02:58<5:25:58,  2.56s/it][A
Training...:  45% 6270/13907 [4:03:01<5:18:15,  2.50s/it][A
Training...:  45% 6271/13907 [4:03:03<5:11:48,  2.45s/it][A
Training...:  45% 6272/13907 [4:03:05<5:04:27,  2.39s/it][A
Training...:  45% 6273/13907 [4:03:08<4:58:53,  2.35s/it][A
Training...:  45% 6274/13907 [4:03:10<4:53:48,  2.31s/it][A
Training...:  45% 6275/13907 [4:03:12<4:48:39,  2.27s/it][A
Training...:  45% 6276/13907 [4:03:14<4:43:26,  2.23s/it][A
Training...:  45% 6277/13907 [4:03:16<4:39:55,  2.20s/it][A
Training...:  45% 6278/13907 [4:03:18<4:35:41,  2.17s/it][A
Training...:  45% 6279/13907 [4:03:21<4:32:34,  2.14s/it][A
Training...:  45% 6280/13907 [4:03:23<4:28:56,  2.12s/it][A
Training...:  45% 6281/13907 [4:03:25<4:25:50,  2.09s/it][A
Training...:  45% 6282/13907 [4:03:27<4:22:31,  2.07s/it][A
Training...:  45% 6283/13907 [4:03:29<4:18:16,  2.03s/it][A
Training...:  45% 6284/13907 [4:03:30<4:13:23,  1.99s/it][A
Training...:  45% 6285/13907 [4:03:32<4:10:09,  1.97s/it][A
Training...:  45% 6286/13907 [4:03:34<4:05:42,  1.93s/it][A
Training...:  45% 6287/13907 [4:03:36<4:01:13,  1.90s/it][A
Training...:  45% 6288/13907 [4:03:38<3:56:23,  1.86s/it][A
Training...:  45% 6289/13907 [4:03:40<3:52:03,  1.83s/it][A
Training...:  45% 6290/13907 [4:03:41<3:47:39,  1.79s/it][A
Training...:  45% 6291/13907 [4:03:43<3:43:21,  1.76s/it][A
Training...:  45% 6292/13907 [4:03:45<3:38:26,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:45:58<26:06:17, 31325.86s/it]
Training...:  45% 6292/13907 [4:03:47<3:38:26,  1.72s/it][A
Training...:  45% 6293/13907 [4:03:47<3:46:46,  1.79s/it][A
Training...:  45% 6294/13907 [4:03:48<3:41:45,  1.75s/it][A
Training...:  45% 6295/13907 [4:03:50<3:33:04,  1.68s/it][A
Training...:  45% 6296/13907 [4:03:51<3:23:59,  1.61s/it][A
Training...:  45% 6297/13907 [4:03:53<3:15:45,  1.54s/it][A
Training...:  45% 6298/13907 [4:03:54<3:06:55,  1.47s/it][A
Training...:  45% 6299/13907 [4:03:55<2:56:55,  1.40s/it][A
Training...:  45% 6300/13907 [4:03:56<2:43:43,  1.29s/it][A
Training...:  45% 6301/13907 [4:04:00<4:22:02,  2.07s/it][A
Training...:  45% 6302/13907 [4:04:03<5:15:44,  2.49s/it][A
Training...:  45% 6303/13907 [4:04:07<5:45:09,  2.72s/it][A
Training...:  45% 6304/13907 [4:04:10<5:59:52,  2.84s/it][A
Training...:  45% 6305/13907 [4:04:13<6:07:17,  2.90s/it][A
Training...:  45% 6306/13907 [4:04:16<6:08:33,  2.91s/it][A
Training...:  45% 6307/13907 [4:04:19<6:07:30,  2.90s/it][A
Training...:  45% 6308/13907 [4:04:21<6:03:10,  2.87s/it][A
Training...:  45% 6309/13907 [4:04:24<5:58:50,  2.83s/it][A
Training...:  45% 6310/13907 [4:04:27<5:53:09,  2.79s/it][A
Training...:  45% 6311/13907 [4:04:30<5:48:40,  2.75s/it][A
Training...:  45% 6312/13907 [4:04:32<5:43:41,  2.72s/it][A
Training...:  45% 6313/13907 [4:04:35<5:40:32,  2.69s/it][A
Training...:  45% 6314/13907 [4:04:37<5:34:52,  2.65s/it][A
Training...:  45% 6315/13907 [4:04:40<5:29:54,  2.61s/it][A
Training...:  45% 6316/13907 [4:04:42<5:24:33,  2.57s/it][A
Training...:  45% 6317/13907 [4:04:45<5:20:08,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:46:59<26:06:17, 31325.86s/it]
Training...:  45% 6317/13907 [4:04:48<5:20:08,  2.53s/it][A
Training...:  45% 6318/13907 [4:04:48<5:31:28,  2.62s/it][A
Training...:  45% 6319/13907 [4:04:50<5:25:22,  2.57s/it][A
Training...:  45% 6320/13907 [4:04:52<5:16:43,  2.50s/it][A
Training...:  45% 6321/13907 [4:04:55<5:09:45,  2.45s/it][A
Training...:  45% 6322/13907 [4:04:57<5:03:42,  2.40s/it][A
Training...:  45% 6323/13907 [4:04:59<4:59:29,  2.37s/it][A
Training...:  45% 6324/13907 [4:05:02<4:53:26,  2.32s/it][A
Training...:  45% 6325/13907 [4:05:04<4:48:45,  2.29s/it][A
Training...:  45% 6326/13907 [4:05:06<4:43:59,  2.25s/it][A
Training...:  45% 6327/13907 [4:05:08<4:39:31,  2.21s/it][A
Training...:  46% 6328/13907 [4:05:10<4:34:44,  2.17s/it][A
Training...:  46% 6329/13907 [4:05:12<4:30:42,  2.14s/it][A
Training...:  46% 6330/13907 [4:05:14<4:27:01,  2.11s/it][A
Training...:  46% 6331/13907 [4:05:16<4:23:22,  2.09s/it][A
Training...:  46% 6332/13907 [4:05:18<4:20:12,  2.06s/it][A
Training...:  46% 6333/13907 [4:05:20<4:16:00,  2.03s/it][A
Training...:  46% 6334/13907 [4:05:22<4:13:55,  2.01s/it][A
Training...:  46% 6335/13907 [4:05:24<4:09:56,  1.98s/it][A
Training...:  46% 6336/13907 [4:05:26<4:06:02,  1.95s/it][A
Training...:  46% 6337/13907 [4:05:28<4:01:41,  1.92s/it][A
Training...:  46% 6338/13907 [4:05:30<3:56:07,  1.87s/it][A
Training...:  46% 6339/13907 [4:05:31<3:51:32,  1.84s/it][A
Training...:  46% 6340/13907 [4:05:33<3:46:38,  1.80s/it][A
Training...:  46% 6341/13907 [4:05:35<3:43:24,  1.77s/it][A
Training...:  46% 6342/13907 [4:05:36<3:38:33,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:47:50<26:06:17, 31325.86s/it]
Training...:  46% 6342/13907 [4:05:38<3:38:33,  1.73s/it][A
Training...:  46% 6343/13907 [4:05:38<3:46:01,  1.79s/it][A
Training...:  46% 6344/13907 [4:05:40<3:39:35,  1.74s/it][A
Training...:  46% 6345/13907 [4:05:42<3:31:42,  1.68s/it][A
Training...:  46% 6346/13907 [4:05:43<3:23:34,  1.62s/it][A
Training...:  46% 6347/13907 [4:05:44<3:15:26,  1.55s/it][A
Training...:  46% 6348/13907 [4:05:46<3:07:21,  1.49s/it][A
Training...:  46% 6349/13907 [4:05:47<2:58:21,  1.42s/it][A
Training...:  46% 6350/13907 [4:05:48<2:45:02,  1.31s/it][A
Training...:  46% 6351/13907 [4:05:52<4:13:38,  2.01s/it][A
Training...:  46% 6352/13907 [4:05:55<5:06:53,  2.44s/it][A
Training...:  46% 6353/13907 [4:05:58<5:36:46,  2.67s/it][A
Training...:  46% 6354/13907 [4:06:01<5:52:25,  2.80s/it][A
Training...:  46% 6355/13907 [4:06:04<6:01:40,  2.87s/it][A
Training...:  46% 6356/13907 [4:06:07<6:04:49,  2.90s/it][A
Training...:  46% 6357/13907 [4:06:10<6:05:10,  2.90s/it][A
Training...:  46% 6358/13907 [4:06:13<6:02:15,  2.88s/it][A
Training...:  46% 6359/13907 [4:06:16<6:00:15,  2.86s/it][A
Training...:  46% 6360/13907 [4:06:19<5:55:15,  2.82s/it][A
Training...:  46% 6361/13907 [4:06:21<5:50:45,  2.79s/it][A
Training...:  46% 6362/13907 [4:06:24<5:44:28,  2.74s/it][A
Training...:  46% 6363/13907 [4:06:27<5:38:50,  2.69s/it][A
Training...:  46% 6364/13907 [4:06:29<5:33:21,  2.65s/it][A
Training...:  46% 6365/13907 [4:06:32<5:27:13,  2.60s/it][A
Training...:  46% 6366/13907 [4:06:34<5:23:13,  2.57s/it][A
Training...:  46% 6367/13907 [4:06:37<5:19:43,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:48:51<26:06:17, 31325.86s/it]
Training...:  46% 6367/13907 [4:06:40<5:19:43,  2.54s/it][A
Training...:  46% 6368/13907 [4:06:40<5:30:07,  2.63s/it][A
Training...:  46% 6369/13907 [4:06:42<5:23:50,  2.58s/it][A
Training...:  46% 6370/13907 [4:06:44<5:14:40,  2.51s/it][A
Training...:  46% 6371/13907 [4:06:47<5:08:05,  2.45s/it][A
Training...:  46% 6372/13907 [4:06:49<5:07:50,  2.45s/it][A
Training...:  46% 6373/13907 [4:06:51<5:00:43,  2.39s/it][A
Training...:  46% 6374/13907 [4:06:54<4:53:53,  2.34s/it][A
Training...:  46% 6375/13907 [4:06:56<4:48:07,  2.30s/it][A
Training...:  46% 6376/13907 [4:06:58<4:41:48,  2.25s/it][A
Training...:  46% 6377/13907 [4:07:00<4:37:44,  2.21s/it][A
Training...:  46% 6378/13907 [4:07:02<4:33:13,  2.18s/it][A
Training...:  46% 6379/13907 [4:07:04<4:29:43,  2.15s/it][A
Training...:  46% 6380/13907 [4:07:06<4:25:27,  2.12s/it][A
Training...:  46% 6381/13907 [4:07:08<4:21:27,  2.08s/it][A
Training...:  46% 6382/13907 [4:07:10<4:17:51,  2.06s/it][A
Training...:  46% 6383/13907 [4:07:12<4:14:27,  2.03s/it][A
Training...:  46% 6384/13907 [4:07:14<4:10:57,  2.00s/it][A
Training...:  46% 6385/13907 [4:07:16<4:07:03,  1.97s/it][A
Training...:  46% 6386/13907 [4:07:18<4:03:04,  1.94s/it][A
Training...:  46% 6387/13907 [4:07:20<3:59:23,  1.91s/it][A
Training...:  46% 6388/13907 [4:07:22<3:56:08,  1.88s/it][A
Training...:  46% 6389/13907 [4:07:23<3:53:11,  1.86s/it][A
Training...:  46% 6390/13907 [4:07:25<3:49:19,  1.83s/it][A
Training...:  46% 6391/13907 [4:07:27<3:44:44,  1.79s/it][A
Training...:  46% 6392/13907 [4:07:29<3:40:37,  1.76s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:49:42<26:06:17, 31325.86s/it]
Training...:  46% 6392/13907 [4:07:30<3:40:37,  1.76s/it][A
Training...:  46% 6393/13907 [4:07:30<3:47:37,  1.82s/it][A
Training...:  46% 6394/13907 [4:07:32<3:41:00,  1.76s/it][A
Training...:  46% 6395/13907 [4:07:34<3:31:03,  1.69s/it][A
Training...:  46% 6396/13907 [4:07:35<3:22:16,  1.62s/it][A
Training...:  46% 6397/13907 [4:07:36<3:14:36,  1.55s/it][A
Training...:  46% 6398/13907 [4:07:38<3:05:09,  1.48s/it][A
Training...:  46% 6399/13907 [4:07:39<2:55:28,  1.40s/it][A
Training...:  46% 6400/13907 [4:07:40<2:42:05,  1.30s/it][A
Training...:  46% 6401/13907 [4:07:44<4:11:37,  2.01s/it][A
Training...:  46% 6402/13907 [4:07:47<5:06:37,  2.45s/it][A
Training...:  46% 6403/13907 [4:07:51<5:39:21,  2.71s/it][A
Training...:  46% 6404/13907 [4:07:54<5:55:52,  2.85s/it][A
Training...:  46% 6405/13907 [4:07:57<6:04:41,  2.92s/it][A
Training...:  46% 6406/13907 [4:08:00<6:07:44,  2.94s/it][A
Training...:  46% 6407/13907 [4:08:03<6:05:37,  2.92s/it][A
Training...:  46% 6408/13907 [4:08:06<6:02:35,  2.90s/it][A
Training...:  46% 6409/13907 [4:08:08<5:58:53,  2.87s/it][A
Training...:  46% 6410/13907 [4:08:11<5:52:32,  2.82s/it][A
Training...:  46% 6411/13907 [4:08:14<5:46:14,  2.77s/it][A
Training...:  46% 6412/13907 [4:08:16<5:40:41,  2.73s/it][A
Training...:  46% 6413/13907 [4:08:19<5:36:25,  2.69s/it][A
Training...:  46% 6414/13907 [4:08:22<5:33:07,  2.67s/it][A
Training...:  46% 6415/13907 [4:08:24<5:26:44,  2.62s/it][A
Training...:  46% 6416/13907 [4:08:26<5:21:18,  2.57s/it][A
Training...:  46% 6417/13907 [4:08:29<5:15:19,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:50:43<26:06:17, 31325.86s/it]
Training...:  46% 6417/13907 [4:08:32<5:15:19,  2.53s/it][A
Training...:  46% 6418/13907 [4:08:32<5:25:46,  2.61s/it][A
Training...:  46% 6419/13907 [4:08:34<5:18:46,  2.55s/it][A
Training...:  46% 6420/13907 [4:08:36<5:10:18,  2.49s/it][A
Training...:  46% 6421/13907 [4:08:39<5:05:14,  2.45s/it][A
Training...:  46% 6422/13907 [4:08:41<4:57:40,  2.39s/it][A
Training...:  46% 6423/13907 [4:08:43<4:51:42,  2.34s/it][A
Training...:  46% 6424/13907 [4:08:45<4:46:03,  2.29s/it][A
Training...:  46% 6425/13907 [4:08:48<4:41:33,  2.26s/it][A
Training...:  46% 6426/13907 [4:08:50<4:37:54,  2.23s/it][A
Training...:  46% 6427/13907 [4:08:52<4:33:46,  2.20s/it][A
Training...:  46% 6428/13907 [4:08:54<4:29:24,  2.16s/it][A
Training...:  46% 6429/13907 [4:08:56<4:26:50,  2.14s/it][A
Training...:  46% 6430/13907 [4:08:58<4:22:31,  2.11s/it][A
Training...:  46% 6431/13907 [4:09:00<4:19:32,  2.08s/it][A
Training...:  46% 6432/13907 [4:09:02<4:16:00,  2.05s/it][A
Training...:  46% 6433/13907 [4:09:04<4:12:32,  2.03s/it][A
Training...:  46% 6434/13907 [4:09:06<4:08:31,  2.00s/it][A
Training...:  46% 6435/13907 [4:09:08<4:05:32,  1.97s/it][A
Training...:  46% 6436/13907 [4:09:10<4:01:24,  1.94s/it][A
Training...:  46% 6437/13907 [4:09:12<3:58:14,  1.91s/it][A
Training...:  46% 6438/13907 [4:09:13<3:54:35,  1.88s/it][A
Training...:  46% 6439/13907 [4:09:15<3:51:14,  1.86s/it][A
Training...:  46% 6440/13907 [4:09:17<3:47:00,  1.82s/it][A
Training...:  46% 6441/13907 [4:09:19<3:42:30,  1.79s/it][A
Training...:  46% 6442/13907 [4:09:20<3:36:59,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:51:34<26:06:17, 31325.86s/it]
Training...:  46% 6442/13907 [4:09:22<3:36:59,  1.74s/it][A
Training...:  46% 6443/13907 [4:09:22<3:44:36,  1.81s/it][A
Training...:  46% 6444/13907 [4:09:24<3:37:43,  1.75s/it][A
Training...:  46% 6445/13907 [4:09:26<3:30:50,  1.70s/it][A
Training...:  46% 6446/13907 [4:09:27<3:22:02,  1.62s/it][A
Training...:  46% 6447/13907 [4:09:28<3:13:30,  1.56s/it][A
Training...:  46% 6448/13907 [4:09:30<3:04:30,  1.48s/it][A
Training...:  46% 6449/13907 [4:09:31<2:55:26,  1.41s/it][A
Training...:  46% 6450/13907 [4:09:32<2:43:47,  1.32s/it][A
Training...:  46% 6451/13907 [4:09:36<4:16:58,  2.07s/it][A
Training...:  46% 6452/13907 [4:09:39<5:10:12,  2.50s/it][A
Training...:  46% 6453/13907 [4:09:43<5:39:10,  2.73s/it][A
Training...:  46% 6454/13907 [4:09:46<5:53:34,  2.85s/it][A
Training...:  46% 6455/13907 [4:09:49<6:02:26,  2.92s/it][A
Training...:  46% 6456/13907 [4:09:52<6:04:13,  2.93s/it][A
Training...:  46% 6457/13907 [4:09:55<6:03:51,  2.93s/it][A
Training...:  46% 6458/13907 [4:09:58<6:00:44,  2.91s/it][A
Training...:  46% 6459/13907 [4:10:00<5:58:39,  2.89s/it][A
Training...:  46% 6460/13907 [4:10:03<5:53:16,  2.85s/it][A
Training...:  46% 6461/13907 [4:10:06<5:49:18,  2.81s/it][A
Training...:  46% 6462/13907 [4:10:09<5:43:02,  2.76s/it][A
Training...:  46% 6463/13907 [4:10:11<5:38:12,  2.73s/it][A
Training...:  46% 6464/13907 [4:10:14<5:32:02,  2.68s/it][A
Training...:  46% 6465/13907 [4:10:16<5:25:22,  2.62s/it][A
Training...:  46% 6466/13907 [4:10:19<5:20:20,  2.58s/it][A
Training...:  47% 6467/13907 [4:10:21<5:16:11,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:52:35<26:06:17, 31325.86s/it]
Training...:  47% 6467/13907 [4:10:24<5:16:11,  2.55s/it][A
Training...:  47% 6468/13907 [4:10:24<5:26:22,  2.63s/it][A
Training...:  47% 6469/13907 [4:10:26<5:19:11,  2.57s/it][A
Training...:  47% 6470/13907 [4:10:29<5:11:21,  2.51s/it][A
Training...:  47% 6471/13907 [4:10:31<5:03:07,  2.45s/it][A
Training...:  47% 6472/13907 [4:10:33<4:56:51,  2.40s/it][A
Training...:  47% 6473/13907 [4:10:36<4:51:52,  2.36s/it][A
Training...:  47% 6474/13907 [4:10:38<4:46:17,  2.31s/it][A
Training...:  47% 6475/13907 [4:10:40<4:41:34,  2.27s/it][A
Training...:  47% 6476/13907 [4:10:42<4:38:49,  2.25s/it][A
Training...:  47% 6477/13907 [4:10:44<4:33:47,  2.21s/it][A
Training...:  47% 6478/13907 [4:10:46<4:29:24,  2.18s/it][A
Training...:  47% 6479/13907 [4:10:49<4:24:46,  2.14s/it][A
Training...:  47% 6480/13907 [4:10:51<4:20:33,  2.10s/it][A
Training...:  47% 6481/13907 [4:10:53<4:16:32,  2.07s/it][A
Training...:  47% 6482/13907 [4:10:55<4:12:50,  2.04s/it][A
Training...:  47% 6483/13907 [4:10:56<4:08:40,  2.01s/it][A
Training...:  47% 6484/13907 [4:10:58<4:04:22,  1.98s/it][A
Training...:  47% 6485/13907 [4:11:00<4:02:04,  1.96s/it][A
Training...:  47% 6486/13907 [4:11:02<3:59:51,  1.94s/it][A
Training...:  47% 6487/13907 [4:11:04<3:55:43,  1.91s/it][A
Training...:  47% 6488/13907 [4:11:06<3:52:32,  1.88s/it][A
Training...:  47% 6489/13907 [4:11:08<3:48:22,  1.85s/it][A
Training...:  47% 6490/13907 [4:11:09<3:43:03,  1.80s/it][A
Training...:  47% 6491/13907 [4:11:11<3:38:27,  1.77s/it][A
Training...:  47% 6492/13907 [4:11:13<3:33:46,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:53:26<26:06:17, 31325.86s/it]
Training...:  47% 6492/13907 [4:11:15<3:33:46,  1.73s/it][A
Training...:  47% 6493/13907 [4:11:15<3:40:51,  1.79s/it][A
Training...:  47% 6494/13907 [4:11:16<3:35:08,  1.74s/it][A
Training...:  47% 6495/13907 [4:11:18<3:28:22,  1.69s/it][A
Training...:  47% 6496/13907 [4:11:19<3:19:46,  1.62s/it][A
Training...:  47% 6497/13907 [4:11:21<3:11:07,  1.55s/it][A
Training...:  47% 6498/13907 [4:11:22<3:02:15,  1.48s/it][A
Training...:  47% 6499/13907 [4:11:23<2:52:58,  1.40s/it][A
Training...:  47% 6500/13907 [4:11:24<2:39:49,  1.29s/it][A
Training...:  47% 6501/13907 [4:11:28<4:07:37,  2.01s/it][A
Training...:  47% 6502/13907 [4:11:31<4:59:52,  2.43s/it][A
Training...:  47% 6503/13907 [4:11:34<5:28:17,  2.66s/it][A
Training...:  47% 6504/13907 [4:11:38<5:44:06,  2.79s/it][A
Training...:  47% 6505/13907 [4:11:41<5:51:54,  2.85s/it][A
Training...:  47% 6506/13907 [4:11:43<5:55:04,  2.88s/it][A
Training...:  47% 6507/13907 [4:11:46<5:54:40,  2.88s/it][A
Training...:  47% 6508/13907 [4:11:49<5:52:22,  2.86s/it][A
Training...:  47% 6509/13907 [4:11:52<5:49:51,  2.84s/it][A
Training...:  47% 6510/13907 [4:11:55<5:46:22,  2.81s/it][A
Training...:  47% 6511/13907 [4:11:57<5:42:15,  2.78s/it][A
Training...:  47% 6512/13907 [4:12:00<5:36:15,  2.73s/it][A
Training...:  47% 6513/13907 [4:12:03<5:31:58,  2.69s/it][A
Training...:  47% 6514/13907 [4:12:05<5:25:15,  2.64s/it][A
Training...:  47% 6515/13907 [4:12:08<5:20:01,  2.60s/it][A
Training...:  47% 6516/13907 [4:12:10<5:14:33,  2.55s/it][A
Training...:  47% 6517/13907 [4:12:13<5:10:18,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:54:26<26:06:17, 31325.86s/it]
Training...:  47% 6517/13907 [4:12:15<5:10:18,  2.52s/it][A
Training...:  47% 6518/13907 [4:12:15<5:20:10,  2.60s/it][A
Training...:  47% 6519/13907 [4:12:18<5:13:39,  2.55s/it][A
Training...:  47% 6520/13907 [4:12:20<5:05:50,  2.48s/it][A
Training...:  47% 6521/13907 [4:12:22<5:00:23,  2.44s/it][A
Training...:  47% 6522/13907 [4:12:25<4:55:14,  2.40s/it][A
Training...:  47% 6523/13907 [4:12:27<4:48:49,  2.35s/it][A
Training...:  47% 6524/13907 [4:12:29<4:43:19,  2.30s/it][A
Training...:  47% 6525/13907 [4:12:31<4:38:57,  2.27s/it][A
Training...:  47% 6526/13907 [4:12:33<4:33:49,  2.23s/it][A
Training...:  47% 6527/13907 [4:12:36<4:29:35,  2.19s/it][A
Training...:  47% 6528/13907 [4:12:38<4:25:16,  2.16s/it][A
Training...:  47% 6529/13907 [4:12:40<4:22:04,  2.13s/it][A
Training...:  47% 6530/13907 [4:12:42<4:18:10,  2.10s/it][A
Training...:  47% 6531/13907 [4:12:44<4:14:28,  2.07s/it][A
Training...:  47% 6532/13907 [4:12:46<4:10:27,  2.04s/it][A
Training...:  47% 6533/13907 [4:12:48<4:07:12,  2.01s/it][A
Training...:  47% 6534/13907 [4:12:50<4:03:42,  1.98s/it][A
Training...:  47% 6535/13907 [4:12:51<4:00:00,  1.95s/it][A
Training...:  47% 6536/13907 [4:12:53<3:56:08,  1.92s/it][A
Training...:  47% 6537/13907 [4:12:55<3:51:45,  1.89s/it][A
Training...:  47% 6538/13907 [4:12:57<3:48:29,  1.86s/it][A
Training...:  47% 6539/13907 [4:12:59<3:44:38,  1.83s/it][A
Training...:  47% 6540/13907 [4:13:00<3:40:23,  1.79s/it][A
Training...:  47% 6541/13907 [4:13:02<3:36:49,  1.77s/it][A
Training...:  47% 6542/13907 [4:13:04<3:31:33,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:55:17<26:06:17, 31325.86s/it]
Training...:  47% 6542/13907 [4:13:06<3:31:33,  1.72s/it][A
Training...:  47% 6543/13907 [4:13:06<3:38:10,  1.78s/it][A
Training...:  47% 6544/13907 [4:13:07<3:31:41,  1.73s/it][A
Training...:  47% 6545/13907 [4:13:09<3:23:43,  1.66s/it][A
Training...:  47% 6546/13907 [4:13:10<3:15:34,  1.59s/it][A
Training...:  47% 6547/13907 [4:13:12<3:07:51,  1.53s/it][A
Training...:  47% 6548/13907 [4:13:13<3:00:03,  1.47s/it][A
Training...:  47% 6549/13907 [4:13:14<2:51:06,  1.40s/it][A
Training...:  47% 6550/13907 [4:13:15<2:38:39,  1.29s/it][A
Training...:  47% 6551/13907 [4:13:19<4:10:07,  2.04s/it][A
Training...:  47% 6552/13907 [4:13:22<5:00:10,  2.45s/it][A
Training...:  47% 6553/13907 [4:13:26<5:28:50,  2.68s/it][A
Training...:  47% 6554/13907 [4:13:29<5:43:26,  2.80s/it][A
Training...:  47% 6555/13907 [4:13:32<5:51:24,  2.87s/it][A
Training...:  47% 6556/13907 [4:13:35<5:52:04,  2.87s/it][A
Training...:  47% 6557/13907 [4:13:37<5:55:11,  2.90s/it][A
Training...:  47% 6558/13907 [4:13:40<5:52:35,  2.88s/it][A
Training...:  47% 6559/13907 [4:13:43<5:46:29,  2.83s/it][A
Training...:  47% 6560/13907 [4:13:46<5:40:02,  2.78s/it][A
Training...:  47% 6561/13907 [4:13:48<5:34:20,  2.73s/it][A
Training...:  47% 6562/13907 [4:13:51<5:28:51,  2.69s/it][A
Training...:  47% 6563/13907 [4:13:53<5:23:08,  2.64s/it][A
Training...:  47% 6564/13907 [4:13:56<5:18:13,  2.60s/it][A
Training...:  47% 6565/13907 [4:13:58<5:13:50,  2.56s/it][A
Training...:  47% 6566/13907 [4:14:01<5:08:56,  2.53s/it][A
Training...:  47% 6567/13907 [4:14:03<5:03:46,  2.48s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:56:17<26:06:17, 31325.86s/it]
Training...:  47% 6567/13907 [4:14:06<5:03:46,  2.48s/it][A
Training...:  47% 6568/13907 [4:14:06<5:14:40,  2.57s/it][A
Training...:  47% 6569/13907 [4:14:08<5:09:49,  2.53s/it][A
Training...:  47% 6570/13907 [4:14:11<5:02:12,  2.47s/it][A
Training...:  47% 6571/13907 [4:14:13<4:59:00,  2.45s/it][A
Training...:  47% 6572/13907 [4:14:15<4:52:16,  2.39s/it][A
Training...:  47% 6573/13907 [4:14:18<4:45:52,  2.34s/it][A
Training...:  47% 6574/13907 [4:14:20<4:41:04,  2.30s/it][A
Training...:  47% 6575/13907 [4:14:22<4:36:35,  2.26s/it][A
Training...:  47% 6576/13907 [4:14:24<4:32:19,  2.23s/it][A
Training...:  47% 6577/13907 [4:14:26<4:28:50,  2.20s/it][A
Training...:  47% 6578/13907 [4:14:28<4:25:04,  2.17s/it][A
Training...:  47% 6579/13907 [4:14:31<4:21:56,  2.14s/it][A
Training...:  47% 6580/13907 [4:14:33<4:17:18,  2.11s/it][A
Training...:  47% 6581/13907 [4:14:35<4:12:47,  2.07s/it][A
Training...:  47% 6582/13907 [4:14:36<4:09:29,  2.04s/it][A
Training...:  47% 6583/13907 [4:14:38<4:05:39,  2.01s/it][A
Training...:  47% 6584/13907 [4:14:40<4:01:59,  1.98s/it][A
Training...:  47% 6585/13907 [4:14:42<3:58:30,  1.95s/it][A
Training...:  47% 6586/13907 [4:14:44<3:56:40,  1.94s/it][A
Training...:  47% 6587/13907 [4:14:46<3:53:30,  1.91s/it][A
Training...:  47% 6588/13907 [4:14:48<3:49:16,  1.88s/it][A
Training...:  47% 6589/13907 [4:14:50<3:45:33,  1.85s/it][A
Training...:  47% 6590/13907 [4:14:51<3:40:57,  1.81s/it][A
Training...:  47% 6591/13907 [4:14:53<3:35:58,  1.77s/it][A
Training...:  47% 6592/13907 [4:14:55<3:31:42,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:57:08<26:06:17, 31325.86s/it]
Training...:  47% 6592/13907 [4:14:57<3:31:42,  1.74s/it][A
Training...:  47% 6593/13907 [4:14:57<3:38:48,  1.80s/it][A
Training...:  47% 6594/13907 [4:14:58<3:32:39,  1.74s/it][A
Training...:  47% 6595/13907 [4:15:00<3:26:41,  1.70s/it][A
Training...:  47% 6596/13907 [4:15:01<3:17:50,  1.62s/it][A
Training...:  47% 6597/13907 [4:15:03<3:09:25,  1.55s/it][A
Training...:  47% 6598/13907 [4:15:04<3:00:32,  1.48s/it][A
Training...:  47% 6599/13907 [4:15:05<2:51:25,  1.41s/it][A
Training...:  47% 6600/13907 [4:15:06<2:38:44,  1.30s/it][A
Training...:  47% 6601/13907 [4:15:10<4:09:56,  2.05s/it][A
Training...:  47% 6602/13907 [4:15:13<5:00:48,  2.47s/it][A
Training...:  47% 6603/13907 [4:15:17<5:28:42,  2.70s/it][A
Training...:  47% 6604/13907 [4:15:20<5:42:46,  2.82s/it][A
Training...:  47% 6605/13907 [4:15:23<5:50:18,  2.88s/it][A
Training...:  48% 6606/13907 [4:15:26<5:52:58,  2.90s/it][A
Training...:  48% 6607/13907 [4:15:29<5:53:02,  2.90s/it][A
Training...:  48% 6608/13907 [4:15:32<5:51:53,  2.89s/it][A
Training...:  48% 6609/13907 [4:15:34<5:48:26,  2.86s/it][A
Training...:  48% 6610/13907 [4:15:37<5:42:49,  2.82s/it][A
Training...:  48% 6611/13907 [4:15:40<5:37:34,  2.78s/it][A
Training...:  48% 6612/13907 [4:15:42<5:32:14,  2.73s/it][A
Training...:  48% 6613/13907 [4:15:45<5:26:36,  2.69s/it][A
Training...:  48% 6614/13907 [4:15:47<5:21:38,  2.65s/it][A
Training...:  48% 6615/13907 [4:15:50<5:16:28,  2.60s/it][A
Training...:  48% 6616/13907 [4:15:52<5:11:29,  2.56s/it][A
Training...:  48% 6617/13907 [4:15:55<5:10:20,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:58:09<26:06:17, 31325.86s/it]
Training...:  48% 6617/13907 [4:15:58<5:10:20,  2.55s/it][A
Training...:  48% 6618/13907 [4:15:58<5:22:40,  2.66s/it][A
Training...:  48% 6619/13907 [4:16:00<5:17:00,  2.61s/it][A
Training...:  48% 6620/13907 [4:16:03<5:08:17,  2.54s/it][A
Training...:  48% 6621/13907 [4:16:05<4:59:57,  2.47s/it][A
Training...:  48% 6622/13907 [4:16:07<4:54:19,  2.42s/it][A
Training...:  48% 6623/13907 [4:16:10<4:47:10,  2.37s/it][A
Training...:  48% 6624/13907 [4:16:12<4:40:37,  2.31s/it][A
Training...:  48% 6625/13907 [4:16:14<4:36:27,  2.28s/it][A
Training...:  48% 6626/13907 [4:16:16<4:32:43,  2.25s/it][A
Training...:  48% 6627/13907 [4:16:18<4:29:58,  2.23s/it][A
Training...:  48% 6628/13907 [4:16:21<4:27:24,  2.20s/it][A
Training...:  48% 6629/13907 [4:16:23<4:23:55,  2.18s/it][A
Training...:  48% 6630/13907 [4:16:25<4:20:32,  2.15s/it][A
Training...:  48% 6631/13907 [4:16:27<4:17:20,  2.12s/it][A
Training...:  48% 6632/13907 [4:16:29<4:13:35,  2.09s/it][A
Training...:  48% 6633/13907 [4:16:31<4:09:27,  2.06s/it][A
Training...:  48% 6634/13907 [4:16:33<4:05:47,  2.03s/it][A
Training...:  48% 6635/13907 [4:16:35<4:02:54,  2.00s/it][A
Training...:  48% 6636/13907 [4:16:37<3:58:46,  1.97s/it][A
Training...:  48% 6637/13907 [4:16:38<3:55:44,  1.95s/it][A
Training...:  48% 6638/13907 [4:16:40<3:52:05,  1.92s/it][A
Training...:  48% 6639/13907 [4:16:42<3:47:38,  1.88s/it][A
Training...:  48% 6640/13907 [4:16:44<3:44:23,  1.85s/it][A
Training...:  48% 6641/13907 [4:16:46<3:40:04,  1.82s/it][A
Training...:  48% 6642/13907 [4:16:47<3:35:27,  1.78s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [12:59:01<26:06:17, 31325.86s/it]
Training...:  48% 6642/13907 [4:16:49<3:35:27,  1.78s/it][A
Training...:  48% 6643/13907 [4:16:49<3:43:00,  1.84s/it][A
Training...:  48% 6644/13907 [4:16:51<3:35:13,  1.78s/it][A
Training...:  48% 6645/13907 [4:16:52<3:27:40,  1.72s/it][A
Training...:  48% 6646/13907 [4:16:54<3:18:43,  1.64s/it][A
Training...:  48% 6647/13907 [4:16:55<3:10:39,  1.58s/it][A
Training...:  48% 6648/13907 [4:16:57<3:01:54,  1.50s/it][A
Training...:  48% 6649/13907 [4:16:58<2:52:30,  1.43s/it][A
Training...:  48% 6650/13907 [4:16:59<2:39:37,  1.32s/it][A
Training...:  48% 6651/13907 [4:17:03<4:05:16,  2.03s/it][A
Training...:  48% 6652/13907 [4:17:06<4:57:24,  2.46s/it][A
Training...:  48% 6653/13907 [4:17:09<5:24:36,  2.68s/it][A
Training...:  48% 6654/13907 [4:17:12<5:39:23,  2.81s/it][A
Training...:  48% 6655/13907 [4:17:16<5:47:16,  2.87s/it][A
Training...:  48% 6656/13907 [4:17:19<5:52:04,  2.91s/it][A
Training...:  48% 6657/13907 [4:17:22<5:55:47,  2.94s/it][A
Training...:  48% 6658/13907 [4:17:24<5:51:43,  2.91s/it][A
Training...:  48% 6659/13907 [4:17:27<5:46:00,  2.86s/it][A
Training...:  48% 6660/13907 [4:17:30<5:40:45,  2.82s/it][A
Training...:  48% 6661/13907 [4:17:33<5:35:15,  2.78s/it][A
Training...:  48% 6662/13907 [4:17:35<5:29:41,  2.73s/it][A
Training...:  48% 6663/13907 [4:17:38<5:25:12,  2.69s/it][A
Training...:  48% 6664/13907 [4:17:40<5:19:49,  2.65s/it][A
Training...:  48% 6665/13907 [4:17:43<5:14:24,  2.60s/it][A
Training...:  48% 6666/13907 [4:17:45<5:08:28,  2.56s/it][A
Training...:  48% 6667/13907 [4:17:48<5:03:11,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:00:02<26:06:17, 31325.86s/it]
Training...:  48% 6667/13907 [4:17:50<5:03:11,  2.51s/it][A
Training...:  48% 6668/13907 [4:17:50<5:13:54,  2.60s/it][A
Training...:  48% 6669/13907 [4:17:53<5:08:09,  2.55s/it][A
Training...:  48% 6670/13907 [4:17:55<5:00:47,  2.49s/it][A
Training...:  48% 6671/13907 [4:17:58<4:55:13,  2.45s/it][A
Training...:  48% 6672/13907 [4:18:00<4:51:40,  2.42s/it][A
Training...:  48% 6673/13907 [4:18:02<4:47:35,  2.39s/it][A
Training...:  48% 6674/13907 [4:18:04<4:41:16,  2.33s/it][A
Training...:  48% 6675/13907 [4:18:07<4:37:00,  2.30s/it][A
Training...:  48% 6676/13907 [4:18:09<4:34:12,  2.28s/it][A
Training...:  48% 6677/13907 [4:18:11<4:29:22,  2.24s/it][A
Training...:  48% 6678/13907 [4:18:13<4:24:46,  2.20s/it][A
Training...:  48% 6679/13907 [4:18:15<4:20:59,  2.17s/it][A
Training...:  48% 6680/13907 [4:18:17<4:16:19,  2.13s/it][A
Training...:  48% 6681/13907 [4:18:19<4:13:45,  2.11s/it][A
Training...:  48% 6682/13907 [4:18:21<4:08:38,  2.06s/it][A
Training...:  48% 6683/13907 [4:18:23<4:04:27,  2.03s/it][A
Training...:  48% 6684/13907 [4:18:25<4:00:06,  1.99s/it][A
Training...:  48% 6685/13907 [4:18:27<3:56:54,  1.97s/it][A
Training...:  48% 6686/13907 [4:18:29<3:53:18,  1.94s/it][A
Training...:  48% 6687/13907 [4:18:31<3:49:25,  1.91s/it][A
Training...:  48% 6688/13907 [4:18:33<3:44:54,  1.87s/it][A
Training...:  48% 6689/13907 [4:18:34<3:40:08,  1.83s/it][A
Training...:  48% 6690/13907 [4:18:36<3:35:51,  1.79s/it][A
Training...:  48% 6691/13907 [4:18:38<3:31:23,  1.76s/it][A
Training...:  48% 6692/13907 [4:18:39<3:26:54,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:00:52<26:06:17, 31325.86s/it]
Training...:  48% 6692/13907 [4:18:41<3:26:54,  1.72s/it][A
Training...:  48% 6693/13907 [4:18:41<3:34:38,  1.79s/it][A
Training...:  48% 6694/13907 [4:18:43<3:29:52,  1.75s/it][A
Training...:  48% 6695/13907 [4:18:44<3:21:50,  1.68s/it][A
Training...:  48% 6696/13907 [4:18:46<3:13:34,  1.61s/it][A
Training...:  48% 6697/13907 [4:18:47<3:05:49,  1.55s/it][A
Training...:  48% 6698/13907 [4:18:49<2:56:52,  1.47s/it][A
Training...:  48% 6699/13907 [4:18:50<2:47:42,  1.40s/it][A
Training...:  48% 6700/13907 [4:18:51<2:35:10,  1.29s/it][A
Training...:  48% 6701/13907 [4:18:55<4:03:27,  2.03s/it][A
Training...:  48% 6702/13907 [4:18:58<4:55:45,  2.46s/it][A
Training...:  48% 6703/13907 [4:19:01<5:24:29,  2.70s/it][A
Training...:  48% 6704/13907 [4:19:04<5:39:22,  2.83s/it][A
Training...:  48% 6705/13907 [4:19:07<5:46:57,  2.89s/it][A
Training...:  48% 6706/13907 [4:19:10<5:48:04,  2.90s/it][A
Training...:  48% 6707/13907 [4:19:13<5:47:59,  2.90s/it][A
Training...:  48% 6708/13907 [4:19:16<5:45:07,  2.88s/it][A
Training...:  48% 6709/13907 [4:19:19<5:41:43,  2.85s/it][A
Training...:  48% 6710/13907 [4:19:22<5:37:17,  2.81s/it][A
Training...:  48% 6711/13907 [4:19:24<5:33:01,  2.78s/it][A
Training...:  48% 6712/13907 [4:19:27<5:28:07,  2.74s/it][A
Training...:  48% 6713/13907 [4:19:30<5:23:59,  2.70s/it][A
Training...:  48% 6714/13907 [4:19:32<5:19:07,  2.66s/it][A
Training...:  48% 6715/13907 [4:19:35<5:15:00,  2.63s/it][A
Training...:  48% 6716/13907 [4:19:37<5:09:53,  2.59s/it][A
Training...:  48% 6717/13907 [4:19:40<5:06:02,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:01:54<26:06:17, 31325.86s/it]
Training...:  48% 6717/13907 [4:19:43<5:06:02,  2.55s/it][A
Training...:  48% 6718/13907 [4:19:43<5:16:16,  2.64s/it][A
Training...:  48% 6719/13907 [4:19:45<5:10:03,  2.59s/it][A
Training...:  48% 6720/13907 [4:19:47<5:02:46,  2.53s/it][A
Training...:  48% 6721/13907 [4:19:50<4:55:02,  2.46s/it][A
Training...:  48% 6722/13907 [4:19:52<4:48:41,  2.41s/it][A
Training...:  48% 6723/13907 [4:19:54<4:43:22,  2.37s/it][A
Training...:  48% 6724/13907 [4:19:56<4:38:22,  2.33s/it][A
Training...:  48% 6725/13907 [4:19:59<4:33:08,  2.28s/it][A
Training...:  48% 6726/13907 [4:20:01<4:30:09,  2.26s/it][A
Training...:  48% 6727/13907 [4:20:03<4:25:51,  2.22s/it][A
Training...:  48% 6728/13907 [4:20:05<4:21:27,  2.19s/it][A
Training...:  48% 6729/13907 [4:20:07<4:18:04,  2.16s/it][A
Training...:  48% 6730/13907 [4:20:09<4:13:13,  2.12s/it][A
Training...:  48% 6731/13907 [4:20:11<4:08:59,  2.08s/it][A
Training...:  48% 6732/13907 [4:20:13<4:06:14,  2.06s/it][A
Training...:  48% 6733/13907 [4:20:15<4:02:56,  2.03s/it][A
Training...:  48% 6734/13907 [4:20:17<3:59:04,  2.00s/it][A
Training...:  48% 6735/13907 [4:20:19<3:56:08,  1.98s/it][A
Training...:  48% 6736/13907 [4:20:21<3:52:25,  1.94s/it][A
Training...:  48% 6737/13907 [4:20:23<3:49:16,  1.92s/it][A
Training...:  48% 6738/13907 [4:20:25<3:45:28,  1.89s/it][A
Training...:  48% 6739/13907 [4:20:26<3:42:03,  1.86s/it][A
Training...:  48% 6740/13907 [4:20:28<3:38:55,  1.83s/it][A
Training...:  48% 6741/13907 [4:20:30<3:35:10,  1.80s/it][A
Training...:  48% 6742/13907 [4:20:32<3:30:22,  1.76s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:02:45<26:06:17, 31325.86s/it]
Training...:  48% 6742/13907 [4:20:33<3:30:22,  1.76s/it][A
Training...:  48% 6743/13907 [4:20:33<3:35:52,  1.81s/it][A
Training...:  48% 6744/13907 [4:20:35<3:29:28,  1.75s/it][A
Training...:  49% 6745/13907 [4:20:37<3:21:20,  1.69s/it][A
Training...:  49% 6746/13907 [4:20:38<3:13:47,  1.62s/it][A
Training...:  49% 6747/13907 [4:20:40<3:06:37,  1.56s/it][A
Training...:  49% 6748/13907 [4:20:41<2:58:05,  1.49s/it][A
Training...:  49% 6749/13907 [4:20:42<2:48:55,  1.42s/it][A
Training...:  49% 6750/13907 [4:20:43<2:34:48,  1.30s/it][A
Training...:  49% 6751/13907 [4:20:47<4:04:34,  2.05s/it][A
Training...:  49% 6752/13907 [4:20:50<4:55:24,  2.48s/it][A
Training...:  49% 6753/13907 [4:20:54<5:22:06,  2.70s/it][A
Training...:  49% 6754/13907 [4:20:57<5:36:42,  2.82s/it][A
Training...:  49% 6755/13907 [4:21:00<5:45:17,  2.90s/it][A
Training...:  49% 6756/13907 [4:21:03<5:45:51,  2.90s/it][A
Training...:  49% 6757/13907 [4:21:06<5:44:48,  2.89s/it][A
Training...:  49% 6758/13907 [4:21:08<5:40:45,  2.86s/it][A
Training...:  49% 6759/13907 [4:21:11<5:36:36,  2.83s/it][A
Training...:  49% 6760/13907 [4:21:14<5:31:33,  2.78s/it][A
Training...:  49% 6761/13907 [4:21:16<5:27:05,  2.75s/it][A
Training...:  49% 6762/13907 [4:21:19<5:22:33,  2.71s/it][A
Training...:  49% 6763/13907 [4:21:22<5:18:11,  2.67s/it][A
Training...:  49% 6764/13907 [4:21:24<5:14:58,  2.65s/it][A
Training...:  49% 6765/13907 [4:21:27<5:11:27,  2.62s/it][A
Training...:  49% 6766/13907 [4:21:29<5:06:25,  2.57s/it][A
Training...:  49% 6767/13907 [4:21:32<5:01:25,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:03:46<26:06:17, 31325.86s/it]
Training...:  49% 6767/13907 [4:21:34<5:01:25,  2.53s/it][A
Training...:  49% 6768/13907 [4:21:34<5:10:53,  2.61s/it][A
Training...:  49% 6769/13907 [4:21:37<5:04:24,  2.56s/it][A
Training...:  49% 6770/13907 [4:21:39<4:57:17,  2.50s/it][A
Training...:  49% 6771/13907 [4:21:42<4:49:58,  2.44s/it][A
Training...:  49% 6772/13907 [4:21:44<4:45:29,  2.40s/it][A
Training...:  49% 6773/13907 [4:21:46<4:39:44,  2.35s/it][A
Training...:  49% 6774/13907 [4:21:48<4:34:30,  2.31s/it][A
Training...:  49% 6775/13907 [4:21:51<4:30:18,  2.27s/it][A
Training...:  49% 6776/13907 [4:21:53<4:27:06,  2.25s/it][A
Training...:  49% 6777/13907 [4:21:55<4:23:51,  2.22s/it][A
Training...:  49% 6778/13907 [4:21:57<4:20:07,  2.19s/it][A
Training...:  49% 6779/13907 [4:21:59<4:15:39,  2.15s/it][A
Training...:  49% 6780/13907 [4:22:01<4:11:21,  2.12s/it][A
Training...:  49% 6781/13907 [4:22:03<4:07:33,  2.08s/it][A
Training...:  49% 6782/13907 [4:22:05<4:03:27,  2.05s/it][A
Training...:  49% 6783/13907 [4:22:07<3:59:09,  2.01s/it][A
Training...:  49% 6784/13907 [4:22:09<3:55:56,  1.99s/it][A
Training...:  49% 6785/13907 [4:22:11<3:51:53,  1.95s/it][A
Training...:  49% 6786/13907 [4:22:13<3:47:33,  1.92s/it][A
Training...:  49% 6787/13907 [4:22:14<3:44:31,  1.89s/it][A
Training...:  49% 6788/13907 [4:22:16<3:40:32,  1.86s/it][A
Training...:  49% 6789/13907 [4:22:18<3:35:56,  1.82s/it][A
Training...:  49% 6790/13907 [4:22:20<3:31:28,  1.78s/it][A
Training...:  49% 6791/13907 [4:22:21<3:26:50,  1.74s/it][A
Training...:  49% 6792/13907 [4:22:23<3:22:33,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:04:36<26:06:17, 31325.86s/it]
Training...:  49% 6792/13907 [4:22:25<3:22:33,  1.71s/it][A
Training...:  49% 6793/13907 [4:22:25<3:29:54,  1.77s/it][A
Training...:  49% 6794/13907 [4:22:26<3:24:26,  1.72s/it][A
Training...:  49% 6795/13907 [4:22:28<3:16:37,  1.66s/it][A
Training...:  49% 6796/13907 [4:22:29<3:08:50,  1.59s/it][A
Training...:  49% 6797/13907 [4:22:31<3:00:51,  1.53s/it][A
Training...:  49% 6798/13907 [4:22:32<2:52:37,  1.46s/it][A
Training...:  49% 6799/13907 [4:22:33<2:43:59,  1.38s/it][A
Training...:  49% 6800/13907 [4:22:34<2:32:24,  1.29s/it][A
Training...:  49% 6801/13907 [4:22:38<3:55:19,  1.99s/it][A
Training...:  49% 6802/13907 [4:22:41<4:46:40,  2.42s/it][A
Training...:  49% 6803/13907 [4:22:45<5:16:14,  2.67s/it][A
Training...:  49% 6804/13907 [4:22:48<5:33:42,  2.82s/it][A
Training...:  49% 6805/13907 [4:22:51<5:45:03,  2.92s/it][A
Training...:  49% 6806/13907 [4:22:54<5:45:16,  2.92s/it][A
Training...:  49% 6807/13907 [4:22:57<5:44:37,  2.91s/it][A
Training...:  49% 6808/13907 [4:23:00<5:41:14,  2.88s/it][A
Training...:  49% 6809/13907 [4:23:02<5:36:11,  2.84s/it][A
Training...:  49% 6810/13907 [4:23:05<5:31:16,  2.80s/it][A
Training...:  49% 6811/13907 [4:23:08<5:25:43,  2.75s/it][A
Training...:  49% 6812/13907 [4:23:10<5:20:30,  2.71s/it][A
Training...:  49% 6813/13907 [4:23:13<5:15:21,  2.67s/it][A
Training...:  49% 6814/13907 [4:23:15<5:10:23,  2.63s/it][A
Training...:  49% 6815/13907 [4:23:18<5:06:51,  2.60s/it][A
Training...:  49% 6816/13907 [4:23:21<5:05:37,  2.59s/it][A
Training...:  49% 6817/13907 [4:23:23<5:02:23,  2.56s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:05:37<26:06:17, 31325.86s/it]
Training...:  49% 6817/13907 [4:23:26<5:02:23,  2.56s/it][A
Training...:  49% 6818/13907 [4:23:26<5:10:45,  2.63s/it][A
Training...:  49% 6819/13907 [4:23:28<5:04:41,  2.58s/it][A
Training...:  49% 6820/13907 [4:23:31<4:56:30,  2.51s/it][A
Training...:  49% 6821/13907 [4:23:33<4:51:21,  2.47s/it][A
Training...:  49% 6822/13907 [4:23:35<4:44:46,  2.41s/it][A
Training...:  49% 6823/13907 [4:23:38<4:39:31,  2.37s/it][A
Training...:  49% 6824/13907 [4:23:40<4:33:39,  2.32s/it][A
Training...:  49% 6825/13907 [4:23:42<4:28:30,  2.27s/it][A
Training...:  49% 6826/13907 [4:23:44<4:23:16,  2.23s/it][A
Training...:  49% 6827/13907 [4:23:46<4:20:15,  2.21s/it][A
Training...:  49% 6828/13907 [4:23:48<4:16:08,  2.17s/it][A
Training...:  49% 6829/13907 [4:23:50<4:12:32,  2.14s/it][A
Training...:  49% 6830/13907 [4:23:52<4:08:31,  2.11s/it][A
Training...:  49% 6831/13907 [4:23:54<4:05:21,  2.08s/it][A
Training...:  49% 6832/13907 [4:23:56<4:01:13,  2.05s/it][A
Training...:  49% 6833/13907 [4:23:58<3:58:25,  2.02s/it][A
Training...:  49% 6834/13907 [4:24:00<3:55:28,  2.00s/it][A
Training...:  49% 6835/13907 [4:24:02<3:51:15,  1.96s/it][A
Training...:  49% 6836/13907 [4:24:04<3:47:38,  1.93s/it][A
Training...:  49% 6837/13907 [4:24:06<3:44:13,  1.90s/it][A
Training...:  49% 6838/13907 [4:24:08<3:40:10,  1.87s/it][A
Training...:  49% 6839/13907 [4:24:09<3:36:56,  1.84s/it][A
Training...:  49% 6840/13907 [4:24:11<3:32:58,  1.81s/it][A
Training...:  49% 6841/13907 [4:24:13<3:28:53,  1.77s/it][A
Training...:  49% 6842/13907 [4:24:14<3:24:32,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:06:28<26:06:17, 31325.86s/it]
Training...:  49% 6842/13907 [4:24:16<3:24:32,  1.74s/it][A
Training...:  49% 6843/13907 [4:24:16<3:31:40,  1.80s/it][A
Training...:  49% 6844/13907 [4:24:18<3:26:13,  1.75s/it][A
Training...:  49% 6845/13907 [4:24:20<3:17:37,  1.68s/it][A
Training...:  49% 6846/13907 [4:24:21<3:09:15,  1.61s/it][A
Training...:  49% 6847/13907 [4:24:22<3:01:23,  1.54s/it][A
Training...:  49% 6848/13907 [4:24:24<2:53:49,  1.48s/it][A
Training...:  49% 6849/13907 [4:24:25<2:45:33,  1.41s/it][A
Training...:  49% 6850/13907 [4:24:26<2:33:55,  1.31s/it][A
Training...:  49% 6851/13907 [4:24:30<3:58:44,  2.03s/it][A
Training...:  49% 6852/13907 [4:24:33<4:50:12,  2.47s/it][A
Training...:  49% 6853/13907 [4:24:37<5:18:54,  2.71s/it][A
Training...:  49% 6854/13907 [4:24:40<5:35:30,  2.85s/it][A
Training...:  49% 6855/13907 [4:24:43<5:45:13,  2.94s/it][A
Training...:  49% 6856/13907 [4:24:46<5:46:35,  2.95s/it][A
Training...:  49% 6857/13907 [4:24:49<5:44:33,  2.93s/it][A
Training...:  49% 6858/13907 [4:24:52<5:40:46,  2.90s/it][A
Training...:  49% 6859/13907 [4:24:54<5:36:13,  2.86s/it][A
Training...:  49% 6860/13907 [4:24:57<5:30:59,  2.82s/it][A
Training...:  49% 6861/13907 [4:25:00<5:25:24,  2.77s/it][A
Training...:  49% 6862/13907 [4:25:02<5:19:58,  2.73s/it][A
Training...:  49% 6863/13907 [4:25:05<5:14:02,  2.67s/it][A
Training...:  49% 6864/13907 [4:25:07<5:08:57,  2.63s/it][A
Training...:  49% 6865/13907 [4:25:10<5:04:01,  2.59s/it][A
Training...:  49% 6866/13907 [4:25:12<4:59:07,  2.55s/it][A
Training...:  49% 6867/13907 [4:25:15<4:54:07,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:07:29<26:06:17, 31325.86s/it]
Training...:  49% 6867/13907 [4:25:18<4:54:07,  2.51s/it][A
Training...:  49% 6868/13907 [4:25:18<5:04:57,  2.60s/it][A
Training...:  49% 6869/13907 [4:25:20<4:59:39,  2.55s/it][A
Training...:  49% 6870/13907 [4:25:22<4:54:24,  2.51s/it][A
Training...:  49% 6871/13907 [4:25:25<4:47:19,  2.45s/it][A
Training...:  49% 6872/13907 [4:25:27<4:41:14,  2.40s/it][A
Training...:  49% 6873/13907 [4:25:29<4:35:59,  2.35s/it][A
Training...:  49% 6874/13907 [4:25:31<4:30:50,  2.31s/it][A
Training...:  49% 6875/13907 [4:25:34<4:25:53,  2.27s/it][A
Training...:  49% 6876/13907 [4:25:36<4:22:00,  2.24s/it][A
Training...:  49% 6877/13907 [4:25:38<4:16:59,  2.19s/it][A
Training...:  49% 6878/13907 [4:25:40<4:12:07,  2.15s/it][A
Training...:  49% 6879/13907 [4:25:42<4:07:49,  2.12s/it][A
Training...:  49% 6880/13907 [4:25:44<4:04:48,  2.09s/it][A
Training...:  49% 6881/13907 [4:25:46<4:02:41,  2.07s/it][A
Training...:  49% 6882/13907 [4:25:48<4:00:31,  2.05s/it][A
Training...:  49% 6883/13907 [4:25:50<3:56:15,  2.02s/it][A
Training...:  50% 6884/13907 [4:25:52<3:51:37,  1.98s/it][A
Training...:  50% 6885/13907 [4:25:54<3:47:32,  1.94s/it][A
Training...:  50% 6886/13907 [4:25:56<3:43:29,  1.91s/it][A
Training...:  50% 6887/13907 [4:25:57<3:39:40,  1.88s/it][A
Training...:  50% 6888/13907 [4:25:59<3:36:08,  1.85s/it][A
Training...:  50% 6889/13907 [4:26:01<3:31:39,  1.81s/it][A
Training...:  50% 6890/13907 [4:26:03<3:27:07,  1.77s/it][A
Training...:  50% 6891/13907 [4:26:04<3:23:27,  1.74s/it][A
Training...:  50% 6892/13907 [4:26:06<3:19:17,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:08:19<26:06:17, 31325.86s/it]
Training...:  50% 6892/13907 [4:26:08<3:19:17,  1.70s/it][A
Training...:  50% 6893/13907 [4:26:08<3:26:26,  1.77s/it][A
Training...:  50% 6894/13907 [4:26:09<3:21:03,  1.72s/it][A
Training...:  50% 6895/13907 [4:26:11<3:15:27,  1.67s/it][A
Training...:  50% 6896/13907 [4:26:12<3:07:51,  1.61s/it][A
Training...:  50% 6897/13907 [4:26:14<3:00:00,  1.54s/it][A
Training...:  50% 6898/13907 [4:26:15<2:52:06,  1.47s/it][A
Training...:  50% 6899/13907 [4:26:16<2:43:44,  1.40s/it][A
Training...:  50% 6900/13907 [4:26:17<2:31:49,  1.30s/it][A
Training...:  50% 6901/13907 [4:26:21<3:57:01,  2.03s/it][A
Training...:  50% 6902/13907 [4:26:25<4:46:49,  2.46s/it][A
Training...:  50% 6903/13907 [4:26:28<5:13:15,  2.68s/it][A
Training...:  50% 6904/13907 [4:26:31<5:28:07,  2.81s/it][A
Training...:  50% 6905/13907 [4:26:34<5:36:00,  2.88s/it][A
Training...:  50% 6906/13907 [4:26:37<5:36:22,  2.88s/it][A
Training...:  50% 6907/13907 [4:26:40<5:33:40,  2.86s/it][A
Training...:  50% 6908/13907 [4:26:42<5:30:34,  2.83s/it][A
Training...:  50% 6909/13907 [4:26:45<5:27:09,  2.80s/it][A
Training...:  50% 6910/13907 [4:26:48<5:22:14,  2.76s/it][A
Training...:  50% 6911/13907 [4:26:50<5:18:11,  2.73s/it][A
Training...:  50% 6912/13907 [4:26:53<5:14:24,  2.70s/it][A
Training...:  50% 6913/13907 [4:26:56<5:10:53,  2.67s/it][A
Training...:  50% 6914/13907 [4:26:58<5:05:55,  2.62s/it][A
Training...:  50% 6915/13907 [4:27:01<5:01:46,  2.59s/it][A
Training...:  50% 6916/13907 [4:27:03<4:57:09,  2.55s/it][A
Training...:  50% 6917/13907 [4:27:06<4:53:06,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:09:20<26:06:17, 31325.86s/it]
Training...:  50% 6917/13907 [4:27:08<4:53:06,  2.52s/it][A
Training...:  50% 6918/13907 [4:27:08<5:02:16,  2.60s/it][A
Training...:  50% 6919/13907 [4:27:11<4:56:03,  2.54s/it][A
Training...:  50% 6920/13907 [4:27:13<4:47:31,  2.47s/it][A
Training...:  50% 6921/13907 [4:27:15<4:41:33,  2.42s/it][A
Training...:  50% 6922/13907 [4:27:18<4:36:42,  2.38s/it][A
Training...:  50% 6923/13907 [4:27:20<4:34:12,  2.36s/it][A
Training...:  50% 6924/13907 [4:27:22<4:28:29,  2.31s/it][A
Training...:  50% 6925/13907 [4:27:24<4:23:46,  2.27s/it][A
Training...:  50% 6926/13907 [4:27:26<4:19:20,  2.23s/it][A
Training...:  50% 6927/13907 [4:27:29<4:14:48,  2.19s/it][A
Training...:  50% 6928/13907 [4:27:31<4:11:32,  2.16s/it][A
Training...:  50% 6929/13907 [4:27:33<4:07:38,  2.13s/it][A
Training...:  50% 6930/13907 [4:27:35<4:03:45,  2.10s/it][A
Training...:  50% 6931/13907 [4:27:37<4:00:56,  2.07s/it][A
Training...:  50% 6932/13907 [4:27:39<3:57:12,  2.04s/it][A
Training...:  50% 6933/13907 [4:27:41<3:53:39,  2.01s/it][A
Training...:  50% 6934/13907 [4:27:43<3:49:24,  1.97s/it][A
Training...:  50% 6935/13907 [4:27:44<3:45:51,  1.94s/it][A
Training...:  50% 6936/13907 [4:27:46<3:41:32,  1.91s/it][A
Training...:  50% 6937/13907 [4:27:48<3:37:45,  1.87s/it][A
Training...:  50% 6938/13907 [4:27:50<3:34:00,  1.84s/it][A
Training...:  50% 6939/13907 [4:27:52<3:30:31,  1.81s/it][A
Training...:  50% 6940/13907 [4:27:53<3:26:24,  1.78s/it][A
Training...:  50% 6941/13907 [4:27:55<3:22:47,  1.75s/it][A
Training...:  50% 6942/13907 [4:27:57<3:18:20,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:10:10<26:06:17, 31325.86s/it]
Training...:  50% 6942/13907 [4:27:58<3:18:20,  1.71s/it][A
Training...:  50% 6943/13907 [4:27:58<3:24:32,  1.76s/it][A
Training...:  50% 6944/13907 [4:28:00<3:18:37,  1.71s/it][A
Training...:  50% 6945/13907 [4:28:02<3:12:06,  1.66s/it][A
Training...:  50% 6946/13907 [4:28:03<3:04:21,  1.59s/it][A
Training...:  50% 6947/13907 [4:28:04<2:56:46,  1.52s/it][A
Training...:  50% 6948/13907 [4:28:06<2:49:31,  1.46s/it][A
Training...:  50% 6949/13907 [4:28:07<2:41:44,  1.39s/it][A
Training...:  50% 6950/13907 [4:28:08<2:30:41,  1.30s/it][A
Training...:  50% 6951/13907 [4:28:12<3:53:50,  2.02s/it][A
Training...:  50% 6952/13907 [4:28:15<4:45:40,  2.46s/it][A
Training...:  50% 6953/13907 [4:28:19<5:14:59,  2.72s/it][A
Training...:  50% 6954/13907 [4:28:22<5:28:57,  2.84s/it][A
Training...:  50% 6955/13907 [4:28:25<5:38:24,  2.92s/it][A
Training...:  50% 6956/13907 [4:28:28<5:41:24,  2.95s/it][A
Training...:  50% 6957/13907 [4:28:31<5:40:21,  2.94s/it][A
Training...:  50% 6958/13907 [4:28:34<5:38:30,  2.92s/it][A
Training...:  50% 6959/13907 [4:28:36<5:35:16,  2.90s/it][A
Training...:  50% 6960/13907 [4:28:39<5:29:32,  2.85s/it][A
Training...:  50% 6961/13907 [4:28:42<5:24:48,  2.81s/it][A
Training...:  50% 6962/13907 [4:28:44<5:18:35,  2.75s/it][A
Training...:  50% 6963/13907 [4:28:47<5:14:30,  2.72s/it][A
Training...:  50% 6964/13907 [4:28:50<5:10:32,  2.68s/it][A
Training...:  50% 6965/13907 [4:28:52<5:06:40,  2.65s/it][A
Training...:  50% 6966/13907 [4:28:55<5:00:47,  2.60s/it][A
Training...:  50% 6967/13907 [4:28:57<4:55:56,  2.56s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:11:11<26:06:17, 31325.86s/it]
Training...:  50% 6967/13907 [4:29:00<4:55:56,  2.56s/it][A
Training...:  50% 6968/13907 [4:29:00<5:05:53,  2.65s/it][A
Training...:  50% 6969/13907 [4:29:03<4:59:11,  2.59s/it][A
Training...:  50% 6970/13907 [4:29:05<4:49:31,  2.50s/it][A
Training...:  50% 6971/13907 [4:29:07<4:42:59,  2.45s/it][A
Training...:  50% 6972/13907 [4:29:09<4:35:23,  2.38s/it][A
Training...:  50% 6973/13907 [4:29:12<4:29:21,  2.33s/it][A
Training...:  50% 6974/13907 [4:29:14<4:24:04,  2.29s/it][A
Training...:  50% 6975/13907 [4:29:16<4:20:42,  2.26s/it][A
Training...:  50% 6976/13907 [4:29:18<4:18:05,  2.23s/it][A
Training...:  50% 6977/13907 [4:29:20<4:14:26,  2.20s/it][A
Training...:  50% 6978/13907 [4:29:22<4:11:18,  2.18s/it][A
Training...:  50% 6979/13907 [4:29:24<4:08:22,  2.15s/it][A
Training...:  50% 6980/13907 [4:29:27<4:04:07,  2.11s/it][A
Training...:  50% 6981/13907 [4:29:29<4:00:25,  2.08s/it][A
Training...:  50% 6982/13907 [4:29:30<3:56:54,  2.05s/it][A
Training...:  50% 6983/13907 [4:29:32<3:53:50,  2.03s/it][A
Training...:  50% 6984/13907 [4:29:34<3:50:18,  2.00s/it][A
Training...:  50% 6985/13907 [4:29:36<3:47:13,  1.97s/it][A
Training...:  50% 6986/13907 [4:29:38<3:43:54,  1.94s/it][A
Training...:  50% 6987/13907 [4:29:40<3:41:08,  1.92s/it][A
Training...:  50% 6988/13907 [4:29:42<3:37:51,  1.89s/it][A
Training...:  50% 6989/13907 [4:29:44<3:34:06,  1.86s/it][A
Training...:  50% 6990/13907 [4:29:45<3:30:38,  1.83s/it][A
Training...:  50% 6991/13907 [4:29:47<3:26:30,  1.79s/it][A
Training...:  50% 6992/13907 [4:29:49<3:22:47,  1.76s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:12:02<26:06:17, 31325.86s/it]
Training...:  50% 6992/13907 [4:29:51<3:22:47,  1.76s/it][A
Training...:  50% 6993/13907 [4:29:51<3:29:35,  1.82s/it][A
Training...:  50% 6994/13907 [4:29:52<3:21:42,  1.75s/it][A
Training...:  50% 6995/13907 [4:29:54<3:12:47,  1.67s/it][A
Training...:  50% 6996/13907 [4:29:55<3:05:33,  1.61s/it][A
Training...:  50% 6997/13907 [4:29:57<2:57:31,  1.54s/it][A
Training...:  50% 6998/13907 [4:29:58<2:49:18,  1.47s/it][A
Training...:  50% 6999/13907 [4:29:59<2:41:16,  1.40s/it][A
Training...:  50% 7000/13907 [4:30:00<2:28:54,  1.29s/it][A
Training...:  50% 7001/13907 [4:30:04<3:52:30,  2.02s/it][A
Training...:  50% 7002/13907 [4:30:07<4:41:40,  2.45s/it][A
Training...:  50% 7003/13907 [4:30:11<5:09:11,  2.69s/it][A
Training...:  50% 7004/13907 [4:30:14<5:26:09,  2.83s/it][A
Training...:  50% 7005/13907 [4:30:17<5:34:31,  2.91s/it][A
Training...:  50% 7006/13907 [4:30:20<5:39:43,  2.95s/it][A
Training...:  50% 7007/13907 [4:30:23<5:39:59,  2.96s/it][A
Training...:  50% 7008/13907 [4:30:26<5:34:30,  2.91s/it][A
Training...:  50% 7009/13907 [4:30:29<5:30:16,  2.87s/it][A
Training...:  50% 7010/13907 [4:30:31<5:24:44,  2.83s/it][A
Training...:  50% 7011/13907 [4:30:34<5:19:21,  2.78s/it][A
Training...:  50% 7012/13907 [4:30:37<5:13:26,  2.73s/it][A
Training...:  50% 7013/13907 [4:30:39<5:08:40,  2.69s/it][A
Training...:  50% 7014/13907 [4:30:42<5:02:46,  2.64s/it][A
Training...:  50% 7015/13907 [4:30:44<4:58:00,  2.59s/it][A
Training...:  50% 7016/13907 [4:30:47<4:53:29,  2.56s/it][A
Training...:  50% 7017/13907 [4:30:49<4:48:55,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:13:03<26:06:17, 31325.86s/it]
Training...:  50% 7017/13907 [4:30:52<4:48:55,  2.52s/it][A
Training...:  50% 7018/13907 [4:30:52<4:58:58,  2.60s/it][A
Training...:  50% 7019/13907 [4:30:54<4:53:23,  2.56s/it][A
Training...:  50% 7020/13907 [4:30:57<4:45:14,  2.49s/it][A
Training...:  50% 7021/13907 [4:30:59<4:39:54,  2.44s/it][A
Training...:  50% 7022/13907 [4:31:01<4:35:28,  2.40s/it][A
Training...:  50% 7023/13907 [4:31:04<4:31:11,  2.36s/it][A
Training...:  51% 7024/13907 [4:31:06<4:25:54,  2.32s/it][A
Training...:  51% 7025/13907 [4:31:08<4:23:28,  2.30s/it][A
Training...:  51% 7026/13907 [4:31:10<4:18:36,  2.25s/it][A
Training...:  51% 7027/13907 [4:31:12<4:15:08,  2.23s/it][A
Training...:  51% 7028/13907 [4:31:14<4:10:46,  2.19s/it][A
Training...:  51% 7029/13907 [4:31:16<4:07:59,  2.16s/it][A
Training...:  51% 7030/13907 [4:31:19<4:04:16,  2.13s/it][A
Training...:  51% 7031/13907 [4:31:21<4:00:43,  2.10s/it][A
Training...:  51% 7032/13907 [4:31:23<3:59:27,  2.09s/it][A
Training...:  51% 7033/13907 [4:31:25<3:56:56,  2.07s/it][A
Training...:  51% 7034/13907 [4:31:27<3:52:32,  2.03s/it][A
Training...:  51% 7035/13907 [4:31:29<3:48:23,  1.99s/it][A
Training...:  51% 7036/13907 [4:31:30<3:44:08,  1.96s/it][A
Training...:  51% 7037/13907 [4:31:32<3:40:25,  1.93s/it][A
Training...:  51% 7038/13907 [4:31:34<3:36:18,  1.89s/it][A
Training...:  51% 7039/13907 [4:31:36<3:32:18,  1.85s/it][A
Training...:  51% 7040/13907 [4:31:38<3:28:32,  1.82s/it][A
Training...:  51% 7041/13907 [4:31:39<3:24:11,  1.78s/it][A
Training...:  51% 7042/13907 [4:31:41<3:19:49,  1.75s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:13:54<26:06:17, 31325.86s/it]
Training...:  51% 7042/13907 [4:31:43<3:19:49,  1.75s/it][A
Training...:  51% 7043/13907 [4:31:43<3:26:35,  1.81s/it][A
Training...:  51% 7044/13907 [4:31:44<3:20:53,  1.76s/it][A
Training...:  51% 7045/13907 [4:31:46<3:14:12,  1.70s/it][A
Training...:  51% 7046/13907 [4:31:48<3:07:20,  1.64s/it][A
Training...:  51% 7047/13907 [4:31:49<2:59:10,  1.57s/it][A
Training...:  51% 7048/13907 [4:31:50<2:51:12,  1.50s/it][A
Training...:  51% 7049/13907 [4:31:52<2:43:04,  1.43s/it][A
Training...:  51% 7050/13907 [4:31:53<2:31:08,  1.32s/it][A
Training...:  51% 7051/13907 [4:31:56<3:51:54,  2.03s/it][A
Training...:  51% 7052/13907 [4:32:00<4:41:06,  2.46s/it][A
Training...:  51% 7053/13907 [4:32:03<5:07:19,  2.69s/it][A
Training...:  51% 7054/13907 [4:32:06<5:20:29,  2.81s/it][A
Training...:  51% 7055/13907 [4:32:09<5:28:07,  2.87s/it][A
Training...:  51% 7056/13907 [4:32:12<5:30:24,  2.89s/it][A
Training...:  51% 7057/13907 [4:32:15<5:30:35,  2.90s/it][A
Training...:  51% 7058/13907 [4:32:18<5:28:18,  2.88s/it][A
Training...:  51% 7059/13907 [4:32:21<5:24:12,  2.84s/it][A
Training...:  51% 7060/13907 [4:32:23<5:20:53,  2.81s/it][A
Training...:  51% 7061/13907 [4:32:26<5:17:24,  2.78s/it][A
Training...:  51% 7062/13907 [4:32:29<5:12:32,  2.74s/it][A
Training...:  51% 7063/13907 [4:32:31<5:07:08,  2.69s/it][A
Training...:  51% 7064/13907 [4:32:34<5:02:26,  2.65s/it][A
Training...:  51% 7065/13907 [4:32:36<4:57:01,  2.60s/it][A
Training...:  51% 7066/13907 [4:32:39<4:53:20,  2.57s/it][A
Training...:  51% 7067/13907 [4:32:41<4:49:00,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:14:55<26:06:17, 31325.86s/it]
Training...:  51% 7067/13907 [4:32:44<4:49:00,  2.54s/it][A
Training...:  51% 7068/13907 [4:32:44<4:59:18,  2.63s/it][A
Training...:  51% 7069/13907 [4:32:47<4:53:43,  2.58s/it][A
Training...:  51% 7070/13907 [4:32:49<4:45:25,  2.50s/it][A
Training...:  51% 7071/13907 [4:32:51<4:38:15,  2.44s/it][A
Training...:  51% 7072/13907 [4:32:53<4:33:05,  2.40s/it][A
Training...:  51% 7073/13907 [4:32:56<4:28:17,  2.36s/it][A
Training...:  51% 7074/13907 [4:32:58<4:23:24,  2.31s/it][A
Training...:  51% 7075/13907 [4:33:00<4:20:03,  2.28s/it][A
Training...:  51% 7076/13907 [4:33:02<4:16:38,  2.25s/it][A
Training...:  51% 7077/13907 [4:33:04<4:12:18,  2.22s/it][A
Training...:  51% 7078/13907 [4:33:07<4:07:38,  2.18s/it][A
Training...:  51% 7079/13907 [4:33:09<4:05:33,  2.16s/it][A
Training...:  51% 7080/13907 [4:33:11<4:00:56,  2.12s/it][A
Training...:  51% 7081/13907 [4:33:13<3:57:51,  2.09s/it][A
Training...:  51% 7082/13907 [4:33:15<3:53:04,  2.05s/it][A
Training...:  51% 7083/13907 [4:33:17<3:49:46,  2.02s/it][A
Training...:  51% 7084/13907 [4:33:19<3:46:03,  1.99s/it][A
Training...:  51% 7085/13907 [4:33:20<3:42:55,  1.96s/it][A
Training...:  51% 7086/13907 [4:33:22<3:38:53,  1.93s/it][A
Training...:  51% 7087/13907 [4:33:24<3:35:21,  1.89s/it][A
Training...:  51% 7088/13907 [4:33:26<3:32:28,  1.87s/it][A
Training...:  51% 7089/13907 [4:33:28<3:29:14,  1.84s/it][A
Training...:  51% 7090/13907 [4:33:29<3:25:03,  1.80s/it][A
Training...:  51% 7091/13907 [4:33:31<3:20:55,  1.77s/it][A
Training...:  51% 7092/13907 [4:33:33<3:16:36,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:15:46<26:06:17, 31325.86s/it]
Training...:  51% 7092/13907 [4:33:35<3:16:36,  1.73s/it][A
Training...:  51% 7093/13907 [4:33:35<3:22:40,  1.78s/it][A
Training...:  51% 7094/13907 [4:33:36<3:16:56,  1.73s/it][A
Training...:  51% 7095/13907 [4:33:38<3:10:38,  1.68s/it][A
Training...:  51% 7096/13907 [4:33:39<3:03:51,  1.62s/it][A
Training...:  51% 7097/13907 [4:33:41<2:56:25,  1.55s/it][A
Training...:  51% 7098/13907 [4:33:42<2:48:30,  1.48s/it][A
Training...:  51% 7099/13907 [4:33:43<2:39:37,  1.41s/it][A
Training...:  51% 7100/13907 [4:33:44<2:27:13,  1.30s/it][A
Training...:  51% 7101/13907 [4:33:48<3:49:44,  2.03s/it][A
Training...:  51% 7102/13907 [4:33:52<4:42:09,  2.49s/it][A
Training...:  51% 7103/13907 [4:33:55<5:10:27,  2.74s/it][A
Training...:  51% 7104/13907 [4:33:58<5:24:51,  2.87s/it][A
Training...:  51% 7105/13907 [4:34:01<5:34:00,  2.95s/it][A
Training...:  51% 7106/13907 [4:34:04<5:35:49,  2.96s/it][A
Training...:  51% 7107/13907 [4:34:07<5:35:51,  2.96s/it][A
Training...:  51% 7108/13907 [4:34:10<5:32:42,  2.94s/it][A
Training...:  51% 7109/13907 [4:34:13<5:29:16,  2.91s/it][A
Training...:  51% 7110/13907 [4:34:16<5:25:05,  2.87s/it][A
Training...:  51% 7111/13907 [4:34:18<5:19:40,  2.82s/it][A
Training...:  51% 7112/13907 [4:34:21<5:14:01,  2.77s/it][A
Training...:  51% 7113/13907 [4:34:24<5:09:48,  2.74s/it][A
Training...:  51% 7114/13907 [4:34:26<5:03:11,  2.68s/it][A
Training...:  51% 7115/13907 [4:34:29<4:57:29,  2.63s/it][A
Training...:  51% 7116/13907 [4:34:31<4:52:59,  2.59s/it][A
Training...:  51% 7117/13907 [4:34:34<4:49:15,  2.56s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:16:48<26:06:17, 31325.86s/it]
Training...:  51% 7117/13907 [4:34:37<4:49:15,  2.56s/it][A
Training...:  51% 7118/13907 [4:34:37<5:00:34,  2.66s/it][A
Training...:  51% 7119/13907 [4:34:39<4:57:09,  2.63s/it][A
Training...:  51% 7120/13907 [4:34:42<4:48:26,  2.55s/it][A
Training...:  51% 7121/13907 [4:34:44<4:41:44,  2.49s/it][A
Training...:  51% 7122/13907 [4:34:46<4:35:16,  2.43s/it][A
Training...:  51% 7123/13907 [4:34:48<4:28:36,  2.38s/it][A
Training...:  51% 7124/13907 [4:34:51<4:22:47,  2.32s/it][A
Training...:  51% 7125/13907 [4:34:53<4:17:40,  2.28s/it][A
Training...:  51% 7126/13907 [4:34:55<4:12:59,  2.24s/it][A
Training...:  51% 7127/13907 [4:34:57<4:08:35,  2.20s/it][A
Training...:  51% 7128/13907 [4:34:59<4:03:44,  2.16s/it][A
Training...:  51% 7129/13907 [4:35:01<3:59:57,  2.12s/it][A
Training...:  51% 7130/13907 [4:35:03<3:56:55,  2.10s/it][A
Training...:  51% 7131/13907 [4:35:05<3:53:15,  2.07s/it][A
Training...:  51% 7132/13907 [4:35:07<3:49:34,  2.03s/it][A
Training...:  51% 7133/13907 [4:35:09<3:45:57,  2.00s/it][A
Training...:  51% 7134/13907 [4:35:11<3:42:42,  1.97s/it][A
Training...:  51% 7135/13907 [4:35:13<3:39:34,  1.95s/it][A
Training...:  51% 7136/13907 [4:35:15<3:36:09,  1.92s/it][A
Training...:  51% 7137/13907 [4:35:16<3:32:42,  1.89s/it][A
Training...:  51% 7138/13907 [4:35:18<3:29:22,  1.86s/it][A
Training...:  51% 7139/13907 [4:35:20<3:25:35,  1.82s/it][A
Training...:  51% 7140/13907 [4:35:22<3:21:18,  1.78s/it][A
Training...:  51% 7141/13907 [4:35:23<3:17:18,  1.75s/it][A
Training...:  51% 7142/13907 [4:35:25<3:13:53,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:17:38<26:06:17, 31325.86s/it]
Training...:  51% 7142/13907 [4:35:27<3:13:53,  1.72s/it][A
Training...:  51% 7143/13907 [4:35:27<3:20:14,  1.78s/it][A
Training...:  51% 7144/13907 [4:35:29<3:14:50,  1.73s/it][A
Training...:  51% 7145/13907 [4:35:30<3:07:30,  1.66s/it][A
Training...:  51% 7146/13907 [4:35:32<3:00:20,  1.60s/it][A
Training...:  51% 7147/13907 [4:35:33<2:53:37,  1.54s/it][A
Training...:  51% 7148/13907 [4:35:34<2:46:09,  1.47s/it][A
Training...:  51% 7149/13907 [4:35:35<2:37:31,  1.40s/it][A
Training...:  51% 7150/13907 [4:35:37<2:26:09,  1.30s/it][A
Training...:  51% 7151/13907 [4:35:40<3:48:42,  2.03s/it][A
Training...:  51% 7152/13907 [4:35:44<4:39:36,  2.48s/it][A
Training...:  51% 7153/13907 [4:35:47<5:06:39,  2.72s/it][A
Training...:  51% 7154/13907 [4:35:50<5:18:44,  2.83s/it][A
Training...:  51% 7155/13907 [4:35:53<5:25:26,  2.89s/it][A
Training...:  51% 7156/13907 [4:35:56<5:26:54,  2.91s/it][A
Training...:  51% 7157/13907 [4:35:59<5:26:00,  2.90s/it][A
Training...:  51% 7158/13907 [4:36:02<5:23:02,  2.87s/it][A
Training...:  51% 7159/13907 [4:36:05<5:18:25,  2.83s/it][A
Training...:  51% 7160/13907 [4:36:07<5:13:57,  2.79s/it][A
Training...:  51% 7161/13907 [4:36:10<5:08:12,  2.74s/it][A
Training...:  51% 7162/13907 [4:36:13<5:04:05,  2.71s/it][A
Training...:  52% 7163/13907 [4:36:15<4:59:19,  2.66s/it][A
Training...:  52% 7164/13907 [4:36:18<4:55:37,  2.63s/it][A
Training...:  52% 7165/13907 [4:36:20<4:52:12,  2.60s/it][A
Training...:  52% 7166/13907 [4:36:23<4:47:45,  2.56s/it][A
Training...:  52% 7167/13907 [4:36:25<4:43:38,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:18:39<26:06:17, 31325.86s/it]
Training...:  52% 7167/13907 [4:36:28<4:43:38,  2.52s/it][A
Training...:  52% 7168/13907 [4:36:28<4:52:51,  2.61s/it][A
Training...:  52% 7169/13907 [4:36:30<4:47:44,  2.56s/it][A
Training...:  52% 7170/13907 [4:36:33<4:39:57,  2.49s/it][A
Training...:  52% 7171/13907 [4:36:35<4:35:11,  2.45s/it][A
Training...:  52% 7172/13907 [4:36:37<4:28:53,  2.40s/it][A
Training...:  52% 7173/13907 [4:36:40<4:25:20,  2.36s/it][A
Training...:  52% 7174/13907 [4:36:42<4:20:45,  2.32s/it][A
Training...:  52% 7175/13907 [4:36:44<4:15:38,  2.28s/it][A
Training...:  52% 7176/13907 [4:36:46<4:10:22,  2.23s/it][A
Training...:  52% 7177/13907 [4:36:48<4:05:31,  2.19s/it][A
Training...:  52% 7178/13907 [4:36:50<4:00:39,  2.15s/it][A
Training...:  52% 7179/13907 [4:36:52<3:56:22,  2.11s/it][A
Training...:  52% 7180/13907 [4:36:54<3:52:33,  2.07s/it][A
Training...:  52% 7181/13907 [4:36:56<3:50:15,  2.05s/it][A
Training...:  52% 7182/13907 [4:36:58<3:46:39,  2.02s/it][A
Training...:  52% 7183/13907 [4:37:00<3:43:19,  1.99s/it][A
Training...:  52% 7184/13907 [4:37:02<3:40:27,  1.97s/it][A
Training...:  52% 7185/13907 [4:37:04<3:37:05,  1.94s/it][A
Training...:  52% 7186/13907 [4:37:06<3:33:02,  1.90s/it][A
Training...:  52% 7187/13907 [4:37:08<3:29:04,  1.87s/it][A
Training...:  52% 7188/13907 [4:37:09<3:25:29,  1.84s/it][A
Training...:  52% 7189/13907 [4:37:11<3:22:07,  1.81s/it][A
Training...:  52% 7190/13907 [4:37:13<3:18:35,  1.77s/it][A
Training...:  52% 7191/13907 [4:37:14<3:15:02,  1.74s/it][A
Training...:  52% 7192/13907 [4:37:16<3:11:13,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:19:29<26:06:17, 31325.86s/it]
Training...:  52% 7192/13907 [4:37:18<3:11:13,  1.71s/it][A
Training...:  52% 7193/13907 [4:37:18<3:17:54,  1.77s/it][A
Training...:  52% 7194/13907 [4:37:20<3:12:23,  1.72s/it][A
Training...:  52% 7195/13907 [4:37:21<3:05:14,  1.66s/it][A
Training...:  52% 7196/13907 [4:37:22<2:56:54,  1.58s/it][A
Training...:  52% 7197/13907 [4:37:24<2:51:00,  1.53s/it][A
Training...:  52% 7198/13907 [4:37:25<2:43:51,  1.47s/it][A
Training...:  52% 7199/13907 [4:37:26<2:36:55,  1.40s/it][A
Training...:  52% 7200/13907 [4:37:27<2:25:46,  1.30s/it][A
Training...:  52% 7201/13907 [4:37:31<3:47:52,  2.04s/it][A
Training...:  52% 7202/13907 [4:37:35<4:36:55,  2.48s/it][A
Training...:  52% 7203/13907 [4:37:38<5:02:25,  2.71s/it][A
Training...:  52% 7204/13907 [4:37:41<5:17:36,  2.84s/it][A
Training...:  52% 7205/13907 [4:37:44<5:27:41,  2.93s/it][A
Training...:  52% 7206/13907 [4:37:47<5:28:11,  2.94s/it][A
Training...:  52% 7207/13907 [4:37:50<5:26:38,  2.93s/it][A
Training...:  52% 7208/13907 [4:37:53<5:22:25,  2.89s/it][A
Training...:  52% 7209/13907 [4:37:56<5:17:43,  2.85s/it][A
Training...:  52% 7210/13907 [4:37:58<5:12:18,  2.80s/it][A
Training...:  52% 7211/13907 [4:38:01<5:07:19,  2.75s/it][A
Training...:  52% 7212/13907 [4:38:04<5:03:38,  2.72s/it][A
Training...:  52% 7213/13907 [4:38:06<4:58:35,  2.68s/it][A
Training...:  52% 7214/13907 [4:38:09<4:54:15,  2.64s/it][A
Training...:  52% 7215/13907 [4:38:11<4:50:26,  2.60s/it][A
Training...:  52% 7216/13907 [4:38:14<4:46:09,  2.57s/it][A
Training...:  52% 7217/13907 [4:38:16<4:41:32,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:20:30<26:06:17, 31325.86s/it]
Training...:  52% 7217/13907 [4:38:19<4:41:32,  2.52s/it][A
Training...:  52% 7218/13907 [4:38:19<4:52:16,  2.62s/it][A
Training...:  52% 7219/13907 [4:38:22<4:47:59,  2.58s/it][A
Training...:  52% 7220/13907 [4:38:24<4:40:59,  2.52s/it][A
Training...:  52% 7221/13907 [4:38:26<4:34:13,  2.46s/it][A
Training...:  52% 7222/13907 [4:38:29<4:27:56,  2.40s/it][A
Training...:  52% 7223/13907 [4:38:31<4:23:09,  2.36s/it][A
Training...:  52% 7224/13907 [4:38:33<4:17:46,  2.31s/it][A
Training...:  52% 7225/13907 [4:38:35<4:12:54,  2.27s/it][A
Training...:  52% 7226/13907 [4:38:37<4:09:41,  2.24s/it][A
Training...:  52% 7227/13907 [4:38:39<4:05:20,  2.20s/it][A
Training...:  52% 7228/13907 [4:38:42<4:01:24,  2.17s/it][A
Training...:  52% 7229/13907 [4:38:44<3:58:56,  2.15s/it][A
Training...:  52% 7230/13907 [4:38:46<3:55:04,  2.11s/it][A
Training...:  52% 7231/13907 [4:38:48<3:51:58,  2.08s/it][A
Training...:  52% 7232/13907 [4:38:50<3:49:10,  2.06s/it][A
Training...:  52% 7233/13907 [4:38:52<3:45:59,  2.03s/it][A
Training...:  52% 7234/13907 [4:38:54<3:43:27,  2.01s/it][A
Training...:  52% 7235/13907 [4:38:56<3:41:01,  1.99s/it][A
Training...:  52% 7236/13907 [4:38:57<3:36:26,  1.95s/it][A
Training...:  52% 7237/13907 [4:38:59<3:32:42,  1.91s/it][A
Training...:  52% 7238/13907 [4:39:01<3:28:09,  1.87s/it][A
Training...:  52% 7239/13907 [4:39:03<3:24:41,  1.84s/it][A
Training...:  52% 7240/13907 [4:39:05<3:20:11,  1.80s/it][A
Training...:  52% 7241/13907 [4:39:06<3:15:46,  1.76s/it][A
Training...:  52% 7242/13907 [4:39:08<3:11:29,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:21:21<26:06:17, 31325.86s/it]
Training...:  52% 7242/13907 [4:39:10<3:11:29,  1.72s/it][A
Training...:  52% 7243/13907 [4:39:10<3:17:20,  1.78s/it][A
Training...:  52% 7244/13907 [4:39:11<3:12:43,  1.74s/it][A
Training...:  52% 7245/13907 [4:39:13<3:04:45,  1.66s/it][A
Training...:  52% 7246/13907 [4:39:14<2:58:11,  1.61s/it][A
Training...:  52% 7247/13907 [4:39:16<2:51:38,  1.55s/it][A
Training...:  52% 7248/13907 [4:39:17<2:44:34,  1.48s/it][A
Training...:  52% 7249/13907 [4:39:18<2:36:41,  1.41s/it][A
Training...:  52% 7250/13907 [4:39:19<2:25:25,  1.31s/it][A
Training...:  52% 7251/13907 [4:39:23<3:45:40,  2.03s/it][A
Training...:  52% 7252/13907 [4:39:27<4:34:09,  2.47s/it][A
Training...:  52% 7253/13907 [4:39:30<4:59:54,  2.70s/it][A
Training...:  52% 7254/13907 [4:39:33<5:12:15,  2.82s/it][A
Training...:  52% 7255/13907 [4:39:36<5:19:29,  2.88s/it][A
Training...:  52% 7256/13907 [4:39:39<5:20:52,  2.89s/it][A
Training...:  52% 7257/13907 [4:39:42<5:21:33,  2.90s/it][A
Training...:  52% 7258/13907 [4:39:45<5:18:29,  2.87s/it][A
Training...:  52% 7259/13907 [4:39:47<5:16:10,  2.85s/it][A
Training...:  52% 7260/13907 [4:39:50<5:12:01,  2.82s/it][A
Training...:  52% 7261/13907 [4:39:53<5:07:23,  2.78s/it][A
Training...:  52% 7262/13907 [4:39:55<5:01:46,  2.72s/it][A
Training...:  52% 7263/13907 [4:39:58<4:56:51,  2.68s/it][A
Training...:  52% 7264/13907 [4:40:01<4:51:17,  2.63s/it][A
Training...:  52% 7265/13907 [4:40:03<4:46:54,  2.59s/it][A
Training...:  52% 7266/13907 [4:40:05<4:41:53,  2.55s/it][A
Training...:  52% 7267/13907 [4:40:08<4:39:48,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:22:22<26:06:17, 31325.86s/it]
Training...:  52% 7267/13907 [4:40:11<4:39:48,  2.53s/it][A
Training...:  52% 7268/13907 [4:40:11<4:52:09,  2.64s/it][A
Training...:  52% 7269/13907 [4:40:13<4:46:19,  2.59s/it][A
Training...:  52% 7270/13907 [4:40:16<4:37:35,  2.51s/it][A
Training...:  52% 7271/13907 [4:40:18<4:30:37,  2.45s/it][A
Training...:  52% 7272/13907 [4:40:20<4:23:55,  2.39s/it][A
Training...:  52% 7273/13907 [4:40:22<4:18:49,  2.34s/it][A
Training...:  52% 7274/13907 [4:40:25<4:13:52,  2.30s/it][A
Training...:  52% 7275/13907 [4:40:27<4:09:16,  2.26s/it][A
Training...:  52% 7276/13907 [4:40:29<4:05:06,  2.22s/it][A
Training...:  52% 7277/13907 [4:40:31<4:00:57,  2.18s/it][A
Training...:  52% 7278/13907 [4:40:33<3:57:09,  2.15s/it][A
Training...:  52% 7279/13907 [4:40:35<3:54:26,  2.12s/it][A
Training...:  52% 7280/13907 [4:40:37<3:51:32,  2.10s/it][A
Training...:  52% 7281/13907 [4:40:39<3:48:20,  2.07s/it][A
Training...:  52% 7282/13907 [4:40:41<3:44:14,  2.03s/it][A
Training...:  52% 7283/13907 [4:40:43<3:40:34,  2.00s/it][A
Training...:  52% 7284/13907 [4:40:45<3:37:14,  1.97s/it][A
Training...:  52% 7285/13907 [4:40:47<3:34:28,  1.94s/it][A
Training...:  52% 7286/13907 [4:40:49<3:31:19,  1.92s/it][A
Training...:  52% 7287/13907 [4:40:50<3:27:53,  1.88s/it][A
Training...:  52% 7288/13907 [4:40:52<3:24:33,  1.85s/it][A
Training...:  52% 7289/13907 [4:40:54<3:20:34,  1.82s/it][A
Training...:  52% 7290/13907 [4:40:56<3:16:41,  1.78s/it][A
Training...:  52% 7291/13907 [4:40:57<3:14:06,  1.76s/it][A
Training...:  52% 7292/13907 [4:40:59<3:10:13,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:23:12<26:06:17, 31325.86s/it]
Training...:  52% 7292/13907 [4:41:01<3:10:13,  1.73s/it][A
Training...:  52% 7293/13907 [4:41:01<3:16:14,  1.78s/it][A
Training...:  52% 7294/13907 [4:41:03<3:11:18,  1.74s/it][A
Training...:  52% 7295/13907 [4:41:04<3:04:27,  1.67s/it][A
Training...:  52% 7296/13907 [4:41:06<2:56:43,  1.60s/it][A
Training...:  52% 7297/13907 [4:41:07<2:49:48,  1.54s/it][A
Training...:  52% 7298/13907 [4:41:08<2:42:57,  1.48s/it][A
Training...:  52% 7299/13907 [4:41:10<2:35:08,  1.41s/it][A
Training...:  52% 7300/13907 [4:41:11<2:23:33,  1.30s/it][A
Training...:  52% 7301/13907 [4:41:14<3:42:41,  2.02s/it][A
Training...:  53% 7302/13907 [4:41:18<4:31:39,  2.47s/it][A
Training...:  53% 7303/13907 [4:41:21<4:59:01,  2.72s/it][A
Training...:  53% 7304/13907 [4:41:24<5:12:44,  2.84s/it][A
Training...:  53% 7305/13907 [4:41:27<5:22:06,  2.93s/it][A
Training...:  53% 7306/13907 [4:41:30<5:24:13,  2.95s/it][A
Training...:  53% 7307/13907 [4:41:33<5:24:34,  2.95s/it][A
Training...:  53% 7308/13907 [4:41:36<5:20:59,  2.92s/it][A
Training...:  53% 7309/13907 [4:41:39<5:16:19,  2.88s/it][A
Training...:  53% 7310/13907 [4:41:42<5:10:35,  2.82s/it][A
Training...:  53% 7311/13907 [4:41:44<5:05:10,  2.78s/it][A
Training...:  53% 7312/13907 [4:41:47<4:59:35,  2.73s/it][A
Training...:  53% 7313/13907 [4:41:49<4:54:58,  2.68s/it][A
Training...:  53% 7314/13907 [4:41:52<4:49:32,  2.64s/it][A
Training...:  53% 7315/13907 [4:41:55<4:45:11,  2.60s/it][A
Training...:  53% 7316/13907 [4:41:57<4:40:16,  2.55s/it][A
Training...:  53% 7317/13907 [4:41:59<4:36:32,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:24:13<26:06:17, 31325.86s/it]
Training...:  53% 7317/13907 [4:42:02<4:36:32,  2.52s/it][A
Training...:  53% 7318/13907 [4:42:02<4:46:35,  2.61s/it][A
Training...:  53% 7319/13907 [4:42:05<4:40:52,  2.56s/it][A
Training...:  53% 7320/13907 [4:42:07<4:33:31,  2.49s/it][A
Training...:  53% 7321/13907 [4:42:09<4:27:32,  2.44s/it][A
Training...:  53% 7322/13907 [4:42:12<4:22:00,  2.39s/it][A
Training...:  53% 7323/13907 [4:42:14<4:17:23,  2.35s/it][A
Training...:  53% 7324/13907 [4:42:16<4:12:32,  2.30s/it][A
Training...:  53% 7325/13907 [4:42:18<4:09:25,  2.27s/it][A
Training...:  53% 7326/13907 [4:42:20<4:05:52,  2.24s/it][A
Training...:  53% 7327/13907 [4:42:23<4:02:07,  2.21s/it][A
Training...:  53% 7328/13907 [4:42:25<3:58:34,  2.18s/it][A
Training...:  53% 7329/13907 [4:42:27<3:54:49,  2.14s/it][A
Training...:  53% 7330/13907 [4:42:29<3:51:01,  2.11s/it][A
Training...:  53% 7331/13907 [4:42:31<3:47:21,  2.07s/it][A
Training...:  53% 7332/13907 [4:42:33<3:44:05,  2.04s/it][A
Training...:  53% 7333/13907 [4:42:35<3:41:57,  2.03s/it][A
Training...:  53% 7334/13907 [4:42:37<3:38:35,  2.00s/it][A
Training...:  53% 7335/13907 [4:42:38<3:34:20,  1.96s/it][A
Training...:  53% 7336/13907 [4:42:40<3:30:27,  1.92s/it][A
Training...:  53% 7337/13907 [4:42:42<3:27:34,  1.90s/it][A
Training...:  53% 7338/13907 [4:42:44<3:24:50,  1.87s/it][A
Training...:  53% 7339/13907 [4:42:46<3:21:13,  1.84s/it][A
Training...:  53% 7340/13907 [4:42:47<3:17:39,  1.81s/it][A
Training...:  53% 7341/13907 [4:42:49<3:14:16,  1.78s/it][A
Training...:  53% 7342/13907 [4:42:51<3:10:31,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:25:04<26:06:17, 31325.86s/it]
Training...:  53% 7342/13907 [4:42:53<3:10:31,  1.74s/it][A
Training...:  53% 7343/13907 [4:42:53<3:17:29,  1.81s/it][A
Training...:  53% 7344/13907 [4:42:54<3:12:56,  1.76s/it][A
Training...:  53% 7345/13907 [4:42:56<3:04:52,  1.69s/it][A
Training...:  53% 7346/13907 [4:42:57<2:56:37,  1.62s/it][A
Training...:  53% 7347/13907 [4:42:59<2:48:32,  1.54s/it][A
Training...:  53% 7348/13907 [4:43:00<2:40:37,  1.47s/it][A
Training...:  53% 7349/13907 [4:43:01<2:32:34,  1.40s/it][A
Training...:  53% 7350/13907 [4:43:02<2:22:05,  1.30s/it][A
Training...:  53% 7351/13907 [4:43:06<3:43:37,  2.05s/it][A
Training...:  53% 7352/13907 [4:43:10<4:29:04,  2.46s/it][A
Training...:  53% 7353/13907 [4:43:13<4:53:41,  2.69s/it][A
Training...:  53% 7354/13907 [4:43:16<5:07:57,  2.82s/it][A
Training...:  53% 7355/13907 [4:43:19<5:14:28,  2.88s/it][A
Training...:  53% 7356/13907 [4:43:22<5:16:37,  2.90s/it][A
Training...:  53% 7357/13907 [4:43:25<5:16:19,  2.90s/it][A
Training...:  53% 7358/13907 [4:43:28<5:14:04,  2.88s/it][A
Training...:  53% 7359/13907 [4:43:30<5:11:47,  2.86s/it][A
Training...:  53% 7360/13907 [4:43:33<5:07:28,  2.82s/it][A
Training...:  53% 7361/13907 [4:43:36<5:04:01,  2.79s/it][A
Training...:  53% 7362/13907 [4:43:39<5:00:47,  2.76s/it][A
Training...:  53% 7363/13907 [4:43:41<4:56:13,  2.72s/it][A
Training...:  53% 7364/13907 [4:43:44<4:51:00,  2.67s/it][A
Training...:  53% 7365/13907 [4:43:46<4:46:42,  2.63s/it][A
Training...:  53% 7366/13907 [4:43:49<4:42:05,  2.59s/it][A
Training...:  53% 7367/13907 [4:43:51<4:38:29,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:26:05<26:06:17, 31325.86s/it]
Training...:  53% 7367/13907 [4:43:54<4:38:29,  2.55s/it][A
Training...:  53% 7368/13907 [4:43:54<4:46:53,  2.63s/it][A
Training...:  53% 7369/13907 [4:43:57<4:41:21,  2.58s/it][A
Training...:  53% 7370/13907 [4:43:59<4:33:07,  2.51s/it][A
Training...:  53% 7371/13907 [4:44:01<4:27:35,  2.46s/it][A
Training...:  53% 7372/13907 [4:44:04<4:24:09,  2.43s/it][A
Training...:  53% 7373/13907 [4:44:06<4:20:32,  2.39s/it][A
Training...:  53% 7374/13907 [4:44:08<4:13:53,  2.33s/it][A
Training...:  53% 7375/13907 [4:44:10<4:08:45,  2.28s/it][A
Training...:  53% 7376/13907 [4:44:12<4:03:30,  2.24s/it][A
Training...:  53% 7377/13907 [4:44:14<3:59:38,  2.20s/it][A
Training...:  53% 7378/13907 [4:44:17<3:55:18,  2.16s/it][A
Training...:  53% 7379/13907 [4:44:19<3:51:43,  2.13s/it][A
Training...:  53% 7380/13907 [4:44:21<3:48:18,  2.10s/it][A
Training...:  53% 7381/13907 [4:44:23<3:45:09,  2.07s/it][A
Training...:  53% 7382/13907 [4:44:25<3:41:48,  2.04s/it][A
Training...:  53% 7383/13907 [4:44:27<3:38:26,  2.01s/it][A
Training...:  53% 7384/13907 [4:44:28<3:35:08,  1.98s/it][A
Training...:  53% 7385/13907 [4:44:30<3:31:43,  1.95s/it][A
Training...:  53% 7386/13907 [4:44:32<3:28:18,  1.92s/it][A
Training...:  53% 7387/13907 [4:44:34<3:25:06,  1.89s/it][A
Training...:  53% 7388/13907 [4:44:36<3:21:38,  1.86s/it][A
Training...:  53% 7389/13907 [4:44:38<3:18:28,  1.83s/it][A
Training...:  53% 7390/13907 [4:44:39<3:14:36,  1.79s/it][A
Training...:  53% 7391/13907 [4:44:41<3:10:52,  1.76s/it][A
Training...:  53% 7392/13907 [4:44:43<3:07:11,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:26:56<26:06:17, 31325.86s/it]
Training...:  53% 7392/13907 [4:44:44<3:07:11,  1.72s/it][A
Training...:  53% 7393/13907 [4:44:44<3:13:26,  1.78s/it][A
Training...:  53% 7394/13907 [4:44:46<3:08:08,  1.73s/it][A
Training...:  53% 7395/13907 [4:44:48<3:01:04,  1.67s/it][A
Training...:  53% 7396/13907 [4:44:49<2:54:35,  1.61s/it][A
Training...:  53% 7397/13907 [4:44:50<2:47:13,  1.54s/it][A
Training...:  53% 7398/13907 [4:44:52<2:40:13,  1.48s/it][A
Training...:  53% 7399/13907 [4:44:53<2:32:28,  1.41s/it][A
Training...:  53% 7400/13907 [4:44:54<2:22:31,  1.31s/it][A
Training...:  53% 7401/13907 [4:44:58<3:41:15,  2.04s/it][A
Training...:  53% 7402/13907 [4:45:01<4:29:26,  2.49s/it][A
Training...:  53% 7403/13907 [4:45:05<4:55:14,  2.72s/it][A
Training...:  53% 7404/13907 [4:45:08<5:09:01,  2.85s/it][A
Training...:  53% 7405/13907 [4:45:11<5:16:01,  2.92s/it][A
Training...:  53% 7406/13907 [4:45:14<5:17:15,  2.93s/it][A
Training...:  53% 7407/13907 [4:45:17<5:15:32,  2.91s/it][A
Training...:  53% 7408/13907 [4:45:20<5:11:38,  2.88s/it][A
Training...:  53% 7409/13907 [4:45:22<5:08:27,  2.85s/it][A
Training...:  53% 7410/13907 [4:45:25<5:03:39,  2.80s/it][A
Training...:  53% 7411/13907 [4:45:28<4:59:38,  2.77s/it][A
Training...:  53% 7412/13907 [4:45:30<4:55:58,  2.73s/it][A
Training...:  53% 7413/13907 [4:45:33<4:54:16,  2.72s/it][A
Training...:  53% 7414/13907 [4:45:36<4:49:12,  2.67s/it][A
Training...:  53% 7415/13907 [4:45:38<4:43:12,  2.62s/it][A
Training...:  53% 7416/13907 [4:45:41<4:37:58,  2.57s/it][A
Training...:  53% 7417/13907 [4:45:43<4:31:47,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:27:57<26:06:17, 31325.86s/it]
Training...:  53% 7417/13907 [4:45:46<4:31:47,  2.51s/it][A
Training...:  53% 7418/13907 [4:45:46<4:40:36,  2.59s/it][A
Training...:  53% 7419/13907 [4:45:48<4:35:04,  2.54s/it][A
Training...:  53% 7420/13907 [4:45:50<4:27:28,  2.47s/it][A
Training...:  53% 7421/13907 [4:45:53<4:22:31,  2.43s/it][A
Training...:  53% 7422/13907 [4:45:55<4:16:26,  2.37s/it][A
Training...:  53% 7423/13907 [4:45:57<4:11:30,  2.33s/it][A
Training...:  53% 7424/13907 [4:45:59<4:07:09,  2.29s/it][A
Training...:  53% 7425/13907 [4:46:02<4:03:13,  2.25s/it][A
Training...:  53% 7426/13907 [4:46:04<3:59:40,  2.22s/it][A
Training...:  53% 7427/13907 [4:46:06<3:55:59,  2.19s/it][A
Training...:  53% 7428/13907 [4:46:08<3:51:28,  2.14s/it][A
Training...:  53% 7429/13907 [4:46:10<3:48:07,  2.11s/it][A
Training...:  53% 7430/13907 [4:46:12<3:44:41,  2.08s/it][A
Training...:  53% 7431/13907 [4:46:14<3:41:09,  2.05s/it][A
Training...:  53% 7432/13907 [4:46:16<3:38:06,  2.02s/it][A
Training...:  53% 7433/13907 [4:46:18<3:34:24,  1.99s/it][A
Training...:  53% 7434/13907 [4:46:20<3:31:43,  1.96s/it][A
Training...:  53% 7435/13907 [4:46:22<3:29:12,  1.94s/it][A
Training...:  53% 7436/13907 [4:46:23<3:25:53,  1.91s/it][A
Training...:  53% 7437/13907 [4:46:25<3:23:16,  1.89s/it][A
Training...:  53% 7438/13907 [4:46:27<3:20:48,  1.86s/it][A
Training...:  53% 7439/13907 [4:46:29<3:16:51,  1.83s/it][A
Training...:  53% 7440/13907 [4:46:30<3:13:21,  1.79s/it][A
Training...:  54% 7441/13907 [4:46:32<3:09:20,  1.76s/it][A
Training...:  54% 7442/13907 [4:46:34<3:04:57,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:28:47<26:06:17, 31325.86s/it]
Training...:  54% 7442/13907 [4:46:36<3:04:57,  1.72s/it][A
Training...:  54% 7443/13907 [4:46:36<3:10:54,  1.77s/it][A
Training...:  54% 7444/13907 [4:46:37<3:06:01,  1.73s/it][A
Training...:  54% 7445/13907 [4:46:39<2:59:09,  1.66s/it][A
Training...:  54% 7446/13907 [4:46:40<2:52:07,  1.60s/it][A
Training...:  54% 7447/13907 [4:46:42<2:45:25,  1.54s/it][A
Training...:  54% 7448/13907 [4:46:43<2:38:48,  1.48s/it][A
Training...:  54% 7449/13907 [4:46:44<2:31:20,  1.41s/it][A
Training...:  54% 7450/13907 [4:46:45<2:20:59,  1.31s/it][A
Training...:  54% 7451/13907 [4:46:49<3:38:53,  2.03s/it][A
Training...:  54% 7452/13907 [4:46:53<4:24:42,  2.46s/it][A
Training...:  54% 7453/13907 [4:46:56<4:50:11,  2.70s/it][A
Training...:  54% 7454/13907 [4:46:59<5:03:52,  2.83s/it][A
Training...:  54% 7455/13907 [4:47:02<5:10:30,  2.89s/it][A
Training...:  54% 7456/13907 [4:47:05<5:12:15,  2.90s/it][A
Training...:  54% 7457/13907 [4:47:08<5:11:09,  2.89s/it][A
Training...:  54% 7458/13907 [4:47:11<5:07:31,  2.86s/it][A
Training...:  54% 7459/13907 [4:47:13<5:03:41,  2.83s/it][A
Training...:  54% 7460/13907 [4:47:16<4:58:15,  2.78s/it][A
Training...:  54% 7461/13907 [4:47:19<4:55:33,  2.75s/it][A
Training...:  54% 7462/13907 [4:47:21<4:52:40,  2.72s/it][A
Training...:  54% 7463/13907 [4:47:24<4:49:04,  2.69s/it][A
Training...:  54% 7464/13907 [4:47:26<4:43:49,  2.64s/it][A
Training...:  54% 7465/13907 [4:47:29<4:38:28,  2.59s/it][A
Training...:  54% 7466/13907 [4:47:31<4:33:58,  2.55s/it][A
Training...:  54% 7467/13907 [4:47:34<4:29:36,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:29:48<26:06:17, 31325.86s/it]
Training...:  54% 7467/13907 [4:47:37<4:29:36,  2.51s/it][A
Training...:  54% 7468/13907 [4:47:37<4:38:24,  2.59s/it][A
Training...:  54% 7469/13907 [4:47:39<4:33:40,  2.55s/it][A
Training...:  54% 7470/13907 [4:47:41<4:26:55,  2.49s/it][A
Training...:  54% 7471/13907 [4:47:44<4:21:13,  2.44s/it][A
Training...:  54% 7472/13907 [4:47:46<4:15:56,  2.39s/it][A
Training...:  54% 7473/13907 [4:47:48<4:11:16,  2.34s/it][A
Training...:  54% 7474/13907 [4:47:50<4:06:03,  2.29s/it][A
Training...:  54% 7475/13907 [4:47:52<4:01:00,  2.25s/it][A
Training...:  54% 7476/13907 [4:47:55<3:58:07,  2.22s/it][A
Training...:  54% 7477/13907 [4:47:57<3:54:30,  2.19s/it][A
Training...:  54% 7478/13907 [4:47:59<3:50:27,  2.15s/it][A
Training...:  54% 7479/13907 [4:48:01<3:48:44,  2.14s/it][A
Training...:  54% 7480/13907 [4:48:03<3:45:21,  2.10s/it][A
Training...:  54% 7481/13907 [4:48:05<3:42:24,  2.08s/it][A
Training...:  54% 7482/13907 [4:48:07<3:39:40,  2.05s/it][A
Training...:  54% 7483/13907 [4:48:09<3:36:08,  2.02s/it][A
Training...:  54% 7484/13907 [4:48:11<3:32:40,  1.99s/it][A
Training...:  54% 7485/13907 [4:48:13<3:28:52,  1.95s/it][A
Training...:  54% 7486/13907 [4:48:15<3:25:08,  1.92s/it][A
Training...:  54% 7487/13907 [4:48:16<3:21:57,  1.89s/it][A
Training...:  54% 7488/13907 [4:48:18<3:18:36,  1.86s/it][A
Training...:  54% 7489/13907 [4:48:20<3:15:13,  1.83s/it][A
Training...:  54% 7490/13907 [4:48:22<3:11:22,  1.79s/it][A
Training...:  54% 7491/13907 [4:48:23<3:08:05,  1.76s/it][A
Training...:  54% 7492/13907 [4:48:25<3:04:43,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:30:38<26:06:17, 31325.86s/it]
Training...:  54% 7492/13907 [4:48:27<3:04:43,  1.73s/it][A
Training...:  54% 7493/13907 [4:48:27<3:10:57,  1.79s/it][A
Training...:  54% 7494/13907 [4:48:28<3:05:42,  1.74s/it][A
Training...:  54% 7495/13907 [4:48:30<2:59:29,  1.68s/it][A
Training...:  54% 7496/13907 [4:48:31<2:52:39,  1.62s/it][A
Training...:  54% 7497/13907 [4:48:33<2:45:46,  1.55s/it][A
Training...:  54% 7498/13907 [4:48:34<2:38:52,  1.49s/it][A
Training...:  54% 7499/13907 [4:48:35<2:31:22,  1.42s/it][A
Training...:  54% 7500/13907 [4:48:37<2:21:04,  1.32s/it][A
Training...:  54% 7501/13907 [4:48:40<3:40:58,  2.07s/it][A
Training...:  54% 7502/13907 [4:48:44<4:26:55,  2.50s/it][A
Training...:  54% 7503/13907 [4:48:47<4:52:55,  2.74s/it][A
Training...:  54% 7504/13907 [4:48:50<5:05:37,  2.86s/it][A
Training...:  54% 7505/13907 [4:48:53<5:11:45,  2.92s/it][A
Training...:  54% 7506/13907 [4:48:56<5:12:46,  2.93s/it][A
Training...:  54% 7507/13907 [4:48:59<5:10:56,  2.92s/it][A
Training...:  54% 7508/13907 [4:49:02<5:08:14,  2.89s/it][A
Training...:  54% 7509/13907 [4:49:05<5:04:38,  2.86s/it][A
Training...:  54% 7510/13907 [4:49:08<4:59:21,  2.81s/it][A
Training...:  54% 7511/13907 [4:49:10<4:54:37,  2.76s/it][A
Training...:  54% 7512/13907 [4:49:13<4:49:03,  2.71s/it][A
Training...:  54% 7513/13907 [4:49:15<4:43:54,  2.66s/it][A
Training...:  54% 7514/13907 [4:49:18<4:39:25,  2.62s/it][A
Training...:  54% 7515/13907 [4:49:20<4:35:33,  2.59s/it][A
Training...:  54% 7516/13907 [4:49:23<4:31:34,  2.55s/it][A
Training...:  54% 7517/13907 [4:49:25<4:28:24,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:31:39<26:06:17, 31325.86s/it]
Training...:  54% 7517/13907 [4:49:28<4:28:24,  2.52s/it][A
Training...:  54% 7518/13907 [4:49:28<4:38:17,  2.61s/it][A
Training...:  54% 7519/13907 [4:49:31<4:33:01,  2.56s/it][A
Training...:  54% 7520/13907 [4:49:33<4:25:32,  2.49s/it][A
Training...:  54% 7521/13907 [4:49:35<4:19:38,  2.44s/it][A
Training...:  54% 7522/13907 [4:49:37<4:13:54,  2.39s/it][A
Training...:  54% 7523/13907 [4:49:40<4:09:24,  2.34s/it][A
Training...:  54% 7524/13907 [4:49:42<4:04:33,  2.30s/it][A
Training...:  54% 7525/13907 [4:49:44<4:00:48,  2.26s/it][A
Training...:  54% 7526/13907 [4:49:46<3:57:19,  2.23s/it][A
Training...:  54% 7527/13907 [4:49:48<3:53:28,  2.20s/it][A
Training...:  54% 7528/13907 [4:49:50<3:50:09,  2.16s/it][A
Training...:  54% 7529/13907 [4:49:53<3:48:38,  2.15s/it][A
Training...:  54% 7530/13907 [4:49:55<3:44:27,  2.11s/it][A
Training...:  54% 7531/13907 [4:49:57<3:42:01,  2.09s/it][A
Training...:  54% 7532/13907 [4:49:59<3:38:47,  2.06s/it][A
Training...:  54% 7533/13907 [4:50:01<3:35:06,  2.02s/it][A
Training...:  54% 7534/13907 [4:50:02<3:30:34,  1.98s/it][A
Training...:  54% 7535/13907 [4:50:04<3:27:23,  1.95s/it][A
Training...:  54% 7536/13907 [4:50:06<3:23:13,  1.91s/it][A
Training...:  54% 7537/13907 [4:50:08<3:20:00,  1.88s/it][A
Training...:  54% 7538/13907 [4:50:10<3:16:50,  1.85s/it][A
Training...:  54% 7539/13907 [4:50:11<3:12:54,  1.82s/it][A
Training...:  54% 7540/13907 [4:50:13<3:08:28,  1.78s/it][A
Training...:  54% 7541/13907 [4:50:15<3:04:31,  1.74s/it][A
Training...:  54% 7542/13907 [4:50:16<3:00:37,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:32:30<26:06:17, 31325.86s/it]
Training...:  54% 7542/13907 [4:50:18<3:00:37,  1.70s/it][A
Training...:  54% 7543/13907 [4:50:18<3:07:18,  1.77s/it][A
Training...:  54% 7544/13907 [4:50:20<3:02:46,  1.72s/it][A
Training...:  54% 7545/13907 [4:50:21<2:56:14,  1.66s/it][A
Training...:  54% 7546/13907 [4:50:23<2:48:54,  1.59s/it][A
Training...:  54% 7547/13907 [4:50:24<2:42:01,  1.53s/it][A
Training...:  54% 7548/13907 [4:50:26<2:35:00,  1.46s/it][A
Training...:  54% 7549/13907 [4:50:27<2:27:02,  1.39s/it][A
Training...:  54% 7550/13907 [4:50:28<2:16:15,  1.29s/it][A
Training...:  54% 7551/13907 [4:50:32<3:34:21,  2.02s/it][A
Training...:  54% 7552/13907 [4:50:35<4:21:21,  2.47s/it][A
Training...:  54% 7553/13907 [4:50:38<4:46:26,  2.70s/it][A
Training...:  54% 7554/13907 [4:50:42<5:00:13,  2.84s/it][A
Training...:  54% 7555/13907 [4:50:45<5:07:31,  2.90s/it][A
Training...:  54% 7556/13907 [4:50:48<5:09:02,  2.92s/it][A
Training...:  54% 7557/13907 [4:50:50<5:08:13,  2.91s/it][A
Training...:  54% 7558/13907 [4:50:53<5:06:58,  2.90s/it][A
Training...:  54% 7559/13907 [4:50:56<5:03:34,  2.87s/it][A
Training...:  54% 7560/13907 [4:50:59<4:58:39,  2.82s/it][A
Training...:  54% 7561/13907 [4:51:01<4:53:43,  2.78s/it][A
Training...:  54% 7562/13907 [4:51:04<4:48:33,  2.73s/it][A
Training...:  54% 7563/13907 [4:51:07<4:44:19,  2.69s/it][A
Training...:  54% 7564/13907 [4:51:09<4:42:50,  2.68s/it][A
Training...:  54% 7565/13907 [4:51:12<4:39:56,  2.65s/it][A
Training...:  54% 7566/13907 [4:51:14<4:34:25,  2.60s/it][A
Training...:  54% 7567/13907 [4:51:17<4:29:28,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:33:31<26:06:17, 31325.86s/it]
Training...:  54% 7567/13907 [4:51:20<4:29:28,  2.55s/it][A
Training...:  54% 7568/13907 [4:51:20<4:37:52,  2.63s/it][A
Training...:  54% 7569/13907 [4:51:22<4:32:07,  2.58s/it][A
Training...:  54% 7570/13907 [4:51:24<4:25:31,  2.51s/it][A
Training...:  54% 7571/13907 [4:51:27<4:19:06,  2.45s/it][A
Training...:  54% 7572/13907 [4:51:29<4:14:32,  2.41s/it][A
Training...:  54% 7573/13907 [4:51:31<4:09:57,  2.37s/it][A
Training...:  54% 7574/13907 [4:51:34<4:04:51,  2.32s/it][A
Training...:  54% 7575/13907 [4:51:36<4:00:18,  2.28s/it][A
Training...:  54% 7576/13907 [4:51:38<3:55:54,  2.24s/it][A
Training...:  54% 7577/13907 [4:51:40<3:52:26,  2.20s/it][A
Training...:  54% 7578/13907 [4:51:42<3:49:46,  2.18s/it][A
Training...:  54% 7579/13907 [4:51:44<3:47:15,  2.15s/it][A
Training...:  55% 7580/13907 [4:51:46<3:44:15,  2.13s/it][A
Training...:  55% 7581/13907 [4:51:48<3:41:20,  2.10s/it][A
Training...:  55% 7582/13907 [4:51:50<3:38:05,  2.07s/it][A
Training...:  55% 7583/13907 [4:51:52<3:34:50,  2.04s/it][A
Training...:  55% 7584/13907 [4:51:54<3:30:25,  2.00s/it][A
Training...:  55% 7585/13907 [4:51:56<3:27:19,  1.97s/it][A
Training...:  55% 7586/13907 [4:51:58<3:23:20,  1.93s/it][A
Training...:  55% 7587/13907 [4:52:00<3:20:10,  1.90s/it][A
Training...:  55% 7588/13907 [4:52:02<3:16:54,  1.87s/it][A
Training...:  55% 7589/13907 [4:52:03<3:13:12,  1.83s/it][A
Training...:  55% 7590/13907 [4:52:05<3:09:48,  1.80s/it][A
Training...:  55% 7591/13907 [4:52:07<3:05:49,  1.77s/it][A
Training...:  55% 7592/13907 [4:52:08<3:01:19,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:34:21<26:06:17, 31325.86s/it]
Training...:  55% 7592/13907 [4:52:10<3:01:19,  1.72s/it][A
Training...:  55% 7593/13907 [4:52:10<3:06:36,  1.77s/it][A
Training...:  55% 7594/13907 [4:52:12<3:01:31,  1.73s/it][A
Training...:  55% 7595/13907 [4:52:13<2:54:20,  1.66s/it][A
Training...:  55% 7596/13907 [4:52:15<2:48:02,  1.60s/it][A
Training...:  55% 7597/13907 [4:52:16<2:41:43,  1.54s/it][A
Training...:  55% 7598/13907 [4:52:18<2:34:45,  1.47s/it][A
Training...:  55% 7599/13907 [4:52:19<2:27:01,  1.40s/it][A
Training...:  55% 7600/13907 [4:52:20<2:16:04,  1.29s/it][A
Training...:  55% 7601/13907 [4:52:23<3:30:43,  2.01s/it][A
Training...:  55% 7602/13907 [4:52:27<4:15:49,  2.43s/it][A
Training...:  55% 7603/13907 [4:52:30<4:42:14,  2.69s/it][A
Training...:  55% 7604/13907 [4:52:33<4:54:42,  2.81s/it][A
Training...:  55% 7605/13907 [4:52:36<5:01:50,  2.87s/it][A
Training...:  55% 7606/13907 [4:52:39<5:05:34,  2.91s/it][A
Training...:  55% 7607/13907 [4:52:42<5:07:09,  2.93s/it][A
Training...:  55% 7608/13907 [4:52:45<5:04:14,  2.90s/it][A
Training...:  55% 7609/13907 [4:52:48<5:00:39,  2.86s/it][A
Training...:  55% 7610/13907 [4:52:51<4:56:20,  2.82s/it][A
Training...:  55% 7611/13907 [4:52:53<4:51:29,  2.78s/it][A
Training...:  55% 7612/13907 [4:52:56<4:46:53,  2.73s/it][A
Training...:  55% 7613/13907 [4:52:59<4:42:28,  2.69s/it][A
Training...:  55% 7614/13907 [4:53:01<4:38:08,  2.65s/it][A
Training...:  55% 7615/13907 [4:53:04<4:35:30,  2.63s/it][A
Training...:  55% 7616/13907 [4:53:06<4:31:37,  2.59s/it][A
Training...:  55% 7617/13907 [4:53:09<4:27:54,  2.56s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:35:23<26:06:17, 31325.86s/it]
Training...:  55% 7617/13907 [4:53:12<4:27:54,  2.56s/it][A
Training...:  55% 7618/13907 [4:53:12<4:38:01,  2.65s/it][A
Training...:  55% 7619/13907 [4:53:14<4:31:47,  2.59s/it][A
Training...:  55% 7620/13907 [4:53:16<4:23:03,  2.51s/it][A
Training...:  55% 7621/13907 [4:53:19<4:16:43,  2.45s/it][A
Training...:  55% 7622/13907 [4:53:21<4:11:06,  2.40s/it][A
Training...:  55% 7623/13907 [4:53:23<4:05:58,  2.35s/it][A
Training...:  55% 7624/13907 [4:53:25<4:01:31,  2.31s/it][A
Training...:  55% 7625/13907 [4:53:27<3:57:02,  2.26s/it][A
Training...:  55% 7626/13907 [4:53:30<3:53:15,  2.23s/it][A
Training...:  55% 7627/13907 [4:53:32<3:49:58,  2.20s/it][A
Training...:  55% 7628/13907 [4:53:34<3:46:53,  2.17s/it][A
Training...:  55% 7629/13907 [4:53:36<3:42:47,  2.13s/it][A
Training...:  55% 7630/13907 [4:53:38<3:39:44,  2.10s/it][A
Training...:  55% 7631/13907 [4:53:40<3:37:09,  2.08s/it][A
Training...:  55% 7632/13907 [4:53:42<3:33:50,  2.04s/it][A
Training...:  55% 7633/13907 [4:53:44<3:30:43,  2.02s/it][A
Training...:  55% 7634/13907 [4:53:46<3:27:32,  1.99s/it][A
Training...:  55% 7635/13907 [4:53:48<3:24:38,  1.96s/it][A
Training...:  55% 7636/13907 [4:53:49<3:21:04,  1.92s/it][A
Training...:  55% 7637/13907 [4:53:51<3:17:52,  1.89s/it][A
Training...:  55% 7638/13907 [4:53:53<3:15:36,  1.87s/it][A
Training...:  55% 7639/13907 [4:53:55<3:13:41,  1.85s/it][A
Training...:  55% 7640/13907 [4:53:57<3:10:15,  1.82s/it][A
Training...:  55% 7641/13907 [4:53:58<3:06:43,  1.79s/it][A
Training...:  55% 7642/13907 [4:54:00<3:01:55,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:36:13<26:06:17, 31325.86s/it]
Training...:  55% 7642/13907 [4:54:02<3:01:55,  1.74s/it][A
Training...:  55% 7643/13907 [4:54:02<3:07:24,  1.80s/it][A
Training...:  55% 7644/13907 [4:54:04<3:02:36,  1.75s/it][A
Training...:  55% 7645/13907 [4:54:05<2:55:22,  1.68s/it][A
Training...:  55% 7646/13907 [4:54:07<2:48:49,  1.62s/it][A
Training...:  55% 7647/13907 [4:54:08<2:42:01,  1.55s/it][A
Training...:  55% 7648/13907 [4:54:09<2:35:00,  1.49s/it][A
Training...:  55% 7649/13907 [4:54:11<2:27:15,  1.41s/it][A
Training...:  55% 7650/13907 [4:54:12<2:16:44,  1.31s/it][A
Training...:  55% 7651/13907 [4:54:15<3:31:25,  2.03s/it][A
Training...:  55% 7652/13907 [4:54:19<4:15:38,  2.45s/it][A
Training...:  55% 7653/13907 [4:54:22<4:39:25,  2.68s/it][A
Training...:  55% 7654/13907 [4:54:25<4:51:57,  2.80s/it][A
Training...:  55% 7655/13907 [4:54:28<4:58:40,  2.87s/it][A
Training...:  55% 7656/13907 [4:54:31<5:00:10,  2.88s/it][A
Training...:  55% 7657/13907 [4:54:34<5:00:34,  2.89s/it][A
Training...:  55% 7658/13907 [4:54:37<4:58:11,  2.86s/it][A
Training...:  55% 7659/13907 [4:54:39<4:54:16,  2.83s/it][A
Training...:  55% 7660/13907 [4:54:42<4:49:58,  2.79s/it][A
Training...:  55% 7661/13907 [4:54:45<4:46:03,  2.75s/it][A
Training...:  55% 7662/13907 [4:54:47<4:42:34,  2.71s/it][A
Training...:  55% 7663/13907 [4:54:50<4:37:49,  2.67s/it][A
Training...:  55% 7664/13907 [4:54:53<4:33:38,  2.63s/it][A
Training...:  55% 7665/13907 [4:54:55<4:30:23,  2.60s/it][A
Training...:  55% 7666/13907 [4:54:58<4:26:18,  2.56s/it][A
Training...:  55% 7667/13907 [4:55:00<4:23:12,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:37:14<26:06:17, 31325.86s/it]
Training...:  55% 7667/13907 [4:55:03<4:23:12,  2.53s/it][A
Training...:  55% 7668/13907 [4:55:03<4:33:22,  2.63s/it][A
Training...:  55% 7669/13907 [4:55:05<4:28:04,  2.58s/it][A
Training...:  55% 7670/13907 [4:55:08<4:20:37,  2.51s/it][A
Training...:  55% 7671/13907 [4:55:10<4:14:31,  2.45s/it][A
Training...:  55% 7672/13907 [4:55:12<4:09:06,  2.40s/it][A
Training...:  55% 7673/13907 [4:55:14<4:04:05,  2.35s/it][A
Training...:  55% 7674/13907 [4:55:17<4:00:12,  2.31s/it][A
Training...:  55% 7675/13907 [4:55:19<3:57:22,  2.29s/it][A
Training...:  55% 7676/13907 [4:55:21<3:54:27,  2.26s/it][A
Training...:  55% 7677/13907 [4:55:23<3:50:20,  2.22s/it][A
Training...:  55% 7678/13907 [4:55:25<3:46:13,  2.18s/it][A
Training...:  55% 7679/13907 [4:55:27<3:42:34,  2.14s/it][A
Training...:  55% 7680/13907 [4:55:29<3:38:30,  2.11s/it][A
Training...:  55% 7681/13907 [4:55:31<3:35:56,  2.08s/it][A
Training...:  55% 7682/13907 [4:55:33<3:31:49,  2.04s/it][A
Training...:  55% 7683/13907 [4:55:35<3:28:14,  2.01s/it][A
Training...:  55% 7684/13907 [4:55:37<3:24:50,  1.98s/it][A
Training...:  55% 7685/13907 [4:55:39<3:21:40,  1.94s/it][A
Training...:  55% 7686/13907 [4:55:41<3:18:16,  1.91s/it][A
Training...:  55% 7687/13907 [4:55:43<3:16:02,  1.89s/it][A
Training...:  55% 7688/13907 [4:55:45<3:13:05,  1.86s/it][A
Training...:  55% 7689/13907 [4:55:46<3:09:58,  1.83s/it][A
Training...:  55% 7690/13907 [4:55:48<3:06:34,  1.80s/it][A
Training...:  55% 7691/13907 [4:55:50<3:03:10,  1.77s/it][A
Training...:  55% 7692/13907 [4:55:51<2:59:37,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:38:05<26:06:17, 31325.86s/it]
Training...:  55% 7692/13907 [4:55:53<2:59:37,  1.73s/it][A
Training...:  55% 7693/13907 [4:55:53<3:05:11,  1.79s/it][A
Training...:  55% 7694/13907 [4:55:55<2:59:45,  1.74s/it][A
Training...:  55% 7695/13907 [4:55:56<2:53:05,  1.67s/it][A
Training...:  55% 7696/13907 [4:55:58<2:46:17,  1.61s/it][A
Training...:  55% 7697/13907 [4:55:59<2:39:31,  1.54s/it][A
Training...:  55% 7698/13907 [4:56:01<2:32:37,  1.47s/it][A
Training...:  55% 7699/13907 [4:56:02<2:24:40,  1.40s/it][A
Training...:  55% 7700/13907 [4:56:03<2:14:12,  1.30s/it][A
Training...:  55% 7701/13907 [4:56:07<3:28:49,  2.02s/it][A
Training...:  55% 7702/13907 [4:56:10<4:14:26,  2.46s/it][A
Training...:  55% 7703/13907 [4:56:13<4:38:48,  2.70s/it][A
Training...:  55% 7704/13907 [4:56:16<4:52:01,  2.82s/it][A
Training...:  55% 7705/13907 [4:56:20<4:58:31,  2.89s/it][A
Training...:  55% 7706/13907 [4:56:22<4:59:39,  2.90s/it][A
Training...:  55% 7707/13907 [4:56:25<4:58:51,  2.89s/it][A
Training...:  55% 7708/13907 [4:56:28<4:55:59,  2.86s/it][A
Training...:  55% 7709/13907 [4:56:31<4:52:49,  2.83s/it][A
Training...:  55% 7710/13907 [4:56:34<4:49:26,  2.80s/it][A
Training...:  55% 7711/13907 [4:56:36<4:45:12,  2.76s/it][A
Training...:  55% 7712/13907 [4:56:39<4:42:55,  2.74s/it][A
Training...:  55% 7713/13907 [4:56:42<4:40:09,  2.71s/it][A
Training...:  55% 7714/13907 [4:56:44<4:36:06,  2.67s/it][A
Training...:  55% 7715/13907 [4:56:47<4:31:24,  2.63s/it][A
Training...:  55% 7716/13907 [4:56:49<4:26:53,  2.59s/it][A
Training...:  55% 7717/13907 [4:56:52<4:22:06,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:39:06<26:06:17, 31325.86s/it]
Training...:  55% 7717/13907 [4:56:54<4:22:06,  2.54s/it][A
Training...:  55% 7718/13907 [4:56:54<4:31:28,  2.63s/it][A
Training...:  56% 7719/13907 [4:56:57<4:26:59,  2.59s/it][A
Training...:  56% 7720/13907 [4:56:59<4:19:53,  2.52s/it][A
Training...:  56% 7721/13907 [4:57:02<4:13:21,  2.46s/it][A
Training...:  56% 7722/13907 [4:57:04<4:09:14,  2.42s/it][A
Training...:  56% 7723/13907 [4:57:06<4:04:27,  2.37s/it][A
Training...:  56% 7724/13907 [4:57:08<3:59:13,  2.32s/it][A
Training...:  56% 7725/13907 [4:57:11<3:54:41,  2.28s/it][A
Training...:  56% 7726/13907 [4:57:13<3:50:15,  2.24s/it][A
Training...:  56% 7727/13907 [4:57:15<3:46:48,  2.20s/it][A
Training...:  56% 7728/13907 [4:57:17<3:43:23,  2.17s/it][A
Training...:  56% 7729/13907 [4:57:19<3:40:09,  2.14s/it][A
Training...:  56% 7730/13907 [4:57:21<3:37:00,  2.11s/it][A
Training...:  56% 7731/13907 [4:57:23<3:34:27,  2.08s/it][A
Training...:  56% 7732/13907 [4:57:25<3:31:19,  2.05s/it][A
Training...:  56% 7733/13907 [4:57:27<3:28:12,  2.02s/it][A
Training...:  56% 7734/13907 [4:57:29<3:24:41,  1.99s/it][A
Training...:  56% 7735/13907 [4:57:31<3:21:27,  1.96s/it][A
Training...:  56% 7736/13907 [4:57:33<3:18:01,  1.93s/it][A
Training...:  56% 7737/13907 [4:57:35<3:15:05,  1.90s/it][A
Training...:  56% 7738/13907 [4:57:36<3:12:09,  1.87s/it][A
Training...:  56% 7739/13907 [4:57:38<3:08:20,  1.83s/it][A
Training...:  56% 7740/13907 [4:57:40<3:05:33,  1.81s/it][A
Training...:  56% 7741/13907 [4:57:42<3:02:35,  1.78s/it][A
Training...:  56% 7742/13907 [4:57:43<2:59:13,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:39:56<26:06:17, 31325.86s/it]
Training...:  56% 7742/13907 [4:57:45<2:59:13,  1.74s/it][A
Training...:  56% 7743/13907 [4:57:45<3:04:36,  1.80s/it][A
Training...:  56% 7744/13907 [4:57:47<2:59:13,  1.74s/it][A
Training...:  56% 7745/13907 [4:57:48<2:51:48,  1.67s/it][A
Training...:  56% 7746/13907 [4:57:50<2:44:21,  1.60s/it][A
Training...:  56% 7747/13907 [4:57:51<2:37:38,  1.54s/it][A
Training...:  56% 7748/13907 [4:57:52<2:30:37,  1.47s/it][A
Training...:  56% 7749/13907 [4:57:54<2:23:12,  1.40s/it][A
Training...:  56% 7750/13907 [4:57:55<2:12:56,  1.30s/it][A
Training...:  56% 7751/13907 [4:57:58<3:30:38,  2.05s/it][A
Training...:  56% 7752/13907 [4:58:02<4:13:54,  2.48s/it][A
Training...:  56% 7753/13907 [4:58:05<4:39:50,  2.73s/it][A
Training...:  56% 7754/13907 [4:58:08<4:52:28,  2.85s/it][A
Training...:  56% 7755/13907 [4:58:11<4:59:22,  2.92s/it][A
Training...:  56% 7756/13907 [4:58:14<5:00:59,  2.94s/it][A
Training...:  56% 7757/13907 [4:58:17<4:59:46,  2.92s/it][A
Training...:  56% 7758/13907 [4:58:20<4:56:59,  2.90s/it][A
Training...:  56% 7759/13907 [4:58:23<4:53:50,  2.87s/it][A
Training...:  56% 7760/13907 [4:58:26<4:48:59,  2.82s/it][A
Training...:  56% 7761/13907 [4:58:28<4:44:08,  2.77s/it][A
Training...:  56% 7762/13907 [4:58:31<4:39:13,  2.73s/it][A
Training...:  56% 7763/13907 [4:58:34<4:34:16,  2.68s/it][A
Training...:  56% 7764/13907 [4:58:36<4:29:23,  2.63s/it][A
Training...:  56% 7765/13907 [4:58:39<4:25:19,  2.59s/it][A
Training...:  56% 7766/13907 [4:58:41<4:21:00,  2.55s/it][A
Training...:  56% 7767/13907 [4:58:43<4:17:06,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:40:57<26:06:17, 31325.86s/it]
Training...:  56% 7767/13907 [4:58:46<4:17:06,  2.51s/it][A
Training...:  56% 7768/13907 [4:58:46<4:26:32,  2.61s/it][A
Training...:  56% 7769/13907 [4:58:49<4:21:30,  2.56s/it][A
Training...:  56% 7770/13907 [4:58:51<4:14:19,  2.49s/it][A
Training...:  56% 7771/13907 [4:58:53<4:07:57,  2.42s/it][A
Training...:  56% 7772/13907 [4:58:56<4:02:46,  2.37s/it][A
Training...:  56% 7773/13907 [4:58:58<3:57:51,  2.33s/it][A
Training...:  56% 7774/13907 [4:59:00<3:53:34,  2.29s/it][A
Training...:  56% 7775/13907 [4:59:02<3:49:22,  2.24s/it][A
Training...:  56% 7776/13907 [4:59:04<3:46:04,  2.21s/it][A
Training...:  56% 7777/13907 [4:59:06<3:43:21,  2.19s/it][A
Training...:  56% 7778/13907 [4:59:08<3:39:45,  2.15s/it][A
Training...:  56% 7779/13907 [4:59:11<3:37:08,  2.13s/it][A
Training...:  56% 7780/13907 [4:59:13<3:34:07,  2.10s/it][A
Training...:  56% 7781/13907 [4:59:15<3:31:00,  2.07s/it][A
Training...:  56% 7782/13907 [4:59:17<3:28:37,  2.04s/it][A
Training...:  56% 7783/13907 [4:59:18<3:26:04,  2.02s/it][A
Training...:  56% 7784/13907 [4:59:20<3:23:30,  1.99s/it][A
Training...:  56% 7785/13907 [4:59:22<3:20:38,  1.97s/it][A
Training...:  56% 7786/13907 [4:59:24<3:17:00,  1.93s/it][A
Training...:  56% 7787/13907 [4:59:26<3:14:24,  1.91s/it][A
Training...:  56% 7788/13907 [4:59:28<3:10:37,  1.87s/it][A
Training...:  56% 7789/13907 [4:59:30<3:08:23,  1.85s/it][A
Training...:  56% 7790/13907 [4:59:31<3:04:21,  1.81s/it][A
Training...:  56% 7791/13907 [4:59:33<3:00:56,  1.78s/it][A
Training...:  56% 7792/13907 [4:59:35<2:56:23,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:41:48<26:06:17, 31325.86s/it]
Training...:  56% 7792/13907 [4:59:37<2:56:23,  1.73s/it][A
Training...:  56% 7793/13907 [4:59:37<3:01:56,  1.79s/it][A
Training...:  56% 7794/13907 [4:59:38<2:56:59,  1.74s/it][A
Training...:  56% 7795/13907 [4:59:40<2:49:53,  1.67s/it][A
Training...:  56% 7796/13907 [4:59:41<2:43:25,  1.60s/it][A
Training...:  56% 7797/13907 [4:59:43<2:36:44,  1.54s/it][A
Training...:  56% 7798/13907 [4:59:44<2:30:35,  1.48s/it][A
Training...:  56% 7799/13907 [4:59:45<2:23:20,  1.41s/it][A
Training...:  56% 7800/13907 [4:59:46<2:13:03,  1.31s/it][A
Training...:  56% 7801/13907 [4:59:50<3:30:06,  2.06s/it][A
Training...:  56% 7802/13907 [4:59:54<4:17:49,  2.53s/it][A
Training...:  56% 7803/13907 [4:59:57<4:43:18,  2.78s/it][A
Training...:  56% 7804/13907 [5:00:00<4:53:12,  2.88s/it][A
Training...:  56% 7805/13907 [5:00:03<4:58:16,  2.93s/it][A
Training...:  56% 7806/13907 [5:00:06<4:58:57,  2.94s/it][A
Training...:  56% 7807/13907 [5:00:09<4:57:48,  2.93s/it][A
Training...:  56% 7808/13907 [5:00:12<4:54:43,  2.90s/it][A
Training...:  56% 7809/13907 [5:00:15<4:51:29,  2.87s/it][A
Training...:  56% 7810/13907 [5:00:17<4:47:05,  2.83s/it][A
Training...:  56% 7811/13907 [5:00:20<4:42:32,  2.78s/it][A
Training...:  56% 7812/13907 [5:00:23<4:37:48,  2.73s/it][A
Training...:  56% 7813/13907 [5:00:25<4:33:07,  2.69s/it][A
Training...:  56% 7814/13907 [5:00:28<4:28:46,  2.65s/it][A
Training...:  56% 7815/13907 [5:00:30<4:24:44,  2.61s/it][A
Training...:  56% 7816/13907 [5:00:33<4:20:43,  2.57s/it][A
Training...:  56% 7817/13907 [5:00:35<4:17:56,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:42:49<26:06:17, 31325.86s/it]
Training...:  56% 7817/13907 [5:00:38<4:17:56,  2.54s/it][A
Training...:  56% 7818/13907 [5:00:38<4:26:43,  2.63s/it][A
Training...:  56% 7819/13907 [5:00:41<4:21:39,  2.58s/it][A
Training...:  56% 7820/13907 [5:00:43<4:14:41,  2.51s/it][A
Training...:  56% 7821/13907 [5:00:45<4:10:21,  2.47s/it][A
Training...:  56% 7822/13907 [5:00:48<4:04:53,  2.41s/it][A
Training...:  56% 7823/13907 [5:00:50<3:59:54,  2.37s/it][A
Training...:  56% 7824/13907 [5:00:52<3:56:02,  2.33s/it][A
Training...:  56% 7825/13907 [5:00:54<3:51:39,  2.29s/it][A
Training...:  56% 7826/13907 [5:00:56<3:47:17,  2.24s/it][A
Training...:  56% 7827/13907 [5:00:59<3:44:10,  2.21s/it][A
Training...:  56% 7828/13907 [5:01:01<3:40:35,  2.18s/it][A
Training...:  56% 7829/13907 [5:01:03<3:37:26,  2.15s/it][A
Training...:  56% 7830/13907 [5:01:05<3:35:07,  2.12s/it][A
Training...:  56% 7831/13907 [5:01:07<3:32:28,  2.10s/it][A
Training...:  56% 7832/13907 [5:01:09<3:30:02,  2.07s/it][A
Training...:  56% 7833/13907 [5:01:11<3:26:57,  2.04s/it][A
Training...:  56% 7834/13907 [5:01:13<3:23:34,  2.01s/it][A
Training...:  56% 7835/13907 [5:01:15<3:20:42,  1.98s/it][A
Training...:  56% 7836/13907 [5:01:17<3:16:55,  1.95s/it][A
Training...:  56% 7837/13907 [5:01:18<3:13:43,  1.91s/it][A
Training...:  56% 7838/13907 [5:01:20<3:10:11,  1.88s/it][A
Training...:  56% 7839/13907 [5:01:22<3:06:45,  1.85s/it][A
Training...:  56% 7840/13907 [5:01:24<3:03:16,  1.81s/it][A
Training...:  56% 7841/13907 [5:01:25<3:00:59,  1.79s/it][A
Training...:  56% 7842/13907 [5:01:27<2:56:16,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:43:40<26:06:17, 31325.86s/it]
Training...:  56% 7842/13907 [5:01:29<2:56:16,  1.74s/it][A
Epoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |)
Step... (20025 | Loss: 0.24827125668525696, Learning Rate: 0.0001816727453842759, Gradient Norm: 0.8007526397705078)
Step... (20050 | Loss: 0.3104998469352722, Learning Rate: 0.00018152121629100293, Gradient Norm: 1.186352252960205)
Step... (20075 | Loss: 0.2632996141910553, Learning Rate: 0.00018136970174964517, Gradient Norm: 0.9002703428268433)
Step... (20100 | Loss: 0.2673195004463196, Learning Rate: 0.00018121820176020265, Gradient Norm: 0.9945133924484253)
Step... (20125 | Loss: 0.2614886462688446, Learning Rate: 0.00018106667266692966, Gradient Norm: 0.8110659122467041)
Step... (20150 | Loss: 0.24626538157463074, Learning Rate: 0.00018091514357365668, Gradient Norm: 1.0821222066879272)
Step... (20175 | Loss: 0.2578303813934326, Learning Rate: 0.00018076365813612938, Gradient Norm: 0.9039866924285889)
Step... (20200 | Loss: 0.20465877652168274, Learning Rate: 0.0001806121290428564, Gradient Norm: 1.1602320671081543)
Step... (20225 | Loss: 0.2488471269607544, Learning Rate: 0.0001804605999495834, Gradient Norm: 0.9669414162635803)
Step... (20250 | Loss: 0.19857695698738098, Learning Rate: 0.0001803091145120561, Gradient Norm: 1.06378173828125)
Step... (20275 | Loss: 0.20916816592216492, Learning Rate: 0.00018015758541878313, Gradient Norm: 0.7987250089645386)
Step... (20300 | Loss: 0.19873040914535522, Learning Rate: 0.00018000605632551014, Gradient Norm: 0.8140466213226318)
Step... (20325 | Loss: 0.22944985330104828, Learning Rate: 0.00017985455633606762, Gradient Norm: 0.6984678506851196)
Step... (20350 | Loss: 0.22199591994285583, Learning Rate: 0.00017970304179470986, Gradient Norm: 1.1599299907684326)
Step... (20375 | Loss: 0.20597028732299805, Learning Rate: 0.00017955151270143688, Gradient Norm: 0.9535931944847107)
Step... (20400 | Loss: 0.24952179193496704, Learning Rate: 0.00017940001271199435, Gradient Norm: 0.9915412068367004)
Step... (20425 | Loss: 0.23806999623775482, Learning Rate: 0.0001792484981706366, Gradient Norm: 1.1334741115570068)
Step... (20450 | Loss: 0.2619607448577881, Learning Rate: 0.0001790969690773636, Gradient Norm: 1.0436264276504517)
Step... (20475 | Loss: 0.27515077590942383, Learning Rate: 0.00017894545453600585, Gradient Norm: 1.1426846981048584)
Step... (20500 | Loss: 0.22550788521766663, Learning Rate: 0.00017879395454656333, Gradient Norm: 1.0667933225631714)
Step... (20525 | Loss: 0.2616213858127594, Learning Rate: 0.00017864242545329034, Gradient Norm: 1.0013608932495117)
Step... (20550 | Loss: 0.22738076746463776, Learning Rate: 0.0001784909109119326, Gradient Norm: 1.1812198162078857)
Step... (20575 | Loss: 0.2485128939151764, Learning Rate: 0.00017833941092249006, Gradient Norm: 0.9441054463386536)
Step... (20600 | Loss: 0.2756815552711487, Learning Rate: 0.00017818788182921708, Gradient Norm: 1.3466811180114746)
Step... (20625 | Loss: 0.20811638236045837, Learning Rate: 0.00017803636728785932, Gradient Norm: 0.8020415306091309)
Step... (20650 | Loss: 0.312276154756546, Learning Rate: 0.0001778848672984168, Gradient Norm: 1.172531247138977)
Step... (20675 | Loss: 0.30604323744773865, Learning Rate: 0.0001777333382051438, Gradient Norm: 0.9359859228134155)
Step... (20700 | Loss: 0.23059749603271484, Learning Rate: 0.00017758182366378605, Gradient Norm: 1.1314902305603027)
Step... (20725 | Loss: 0.2864167094230652, Learning Rate: 0.0001774303091224283, Gradient Norm: 0.8148312568664551)
Step... (20750 | Loss: 0.22908174991607666, Learning Rate: 0.00017727879458107054, Gradient Norm: 0.9439587593078613)
Step... (20775 | Loss: 0.3237815201282501, Learning Rate: 0.0001771272800397128, Gradient Norm: 1.026139497756958)
Step... (20800 | Loss: 0.2648906707763672, Learning Rate: 0.00017697576549835503, Gradient Norm: 1.3438175916671753)
Step... (20825 | Loss: 0.30269837379455566, Learning Rate: 0.00017682425095699728, Gradient Norm: 1.2314701080322266)
Step... (20850 | Loss: 0.30481281876564026, Learning Rate: 0.00017667273641563952, Gradient Norm: 1.1672056913375854)Training...:  56% 7843/13907 [5:01:29<3:02:35,  1.81s/it][A
Step... (20875 | Loss: 0.2707550823688507, Learning Rate: 0.00017652122187428176, Gradient Norm: 1.004737138748169)
Step... (20900 | Loss: 0.1975151002407074, Learning Rate: 0.00017636969278100878, Gradient Norm: 1.25022292137146)
Step... (20925 | Loss: 0.23731964826583862, Learning Rate: 0.00017621819279156625, Gradient Norm: 0.7496537566184998)
Step... (20950 | Loss: 0.21278847754001617, Learning Rate: 0.0001760666782502085, Gradient Norm: 1.025739073753357)
Step... (20975 | Loss: 0.24040232598781586, Learning Rate: 0.0001759151491569355, Gradient Norm: 1.1271982192993164)
Step... (21000 | Loss: 0.18597863614559174, Learning Rate: 0.00017576364916749299, Gradient Norm: 0.9708096981048584)
Step... (21025 | Loss: 0.19738034904003143, Learning Rate: 0.00017561213462613523, Gradient Norm: 0.7717207074165344)
Step... (21050 | Loss: 0.26734426617622375, Learning Rate: 0.00017546060553286225, Gradient Norm: 1.4389722347259521)
Step... (21075 | Loss: 0.23107361793518066, Learning Rate: 0.00017530910554341972, Gradient Norm: 0.7401666045188904)
Step... (21100 | Loss: 0.20111969113349915, Learning Rate: 0.00017515759100206196, Gradient Norm: 1.0459539890289307)
Step... (21125 | Loss: 0.2797258794307709, Learning Rate: 0.00017500606190878898, Gradient Norm: 1.1677114963531494)
Step... (21150 | Loss: 0.24621737003326416, Learning Rate: 0.00017485456191934645, Gradient Norm: 1.1407749652862549)
Step... (21175 | Loss: 0.17494073510169983, Learning Rate: 0.0001747030473779887, Gradient Norm: 0.6983294486999512)
Step... (21200 | Loss: 0.18650805950164795, Learning Rate: 0.0001745515182847157, Gradient Norm: 1.1515307426452637)
Step... (21225 | Loss: 0.3118581771850586, Learning Rate: 0.00017440000374335796, Gradient Norm: 1.1104803085327148)
Step... (21250 | Loss: 0.1814783811569214, Learning Rate: 0.00017424850375391543, Gradient Norm: 0.9276402592658997)
Step... (21275 | Loss: 0.22942419350147247, Learning Rate: 0.00017409697466064245, Gradient Norm: 0.8580046892166138)
Step... (21300 | Loss: 0.2959156036376953, Learning Rate: 0.0001739454601192847, Gradient Norm: 1.3019689321517944)
Step... (21325 | Loss: 0.20106320083141327, Learning Rate: 0.00017379396012984216, Gradient Norm: 0.8763185739517212)
Step... (21350 | Loss: 0.20763878524303436, Learning Rate: 0.00017364243103656918, Gradient Norm: 0.750562310218811)
Step... (21375 | Loss: 0.25987258553504944, Learning Rate: 0.00017349091649521142, Gradient Norm: 0.8515927195549011)
Step... (21400 | Loss: 0.23723110556602478, Learning Rate: 0.0001733394165057689, Gradient Norm: 0.9785346388816833)
Step... (21425 | Loss: 0.2585031986236572, Learning Rate: 0.0001731878874124959, Gradient Norm: 1.0276780128479004)
Step... (21450 | Loss: 0.2668154537677765, Learning Rate: 0.00017303637287113816, Gradient Norm: 0.9650806188583374)
Step... (21475 | Loss: 0.2685799300670624, Learning Rate: 0.00017288487288169563, Gradient Norm: 1.2400487661361694)
Step... (21500 | Loss: 0.19610978662967682, Learning Rate: 0.00017273334378842264, Gradient Norm: 1.212592363357544)
Step... (21525 | Loss: 0.2496843785047531, Learning Rate: 0.0001725818292470649, Gradient Norm: 0.9281882643699646)
Step... (21550 | Loss: 0.22965121269226074, Learning Rate: 0.00017243031470570713, Gradient Norm: 1.514380931854248)
Step... (21575 | Loss: 0.19834180176258087, Learning Rate: 0.00017227880016434938, Gradient Norm: 0.9460052847862244)
Step... (21600 | Loss: 0.25133609771728516, Learning Rate: 0.00017212728562299162, Gradient Norm: 1.2294440269470215)
Step... (21625 | Loss: 0.21268247067928314, Learning Rate: 0.00017197577108163387, Gradient Norm: 0.9794239401817322)
Step... (21650 | Loss: 0.24812008440494537, Learning Rate: 0.00017182424198836088, Gradient Norm: 1.0234098434448242)
Step... (21675 | Loss: 0.22019407153129578, Learning Rate: 0.00017167274199891835, Gradient Norm: 0.7716074585914612)
Step... (21700 | Loss: 0.20632566511631012, Learning Rate: 0.0001715212274575606, Gradient Norm: 0.9125968217849731)
Step... (21725 | Loss: 0.24668103456497192, Learning Rate: 0.00017136969836428761, Gradient Norm: 0.8026633262634277)

Training...:  56% 7844/13907 [5:01:31<3:01:32,  1.80s/it][A
Training...:  56% 7845/13907 [5:01:32<2:53:07,  1.71s/it][A
Training...:  56% 7846/13907 [5:01:34<2:44:00,  1.62s/it][A
Training...:  56% 7847/13907 [5:01:35<2:36:31,  1.55s/it][A
Training...:  56% 7848/13907 [5:01:36<2:28:43,  1.47s/it][A
Training...:  56% 7849/13907 [5:01:38<2:20:52,  1.40s/it][A
Training...:  56% 7850/13907 [5:01:39<2:10:46,  1.30s/it][A
Training...:  56% 7851/13907 [5:01:42<3:26:32,  2.05s/it][A
Training...:  56% 7852/13907 [5:01:46<4:10:30,  2.48s/it][A
Training...:  56% 7853/13907 [5:01:49<4:34:20,  2.72s/it][A
Training...:  56% 7854/13907 [5:01:52<4:46:16,  2.84s/it][A
Training...:  56% 7855/13907 [5:01:55<4:52:57,  2.90s/it][A
Training...:  56% 7856/13907 [5:01:58<4:54:28,  2.92s/it][A
Training...:  56% 7857/13907 [5:02:01<4:54:25,  2.92s/it][A
Training...:  57% 7858/13907 [5:02:04<4:51:55,  2.90s/it][A
Training...:  57% 7859/13907 [5:02:07<4:48:50,  2.87s/it][A
Training...:  57% 7860/13907 [5:02:10<4:43:45,  2.82s/it][A
Training...:  57% 7861/13907 [5:02:12<4:40:15,  2.78s/it][A
Training...:  57% 7862/13907 [5:02:15<4:35:23,  2.73s/it][A
Training...:  57% 7863/13907 [5:02:18<4:32:46,  2.71s/it][A
Training...:  57% 7864/13907 [5:02:20<4:28:34,  2.67s/it][A
Training...:  57% 7865/13907 [5:02:23<4:24:08,  2.62s/it][A
Training...:  57% 7866/13907 [5:02:25<4:19:48,  2.58s/it][A
Training...:  57% 7867/13907 [5:02:28<4:15:41,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:44:42<26:06:17, 31325.86s/it]
Training...:  57% 7867/13907 [5:02:30<4:15:41,  2.54s/it][A
Training...:  57% 7868/13907 [5:02:30<4:23:47,  2.62s/it][A
Training...:  57% 7869/13907 [5:02:33<4:18:02,  2.56s/it][A
Training...:  57% 7870/13907 [5:02:35<4:10:30,  2.49s/it][A
Training...:  57% 7871/13907 [5:02:37<4:04:51,  2.43s/it][A
Training...:  57% 7872/13907 [5:02:40<3:58:57,  2.38s/it][A
Training...:  57% 7873/13907 [5:02:42<3:56:48,  2.35s/it][A
Training...:  57% 7874/13907 [5:02:44<3:53:39,  2.32s/it][A
Training...:  57% 7875/13907 [5:02:46<3:50:38,  2.29s/it][A
Training...:  57% 7876/13907 [5:02:49<3:46:16,  2.25s/it][A
Training...:  57% 7877/13907 [5:02:51<3:41:51,  2.21s/it][A
Training...:  57% 7878/13907 [5:02:53<3:37:52,  2.17s/it][A
Training...:  57% 7879/13907 [5:02:55<3:34:35,  2.14s/it][A
Training...:  57% 7880/13907 [5:02:57<3:30:47,  2.10s/it][A
Training...:  57% 7881/13907 [5:02:59<3:27:38,  2.07s/it][A
Training...:  57% 7882/13907 [5:03:01<3:23:56,  2.03s/it][A
Training...:  57% 7883/13907 [5:03:03<3:20:48,  2.00s/it][A
Training...:  57% 7884/13907 [5:03:05<3:18:07,  1.97s/it][A
Training...:  57% 7885/13907 [5:03:07<3:15:18,  1.95s/it][A
Training...:  57% 7886/13907 [5:03:08<3:11:38,  1.91s/it][A
Training...:  57% 7887/13907 [5:03:10<3:07:56,  1.87s/it][A
Training...:  57% 7888/13907 [5:03:12<3:05:24,  1.85s/it][A
Training...:  57% 7889/13907 [5:03:14<3:03:03,  1.83s/it][A
Training...:  57% 7890/13907 [5:03:15<3:00:11,  1.80s/it][A
Training...:  57% 7891/13907 [5:03:17<2:56:33,  1.76s/it][A
Training...:  57% 7892/13907 [5:03:19<2:53:04,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:45:32<26:06:17, 31325.86s/it]
Training...:  57% 7892/13907 [5:03:21<2:53:04,  1.73s/it][A
Training...:  57% 7893/13907 [5:03:21<2:58:46,  1.78s/it][A
Training...:  57% 7894/13907 [5:03:22<2:53:53,  1.74s/it][A
Training...:  57% 7895/13907 [5:03:24<2:47:34,  1.67s/it][A
Training...:  57% 7896/13907 [5:03:25<2:41:17,  1.61s/it][A
Training...:  57% 7897/13907 [5:03:27<2:35:21,  1.55s/it][A
Training...:  57% 7898/13907 [5:03:28<2:29:52,  1.50s/it][A
Training...:  57% 7899/13907 [5:03:29<2:22:22,  1.42s/it][A
Training...:  57% 7900/13907 [5:03:30<2:12:10,  1.32s/it][A
Training...:  57% 7901/13907 [5:03:34<3:25:31,  2.05s/it][A
Training...:  57% 7902/13907 [5:03:38<4:08:12,  2.48s/it][A
Training...:  57% 7903/13907 [5:03:41<4:34:46,  2.75s/it][A
Training...:  57% 7904/13907 [5:03:44<4:47:22,  2.87s/it][A
Training...:  57% 7905/13907 [5:03:47<4:54:23,  2.94s/it][A
Training...:  57% 7906/13907 [5:03:50<4:55:47,  2.96s/it][A
Training...:  57% 7907/13907 [5:03:53<4:53:33,  2.94s/it][A
Training...:  57% 7908/13907 [5:03:56<4:50:37,  2.91s/it][A
Training...:  57% 7909/13907 [5:03:59<4:46:39,  2.87s/it][A
Training...:  57% 7910/13907 [5:04:01<4:41:07,  2.81s/it][A
Training...:  57% 7911/13907 [5:04:04<4:36:27,  2.77s/it][A
Training...:  57% 7912/13907 [5:04:07<4:32:11,  2.72s/it][A
Training...:  57% 7913/13907 [5:04:09<4:28:04,  2.68s/it][A
Training...:  57% 7914/13907 [5:04:12<4:24:08,  2.64s/it][A
Training...:  57% 7915/13907 [5:04:14<4:19:51,  2.60s/it][A
Training...:  57% 7916/13907 [5:04:17<4:16:19,  2.57s/it][A
Training...:  57% 7917/13907 [5:04:19<4:13:37,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:46:33<26:06:17, 31325.86s/it]
Training...:  57% 7917/13907 [5:04:22<4:13:37,  2.54s/it][A
Training...:  57% 7918/13907 [5:04:22<4:22:26,  2.63s/it][A
Training...:  57% 7919/13907 [5:04:25<4:16:49,  2.57s/it][A
Training...:  57% 7920/13907 [5:04:27<4:09:40,  2.50s/it][A
Training...:  57% 7921/13907 [5:04:29<4:04:31,  2.45s/it][A
Training...:  57% 7922/13907 [5:04:32<3:58:54,  2.40s/it][A
Training...:  57% 7923/13907 [5:04:34<3:53:39,  2.34s/it][A
Training...:  57% 7924/13907 [5:04:36<3:49:08,  2.30s/it][A
Training...:  57% 7925/13907 [5:04:38<3:44:49,  2.25s/it][A
Training...:  57% 7926/13907 [5:04:40<3:41:25,  2.22s/it][A
Training...:  57% 7927/13907 [5:04:42<3:37:58,  2.19s/it][A
Training...:  57% 7928/13907 [5:04:44<3:34:53,  2.16s/it][A
Training...:  57% 7929/13907 [5:04:47<3:31:54,  2.13s/it][A
Training...:  57% 7930/13907 [5:04:49<3:28:18,  2.09s/it][A
Training...:  57% 7931/13907 [5:04:51<3:25:13,  2.06s/it][A
Training...:  57% 7932/13907 [5:04:53<3:22:15,  2.03s/it][A
Training...:  57% 7933/13907 [5:04:54<3:19:23,  2.00s/it][A
Training...:  57% 7934/13907 [5:04:56<3:16:13,  1.97s/it][A
Training...:  57% 7935/13907 [5:04:58<3:13:30,  1.94s/it][A
Training...:  57% 7936/13907 [5:05:00<3:11:09,  1.92s/it][A
Training...:  57% 7937/13907 [5:05:02<3:09:17,  1.90s/it][A
Training...:  57% 7938/13907 [5:05:04<3:05:59,  1.87s/it][A
Training...:  57% 7939/13907 [5:05:06<3:03:23,  1.84s/it][A
Training...:  57% 7940/13907 [5:05:07<2:59:36,  1.81s/it][A
Training...:  57% 7941/13907 [5:05:09<2:56:30,  1.78s/it][A
Training...:  57% 7942/13907 [5:05:11<2:52:47,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:47:24<26:06:17, 31325.86s/it]
Training...:  57% 7942/13907 [5:05:13<2:52:47,  1.74s/it][A
Training...:  57% 7943/13907 [5:05:13<2:58:18,  1.79s/it][A
Training...:  57% 7944/13907 [5:05:14<2:53:23,  1.74s/it][A
Training...:  57% 7945/13907 [5:05:16<2:46:45,  1.68s/it][A
Training...:  57% 7946/13907 [5:05:17<2:40:32,  1.62s/it][A
Training...:  57% 7947/13907 [5:05:19<2:34:21,  1.55s/it][A
Training...:  57% 7948/13907 [5:05:20<2:28:35,  1.50s/it][A
Training...:  57% 7949/13907 [5:05:21<2:21:11,  1.42s/it][A
Training...:  57% 7950/13907 [5:05:22<2:10:57,  1.32s/it][A
Training...:  57% 7951/13907 [5:05:26<3:22:46,  2.04s/it][A
Training...:  57% 7952/13907 [5:05:29<4:05:33,  2.47s/it][A
Training...:  57% 7953/13907 [5:05:33<4:28:41,  2.71s/it][A
Training...:  57% 7954/13907 [5:05:36<4:40:37,  2.83s/it][A
Training...:  57% 7955/13907 [5:05:39<4:46:49,  2.89s/it][A
Training...:  57% 7956/13907 [5:05:42<4:48:54,  2.91s/it][A
Training...:  57% 7957/13907 [5:05:45<4:49:15,  2.92s/it][A
Training...:  57% 7958/13907 [5:05:48<4:47:33,  2.90s/it][A
Training...:  57% 7959/13907 [5:05:50<4:44:31,  2.87s/it][A
Training...:  57% 7960/13907 [5:05:53<4:40:44,  2.83s/it][A
Training...:  57% 7961/13907 [5:05:56<4:36:57,  2.79s/it][A
Training...:  57% 7962/13907 [5:05:58<4:31:59,  2.75s/it][A
Training...:  57% 7963/13907 [5:06:01<4:27:32,  2.70s/it][A
Training...:  57% 7964/13907 [5:06:04<4:24:48,  2.67s/it][A
Training...:  57% 7965/13907 [5:06:06<4:20:31,  2.63s/it][A
Training...:  57% 7966/13907 [5:06:09<4:15:39,  2.58s/it][A
Training...:  57% 7967/13907 [5:06:11<4:11:42,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:48:25<26:06:17, 31325.86s/it]
Training...:  57% 7967/13907 [5:06:14<4:11:42,  2.54s/it][A
Training...:  57% 7968/13907 [5:06:14<4:20:51,  2.64s/it][A
Training...:  57% 7969/13907 [5:06:16<4:15:33,  2.58s/it][A
Training...:  57% 7970/13907 [5:06:19<4:09:12,  2.52s/it][A
Training...:  57% 7971/13907 [5:06:21<4:04:25,  2.47s/it][A
Training...:  57% 7972/13907 [5:06:23<3:58:13,  2.41s/it][A
Training...:  57% 7973/13907 [5:06:26<3:54:29,  2.37s/it][A
Training...:  57% 7974/13907 [5:06:28<3:49:32,  2.32s/it][A
Training...:  57% 7975/13907 [5:06:30<3:47:11,  2.30s/it][A
Training...:  57% 7976/13907 [5:06:32<3:43:02,  2.26s/it][A
Training...:  57% 7977/13907 [5:06:34<3:39:51,  2.22s/it][A
Training...:  57% 7978/13907 [5:06:37<3:35:59,  2.19s/it][A
Training...:  57% 7979/13907 [5:06:39<3:33:01,  2.16s/it][A
Training...:  57% 7980/13907 [5:06:41<3:28:46,  2.11s/it][A
Training...:  57% 7981/13907 [5:06:43<3:25:18,  2.08s/it][A
Training...:  57% 7982/13907 [5:06:45<3:21:52,  2.04s/it][A
Training...:  57% 7983/13907 [5:06:47<3:19:21,  2.02s/it][A
Training...:  57% 7984/13907 [5:06:49<3:15:50,  1.98s/it][A
Training...:  57% 7985/13907 [5:06:50<3:13:03,  1.96s/it][A
Training...:  57% 7986/13907 [5:06:52<3:10:12,  1.93s/it][A
Training...:  57% 7987/13907 [5:06:54<3:07:08,  1.90s/it][A
Training...:  57% 7988/13907 [5:06:56<3:04:29,  1.87s/it][A
Training...:  57% 7989/13907 [5:06:58<3:01:28,  1.84s/it][A
Training...:  57% 7990/13907 [5:06:59<2:58:16,  1.81s/it][A
Training...:  57% 7991/13907 [5:07:01<2:55:11,  1.78s/it][A
Training...:  57% 7992/13907 [5:07:03<2:51:28,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:49:16<26:06:17, 31325.86s/it]
Training...:  57% 7992/13907 [5:07:05<2:51:28,  1.74s/it][A
Training...:  57% 7993/13907 [5:07:05<2:58:03,  1.81s/it][A
Training...:  57% 7994/13907 [5:07:06<2:52:22,  1.75s/it][A
Training...:  57% 7995/13907 [5:07:08<2:45:09,  1.68s/it][A
Training...:  57% 7996/13907 [5:07:09<2:38:45,  1.61s/it][A
Training...:  58% 7997/13907 [5:07:11<2:32:36,  1.55s/it][A
Training...:  58% 7998/13907 [5:07:12<2:26:29,  1.49s/it][A
Training...:  58% 7999/13907 [5:07:13<2:19:13,  1.41s/it][A
Training...:  58% 8000/13907 [5:07:14<2:09:27,  1.31s/it][A
Training...:  58% 8001/13907 [5:07:18<3:24:12,  2.07s/it][A
Training...:  58% 8002/13907 [5:07:22<4:06:21,  2.50s/it][A
Training...:  58% 8003/13907 [5:07:25<4:30:50,  2.75s/it][A
Training...:  58% 8004/13907 [5:07:28<4:43:05,  2.88s/it][A
Training...:  58% 8005/13907 [5:07:31<4:49:04,  2.94s/it][A
Training...:  58% 8006/13907 [5:07:34<4:49:38,  2.94s/it][A
Training...:  58% 8007/13907 [5:07:37<4:48:12,  2.93s/it][A
Training...:  58% 8008/13907 [5:07:40<4:45:03,  2.90s/it][A
Training...:  58% 8009/13907 [5:07:43<4:41:14,  2.86s/it][A
Training...:  58% 8010/13907 [5:07:46<4:37:45,  2.83s/it][A
Training...:  58% 8011/13907 [5:07:48<4:34:07,  2.79s/it][A
Training...:  58% 8012/13907 [5:07:51<4:30:06,  2.75s/it][A
Training...:  58% 8013/13907 [5:07:53<4:25:35,  2.70s/it][A
Training...:  58% 8014/13907 [5:07:56<4:21:23,  2.66s/it][A
Training...:  58% 8015/13907 [5:07:59<4:17:15,  2.62s/it][A
Training...:  58% 8016/13907 [5:08:01<4:14:03,  2.59s/it][A
Training...:  58% 8017/13907 [5:08:04<4:11:31,  2.56s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:50:18<26:06:17, 31325.86s/it]
Training...:  58% 8017/13907 [5:08:06<4:11:31,  2.56s/it][A
Training...:  58% 8018/13907 [5:08:06<4:19:50,  2.65s/it][A
Training...:  58% 8019/13907 [5:08:09<4:14:15,  2.59s/it][A
Training...:  58% 8020/13907 [5:08:11<4:06:34,  2.51s/it][A
Training...:  58% 8021/13907 [5:08:14<4:00:57,  2.46s/it][A
Training...:  58% 8022/13907 [5:08:16<3:55:11,  2.40s/it][A
Training...:  58% 8023/13907 [5:08:18<3:50:31,  2.35s/it][A
Training...:  58% 8024/13907 [5:08:20<3:46:06,  2.31s/it][A
Training...:  58% 8025/13907 [5:08:22<3:41:48,  2.26s/it][A
Training...:  58% 8026/13907 [5:08:25<3:37:49,  2.22s/it][A
Training...:  58% 8027/13907 [5:08:27<3:36:04,  2.20s/it][A
Training...:  58% 8028/13907 [5:08:29<3:32:00,  2.16s/it][A
Training...:  58% 8029/13907 [5:08:31<3:29:03,  2.13s/it][A
Training...:  58% 8030/13907 [5:08:33<3:25:43,  2.10s/it][A
Training...:  58% 8031/13907 [5:08:35<3:22:54,  2.07s/it][A
Training...:  58% 8032/13907 [5:08:37<3:20:27,  2.05s/it][A
Training...:  58% 8033/13907 [5:08:39<3:16:54,  2.01s/it][A
Training...:  58% 8034/13907 [5:08:41<3:13:07,  1.97s/it][A
Training...:  58% 8035/13907 [5:08:43<3:10:02,  1.94s/it][A
Training...:  58% 8036/13907 [5:08:44<3:06:54,  1.91s/it][A
Training...:  58% 8037/13907 [5:08:46<3:03:49,  1.88s/it][A
Training...:  58% 8038/13907 [5:08:48<3:01:16,  1.85s/it][A
Training...:  58% 8039/13907 [5:08:50<2:57:50,  1.82s/it][A
Training...:  58% 8040/13907 [5:08:51<2:54:55,  1.79s/it][A
Training...:  58% 8041/13907 [5:08:53<2:50:54,  1.75s/it][A
Training...:  58% 8042/13907 [5:08:55<2:46:27,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:51:08<26:06:17, 31325.86s/it]
Training...:  58% 8042/13907 [5:08:57<2:46:27,  1.70s/it][A
Training...:  58% 8043/13907 [5:08:57<2:51:35,  1.76s/it][A
Training...:  58% 8044/13907 [5:08:58<2:46:58,  1.71s/it][A
Training...:  58% 8045/13907 [5:09:00<2:39:34,  1.63s/it][A
Training...:  58% 8046/13907 [5:09:01<2:32:52,  1.57s/it][A
Training...:  58% 8047/13907 [5:09:02<2:26:35,  1.50s/it][A
Training...:  58% 8048/13907 [5:09:04<2:20:43,  1.44s/it][A
Training...:  58% 8049/13907 [5:09:05<2:13:21,  1.37s/it][A
Training...:  58% 8050/13907 [5:09:06<2:03:44,  1.27s/it][A
Training...:  58% 8051/13907 [5:09:10<3:12:59,  1.98s/it][A
Training...:  58% 8052/13907 [5:09:13<3:56:28,  2.42s/it][A
Training...:  58% 8053/13907 [5:09:16<4:20:28,  2.67s/it][A
Training...:  58% 8054/13907 [5:09:19<4:34:20,  2.81s/it][A
Training...:  58% 8055/13907 [5:09:22<4:39:49,  2.87s/it][A
Training...:  58% 8056/13907 [5:09:25<4:42:31,  2.90s/it][A
Training...:  58% 8057/13907 [5:09:28<4:42:08,  2.89s/it][A
Training...:  58% 8058/13907 [5:09:31<4:39:56,  2.87s/it][A
Training...:  58% 8059/13907 [5:09:34<4:35:43,  2.83s/it][A
Training...:  58% 8060/13907 [5:09:36<4:31:15,  2.78s/it][A
Training...:  58% 8061/13907 [5:09:39<4:27:39,  2.75s/it][A
Training...:  58% 8062/13907 [5:09:42<4:23:03,  2.70s/it][A
Training...:  58% 8063/13907 [5:09:44<4:18:22,  2.65s/it][A
Training...:  58% 8064/13907 [5:09:47<4:14:11,  2.61s/it][A
Training...:  58% 8065/13907 [5:09:49<4:10:39,  2.57s/it][A
Training...:  58% 8066/13907 [5:09:52<4:07:12,  2.54s/it][A
Training...:  58% 8067/13907 [5:09:54<4:04:26,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:52:08<26:06:17, 31325.86s/it]
Training...:  58% 8067/13907 [5:09:57<4:04:26,  2.51s/it][A
Training...:  58% 8068/13907 [5:09:57<4:13:06,  2.60s/it][A
Training...:  58% 8069/13907 [5:09:59<4:08:17,  2.55s/it][A
Training...:  58% 8070/13907 [5:10:02<4:01:38,  2.48s/it][A
Training...:  58% 8071/13907 [5:10:04<3:56:40,  2.43s/it][A
Training...:  58% 8072/13907 [5:10:06<3:51:15,  2.38s/it][A
Training...:  58% 8073/13907 [5:10:09<3:47:38,  2.34s/it][A
Training...:  58% 8074/13907 [5:10:11<3:43:12,  2.30s/it][A
Training...:  58% 8075/13907 [5:10:13<3:41:30,  2.28s/it][A
Training...:  58% 8076/13907 [5:10:15<3:38:11,  2.25s/it][A
Training...:  58% 8077/13907 [5:10:17<3:34:27,  2.21s/it][A
Training...:  58% 8078/13907 [5:10:19<3:31:03,  2.17s/it][A
Training...:  58% 8079/13907 [5:10:21<3:27:43,  2.14s/it][A
Training...:  58% 8080/13907 [5:10:23<3:24:11,  2.10s/it][A
Training...:  58% 8081/13907 [5:10:25<3:21:07,  2.07s/it][A
Training...:  58% 8082/13907 [5:10:27<3:18:08,  2.04s/it][A
Training...:  58% 8083/13907 [5:10:29<3:15:48,  2.02s/it][A
Training...:  58% 8084/13907 [5:10:31<3:12:48,  1.99s/it][A
Training...:  58% 8085/13907 [5:10:33<3:10:10,  1.96s/it][A
Training...:  58% 8086/13907 [5:10:35<3:07:05,  1.93s/it][A
Training...:  58% 8087/13907 [5:10:37<3:04:00,  1.90s/it][A
Training...:  58% 8088/13907 [5:10:39<3:01:48,  1.87s/it][A
Training...:  58% 8089/13907 [5:10:40<2:58:28,  1.84s/it][A
Training...:  58% 8090/13907 [5:10:42<2:54:25,  1.80s/it][A
Training...:  58% 8091/13907 [5:10:44<2:50:50,  1.76s/it][A
Training...:  58% 8092/13907 [5:10:45<2:47:18,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:52:59<26:06:17, 31325.86s/it]
Training...:  58% 8092/13907 [5:10:47<2:47:18,  1.73s/it][A
Training...:  58% 8093/13907 [5:10:47<2:52:43,  1.78s/it][A
Training...:  58% 8094/13907 [5:10:49<2:47:36,  1.73s/it][A
Training...:  58% 8095/13907 [5:10:50<2:41:03,  1.66s/it][A
Training...:  58% 8096/13907 [5:10:52<2:34:15,  1.59s/it][A
Training...:  58% 8097/13907 [5:10:53<2:28:16,  1.53s/it][A
Training...:  58% 8098/13907 [5:10:55<2:22:02,  1.47s/it][A
Training...:  58% 8099/13907 [5:10:56<2:15:23,  1.40s/it][A
Training...:  58% 8100/13907 [5:10:57<2:06:06,  1.30s/it][A
Training...:  58% 8101/13907 [5:11:01<3:16:54,  2.03s/it][A
Training...:  58% 8102/13907 [5:11:04<3:58:58,  2.47s/it][A
Training...:  58% 8103/13907 [5:11:07<4:22:54,  2.72s/it][A
Training...:  58% 8104/13907 [5:11:11<4:34:50,  2.84s/it][A
Training...:  58% 8105/13907 [5:11:14<4:41:40,  2.91s/it][A
Training...:  58% 8106/13907 [5:11:17<4:42:47,  2.92s/it][A
Training...:  58% 8107/13907 [5:11:20<4:42:14,  2.92s/it][A
Training...:  58% 8108/13907 [5:11:22<4:39:49,  2.90s/it][A
Training...:  58% 8109/13907 [5:11:25<4:37:25,  2.87s/it][A
Training...:  58% 8110/13907 [5:11:28<4:32:57,  2.83s/it][A
Training...:  58% 8111/13907 [5:11:31<4:28:36,  2.78s/it][A
Training...:  58% 8112/13907 [5:11:33<4:22:49,  2.72s/it][A
Training...:  58% 8113/13907 [5:11:36<4:19:10,  2.68s/it][A
Training...:  58% 8114/13907 [5:11:38<4:14:47,  2.64s/it][A
Training...:  58% 8115/13907 [5:11:41<4:10:51,  2.60s/it][A
Training...:  58% 8116/13907 [5:11:43<4:07:11,  2.56s/it][A
Training...:  58% 8117/13907 [5:11:46<4:03:17,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:54:00<26:06:17, 31325.86s/it]
Training...:  58% 8117/13907 [5:11:49<4:03:17,  2.52s/it][A
Training...:  58% 8118/13907 [5:11:49<4:12:17,  2.61s/it][A
Training...:  58% 8119/13907 [5:11:51<4:08:51,  2.58s/it][A
Training...:  58% 8120/13907 [5:11:53<4:02:53,  2.52s/it][A
Training...:  58% 8121/13907 [5:11:56<3:57:44,  2.47s/it][A
Training...:  58% 8122/13907 [5:11:58<3:54:54,  2.44s/it][A
Training...:  58% 8123/13907 [5:12:00<3:50:13,  2.39s/it][A
Training...:  58% 8124/13907 [5:12:03<3:45:58,  2.34s/it][A
Training...:  58% 8125/13907 [5:12:05<3:43:15,  2.32s/it][A
Training...:  58% 8126/13907 [5:12:07<3:38:42,  2.27s/it][A
Training...:  58% 8127/13907 [5:12:09<3:34:00,  2.22s/it][A
Training...:  58% 8128/13907 [5:12:11<3:30:12,  2.18s/it][A
Training...:  58% 8129/13907 [5:12:13<3:26:49,  2.15s/it][A
Training...:  58% 8130/13907 [5:12:15<3:22:42,  2.11s/it][A
Training...:  58% 8131/13907 [5:12:17<3:19:11,  2.07s/it][A
Training...:  58% 8132/13907 [5:12:19<3:15:42,  2.03s/it][A
Training...:  58% 8133/13907 [5:12:21<3:12:16,  2.00s/it][A
Training...:  58% 8134/13907 [5:12:23<3:09:15,  1.97s/it][A
Training...:  58% 8135/13907 [5:12:25<3:06:44,  1.94s/it][A
Training...:  59% 8136/13907 [5:12:27<3:04:04,  1.91s/it][A
Training...:  59% 8137/13907 [5:12:29<3:01:23,  1.89s/it][A
Training...:  59% 8138/13907 [5:12:30<2:58:02,  1.85s/it][A
Training...:  59% 8139/13907 [5:12:32<2:54:52,  1.82s/it][A
Training...:  59% 8140/13907 [5:12:34<2:51:39,  1.79s/it][A
Training...:  59% 8141/13907 [5:12:35<2:48:23,  1.75s/it][A
Training...:  59% 8142/13907 [5:12:37<2:45:02,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:54:50<26:06:17, 31325.86s/it]
Training...:  59% 8142/13907 [5:12:39<2:45:02,  1.72s/it][A
Training...:  59% 8143/13907 [5:12:39<2:50:47,  1.78s/it][A
Training...:  59% 8144/13907 [5:12:41<2:45:54,  1.73s/it][A
Training...:  59% 8145/13907 [5:12:42<2:39:29,  1.66s/it][A
Training...:  59% 8146/13907 [5:12:44<2:33:23,  1.60s/it][A
Training...:  59% 8147/13907 [5:12:45<2:27:33,  1.54s/it][A
Training...:  59% 8148/13907 [5:12:46<2:21:36,  1.48s/it][A
Training...:  59% 8149/13907 [5:12:48<2:14:01,  1.40s/it][A
Training...:  59% 8150/13907 [5:12:49<2:04:00,  1.29s/it][A
Training...:  59% 8151/13907 [5:12:52<3:13:37,  2.02s/it][A
Training...:  59% 8152/13907 [5:12:56<3:57:25,  2.48s/it][A
Training...:  59% 8153/13907 [5:12:59<4:21:34,  2.73s/it][A
Training...:  59% 8154/13907 [5:13:02<4:33:12,  2.85s/it][A
Training...:  59% 8155/13907 [5:13:05<4:40:54,  2.93s/it][A
Training...:  59% 8156/13907 [5:13:08<4:42:46,  2.95s/it][A
Training...:  59% 8157/13907 [5:13:11<4:41:41,  2.94s/it][A
Training...:  59% 8158/13907 [5:13:14<4:39:35,  2.92s/it][A
Training...:  59% 8159/13907 [5:13:17<4:36:00,  2.88s/it][A
Training...:  59% 8160/13907 [5:13:20<4:33:35,  2.86s/it][A
Training...:  59% 8161/13907 [5:13:23<4:31:14,  2.83s/it][A
Training...:  59% 8162/13907 [5:13:25<4:26:02,  2.78s/it][A
Training...:  59% 8163/13907 [5:13:28<4:19:55,  2.72s/it][A
Training...:  59% 8164/13907 [5:13:30<4:14:34,  2.66s/it][A
Training...:  59% 8165/13907 [5:13:33<4:10:09,  2.61s/it][A
Training...:  59% 8166/13907 [5:13:35<4:06:28,  2.58s/it][A
Training...:  59% 8167/13907 [5:13:38<4:02:43,  2.54s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:55:52<26:06:17, 31325.86s/it]
Training...:  59% 8167/13907 [5:13:41<4:02:43,  2.54s/it][A
Training...:  59% 8168/13907 [5:13:41<4:10:56,  2.62s/it][A
Training...:  59% 8169/13907 [5:13:43<4:06:09,  2.57s/it][A
Training...:  59% 8170/13907 [5:13:45<3:59:50,  2.51s/it][A
Training...:  59% 8171/13907 [5:13:48<3:54:40,  2.45s/it][A
Training...:  59% 8172/13907 [5:13:50<3:49:02,  2.40s/it][A
Training...:  59% 8173/13907 [5:13:52<3:44:45,  2.35s/it][A
Training...:  59% 8174/13907 [5:13:54<3:40:26,  2.31s/it][A
Training...:  59% 8175/13907 [5:13:57<3:37:08,  2.27s/it][A
Training...:  59% 8176/13907 [5:13:59<3:33:08,  2.23s/it][A
Training...:  59% 8177/13907 [5:14:01<3:29:52,  2.20s/it][A
Training...:  59% 8178/13907 [5:14:03<3:26:25,  2.16s/it][A
Training...:  59% 8179/13907 [5:14:05<3:23:45,  2.13s/it][A
Training...:  59% 8180/13907 [5:14:07<3:21:05,  2.11s/it][A
Training...:  59% 8181/13907 [5:14:09<3:17:45,  2.07s/it][A
Training...:  59% 8182/13907 [5:14:11<3:15:06,  2.04s/it][A
Training...:  59% 8183/13907 [5:14:13<3:12:09,  2.01s/it][A
Training...:  59% 8184/13907 [5:14:15<3:09:17,  1.98s/it][A
Training...:  59% 8185/13907 [5:14:17<3:06:03,  1.95s/it][A
Training...:  59% 8186/13907 [5:14:19<3:03:11,  1.92s/it][A
Training...:  59% 8187/13907 [5:14:20<3:01:14,  1.90s/it][A
Training...:  59% 8188/13907 [5:14:22<2:57:35,  1.86s/it][A
Training...:  59% 8189/13907 [5:14:24<2:54:19,  1.83s/it][A
Training...:  59% 8190/13907 [5:14:26<2:51:19,  1.80s/it][A
Training...:  59% 8191/13907 [5:14:27<2:48:51,  1.77s/it][A
Training...:  59% 8192/13907 [5:14:29<2:45:01,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:56:42<26:06:17, 31325.86s/it]
Training...:  59% 8192/13907 [5:14:31<2:45:01,  1.73s/it][A
Training...:  59% 8193/13907 [5:14:31<2:51:44,  1.80s/it][A
Training...:  59% 8194/13907 [5:14:33<2:48:38,  1.77s/it][A
Training...:  59% 8195/13907 [5:14:34<2:42:32,  1.71s/it][A
Training...:  59% 8196/13907 [5:14:36<2:35:58,  1.64s/it][A
Training...:  59% 8197/13907 [5:14:37<2:29:26,  1.57s/it][A
Training...:  59% 8198/13907 [5:14:39<2:22:44,  1.50s/it][A
Training...:  59% 8199/13907 [5:14:40<2:15:11,  1.42s/it][A
Training...:  59% 8200/13907 [5:14:41<2:04:27,  1.31s/it][A
Training...:  59% 8201/13907 [5:14:45<3:14:31,  2.05s/it][A
Training...:  59% 8202/13907 [5:14:48<3:54:30,  2.47s/it][A
Training...:  59% 8203/13907 [5:14:51<4:16:43,  2.70s/it][A
Training...:  59% 8204/13907 [5:14:54<4:28:14,  2.82s/it][A
Training...:  59% 8205/13907 [5:14:57<4:34:01,  2.88s/it][A
Training...:  59% 8206/13907 [5:15:00<4:35:15,  2.90s/it][A
Training...:  59% 8207/13907 [5:15:03<4:34:22,  2.89s/it][A
Training...:  59% 8208/13907 [5:15:06<4:32:00,  2.86s/it][A
Training...:  59% 8209/13907 [5:15:09<4:27:57,  2.82s/it][A
Training...:  59% 8210/13907 [5:15:11<4:23:13,  2.77s/it][A
Training...:  59% 8211/13907 [5:15:14<4:19:27,  2.73s/it][A
Training...:  59% 8212/13907 [5:15:17<4:15:37,  2.69s/it][A
Training...:  59% 8213/13907 [5:15:19<4:13:28,  2.67s/it][A
Training...:  59% 8214/13907 [5:15:22<4:09:52,  2.63s/it][A
Training...:  59% 8215/13907 [5:15:24<4:05:44,  2.59s/it][A
Training...:  59% 8216/13907 [5:15:27<4:02:06,  2.55s/it][A
Training...:  59% 8217/13907 [5:15:29<3:59:26,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:57:43<26:06:17, 31325.86s/it]
Training...:  59% 8217/13907 [5:15:32<3:59:26,  2.52s/it][A
Training...:  59% 8218/13907 [5:15:32<4:07:36,  2.61s/it][A
Training...:  59% 8219/13907 [5:15:34<4:03:00,  2.56s/it][A
Training...:  59% 8220/13907 [5:15:37<3:57:15,  2.50s/it][A
Training...:  59% 8221/13907 [5:15:39<3:51:46,  2.45s/it][A
Training...:  59% 8222/13907 [5:15:42<3:48:34,  2.41s/it][A
Training...:  59% 8223/13907 [5:15:44<3:43:27,  2.36s/it][A
Training...:  59% 8224/13907 [5:15:46<3:39:20,  2.32s/it][A
Training...:  59% 8225/13907 [5:15:48<3:35:21,  2.27s/it][A
Training...:  59% 8226/13907 [5:15:50<3:32:21,  2.24s/it][A
Training...:  59% 8227/13907 [5:15:52<3:29:26,  2.21s/it][A
Training...:  59% 8228/13907 [5:15:55<3:25:53,  2.18s/it][A
Training...:  59% 8229/13907 [5:15:57<3:22:49,  2.14s/it][A
Training...:  59% 8230/13907 [5:15:59<3:19:20,  2.11s/it][A
Training...:  59% 8231/13907 [5:16:01<3:16:34,  2.08s/it][A
Training...:  59% 8232/13907 [5:16:03<3:12:22,  2.03s/it][A
Training...:  59% 8233/13907 [5:16:05<3:10:09,  2.01s/it][A
Training...:  59% 8234/13907 [5:16:06<3:06:51,  1.98s/it][A
Training...:  59% 8235/13907 [5:16:08<3:04:07,  1.95s/it][A
Training...:  59% 8236/13907 [5:16:10<3:01:01,  1.92s/it][A
Training...:  59% 8237/13907 [5:16:12<2:58:01,  1.88s/it][A
Training...:  59% 8238/13907 [5:16:14<2:54:41,  1.85s/it][A
Training...:  59% 8239/13907 [5:16:15<2:51:54,  1.82s/it][A
Training...:  59% 8240/13907 [5:16:17<2:48:42,  1.79s/it][A
Training...:  59% 8241/13907 [5:16:19<2:46:04,  1.76s/it][A
Training...:  59% 8242/13907 [5:16:21<2:42:34,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:58:34<26:06:17, 31325.86s/it]
Training...:  59% 8242/13907 [5:16:22<2:42:34,  1.72s/it][A
Training...:  59% 8243/13907 [5:16:22<2:48:29,  1.78s/it][A
Training...:  59% 8244/13907 [5:16:24<2:43:48,  1.74s/it][A
Training...:  59% 8245/13907 [5:16:26<2:37:51,  1.67s/it][A
Training...:  59% 8246/13907 [5:16:27<2:31:16,  1.60s/it][A
Training...:  59% 8247/13907 [5:16:28<2:25:30,  1.54s/it][A
Training...:  59% 8248/13907 [5:16:30<2:19:35,  1.48s/it][A
Training...:  59% 8249/13907 [5:16:31<2:12:55,  1.41s/it][A
Training...:  59% 8250/13907 [5:16:32<2:03:15,  1.31s/it][A
Training...:  59% 8251/13907 [5:16:36<3:11:54,  2.04s/it][A
Training...:  59% 8252/13907 [5:16:39<3:52:22,  2.47s/it][A
Training...:  59% 8253/13907 [5:16:43<4:14:38,  2.70s/it][A
Training...:  59% 8254/13907 [5:16:46<4:25:23,  2.82s/it][A
Training...:  59% 8255/13907 [5:16:49<4:31:10,  2.88s/it][A
Training...:  59% 8256/13907 [5:16:52<4:32:50,  2.90s/it][A
Training...:  59% 8257/13907 [5:16:54<4:32:07,  2.89s/it][A
Training...:  59% 8258/13907 [5:16:57<4:29:57,  2.87s/it][A
Training...:  59% 8259/13907 [5:17:00<4:26:51,  2.83s/it][A
Training...:  59% 8260/13907 [5:17:03<4:23:40,  2.80s/it][A
Training...:  59% 8261/13907 [5:17:05<4:21:36,  2.78s/it][A
Training...:  59% 8262/13907 [5:17:08<4:17:41,  2.74s/it][A
Training...:  59% 8263/13907 [5:17:11<4:12:39,  2.69s/it][A
Training...:  59% 8264/13907 [5:17:13<4:08:08,  2.64s/it][A
Training...:  59% 8265/13907 [5:17:16<4:04:27,  2.60s/it][A
Training...:  59% 8266/13907 [5:17:18<4:00:44,  2.56s/it][A
Training...:  59% 8267/13907 [5:17:21<3:57:01,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [13:59:35<26:06:17, 31325.86s/it]
Training...:  59% 8267/13907 [5:17:23<3:57:01,  2.52s/it][A
Training...:  59% 8268/13907 [5:17:23<4:05:05,  2.61s/it][A
Training...:  59% 8269/13907 [5:17:26<4:00:38,  2.56s/it][A
Training...:  59% 8270/13907 [5:17:28<3:54:45,  2.50s/it][A
Training...:  59% 8271/13907 [5:17:31<3:49:19,  2.44s/it][A
Training...:  59% 8272/13907 [5:17:33<3:44:01,  2.39s/it][A
Training...:  59% 8273/13907 [5:17:35<3:39:39,  2.34s/it][A
Training...:  59% 8274/13907 [5:17:37<3:35:06,  2.29s/it][A
Training...:  60% 8275/13907 [5:17:39<3:31:24,  2.25s/it][A
Training...:  60% 8276/13907 [5:17:42<3:28:11,  2.22s/it][A
Training...:  60% 8277/13907 [5:17:44<3:25:20,  2.19s/it][A
Training...:  60% 8278/13907 [5:17:46<3:21:56,  2.15s/it][A
Training...:  60% 8279/13907 [5:17:48<3:19:47,  2.13s/it][A
Training...:  60% 8280/13907 [5:17:50<3:17:15,  2.10s/it][A
Training...:  60% 8281/13907 [5:17:52<3:14:38,  2.08s/it][A
Training...:  60% 8282/13907 [5:17:54<3:12:16,  2.05s/it][A
Training...:  60% 8283/13907 [5:17:56<3:10:15,  2.03s/it][A
Training...:  60% 8284/13907 [5:17:58<3:06:43,  1.99s/it][A
Training...:  60% 8285/13907 [5:18:00<3:04:36,  1.97s/it][A
Training...:  60% 8286/13907 [5:18:01<3:01:31,  1.94s/it][A
Training...:  60% 8287/13907 [5:18:03<2:58:49,  1.91s/it][A
Training...:  60% 8288/13907 [5:18:05<2:56:20,  1.88s/it][A
Training...:  60% 8289/13907 [5:18:07<2:53:54,  1.86s/it][A
Training...:  60% 8290/13907 [5:18:09<2:50:57,  1.83s/it][A
Training...:  60% 8291/13907 [5:18:10<2:47:41,  1.79s/it][A
Training...:  60% 8292/13907 [5:18:12<2:43:32,  1.75s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:00:25<26:06:17, 31325.86s/it]
Training...:  60% 8292/13907 [5:18:14<2:43:32,  1.75s/it][A
Training...:  60% 8293/13907 [5:18:14<2:48:33,  1.80s/it][A
Training...:  60% 8294/13907 [5:18:16<2:43:50,  1.75s/it][A
Training...:  60% 8295/13907 [5:18:17<2:36:59,  1.68s/it][A
Training...:  60% 8296/13907 [5:18:19<2:31:08,  1.62s/it][A
Training...:  60% 8297/13907 [5:18:20<2:24:59,  1.55s/it][A
Training...:  60% 8298/13907 [5:18:21<2:18:59,  1.49s/it][A
Training...:  60% 8299/13907 [5:18:23<2:12:12,  1.41s/it][A
Training...:  60% 8300/13907 [5:18:24<2:02:51,  1.31s/it][A
Training...:  60% 8301/13907 [5:18:27<3:12:22,  2.06s/it][A
Training...:  60% 8302/13907 [5:18:31<3:52:52,  2.49s/it][A
Training...:  60% 8303/13907 [5:18:34<4:15:23,  2.73s/it][A
Training...:  60% 8304/13907 [5:18:37<4:27:11,  2.86s/it][A
Training...:  60% 8305/13907 [5:18:41<4:33:29,  2.93s/it][A
Training...:  60% 8306/13907 [5:18:43<4:34:15,  2.94s/it][A
Training...:  60% 8307/13907 [5:18:46<4:33:45,  2.93s/it][A
Training...:  60% 8308/13907 [5:18:49<4:31:32,  2.91s/it][A
Training...:  60% 8309/13907 [5:18:52<4:28:19,  2.88s/it][A
Training...:  60% 8310/13907 [5:18:55<4:24:32,  2.84s/it][A
Training...:  60% 8311/13907 [5:18:57<4:21:21,  2.80s/it][A
Training...:  60% 8312/13907 [5:19:00<4:16:00,  2.75s/it][A
Training...:  60% 8313/13907 [5:19:03<4:11:23,  2.70s/it][A
Training...:  60% 8314/13907 [5:19:05<4:06:56,  2.65s/it][A
Training...:  60% 8315/13907 [5:19:08<4:03:40,  2.61s/it][A
Training...:  60% 8316/13907 [5:19:10<4:00:08,  2.58s/it][A
Training...:  60% 8317/13907 [5:19:13<3:59:00,  2.57s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:01:27<26:06:17, 31325.86s/it]
Training...:  60% 8317/13907 [5:19:16<3:59:00,  2.57s/it][A
Training...:  60% 8318/13907 [5:19:16<4:07:09,  2.65s/it][A
Training...:  60% 8319/13907 [5:19:18<4:01:41,  2.60s/it][A
Training...:  60% 8320/13907 [5:19:20<3:54:55,  2.52s/it][A
Training...:  60% 8321/13907 [5:19:23<3:48:46,  2.46s/it][A
Training...:  60% 8322/13907 [5:19:25<3:43:30,  2.40s/it][A
Training...:  60% 8323/13907 [5:19:27<3:38:22,  2.35s/it][A
Training...:  60% 8324/13907 [5:19:29<3:34:47,  2.31s/it][A
Training...:  60% 8325/13907 [5:19:32<3:31:21,  2.27s/it][A
Training...:  60% 8326/13907 [5:19:34<3:27:26,  2.23s/it][A
Training...:  60% 8327/13907 [5:19:36<3:24:25,  2.20s/it][A
Training...:  60% 8328/13907 [5:19:38<3:21:35,  2.17s/it][A
Training...:  60% 8329/13907 [5:19:40<3:18:25,  2.13s/it][A
Training...:  60% 8330/13907 [5:19:42<3:15:14,  2.10s/it][A
Training...:  60% 8331/13907 [5:19:44<3:13:06,  2.08s/it][A
Training...:  60% 8332/13907 [5:19:46<3:10:04,  2.05s/it][A
Training...:  60% 8333/13907 [5:19:48<3:07:03,  2.01s/it][A
Training...:  60% 8334/13907 [5:19:50<3:04:03,  1.98s/it][A
Training...:  60% 8335/13907 [5:19:52<3:01:25,  1.95s/it][A
Training...:  60% 8336/13907 [5:19:54<2:59:01,  1.93s/it][A
Training...:  60% 8337/13907 [5:19:56<2:56:00,  1.90s/it][A
Training...:  60% 8338/13907 [5:19:57<2:53:00,  1.86s/it][A
Training...:  60% 8339/13907 [5:19:59<2:50:13,  1.83s/it][A
Training...:  60% 8340/13907 [5:20:01<2:47:15,  1.80s/it][A
Training...:  60% 8341/13907 [5:20:02<2:43:53,  1.77s/it][A
Training...:  60% 8342/13907 [5:20:04<2:39:50,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:02:17<26:06:17, 31325.86s/it]
Training...:  60% 8342/13907 [5:20:06<2:39:50,  1.72s/it][A
Training...:  60% 8343/13907 [5:20:06<2:44:50,  1.78s/it][A
Training...:  60% 8344/13907 [5:20:08<2:39:56,  1.73s/it][A
Training...:  60% 8345/13907 [5:20:09<2:33:26,  1.66s/it][A
Training...:  60% 8346/13907 [5:20:11<2:27:43,  1.59s/it][A
Training...:  60% 8347/13907 [5:20:12<2:21:36,  1.53s/it][A
Training...:  60% 8348/13907 [5:20:13<2:15:22,  1.46s/it][A
Training...:  60% 8349/13907 [5:20:14<2:09:26,  1.40s/it][A
Training...:  60% 8350/13907 [5:20:16<1:59:43,  1.29s/it][A
Training...:  60% 8351/13907 [5:20:19<3:07:35,  2.03s/it][A
Training...:  60% 8352/13907 [5:20:23<3:48:42,  2.47s/it][A
Training...:  60% 8353/13907 [5:20:26<4:11:04,  2.71s/it][A
Training...:  60% 8354/13907 [5:20:29<4:23:13,  2.84s/it][A
Training...:  60% 8355/13907 [5:20:32<4:28:10,  2.90s/it][A
Training...:  60% 8356/13907 [5:20:35<4:31:20,  2.93s/it][A
Training...:  60% 8357/13907 [5:20:38<4:32:19,  2.94s/it][A
Training...:  60% 8358/13907 [5:20:41<4:28:19,  2.90s/it][A
Training...:  60% 8359/13907 [5:20:44<4:24:11,  2.86s/it][A
Training...:  60% 8360/13907 [5:20:46<4:19:18,  2.80s/it][A
Training...:  60% 8361/13907 [5:20:49<4:14:27,  2.75s/it][A
Training...:  60% 8362/13907 [5:20:52<4:09:52,  2.70s/it][A
Training...:  60% 8363/13907 [5:20:54<4:05:41,  2.66s/it][A
Training...:  60% 8364/13907 [5:20:57<4:01:03,  2.61s/it][A
Training...:  60% 8365/13907 [5:20:59<3:56:49,  2.56s/it][A
Training...:  60% 8366/13907 [5:21:02<3:52:56,  2.52s/it][A
Training...:  60% 8367/13907 [5:21:04<3:48:32,  2.48s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:03:18<26:06:17, 31325.86s/it]
Training...:  60% 8367/13907 [5:21:07<3:48:32,  2.48s/it][A
Training...:  60% 8368/13907 [5:21:07<3:56:42,  2.56s/it][A
Training...:  60% 8369/13907 [5:21:09<3:52:33,  2.52s/it][A
Training...:  60% 8370/13907 [5:21:11<3:46:50,  2.46s/it][A
Training...:  60% 8371/13907 [5:21:14<3:41:29,  2.40s/it][A
Training...:  60% 8372/13907 [5:21:16<3:36:51,  2.35s/it][A
Training...:  60% 8373/13907 [5:21:18<3:33:08,  2.31s/it][A
Training...:  60% 8374/13907 [5:21:20<3:29:33,  2.27s/it][A
Training...:  60% 8375/13907 [5:21:23<3:26:50,  2.24s/it][A
Training...:  60% 8376/13907 [5:21:25<3:23:26,  2.21s/it][A
Training...:  60% 8377/13907 [5:21:27<3:21:14,  2.18s/it][A
Training...:  60% 8378/13907 [5:21:29<3:18:02,  2.15s/it][A
Training...:  60% 8379/13907 [5:21:31<3:14:47,  2.11s/it][A
Training...:  60% 8380/13907 [5:21:33<3:12:22,  2.09s/it][A
Training...:  60% 8381/13907 [5:21:35<3:09:53,  2.06s/it][A
Training...:  60% 8382/13907 [5:21:37<3:07:39,  2.04s/it][A
Training...:  60% 8383/13907 [5:21:39<3:06:03,  2.02s/it][A
Training...:  60% 8384/13907 [5:21:41<3:03:21,  1.99s/it][A
Training...:  60% 8385/13907 [5:21:43<2:59:28,  1.95s/it][A
Training...:  60% 8386/13907 [5:21:44<2:55:46,  1.91s/it][A
Training...:  60% 8387/13907 [5:21:46<2:52:40,  1.88s/it][A
Training...:  60% 8388/13907 [5:21:48<2:49:25,  1.84s/it][A
Training...:  60% 8389/13907 [5:21:50<2:46:17,  1.81s/it][A
Training...:  60% 8390/13907 [5:21:51<2:42:55,  1.77s/it][A
Training...:  60% 8391/13907 [5:21:53<2:39:16,  1.73s/it][A
Training...:  60% 8392/13907 [5:21:55<2:35:31,  1.69s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:04:08<26:06:17, 31325.86s/it]
Training...:  60% 8392/13907 [5:21:57<2:35:31,  1.69s/it][A
Training...:  60% 8393/13907 [5:21:57<2:42:00,  1.76s/it][A
Training...:  60% 8394/13907 [5:21:58<2:37:28,  1.71s/it][A
Training...:  60% 8395/13907 [5:22:00<2:31:16,  1.65s/it][A
Training...:  60% 8396/13907 [5:22:01<2:25:49,  1.59s/it][A
Training...:  60% 8397/13907 [5:22:03<2:20:23,  1.53s/it][A
Training...:  60% 8398/13907 [5:22:04<2:15:44,  1.48s/it][A
Training...:  60% 8399/13907 [5:22:05<2:10:49,  1.43s/it][A
Training...:  60% 8400/13907 [5:22:06<2:01:54,  1.33s/it][A
Training...:  60% 8401/13907 [5:22:10<3:11:26,  2.09s/it][A
Training...:  60% 8402/13907 [5:22:14<3:52:46,  2.54s/it][A
Training...:  60% 8403/13907 [5:22:17<4:11:46,  2.74s/it][A
Training...:  60% 8404/13907 [5:22:20<4:21:37,  2.85s/it][A
Training...:  60% 8405/13907 [5:22:23<4:28:24,  2.93s/it][A
Training...:  60% 8406/13907 [5:22:26<4:29:18,  2.94s/it][A
Training...:  60% 8407/13907 [5:22:29<4:28:00,  2.92s/it][A
Training...:  60% 8408/13907 [5:22:32<4:25:29,  2.90s/it][A
Training...:  60% 8409/13907 [5:22:35<4:22:35,  2.87s/it][A
Training...:  60% 8410/13907 [5:22:37<4:19:29,  2.83s/it][A
Training...:  60% 8411/13907 [5:22:40<4:16:22,  2.80s/it][A
Training...:  60% 8412/13907 [5:22:43<4:15:08,  2.79s/it][A
Training...:  60% 8413/13907 [5:22:46<4:11:53,  2.75s/it][A
Training...:  61% 8414/13907 [5:22:48<4:06:21,  2.69s/it][A
Training...:  61% 8415/13907 [5:22:51<4:01:46,  2.64s/it][A
Training...:  61% 8416/13907 [5:22:53<3:57:30,  2.60s/it][A
Training...:  61% 8417/13907 [5:22:56<3:53:20,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:05:10<26:06:17, 31325.86s/it]
Training...:  61% 8417/13907 [5:22:58<3:53:20,  2.55s/it][A
Training...:  61% 8418/13907 [5:22:58<4:00:42,  2.63s/it][A
Training...:  61% 8419/13907 [5:23:01<3:55:41,  2.58s/it][A
Training...:  61% 8420/13907 [5:23:03<3:49:03,  2.50s/it][A
Training...:  61% 8421/13907 [5:23:06<3:43:59,  2.45s/it][A
Training...:  61% 8422/13907 [5:23:08<3:40:24,  2.41s/it][A
Training...:  61% 8423/13907 [5:23:10<3:35:59,  2.36s/it][A
Training...:  61% 8424/13907 [5:23:12<3:31:27,  2.31s/it][A
Training...:  61% 8425/13907 [5:23:14<3:27:23,  2.27s/it][A
Training...:  61% 8426/13907 [5:23:17<3:24:00,  2.23s/it][A
Training...:  61% 8427/13907 [5:23:19<3:20:56,  2.20s/it][A
Training...:  61% 8428/13907 [5:23:21<3:18:08,  2.17s/it][A
Training...:  61% 8429/13907 [5:23:23<3:15:22,  2.14s/it][A
Training...:  61% 8430/13907 [5:23:25<3:12:06,  2.10s/it][A
Training...:  61% 8431/13907 [5:23:27<3:09:55,  2.08s/it][A
Training...:  61% 8432/13907 [5:23:29<3:06:41,  2.05s/it][A
Training...:  61% 8433/13907 [5:23:31<3:04:30,  2.02s/it][A
Training...:  61% 8434/13907 [5:23:33<3:01:32,  1.99s/it][A
Training...:  61% 8435/13907 [5:23:35<2:58:41,  1.96s/it][A
Training...:  61% 8436/13907 [5:23:37<2:56:22,  1.93s/it][A
Training...:  61% 8437/13907 [5:23:38<2:53:22,  1.90s/it][A
Training...:  61% 8438/13907 [5:23:40<2:50:13,  1.87s/it][A
Training...:  61% 8439/13907 [5:23:42<2:47:04,  1.83s/it][A
Training...:  61% 8440/13907 [5:23:44<2:43:25,  1.79s/it][A
Training...:  61% 8441/13907 [5:23:45<2:40:09,  1.76s/it][A
Training...:  61% 8442/13907 [5:23:47<2:36:31,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:06:00<26:06:17, 31325.86s/it]
Training...:  61% 8442/13907 [5:23:49<2:36:31,  1.72s/it][A
Training...:  61% 8443/13907 [5:23:49<2:41:50,  1.78s/it][A
Training...:  61% 8444/13907 [5:23:50<2:37:01,  1.72s/it][A
Training...:  61% 8445/13907 [5:23:52<2:30:16,  1.65s/it][A
Training...:  61% 8446/13907 [5:23:53<2:23:54,  1.58s/it][A
Training...:  61% 8447/13907 [5:23:55<2:18:48,  1.53s/it][A
Training...:  61% 8448/13907 [5:23:56<2:14:52,  1.48s/it][A
Training...:  61% 8449/13907 [5:23:57<2:09:47,  1.43s/it][A
Training...:  61% 8450/13907 [5:23:59<2:01:47,  1.34s/it][A
Training...:  61% 8451/13907 [5:24:02<3:10:14,  2.09s/it][A
Training...:  61% 8452/13907 [5:24:06<3:54:06,  2.57s/it][A
Training...:  61% 8453/13907 [5:24:09<4:16:03,  2.82s/it][A
Training...:  61% 8454/13907 [5:24:13<4:24:50,  2.91s/it][A
Training...:  61% 8455/13907 [5:24:16<4:28:22,  2.95s/it][A
Training...:  61% 8456/13907 [5:24:19<4:29:17,  2.96s/it][A
Training...:  61% 8457/13907 [5:24:22<4:27:33,  2.95s/it][A
Training...:  61% 8458/13907 [5:24:24<4:24:02,  2.91s/it][A
Training...:  61% 8459/13907 [5:24:27<4:20:22,  2.87s/it][A
Training...:  61% 8460/13907 [5:24:30<4:16:05,  2.82s/it][A
Training...:  61% 8461/13907 [5:24:33<4:12:55,  2.79s/it][A
Training...:  61% 8462/13907 [5:24:35<4:08:51,  2.74s/it][A
Training...:  61% 8463/13907 [5:24:38<4:05:06,  2.70s/it][A
Training...:  61% 8464/13907 [5:24:40<4:00:19,  2.65s/it][A
Training...:  61% 8465/13907 [5:24:43<3:56:18,  2.61s/it][A
Training...:  61% 8466/13907 [5:24:45<3:52:26,  2.56s/it][A
Training...:  61% 8467/13907 [5:24:48<3:48:49,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:07:02<26:06:17, 31325.86s/it]
Training...:  61% 8467/13907 [5:24:51<3:48:49,  2.52s/it][A
Training...:  61% 8468/13907 [5:24:51<3:57:23,  2.62s/it][A
Training...:  61% 8469/13907 [5:24:53<3:53:14,  2.57s/it][A
Training...:  61% 8470/13907 [5:24:55<3:47:04,  2.51s/it][A
Training...:  61% 8471/13907 [5:24:58<3:41:27,  2.44s/it][A
Training...:  61% 8472/13907 [5:25:00<3:35:51,  2.38s/it][A
Training...:  61% 8473/13907 [5:25:02<3:32:12,  2.34s/it][A
Training...:  61% 8474/13907 [5:25:04<3:27:59,  2.30s/it][A
Training...:  61% 8475/13907 [5:25:07<3:25:36,  2.27s/it][A
Training...:  61% 8476/13907 [5:25:09<3:22:31,  2.24s/it][A
Training...:  61% 8477/13907 [5:25:11<3:20:11,  2.21s/it][A
Training...:  61% 8478/13907 [5:25:13<3:17:53,  2.19s/it][A
Training...:  61% 8479/13907 [5:25:15<3:15:21,  2.16s/it][A
Training...:  61% 8480/13907 [5:25:17<3:12:31,  2.13s/it][A
Training...:  61% 8481/13907 [5:25:19<3:08:52,  2.09s/it][A
Training...:  61% 8482/13907 [5:25:21<3:05:06,  2.05s/it][A
Training...:  61% 8483/13907 [5:25:23<3:01:38,  2.01s/it][A
Training...:  61% 8484/13907 [5:25:25<2:58:17,  1.97s/it][A
Training...:  61% 8485/13907 [5:25:27<2:55:32,  1.94s/it][A
Training...:  61% 8486/13907 [5:25:29<2:52:34,  1.91s/it][A
Training...:  61% 8487/13907 [5:25:30<2:50:02,  1.88s/it][A
Training...:  61% 8488/13907 [5:25:32<2:46:42,  1.85s/it][A
Training...:  61% 8489/13907 [5:25:34<2:43:38,  1.81s/it][A
Training...:  61% 8490/13907 [5:25:36<2:40:40,  1.78s/it][A
Training...:  61% 8491/13907 [5:25:37<2:37:59,  1.75s/it][A
Training...:  61% 8492/13907 [5:25:39<2:34:44,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:07:52<26:06:17, 31325.86s/it]
Training...:  61% 8492/13907 [5:25:41<2:34:44,  1.71s/it][A
Training...:  61% 8493/13907 [5:25:41<2:39:58,  1.77s/it][A
Training...:  61% 8494/13907 [5:25:42<2:35:40,  1.73s/it][A
Training...:  61% 8495/13907 [5:25:44<2:30:37,  1.67s/it][A
Training...:  61% 8496/13907 [5:25:45<2:24:53,  1.61s/it][A
Training...:  61% 8497/13907 [5:25:47<2:18:42,  1.54s/it][A
Training...:  61% 8498/13907 [5:25:48<2:13:06,  1.48s/it][A
Training...:  61% 8499/13907 [5:25:49<2:06:07,  1.40s/it][A
Training...:  61% 8500/13907 [5:25:50<1:56:46,  1.30s/it][A
Training...:  61% 8501/13907 [5:25:54<3:01:14,  2.01s/it][A
Training...:  61% 8502/13907 [5:25:58<3:40:21,  2.45s/it][A
Training...:  61% 8503/13907 [5:26:01<4:02:13,  2.69s/it][A
Training...:  61% 8504/13907 [5:26:04<4:13:28,  2.81s/it][A
Training...:  61% 8505/13907 [5:26:07<4:18:46,  2.87s/it][A
Training...:  61% 8506/13907 [5:26:10<4:21:12,  2.90s/it][A
Training...:  61% 8507/13907 [5:26:13<4:19:54,  2.89s/it][A
Training...:  61% 8508/13907 [5:26:16<4:17:34,  2.86s/it][A
Training...:  61% 8509/13907 [5:26:18<4:14:41,  2.83s/it][A
Training...:  61% 8510/13907 [5:26:21<4:10:54,  2.79s/it][A
Training...:  61% 8511/13907 [5:26:24<4:06:45,  2.74s/it][A
Training...:  61% 8512/13907 [5:26:26<4:03:21,  2.71s/it][A
Training...:  61% 8513/13907 [5:26:29<4:01:43,  2.69s/it][A
Training...:  61% 8514/13907 [5:26:32<3:57:33,  2.64s/it][A
Training...:  61% 8515/13907 [5:26:34<3:53:21,  2.60s/it][A
Training...:  61% 8516/13907 [5:26:36<3:49:48,  2.56s/it][A
Training...:  61% 8517/13907 [5:26:39<3:46:18,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:08:53<26:06:17, 31325.86s/it]
Training...:  61% 8517/13907 [5:26:42<3:46:18,  2.52s/it][A
Training...:  61% 8518/13907 [5:26:42<3:54:20,  2.61s/it][A
Training...:  61% 8519/13907 [5:26:44<3:50:06,  2.56s/it][A
Training...:  61% 8520/13907 [5:26:46<3:43:23,  2.49s/it][A
Training...:  61% 8521/13907 [5:26:49<3:38:13,  2.43s/it][A
Training...:  61% 8522/13907 [5:26:51<3:33:14,  2.38s/it][A
Training...:  61% 8523/13907 [5:26:53<3:28:57,  2.33s/it][A
Training...:  61% 8524/13907 [5:26:55<3:25:34,  2.29s/it][A
Training...:  61% 8525/13907 [5:26:58<3:21:51,  2.25s/it][A
Training...:  61% 8526/13907 [5:27:00<3:18:16,  2.21s/it][A
Training...:  61% 8527/13907 [5:27:02<3:15:28,  2.18s/it][A
Training...:  61% 8528/13907 [5:27:04<3:12:17,  2.14s/it][A
Training...:  61% 8529/13907 [5:27:06<3:10:22,  2.12s/it][A
Training...:  61% 8530/13907 [5:27:08<3:06:47,  2.08s/it][A
Training...:  61% 8531/13907 [5:27:10<3:03:58,  2.05s/it][A
Training...:  61% 8532/13907 [5:27:12<3:01:07,  2.02s/it][A
Training...:  61% 8533/13907 [5:27:14<2:58:29,  1.99s/it][A
Training...:  61% 8534/13907 [5:27:16<2:55:44,  1.96s/it][A
Training...:  61% 8535/13907 [5:27:18<2:53:00,  1.93s/it][A
Training...:  61% 8536/13907 [5:27:19<2:50:03,  1.90s/it][A
Training...:  61% 8537/13907 [5:27:21<2:47:55,  1.88s/it][A
Training...:  61% 8538/13907 [5:27:23<2:44:58,  1.84s/it][A
Training...:  61% 8539/13907 [5:27:25<2:41:40,  1.81s/it][A
Training...:  61% 8540/13907 [5:27:26<2:38:53,  1.78s/it][A
Training...:  61% 8541/13907 [5:27:28<2:35:37,  1.74s/it][A
Training...:  61% 8542/13907 [5:27:30<2:32:32,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:09:43<26:06:17, 31325.86s/it]
Training...:  61% 8542/13907 [5:27:32<2:32:32,  1.71s/it][A
Training...:  61% 8543/13907 [5:27:32<2:37:19,  1.76s/it][A
Training...:  61% 8544/13907 [5:27:33<2:33:29,  1.72s/it][A
Training...:  61% 8545/13907 [5:27:35<2:27:48,  1.65s/it][A
Training...:  61% 8546/13907 [5:27:36<2:21:28,  1.58s/it][A
Training...:  61% 8547/13907 [5:27:37<2:15:43,  1.52s/it][A
Training...:  61% 8548/13907 [5:27:39<2:09:13,  1.45s/it][A
Training...:  61% 8549/13907 [5:27:40<2:02:36,  1.37s/it][A
Training...:  61% 8550/13907 [5:27:41<1:53:09,  1.27s/it][A
Training...:  61% 8551/13907 [5:27:45<3:01:01,  2.03s/it][A
Training...:  61% 8552/13907 [5:27:48<3:40:32,  2.47s/it][A
Training...:  62% 8553/13907 [5:27:52<4:02:46,  2.72s/it][A
Training...:  62% 8554/13907 [5:27:55<4:17:32,  2.89s/it][A
Training...:  62% 8555/13907 [5:27:58<4:25:34,  2.98s/it][A
Training...:  62% 8556/13907 [5:28:01<4:25:44,  2.98s/it][A
Training...:  62% 8557/13907 [5:28:04<4:24:25,  2.97s/it][A
Training...:  62% 8558/13907 [5:28:07<4:21:18,  2.93s/it][A
Training...:  62% 8559/13907 [5:28:10<4:17:56,  2.89s/it][A
Training...:  62% 8560/13907 [5:28:12<4:14:07,  2.85s/it][A
Training...:  62% 8561/13907 [5:28:15<4:10:18,  2.81s/it][A
Training...:  62% 8562/13907 [5:28:18<4:05:36,  2.76s/it][A
Training...:  62% 8563/13907 [5:28:20<4:02:27,  2.72s/it][A
Training...:  62% 8564/13907 [5:28:23<3:57:57,  2.67s/it][A
Training...:  62% 8565/13907 [5:28:25<3:53:56,  2.63s/it][A
Training...:  62% 8566/13907 [5:28:28<3:49:55,  2.58s/it][A
Training...:  62% 8567/13907 [5:28:30<3:46:42,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:10:44<26:06:17, 31325.86s/it]
Training...:  62% 8567/13907 [5:28:33<3:46:42,  2.55s/it][A
Training...:  62% 8568/13907 [5:28:33<3:53:23,  2.62s/it][A
Training...:  62% 8569/13907 [5:28:36<3:49:18,  2.58s/it][A
Training...:  62% 8570/13907 [5:28:38<3:45:28,  2.53s/it][A
Training...:  62% 8571/13907 [5:28:40<3:40:23,  2.48s/it][A
Training...:  62% 8572/13907 [5:28:43<3:36:42,  2.44s/it][A
Training...:  62% 8573/13907 [5:28:45<3:32:24,  2.39s/it][A
Training...:  62% 8574/13907 [5:28:47<3:27:53,  2.34s/it][A
Training...:  62% 8575/13907 [5:28:49<3:24:06,  2.30s/it][A
Training...:  62% 8576/13907 [5:28:52<3:21:10,  2.26s/it][A
Training...:  62% 8577/13907 [5:28:54<3:17:41,  2.23s/it][A
Training...:  62% 8578/13907 [5:28:56<3:14:08,  2.19s/it][A
Training...:  62% 8579/13907 [5:28:58<3:10:48,  2.15s/it][A
Training...:  62% 8580/13907 [5:29:00<3:08:41,  2.13s/it][A
Training...:  62% 8581/13907 [5:29:02<3:07:10,  2.11s/it][A
Training...:  62% 8582/13907 [5:29:04<3:05:06,  2.09s/it][A
Training...:  62% 8583/13907 [5:29:06<3:02:33,  2.06s/it][A
Training...:  62% 8584/13907 [5:29:08<2:59:07,  2.02s/it][A
Training...:  62% 8585/13907 [5:29:10<2:55:51,  1.98s/it][A
Training...:  62% 8586/13907 [5:29:12<2:52:54,  1.95s/it][A
Training...:  62% 8587/13907 [5:29:14<2:49:57,  1.92s/it][A
Training...:  62% 8588/13907 [5:29:15<2:46:45,  1.88s/it][A
Training...:  62% 8589/13907 [5:29:17<2:44:57,  1.86s/it][A
Training...:  62% 8590/13907 [5:29:19<2:41:45,  1.83s/it][A
Training...:  62% 8591/13907 [5:29:21<2:38:17,  1.79s/it][A
Training...:  62% 8592/13907 [5:29:22<2:34:29,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:11:36<26:06:17, 31325.86s/it]
Training...:  62% 8592/13907 [5:29:24<2:34:29,  1.74s/it][A
Training...:  62% 8593/13907 [5:29:24<2:39:47,  1.80s/it][A
Training...:  62% 8594/13907 [5:29:26<2:35:30,  1.76s/it][A
Training...:  62% 8595/13907 [5:29:27<2:28:45,  1.68s/it][A
Training...:  62% 8596/13907 [5:29:29<2:21:53,  1.60s/it][A
Training...:  62% 8597/13907 [5:29:30<2:15:22,  1.53s/it][A
Training...:  62% 8598/13907 [5:29:32<2:09:17,  1.46s/it][A
Training...:  62% 8599/13907 [5:29:33<2:02:41,  1.39s/it][A
Training...:  62% 8600/13907 [5:29:34<1:53:13,  1.28s/it][A
Training...:  62% 8601/13907 [5:29:38<2:59:29,  2.03s/it][A
Training...:  62% 8602/13907 [5:29:41<3:36:59,  2.45s/it][A
Training...:  62% 8603/13907 [5:29:44<3:58:30,  2.70s/it][A
Training...:  62% 8604/13907 [5:29:47<4:09:23,  2.82s/it][A
Training...:  62% 8605/13907 [5:29:50<4:15:38,  2.89s/it][A
Training...:  62% 8606/13907 [5:29:53<4:16:58,  2.91s/it][A
Training...:  62% 8607/13907 [5:29:56<4:16:42,  2.91s/it][A
Training...:  62% 8608/13907 [5:29:59<4:14:21,  2.88s/it][A
Training...:  62% 8609/13907 [5:30:02<4:12:09,  2.86s/it][A
Training...:  62% 8610/13907 [5:30:05<4:08:53,  2.82s/it][A
Training...:  62% 8611/13907 [5:30:07<4:05:41,  2.78s/it][A
Training...:  62% 8612/13907 [5:30:10<4:01:23,  2.74s/it][A
Training...:  62% 8613/13907 [5:30:13<3:57:50,  2.70s/it][A
Training...:  62% 8614/13907 [5:30:15<3:53:49,  2.65s/it][A
Training...:  62% 8615/13907 [5:30:18<3:50:11,  2.61s/it][A
Training...:  62% 8616/13907 [5:30:20<3:46:54,  2.57s/it][A
Training...:  62% 8617/13907 [5:30:23<3:44:55,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:12:37<26:06:17, 31325.86s/it]
Training...:  62% 8617/13907 [5:30:25<3:44:55,  2.55s/it][A
Training...:  62% 8618/13907 [5:30:25<3:53:22,  2.65s/it][A
Training...:  62% 8619/13907 [5:30:28<3:48:38,  2.59s/it][A
Training...:  62% 8620/13907 [5:30:30<3:42:05,  2.52s/it][A
Training...:  62% 8621/13907 [5:30:33<3:36:12,  2.45s/it][A
Training...:  62% 8622/13907 [5:30:35<3:31:50,  2.41s/it][A
Training...:  62% 8623/13907 [5:30:37<3:27:45,  2.36s/it][A
Training...:  62% 8624/13907 [5:30:39<3:24:43,  2.33s/it][A
Training...:  62% 8625/13907 [5:30:42<3:21:37,  2.29s/it][A
Training...:  62% 8626/13907 [5:30:44<3:18:10,  2.25s/it][A
Training...:  62% 8627/13907 [5:30:46<3:15:15,  2.22s/it][A
Training...:  62% 8628/13907 [5:30:48<3:11:43,  2.18s/it][A
Training...:  62% 8629/13907 [5:30:50<3:08:49,  2.15s/it][A
Training...:  62% 8630/13907 [5:30:52<3:05:17,  2.11s/it][A
Training...:  62% 8631/13907 [5:30:54<3:02:50,  2.08s/it][A
Training...:  62% 8632/13907 [5:30:56<2:59:41,  2.04s/it][A
Training...:  62% 8633/13907 [5:30:58<2:57:08,  2.02s/it][A
Training...:  62% 8634/13907 [5:31:00<2:54:10,  1.98s/it][A
Training...:  62% 8635/13907 [5:31:02<2:51:41,  1.95s/it][A
Training...:  62% 8636/13907 [5:31:04<2:49:05,  1.92s/it][A
Training...:  62% 8637/13907 [5:31:06<2:47:20,  1.91s/it][A
Training...:  62% 8638/13907 [5:31:07<2:44:05,  1.87s/it][A
Training...:  62% 8639/13907 [5:31:09<2:41:26,  1.84s/it][A
Training...:  62% 8640/13907 [5:31:11<2:38:30,  1.81s/it][A
Training...:  62% 8641/13907 [5:31:12<2:35:12,  1.77s/it][A
Training...:  62% 8642/13907 [5:31:14<2:31:37,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:13:27<26:06:17, 31325.86s/it]
Training...:  62% 8642/13907 [5:31:16<2:31:37,  1.73s/it][A
Training...:  62% 8643/13907 [5:31:16<2:35:42,  1.77s/it][A
Training...:  62% 8644/13907 [5:31:18<2:31:05,  1.72s/it][A
Training...:  62% 8645/13907 [5:31:19<2:24:59,  1.65s/it][A
Training...:  62% 8646/13907 [5:31:21<2:18:54,  1.58s/it][A
Training...:  62% 8647/13907 [5:31:22<2:13:46,  1.53s/it][A
Training...:  62% 8648/13907 [5:31:23<2:07:54,  1.46s/it][A
Training...:  62% 8649/13907 [5:31:24<2:02:00,  1.39s/it][A
Training...:  62% 8650/13907 [5:31:25<1:52:34,  1.28s/it][A
Training...:  62% 8651/13907 [5:31:29<2:56:06,  2.01s/it][A
Training...:  62% 8652/13907 [5:31:33<3:36:58,  2.48s/it][A
Training...:  62% 8653/13907 [5:31:36<4:01:48,  2.76s/it][A
Training...:  62% 8654/13907 [5:31:39<4:15:07,  2.91s/it][A
Training...:  62% 8655/13907 [5:31:43<4:21:40,  2.99s/it][A
Training...:  62% 8656/13907 [5:31:46<4:24:01,  3.02s/it][A
Training...:  62% 8657/13907 [5:31:49<4:24:07,  3.02s/it][A
Training...:  62% 8658/13907 [5:31:52<4:21:10,  2.99s/it][A
Training...:  62% 8659/13907 [5:31:54<4:18:08,  2.95s/it][A
Training...:  62% 8660/13907 [5:31:57<4:14:23,  2.91s/it][A
Training...:  62% 8661/13907 [5:32:00<4:11:43,  2.88s/it][A
Training...:  62% 8662/13907 [5:32:03<4:09:01,  2.85s/it][A
Training...:  62% 8663/13907 [5:32:06<4:06:44,  2.82s/it][A
Training...:  62% 8664/13907 [5:32:08<4:01:19,  2.76s/it][A
Training...:  62% 8665/13907 [5:32:11<3:56:25,  2.71s/it][A
Training...:  62% 8666/13907 [5:32:13<3:51:35,  2.65s/it][A
Training...:  62% 8667/13907 [5:32:16<3:47:40,  2.61s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:14:30<26:06:17, 31325.86s/it]
Training...:  62% 8667/13907 [5:32:19<3:47:40,  2.61s/it][A
Training...:  62% 8668/13907 [5:32:19<3:54:46,  2.69s/it][A
Training...:  62% 8669/13907 [5:32:21<3:48:51,  2.62s/it][A
Training...:  62% 8670/13907 [5:32:24<3:41:05,  2.53s/it][A
Training...:  62% 8671/13907 [5:32:26<3:35:12,  2.47s/it][A
Training...:  62% 8672/13907 [5:32:28<3:30:13,  2.41s/it][A
Training...:  62% 8673/13907 [5:32:30<3:25:27,  2.36s/it][A
Training...:  62% 8674/13907 [5:32:33<3:20:59,  2.30s/it][A
Training...:  62% 8675/13907 [5:32:35<3:17:48,  2.27s/it][A
Training...:  62% 8676/13907 [5:32:37<3:14:34,  2.23s/it][A
Training...:  62% 8677/13907 [5:32:39<3:11:42,  2.20s/it][A
Training...:  62% 8678/13907 [5:32:41<3:09:03,  2.17s/it][A
Training...:  62% 8679/13907 [5:32:43<3:06:18,  2.14s/it][A
Training...:  62% 8680/13907 [5:32:45<3:03:38,  2.11s/it][A
Training...:  62% 8681/13907 [5:32:47<3:01:07,  2.08s/it][A
Training...:  62% 8682/13907 [5:32:49<2:58:49,  2.05s/it][A
Training...:  62% 8683/13907 [5:32:51<2:56:00,  2.02s/it][A
Training...:  62% 8684/13907 [5:32:53<2:53:28,  1.99s/it][A
Training...:  62% 8685/13907 [5:32:55<2:51:12,  1.97s/it][A
Training...:  62% 8686/13907 [5:32:57<2:49:18,  1.95s/it][A
Training...:  62% 8687/13907 [5:32:59<2:46:33,  1.91s/it][A
Training...:  62% 8688/13907 [5:33:01<2:43:44,  1.88s/it][A
Training...:  62% 8689/13907 [5:33:02<2:41:12,  1.85s/it][A
Training...:  62% 8690/13907 [5:33:04<2:38:52,  1.83s/it][A
Training...:  62% 8691/13907 [5:33:06<2:36:28,  1.80s/it][A
Training...:  63% 8692/13907 [5:33:07<2:32:46,  1.76s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:15:21<26:06:17, 31325.86s/it]
Training...:  63% 8692/13907 [5:33:09<2:32:46,  1.76s/it][A
Training...:  63% 8693/13907 [5:33:09<2:37:49,  1.82s/it][A
Training...:  63% 8694/13907 [5:33:11<2:32:57,  1.76s/it][A
Training...:  63% 8695/13907 [5:33:13<2:26:59,  1.69s/it][A
Training...:  63% 8696/13907 [5:33:14<2:21:19,  1.63s/it][A
Training...:  63% 8697/13907 [5:33:15<2:15:21,  1.56s/it][A
Training...:  63% 8698/13907 [5:33:17<2:08:41,  1.48s/it][A
Training...:  63% 8699/13907 [5:33:18<2:01:59,  1.41s/it][A
Training...:  63% 8700/13907 [5:33:19<1:53:03,  1.30s/it][A
Training...:  63% 8701/13907 [5:33:23<2:58:39,  2.06s/it][A
Training...:  63% 8702/13907 [5:33:26<3:37:46,  2.51s/it][A
Training...:  63% 8703/13907 [5:33:30<3:59:01,  2.76s/it][A
Training...:  63% 8704/13907 [5:33:33<4:08:45,  2.87s/it][A
Training...:  63% 8705/13907 [5:33:36<4:13:33,  2.92s/it][A
Training...:  63% 8706/13907 [5:33:39<4:13:40,  2.93s/it][A
Training...:  63% 8707/13907 [5:33:42<4:11:39,  2.90s/it][A
Training...:  63% 8708/13907 [5:33:45<4:09:06,  2.87s/it][A
Training...:  63% 8709/13907 [5:33:47<4:06:07,  2.84s/it][A
Training...:  63% 8710/13907 [5:33:50<4:02:32,  2.80s/it][A
Training...:  63% 8711/13907 [5:33:53<3:58:20,  2.75s/it][A
Training...:  63% 8712/13907 [5:33:55<3:54:22,  2.71s/it][A
Training...:  63% 8713/13907 [5:33:58<3:50:27,  2.66s/it][A
Training...:  63% 8714/13907 [5:34:00<3:47:24,  2.63s/it][A
Training...:  63% 8715/13907 [5:34:03<3:43:32,  2.58s/it][A
Training...:  63% 8716/13907 [5:34:05<3:40:58,  2.55s/it][A
Training...:  63% 8717/13907 [5:34:08<3:37:29,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:16:22<26:06:17, 31325.86s/it]
Training...:  63% 8717/13907 [5:34:11<3:37:29,  2.51s/it][A
Training...:  63% 8718/13907 [5:34:11<3:44:46,  2.60s/it][A
Training...:  63% 8719/13907 [5:34:13<3:41:02,  2.56s/it][A
Training...:  63% 8720/13907 [5:34:15<3:35:19,  2.49s/it][A
Training...:  63% 8721/13907 [5:34:18<3:31:34,  2.45s/it][A
Training...:  63% 8722/13907 [5:34:20<3:27:10,  2.40s/it][A
Training...:  63% 8723/13907 [5:34:22<3:22:33,  2.34s/it][A
Training...:  63% 8724/13907 [5:34:24<3:18:38,  2.30s/it][A
Training...:  63% 8725/13907 [5:34:27<3:15:53,  2.27s/it][A
Training...:  63% 8726/13907 [5:34:29<3:13:54,  2.25s/it][A
Training...:  63% 8727/13907 [5:34:31<3:10:42,  2.21s/it][A
Training...:  63% 8728/13907 [5:34:33<3:07:57,  2.18s/it][A
Training...:  63% 8729/13907 [5:34:35<3:04:52,  2.14s/it][A
Training...:  63% 8730/13907 [5:34:37<3:01:27,  2.10s/it][A
Training...:  63% 8731/13907 [5:34:39<2:59:24,  2.08s/it][A
Training...:  63% 8732/13907 [5:34:41<2:56:55,  2.05s/it][A
Training...:  63% 8733/13907 [5:34:43<2:54:39,  2.03s/it][A
Training...:  63% 8734/13907 [5:34:45<2:51:49,  1.99s/it][A
Training...:  63% 8735/13907 [5:34:47<2:49:13,  1.96s/it][A
Training...:  63% 8736/13907 [5:34:49<2:46:32,  1.93s/it][A
Training...:  63% 8737/13907 [5:34:51<2:43:38,  1.90s/it][A
Training...:  63% 8738/13907 [5:34:52<2:40:18,  1.86s/it][A
Training...:  63% 8739/13907 [5:34:54<2:37:16,  1.83s/it][A
Training...:  63% 8740/13907 [5:34:56<2:34:02,  1.79s/it][A
Training...:  63% 8741/13907 [5:34:57<2:31:38,  1.76s/it][A
Training...:  63% 8742/13907 [5:34:59<2:28:18,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:17:12<26:06:17, 31325.86s/it]
Training...:  63% 8742/13907 [5:35:01<2:28:18,  1.72s/it][A
Training...:  63% 8743/13907 [5:35:01<2:33:19,  1.78s/it][A
Training...:  63% 8744/13907 [5:35:03<2:28:50,  1.73s/it][A
Training...:  63% 8745/13907 [5:35:04<2:24:00,  1.67s/it][A
Training...:  63% 8746/13907 [5:35:06<2:18:01,  1.60s/it][A
Training...:  63% 8747/13907 [5:35:07<2:12:44,  1.54s/it][A
Training...:  63% 8748/13907 [5:35:08<2:06:42,  1.47s/it][A
Training...:  63% 8749/13907 [5:35:10<2:00:37,  1.40s/it][A
Training...:  63% 8750/13907 [5:35:11<1:51:13,  1.29s/it][A
Training...:  63% 8751/13907 [5:35:14<2:55:52,  2.05s/it][A
Training...:  63% 8752/13907 [5:35:18<3:33:30,  2.48s/it][A
Training...:  63% 8753/13907 [5:35:21<3:55:30,  2.74s/it][A
Training...:  63% 8754/13907 [5:35:24<4:06:00,  2.86s/it][A
Training...:  63% 8755/13907 [5:35:27<4:11:21,  2.93s/it][A
Training...:  63% 8756/13907 [5:35:30<4:12:18,  2.94s/it][A
Training...:  63% 8757/13907 [5:35:33<4:11:28,  2.93s/it][A
Training...:  63% 8758/13907 [5:35:36<4:09:06,  2.90s/it][A
Training...:  63% 8759/13907 [5:35:39<4:06:25,  2.87s/it][A
Training...:  63% 8760/13907 [5:35:42<4:03:14,  2.84s/it][A
Training...:  63% 8761/13907 [5:35:44<3:58:59,  2.79s/it][A
Training...:  63% 8762/13907 [5:35:47<3:54:21,  2.73s/it][A
Training...:  63% 8763/13907 [5:35:50<3:50:51,  2.69s/it][A
Training...:  63% 8764/13907 [5:35:52<3:47:29,  2.65s/it][A
Training...:  63% 8765/13907 [5:35:55<3:43:35,  2.61s/it][A
Training...:  63% 8766/13907 [5:35:57<3:39:43,  2.56s/it][A
Training...:  63% 8767/13907 [5:36:00<3:36:40,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:18:14<26:06:17, 31325.86s/it]
Training...:  63% 8767/13907 [5:36:02<3:36:40,  2.53s/it][A
Training...:  63% 8768/13907 [5:36:02<3:44:11,  2.62s/it][A
Training...:  63% 8769/13907 [5:36:05<3:40:08,  2.57s/it][A
Training...:  63% 8770/13907 [5:36:07<3:34:17,  2.50s/it][A
Training...:  63% 8771/13907 [5:36:10<3:29:30,  2.45s/it][A
Training...:  63% 8772/13907 [5:36:12<3:24:20,  2.39s/it][A
Training...:  63% 8773/13907 [5:36:14<3:20:30,  2.34s/it][A
Training...:  63% 8774/13907 [5:36:16<3:16:37,  2.30s/it][A
Training...:  63% 8775/13907 [5:36:18<3:13:24,  2.26s/it][A
Training...:  63% 8776/13907 [5:36:21<3:10:50,  2.23s/it][A
Training...:  63% 8777/13907 [5:36:23<3:08:19,  2.20s/it][A
Training...:  63% 8778/13907 [5:36:25<3:05:00,  2.16s/it][A
Training...:  63% 8779/13907 [5:36:27<3:03:24,  2.15s/it][A
Training...:  63% 8780/13907 [5:36:29<3:00:43,  2.12s/it][A
Training...:  63% 8781/13907 [5:36:31<2:58:20,  2.09s/it][A
Training...:  63% 8782/13907 [5:36:33<2:55:33,  2.06s/it][A
Training...:  63% 8783/13907 [5:36:35<2:52:57,  2.03s/it][A
Training...:  63% 8784/13907 [5:36:37<2:50:15,  1.99s/it][A
Training...:  63% 8785/13907 [5:36:39<2:47:41,  1.96s/it][A
Training...:  63% 8786/13907 [5:36:41<2:45:09,  1.94s/it][A
Training...:  63% 8787/13907 [5:36:42<2:42:34,  1.91s/it][A
Training...:  63% 8788/13907 [5:36:44<2:40:15,  1.88s/it][A
Training...:  63% 8789/13907 [5:36:46<2:36:54,  1.84s/it][A
Training...:  63% 8790/13907 [5:36:48<2:33:50,  1.80s/it][A
Training...:  63% 8791/13907 [5:36:49<2:31:07,  1.77s/it][A
Training...:  63% 8792/13907 [5:36:51<2:28:08,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:19:04<26:06:17, 31325.86s/it]
Training...:  63% 8792/13907 [5:36:53<2:28:08,  1.74s/it][A
Training...:  63% 8793/13907 [5:36:53<2:32:38,  1.79s/it][A
Training...:  63% 8794/13907 [5:36:55<2:28:53,  1.75s/it][A
Training...:  63% 8795/13907 [5:36:56<2:23:34,  1.69s/it][A
Training...:  63% 8796/13907 [5:36:58<2:17:20,  1.61s/it][A
Training...:  63% 8797/13907 [5:36:59<2:11:47,  1.55s/it][A
Training...:  63% 8798/13907 [5:37:00<2:06:52,  1.49s/it][A
Training...:  63% 8799/13907 [5:37:02<2:00:43,  1.42s/it][A
Training...:  63% 8800/13907 [5:37:03<1:51:52,  1.31s/it][A
Training...:  63% 8801/13907 [5:37:06<2:53:07,  2.03s/it][A
Training...:  63% 8802/13907 [5:37:10<3:27:18,  2.44s/it][A
Training...:  63% 8803/13907 [5:37:13<3:48:11,  2.68s/it][A
Training...:  63% 8804/13907 [5:37:16<4:00:18,  2.83s/it][A
Training...:  63% 8805/13907 [5:37:19<4:08:40,  2.92s/it][A
Training...:  63% 8806/13907 [5:37:22<4:12:02,  2.96s/it][A
Training...:  63% 8807/13907 [5:37:25<4:11:36,  2.96s/it][A
Training...:  63% 8808/13907 [5:37:28<4:08:56,  2.93s/it][A
Training...:  63% 8809/13907 [5:37:31<4:05:18,  2.89s/it][A
Training...:  63% 8810/13907 [5:37:34<4:01:11,  2.84s/it][A
Training...:  63% 8811/13907 [5:37:36<3:56:26,  2.78s/it][A
Training...:  63% 8812/13907 [5:37:39<3:52:24,  2.74s/it][A
Training...:  63% 8813/13907 [5:37:42<3:48:29,  2.69s/it][A
Training...:  63% 8814/13907 [5:37:44<3:44:09,  2.64s/it][A
Training...:  63% 8815/13907 [5:37:47<3:41:04,  2.60s/it][A
Training...:  63% 8816/13907 [5:37:49<3:37:29,  2.56s/it][A
Training...:  63% 8817/13907 [5:37:52<3:34:13,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:20:06<26:06:17, 31325.86s/it]
Training...:  63% 8817/13907 [5:37:54<3:34:13,  2.53s/it][A
Training...:  63% 8818/13907 [5:37:54<3:41:36,  2.61s/it][A
Training...:  63% 8819/13907 [5:37:57<3:37:30,  2.56s/it][A
Training...:  63% 8820/13907 [5:37:59<3:30:46,  2.49s/it][A
Training...:  63% 8821/13907 [5:38:01<3:25:13,  2.42s/it][A
Training...:  63% 8822/13907 [5:38:04<3:19:58,  2.36s/it][A
Training...:  63% 8823/13907 [5:38:06<3:16:19,  2.32s/it][A
Training...:  63% 8824/13907 [5:38:08<3:12:58,  2.28s/it][A
Training...:  63% 8825/13907 [5:38:10<3:10:00,  2.24s/it][A
Training...:  63% 8826/13907 [5:38:12<3:06:47,  2.21s/it][A
Training...:  63% 8827/13907 [5:38:14<3:04:01,  2.17s/it][A
Training...:  63% 8828/13907 [5:38:16<3:01:02,  2.14s/it][A
Training...:  63% 8829/13907 [5:38:18<2:58:34,  2.11s/it][A
Training...:  63% 8830/13907 [5:38:20<2:56:03,  2.08s/it][A
Training...:  64% 8831/13907 [5:38:22<2:54:19,  2.06s/it][A
Training...:  64% 8832/13907 [5:38:24<2:51:28,  2.03s/it][A
Training...:  64% 8833/13907 [5:38:26<2:48:54,  2.00s/it][A
Training...:  64% 8834/13907 [5:38:28<2:45:59,  1.96s/it][A
Training...:  64% 8835/13907 [5:38:30<2:44:38,  1.95s/it][A
Training...:  64% 8836/13907 [5:38:32<2:41:52,  1.92s/it][A
Training...:  64% 8837/13907 [5:38:34<2:38:56,  1.88s/it][A
Training...:  64% 8838/13907 [5:38:36<2:36:13,  1.85s/it][A
Training...:  64% 8839/13907 [5:38:37<2:33:47,  1.82s/it][A
Training...:  64% 8840/13907 [5:38:39<2:30:58,  1.79s/it][A
Training...:  64% 8841/13907 [5:38:41<2:28:37,  1.76s/it][A
Training...:  64% 8842/13907 [5:38:42<2:25:25,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:20:55<26:06:17, 31325.86s/it]
Training...:  64% 8842/13907 [5:38:44<2:25:25,  1.72s/it][A
Training...:  64% 8843/13907 [5:38:44<2:30:45,  1.79s/it][A
Training...:  64% 8844/13907 [5:38:46<2:27:05,  1.74s/it][A
Training...:  64% 8845/13907 [5:38:47<2:21:43,  1.68s/it][A
Training...:  64% 8846/13907 [5:38:49<2:16:18,  1.62s/it][A
Training...:  64% 8847/13907 [5:38:50<2:11:03,  1.55s/it][A
Training...:  64% 8848/13907 [5:38:52<2:05:35,  1.49s/it][A
Training...:  64% 8849/13907 [5:38:53<2:00:24,  1.43s/it][A
Training...:  64% 8850/13907 [5:38:54<1:51:50,  1.33s/it][A
Training...:  64% 8851/13907 [5:38:58<2:53:55,  2.06s/it][A
Training...:  64% 8852/13907 [5:39:01<3:28:47,  2.48s/it][A
Training...:  64% 8853/13907 [5:39:05<3:48:34,  2.71s/it][A
Training...:  64% 8854/13907 [5:39:08<3:59:03,  2.84s/it][A
Training...:  64% 8855/13907 [5:39:11<4:05:12,  2.91s/it][A
Training...:  64% 8856/13907 [5:39:14<4:08:00,  2.95s/it][A
Training...:  64% 8857/13907 [5:39:17<4:07:47,  2.94s/it][A
Training...:  64% 8858/13907 [5:39:20<4:06:32,  2.93s/it][A
Training...:  64% 8859/13907 [5:39:22<4:04:43,  2.91s/it][A
Training...:  64% 8860/13907 [5:39:25<4:01:11,  2.87s/it][A
Training...:  64% 8861/13907 [5:39:28<3:58:07,  2.83s/it][A
Training...:  64% 8862/13907 [5:39:31<3:53:27,  2.78s/it][A
Training...:  64% 8863/13907 [5:39:33<3:49:57,  2.74s/it][A
Training...:  64% 8864/13907 [5:39:36<3:46:23,  2.69s/it][A
Training...:  64% 8865/13907 [5:39:38<3:43:08,  2.66s/it][A
Training...:  64% 8866/13907 [5:39:41<3:39:24,  2.61s/it][A
Training...:  64% 8867/13907 [5:39:43<3:36:29,  2.58s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:21:58<26:06:17, 31325.86s/it]
Training...:  64% 8867/13907 [5:39:46<3:36:29,  2.58s/it][A
Training...:  64% 8868/13907 [5:39:46<3:43:41,  2.66s/it][A
Training...:  64% 8869/13907 [5:39:49<3:37:32,  2.59s/it][A
Training...:  64% 8870/13907 [5:39:51<3:30:56,  2.51s/it][A
Training...:  64% 8871/13907 [5:39:53<3:26:01,  2.45s/it][A
Training...:  64% 8872/13907 [5:39:56<3:21:49,  2.41s/it][A
Training...:  64% 8873/13907 [5:39:58<3:17:44,  2.36s/it][A
Training...:  64% 8874/13907 [5:40:00<3:13:56,  2.31s/it][A
Training...:  64% 8875/13907 [5:40:02<3:10:30,  2.27s/it][A
Training...:  64% 8876/13907 [5:40:04<3:07:10,  2.23s/it][A
Training...:  64% 8877/13907 [5:40:07<3:05:04,  2.21s/it][A
Training...:  64% 8878/13907 [5:40:09<3:02:02,  2.17s/it][A
Training...:  64% 8879/13907 [5:40:11<2:59:03,  2.14s/it][A
Training...:  64% 8880/13907 [5:40:13<2:56:34,  2.11s/it][A
Training...:  64% 8881/13907 [5:40:15<2:53:56,  2.08s/it][A
Training...:  64% 8882/13907 [5:40:17<2:51:35,  2.05s/it][A
Training...:  64% 8883/13907 [5:40:19<2:49:36,  2.03s/it][A
Training...:  64% 8884/13907 [5:40:21<2:46:45,  1.99s/it][A
Training...:  64% 8885/13907 [5:40:23<2:44:10,  1.96s/it][A
Training...:  64% 8886/13907 [5:40:24<2:41:37,  1.93s/it][A
Training...:  64% 8887/13907 [5:40:26<2:39:20,  1.90s/it][A
Training...:  64% 8888/13907 [5:40:28<2:36:18,  1.87s/it][A
Training...:  64% 8889/13907 [5:40:30<2:33:07,  1.83s/it][A
Training...:  64% 8890/13907 [5:40:32<2:30:43,  1.80s/it][A
Training...:  64% 8891/13907 [5:40:33<2:27:57,  1.77s/it][A
Training...:  64% 8892/13907 [5:40:35<2:24:39,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:22:48<26:06:17, 31325.86s/it]
Training...:  64% 8892/13907 [5:40:37<2:24:39,  1.73s/it][A
Training...:  64% 8893/13907 [5:40:37<2:29:29,  1.79s/it][A
Training...:  64% 8894/13907 [5:40:38<2:25:49,  1.75s/it][A
Training...:  64% 8895/13907 [5:40:40<2:20:02,  1.68s/it][A
Training...:  64% 8896/13907 [5:40:41<2:14:34,  1.61s/it][A
Training...:  64% 8897/13907 [5:40:43<2:09:39,  1.55s/it][A
Training...:  64% 8898/13907 [5:40:44<2:04:26,  1.49s/it][A
Training...:  64% 8899/13907 [5:40:45<1:57:59,  1.41s/it][A
Training...:  64% 8900/13907 [5:40:46<1:49:16,  1.31s/it][A
Training...:  64% 8901/13907 [5:40:50<2:50:30,  2.04s/it][A
Training...:  64% 8902/13907 [5:40:54<3:27:33,  2.49s/it][A
Training...:  64% 8903/13907 [5:40:57<3:47:40,  2.73s/it][A
Training...:  64% 8904/13907 [5:41:00<3:56:55,  2.84s/it][A
Training...:  64% 8905/13907 [5:41:03<4:01:33,  2.90s/it][A
Training...:  64% 8906/13907 [5:41:06<4:02:49,  2.91s/it][A
Training...:  64% 8907/13907 [5:41:09<4:02:09,  2.91s/it][A
Training...:  64% 8908/13907 [5:41:12<3:59:15,  2.87s/it][A
Training...:  64% 8909/13907 [5:41:15<3:56:40,  2.84s/it][A
Training...:  64% 8910/13907 [5:41:17<3:52:19,  2.79s/it][A
Training...:  64% 8911/13907 [5:41:20<3:49:07,  2.75s/it][A
Training...:  64% 8912/13907 [5:41:23<3:45:46,  2.71s/it][A
Training...:  64% 8913/13907 [5:41:25<3:42:56,  2.68s/it][A
Training...:  64% 8914/13907 [5:41:28<3:40:06,  2.64s/it][A
Training...:  64% 8915/13907 [5:41:30<3:37:00,  2.61s/it][A
Training...:  64% 8916/13907 [5:41:33<3:33:30,  2.57s/it][A
Training...:  64% 8917/13907 [5:41:35<3:29:51,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:23:49<26:06:17, 31325.86s/it]
Training...:  64% 8917/13907 [5:41:38<3:29:51,  2.52s/it][A
Training...:  64% 8918/13907 [5:41:38<3:37:59,  2.62s/it][A
Training...:  64% 8919/13907 [5:41:40<3:33:48,  2.57s/it][A
Training...:  64% 8920/13907 [5:41:43<3:27:50,  2.50s/it][A
Training...:  64% 8921/13907 [5:41:45<3:22:29,  2.44s/it][A
Training...:  64% 8922/13907 [5:41:47<3:18:24,  2.39s/it][A
Training...:  64% 8923/13907 [5:41:50<3:14:50,  2.35s/it][A
Training...:  64% 8924/13907 [5:41:52<3:11:07,  2.30s/it][A
Training...:  64% 8925/13907 [5:41:54<3:08:21,  2.27s/it][A
Training...:  64% 8926/13907 [5:41:56<3:06:05,  2.24s/it][A
Training...:  64% 8927/13907 [5:41:58<3:04:34,  2.22s/it][A
Training...:  64% 8928/13907 [5:42:00<3:03:18,  2.21s/it][A
Training...:  64% 8929/13907 [5:42:03<3:00:56,  2.18s/it][A
Training...:  64% 8930/13907 [5:42:05<2:57:38,  2.14s/it][A
Training...:  64% 8931/13907 [5:42:07<2:54:42,  2.11s/it][A
Training...:  64% 8932/13907 [5:42:09<2:51:24,  2.07s/it][A
Training...:  64% 8933/13907 [5:42:11<2:48:33,  2.03s/it][A
Training...:  64% 8934/13907 [5:42:12<2:45:15,  1.99s/it][A
Training...:  64% 8935/13907 [5:42:14<2:42:21,  1.96s/it][A
Training...:  64% 8936/13907 [5:42:16<2:39:34,  1.93s/it][A
Training...:  64% 8937/13907 [5:42:18<2:36:54,  1.89s/it][A
Training...:  64% 8938/13907 [5:42:20<2:34:19,  1.86s/it][A
Training...:  64% 8939/13907 [5:42:22<2:31:31,  1.83s/it][A
Training...:  64% 8940/13907 [5:42:23<2:28:42,  1.80s/it][A
Training...:  64% 8941/13907 [5:42:25<2:26:16,  1.77s/it][A
Training...:  64% 8942/13907 [5:42:27<2:23:08,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:24:40<26:06:17, 31325.86s/it]
Training...:  64% 8942/13907 [5:42:29<2:23:08,  1.73s/it][A
Training...:  64% 8943/13907 [5:42:29<2:28:24,  1.79s/it][A
Training...:  64% 8944/13907 [5:42:30<2:24:05,  1.74s/it][A
Training...:  64% 8945/13907 [5:42:32<2:18:02,  1.67s/it][A
Training...:  64% 8946/13907 [5:42:33<2:14:19,  1.62s/it][A
Training...:  64% 8947/13907 [5:42:35<2:08:26,  1.55s/it][A
Training...:  64% 8948/13907 [5:42:36<2:02:04,  1.48s/it][A
Training...:  64% 8949/13907 [5:42:37<1:55:24,  1.40s/it][A
Training...:  64% 8950/13907 [5:42:38<1:47:09,  1.30s/it][A
Training...:  64% 8951/13907 [5:42:42<2:50:10,  2.06s/it][A
Training...:  64% 8952/13907 [5:42:46<3:26:24,  2.50s/it][A
Training...:  64% 8953/13907 [5:42:49<3:46:04,  2.74s/it][A
Training...:  64% 8954/13907 [5:42:52<3:55:53,  2.86s/it][A
Training...:  64% 8955/13907 [5:42:55<4:01:25,  2.93s/it][A
Training...:  64% 8956/13907 [5:42:58<4:02:28,  2.94s/it][A
Training...:  64% 8957/13907 [5:43:01<4:01:11,  2.92s/it][A
Training...:  64% 8958/13907 [5:43:04<3:58:09,  2.89s/it][A
Training...:  64% 8959/13907 [5:43:07<3:55:26,  2.85s/it][A
Training...:  64% 8960/13907 [5:43:09<3:51:54,  2.81s/it][A
Training...:  64% 8961/13907 [5:43:12<3:51:10,  2.80s/it][A
Training...:  64% 8962/13907 [5:43:15<3:46:17,  2.75s/it][A
Training...:  64% 8963/13907 [5:43:17<3:42:31,  2.70s/it][A
Training...:  64% 8964/13907 [5:43:20<3:37:51,  2.64s/it][A
Training...:  64% 8965/13907 [5:43:22<3:33:47,  2.60s/it][A
Training...:  64% 8966/13907 [5:43:25<3:30:00,  2.55s/it][A
Training...:  64% 8967/13907 [5:43:27<3:26:59,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:25:41<26:06:17, 31325.86s/it]
Training...:  64% 8967/13907 [5:43:30<3:26:59,  2.51s/it][A
Training...:  64% 8968/13907 [5:43:30<3:34:08,  2.60s/it][A
Training...:  64% 8969/13907 [5:43:32<3:30:27,  2.56s/it][A
Training...:  64% 8970/13907 [5:43:35<3:24:38,  2.49s/it][A
Training...:  65% 8971/13907 [5:43:37<3:20:20,  2.44s/it][A
Training...:  65% 8972/13907 [5:43:39<3:16:19,  2.39s/it][A
Training...:  65% 8973/13907 [5:43:41<3:12:36,  2.34s/it][A
Training...:  65% 8974/13907 [5:43:44<3:09:13,  2.30s/it][A
Training...:  65% 8975/13907 [5:43:46<3:06:04,  2.26s/it][A
Training...:  65% 8976/13907 [5:43:48<3:03:12,  2.23s/it][A
Training...:  65% 8977/13907 [5:43:50<3:01:02,  2.20s/it][A
Training...:  65% 8978/13907 [5:43:52<2:57:49,  2.16s/it][A
Training...:  65% 8979/13907 [5:43:54<2:55:17,  2.13s/it][A
Training...:  65% 8980/13907 [5:43:56<2:52:58,  2.11s/it][A
Training...:  65% 8981/13907 [5:43:58<2:50:54,  2.08s/it][A
Training...:  65% 8982/13907 [5:44:00<2:48:21,  2.05s/it][A
Training...:  65% 8983/13907 [5:44:02<2:46:50,  2.03s/it][A
Training...:  65% 8984/13907 [5:44:04<2:44:47,  2.01s/it][A
Training...:  65% 8985/13907 [5:44:06<2:42:44,  1.98s/it][A
Training...:  65% 8986/13907 [5:44:08<2:39:50,  1.95s/it][A
Training...:  65% 8987/13907 [5:44:10<2:36:49,  1.91s/it][A
Training...:  65% 8988/13907 [5:44:12<2:34:01,  1.88s/it][A
Training...:  65% 8989/13907 [5:44:13<2:31:08,  1.84s/it][A
Training...:  65% 8990/13907 [5:44:15<2:28:20,  1.81s/it][A
Training...:  65% 8991/13907 [5:44:17<2:25:21,  1.77s/it][A
Training...:  65% 8992/13907 [5:44:19<2:21:59,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:26:32<26:06:17, 31325.86s/it]
Training...:  65% 8992/13907 [5:44:20<2:21:59,  1.73s/it][A
Training...:  65% 8993/13907 [5:44:20<2:26:21,  1.79s/it][A
Training...:  65% 8994/13907 [5:44:22<2:22:14,  1.74s/it][A
Training...:  65% 8995/13907 [5:44:24<2:17:01,  1.67s/it][A
Training...:  65% 8996/13907 [5:44:25<2:11:00,  1.60s/it][A
Training...:  65% 8997/13907 [5:44:26<2:05:37,  1.54s/it][A
Training...:  65% 8998/13907 [5:44:28<1:59:38,  1.46s/it][A
Training...:  65% 8999/13907 [5:44:29<1:52:53,  1.38s/it][A
Training...:  65% 9000/13907 [5:44:30<1:44:35,  1.28s/it][A
Training...:  65% 9001/13907 [5:44:34<2:45:02,  2.02s/it][A
Training...:  65% 9002/13907 [5:44:37<3:22:04,  2.47s/it][A
Training...:  65% 9003/13907 [5:44:40<3:42:14,  2.72s/it][A
Training...:  65% 9004/13907 [5:44:44<3:51:21,  2.83s/it][A
Training...:  65% 9005/13907 [5:44:47<3:54:58,  2.88s/it][A
Training...:  65% 9006/13907 [5:44:49<3:56:03,  2.89s/it][A
Training...:  65% 9007/13907 [5:44:52<3:55:19,  2.88s/it][A
Training...:  65% 9008/13907 [5:44:55<3:53:16,  2.86s/it][A
Training...:  65% 9009/13907 [5:44:58<3:49:53,  2.82s/it][A
Training...:  65% 9010/13907 [5:45:01<3:47:10,  2.78s/it][A
Training...:  65% 9011/13907 [5:45:03<3:44:33,  2.75s/it][A
Training...:  65% 9012/13907 [5:45:06<3:40:47,  2.71s/it][A
Training...:  65% 9013/13907 [5:45:08<3:38:14,  2.68s/it][A
Training...:  65% 9014/13907 [5:45:11<3:35:02,  2.64s/it][A
Training...:  65% 9015/13907 [5:45:14<3:32:02,  2.60s/it][A
Training...:  65% 9016/13907 [5:45:16<3:28:41,  2.56s/it][A
Training...:  65% 9017/13907 [5:45:18<3:25:38,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:27:32<26:06:17, 31325.86s/it]
Training...:  65% 9017/13907 [5:45:21<3:25:38,  2.52s/it][A
Training...:  65% 9018/13907 [5:45:21<3:32:41,  2.61s/it][A
Training...:  65% 9019/13907 [5:45:24<3:29:13,  2.57s/it][A
Training...:  65% 9020/13907 [5:45:26<3:23:42,  2.50s/it][A
Training...:  65% 9021/13907 [5:45:28<3:18:58,  2.44s/it][A
Training...:  65% 9022/13907 [5:45:31<3:15:16,  2.40s/it][A
Training...:  65% 9023/13907 [5:45:33<3:11:08,  2.35s/it][A
Training...:  65% 9024/13907 [5:45:35<3:07:09,  2.30s/it][A
Training...:  65% 9025/13907 [5:45:37<3:03:30,  2.26s/it][A
Training...:  65% 9026/13907 [5:45:39<3:00:28,  2.22s/it][A
Training...:  65% 9027/13907 [5:45:41<2:57:55,  2.19s/it][A
Training...:  65% 9028/13907 [5:45:44<2:55:02,  2.15s/it][A
Training...:  65% 9029/13907 [5:45:46<2:52:53,  2.13s/it][A
Training...:  65% 9030/13907 [5:45:48<2:51:47,  2.11s/it][A
Training...:  65% 9031/13907 [5:45:50<2:49:40,  2.09s/it][A
Training...:  65% 9032/13907 [5:45:52<2:46:41,  2.05s/it][A
Training...:  65% 9033/13907 [5:45:54<2:44:01,  2.02s/it][A
Training...:  65% 9034/13907 [5:45:56<2:41:08,  1.98s/it][A
Training...:  65% 9035/13907 [5:45:57<2:38:02,  1.95s/it][A
Training...:  65% 9036/13907 [5:45:59<2:35:29,  1.92s/it][A
Training...:  65% 9037/13907 [5:46:01<2:33:05,  1.89s/it][A
Training...:  65% 9038/13907 [5:46:03<2:30:22,  1.85s/it][A
Training...:  65% 9039/13907 [5:46:05<2:27:33,  1.82s/it][A
Training...:  65% 9040/13907 [5:46:06<2:25:29,  1.79s/it][A
Training...:  65% 9041/13907 [5:46:08<2:22:40,  1.76s/it][A
Training...:  65% 9042/13907 [5:46:10<2:19:17,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:28:23<26:06:17, 31325.86s/it]
Training...:  65% 9042/13907 [5:46:12<2:19:17,  1.72s/it][A
Training...:  65% 9043/13907 [5:46:12<2:23:50,  1.77s/it][A
Training...:  65% 9044/13907 [5:46:13<2:20:04,  1.73s/it][A
Training...:  65% 9045/13907 [5:46:15<2:15:24,  1.67s/it][A
Training...:  65% 9046/13907 [5:46:16<2:10:11,  1.61s/it][A
Training...:  65% 9047/13907 [5:46:18<2:05:12,  1.55s/it][A
Training...:  65% 9048/13907 [5:46:19<1:59:25,  1.47s/it][A
Training...:  65% 9049/13907 [5:46:20<1:53:24,  1.40s/it][A
Training...:  65% 9050/13907 [5:46:21<1:44:56,  1.30s/it][A
Training...:  65% 9051/13907 [5:46:25<2:42:53,  2.01s/it][A
Training...:  65% 9052/13907 [5:46:28<3:19:44,  2.47s/it][A
Training...:  65% 9053/13907 [5:46:32<3:39:51,  2.72s/it][A
Training...:  65% 9054/13907 [5:46:35<3:49:46,  2.84s/it][A
Training...:  65% 9055/13907 [5:46:38<3:55:37,  2.91s/it][A
Training...:  65% 9056/13907 [5:46:41<3:57:38,  2.94s/it][A
Training...:  65% 9057/13907 [5:46:44<3:58:00,  2.94s/it][A
Training...:  65% 9058/13907 [5:46:47<3:56:53,  2.93s/it][A
Training...:  65% 9059/13907 [5:46:50<3:54:56,  2.91s/it][A
Training...:  65% 9060/13907 [5:46:52<3:52:10,  2.87s/it][A
Training...:  65% 9061/13907 [5:46:55<3:50:31,  2.85s/it][A
Training...:  65% 9062/13907 [5:46:58<3:44:44,  2.78s/it][A
Training...:  65% 9063/13907 [5:47:00<3:40:14,  2.73s/it][A
Training...:  65% 9064/13907 [5:47:03<3:36:11,  2.68s/it][A
Training...:  65% 9065/13907 [5:47:05<3:32:24,  2.63s/it][A
Training...:  65% 9066/13907 [5:47:08<3:28:43,  2.59s/it][A
Training...:  65% 9067/13907 [5:47:10<3:24:13,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:29:24<26:06:17, 31325.86s/it]
Training...:  65% 9067/13907 [5:47:13<3:24:13,  2.53s/it][A
Training...:  65% 9068/13907 [5:47:13<3:31:39,  2.62s/it][A
Training...:  65% 9069/13907 [5:47:16<3:27:26,  2.57s/it][A
Training...:  65% 9070/13907 [5:47:18<3:21:26,  2.50s/it][A
Training...:  65% 9071/13907 [5:47:20<3:16:41,  2.44s/it][A
Training...:  65% 9072/13907 [5:47:23<3:12:49,  2.39s/it][A
Training...:  65% 9073/13907 [5:47:25<3:08:34,  2.34s/it][A
Training...:  65% 9074/13907 [5:47:27<3:04:48,  2.29s/it][A
Training...:  65% 9075/13907 [5:47:29<3:02:08,  2.26s/it][A
Training...:  65% 9076/13907 [5:47:31<2:58:58,  2.22s/it][A
Training...:  65% 9077/13907 [5:47:33<2:56:29,  2.19s/it][A
Training...:  65% 9078/13907 [5:47:35<2:53:58,  2.16s/it][A
Training...:  65% 9079/13907 [5:47:38<2:51:07,  2.13s/it][A
Training...:  65% 9080/13907 [5:47:40<2:48:53,  2.10s/it][A
Training...:  65% 9081/13907 [5:47:42<2:46:43,  2.07s/it][A
Training...:  65% 9082/13907 [5:47:44<2:44:11,  2.04s/it][A
Training...:  65% 9083/13907 [5:47:45<2:41:38,  2.01s/it][A
Training...:  65% 9084/13907 [5:47:47<2:39:08,  1.98s/it][A
Training...:  65% 9085/13907 [5:47:49<2:36:57,  1.95s/it][A
Training...:  65% 9086/13907 [5:47:51<2:34:02,  1.92s/it][A
Training...:  65% 9087/13907 [5:47:53<2:31:14,  1.88s/it][A
Training...:  65% 9088/13907 [5:47:55<2:27:43,  1.84s/it][A
Training...:  65% 9089/13907 [5:47:56<2:25:36,  1.81s/it][A
Training...:  65% 9090/13907 [5:47:58<2:23:22,  1.79s/it][A
Training...:  65% 9091/13907 [5:48:00<2:20:01,  1.74s/it][A
Training...:  65% 9092/13907 [5:48:01<2:17:23,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:30:15<26:06:17, 31325.86s/it]
Training...:  65% 9092/13907 [5:48:03<2:17:23,  1.71s/it][A
Training...:  65% 9093/13907 [5:48:03<2:21:53,  1.77s/it][A
Training...:  65% 9094/13907 [5:48:05<2:18:16,  1.72s/it][A
Training...:  65% 9095/13907 [5:48:06<2:12:51,  1.66s/it][A
Training...:  65% 9096/13907 [5:48:08<2:07:47,  1.59s/it][A
Training...:  65% 9097/13907 [5:48:09<2:02:48,  1.53s/it][A
Training...:  65% 9098/13907 [5:48:11<1:57:34,  1.47s/it][A
Training...:  65% 9099/13907 [5:48:12<1:51:52,  1.40s/it][A
Training...:  65% 9100/13907 [5:48:13<1:43:52,  1.30s/it][A
Training...:  65% 9101/13907 [5:48:17<2:42:58,  2.03s/it][A
Training...:  65% 9102/13907 [5:48:20<3:18:43,  2.48s/it][A
Training...:  65% 9103/13907 [5:48:24<3:39:51,  2.75s/it][A
Training...:  65% 9104/13907 [5:48:27<3:51:01,  2.89s/it][A
Training...:  65% 9105/13907 [5:48:30<3:55:30,  2.94s/it][A
Training...:  65% 9106/13907 [5:48:33<3:56:21,  2.95s/it][A
Training...:  65% 9107/13907 [5:48:36<3:55:37,  2.95s/it][A
Training...:  65% 9108/13907 [5:48:39<3:52:46,  2.91s/it][A
Training...:  65% 9109/13907 [5:48:41<3:50:05,  2.88s/it][A
Training...:  66% 9110/13907 [5:48:44<3:46:07,  2.83s/it][A
Training...:  66% 9111/13907 [5:48:47<3:42:23,  2.78s/it][A
Training...:  66% 9112/13907 [5:48:49<3:38:15,  2.73s/it][A
Training...:  66% 9113/13907 [5:48:52<3:34:16,  2.68s/it][A
Training...:  66% 9114/13907 [5:48:54<3:30:48,  2.64s/it][A
Training...:  66% 9115/13907 [5:48:57<3:27:48,  2.60s/it][A
Training...:  66% 9116/13907 [5:48:59<3:24:29,  2.56s/it][A
Training...:  66% 9117/13907 [5:49:02<3:21:35,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:31:16<26:06:17, 31325.86s/it]
Training...:  66% 9117/13907 [5:49:05<3:21:35,  2.53s/it][A
Training...:  66% 9118/13907 [5:49:05<3:28:42,  2.61s/it][A
Training...:  66% 9119/13907 [5:49:07<3:24:41,  2.57s/it][A
Training...:  66% 9120/13907 [5:49:09<3:18:33,  2.49s/it][A
Training...:  66% 9121/13907 [5:49:12<3:14:25,  2.44s/it][A
Training...:  66% 9122/13907 [5:49:14<3:10:06,  2.38s/it][A
Training...:  66% 9123/13907 [5:49:16<3:06:55,  2.34s/it][A
Training...:  66% 9124/13907 [5:49:18<3:03:24,  2.30s/it][A
Training...:  66% 9125/13907 [5:49:21<3:00:31,  2.27s/it][A
Training...:  66% 9126/13907 [5:49:23<2:57:26,  2.23s/it][A
Training...:  66% 9127/13907 [5:49:25<2:54:45,  2.19s/it][A
Training...:  66% 9128/13907 [5:49:27<2:52:46,  2.17s/it][A
Training...:  66% 9129/13907 [5:49:29<2:50:32,  2.14s/it][A
Training...:  66% 9130/13907 [5:49:31<2:48:10,  2.11s/it][A
Training...:  66% 9131/13907 [5:49:33<2:46:04,  2.09s/it][A
Training...:  66% 9132/13907 [5:49:35<2:44:24,  2.07s/it][A
Training...:  66% 9133/13907 [5:49:37<2:43:49,  2.06s/it][A
Training...:  66% 9134/13907 [5:49:39<2:40:25,  2.02s/it][A
Training...:  66% 9135/13907 [5:49:41<2:36:50,  1.97s/it][A
Training...:  66% 9136/13907 [5:49:43<2:33:32,  1.93s/it][A
Training...:  66% 9137/13907 [5:49:45<2:30:45,  1.90s/it][A
Training...:  66% 9138/13907 [5:49:46<2:27:48,  1.86s/it][A
Training...:  66% 9139/13907 [5:49:48<2:25:05,  1.83s/it][A
Training...:  66% 9140/13907 [5:49:50<2:21:46,  1.78s/it][A
Training...:  66% 9141/13907 [5:49:52<2:18:37,  1.75s/it][A
Training...:  66% 9142/13907 [5:49:53<2:15:32,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:32:06<26:06:17, 31325.86s/it]
Training...:  66% 9142/13907 [5:49:55<2:15:32,  1.71s/it][A
Training...:  66% 9143/13907 [5:49:55<2:20:09,  1.77s/it][A
Training...:  66% 9144/13907 [5:49:57<2:16:48,  1.72s/it][A
Training...:  66% 9145/13907 [5:49:58<2:11:53,  1.66s/it][A
Training...:  66% 9146/13907 [5:50:00<2:06:28,  1.59s/it][A
Training...:  66% 9147/13907 [5:50:01<2:01:35,  1.53s/it][A
Training...:  66% 9148/13907 [5:50:02<1:56:55,  1.47s/it][A
Training...:  66% 9149/13907 [5:50:04<1:51:42,  1.41s/it][A
Training...:  66% 9150/13907 [5:50:05<1:43:53,  1.31s/it][A
Training...:  66% 9151/13907 [5:50:09<2:44:33,  2.08s/it][A
Training...:  66% 9152/13907 [5:50:12<3:18:26,  2.50s/it][A
Training...:  66% 9153/13907 [5:50:15<3:37:17,  2.74s/it][A
Training...:  66% 9154/13907 [5:50:19<3:46:55,  2.86s/it][A
Training...:  66% 9155/13907 [5:50:22<3:51:42,  2.93s/it][A
Training...:  66% 9156/13907 [5:50:25<3:53:25,  2.95s/it][A
Training...:  66% 9157/13907 [5:50:28<3:53:16,  2.95s/it][A
Training...:  66% 9158/13907 [5:50:30<3:51:27,  2.92s/it][A
Training...:  66% 9159/13907 [5:50:33<3:48:37,  2.89s/it][A
Training...:  66% 9160/13907 [5:50:36<3:45:20,  2.85s/it][A
Training...:  66% 9161/13907 [5:50:39<3:42:42,  2.82s/it][A
Training...:  66% 9162/13907 [5:50:41<3:38:05,  2.76s/it][A
Training...:  66% 9163/13907 [5:50:44<3:37:07,  2.75s/it][A
Training...:  66% 9164/13907 [5:50:47<3:34:10,  2.71s/it][A
Training...:  66% 9165/13907 [5:50:49<3:30:09,  2.66s/it][A
Training...:  66% 9166/13907 [5:50:52<3:26:13,  2.61s/it][A
Training...:  66% 9167/13907 [5:50:54<3:23:14,  2.57s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:33:08<26:06:17, 31325.86s/it]
Training...:  66% 9167/13907 [5:50:57<3:23:14,  2.57s/it][A
Training...:  66% 9168/13907 [5:50:57<3:29:33,  2.65s/it][A
Training...:  66% 9169/13907 [5:50:59<3:24:30,  2.59s/it][A
Training...:  66% 9170/13907 [5:51:02<3:18:27,  2.51s/it][A
Training...:  66% 9171/13907 [5:51:04<3:13:38,  2.45s/it][A
Training...:  66% 9172/13907 [5:51:06<3:09:46,  2.40s/it][A
Training...:  66% 9173/13907 [5:51:09<3:06:29,  2.36s/it][A
Training...:  66% 9174/13907 [5:51:11<3:02:41,  2.32s/it][A
Training...:  66% 9175/13907 [5:51:13<2:59:10,  2.27s/it][A
Training...:  66% 9176/13907 [5:51:15<2:55:36,  2.23s/it][A
Training...:  66% 9177/13907 [5:51:17<2:52:31,  2.19s/it][A
Training...:  66% 9178/13907 [5:51:19<2:49:55,  2.16s/it][A
Training...:  66% 9179/13907 [5:51:21<2:47:33,  2.13s/it][A
Training...:  66% 9180/13907 [5:51:23<2:44:49,  2.09s/it][A
Training...:  66% 9181/13907 [5:51:25<2:42:23,  2.06s/it][A
Training...:  66% 9182/13907 [5:51:27<2:40:15,  2.04s/it][A
Training...:  66% 9183/13907 [5:51:29<2:37:57,  2.01s/it][A
Training...:  66% 9184/13907 [5:51:31<2:35:19,  1.97s/it][A
Training...:  66% 9185/13907 [5:51:33<2:33:18,  1.95s/it][A
Training...:  66% 9186/13907 [5:51:35<2:31:21,  1.92s/it][A
Training...:  66% 9187/13907 [5:51:37<2:29:29,  1.90s/it][A
Training...:  66% 9188/13907 [5:51:39<2:26:59,  1.87s/it][A
Training...:  66% 9189/13907 [5:51:40<2:25:04,  1.85s/it][A
Training...:  66% 9190/13907 [5:51:42<2:22:08,  1.81s/it][A
Training...:  66% 9191/13907 [5:51:44<2:19:22,  1.77s/it][A
Training...:  66% 9192/13907 [5:51:45<2:16:19,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:33:59<26:06:17, 31325.86s/it]
Training...:  66% 9192/13907 [5:51:47<2:16:19,  1.73s/it][A
Training...:  66% 9193/13907 [5:51:47<2:20:44,  1.79s/it][A
Training...:  66% 9194/13907 [5:51:49<2:16:48,  1.74s/it][A
Training...:  66% 9195/13907 [5:51:51<2:12:23,  1.69s/it][A
Training...:  66% 9196/13907 [5:51:52<2:07:24,  1.62s/it][A
Training...:  66% 9197/13907 [5:51:53<2:02:43,  1.56s/it][A
Training...:  66% 9198/13907 [5:51:55<1:58:12,  1.51s/it][A
Training...:  66% 9199/13907 [5:51:56<1:52:22,  1.43s/it][A
Training...:  66% 9200/13907 [5:51:57<1:44:08,  1.33s/it][A
Training...:  66% 9201/13907 [5:52:01<2:42:06,  2.07s/it][A
Training...:  66% 9202/13907 [5:52:04<3:15:26,  2.49s/it][A
Training...:  66% 9203/13907 [5:52:08<3:35:07,  2.74s/it][A
Training...:  66% 9204/13907 [5:52:11<3:44:18,  2.86s/it][A
Training...:  66% 9205/13907 [5:52:14<3:47:28,  2.90s/it][A
Training...:  66% 9206/13907 [5:52:17<3:48:01,  2.91s/it][A
Training...:  66% 9207/13907 [5:52:20<3:47:15,  2.90s/it][A
Training...:  66% 9208/13907 [5:52:23<3:45:18,  2.88s/it][A
Training...:  66% 9209/13907 [5:52:25<3:42:24,  2.84s/it][A
Training...:  66% 9210/13907 [5:52:28<3:38:33,  2.79s/it][A
Training...:  66% 9211/13907 [5:52:31<3:35:22,  2.75s/it][A
Training...:  66% 9212/13907 [5:52:33<3:31:57,  2.71s/it][A
Training...:  66% 9213/13907 [5:52:36<3:28:50,  2.67s/it][A
Training...:  66% 9214/13907 [5:52:38<3:25:43,  2.63s/it][A
Training...:  66% 9215/13907 [5:52:41<3:23:00,  2.60s/it][A
Training...:  66% 9216/13907 [5:52:43<3:19:31,  2.55s/it][A
Training...:  66% 9217/13907 [5:52:46<3:17:22,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:35:00<26:06:17, 31325.86s/it]
Training...:  66% 9217/13907 [5:52:49<3:17:22,  2.53s/it][A
Training...:  66% 9218/13907 [5:52:49<3:23:32,  2.60s/it][A
Training...:  66% 9219/13907 [5:52:51<3:19:29,  2.55s/it][A
Training...:  66% 9220/13907 [5:52:53<3:14:24,  2.49s/it][A
Training...:  66% 9221/13907 [5:52:56<3:09:59,  2.43s/it][A
Training...:  66% 9222/13907 [5:52:58<3:06:08,  2.38s/it][A
Training...:  66% 9223/13907 [5:53:00<3:03:08,  2.35s/it][A
Training...:  66% 9224/13907 [5:53:02<2:59:21,  2.30s/it][A
Training...:  66% 9225/13907 [5:53:05<2:56:36,  2.26s/it][A
Training...:  66% 9226/13907 [5:53:07<2:54:14,  2.23s/it][A
Training...:  66% 9227/13907 [5:53:09<2:51:33,  2.20s/it][A
Training...:  66% 9228/13907 [5:53:11<2:48:47,  2.16s/it][A
Training...:  66% 9229/13907 [5:53:13<2:47:38,  2.15s/it][A
Training...:  66% 9230/13907 [5:53:15<2:46:29,  2.14s/it][A
Training...:  66% 9231/13907 [5:53:17<2:43:48,  2.10s/it][A
Training...:  66% 9232/13907 [5:53:19<2:41:09,  2.07s/it][A
Training...:  66% 9233/13907 [5:53:21<2:38:18,  2.03s/it][A
Training...:  66% 9234/13907 [5:53:23<2:35:16,  1.99s/it][A
Training...:  66% 9235/13907 [5:53:25<2:32:57,  1.96s/it][A
Training...:  66% 9236/13907 [5:53:27<2:30:24,  1.93s/it][A
Training...:  66% 9237/13907 [5:53:29<2:28:11,  1.90s/it][A
Training...:  66% 9238/13907 [5:53:30<2:26:07,  1.88s/it][A
Training...:  66% 9239/13907 [5:53:32<2:24:03,  1.85s/it][A
Training...:  66% 9240/13907 [5:53:34<2:20:58,  1.81s/it][A
Training...:  66% 9241/13907 [5:53:36<2:18:47,  1.78s/it][A
Training...:  66% 9242/13907 [5:53:37<2:15:31,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:35:50<26:06:17, 31325.86s/it]
Training...:  66% 9242/13907 [5:53:39<2:15:31,  1.74s/it][A
Training...:  66% 9243/13907 [5:53:39<2:20:04,  1.80s/it][A
Training...:  66% 9244/13907 [5:53:41<2:16:41,  1.76s/it][A
Training...:  66% 9245/13907 [5:53:42<2:11:38,  1.69s/it][A
Training...:  66% 9246/13907 [5:53:44<2:06:20,  1.63s/it][A
Training...:  66% 9247/13907 [5:53:45<2:01:16,  1.56s/it][A
Training...:  66% 9248/13907 [5:53:47<1:56:03,  1.49s/it][A
Training...:  67% 9249/13907 [5:53:48<1:50:31,  1.42s/it][A
Training...:  67% 9250/13907 [5:53:49<1:42:33,  1.32s/it][A
Training...:  67% 9251/13907 [5:53:53<2:37:05,  2.02s/it][A
Training...:  67% 9252/13907 [5:53:56<3:11:11,  2.46s/it][A
Training...:  67% 9253/13907 [5:53:59<3:29:30,  2.70s/it][A
Training...:  67% 9254/13907 [5:54:02<3:38:25,  2.82s/it][A
Training...:  67% 9255/13907 [5:54:06<3:43:33,  2.88s/it][A
Training...:  67% 9256/13907 [5:54:08<3:45:31,  2.91s/it][A
Training...:  67% 9257/13907 [5:54:11<3:45:23,  2.91s/it][A
Training...:  67% 9258/13907 [5:54:14<3:43:28,  2.88s/it][A
Training...:  67% 9259/13907 [5:54:17<3:40:38,  2.85s/it][A
Training...:  67% 9260/13907 [5:54:20<3:36:27,  2.79s/it][A
Training...:  67% 9261/13907 [5:54:22<3:33:48,  2.76s/it][A
Training...:  67% 9262/13907 [5:54:25<3:31:11,  2.73s/it][A
Training...:  67% 9263/13907 [5:54:28<3:27:41,  2.68s/it][A
Training...:  67% 9264/13907 [5:54:30<3:24:16,  2.64s/it][A
Training...:  67% 9265/13907 [5:54:33<3:21:41,  2.61s/it][A
Training...:  67% 9266/13907 [5:54:35<3:17:51,  2.56s/it][A
Training...:  67% 9267/13907 [5:54:38<3:14:40,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:36:52<26:06:17, 31325.86s/it]
Training...:  67% 9267/13907 [5:54:40<3:14:40,  2.52s/it][A
Training...:  67% 9268/13907 [5:54:40<3:21:01,  2.60s/it][A
Training...:  67% 9269/13907 [5:54:43<3:17:52,  2.56s/it][A
Training...:  67% 9270/13907 [5:54:45<3:13:12,  2.50s/it][A
Training...:  67% 9271/13907 [5:54:47<3:08:42,  2.44s/it][A
Training...:  67% 9272/13907 [5:54:50<3:05:35,  2.40s/it][A
Training...:  67% 9273/13907 [5:54:52<3:02:38,  2.36s/it][A
Training...:  67% 9274/13907 [5:54:54<2:59:38,  2.33s/it][A
Training...:  67% 9275/13907 [5:54:56<2:57:02,  2.29s/it][A
Training...:  67% 9276/13907 [5:54:59<2:54:15,  2.26s/it][A
Training...:  67% 9277/13907 [5:55:01<2:50:47,  2.21s/it][A
Training...:  67% 9278/13907 [5:55:03<2:47:35,  2.17s/it][A
Training...:  67% 9279/13907 [5:55:05<2:44:35,  2.13s/it][A
Training...:  67% 9280/13907 [5:55:07<2:41:42,  2.10s/it][A
Training...:  67% 9281/13907 [5:55:09<2:39:46,  2.07s/it][A
Training...:  67% 9282/13907 [5:55:11<2:37:33,  2.04s/it][A
Training...:  67% 9283/13907 [5:55:13<2:35:51,  2.02s/it][A
Training...:  67% 9284/13907 [5:55:15<2:33:32,  1.99s/it][A
Training...:  67% 9285/13907 [5:55:17<2:31:08,  1.96s/it][A
Training...:  67% 9286/13907 [5:55:19<2:28:04,  1.92s/it][A
Training...:  67% 9287/13907 [5:55:20<2:25:50,  1.89s/it][A
Training...:  67% 9288/13907 [5:55:22<2:23:23,  1.86s/it][A
Training...:  67% 9289/13907 [5:55:24<2:20:51,  1.83s/it][A
Training...:  67% 9290/13907 [5:55:26<2:17:49,  1.79s/it][A
Training...:  67% 9291/13907 [5:55:27<2:15:31,  1.76s/it][A
Training...:  67% 9292/13907 [5:55:29<2:12:57,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:37:42<26:06:17, 31325.86s/it]
Training...:  67% 9292/13907 [5:55:31<2:12:57,  1.73s/it][A
Training...:  67% 9293/13907 [5:55:31<2:17:27,  1.79s/it][A
Training...:  67% 9294/13907 [5:55:32<2:13:26,  1.74s/it][A
Training...:  67% 9295/13907 [5:55:34<2:08:37,  1.67s/it][A
Training...:  67% 9296/13907 [5:55:35<2:03:30,  1.61s/it][A
Training...:  67% 9297/13907 [5:55:37<1:58:12,  1.54s/it][A
Training...:  67% 9298/13907 [5:55:38<1:52:54,  1.47s/it][A
Training...:  67% 9299/13907 [5:55:39<1:47:02,  1.39s/it][A
Training...:  67% 9300/13907 [5:55:40<1:38:48,  1.29s/it][A
Training...:  67% 9301/13907 [5:55:44<2:36:26,  2.04s/it][A
Training...:  67% 9302/13907 [5:55:48<3:08:50,  2.46s/it][A
Training...:  67% 9303/13907 [5:55:51<3:26:27,  2.69s/it][A
Training...:  67% 9304/13907 [5:55:54<3:36:30,  2.82s/it][A
Training...:  67% 9305/13907 [5:55:57<3:42:05,  2.90s/it][A
Training...:  67% 9306/13907 [5:56:00<3:43:11,  2.91s/it][A
Training...:  67% 9307/13907 [5:56:03<3:42:59,  2.91s/it][A
Training...:  67% 9308/13907 [5:56:06<3:41:02,  2.88s/it][A
Training...:  67% 9309/13907 [5:56:09<3:38:48,  2.86s/it][A
Training...:  67% 9310/13907 [5:56:11<3:35:40,  2.82s/it][A
Training...:  67% 9311/13907 [5:56:14<3:32:39,  2.78s/it][A
Training...:  67% 9312/13907 [5:56:17<3:28:59,  2.73s/it][A
Training...:  67% 9313/13907 [5:56:19<3:24:54,  2.68s/it][A
Training...:  67% 9314/13907 [5:56:22<3:22:57,  2.65s/it][A
Training...:  67% 9315/13907 [5:56:24<3:19:45,  2.61s/it][A
Training...:  67% 9316/13907 [5:56:27<3:16:01,  2.56s/it][A
Training...:  67% 9317/13907 [5:56:29<3:12:10,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:38:43<26:06:17, 31325.86s/it]
Training...:  67% 9317/13907 [5:56:32<3:12:10,  2.51s/it][A
Training...:  67% 9318/13907 [5:56:32<3:18:31,  2.60s/it][A
Training...:  67% 9319/13907 [5:56:34<3:14:55,  2.55s/it][A
Training...:  67% 9320/13907 [5:56:37<3:09:06,  2.47s/it][A
Training...:  67% 9321/13907 [5:56:39<3:04:43,  2.42s/it][A
Training...:  67% 9322/13907 [5:56:41<3:00:22,  2.36s/it][A
Training...:  67% 9323/13907 [5:56:43<2:57:04,  2.32s/it][A
Training...:  67% 9324/13907 [5:56:45<2:54:06,  2.28s/it][A
Training...:  67% 9325/13907 [5:56:48<2:51:26,  2.25s/it][A
Training...:  67% 9326/13907 [5:56:50<2:48:38,  2.21s/it][A
Training...:  67% 9327/13907 [5:56:52<2:46:08,  2.18s/it][A
Training...:  67% 9328/13907 [5:56:54<2:43:49,  2.15s/it][A
Training...:  67% 9329/13907 [5:56:56<2:42:05,  2.12s/it][A
Training...:  67% 9330/13907 [5:56:58<2:39:52,  2.10s/it][A
Training...:  67% 9331/13907 [5:57:00<2:37:37,  2.07s/it][A
Training...:  67% 9332/13907 [5:57:02<2:35:21,  2.04s/it][A
Training...:  67% 9333/13907 [5:57:04<2:33:32,  2.01s/it][A
Training...:  67% 9334/13907 [5:57:06<2:31:20,  1.99s/it][A
Training...:  67% 9335/13907 [5:57:08<2:29:17,  1.96s/it][A
Training...:  67% 9336/13907 [5:57:10<2:27:02,  1.93s/it][A
Training...:  67% 9337/13907 [5:57:11<2:24:41,  1.90s/it][A
Training...:  67% 9338/13907 [5:57:13<2:22:23,  1.87s/it][A
Training...:  67% 9339/13907 [5:57:15<2:20:23,  1.84s/it][A
Training...:  67% 9340/13907 [5:57:17<2:17:44,  1.81s/it][A
Training...:  67% 9341/13907 [5:57:19<2:15:19,  1.78s/it][A
Training...:  67% 9342/13907 [5:57:20<2:12:23,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:39:33<26:06:17, 31325.86s/it]
Training...:  67% 9342/13907 [5:57:22<2:12:23,  1.74s/it][A
Training...:  67% 9343/13907 [5:57:22<2:16:41,  1.80s/it][A
Training...:  67% 9344/13907 [5:57:24<2:12:36,  1.74s/it][A
Training...:  67% 9345/13907 [5:57:25<2:08:11,  1.69s/it][A
Training...:  67% 9346/13907 [5:57:27<2:02:59,  1.62s/it][A
Training...:  67% 9347/13907 [5:57:28<1:57:55,  1.55s/it][A
Training...:  67% 9348/13907 [5:57:29<1:53:05,  1.49s/it][A
Training...:  67% 9349/13907 [5:57:31<1:47:10,  1.41s/it][A
Training...:  67% 9350/13907 [5:57:32<1:40:05,  1.32s/it][A
Training...:  67% 9351/13907 [5:57:36<2:37:26,  2.07s/it][A
Training...:  67% 9352/13907 [5:57:39<3:08:55,  2.49s/it][A
Training...:  67% 9353/13907 [5:57:42<3:25:03,  2.70s/it][A
Training...:  67% 9354/13907 [5:57:45<3:34:10,  2.82s/it][A
Training...:  67% 9355/13907 [5:57:48<3:38:42,  2.88s/it][A
Training...:  67% 9356/13907 [5:57:51<3:39:25,  2.89s/it][A
Training...:  67% 9357/13907 [5:57:54<3:39:02,  2.89s/it][A
Training...:  67% 9358/13907 [5:57:57<3:37:12,  2.86s/it][A
Training...:  67% 9359/13907 [5:58:00<3:34:28,  2.83s/it][A
Training...:  67% 9360/13907 [5:58:02<3:31:47,  2.79s/it][A
Training...:  67% 9361/13907 [5:58:05<3:29:18,  2.76s/it][A
Training...:  67% 9362/13907 [5:58:08<3:26:29,  2.73s/it][A
Training...:  67% 9363/13907 [5:58:10<3:23:29,  2.69s/it][A
Training...:  67% 9364/13907 [5:58:13<3:20:36,  2.65s/it][A
Training...:  67% 9365/13907 [5:58:15<3:18:00,  2.62s/it][A
Training...:  67% 9366/13907 [5:58:18<3:15:38,  2.59s/it][A
Training...:  67% 9367/13907 [5:58:20<3:12:36,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:40:35<26:06:17, 31325.86s/it]
Training...:  67% 9367/13907 [5:58:23<3:12:36,  2.55s/it][A
Training...:  67% 9368/13907 [5:58:23<3:19:21,  2.64s/it][A
Training...:  67% 9369/13907 [5:58:26<3:15:23,  2.58s/it][A
Training...:  67% 9370/13907 [5:58:28<3:10:02,  2.51s/it][A
Training...:  67% 9371/13907 [5:58:30<3:06:24,  2.47s/it][A
Training...:  67% 9372/13907 [5:58:33<3:04:12,  2.44s/it][A
Training...:  67% 9373/13907 [5:58:35<3:00:02,  2.38s/it][A
Training...:  67% 9374/13907 [5:58:37<2:55:41,  2.33s/it][A
Training...:  67% 9375/13907 [5:58:39<2:52:12,  2.28s/it][A
Training...:  67% 9376/13907 [5:58:42<2:48:54,  2.24s/it][A
Training...:  67% 9377/13907 [5:58:44<2:45:46,  2.20s/it][A
Training...:  67% 9378/13907 [5:58:46<2:43:15,  2.16s/it][A
Training...:  67% 9379/13907 [5:58:48<2:40:26,  2.13s/it][A
Training...:  67% 9380/13907 [5:58:50<2:37:45,  2.09s/it][A
Training...:  67% 9381/13907 [5:58:52<2:35:32,  2.06s/it][A
Training...:  67% 9382/13907 [5:58:54<2:33:32,  2.04s/it][A
Training...:  67% 9383/13907 [5:58:56<2:31:00,  2.00s/it][A
Training...:  67% 9384/13907 [5:58:58<2:28:21,  1.97s/it][A
Training...:  67% 9385/13907 [5:58:59<2:26:05,  1.94s/it][A
Training...:  67% 9386/13907 [5:59:01<2:23:38,  1.91s/it][A
Training...:  67% 9387/13907 [5:59:03<2:21:22,  1.88s/it][A
Training...:  68% 9388/13907 [5:59:05<2:19:00,  1.85s/it][A
Training...:  68% 9389/13907 [5:59:07<2:16:38,  1.81s/it][A
Training...:  68% 9390/13907 [5:59:08<2:14:52,  1.79s/it][A
Training...:  68% 9391/13907 [5:59:10<2:12:19,  1.76s/it][A
Training...:  68% 9392/13907 [5:59:12<2:09:15,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:41:25<26:06:17, 31325.86s/it]
Training...:  68% 9392/13907 [5:59:14<2:09:15,  1.72s/it][A
Training...:  68% 9393/13907 [5:59:14<2:13:28,  1.77s/it][A
Training...:  68% 9394/13907 [5:59:15<2:10:11,  1.73s/it][A
Training...:  68% 9395/13907 [5:59:17<2:05:35,  1.67s/it][A
Training...:  68% 9396/13907 [5:59:18<2:00:29,  1.60s/it][A
Training...:  68% 9397/13907 [5:59:20<1:55:33,  1.54s/it][A
Training...:  68% 9398/13907 [5:59:21<1:50:33,  1.47s/it][A
Training...:  68% 9399/13907 [5:59:22<1:45:18,  1.40s/it][A
Training...:  68% 9400/13907 [5:59:23<1:37:19,  1.30s/it][A
Training...:  68% 9401/13907 [5:59:27<2:30:16,  2.00s/it][A
Training...:  68% 9402/13907 [5:59:30<3:02:57,  2.44s/it][A
Training...:  68% 9403/13907 [5:59:34<3:20:42,  2.67s/it][A
Training...:  68% 9404/13907 [5:59:37<3:30:05,  2.80s/it][A
Training...:  68% 9405/13907 [5:59:40<3:35:42,  2.87s/it][A
Training...:  68% 9406/13907 [5:59:43<3:37:44,  2.90s/it][A
Training...:  68% 9407/13907 [5:59:46<3:37:46,  2.90s/it][A
Training...:  68% 9408/13907 [5:59:48<3:36:04,  2.88s/it][A
Training...:  68% 9409/13907 [5:59:51<3:33:33,  2.85s/it][A
Training...:  68% 9410/13907 [5:59:54<3:31:21,  2.82s/it][A
Training...:  68% 9411/13907 [5:59:57<3:28:05,  2.78s/it][A
Training...:  68% 9412/13907 [5:59:59<3:24:26,  2.73s/it][A
Training...:  68% 9413/13907 [6:00:02<3:21:42,  2.69s/it][A
Training...:  68% 9414/13907 [6:00:04<3:18:40,  2.65s/it][A
Training...:  68% 9415/13907 [6:00:07<3:15:21,  2.61s/it][A
Training...:  68% 9416/13907 [6:00:09<3:13:45,  2.59s/it][A
Training...:  68% 9417/13907 [6:00:12<3:11:19,  2.56s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:42:26<26:06:17, 31325.86s/it]
Training...:  68% 9417/13907 [6:00:15<3:11:19,  2.56s/it][A
Training...:  68% 9418/13907 [6:00:15<3:18:24,  2.65s/it][A
Training...:  68% 9419/13907 [6:00:17<3:14:37,  2.60s/it][A
Training...:  68% 9420/13907 [6:00:20<3:09:42,  2.54s/it][A
Training...:  68% 9421/13907 [6:00:22<3:04:28,  2.47s/it][A
Training...:  68% 9422/13907 [6:00:24<3:00:01,  2.41s/it][A
Training...:  68% 9423/13907 [6:00:26<2:56:19,  2.36s/it][A
Training...:  68% 9424/13907 [6:00:29<2:53:32,  2.32s/it][A
Training...:  68% 9425/13907 [6:00:31<2:50:31,  2.28s/it][A
Training...:  68% 9426/13907 [6:00:33<2:47:10,  2.24s/it][A
Training...:  68% 9427/13907 [6:00:35<2:44:14,  2.20s/it][A
Training...:  68% 9428/13907 [6:00:37<2:41:57,  2.17s/it][A
Training...:  68% 9429/13907 [6:00:39<2:39:59,  2.14s/it][A
Training...:  68% 9430/13907 [6:00:41<2:37:05,  2.11s/it][A
Training...:  68% 9431/13907 [6:00:43<2:35:28,  2.08s/it][A
Training...:  68% 9432/13907 [6:00:45<2:32:43,  2.05s/it][A
Training...:  68% 9433/13907 [6:00:47<2:30:59,  2.02s/it][A
Training...:  68% 9434/13907 [6:00:49<2:28:17,  1.99s/it][A
Training...:  68% 9435/13907 [6:00:51<2:26:18,  1.96s/it][A
Training...:  68% 9436/13907 [6:00:53<2:23:15,  1.92s/it][A
Training...:  68% 9437/13907 [6:00:55<2:20:40,  1.89s/it][A
Training...:  68% 9438/13907 [6:00:56<2:17:56,  1.85s/it][A
Training...:  68% 9439/13907 [6:00:58<2:15:31,  1.82s/it][A
Training...:  68% 9440/13907 [6:01:00<2:12:35,  1.78s/it][A
Training...:  68% 9441/13907 [6:01:02<2:09:53,  1.75s/it][A
Training...:  68% 9442/13907 [6:01:03<2:07:06,  1.71s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:43:16<26:06:17, 31325.86s/it]
Training...:  68% 9442/13907 [6:01:05<2:07:06,  1.71s/it][A
Training...:  68% 9443/13907 [6:01:05<2:11:36,  1.77s/it][A
Training...:  68% 9444/13907 [6:01:07<2:08:21,  1.73s/it][A
Training...:  68% 9445/13907 [6:01:08<2:03:59,  1.67s/it][A
Training...:  68% 9446/13907 [6:01:10<1:59:12,  1.60s/it][A
Training...:  68% 9447/13907 [6:01:11<1:54:57,  1.55s/it][A
Training...:  68% 9448/13907 [6:01:12<1:50:16,  1.48s/it][A
Training...:  68% 9449/13907 [6:01:14<1:44:59,  1.41s/it][A
Training...:  68% 9450/13907 [6:01:15<1:36:49,  1.30s/it][A
Training...:  68% 9451/13907 [6:01:18<2:29:54,  2.02s/it][A
Training...:  68% 9452/13907 [6:01:22<3:03:07,  2.47s/it][A
Training...:  68% 9453/13907 [6:01:25<3:21:11,  2.71s/it][A
Training...:  68% 9454/13907 [6:01:28<3:30:39,  2.84s/it][A
Training...:  68% 9455/13907 [6:01:32<3:36:44,  2.92s/it][A
Training...:  68% 9456/13907 [6:01:35<3:38:28,  2.95s/it][A
Training...:  68% 9457/13907 [6:01:37<3:38:29,  2.95s/it][A
Training...:  68% 9458/13907 [6:01:40<3:36:43,  2.92s/it][A
Training...:  68% 9459/13907 [6:01:43<3:34:08,  2.89s/it][A
Training...:  68% 9460/13907 [6:01:46<3:30:56,  2.85s/it][A
Training...:  68% 9461/13907 [6:01:49<3:27:41,  2.80s/it][A
Training...:  68% 9462/13907 [6:01:51<3:24:12,  2.76s/it][A
Training...:  68% 9463/13907 [6:01:54<3:20:29,  2.71s/it][A
Training...:  68% 9464/13907 [6:01:56<3:16:34,  2.65s/it][A
Training...:  68% 9465/13907 [6:01:59<3:14:33,  2.63s/it][A
Training...:  68% 9466/13907 [6:02:01<3:13:04,  2.61s/it][A
Training...:  68% 9467/13907 [6:02:04<3:09:20,  2.56s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:44:18<26:06:17, 31325.86s/it]
Training...:  68% 9467/13907 [6:02:07<3:09:20,  2.56s/it][A
Training...:  68% 9468/13907 [6:02:07<3:14:48,  2.63s/it][A
Training...:  68% 9469/13907 [6:02:09<3:10:10,  2.57s/it][A
Training...:  68% 9470/13907 [6:02:12<3:05:04,  2.50s/it][A
Training...:  68% 9471/13907 [6:02:14<3:01:03,  2.45s/it][A
Training...:  68% 9472/13907 [6:02:16<2:56:41,  2.39s/it][A
Training...:  68% 9473/13907 [6:02:18<2:53:03,  2.34s/it][A
Training...:  68% 9474/13907 [6:02:20<2:49:21,  2.29s/it][A
Training...:  68% 9475/13907 [6:02:23<2:46:57,  2.26s/it][A
Training...:  68% 9476/13907 [6:02:25<2:43:31,  2.21s/it][A
Training...:  68% 9477/13907 [6:02:27<2:40:56,  2.18s/it][A
Training...:  68% 9478/13907 [6:02:29<2:38:25,  2.15s/it][A
Training...:  68% 9479/13907 [6:02:31<2:36:01,  2.11s/it][A
Training...:  68% 9480/13907 [6:02:33<2:33:42,  2.08s/it][A
Training...:  68% 9481/13907 [6:02:35<2:31:37,  2.06s/it][A
Training...:  68% 9482/13907 [6:02:37<2:29:36,  2.03s/it][A
Training...:  68% 9483/13907 [6:02:39<2:27:24,  2.00s/it][A
Training...:  68% 9484/13907 [6:02:41<2:25:48,  1.98s/it][A
Training...:  68% 9485/13907 [6:02:43<2:24:06,  1.96s/it][A
Training...:  68% 9486/13907 [6:02:45<2:22:21,  1.93s/it][A
Training...:  68% 9487/13907 [6:02:46<2:20:15,  1.90s/it][A
Training...:  68% 9488/13907 [6:02:48<2:17:43,  1.87s/it][A
Training...:  68% 9489/13907 [6:02:50<2:15:47,  1.84s/it][A
Training...:  68% 9490/13907 [6:02:52<2:13:05,  1.81s/it][A
Training...:  68% 9491/13907 [6:02:53<2:10:59,  1.78s/it][A
Training...:  68% 9492/13907 [6:02:55<2:08:00,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:45:08<26:06:17, 31325.86s/it]
Training...:  68% 9492/13907 [6:02:57<2:08:00,  1.74s/it][A
Training...:  68% 9493/13907 [6:02:57<2:11:45,  1.79s/it][A
Training...:  68% 9494/13907 [6:02:59<2:08:12,  1.74s/it][A
Training...:  68% 9495/13907 [6:03:00<2:03:11,  1.68s/it][A
Training...:  68% 9496/13907 [6:03:02<1:58:57,  1.62s/it][A
Training...:  68% 9497/13907 [6:03:03<1:53:51,  1.55s/it][A
Training...:  68% 9498/13907 [6:03:04<1:48:14,  1.47s/it][A
Training...:  68% 9499/13907 [6:03:06<1:42:52,  1.40s/it][A
Training...:  68% 9500/13907 [6:03:07<1:35:26,  1.30s/it][A
Training...:  68% 9501/13907 [6:03:10<2:31:10,  2.06s/it][A
Training...:  68% 9502/13907 [6:03:14<3:01:35,  2.47s/it][A
Training...:  68% 9503/13907 [6:03:17<3:18:11,  2.70s/it][A
Training...:  68% 9504/13907 [6:03:20<3:27:10,  2.82s/it][A
Training...:  68% 9505/13907 [6:03:23<3:32:39,  2.90s/it][A
Training...:  68% 9506/13907 [6:03:26<3:33:22,  2.91s/it][A
Training...:  68% 9507/13907 [6:03:29<3:32:18,  2.90s/it][A
Training...:  68% 9508/13907 [6:03:32<3:30:18,  2.87s/it][A
Training...:  68% 9509/13907 [6:03:35<3:28:04,  2.84s/it][A
Training...:  68% 9510/13907 [6:03:37<3:25:24,  2.80s/it][A
Training...:  68% 9511/13907 [6:03:40<3:22:30,  2.76s/it][A
Training...:  68% 9512/13907 [6:03:43<3:19:26,  2.72s/it][A
Training...:  68% 9513/13907 [6:03:45<3:16:25,  2.68s/it][A
Training...:  68% 9514/13907 [6:03:48<3:13:16,  2.64s/it][A
Training...:  68% 9515/13907 [6:03:50<3:09:40,  2.59s/it][A
Training...:  68% 9516/13907 [6:03:53<3:06:39,  2.55s/it][A
Training...:  68% 9517/13907 [6:03:55<3:04:01,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:46:09<26:06:17, 31325.86s/it]
Training...:  68% 9517/13907 [6:03:58<3:04:01,  2.52s/it][A
Training...:  68% 9518/13907 [6:03:58<3:10:54,  2.61s/it][A
Training...:  68% 9519/13907 [6:04:00<3:07:52,  2.57s/it][A
Training...:  68% 9520/13907 [6:04:03<3:04:05,  2.52s/it][A
Training...:  68% 9521/13907 [6:04:05<2:59:22,  2.45s/it][A
Training...:  68% 9522/13907 [6:04:07<2:54:53,  2.39s/it][A
Training...:  68% 9523/13907 [6:04:10<2:50:35,  2.33s/it][A
Training...:  68% 9524/13907 [6:04:12<2:47:18,  2.29s/it][A
Training...:  68% 9525/13907 [6:04:14<2:44:24,  2.25s/it][A
Training...:  68% 9526/13907 [6:04:16<2:41:47,  2.22s/it][A
Training...:  69% 9527/13907 [6:04:18<2:39:27,  2.18s/it][A
Training...:  69% 9528/13907 [6:04:20<2:36:54,  2.15s/it][A
Training...:  69% 9529/13907 [6:04:22<2:34:17,  2.11s/it][A
Training...:  69% 9530/13907 [6:04:24<2:32:00,  2.08s/it][A
Training...:  69% 9531/13907 [6:04:26<2:29:45,  2.05s/it][A
Training...:  69% 9532/13907 [6:04:28<2:27:32,  2.02s/it][A
Training...:  69% 9533/13907 [6:04:30<2:25:07,  1.99s/it][A
Training...:  69% 9534/13907 [6:04:32<2:22:37,  1.96s/it][A
Training...:  69% 9535/13907 [6:04:34<2:20:46,  1.93s/it][A
Training...:  69% 9536/13907 [6:04:36<2:18:14,  1.90s/it][A
Training...:  69% 9537/13907 [6:04:38<2:15:55,  1.87s/it][A
Training...:  69% 9538/13907 [6:04:39<2:13:14,  1.83s/it][A
Training...:  69% 9539/13907 [6:04:41<2:11:03,  1.80s/it][A
Training...:  69% 9540/13907 [6:04:43<2:08:31,  1.77s/it][A
Training...:  69% 9541/13907 [6:04:44<2:06:38,  1.74s/it][A
Training...:  69% 9542/13907 [6:04:46<2:03:38,  1.70s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:46:59<26:06:17, 31325.86s/it]
Training...:  69% 9542/13907 [6:04:48<2:03:38,  1.70s/it][A
Training...:  69% 9543/13907 [6:04:48<2:07:55,  1.76s/it][A
Training...:  69% 9544/13907 [6:04:50<2:04:49,  1.72s/it][A
Training...:  69% 9545/13907 [6:04:51<1:59:50,  1.65s/it][A
Training...:  69% 9546/13907 [6:04:52<1:55:32,  1.59s/it][A
Training...:  69% 9547/13907 [6:04:54<1:51:16,  1.53s/it][A
Training...:  69% 9548/13907 [6:04:55<1:46:30,  1.47s/it][A
Training...:  69% 9549/13907 [6:04:56<1:41:16,  1.39s/it][A
Training...:  69% 9550/13907 [6:04:57<1:33:59,  1.29s/it][A
Training...:  69% 9551/13907 [6:05:01<2:25:55,  2.01s/it][A
Training...:  69% 9552/13907 [6:05:05<2:57:22,  2.44s/it][A
Training...:  69% 9553/13907 [6:05:08<3:15:41,  2.70s/it][A
Training...:  69% 9554/13907 [6:05:11<3:25:37,  2.83s/it][A
Training...:  69% 9555/13907 [6:05:14<3:31:38,  2.92s/it][A
Training...:  69% 9556/13907 [6:05:17<3:33:34,  2.95s/it][A
Training...:  69% 9557/13907 [6:05:20<3:34:08,  2.95s/it][A
Training...:  69% 9558/13907 [6:05:23<3:32:06,  2.93s/it][A
Training...:  69% 9559/13907 [6:05:26<3:29:44,  2.89s/it][A
Training...:  69% 9560/13907 [6:05:29<3:27:15,  2.86s/it][A
Training...:  69% 9561/13907 [6:05:31<3:26:47,  2.85s/it][A
Training...:  69% 9562/13907 [6:05:34<3:23:00,  2.80s/it][A
Training...:  69% 9563/13907 [6:05:37<3:19:40,  2.76s/it][A
Training...:  69% 9564/13907 [6:05:39<3:15:37,  2.70s/it][A
Training...:  69% 9565/13907 [6:05:42<3:12:11,  2.66s/it][A
Training...:  69% 9566/13907 [6:05:44<3:08:07,  2.60s/it][A
Training...:  69% 9567/13907 [6:05:47<3:05:04,  2.56s/it][A                                                                                                                            
                                                         [AStep... (21750 | Loss: 0.172603040933609, Learning Rate: 0.0001712181983748451, Gradient Norm: 0.8182898759841919)
Step... (21775 | Loss: 0.28741106390953064, Learning Rate: 0.00017106668383348733, Gradient Norm: 0.8629570603370667)
Step... (21800 | Loss: 0.19433113932609558, Learning Rate: 0.00017091515474021435, Gradient Norm: 1.0898921489715576)
Step... (21825 | Loss: 0.19978895783424377, Learning Rate: 0.00017076362564694136, Gradient Norm: 0.603559672832489)
Step... (21850 | Loss: 0.25643032789230347, Learning Rate: 0.00017061214020941406, Gradient Norm: 1.3921631574630737)
Step... (21875 | Loss: 0.22586874663829803, Learning Rate: 0.00017046061111614108, Gradient Norm: 0.726635217666626)
Step... (21900 | Loss: 0.21918821334838867, Learning Rate: 0.0001703090820228681, Gradient Norm: 0.7090917229652405)
Step... (21925 | Loss: 0.27094459533691406, Learning Rate: 0.0001701575965853408, Gradient Norm: 0.8510596752166748)
Step... (21950 | Loss: 0.3050001263618469, Learning Rate: 0.00017000606749206781, Gradient Norm: 1.5052688121795654)
Step... (21975 | Loss: 0.19278168678283691, Learning Rate: 0.00016985453839879483, Gradient Norm: 0.6716712713241577)
Step... (22000 | Loss: 0.21842747926712036, Learning Rate: 0.00016970305296126753, Gradient Norm: 1.5727684497833252)
Step... (22025 | Loss: 0.2859988212585449, Learning Rate: 0.00016955152386799455, Gradient Norm: 0.8637511730194092)
Step... (22050 | Loss: 0.30963796377182007, Learning Rate: 0.00016939999477472156, Gradient Norm: 1.4604251384735107)
Step... (22075 | Loss: 0.2145845890045166, Learning Rate: 0.00016924850933719426, Gradient Norm: 0.7006728649139404)
Step... (22100 | Loss: 0.24151360988616943, Learning Rate: 0.00016909698024392128, Gradient Norm: 1.0732003450393677)
Step... (22125 | Loss: 0.208909273147583, Learning Rate: 0.0001689454511506483, Gradient Norm: 0.7146475315093994)
Step... (22150 | Loss: 0.21716982126235962, Learning Rate: 0.000168793965713121, Gradient Norm: 0.9439048767089844)
Step... (22175 | Loss: 0.23661556839942932, Learning Rate: 0.000168642436619848, Gradient Norm: 0.8217257261276245)
Step... (22200 | Loss: 0.19950604438781738, Learning Rate: 0.00016849090752657503, Gradient Norm: 0.8563954830169678)
Step... (22225 | Loss: 0.24210800230503082, Learning Rate: 0.00016833942208904773, Gradient Norm: 0.7135978937149048)
Step... (22250 | Loss: 0.19014833867549896, Learning Rate: 0.00016818789299577475, Gradient Norm: 1.2214293479919434)
Step... (22275 | Loss: 0.2625007927417755, Learning Rate: 0.00016803636390250176, Gradient Norm: 0.8900808095932007)
Step... (22300 | Loss: 0.2723848521709442, Learning Rate: 0.00016788486391305923, Gradient Norm: 1.0678054094314575)
Step... (22325 | Loss: 0.2711266875267029, Learning Rate: 0.00016773334937170148, Gradient Norm: 0.8572572469711304)
Step... (22350 | Loss: 0.2440539002418518, Learning Rate: 0.0001675818202784285, Gradient Norm: 1.3352866172790527)
Step... (22375 | Loss: 0.21077783405780792, Learning Rate: 0.00016743030573707074, Gradient Norm: 0.7386083602905273)
Step... (22400 | Loss: 0.22796864807605743, Learning Rate: 0.00016727879119571298, Gradient Norm: 0.9985126852989197)
Step... (22425 | Loss: 0.1810207962989807, Learning Rate: 0.00016712727665435523, Gradient Norm: 1.023755669593811)
Step... (22450 | Loss: 0.19036176800727844, Learning Rate: 0.00016697576211299747, Gradient Norm: 0.8811874985694885)
Step... (22475 | Loss: 0.2690540850162506, Learning Rate: 0.00016682424757163972, Gradient Norm: 0.8893904089927673)
Step... (22500 | Loss: 0.1920650750398636, Learning Rate: 0.00016667273303028196, Gradient Norm: 1.08561110496521)
Step... (22525 | Loss: 0.2105560004711151, Learning Rate: 0.0001665212184889242, Gradient Norm: 0.716235339641571)
Step... (22550 | Loss: 0.2640616297721863, Learning Rate: 0.00016636970394756645, Gradient Norm: 1.5179572105407715)
Step... (22575 | Loss: 0.2336740493774414, Learning Rate: 0.00016621817485429347, Gradient Norm: 0.7486419677734375)
Step... (22600 | Loss: 0.23784410953521729, Learning Rate: 0.00016606667486485094,Epoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:48:01<26:06:17, 31325.86s/it]
Training...:  69% 9567/13907 [6:05:50<3:05:04,  2.56s/it][A
Training...:  69% 9568/13907 [6:05:50<3:11:05,  2.64s/it][A Gradient Norm: 1.0217671394348145)
Step... (22625 | Loss: 0.20351162552833557, Learning Rate: 0.00016591516032349318, Gradient Norm: 0.5569616556167603)
Step... (22650 | Loss: 0.2726372480392456, Learning Rate: 0.0001657636312302202, Gradient Norm: 1.397064208984375)
Step... (22675 | Loss: 0.17325666546821594, Learning Rate: 0.00016561213124077767, Gradient Norm: 0.6837886571884155)
Step... (22700 | Loss: 0.27073532342910767, Learning Rate: 0.00016546061669941992, Gradient Norm: 1.0614981651306152)
Step... (22725 | Loss: 0.2097042202949524, Learning Rate: 0.00016530908760614693, Gradient Norm: 0.788823127746582)
Step... (22750 | Loss: 0.17053638398647308, Learning Rate: 0.0001651575876167044, Gradient Norm: 0.8722928762435913)
Step... (22775 | Loss: 0.2149391770362854, Learning Rate: 0.00016500607307534665, Gradient Norm: 0.911893904209137)
Step... (22800 | Loss: 0.21752333641052246, Learning Rate: 0.00016485454398207366, Gradient Norm: 1.1503536701202393)
Step... (22825 | Loss: 0.1926650106906891, Learning Rate: 0.00016470304399263114, Gradient Norm: 0.7674553394317627)
Step... (22850 | Loss: 0.21392622590065002, Learning Rate: 0.00016455152945127338, Gradient Norm: 1.1742664575576782)
Step... (22875 | Loss: 0.20509685575962067, Learning Rate: 0.0001644000003580004, Gradient Norm: 0.6671639680862427)
Step... (22900 | Loss: 0.20265081524848938, Learning Rate: 0.00016424848581664264, Gradient Norm: 0.8948095440864563)
Step... (22925 | Loss: 0.25169527530670166, Learning Rate: 0.00016409698582720011, Gradient Norm: 1.092542290687561)
Step... (22950 | Loss: 0.2553783357143402, Learning Rate: 0.00016394545673392713, Gradient Norm: 1.429316520690918)
Step... (22975 | Loss: 0.24272216856479645, Learning Rate: 0.00016379394219256938, Gradient Norm: 0.6799519062042236)
Step... (23000 | Loss: 0.19309376180171967, Learning Rate: 0.00016364244220312685, Gradient Norm: 0.8885222673416138)
Step... (23025 | Loss: 0.18870045244693756, Learning Rate: 0.00016349091310985386, Gradient Norm: 0.6905677914619446)
Step... (23050 | Loss: 0.23356854915618896, Learning Rate: 0.0001633393985684961, Gradient Norm: 1.1057438850402832)
Step... (23075 | Loss: 0.2227230668067932, Learning Rate: 0.00016318789857905358, Gradient Norm: 0.639337956905365)
Step... (23100 | Loss: 0.23761048913002014, Learning Rate: 0.0001630363694857806, Gradient Norm: 1.8391278982162476)
Step... (23125 | Loss: 0.28704631328582764, Learning Rate: 0.00016288485494442284, Gradient Norm: 0.9359624981880188)
Step... (23150 | Loss: 0.28969621658325195, Learning Rate: 0.00016273335495498031, Gradient Norm: 1.0436270236968994)
Step... (23175 | Loss: 0.23256883025169373, Learning Rate: 0.00016258182586170733, Gradient Norm: 0.8617235422134399)
Step... (23200 | Loss: 0.2013678252696991, Learning Rate: 0.00016243031132034957, Gradient Norm: 1.222065806388855)
Step... (23225 | Loss: 0.2409060150384903, Learning Rate: 0.00016227879677899182, Gradient Norm: 0.8981244564056396)
Step... (23250 | Loss: 0.26549357175827026, Learning Rate: 0.00016212728223763406, Gradient Norm: 1.0519663095474243)
Step... (23275 | Loss: 0.2804594039916992, Learning Rate: 0.0001619757676962763, Gradient Norm: 0.8450125455856323)
Step... (23300 | Loss: 0.23597705364227295, Learning Rate: 0.00016182425315491855, Gradient Norm: 0.8231200575828552)
Step... (23325 | Loss: 0.21329015493392944, Learning Rate: 0.00016167272406164557, Gradient Norm: 0.8014496564865112)
Step... (23350 | Loss: 0.23557403683662415, Learning Rate: 0.00016152122407220304, Gradient Norm: 1.2027846574783325)
Step... (23375 | Loss: 0.19078320264816284, Learning Rate: 0.00016136970953084528, Gradient Norm: 1.3132081031799316)
Step... (23400 | Loss: 0.23128220438957214, Learning Rate: 0.0001612181804375723, Gradient Norm: 1.155572772026062)
Step... (23425 | Loss: 0.3275403678417206, Learning Rate: 0.00016106668044812977, Gradient Norm: 0.9992321133613586)
Step... (23450 | Loss: 0.2065625935792923, Learning Rate: 0.00016091516590677202, Gradient Norm: 0.9061384201049805)

Training...:  69% 9569/13907 [6:05:52<3:09:28,  2.62s/it][A
Training...:  69% 9570/13907 [6:05:55<3:03:47,  2.54s/it][A
Training...:  69% 9571/13907 [6:05:57<2:59:18,  2.48s/it][A
Training...:  69% 9572/13907 [6:05:59<2:54:47,  2.42s/it][A
Training...:  69% 9573/13907 [6:06:01<2:51:17,  2.37s/it][A
Training...:  69% 9574/13907 [6:06:04<2:47:56,  2.33s/it][A
Training...:  69% 9575/13907 [6:06:06<2:45:30,  2.29s/it][A
Training...:  69% 9576/13907 [6:06:08<2:42:39,  2.25s/it][A
Training...:  69% 9577/13907 [6:06:10<2:40:39,  2.23s/it][A
Training...:  69% 9578/13907 [6:06:12<2:37:59,  2.19s/it][A
Training...:  69% 9579/13907 [6:06:14<2:36:22,  2.17s/it][A
Training...:  69% 9580/13907 [6:06:17<2:34:40,  2.14s/it][A
Training...:  69% 9581/13907 [6:06:19<2:32:20,  2.11s/it][A
Training...:  69% 9582/13907 [6:06:21<2:30:34,  2.09s/it][A
Training...:  69% 9583/13907 [6:06:23<2:28:11,  2.06s/it][A
Training...:  69% 9584/13907 [6:06:25<2:25:45,  2.02s/it][A
Training...:  69% 9585/13907 [6:06:26<2:23:39,  1.99s/it][A
Training...:  69% 9586/13907 [6:06:28<2:20:57,  1.96s/it][A
Training...:  69% 9587/13907 [6:06:30<2:18:44,  1.93s/it][A
Training...:  69% 9588/13907 [6:06:32<2:16:19,  1.89s/it][A
Training...:  69% 9589/13907 [6:06:34<2:13:31,  1.86s/it][A
Training...:  69% 9590/13907 [6:06:36<2:11:12,  1.82s/it][A
Training...:  69% 9591/13907 [6:06:37<2:09:00,  1.79s/it][A
Training...:  69% 9592/13907 [6:06:39<2:06:21,  1.76s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:48:52<26:06:17, 31325.86s/it]
Training...:  69% 9592/13907 [6:06:41<2:06:21,  1.76s/it][A
Training...:  69% 9593/13907 [6:06:41<2:10:18,  1.81s/it][A
Training...:  69% 9594/13907 [6:06:43<2:06:49,  1.76s/it][A
Training...:  69% 9595/13907 [6:06:44<2:02:38,  1.71s/it][A
Training...:  69% 9596/13907 [6:06:46<1:57:26,  1.63s/it][A
Training...:  69% 9597/13907 [6:06:47<1:53:16,  1.58s/it][A
Training...:  69% 9598/13907 [6:06:48<1:48:34,  1.51s/it][A
Training...:  69% 9599/13907 [6:06:50<1:42:46,  1.43s/it][A
Training...:  69% 9600/13907 [6:06:51<1:35:15,  1.33s/it][A
Training...:  69% 9601/13907 [6:06:54<2:27:45,  2.06s/it][A
Training...:  69% 9602/13907 [6:06:58<2:57:32,  2.47s/it][A
Training...:  69% 9603/13907 [6:07:01<3:13:42,  2.70s/it][A
Training...:  69% 9604/13907 [6:07:04<3:22:07,  2.82s/it][A
Training...:  69% 9605/13907 [6:07:07<3:26:02,  2.87s/it][A
Training...:  69% 9606/13907 [6:07:10<3:26:59,  2.89s/it][A
Training...:  69% 9607/13907 [6:07:13<3:26:14,  2.88s/it][A
Training...:  69% 9608/13907 [6:07:16<3:23:31,  2.84s/it][A
Training...:  69% 9609/13907 [6:07:19<3:22:02,  2.82s/it][A
Training...:  69% 9610/13907 [6:07:21<3:19:10,  2.78s/it][A
Training...:  69% 9611/13907 [6:07:24<3:16:08,  2.74s/it][A
Training...:  69% 9612/13907 [6:07:26<3:13:12,  2.70s/it][A
Training...:  69% 9613/13907 [6:07:29<3:10:50,  2.67s/it][A
Training...:  69% 9614/13907 [6:07:32<3:07:21,  2.62s/it][A
Training...:  69% 9615/13907 [6:07:34<3:04:49,  2.58s/it][A
Training...:  69% 9616/13907 [6:07:37<3:02:09,  2.55s/it][A
Training...:  69% 9617/13907 [6:07:39<2:59:41,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:49:53<26:06:17, 31325.86s/it]
Training...:  69% 9617/13907 [6:07:42<2:59:41,  2.51s/it][A
Training...:  69% 9618/13907 [6:07:42<3:06:48,  2.61s/it][A
Training...:  69% 9619/13907 [6:07:44<3:03:25,  2.57s/it][A
Training...:  69% 9620/13907 [6:07:47<2:59:15,  2.51s/it][A
Training...:  69% 9621/13907 [6:07:49<2:55:28,  2.46s/it][A
Training...:  69% 9622/13907 [6:07:51<2:51:30,  2.40s/it][A
Training...:  69% 9623/13907 [6:07:53<2:47:54,  2.35s/it][A
Training...:  69% 9624/13907 [6:07:56<2:44:55,  2.31s/it][A
Training...:  69% 9625/13907 [6:07:58<2:42:29,  2.28s/it][A
Training...:  69% 9626/13907 [6:08:00<2:39:54,  2.24s/it][A
Training...:  69% 9627/13907 [6:08:02<2:39:04,  2.23s/it][A
Training...:  69% 9628/13907 [6:08:04<2:36:49,  2.20s/it][A
Training...:  69% 9629/13907 [6:08:06<2:34:19,  2.16s/it][A
Training...:  69% 9630/13907 [6:08:08<2:31:44,  2.13s/it][A
Training...:  69% 9631/13907 [6:08:11<2:29:10,  2.09s/it][A
Training...:  69% 9632/13907 [6:08:12<2:26:50,  2.06s/it][A
Training...:  69% 9633/13907 [6:08:14<2:24:40,  2.03s/it][A
Training...:  69% 9634/13907 [6:08:16<2:22:21,  2.00s/it][A
Training...:  69% 9635/13907 [6:08:18<2:20:00,  1.97s/it][A
Training...:  69% 9636/13907 [6:08:20<2:17:38,  1.93s/it][A
Training...:  69% 9637/13907 [6:08:22<2:14:56,  1.90s/it][A
Training...:  69% 9638/13907 [6:08:24<2:12:31,  1.86s/it][A
Training...:  69% 9639/13907 [6:08:25<2:09:54,  1.83s/it][A
Training...:  69% 9640/13907 [6:08:27<2:07:12,  1.79s/it][A
Training...:  69% 9641/13907 [6:08:29<2:04:49,  1.76s/it][A
Training...:  69% 9642/13907 [6:08:30<2:02:36,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:50:44<26:06:17, 31325.86s/it]
Training...:  69% 9642/13907 [6:08:32<2:02:36,  1.72s/it][A
Training...:  69% 9643/13907 [6:08:32<2:06:43,  1.78s/it][A
Training...:  69% 9644/13907 [6:08:34<2:03:21,  1.74s/it][A
Training...:  69% 9645/13907 [6:08:36<1:58:39,  1.67s/it][A
Training...:  69% 9646/13907 [6:08:37<1:53:49,  1.60s/it][A
Training...:  69% 9647/13907 [6:08:38<1:49:13,  1.54s/it][A
Training...:  69% 9648/13907 [6:08:40<1:43:58,  1.46s/it][A
Training...:  69% 9649/13907 [6:08:41<1:38:47,  1.39s/it][A
Training...:  69% 9650/13907 [6:08:42<1:31:41,  1.29s/it][A
Training...:  69% 9651/13907 [6:08:46<2:23:22,  2.02s/it][A
Training...:  69% 9652/13907 [6:08:49<2:53:35,  2.45s/it][A
Training...:  69% 9653/13907 [6:08:52<3:10:31,  2.69s/it][A
Training...:  69% 9654/13907 [6:08:56<3:20:27,  2.83s/it][A
Training...:  69% 9655/13907 [6:08:59<3:25:13,  2.90s/it][A
Training...:  69% 9656/13907 [6:09:02<3:25:39,  2.90s/it][A
Training...:  69% 9657/13907 [6:09:04<3:24:46,  2.89s/it][A
Training...:  69% 9658/13907 [6:09:07<3:23:00,  2.87s/it][A
Training...:  69% 9659/13907 [6:09:10<3:20:47,  2.84s/it][A
Training...:  69% 9660/13907 [6:09:13<3:18:18,  2.80s/it][A
Training...:  69% 9661/13907 [6:09:15<3:17:16,  2.79s/it][A
Training...:  69% 9662/13907 [6:09:18<3:13:41,  2.74s/it][A
Training...:  69% 9663/13907 [6:09:21<3:09:57,  2.69s/it][A
Training...:  69% 9664/13907 [6:09:23<3:06:35,  2.64s/it][A
Training...:  69% 9665/13907 [6:09:26<3:04:26,  2.61s/it][A
Training...:  70% 9666/13907 [6:09:28<3:01:13,  2.56s/it][A
Training...:  70% 9667/13907 [6:09:31<2:58:24,  2.52s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:51:45<26:06:17, 31325.86s/it]
Training...:  70% 9667/13907 [6:09:33<2:58:24,  2.52s/it][A
Training...:  70% 9668/13907 [6:09:33<3:04:57,  2.62s/it][A
Training...:  70% 9669/13907 [6:09:36<3:01:51,  2.57s/it][A
Training...:  70% 9670/13907 [6:09:38<2:56:51,  2.50s/it][A
Training...:  70% 9671/13907 [6:09:41<2:53:42,  2.46s/it][A
Training...:  70% 9672/13907 [6:09:43<2:50:59,  2.42s/it][A
Training...:  70% 9673/13907 [6:09:45<2:46:59,  2.37s/it][A
Training...:  70% 9674/13907 [6:09:47<2:42:37,  2.31s/it][A
Training...:  70% 9675/13907 [6:09:49<2:39:13,  2.26s/it][A
Training...:  70% 9676/13907 [6:09:52<2:36:34,  2.22s/it][A
Training...:  70% 9677/13907 [6:09:54<2:34:30,  2.19s/it][A
Training...:  70% 9678/13907 [6:09:56<2:32:05,  2.16s/it][A
Training...:  70% 9679/13907 [6:09:58<2:29:42,  2.12s/it][A
Training...:  70% 9680/13907 [6:10:00<2:28:08,  2.10s/it][A
Training...:  70% 9681/13907 [6:10:02<2:26:11,  2.08s/it][A
Training...:  70% 9682/13907 [6:10:04<2:23:58,  2.04s/it][A
Training...:  70% 9683/13907 [6:10:06<2:21:34,  2.01s/it][A
Training...:  70% 9684/13907 [6:10:08<2:19:00,  1.97s/it][A
Training...:  70% 9685/13907 [6:10:10<2:17:04,  1.95s/it][A
Training...:  70% 9686/13907 [6:10:11<2:14:23,  1.91s/it][A
Training...:  70% 9687/13907 [6:10:13<2:12:20,  1.88s/it][A
Training...:  70% 9688/13907 [6:10:15<2:10:32,  1.86s/it][A
Training...:  70% 9689/13907 [6:10:17<2:08:34,  1.83s/it][A
Training...:  70% 9690/13907 [6:10:18<2:06:15,  1.80s/it][A
Training...:  70% 9691/13907 [6:10:20<2:03:57,  1.76s/it][A
Training...:  70% 9692/13907 [6:10:22<2:01:14,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:52:35<26:06:17, 31325.86s/it]
Training...:  70% 9692/13907 [6:10:24<2:01:14,  1.73s/it][A
Training...:  70% 9693/13907 [6:10:24<2:05:31,  1.79s/it][A
Training...:  70% 9694/13907 [6:10:25<2:02:50,  1.75s/it][A
Training...:  70% 9695/13907 [6:10:27<1:59:19,  1.70s/it][A
Training...:  70% 9696/13907 [6:10:28<1:54:27,  1.63s/it][A
Training...:  70% 9697/13907 [6:10:30<1:49:56,  1.57s/it][A
Training...:  70% 9698/13907 [6:10:31<1:45:38,  1.51s/it][A
Training...:  70% 9699/13907 [6:10:32<1:40:08,  1.43s/it][A
Training...:  70% 9700/13907 [6:10:34<1:31:42,  1.31s/it][A
Training...:  70% 9701/13907 [6:10:37<2:23:15,  2.04s/it][A
Training...:  70% 9702/13907 [6:10:41<2:54:50,  2.49s/it][A
Training...:  70% 9703/13907 [6:10:44<3:10:27,  2.72s/it][A
Training...:  70% 9704/13907 [6:10:47<3:18:45,  2.84s/it][A
Training...:  70% 9705/13907 [6:10:50<3:22:32,  2.89s/it][A
Training...:  70% 9706/13907 [6:10:53<3:23:33,  2.91s/it][A
Training...:  70% 9707/13907 [6:10:56<3:24:02,  2.91s/it][A
Training...:  70% 9708/13907 [6:10:59<3:22:56,  2.90s/it][A
Training...:  70% 9709/13907 [6:11:02<3:20:49,  2.87s/it][A
Training...:  70% 9710/13907 [6:11:04<3:17:40,  2.83s/it][A
Training...:  70% 9711/13907 [6:11:07<3:14:30,  2.78s/it][A
Training...:  70% 9712/13907 [6:11:10<3:11:24,  2.74s/it][A
Training...:  70% 9713/13907 [6:11:12<3:08:25,  2.70s/it][A
Training...:  70% 9714/13907 [6:11:15<3:05:12,  2.65s/it][A
Training...:  70% 9715/13907 [6:11:17<3:02:22,  2.61s/it][A
Training...:  70% 9716/13907 [6:11:20<2:59:21,  2.57s/it][A
Training...:  70% 9717/13907 [6:11:22<2:56:39,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:53:36<26:06:17, 31325.86s/it]
Training...:  70% 9717/13907 [6:11:25<2:56:39,  2.53s/it][A
Training...:  70% 9718/13907 [6:11:25<3:03:08,  2.62s/it][A
Training...:  70% 9719/13907 [6:11:28<3:00:12,  2.58s/it][A
Training...:  70% 9720/13907 [6:11:30<2:55:12,  2.51s/it][A
Training...:  70% 9721/13907 [6:11:32<2:51:40,  2.46s/it][A
Training...:  70% 9722/13907 [6:11:35<2:47:46,  2.41s/it][A
Training...:  70% 9723/13907 [6:11:37<2:44:40,  2.36s/it][A
Training...:  70% 9724/13907 [6:11:39<2:41:40,  2.32s/it][A
Training...:  70% 9725/13907 [6:11:41<2:38:56,  2.28s/it][A
Training...:  70% 9726/13907 [6:11:44<2:37:14,  2.26s/it][A
Training...:  70% 9727/13907 [6:11:46<2:35:39,  2.23s/it][A
Training...:  70% 9728/13907 [6:11:48<2:33:54,  2.21s/it][A
Training...:  70% 9729/13907 [6:11:50<2:32:34,  2.19s/it][A
Training...:  70% 9730/13907 [6:11:52<2:30:18,  2.16s/it][A
Training...:  70% 9731/13907 [6:11:54<2:28:04,  2.13s/it][A
Training...:  70% 9732/13907 [6:11:56<2:25:22,  2.09s/it][A
Training...:  70% 9733/13907 [6:11:58<2:23:51,  2.07s/it][A
Training...:  70% 9734/13907 [6:12:00<2:21:25,  2.03s/it][A
Training...:  70% 9735/13907 [6:12:02<2:20:16,  2.02s/it][A
Training...:  70% 9736/13907 [6:12:04<2:18:20,  1.99s/it][A
Training...:  70% 9737/13907 [6:12:06<2:15:40,  1.95s/it][A
Training...:  70% 9738/13907 [6:12:08<2:12:52,  1.91s/it][A
Training...:  70% 9739/13907 [6:12:09<2:10:30,  1.88s/it][A
Training...:  70% 9740/13907 [6:12:11<2:07:24,  1.83s/it][A
Training...:  70% 9741/13907 [6:12:13<2:04:54,  1.80s/it][A
Training...:  70% 9742/13907 [6:12:15<2:02:38,  1.77s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:54:28<26:06:17, 31325.86s/it]
Training...:  70% 9742/13907 [6:12:17<2:02:38,  1.77s/it][A
Training...:  70% 9743/13907 [6:12:17<2:06:47,  1.83s/it][A
Training...:  70% 9744/13907 [6:12:18<2:03:05,  1.77s/it][A
Training...:  70% 9745/13907 [6:12:20<1:58:13,  1.70s/it][A
Training...:  70% 9746/13907 [6:12:21<1:54:17,  1.65s/it][A
Training...:  70% 9747/13907 [6:12:23<1:49:44,  1.58s/it][A
Training...:  70% 9748/13907 [6:12:24<1:45:44,  1.53s/it][A
Training...:  70% 9749/13907 [6:12:25<1:40:40,  1.45s/it][A
Training...:  70% 9750/13907 [6:12:26<1:32:40,  1.34s/it][A
Training...:  70% 9751/13907 [6:12:30<2:20:52,  2.03s/it][A
Training...:  70% 9752/13907 [6:12:34<2:50:41,  2.46s/it][A
Training...:  70% 9753/13907 [6:12:37<3:05:52,  2.68s/it][A
Training...:  70% 9754/13907 [6:12:40<3:13:53,  2.80s/it][A
Training...:  70% 9755/13907 [6:12:43<3:18:02,  2.86s/it][A
Training...:  70% 9756/13907 [6:12:46<3:18:59,  2.88s/it][A
Training...:  70% 9757/13907 [6:12:49<3:18:08,  2.86s/it][A
Training...:  70% 9758/13907 [6:12:51<3:16:48,  2.85s/it][A
Training...:  70% 9759/13907 [6:12:54<3:15:22,  2.83s/it][A
Training...:  70% 9760/13907 [6:12:57<3:12:58,  2.79s/it][A
Training...:  70% 9761/13907 [6:13:00<3:09:49,  2.75s/it][A
Training...:  70% 9762/13907 [6:13:02<3:07:02,  2.71s/it][A
Training...:  70% 9763/13907 [6:13:05<3:04:08,  2.67s/it][A
Training...:  70% 9764/13907 [6:13:07<3:00:44,  2.62s/it][A
Training...:  70% 9765/13907 [6:13:10<2:58:03,  2.58s/it][A
Training...:  70% 9766/13907 [6:13:12<2:54:57,  2.54s/it][A
Training...:  70% 9767/13907 [6:13:15<2:53:18,  2.51s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:55:29<26:06:17, 31325.86s/it]
Training...:  70% 9767/13907 [6:13:18<2:53:18,  2.51s/it][A
Training...:  70% 9768/13907 [6:13:18<3:00:40,  2.62s/it][A
Training...:  70% 9769/13907 [6:13:20<2:56:54,  2.57s/it][A
Training...:  70% 9770/13907 [6:13:22<2:51:35,  2.49s/it][A
Training...:  70% 9771/13907 [6:13:25<2:47:39,  2.43s/it][A
Training...:  70% 9772/13907 [6:13:27<2:44:03,  2.38s/it][A
Training...:  70% 9773/13907 [6:13:29<2:40:32,  2.33s/it][A
Training...:  70% 9774/13907 [6:13:31<2:37:11,  2.28s/it][A
Training...:  70% 9775/13907 [6:13:33<2:34:32,  2.24s/it][A
Training...:  70% 9776/13907 [6:13:36<2:32:39,  2.22s/it][A
Training...:  70% 9777/13907 [6:13:38<2:30:46,  2.19s/it][A
Training...:  70% 9778/13907 [6:13:40<2:29:03,  2.17s/it][A
Training...:  70% 9779/13907 [6:13:42<2:27:06,  2.14s/it][A
Training...:  70% 9780/13907 [6:13:44<2:25:16,  2.11s/it][A
Training...:  70% 9781/13907 [6:13:46<2:22:54,  2.08s/it][A
Training...:  70% 9782/13907 [6:13:48<2:20:32,  2.04s/it][A
Training...:  70% 9783/13907 [6:13:50<2:18:40,  2.02s/it][A
Training...:  70% 9784/13907 [6:13:52<2:16:15,  1.98s/it][A
Training...:  70% 9785/13907 [6:13:54<2:15:16,  1.97s/it][A
Training...:  70% 9786/13907 [6:13:56<2:13:31,  1.94s/it][A
Training...:  70% 9787/13907 [6:13:57<2:11:08,  1.91s/it][A
Training...:  70% 9788/13907 [6:13:59<2:08:28,  1.87s/it][A
Training...:  70% 9789/13907 [6:14:01<2:06:28,  1.84s/it][A
Training...:  70% 9790/13907 [6:14:03<2:04:04,  1.81s/it][A
Training...:  70% 9791/13907 [6:14:04<2:01:47,  1.78s/it][A
Training...:  70% 9792/13907 [6:14:06<1:59:22,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:56:19<26:06:17, 31325.86s/it]
Training...:  70% 9792/13907 [6:14:08<1:59:22,  1.74s/it][A
Training...:  70% 9793/13907 [6:14:08<2:03:11,  1.80s/it][A
Training...:  70% 9794/13907 [6:14:10<1:59:55,  1.75s/it][A
Training...:  70% 9795/13907 [6:14:11<1:55:05,  1.68s/it][A
Training...:  70% 9796/13907 [6:14:13<1:50:16,  1.61s/it][A
Training...:  70% 9797/13907 [6:14:14<1:45:52,  1.55s/it][A
Training...:  70% 9798/13907 [6:14:15<1:41:07,  1.48s/it][A
Training...:  70% 9799/13907 [6:14:16<1:36:17,  1.41s/it][A
Training...:  70% 9800/13907 [6:14:18<1:29:27,  1.31s/it][A
Training...:  70% 9801/13907 [6:14:21<2:22:13,  2.08s/it][A
Training...:  70% 9802/13907 [6:14:25<2:51:44,  2.51s/it][A
Training...:  70% 9803/13907 [6:14:28<3:06:07,  2.72s/it][A
Training...:  70% 9804/13907 [6:14:31<3:15:40,  2.86s/it][A
Training...:  71% 9805/13907 [6:14:35<3:22:10,  2.96s/it][A
Training...:  71% 9806/13907 [6:14:37<3:22:03,  2.96s/it][A
Training...:  71% 9807/13907 [6:14:40<3:20:47,  2.94s/it][A
Training...:  71% 9808/13907 [6:14:43<3:18:26,  2.90s/it][A
Training...:  71% 9809/13907 [6:14:46<3:16:20,  2.87s/it][A
Training...:  71% 9810/13907 [6:14:49<3:13:34,  2.83s/it][A
Training...:  71% 9811/13907 [6:14:51<3:10:08,  2.79s/it][A
Training...:  71% 9812/13907 [6:14:54<3:07:44,  2.75s/it][A
Training...:  71% 9813/13907 [6:14:57<3:05:12,  2.71s/it][A
Training...:  71% 9814/13907 [6:14:59<3:02:42,  2.68s/it][A
Training...:  71% 9815/13907 [6:15:02<2:59:51,  2.64s/it][A
Training...:  71% 9816/13907 [6:15:04<2:56:42,  2.59s/it][A
Training...:  71% 9817/13907 [6:15:07<2:53:54,  2.55s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:57:21<26:06:17, 31325.86s/it]
Training...:  71% 9817/13907 [6:15:10<2:53:54,  2.55s/it][A
Training...:  71% 9818/13907 [6:15:10<2:59:24,  2.63s/it][A
Training...:  71% 9819/13907 [6:15:12<2:55:55,  2.58s/it][A
Training...:  71% 9820/13907 [6:15:14<2:51:06,  2.51s/it][A
Training...:  71% 9821/13907 [6:15:17<2:47:05,  2.45s/it][A
Training...:  71% 9822/13907 [6:15:19<2:43:55,  2.41s/it][A
Training...:  71% 9823/13907 [6:15:21<2:40:20,  2.36s/it][A
Training...:  71% 9824/13907 [6:15:23<2:36:54,  2.31s/it][A
Training...:  71% 9825/13907 [6:15:26<2:33:58,  2.26s/it][A
Training...:  71% 9826/13907 [6:15:28<2:31:30,  2.23s/it][A
Training...:  71% 9827/13907 [6:15:30<2:29:14,  2.19s/it][A
Training...:  71% 9828/13907 [6:15:32<2:26:51,  2.16s/it][A
Training...:  71% 9829/13907 [6:15:34<2:24:50,  2.13s/it][A
Training...:  71% 9830/13907 [6:15:36<2:23:15,  2.11s/it][A
Training...:  71% 9831/13907 [6:15:38<2:21:32,  2.08s/it][A
Training...:  71% 9832/13907 [6:15:40<2:20:29,  2.07s/it][A
Training...:  71% 9833/13907 [6:15:42<2:17:57,  2.03s/it][A
Training...:  71% 9834/13907 [6:15:44<2:15:27,  2.00s/it][A
Training...:  71% 9835/13907 [6:15:46<2:14:49,  1.99s/it][A
Training...:  71% 9836/13907 [6:15:48<2:11:56,  1.94s/it][A
Training...:  71% 9837/13907 [6:15:50<2:09:41,  1.91s/it][A
Training...:  71% 9838/13907 [6:15:51<2:06:51,  1.87s/it][A
Training...:  71% 9839/13907 [6:15:53<2:04:12,  1.83s/it][A
Training...:  71% 9840/13907 [6:15:55<2:01:38,  1.79s/it][A
Training...:  71% 9841/13907 [6:15:57<1:59:03,  1.76s/it][A
Training...:  71% 9842/13907 [6:15:58<1:56:33,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:58:11<26:06:17, 31325.86s/it]
Training...:  71% 9842/13907 [6:16:00<1:56:33,  1.72s/it][A
Training...:  71% 9843/13907 [6:16:00<2:00:27,  1.78s/it][A
Training...:  71% 9844/13907 [6:16:02<1:57:15,  1.73s/it][A
Training...:  71% 9845/13907 [6:16:03<1:52:32,  1.66s/it][A
Training...:  71% 9846/13907 [6:16:05<1:47:38,  1.59s/it][A
Training...:  71% 9847/13907 [6:16:06<1:43:14,  1.53s/it][A
Training...:  71% 9848/13907 [6:16:07<1:38:52,  1.46s/it][A
Training...:  71% 9849/13907 [6:16:09<1:34:28,  1.40s/it][A
Training...:  71% 9850/13907 [6:16:10<1:27:41,  1.30s/it][A
Training...:  71% 9851/13907 [6:16:13<2:16:34,  2.02s/it][A
Training...:  71% 9852/13907 [6:16:17<2:46:16,  2.46s/it][A
Training...:  71% 9853/13907 [6:16:20<3:02:00,  2.69s/it][A
Training...:  71% 9854/13907 [6:16:23<3:10:59,  2.83s/it][A
Training...:  71% 9855/13907 [6:16:26<3:14:55,  2.89s/it][A
Training...:  71% 9856/13907 [6:16:29<3:15:10,  2.89s/it][A
Training...:  71% 9857/13907 [6:16:32<3:14:52,  2.89s/it][A
Training...:  71% 9858/13907 [6:16:35<3:13:42,  2.87s/it][A
Training...:  71% 9859/13907 [6:16:38<3:12:09,  2.85s/it][A
Training...:  71% 9860/13907 [6:16:40<3:09:51,  2.81s/it][A
Training...:  71% 9861/13907 [6:16:43<3:06:58,  2.77s/it][A
Training...:  71% 9862/13907 [6:16:46<3:03:34,  2.72s/it][A
Training...:  71% 9863/13907 [6:16:48<3:00:18,  2.68s/it][A
Training...:  71% 9864/13907 [6:16:51<2:58:09,  2.64s/it][A
Training...:  71% 9865/13907 [6:16:53<2:56:23,  2.62s/it][A
Training...:  71% 9866/13907 [6:16:56<2:55:51,  2.61s/it][A
Training...:  71% 9867/13907 [6:16:58<2:52:35,  2.56s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [14:59:12<26:06:17, 31325.86s/it]
Training...:  71% 9867/13907 [6:17:01<2:52:35,  2.56s/it][A
Training...:  71% 9868/13907 [6:17:01<2:57:27,  2.64s/it][A
Training...:  71% 9869/13907 [6:17:04<2:53:31,  2.58s/it][A
Training...:  71% 9870/13907 [6:17:06<2:48:56,  2.51s/it][A
Training...:  71% 9871/13907 [6:17:08<2:46:23,  2.47s/it][A
Training...:  71% 9872/13907 [6:17:11<2:41:38,  2.40s/it][A
Training...:  71% 9873/13907 [6:17:13<2:38:59,  2.36s/it][A
Training...:  71% 9874/13907 [6:17:15<2:36:28,  2.33s/it][A
Training...:  71% 9875/13907 [6:17:17<2:33:40,  2.29s/it][A
Training...:  71% 9876/13907 [6:17:19<2:30:03,  2.23s/it][A
Training...:  71% 9877/13907 [6:17:22<2:27:12,  2.19s/it][A
Training...:  71% 9878/13907 [6:17:24<2:24:37,  2.15s/it][A
Training...:  71% 9879/13907 [6:17:26<2:22:27,  2.12s/it][A
Training...:  71% 9880/13907 [6:17:28<2:20:48,  2.10s/it][A
Training...:  71% 9881/13907 [6:17:30<2:19:10,  2.07s/it][A
Training...:  71% 9882/13907 [6:17:32<2:17:23,  2.05s/it][A
Training...:  71% 9883/13907 [6:17:34<2:15:26,  2.02s/it][A
Training...:  71% 9884/13907 [6:17:36<2:13:50,  2.00s/it][A
Training...:  71% 9885/13907 [6:17:38<2:11:51,  1.97s/it][A
Training...:  71% 9886/13907 [6:17:39<2:09:27,  1.93s/it][A
Training...:  71% 9887/13907 [6:17:41<2:07:24,  1.90s/it][A
Training...:  71% 9888/13907 [6:17:43<2:06:01,  1.88s/it][A
Training...:  71% 9889/13907 [6:17:45<2:04:20,  1.86s/it][A
Training...:  71% 9890/13907 [6:17:47<2:01:45,  1.82s/it][A
Training...:  71% 9891/13907 [6:17:48<1:59:07,  1.78s/it][A
Training...:  71% 9892/13907 [6:17:50<1:56:19,  1.74s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:00:03<26:06:17, 31325.86s/it]
Training...:  71% 9892/13907 [6:17:52<1:56:19,  1.74s/it][A
Training...:  71% 9893/13907 [6:17:52<2:00:08,  1.80s/it][A
Training...:  71% 9894/13907 [6:17:53<1:56:51,  1.75s/it][A
Training...:  71% 9895/13907 [6:17:55<1:52:26,  1.68s/it][A
Training...:  71% 9896/13907 [6:17:56<1:48:15,  1.62s/it][A
Training...:  71% 9897/13907 [6:17:58<1:43:25,  1.55s/it][A
Training...:  71% 9898/13907 [6:17:59<1:38:34,  1.48s/it][A
Training...:  71% 9899/13907 [6:18:00<1:33:40,  1.40s/it][A
Training...:  71% 9900/13907 [6:18:01<1:26:16,  1.29s/it][A
Training...:  71% 9901/13907 [6:18:05<2:15:16,  2.03s/it][A
Training...:  71% 9902/13907 [6:18:09<2:45:28,  2.48s/it][A
Training...:  71% 9903/13907 [6:18:12<3:02:53,  2.74s/it][A
Training...:  71% 9904/13907 [6:18:15<3:12:56,  2.89s/it][A
Training...:  71% 9905/13907 [6:18:18<3:16:31,  2.95s/it][A
Training...:  71% 9906/13907 [6:18:21<3:16:41,  2.95s/it][A
Training...:  71% 9907/13907 [6:18:24<3:15:31,  2.93s/it][A
Training...:  71% 9908/13907 [6:18:27<3:13:56,  2.91s/it][A
Training...:  71% 9909/13907 [6:18:30<3:11:28,  2.87s/it][A
Training...:  71% 9910/13907 [6:18:33<3:08:15,  2.83s/it][A
Training...:  71% 9911/13907 [6:18:35<3:05:42,  2.79s/it][A
Training...:  71% 9912/13907 [6:18:38<3:01:43,  2.73s/it][A
Training...:  71% 9913/13907 [6:18:40<2:58:53,  2.69s/it][A
Training...:  71% 9914/13907 [6:18:43<2:56:51,  2.66s/it][A
Training...:  71% 9915/13907 [6:18:46<2:54:23,  2.62s/it][A
Training...:  71% 9916/13907 [6:18:48<2:51:14,  2.57s/it][A
Training...:  71% 9917/13907 [6:18:50<2:48:32,  2.53s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:01:04<26:06:17, 31325.86s/it]
Training...:  71% 9917/13907 [6:18:53<2:48:32,  2.53s/it][A
Training...:  71% 9918/13907 [6:18:53<2:54:11,  2.62s/it][A
Training...:  71% 9919/13907 [6:18:56<2:50:41,  2.57s/it][A
Training...:  71% 9920/13907 [6:18:58<2:46:18,  2.50s/it][A
Training...:  71% 9921/13907 [6:19:00<2:42:35,  2.45s/it][A
Training...:  71% 9922/13907 [6:19:03<2:39:59,  2.41s/it][A
Training...:  71% 9923/13907 [6:19:05<2:36:54,  2.36s/it][A
Training...:  71% 9924/13907 [6:19:07<2:34:58,  2.33s/it][A
Training...:  71% 9925/13907 [6:19:09<2:32:34,  2.30s/it][A
Training...:  71% 9926/13907 [6:19:12<2:29:40,  2.26s/it][A
Training...:  71% 9927/13907 [6:19:14<2:27:01,  2.22s/it][A
Training...:  71% 9928/13907 [6:19:16<2:24:29,  2.18s/it][A
Training...:  71% 9929/13907 [6:19:18<2:22:14,  2.15s/it][A
Training...:  71% 9930/13907 [6:19:20<2:19:36,  2.11s/it][A
Training...:  71% 9931/13907 [6:19:22<2:17:29,  2.07s/it][A
Training...:  71% 9932/13907 [6:19:24<2:15:43,  2.05s/it][A
Training...:  71% 9933/13907 [6:19:26<2:14:27,  2.03s/it][A
Training...:  71% 9934/13907 [6:19:28<2:13:50,  2.02s/it][A
Training...:  71% 9935/13907 [6:19:30<2:11:48,  1.99s/it][A
Training...:  71% 9936/13907 [6:19:32<2:09:28,  1.96s/it][A
Training...:  71% 9937/13907 [6:19:34<2:06:46,  1.92s/it][A
Training...:  71% 9938/13907 [6:19:35<2:04:22,  1.88s/it][A
Training...:  71% 9939/13907 [6:19:37<2:02:02,  1.85s/it][A
Training...:  71% 9940/13907 [6:19:39<1:59:04,  1.80s/it][A
Training...:  71% 9941/13907 [6:19:40<1:57:03,  1.77s/it][A
Training...:  71% 9942/13907 [6:19:42<1:54:31,  1.73s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:01:55<26:06:17, 31325.86s/it]
Training...:  71% 9942/13907 [6:19:44<1:54:31,  1.73s/it][A
Training...:  71% 9943/13907 [6:19:44<1:58:32,  1.79s/it][A
Training...:  72% 9944/13907 [6:19:46<1:55:37,  1.75s/it][A
Training...:  72% 9945/13907 [6:19:47<1:51:15,  1.68s/it][A
Training...:  72% 9946/13907 [6:19:49<1:46:44,  1.62s/it][A
Training...:  72% 9947/13907 [6:19:50<1:43:09,  1.56s/it][A
Training...:  72% 9948/13907 [6:19:51<1:38:20,  1.49s/it][A
Training...:  72% 9949/13907 [6:19:53<1:33:12,  1.41s/it][A
Training...:  72% 9950/13907 [6:19:54<1:26:55,  1.32s/it][A
Training...:  72% 9951/13907 [6:19:58<2:16:35,  2.07s/it][A
Training...:  72% 9952/13907 [6:20:01<2:46:23,  2.52s/it][A
Training...:  72% 9953/13907 [6:20:05<3:02:28,  2.77s/it][A
Training...:  72% 9954/13907 [6:20:08<3:10:46,  2.90s/it][A
Training...:  72% 9955/13907 [6:20:11<3:14:28,  2.95s/it][A
Training...:  72% 9956/13907 [6:20:14<3:15:39,  2.97s/it][A
Training...:  72% 9957/13907 [6:20:17<3:15:10,  2.96s/it][A
Training...:  72% 9958/13907 [6:20:20<3:14:12,  2.95s/it][A
Training...:  72% 9959/13907 [6:20:23<3:11:57,  2.92s/it][A
Training...:  72% 9960/13907 [6:20:25<3:09:47,  2.89s/it][A
Training...:  72% 9961/13907 [6:20:28<3:06:51,  2.84s/it][A
Training...:  72% 9962/13907 [6:20:31<3:04:10,  2.80s/it][A
Training...:  72% 9963/13907 [6:20:33<3:01:33,  2.76s/it][A
Training...:  72% 9964/13907 [6:20:36<2:58:28,  2.72s/it][A
Training...:  72% 9965/13907 [6:20:39<2:55:23,  2.67s/it][A
Training...:  72% 9966/13907 [6:20:41<2:52:10,  2.62s/it][A
Training...:  72% 9967/13907 [6:20:44<2:50:12,  2.59s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:02:58<26:06:17, 31325.86s/it]
Training...:  72% 9967/13907 [6:20:47<2:50:12,  2.59s/it][A
Training...:  72% 9968/13907 [6:20:47<2:55:23,  2.67s/it][A
Training...:  72% 9969/13907 [6:20:49<2:52:59,  2.64s/it][A
Training...:  72% 9970/13907 [6:20:51<2:46:55,  2.54s/it][A
Training...:  72% 9971/13907 [6:20:54<2:42:12,  2.47s/it][A
Training...:  72% 9972/13907 [6:20:56<2:37:52,  2.41s/it][A
Training...:  72% 9973/13907 [6:20:58<2:35:07,  2.37s/it][A
Training...:  72% 9974/13907 [6:21:00<2:32:13,  2.32s/it][A
Training...:  72% 9975/13907 [6:21:03<2:29:31,  2.28s/it][A
Training...:  72% 9976/13907 [6:21:05<2:26:44,  2.24s/it][A
Training...:  72% 9977/13907 [6:21:07<2:24:01,  2.20s/it][A
Training...:  72% 9978/13907 [6:21:09<2:21:56,  2.17s/it][A
Training...:  72% 9979/13907 [6:21:11<2:19:38,  2.13s/it][A
Training...:  72% 9980/13907 [6:21:13<2:17:25,  2.10s/it][A
Training...:  72% 9981/13907 [6:21:15<2:15:39,  2.07s/it][A
Training...:  72% 9982/13907 [6:21:17<2:13:28,  2.04s/it][A
Training...:  72% 9983/13907 [6:21:19<2:11:49,  2.02s/it][A
Training...:  72% 9984/13907 [6:21:21<2:09:53,  1.99s/it][A
Training...:  72% 9985/13907 [6:21:23<2:07:53,  1.96s/it][A
Training...:  72% 9986/13907 [6:21:25<2:05:54,  1.93s/it][A
Training...:  72% 9987/13907 [6:21:26<2:03:40,  1.89s/it][A
Training...:  72% 9988/13907 [6:21:28<2:01:31,  1.86s/it][A
Training...:  72% 9989/13907 [6:21:30<1:59:17,  1.83s/it][A
Training...:  72% 9990/13907 [6:21:32<1:56:50,  1.79s/it][A
Training...:  72% 9991/13907 [6:21:33<1:54:57,  1.76s/it][A
Training...:  72% 9992/13907 [6:21:35<1:52:17,  1.72s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:03:48<26:06:17, 31325.86s/it]
Training...:  72% 9992/13907 [6:21:37<1:52:17,  1.72s/it][A
Training...:  72% 9993/13907 [6:21:37<1:55:56,  1.78s/it][A
Training...:  72% 9994/13907 [6:21:39<1:52:50,  1.73s/it][A
Training...:  72% 9995/13907 [6:21:40<1:49:36,  1.68s/it][A
Training...:  72% 9996/13907 [6:21:42<1:45:11,  1.61s/it][A
Training...:  72% 9997/13907 [6:21:43<1:41:14,  1.55s/it][A
Training...:  72% 9998/13907 [6:21:44<1:37:19,  1.49s/it][A
Training...:  72% 9999/13907 [6:21:46<1:32:19,  1.42s/it][A
Training...:  72% 10000/13907 [6:21:47<1:24:59,  1.31s/it][A
Training...:  72% 10001/13907 [6:21:50<2:14:47,  2.07s/it][A
Training...:  72% 10002/13907 [6:21:54<2:43:06,  2.51s/it][A
Training...:  72% 10003/13907 [6:21:57<2:59:47,  2.76s/it][A
Training...:  72% 10004/13907 [6:22:01<3:09:47,  2.92s/it][A
Training...:  72% 10005/13907 [6:22:04<3:14:21,  2.99s/it][A
Training...:  72% 10006/13907 [6:22:07<3:16:04,  3.02s/it][A
Training...:  72% 10007/13907 [6:22:10<3:15:50,  3.01s/it][A
Training...:  72% 10008/13907 [6:22:13<3:14:20,  2.99s/it][A
Training...:  72% 10009/13907 [6:22:16<3:12:30,  2.96s/it][A
Training...:  72% 10010/13907 [6:22:19<3:09:13,  2.91s/it][A
Training...:  72% 10011/13907 [6:22:21<3:06:32,  2.87s/it][A
Training...:  72% 10012/13907 [6:22:24<3:02:57,  2.82s/it][A
Training...:  72% 10013/13907 [6:22:27<3:00:06,  2.78s/it][A
Training...:  72% 10014/13907 [6:22:29<2:57:12,  2.73s/it][A
Training...:  72% 10015/13907 [6:22:32<2:54:31,  2.69s/it][A
Training...:  72% 10016/13907 [6:22:34<2:51:22,  2.64s/it][A
Training...:  72% 10017/13907 [6:22:37<2:49:18,  2.61s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:04:51<26:06:17, 31325.86s/it]
Training...:  72% 10017/13907 [6:22:40<2:49:18,  2.61s/it][A
Training...:  72% 10018/13907 [6:22:40<2:55:17,  2.70s/it][A
Training...:  72% 10019/13907 [6:22:42<2:51:18,  2.64s/it][A
Training...:  72% 10020/13907 [6:22:45<2:46:02,  2.56s/it][A
Training...:  72% 10021/13907 [6:22:47<2:41:06,  2.49s/it][A
Training...:  72% 10022/13907 [6:22:49<2:36:34,  2.42s/it][A
Training...:  72% 10023/13907 [6:22:52<2:32:22,  2.35s/it][A
Training...:  72% 10024/13907 [6:22:54<2:29:22,  2.31s/it][A
Training...:  72% 10025/13907 [6:22:56<2:26:32,  2.27s/it][A
Training...:  72% 10026/13907 [6:22:58<2:24:18,  2.23s/it][A
Training...:  72% 10027/13907 [6:23:00<2:22:17,  2.20s/it][A
Training...:  72% 10028/13907 [6:23:02<2:20:13,  2.17s/it][A
Training...:  72% 10029/13907 [6:23:04<2:18:44,  2.15s/it][A
Training...:  72% 10030/13907 [6:23:06<2:16:07,  2.11s/it][A
Training...:  72% 10031/13907 [6:23:08<2:14:09,  2.08s/it][A
Training...:  72% 10032/13907 [6:23:10<2:12:39,  2.05s/it][A
Training...:  72% 10033/13907 [6:23:12<2:10:07,  2.02s/it][A
Training...:  72% 10034/13907 [6:23:14<2:07:46,  1.98s/it][A
Training...:  72% 10035/13907 [6:23:16<2:06:07,  1.95s/it][A
Training...:  72% 10036/13907 [6:23:18<2:03:53,  1.92s/it][A
Training...:  72% 10037/13907 [6:23:20<2:02:00,  1.89s/it][A
Training...:  72% 10038/13907 [6:23:22<1:59:45,  1.86s/it][A
Training...:  72% 10039/13907 [6:23:23<1:57:32,  1.82s/it][A
Training...:  72% 10040/13907 [6:23:25<1:55:28,  1.79s/it][A
Training...:  72% 10041/13907 [6:23:27<1:53:40,  1.76s/it][A
Training...:  72% 10042/13907 [6:23:28<1:51:32,  1.73s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:05:41<26:06:17, 31325.86s/it]
Training...:  72% 10042/13907 [6:23:30<1:51:32,  1.73s/it][A
Training...:  72% 10043/13907 [6:23:30<1:55:01,  1.79s/it][A
Training...:  72% 10044/13907 [6:23:32<1:51:55,  1.74s/it][A
Training...:  72% 10045/13907 [6:23:33<1:47:41,  1.67s/it][A
Training...:  72% 10046/13907 [6:23:35<1:43:36,  1.61s/it][A
Training...:  72% 10047/13907 [6:23:36<1:39:41,  1.55s/it][A
Training...:  72% 10048/13907 [6:23:38<1:35:31,  1.49s/it][A
Training...:  72% 10049/13907 [6:23:39<1:30:48,  1.41s/it][A
Training...:  72% 10050/13907 [6:23:40<1:23:48,  1.30s/it][A
Training...:  72% 10051/13907 [6:23:44<2:10:29,  2.03s/it][A
Training...:  72% 10052/13907 [6:23:47<2:38:42,  2.47s/it][A
Training...:  72% 10053/13907 [6:23:50<2:54:01,  2.71s/it][A
Training...:  72% 10054/13907 [6:23:54<3:01:42,  2.83s/it][A
Training...:  72% 10055/13907 [6:23:57<3:08:33,  2.94s/it][A
Training...:  72% 10056/13907 [6:24:00<3:10:12,  2.96s/it][A
Training...:  72% 10057/13907 [6:24:03<3:08:26,  2.94s/it][A
Training...:  72% 10058/13907 [6:24:05<3:05:58,  2.90s/it][A
Training...:  72% 10059/13907 [6:24:08<3:03:43,  2.86s/it][A
Training...:  72% 10060/13907 [6:24:11<3:01:26,  2.83s/it][A
Training...:  72% 10061/13907 [6:24:14<2:58:26,  2.78s/it][A
Training...:  72% 10062/13907 [6:24:16<2:55:13,  2.73s/it][A
Training...:  72% 10063/13907 [6:24:19<2:52:48,  2.70s/it][A
Training...:  72% 10064/13907 [6:24:21<2:50:12,  2.66s/it][A
Training...:  72% 10065/13907 [6:24:24<2:47:31,  2.62s/it][A
Training...:  72% 10066/13907 [6:24:26<2:45:11,  2.58s/it][A
Training...:  72% 10067/13907 [6:24:29<2:42:32,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:06:43<26:06:17, 31325.86s/it]
Training...:  72% 10067/13907 [6:24:32<2:42:32,  2.54s/it][A
Training...:  72% 10068/13907 [6:24:32<2:48:04,  2.63s/it][A
Training...:  72% 10069/13907 [6:24:34<2:45:19,  2.58s/it][A
Training...:  72% 10070/13907 [6:24:37<2:41:49,  2.53s/it][A
Training...:  72% 10071/13907 [6:24:39<2:38:12,  2.47s/it][A
Training...:  72% 10072/13907 [6:24:41<2:34:34,  2.42s/it][A
Training...:  72% 10073/13907 [6:24:43<2:30:52,  2.36s/it][A
Training...:  72% 10074/13907 [6:24:46<2:27:52,  2.31s/it][A
Training...:  72% 10075/13907 [6:24:48<2:25:41,  2.28s/it][A
Training...:  72% 10076/13907 [6:24:50<2:23:28,  2.25s/it][A
Training...:  72% 10077/13907 [6:24:52<2:20:36,  2.20s/it][A
Training...:  72% 10078/13907 [6:24:54<2:18:31,  2.17s/it][A
Training...:  72% 10079/13907 [6:24:56<2:16:27,  2.14s/it][A
Training...:  72% 10080/13907 [6:24:58<2:13:55,  2.10s/it][A
Training...:  72% 10081/13907 [6:25:00<2:11:42,  2.07s/it][A
Training...:  72% 10082/13907 [6:25:02<2:09:03,  2.02s/it][A
Training...:  73% 10083/13907 [6:25:04<2:07:28,  2.00s/it][A
Training...:  73% 10084/13907 [6:25:06<2:05:24,  1.97s/it][A
Training...:  73% 10085/13907 [6:25:08<2:04:17,  1.95s/it][A
Training...:  73% 10086/13907 [6:25:10<2:02:38,  1.93s/it][A
Training...:  73% 10087/13907 [6:25:12<2:00:21,  1.89s/it][A
Training...:  73% 10088/13907 [6:25:13<1:58:17,  1.86s/it][A
Training...:  73% 10089/13907 [6:25:15<1:56:06,  1.82s/it][A
Training...:  73% 10090/13907 [6:25:17<1:53:49,  1.79s/it][A
Training...:  73% 10091/13907 [6:25:19<1:51:11,  1.75s/it][A
Training...:  73% 10092/13907 [6:25:20<1:48:50,  1.71s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:07:33<26:06:17, 31325.86s/it]
Training...:  73% 10092/13907 [6:25:22<1:48:50,  1.71s/it][A
Training...:  73% 10093/13907 [6:25:22<1:52:45,  1.77s/it][A
Training...:  73% 10094/13907 [6:25:24<1:49:48,  1.73s/it][A
Training...:  73% 10095/13907 [6:25:25<1:45:50,  1.67s/it][A
Training...:  73% 10096/13907 [6:25:27<1:42:02,  1.61s/it][A
Training...:  73% 10097/13907 [6:25:28<1:38:04,  1.54s/it][A
Training...:  73% 10098/13907 [6:25:29<1:33:31,  1.47s/it][A
Training...:  73% 10099/13907 [6:25:31<1:28:55,  1.40s/it][A
Training...:  73% 10100/13907 [6:25:32<1:21:59,  1.29s/it][A
Training...:  73% 10101/13907 [6:25:35<2:07:40,  2.01s/it][A
Training...:  73% 10102/13907 [6:25:39<2:35:30,  2.45s/it][A
Training...:  73% 10103/13907 [6:25:42<2:50:32,  2.69s/it][A
Training...:  73% 10104/13907 [6:25:45<2:59:03,  2.82s/it][A
Training...:  73% 10105/13907 [6:25:48<3:03:36,  2.90s/it][A
Training...:  73% 10106/13907 [6:25:51<3:04:20,  2.91s/it][A
Training...:  73% 10107/13907 [6:25:54<3:04:52,  2.92s/it][A
Training...:  73% 10108/13907 [6:25:57<3:03:14,  2.89s/it][A
Training...:  73% 10109/13907 [6:26:00<3:01:30,  2.87s/it][A
Training...:  73% 10110/13907 [6:26:03<2:58:30,  2.82s/it][A
Training...:  73% 10111/13907 [6:26:05<2:55:54,  2.78s/it][A
Training...:  73% 10112/13907 [6:26:08<2:53:21,  2.74s/it][A
Training...:  73% 10113/13907 [6:26:10<2:51:41,  2.72s/it][A
Training...:  73% 10114/13907 [6:26:13<2:48:39,  2.67s/it][A
Training...:  73% 10115/13907 [6:26:16<2:45:46,  2.62s/it][A
Training...:  73% 10116/13907 [6:26:18<2:43:34,  2.59s/it][A
Training...:  73% 10117/13907 [6:26:21<2:42:20,  2.57s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:08:35<26:06:17, 31325.86s/it]
Training...:  73% 10117/13907 [6:26:23<2:42:20,  2.57s/it][A
Training...:  73% 10118/13907 [6:26:23<2:47:22,  2.65s/it][A
Training...:  73% 10119/13907 [6:26:26<2:43:18,  2.59s/it][A
Training...:  73% 10120/13907 [6:26:28<2:40:01,  2.54s/it][A
Training...:  73% 10121/13907 [6:26:31<2:35:57,  2.47s/it][A
Training...:  73% 10122/13907 [6:26:33<2:33:03,  2.43s/it][A
Training...:  73% 10123/13907 [6:26:35<2:29:35,  2.37s/it][A
Training...:  73% 10124/13907 [6:26:37<2:26:19,  2.32s/it][A
Training...:  73% 10125/13907 [6:26:40<2:23:48,  2.28s/it][A
Training...:  73% 10126/13907 [6:26:42<2:20:52,  2.24s/it][A
Training...:  73% 10127/13907 [6:26:44<2:18:30,  2.20s/it][A
Training...:  73% 10128/13907 [6:26:46<2:16:23,  2.17s/it][A
Training...:  73% 10129/13907 [6:26:48<2:14:30,  2.14s/it][A
Training...:  73% 10130/13907 [6:26:50<2:12:40,  2.11s/it][A
Training...:  73% 10131/13907 [6:26:52<2:10:57,  2.08s/it][A
Training...:  73% 10132/13907 [6:26:54<2:08:32,  2.04s/it][A
Training...:  73% 10133/13907 [6:26:56<2:06:56,  2.02s/it][A
Training...:  73% 10134/13907 [6:26:58<2:04:59,  1.99s/it][A
Training...:  73% 10135/13907 [6:27:00<2:03:01,  1.96s/it][A
Training...:  73% 10136/13907 [6:27:02<2:01:12,  1.93s/it][A
Training...:  73% 10137/13907 [6:27:03<1:59:32,  1.90s/it][A
Training...:  73% 10138/13907 [6:27:05<1:57:42,  1.87s/it][A
Training...:  73% 10139/13907 [6:27:07<1:55:29,  1.84s/it][A
Training...:  73% 10140/13907 [6:27:09<1:53:20,  1.81s/it][A
Training...:  73% 10141/13907 [6:27:10<1:51:13,  1.77s/it][A
Training...:  73% 10142/13907 [6:27:12<1:48:39,  1.73s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:09:25<26:06:17, 31325.86s/it]
Training...:  73% 10142/13907 [6:27:14<1:48:39,  1.73s/it][A
Training...:  73% 10143/13907 [6:27:14<1:52:00,  1.79s/it][A
Training...:  73% 10144/13907 [6:27:16<1:48:46,  1.73s/it][A
Training...:  73% 10145/13907 [6:27:17<1:44:24,  1.67s/it][A
Training...:  73% 10146/13907 [6:27:19<1:40:10,  1.60s/it][A
Training...:  73% 10147/13907 [6:27:20<1:36:38,  1.54s/it][A
Training...:  73% 10148/13907 [6:27:21<1:32:19,  1.47s/it][A
Training...:  73% 10149/13907 [6:27:23<1:27:51,  1.40s/it][A
Training...:  73% 10150/13907 [6:27:24<1:21:07,  1.30s/it][A
Training...:  73% 10151/13907 [6:27:27<2:06:22,  2.02s/it][A
Training...:  73% 10152/13907 [6:27:31<2:34:02,  2.46s/it][A
Training...:  73% 10153/13907 [6:27:34<2:48:06,  2.69s/it][A
Training...:  73% 10154/13907 [6:27:37<2:56:23,  2.82s/it][A
Training...:  73% 10155/13907 [6:27:40<3:00:35,  2.89s/it][A
Training...:  73% 10156/13907 [6:27:43<3:01:40,  2.91s/it][A
Training...:  73% 10157/13907 [6:27:46<3:00:38,  2.89s/it][A
Training...:  73% 10158/13907 [6:27:49<2:59:12,  2.87s/it][A
Training...:  73% 10159/13907 [6:27:52<2:57:08,  2.84s/it][A
Training...:  73% 10160/13907 [6:27:54<2:54:05,  2.79s/it][A
Training...:  73% 10161/13907 [6:27:57<2:51:47,  2.75s/it][A
Training...:  73% 10162/13907 [6:27:59<2:49:09,  2.71s/it][A
Training...:  73% 10163/13907 [6:28:02<2:46:50,  2.67s/it][A
Training...:  73% 10164/13907 [6:28:05<2:44:55,  2.64s/it][A
Training...:  73% 10165/13907 [6:28:07<2:43:38,  2.62s/it][A
Training...:  73% 10166/13907 [6:28:10<2:40:24,  2.57s/it][A
Training...:  73% 10167/13907 [6:28:12<2:37:13,  2.52s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:10:26<26:06:17, 31325.86s/it]
Training...:  73% 10167/13907 [6:28:15<2:37:13,  2.52s/it][A
Training...:  73% 10168/13907 [6:28:15<2:41:39,  2.59s/it][A
Training...:  73% 10169/13907 [6:28:17<2:38:17,  2.54s/it][A
Training...:  73% 10170/13907 [6:28:20<2:34:11,  2.48s/it][A
Training...:  73% 10171/13907 [6:28:22<2:30:50,  2.42s/it][A
Training...:  73% 10172/13907 [6:28:24<2:27:47,  2.37s/it][A
Training...:  73% 10173/13907 [6:28:26<2:24:48,  2.33s/it][A
Training...:  73% 10174/13907 [6:28:29<2:22:33,  2.29s/it][A
Training...:  73% 10175/13907 [6:28:31<2:20:06,  2.25s/it][A
Training...:  73% 10176/13907 [6:28:33<2:17:47,  2.22s/it][A
Training...:  73% 10177/13907 [6:28:35<2:15:51,  2.19s/it][A
Training...:  73% 10178/13907 [6:28:37<2:13:17,  2.14s/it][A
Training...:  73% 10179/13907 [6:28:39<2:11:27,  2.12s/it][A
Training...:  73% 10180/13907 [6:28:41<2:09:34,  2.09s/it][A
Training...:  73% 10181/13907 [6:28:43<2:08:01,  2.06s/it][A
Training...:  73% 10182/13907 [6:28:45<2:06:05,  2.03s/it][A
Training...:  73% 10183/13907 [6:28:47<2:04:27,  2.01s/it][A
Training...:  73% 10184/13907 [6:28:49<2:02:47,  1.98s/it][A
Training...:  73% 10185/13907 [6:28:51<2:00:46,  1.95s/it][A
Training...:  73% 10186/13907 [6:28:53<1:58:47,  1.92s/it][A
Training...:  73% 10187/13907 [6:28:54<1:56:41,  1.88s/it][A
Training...:  73% 10188/13907 [6:28:56<1:54:30,  1.85s/it][A
Training...:  73% 10189/13907 [6:28:58<1:52:27,  1.81s/it][A
Training...:  73% 10190/13907 [6:29:00<1:50:31,  1.78s/it][A
Training...:  73% 10191/13907 [6:29:01<1:48:36,  1.75s/it][A
Training...:  73% 10192/13907 [6:29:03<1:46:26,  1.72s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:11:16<26:06:17, 31325.86s/it]
Training...:  73% 10192/13907 [6:29:05<1:46:26,  1.72s/it][A
Training...:  73% 10193/13907 [6:29:05<1:49:52,  1.77s/it][A
Training...:  73% 10194/13907 [6:29:07<1:46:56,  1.73s/it][A
Training...:  73% 10195/13907 [6:29:08<1:42:52,  1.66s/it][A
Training...:  73% 10196/13907 [6:29:09<1:38:59,  1.60s/it][A
Training...:  73% 10197/13907 [6:29:11<1:35:01,  1.54s/it][A
Training...:  73% 10198/13907 [6:29:12<1:30:47,  1.47s/it][A
Training...:  73% 10199/13907 [6:29:13<1:26:51,  1.41s/it][A
Training...:  73% 10200/13907 [6:29:15<1:20:59,  1.31s/it][A
Training...:  73% 10201/13907 [6:29:18<2:08:30,  2.08s/it][A
Training...:  73% 10202/13907 [6:29:22<2:34:55,  2.51s/it][A
Training...:  73% 10203/13907 [6:29:25<2:49:06,  2.74s/it][A
Training...:  73% 10204/13907 [6:29:28<2:56:07,  2.85s/it][A
Training...:  73% 10205/13907 [6:29:31<3:00:23,  2.92s/it][A
Training...:  73% 10206/13907 [6:29:34<3:00:41,  2.93s/it][A
Training...:  73% 10207/13907 [6:29:37<2:59:59,  2.92s/it][A
Training...:  73% 10208/13907 [6:29:40<2:58:31,  2.90s/it][A
Training...:  73% 10209/13907 [6:29:43<2:56:52,  2.87s/it][A
Training...:  73% 10210/13907 [6:29:46<2:54:29,  2.83s/it][A
Training...:  73% 10211/13907 [6:29:48<2:52:30,  2.80s/it][A
Training...:  73% 10212/13907 [6:29:51<2:50:05,  2.76s/it][A
Training...:  73% 10213/13907 [6:29:54<2:47:14,  2.72s/it][A
Training...:  73% 10214/13907 [6:29:56<2:44:45,  2.68s/it][A
Training...:  73% 10215/13907 [6:29:59<2:42:04,  2.63s/it][A
Training...:  73% 10216/13907 [6:30:01<2:39:49,  2.60s/it][A
Training...:  73% 10217/13907 [6:30:04<2:37:31,  2.56s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:12:18<26:06:17, 31325.86s/it]
Training...:  73% 10217/13907 [6:30:07<2:37:31,  2.56s/it][A
Training...:  73% 10218/13907 [6:30:07<2:42:18,  2.64s/it][A
Training...:  73% 10219/13907 [6:30:09<2:39:26,  2.59s/it][A
Training...:  73% 10220/13907 [6:30:11<2:35:29,  2.53s/it][A
Training...:  73% 10221/13907 [6:30:14<2:31:40,  2.47s/it][A
Training...:  74% 10222/13907 [6:30:16<2:29:28,  2.43s/it][A
Training...:  74% 10223/13907 [6:30:18<2:28:14,  2.41s/it][A
Training...:  74% 10224/13907 [6:30:21<2:24:40,  2.36s/it][A
Training...:  74% 10225/13907 [6:30:23<2:21:51,  2.31s/it][A
Training...:  74% 10226/13907 [6:30:25<2:18:58,  2.27s/it][A
Training...:  74% 10227/13907 [6:30:27<2:16:24,  2.22s/it][A
Training...:  74% 10228/13907 [6:30:29<2:13:54,  2.18s/it][A
Training...:  74% 10229/13907 [6:30:31<2:11:52,  2.15s/it][A
Training...:  74% 10230/13907 [6:30:33<2:10:12,  2.12s/it][A
Training...:  74% 10231/13907 [6:30:35<2:08:41,  2.10s/it][A
Training...:  74% 10232/13907 [6:30:37<2:06:40,  2.07s/it][A
Training...:  74% 10233/13907 [6:30:39<2:04:50,  2.04s/it][A
Training...:  74% 10234/13907 [6:30:41<2:02:54,  2.01s/it][A
Training...:  74% 10235/13907 [6:30:43<2:01:13,  1.98s/it][A
Training...:  74% 10236/13907 [6:30:45<1:59:16,  1.95s/it][A
Training...:  74% 10237/13907 [6:30:47<1:57:17,  1.92s/it][A
Training...:  74% 10238/13907 [6:30:49<1:55:14,  1.88s/it][A
Training...:  74% 10239/13907 [6:30:51<1:53:05,  1.85s/it][A
Training...:  74% 10240/13907 [6:30:52<1:51:10,  1.82s/it][A
Training...:  74% 10241/13907 [6:30:54<1:49:00,  1.78s/it][A
Training...:  74% 10242/13907 [6:30:56<1:47:24,  1.76s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:13:09<26:06:17, 31325.86s/it]
Training...:  74% 10242/13907 [6:30:58<1:47:24,  1.76s/it][A
Training...:  74% 10243/13907 [6:30:58<1:50:41,  1.81s/it][A
Training...:  74% 10244/13907 [6:30:59<1:47:31,  1.76s/it][A
Training...:  74% 10245/13907 [6:31:01<1:43:36,  1.70s/it][A
Training...:  74% 10246/13907 [6:31:02<1:39:43,  1.63s/it][A
Training...:  74% 10247/13907 [6:31:04<1:35:56,  1.57s/it][A
Training...:  74% 10248/13907 [6:31:05<1:31:58,  1.51s/it][A
Training...:  74% 10249/13907 [6:31:06<1:27:25,  1.43s/it][A
Training...:  74% 10250/13907 [6:31:07<1:21:20,  1.33s/it][A
Training...:  74% 10251/13907 [6:31:11<2:04:42,  2.05s/it][A
Training...:  74% 10252/13907 [6:31:15<2:31:08,  2.48s/it][A
Training...:  74% 10253/13907 [6:31:18<2:45:38,  2.72s/it][A
Training...:  74% 10254/13907 [6:31:21<2:53:26,  2.85s/it][A
Training...:  74% 10255/13907 [6:31:24<2:56:44,  2.90s/it][A
Training...:  74% 10256/13907 [6:31:27<2:57:34,  2.92s/it][A
Training...:  74% 10257/13907 [6:31:30<2:56:39,  2.90s/it][A
Training...:  74% 10258/13907 [6:31:33<2:54:15,  2.87s/it][A
Training...:  74% 10259/13907 [6:31:36<2:52:17,  2.83s/it][A
Training...:  74% 10260/13907 [6:31:38<2:51:13,  2.82s/it][A
Training...:  74% 10261/13907 [6:31:41<2:49:20,  2.79s/it][A
Training...:  74% 10262/13907 [6:31:44<2:45:46,  2.73s/it][A
Training...:  74% 10263/13907 [6:31:46<2:42:40,  2.68s/it][A
Training...:  74% 10264/13907 [6:31:49<2:39:42,  2.63s/it][A
Training...:  74% 10265/13907 [6:31:51<2:37:13,  2.59s/it][A
Training...:  74% 10266/13907 [6:31:54<2:34:37,  2.55s/it][A
Training...:  74% 10267/13907 [6:31:56<2:32:20,  2.51s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:14:10<26:06:17, 31325.86s/it]
Training...:  74% 10267/13907 [6:31:59<2:32:20,  2.51s/it][A
Training...:  74% 10268/13907 [6:31:59<2:37:30,  2.60s/it][A
Training...:  74% 10269/13907 [6:32:01<2:34:06,  2.54s/it][A
Training...:  74% 10270/13907 [6:32:04<2:29:58,  2.47s/it][A
Training...:  74% 10271/13907 [6:32:06<2:26:52,  2.42s/it][A
Training...:  74% 10272/13907 [6:32:08<2:23:34,  2.37s/it][A
Training...:  74% 10273/13907 [6:32:10<2:21:10,  2.33s/it][A
Training...:  74% 10274/13907 [6:32:13<2:18:41,  2.29s/it][A
Training...:  74% 10275/13907 [6:32:15<2:16:32,  2.26s/it][A
Training...:  74% 10276/13907 [6:32:17<2:14:06,  2.22s/it][A
Training...:  74% 10277/13907 [6:32:19<2:11:52,  2.18s/it][A
Training...:  74% 10278/13907 [6:32:21<2:09:36,  2.14s/it][A
Training...:  74% 10279/13907 [6:32:23<2:07:37,  2.11s/it][A
Training...:  74% 10280/13907 [6:32:25<2:06:01,  2.08s/it][A
Training...:  74% 10281/13907 [6:32:27<2:04:33,  2.06s/it][A
Training...:  74% 10282/13907 [6:32:29<2:02:38,  2.03s/it][A
Training...:  74% 10283/13907 [6:32:31<2:01:19,  2.01s/it][A
Training...:  74% 10284/13907 [6:32:33<1:59:39,  1.98s/it][A
Training...:  74% 10285/13907 [6:32:35<1:58:03,  1.96s/it][A
Training...:  74% 10286/13907 [6:32:37<1:56:06,  1.92s/it][A
Training...:  74% 10287/13907 [6:32:38<1:54:15,  1.89s/it][A
Training...:  74% 10288/13907 [6:32:40<1:52:13,  1.86s/it][A
Training...:  74% 10289/13907 [6:32:42<1:50:25,  1.83s/it][A
Training...:  74% 10290/13907 [6:32:44<1:48:21,  1.80s/it][A
Training...:  74% 10291/13907 [6:32:45<1:47:09,  1.78s/it][A
Training...:  74% 10292/13907 [6:32:47<1:44:34,  1.74s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:15:00<26:06:17, 31325.86s/it]
Training...:  74% 10292/13907 [6:32:49<1:44:34,  1.74s/it][A
Training...:  74% 10293/13907 [6:32:49<1:48:07,  1.80s/it][A
Training...:  74% 10294/13907 [6:32:51<1:45:19,  1.75s/it][A
Training...:  74% 10295/13907 [6:32:52<1:41:04,  1.68s/it][A
Training...:  74% 10296/13907 [6:32:54<1:36:53,  1.61s/it][A
Training...:  74% 10297/13907 [6:32:55<1:32:40,  1.54s/it][A
Training...:  74% 10298/13907 [6:32:56<1:28:52,  1.48s/it][A
Training...:  74% 10299/13907 [6:32:58<1:24:15,  1.40s/it][A
Training...:  74% 10300/13907 [6:32:59<1:17:30,  1.29s/it][A
Training...:  74% 10301/13907 [6:33:02<2:01:48,  2.03s/it][A
Training...:  74% 10302/13907 [6:33:06<2:28:35,  2.47s/it][A
Training...:  74% 10303/13907 [6:33:09<2:43:16,  2.72s/it][A
Training...:  74% 10304/13907 [6:33:12<2:50:24,  2.84s/it][A
Training...:  74% 10305/13907 [6:33:15<2:53:26,  2.89s/it][A
Training...:  74% 10306/13907 [6:33:18<2:54:19,  2.90s/it][A
Training...:  74% 10307/13907 [6:33:21<2:53:03,  2.88s/it][A
Training...:  74% 10308/13907 [6:33:24<2:51:38,  2.86s/it][A
Training...:  74% 10309/13907 [6:33:27<2:50:31,  2.84s/it][A
Training...:  74% 10310/13907 [6:33:29<2:48:17,  2.81s/it][A
Training...:  74% 10311/13907 [6:33:32<2:46:05,  2.77s/it][A
Training...:  74% 10312/13907 [6:33:35<2:43:08,  2.72s/it][A
Training...:  74% 10313/13907 [6:33:37<2:40:42,  2.68s/it][A
Training...:  74% 10314/13907 [6:33:40<2:37:46,  2.63s/it][A
Training...:  74% 10315/13907 [6:33:42<2:35:44,  2.60s/it][A
Training...:  74% 10316/13907 [6:33:45<2:33:13,  2.56s/it][A
Training...:  74% 10317/13907 [6:33:47<2:31:04,  2.52s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:16:01<26:06:17, 31325.86s/it]
Training...:  74% 10317/13907 [6:33:50<2:31:04,  2.52s/it][A
Training...:  74% 10318/13907 [6:33:50<2:36:39,  2.62s/it][A
Training...:  74% 10319/13907 [6:33:53<2:34:07,  2.58s/it][A
Training...:  74% 10320/13907 [6:33:55<2:29:50,  2.51s/it][A
Training...:  74% 10321/13907 [6:33:57<2:26:21,  2.45s/it][A
Training...:  74% 10322/13907 [6:34:00<2:24:15,  2.41s/it][A
Training...:  74% 10323/13907 [6:34:02<2:21:12,  2.36s/it][A
Training...:  74% 10324/13907 [6:34:04<2:18:09,  2.31s/it][A
Training...:  74% 10325/13907 [6:34:06<2:15:24,  2.27s/it][A
Training...:  74% 10326/13907 [6:34:08<2:12:49,  2.23s/it][A
Training...:  74% 10327/13907 [6:34:10<2:10:54,  2.19s/it][A
Training...:  74% 10328/13907 [6:34:12<2:08:47,  2.16s/it][A
Training...:  74% 10329/13907 [6:34:15<2:06:58,  2.13s/it][A
Training...:  74% 10330/13907 [6:34:17<2:05:10,  2.10s/it][A
Training...:  74% 10331/13907 [6:34:19<2:02:58,  2.06s/it][A
Training...:  74% 10332/13907 [6:34:20<2:00:57,  2.03s/it][A
Training...:  74% 10333/13907 [6:34:22<1:59:00,  2.00s/it][A
Training...:  74% 10334/13907 [6:34:24<1:57:19,  1.97s/it][A
Training...:  74% 10335/13907 [6:34:26<1:55:56,  1.95s/it][A
Training...:  74% 10336/13907 [6:34:28<1:54:22,  1.92s/it][A
Training...:  74% 10337/13907 [6:34:30<1:52:36,  1.89s/it][A
Training...:  74% 10338/13907 [6:34:32<1:51:11,  1.87s/it][A
Training...:  74% 10339/13907 [6:34:33<1:49:12,  1.84s/it][A
Training...:  74% 10340/13907 [6:34:35<1:47:39,  1.81s/it][A
Training...:  74% 10341/13907 [6:34:37<1:45:29,  1.77s/it][A
Training...:  74% 10342/13907 [6:34:39<1:43:29,  1.74s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:16:52<26:06:17, 31325.86s/it]
Training...:  74% 10342/13907 [6:34:41<1:43:29,  1.74s/it][A
Training...:  74% 10343/13907 [6:34:41<1:47:00,  1.80s/it][A
Training...:  74% 10344/13907 [6:34:42<1:44:28,  1.76s/it][A
Training...:  74% 10345/13907 [6:34:44<1:40:41,  1.70s/it][A
Training...:  74% 10346/13907 [6:34:45<1:36:24,  1.62s/it][A
Training...:  74% 10347/13907 [6:34:47<1:32:30,  1.56s/it][A
Training...:  74% 10348/13907 [6:34:48<1:28:31,  1.49s/it][A
Training...:  74% 10349/13907 [6:34:49<1:23:50,  1.41s/it][A
Training...:  74% 10350/13907 [6:34:50<1:17:30,  1.31s/it][A
Training...:  74% 10351/13907 [6:34:54<1:58:21,  2.00s/it][A
Training...:  74% 10352/13907 [6:34:57<2:22:53,  2.41s/it][A
Training...:  74% 10353/13907 [6:35:00<2:38:01,  2.67s/it][A
Training...:  74% 10354/13907 [6:35:04<2:46:18,  2.81s/it][A
Training...:  74% 10355/13907 [6:35:07<2:50:51,  2.89s/it][A
Training...:  74% 10356/13907 [6:35:10<2:52:57,  2.92s/it][A
Training...:  74% 10357/13907 [6:35:13<2:52:48,  2.92s/it][A
Training...:  74% 10358/13907 [6:35:15<2:50:34,  2.88s/it][A
Training...:  74% 10359/13907 [6:35:18<2:48:31,  2.85s/it][A
Training...:  74% 10360/13907 [6:35:21<2:45:24,  2.80s/it][A
Training...:  75% 10361/13907 [6:35:24<2:43:34,  2.77s/it][A
Training...:  75% 10362/13907 [6:35:26<2:41:08,  2.73s/it][A
Training...:  75% 10363/13907 [6:35:29<2:40:36,  2.72s/it][A
Training...:  75% 10364/13907 [6:35:31<2:37:39,  2.67s/it][A
Training...:  75% 10365/13907 [6:35:34<2:34:38,  2.62s/it][A
Training...:  75% 10366/13907 [6:35:36<2:32:20,  2.58s/it][A
Training...:  75% 10367/13907 [6:35:39<2:29:55,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:17:53<26:06:17, 31325.86s/it]
Training...:  75% 10367/13907 [6:35:42<2:29:55,  2.54s/it][A
Training...:  75% 10368/13907 [6:35:42<2:34:43,  2.62s/it][A
Training...:  75% 10369/13907 [6:35:44<2:31:42,  2.57s/it][A
Training...:  75% 10370/13907 [6:35:47<2:27:59,  2.51s/it][A
Training...:  75% 10371/13907 [6:35:49<2:24:20,  2.45s/it][A
Training...:  75% 10372/13907 [6:35:51<2:20:48,  2.39s/it][A
Training...:  75% 10373/13907 [6:35:53<2:17:38,  2.34s/it][A
Training...:  75% 10374/13907 [6:35:55<2:15:25,  2.30s/it][A
Training...:  75% 10375/13907 [6:35:58<2:13:16,  2.26s/it][A
Training...:  75% 10376/13907 [6:36:00<2:11:26,  2.23s/it][A
Training...:  75% 10377/13907 [6:36:02<2:09:54,  2.21s/it][A
Training...:  75% 10378/13907 [6:36:04<2:07:45,  2.17s/it][A
Training...:  75% 10379/13907 [6:36:06<2:05:51,  2.14s/it][A
Training...:  75% 10380/13907 [6:36:08<2:03:38,  2.10s/it][A
Training...:  75% 10381/13907 [6:36:10<2:02:12,  2.08s/it][A
Training...:  75% 10382/13907 [6:36:12<2:00:17,  2.05s/it][A
Training...:  75% 10383/13907 [6:36:14<1:58:21,  2.02s/it][A
Training...:  75% 10384/13907 [6:36:16<1:56:41,  1.99s/it][A
Training...:  75% 10385/13907 [6:36:18<1:55:27,  1.97s/it][A
Training...:  75% 10386/13907 [6:36:20<1:53:47,  1.94s/it][A
Training...:  75% 10387/13907 [6:36:22<1:51:58,  1.91s/it][A
Training...:  75% 10388/13907 [6:36:23<1:50:03,  1.88s/it][A
Training...:  75% 10389/13907 [6:36:25<1:48:15,  1.85s/it][A
Training...:  75% 10390/13907 [6:36:27<1:45:54,  1.81s/it][A
Training...:  75% 10391/13907 [6:36:29<1:44:04,  1.78s/it][A
Training...:  75% 10392/13907 [6:36:30<1:42:35,  1.75s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:18:43<26:06:17, 31325.86s/it]
Training...:  75% 10392/13907 [6:36:32<1:42:35,  1.75s/it][A
Training...:  75% 10393/13907 [6:36:32<1:45:55,  1.81s/it][A
Training...:  75% 10394/13907 [6:36:34<1:42:16,  1.75s/it][A
Training...:  75% 10395/13907 [6:36:35<1:38:55,  1.69s/it][A
Training...:  75% 10396/13907 [6:36:37<1:34:46,  1.62s/it][A
Training...:  75% 10397/13907 [6:36:38<1:30:49,  1.55s/it][A
Training...:  75% 10398/13907 [6:36:40<1:26:36,  1.48s/it][A
Training...:  75% 10399/13907 [6:36:41<1:21:56,  1.40s/it][A
Training...:  75% 10400/13907 [6:36:42<1:15:57,  1.30s/it][A
Training...:  75% 10401/13907 [6:36:46<1:58:38,  2.03s/it][A
Training...:  75% 10402/13907 [6:36:49<2:22:27,  2.44s/it][A
Training...:  75% 10403/13907 [6:36:52<2:36:21,  2.68s/it][A
Training...:  75% 10404/13907 [6:36:55<2:43:49,  2.81s/it][A
Training...:  75% 10405/13907 [6:36:58<2:47:46,  2.87s/it][A
Training...:  75% 10406/13907 [6:37:01<2:49:54,  2.91s/it][A
Training...:  75% 10407/13907 [6:37:04<2:51:14,  2.94s/it][A
Training...:  75% 10408/13907 [6:37:07<2:48:47,  2.89s/it][A
Training...:  75% 10409/13907 [6:37:10<2:45:59,  2.85s/it][A
Training...:  75% 10410/13907 [6:37:13<2:42:23,  2.79s/it][A
Training...:  75% 10411/13907 [6:37:15<2:40:11,  2.75s/it][A
Training...:  75% 10412/13907 [6:37:18<2:37:20,  2.70s/it][A
Training...:  75% 10413/13907 [6:37:20<2:34:47,  2.66s/it][A
Training...:  75% 10414/13907 [6:37:23<2:32:07,  2.61s/it][A
Training...:  75% 10415/13907 [6:37:25<2:29:56,  2.58s/it][A
Training...:  75% 10416/13907 [6:37:28<2:27:39,  2.54s/it][A
Training...:  75% 10417/13907 [6:37:30<2:25:56,  2.51s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:19:44<26:06:17, 31325.86s/it]
Training...:  75% 10417/13907 [6:37:33<2:25:56,  2.51s/it][A
Training...:  75% 10418/13907 [6:37:33<2:30:52,  2.59s/it][A
Training...:  75% 10419/13907 [6:37:36<2:28:32,  2.56s/it][A
Training...:  75% 10420/13907 [6:37:38<2:24:58,  2.49s/it][A
Training...:  75% 10421/13907 [6:37:40<2:22:23,  2.45s/it][A
Training...:  75% 10422/13907 [6:37:42<2:19:12,  2.40s/it][A
Training...:  75% 10423/13907 [6:37:45<2:16:20,  2.35s/it][A
Training...:  75% 10424/13907 [6:37:47<2:14:11,  2.31s/it][A
Training...:  75% 10425/13907 [6:37:49<2:12:26,  2.28s/it][A
Training...:  75% 10426/13907 [6:37:51<2:10:30,  2.25s/it][A
Training...:  75% 10427/13907 [6:37:54<2:09:03,  2.23s/it][A
Training...:  75% 10428/13907 [6:37:56<2:07:14,  2.19s/it][A
Training...:  75% 10429/13907 [6:37:58<2:05:09,  2.16s/it][A
Training...:  75% 10430/13907 [6:38:00<2:02:58,  2.12s/it][A
Training...:  75% 10431/13907 [6:38:02<2:01:03,  2.09s/it][A
Training...:  75% 10432/13907 [6:38:04<1:59:19,  2.06s/it][A
Training...:  75% 10433/13907 [6:38:06<1:57:26,  2.03s/it][A
Training...:  75% 10434/13907 [6:38:08<1:55:45,  2.00s/it][A
Training...:  75% 10435/13907 [6:38:10<1:54:34,  1.98s/it][A
Training...:  75% 10436/13907 [6:38:11<1:52:54,  1.95s/it][A
Training...:  75% 10437/13907 [6:38:13<1:50:52,  1.92s/it][A
Training...:  75% 10438/13907 [6:38:15<1:48:38,  1.88s/it][A
Training...:  75% 10439/13907 [6:38:17<1:46:14,  1.84s/it][A
Training...:  75% 10440/13907 [6:38:19<1:44:10,  1.80s/it][A
Training...:  75% 10441/13907 [6:38:20<1:42:29,  1.77s/it][A
Training...:  75% 10442/13907 [6:38:22<1:40:16,  1.74s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:20:35<26:06:17, 31325.86s/it]
Training...:  75% 10442/13907 [6:38:24<1:40:16,  1.74s/it][A
Training...:  75% 10443/13907 [6:38:24<1:43:37,  1.79s/it][A
Training...:  75% 10444/13907 [6:38:25<1:40:28,  1.74s/it][A
Training...:  75% 10445/13907 [6:38:27<1:36:36,  1.67s/it][A
Training...:  75% 10446/13907 [6:38:28<1:33:00,  1.61s/it][A
Training...:  75% 10447/13907 [6:38:30<1:29:08,  1.55s/it][A
Training...:  75% 10448/13907 [6:38:31<1:25:03,  1.48s/it][A
Training...:  75% 10449/13907 [6:38:32<1:20:42,  1.40s/it][A
Training...:  75% 10450/13907 [6:38:33<1:15:08,  1.30s/it][A
Training...:  75% 10451/13907 [6:38:37<1:56:57,  2.03s/it][A
Training...:  75% 10452/13907 [6:38:41<2:21:25,  2.46s/it][A
Training...:  75% 10453/13907 [6:38:44<2:35:09,  2.70s/it][A
Training...:  75% 10454/13907 [6:38:47<2:42:39,  2.83s/it][A
Training...:  75% 10455/13907 [6:38:50<2:46:07,  2.89s/it][A
Training...:  75% 10456/13907 [6:38:53<2:46:57,  2.90s/it][A
Training...:  75% 10457/13907 [6:38:56<2:47:07,  2.91s/it][A
Training...:  75% 10458/13907 [6:38:59<2:45:40,  2.88s/it][A
Training...:  75% 10459/13907 [6:39:01<2:43:53,  2.85s/it][A
Training...:  75% 10460/13907 [6:39:04<2:42:06,  2.82s/it][A
Training...:  75% 10461/13907 [6:39:07<2:40:16,  2.79s/it][A
Training...:  75% 10462/13907 [6:39:10<2:37:50,  2.75s/it][A
Training...:  75% 10463/13907 [6:39:12<2:35:28,  2.71s/it][A
Training...:  75% 10464/13907 [6:39:15<2:33:18,  2.67s/it][A
Training...:  75% 10465/13907 [6:39:17<2:32:14,  2.65s/it][A
Training...:  75% 10466/13907 [6:39:20<2:29:23,  2.60s/it][A
Training...:  75% 10467/13907 [6:39:22<2:26:19,  2.55s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:21:36<26:06:17, 31325.86s/it]
Training...:  75% 10467/13907 [6:39:25<2:26:19,  2.55s/it][A
Training...:  75% 10468/13907 [6:39:25<2:30:58,  2.63s/it][A
Training...:  75% 10469/13907 [6:39:28<2:28:14,  2.59s/it][A
Training...:  75% 10470/13907 [6:39:30<2:25:03,  2.53s/it][A
Training...:  75% 10471/13907 [6:39:32<2:21:31,  2.47s/it][A
Training...:  75% 10472/13907 [6:39:35<2:18:07,  2.41s/it][A
Training...:  75% 10473/13907 [6:39:37<2:15:59,  2.38s/it][A
Training...:  75% 10474/13907 [6:39:39<2:12:51,  2.32s/it][A
Training...:  75% 10475/13907 [6:39:41<2:10:00,  2.27s/it][A
Training...:  75% 10476/13907 [6:39:43<2:07:59,  2.24s/it][A
Training...:  75% 10477/13907 [6:39:46<2:05:56,  2.20s/it][A
Training...:  75% 10478/13907 [6:39:48<2:03:36,  2.16s/it][A
Training...:  75% 10479/13907 [6:39:50<2:01:23,  2.12s/it][A
Training...:  75% 10480/13907 [6:39:52<1:59:34,  2.09s/it][A
Training...:  75% 10481/13907 [6:39:54<1:58:08,  2.07s/it][A
Training...:  75% 10482/13907 [6:39:56<1:56:09,  2.03s/it][A
Training...:  75% 10483/13907 [6:39:58<1:54:37,  2.01s/it][A
Training...:  75% 10484/13907 [6:40:00<1:52:52,  1.98s/it][A
Training...:  75% 10485/13907 [6:40:01<1:51:16,  1.95s/it][A
Training...:  75% 10486/13907 [6:40:03<1:49:16,  1.92s/it][A
Training...:  75% 10487/13907 [6:40:05<1:47:30,  1.89s/it][A
Training...:  75% 10488/13907 [6:40:07<1:45:42,  1.86s/it][A
Training...:  75% 10489/13907 [6:40:09<1:43:54,  1.82s/it][A
Training...:  75% 10490/13907 [6:40:10<1:42:11,  1.79s/it][A
Training...:  75% 10491/13907 [6:40:12<1:40:17,  1.76s/it][A
Training...:  75% 10492/13907 [6:40:14<1:38:13,  1.73s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:22:27<26:06:17, 31325.86s/it]
Training...:  75% 10492/13907 [6:40:16<1:38:13,  1.73s/it][A
Training...:  75% 10493/13907 [6:40:16<1:41:17,  1.78s/it][A
Training...:  75% 10494/13907 [6:40:17<1:38:30,  1.73s/it][A
Training...:  75% 10495/13907 [6:40:19<1:34:23,  1.66s/it][A
Training...:  75% 10496/13907 [6:40:20<1:31:13,  1.60s/it][A
Training...:  75% 10497/13907 [6:40:22<1:27:19,  1.54s/it][A
Training...:  75% 10498/13907 [6:40:23<1:23:18,  1.47s/it][A
Training...:  75% 10499/13907 [6:40:24<1:19:13,  1.39s/it][A
Training...:  76% 10500/13907 [6:40:25<1:13:02,  1.29s/it][A
Training...:  76% 10501/13907 [6:40:29<1:54:20,  2.01s/it][A
Training...:  76% 10502/13907 [6:40:32<2:18:38,  2.44s/it][A
Training...:  76% 10503/13907 [6:40:36<2:33:55,  2.71s/it][A
Training...:  76% 10504/13907 [6:40:39<2:42:01,  2.86s/it][A
Training...:  76% 10505/13907 [6:40:42<2:45:32,  2.92s/it][A
Training...:  76% 10506/13907 [6:40:45<2:45:57,  2.93s/it][A
Training...:  76% 10507/13907 [6:40:48<2:45:15,  2.92s/it][A
Training...:  76% 10508/13907 [6:40:50<2:43:13,  2.88s/it][A
Training...:  76% 10509/13907 [6:40:53<2:41:16,  2.85s/it][A
Training...:  76% 10510/13907 [6:40:56<2:38:37,  2.80s/it][A
Training...:  76% 10511/13907 [6:40:59<2:35:53,  2.75s/it][A
Training...:  76% 10512/13907 [6:41:01<2:32:55,  2.70s/it][A
Training...:  76% 10513/13907 [6:41:04<2:30:38,  2.66s/it][A
Training...:  76% 10514/13907 [6:41:06<2:28:13,  2.62s/it][A
Training...:  76% 10515/13907 [6:41:09<2:26:10,  2.59s/it][A
Training...:  76% 10516/13907 [6:41:11<2:24:23,  2.55s/it][A
Training...:  76% 10517/13907 [6:41:14<2:22:01,  2.51s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:23:28<26:06:17, 31325.86s/it]
Training...:  76% 10517/13907 [6:41:16<2:22:01,  2.51s/it][A
Training...:  76% 10518/13907 [6:41:16<2:26:53,  2.60s/it][A
Training...:  76% 10519/13907 [6:41:19<2:23:44,  2.55s/it][A
Training...:  76% 10520/13907 [6:41:21<2:20:06,  2.48s/it][A
Training...:  76% 10521/13907 [6:41:24<2:17:05,  2.43s/it][A
Training...:  76% 10522/13907 [6:41:26<2:14:22,  2.38s/it][A
Training...:  76% 10523/13907 [6:41:28<2:12:07,  2.34s/it][A
Training...:  76% 10524/13907 [6:41:30<2:10:46,  2.32s/it][A
Training...:  76% 10525/13907 [6:41:32<2:08:26,  2.28s/it][A
Training...:  76% 10526/13907 [6:41:35<2:06:39,  2.25s/it][A
Training...:  76% 10527/13907 [6:41:37<2:04:33,  2.21s/it][A
Training...:  76% 10528/13907 [6:41:39<2:02:45,  2.18s/it][A
Training...:  76% 10529/13907 [6:41:41<2:01:27,  2.16s/it][A
Training...:  76% 10530/13907 [6:41:43<1:59:34,  2.12s/it][A
Training...:  76% 10531/13907 [6:41:45<1:57:46,  2.09s/it][A
Training...:  76% 10532/13907 [6:41:47<1:56:15,  2.07s/it][A
Training...:  76% 10533/13907 [6:41:49<1:54:30,  2.04s/it][A
Training...:  76% 10534/13907 [6:41:51<1:53:05,  2.01s/it][A
Training...:  76% 10535/13907 [6:41:53<1:52:09,  2.00s/it][A
Training...:  76% 10536/13907 [6:41:55<1:50:44,  1.97s/it][A
Training...:  76% 10537/13907 [6:41:57<1:48:17,  1.93s/it][A
Training...:  76% 10538/13907 [6:41:58<1:45:35,  1.88s/it][A
Training...:  76% 10539/13907 [6:42:00<1:43:07,  1.84s/it][A
Training...:  76% 10540/13907 [6:42:02<1:40:49,  1.80s/it][A
Training...:  76% 10541/13907 [6:42:04<1:38:37,  1.76s/it][A
Training...:  76% 10542/13907 [6:42:05<1:36:37,  1.72s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:24:18<26:06:17, 31325.86s/it]
Training...:  76% 10542/13907 [6:42:07<1:36:37,  1.72s/it][A
Training...:  76% 10543/13907 [6:42:07<1:39:49,  1.78s/it][A
Training...:  76% 10544/13907 [6:42:09<1:37:13,  1.73s/it][A
Training...:  76% 10545/13907 [6:42:10<1:33:31,  1.67s/it][A
Training...:  76% 10546/13907 [6:42:12<1:29:47,  1.60s/it][A
Training...:  76% 10547/13907 [6:42:13<1:26:16,  1.54s/it][A
Training...:  76% 10548/13907 [6:42:14<1:22:46,  1.48s/it][A
Training...:  76% 10549/13907 [6:42:16<1:19:05,  1.41s/it][A
Training...:  76% 10550/13907 [6:42:17<1:13:26,  1.31s/it][A
Training...:  76% 10551/13907 [6:42:21<1:55:43,  2.07s/it][A
Training...:  76% 10552/13907 [6:42:24<2:19:14,  2.49s/it][A
Training...:  76% 10553/13907 [6:42:27<2:31:25,  2.71s/it][A
Training...:  76% 10554/13907 [6:42:30<2:37:25,  2.82s/it][A
Training...:  76% 10555/13907 [6:42:33<2:40:26,  2.87s/it][A
Training...:  76% 10556/13907 [6:42:36<2:41:07,  2.89s/it][A
Training...:  76% 10557/13907 [6:42:39<2:40:58,  2.88s/it][A
Training...:  76% 10558/13907 [6:42:42<2:39:20,  2.85s/it][A
Training...:  76% 10559/13907 [6:42:45<2:37:26,  2.82s/it][A
Training...:  76% 10560/13907 [6:42:47<2:36:03,  2.80s/it][A
Training...:  76% 10561/13907 [6:42:50<2:33:36,  2.75s/it][A
Training...:  76% 10562/13907 [6:42:53<2:31:07,  2.71s/it][A
Training...:  76% 10563/13907 [6:42:55<2:28:50,  2.67s/it][A
Training...:  76% 10564/13907 [6:42:58<2:26:29,  2.63s/it][A
Training...:  76% 10565/13907 [6:43:00<2:24:05,  2.59s/it][A
Training...:  76% 10566/13907 [6:43:03<2:21:40,  2.54s/it][A
Training...:  76% 10567/13907 [6:43:05<2:19:42,  2.51s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:25:19<26:06:17, 31325.86s/it]
Training...:  76% 10567/13907 [6:43:08<2:19:42,  2.51s/it][A
Training...:  76% 10568/13907 [6:43:08<2:24:48,  2.60s/it][A
Training...:  76% 10569/13907 [6:43:10<2:22:23,  2.56s/it][A
Training...:  76% 10570/13907 [6:43:13<2:19:08,  2.50s/it][A
Training...:  76% 10571/13907 [6:43:15<2:16:46,  2.46s/it][A
Training...:  76% 10572/13907 [6:43:18<2:14:18,  2.42s/it][A
Training...:  76% 10573/13907 [6:43:20<2:11:53,  2.37s/it][A
Training...:  76% 10574/13907 [6:43:22<2:08:38,  2.32s/it][A
Training...:  76% 10575/13907 [6:43:24<2:05:57,  2.27s/it][A
Training...:  76% 10576/13907 [6:43:26<2:03:41,  2.23s/it][A
Training...:  76% 10577/13907 [6:43:28<2:01:37,  2.19s/it][A
Training...:  76% 10578/13907 [6:43:30<1:59:45,  2.16s/it][A
Training...:  76% 10579/13907 [6:43:32<1:57:41,  2.12s/it][A
Training...:  76% 10580/13907 [6:43:34<1:55:46,  2.09s/it][A
Training...:  76% 10581/13907 [6:43:36<1:54:17,  2.06s/it][A
Training...:  76% 10582/13907 [6:43:38<1:52:28,  2.03s/it][A
Training...:  76% 10583/13907 [6:43:40<1:50:49,  2.00s/it][A
Training...:  76% 10584/13907 [6:43:42<1:48:49,  1.96s/it][A
Training...:  76% 10585/13907 [6:43:44<1:47:01,  1.93s/it][A
Training...:  76% 10586/13907 [6:43:46<1:45:16,  1.90s/it][A
Training...:  76% 10587/13907 [6:43:48<1:43:39,  1.87s/it][A
Training...:  76% 10588/13907 [6:43:50<1:41:52,  1.84s/it][A
Training...:  76% 10589/13907 [6:43:51<1:40:08,  1.81s/it][A
Training...:  76% 10590/13907 [6:43:53<1:38:24,  1.78s/it][A
Training...:  76% 10591/13907 [6:43:55<1:36:29,  1.75s/it][A
Training...:  76% 10592/13907 [6:43:56<1:34:14,  1.71s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:26:09<26:06:17, 31325.86s/it]
Training...:  76% 10592/13907 [6:43:58<1:34:14,  1.71s/it][A
Training...:  76% 10593/13907 [6:43:58<1:37:09,  1.76s/it][A
Training...:  76% 10594/13907 [6:44:00<1:34:48,  1.72s/it][A
Training...:  76% 10595/13907 [6:44:01<1:31:15,  1.65s/it][A
Training...:  76% 10596/13907 [6:44:03<1:27:45,  1.59s/it][A
Training...:  76% 10597/13907 [6:44:04<1:24:25,  1.53s/it][A
Training...:  76% 10598/13907 [6:44:05<1:20:40,  1.46s/it][A
Training...:  76% 10599/13907 [6:44:07<1:16:41,  1.39s/it][A
Training...:  76% 10600/13907 [6:44:08<1:11:00,  1.29s/it][A
Training...:  76% 10601/13907 [6:44:11<1:51:14,  2.02s/it][A
Training...:  76% 10602/13907 [6:44:15<2:15:07,  2.45s/it][A
Training...:  76% 10603/13907 [6:44:18<2:27:53,  2.69s/it][A
Training...:  76% 10604/13907 [6:44:21<2:35:16,  2.82s/it][A
Training...:  76% 10605/13907 [6:44:24<2:38:47,  2.89s/it][A
Training...:  76% 10606/13907 [6:44:27<2:39:30,  2.90s/it][A
Training...:  76% 10607/13907 [6:44:30<2:38:49,  2.89s/it][A
Training...:  76% 10608/13907 [6:44:33<2:38:15,  2.88s/it][A
Training...:  76% 10609/13907 [6:44:36<2:36:13,  2.84s/it][A
Training...:  76% 10610/13907 [6:44:38<2:33:46,  2.80s/it][A
Training...:  76% 10611/13907 [6:44:41<2:31:07,  2.75s/it][A
Training...:  76% 10612/13907 [6:44:44<2:28:57,  2.71s/it][A
Training...:  76% 10613/13907 [6:44:46<2:27:36,  2.69s/it][A
Training...:  76% 10614/13907 [6:44:49<2:25:25,  2.65s/it][A
Training...:  76% 10615/13907 [6:44:51<2:22:50,  2.60s/it][A
Training...:  76% 10616/13907 [6:44:54<2:19:53,  2.55s/it][A
Training...:  76% 10617/13907 [6:44:56<2:17:41,  2.51s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:27:10<26:06:17, 31325.86s/it]
Training...:  76% 10617/13907 [6:44:59<2:17:41,  2.51s/it][A
Training...:  76% 10618/13907 [6:44:59<2:22:26,  2.60s/it][A
Training...:  76% 10619/13907 [6:45:01<2:19:26,  2.54s/it][A
Training...:  76% 10620/13907 [6:45:04<2:15:40,  2.48s/it][A
Training...:  76% 10621/13907 [6:45:06<2:12:54,  2.43s/it][A
Training...:  76% 10622/13907 [6:45:08<2:09:55,  2.37s/it][A
Training...:  76% 10623/13907 [6:45:11<2:07:58,  2.34s/it][A
Training...:  76% 10624/13907 [6:45:13<2:05:31,  2.29s/it][A
Training...:  76% 10625/13907 [6:45:15<2:03:24,  2.26s/it][A
Training...:  76% 10626/13907 [6:45:17<2:01:16,  2.22s/it][A
Training...:  76% 10627/13907 [6:45:19<1:59:31,  2.19s/it][A
Training...:  76% 10628/13907 [6:45:21<1:57:46,  2.16s/it][A
Training...:  76% 10629/13907 [6:45:23<1:56:18,  2.13s/it][A
Training...:  76% 10630/13907 [6:45:25<1:54:38,  2.10s/it][A
Training...:  76% 10631/13907 [6:45:27<1:53:10,  2.07s/it][A
Training...:  76% 10632/13907 [6:45:29<1:51:15,  2.04s/it][A
Training...:  76% 10633/13907 [6:45:31<1:49:34,  2.01s/it][A
Training...:  76% 10634/13907 [6:45:33<1:47:33,  1.97s/it][A
Training...:  76% 10635/13907 [6:45:35<1:46:09,  1.95s/it][A
Training...:  76% 10636/13907 [6:45:37<1:44:20,  1.91s/it][A
Training...:  76% 10637/13907 [6:45:39<1:42:41,  1.88s/it][A
Training...:  76% 10638/13907 [6:45:40<1:41:14,  1.86s/it][A
Training...:  77% 10639/13907 [6:45:42<1:39:35,  1.83s/it][A
Training...:  77% 10640/13907 [6:45:44<1:37:28,  1.79s/it][A
Training...:  77% 10641/13907 [6:45:46<1:35:27,  1.75s/it][A
Training...:  77% 10642/13907 [6:45:47<1:33:43,  1.72s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:28:00<26:06:17, 31325.86s/it]
Training...:  77% 10642/13907 [6:45:49<1:33:43,  1.72s/it][A
Training...:  77% 10643/13907 [6:45:49<1:36:45,  1.78s/it][A
Training...:  77% 10644/13907 [6:45:51<1:34:07,  1.73s/it][A
Training...:  77% 10645/13907 [6:45:52<1:30:46,  1.67s/it][A
Training...:  77% 10646/13907 [6:45:54<1:27:15,  1.61s/it][A
Training...:  77% 10647/13907 [6:45:55<1:23:52,  1.54s/it][A
Training...:  77% 10648/13907 [6:45:56<1:20:11,  1.48s/it][A
Training...:  77% 10649/13907 [6:45:58<1:15:58,  1.40s/it][A
Training...:  77% 10650/13907 [6:45:59<1:10:01,  1.29s/it][A
Training...:  77% 10651/13907 [6:46:02<1:49:46,  2.02s/it][A
Training...:  77% 10652/13907 [6:46:06<2:13:22,  2.46s/it][A
Training...:  77% 10653/13907 [6:46:09<2:28:19,  2.74s/it][A
Training...:  77% 10654/13907 [6:46:13<2:36:35,  2.89s/it][A
Training...:  77% 10655/13907 [6:46:16<2:39:33,  2.94s/it][A
Training...:  77% 10656/13907 [6:46:19<2:39:42,  2.95s/it][A
Training...:  77% 10657/13907 [6:46:21<2:38:30,  2.93s/it][A
Training...:  77% 10658/13907 [6:46:24<2:36:33,  2.89s/it][A
Training...:  77% 10659/13907 [6:46:27<2:34:24,  2.85s/it][A
Training...:  77% 10660/13907 [6:46:30<2:31:57,  2.81s/it][A
Training...:  77% 10661/13907 [6:46:32<2:29:34,  2.76s/it][A
Training...:  77% 10662/13907 [6:46:35<2:26:56,  2.72s/it][A
Training...:  77% 10663/13907 [6:46:38<2:24:32,  2.67s/it][A
Training...:  77% 10664/13907 [6:46:40<2:22:08,  2.63s/it][A
Training...:  77% 10665/13907 [6:46:43<2:20:32,  2.60s/it][A
Training...:  77% 10666/13907 [6:46:45<2:18:25,  2.56s/it][A
Training...:  77% 10667/13907 [6:46:48<2:16:22,  2.53s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:29:02<26:06:17, 31325.86s/it]
Training...:  77% 10667/13907 [6:46:50<2:16:22,  2.53s/it][A
Training...:  77% 10668/13907 [6:46:50<2:20:51,  2.61s/it][A
Training...:  77% 10669/13907 [6:46:53<2:18:38,  2.57s/it][A
Training...:  77% 10670/13907 [6:46:55<2:14:51,  2.50s/it][A
Training...:  77% 10671/13907 [6:46:57<2:11:48,  2.44s/it][A
Training...:  77% 10672/13907 [6:47:00<2:08:51,  2.39s/it][A
Training...:  77% 10673/13907 [6:47:02<2:06:50,  2.35s/it][A
Training...:  77% 10674/13907 [6:47:04<2:05:30,  2.33s/it][A
Training...:  77% 10675/13907 [6:47:06<2:03:14,  2.29s/it][A
Training...:  77% 10676/13907 [6:47:09<2:01:20,  2.25s/it][A
Training...:  77% 10677/13907 [6:47:11<1:59:24,  2.22s/it][A
Training...:  77% 10678/13907 [6:47:13<1:57:40,  2.19s/it][A
Training...:  77% 10679/13907 [6:47:15<1:55:54,  2.15s/it][A
Training...:  77% 10680/13907 [6:47:17<1:53:56,  2.12s/it][A
Training...:  77% 10681/13907 [6:47:19<1:52:01,  2.08s/it][A
Training...:  77% 10682/13907 [6:47:21<1:50:05,  2.05s/it][A
Training...:  77% 10683/13907 [6:47:23<1:48:03,  2.01s/it][A
Training...:  77% 10684/13907 [6:47:25<1:46:18,  1.98s/it][A
Training...:  77% 10685/13907 [6:47:27<1:44:44,  1.95s/it][A
Training...:  77% 10686/13907 [6:47:28<1:42:45,  1.91s/it][A
Training...:  77% 10687/13907 [6:47:30<1:41:25,  1.89s/it][A
Training...:  77% 10688/13907 [6:47:32<1:39:34,  1.86s/it][A
Training...:  77% 10689/13907 [6:47:34<1:37:52,  1.82s/it][A
Training...:  77% 10690/13907 [6:47:36<1:36:00,  1.79s/it][A
Training...:  77% 10691/13907 [6:47:37<1:34:15,  1.76s/it][A
Training...:  77% 10692/13907 [6:47:39<1:32:17,  1.72s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:29:52<26:06:17, 31325.86s/it]
Training...:  77% 10692/13907 [6:47:41<1:32:17,  1.72s/it][A
Training...:  77% 10693/13907 [6:47:41<1:35:17,  1.78s/it][A
Training...:  77% 10694/13907 [6:47:42<1:33:07,  1.74s/it][A
Training...:  77% 10695/13907 [6:47:44<1:29:28,  1.67s/it][A
Training...:  77% 10696/13907 [6:47:45<1:26:09,  1.61s/it][A
Training...:  77% 10697/13907 [6:47:47<1:22:59,  1.55s/it][A
Training...:  77% 10698/13907 [6:47:48<1:19:46,  1.49s/it][A
Training...:  77% 10699/13907 [6:47:49<1:15:49,  1.42s/it][A
Training...:  77% 10700/13907 [6:47:51<1:10:42,  1.32s/it][A
Training...:  77% 10701/13907 [6:47:54<1:51:59,  2.10s/it][A
Training...:  77% 10702/13907 [6:47:58<2:14:14,  2.51s/it][A
Training...:  77% 10703/13907 [6:48:01<2:26:07,  2.74s/it][A
Training...:  77% 10704/13907 [6:48:04<2:32:20,  2.85s/it][A
Training...:  77% 10705/13907 [6:48:07<2:36:17,  2.93s/it][A
Training...:  77% 10706/13907 [6:48:10<2:38:47,  2.98s/it][A
Training...:  77% 10707/13907 [6:48:13<2:38:02,  2.96s/it][A
Training...:  77% 10708/13907 [6:48:16<2:35:38,  2.92s/it][A
Training...:  77% 10709/13907 [6:48:19<2:32:45,  2.87s/it][A
Training...:  77% 10710/13907 [6:48:22<2:29:39,  2.81s/it][A
Training...:  77% 10711/13907 [6:48:24<2:26:45,  2.76s/it][A
Training...:  77% 10712/13907 [6:48:27<2:24:13,  2.71s/it][A
Training...:  77% 10713/13907 [6:48:29<2:22:29,  2.68s/it][A
Training...:  77% 10714/13907 [6:48:32<2:20:00,  2.63s/it][A
Training...:  77% 10715/13907 [6:48:34<2:17:32,  2.59s/it][A
Training...:  77% 10716/13907 [6:48:37<2:15:15,  2.54s/it][A
Training...:  77% 10717/13907 [6:48:39<2:13:28,  2.51s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:30:53<26:06:17, 31325.86s/it]
Training...:  77% 10717/13907 [6:48:42<2:13:28,  2.51s/it][A
Training...:  77% 10718/13907 [6:48:42<2:18:29,  2.61s/it][A
Training...:  77% 10719/13907 [6:48:45<2:16:21,  2.57s/it][A
Training...:  77% 10720/13907 [6:48:47<2:12:48,  2.50s/it][A
Training...:  77% 10721/13907 [6:48:49<2:10:01,  2.45s/it][A
Training...:  77% 10722/13907 [6:48:52<2:06:52,  2.39s/it][A
Training...:  77% 10723/13907 [6:48:54<2:04:14,  2.34s/it][A
Training...:  77% 10724/13907 [6:48:56<2:02:04,  2.30s/it][A
Training...:  77% 10725/13907 [6:48:58<2:00:21,  2.27s/it][A
Training...:  77% 10726/13907 [6:49:00<1:58:25,  2.23s/it][A
Training...:  77% 10727/13907 [6:49:03<1:56:31,  2.20s/it][A
Training...:  77% 10728/13907 [6:49:05<1:54:58,  2.17s/it][A
Training...:  77% 10729/13907 [6:49:07<1:53:26,  2.14s/it][A
Training...:  77% 10730/13907 [6:49:09<1:51:55,  2.11s/it][A
Training...:  77% 10731/13907 [6:49:11<1:50:24,  2.09s/it][A
Training...:  77% 10732/13907 [6:49:13<1:48:42,  2.05s/it][A
Training...:  77% 10733/13907 [6:49:15<1:47:35,  2.03s/it][A
Training...:  77% 10734/13907 [6:49:17<1:45:47,  2.00s/it][A
Training...:  77% 10735/13907 [6:49:19<1:44:08,  1.97s/it][A
Training...:  77% 10736/13907 [6:49:20<1:42:28,  1.94s/it][A
Training...:  77% 10737/13907 [6:49:22<1:40:46,  1.91s/it][A
Training...:  77% 10738/13907 [6:49:24<1:39:14,  1.88s/it][A
Training...:  77% 10739/13907 [6:49:26<1:38:00,  1.86s/it][A
Training...:  77% 10740/13907 [6:49:28<1:36:26,  1.83s/it][A
Training...:  77% 10741/13907 [6:49:29<1:34:18,  1.79s/it][A
Training...:  77% 10742/13907 [6:49:31<1:31:55,  1.74s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:31:44<26:06:17, 31325.86s/it]
Training...:  77% 10742/13907 [6:49:33<1:31:55,  1.74s/it][A
Training...:  77% 10743/13907 [6:49:33<1:34:32,  1.79s/it][A
Training...:  77% 10744/13907 [6:49:34<1:32:02,  1.75s/it][A
Training...:  77% 10745/13907 [6:49:36<1:28:51,  1.69s/it][A
Training...:  77% 10746/13907 [6:49:38<1:25:15,  1.62s/it][A
Training...:  77% 10747/13907 [6:49:39<1:21:37,  1.55s/it][A
Training...:  77% 10748/13907 [6:49:40<1:17:59,  1.48s/it][A
Training...:  77% 10749/13907 [6:49:41<1:14:07,  1.41s/it][A
Training...:  77% 10750/13907 [6:49:43<1:08:27,  1.30s/it][A
Training...:  77% 10751/13907 [6:49:46<1:47:30,  2.04s/it][A
Training...:  77% 10752/13907 [6:49:50<2:11:25,  2.50s/it][A
Training...:  77% 10753/13907 [6:49:53<2:24:24,  2.75s/it][A
Training...:  77% 10754/13907 [6:49:56<2:32:22,  2.90s/it][A
Training...:  77% 10755/13907 [6:50:00<2:36:13,  2.97s/it][A
Training...:  77% 10756/13907 [6:50:03<2:35:49,  2.97s/it][A
Training...:  77% 10757/13907 [6:50:05<2:35:02,  2.95s/it][A
Training...:  77% 10758/13907 [6:50:08<2:32:40,  2.91s/it][A
Training...:  77% 10759/13907 [6:50:11<2:30:24,  2.87s/it][A
Training...:  77% 10760/13907 [6:50:14<2:27:38,  2.81s/it][A
Training...:  77% 10761/13907 [6:50:16<2:25:41,  2.78s/it][A
Training...:  77% 10762/13907 [6:50:19<2:23:31,  2.74s/it][A
Training...:  77% 10763/13907 [6:50:22<2:21:23,  2.70s/it][A
Training...:  77% 10764/13907 [6:50:24<2:19:02,  2.65s/it][A
Training...:  77% 10765/13907 [6:50:27<2:17:01,  2.62s/it][A
Training...:  77% 10766/13907 [6:50:29<2:14:27,  2.57s/it][A
Training...:  77% 10767/13907 [6:50:32<2:12:40,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:32:46<26:06:17, 31325.86s/it]
Training...:  77% 10767/13907 [6:50:34<2:12:40,  2.54s/it][A
Training...:  77% 10768/13907 [6:50:34<2:17:05,  2.62s/it][A
Training...:  77% 10769/13907 [6:50:37<2:14:24,  2.57s/it][A
Training...:  77% 10770/13907 [6:50:39<2:10:29,  2.50s/it][A
Training...:  77% 10771/13907 [6:50:42<2:07:55,  2.45s/it][A
Training...:  77% 10772/13907 [6:50:44<2:05:54,  2.41s/it][A
Training...:  77% 10773/13907 [6:50:46<2:04:34,  2.39s/it][A
Training...:  77% 10774/13907 [6:50:49<2:02:58,  2.36s/it][A
Training...:  77% 10775/13907 [6:50:51<2:00:18,  2.30s/it][A
Training...:  77% 10776/13907 [6:50:53<1:57:53,  2.26s/it][A
Training...:  77% 10777/13907 [6:50:55<1:55:45,  2.22s/it][A
Training...:  78% 10778/13907 [6:50:57<1:53:42,  2.18s/it][A
Training...:  78% 10779/13907 [6:50:59<1:51:55,  2.15s/it][A
Training...:  78% 10780/13907 [6:51:01<1:50:08,  2.11s/it][A
Training...:  78% 10781/13907 [6:51:03<1:48:44,  2.09s/it][A
Training...:  78% 10782/13907 [6:51:05<1:47:18,  2.06s/it][A
Training...:  78% 10783/13907 [6:51:07<1:45:42,  2.03s/it][A
Training...:  78% 10784/13907 [6:51:09<1:44:12,  2.00s/it][A
Training...:  78% 10785/13907 [6:51:11<1:43:18,  1.99s/it][A
Training...:  78% 10786/13907 [6:51:13<1:41:41,  1.96s/it][A
Training...:  78% 10787/13907 [6:51:15<1:40:04,  1.92s/it][A
Training...:  78% 10788/13907 [6:51:17<1:38:13,  1.89s/it][A
Training...:  78% 10789/13907 [6:51:18<1:36:26,  1.86s/it][A
Training...:  78% 10790/13907 [6:51:20<1:34:02,  1.81s/it][A
Training...:  78% 10791/13907 [6:51:22<1:31:50,  1.77s/it][A
Training...:  78% 10792/13907 [6:51:23<1:29:45,  1.73s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:33:37<26:06:17, 31325.86s/it]
Training...:  78% 10792/13907 [6:51:25<1:29:45,  1.73s/it][A
Training...:  78% 10793/13907 [6:51:25<1:32:50,  1.79s/it][A
Training...:  78% 10794/13907 [6:51:27<1:30:09,  1.74s/it][A
Training...:  78% 10795/13907 [6:51:28<1:26:35,  1.67s/it][A
Training...:  78% 10796/13907 [6:51:30<1:23:35,  1.61s/it][A
Training...:  78% 10797/13907 [6:51:31<1:20:04,  1.54s/it][A
Training...:  78% 10798/13907 [6:51:33<1:16:24,  1.47s/it][A
Training...:  78% 10799/13907 [6:51:34<1:12:40,  1.40s/it][A
Training...:  78% 10800/13907 [6:51:35<1:07:06,  1.30s/it][A
Training...:  78% 10801/13907 [6:51:39<1:45:59,  2.05s/it][A
Training...:  78% 10802/13907 [6:51:42<2:09:49,  2.51s/it][A
Training...:  78% 10803/13907 [6:51:46<2:22:01,  2.75s/it][A
Training...:  78% 10804/13907 [6:51:49<2:28:17,  2.87s/it][A
Training...:  78% 10805/13907 [6:51:52<2:31:56,  2.94s/it][A
Training...:  78% 10806/13907 [6:51:55<2:32:41,  2.95s/it][A
Training...:  78% 10807/13907 [6:51:58<2:32:17,  2.95s/it][A
Training...:  78% 10808/13907 [6:52:01<2:31:06,  2.93s/it][A
Training...:  78% 10809/13907 [6:52:04<2:30:38,  2.92s/it][A
Training...:  78% 10810/13907 [6:52:06<2:29:19,  2.89s/it][A
Training...:  78% 10811/13907 [6:52:09<2:26:11,  2.83s/it][A
Training...:  78% 10812/13907 [6:52:12<2:23:53,  2.79s/it][A
Training...:  78% 10813/13907 [6:52:14<2:21:14,  2.74s/it][A
Training...:  78% 10814/13907 [6:52:17<2:18:29,  2.69s/it][A
Training...:  78% 10815/13907 [6:52:19<2:16:24,  2.65s/it][A
Training...:  78% 10816/13907 [6:52:22<2:14:00,  2.60s/it][A
Training...:  78% 10817/13907 [6:52:24<2:11:53,  2.56s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:34:38<26:06:17, 31325.86s/it]
Training...:  78% 10817/13907 [6:52:27<2:11:53,  2.56s/it][A
Training...:  78% 10818/13907 [6:52:27<2:16:00,  2.64s/it][A
Training...:  78% 10819/13907 [6:52:30<2:13:13,  2.59s/it][A
Training...:  78% 10820/13907 [6:52:32<2:09:55,  2.53s/it][A
Training...:  78% 10821/13907 [6:52:34<2:07:14,  2.47s/it][A
Training...:  78% 10822/13907 [6:52:37<2:04:49,  2.43s/it][A
Training...:  78% 10823/13907 [6:52:39<2:02:19,  2.38s/it][A
Training...:  78% 10824/13907 [6:52:41<1:59:33,  2.33s/it][A
Training...:  78% 10825/13907 [6:52:43<1:57:11,  2.28s/it][A
Training...:  78% 10826/13907 [6:52:46<1:55:09,  2.24s/it][A
Training...:  78% 10827/13907 [6:52:48<1:53:37,  2.21s/it][A
Training...:  78% 10828/13907 [6:52:50<1:52:12,  2.19s/it][A
Training...:  78% 10829/13907 [6:52:52<1:50:25,  2.15s/it][A
Training...:  78% 10830/13907 [6:52:54<1:48:24,  2.11s/it][A
Training...:  78% 10831/13907 [6:52:56<1:46:32,  2.08s/it][A
Training...:  78% 10832/13907 [6:52:58<1:45:05,  2.05s/it][A
Training...:  78% 10833/13907 [6:53:00<1:43:16,  2.02s/it][A
Training...:  78% 10834/13907 [6:53:02<1:41:32,  1.98s/it][A
Training...:  78% 10835/13907 [6:53:04<1:40:10,  1.96s/it][A
Training...:  78% 10836/13907 [6:53:06<1:38:32,  1.93s/it][A
Training...:  78% 10837/13907 [6:53:07<1:37:01,  1.90s/it][A
Training...:  78% 10838/13907 [6:53:09<1:35:30,  1.87s/it][A
Training...:  78% 10839/13907 [6:53:11<1:34:03,  1.84s/it][A
Training...:  78% 10840/13907 [6:53:13<1:32:13,  1.80s/it][A
Training...:  78% 10841/13907 [6:53:14<1:30:21,  1.77s/it][A
Training...:  78% 10842/13907 [6:53:16<1:28:35,  1.73s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:35:29<26:06:17, 31325.86s/it]
Training...:  78% 10842/13907 [6:53:18<1:28:35,  1.73s/it][A
Training...:  78% 10843/13907 [6:53:18<1:31:33,  1.79s/it][A
Training...:  78% 10844/13907 [6:53:20<1:29:13,  1.75s/it][A
Training...:  78% 10845/13907 [6:53:21<1:26:39,  1.70s/it][A
Training...:  78% 10846/13907 [6:53:23<1:24:01,  1.65s/it][A
Training...:  78% 10847/13907 [6:53:24<1:20:30,  1.58s/it][A
Training...:  78% 10848/13907 [6:53:25<1:17:13,  1.51s/it][A
Training...:  78% 10849/13907 [6:53:27<1:13:24,  1.44s/it][A
Training...:  78% 10850/13907 [6:53:28<1:07:20,  1.32s/it][A
Training...:  78% 10851/13907 [6:53:32<1:45:49,  2.08s/it][A
Training...:  78% 10852/13907 [6:53:35<2:07:45,  2.51s/it][A
Training...:  78% 10853/13907 [6:53:38<2:19:31,  2.74s/it][A
Training...:  78% 10854/13907 [6:53:42<2:25:29,  2.86s/it][A
Training...:  78% 10855/13907 [6:53:45<2:28:41,  2.92s/it][A
Training...:  78% 10856/13907 [6:53:48<2:29:15,  2.94s/it][A
Training...:  78% 10857/13907 [6:53:51<2:29:13,  2.94s/it][A
Training...:  78% 10858/13907 [6:53:53<2:28:07,  2.91s/it][A
Training...:  78% 10859/13907 [6:53:56<2:26:15,  2.88s/it][A
Training...:  78% 10860/13907 [6:53:59<2:24:19,  2.84s/it][A
Training...:  78% 10861/13907 [6:54:02<2:21:56,  2.80s/it][A
Training...:  78% 10862/13907 [6:54:04<2:19:19,  2.75s/it][A
Training...:  78% 10863/13907 [6:54:07<2:16:56,  2.70s/it][A
Training...:  78% 10864/13907 [6:54:09<2:14:37,  2.65s/it][A
Training...:  78% 10865/13907 [6:54:12<2:12:36,  2.62s/it][A
Training...:  78% 10866/13907 [6:54:14<2:10:00,  2.57s/it][A
Training...:  78% 10867/13907 [6:54:17<2:08:10,  2.53s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:36:31<26:06:17, 31325.86s/it]
Training...:  78% 10867/13907 [6:54:20<2:08:10,  2.53s/it][A
Training...:  78% 10868/13907 [6:54:20<2:12:35,  2.62s/it][A
Training...:  78% 10869/13907 [6:54:22<2:10:47,  2.58s/it][A
Training...:  78% 10870/13907 [6:54:24<2:07:24,  2.52s/it][A
Training...:  78% 10871/13907 [6:54:27<2:04:47,  2.47s/it][A
Training...:  78% 10872/13907 [6:54:29<2:02:28,  2.42s/it][A
Training...:  78% 10873/13907 [6:54:31<2:00:14,  2.38s/it][A
Training...:  78% 10874/13907 [6:54:34<1:57:48,  2.33s/it][A
Training...:  78% 10875/13907 [6:54:36<1:56:19,  2.30s/it][A
Training...:  78% 10876/13907 [6:54:38<1:54:35,  2.27s/it][A
Training...:  78% 10877/13907 [6:54:40<1:52:28,  2.23s/it][A
Training...:  78% 10878/13907 [6:54:42<1:50:48,  2.19s/it][A
Training...:  78% 10879/13907 [6:54:44<1:48:59,  2.16s/it][A
Training...:  78% 10880/13907 [6:54:46<1:47:38,  2.13s/it][A
Training...:  78% 10881/13907 [6:54:49<1:46:39,  2.11s/it][A
Training...:  78% 10882/13907 [6:54:51<1:45:22,  2.09s/it][A
Training...:  78% 10883/13907 [6:54:53<1:44:05,  2.07s/it][A
Training...:  78% 10884/13907 [6:54:55<1:41:48,  2.02s/it][A
Training...:  78% 10885/13907 [6:54:56<1:40:03,  1.99s/it][A
Training...:  78% 10886/13907 [6:54:58<1:38:15,  1.95s/it][A
Training...:  78% 10887/13907 [6:55:00<1:36:21,  1.91s/it][A
Training...:  78% 10888/13907 [6:55:02<1:34:31,  1.88s/it][A
Training...:  78% 10889/13907 [6:55:04<1:32:48,  1.85s/it][A
Training...:  78% 10890/13907 [6:55:05<1:30:43,  1.80s/it][A
Training...:  78% 10891/13907 [6:55:07<1:28:45,  1.77s/it][A
Training...:  78% 10892/13907 [6:55:09<1:26:38,  1.72s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:37:22<26:06:17, 31325.86s/it]
Training...:  78% 10892/13907 [6:55:11<1:26:38,  1.72s/it][A
Training...:  78% 10893/13907 [6:55:11<1:29:23,  1.78s/it][A
Training...:  78% 10894/13907 [6:55:12<1:27:16,  1.74s/it][A
Training...:  78% 10895/13907 [6:55:14<1:24:10,  1.68s/it][A
Training...:  78% 10896/13907 [6:55:15<1:20:54,  1.61s/it][A
Training...:  78% 10897/13907 [6:55:17<1:17:38,  1.55s/it][A
Training...:  78% 10898/13907 [6:55:18<1:14:18,  1.48s/it][A
Training...:  78% 10899/13907 [6:55:19<1:10:31,  1.41s/it][A
Training...:  78% 10900/13907 [6:55:20<1:05:04,  1.30s/it][A
Training...:  78% 10901/13907 [6:55:24<1:43:36,  2.07s/it][A
Training...:  78% 10902/13907 [6:55:28<2:04:46,  2.49s/it][A
Training...:  78% 10903/13907 [6:55:31<2:17:02,  2.74s/it][A
Training...:  78% 10904/13907 [6:55:34<2:22:22,  2.84s/it][A
Training...:  78% 10905/13907 [6:55:37<2:25:21,  2.91s/it][A
Training...:  78% 10906/13907 [6:55:40<2:26:04,  2.92s/it][A
Training...:  78% 10907/13907 [6:55:43<2:25:51,  2.92s/it][A
Training...:  78% 10908/13907 [6:55:46<2:24:25,  2.89s/it][A
Training...:  78% 10909/13907 [6:55:49<2:23:16,  2.87s/it][A
Training...:  78% 10910/13907 [6:55:51<2:21:35,  2.83s/it][A
Training...:  78% 10911/13907 [6:55:54<2:19:39,  2.80s/it][A
Training...:  78% 10912/13907 [6:55:57<2:17:48,  2.76s/it][A
Training...:  78% 10913/13907 [6:55:59<2:15:10,  2.71s/it][A
Training...:  78% 10914/13907 [6:56:02<2:12:36,  2.66s/it][A
Training...:  78% 10915/13907 [6:56:04<2:10:22,  2.61s/it][A
Training...:  78% 10916/13907 [6:56:07<2:08:00,  2.57s/it][A
Training...:  79% 10917/13907 [6:56:09<2:06:35,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:38:23<26:06:17, 31325.86s/it]
Training...:  79% 10917/13907 [6:56:12<2:06:35,  2.54s/it][A
Training...:  79% 10918/13907 [6:56:12<2:12:23,  2.66s/it][A
Training...:  79% 10919/13907 [6:56:15<2:09:28,  2.60s/it][A
Training...:  79% 10920/13907 [6:56:17<2:06:22,  2.54s/it][A
Training...:  79% 10921/13907 [6:56:19<2:03:03,  2.47s/it][A
Training...:  79% 10922/13907 [6:56:22<1:59:48,  2.41s/it][A
Training...:  79% 10923/13907 [6:56:24<1:57:12,  2.36s/it][A
Training...:  79% 10924/13907 [6:56:26<1:54:39,  2.31s/it][A
Training...:  79% 10925/13907 [6:56:28<1:52:27,  2.26s/it][A
Training...:  79% 10926/13907 [6:56:30<1:50:30,  2.22s/it][A
Training...:  79% 10927/13907 [6:56:32<1:48:55,  2.19s/it][A
Training...:  79% 10928/13907 [6:56:35<1:47:15,  2.16s/it][A
Training...:  79% 10929/13907 [6:56:37<1:46:01,  2.14s/it][A
Training...:  79% 10930/13907 [6:56:39<1:44:26,  2.11s/it][A
Training...:  79% 10931/13907 [6:56:41<1:42:54,  2.07s/it][A
Training...:  79% 10932/13907 [6:56:43<1:41:13,  2.04s/it][A
Training...:  79% 10933/13907 [6:56:45<1:39:35,  2.01s/it][A
Training...:  79% 10934/13907 [6:56:46<1:38:08,  1.98s/it][A
Training...:  79% 10935/13907 [6:56:48<1:36:36,  1.95s/it][A
Training...:  79% 10936/13907 [6:56:50<1:34:51,  1.92s/it][A
Training...:  79% 10937/13907 [6:56:52<1:33:26,  1.89s/it][A
Training...:  79% 10938/13907 [6:56:54<1:31:59,  1.86s/it][A
Training...:  79% 10939/13907 [6:56:56<1:30:45,  1.83s/it][A
Training...:  79% 10940/13907 [6:56:57<1:28:49,  1.80s/it][A
Training...:  79% 10941/13907 [6:56:59<1:27:15,  1.77s/it][A
Training...:  79% 10942/13907 [6:57:01<1:25:32,  1.73s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:39:14<26:06:17, 31325.86s/it]
Training...:  79% 10942/13907 [6:57:03<1:25:32,  1.73s/it][A
Training...:  79% 10943/13907 [6:57:03<1:28:39,  1.79s/it][A
Training...:  79% 10944/13907 [6:57:04<1:26:27,  1.75s/it][A
Training...:  79% 10945/13907 [6:57:06<1:23:02,  1.68s/it][A
Training...:  79% 10946/13907 [6:57:07<1:19:16,  1.61s/it][A
Training...:  79% 10947/13907 [6:57:09<1:15:50,  1.54s/it][A
Training...:  79% 10948/13907 [6:57:10<1:12:15,  1.47s/it][A
Training...:  79% 10949/13907 [6:57:11<1:09:14,  1.40s/it][A
Training...:  79% 10950/13907 [6:57:12<1:04:25,  1.31s/it][A
Training...:  79% 10951/13907 [6:57:16<1:40:58,  2.05s/it][A
Training...:  79% 10952/13907 [6:57:19<2:02:16,  2.48s/it][A
Training...:  79% 10953/13907 [6:57:23<2:15:02,  2.74s/it][A
Training...:  79% 10954/13907 [6:57:26<2:22:09,  2.89s/it][A
Training...:  79% 10955/13907 [6:57:29<2:25:26,  2.96s/it][A
Training...:  79% 10956/13907 [6:57:32<2:26:31,  2.98s/it][A
Training...:  79% 10957/13907 [6:57:35<2:26:03,  2.97s/it][A
Training...:  79% 10958/13907 [6:57:38<2:25:10,  2.95s/it][A
Training...:  79% 10959/13907 [6:57:41<2:23:24,  2.92s/it][A
Training...:  79% 10960/13907 [6:57:44<2:21:42,  2.89s/it][A
Training...:  79% 10961/13907 [6:57:46<2:19:35,  2.84s/it][A
Training...:  79% 10962/13907 [6:57:49<2:17:56,  2.81s/it][A
Training...:  79% 10963/13907 [6:57:52<2:16:40,  2.79s/it][A
Training...:  79% 10964/13907 [6:57:55<2:15:18,  2.76s/it][A
Training...:  79% 10965/13907 [6:57:57<2:13:40,  2.73s/it][A
Training...:  79% 10966/13907 [6:58:00<2:10:57,  2.67s/it][A
Training...:  79% 10967/13907 [6:58:02<2:08:19,  2.62s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:40:16<26:06:17, 31325.86s/it]
Training...:  79% 10967/13907 [6:58:05<2:08:19,  2.62s/it][A
Training...:  79% 10968/13907 [6:58:05<2:11:50,  2.69s/it][A
Training...:  79% 10969/13907 [6:58:08<2:08:33,  2.63s/it][A
Training...:  79% 10970/13907 [6:58:10<2:04:32,  2.54s/it][A
Training...:  79% 10971/13907 [6:58:12<2:02:07,  2.50s/it][A
Training...:  79% 10972/13907 [6:58:15<1:59:09,  2.44s/it][A
Training...:  79% 10973/13907 [6:58:17<1:56:19,  2.38s/it][A
Training...:  79% 10974/13907 [6:58:19<1:53:42,  2.33s/it][A
Training...:  79% 10975/13907 [6:58:21<1:51:28,  2.28s/it][A
Training...:  79% 10976/13907 [6:58:23<1:49:27,  2.24s/it][A
Training...:  79% 10977/13907 [6:58:26<1:47:45,  2.21s/it][A
Training...:  79% 10978/13907 [6:58:28<1:45:47,  2.17s/it][A
Training...:  79% 10979/13907 [6:58:30<1:44:10,  2.13s/it][A
Training...:  79% 10980/13907 [6:58:32<1:42:22,  2.10s/it][A
Training...:  79% 10981/13907 [6:58:34<1:41:10,  2.07s/it][A
Training...:  79% 10982/13907 [6:58:36<1:39:19,  2.04s/it][A
Training...:  79% 10983/13907 [6:58:38<1:37:53,  2.01s/it][A
Training...:  79% 10984/13907 [6:58:40<1:36:27,  1.98s/it][A
Training...:  79% 10985/13907 [6:58:41<1:34:48,  1.95s/it][A
Training...:  79% 10986/13907 [6:58:43<1:33:10,  1.91s/it][A
Training...:  79% 10987/13907 [6:58:45<1:31:32,  1.88s/it][A
Training...:  79% 10988/13907 [6:58:47<1:29:34,  1.84s/it][A
Training...:  79% 10989/13907 [6:58:49<1:27:54,  1.81s/it][A
Training...:  79% 10990/13907 [6:58:50<1:26:09,  1.77s/it][A
Training...:  79% 10991/13907 [6:58:52<1:24:23,  1.74s/it][A
Training...:  79% 10992/13907 [6:58:53<1:22:40,  1.70s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:41:07<26:06:17, 31325.86s/it]
Training...:  79% 10992/13907 [6:58:55<1:22:40,  1.70s/it][A
Training...:  79% 10993/13907 [6:58:55<1:25:48,  1.77s/it][A
Training...:  79% 10994/13907 [6:58:57<1:23:33,  1.72s/it][A
Training...:  79% 10995/13907 [6:58:59<1:20:26,  1.66s/it][A
Training...:  79% 10996/13907 [6:59:00<1:17:05,  1.59s/it][A
Training...:  79% 10997/13907 [6:59:01<1:14:24,  1.53s/it][A
Training...:  79% 10998/13907 [6:59:03<1:11:15,  1.47s/it][A
Training...:  79% 10999/13907 [6:59:04<1:08:00,  1.40s/it][A
Training...:  79% 11000/13907 [6:59:05<1:02:46,  1.30s/it][A
Training...:  79% 11001/13907 [6:59:09<1:39:32,  2.06s/it][A
Training...:  79% 11002/13907 [6:59:12<2:00:50,  2.50s/it][A
Training...:  79% 11003/13907 [6:59:16<2:11:40,  2.72s/it][A
Training...:  79% 11004/13907 [6:59:19<2:17:08,  2.83s/it][A
Training...:  79% 11005/13907 [6:59:22<2:20:21,  2.90s/it][A
Training...:  79% 11006/13907 [6:59:25<2:20:55,  2.91s/it][A
Training...:  79% 11007/13907 [6:59:28<2:20:52,  2.91s/it][A
Training...:  79% 11008/13907 [6:59:30<2:19:23,  2.88s/it][A
Training...:  79% 11009/13907 [6:59:33<2:17:16,  2.84s/it][A
Training...:  79% 11010/13907 [6:59:36<2:15:14,  2.80s/it][A
Training...:  79% 11011/13907 [6:59:39<2:13:01,  2.76s/it][A
Training...:  79% 11012/13907 [6:59:41<2:10:53,  2.71s/it][A
Training...:  79% 11013/13907 [6:59:44<2:09:06,  2.68s/it][A
Training...:  79% 11014/13907 [6:59:46<2:07:33,  2.65s/it][A
Training...:  79% 11015/13907 [6:59:49<2:05:31,  2.60s/it][A
Training...:  79% 11016/13907 [6:59:51<2:03:47,  2.57s/it][A
Training...:  79% 11017/13907 [6:59:54<2:01:59,  2.53s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:42:08<26:06:17, 31325.86s/it]
Training...:  79% 11017/13907 [6:59:57<2:01:59,  2.53s/it][A
Training...:  79% 11018/13907 [6:59:57<2:07:10,  2.64s/it][A
Training...:  79% 11019/13907 [6:59:59<2:04:22,  2.58s/it][A
Training...:  79% 11020/13907 [7:00:01<2:01:23,  2.52s/it][A
Training...:  79% 11021/13907 [7:00:04<1:58:42,  2.47s/it][A
Training...:  79% 11022/13907 [7:00:06<1:56:22,  2.42s/it][A
Training...:  79% 11023/13907 [7:00:08<1:53:49,  2.37s/it][A
Training...:  79% 11024/13907 [7:00:11<1:52:12,  2.34s/it][A
Training...:  79% 11025/13907 [7:00:13<1:50:46,  2.31s/it][A
Training...:  79% 11026/13907 [7:00:15<1:48:18,  2.26s/it][A
Training...:  79% 11027/13907 [7:00:17<1:46:27,  2.22s/it][A
Training...:  79% 11028/13907 [7:00:19<1:44:20,  2.17s/it][A
Training...:  79% 11029/13907 [7:00:21<1:42:54,  2.15s/it][A
Training...:  79% 11030/13907 [7:00:23<1:41:01,  2.11s/it][A
Training...:  79% 11031/13907 [7:00:25<1:39:39,  2.08s/it][A
Training...:  79% 11032/13907 [7:00:27<1:38:04,  2.05s/it][A
Training...:  79% 11033/13907 [7:00:29<1:36:25,  2.01s/it][A
Training...:  79% 11034/13907 [7:00:31<1:34:59,  1.98s/it][A
Training...:  79% 11035/13907 [7:00:33<1:33:43,  1.96s/it][A
Training...:  79% 11036/13907 [7:00:35<1:32:19,  1.93s/it][A
Training...:  79% 11037/13907 [7:00:37<1:30:57,  1.90s/it][A
Training...:  79% 11038/13907 [7:00:38<1:29:04,  1.86s/it][A
Training...:  79% 11039/13907 [7:00:40<1:27:30,  1.83s/it][A
Training...:  79% 11040/13907 [7:00:42<1:25:51,  1.80s/it][A
Training...:  79% 11041/13907 [7:00:44<1:24:02,  1.76s/it][A
Training...:  79% 11042/13907 [7:00:45<1:22:13,  1.72s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:42:58<26:06:17, 31325.86s/it]
Training...:  79% 11042/13907 [7:00:47<1:22:13,  1.72s/it][A
Training...:  79% 11043/13907 [7:00:47<1:24:39,  1.77s/it][A
Training...:  79% 11044/13907 [7:00:49<1:22:08,  1.72s/it][A
Training...:  79% 11045/13907 [7:00:50<1:18:52,  1.65s/it][A
Training...:  79% 11046/13907 [7:00:52<1:15:53,  1.59s/it][A
Training...:  79% 11047/13907 [7:00:53<1:13:07,  1.53s/it][A
Training...:  79% 11048/13907 [7:00:54<1:10:59,  1.49s/it][A
Training...:  79% 11049/13907 [7:00:56<1:07:42,  1.42s/it][A
Training...:  79% 11050/13907 [7:00:57<1:02:50,  1.32s/it][A
Training...:  79% 11051/13907 [7:01:01<1:38:53,  2.08s/it][A
Training...:  79% 11052/13907 [7:01:04<1:58:40,  2.49s/it][A
Training...:  79% 11053/13907 [7:01:07<2:09:39,  2.73s/it][A
Training...:  79% 11054/13907 [7:01:11<2:16:10,  2.86s/it][A
Training...:  79% 11055/13907 [7:01:14<2:19:20,  2.93s/it][A
Training...:  79% 11056/13907 [7:01:17<2:20:26,  2.96s/it][A
Training...:  80% 11057/13907 [7:01:20<2:19:31,  2.94s/it][A
Training...:  80% 11058/13907 [7:01:22<2:18:07,  2.91s/it][A
Training...:  80% 11059/13907 [7:01:25<2:16:21,  2.87s/it][A
Training...:  80% 11060/13907 [7:01:28<2:14:32,  2.84s/it][A
Training...:  80% 11061/13907 [7:01:31<2:13:17,  2.81s/it][A
Training...:  80% 11062/13907 [7:01:33<2:12:05,  2.79s/it][A
Training...:  80% 11063/13907 [7:01:36<2:09:41,  2.74s/it][A
Training...:  80% 11064/13907 [7:01:39<2:06:40,  2.67s/it][A
Training...:  80% 11065/13907 [7:01:41<2:04:23,  2.63s/it][A
Training...:  80% 11066/13907 [7:01:44<2:02:06,  2.58s/it][A
Training...:  80% 11067/13907 [7:01:46<2:00:20,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:44:00<26:06:17, 31325.86s/it]
Training...:  80% 11067/13907 [7:01:49<2:00:20,  2.54s/it][A
Training...:  80% 11068/13907 [7:01:49<2:04:29,  2.63s/it][A
Training...:  80% 11069/13907 [7:01:51<2:02:33,  2.59s/it][A
Training...:  80% 11070/13907 [7:01:54<1:59:23,  2.52s/it][A
Training...:  80% 11071/13907 [7:01:56<1:56:37,  2.47s/it][A
Training...:  80% 11072/13907 [7:01:58<1:54:45,  2.43s/it][A
Training...:  80% 11073/13907 [7:02:01<1:52:30,  2.38s/it][A
Training...:  80% 11074/13907 [7:02:03<1:50:46,  2.35s/it][A
Training...:  80% 11075/13907 [7:02:05<1:48:23,  2.30s/it][A
Training...:  80% 11076/13907 [7:02:07<1:46:18,  2.25s/it][A
Training...:  80% 11077/13907 [7:02:09<1:44:28,  2.21s/it][A
Training...:  80% 11078/13907 [7:02:12<1:42:56,  2.18s/it][A
Training...:  80% 11079/13907 [7:02:14<1:41:25,  2.15s/it][A
Training...:  80% 11080/13907 [7:02:16<1:39:56,  2.12s/it][A
Training...:  80% 11081/13907 [7:02:18<1:38:46,  2.10s/it][A
Training...:  80% 11082/13907 [7:02:20<1:37:09,  2.06s/it][A
Training...:  80% 11083/13907 [7:02:22<1:36:14,  2.04s/it][A
Training...:  80% 11084/13907 [7:02:24<1:34:30,  2.01s/it][A
Training...:  80% 11085/13907 [7:02:26<1:32:58,  1.98s/it][A
Training...:  80% 11086/13907 [7:02:27<1:31:26,  1.94s/it][A
Training...:  80% 11087/13907 [7:02:29<1:29:39,  1.91s/it][A
Training...:  80% 11088/13907 [7:02:31<1:27:59,  1.87s/it][A
Training...:  80% 11089/13907 [7:02:33<1:26:16,  1.84s/it][A
Training...:  80% 11090/13907 [7:02:34<1:24:37,  1.80s/it][A
Training...:  80% 11091/13907 [7:02:36<1:23:16,  1.77s/it][A
Training...:  80% 11092/13907 [7:02:38<1:21:31,  1.74s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:44:51<26:06:17, 31325.86s/it]
Training...:  80% 11092/13907 [7:02:40<1:21:31,  1.74s/it][A
Training...:  80% 11093/13907 [7:02:40<1:24:03,  1.79s/it][A
Training...:  80% 11094/13907 [7:02:41<1:22:07,  1.75s/it][A
Training...:  80% 11095/13907 [7:02:43<1:19:16,  1.69s/it][A
Training...:  80% 11096/13907 [7:02:44<1:16:12,  1.63s/it][A
Training...:  80% 11097/13907 [7:02:46<1:12:55,  1.56s/it][A
Training...:  80% 11098/13907 [7:02:47<1:09:23,  1.48s/it][A
Training...:  80% 11099/13907 [7:02:48<1:05:39,  1.40s/it][A
Training...:  80% 11100/13907 [7:02:49<1:00:50,  1.30s/it][A
Training...:  80% 11101/13907 [7:02:53<1:33:52,  2.01s/it][A
Training...:  80% 11102/13907 [7:02:56<1:53:25,  2.43s/it][A
Training...:  80% 11103/13907 [7:03:00<2:04:39,  2.67s/it][A
Training...:  80% 11104/13907 [7:03:03<2:10:52,  2.80s/it][A
Training...:  80% 11105/13907 [7:03:06<2:14:00,  2.87s/it][A
Training...:  80% 11106/13907 [7:03:09<2:14:28,  2.88s/it][A
Training...:  80% 11107/13907 [7:03:12<2:14:05,  2.87s/it][A
Training...:  80% 11108/13907 [7:03:14<2:12:57,  2.85s/it][A
Training...:  80% 11109/13907 [7:03:17<2:11:32,  2.82s/it][A
Training...:  80% 11110/13907 [7:03:20<2:09:39,  2.78s/it][A
Training...:  80% 11111/13907 [7:03:22<2:07:45,  2.74s/it][A
Training...:  80% 11112/13907 [7:03:25<2:05:37,  2.70s/it][A
Training...:  80% 11113/13907 [7:03:28<2:04:13,  2.67s/it][A
Training...:  80% 11114/13907 [7:03:30<2:02:00,  2.62s/it][A
Training...:  80% 11115/13907 [7:03:33<2:00:26,  2.59s/it][A
Training...:  80% 11116/13907 [7:03:35<1:58:57,  2.56s/it][A
Training...:  80% 11117/13907 [7:03:38<1:57:40,  2.53s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:45:52<26:06:17, 31325.86s/it]
Training...:  80% 11117/13907 [7:03:40<1:57:40,  2.53s/it][A
Training...:  80% 11118/13907 [7:03:40<2:01:55,  2.62s/it][A
Training...:  80% 11119/13907 [7:03:43<1:59:53,  2.58s/it][A
Training...:  80% 11120/13907 [7:03:45<1:56:23,  2.51s/it][A
Training...:  80% 11121/13907 [7:03:48<1:53:59,  2.45s/it][A
Training...:  80% 11122/13907 [7:03:50<1:51:24,  2.40s/it][A
Training...:  80% 11123/13907 [7:03:52<1:49:22,  2.36s/it][A
Training...:  80% 11124/13907 [7:03:54<1:47:07,  2.31s/it][A
Training...:  80% 11125/13907 [7:03:57<1:45:47,  2.28s/it][A
Training...:  80% 11126/13907 [7:03:59<1:44:21,  2.25s/it][A
Training...:  80% 11127/13907 [7:04:01<1:42:52,  2.22s/it][A
Training...:  80% 11128/13907 [7:04:03<1:41:07,  2.18s/it][A
Training...:  80% 11129/13907 [7:04:05<1:39:08,  2.14s/it][A
Training...:  80% 11130/13907 [7:04:07<1:37:07,  2.10s/it][A
Training...:  80% 11131/13907 [7:04:09<1:35:13,  2.06s/it][A
Training...:  80% 11132/13907 [7:04:11<1:33:34,  2.02s/it][A
Training...:  80% 11133/13907 [7:04:13<1:32:20,  2.00s/it][A
Training...:  80% 11134/13907 [7:04:15<1:30:36,  1.96s/it][A
Training...:  80% 11135/13907 [7:04:17<1:29:14,  1.93s/it][A
Training...:  80% 11136/13907 [7:04:18<1:28:05,  1.91s/it][A
Training...:  80% 11137/13907 [7:04:20<1:26:38,  1.88s/it][A
Training...:  80% 11138/13907 [7:04:22<1:25:20,  1.85s/it][A
Training...:  80% 11139/13907 [7:04:24<1:23:49,  1.82s/it][A
Training...:  80% 11140/13907 [7:04:26<1:22:08,  1.78s/it][A
Training...:  80% 11141/13907 [7:04:27<1:20:38,  1.75s/it][A
Training...:  80% 11142/13907 [7:04:29<1:19:06,  1.72s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:46:42<26:06:17, 31325.86s/it]
Training...:  80% 11142/13907 [7:04:31<1:19:06,  1.72s/it][A
Training...:  80% 11143/13907 [7:04:31<1:21:46,  1.78s/it][A
Training...:  80% 11144/13907 [7:04:32<1:19:34,  1.73s/it][A
Training...:  80% 11145/13907 [7:04:34<1:16:34,  1.66s/it][A
Training...:  80% 11146/13907 [7:04:35<1:14:15,  1.61s/it][A
Training...:  80% 11147/13907 [7:04:37<1:11:48,  1.56s/it][A
Training...:  80% 11148/13907 [7:04:38<1:08:22,  1.49s/it][A
Training...:  80% 11149/13907 [7:04:39<1:04:23,  1.40s/it][A
Training...:  80% 11150/13907 [7:04:40<59:12,  1.29s/it]  [A
Training...:  80% 11151/13907 [7:04:44<1:32:49,  2.02s/it][A
Training...:  80% 11152/13907 [7:04:48<1:53:25,  2.47s/it][A
Training...:  80% 11153/13907 [7:04:51<2:04:44,  2.72s/it][A
Training...:  80% 11154/13907 [7:04:54<2:10:16,  2.84s/it][A
Training...:  80% 11155/13907 [7:04:57<2:13:13,  2.90s/it][A
Training...:  80% 11156/13907 [7:05:00<2:14:48,  2.94s/it][A
Training...:  80% 11157/13907 [7:05:03<2:14:57,  2.94s/it][A
Training...:  80% 11158/13907 [7:05:06<2:13:50,  2.92s/it][A
Training...:  80% 11159/13907 [7:05:09<2:12:15,  2.89s/it][A
Training...:  80% 11160/13907 [7:05:11<2:09:54,  2.84s/it][A
Training...:  80% 11161/13907 [7:05:14<2:07:58,  2.80s/it][A
Training...:  80% 11162/13907 [7:05:17<2:05:45,  2.75s/it][A
Training...:  80% 11163/13907 [7:05:19<2:04:08,  2.71s/it][A
Training...:  80% 11164/13907 [7:05:22<2:03:38,  2.70s/it][A
Training...:  80% 11165/13907 [7:05:25<2:02:56,  2.69s/it][A
Training...:  80% 11166/13907 [7:05:27<2:00:47,  2.64s/it][A
Training...:  80% 11167/13907 [7:05:30<1:58:53,  2.60s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:47:44<26:06:17, 31325.86s/it]
Training...:  80% 11167/13907 [7:05:33<1:58:53,  2.60s/it][A
Training...:  80% 11168/13907 [7:05:33<2:02:33,  2.68s/it][A
Training...:  80% 11169/13907 [7:05:35<1:59:34,  2.62s/it][A
Training...:  80% 11170/13907 [7:05:37<1:55:34,  2.53s/it][A
Training...:  80% 11171/13907 [7:05:40<1:52:23,  2.46s/it][A
Training...:  80% 11172/13907 [7:05:42<1:50:09,  2.42s/it][A
Training...:  80% 11173/13907 [7:05:44<1:47:52,  2.37s/it][A
Training...:  80% 11174/13907 [7:05:47<1:45:43,  2.32s/it][A
Training...:  80% 11175/13907 [7:05:49<1:43:50,  2.28s/it][A
Training...:  80% 11176/13907 [7:05:51<1:42:00,  2.24s/it][A
Training...:  80% 11177/13907 [7:05:53<1:40:35,  2.21s/it][A
Training...:  80% 11178/13907 [7:05:55<1:39:14,  2.18s/it][A
Training...:  80% 11179/13907 [7:05:57<1:38:08,  2.16s/it][A
Training...:  80% 11180/13907 [7:05:59<1:36:51,  2.13s/it][A
Training...:  80% 11181/13907 [7:06:01<1:35:26,  2.10s/it][A
Training...:  80% 11182/13907 [7:06:03<1:34:15,  2.08s/it][A
Training...:  80% 11183/13907 [7:06:05<1:33:17,  2.05s/it][A
Training...:  80% 11184/13907 [7:06:07<1:31:26,  2.02s/it][A
Training...:  80% 11185/13907 [7:06:09<1:30:01,  1.98s/it][A
Training...:  80% 11186/13907 [7:06:11<1:28:20,  1.95s/it][A
Training...:  80% 11187/13907 [7:06:13<1:26:40,  1.91s/it][A
Training...:  80% 11188/13907 [7:06:15<1:25:20,  1.88s/it][A
Training...:  80% 11189/13907 [7:06:16<1:23:38,  1.85s/it][A
Training...:  80% 11190/13907 [7:06:18<1:21:43,  1.80s/it][A
Training...:  80% 11191/13907 [7:06:20<1:20:02,  1.77s/it][A
Training...:  80% 11192/13907 [7:06:22<1:18:26,  1.73s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:48:35<26:06:17, 31325.86s/it]
Training...:  80% 11192/13907 [7:06:23<1:18:26,  1.73s/it][A
Training...:  80% 11193/13907 [7:06:23<1:20:42,  1.78s/it][A
Training...:  80% 11194/13907 [7:06:25<1:18:47,  1.74s/it][A
Training...:  80% 11195/13907 [7:06:27<1:16:20,  1.69s/it][A
Training...:  81% 11196/13907 [7:06:28<1:14:01,  1.64s/it][A
Training...:  81% 11197/13907 [7:06:30<1:10:54,  1.57s/it][A
Training...:  81% 11198/13907 [7:06:31<1:07:24,  1.49s/it][A
Training...:  81% 11199/13907 [7:06:32<1:03:37,  1.41s/it][A
Training...:  81% 11200/13907 [7:06:33<58:43,  1.30s/it]  [A
Training...:  81% 11201/13907 [7:06:37<1:31:50,  2.04s/it][A
Training...:  81% 11202/13907 [7:06:40<1:51:41,  2.48s/it][A
Training...:  81% 11203/13907 [7:06:44<2:02:32,  2.72s/it][A
Training...:  81% 11204/13907 [7:06:47<2:08:29,  2.85s/it][A
Training...:  81% 11205/13907 [7:06:50<2:11:28,  2.92s/it][A
Training...:  81% 11206/13907 [7:06:53<2:11:57,  2.93s/it][A
Training...:  81% 11207/13907 [7:06:56<2:12:12,  2.94s/it][A
Training...:  81% 11208/13907 [7:06:59<2:10:52,  2.91s/it][A
Training...:  81% 11209/13907 [7:07:01<2:08:55,  2.87s/it][A
Training...:  81% 11210/13907 [7:07:04<2:06:58,  2.82s/it][A
Training...:  81% 11211/13907 [7:07:07<2:05:26,  2.79s/it][A
Training...:  81% 11212/13907 [7:07:09<2:02:52,  2.74s/it][A
Training...:  81% 11213/13907 [7:07:12<2:01:36,  2.71s/it][A
Training...:  81% 11214/13907 [7:07:15<1:59:16,  2.66s/it][A
Training...:  81% 11215/13907 [7:07:17<1:58:08,  2.63s/it][A
Training...:  81% 11216/13907 [7:07:20<1:56:18,  2.59s/it][A
Training...:  81% 11217/13907 [7:07:22<1:55:10,  2.57s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:49:36<26:06:17, 31325.86s/it]
Training...:  81% 11217/13907 [7:07:25<1:55:10,  2.57s/it][A
Training...:  81% 11218/13907 [7:07:25<1:58:39,  2.65s/it][A
Training...:  81% 11219/13907 [7:07:28<1:56:06,  2.59s/it][A
Training...:  81% 11220/13907 [7:07:30<1:52:44,  2.52s/it][A
Training...:  81% 11221/13907 [7:07:32<1:50:45,  2.47s/it][A
Training...:  81% 11222/13907 [7:07:35<1:48:31,  2.43s/it][A
Training...:  81% 11223/13907 [7:07:37<1:48:34,  2.43s/it][A
Training...:  81% 11224/13907 [7:07:39<1:46:12,  2.38s/it][A
Training...:  81% 11225/13907 [7:07:42<1:44:35,  2.34s/it][A
Training...:  81% 11226/13907 [7:07:44<1:42:09,  2.29s/it][A
Training...:  81% 11227/13907 [7:07:46<1:40:24,  2.25s/it][A
Training...:  81% 11228/13907 [7:07:48<1:38:39,  2.21s/it][A
Training...:  81% 11229/13907 [7:07:50<1:36:48,  2.17s/it][A
Training...:  81% 11230/13907 [7:07:52<1:34:57,  2.13s/it][A
Training...:  81% 11231/13907 [7:07:54<1:33:26,  2.10s/it][A
Training...:  81% 11232/13907 [7:07:56<1:31:55,  2.06s/it][A
Training...:  81% 11233/13907 [7:07:58<1:30:35,  2.03s/it][A
Training...:  81% 11234/13907 [7:08:00<1:29:11,  2.00s/it][A
Training...:  81% 11235/13907 [7:08:02<1:27:51,  1.97s/it][A
Training...:  81% 11236/13907 [7:08:04<1:26:20,  1.94s/it][A
Training...:  81% 11237/13907 [7:08:06<1:24:54,  1.91s/it][A
Training...:  81% 11238/13907 [7:08:07<1:23:36,  1.88s/it][A
Training...:  81% 11239/13907 [7:08:09<1:22:02,  1.84s/it][A
Training...:  81% 11240/13907 [7:08:11<1:20:18,  1.81s/it][A
Training...:  81% 11241/13907 [7:08:13<1:19:02,  1.78s/it][A
Training...:  81% 11242/13907 [7:08:14<1:17:20,  1.74s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:50:27<26:06:17, 31325.86s/it]
Training...:  81% 11242/13907 [7:08:16<1:17:20,  1.74s/it][A
Training...:  81% 11243/13907 [7:08:16<1:19:52,  1.80s/it][A
Training...:  81% 11244/13907 [7:08:18<1:17:31,  1.75s/it][A
Training...:  81% 11245/13907 [7:08:19<1:14:57,  1.69s/it][A
Training...:  81% 11246/13907 [7:08:21<1:12:18,  1.63s/it][A
Training...:  81% 11247/13907 [7:08:22<1:09:22,  1.56s/it][A
Training...:  81% 11248/13907 [7:08:24<1:06:18,  1.50s/it][A
Training...:  81% 11249/13907 [7:08:25<1:03:28,  1.43s/it][A
Training...:  81% 11250/13907 [7:08:26<59:02,  1.33s/it]  [A
Training...:  81% 11251/13907 [7:08:30<1:31:33,  2.07s/it][A
Training...:  81% 11252/13907 [7:08:33<1:52:02,  2.53s/it][A
Training...:  81% 11253/13907 [7:08:37<2:03:40,  2.80s/it][A
Training...:  81% 11254/13907 [7:08:40<2:10:18,  2.95s/it][A
Training...:  81% 11255/13907 [7:08:43<2:13:50,  3.03s/it][A
Training...:  81% 11256/13907 [7:08:46<2:14:09,  3.04s/it][A
Training...:  81% 11257/13907 [7:08:49<2:13:13,  3.02s/it][A
Training...:  81% 11258/13907 [7:08:52<2:11:43,  2.98s/it][A
Training...:  81% 11259/13907 [7:08:55<2:11:10,  2.97s/it][A
Training...:  81% 11260/13907 [7:08:58<2:09:51,  2.94s/it][A
Training...:  81% 11261/13907 [7:09:01<2:07:11,  2.88s/it][A
Training...:  81% 11262/13907 [7:09:04<2:04:59,  2.84s/it][A
Training...:  81% 11263/13907 [7:09:06<2:02:41,  2.78s/it][A
Training...:  81% 11264/13907 [7:09:09<2:00:49,  2.74s/it][A
Training...:  81% 11265/13907 [7:09:11<1:59:01,  2.70s/it][A
Training...:  81% 11266/13907 [7:09:14<1:57:10,  2.66s/it][A
Training...:  81% 11267/13907 [7:09:17<1:55:40,  2.63s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:51:31<26:06:17, 31325.86s/it]
Training...:  81% 11267/13907 [7:09:19<1:55:40,  2.63s/it][A
Training...:  81% 11268/13907 [7:09:19<1:59:16,  2.71s/it][A
Training...:  81% 11269/13907 [7:09:22<1:56:08,  2.64s/it][A
Training...:  81% 11270/13907 [7:09:24<1:52:30,  2.56s/it][A
Training...:  81% 11271/13907 [7:09:27<1:49:34,  2.49s/it][A
Training...:  81% 11272/13907 [7:09:29<1:47:27,  2.45s/it][A
Training...:  81% 11273/13907 [7:09:31<1:45:01,  2.39s/it][A
Training...:  81% 11274/13907 [7:09:33<1:42:52,  2.34s/it][A
Training...:  81% 11275/13907 [7:09:36<1:41:01,  2.30s/it][A
Training...:  81% 11276/13907 [7:09:38<1:39:23,  2.27s/it][A
Training...:  81% 11277/13907 [7:09:40<1:37:58,  2.24s/it][A
Training...:  81% 11278/13907 [7:09:42<1:36:18,  2.20s/it][A
Training...:  81% 11279/13907 [7:09:44<1:34:57,  2.17s/it][A
Training...:  81% 11280/13907 [7:09:46<1:33:37,  2.14s/it][A
Training...:  81% 11281/13907 [7:09:48<1:32:13,  2.11s/it][A
Training...:  81% 11282/13907 [7:09:50<1:30:39,  2.07s/it][A
Training...:  81% 11283/13907 [7:09:52<1:29:16,  2.04s/it][A
Training...:  81% 11284/13907 [7:09:54<1:28:10,  2.02s/it][A
Training...:  81% 11285/13907 [7:09:56<1:27:03,  1.99s/it][A
Training...:  81% 11286/13907 [7:09:58<1:25:55,  1.97s/it][A
Training...:  81% 11287/13907 [7:10:00<1:24:34,  1.94s/it][A
Training...:  81% 11288/13907 [7:10:02<1:23:17,  1.91s/it][A
Training...:  81% 11289/13907 [7:10:04<1:22:02,  1.88s/it][A
Training...:  81% 11290/13907 [7:10:05<1:20:37,  1.85s/it][A
Training...:  81% 11291/13907 [7:10:07<1:18:58,  1.81s/it][A
Training...:  81% 11292/13907 [7:10:09<1:17:28,  1.78s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:52:22<26:06:17, 31325.86s/it]
Training...:  81% 11292/13907 [7:10:11<1:17:28,  1.78s/it][A
Step... (23475 | Loss: 0.21110543608665466, Learning Rate: 0.00016076363681349903, Gradient Norm: 0.8305695056915283)
Step... (23500 | Loss: 0.1666911244392395, Learning Rate: 0.0001606121368240565, Gradient Norm: 0.7381412982940674)
Step... (23525 | Loss: 0.2236136943101883, Learning Rate: 0.00016046062228269875, Gradient Norm: 0.6984795331954956)
Step... (23550 | Loss: 0.22085602581501007, Learning Rate: 0.00016030909318942577, Gradient Norm: 0.7781980633735657)
Step... (23575 | Loss: 0.19758757948875427, Learning Rate: 0.00016015759319998324, Gradient Norm: 0.7157557606697083)
Step... (23600 | Loss: 0.2090696394443512, Learning Rate: 0.00016000607865862548, Gradient Norm: 1.2505879402160645)
Step... (23625 | Loss: 0.19705602526664734, Learning Rate: 0.0001598545495653525, Gradient Norm: 0.7970755100250244)
Step... (23650 | Loss: 0.19540487229824066, Learning Rate: 0.00015970303502399474, Gradient Norm: 1.0590938329696655)
Step... (23675 | Loss: 0.18898770213127136, Learning Rate: 0.00015955153503455222, Gradient Norm: 0.6374908685684204)
Step... (23700 | Loss: 0.2544465661048889, Learning Rate: 0.00015940000594127923, Gradient Norm: 1.6345009803771973)
Step... (23725 | Loss: 0.2547158896923065, Learning Rate: 0.00015924849139992148, Gradient Norm: 0.8392926454544067)
Step... (23750 | Loss: 0.2269788384437561, Learning Rate: 0.00015909699141047895, Gradient Norm: 1.1963071823120117)
Step... (23775 | Loss: 0.19261226058006287, Learning Rate: 0.00015894546231720597, Gradient Norm: 0.657772421836853)
Step... (23800 | Loss: 0.2698872983455658, Learning Rate: 0.0001587939477758482, Gradient Norm: 1.3095214366912842)
Step... (23825 | Loss: 0.25917619466781616, Learning Rate: 0.00015864244778640568, Gradient Norm: 0.9672130942344666)
Step... (23850 | Loss: 0.26669418811798096, Learning Rate: 0.0001584909186931327, Gradient Norm: 1.1284081935882568)
Step... (23875 | Loss: 0.242944598197937, Learning Rate: 0.00015833940415177494, Gradient Norm: 0.7738472819328308)
Step... (23900 | Loss: 0.3238920569419861, Learning Rate: 0.00015818790416233242, Gradient Norm: 1.3852969408035278)
Step... (23925 | Loss: 0.20654425024986267, Learning Rate: 0.00015803637506905943, Gradient Norm: 0.8611186742782593)
Step... (23950 | Loss: 0.2744830548763275, Learning Rate: 0.00015788484597578645, Gradient Norm: 1.3721816539764404)
Step... (23975 | Loss: 0.22701138257980347, Learning Rate: 0.00015773334598634392, Gradient Norm: 0.7274041175842285)
Step... (24000 | Loss: 0.2368013858795166, Learning Rate: 0.00015758183144498616, Gradient Norm: 1.0002532005310059)
Step... (24025 | Loss: 0.28912970423698425, Learning Rate: 0.00015743030235171318, Gradient Norm: 1.0421438217163086)
Step... (24050 | Loss: 0.26870018243789673, Learning Rate: 0.00015727880236227065, Gradient Norm: 1.023808479309082)
Step... (24075 | Loss: 0.19926860928535461, Learning Rate: 0.0001571272878209129, Gradient Norm: 0.6926731467247009)
Step... (24100 | Loss: 0.16709056496620178, Learning Rate: 0.00015697575872763991, Gradient Norm: 1.2798371315002441)
Step... (24125 | Loss: 0.26464152336120605, Learning Rate: 0.00015682425873819739, Gradient Norm: 0.790186882019043)
Step... (24150 | Loss: 0.2494579553604126, Learning Rate: 0.0001566727296449244, Gradient Norm: 1.0534923076629639)
Step... (24175 | Loss: 0.24536141753196716, Learning Rate: 0.00015652121510356665, Gradient Norm: 0.9401168823242188)
Step... (24200 | Loss: 0.22962114214897156, Learning Rate: 0.00015636971511412412, Gradient Norm: 1.1812689304351807)
Step... (24225 | Loss: 0.23246559500694275, Learning Rate: 0.00015621818602085114, Gradient Norm: 0.8900744915008545)
Step... (24250 | Loss: 0.1957128345966339, Learning Rate: 0.00015606665692757815, Gradient Norm: 0.8587034940719604)
Step... (24275 | Loss: 0.2468329817056656, Learning Rate: 0.00015591517149005085, Gradient Norm: 0.9649057984352112)
Step... (24300 | Loss: 0.19259366393089294, Learning Rate: 0.00015576364239677787, Gradient Norm: 0.9800106883049011)
Step... (24325 | Loss: 0.2875411808490753, Learning Rate: 0.00015561211330350488, Gradient Norm: 1.1551222801208496)
Step... (24350 | Loss: 0.1967577040195465, Learning Rate: 0.00015546062786597759, Gradient Norm: 0.8945172429084778)
Step... (24375 | Loss: 0.2030802071094513, Learning Rate: 0.0001553090987727046, Gradient Norm: 0.8837954998016357)
Step... (24400 | Loss: 0.15683861076831818, Learning Rate: 0.00015515756967943162, Gradient Norm: 0.7715370059013367)
Step... (24425 | Loss: 0.19990810751914978, Learning Rate: 0.0001550060696899891, Gradient Norm: 0.7276828289031982)
Step... (24450 | Loss: 0.25610125064849854, Learning Rate: 0.00015485455514863133, Gradient Norm: 1.6525344848632812)
Step... (24475 | Loss: 0.3201914429664612, Learning Rate: 0.00015470302605535835, Gradient Norm: 0.7857486605644226)
Step... (24500 | Loss: 0.2234063446521759, Learning Rate: 0.00015455152606591582, Gradient Norm: 1.2511622905731201)
Step... (24525 | Loss: 0.2711073160171509, Learning Rate: 0.00015440001152455807, Gradient Norm: 1.2645809650421143)
Step... (24550 | Loss: 0.18511544167995453, Learning Rate: 0.00015424848243128508, Gradient Norm: 1.0763397216796875)
Step... (24575 | Loss: 0.19823458790779114, Learning Rate: 0.00015409696788992733, Gradient Norm: 0.7206516265869141)
Step... (24600 | Loss: 0.21190331876277924, Learning Rate: 0.0001539454679004848, Gradient Norm: 0.9487178325653076)
Step... (24625 | Loss: 0.2428174614906311, Learning Rate: 0.00015379393880721182, Gradient Norm: 1.114641547203064)
Step... (24650 | Loss: 0.19081267714500427, Learning Rate: 0.00015364242426585406, Gradient Norm: 0.8894214630126953)
Step... (24675 | Loss: 0.23348768055438995, Learning Rate: 0.00015349092427641153, Gradient Norm: 0.9170966148376465)
Step... (24700 | Loss: 0.2420957386493683, Learning Rate: 0.00015333939518313855, Gradient Norm: 1.044128656387329)
Step... (24725 | Loss: 0.29829636216163635, Learning Rate: 0.0001531878806417808, Gradient Norm: 0.9583113789558411)
Step... (24750 | Loss: 0.1792992502450943, Learning Rate: 0.00015303638065233827, Gradient Norm: 0.9276326894760132)
Step... (24775 | Loss: 0.26464787125587463, Learning Rate: 0.00015288485155906528, Gradient Norm: 0.884194016456604)
Step... (24800 | Loss: 0.25513899326324463, Learning Rate: 0.00015273333701770753, Gradient Norm: 1.1519241333007812)
Step... (24825 | Loss: 0.21422868967056274, Learning Rate: 0.000152581837028265, Gradient Norm: 0.9749297499656677)
Step... (24850 | Loss: 0.2526111602783203, Learning Rate: 0.00015243030793499202, Gradient Norm: 1.211766242980957)
Step... (24875 | Loss: 0.15177947282791138, Learning Rate: 0.00015227879339363426, Gradient Norm: 0.5689331293106079)
Step... (24900 | Loss: 0.22996018826961517, Learning Rate: 0.0001521272788522765, Gradient Norm: 1.2209932804107666)
Step... (24925 | Loss: 0.23800396919250488, Learning Rate: 0.00015197576431091875, Gradient Norm: 0.6735236644744873)
Step... (24950 | Loss: 0.15671700239181519, Learning Rate: 0.000151824249769561, Gradient Norm: 0.8422859907150269)
Step... (24975 | Loss: 0.2488691657781601, Learning Rate: 0.00015167273522820324, Gradient Norm: 0.9335479140281677)
Step... (25000 | Loss: 0.15602630376815796, Learning Rate: 0.00015152120613493025, Gradient Norm: 0.7259755730628967)
Step... (25025 | Loss: 0.2349076122045517, Learning Rate: 0.00015136970614548773, Gradient Norm: 0.8085358142852783)
Step... (25050 | Loss: 0.28120291233062744, Learning Rate: 0.00015121819160412997, Gradient Norm: 0.8956518173217773)
Step... (25075 | Loss: 0.21874400973320007, Learning Rate: 0.00015106666251085699, Gradient Norm: 0.8955407738685608)
Step... (25100 | Loss: 0.2611951231956482, Learning Rate: 0.00015091516252141446, Gradient Norm: 1.3065905570983887)
Step... (25125 | Loss: 0.19657564163208008, Learning Rate: 0.0001507636479800567, Gradient Norm: 0.872995138168335)
Step... (25150 | Loss: 0.2385898232460022, Learning Rate: 0.00015061211888678372, Gradient Norm: 1.173574447631836)
Step... (25175 | Loss: 0.22850735485553741, Learning Rate: 0.0001504606188973412, Gradient Norm: 0.8354026079177856)
Training...:  81% 11293/13907 [7:10:11<1:19:52,  1.83s/it][A
Training...:  81% 11294/13907 [7:10:13<1:19:45,  1.83s/it][A
Training...:  81% 11295/13907 [7:10:14<1:16:56,  1.77s/it][A
Training...:  81% 11296/13907 [7:10:16<1:14:00,  1.70s/it][A
Training...:  81% 11297/13907 [7:10:17<1:11:02,  1.63s/it][A
Training...:  81% 11298/13907 [7:10:19<1:07:34,  1.55s/it][A
Training...:  81% 11299/13907 [7:10:20<1:04:04,  1.47s/it][A
Training...:  81% 11300/13907 [7:10:21<59:02,  1.36s/it]  [A
Training...:  81% 11301/13907 [7:10:25<1:31:19,  2.10s/it][A
Training...:  81% 11302/13907 [7:10:28<1:50:14,  2.54s/it][A
Training...:  81% 11303/13907 [7:10:32<1:59:58,  2.76s/it][A
Training...:  81% 11304/13907 [7:10:35<2:05:12,  2.89s/it][A
Training...:  81% 11305/13907 [7:10:38<2:07:58,  2.95s/it][A
Training...:  81% 11306/13907 [7:10:41<2:08:45,  2.97s/it][A
Training...:  81% 11307/13907 [7:10:44<2:07:57,  2.95s/it][A
Training...:  81% 11308/13907 [7:10:47<2:06:42,  2.93s/it][A
Training...:  81% 11309/13907 [7:10:50<2:05:12,  2.89s/it][A
Training...:  81% 11310/13907 [7:10:52<2:03:31,  2.85s/it][A
Training...:  81% 11311/13907 [7:10:55<2:01:37,  2.81s/it][A
Training...:  81% 11312/13907 [7:10:58<1:59:59,  2.77s/it][A
Training...:  81% 11313/13907 [7:11:00<1:58:14,  2.73s/it][A
Training...:  81% 11314/13907 [7:11:03<1:56:19,  2.69s/it][A
Training...:  81% 11315/13907 [7:11:06<1:54:30,  2.65s/it][A
Training...:  81% 11316/13907 [7:11:08<1:52:33,  2.61s/it][A
Training...:  81% 11317/13907 [7:11:11<1:51:09,  2.58s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:53:25<26:06:17, 31325.86s/it]
Training...:  81% 11317/13907 [7:11:13<1:51:09,  2.58s/it][A
Training...:  81% 11318/13907 [7:11:13<1:54:59,  2.67s/it][A
Training...:  81% 11319/13907 [7:11:16<1:52:15,  2.60s/it][A
Training...:  81% 11320/13907 [7:11:18<1:50:06,  2.55s/it][A
Training...:  81% 11321/13907 [7:11:21<1:47:44,  2.50s/it][A
Training...:  81% 11322/13907 [7:11:23<1:45:33,  2.45s/it][A
Training...:  81% 11323/13907 [7:11:25<1:43:16,  2.40s/it][A
Training...:  81% 11324/13907 [7:11:28<1:41:05,  2.35s/it][A
Training...:  81% 11325/13907 [7:11:30<1:39:07,  2.30s/it][A
Training...:  81% 11326/13907 [7:11:32<1:37:45,  2.27s/it][A
Training...:  81% 11327/13907 [7:11:34<1:36:50,  2.25s/it][A
Training...:  81% 11328/13907 [7:11:36<1:35:31,  2.22s/it][A
Training...:  81% 11329/13907 [7:11:38<1:33:34,  2.18s/it][A
Training...:  81% 11330/13907 [7:11:40<1:31:45,  2.14s/it][A
Training...:  81% 11331/13907 [7:11:42<1:30:13,  2.10s/it][A
Training...:  81% 11332/13907 [7:11:44<1:28:30,  2.06s/it][A
Training...:  81% 11333/13907 [7:11:46<1:27:06,  2.03s/it][A
Training...:  81% 11334/13907 [7:11:48<1:25:44,  2.00s/it][A
Training...:  82% 11335/13907 [7:11:50<1:24:20,  1.97s/it][A
Training...:  82% 11336/13907 [7:11:52<1:22:57,  1.94s/it][A
Training...:  82% 11337/13907 [7:11:54<1:21:38,  1.91s/it][A
Training...:  82% 11338/13907 [7:11:56<1:20:06,  1.87s/it][A
Training...:  82% 11339/13907 [7:11:57<1:18:32,  1.84s/it][A
Training...:  82% 11340/13907 [7:11:59<1:16:44,  1.79s/it][A
Training...:  82% 11341/13907 [7:12:01<1:15:19,  1.76s/it][A
Training...:  82% 11342/13907 [7:12:02<1:13:43,  1.72s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:54:16<26:06:17, 31325.86s/it]
Training...:  82% 11342/13907 [7:12:04<1:13:43,  1.72s/it][A
Training...:  82% 11343/13907 [7:12:04<1:16:13,  1.78s/it][A
Training...:  82% 11344/13907 [7:12:06<1:14:16,  1.74s/it][A
Training...:  82% 11345/13907 [7:12:07<1:11:23,  1.67s/it][A
Training...:  82% 11346/13907 [7:12:09<1:08:47,  1.61s/it][A
Training...:  82% 11347/13907 [7:12:10<1:06:13,  1.55s/it][A
Training...:  82% 11348/13907 [7:12:12<1:03:25,  1.49s/it][A
Training...:  82% 11349/13907 [7:12:13<1:00:51,  1.43s/it][A
Training...:  82% 11350/13907 [7:12:14<56:17,  1.32s/it]  [A
Training...:  82% 11351/13907 [7:12:18<1:26:59,  2.04s/it][A
Training...:  82% 11352/13907 [7:12:21<1:46:16,  2.50s/it][A
Training...:  82% 11353/13907 [7:12:25<1:56:25,  2.73s/it][A
Training...:  82% 11354/13907 [7:12:28<2:02:00,  2.87s/it][A
Training...:  82% 11355/13907 [7:12:31<2:04:49,  2.93s/it][A
Training...:  82% 11356/13907 [7:12:34<2:07:11,  2.99s/it][A
Training...:  82% 11357/13907 [7:12:37<2:07:15,  2.99s/it][A
Training...:  82% 11358/13907 [7:12:40<2:06:13,  2.97s/it][A
Training...:  82% 11359/13907 [7:12:43<2:04:52,  2.94s/it][A
Training...:  82% 11360/13907 [7:12:46<2:02:46,  2.89s/it][A
Training...:  82% 11361/13907 [7:12:48<2:00:42,  2.84s/it][A
Training...:  82% 11362/13907 [7:12:51<1:58:25,  2.79s/it][A
Training...:  82% 11363/13907 [7:12:54<1:55:59,  2.74s/it][A
Training...:  82% 11364/13907 [7:12:56<1:54:33,  2.70s/it][A
Training...:  82% 11365/13907 [7:12:59<1:52:27,  2.65s/it][A
Training...:  82% 11366/13907 [7:13:01<1:50:23,  2.61s/it][A
Training...:  82% 11367/13907 [7:13:04<1:48:20,  2.56s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:55:18<26:06:17, 31325.86s/it]
Training...:  82% 11367/13907 [7:13:07<1:48:20,  2.56s/it][A
Training...:  82% 11368/13907 [7:13:07<1:51:40,  2.64s/it][A
Training...:  82% 11369/13907 [7:13:09<1:49:27,  2.59s/it][A
Training...:  82% 11370/13907 [7:13:11<1:46:19,  2.51s/it][A
Training...:  82% 11371/13907 [7:13:14<1:44:14,  2.47s/it][A
Training...:  82% 11372/13907 [7:13:16<1:42:20,  2.42s/it][A
Training...:  82% 11373/13907 [7:13:18<1:39:53,  2.37s/it][A
Training...:  82% 11374/13907 [7:13:20<1:37:38,  2.31s/it][A
Training...:  82% 11375/13907 [7:13:23<1:35:48,  2.27s/it][A
Training...:  82% 11376/13907 [7:13:25<1:34:32,  2.24s/it][A
Training...:  82% 11377/13907 [7:13:27<1:33:14,  2.21s/it][A
Training...:  82% 11378/13907 [7:13:29<1:31:34,  2.17s/it][A
Training...:  82% 11379/13907 [7:13:31<1:29:59,  2.14s/it][A
Training...:  82% 11380/13907 [7:13:33<1:28:27,  2.10s/it][A
Training...:  82% 11381/13907 [7:13:35<1:27:17,  2.07s/it][A
Training...:  82% 11382/13907 [7:13:37<1:26:03,  2.04s/it][A
Training...:  82% 11383/13907 [7:13:39<1:24:52,  2.02s/it][A
Training...:  82% 11384/13907 [7:13:41<1:23:39,  1.99s/it][A
Training...:  82% 11385/13907 [7:13:43<1:22:17,  1.96s/it][A
Training...:  82% 11386/13907 [7:13:45<1:21:15,  1.93s/it][A
Training...:  82% 11387/13907 [7:13:47<1:19:57,  1.90s/it][A
Training...:  82% 11388/13907 [7:13:48<1:18:40,  1.87s/it][A
Training...:  82% 11389/13907 [7:13:50<1:17:07,  1.84s/it][A
Training...:  82% 11390/13907 [7:13:52<1:15:30,  1.80s/it][A
Training...:  82% 11391/13907 [7:13:54<1:14:13,  1.77s/it][A
Training...:  82% 11392/13907 [7:13:55<1:12:39,  1.73s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:56:08<26:06:17, 31325.86s/it]
Training...:  82% 11392/13907 [7:13:57<1:12:39,  1.73s/it][A
Training...:  82% 11393/13907 [7:13:57<1:15:05,  1.79s/it][A
Training...:  82% 11394/13907 [7:13:59<1:13:17,  1.75s/it][A
Training...:  82% 11395/13907 [7:14:00<1:10:28,  1.68s/it][A
Training...:  82% 11396/13907 [7:14:02<1:07:42,  1.62s/it][A
Training...:  82% 11397/13907 [7:14:03<1:04:52,  1.55s/it][A
Training...:  82% 11398/13907 [7:14:04<1:02:07,  1.49s/it][A
Training...:  82% 11399/13907 [7:14:06<59:09,  1.42s/it]  [A
Training...:  82% 11400/13907 [7:14:07<54:31,  1.31s/it][A
Training...:  82% 11401/13907 [7:14:10<1:24:57,  2.03s/it][A
Training...:  82% 11402/13907 [7:14:14<1:43:27,  2.48s/it][A
Training...:  82% 11403/13907 [7:14:17<1:54:14,  2.74s/it][A
Training...:  82% 11404/13907 [7:14:21<2:00:15,  2.88s/it][A
Training...:  82% 11405/13907 [7:14:24<2:02:57,  2.95s/it][A
Training...:  82% 11406/13907 [7:14:27<2:03:31,  2.96s/it][A
Training...:  82% 11407/13907 [7:14:30<2:03:01,  2.95s/it][A
Training...:  82% 11408/13907 [7:14:32<2:02:03,  2.93s/it][A
Training...:  82% 11409/13907 [7:14:35<2:00:36,  2.90s/it][A
Training...:  82% 11410/13907 [7:14:38<1:58:48,  2.85s/it][A
Training...:  82% 11411/13907 [7:14:41<1:57:01,  2.81s/it][A
Training...:  82% 11412/13907 [7:14:43<1:55:23,  2.77s/it][A
Training...:  82% 11413/13907 [7:14:46<1:54:06,  2.75s/it][A
Training...:  82% 11414/13907 [7:14:49<1:51:55,  2.69s/it][A
Training...:  82% 11415/13907 [7:14:51<1:50:20,  2.66s/it][A
Training...:  82% 11416/13907 [7:14:54<1:48:41,  2.62s/it][A
Training...:  82% 11417/13907 [7:14:56<1:47:23,  2.59s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:57:10<26:06:17, 31325.86s/it]
Training...:  82% 11417/13907 [7:14:59<1:47:23,  2.59s/it][A
Training...:  82% 11418/13907 [7:14:59<1:50:54,  2.67s/it][A
Training...:  82% 11419/13907 [7:15:02<1:48:12,  2.61s/it][A
Training...:  82% 11420/13907 [7:15:04<1:45:00,  2.53s/it][A
Training...:  82% 11421/13907 [7:15:06<1:43:14,  2.49s/it][A
Training...:  82% 11422/13907 [7:15:09<1:41:17,  2.45s/it][A
Training...:  82% 11423/13907 [7:15:11<1:39:28,  2.40s/it][A
Training...:  82% 11424/13907 [7:15:13<1:37:08,  2.35s/it][A
Training...:  82% 11425/13907 [7:15:15<1:35:38,  2.31s/it][A
Training...:  82% 11426/13907 [7:15:18<1:33:50,  2.27s/it][A
Training...:  82% 11427/13907 [7:15:20<1:32:36,  2.24s/it][A
Training...:  82% 11428/13907 [7:15:22<1:30:59,  2.20s/it][A
Training...:  82% 11429/13907 [7:15:24<1:29:49,  2.18s/it][A
Training...:  82% 11430/13907 [7:15:26<1:28:12,  2.14s/it][A
Training...:  82% 11431/13907 [7:15:28<1:26:56,  2.11s/it][A
Training...:  82% 11432/13907 [7:15:30<1:25:48,  2.08s/it][A
Training...:  82% 11433/13907 [7:15:32<1:24:22,  2.05s/it][A
Training...:  82% 11434/13907 [7:15:34<1:23:08,  2.02s/it][A
Training...:  82% 11435/13907 [7:15:36<1:21:38,  1.98s/it][A
Training...:  82% 11436/13907 [7:15:38<1:20:10,  1.95s/it][A
Training...:  82% 11437/13907 [7:15:40<1:18:58,  1.92s/it][A
Training...:  82% 11438/13907 [7:15:41<1:17:18,  1.88s/it][A
Training...:  82% 11439/13907 [7:15:43<1:16:34,  1.86s/it][A
Training...:  82% 11440/13907 [7:15:45<1:15:02,  1.83s/it][A
Training...:  82% 11441/13907 [7:15:47<1:13:51,  1.80s/it][A
Training...:  82% 11442/13907 [7:15:48<1:12:20,  1.76s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:58:02<26:06:17, 31325.86s/it]
Training...:  82% 11442/13907 [7:15:50<1:12:20,  1.76s/it][A
Training...:  82% 11443/13907 [7:15:50<1:14:19,  1.81s/it][A
Training...:  82% 11444/13907 [7:15:52<1:12:10,  1.76s/it][A
Training...:  82% 11445/13907 [7:15:54<1:09:09,  1.69s/it][A
Training...:  82% 11446/13907 [7:15:55<1:06:22,  1.62s/it][A
Training...:  82% 11447/13907 [7:15:56<1:03:46,  1.56s/it][A
Training...:  82% 11448/13907 [7:15:58<1:01:10,  1.49s/it][A
Training...:  82% 11449/13907 [7:15:59<58:16,  1.42s/it]  [A
Training...:  82% 11450/13907 [7:16:00<54:09,  1.32s/it][A
Training...:  82% 11451/13907 [7:16:04<1:22:42,  2.02s/it][A
Training...:  82% 11452/13907 [7:16:07<1:39:43,  2.44s/it][A
Training...:  82% 11453/13907 [7:16:10<1:49:32,  2.68s/it][A
Training...:  82% 11454/13907 [7:16:14<1:54:52,  2.81s/it][A
Training...:  82% 11455/13907 [7:16:17<1:58:19,  2.90s/it][A
Training...:  82% 11456/13907 [7:16:20<1:58:42,  2.91s/it][A
Training...:  82% 11457/13907 [7:16:22<1:58:02,  2.89s/it][A
Training...:  82% 11458/13907 [7:16:25<1:57:05,  2.87s/it][A
Training...:  82% 11459/13907 [7:16:28<1:56:26,  2.85s/it][A
Training...:  82% 11460/13907 [7:16:31<1:55:26,  2.83s/it][A
Training...:  82% 11461/13907 [7:16:34<1:53:59,  2.80s/it][A
Training...:  82% 11462/13907 [7:16:36<1:52:55,  2.77s/it][A
Training...:  82% 11463/13907 [7:16:39<1:51:26,  2.74s/it][A
Training...:  82% 11464/13907 [7:16:42<1:50:04,  2.70s/it][A
Training...:  82% 11465/13907 [7:16:44<1:48:50,  2.67s/it][A
Training...:  82% 11466/13907 [7:16:47<1:47:22,  2.64s/it][A
Training...:  82% 11467/13907 [7:16:49<1:45:31,  2.59s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:59:03<26:06:17, 31325.86s/it]
Training...:  82% 11467/13907 [7:16:52<1:45:31,  2.59s/it][A
Training...:  82% 11468/13907 [7:16:52<1:48:58,  2.68s/it][A
Training...:  82% 11469/13907 [7:16:55<1:46:17,  2.62s/it][A
Training...:  82% 11470/13907 [7:16:57<1:43:39,  2.55s/it][A
Training...:  82% 11471/13907 [7:16:59<1:40:59,  2.49s/it][A
Training...:  82% 11472/13907 [7:17:02<1:39:19,  2.45s/it][A
Training...:  82% 11473/13907 [7:17:04<1:37:18,  2.40s/it][A
Training...:  83% 11474/13907 [7:17:06<1:35:17,  2.35s/it][A
Training...:  83% 11475/13907 [7:17:08<1:32:52,  2.29s/it][A
Training...:  83% 11476/13907 [7:17:10<1:30:59,  2.25s/it][A
Training...:  83% 11477/13907 [7:17:13<1:29:17,  2.20s/it][A
Training...:  83% 11478/13907 [7:17:15<1:27:38,  2.16s/it][A
Training...:  83% 11479/13907 [7:17:17<1:26:30,  2.14s/it][A
Training...:  83% 11480/13907 [7:17:19<1:24:51,  2.10s/it][A
Training...:  83% 11481/13907 [7:17:21<1:23:35,  2.07s/it][A
Training...:  83% 11482/13907 [7:17:23<1:22:03,  2.03s/it][A
Training...:  83% 11483/13907 [7:17:25<1:20:51,  2.00s/it][A
Training...:  83% 11484/13907 [7:17:26<1:19:16,  1.96s/it][A
Training...:  83% 11485/13907 [7:17:28<1:17:50,  1.93s/it][A
Training...:  83% 11486/13907 [7:17:30<1:16:31,  1.90s/it][A
Training...:  83% 11487/13907 [7:17:32<1:15:11,  1.86s/it][A
Training...:  83% 11488/13907 [7:17:34<1:13:53,  1.83s/it][A
Training...:  83% 11489/13907 [7:17:35<1:12:30,  1.80s/it][A
Training...:  83% 11490/13907 [7:17:37<1:10:58,  1.76s/it][A
Training...:  83% 11491/13907 [7:17:39<1:09:35,  1.73s/it][A
Training...:  83% 11492/13907 [7:17:40<1:07:48,  1.68s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [15:59:53<26:06:17, 31325.86s/it]
Training...:  83% 11492/13907 [7:17:42<1:07:48,  1.68s/it][A
Training...:  83% 11493/13907 [7:17:42<1:09:21,  1.72s/it][A
Training...:  83% 11494/13907 [7:17:44<1:07:34,  1.68s/it][A
Training...:  83% 11495/13907 [7:17:45<1:04:49,  1.61s/it][A
Training...:  83% 11496/13907 [7:17:47<1:02:18,  1.55s/it][A
Training...:  83% 11497/13907 [7:17:48<1:00:00,  1.49s/it][A
Training...:  83% 11498/13907 [7:17:49<57:38,  1.44s/it]  [A
Training...:  83% 11499/13907 [7:17:50<54:54,  1.37s/it][A
Training...:  83% 11500/13907 [7:17:51<51:07,  1.27s/it][A
Training...:  83% 11501/13907 [7:17:55<1:20:28,  2.01s/it][A
Training...:  83% 11502/13907 [7:17:59<1:38:19,  2.45s/it][A
Training...:  83% 11503/13907 [7:18:02<1:48:05,  2.70s/it][A
Training...:  83% 11504/13907 [7:18:05<1:53:23,  2.83s/it][A
Training...:  83% 11505/13907 [7:18:08<1:56:12,  2.90s/it][A
Training...:  83% 11506/13907 [7:18:11<1:56:28,  2.91s/it][A
Training...:  83% 11507/13907 [7:18:14<1:56:01,  2.90s/it][A
Training...:  83% 11508/13907 [7:18:17<1:54:58,  2.88s/it][A
Training...:  83% 11509/13907 [7:18:20<1:54:09,  2.86s/it][A
Training...:  83% 11510/13907 [7:18:22<1:52:48,  2.82s/it][A
Training...:  83% 11511/13907 [7:18:25<1:51:32,  2.79s/it][A
Training...:  83% 11512/13907 [7:18:28<1:49:09,  2.73s/it][A
Training...:  83% 11513/13907 [7:18:30<1:47:19,  2.69s/it][A
Training...:  83% 11514/13907 [7:18:33<1:45:23,  2.64s/it][A
Training...:  83% 11515/13907 [7:18:35<1:43:46,  2.60s/it][A
Training...:  83% 11516/13907 [7:18:38<1:42:02,  2.56s/it][A
Training...:  83% 11517/13907 [7:18:40<1:40:33,  2.52s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:00:54<26:06:17, 31325.86s/it]
Training...:  83% 11517/13907 [7:18:43<1:40:33,  2.52s/it][A
Training...:  83% 11518/13907 [7:18:43<1:43:57,  2.61s/it][A
Training...:  83% 11519/13907 [7:18:45<1:42:13,  2.57s/it][A
Training...:  83% 11520/13907 [7:18:48<1:39:59,  2.51s/it][A
Training...:  83% 11521/13907 [7:18:50<1:37:47,  2.46s/it][A
Training...:  83% 11522/13907 [7:18:52<1:35:49,  2.41s/it][A
Training...:  83% 11523/13907 [7:18:55<1:33:39,  2.36s/it][A
Training...:  83% 11524/13907 [7:18:57<1:31:50,  2.31s/it][A
Training...:  83% 11525/13907 [7:18:59<1:30:05,  2.27s/it][A
Training...:  83% 11526/13907 [7:19:01<1:28:33,  2.23s/it][A
Training...:  83% 11527/13907 [7:19:03<1:27:19,  2.20s/it][A
Training...:  83% 11528/13907 [7:19:05<1:26:19,  2.18s/it][A
Training...:  83% 11529/13907 [7:19:08<1:24:51,  2.14s/it][A
Training...:  83% 11530/13907 [7:19:10<1:23:30,  2.11s/it][A
Training...:  83% 11531/13907 [7:19:12<1:22:25,  2.08s/it][A
Training...:  83% 11532/13907 [7:19:14<1:21:18,  2.05s/it][A
Training...:  83% 11533/13907 [7:19:16<1:20:14,  2.03s/it][A
Training...:  83% 11534/13907 [7:19:17<1:18:52,  1.99s/it][A
Training...:  83% 11535/13907 [7:19:19<1:17:57,  1.97s/it][A
Training...:  83% 11536/13907 [7:19:21<1:16:47,  1.94s/it][A
Training...:  83% 11537/13907 [7:19:23<1:15:42,  1.92s/it][A
Training...:  83% 11538/13907 [7:19:25<1:14:46,  1.89s/it][A
Training...:  83% 11539/13907 [7:19:27<1:13:51,  1.87s/it][A
Training...:  83% 11540/13907 [7:19:29<1:12:31,  1.84s/it][A
Training...:  83% 11541/13907 [7:19:30<1:11:05,  1.80s/it][A
Training...:  83% 11542/13907 [7:19:32<1:09:20,  1.76s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:01:45<26:06:17, 31325.86s/it]
Training...:  83% 11542/13907 [7:19:34<1:09:20,  1.76s/it][A
Training...:  83% 11543/13907 [7:19:34<1:11:16,  1.81s/it][A
Training...:  83% 11544/13907 [7:19:36<1:09:27,  1.76s/it][A
Training...:  83% 11545/13907 [7:19:37<1:07:00,  1.70s/it][A
Training...:  83% 11546/13907 [7:19:39<1:04:12,  1.63s/it][A
Training...:  83% 11547/13907 [7:19:40<1:01:56,  1.57s/it][A
Training...:  83% 11548/13907 [7:19:41<58:51,  1.50s/it]  [A
Training...:  83% 11549/13907 [7:19:43<55:41,  1.42s/it][A
Training...:  83% 11550/13907 [7:19:44<51:19,  1.31s/it][A
Training...:  83% 11551/13907 [7:19:47<1:20:11,  2.04s/it][A
Training...:  83% 11552/13907 [7:19:51<1:37:15,  2.48s/it][A
Training...:  83% 11553/13907 [7:19:54<1:46:46,  2.72s/it][A
Training...:  83% 11554/13907 [7:19:57<1:51:35,  2.85s/it][A
Training...:  83% 11555/13907 [7:20:00<1:54:04,  2.91s/it][A
Training...:  83% 11556/13907 [7:20:03<1:54:36,  2.92s/it][A
Training...:  83% 11557/13907 [7:20:06<1:53:59,  2.91s/it][A
Training...:  83% 11558/13907 [7:20:09<1:53:07,  2.89s/it][A
Training...:  83% 11559/13907 [7:20:12<1:51:30,  2.85s/it][A
Training...:  83% 11560/13907 [7:20:14<1:50:03,  2.81s/it][A
Training...:  83% 11561/13907 [7:20:17<1:48:47,  2.78s/it][A
Training...:  83% 11562/13907 [7:20:20<1:46:55,  2.74s/it][A
Training...:  83% 11563/13907 [7:20:23<1:46:36,  2.73s/it][A
Training...:  83% 11564/13907 [7:20:25<1:44:58,  2.69s/it][A
Training...:  83% 11565/13907 [7:20:28<1:42:40,  2.63s/it][A
Training...:  83% 11566/13907 [7:20:30<1:40:50,  2.58s/it][A
Training...:  83% 11567/13907 [7:20:33<1:39:02,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:02:47<26:06:17, 31325.86s/it]
Training...:  83% 11567/13907 [7:20:35<1:39:02,  2.54s/it][A
Training...:  83% 11568/13907 [7:20:35<1:41:59,  2.62s/it][A
Training...:  83% 11569/13907 [7:20:38<1:39:46,  2.56s/it][A
Training...:  83% 11570/13907 [7:20:40<1:37:11,  2.50s/it][A
Training...:  83% 11571/13907 [7:20:42<1:35:16,  2.45s/it][A
Training...:  83% 11572/13907 [7:20:45<1:33:04,  2.39s/it][A
Training...:  83% 11573/13907 [7:20:47<1:31:22,  2.35s/it][A
Training...:  83% 11574/13907 [7:20:49<1:29:44,  2.31s/it][A
Training...:  83% 11575/13907 [7:20:51<1:28:08,  2.27s/it][A
Training...:  83% 11576/13907 [7:20:53<1:26:38,  2.23s/it][A
Training...:  83% 11577/13907 [7:20:56<1:25:02,  2.19s/it][A
Training...:  83% 11578/13907 [7:20:58<1:23:33,  2.15s/it][A
Training...:  83% 11579/13907 [7:21:00<1:22:19,  2.12s/it][A
Training...:  83% 11580/13907 [7:21:02<1:20:56,  2.09s/it][A
Training...:  83% 11581/13907 [7:21:04<1:19:43,  2.06s/it][A
Training...:  83% 11582/13907 [7:21:06<1:18:24,  2.02s/it][A
Training...:  83% 11583/13907 [7:21:08<1:17:20,  2.00s/it][A
Training...:  83% 11584/13907 [7:21:09<1:16:03,  1.96s/it][A
Training...:  83% 11585/13907 [7:21:11<1:15:03,  1.94s/it][A
Training...:  83% 11586/13907 [7:21:13<1:13:51,  1.91s/it][A
Training...:  83% 11587/13907 [7:21:15<1:12:44,  1.88s/it][A
Training...:  83% 11588/13907 [7:21:17<1:11:34,  1.85s/it][A
Training...:  83% 11589/13907 [7:21:19<1:10:20,  1.82s/it][A
Training...:  83% 11590/13907 [7:21:20<1:09:03,  1.79s/it][A
Training...:  83% 11591/13907 [7:21:22<1:07:37,  1.75s/it][A
Training...:  83% 11592/13907 [7:21:24<1:06:18,  1.72s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:03:37<26:06:17, 31325.86s/it]
Training...:  83% 11592/13907 [7:21:25<1:06:18,  1.72s/it][A
Training...:  83% 11593/13907 [7:21:25<1:08:24,  1.77s/it][A
Training...:  83% 11594/13907 [7:21:27<1:06:41,  1.73s/it][A
Training...:  83% 11595/13907 [7:21:29<1:04:10,  1.67s/it][A
Training...:  83% 11596/13907 [7:21:30<1:01:34,  1.60s/it][A
Training...:  83% 11597/13907 [7:21:31<59:05,  1.53s/it]  [A
Training...:  83% 11598/13907 [7:21:33<56:44,  1.47s/it][A
Training...:  83% 11599/13907 [7:21:34<54:25,  1.41s/it][A
Training...:  83% 11600/13907 [7:21:35<50:55,  1.32s/it][A
Training...:  83% 11601/13907 [7:21:39<1:18:40,  2.05s/it][A
Training...:  83% 11602/13907 [7:21:42<1:34:26,  2.46s/it][A
Training...:  83% 11603/13907 [7:21:45<1:43:10,  2.69s/it][A
Training...:  83% 11604/13907 [7:21:49<1:47:36,  2.80s/it][A
Training...:  83% 11605/13907 [7:21:52<1:50:10,  2.87s/it][A
Training...:  83% 11606/13907 [7:21:55<1:50:48,  2.89s/it][A
Training...:  83% 11607/13907 [7:21:57<1:50:47,  2.89s/it][A
Training...:  83% 11608/13907 [7:22:00<1:49:49,  2.87s/it][A
Training...:  83% 11609/13907 [7:22:03<1:48:46,  2.84s/it][A
Training...:  83% 11610/13907 [7:22:06<1:47:12,  2.80s/it][A
Training...:  83% 11611/13907 [7:22:08<1:45:38,  2.76s/it][A
Training...:  83% 11612/13907 [7:22:11<1:43:51,  2.72s/it][A
Training...:  84% 11613/13907 [7:22:14<1:42:47,  2.69s/it][A
Training...:  84% 11614/13907 [7:22:16<1:41:18,  2.65s/it][A
Training...:  84% 11615/13907 [7:22:19<1:39:54,  2.62s/it][A
Training...:  84% 11616/13907 [7:22:21<1:38:27,  2.58s/it][A
Training...:  84% 11617/13907 [7:22:24<1:37:17,  2.55s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:04:38<26:06:17, 31325.86s/it]
Training...:  84% 11617/13907 [7:22:27<1:37:17,  2.55s/it][A
Training...:  84% 11618/13907 [7:22:27<1:40:50,  2.64s/it][A
Training...:  84% 11619/13907 [7:22:29<1:38:55,  2.59s/it][A
Training...:  84% 11620/13907 [7:22:31<1:36:21,  2.53s/it][A
Training...:  84% 11621/13907 [7:22:34<1:34:28,  2.48s/it][A
Training...:  84% 11622/13907 [7:22:36<1:33:04,  2.44s/it][A
Training...:  84% 11623/13907 [7:22:38<1:31:00,  2.39s/it][A
Training...:  84% 11624/13907 [7:22:41<1:29:28,  2.35s/it][A
Training...:  84% 11625/13907 [7:22:43<1:27:59,  2.31s/it][A
Training...:  84% 11626/13907 [7:22:45<1:26:17,  2.27s/it][A
Training...:  84% 11627/13907 [7:22:47<1:24:38,  2.23s/it][A
Training...:  84% 11628/13907 [7:22:49<1:23:15,  2.19s/it][A
Training...:  84% 11629/13907 [7:22:51<1:22:23,  2.17s/it][A
Training...:  84% 11630/13907 [7:22:54<1:21:51,  2.16s/it][A
Training...:  84% 11631/13907 [7:22:56<1:20:52,  2.13s/it][A
Training...:  84% 11632/13907 [7:22:58<1:19:28,  2.10s/it][A
Training...:  84% 11633/13907 [7:23:00<1:18:04,  2.06s/it][A
Training...:  84% 11634/13907 [7:23:02<1:16:35,  2.02s/it][A
Training...:  84% 11635/13907 [7:23:03<1:15:27,  1.99s/it][A
Training...:  84% 11636/13907 [7:23:05<1:14:08,  1.96s/it][A
Training...:  84% 11637/13907 [7:23:07<1:12:43,  1.92s/it][A
Training...:  84% 11638/13907 [7:23:09<1:11:28,  1.89s/it][A
Training...:  84% 11639/13907 [7:23:11<1:10:14,  1.86s/it][A
Training...:  84% 11640/13907 [7:23:13<1:08:54,  1.82s/it][A
Training...:  84% 11641/13907 [7:23:14<1:07:50,  1.80s/it][A
Training...:  84% 11642/13907 [7:23:16<1:06:15,  1.76s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:05:29<26:06:17, 31325.86s/it]
Training...:  84% 11642/13907 [7:23:18<1:06:15,  1.76s/it][A
Training...:  84% 11643/13907 [7:23:18<1:08:17,  1.81s/it][A
Training...:  84% 11644/13907 [7:23:19<1:06:14,  1.76s/it][A
Training...:  84% 11645/13907 [7:23:21<1:03:54,  1.70s/it][A
Training...:  84% 11646/13907 [7:23:23<1:01:31,  1.63s/it][A
Training...:  84% 11647/13907 [7:23:24<58:58,  1.57s/it]  [A
Training...:  84% 11648/13907 [7:23:25<56:19,  1.50s/it][A
Training...:  84% 11649/13907 [7:23:27<53:33,  1.42s/it][A
Training...:  84% 11650/13907 [7:23:28<49:43,  1.32s/it][A
Training...:  84% 11651/13907 [7:23:31<1:16:34,  2.04s/it][A
Training...:  84% 11652/13907 [7:23:35<1:33:12,  2.48s/it][A
Training...:  84% 11653/13907 [7:23:38<1:42:35,  2.73s/it][A
Training...:  84% 11654/13907 [7:23:41<1:47:25,  2.86s/it][A
Training...:  84% 11655/13907 [7:23:44<1:49:45,  2.92s/it][A
Training...:  84% 11656/13907 [7:23:47<1:49:52,  2.93s/it][A
Training...:  84% 11657/13907 [7:23:50<1:50:07,  2.94s/it][A
Training...:  84% 11658/13907 [7:23:53<1:48:45,  2.90s/it][A
Training...:  84% 11659/13907 [7:23:56<1:47:32,  2.87s/it][A
Training...:  84% 11660/13907 [7:23:59<1:45:34,  2.82s/it][A
Training...:  84% 11661/13907 [7:24:01<1:44:12,  2.78s/it][A
Training...:  84% 11662/13907 [7:24:04<1:43:23,  2.76s/it][A
Training...:  84% 11663/13907 [7:24:07<1:42:20,  2.74s/it][A
Training...:  84% 11664/13907 [7:24:09<1:40:31,  2.69s/it][A
Training...:  84% 11665/13907 [7:24:12<1:38:21,  2.63s/it][A
Training...:  84% 11666/13907 [7:24:14<1:36:46,  2.59s/it][A
Training...:  84% 11667/13907 [7:24:17<1:35:06,  2.55s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:06:31<26:06:17, 31325.86s/it]
Training...:  84% 11667/13907 [7:24:19<1:35:06,  2.55s/it][A
Training...:  84% 11668/13907 [7:24:19<1:37:59,  2.63s/it][A
Training...:  84% 11669/13907 [7:24:22<1:36:03,  2.58s/it][A
Training...:  84% 11670/13907 [7:24:24<1:33:09,  2.50s/it][A
Training...:  84% 11671/13907 [7:24:27<1:31:09,  2.45s/it][A
Training...:  84% 11672/13907 [7:24:29<1:29:08,  2.39s/it][A
Training...:  84% 11673/13907 [7:24:31<1:27:15,  2.34s/it][A
Training...:  84% 11674/13907 [7:24:33<1:25:39,  2.30s/it][A
Training...:  84% 11675/13907 [7:24:35<1:24:15,  2.27s/it][A
Training...:  84% 11676/13907 [7:24:38<1:23:04,  2.23s/it][A
Training...:  84% 11677/13907 [7:24:40<1:21:52,  2.20s/it][A
Training...:  84% 11678/13907 [7:24:42<1:20:27,  2.17s/it][A
Training...:  84% 11679/13907 [7:24:44<1:19:43,  2.15s/it][A
Training...:  84% 11680/13907 [7:24:46<1:18:35,  2.12s/it][A
Training...:  84% 11681/13907 [7:24:48<1:17:43,  2.10s/it][A
Training...:  84% 11682/13907 [7:24:50<1:16:47,  2.07s/it][A
Training...:  84% 11683/13907 [7:24:52<1:15:47,  2.04s/it][A
Training...:  84% 11684/13907 [7:24:54<1:14:31,  2.01s/it][A
Training...:  84% 11685/13907 [7:24:56<1:13:23,  1.98s/it][A
Training...:  84% 11686/13907 [7:24:58<1:12:07,  1.95s/it][A
Training...:  84% 11687/13907 [7:25:00<1:10:48,  1.91s/it][A
Training...:  84% 11688/13907 [7:25:01<1:09:30,  1.88s/it][A
Training...:  84% 11689/13907 [7:25:03<1:08:13,  1.85s/it][A
Training...:  84% 11690/13907 [7:25:05<1:06:55,  1.81s/it][A
Training...:  84% 11691/13907 [7:25:07<1:05:27,  1.77s/it][A
Training...:  84% 11692/13907 [7:25:08<1:04:12,  1.74s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:07:21<26:06:17, 31325.86s/it]
Training...:  84% 11692/13907 [7:25:10<1:04:12,  1.74s/it][A
Training...:  84% 11693/13907 [7:25:10<1:06:20,  1.80s/it][A
Training...:  84% 11694/13907 [7:25:12<1:04:31,  1.75s/it][A
Training...:  84% 11695/13907 [7:25:13<1:02:31,  1.70s/it][A
Training...:  84% 11696/13907 [7:25:15<1:00:10,  1.63s/it][A
Training...:  84% 11697/13907 [7:25:16<57:40,  1.57s/it]  [A
Training...:  84% 11698/13907 [7:25:18<55:04,  1.50s/it][A
Training...:  84% 11699/13907 [7:25:19<52:43,  1.43s/it][A
Training...:  84% 11700/13907 [7:25:20<48:59,  1.33s/it][A
Training...:  84% 11701/13907 [7:25:24<1:16:33,  2.08s/it][A
Training...:  84% 11702/13907 [7:25:27<1:32:32,  2.52s/it][A
Training...:  84% 11703/13907 [7:25:31<1:40:46,  2.74s/it][A
Training...:  84% 11704/13907 [7:25:34<1:45:15,  2.87s/it][A
Training...:  84% 11705/13907 [7:25:37<1:47:07,  2.92s/it][A
Training...:  84% 11706/13907 [7:25:40<1:47:32,  2.93s/it][A
Training...:  84% 11707/13907 [7:25:43<1:46:54,  2.92s/it][A
Training...:  84% 11708/13907 [7:25:45<1:45:59,  2.89s/it][A
Training...:  84% 11709/13907 [7:25:48<1:44:50,  2.86s/it][A
Training...:  84% 11710/13907 [7:25:51<1:43:07,  2.82s/it][A
Training...:  84% 11711/13907 [7:25:54<1:41:33,  2.77s/it][A
Training...:  84% 11712/13907 [7:25:56<1:39:43,  2.73s/it][A
Training...:  84% 11713/13907 [7:25:59<1:38:26,  2.69s/it][A
Training...:  84% 11714/13907 [7:26:01<1:36:42,  2.65s/it][A
Training...:  84% 11715/13907 [7:26:04<1:35:16,  2.61s/it][A
Training...:  84% 11716/13907 [7:26:06<1:33:42,  2.57s/it][A
Training...:  84% 11717/13907 [7:26:09<1:32:41,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:08:23<26:06:17, 31325.86s/it]
Training...:  84% 11717/13907 [7:26:12<1:32:41,  2.54s/it][A
Training...:  84% 11718/13907 [7:26:12<1:36:17,  2.64s/it][A
Training...:  84% 11719/13907 [7:26:14<1:34:39,  2.60s/it][A
Training...:  84% 11720/13907 [7:26:17<1:32:00,  2.52s/it][A
Training...:  84% 11721/13907 [7:26:19<1:29:56,  2.47s/it][A
Training...:  84% 11722/13907 [7:26:21<1:27:58,  2.42s/it][A
Training...:  84% 11723/13907 [7:26:24<1:26:16,  2.37s/it][A
Training...:  84% 11724/13907 [7:26:26<1:24:38,  2.33s/it][A
Training...:  84% 11725/13907 [7:26:28<1:23:15,  2.29s/it][A
Training...:  84% 11726/13907 [7:26:30<1:22:23,  2.27s/it][A
Training...:  84% 11727/13907 [7:26:32<1:21:27,  2.24s/it][A
Training...:  84% 11728/13907 [7:26:34<1:19:46,  2.20s/it][A
Training...:  84% 11729/13907 [7:26:37<1:18:21,  2.16s/it][A
Training...:  84% 11730/13907 [7:26:39<1:16:56,  2.12s/it][A
Training...:  84% 11731/13907 [7:26:41<1:15:40,  2.09s/it][A
Training...:  84% 11732/13907 [7:26:43<1:14:22,  2.05s/it][A
Training...:  84% 11733/13907 [7:26:44<1:13:14,  2.02s/it][A
Training...:  84% 11734/13907 [7:26:46<1:12:13,  1.99s/it][A
Training...:  84% 11735/13907 [7:26:48<1:11:23,  1.97s/it][A
Training...:  84% 11736/13907 [7:26:50<1:10:11,  1.94s/it][A
Training...:  84% 11737/13907 [7:26:52<1:08:50,  1.90s/it][A
Training...:  84% 11738/13907 [7:26:54<1:07:28,  1.87s/it][A
Training...:  84% 11739/13907 [7:26:56<1:06:18,  1.84s/it][A
Training...:  84% 11740/13907 [7:26:57<1:04:57,  1.80s/it][A
Training...:  84% 11741/13907 [7:26:59<1:03:55,  1.77s/it][A
Training...:  84% 11742/13907 [7:27:01<1:02:37,  1.74s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:09:14<26:06:17, 31325.86s/it]
Training...:  84% 11742/13907 [7:27:03<1:02:37,  1.74s/it][A
Training...:  84% 11743/13907 [7:27:03<1:04:43,  1.79s/it][A
Training...:  84% 11744/13907 [7:27:04<1:03:11,  1.75s/it][A
Training...:  84% 11745/13907 [7:27:06<1:01:10,  1.70s/it][A
Training...:  84% 11746/13907 [7:27:07<58:48,  1.63s/it]  [A
Training...:  84% 11747/13907 [7:27:09<56:15,  1.56s/it][A
Training...:  84% 11748/13907 [7:27:10<53:41,  1.49s/it][A
Training...:  84% 11749/13907 [7:27:11<50:44,  1.41s/it][A
Training...:  84% 11750/13907 [7:27:12<46:59,  1.31s/it][A
Training...:  84% 11751/13907 [7:27:16<1:12:57,  2.03s/it][A
Training...:  85% 11752/13907 [7:27:19<1:28:32,  2.47s/it][A
Training...:  85% 11753/13907 [7:27:23<1:38:03,  2.73s/it][A
Training...:  85% 11754/13907 [7:27:26<1:43:54,  2.90s/it][A
Training...:  85% 11755/13907 [7:27:29<1:46:45,  2.98s/it][A
Training...:  85% 11756/13907 [7:27:32<1:47:23,  3.00s/it][A
Training...:  85% 11757/13907 [7:27:35<1:47:00,  2.99s/it][A
Training...:  85% 11758/13907 [7:27:38<1:46:03,  2.96s/it][A
Training...:  85% 11759/13907 [7:27:41<1:44:36,  2.92s/it][A
Training...:  85% 11760/13907 [7:27:44<1:43:59,  2.91s/it][A
Training...:  85% 11761/13907 [7:27:47<1:42:55,  2.88s/it][A
Training...:  85% 11762/13907 [7:27:49<1:40:51,  2.82s/it][A
Training...:  85% 11763/13907 [7:27:52<1:38:56,  2.77s/it][A
Training...:  85% 11764/13907 [7:27:55<1:36:49,  2.71s/it][A
Training...:  85% 11765/13907 [7:27:57<1:35:02,  2.66s/it][A
Training...:  85% 11766/13907 [7:28:00<1:33:34,  2.62s/it][A
Training...:  85% 11767/13907 [7:28:02<1:31:53,  2.58s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:10:16<26:06:17, 31325.86s/it]
Training...:  85% 11767/13907 [7:28:05<1:31:53,  2.58s/it][A
Training...:  85% 11768/13907 [7:28:05<1:34:52,  2.66s/it][A
Training...:  85% 11769/13907 [7:28:07<1:32:18,  2.59s/it][A
Training...:  85% 11770/13907 [7:28:10<1:29:03,  2.50s/it][A
Training...:  85% 11771/13907 [7:28:12<1:26:53,  2.44s/it][A
Training...:  85% 11772/13907 [7:28:14<1:25:04,  2.39s/it][A
Training...:  85% 11773/13907 [7:28:17<1:23:08,  2.34s/it][A
Training...:  85% 11774/13907 [7:28:19<1:21:32,  2.29s/it][A
Training...:  85% 11775/13907 [7:28:21<1:20:12,  2.26s/it][A
Training...:  85% 11776/13907 [7:28:23<1:18:43,  2.22s/it][A
Training...:  85% 11777/13907 [7:28:25<1:17:31,  2.18s/it][A
Training...:  85% 11778/13907 [7:28:27<1:16:36,  2.16s/it][A
Training...:  85% 11779/13907 [7:28:29<1:15:33,  2.13s/it][A
Training...:  85% 11780/13907 [7:28:31<1:14:26,  2.10s/it][A
Training...:  85% 11781/13907 [7:28:33<1:13:34,  2.08s/it][A
Training...:  85% 11782/13907 [7:28:35<1:12:32,  2.05s/it][A
Training...:  85% 11783/13907 [7:28:37<1:11:44,  2.03s/it][A
Training...:  85% 11784/13907 [7:28:39<1:10:32,  1.99s/it][A
Training...:  85% 11785/13907 [7:28:41<1:09:36,  1.97s/it][A
Training...:  85% 11786/13907 [7:28:43<1:08:16,  1.93s/it][A
Training...:  85% 11787/13907 [7:28:45<1:07:15,  1.90s/it][A
Training...:  85% 11788/13907 [7:28:47<1:06:14,  1.88s/it][A
Training...:  85% 11789/13907 [7:28:48<1:05:09,  1.85s/it][A
Training...:  85% 11790/13907 [7:28:50<1:03:47,  1.81s/it][A
Training...:  85% 11791/13907 [7:28:52<1:02:47,  1.78s/it][A
Training...:  85% 11792/13907 [7:28:53<1:01:52,  1.76s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:11:07<26:06:17, 31325.86s/it]
Training...:  85% 11792/13907 [7:28:55<1:01:52,  1.76s/it][A
Training...:  85% 11793/13907 [7:28:55<1:04:06,  1.82s/it][A
Training...:  85% 11794/13907 [7:28:57<1:02:20,  1.77s/it][A
Training...:  85% 11795/13907 [7:28:59<59:41,  1.70s/it]  [A
Training...:  85% 11796/13907 [7:29:00<57:18,  1.63s/it][A
Training...:  85% 11797/13907 [7:29:02<54:50,  1.56s/it][A
Training...:  85% 11798/13907 [7:29:03<52:09,  1.48s/it][A
Training...:  85% 11799/13907 [7:29:04<49:15,  1.40s/it][A
Training...:  85% 11800/13907 [7:29:05<45:22,  1.29s/it][A
Training...:  85% 11801/13907 [7:29:09<1:12:10,  2.06s/it][A
Training...:  85% 11802/13907 [7:29:12<1:27:16,  2.49s/it][A
Training...:  85% 11803/13907 [7:29:16<1:34:55,  2.71s/it][A
Training...:  85% 11804/13907 [7:29:19<1:38:33,  2.81s/it][A
Training...:  85% 11805/13907 [7:29:22<1:40:25,  2.87s/it][A
Training...:  85% 11806/13907 [7:29:25<1:40:47,  2.88s/it][A
Training...:  85% 11807/13907 [7:29:27<1:40:32,  2.87s/it][A
Training...:  85% 11808/13907 [7:29:30<1:39:48,  2.85s/it][A
Training...:  85% 11809/13907 [7:29:33<1:38:32,  2.82s/it][A
Training...:  85% 11810/13907 [7:29:36<1:37:15,  2.78s/it][A
Training...:  85% 11811/13907 [7:29:38<1:35:54,  2.75s/it][A
Training...:  85% 11812/13907 [7:29:41<1:34:30,  2.71s/it][A
Training...:  85% 11813/13907 [7:29:44<1:33:16,  2.67s/it][A
Training...:  85% 11814/13907 [7:29:46<1:31:58,  2.64s/it][A
Training...:  85% 11815/13907 [7:29:49<1:30:34,  2.60s/it][A
Training...:  85% 11816/13907 [7:29:51<1:28:49,  2.55s/it][A
Training...:  85% 11817/13907 [7:29:53<1:27:21,  2.51s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:12:07<26:06:17, 31325.86s/it]
Training...:  85% 11817/13907 [7:29:56<1:27:21,  2.51s/it][A
Training...:  85% 11818/13907 [7:29:56<1:30:27,  2.60s/it][A
Training...:  85% 11819/13907 [7:29:59<1:28:46,  2.55s/it][A
Training...:  85% 11820/13907 [7:30:01<1:26:12,  2.48s/it][A
Training...:  85% 11821/13907 [7:30:03<1:23:52,  2.41s/it][A
Training...:  85% 11822/13907 [7:30:06<1:21:59,  2.36s/it][A
Training...:  85% 11823/13907 [7:30:08<1:20:25,  2.32s/it][A
Training...:  85% 11824/13907 [7:30:10<1:19:12,  2.28s/it][A
Training...:  85% 11825/13907 [7:30:12<1:17:51,  2.24s/it][A
Training...:  85% 11826/13907 [7:30:14<1:17:41,  2.24s/it][A
Training...:  85% 11827/13907 [7:30:16<1:16:15,  2.20s/it][A
Training...:  85% 11828/13907 [7:30:18<1:14:45,  2.16s/it][A
Training...:  85% 11829/13907 [7:30:21<1:13:23,  2.12s/it][A
Training...:  85% 11830/13907 [7:30:23<1:12:20,  2.09s/it][A
Training...:  85% 11831/13907 [7:30:25<1:11:25,  2.06s/it][A
Training...:  85% 11832/13907 [7:30:26<1:10:17,  2.03s/it][A
Training...:  85% 11833/13907 [7:30:28<1:09:24,  2.01s/it][A
Training...:  85% 11834/13907 [7:30:30<1:08:11,  1.97s/it][A
Training...:  85% 11835/13907 [7:30:32<1:07:16,  1.95s/it][A
Training...:  85% 11836/13907 [7:30:34<1:06:16,  1.92s/it][A
Training...:  85% 11837/13907 [7:30:36<1:05:03,  1.89s/it][A
Training...:  85% 11838/13907 [7:30:38<1:03:53,  1.85s/it][A
Training...:  85% 11839/13907 [7:30:39<1:02:52,  1.82s/it][A
Training...:  85% 11840/13907 [7:30:41<1:01:45,  1.79s/it][A
Training...:  85% 11841/13907 [7:30:43<1:00:32,  1.76s/it][A
Training...:  85% 11842/13907 [7:30:44<59:20,  1.72s/it]  [A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:12:58<26:06:17, 31325.86s/it]
Training...:  85% 11842/13907 [7:30:46<59:20,  1.72s/it][A
Training...:  85% 11843/13907 [7:30:46<1:01:17,  1.78s/it][A
Training...:  85% 11844/13907 [7:30:48<59:46,  1.74s/it]  [A
Training...:  85% 11845/13907 [7:30:50<57:34,  1.68s/it][A
Training...:  85% 11846/13907 [7:30:51<55:25,  1.61s/it][A
Training...:  85% 11847/13907 [7:30:52<53:22,  1.55s/it][A
Training...:  85% 11848/13907 [7:30:54<51:29,  1.50s/it][A
Training...:  85% 11849/13907 [7:30:55<48:59,  1.43s/it][A
Training...:  85% 11850/13907 [7:30:56<45:28,  1.33s/it][A
Training...:  85% 11851/13907 [7:31:00<1:09:59,  2.04s/it][A
Training...:  85% 11852/13907 [7:31:03<1:25:03,  2.48s/it][A
Training...:  85% 11853/13907 [7:31:07<1:33:26,  2.73s/it][A
Training...:  85% 11854/13907 [7:31:10<1:37:56,  2.86s/it][A
Training...:  85% 11855/13907 [7:31:13<1:40:09,  2.93s/it][A
Training...:  85% 11856/13907 [7:31:16<1:40:11,  2.93s/it][A
Training...:  85% 11857/13907 [7:31:19<1:39:53,  2.92s/it][A
Training...:  85% 11858/13907 [7:31:22<1:38:45,  2.89s/it][A
Training...:  85% 11859/13907 [7:31:24<1:37:36,  2.86s/it][A
Training...:  85% 11860/13907 [7:31:27<1:37:14,  2.85s/it][A
Training...:  85% 11861/13907 [7:31:30<1:37:19,  2.85s/it][A
Training...:  85% 11862/13907 [7:31:33<1:35:55,  2.81s/it][A
Training...:  85% 11863/13907 [7:31:35<1:34:23,  2.77s/it][A
Training...:  85% 11864/13907 [7:31:38<1:32:30,  2.72s/it][A
Training...:  85% 11865/13907 [7:31:41<1:30:20,  2.65s/it][A
Training...:  85% 11866/13907 [7:31:43<1:28:28,  2.60s/it][A
Training...:  85% 11867/13907 [7:31:45<1:26:49,  2.55s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:14:00<26:06:17, 31325.86s/it]
Training...:  85% 11867/13907 [7:31:48<1:26:49,  2.55s/it][A
Training...:  85% 11868/13907 [7:31:48<1:29:36,  2.64s/it][A
Training...:  85% 11869/13907 [7:31:51<1:27:32,  2.58s/it][A
Training...:  85% 11870/13907 [7:31:53<1:25:00,  2.50s/it][A
Training...:  85% 11871/13907 [7:31:55<1:23:06,  2.45s/it][A
Training...:  85% 11872/13907 [7:31:58<1:20:59,  2.39s/it][A
Training...:  85% 11873/13907 [7:32:00<1:19:20,  2.34s/it][A
Training...:  85% 11874/13907 [7:32:02<1:17:43,  2.29s/it][A
Training...:  85% 11875/13907 [7:32:04<1:16:30,  2.26s/it][A
Training...:  85% 11876/13907 [7:32:06<1:15:16,  2.22s/it][A
Training...:  85% 11877/13907 [7:32:09<1:14:41,  2.21s/it][A
Training...:  85% 11878/13907 [7:32:11<1:13:44,  2.18s/it][A
Training...:  85% 11879/13907 [7:32:13<1:13:06,  2.16s/it][A
Training...:  85% 11880/13907 [7:32:15<1:12:08,  2.14s/it][A
Training...:  85% 11881/13907 [7:32:17<1:11:19,  2.11s/it][A
Training...:  85% 11882/13907 [7:32:19<1:10:26,  2.09s/it][A
Training...:  85% 11883/13907 [7:32:21<1:09:27,  2.06s/it][A
Training...:  85% 11884/13907 [7:32:23<1:08:27,  2.03s/it][A
Training...:  85% 11885/13907 [7:32:25<1:07:35,  2.01s/it][A
Training...:  85% 11886/13907 [7:32:27<1:06:27,  1.97s/it][A
Training...:  85% 11887/13907 [7:32:29<1:05:28,  1.94s/it][A
Training...:  85% 11888/13907 [7:32:30<1:04:16,  1.91s/it][A
Training...:  85% 11889/13907 [7:32:32<1:03:12,  1.88s/it][A
Training...:  85% 11890/13907 [7:32:34<1:02:06,  1.85s/it][A
Training...:  86% 11891/13907 [7:32:36<1:01:10,  1.82s/it][A
Training...:  86% 11892/13907 [7:32:38<1:00:25,  1.80s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:14:51<26:06:17, 31325.86s/it]
Training...:  86% 11892/13907 [7:32:40<1:00:25,  1.80s/it][A
Training...:  86% 11893/13907 [7:32:40<1:02:32,  1.86s/it][A
Training...:  86% 11894/13907 [7:32:41<1:00:44,  1.81s/it][A
Training...:  86% 11895/13907 [7:32:43<57:55,  1.73s/it]  [A
Training...:  86% 11896/13907 [7:32:44<55:06,  1.64s/it][A
Training...:  86% 11897/13907 [7:32:46<52:47,  1.58s/it][A
Training...:  86% 11898/13907 [7:32:47<50:28,  1.51s/it][A
Training...:  86% 11899/13907 [7:32:48<47:56,  1.43s/it][A
Training...:  86% 11900/13907 [7:32:49<44:20,  1.33s/it][A
Training...:  86% 11901/13907 [7:32:53<1:09:29,  2.08s/it][A
Training...:  86% 11902/13907 [7:32:57<1:24:16,  2.52s/it][A
Training...:  86% 11903/13907 [7:33:00<1:32:07,  2.76s/it][A
Training...:  86% 11904/13907 [7:33:03<1:35:58,  2.87s/it][A
Training...:  86% 11905/13907 [7:33:06<1:38:13,  2.94s/it][A
Training...:  86% 11906/13907 [7:33:09<1:38:25,  2.95s/it][A
Training...:  86% 11907/13907 [7:33:12<1:38:01,  2.94s/it][A
Training...:  86% 11908/13907 [7:33:15<1:37:31,  2.93s/it][A
Training...:  86% 11909/13907 [7:33:18<1:36:22,  2.89s/it][A
Training...:  86% 11910/13907 [7:33:21<1:35:03,  2.86s/it][A
Training...:  86% 11911/13907 [7:33:23<1:33:38,  2.81s/it][A
Training...:  86% 11912/13907 [7:33:26<1:32:01,  2.77s/it][A
Training...:  86% 11913/13907 [7:33:29<1:30:59,  2.74s/it][A
Training...:  86% 11914/13907 [7:33:31<1:29:21,  2.69s/it][A
Training...:  86% 11915/13907 [7:33:34<1:27:41,  2.64s/it][A
Training...:  86% 11916/13907 [7:33:36<1:26:20,  2.60s/it][A
Training...:  86% 11917/13907 [7:33:39<1:24:52,  2.56s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:15:53<26:06:17, 31325.86s/it]
Training...:  86% 11917/13907 [7:33:42<1:24:52,  2.56s/it][A
Training...:  86% 11918/13907 [7:33:42<1:27:49,  2.65s/it][A
Training...:  86% 11919/13907 [7:33:44<1:25:52,  2.59s/it][A
Training...:  86% 11920/13907 [7:33:47<1:25:01,  2.57s/it][A
Training...:  86% 11921/13907 [7:33:49<1:23:01,  2.51s/it][A
Training...:  86% 11922/13907 [7:33:51<1:20:30,  2.43s/it][A
Training...:  86% 11923/13907 [7:33:53<1:18:29,  2.37s/it][A
Training...:  86% 11924/13907 [7:33:56<1:16:38,  2.32s/it][A
Training...:  86% 11925/13907 [7:33:58<1:15:04,  2.27s/it][A
Training...:  86% 11926/13907 [7:34:00<1:13:41,  2.23s/it][A
Training...:  86% 11927/13907 [7:34:02<1:12:28,  2.20s/it][A
Training...:  86% 11928/13907 [7:34:04<1:11:09,  2.16s/it][A
Training...:  86% 11929/13907 [7:34:06<1:10:14,  2.13s/it][A
Training...:  86% 11930/13907 [7:34:08<1:09:29,  2.11s/it][A
Training...:  86% 11931/13907 [7:34:10<1:08:47,  2.09s/it][A
Training...:  86% 11932/13907 [7:34:12<1:07:51,  2.06s/it][A
Training...:  86% 11933/13907 [7:34:14<1:06:50,  2.03s/it][A
Training...:  86% 11934/13907 [7:34:16<1:06:11,  2.01s/it][A
Training...:  86% 11935/13907 [7:34:18<1:05:28,  1.99s/it][A
Training...:  86% 11936/13907 [7:34:20<1:03:59,  1.95s/it][A
Training...:  86% 11937/13907 [7:34:22<1:02:43,  1.91s/it][A
Training...:  86% 11938/13907 [7:34:24<1:01:18,  1.87s/it][A
Training...:  86% 11939/13907 [7:34:25<1:00:13,  1.84s/it][A
Training...:  86% 11940/13907 [7:34:27<59:02,  1.80s/it]  [A
Training...:  86% 11941/13907 [7:34:29<57:54,  1.77s/it][A
Training...:  86% 11942/13907 [7:34:30<56:37,  1.73s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:16:44<26:06:17, 31325.86s/it]
Training...:  86% 11942/13907 [7:34:32<56:37,  1.73s/it][A
Training...:  86% 11943/13907 [7:34:32<58:19,  1.78s/it][A
Training...:  86% 11944/13907 [7:34:34<56:45,  1.74s/it][A
Training...:  86% 11945/13907 [7:34:35<54:38,  1.67s/it][A
Training...:  86% 11946/13907 [7:34:37<52:23,  1.60s/it][A
Training...:  86% 11947/13907 [7:34:38<50:22,  1.54s/it][A
Training...:  86% 11948/13907 [7:34:40<48:14,  1.48s/it][A
Training...:  86% 11949/13907 [7:34:41<45:39,  1.40s/it][A
Training...:  86% 11950/13907 [7:34:42<41:59,  1.29s/it][A
Training...:  86% 11951/13907 [7:34:46<1:05:42,  2.02s/it][A
Training...:  86% 11952/13907 [7:34:49<1:20:07,  2.46s/it][A
Training...:  86% 11953/13907 [7:34:52<1:28:15,  2.71s/it][A
Training...:  86% 11954/13907 [7:34:56<1:33:24,  2.87s/it][A
Training...:  86% 11955/13907 [7:34:59<1:35:27,  2.93s/it][A
Training...:  86% 11956/13907 [7:35:02<1:36:10,  2.96s/it][A
Training...:  86% 11957/13907 [7:35:05<1:36:17,  2.96s/it][A
Training...:  86% 11958/13907 [7:35:08<1:36:31,  2.97s/it][A
Training...:  86% 11959/13907 [7:35:11<1:34:56,  2.92s/it][A
Training...:  86% 11960/13907 [7:35:13<1:33:07,  2.87s/it][A
Training...:  86% 11961/13907 [7:35:16<1:31:30,  2.82s/it][A
Training...:  86% 11962/13907 [7:35:19<1:29:39,  2.77s/it][A
Training...:  86% 11963/13907 [7:35:21<1:27:47,  2.71s/it][A
Training...:  86% 11964/13907 [7:35:24<1:26:16,  2.66s/it][A
Training...:  86% 11965/13907 [7:35:26<1:24:45,  2.62s/it][A
Training...:  86% 11966/13907 [7:35:29<1:23:28,  2.58s/it][A
Training...:  86% 11967/13907 [7:35:31<1:22:14,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:17:45<26:06:17, 31325.86s/it]
Training...:  86% 11967/13907 [7:35:34<1:22:14,  2.54s/it][A
Training...:  86% 11968/13907 [7:35:34<1:25:13,  2.64s/it][A
Training...:  86% 11969/13907 [7:35:37<1:23:32,  2.59s/it][A
Training...:  86% 11970/13907 [7:35:39<1:21:00,  2.51s/it][A
Training...:  86% 11971/13907 [7:35:41<1:18:56,  2.45s/it][A
Training...:  86% 11972/13907 [7:35:43<1:17:03,  2.39s/it][A
Training...:  86% 11973/13907 [7:35:46<1:15:37,  2.35s/it][A
Training...:  86% 11974/13907 [7:35:48<1:14:14,  2.30s/it][A
Training...:  86% 11975/13907 [7:35:50<1:12:58,  2.27s/it][A
Training...:  86% 11976/13907 [7:35:52<1:11:56,  2.24s/it][A
Training...:  86% 11977/13907 [7:35:54<1:10:41,  2.20s/it][A
Training...:  86% 11978/13907 [7:35:56<1:09:37,  2.17s/it][A
Training...:  86% 11979/13907 [7:35:58<1:08:49,  2.14s/it][A
Training...:  86% 11980/13907 [7:36:01<1:07:56,  2.12s/it][A
Training...:  86% 11981/13907 [7:36:03<1:07:01,  2.09s/it][A
Training...:  86% 11982/13907 [7:36:05<1:06:06,  2.06s/it][A
Training...:  86% 11983/13907 [7:36:07<1:05:16,  2.04s/it][A
Training...:  86% 11984/13907 [7:36:08<1:04:22,  2.01s/it][A
Training...:  86% 11985/13907 [7:36:10<1:03:48,  1.99s/it][A
Training...:  86% 11986/13907 [7:36:12<1:02:48,  1.96s/it][A
Training...:  86% 11987/13907 [7:36:14<1:02:31,  1.95s/it][A
Training...:  86% 11988/13907 [7:36:16<1:01:21,  1.92s/it][A
Training...:  86% 11989/13907 [7:36:18<59:59,  1.88s/it]  [A
Training...:  86% 11990/13907 [7:36:20<58:39,  1.84s/it][A
Training...:  86% 11991/13907 [7:36:21<57:27,  1.80s/it][A
Training...:  86% 11992/13907 [7:36:23<56:08,  1.76s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:18:36<26:06:17, 31325.86s/it]
Training...:  86% 11992/13907 [7:36:25<56:08,  1.76s/it][A
Training...:  86% 11993/13907 [7:36:25<57:55,  1.82s/it][A
Training...:  86% 11994/13907 [7:36:27<56:06,  1.76s/it][A
Training...:  86% 11995/13907 [7:36:28<53:57,  1.69s/it][A
Training...:  86% 11996/13907 [7:36:30<51:28,  1.62s/it][A
Training...:  86% 11997/13907 [7:36:31<49:10,  1.54s/it][A
Training...:  86% 11998/13907 [7:36:32<47:00,  1.48s/it][A
Training...:  86% 11999/13907 [7:36:33<44:40,  1.40s/it][A
Training...:  86% 12000/13907 [7:36:35<41:24,  1.30s/it][A
Training...:  86% 12001/13907 [7:36:38<1:04:34,  2.03s/it][A
Training...:  86% 12002/13907 [7:36:42<1:18:29,  2.47s/it][A
Training...:  86% 12003/13907 [7:36:45<1:25:44,  2.70s/it][A
Training...:  86% 12004/13907 [7:36:48<1:29:29,  2.82s/it][A
Training...:  86% 12005/13907 [7:36:51<1:31:22,  2.88s/it][A
Training...:  86% 12006/13907 [7:36:54<1:31:50,  2.90s/it][A
Training...:  86% 12007/13907 [7:36:57<1:31:56,  2.90s/it][A
Training...:  86% 12008/13907 [7:37:00<1:31:02,  2.88s/it][A
Training...:  86% 12009/13907 [7:37:03<1:30:39,  2.87s/it][A
Training...:  86% 12010/13907 [7:37:05<1:29:29,  2.83s/it][A
Training...:  86% 12011/13907 [7:37:08<1:28:02,  2.79s/it][A
Training...:  86% 12012/13907 [7:37:11<1:26:47,  2.75s/it][A
Training...:  86% 12013/13907 [7:37:13<1:25:24,  2.71s/it][A
Training...:  86% 12014/13907 [7:37:16<1:24:04,  2.67s/it][A
Training...:  86% 12015/13907 [7:37:18<1:22:40,  2.62s/it][A
Training...:  86% 12016/13907 [7:37:21<1:21:09,  2.57s/it][A
Training...:  86% 12017/13907 [7:37:23<1:20:45,  2.56s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:19:37<26:06:17, 31325.86s/it]
Training...:  86% 12017/13907 [7:37:26<1:20:45,  2.56s/it][A
Training...:  86% 12018/13907 [7:37:26<1:23:23,  2.65s/it][A
Training...:  86% 12019/13907 [7:37:29<1:21:43,  2.60s/it][A
Training...:  86% 12020/13907 [7:37:31<1:19:03,  2.51s/it][A
Training...:  86% 12021/13907 [7:37:33<1:17:10,  2.46s/it][A
Training...:  86% 12022/13907 [7:37:36<1:15:31,  2.40s/it][A
Training...:  86% 12023/13907 [7:37:38<1:14:02,  2.36s/it][A
Training...:  86% 12024/13907 [7:37:40<1:12:33,  2.31s/it][A
Training...:  86% 12025/13907 [7:37:42<1:11:19,  2.27s/it][A
Training...:  86% 12026/13907 [7:37:44<1:10:08,  2.24s/it][A
Training...:  86% 12027/13907 [7:37:47<1:08:56,  2.20s/it][A
Training...:  86% 12028/13907 [7:37:49<1:07:59,  2.17s/it][A
Training...:  86% 12029/13907 [7:37:51<1:07:01,  2.14s/it][A
Training...:  87% 12030/13907 [7:37:53<1:06:07,  2.11s/it][A
Training...:  87% 12031/13907 [7:37:55<1:05:21,  2.09s/it][A
Training...:  87% 12032/13907 [7:37:57<1:04:28,  2.06s/it][A
Training...:  87% 12033/13907 [7:37:59<1:03:26,  2.03s/it][A
Training...:  87% 12034/13907 [7:38:01<1:02:21,  2.00s/it][A
Training...:  87% 12035/13907 [7:38:03<1:01:16,  1.96s/it][A
Training...:  87% 12036/13907 [7:38:04<1:00:29,  1.94s/it][A
Training...:  87% 12037/13907 [7:38:06<59:29,  1.91s/it]  [A
Training...:  87% 12038/13907 [7:38:08<58:31,  1.88s/it][A
Training...:  87% 12039/13907 [7:38:10<57:48,  1.86s/it][A
Training...:  87% 12040/13907 [7:38:12<56:37,  1.82s/it][A
Training...:  87% 12041/13907 [7:38:13<55:30,  1.79s/it][A
Training...:  87% 12042/13907 [7:38:15<54:30,  1.75s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:20:28<26:06:17, 31325.86s/it]
Training...:  87% 12042/13907 [7:38:17<54:30,  1.75s/it][A
Training...:  87% 12043/13907 [7:38:17<56:15,  1.81s/it][A
Training...:  87% 12044/13907 [7:38:19<54:32,  1.76s/it][A
Training...:  87% 12045/13907 [7:38:20<52:19,  1.69s/it][A
Training...:  87% 12046/13907 [7:38:22<50:08,  1.62s/it][A
Training...:  87% 12047/13907 [7:38:23<47:58,  1.55s/it][A
Training...:  87% 12048/13907 [7:38:24<46:03,  1.49s/it][A
Training...:  87% 12049/13907 [7:38:26<43:44,  1.41s/it][A
Training...:  87% 12050/13907 [7:38:27<40:40,  1.31s/it][A
Training...:  87% 12051/13907 [7:38:31<1:04:35,  2.09s/it][A
Training...:  87% 12052/13907 [7:38:34<1:17:29,  2.51s/it][A
Training...:  87% 12053/13907 [7:38:37<1:24:16,  2.73s/it][A
Training...:  87% 12054/13907 [7:38:40<1:27:54,  2.85s/it][A
Training...:  87% 12055/13907 [7:38:43<1:29:35,  2.90s/it][A
Training...:  87% 12056/13907 [7:38:46<1:29:54,  2.91s/it][A
Training...:  87% 12057/13907 [7:38:49<1:29:53,  2.92s/it][A
Training...:  87% 12058/13907 [7:38:52<1:29:50,  2.92s/it][A
Training...:  87% 12059/13907 [7:38:55<1:28:34,  2.88s/it][A
Training...:  87% 12060/13907 [7:38:58<1:26:57,  2.82s/it][A
Training...:  87% 12061/13907 [7:39:00<1:25:13,  2.77s/it][A
Training...:  87% 12062/13907 [7:39:03<1:23:35,  2.72s/it][A
Training...:  87% 12063/13907 [7:39:06<1:22:18,  2.68s/it][A
Training...:  87% 12064/13907 [7:39:08<1:20:55,  2.63s/it][A
Training...:  87% 12065/13907 [7:39:11<1:19:39,  2.59s/it][A
Training...:  87% 12066/13907 [7:39:13<1:18:40,  2.56s/it][A
Training...:  87% 12067/13907 [7:39:16<1:17:42,  2.53s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:21:30<26:06:17, 31325.86s/it]
Training...:  87% 12067/13907 [7:39:18<1:17:42,  2.53s/it][A
Training...:  87% 12068/13907 [7:39:18<1:20:22,  2.62s/it][A
Training...:  87% 12069/13907 [7:39:21<1:18:46,  2.57s/it][A
Training...:  87% 12070/13907 [7:39:23<1:16:40,  2.50s/it][A
Training...:  87% 12071/13907 [7:39:25<1:15:02,  2.45s/it][A
Training...:  87% 12072/13907 [7:39:28<1:13:33,  2.40s/it][A
Training...:  87% 12073/13907 [7:39:30<1:12:05,  2.36s/it][A
Training...:  87% 12074/13907 [7:39:32<1:11:03,  2.33s/it][A
Training...:  87% 12075/13907 [7:39:34<1:09:54,  2.29s/it][A
Training...:  87% 12076/13907 [7:39:37<1:08:56,  2.26s/it][A
Training...:  87% 12077/13907 [7:39:39<1:07:46,  2.22s/it][A
Training...:  87% 12078/13907 [7:39:41<1:06:24,  2.18s/it][A
Training...:  87% 12079/13907 [7:39:43<1:05:32,  2.15s/it][A
Training...:  87% 12080/13907 [7:39:45<1:04:26,  2.12s/it][A
Training...:  87% 12081/13907 [7:39:47<1:03:26,  2.08s/it][A
Training...:  87% 12082/13907 [7:39:49<1:02:27,  2.05s/it][A
Training...:  87% 12083/13907 [7:39:51<1:01:29,  2.02s/it][A
Training...:  87% 12084/13907 [7:39:53<1:00:36,  1.99s/it][A
Training...:  87% 12085/13907 [7:39:55<59:40,  1.97s/it]  [A
Training...:  87% 12086/13907 [7:39:57<58:50,  1.94s/it][A
Training...:  87% 12087/13907 [7:39:59<58:15,  1.92s/it][A
Training...:  87% 12088/13907 [7:40:00<57:20,  1.89s/it][A
Training...:  87% 12089/13907 [7:40:02<56:19,  1.86s/it][A
Training...:  87% 12090/13907 [7:40:04<55:01,  1.82s/it][A
Training...:  87% 12091/13907 [7:40:06<53:53,  1.78s/it][A
Training...:  87% 12092/13907 [7:40:07<52:38,  1.74s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:22:20<26:06:17, 31325.86s/it]
Training...:  87% 12092/13907 [7:40:09<52:38,  1.74s/it][A
Training...:  87% 12093/13907 [7:40:09<54:14,  1.79s/it][A
Training...:  87% 12094/13907 [7:40:11<52:46,  1.75s/it][A
Training...:  87% 12095/13907 [7:40:12<51:07,  1.69s/it][A
Training...:  87% 12096/13907 [7:40:14<49:02,  1.62s/it][A
Training...:  87% 12097/13907 [7:40:15<47:01,  1.56s/it][A
Training...:  87% 12098/13907 [7:40:17<44:50,  1.49s/it][A
Training...:  87% 12099/13907 [7:40:18<42:19,  1.40s/it][A
Training...:  87% 12100/13907 [7:40:19<39:07,  1.30s/it][A
Training...:  87% 12101/13907 [7:40:22<1:00:43,  2.02s/it][A
Training...:  87% 12102/13907 [7:40:26<1:13:42,  2.45s/it][A
Training...:  87% 12103/13907 [7:40:29<1:20:38,  2.68s/it][A
Training...:  87% 12104/13907 [7:40:32<1:24:16,  2.80s/it][A
Training...:  87% 12105/13907 [7:40:35<1:26:06,  2.87s/it][A
Training...:  87% 12106/13907 [7:40:38<1:26:58,  2.90s/it][A
Training...:  87% 12107/13907 [7:40:41<1:26:55,  2.90s/it][A
Training...:  87% 12108/13907 [7:40:44<1:26:18,  2.88s/it][A
Training...:  87% 12109/13907 [7:40:47<1:25:49,  2.86s/it][A
Training...:  87% 12110/13907 [7:40:50<1:24:55,  2.84s/it][A
Training...:  87% 12111/13907 [7:40:52<1:24:00,  2.81s/it][A
Training...:  87% 12112/13907 [7:40:55<1:22:43,  2.77s/it][A
Training...:  87% 12113/13907 [7:40:58<1:21:30,  2.73s/it][A
Training...:  87% 12114/13907 [7:41:00<1:20:06,  2.68s/it][A
Training...:  87% 12115/13907 [7:41:03<1:18:55,  2.64s/it][A
Training...:  87% 12116/13907 [7:41:05<1:17:40,  2.60s/it][A
Training...:  87% 12117/13907 [7:41:08<1:16:42,  2.57s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:23:22<26:06:17, 31325.86s/it]
Training...:  87% 12117/13907 [7:41:11<1:16:42,  2.57s/it][A
Training...:  87% 12118/13907 [7:41:11<1:19:00,  2.65s/it][A
Training...:  87% 12119/13907 [7:41:13<1:17:18,  2.59s/it][A
Training...:  87% 12120/13907 [7:41:16<1:16:06,  2.56s/it][A
Training...:  87% 12121/13907 [7:41:18<1:14:12,  2.49s/it][A
Training...:  87% 12122/13907 [7:41:20<1:12:51,  2.45s/it][A
Training...:  87% 12123/13907 [7:41:22<1:10:56,  2.39s/it][A
Training...:  87% 12124/13907 [7:41:25<1:09:21,  2.33s/it][A
Training...:  87% 12125/13907 [7:41:27<1:08:07,  2.29s/it][A
Training...:  87% 12126/13907 [7:41:29<1:06:50,  2.25s/it][A
Training...:  87% 12127/13907 [7:41:31<1:05:34,  2.21s/it][A
Training...:  87% 12128/13907 [7:41:33<1:04:28,  2.17s/it][A
Training...:  87% 12129/13907 [7:41:35<1:03:34,  2.15s/it][A
Training...:  87% 12130/13907 [7:41:37<1:02:30,  2.11s/it][A
Training...:  87% 12131/13907 [7:41:39<1:01:28,  2.08s/it][A
Training...:  87% 12132/13907 [7:41:41<1:00:39,  2.05s/it][A
Training...:  87% 12133/13907 [7:41:43<59:45,  2.02s/it]  [A
Training...:  87% 12134/13907 [7:41:45<58:45,  1.99s/it][A
Training...:  87% 12135/13907 [7:41:47<57:53,  1.96s/it][A
Training...:  87% 12136/13907 [7:41:49<56:59,  1.93s/it][A
Training...:  87% 12137/13907 [7:41:51<56:01,  1.90s/it][A
Training...:  87% 12138/13907 [7:41:53<55:00,  1.87s/it][A
Training...:  87% 12139/13907 [7:41:54<54:05,  1.84s/it][A
Training...:  87% 12140/13907 [7:41:56<53:09,  1.81s/it][A
Training...:  87% 12141/13907 [7:41:58<52:19,  1.78s/it][A
Training...:  87% 12142/13907 [7:41:59<51:27,  1.75s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:24:13<26:06:17, 31325.86s/it]
Training...:  87% 12142/13907 [7:42:01<51:27,  1.75s/it][A
Training...:  87% 12143/13907 [7:42:01<53:19,  1.81s/it][A
Training...:  87% 12144/13907 [7:42:03<51:47,  1.76s/it][A
Training...:  87% 12145/13907 [7:42:05<50:20,  1.71s/it][A
Training...:  87% 12146/13907 [7:42:06<48:28,  1.65s/it][A
Training...:  87% 12147/13907 [7:42:08<46:31,  1.59s/it][A
Training...:  87% 12148/13907 [7:42:09<44:28,  1.52s/it][A
Training...:  87% 12149/13907 [7:42:10<42:13,  1.44s/it][A
Training...:  87% 12150/13907 [7:42:11<38:57,  1.33s/it][A
Training...:  87% 12151/13907 [7:42:15<1:00:22,  2.06s/it][A
Training...:  87% 12152/13907 [7:42:19<1:13:16,  2.51s/it][A
Training...:  87% 12153/13907 [7:42:22<1:20:10,  2.74s/it][A
Training...:  87% 12154/13907 [7:42:25<1:23:38,  2.86s/it][A
Training...:  87% 12155/13907 [7:42:28<1:25:18,  2.92s/it][A
Training...:  87% 12156/13907 [7:42:31<1:25:45,  2.94s/it][A
Training...:  87% 12157/13907 [7:42:34<1:25:46,  2.94s/it][A
Training...:  87% 12158/13907 [7:42:37<1:24:44,  2.91s/it][A
Training...:  87% 12159/13907 [7:42:40<1:23:23,  2.86s/it][A
Training...:  87% 12160/13907 [7:42:42<1:21:58,  2.82s/it][A
Training...:  87% 12161/13907 [7:42:45<1:20:34,  2.77s/it][A
Training...:  87% 12162/13907 [7:42:48<1:18:57,  2.72s/it][A
Training...:  87% 12163/13907 [7:42:50<1:17:28,  2.67s/it][A
Training...:  87% 12164/13907 [7:42:53<1:16:04,  2.62s/it][A
Training...:  87% 12165/13907 [7:42:55<1:14:48,  2.58s/it][A
Training...:  87% 12166/13907 [7:42:58<1:13:37,  2.54s/it][A
Training...:  87% 12167/13907 [7:43:00<1:12:24,  2.50s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:25:14<26:06:17, 31325.86s/it]
Training...:  87% 12167/13907 [7:43:03<1:12:24,  2.50s/it][A
Training...:  87% 12168/13907 [7:43:03<1:15:10,  2.59s/it][A
Training...:  88% 12169/13907 [7:43:05<1:14:15,  2.56s/it][A
Training...:  88% 12170/13907 [7:43:08<1:12:40,  2.51s/it][A
Training...:  88% 12171/13907 [7:43:10<1:10:48,  2.45s/it][A
Training...:  88% 12172/13907 [7:43:12<1:09:00,  2.39s/it][A
Training...:  88% 12173/13907 [7:43:14<1:07:22,  2.33s/it][A
Training...:  88% 12174/13907 [7:43:17<1:06:07,  2.29s/it][A
Training...:  88% 12175/13907 [7:43:19<1:05:04,  2.25s/it][A
Training...:  88% 12176/13907 [7:43:21<1:04:01,  2.22s/it][A
Training...:  88% 12177/13907 [7:43:23<1:02:54,  2.18s/it][A
Training...:  88% 12178/13907 [7:43:25<1:01:43,  2.14s/it][A
Training...:  88% 12179/13907 [7:43:27<1:00:43,  2.11s/it][A
Training...:  88% 12180/13907 [7:43:29<59:47,  2.08s/it]  [A
Training...:  88% 12181/13907 [7:43:31<59:17,  2.06s/it][A
Training...:  88% 12182/13907 [7:43:33<58:24,  2.03s/it][A
Training...:  88% 12183/13907 [7:43:35<57:35,  2.00s/it][A
Training...:  88% 12184/13907 [7:43:37<56:43,  1.98s/it][A
Training...:  88% 12185/13907 [7:43:39<55:58,  1.95s/it][A
Training...:  88% 12186/13907 [7:43:41<55:03,  1.92s/it][A
Training...:  88% 12187/13907 [7:43:42<53:54,  1.88s/it][A
Training...:  88% 12188/13907 [7:43:44<53:05,  1.85s/it][A
Training...:  88% 12189/13907 [7:43:46<51:59,  1.82s/it][A
Training...:  88% 12190/13907 [7:43:48<50:57,  1.78s/it][A
Training...:  88% 12191/13907 [7:43:49<50:08,  1.75s/it][A
Training...:  88% 12192/13907 [7:43:51<48:58,  1.71s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:26:04<26:06:17, 31325.86s/it]
Training...:  88% 12192/13907 [7:43:53<48:58,  1.71s/it][A
Training...:  88% 12193/13907 [7:43:53<50:37,  1.77s/it][A
Training...:  88% 12194/13907 [7:43:54<49:19,  1.73s/it][A
Training...:  88% 12195/13907 [7:43:56<47:22,  1.66s/it][A
Training...:  88% 12196/13907 [7:43:57<45:30,  1.60s/it][A
Training...:  88% 12197/13907 [7:43:59<43:45,  1.54s/it][A
Training...:  88% 12198/13907 [7:44:00<42:04,  1.48s/it][A
Training...:  88% 12199/13907 [7:44:01<40:05,  1.41s/it][A
Training...:  88% 12200/13907 [7:44:02<37:03,  1.30s/it][A
Training...:  88% 12201/13907 [7:44:06<58:38,  2.06s/it][A
Training...:  88% 12202/13907 [7:44:10<1:11:16,  2.51s/it][A
Training...:  88% 12203/13907 [7:44:13<1:18:05,  2.75s/it][A
Training...:  88% 12204/13907 [7:44:16<1:21:38,  2.88s/it][A
Training...:  88% 12205/13907 [7:44:19<1:23:51,  2.96s/it][A
Training...:  88% 12206/13907 [7:44:23<1:25:02,  3.00s/it][A
Training...:  88% 12207/13907 [7:44:26<1:25:06,  3.00s/it][A
Training...:  88% 12208/13907 [7:44:28<1:23:55,  2.96s/it][A
Training...:  88% 12209/13907 [7:44:31<1:22:20,  2.91s/it][A
Training...:  88% 12210/13907 [7:44:34<1:20:25,  2.84s/it][A
Training...:  88% 12211/13907 [7:44:37<1:18:58,  2.79s/it][A
Training...:  88% 12212/13907 [7:44:39<1:17:34,  2.75s/it][A
Training...:  88% 12213/13907 [7:44:42<1:16:16,  2.70s/it][A
Training...:  88% 12214/13907 [7:44:44<1:14:54,  2.65s/it][A
Training...:  88% 12215/13907 [7:44:47<1:13:43,  2.61s/it][A
Training...:  88% 12216/13907 [7:44:49<1:12:32,  2.57s/it][A
Training...:  88% 12217/13907 [7:44:52<1:11:33,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:27:06<26:06:17, 31325.86s/it]
Training...:  88% 12217/13907 [7:44:55<1:11:33,  2.54s/it][A
Training...:  88% 12218/13907 [7:44:55<1:13:53,  2.63s/it][A
Training...:  88% 12219/13907 [7:44:57<1:12:32,  2.58s/it][A
Training...:  88% 12220/13907 [7:44:59<1:10:26,  2.51s/it][A
Training...:  88% 12221/13907 [7:45:02<1:08:59,  2.46s/it][A
Training...:  88% 12222/13907 [7:45:04<1:07:35,  2.41s/it][A
Training...:  88% 12223/13907 [7:45:06<1:06:06,  2.36s/it][A
Training...:  88% 12224/13907 [7:45:09<1:04:54,  2.31s/it][A
Training...:  88% 12225/13907 [7:45:11<1:03:43,  2.27s/it][A
Training...:  88% 12226/13907 [7:45:13<1:02:44,  2.24s/it][A
Training...:  88% 12227/13907 [7:45:15<1:01:54,  2.21s/it][A
Training...:  88% 12228/13907 [7:45:17<1:00:45,  2.17s/it][A
Training...:  88% 12229/13907 [7:45:19<1:00:14,  2.15s/it][A
Training...:  88% 12230/13907 [7:45:21<59:50,  2.14s/it]  [A
Training...:  88% 12231/13907 [7:45:23<58:50,  2.11s/it][A
Training...:  88% 12232/13907 [7:45:25<57:37,  2.06s/it][A
Training...:  88% 12233/13907 [7:45:27<56:29,  2.03s/it][A
Training...:  88% 12234/13907 [7:45:29<55:17,  1.98s/it][A
Training...:  88% 12235/13907 [7:45:31<54:17,  1.95s/it][A
Training...:  88% 12236/13907 [7:45:33<53:06,  1.91s/it][A
Training...:  88% 12237/13907 [7:45:35<52:16,  1.88s/it][A
Training...:  88% 12238/13907 [7:45:36<51:10,  1.84s/it][A
Training...:  88% 12239/13907 [7:45:38<50:14,  1.81s/it][A
Training...:  88% 12240/13907 [7:45:40<49:18,  1.77s/it][A
Training...:  88% 12241/13907 [7:45:41<48:20,  1.74s/it][A
Training...:  88% 12242/13907 [7:45:43<47:16,  1.70s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:27:56<26:06:17, 31325.86s/it]
Training...:  88% 12242/13907 [7:45:45<47:16,  1.70s/it][A
Training...:  88% 12243/13907 [7:45:45<48:56,  1.77s/it][A
Training...:  88% 12244/13907 [7:45:47<47:42,  1.72s/it][A
Training...:  88% 12245/13907 [7:45:48<45:55,  1.66s/it][A
Training...:  88% 12246/13907 [7:45:50<44:01,  1.59s/it][A
Training...:  88% 12247/13907 [7:45:51<42:17,  1.53s/it][A
Training...:  88% 12248/13907 [7:45:52<40:27,  1.46s/it][A
Training...:  88% 12249/13907 [7:45:54<38:31,  1.39s/it][A
Training...:  88% 12250/13907 [7:45:55<35:45,  1.29s/it][A
Training...:  88% 12251/13907 [7:45:58<57:09,  2.07s/it][A
Training...:  88% 12252/13907 [7:46:02<1:09:48,  2.53s/it][A
Training...:  88% 12253/13907 [7:46:05<1:16:27,  2.77s/it][A
Training...:  88% 12254/13907 [7:46:09<1:20:08,  2.91s/it][A
Training...:  88% 12255/13907 [7:46:12<1:21:42,  2.97s/it][A
Training...:  88% 12256/13907 [7:46:15<1:22:14,  2.99s/it][A
Training...:  88% 12257/13907 [7:46:18<1:21:48,  2.97s/it][A
Training...:  88% 12258/13907 [7:46:21<1:20:55,  2.94s/it][A
Training...:  88% 12259/13907 [7:46:23<1:19:32,  2.90s/it][A
Training...:  88% 12260/13907 [7:46:26<1:18:06,  2.85s/it][A
Training...:  88% 12261/13907 [7:46:29<1:16:51,  2.80s/it][A
Training...:  88% 12262/13907 [7:46:32<1:16:17,  2.78s/it][A
Training...:  88% 12263/13907 [7:46:34<1:15:10,  2.74s/it][A
Training...:  88% 12264/13907 [7:46:37<1:13:29,  2.68s/it][A
Training...:  88% 12265/13907 [7:46:39<1:12:08,  2.64s/it][A
Training...:  88% 12266/13907 [7:46:42<1:10:49,  2.59s/it][A
Training...:  88% 12267/13907 [7:46:44<1:09:28,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:28:58<26:06:17, 31325.86s/it]
Training...:  88% 12267/13907 [7:46:47<1:09:28,  2.54s/it][A
Training...:  88% 12268/13907 [7:46:47<1:11:39,  2.62s/it][A
Training...:  88% 12269/13907 [7:46:49<1:10:13,  2.57s/it][A
Training...:  88% 12270/13907 [7:46:52<1:08:18,  2.50s/it][A
Training...:  88% 12271/13907 [7:46:54<1:06:45,  2.45s/it][A
Training...:  88% 12272/13907 [7:46:56<1:05:19,  2.40s/it][A
Training...:  88% 12273/13907 [7:46:59<1:04:11,  2.36s/it][A
Training...:  88% 12274/13907 [7:47:01<1:02:47,  2.31s/it][A
Training...:  88% 12275/13907 [7:47:03<1:01:36,  2.26s/it][A
Training...:  88% 12276/13907 [7:47:05<1:00:52,  2.24s/it][A
Training...:  88% 12277/13907 [7:47:07<59:44,  2.20s/it]  [A
Training...:  88% 12278/13907 [7:47:09<58:39,  2.16s/it][A
Training...:  88% 12279/13907 [7:47:11<57:39,  2.13s/it][A
Training...:  88% 12280/13907 [7:47:13<56:57,  2.10s/it][A
Training...:  88% 12281/13907 [7:47:15<56:10,  2.07s/it][A
Training...:  88% 12282/13907 [7:47:17<55:10,  2.04s/it][A
Training...:  88% 12283/13907 [7:47:19<54:24,  2.01s/it][A
Training...:  88% 12284/13907 [7:47:21<53:35,  1.98s/it][A
Training...:  88% 12285/13907 [7:47:23<52:52,  1.96s/it][A
Training...:  88% 12286/13907 [7:47:25<51:59,  1.92s/it][A
Training...:  88% 12287/13907 [7:47:27<51:12,  1.90s/it][A
Training...:  88% 12288/13907 [7:47:29<50:12,  1.86s/it][A
Training...:  88% 12289/13907 [7:47:30<49:35,  1.84s/it][A
Training...:  88% 12290/13907 [7:47:32<48:40,  1.81s/it][A
Training...:  88% 12291/13907 [7:47:34<47:48,  1.78s/it][A
Training...:  88% 12292/13907 [7:47:35<46:53,  1.74s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:29:49<26:06:17, 31325.86s/it]
Training...:  88% 12292/13907 [7:47:37<46:53,  1.74s/it][A
Training...:  88% 12293/13907 [7:47:37<48:34,  1.81s/it][A
Training...:  88% 12294/13907 [7:47:39<47:12,  1.76s/it][A
Training...:  88% 12295/13907 [7:47:41<45:16,  1.69s/it][A
Training...:  88% 12296/13907 [7:47:42<43:26,  1.62s/it][A
Training...:  88% 12297/13907 [7:47:43<41:38,  1.55s/it][A
Training...:  88% 12298/13907 [7:47:45<39:39,  1.48s/it][A
Training...:  88% 12299/13907 [7:47:46<37:51,  1.41s/it][A
Training...:  88% 12300/13907 [7:47:47<34:59,  1.31s/it][A
Training...:  88% 12301/13907 [7:47:51<55:32,  2.08s/it][A
Training...:  88% 12302/13907 [7:47:55<1:07:44,  2.53s/it][A
Training...:  88% 12303/13907 [7:47:58<1:13:47,  2.76s/it][A
Training...:  88% 12304/13907 [7:48:01<1:16:48,  2.88s/it][A
Training...:  88% 12305/13907 [7:48:04<1:18:13,  2.93s/it][A
Training...:  88% 12306/13907 [7:48:07<1:18:24,  2.94s/it][A
Training...:  88% 12307/13907 [7:48:10<1:18:09,  2.93s/it][A
Training...:  89% 12308/13907 [7:48:13<1:17:24,  2.90s/it][A
Training...:  89% 12309/13907 [7:48:16<1:16:27,  2.87s/it][A
Training...:  89% 12310/13907 [7:48:18<1:15:05,  2.82s/it][A
Training...:  89% 12311/13907 [7:48:21<1:13:34,  2.77s/it][A
Training...:  89% 12312/13907 [7:48:23<1:12:11,  2.72s/it][A
Training...:  89% 12313/13907 [7:48:26<1:11:26,  2.69s/it][A
Training...:  89% 12314/13907 [7:48:29<1:10:16,  2.65s/it][A
Training...:  89% 12315/13907 [7:48:31<1:09:27,  2.62s/it][A
Training...:  89% 12316/13907 [7:48:34<1:08:21,  2.58s/it][A
Training...:  89% 12317/13907 [7:48:36<1:07:25,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:30:50<26:06:17, 31325.86s/it]
Training...:  89% 12317/13907 [7:48:39<1:07:25,  2.54s/it][A
Training...:  89% 12318/13907 [7:48:39<1:09:46,  2.63s/it][A
Training...:  89% 12319/13907 [7:48:42<1:08:32,  2.59s/it][A
Training...:  89% 12320/13907 [7:48:44<1:07:31,  2.55s/it][A
Training...:  89% 12321/13907 [7:48:46<1:06:11,  2.50s/it][A
Training...:  89% 12322/13907 [7:48:49<1:04:28,  2.44s/it][A
Training...:  89% 12323/13907 [7:48:51<1:02:56,  2.38s/it][A
Training...:  89% 12324/13907 [7:48:53<1:01:39,  2.34s/it][A
Training...:  89% 12325/13907 [7:48:55<1:00:43,  2.30s/it][A
Training...:  89% 12326/13907 [7:48:58<59:54,  2.27s/it]  [A
Training...:  89% 12327/13907 [7:49:00<58:59,  2.24s/it][A
Training...:  89% 12328/13907 [7:49:02<57:37,  2.19s/it][A
Training...:  89% 12329/13907 [7:49:04<56:18,  2.14s/it][A
Training...:  89% 12330/13907 [7:49:06<55:04,  2.10s/it][A
Training...:  89% 12331/13907 [7:49:08<54:05,  2.06s/it][A
Training...:  89% 12332/13907 [7:49:10<53:09,  2.02s/it][A
Training...:  89% 12333/13907 [7:49:12<52:09,  1.99s/it][A
Training...:  89% 12334/13907 [7:49:14<51:14,  1.95s/it][A
Training...:  89% 12335/13907 [7:49:15<50:26,  1.93s/it][A
Training...:  89% 12336/13907 [7:49:17<49:29,  1.89s/it][A
Training...:  89% 12337/13907 [7:49:19<48:41,  1.86s/it][A
Training...:  89% 12338/13907 [7:49:21<47:47,  1.83s/it][A
Training...:  89% 12339/13907 [7:49:22<47:07,  1.80s/it][A
Training...:  89% 12340/13907 [7:49:24<46:21,  1.77s/it][A
Training...:  89% 12341/13907 [7:49:26<45:34,  1.75s/it][A
Training...:  89% 12342/13907 [7:49:27<44:46,  1.72s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:31:41<26:06:17, 31325.86s/it]
Training...:  89% 12342/13907 [7:49:29<44:46,  1.72s/it][A
Training...:  89% 12343/13907 [7:49:29<46:13,  1.77s/it][A
Training...:  89% 12344/13907 [7:49:31<44:54,  1.72s/it][A
Training...:  89% 12345/13907 [7:49:33<43:10,  1.66s/it][A
Training...:  89% 12346/13907 [7:49:34<41:27,  1.59s/it][A
Training...:  89% 12347/13907 [7:49:35<39:50,  1.53s/it][A
Training...:  89% 12348/13907 [7:49:37<37:57,  1.46s/it][A
Training...:  89% 12349/13907 [7:49:38<35:56,  1.38s/it][A
Training...:  89% 12350/13907 [7:49:39<33:26,  1.29s/it][A
Training...:  89% 12351/13907 [7:49:43<52:11,  2.01s/it][A
Training...:  89% 12352/13907 [7:49:46<1:03:32,  2.45s/it][A
Training...:  89% 12353/13907 [7:49:49<1:09:51,  2.70s/it][A
Training...:  89% 12354/13907 [7:49:53<1:13:20,  2.83s/it][A
Training...:  89% 12355/13907 [7:49:56<1:15:28,  2.92s/it][A
Training...:  89% 12356/13907 [7:49:59<1:15:58,  2.94s/it][A
Training...:  89% 12357/13907 [7:50:02<1:15:36,  2.93s/it][A
Training...:  89% 12358/13907 [7:50:04<1:14:45,  2.90s/it][A
Training...:  89% 12359/13907 [7:50:07<1:14:14,  2.88s/it][A
Training...:  89% 12360/13907 [7:50:10<1:13:44,  2.86s/it][A
Training...:  89% 12361/13907 [7:50:13<1:12:21,  2.81s/it][A
Training...:  89% 12362/13907 [7:50:15<1:11:01,  2.76s/it][A
Training...:  89% 12363/13907 [7:50:18<1:09:44,  2.71s/it][A
Training...:  89% 12364/13907 [7:50:20<1:08:31,  2.66s/it][A
Training...:  89% 12365/13907 [7:50:23<1:07:25,  2.62s/it][A
Training...:  89% 12366/13907 [7:50:25<1:06:05,  2.57s/it][A
Training...:  89% 12367/13907 [7:50:28<1:05:07,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:32:42<26:06:17, 31325.86s/it]
Training...:  89% 12367/13907 [7:50:31<1:05:07,  2.54s/it][A
Training...:  89% 12368/13907 [7:50:31<1:07:16,  2.62s/it][A
Training...:  89% 12369/13907 [7:50:33<1:05:50,  2.57s/it][A
Training...:  89% 12370/13907 [7:50:36<1:04:00,  2.50s/it][A
Training...:  89% 12371/13907 [7:50:38<1:02:28,  2.44s/it][A
Training...:  89% 12372/13907 [7:50:40<1:01:02,  2.39s/it][A
Training...:  89% 12373/13907 [7:50:42<59:53,  2.34s/it]  [A
Training...:  89% 12374/13907 [7:50:45<58:38,  2.30s/it][A
Training...:  89% 12375/13907 [7:50:47<57:27,  2.25s/it][A
Training...:  89% 12376/13907 [7:50:49<56:38,  2.22s/it][A
Training...:  89% 12377/13907 [7:50:51<56:01,  2.20s/it][A
Training...:  89% 12378/13907 [7:50:53<54:59,  2.16s/it][A
Training...:  89% 12379/13907 [7:50:55<54:23,  2.14s/it][A
Training...:  89% 12380/13907 [7:50:57<53:48,  2.11s/it][A
Training...:  89% 12381/13907 [7:50:59<53:05,  2.09s/it][A
Training...:  89% 12382/13907 [7:51:01<52:16,  2.06s/it][A
Training...:  89% 12383/13907 [7:51:03<51:20,  2.02s/it][A
Training...:  89% 12384/13907 [7:51:05<50:30,  1.99s/it][A
Training...:  89% 12385/13907 [7:51:07<49:43,  1.96s/it][A
Training...:  89% 12386/13907 [7:51:09<49:01,  1.93s/it][A
Training...:  89% 12387/13907 [7:51:11<48:10,  1.90s/it][A
Training...:  89% 12388/13907 [7:51:12<47:15,  1.87s/it][A
Training...:  89% 12389/13907 [7:51:14<46:32,  1.84s/it][A
Training...:  89% 12390/13907 [7:51:16<45:49,  1.81s/it][A
Training...:  89% 12391/13907 [7:51:18<44:57,  1.78s/it][A
Training...:  89% 12392/13907 [7:51:19<43:56,  1.74s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:33:32<26:06:17, 31325.86s/it]
Training...:  89% 12392/13907 [7:51:21<43:56,  1.74s/it][A
Training...:  89% 12393/13907 [7:51:21<45:32,  1.80s/it][A
Training...:  89% 12394/13907 [7:51:23<44:33,  1.77s/it][A
Training...:  89% 12395/13907 [7:51:25<43:20,  1.72s/it][A
Training...:  89% 12396/13907 [7:51:26<41:32,  1.65s/it][A
Training...:  89% 12397/13907 [7:51:27<39:53,  1.59s/it][A
Training...:  89% 12398/13907 [7:51:29<38:13,  1.52s/it][A
Training...:  89% 12399/13907 [7:51:30<36:07,  1.44s/it][A
Training...:  89% 12400/13907 [7:51:31<33:18,  1.33s/it][A
Training...:  89% 12401/13907 [7:51:35<51:51,  2.07s/it][A
Training...:  89% 12402/13907 [7:51:38<1:02:41,  2.50s/it][A
Training...:  89% 12403/13907 [7:51:42<1:08:43,  2.74s/it][A
Training...:  89% 12404/13907 [7:51:45<1:11:50,  2.87s/it][A
Training...:  89% 12405/13907 [7:51:48<1:13:12,  2.92s/it][A
Training...:  89% 12406/13907 [7:51:51<1:13:23,  2.93s/it][A
Training...:  89% 12407/13907 [7:51:54<1:13:02,  2.92s/it][A
Training...:  89% 12408/13907 [7:51:57<1:12:20,  2.90s/it][A
Training...:  89% 12409/13907 [7:51:59<1:11:35,  2.87s/it][A
Training...:  89% 12410/13907 [7:52:02<1:10:35,  2.83s/it][A
Training...:  89% 12411/13907 [7:52:05<1:09:30,  2.79s/it][A
Training...:  89% 12412/13907 [7:52:07<1:08:02,  2.73s/it][A
Training...:  89% 12413/13907 [7:52:10<1:07:16,  2.70s/it][A
Training...:  89% 12414/13907 [7:52:13<1:05:59,  2.65s/it][A
Training...:  89% 12415/13907 [7:52:15<1:05:07,  2.62s/it][A
Training...:  89% 12416/13907 [7:52:18<1:03:54,  2.57s/it][A
Training...:  89% 12417/13907 [7:52:20<1:02:54,  2.53s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:34:34<26:06:17, 31325.86s/it]
Training...:  89% 12417/13907 [7:52:23<1:02:54,  2.53s/it][A
Training...:  89% 12418/13907 [7:52:23<1:05:58,  2.66s/it][A
Training...:  89% 12419/13907 [7:52:25<1:04:24,  2.60s/it][A
Training...:  89% 12420/13907 [7:52:28<1:02:24,  2.52s/it][A
Training...:  89% 12421/13907 [7:52:30<1:01:04,  2.47s/it][A
Training...:  89% 12422/13907 [7:52:32<59:37,  2.41s/it]  [A
Training...:  89% 12423/13907 [7:52:35<58:22,  2.36s/it][A
Training...:  89% 12424/13907 [7:52:37<57:38,  2.33s/it][A
Training...:  89% 12425/13907 [7:52:39<56:24,  2.28s/it][A
Training...:  89% 12426/13907 [7:52:41<55:19,  2.24s/it][A
Training...:  89% 12427/13907 [7:52:43<54:22,  2.20s/it][A
Training...:  89% 12428/13907 [7:52:45<53:36,  2.17s/it][A
Training...:  89% 12429/13907 [7:52:48<52:46,  2.14s/it][A
Training...:  89% 12430/13907 [7:52:50<51:58,  2.11s/it][A
Training...:  89% 12431/13907 [7:52:52<51:04,  2.08s/it][A
Training...:  89% 12432/13907 [7:52:54<50:14,  2.04s/it][A
Training...:  89% 12433/13907 [7:52:56<49:40,  2.02s/it][A
Training...:  89% 12434/13907 [7:52:57<48:53,  1.99s/it][A
Training...:  89% 12435/13907 [7:52:59<48:11,  1.96s/it][A
Training...:  89% 12436/13907 [7:53:01<47:19,  1.93s/it][A
Training...:  89% 12437/13907 [7:53:03<46:26,  1.90s/it][A
Training...:  89% 12438/13907 [7:53:05<45:31,  1.86s/it][A
Training...:  89% 12439/13907 [7:53:07<44:46,  1.83s/it][A
Training...:  89% 12440/13907 [7:53:08<43:51,  1.79s/it][A
Training...:  89% 12441/13907 [7:53:10<42:59,  1.76s/it][A
Training...:  89% 12442/13907 [7:53:12<42:04,  1.72s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:35:25<26:06:17, 31325.86s/it]
Training...:  89% 12442/13907 [7:53:13<42:04,  1.72s/it][A
Training...:  89% 12443/13907 [7:53:13<43:23,  1.78s/it][A
Training...:  89% 12444/13907 [7:53:15<42:11,  1.73s/it][A
Training...:  89% 12445/13907 [7:53:17<40:34,  1.67s/it][A
Training...:  89% 12446/13907 [7:53:18<39:06,  1.61s/it][A
Training...:  90% 12447/13907 [7:53:19<37:32,  1.54s/it][A
Training...:  90% 12448/13907 [7:53:21<36:03,  1.48s/it][A
Training...:  90% 12449/13907 [7:53:22<34:14,  1.41s/it][A
Training...:  90% 12450/13907 [7:53:23<31:40,  1.30s/it][A
Training...:  90% 12451/13907 [7:53:27<49:37,  2.05s/it][A
Training...:  90% 12452/13907 [7:53:30<1:00:22,  2.49s/it][A
Training...:  90% 12453/13907 [7:53:34<1:06:13,  2.73s/it][A
Training...:  90% 12454/13907 [7:53:37<1:09:48,  2.88s/it][A
Training...:  90% 12455/13907 [7:53:40<1:12:01,  2.98s/it][A
Training...:  90% 12456/13907 [7:53:43<1:12:01,  2.98s/it][A
Training...:  90% 12457/13907 [7:53:46<1:11:31,  2.96s/it][A
Training...:  90% 12458/13907 [7:53:49<1:10:30,  2.92s/it][A
Training...:  90% 12459/13907 [7:53:52<1:09:15,  2.87s/it][A
Training...:  90% 12460/13907 [7:53:54<1:08:05,  2.82s/it][A
Training...:  90% 12461/13907 [7:53:57<1:06:55,  2.78s/it][A
Training...:  90% 12462/13907 [7:54:00<1:05:50,  2.73s/it][A
Training...:  90% 12463/13907 [7:54:02<1:04:41,  2.69s/it][A
Training...:  90% 12464/13907 [7:54:05<1:03:47,  2.65s/it][A
Training...:  90% 12465/13907 [7:54:07<1:02:43,  2.61s/it][A
Training...:  90% 12466/13907 [7:54:10<1:01:45,  2.57s/it][A
Training...:  90% 12467/13907 [7:54:12<1:00:57,  2.54s/it][A                                                                                                                            
                                                          [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:36:26<26:06:17, 31325.86s/it]
Training...:  90% 12467/13907 [7:54:15<1:00:57,  2.54s/it][A
Training...:  90% 12468/13907 [7:54:15<1:03:17,  2.64s/it][A
Training...:  90% 12469/13907 [7:54:18<1:02:05,  2.59s/it][A
Training...:  90% 12470/13907 [7:54:20<1:00:26,  2.52s/it][A
Training...:  90% 12471/13907 [7:54:22<59:03,  2.47s/it]  [A
Training...:  90% 12472/13907 [7:54:25<57:42,  2.41s/it][A
Training...:  90% 12473/13907 [7:54:27<56:19,  2.36s/it][A
Training...:  90% 12474/13907 [7:54:29<55:05,  2.31s/it][A
Training...:  90% 12475/13907 [7:54:31<54:00,  2.26s/it][A
Training...:  90% 12476/13907 [7:54:33<53:05,  2.23s/it][A
Training...:  90% 12477/13907 [7:54:35<52:06,  2.19s/it][A
Training...:  90% 12478/13907 [7:54:37<51:19,  2.16s/it][A
Training...:  90% 12479/13907 [7:54:40<50:42,  2.13s/it][A
Training...:  90% 12480/13907 [7:54:42<49:47,  2.09s/it][A
Training...:  90% 12481/13907 [7:54:44<49:16,  2.07s/it][A
Training...:  90% 12482/13907 [7:54:46<48:47,  2.05s/it][A
Training...:  90% 12483/13907 [7:54:48<48:09,  2.03s/it][A
Training...:  90% 12484/13907 [7:54:49<47:18,  1.99s/it][A
Training...:  90% 12485/13907 [7:54:51<46:32,  1.96s/it][A
Training...:  90% 12486/13907 [7:54:53<45:49,  1.93s/it][A
Training...:  90% 12487/13907 [7:54:55<45:29,  1.92s/it][A
Training...:  90% 12488/13907 [7:54:57<44:31,  1.88s/it][A
Training...:  90% 12489/13907 [7:54:59<43:35,  1.84s/it][A
Training...:  90% 12490/13907 [7:55:00<42:37,  1.80s/it][A
Training...:  90% 12491/13907 [7:55:02<41:45,  1.77s/it][A
Training...:  90% 12492/13907 [7:55:04<40:49,  1.73s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:37:17<26:06:17, 31325.86s/it]
Training...:  90% 12492/13907 [7:55:06<40:49,  1.73s/it][A
Training...:  90% 12493/13907 [7:55:06<42:06,  1.79s/it][A
Training...:  90% 12494/13907 [7:55:07<40:57,  1.74s/it][A
Training...:  90% 12495/13907 [7:55:09<39:16,  1.67s/it][A
Training...:  90% 12496/13907 [7:55:10<37:47,  1.61s/it][A
Training...:  90% 12497/13907 [7:55:12<36:11,  1.54s/it][A
Training...:  90% 12498/13907 [7:55:13<34:37,  1.47s/it][A
Training...:  90% 12499/13907 [7:55:14<32:49,  1.40s/it][A
Training...:  90% 12500/13907 [7:55:15<30:40,  1.31s/it][A
Training...:  90% 12501/13907 [7:55:19<47:59,  2.05s/it][A
Training...:  90% 12502/13907 [7:55:22<57:47,  2.47s/it][A
Training...:  90% 12503/13907 [7:55:26<1:03:02,  2.69s/it][A
Training...:  90% 12504/13907 [7:55:29<1:06:04,  2.83s/it][A
Training...:  90% 12505/13907 [7:55:32<1:07:39,  2.90s/it][A
Training...:  90% 12506/13907 [7:55:35<1:08:17,  2.92s/it][A
Training...:  90% 12507/13907 [7:55:38<1:08:05,  2.92s/it][A
Training...:  90% 12508/13907 [7:55:41<1:07:35,  2.90s/it][A
Training...:  90% 12509/13907 [7:55:43<1:07:05,  2.88s/it][A
Training...:  90% 12510/13907 [7:55:46<1:06:19,  2.85s/it][A
Training...:  90% 12511/13907 [7:55:49<1:05:18,  2.81s/it][A
Training...:  90% 12512/13907 [7:55:52<1:04:02,  2.75s/it][A
Training...:  90% 12513/13907 [7:55:54<1:02:52,  2.71s/it][A
Training...:  90% 12514/13907 [7:55:57<1:01:54,  2.67s/it][A
Training...:  90% 12515/13907 [7:55:59<1:00:58,  2.63s/it][A
Training...:  90% 12516/13907 [7:56:02<59:58,  2.59s/it]  [A
Training...:  90% 12517/13907 [7:56:04<59:21,  2.56s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:38:18<26:06:17, 31325.86s/it]
Training...:  90% 12517/13907 [7:56:07<59:21,  2.56s/it][A
Training...:  90% 12518/13907 [7:56:07<1:02:00,  2.68s/it][A
Training...:  90% 12519/13907 [7:56:10<1:00:37,  2.62s/it][A
Training...:  90% 12520/13907 [7:56:12<58:41,  2.54s/it]  [A
Training...:  90% 12521/13907 [7:56:14<57:33,  2.49s/it][A
Training...:  90% 12522/13907 [7:56:17<56:29,  2.45s/it][A
Training...:  90% 12523/13907 [7:56:19<55:17,  2.40s/it][A
Training...:  90% 12524/13907 [7:56:21<53:47,  2.33s/it][A
Training...:  90% 12525/13907 [7:56:23<52:47,  2.29s/it][A
Training...:  90% 12526/13907 [7:56:26<51:51,  2.25s/it][A
Training...:  90% 12527/13907 [7:56:28<51:05,  2.22s/it][A
Training...:  90% 12528/13907 [7:56:30<50:07,  2.18s/it][A
Training...:  90% 12529/13907 [7:56:32<49:29,  2.16s/it][A
Training...:  90% 12530/13907 [7:56:34<48:30,  2.11s/it][A
Training...:  90% 12531/13907 [7:56:36<47:47,  2.08s/it][A
Training...:  90% 12532/13907 [7:56:38<47:16,  2.06s/it][A
Training...:  90% 12533/13907 [7:56:40<46:32,  2.03s/it][A
Training...:  90% 12534/13907 [7:56:42<45:42,  2.00s/it][A
Training...:  90% 12535/13907 [7:56:44<45:06,  1.97s/it][A
Training...:  90% 12536/13907 [7:56:46<44:26,  1.94s/it][A
Training...:  90% 12537/13907 [7:56:48<43:41,  1.91s/it][A
Training...:  90% 12538/13907 [7:56:49<42:56,  1.88s/it][A
Training...:  90% 12539/13907 [7:56:51<42:06,  1.85s/it][A
Training...:  90% 12540/13907 [7:56:53<41:17,  1.81s/it][A
Training...:  90% 12541/13907 [7:56:55<40:30,  1.78s/it][A
Training...:  90% 12542/13907 [7:56:56<39:48,  1.75s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:39:09<26:06:17, 31325.86s/it]
Training...:  90% 12542/13907 [7:56:58<39:48,  1.75s/it][A
Training...:  90% 12543/13907 [7:56:58<41:04,  1.81s/it][A
Training...:  90% 12544/13907 [7:57:00<39:54,  1.76s/it][A
Training...:  90% 12545/13907 [7:57:01<38:26,  1.69s/it][A
Training...:  90% 12546/13907 [7:57:03<36:52,  1.63s/it][A
Training...:  90% 12547/13907 [7:57:04<35:24,  1.56s/it][A
Training...:  90% 12548/13907 [7:57:06<33:57,  1.50s/it][A
Training...:  90% 12549/13907 [7:57:07<32:07,  1.42s/it][A
Training...:  90% 12550/13907 [7:57:08<29:40,  1.31s/it][A
Training...:  90% 12551/13907 [7:57:12<47:23,  2.10s/it][A
Training...:  90% 12552/13907 [7:57:15<56:41,  2.51s/it][A
Training...:  90% 12553/13907 [7:57:19<1:01:41,  2.73s/it][A
Training...:  90% 12554/13907 [7:57:22<1:04:12,  2.85s/it][A
Training...:  90% 12555/13907 [7:57:25<1:05:39,  2.91s/it][A
Training...:  90% 12556/13907 [7:57:28<1:05:50,  2.92s/it][A
Training...:  90% 12557/13907 [7:57:31<1:05:20,  2.90s/it][A
Training...:  90% 12558/13907 [7:57:33<1:04:49,  2.88s/it][A
Training...:  90% 12559/13907 [7:57:36<1:04:23,  2.87s/it][A
Training...:  90% 12560/13907 [7:57:39<1:03:29,  2.83s/it][A
Training...:  90% 12561/13907 [7:57:42<1:02:25,  2.78s/it][A
Training...:  90% 12562/13907 [7:57:44<1:01:01,  2.72s/it][A
Training...:  90% 12563/13907 [7:57:47<59:56,  2.68s/it]  [A
Training...:  90% 12564/13907 [7:57:49<58:56,  2.63s/it][A
Training...:  90% 12565/13907 [7:57:52<57:57,  2.59s/it][A
Training...:  90% 12566/13907 [7:57:54<57:01,  2.55s/it][A
Training...:  90% 12567/13907 [7:57:57<56:09,  2.51s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:40:11<26:06:17, 31325.86s/it]
Training...:  90% 12567/13907 [7:57:59<56:09,  2.51s/it][A
Training...:  90% 12568/13907 [7:57:59<57:59,  2.60s/it][A
Training...:  90% 12569/13907 [7:58:02<56:47,  2.55s/it][A
Training...:  90% 12570/13907 [7:58:04<55:13,  2.48s/it][A
Training...:  90% 12571/13907 [7:58:06<53:44,  2.41s/it][A
Training...:  90% 12572/13907 [7:58:09<52:28,  2.36s/it][A
Training...:  90% 12573/13907 [7:58:11<51:26,  2.31s/it][A
Training...:  90% 12574/13907 [7:58:13<50:27,  2.27s/it][A
Training...:  90% 12575/13907 [7:58:15<49:39,  2.24s/it][A
Training...:  90% 12576/13907 [7:58:17<49:04,  2.21s/it][A
Training...:  90% 12577/13907 [7:58:19<48:28,  2.19s/it][A
Training...:  90% 12578/13907 [7:58:22<47:37,  2.15s/it][A
Training...:  90% 12579/13907 [7:58:24<47:15,  2.14s/it][A
Training...:  90% 12580/13907 [7:58:26<46:38,  2.11s/it][A
Training...:  90% 12581/13907 [7:58:28<45:44,  2.07s/it][A
Training...:  90% 12582/13907 [7:58:30<45:01,  2.04s/it][A
Training...:  90% 12583/13907 [7:58:32<44:19,  2.01s/it][A
Training...:  90% 12584/13907 [7:58:33<43:32,  1.97s/it][A
Training...:  90% 12585/13907 [7:58:35<42:55,  1.95s/it][A
Training...:  91% 12586/13907 [7:58:37<42:10,  1.92s/it][A
Training...:  91% 12587/13907 [7:58:39<41:26,  1.88s/it][A
Training...:  91% 12588/13907 [7:58:41<40:44,  1.85s/it][A
Training...:  91% 12589/13907 [7:58:43<40:02,  1.82s/it][A
Training...:  91% 12590/13907 [7:58:44<39:20,  1.79s/it][A
Training...:  91% 12591/13907 [7:58:46<38:29,  1.76s/it][A
Training...:  91% 12592/13907 [7:58:48<37:39,  1.72s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:41:01<26:06:17, 31325.86s/it]
Training...:  91% 12592/13907 [7:58:49<37:39,  1.72s/it][A
Training...:  91% 12593/13907 [7:58:49<38:53,  1.78s/it][A
Training...:  91% 12594/13907 [7:58:51<38:15,  1.75s/it][A
Training...:  91% 12595/13907 [7:58:53<36:34,  1.67s/it][A
Training...:  91% 12596/13907 [7:58:54<35:20,  1.62s/it][A
Training...:  91% 12597/13907 [7:58:56<34:05,  1.56s/it][A
Training...:  91% 12598/13907 [7:58:57<32:20,  1.48s/it][A
Training...:  91% 12599/13907 [7:58:58<30:34,  1.40s/it][A
Training...:  91% 12600/13907 [7:58:59<28:08,  1.29s/it][A
Training...:  91% 12601/13907 [7:59:03<44:31,  2.05s/it][A
Training...:  91% 12602/13907 [7:59:06<53:49,  2.47s/it][A
Training...:  91% 12603/13907 [7:59:10<58:41,  2.70s/it][A
Training...:  91% 12604/13907 [7:59:13<1:01:07,  2.81s/it][A
Training...:  91% 12605/13907 [7:59:16<1:02:34,  2.88s/it][A
Training...:  91% 12606/13907 [7:59:19<1:02:48,  2.90s/it][A
Training...:  91% 12607/13907 [7:59:22<1:02:27,  2.88s/it][A
Training...:  91% 12608/13907 [7:59:24<1:01:45,  2.85s/it][A
Training...:  91% 12609/13907 [7:59:27<1:01:06,  2.82s/it][A
Training...:  91% 12610/13907 [7:59:30<1:00:12,  2.79s/it][A
Training...:  91% 12611/13907 [7:59:32<59:14,  2.74s/it]  [A
Training...:  91% 12612/13907 [7:59:35<58:28,  2.71s/it][A
Training...:  91% 12613/13907 [7:59:38<57:32,  2.67s/it][A
Training...:  91% 12614/13907 [7:59:40<56:28,  2.62s/it][A
Training...:  91% 12615/13907 [7:59:43<55:57,  2.60s/it][A
Training...:  91% 12616/13907 [7:59:45<55:20,  2.57s/it][A
Training...:  91% 12617/13907 [7:59:48<54:23,  2.53s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:42:02<26:06:17, 31325.86s/it]
Training...:  91% 12617/13907 [7:59:50<54:23,  2.53s/it][A
Training...:  91% 12618/13907 [7:59:50<56:09,  2.61s/it][A
Training...:  91% 12619/13907 [7:59:53<55:13,  2.57s/it][A
Training...:  91% 12620/13907 [7:59:55<53:44,  2.51s/it][A
Training...:  91% 12621/13907 [7:59:58<52:28,  2.45s/it][A
Training...:  91% 12622/13907 [8:00:00<51:42,  2.41s/it][A
Training...:  91% 12623/13907 [8:00:02<51:20,  2.40s/it][A
Training...:  91% 12624/13907 [8:00:04<50:09,  2.35s/it][A
Training...:  91% 12625/13907 [8:00:07<49:20,  2.31s/it][A
Training...:  91% 12626/13907 [8:00:09<48:22,  2.27s/it][A
Training...:  91% 12627/13907 [8:00:11<47:26,  2.22s/it][A
Training...:  91% 12628/13907 [8:00:13<46:33,  2.18s/it][A
Training...:  91% 12629/13907 [8:00:15<45:50,  2.15s/it][A
Training...:  91% 12630/13907 [8:00:17<45:17,  2.13s/it][A
Training...:  91% 12631/13907 [8:00:19<44:25,  2.09s/it][A
Training...:  91% 12632/13907 [8:00:21<43:43,  2.06s/it][A
Training...:  91% 12633/13907 [8:00:23<42:57,  2.02s/it][A
Training...:  91% 12634/13907 [8:00:25<42:20,  2.00s/it][A
Training...:  91% 12635/13907 [8:00:27<41:38,  1.96s/it][A
Training...:  91% 12636/13907 [8:00:29<40:53,  1.93s/it][A
Training...:  91% 12637/13907 [8:00:31<40:17,  1.90s/it][A
Training...:  91% 12638/13907 [8:00:33<39:47,  1.88s/it][A
Training...:  91% 12639/13907 [8:00:34<39:05,  1.85s/it][A
Training...:  91% 12640/13907 [8:00:36<38:18,  1.81s/it][A
Training...:  91% 12641/13907 [8:00:38<37:36,  1.78s/it][A
Training...:  91% 12642/13907 [8:00:39<36:48,  1.75s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:42:53<26:06:17, 31325.86s/it]
Training...:  91% 12642/13907 [8:00:41<36:48,  1.75s/it][A
Training...:  91% 12643/13907 [8:00:41<37:57,  1.80s/it][A
Training...:  91% 12644/13907 [8:00:43<36:47,  1.75s/it][A
Training...:  91% 12645/13907 [8:00:45<35:33,  1.69s/it][A
Training...:  91% 12646/13907 [8:00:46<34:02,  1.62s/it][A
Training...:  91% 12647/13907 [8:00:47<32:41,  1.56s/it][A
Training...:  91% 12648/13907 [8:00:49<31:11,  1.49s/it][A
Training...:  91% 12649/13907 [8:00:50<29:37,  1.41s/it][A
Training...:  91% 12650/13907 [8:00:51<27:19,  1.30s/it][A
Training...:  91% 12651/13907 [8:00:55<42:38,  2.04s/it][A
Training...:  91% 12652/13907 [8:00:58<51:53,  2.48s/it][A
Training...:  91% 12653/13907 [8:01:02<57:11,  2.74s/it][A
Training...:  91% 12654/13907 [8:01:05<1:00:09,  2.88s/it][A
Training...:  91% 12655/13907 [8:01:08<1:01:32,  2.95s/it][A
Training...:  91% 12656/13907 [8:01:11<1:01:32,  2.95s/it][A
Training...:  91% 12657/13907 [8:01:14<1:01:08,  2.93s/it][A
Training...:  91% 12658/13907 [8:01:17<1:00:25,  2.90s/it][A
Training...:  91% 12659/13907 [8:01:19<59:30,  2.86s/it]  [A
Training...:  91% 12660/13907 [8:01:22<59:06,  2.84s/it][A
Training...:  91% 12661/13907 [8:01:25<58:15,  2.81s/it][A
Training...:  91% 12662/13907 [8:01:28<57:07,  2.75s/it][A
Training...:  91% 12663/13907 [8:01:30<56:11,  2.71s/it][A
Training...:  91% 12664/13907 [8:01:33<55:06,  2.66s/it][A
Training...:  91% 12665/13907 [8:01:35<54:09,  2.62s/it][A
Training...:  91% 12666/13907 [8:01:38<53:10,  2.57s/it][A
Training...:  91% 12667/13907 [8:01:40<52:14,  2.53s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:43:54<26:06:17, 31325.86s/it]
Training...:  91% 12667/13907 [8:01:43<52:14,  2.53s/it][A
Training...:  91% 12668/13907 [8:01:43<54:01,  2.62s/it][A
Training...:  91% 12669/13907 [8:01:45<52:54,  2.56s/it][A
Training...:  91% 12670/13907 [8:01:48<51:25,  2.49s/it][A
Training...:  91% 12671/13907 [8:01:50<50:15,  2.44s/it][A
Training...:  91% 12672/13907 [8:01:52<49:01,  2.38s/it][A
Training...:  91% 12673/13907 [8:01:54<48:02,  2.34s/it][A
Training...:  91% 12674/13907 [8:01:57<47:06,  2.29s/it][A
Training...:  91% 12675/13907 [8:01:59<46:20,  2.26s/it][A
Training...:  91% 12676/13907 [8:02:01<45:37,  2.22s/it][A
Training...:  91% 12677/13907 [8:02:03<44:43,  2.18s/it][A
Training...:  91% 12678/13907 [8:02:05<43:58,  2.15s/it][A
Training...:  91% 12679/13907 [8:02:07<43:25,  2.12s/it][A
Training...:  91% 12680/13907 [8:02:09<42:42,  2.09s/it][A
Training...:  91% 12681/13907 [8:02:11<42:08,  2.06s/it][A
Training...:  91% 12682/13907 [8:02:13<41:27,  2.03s/it][A
Training...:  91% 12683/13907 [8:02:15<40:52,  2.00s/it][A
Training...:  91% 12684/13907 [8:02:17<40:19,  1.98s/it][A
Training...:  91% 12685/13907 [8:02:19<39:49,  1.96s/it][A
Training...:  91% 12686/13907 [8:02:21<39:12,  1.93s/it][A
Training...:  91% 12687/13907 [8:02:23<38:36,  1.90s/it][A
Training...:  91% 12688/13907 [8:02:24<38:06,  1.88s/it][A
Training...:  91% 12689/13907 [8:02:26<37:31,  1.85s/it][A
Training...:  91% 12690/13907 [8:02:28<36:53,  1.82s/it][A
Training...:  91% 12691/13907 [8:02:30<36:07,  1.78s/it][A
Training...:  91% 12692/13907 [8:02:31<35:24,  1.75s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:44:44<26:06:17, 31325.86s/it]
Training...:  91% 12692/13907 [8:02:33<35:24,  1.75s/it][A
Training...:  91% 12693/13907 [8:02:33<36:28,  1.80s/it][A
Training...:  91% 12694/13907 [8:02:35<35:24,  1.75s/it][A
Training...:  91% 12695/13907 [8:02:36<34:08,  1.69s/it][A
Training...:  91% 12696/13907 [8:02:38<32:38,  1.62s/it][A
Training...:  91% 12697/13907 [8:02:39<31:25,  1.56s/it][A
Training...:  91% 12698/13907 [8:02:41<30:15,  1.50s/it][A
Training...:  91% 12699/13907 [8:02:42<28:46,  1.43s/it][A
Training...:  91% 12700/13907 [8:02:43<26:42,  1.33s/it][A
Training...:  91% 12701/13907 [8:02:47<41:38,  2.07s/it][A
Training...:  91% 12702/13907 [8:02:50<50:10,  2.50s/it][A
Training...:  91% 12703/13907 [8:02:54<54:42,  2.73s/it][A
Training...:  91% 12704/13907 [8:02:57<56:50,  2.83s/it][A
Training...:  91% 12705/13907 [8:03:00<58:18,  2.91s/it][A
Training...:  91% 12706/13907 [8:03:03<58:20,  2.91s/it][A
Training...:  91% 12707/13907 [8:03:06<58:08,  2.91s/it][A
Training...:  91% 12708/13907 [8:03:08<57:35,  2.88s/it][A
Training...:  91% 12709/13907 [8:03:11<56:50,  2.85s/it][A
Training...:  91% 12710/13907 [8:03:14<56:03,  2.81s/it][A
Training...:  91% 12711/13907 [8:03:17<55:23,  2.78s/it][A
Training...:  91% 12712/13907 [8:03:19<54:12,  2.72s/it][A
Training...:  91% 12713/13907 [8:03:22<53:31,  2.69s/it][A
Training...:  91% 12714/13907 [8:03:24<52:47,  2.66s/it][A
Training...:  91% 12715/13907 [8:03:27<51:59,  2.62s/it][A
Training...:  91% 12716/13907 [8:03:29<51:09,  2.58s/it][A
Training...:  91% 12717/13907 [8:03:32<50:27,  2.54s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:45:46<26:06:17, 31325.86s/it]
Training...:  91% 12717/13907 [8:03:35<50:27,  2.54s/it][A
Training...:  91% 12718/13907 [8:03:35<52:00,  2.62s/it][A
Training...:  91% 12719/13907 [8:03:37<50:57,  2.57s/it][A
Training...:  91% 12720/13907 [8:03:40<49:54,  2.52s/it][A
Training...:  91% 12721/13907 [8:03:42<48:36,  2.46s/it][A
Training...:  91% 12722/13907 [8:03:44<47:34,  2.41s/it][A
Training...:  91% 12723/13907 [8:03:46<46:33,  2.36s/it][A
Training...:  91% 12724/13907 [8:03:49<45:33,  2.31s/it][A
Training...:  92% 12725/13907 [8:03:51<44:46,  2.27s/it][A
Training...:  92% 12726/13907 [8:03:53<43:58,  2.23s/it][A
Training...:  92% 12727/13907 [8:03:55<43:20,  2.20s/it][A
Training...:  92% 12728/13907 [8:03:57<42:53,  2.18s/it][A
Training...:  92% 12729/13907 [8:03:59<42:18,  2.15s/it][A
Training...:  92% 12730/13907 [8:04:01<41:37,  2.12s/it][A
Training...:  92% 12731/13907 [8:04:03<40:50,  2.08s/it][A
Training...:  92% 12732/13907 [8:04:05<40:09,  2.05s/it][A
Training...:  92% 12733/13907 [8:04:07<39:31,  2.02s/it][A
Training...:  92% 12734/13907 [8:04:09<38:50,  1.99s/it][A
Training...:  92% 12735/13907 [8:04:11<38:19,  1.96s/it][A
Training...:  92% 12736/13907 [8:04:13<37:49,  1.94s/it][A
Training...:  92% 12737/13907 [8:04:15<37:19,  1.91s/it][A
Training...:  92% 12738/13907 [8:04:17<36:39,  1.88s/it][A
Training...:  92% 12739/13907 [8:04:18<36:01,  1.85s/it][A
Training...:  92% 12740/13907 [8:04:20<35:13,  1.81s/it][A
Training...:  92% 12741/13907 [8:04:22<34:36,  1.78s/it][A
Training...:  92% 12742/13907 [8:04:23<33:48,  1.74s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:46:37<26:06:17, 31325.86s/it]
Training...:  92% 12742/13907 [8:04:25<33:48,  1.74s/it][A
Training...:  92% 12743/13907 [8:04:25<34:54,  1.80s/it][A
Training...:  92% 12744/13907 [8:04:27<33:51,  1.75s/it][A
Training...:  92% 12745/13907 [8:04:28<32:24,  1.67s/it][A
Training...:  92% 12746/13907 [8:04:30<31:06,  1.61s/it][A
Training...:  92% 12747/13907 [8:04:31<29:53,  1.55s/it][A
Training...:  92% 12748/13907 [8:04:33<28:29,  1.47s/it][A
Training...:  92% 12749/13907 [8:04:34<27:00,  1.40s/it][A
Training...:  92% 12750/13907 [8:04:35<24:54,  1.29s/it][A
Training...:  92% 12751/13907 [8:04:39<39:35,  2.06s/it][A
Training...:  92% 12752/13907 [8:04:42<47:56,  2.49s/it][A
Training...:  92% 12753/13907 [8:04:45<52:13,  2.72s/it][A
Training...:  92% 12754/13907 [8:04:49<54:31,  2.84s/it][A
Training...:  92% 12755/13907 [8:04:52<55:41,  2.90s/it][A
Training...:  92% 12756/13907 [8:04:55<55:54,  2.91s/it][A
Training...:  92% 12757/13907 [8:04:57<55:41,  2.91s/it][A
Training...:  92% 12758/13907 [8:05:00<55:17,  2.89s/it][A
Training...:  92% 12759/13907 [8:05:03<54:37,  2.85s/it][A
Training...:  92% 12760/13907 [8:05:06<53:46,  2.81s/it][A
Training...:  92% 12761/13907 [8:05:09<53:11,  2.79s/it][A
Training...:  92% 12762/13907 [8:05:11<52:22,  2.74s/it][A
Training...:  92% 12763/13907 [8:05:14<51:41,  2.71s/it][A
Training...:  92% 12764/13907 [8:05:16<50:48,  2.67s/it][A
Training...:  92% 12765/13907 [8:05:19<49:57,  2.62s/it][A
Training...:  92% 12766/13907 [8:05:21<48:59,  2.58s/it][A
Training...:  92% 12767/13907 [8:05:24<48:17,  2.54s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:47:38<26:06:17, 31325.86s/it]
Training...:  92% 12767/13907 [8:05:27<48:17,  2.54s/it][A
Training...:  92% 12768/13907 [8:05:27<50:07,  2.64s/it][A
Training...:  92% 12769/13907 [8:05:29<48:59,  2.58s/it][A
Training...:  92% 12770/13907 [8:05:32<47:39,  2.52s/it][A
Training...:  92% 12771/13907 [8:05:34<46:32,  2.46s/it][A
Training...:  92% 12772/13907 [8:05:36<45:26,  2.40s/it][A
Training...:  92% 12773/13907 [8:05:38<44:24,  2.35s/it][A
Training...:  92% 12774/13907 [8:05:41<43:29,  2.30s/it][A
Training...:  92% 12775/13907 [8:05:43<42:50,  2.27s/it][A
Training...:  92% 12776/13907 [8:05:45<42:05,  2.23s/it][A
Training...:  92% 12777/13907 [8:05:47<41:26,  2.20s/it][A
Training...:  92% 12778/13907 [8:05:49<40:46,  2.17s/it][A
Training...:  92% 12779/13907 [8:05:51<40:11,  2.14s/it][A
Training...:  92% 12780/13907 [8:05:53<39:32,  2.11s/it][A
Training...:  92% 12781/13907 [8:05:55<38:59,  2.08s/it][A
Training...:  92% 12782/13907 [8:05:57<38:19,  2.04s/it][A
Training...:  92% 12783/13907 [8:05:59<37:44,  2.02s/it][A
Training...:  92% 12784/13907 [8:06:01<37:04,  1.98s/it][A
Training...:  92% 12785/13907 [8:06:03<36:40,  1.96s/it][A
Training...:  92% 12786/13907 [8:06:05<36:04,  1.93s/it][A
Training...:  92% 12787/13907 [8:06:07<35:33,  1.90s/it][A
Training...:  92% 12788/13907 [8:06:08<35:11,  1.89s/it][A
Training...:  92% 12789/13907 [8:06:10<34:29,  1.85s/it][A
Training...:  92% 12790/13907 [8:06:12<33:55,  1.82s/it][A
Training...:  92% 12791/13907 [8:06:14<33:16,  1.79s/it][A
Training...:  92% 12792/13907 [8:06:15<32:30,  1.75s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:48:29<26:06:17, 31325.86s/it]
Training...:  92% 12792/13907 [8:06:17<32:30,  1.75s/it][A
Training...:  92% 12793/13907 [8:06:17<33:28,  1.80s/it][A
Training...:  92% 12794/13907 [8:06:19<32:30,  1.75s/it][A
Training...:  92% 12795/13907 [8:06:20<31:10,  1.68s/it][A
Training...:  92% 12796/13907 [8:06:22<29:55,  1.62s/it][A
Training...:  92% 12797/13907 [8:06:23<28:39,  1.55s/it][A
Training...:  92% 12798/13907 [8:06:25<27:20,  1.48s/it][A
Training...:  92% 12799/13907 [8:06:26<26:01,  1.41s/it][A
Training...:  92% 12800/13907 [8:06:27<23:56,  1.30s/it][A
Training...:  92% 12801/13907 [8:06:31<37:44,  2.05s/it][A
Training...:  92% 12802/13907 [8:06:34<45:41,  2.48s/it][A
Training...:  92% 12803/13907 [8:06:37<49:53,  2.71s/it][A
Training...:  92% 12804/13907 [8:06:41<52:04,  2.83s/it][A
Training...:  92% 12805/13907 [8:06:44<53:07,  2.89s/it][A
Training...:  92% 12806/13907 [8:06:47<53:15,  2.90s/it][A
Training...:  92% 12807/13907 [8:06:49<53:03,  2.89s/it][A
Training...:  92% 12808/13907 [8:06:52<52:35,  2.87s/it][A
Training...:  92% 12809/13907 [8:06:55<52:03,  2.84s/it][A
Training...:  92% 12810/13907 [8:06:58<51:15,  2.80s/it][A
Training...:  92% 12811/13907 [8:07:00<50:24,  2.76s/it][A
Training...:  92% 12812/13907 [8:07:03<49:34,  2.72s/it][A
Training...:  92% 12813/13907 [8:07:06<48:55,  2.68s/it][A
Training...:  92% 12814/13907 [8:07:08<48:02,  2.64s/it][A
Training...:  92% 12815/13907 [8:07:11<47:18,  2.60s/it][A
Training...:  92% 12816/13907 [8:07:13<46:38,  2.56s/it][A
Training...:  92% 12817/13907 [8:07:16<46:10,  2.54s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:49:30<26:06:17, 31325.86s/it]
Training...:  92% 12817/13907 [8:07:18<46:10,  2.54s/it][A
Training...:  92% 12818/13907 [8:07:18<47:37,  2.62s/it][A
Training...:  92% 12819/13907 [8:07:21<46:43,  2.58s/it][A
Training...:  92% 12820/13907 [8:07:23<45:37,  2.52s/it][A
Training...:  92% 12821/13907 [8:07:26<44:29,  2.46s/it][A
Training...:  92% 12822/13907 [8:07:28<43:30,  2.41s/it][A
Training...:  92% 12823/13907 [8:07:30<42:33,  2.36s/it][A
Training...:  92% 12824/13907 [8:07:32<41:34,  2.30s/it][A
Training...:  92% 12825/13907 [8:07:34<40:51,  2.27s/it][A
Training...:  92% 12826/13907 [8:07:37<40:11,  2.23s/it][A
Training...:  92% 12827/13907 [8:07:39<39:31,  2.20s/it][A
Training...:  92% 12828/13907 [8:07:41<38:52,  2.16s/it][A
Training...:  92% 12829/13907 [8:07:43<38:17,  2.13s/it][A
Training...:  92% 12830/13907 [8:07:45<37:42,  2.10s/it][A
Training...:  92% 12831/13907 [8:07:47<37:01,  2.06s/it][A
Training...:  92% 12832/13907 [8:07:49<36:25,  2.03s/it][A
Training...:  92% 12833/13907 [8:07:51<35:46,  2.00s/it][A
Training...:  92% 12834/13907 [8:07:53<35:18,  1.97s/it][A
Training...:  92% 12835/13907 [8:07:55<34:50,  1.95s/it][A
Training...:  92% 12836/13907 [8:07:56<34:13,  1.92s/it][A
Training...:  92% 12837/13907 [8:07:58<33:37,  1.89s/it][A
Training...:  92% 12838/13907 [8:08:00<33:06,  1.86s/it][A
Training...:  92% 12839/13907 [8:08:02<32:32,  1.83s/it][A
Training...:  92% 12840/13907 [8:08:03<31:54,  1.79s/it][A
Training...:  92% 12841/13907 [8:08:05<31:27,  1.77s/it][A
Training...:  92% 12842/13907 [8:08:07<30:47,  1.73s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:50:20<26:06:17, 31325.86s/it]
Training...:  92% 12842/13907 [8:08:09<30:47,  1.73s/it][A
Training...:  92% 12843/13907 [8:08:09<31:56,  1.80s/it][A
Training...:  92% 12844/13907 [8:08:10<31:02,  1.75s/it][A
Training...:  92% 12845/13907 [8:08:12<29:54,  1.69s/it][A
Training...:  92% 12846/13907 [8:08:13<28:38,  1.62s/it][A
Training...:  92% 12847/13907 [8:08:15<27:33,  1.56s/it][A
Training...:  92% 12848/13907 [8:08:16<26:14,  1.49s/it][A
Training...:  92% 12849/13907 [8:08:17<24:51,  1.41s/it][A
Training...:  92% 12850/13907 [8:08:18<22:52,  1.30s/it][A
Training...:  92% 12851/13907 [8:08:22<35:39,  2.03s/it][A
Training...:  92% 12852/13907 [8:08:26<43:27,  2.47s/it][A
Training...:  92% 12853/13907 [8:08:29<47:29,  2.70s/it][A
Training...:  92% 12854/13907 [8:08:32<49:36,  2.83s/it][A
Training...:  92% 12855/13907 [8:08:35<50:40,  2.89s/it][A
Training...:  92% 12856/13907 [8:08:38<50:50,  2.90s/it][A
Training...:  92% 12857/13907 [8:08:41<50:29,  2.88s/it][A
Training...:  92% 12858/13907 [8:08:44<49:59,  2.86s/it][A
Training...:  92% 12859/13907 [8:08:46<49:43,  2.85s/it][A
Training...:  92% 12860/13907 [8:08:49<48:57,  2.81s/it][A
Training...:  92% 12861/13907 [8:08:52<48:09,  2.76s/it][A
Training...:  92% 12862/13907 [8:08:54<47:23,  2.72s/it][A
Training...:  92% 12863/13907 [8:08:57<46:40,  2.68s/it][A
Training...:  93% 12864/13907 [8:09:00<45:54,  2.64s/it][A
Training...:  93% 12865/13907 [8:09:02<45:14,  2.61s/it][A
Training...:  93% 12866/13907 [8:09:05<44:52,  2.59s/it][A
Training...:  93% 12867/13907 [8:09:07<44:44,  2.58s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:51:21<26:06:17, 31325.86s/it]
Training...:  93% 12867/13907 [8:09:10<44:44,  2.58s/it][A
Training...:  93% 12868/13907 [8:09:10<45:57,  2.65s/it][A
Training...:  93% 12869/13907 [8:09:13<44:44,  2.59s/it][A
Training...:  93% 12870/13907 [8:09:15<43:17,  2.50s/it][A
Training...:  93% 12871/13907 [8:09:17<42:29,  2.46s/it][A
Training...:  93% 12872/13907 [8:09:19<41:22,  2.40s/it][A
Training...:  93% 12873/13907 [8:09:22<40:32,  2.35s/it][A
Training...:  93% 12874/13907 [8:09:24<39:32,  2.30s/it][A
Training...:  93% 12875/13907 [8:09:26<38:50,  2.26s/it][A
Training...:  93% 12876/13907 [8:09:28<38:07,  2.22s/it][A
Training...:  93% 12877/13907 [8:09:30<37:26,  2.18s/it][A
Training...:  93% 12878/13907 [8:09:32<36:55,  2.15s/it][A
Training...:  93% 12879/13907 [8:09:34<36:27,  2.13s/it][A
Training...:  93% 12880/13907 [8:09:36<36:05,  2.11s/it][A
Training...:  93% 12881/13907 [8:09:38<35:33,  2.08s/it][A
Training...:  93% 12882/13907 [8:09:40<34:57,  2.05s/it][A
Training...:  93% 12883/13907 [8:09:42<34:21,  2.01s/it][A
Training...:  93% 12884/13907 [8:09:44<33:40,  1.97s/it][A
Training...:  93% 12885/13907 [8:09:46<33:13,  1.95s/it][A
Training...:  93% 12886/13907 [8:09:48<32:34,  1.91s/it][A
Training...:  93% 12887/13907 [8:09:50<32:11,  1.89s/it][A
Training...:  93% 12888/13907 [8:09:52<31:32,  1.86s/it][A
Training...:  93% 12889/13907 [8:09:53<31:09,  1.84s/it][A
Training...:  93% 12890/13907 [8:09:55<30:32,  1.80s/it][A
Training...:  93% 12891/13907 [8:09:57<29:53,  1.77s/it][A
Training...:  93% 12892/13907 [8:09:58<29:22,  1.74s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:52:12<26:06:17, 31325.86s/it]
Training...:  93% 12892/13907 [8:10:00<29:22,  1.74s/it][A
Training...:  93% 12893/13907 [8:10:00<30:17,  1.79s/it][A
Training...:  93% 12894/13907 [8:10:02<29:28,  1.75s/it][A
Training...:  93% 12895/13907 [8:10:04<28:26,  1.69s/it][A
Training...:  93% 12896/13907 [8:10:05<27:13,  1.62s/it][A
Training...:  93% 12897/13907 [8:10:06<26:05,  1.55s/it][A
Training...:  93% 12898/13907 [8:10:08<24:54,  1.48s/it][A
Training...:  93% 12899/13907 [8:10:09<23:37,  1.41s/it][A
Training...:  93% 12900/13907 [8:10:10<22:00,  1.31s/it][A
Training...:  93% 12901/13907 [8:10:14<34:25,  2.05s/it][A
Training...:  93% 12902/13907 [8:10:17<41:45,  2.49s/it][A
Training...:  93% 12903/13907 [8:10:21<45:50,  2.74s/it][A
Training...:  93% 12904/13907 [8:10:24<48:04,  2.88s/it][A
Training...:  93% 12905/13907 [8:10:27<49:07,  2.94s/it][A
Training...:  93% 12906/13907 [8:10:30<49:28,  2.97s/it][A
Training...:  93% 12907/13907 [8:10:33<49:12,  2.95s/it][A
Training...:  93% 12908/13907 [8:10:36<48:43,  2.93s/it][A
Training...:  93% 12909/13907 [8:10:39<48:01,  2.89s/it][A
Training...:  93% 12910/13907 [8:10:41<47:24,  2.85s/it][A
Training...:  93% 12911/13907 [8:10:44<46:39,  2.81s/it][A
Training...:  93% 12912/13907 [8:10:47<45:59,  2.77s/it][A
Training...:  93% 12913/13907 [8:10:49<45:14,  2.73s/it][A
Training...:  93% 12914/13907 [8:10:52<44:34,  2.69s/it][A
Training...:  93% 12915/13907 [8:10:55<43:59,  2.66s/it][A
Training...:  93% 12916/13907 [8:10:57<43:44,  2.65s/it][A
Training...:  93% 12917/13907 [8:11:00<42:59,  2.61s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:53:14<26:06:17, 31325.86s/it]
Training...:  93% 12917/13907 [8:11:03<42:59,  2.61s/it][A
Training...:  93% 12918/13907 [8:11:03<44:07,  2.68s/it][A
Training...:  93% 12919/13907 [8:11:05<43:16,  2.63s/it][A
Training...:  93% 12920/13907 [8:11:07<42:00,  2.55s/it][A
Training...:  93% 12921/13907 [8:11:10<40:48,  2.48s/it][A
Training...:  93% 12922/13907 [8:11:12<39:53,  2.43s/it][A
Training...:  93% 12923/13907 [8:11:14<39:04,  2.38s/it][A
Training...:  93% 12924/13907 [8:11:17<38:25,  2.35s/it][A
Training...:  93% 12925/13907 [8:11:19<37:42,  2.30s/it][A
Training...:  93% 12926/13907 [8:11:21<37:03,  2.27s/it][A
Training...:  93% 12927/13907 [8:11:23<36:18,  2.22s/it][A
Training...:  93% 12928/13907 [8:11:25<35:38,  2.18s/it][A
Training...:  93% 12929/13907 [8:11:27<35:01,  2.15s/it][A
Training...:  93% 12930/13907 [8:11:29<34:25,  2.11s/it][A
Training...:  93% 12931/13907 [8:11:31<33:55,  2.09s/it][A
Training...:  93% 12932/13907 [8:11:33<33:29,  2.06s/it][A
Training...:  93% 12933/13907 [8:11:35<33:06,  2.04s/it][A
Training...:  93% 12934/13907 [8:11:37<32:38,  2.01s/it][A
Training...:  93% 12935/13907 [8:11:39<32:15,  1.99s/it][A
Training...:  93% 12936/13907 [8:11:41<31:46,  1.96s/it][A
Training...:  93% 12937/13907 [8:11:43<31:17,  1.94s/it][A
Training...:  93% 12938/13907 [8:11:45<30:43,  1.90s/it][A
Training...:  93% 12939/13907 [8:11:47<30:12,  1.87s/it][A
Training...:  93% 12940/13907 [8:11:48<29:35,  1.84s/it][A
Training...:  93% 12941/13907 [8:11:50<28:57,  1.80s/it][A
Training...:  93% 12942/13907 [8:11:52<28:22,  1.76s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:54:05<26:06:17, 31325.86s/it]
Training...:  93% 12942/13907 [8:11:54<28:22,  1.76s/it][A
Training...:  93% 12943/13907 [8:11:54<29:11,  1.82s/it][A
Training...:  93% 12944/13907 [8:11:55<28:24,  1.77s/it][A
Training...:  93% 12945/13907 [8:11:57<27:18,  1.70s/it][A
Training...:  93% 12946/13907 [8:11:58<26:11,  1.64s/it][A
Training...:  93% 12947/13907 [8:12:00<25:06,  1.57s/it][A
Training...:  93% 12948/13907 [8:12:01<24:05,  1.51s/it][A
Training...:  93% 12949/13907 [8:12:02<22:54,  1.43s/it][A
Training...:  93% 12950/13907 [8:12:03<21:09,  1.33s/it][A
Training...:  93% 12951/13907 [8:12:07<33:21,  2.09s/it][A
Training...:  93% 12952/13907 [8:12:11<39:48,  2.50s/it][A
Training...:  93% 12953/13907 [8:12:14<43:25,  2.73s/it][A
Training...:  93% 12954/13907 [8:12:17<45:21,  2.86s/it][A
Training...:  93% 12955/13907 [8:12:20<46:21,  2.92s/it][A
Training...:  93% 12956/13907 [8:12:23<46:33,  2.94s/it][A
Training...:  93% 12957/13907 [8:12:26<46:12,  2.92s/it][A
Training...:  93% 12958/13907 [8:12:29<45:36,  2.88s/it][A
Training...:  93% 12959/13907 [8:12:32<45:04,  2.85s/it][A
Training...:  93% 12960/13907 [8:12:34<44:16,  2.81s/it][A
Training...:  93% 12961/13907 [8:12:37<43:33,  2.76s/it][A
Training...:  93% 12962/13907 [8:12:40<42:55,  2.73s/it][A
Training...:  93% 12963/13907 [8:12:42<42:11,  2.68s/it][A
Training...:  93% 12964/13907 [8:12:45<41:29,  2.64s/it][A
Training...:  93% 12965/13907 [8:12:47<40:58,  2.61s/it][A
Training...:  93% 12966/13907 [8:12:50<40:06,  2.56s/it][A
Training...:  93% 12967/13907 [8:12:52<39:27,  2.52s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:55:06<26:06:17, 31325.86s/it]
Training...:  93% 12967/13907 [8:12:55<39:27,  2.52s/it][A
Training...:  93% 12968/13907 [8:12:55<40:38,  2.60s/it][A
Training...:  93% 12969/13907 [8:12:57<39:51,  2.55s/it][A
Training...:  93% 12970/13907 [8:13:00<38:43,  2.48s/it][A
Training...:  93% 12971/13907 [8:13:02<37:59,  2.44s/it][A
Training...:  93% 12972/13907 [8:13:04<37:41,  2.42s/it][A
Training...:  93% 12973/13907 [8:13:07<36:54,  2.37s/it][A
Training...:  93% 12974/13907 [8:13:09<36:01,  2.32s/it][A
Training...:  93% 12975/13907 [8:13:11<35:20,  2.27s/it][A
Training...:  93% 12976/13907 [8:13:13<34:29,  2.22s/it][A
Training...:  93% 12977/13907 [8:13:15<33:51,  2.18s/it][A
Training...:  93% 12978/13907 [8:13:17<33:25,  2.16s/it][A
Training...:  93% 12979/13907 [8:13:19<32:55,  2.13s/it][A
Training...:  93% 12980/13907 [8:13:21<32:21,  2.09s/it][A
Training...:  93% 12981/13907 [8:13:23<31:54,  2.07s/it][A
Training...:  93% 12982/13907 [8:13:25<31:25,  2.04s/it][A
Training...:  93% 12983/13907 [8:13:27<30:55,  2.01s/it][A
Training...:  93% 12984/13907 [8:13:29<30:25,  1.98s/it][A
Training...:  93% 12985/13907 [8:13:31<30:03,  1.96s/it][A
Training...:  93% 12986/13907 [8:13:33<29:36,  1.93s/it][A
Training...:  93% 12987/13907 [8:13:35<29:11,  1.90s/it][A
Training...:  93% 12988/13907 [8:13:37<28:38,  1.87s/it][A
Training...:  93% 12989/13907 [8:13:38<28:06,  1.84s/it][A
Training...:  93% 12990/13907 [8:13:40<27:34,  1.80s/it][A
Training...:  93% 12991/13907 [8:13:42<26:59,  1.77s/it][A
Training...:  93% 12992/13907 [8:13:44<26:26,  1.73s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:55:57<26:06:17, 31325.86s/it]
Training...:  93% 12992/13907 [8:13:45<26:26,  1.73s/it][A
Training...:  93% 12993/13907 [8:13:45<27:19,  1.79s/it][A
Training...:  93% 12994/13907 [8:13:47<26:36,  1.75s/it][A
Training...:  93% 12995/13907 [8:13:49<25:36,  1.69s/it][A
Training...:  93% 12996/13907 [8:13:50<24:40,  1.63s/it][A
Training...:  93% 12997/13907 [8:13:52<23:46,  1.57s/it][A
Training...:  93% 12998/13907 [8:13:53<22:59,  1.52s/it][A
Training...:  93% 12999/13907 [8:13:54<21:46,  1.44s/it][A
Training...:  93% 13000/13907 [8:13:55<20:10,  1.33s/it][A
Training...:  93% 13001/13907 [8:13:59<31:08,  2.06s/it][A
Training...:  93% 13002/13907 [8:14:03<37:40,  2.50s/it][A
Training...:  93% 13003/13907 [8:14:06<41:02,  2.72s/it][A
Training...:  94% 13004/13907 [8:14:09<42:44,  2.84s/it][A
Training...:  94% 13005/13907 [8:14:12<43:27,  2.89s/it][A
Training...:  94% 13006/13907 [8:14:15<43:43,  2.91s/it][A
Training...:  94% 13007/13907 [8:14:18<43:44,  2.92s/it][A
Training...:  94% 13008/13907 [8:14:21<43:15,  2.89s/it][A
Training...:  94% 13009/13907 [8:14:23<42:37,  2.85s/it][A
Training...:  94% 13010/13907 [8:14:26<42:06,  2.82s/it][A
Training...:  94% 13011/13907 [8:14:29<41:37,  2.79s/it][A
Training...:  94% 13012/13907 [8:14:32<40:49,  2.74s/it][A
Training...:  94% 13013/13907 [8:14:34<40:15,  2.70s/it][A
Training...:  94% 13014/13907 [8:14:37<39:27,  2.65s/it][A
Training...:  94% 13015/13907 [8:14:39<38:38,  2.60s/it][A
Training...:  94% 13016/13907 [8:14:42<37:49,  2.55s/it][A
Training...:  94% 13017/13907 [8:14:44<37:13,  2.51s/it][A                                                                                                                            
                                                        [AStep... (25200 | Loss: 0.21506142616271973, Learning Rate: 0.00015030910435598344, Gradient Norm: 0.9493966102600098)
Step... (25225 | Loss: 0.2891709804534912, Learning Rate: 0.00015015757526271045, Gradient Norm: 0.9940158724784851)
Step... (25250 | Loss: 0.18031156063079834, Learning Rate: 0.00015000607527326792, Gradient Norm: 0.9135951399803162)
Step... (25275 | Loss: 0.23392310738563538, Learning Rate: 0.00014985456073191017, Gradient Norm: 0.7327132225036621)
Step... (25300 | Loss: 0.18607649207115173, Learning Rate: 0.00014970303163863719, Gradient Norm: 0.8368880152702332)
Step... (25325 | Loss: 0.17096573114395142, Learning Rate: 0.00014955151709727943, Gradient Norm: 0.5774127244949341)
Step... (25350 | Loss: 0.21566230058670044, Learning Rate: 0.0001494000171078369, Gradient Norm: 1.1139414310455322)
Step... (25375 | Loss: 0.250210165977478, Learning Rate: 0.00014924848801456392, Gradient Norm: 0.861386239528656)
Step... (25400 | Loss: 0.26740142703056335, Learning Rate: 0.00014909697347320616, Gradient Norm: 1.0308940410614014)
Step... (25425 | Loss: 0.17605355381965637, Learning Rate: 0.00014894547348376364, Gradient Norm: 0.6557826995849609)
Step... (25450 | Loss: 0.2197185754776001, Learning Rate: 0.00014879394439049065, Gradient Norm: 0.8992340564727783)
Step... (25475 | Loss: 0.24047477543354034, Learning Rate: 0.0001486424298491329, Gradient Norm: 1.0663511753082275)
Step... (25500 | Loss: 0.20737901329994202, Learning Rate: 0.00014849092985969037, Gradient Norm: 1.9611233472824097)
Step... (25525 | Loss: 0.21171191334724426, Learning Rate: 0.00014833940076641738, Gradient Norm: 0.7251715660095215)
Step... (25550 | Loss: 0.1830022633075714, Learning Rate: 0.00014818788622505963, Gradient Norm: 1.1385457515716553)
Step... (25575 | Loss: 0.22335202991962433, Learning Rate: 0.0001480363862356171, Gradient Norm: 0.8306920528411865)
Step... (25600 | Loss: 0.23373034596443176, Learning Rate: 0.00014788485714234412, Gradient Norm: 1.5041837692260742)
Step... (25625 | Loss: 0.24196691811084747, Learning Rate: 0.00014773334260098636, Gradient Norm: 0.6721357107162476)
Step... (25650 | Loss: 0.1987464427947998, Learning Rate: 0.0001475818280596286, Gradient Norm: 1.3258812427520752)
Step... (25675 | Loss: 0.23137803375720978, Learning Rate: 0.00014743031351827085, Gradient Norm: 0.8222770690917969)
Step... (25700 | Loss: 0.290368914604187, Learning Rate: 0.0001472787989769131, Gradient Norm: 1.0816582441329956)
Step... (25725 | Loss: 0.291753351688385, Learning Rate: 0.0001471272698836401, Gradient Norm: 0.702816367149353)
Step... (25750 | Loss: 0.23935118317604065, Learning Rate: 0.00014697576989419758, Gradient Norm: 1.0541282892227173)
Step... (25775 | Loss: 0.20121058821678162, Learning Rate: 0.00014682425535283983, Gradient Norm: 0.721842348575592)
Step... (25800 | Loss: 0.2506847083568573, Learning Rate: 0.00014667272625956684, Gradient Norm: 0.9506323337554932)
Step... (25825 | Loss: 0.18694032728672028, Learning Rate: 0.0001465212117182091, Gradient Norm: 0.7744369506835938)
Step... (25850 | Loss: 0.2258661985397339, Learning Rate: 0.00014636971172876656, Gradient Norm: 0.8271030187606812)
Step... (25875 | Loss: 0.1883060336112976, Learning Rate: 0.00014621818263549358, Gradient Norm: 0.6075310707092285)
Step... (25900 | Loss: 0.2258269339799881, Learning Rate: 0.00014606666809413582, Gradient Norm: 0.9247499108314514)
Step... (25925 | Loss: 0.18990646302700043, Learning Rate: 0.0001459151681046933, Gradient Norm: 0.8104613423347473)
Step... (25950 | Loss: 0.2277112901210785, Learning Rate: 0.0001457636390114203, Gradient Norm: 1.1876296997070312)
Step... (25975 | Loss: 0.19828566908836365, Learning Rate: 0.00014561212447006255, Gradient Norm: 0.6054201722145081)
Step... (26000 | Loss: 0.1782069057226181, Learning Rate: 0.00014546062448062003, Gradient Norm: 1.0262560844421387)
Step... (26025 | Loss: 0.23865263164043427, Learning Rate: 0.00014530909538734704, Gradient Norm: 0.847926676273346)
Step... (26050 | Loss: 0.20690812170505524, Learning Rate: 0.0001451575808459893, Gradient Norm: 1.3198461532592773)
Step... (26075 | Loss: 0.21785518527030945, Learning Rate: 0.00014500606630463153, Gradient Norm: 0.8271299004554749)
Step... (26100 | Loss: 0.1900075078010559, Learning Rate: 0.00014485455176327378, Gradient Norm: 0.8344607949256897)
Step... (26125 | Loss: 0.1904381364583969, Learning Rate: 0.00014470303722191602, Gradient Norm: 0.7887115478515625)
Step... (26150 | Loss: 0.1933664083480835, Learning Rate: 0.00014455152268055826, Gradient Norm: 0.9886388778686523)
Step... (26175 | Loss: 0.1835688054561615, Learning Rate: 0.0001444000081392005, Gradient Norm: 0.7338196039199829)
Step... (26200 | Loss: 0.15377703309059143, Learning Rate: 0.00014424849359784275, Gradient Norm: 1.1873657703399658)
Step... (26225 | Loss: 0.23769411444664001, Learning Rate: 0.000144096979056485, Gradient Norm: 0.8594014048576355)
Step... (26250 | Loss: 0.1791502833366394, Learning Rate: 0.000143945449963212, Gradient Norm: 1.254817008972168)
Step... (26275 | Loss: 0.2582281231880188, Learning Rate: 0.00014379394997376949, Gradient Norm: 1.0564539432525635)
Step... (26300 | Loss: 0.19426575303077698, Learning Rate: 0.00014364243543241173, Gradient Norm: 1.175635576248169)
Step... (26325 | Loss: 0.22642844915390015, Learning Rate: 0.00014349090633913875, Gradient Norm: 0.9826547503471375)
Step... (26350 | Loss: 0.19371257722377777, Learning Rate: 0.00014333940634969622, Gradient Norm: 0.7971054911613464)
Step... (26375 | Loss: 0.192627415060997, Learning Rate: 0.00014318789180833846, Gradient Norm: 0.7837886810302734)
Step... (26400 | Loss: 0.16547773778438568, Learning Rate: 0.00014303636271506548, Gradient Norm: 0.7085282206535339)
Step... (26425 | Loss: 0.2488200068473816, Learning Rate: 0.00014288486272562295, Gradient Norm: 1.0655404329299927)
Step... (26450 | Loss: 0.23574545979499817, Learning Rate: 0.0001427333481842652, Gradient Norm: 1.1050831079483032)
Step... (26475 | Loss: 0.1534273624420166, Learning Rate: 0.0001425818190909922, Gradient Norm: 0.7416699528694153)
Step... (26500 | Loss: 0.15663468837738037, Learning Rate: 0.00014243031910154969, Gradient Norm: 0.896690845489502)
Step... (26525 | Loss: 0.27729105949401855, Learning Rate: 0.00014227880456019193, Gradient Norm: 1.0197118520736694)
Step... (26550 | Loss: 0.1562841236591339, Learning Rate: 0.00014212727546691895, Gradient Norm: 0.8530640602111816)
Step... (26575 | Loss: 0.21912643313407898, Learning Rate: 0.0001419757609255612, Gradient Norm: 0.8170053958892822)
Step... (26600 | Loss: 0.1518709659576416, Learning Rate: 0.00014182426093611866, Gradient Norm: 0.9711620807647705)
Step... (26625 | Loss: 0.18469813466072083, Learning Rate: 0.00014167273184284568, Gradient Norm: 0.6953931450843811)
Step... (26650 | Loss: 0.262395441532135, Learning Rate: 0.00014152121730148792, Gradient Norm: 0.9583610892295837)
Step... (26675 | Loss: 0.24322307109832764, Learning Rate: 0.0001413697173120454, Gradient Norm: 0.8219763040542603)
Step... (26700 | Loss: 0.19186127185821533, Learning Rate: 0.0001412181882187724, Gradient Norm: 1.0038392543792725)
Step... (26725 | Loss: 0.1576233059167862, Learning Rate: 0.00014106667367741466, Gradient Norm: 0.5417913794517517)
Step... (26750 | Loss: 0.224077969789505, Learning Rate: 0.00014091514458414167, Gradient Norm: 0.7134078741073608)
Step... (26775 | Loss: 0.20334279537200928, Learning Rate: 0.00014076364459469914, Gradient Norm: 0.6481912136077881)
Step... (26800 | Loss: 0.19077900052070618, Learning Rate: 0.0001406121300533414, Gradient Norm: 0.8712556958198547)
Step... (26825 | Loss: 0.2240149825811386, Learning Rate: 0.0001404606009600684, Gradient Norm: 0.8511216640472412)
Step... (26850 | Loss: 0.20219223201274872, Learning Rate: 0.00014030910097062588, Gradient Norm: 0.9688987731933594)
Step... (26875 | Loss: 0.1879277229309082, Learning Rate: 0.00014015758642926812, Gradient Norm: 0.5895053744316101)
Step... (26900 | Loss: 0.27521365880966187, Learning Rate: 0.00014000605733599514, Gradient Norm: 1.0993492603302002)
Step... (26925 | Loss: 0.247196763753891, Learning Rate: 0.0001398545573465526, Gradient Norm: 1.0277493000030518)Epoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:56:58<26:06:17, 31325.86s/it]
Training...:  94% 13017/13907 [8:14:47<37:13,  2.51s/it][A
Training...:  94% 13018/13907 [8:14:47<38:33,  2.60s/it][A
Training...:  94% 13019/13907 [8:14:49<38:23,  2.59s/it][A
Training...:  94% 13020/13907 [8:14:52<37:08,  2.51s/it][A
Training...:  94% 13021/13907 [8:14:54<36:12,  2.45s/it][A
Training...:  94% 13022/13907 [8:14:56<35:11,  2.39s/it][A
Training...:  94% 13023/13907 [8:14:58<34:25,  2.34s/it][A
Training...:  94% 13024/13907 [8:15:01<33:46,  2.29s/it][A
Training...:  94% 13025/13907 [8:15:03<33:09,  2.26s/it][A
Training...:  94% 13026/13907 [8:15:05<32:30,  2.21s/it][A
Training...:  94% 13027/13907 [8:15:07<31:58,  2.18s/it][A
Training...:  94% 13028/13907 [8:15:09<31:30,  2.15s/it][A
Training...:  94% 13029/13907 [8:15:11<31:03,  2.12s/it][A
Training...:  94% 13030/13907 [8:15:13<30:37,  2.09s/it][A
Training...:  94% 13031/13907 [8:15:15<30:10,  2.07s/it][A
Training...:  94% 13032/13907 [8:15:17<29:44,  2.04s/it][A
Training...:  94% 13033/13907 [8:15:19<29:17,  2.01s/it][A
Training...:  94% 13034/13907 [8:15:21<28:50,  1.98s/it][A
Training...:  94% 13035/13907 [8:15:23<28:28,  1.96s/it][A
Training...:  94% 13036/13907 [8:15:25<27:59,  1.93s/it][A
Training...:  94% 13037/13907 [8:15:27<27:30,  1.90s/it][A
Training...:  94% 13038/13907 [8:15:28<26:58,  1.86s/it][A
Training...:  94% 13039/13907 [8:15:30<26:29,  1.83s/it][A
Training...:  94% 13040/13907 [8:15:32<25:55,  1.79s/it][A
Training...:  94% 13041/13907 [8:15:34<25:25,  1.76s/it][A
Training...:  94% 13042/13907 [8:15:35<24:59,  1.73s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:57:48<26:06:17, 31325.86s/it]
Training...:  94% 13042/13907 [8:15:37<24:59,  1.73s/it][A
Training...:  94% 13043/13907 [8:15:37<25:46,  1.79s/it][A
Training...:  94% 13044/13907 [8:15:39<25:06,  1.75s/it][A
Training...:  94% 13045/13907 [8:15:40<24:07,  1.68s/it][A
Training...:  94% 13046/13907 [8:15:42<23:08,  1.61s/it][A
Training...:  94% 13047/13907 [8:15:43<22:17,  1.56s/it][A
Training...:  94% 13048/13907 [8:15:45<21:21,  1.49s/it][A
Training...:  94% 13049/13907 [8:15:46<20:17,  1.42s/it][A
Training...:  94% 13050/13907 [8:15:47<18:50,  1.32s/it][A
Training...:  94% 13051/13907 [8:15:51<29:06,  2.04s/it][A
Training...:  94% 13052/13907 [8:15:54<35:24,  2.48s/it][A
Training...:  94% 13053/13907 [8:15:57<39:01,  2.74s/it][A
Training...:  94% 13054/13907 [8:16:01<40:43,  2.86s/it][A
Training...:  94% 13055/13907 [8:16:04<41:35,  2.93s/it][A
Training...:  94% 13056/13907 [8:16:07<41:34,  2.93s/it][A
Training...:  94% 13057/13907 [8:16:10<41:23,  2.92s/it][A
Training...:  94% 13058/13907 [8:16:12<40:55,  2.89s/it][A
Training...:  94% 13059/13907 [8:16:15<40:24,  2.86s/it][A
Training...:  94% 13060/13907 [8:16:18<39:38,  2.81s/it][A
Training...:  94% 13061/13907 [8:16:20<38:59,  2.76s/it][A
Training...:  94% 13062/13907 [8:16:23<38:16,  2.72s/it][A
Training...:  94% 13063/13907 [8:16:26<37:44,  2.68s/it][A
Training...:  94% 13064/13907 [8:16:28<37:04,  2.64s/it][A
Training...:  94% 13065/13907 [8:16:31<36:30,  2.60s/it][A
Training...:  94% 13066/13907 [8:16:33<35:52,  2.56s/it][A
Training...:  94% 13067/13907 [8:16:36<35:29,  2.54s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:58:50<26:06:17, 31325.86s/it]
Training...:  94% 13067/13907 [8:16:39<35:29,  2.54s/it][A
Training...:  94% 13068/13907 [8:16:39<36:37,  2.62s/it][A
Training...:  94% 13069/13907 [8:16:41<36:00,  2.58s/it][A
Training...:  94% 13070/13907 [8:16:43<35:10,  2.52s/it][A
Training...:  94% 13071/13907 [8:16:46<34:17,  2.46s/it][A
Training...:  94% 13072/13907 [8:16:48<33:24,  2.40s/it][A
Training...:  94% 13073/13907 [8:16:50<32:43,  2.35s/it][A
Training...:  94% 13074/13907 [8:16:52<32:03,  2.31s/it][A
Training...:  94% 13075/13907 [8:16:55<31:23,  2.26s/it][A
Training...:  94% 13076/13907 [8:16:57<30:53,  2.23s/it][A
Training...:  94% 13077/13907 [8:16:59<30:20,  2.19s/it][A
Training...:  94% 13078/13907 [8:17:01<29:47,  2.16s/it][A
Training...:  94% 13079/13907 [8:17:03<29:22,  2.13s/it][A
Training...:  94% 13080/13907 [8:17:05<29:02,  2.11s/it][A
Training...:  94% 13081/13907 [8:17:07<28:31,  2.07s/it][A
Training...:  94% 13082/13907 [8:17:09<28:00,  2.04s/it][A
Training...:  94% 13083/13907 [8:17:11<27:38,  2.01s/it][A
Training...:  94% 13084/13907 [8:17:13<27:13,  1.98s/it][A
Training...:  94% 13085/13907 [8:17:15<26:57,  1.97s/it][A
Training...:  94% 13086/13907 [8:17:17<26:21,  1.93s/it][A
Training...:  94% 13087/13907 [8:17:18<26:04,  1.91s/it][A
Training...:  94% 13088/13907 [8:17:20<25:29,  1.87s/it][A
Training...:  94% 13089/13907 [8:17:22<24:56,  1.83s/it][A
Training...:  94% 13090/13907 [8:17:24<24:19,  1.79s/it][A
Training...:  94% 13091/13907 [8:17:25<23:58,  1.76s/it][A
Training...:  94% 13092/13907 [8:17:27<23:24,  1.72s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [16:59:40<26:06:17, 31325.86s/it]
Training...:  94% 13092/13907 [8:17:29<23:24,  1.72s/it][A
Training...:  94% 13093/13907 [8:17:29<24:09,  1.78s/it][A
Training...:  94% 13094/13907 [8:17:31<23:31,  1.74s/it][A
Training...:  94% 13095/13907 [8:17:32<22:34,  1.67s/it][A
Training...:  94% 13096/13907 [8:17:33<21:37,  1.60s/it][A
Training...:  94% 13097/13907 [8:17:35<20:47,  1.54s/it][A
Training...:  94% 13098/13907 [8:17:36<19:53,  1.48s/it][A
Training...:  94% 13099/13907 [8:17:37<18:51,  1.40s/it][A
Training...:  94% 13100/13907 [8:17:39<17:31,  1.30s/it][A
Training...:  94% 13101/13907 [8:17:42<27:14,  2.03s/it][A
Training...:  94% 13102/13907 [8:17:46<33:08,  2.47s/it][A
Training...:  94% 13103/13907 [8:17:49<36:26,  2.72s/it][A
Training...:  94% 13104/13907 [8:17:52<38:10,  2.85s/it][A
Training...:  94% 13105/13907 [8:17:55<39:01,  2.92s/it][A
Training...:  94% 13106/13907 [8:17:58<39:13,  2.94s/it][A
Training...:  94% 13107/13907 [8:18:01<39:09,  2.94s/it][A
Training...:  94% 13108/13907 [8:18:04<38:49,  2.91s/it][A
Training...:  94% 13109/13907 [8:18:07<38:14,  2.88s/it][A
Training...:  94% 13110/13907 [8:18:10<37:43,  2.84s/it][A
Training...:  94% 13111/13907 [8:18:12<37:02,  2.79s/it][A
Training...:  94% 13112/13907 [8:18:15<36:25,  2.75s/it][A
Training...:  94% 13113/13907 [8:18:18<36:01,  2.72s/it][A
Training...:  94% 13114/13907 [8:18:20<35:25,  2.68s/it][A
Training...:  94% 13115/13907 [8:18:23<34:41,  2.63s/it][A
Training...:  94% 13116/13907 [8:18:25<34:02,  2.58s/it][A
Training...:  94% 13117/13907 [8:18:28<33:28,  2.54s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:00:42<26:06:17, 31325.86s/it]
Training...:  94% 13117/13907 [8:18:30<33:28,  2.54s/it][A
Training...:  94% 13118/13907 [8:18:30<34:24,  2.62s/it][A
Training...:  94% 13119/13907 [8:18:33<33:43,  2.57s/it][A
Training...:  94% 13120/13907 [8:18:35<33:15,  2.54s/it][A
Training...:  94% 13121/13907 [8:18:38<32:29,  2.48s/it][A
Training...:  94% 13122/13907 [8:18:40<31:39,  2.42s/it][A
Training...:  94% 13123/13907 [8:18:42<30:49,  2.36s/it][A
Training...:  94% 13124/13907 [8:18:44<30:09,  2.31s/it][A
Training...:  94% 13125/13907 [8:18:47<29:32,  2.27s/it][A
Training...:  94% 13126/13907 [8:18:49<28:59,  2.23s/it][A
Training...:  94% 13127/13907 [8:18:51<28:28,  2.19s/it][A
Training...:  94% 13128/13907 [8:18:53<28:01,  2.16s/it][A
Training...:  94% 13129/13907 [8:18:55<27:34,  2.13s/it][A
Training...:  94% 13130/13907 [8:18:57<27:11,  2.10s/it][A
Training...:  94% 13131/13907 [8:18:59<26:51,  2.08s/it][A
Training...:  94% 13132/13907 [8:19:01<26:24,  2.05s/it][A
Training...:  94% 13133/13907 [8:19:03<26:02,  2.02s/it][A
Training...:  94% 13134/13907 [8:19:05<25:36,  1.99s/it][A
Training...:  94% 13135/13907 [8:19:07<25:15,  1.96s/it][A
Training...:  94% 13136/13907 [8:19:09<24:45,  1.93s/it][A
Training...:  94% 13137/13907 [8:19:10<24:18,  1.89s/it][A
Training...:  94% 13138/13907 [8:19:12<23:52,  1.86s/it][A
Training...:  94% 13139/13907 [8:19:14<23:23,  1.83s/it][A
Training...:  94% 13140/13907 [8:19:16<22:56,  1.79s/it][A
Training...:  94% 13141/13907 [8:19:17<22:36,  1.77s/it][A
Training...:  94% 13142/13907 [8:19:19<22:04,  1.73s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:01:32<26:06:17, 31325.86s/it]
Training...:  94% 13142/13907 [8:19:21<22:04,  1.73s/it][A
Training...:  95% 13143/13907 [8:19:21<22:46,  1.79s/it][A
Training...:  95% 13144/13907 [8:19:23<22:13,  1.75s/it][A
Training...:  95% 13145/13907 [8:19:24<21:20,  1.68s/it][A
Training...:  95% 13146/13907 [8:19:26<20:39,  1.63s/it][A
Training...:  95% 13147/13907 [8:19:27<19:51,  1.57s/it][A
Training...:  95% 13148/13907 [8:19:28<19:07,  1.51s/it][A
Training...:  95% 13149/13907 [8:19:30<18:08,  1.44s/it][A
Training...:  95% 13150/13907 [8:19:31<16:44,  1.33s/it][A
Training...:  95% 13151/13907 [8:19:34<25:39,  2.04s/it][A
Training...:  95% 13152/13907 [8:19:38<31:17,  2.49s/it][A
Training...:  95% 13153/13907 [8:19:41<34:22,  2.73s/it][A
Training...:  95% 13154/13907 [8:19:44<35:55,  2.86s/it][A
Training...:  95% 13155/13907 [8:19:48<36:58,  2.95s/it][A
Training...:  95% 13156/13907 [8:19:51<37:17,  2.98s/it][A
Training...:  95% 13157/13907 [8:19:54<37:14,  2.98s/it][A
Training...:  95% 13158/13907 [8:19:57<36:56,  2.96s/it][A
Training...:  95% 13159/13907 [8:19:59<36:19,  2.91s/it][A
Training...:  95% 13160/13907 [8:20:02<35:37,  2.86s/it][A
Training...:  95% 13161/13907 [8:20:05<34:58,  2.81s/it][A
Training...:  95% 13162/13907 [8:20:08<34:38,  2.79s/it][A
Training...:  95% 13163/13907 [8:20:10<34:06,  2.75s/it][A
Training...:  95% 13164/13907 [8:20:13<33:18,  2.69s/it][A
Training...:  95% 13165/13907 [8:20:15<32:38,  2.64s/it][A
Training...:  95% 13166/13907 [8:20:18<32:03,  2.60s/it][A
Training...:  95% 13167/13907 [8:20:20<31:26,  2.55s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:02:34<26:06:17, 31325.86s/it]
Training...:  95% 13167/13907 [8:20:23<31:26,  2.55s/it][A
Training...:  95% 13168/13907 [8:20:23<32:20,  2.63s/it][A
Training...:  95% 13169/13907 [8:20:25<31:43,  2.58s/it][A
Training...:  95% 13170/13907 [8:20:28<30:46,  2.51s/it][A
Training...:  95% 13171/13907 [8:20:30<30:07,  2.46s/it][A
Training...:  95% 13172/13907 [8:20:32<29:24,  2.40s/it][A
Training...:  95% 13173/13907 [8:20:35<28:47,  2.35s/it][A
Training...:  95% 13174/13907 [8:20:37<28:08,  2.30s/it][A
Training...:  95% 13175/13907 [8:20:39<27:37,  2.26s/it][A
Training...:  95% 13176/13907 [8:20:41<27:08,  2.23s/it][A
Training...:  95% 13177/13907 [8:20:43<26:43,  2.20s/it][A
Training...:  95% 13178/13907 [8:20:45<26:17,  2.16s/it][A
Training...:  95% 13179/13907 [8:20:47<25:55,  2.14s/it][A
Training...:  95% 13180/13907 [8:20:49<25:31,  2.11s/it][A
Training...:  95% 13181/13907 [8:20:51<25:10,  2.08s/it][A
Training...:  95% 13182/13907 [8:20:53<24:42,  2.04s/it][A
Training...:  95% 13183/13907 [8:20:55<24:19,  2.02s/it][A
Training...:  95% 13184/13907 [8:20:57<24:00,  1.99s/it][A
Training...:  95% 13185/13907 [8:20:59<23:42,  1.97s/it][A
Training...:  95% 13186/13907 [8:21:01<23:20,  1.94s/it][A
Training...:  95% 13187/13907 [8:21:03<22:55,  1.91s/it][A
Training...:  95% 13188/13907 [8:21:05<22:32,  1.88s/it][A
Training...:  95% 13189/13907 [8:21:07<22:08,  1.85s/it][A
Training...:  95% 13190/13907 [8:21:08<21:44,  1.82s/it][A
Training...:  95% 13191/13907 [8:21:10<21:18,  1.79s/it][A
Training...:  95% 13192/13907 [8:21:12<20:51,  1.75s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:03:25<26:06:17, 31325.86s/it]
Training...:  95% 13192/13907 [8:21:14<20:51,  1.75s/it][A
Training...:  95% 13193/13907 [8:21:14<21:30,  1.81s/it][A
Training...:  95% 13194/13907 [8:21:15<21:11,  1.78s/it][A
Training...:  95% 13195/13907 [8:21:17<20:18,  1.71s/it][A
Training...:  95% 13196/13907 [8:21:18<19:49,  1.67s/it][A
Training...:  95% 13197/13907 [8:21:20<18:55,  1.60s/it][A
Training...:  95% 13198/13907 [8:21:21<17:58,  1.52s/it][A
Training...:  95% 13199/13907 [8:21:22<16:56,  1.44s/it][A
Training...:  95% 13200/13907 [8:21:24<15:37,  1.33s/it][A
Training...:  95% 13201/13907 [8:21:27<24:15,  2.06s/it][A
Training...:  95% 13202/13907 [8:21:31<29:13,  2.49s/it][A
Training...:  95% 13203/13907 [8:21:34<32:00,  2.73s/it][A
Training...:  95% 13204/13907 [8:21:37<33:25,  2.85s/it][A
Training...:  95% 13205/13907 [8:21:40<34:04,  2.91s/it][A
Training...:  95% 13206/13907 [8:21:43<34:11,  2.93s/it][A
Training...:  95% 13207/13907 [8:21:46<34:01,  2.92s/it][A
Training...:  95% 13208/13907 [8:21:49<33:39,  2.89s/it][A
Training...:  95% 13209/13907 [8:21:52<33:13,  2.86s/it][A
Training...:  95% 13210/13907 [8:21:54<32:48,  2.82s/it][A
Training...:  95% 13211/13907 [8:21:57<32:17,  2.78s/it][A
Training...:  95% 13212/13907 [8:22:00<31:49,  2.75s/it][A
Training...:  95% 13213/13907 [8:22:02<31:28,  2.72s/it][A
Training...:  95% 13214/13907 [8:22:05<30:56,  2.68s/it][A
Training...:  95% 13215/13907 [8:22:08<30:24,  2.64s/it][A
Training...:  95% 13216/13907 [8:22:10<29:51,  2.59s/it][A
Training...:  95% 13217/13907 [8:22:13<29:20,  2.55s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:04:27<26:06:17, 31325.86s/it]
Training...:  95% 13217/13907 [8:22:15<29:20,  2.55s/it][A
Training...:  95% 13218/13907 [8:22:15<30:12,  2.63s/it][A
Training...:  95% 13219/13907 [8:22:18<29:44,  2.59s/it][A
Training...:  95% 13220/13907 [8:22:20<29:03,  2.54s/it][A
Training...:  95% 13221/13907 [8:22:23<28:32,  2.50s/it][A
Training...:  95% 13222/13907 [8:22:25<28:07,  2.46s/it][A
Training...:  95% 13223/13907 [8:22:27<27:22,  2.40s/it][A
Training...:  95% 13224/13907 [8:22:30<26:39,  2.34s/it][A
Training...:  95% 13225/13907 [8:22:32<26:09,  2.30s/it][A
Training...:  95% 13226/13907 [8:22:34<25:40,  2.26s/it][A
Training...:  95% 13227/13907 [8:22:36<25:14,  2.23s/it][A
Training...:  95% 13228/13907 [8:22:38<24:46,  2.19s/it][A
Training...:  95% 13229/13907 [8:22:40<24:19,  2.15s/it][A
Training...:  95% 13230/13907 [8:22:42<23:53,  2.12s/it][A
Training...:  95% 13231/13907 [8:22:44<23:28,  2.08s/it][A
Training...:  95% 13232/13907 [8:22:46<23:03,  2.05s/it][A
Training...:  95% 13233/13907 [8:22:48<22:41,  2.02s/it][A
Training...:  95% 13234/13907 [8:22:50<22:18,  1.99s/it][A
Training...:  95% 13235/13907 [8:22:52<21:55,  1.96s/it][A
Training...:  95% 13236/13907 [8:22:54<21:30,  1.92s/it][A
Training...:  95% 13237/13907 [8:22:56<21:08,  1.89s/it][A
Training...:  95% 13238/13907 [8:22:57<20:46,  1.86s/it][A
Training...:  95% 13239/13907 [8:22:59<20:24,  1.83s/it][A
Training...:  95% 13240/13907 [8:23:01<19:59,  1.80s/it][A
Training...:  95% 13241/13907 [8:23:03<19:35,  1.76s/it][A
Training...:  95% 13242/13907 [8:23:04<19:12,  1.73s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:05:17<26:06:17, 31325.86s/it]
Training...:  95% 13242/13907 [8:23:06<19:12,  1.73s/it][A
Training...:  95% 13243/13907 [8:23:06<19:48,  1.79s/it][A
Training...:  95% 13244/13907 [8:23:08<19:15,  1.74s/it][A
Training...:  95% 13245/13907 [8:23:09<18:30,  1.68s/it][A
Training...:  95% 13246/13907 [8:23:11<17:52,  1.62s/it][A
Training...:  95% 13247/13907 [8:23:12<17:18,  1.57s/it][A
Training...:  95% 13248/13907 [8:23:14<16:33,  1.51s/it][A
Training...:  95% 13249/13907 [8:23:15<15:40,  1.43s/it][A
Training...:  95% 13250/13907 [8:23:16<14:28,  1.32s/it][A
Training...:  95% 13251/13907 [8:23:20<22:23,  2.05s/it][A
Training...:  95% 13252/13907 [8:23:23<27:08,  2.49s/it][A
Training...:  95% 13253/13907 [8:23:26<29:33,  2.71s/it][A
Training...:  95% 13254/13907 [8:23:30<30:52,  2.84s/it][A
Training...:  95% 13255/13907 [8:23:33<31:30,  2.90s/it][A
Training...:  95% 13256/13907 [8:23:36<31:43,  2.92s/it][A
Training...:  95% 13257/13907 [8:23:38<31:30,  2.91s/it][A
Training...:  95% 13258/13907 [8:23:41<31:10,  2.88s/it][A
Training...:  95% 13259/13907 [8:23:44<30:51,  2.86s/it][A
Training...:  95% 13260/13907 [8:23:47<30:41,  2.85s/it][A
Training...:  95% 13261/13907 [8:23:50<30:20,  2.82s/it][A
Training...:  95% 13262/13907 [8:23:52<29:42,  2.76s/it][A
Training...:  95% 13263/13907 [8:23:55<29:07,  2.71s/it][A
Training...:  95% 13264/13907 [8:23:57<28:32,  2.66s/it][A
Training...:  95% 13265/13907 [8:24:00<28:01,  2.62s/it][A
Training...:  95% 13266/13907 [8:24:02<27:27,  2.57s/it][A
Training...:  95% 13267/13907 [8:24:05<26:59,  2.53s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:06:19<26:06:17, 31325.86s/it]
Training...:  95% 13267/13907 [8:24:08<26:59,  2.53s/it][A
Training...:  95% 13268/13907 [8:24:08<27:53,  2.62s/it][A
Training...:  95% 13269/13907 [8:24:10<27:19,  2.57s/it][A
Training...:  95% 13270/13907 [8:24:13<26:41,  2.51s/it][A
Training...:  95% 13271/13907 [8:24:15<25:56,  2.45s/it][A
Training...:  95% 13272/13907 [8:24:17<25:10,  2.38s/it][A
Training...:  95% 13273/13907 [8:24:19<24:37,  2.33s/it][A
Training...:  95% 13274/13907 [8:24:21<24:04,  2.28s/it][A
Training...:  95% 13275/13907 [8:24:24<23:39,  2.25s/it][A
Training...:  95% 13276/13907 [8:24:26<23:17,  2.21s/it][A
Training...:  95% 13277/13907 [8:24:28<22:53,  2.18s/it][A
Training...:  95% 13278/13907 [8:24:30<22:34,  2.15s/it][A
Training...:  95% 13279/13907 [8:24:32<22:11,  2.12s/it][A
Training...:  95% 13280/13907 [8:24:34<21:50,  2.09s/it][A
Training...:  95% 13281/13907 [8:24:36<21:36,  2.07s/it][A
Training...:  96% 13282/13907 [8:24:38<21:19,  2.05s/it][A
Training...:  96% 13283/13907 [8:24:40<20:59,  2.02s/it][A
Training...:  96% 13284/13907 [8:24:42<20:37,  1.99s/it][A
Training...:  96% 13285/13907 [8:24:44<20:18,  1.96s/it][A
Training...:  96% 13286/13907 [8:24:46<19:58,  1.93s/it][A
Training...:  96% 13287/13907 [8:24:47<19:41,  1.91s/it][A
Training...:  96% 13288/13907 [8:24:49<19:21,  1.88s/it][A
Training...:  96% 13289/13907 [8:24:51<19:02,  1.85s/it][A
Training...:  96% 13290/13907 [8:24:53<18:37,  1.81s/it][A
Training...:  96% 13291/13907 [8:24:55<18:20,  1.79s/it][A
Training...:  96% 13292/13907 [8:24:56<18:07,  1.77s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:07:09<26:06:17, 31325.86s/it]
Training...:  96% 13292/13907 [8:24:58<18:07,  1.77s/it][A
Training...:  96% 13293/13907 [8:24:58<18:43,  1.83s/it][A
Training...:  96% 13294/13907 [8:25:00<18:07,  1.77s/it][A
Training...:  96% 13295/13907 [8:25:01<17:20,  1.70s/it][A
Training...:  96% 13296/13907 [8:25:03<16:31,  1.62s/it][A
Training...:  96% 13297/13907 [8:25:04<15:48,  1.56s/it][A
Training...:  96% 13298/13907 [8:25:06<15:06,  1.49s/it][A
Training...:  96% 13299/13907 [8:25:07<14:23,  1.42s/it][A
Training...:  96% 13300/13907 [8:25:08<13:18,  1.32s/it][A
Training...:  96% 13301/13907 [8:25:12<20:35,  2.04s/it][A
Training...:  96% 13302/13907 [8:25:15<24:55,  2.47s/it][A
Training...:  96% 13303/13907 [8:25:18<27:02,  2.69s/it][A
Training...:  96% 13304/13907 [8:25:21<28:09,  2.80s/it][A
Training...:  96% 13305/13907 [8:25:24<28:43,  2.86s/it][A
Training...:  96% 13306/13907 [8:25:27<28:49,  2.88s/it][A
Training...:  96% 13307/13907 [8:25:30<28:43,  2.87s/it][A
Training...:  96% 13308/13907 [8:25:33<28:26,  2.85s/it][A
Training...:  96% 13309/13907 [8:25:36<28:09,  2.82s/it][A
Training...:  96% 13310/13907 [8:25:38<27:44,  2.79s/it][A
Training...:  96% 13311/13907 [8:25:41<27:19,  2.75s/it][A
Training...:  96% 13312/13907 [8:25:44<26:49,  2.70s/it][A
Training...:  96% 13313/13907 [8:25:46<26:24,  2.67s/it][A
Training...:  96% 13314/13907 [8:25:49<25:58,  2.63s/it][A
Training...:  96% 13315/13907 [8:25:51<25:32,  2.59s/it][A
Training...:  96% 13316/13907 [8:25:54<25:07,  2.55s/it][A
Training...:  96% 13317/13907 [8:25:56<24:44,  2.52s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:08:10<26:06:17, 31325.86s/it]
Training...:  96% 13317/13907 [8:25:59<24:44,  2.52s/it][A
Training...:  96% 13318/13907 [8:25:59<25:37,  2.61s/it][A
Training...:  96% 13319/13907 [8:26:02<25:12,  2.57s/it][A
Training...:  96% 13320/13907 [8:26:04<24:28,  2.50s/it][A
Training...:  96% 13321/13907 [8:26:06<23:51,  2.44s/it][A
Training...:  96% 13322/13907 [8:26:08<23:15,  2.39s/it][A
Training...:  96% 13323/13907 [8:26:11<22:42,  2.33s/it][A
Training...:  96% 13324/13907 [8:26:13<22:16,  2.29s/it][A
Training...:  96% 13325/13907 [8:26:15<21:54,  2.26s/it][A
Training...:  96% 13326/13907 [8:26:17<21:32,  2.23s/it][A
Training...:  96% 13327/13907 [8:26:19<21:25,  2.22s/it][A
Training...:  96% 13328/13907 [8:26:21<21:02,  2.18s/it][A
Training...:  96% 13329/13907 [8:26:23<20:38,  2.14s/it][A
Training...:  96% 13330/13907 [8:26:25<20:14,  2.10s/it][A
Training...:  96% 13331/13907 [8:26:27<19:54,  2.07s/it][A
Training...:  96% 13332/13907 [8:26:29<19:31,  2.04s/it][A
Training...:  96% 13333/13907 [8:26:31<19:11,  2.01s/it][A
Training...:  96% 13334/13907 [8:26:33<18:50,  1.97s/it][A
Training...:  96% 13335/13907 [8:26:35<18:32,  1.94s/it][A
Training...:  96% 13336/13907 [8:26:37<18:12,  1.91s/it][A
Training...:  96% 13337/13907 [8:26:39<17:53,  1.88s/it][A
Training...:  96% 13338/13907 [8:26:41<17:32,  1.85s/it][A
Training...:  96% 13339/13907 [8:26:42<17:15,  1.82s/it][A
Training...:  96% 13340/13907 [8:26:44<16:53,  1.79s/it][A
Training...:  96% 13341/13907 [8:26:46<16:34,  1.76s/it][A
Training...:  96% 13342/13907 [8:26:47<16:12,  1.72s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:09:00<26:06:17, 31325.86s/it]
Training...:  96% 13342/13907 [8:26:49<16:12,  1.72s/it][A
Training...:  96% 13343/13907 [8:26:49<16:44,  1.78s/it][A
Training...:  96% 13344/13907 [8:26:51<16:13,  1.73s/it][A
Training...:  96% 13345/13907 [8:26:52<15:33,  1.66s/it][A
Training...:  96% 13346/13907 [8:26:54<14:52,  1.59s/it][A
Training...:  96% 13347/13907 [8:26:55<14:14,  1.53s/it][A
Training...:  96% 13348/13907 [8:26:57<13:35,  1.46s/it][A
Training...:  96% 13349/13907 [8:26:58<12:53,  1.39s/it][A
Training...:  96% 13350/13907 [8:26:59<11:54,  1.28s/it][A
Training...:  96% 13351/13907 [8:27:02<18:25,  1.99s/it][A
Training...:  96% 13352/13907 [8:27:06<22:27,  2.43s/it][A
Training...:  96% 13353/13907 [8:27:09<24:37,  2.67s/it][A
Training...:  96% 13354/13907 [8:27:12<25:43,  2.79s/it][A
Training...:  96% 13355/13907 [8:27:15<26:19,  2.86s/it][A
Training...:  96% 13356/13907 [8:27:18<26:31,  2.89s/it][A
Training...:  96% 13357/13907 [8:27:21<26:25,  2.88s/it][A
Training...:  96% 13358/13907 [8:27:24<26:11,  2.86s/it][A
Training...:  96% 13359/13907 [8:27:27<25:52,  2.83s/it][A
Training...:  96% 13360/13907 [8:27:29<25:29,  2.80s/it][A
Training...:  96% 13361/13907 [8:27:32<25:01,  2.75s/it][A
Training...:  96% 13362/13907 [8:27:35<24:34,  2.71s/it][A
Training...:  96% 13363/13907 [8:27:37<24:07,  2.66s/it][A
Training...:  96% 13364/13907 [8:27:40<23:43,  2.62s/it][A
Training...:  96% 13365/13907 [8:27:42<23:27,  2.60s/it][A
Training...:  96% 13366/13907 [8:27:45<23:01,  2.55s/it][A
Training...:  96% 13367/13907 [8:27:47<22:43,  2.52s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:10:01<26:06:17, 31325.86s/it]
Training...:  96% 13367/13907 [8:27:50<22:43,  2.52s/it][A
Training...:  96% 13368/13907 [8:27:50<23:35,  2.63s/it][A
Training...:  96% 13369/13907 [8:27:52<23:07,  2.58s/it][A
Training...:  96% 13370/13907 [8:27:55<22:46,  2.55s/it][A
Training...:  96% 13371/13907 [8:27:57<22:20,  2.50s/it][A
Training...:  96% 13372/13907 [8:28:00<21:39,  2.43s/it][A
Training...:  96% 13373/13907 [8:28:02<21:09,  2.38s/it][A
Training...:  96% 13374/13907 [8:28:04<20:38,  2.32s/it][A
Training...:  96% 13375/13907 [8:28:06<20:23,  2.30s/it][A
Training...:  96% 13376/13907 [8:28:08<20:08,  2.28s/it][A
Training...:  96% 13377/13907 [8:28:11<19:45,  2.24s/it][A
Training...:  96% 13378/13907 [8:28:13<19:27,  2.21s/it][A
Training...:  96% 13379/13907 [8:28:15<19:10,  2.18s/it][A
Training...:  96% 13380/13907 [8:28:17<18:46,  2.14s/it][A
Training...:  96% 13381/13907 [8:28:19<18:22,  2.10s/it][A
Training...:  96% 13382/13907 [8:28:21<18:00,  2.06s/it][A
Training...:  96% 13383/13907 [8:28:23<17:38,  2.02s/it][A
Training...:  96% 13384/13907 [8:28:25<17:18,  1.99s/it][A
Training...:  96% 13385/13907 [8:28:27<17:01,  1.96s/it][A
Training...:  96% 13386/13907 [8:28:28<16:43,  1.93s/it][A
Training...:  96% 13387/13907 [8:28:30<16:25,  1.89s/it][A
Training...:  96% 13388/13907 [8:28:32<16:07,  1.86s/it][A
Training...:  96% 13389/13907 [8:28:34<15:49,  1.83s/it][A
Training...:  96% 13390/13907 [8:28:36<15:27,  1.79s/it][A
Training...:  96% 13391/13907 [8:28:37<15:06,  1.76s/it][A
Training...:  96% 13392/13907 [8:28:39<14:46,  1.72s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:10:52<26:06:17, 31325.86s/it]
Training...:  96% 13392/13907 [8:28:41<14:46,  1.72s/it][A
Training...:  96% 13393/13907 [8:28:41<15:14,  1.78s/it][A
Training...:  96% 13394/13907 [8:28:42<14:53,  1.74s/it][A
Training...:  96% 13395/13907 [8:28:44<14:14,  1.67s/it][A
Training...:  96% 13396/13907 [8:28:45<13:40,  1.61s/it][A
Training...:  96% 13397/13907 [8:28:47<13:07,  1.54s/it][A
Training...:  96% 13398/13907 [8:28:48<12:35,  1.48s/it][A
Training...:  96% 13399/13907 [8:28:49<11:56,  1.41s/it][A
Training...:  96% 13400/13907 [8:28:50<11:02,  1.31s/it][A
Training...:  96% 13401/13907 [8:28:54<17:01,  2.02s/it][A
Training...:  96% 13402/13907 [8:28:58<20:45,  2.47s/it][A
Training...:  96% 13403/13907 [8:29:01<22:52,  2.72s/it][A
Training...:  96% 13404/13907 [8:29:04<24:03,  2.87s/it][A
Training...:  96% 13405/13907 [8:29:07<24:32,  2.93s/it][A
Training...:  96% 13406/13907 [8:29:10<24:47,  2.97s/it][A
Training...:  96% 13407/13907 [8:29:13<24:40,  2.96s/it][A
Training...:  96% 13408/13907 [8:29:16<24:22,  2.93s/it][A
Training...:  96% 13409/13907 [8:29:19<24:04,  2.90s/it][A
Training...:  96% 13410/13907 [8:29:22<23:35,  2.85s/it][A
Training...:  96% 13411/13907 [8:29:24<23:31,  2.84s/it][A
Training...:  96% 13412/13907 [8:29:27<23:07,  2.80s/it][A
Training...:  96% 13413/13907 [8:29:30<22:41,  2.76s/it][A
Training...:  96% 13414/13907 [8:29:32<22:12,  2.70s/it][A
Training...:  96% 13415/13907 [8:29:35<21:50,  2.66s/it][A
Training...:  96% 13416/13907 [8:29:37<21:21,  2.61s/it][A
Training...:  96% 13417/13907 [8:29:40<20:59,  2.57s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:11:54<26:06:17, 31325.86s/it]
Training...:  96% 13417/13907 [8:29:43<20:59,  2.57s/it][A
Training...:  96% 13418/13907 [8:29:43<21:41,  2.66s/it][A
Training...:  96% 13419/13907 [8:29:45<21:14,  2.61s/it][A
Training...:  96% 13420/13907 [8:29:48<20:32,  2.53s/it][A
Training...:  97% 13421/13907 [8:29:50<20:00,  2.47s/it][A
Training...:  97% 13422/13907 [8:29:52<19:26,  2.40s/it][A
Training...:  97% 13423/13907 [8:29:54<19:00,  2.36s/it][A
Training...:  97% 13424/13907 [8:29:57<18:38,  2.32s/it][A
Training...:  97% 13425/13907 [8:29:59<18:17,  2.28s/it][A
Training...:  97% 13426/13907 [8:30:01<18:03,  2.25s/it][A
Training...:  97% 13427/13907 [8:30:03<17:48,  2.23s/it][A
Training...:  97% 13428/13907 [8:30:05<17:28,  2.19s/it][A
Training...:  97% 13429/13907 [8:30:07<17:14,  2.17s/it][A
Training...:  97% 13430/13907 [8:30:09<16:56,  2.13s/it][A
Training...:  97% 13431/13907 [8:30:12<16:41,  2.10s/it][A
Training...:  97% 13432/13907 [8:30:14<16:22,  2.07s/it][A
Training...:  97% 13433/13907 [8:30:15<16:06,  2.04s/it][A
Training...:  97% 13434/13907 [8:30:17<15:55,  2.02s/it][A
Training...:  97% 13435/13907 [8:30:19<15:45,  2.00s/it][A
Training...:  97% 13436/13907 [8:30:21<15:29,  1.97s/it][A
Training...:  97% 13437/13907 [8:30:23<15:10,  1.94s/it][A
Training...:  97% 13438/13907 [8:30:25<14:47,  1.89s/it][A
Training...:  97% 13439/13907 [8:30:27<14:33,  1.87s/it][A
Training...:  97% 13440/13907 [8:30:29<14:16,  1.83s/it][A
Training...:  97% 13441/13907 [8:30:30<13:58,  1.80s/it][A
Training...:  97% 13442/13907 [8:30:32<13:38,  1.76s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:12:45<26:06:17, 31325.86s/it]
Training...:  97% 13442/13907 [8:30:34<13:38,  1.76s/it][A
Training...:  97% 13443/13907 [8:30:34<14:01,  1.81s/it][A
Training...:  97% 13444/13907 [8:30:36<13:37,  1.77s/it][A
Training...:  97% 13445/13907 [8:30:37<13:04,  1.70s/it][A
Training...:  97% 13446/13907 [8:30:39<12:33,  1.63s/it][A
Training...:  97% 13447/13907 [8:30:40<12:07,  1.58s/it][A
Training...:  97% 13448/13907 [8:30:41<11:33,  1.51s/it][A
Training...:  97% 13449/13907 [8:30:43<11:01,  1.44s/it][A
Training...:  97% 13450/13907 [8:30:44<10:09,  1.33s/it][A
Training...:  97% 13451/13907 [8:30:48<15:49,  2.08s/it][A
Training...:  97% 13452/13907 [8:30:51<19:06,  2.52s/it][A
Training...:  97% 13453/13907 [8:30:54<20:47,  2.75s/it][A
Training...:  97% 13454/13907 [8:30:58<21:44,  2.88s/it][A
Training...:  97% 13455/13907 [8:31:01<22:18,  2.96s/it][A
Training...:  97% 13456/13907 [8:31:04<22:25,  2.98s/it][A
Training...:  97% 13457/13907 [8:31:07<22:24,  2.99s/it][A
Training...:  97% 13458/13907 [8:31:10<22:10,  2.96s/it][A
Training...:  97% 13459/13907 [8:31:13<21:55,  2.94s/it][A
Training...:  97% 13460/13907 [8:31:15<21:38,  2.91s/it][A
Training...:  97% 13461/13907 [8:31:18<21:18,  2.87s/it][A
Training...:  97% 13462/13907 [8:31:21<20:56,  2.82s/it][A
Training...:  97% 13463/13907 [8:31:24<20:36,  2.78s/it][A
Training...:  97% 13464/13907 [8:31:26<20:18,  2.75s/it][A
Training...:  97% 13465/13907 [8:31:29<19:55,  2.71s/it][A
Training...:  97% 13466/13907 [8:31:31<19:34,  2.66s/it][A
Training...:  97% 13467/13907 [8:31:34<19:16,  2.63s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:13:48<26:06:17, 31325.86s/it]
Training...:  97% 13467/13907 [8:31:37<19:16,  2.63s/it][A
Training...:  97% 13468/13907 [8:31:37<19:47,  2.70s/it][A
Training...:  97% 13469/13907 [8:31:39<19:09,  2.62s/it][A
Training...:  97% 13470/13907 [8:31:42<18:31,  2.54s/it][A
Training...:  97% 13471/13907 [8:31:44<18:03,  2.48s/it][A
Training...:  97% 13472/13907 [8:31:46<17:34,  2.42s/it][A
Training...:  97% 13473/13907 [8:31:48<17:09,  2.37s/it][A
Training...:  97% 13474/13907 [8:31:51<16:56,  2.35s/it][A
Training...:  97% 13475/13907 [8:31:53<16:40,  2.32s/it][A
Training...:  97% 13476/13907 [8:31:55<16:20,  2.27s/it][A
Training...:  97% 13477/13907 [8:31:57<16:01,  2.24s/it][A
Training...:  97% 13478/13907 [8:31:59<15:43,  2.20s/it][A
Training...:  97% 13479/13907 [8:32:02<15:24,  2.16s/it][A
Training...:  97% 13480/13907 [8:32:04<15:07,  2.12s/it][A
Training...:  97% 13481/13907 [8:32:06<14:56,  2.10s/it][A
Training...:  97% 13482/13907 [8:32:08<14:40,  2.07s/it][A
Training...:  97% 13483/13907 [8:32:10<14:23,  2.04s/it][A
Training...:  97% 13484/13907 [8:32:11<14:06,  2.00s/it][A
Training...:  97% 13485/13907 [8:32:13<13:48,  1.96s/it][A
Training...:  97% 13486/13907 [8:32:15<13:34,  1.94s/it][Awandb: Network error (ReadTimeout), entering retry loop.

Training...:  97% 13487/13907 [8:32:17<13:20,  1.90s/it][A
Training...:  97% 13488/13907 [8:32:19<13:05,  1.87s/it][A
Training...:  97% 13489/13907 [8:32:21<12:47,  1.84s/it][A
Training...:  97% 13490/13907 [8:32:22<12:30,  1.80s/it][A
Training...:  97% 13491/13907 [8:32:24<12:14,  1.77s/it][A
Training...:  97% 13492/13907 [8:32:26<11:55,  1.72s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:14:39<26:06:17, 31325.86s/it]
Training...:  97% 13492/13907 [8:32:28<11:55,  1.72s/it][A
Training...:  97% 13493/13907 [8:32:28<12:18,  1.78s/it][A
Training...:  97% 13494/13907 [8:32:29<11:58,  1.74s/it][A
Training...:  97% 13495/13907 [8:32:31<11:28,  1.67s/it][A
Training...:  97% 13496/13907 [8:32:32<11:01,  1.61s/it][A
Training...:  97% 13497/13907 [8:32:34<10:33,  1.54s/it][A
Training...:  97% 13498/13907 [8:32:35<10:08,  1.49s/it][A
Training...:  97% 13499/13907 [8:32:36<09:37,  1.42s/it][A
Training...:  97% 13500/13907 [8:32:37<08:54,  1.31s/it][A
Training...:  97% 13501/13907 [8:32:41<13:54,  2.06s/it][A
Training...:  97% 13502/13907 [8:32:45<16:52,  2.50s/it][A
Training...:  97% 13503/13907 [8:32:48<18:27,  2.74s/it][A
Training...:  97% 13504/13907 [8:32:51<19:13,  2.86s/it][A
Training...:  97% 13505/13907 [8:32:54<19:40,  2.94s/it][A
Training...:  97% 13506/13907 [8:32:57<20:01,  3.00s/it][A
Training...:  97% 13507/13907 [8:33:00<19:51,  2.98s/it][A
Training...:  97% 13508/13907 [8:33:03<19:28,  2.93s/it][A
Training...:  97% 13509/13907 [8:33:06<19:04,  2.88s/it][A
Training...:  97% 13510/13907 [8:33:08<18:38,  2.82s/it][A
Training...:  97% 13511/13907 [8:33:11<18:19,  2.78s/it][A
Training...:  97% 13512/13907 [8:33:14<17:58,  2.73s/it][A
Training...:  97% 13513/13907 [8:33:16<17:45,  2.70s/it][A
Training...:  97% 13514/13907 [8:33:19<17:27,  2.67s/it][A
Training...:  97% 13515/13907 [8:33:22<17:09,  2.63s/it][A
Training...:  97% 13516/13907 [8:33:24<16:48,  2.58s/it][A
Training...:  97% 13517/13907 [8:33:26<16:27,  2.53s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:15:40<26:06:17, 31325.86s/it]
Training...:  97% 13517/13907 [8:33:29<16:27,  2.53s/it][A
Training...:  97% 13518/13907 [8:33:29<16:56,  2.61s/it][A
Training...:  97% 13519/13907 [8:33:32<16:36,  2.57s/it][A
Training...:  97% 13520/13907 [8:33:34<16:06,  2.50s/it][A
Training...:  97% 13521/13907 [8:33:36<15:44,  2.45s/it][A
Training...:  97% 13522/13907 [8:33:39<15:29,  2.41s/it][A
Training...:  97% 13523/13907 [8:33:41<15:07,  2.36s/it][A
Training...:  97% 13524/13907 [8:33:43<14:50,  2.32s/it][A
Training...:  97% 13525/13907 [8:33:45<14:31,  2.28s/it][A
Training...:  97% 13526/13907 [8:33:47<14:11,  2.23s/it][A
Training...:  97% 13527/13907 [8:33:50<14:02,  2.22s/it][A
Training...:  97% 13528/13907 [8:33:52<13:47,  2.18s/it][A
Training...:  97% 13529/13907 [8:33:54<13:31,  2.15s/it][A
Training...:  97% 13530/13907 [8:33:56<13:16,  2.11s/it][A
Training...:  97% 13531/13907 [8:33:58<12:58,  2.07s/it][A
Training...:  97% 13532/13907 [8:34:00<12:45,  2.04s/it][A
Training...:  97% 13533/13907 [8:34:02<12:32,  2.01s/it][A
Training...:  97% 13534/13907 [8:34:04<12:18,  1.98s/it][A
Training...:  97% 13535/13907 [8:34:06<12:07,  1.96s/it][A
Training...:  97% 13536/13907 [8:34:07<11:51,  1.92s/it][A
Training...:  97% 13537/13907 [8:34:09<11:39,  1.89s/it][A
Training...:  97% 13538/13907 [8:34:11<11:29,  1.87s/it][A
Training...:  97% 13539/13907 [8:34:13<11:16,  1.84s/it][A
Training...:  97% 13540/13907 [8:34:14<11:01,  1.80s/it][A
Training...:  97% 13541/13907 [8:34:16<10:47,  1.77s/it][A
Training...:  97% 13542/13907 [8:34:18<10:33,  1.74s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:16:31<26:06:17, 31325.86s/it]
Training...:  97% 13542/13907 [8:34:20<10:33,  1.74s/it][A
Training...:  97% 13543/13907 [8:34:20<10:53,  1.80s/it][A
Training...:  97% 13544/13907 [8:34:21<10:37,  1.76s/it][A
Training...:  97% 13545/13907 [8:34:23<10:06,  1.68s/it][A
Training...:  97% 13546/13907 [8:34:24<09:43,  1.62s/it][A
Training...:  97% 13547/13907 [8:34:26<09:17,  1.55s/it][A
Training...:  97% 13548/13907 [8:34:27<08:52,  1.48s/it][A
Training...:  97% 13549/13907 [8:34:28<08:24,  1.41s/it][A
Training...:  97% 13550/13907 [8:34:29<07:44,  1.30s/it][A
Training...:  97% 13551/13907 [8:34:33<12:14,  2.06s/it][A
Training...:  97% 13552/13907 [8:34:37<14:48,  2.50s/it][A
Training...:  97% 13553/13907 [8:34:40<16:10,  2.74s/it][A
Training...:  97% 13554/13907 [8:34:43<16:50,  2.86s/it][A
Training...:  97% 13555/13907 [8:34:46<17:09,  2.93s/it][A
Training...:  97% 13556/13907 [8:34:49<17:11,  2.94s/it][A
Training...:  97% 13557/13907 [8:34:52<17:06,  2.93s/it][A
Training...:  97% 13558/13907 [8:34:55<16:55,  2.91s/it][A
Training...:  97% 13559/13907 [8:34:58<16:39,  2.87s/it][A
Training...:  98% 13560/13907 [8:35:01<16:21,  2.83s/it][A
Training...:  98% 13561/13907 [8:35:03<16:01,  2.78s/it][A
Training...:  98% 13562/13907 [8:35:06<15:46,  2.74s/it][A
Training...:  98% 13563/13907 [8:35:08<15:30,  2.70s/it][A
Training...:  98% 13564/13907 [8:35:11<15:15,  2.67s/it][A
Training...:  98% 13565/13907 [8:35:14<14:59,  2.63s/it][A
Training...:  98% 13566/13907 [8:35:16<14:43,  2.59s/it][A
Training...:  98% 13567/13907 [8:35:19<14:33,  2.57s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:17:33<26:06:17, 31325.86s/it]
Training...:  98% 13567/13907 [8:35:21<14:33,  2.57s/it][A
Training...:  98% 13568/13907 [8:35:21<14:56,  2.64s/it][A
Training...:  98% 13569/13907 [8:35:24<14:39,  2.60s/it][A
Training...:  98% 13570/13907 [8:35:26<14:16,  2.54s/it][A
Training...:  98% 13571/13907 [8:35:29<13:51,  2.47s/it][A
Training...:  98% 13572/13907 [8:35:31<13:29,  2.42s/it][A
Training...:  98% 13573/13907 [8:35:33<13:07,  2.36s/it][A
Training...:  98% 13574/13907 [8:35:35<12:50,  2.31s/it][A
Training...:  98% 13575/13907 [8:35:38<12:35,  2.27s/it][A
Training...:  98% 13576/13907 [8:35:40<12:20,  2.24s/it][A
Training...:  98% 13577/13907 [8:35:42<12:10,  2.21s/it][A
Training...:  98% 13578/13907 [8:35:44<11:56,  2.18s/it][A
Training...:  98% 13579/13907 [8:35:46<11:47,  2.16s/it][A
Training...:  98% 13580/13907 [8:35:48<11:35,  2.13s/it][A
Training...:  98% 13581/13907 [8:35:50<11:22,  2.09s/it][A
Training...:  98% 13582/13907 [8:35:52<11:12,  2.07s/it][A
Training...:  98% 13583/13907 [8:35:54<10:57,  2.03s/it][A
Training...:  98% 13584/13907 [8:35:56<10:45,  2.00s/it][A
Training...:  98% 13585/13907 [8:35:58<10:33,  1.97s/it][A
Training...:  98% 13586/13907 [8:36:00<10:21,  1.94s/it][A
Training...:  98% 13587/13907 [8:36:02<10:07,  1.90s/it][A
Training...:  98% 13588/13907 [8:36:03<09:52,  1.86s/it][A
Training...:  98% 13589/13907 [8:36:05<09:39,  1.82s/it][A
Training...:  98% 13590/13907 [8:36:07<09:25,  1.78s/it][A
Training...:  98% 13591/13907 [8:36:08<09:11,  1.75s/it][A
Training...:  98% 13592/13907 [8:36:10<08:58,  1.71s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:18:23<26:06:17, 31325.86s/it]
Training...:  98% 13592/13907 [8:36:12<08:58,  1.71s/it][A
Training...:  98% 13593/13907 [8:36:12<09:14,  1.76s/it][A
Training...:  98% 13594/13907 [8:36:14<08:58,  1.72s/it][A
Training...:  98% 13595/13907 [8:36:15<08:35,  1.65s/it][A
Training...:  98% 13596/13907 [8:36:17<08:15,  1.59s/it][A
Training...:  98% 13597/13907 [8:36:18<07:55,  1.53s/it][A
Training...:  98% 13598/13907 [8:36:19<07:33,  1.47s/it][A
Training...:  98% 13599/13907 [8:36:20<07:09,  1.39s/it][A
Training...:  98% 13600/13907 [8:36:21<06:36,  1.29s/it][A
Training...:  98% 13601/13907 [8:36:25<10:22,  2.03s/it][A
Training...:  98% 13602/13907 [8:36:29<12:38,  2.49s/it][A
Training...:  98% 13603/13907 [8:36:32<13:52,  2.74s/it][A
Training...:  98% 13604/13907 [8:36:35<14:26,  2.86s/it][A
Training...:  98% 13605/13907 [8:36:38<14:40,  2.91s/it][A
Training...:  98% 13606/13907 [8:36:41<14:42,  2.93s/it][A
Training...:  98% 13607/13907 [8:36:44<14:35,  2.92s/it][A
Training...:  98% 13608/13907 [8:36:47<14:25,  2.90s/it][A
Training...:  98% 13609/13907 [8:36:50<14:17,  2.88s/it][A
Training...:  98% 13610/13907 [8:36:53<13:59,  2.83s/it][A
Training...:  98% 13611/13907 [8:36:55<13:47,  2.80s/it][A
Training...:  98% 13612/13907 [8:36:58<13:35,  2.76s/it][A
Training...:  98% 13613/13907 [8:37:01<13:19,  2.72s/it][A
Training...:  98% 13614/13907 [8:37:03<13:05,  2.68s/it][A
Training...:  98% 13615/13907 [8:37:06<12:50,  2.64s/it][A
Training...:  98% 13616/13907 [8:37:08<12:34,  2.59s/it][A
Training...:  98% 13617/13907 [8:37:11<12:20,  2.55s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:19:25<26:06:17, 31325.86s/it]
Training...:  98% 13617/13907 [8:37:14<12:20,  2.55s/it][A
Training...:  98% 13618/13907 [8:37:14<12:50,  2.67s/it][A
Training...:  98% 13619/13907 [8:37:16<12:36,  2.63s/it][A
Training...:  98% 13620/13907 [8:37:19<12:16,  2.57s/it][A
Training...:  98% 13621/13907 [8:37:21<11:54,  2.50s/it][A
Training...:  98% 13622/13907 [8:37:23<11:34,  2.44s/it][A
Training...:  98% 13623/13907 [8:37:25<11:13,  2.37s/it][A
Training...:  98% 13624/13907 [8:37:28<10:54,  2.31s/it][A
Training...:  98% 13625/13907 [8:37:30<10:37,  2.26s/it][A
Training...:  98% 13626/13907 [8:37:32<10:23,  2.22s/it][A
Training...:  98% 13627/13907 [8:37:34<10:10,  2.18s/it][A
Training...:  98% 13628/13907 [8:37:36<09:58,  2.15s/it][A
Training...:  98% 13629/13907 [8:37:38<09:49,  2.12s/it][A
Training...:  98% 13630/13907 [8:37:40<09:38,  2.09s/it][A
Training...:  98% 13631/13907 [8:37:42<09:27,  2.06s/it][A
Training...:  98% 13632/13907 [8:37:44<09:18,  2.03s/it][A
Training...:  98% 13633/13907 [8:37:46<09:09,  2.01s/it][A
Training...:  98% 13634/13907 [8:37:48<08:59,  1.98s/it][A
Training...:  98% 13635/13907 [8:37:50<08:49,  1.95s/it][A
Training...:  98% 13636/13907 [8:37:52<08:40,  1.92s/it][A
Training...:  98% 13637/13907 [8:37:53<08:29,  1.89s/it][A
Training...:  98% 13638/13907 [8:37:55<08:21,  1.87s/it][A
Training...:  98% 13639/13907 [8:37:57<08:12,  1.84s/it][A
Training...:  98% 13640/13907 [8:37:59<08:01,  1.80s/it][A
Training...:  98% 13641/13907 [8:38:00<07:52,  1.78s/it][A
Training...:  98% 13642/13907 [8:38:02<07:41,  1.74s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:20:15<26:06:17, 31325.86s/it]
Training...:  98% 13642/13907 [8:38:04<07:41,  1.74s/it][A
Training...:  98% 13643/13907 [8:38:04<07:54,  1.80s/it][A
Training...:  98% 13644/13907 [8:38:06<07:40,  1.75s/it][A
Training...:  98% 13645/13907 [8:38:07<07:23,  1.69s/it][A
Training...:  98% 13646/13907 [8:38:09<07:03,  1.62s/it][A
Training...:  98% 13647/13907 [8:38:10<06:43,  1.55s/it][A
Training...:  98% 13648/13907 [8:38:11<06:26,  1.49s/it][A
Training...:  98% 13649/13907 [8:38:13<06:05,  1.42s/it][A
Training...:  98% 13650/13907 [8:38:14<05:38,  1.32s/it][A
Training...:  98% 13651/13907 [8:38:17<08:42,  2.04s/it][A
Training...:  98% 13652/13907 [8:38:21<10:33,  2.48s/it][A
Training...:  98% 13653/13907 [8:38:24<11:31,  2.72s/it][A
Training...:  98% 13654/13907 [8:38:27<12:02,  2.86s/it][A
Training...:  98% 13655/13907 [8:38:31<12:16,  2.92s/it][A
Training...:  98% 13656/13907 [8:38:34<12:17,  2.94s/it][A
Training...:  98% 13657/13907 [8:38:37<12:22,  2.97s/it][A
Training...:  98% 13658/13907 [8:38:39<12:16,  2.96s/it][A
Training...:  98% 13659/13907 [8:38:42<12:01,  2.91s/it][A
Training...:  98% 13660/13907 [8:38:45<11:44,  2.85s/it][A
Training...:  98% 13661/13907 [8:38:48<11:28,  2.80s/it][A
Training...:  98% 13662/13907 [8:38:50<11:15,  2.76s/it][A
Training...:  98% 13663/13907 [8:38:53<11:02,  2.71s/it][A
Training...:  98% 13664/13907 [8:38:55<10:47,  2.66s/it][A
Training...:  98% 13665/13907 [8:38:58<10:33,  2.62s/it][A
Training...:  98% 13666/13907 [8:39:00<10:20,  2.58s/it][A
Training...:  98% 13667/13907 [8:39:03<10:07,  2.53s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:21:17<26:06:17, 31325.86s/it]
Training...:  98% 13667/13907 [8:39:06<10:07,  2.53s/it][A
Training...:  98% 13668/13907 [8:39:06<10:25,  2.62s/it][A
Training...:  98% 13669/13907 [8:39:08<10:10,  2.57s/it][A
Training...:  98% 13670/13907 [8:39:11<09:53,  2.51s/it][A
Training...:  98% 13671/13907 [8:39:13<09:37,  2.45s/it][A
Training...:  98% 13672/13907 [8:39:15<09:25,  2.41s/it][A
Training...:  98% 13673/13907 [8:39:17<09:14,  2.37s/it][A
Training...:  98% 13674/13907 [8:39:20<09:01,  2.32s/it][A
Training...:  98% 13675/13907 [8:39:22<08:51,  2.29s/it][A
Training...:  98% 13676/13907 [8:39:24<08:41,  2.26s/it][A
Training...:  98% 13677/13907 [8:39:26<08:31,  2.23s/it][A
Training...:  98% 13678/13907 [8:39:28<08:22,  2.19s/it][A
Training...:  98% 13679/13907 [8:39:30<08:13,  2.16s/it][A
Training...:  98% 13680/13907 [8:39:32<08:04,  2.13s/it][A
Training...:  98% 13681/13907 [8:39:35<07:56,  2.11s/it][A
Training...:  98% 13682/13907 [8:39:37<07:48,  2.08s/it][A
Training...:  98% 13683/13907 [8:39:39<07:38,  2.05s/it][A
Training...:  98% 13684/13907 [8:39:40<07:27,  2.01s/it][A
Training...:  98% 13685/13907 [8:39:42<07:19,  1.98s/it][A
Training...:  98% 13686/13907 [8:39:44<07:09,  1.94s/it][A
Training...:  98% 13687/13907 [8:39:46<06:59,  1.91s/it][A
Training...:  98% 13688/13907 [8:39:48<06:52,  1.88s/it][A
Training...:  98% 13689/13907 [8:39:50<06:43,  1.85s/it][A
Training...:  98% 13690/13907 [8:39:51<06:34,  1.82s/it][A
Training...:  98% 13691/13907 [8:39:53<06:25,  1.79s/it][A
Training...:  98% 13692/13907 [8:39:55<06:16,  1.75s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:22:08<26:06:17, 31325.86s/it]
Training...:  98% 13692/13907 [8:39:57<06:16,  1.75s/it][A
Training...:  98% 13693/13907 [8:39:57<06:26,  1.81s/it][A
Training...:  98% 13694/13907 [8:39:58<06:15,  1.76s/it][A
Training...:  98% 13695/13907 [8:40:00<05:59,  1.69s/it][A
Training...:  98% 13696/13907 [8:40:01<05:43,  1.63s/it][A
Training...:  98% 13697/13907 [8:40:03<05:28,  1.56s/it][A
Training...:  98% 13698/13907 [8:40:04<05:11,  1.49s/it][A
Training...:  99% 13699/13907 [8:40:05<04:55,  1.42s/it][A
Training...:  99% 13700/13907 [8:40:06<04:33,  1.32s/it][A
Training...:  99% 13701/13907 [8:40:10<06:58,  2.03s/it][A
Training...:  99% 13702/13907 [8:40:14<08:21,  2.45s/it][A
Training...:  99% 13703/13907 [8:40:17<09:13,  2.71s/it][A
Training...:  99% 13704/13907 [8:40:20<09:36,  2.84s/it][A
Training...:  99% 13705/13907 [8:40:23<09:47,  2.91s/it][A
Training...:  99% 13706/13907 [8:40:26<09:46,  2.92s/it][A
Training...:  99% 13707/13907 [8:40:29<09:41,  2.91s/it][A
Training...:  99% 13708/13907 [8:40:32<09:33,  2.88s/it][A
Training...:  99% 13709/13907 [8:40:34<09:24,  2.85s/it][A
Training...:  99% 13710/13907 [8:40:37<09:15,  2.82s/it][A
Training...:  99% 13711/13907 [8:40:40<09:04,  2.78s/it][A
Training...:  99% 13712/13907 [8:40:43<08:52,  2.73s/it][A
Training...:  99% 13713/13907 [8:40:45<08:41,  2.69s/it][A
Training...:  99% 13714/13907 [8:40:48<08:30,  2.64s/it][A
Training...:  99% 13715/13907 [8:40:50<08:19,  2.60s/it][A
Training...:  99% 13716/13907 [8:40:53<08:08,  2.56s/it][A
Training...:  99% 13717/13907 [8:40:55<07:59,  2.52s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:23:09<26:06:17, 31325.86s/it]
Training...:  99% 13717/13907 [8:40:58<07:59,  2.52s/it][A
Training...:  99% 13718/13907 [8:40:58<08:13,  2.61s/it][A
Training...:  99% 13719/13907 [8:41:00<08:02,  2.56s/it][A
Training...:  99% 13720/13907 [8:41:03<07:48,  2.50s/it][A
Training...:  99% 13721/13907 [8:41:05<07:35,  2.45s/it][A
Training...:  99% 13722/13907 [8:41:07<07:24,  2.41s/it][A
Training...:  99% 13723/13907 [8:41:10<07:15,  2.36s/it][A
Training...:  99% 13724/13907 [8:41:12<07:03,  2.31s/it][A
Training...:  99% 13725/13907 [8:41:14<06:53,  2.27s/it][A
Training...:  99% 13726/13907 [8:41:16<06:44,  2.24s/it][A
Training...:  99% 13727/13907 [8:41:18<06:36,  2.20s/it][A
Training...:  99% 13728/13907 [8:41:20<06:28,  2.17s/it][A
Training...:  99% 13729/13907 [8:41:22<06:22,  2.15s/it][A
Training...:  99% 13730/13907 [8:41:25<06:18,  2.14s/it][A
Training...:  99% 13731/13907 [8:41:27<06:10,  2.11s/it][A
Training...:  99% 13732/13907 [8:41:29<06:01,  2.06s/it][A
Training...:  99% 13733/13907 [8:41:30<05:52,  2.03s/it][A
Training...:  99% 13734/13907 [8:41:32<05:44,  1.99s/it][A
Training...:  99% 13735/13907 [8:41:34<05:36,  1.95s/it][A
Training...:  99% 13736/13907 [8:41:36<05:29,  1.93s/it][A
Training...:  99% 13737/13907 [8:41:38<05:22,  1.90s/it][A
Training...:  99% 13738/13907 [8:41:40<05:14,  1.86s/it][A
Training...:  99% 13739/13907 [8:41:41<05:07,  1.83s/it][A
Training...:  99% 13740/13907 [8:41:43<05:00,  1.80s/it][A
Training...:  99% 13741/13907 [8:41:45<04:53,  1.77s/it][A
Training...:  99% 13742/13907 [8:41:47<04:45,  1.73s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:24:00<26:06:17, 31325.86s/it]
Training...:  99% 13742/13907 [8:41:48<04:45,  1.73s/it][A
Training...:  99% 13743/13907 [8:41:48<04:53,  1.79s/it][A
Training...:  99% 13744/13907 [8:41:50<04:45,  1.75s/it][A
Training...:  99% 13745/13907 [8:41:52<04:32,  1.68s/it][A
Training...:  99% 13746/13907 [8:41:53<04:19,  1.61s/it][A
Training...:  99% 13747/13907 [8:41:54<04:06,  1.54s/it][A
Training...:  99% 13748/13907 [8:41:56<03:54,  1.47s/it][A
Training...:  99% 13749/13907 [8:41:57<03:40,  1.40s/it][A
Training...:  99% 13750/13907 [8:41:58<03:23,  1.29s/it][A
Training...:  99% 13751/13907 [8:42:02<05:13,  2.01s/it][A
Training...:  99% 13752/13907 [8:42:05<06:18,  2.44s/it][A
Training...:  99% 13753/13907 [8:42:08<06:55,  2.70s/it][A
Training...:  99% 13754/13907 [8:42:12<07:15,  2.85s/it][A
Training...:  99% 13755/13907 [8:42:15<07:24,  2.93s/it][A
Training...:  99% 13756/13907 [8:42:18<07:24,  2.94s/it][A
Training...:  99% 13757/13907 [8:42:21<07:22,  2.95s/it][A
Training...:  99% 13758/13907 [8:42:24<07:15,  2.92s/it][A
Training...:  99% 13759/13907 [8:42:26<07:07,  2.89s/it][A
Training...:  99% 13760/13907 [8:42:29<06:57,  2.84s/it][A
Training...:  99% 13761/13907 [8:42:32<06:53,  2.83s/it][A
Training...:  99% 13762/13907 [8:42:35<06:45,  2.80s/it][A
Training...:  99% 13763/13907 [8:42:37<06:35,  2.75s/it][A
Training...:  99% 13764/13907 [8:42:40<06:25,  2.70s/it][A
Training...:  99% 13765/13907 [8:42:42<06:17,  2.66s/it][A
Training...:  99% 13766/13907 [8:42:45<06:08,  2.61s/it][A
Training...:  99% 13767/13907 [8:42:47<05:59,  2.57s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:25:01<26:06:17, 31325.86s/it]
Training...:  99% 13767/13907 [8:42:50<05:59,  2.57s/it][A
Training...:  99% 13768/13907 [8:42:50<06:06,  2.64s/it][A
Training...:  99% 13769/13907 [8:42:53<05:55,  2.58s/it][A
Training...:  99% 13770/13907 [8:42:55<05:43,  2.51s/it][A
Training...:  99% 13771/13907 [8:42:57<05:34,  2.46s/it][A
Training...:  99% 13772/13907 [8:43:00<05:24,  2.41s/it][A
Training...:  99% 13773/13907 [8:43:02<05:15,  2.36s/it][A
Training...:  99% 13774/13907 [8:43:04<05:07,  2.31s/it][A
Training...:  99% 13775/13907 [8:43:06<05:00,  2.27s/it][A
Training...:  99% 13776/13907 [8:43:08<04:53,  2.24s/it][A
Training...:  99% 13777/13907 [8:43:11<04:46,  2.20s/it][A
Training...:  99% 13778/13907 [8:43:13<04:40,  2.17s/it][A
Training...:  99% 13779/13907 [8:43:15<04:34,  2.15s/it][A
Training...:  99% 13780/13907 [8:43:17<04:29,  2.12s/it][A
Training...:  99% 13781/13907 [8:43:19<04:23,  2.09s/it][A
Training...:  99% 13782/13907 [8:43:21<04:18,  2.07s/it][A
Training...:  99% 13783/13907 [8:43:23<04:12,  2.03s/it][A
Training...:  99% 13784/13907 [8:43:25<04:06,  2.01s/it][A
Training...:  99% 13785/13907 [8:43:27<04:01,  1.98s/it][A
Training...:  99% 13786/13907 [8:43:28<03:55,  1.95s/it][A
Training...:  99% 13787/13907 [8:43:30<03:50,  1.92s/it][A
Training...:  99% 13788/13907 [8:43:32<03:45,  1.89s/it][A
Training...:  99% 13789/13907 [8:43:34<03:39,  1.86s/it][A
Training...:  99% 13790/13907 [8:43:36<03:33,  1.83s/it][A
Training...:  99% 13791/13907 [8:43:37<03:28,  1.80s/it][A
Training...:  99% 13792/13907 [8:43:39<03:23,  1.77s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:25:52<26:06:17, 31325.86s/it]
Training...:  99% 13792/13907 [8:43:41<03:23,  1.77s/it][A
Training...:  99% 13793/13907 [8:43:41<03:27,  1.82s/it][A
Training...:  99% 13794/13907 [8:43:43<03:20,  1.77s/it][A
Training...:  99% 13795/13907 [8:43:44<03:10,  1.70s/it][A
Training...:  99% 13796/13907 [8:43:46<03:00,  1.63s/it][A
Training...:  99% 13797/13907 [8:43:47<02:52,  1.57s/it][A
Training...:  99% 13798/13907 [8:43:48<02:42,  1.49s/it][A
Training...:  99% 13799/13907 [8:43:50<02:32,  1.41s/it][A
Training...:  99% 13800/13907 [8:43:51<02:19,  1.30s/it][A
Training...:  99% 13801/13907 [8:43:55<03:41,  2.09s/it][A
Training...:  99% 13802/13907 [8:43:58<04:27,  2.55s/it][A
Training...:  99% 13803/13907 [8:44:02<04:48,  2.77s/it][A
Training...:  99% 13804/13907 [8:44:05<04:58,  2.89s/it][A
Training...:  99% 13805/13907 [8:44:08<05:00,  2.94s/it][A
Training...:  99% 13806/13907 [8:44:11<04:57,  2.95s/it][A
Training...:  99% 13807/13907 [8:44:14<04:55,  2.96s/it][A
Training...:  99% 13808/13907 [8:44:17<04:51,  2.94s/it][A
Training...:  99% 13809/13907 [8:44:20<04:46,  2.92s/it][A
Training...:  99% 13810/13907 [8:44:22<04:40,  2.89s/it][A
Training...:  99% 13811/13907 [8:44:25<04:34,  2.85s/it][A
Training...:  99% 13812/13907 [8:44:28<04:26,  2.81s/it][A
Training...:  99% 13813/13907 [8:44:30<04:19,  2.76s/it][A
Training...:  99% 13814/13907 [8:44:33<04:13,  2.72s/it][A
Training...:  99% 13815/13907 [8:44:36<04:06,  2.68s/it][A
Training...:  99% 13816/13907 [8:44:38<04:00,  2.64s/it][A
Training...:  99% 13817/13907 [8:44:41<03:53,  2.60s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:26:55<26:06:17, 31325.86s/it]
Training...:  99% 13817/13907 [8:44:44<03:53,  2.60s/it][A
Training...:  99% 13818/13907 [8:44:44<03:59,  2.69s/it][A
Training...:  99% 13819/13907 [8:44:46<03:50,  2.62s/it][A
Training...:  99% 13820/13907 [8:44:49<03:42,  2.56s/it][A
Training...:  99% 13821/13907 [8:44:51<03:34,  2.50s/it][A
Training...:  99% 13822/13907 [8:44:53<03:27,  2.44s/it][A
Training...:  99% 13823/13907 [8:44:55<03:20,  2.39s/it][A
Training...:  99% 13824/13907 [8:44:58<03:14,  2.34s/it][A
Training...:  99% 13825/13907 [8:45:00<03:09,  2.31s/it][A
Training...:  99% 13826/13907 [8:45:02<03:03,  2.27s/it][A
Training...:  99% 13827/13907 [8:45:04<02:58,  2.23s/it][A
Training...:  99% 13828/13907 [8:45:06<02:53,  2.19s/it][A
Training...:  99% 13829/13907 [8:45:08<02:48,  2.16s/it][A
Training...:  99% 13830/13907 [8:45:10<02:43,  2.12s/it][A
Training...:  99% 13831/13907 [8:45:12<02:38,  2.09s/it][A
Training...:  99% 13832/13907 [8:45:14<02:34,  2.06s/it][A
Training...:  99% 13833/13907 [8:45:16<02:30,  2.03s/it][A
Training...:  99% 13834/13907 [8:45:18<02:25,  1.99s/it][A
Training...:  99% 13835/13907 [8:45:20<02:21,  1.96s/it][A
Training...:  99% 13836/13907 [8:45:22<02:16,  1.92s/it][A
Training...:  99% 13837/13907 [8:45:24<02:12,  1.90s/it][A
Training...: 100% 13838/13907 [8:45:26<02:08,  1.87s/it][A
Training...: 100% 13839/13907 [8:45:27<02:04,  1.84s/it][A
Training...: 100% 13840/13907 [8:45:29<02:01,  1.81s/it][A
Training...: 100% 13841/13907 [8:45:31<01:56,  1.77s/it][A
Training...: 100% 13842/13907 [8:45:33<01:52,  1.73s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:27:46<26:06:17, 31325.86s/it]
Training...: 100% 13842/13907 [8:45:34<01:52,  1.73s/it][A
Training...: 100% 13843/13907 [8:45:34<01:54,  1.79s/it][A
Training...: 100% 13844/13907 [8:45:36<01:49,  1.74s/it][A
Training...: 100% 13845/13907 [8:45:38<01:44,  1.68s/it][A
Training...: 100% 13846/13907 [8:45:39<01:38,  1.62s/it][A
Training...: 100% 13847/13907 [8:45:40<01:32,  1.55s/it][A
Training...: 100% 13848/13907 [8:45:42<01:27,  1.49s/it][A
Training...: 100% 13849/13907 [8:45:43<01:22,  1.42s/it][A
Training...: 100% 13850/13907 [8:45:44<01:15,  1.32s/it][A
Training...: 100% 13851/13907 [8:45:48<01:54,  2.04s/it][A
Training...: 100% 13852/13907 [8:45:51<02:16,  2.47s/it][A
Training...: 100% 13853/13907 [8:45:55<02:26,  2.71s/it][A
Training...: 100% 13854/13907 [8:45:58<02:30,  2.84s/it][A
Training...: 100% 13855/13907 [8:46:01<02:31,  2.91s/it][A
Training...: 100% 13856/13907 [8:46:04<02:31,  2.97s/it][A
Training...: 100% 13857/13907 [8:46:07<02:28,  2.97s/it][A
Training...: 100% 13858/13907 [8:46:10<02:23,  2.94s/it][A
Training...: 100% 13859/13907 [8:46:13<02:18,  2.89s/it][A
Training...: 100% 13860/13907 [8:46:15<02:13,  2.85s/it][A
Training...: 100% 13861/13907 [8:46:18<02:08,  2.80s/it][A
Training...: 100% 13862/13907 [8:46:21<02:03,  2.75s/it][A
Training...: 100% 13863/13907 [8:46:23<01:58,  2.70s/it][A
Training...: 100% 13864/13907 [8:46:26<01:54,  2.65s/it][A
Training...: 100% 13865/13907 [8:46:28<01:49,  2.61s/it][A
Training...: 100% 13866/13907 [8:46:31<01:45,  2.57s/it][A
Training...: 100% 13867/13907 [8:46:33<01:41,  2.53s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:28:47<26:06:17, 31325.86s/it]
Training...: 100% 13867/13907 [8:46:36<01:41,  2.53s/it][A
Training...: 100% 13868/13907 [8:46:36<01:41,  2.61s/it][A
Training...: 100% 13869/13907 [8:46:38<01:37,  2.57s/it][A
Training...: 100% 13870/13907 [8:46:41<01:32,  2.51s/it][A
Training...: 100% 13871/13907 [8:46:43<01:28,  2.46s/it][A
Training...: 100% 13872/13907 [8:46:45<01:24,  2.41s/it][A
Training...: 100% 13873/13907 [8:46:48<01:20,  2.36s/it][A
Training...: 100% 13874/13907 [8:46:50<01:16,  2.32s/it][A
Training...: 100% 13875/13907 [8:46:52<01:12,  2.28s/it][A
Training...: 100% 13876/13907 [8:46:54<01:09,  2.25s/it][A
Training...: 100% 13877/13907 [8:46:56<01:06,  2.22s/it][A
Training...: 100% 13878/13907 [8:46:59<01:03,  2.18s/it][A
Training...: 100% 13879/13907 [8:47:01<01:00,  2.15s/it][A
Training...: 100% 13880/13907 [8:47:03<00:57,  2.12s/it][A
Training...: 100% 13881/13907 [8:47:05<00:54,  2.10s/it][A
Training...: 100% 13882/13907 [8:47:07<00:51,  2.06s/it][A
Training...: 100% 13883/13907 [8:47:09<00:49,  2.06s/it][A
Training...: 100% 13884/13907 [8:47:11<00:46,  2.03s/it][A
Training...: 100% 13885/13907 [8:47:13<00:43,  1.99s/it][A
Training...: 100% 13886/13907 [8:47:14<00:40,  1.95s/it][A
Training...: 100% 13887/13907 [8:47:16<00:38,  1.92s/it][A
Training...: 100% 13888/13907 [8:47:18<00:35,  1.89s/it][A
Training...: 100% 13889/13907 [8:47:20<00:33,  1.86s/it][A
Training...: 100% 13890/13907 [8:47:22<00:30,  1.82s/it][A
Training...: 100% 13891/13907 [8:47:23<00:28,  1.78s/it][A
Training...: 100% 13892/13907 [8:47:25<00:26,  1.74s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  25% 1/4 [17:29:38<26:06:17, 31325.86s/it]
Training...: 100% 13892/13907 [8:47:27<00:26,  1.74s/it][A
Training...: 100% 13893/13907 [8:47:27<00:25,  1.80s/it][A
Training...: 100% 13894/13907 [8:47:29<00:22,  1.76s/it][A
Training...: 100% 13895/13907 [8:47:30<00:20,  1.72s/it][A
Training...: 100% 13896/13907 [8:47:32<00:18,  1.66s/it][A
Training...: 100% 13897/13907 [8:47:33<00:15,  1.60s/it][A
Training...: 100% 13898/13907 [8:47:35<00:13,  1.52s/it][A
Training...: 100% 13899/13907 [8:47:36<00:11,  1.44s/it][A
Training...: 100% 13900/13907 [8:47:37<00:09,  1.33s/it][A
Training...: 100% 13901/13907 [8:47:40<00:11,  1.95s/it][A
Training...: 100% 13902/13907 [8:47:43<00:11,  2.22s/it][A
Training...: 100% 13903/13907 [8:47:46<00:09,  2.32s/it][A
Training...: 100% 13904/13907 [8:47:48<00:06,  2.31s/it][A
Training...: 100% 13905/13907 [8:47:50<00:04,  2.25s/it][A
Training...: 100% 13906/13907 [8:47:52<00:02,  2.15s/it][A
Training...: 100% 13907/13907 [8:47:54<00:00,  2.00s/it][ATraining...: 100% 13907/13907 [8:47:54<00:00,  2.28s/it]
Epoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:30:05<17:31:07, 31533.87s/it]

Step... (26950 | Loss: 0.20752733945846558, Learning Rate: 0.00013970304280519485, Gradient Norm: 1.4967498779296875)
Step... (26975 | Loss: 0.22401320934295654, Learning Rate: 0.00013955151371192187, Gradient Norm: 0.9015403985977173)
Step... (27000 | Loss: 0.23196616768836975, Learning Rate: 0.00013939999917056412, Gradient Norm: 0.9061973094940186)
Step... (27025 | Loss: 0.2849484086036682, Learning Rate: 0.0001392484991811216, Gradient Norm: 0.9644677639007568)
Step... (27050 | Loss: 0.25220710039138794, Learning Rate: 0.0001390969700878486, Gradient Norm: 0.9869617223739624)
Step... (27075 | Loss: 0.1990624964237213, Learning Rate: 0.00013894545554649085, Gradient Norm: 1.1464521884918213)
Step... (27100 | Loss: 0.2427128255367279, Learning Rate: 0.00013879395555704832, Gradient Norm: 1.5280628204345703)
Step... (27125 | Loss: 0.1744052618741989, Learning Rate: 0.00013864242646377534, Gradient Norm: 0.6880577802658081)
Step... (27150 | Loss: 0.1842283010482788, Learning Rate: 0.00013849091192241758, Gradient Norm: 1.1367098093032837)
Step... (27175 | Loss: 0.30630066990852356, Learning Rate: 0.00013833941193297505, Gradient Norm: 1.071640968322754)
Step... (27200 | Loss: 0.25033408403396606, Learning Rate: 0.00013818788283970207, Gradient Norm: 1.465979814529419)
Step... (27225 | Loss: 0.18536043167114258, Learning Rate: 0.00013803636829834431, Gradient Norm: 0.8973680734634399)
Step... (27250 | Loss: 0.23065778613090515, Learning Rate: 0.0001378848683089018, Gradient Norm: 0.8535232543945312)
Step... (27275 | Loss: 0.21155309677124023, Learning Rate: 0.0001377333392156288, Gradient Norm: 0.6797406673431396)
Step... (27300 | Loss: 0.2039606124162674, Learning Rate: 0.00013758182467427105, Gradient Norm: 0.7097201347351074)
Step... (27325 | Loss: 0.2311094105243683, Learning Rate: 0.0001374303101329133, Gradient Norm: 0.707297682762146)
Step... (27350 | Loss: 0.189650759100914, Learning Rate: 0.00013727879559155554, Gradient Norm: 0.9925759434700012)
Step... (27375 | Loss: 0.24705447256565094, Learning Rate: 0.00013712728105019778, Gradient Norm: 0.8325022459030151)
Step... (27400 | Loss: 0.3130473494529724, Learning Rate: 0.00013697576650884002, Gradient Norm: 1.184074878692627)
Step... (27425 | Loss: 0.19038249552249908, Learning Rate: 0.00013682425196748227, Gradient Norm: 0.6515418291091919)
Step... (27450 | Loss: 0.17866185307502747, Learning Rate: 0.0001366727374261245, Gradient Norm: 0.6668398976325989)
Step... (27475 | Loss: 0.2182454764842987, Learning Rate: 0.00013652122288476676, Gradient Norm: 1.0683561563491821)
Step... (27500 | Loss: 0.2546437084674835, Learning Rate: 0.00013636969379149377, Gradient Norm: 0.9532268047332764)
Step... (27525 | Loss: 0.2528386414051056, Learning Rate: 0.00013621819380205125, Gradient Norm: 1.0199427604675293)
Step... (27550 | Loss: 0.21903926134109497, Learning Rate: 0.0001360666792606935, Gradient Norm: 1.2001986503601074)
Step... (27575 | Loss: 0.24840718507766724, Learning Rate: 0.0001359151501674205, Gradient Norm: 0.8604899048805237)
Step... (27600 | Loss: 0.19781962037086487, Learning Rate: 0.00013576365017797798, Gradient Norm: 1.0241224765777588)
Step... (27625 | Loss: 0.19740021228790283, Learning Rate: 0.00013561213563662022, Gradient Norm: 1.1293424367904663)
Step... (27650 | Loss: 0.2251485288143158, Learning Rate: 0.00013546060654334724, Gradient Norm: 0.9508259296417236)
Step... (27675 | Loss: 0.23914563655853271, Learning Rate: 0.0001353091065539047, Gradient Norm: 0.7704890966415405)
Step... (27700 | Loss: 0.20997586846351624, Learning Rate: 0.00013515759201254696, Gradient Norm: 0.8688854575157166)
Step... (27725 | Loss: 0.21791768074035645, Learning Rate: 0.00013500606291927397, Gradient Norm: 0.7412267923355103)
Step... (27750 | Loss: 0.19094178080558777, Learning Rate: 0.00013485454837791622, Gradient Norm: 1.4609510898590088)
Step... (27775 | Loss: 0.2196742445230484, Learning Rate: 0.00013470303383655846, Gradient Norm: 0.872066080570221)
Step... (27800 | Loss: 0.25518643856048584, Learning Rate: 0.000134551519295Training...:   0% 0/13907 [00:00<?, ?it/s][A2007, Gradient Norm: 1.65037202835083)

Training...:   0% 1/13907 [00:04<15:32:39,  4.02s/it][A
Training...:   0% 2/13907 [00:07<14:34:53,  3.78s/it][A
Training...:   0% 3/13907 [00:10<13:47:24,  3.57s/it][A
Training...:   0% 4/13907 [00:14<13:20:27,  3.45s/it][A
Training...:   0% 5/13907 [00:17<13:06:19,  3.39s/it][A
Training...:   0% 6/13907 [00:20<12:55:57,  3.35s/it][A
Training...:   0% 7/13907 [00:23<12:27:44,  3.23s/it][A
Training...:   0% 8/13907 [00:26<12:02:08,  3.12s/it][A
Training...:   0% 9/13907 [00:29<11:37:02,  3.01s/it][A
Training...:   0% 10/13907 [00:32<11:19:44,  2.93s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:30:46<17:31:07, 31533.87s/it]
Training...:   0% 10/13907 [00:35<11:19:44,  2.93s/it][A
Training...:   0% 11/13907 [00:35<11:30:48,  2.98s/it][A
Training...:   0% 12/13907 [00:37<11:13:05,  2.91s/it][A
Training...:   0% 13/13907 [00:40<10:50:44,  2.81s/it][A
Training...:   0% 14/13907 [00:43<10:32:21,  2.73s/it][A
Training...:   0% 15/13907 [00:45<10:15:35,  2.66s/it][A
Training...:   0% 16/13907 [00:48<10:03:13,  2.61s/it][A
Training...:   0% 17/13907 [00:50<9:52:28,  2.56s/it] [A
Training...:   0% 18/13907 [00:52<9:42:23,  2.52s/it][A
Training...:   0% 19/13907 [00:55<9:30:45,  2.47s/it][A
Training...:   0% 20/13907 [00:57<9:22:46,  2.43s/it][A
Training...:   0% 21/13907 [01:00<9:15:16,  2.40s/it][A
Training...:   0% 22/13907 [01:02<9:09:37,  2.38s/it][A
Training...:   0% 23/13907 [01:04<9:00:01,  2.33s/it][A
Training...:   0% 24/13907 [01:06<8:51:49,  2.30s/it][A
Training...:   0% 25/13907 [01:08<8:43:46,  2.26s/it][A
Training...:   0% 26/13907 [01:11<8:36:12,  2.23s/it][A
Training...:   0% 27/13907 [01:13<8:26:28,  2.19s/it][A
Training...:   0% 28/13907 [01:15<8:19:18,  2.16s/it][A
Training...:   0% 29/13907 [01:17<8:13:00,  2.13s/it][A
Training...:   0% 30/13907 [01:19<8:07:33,  2.11s/it][A
Training...:   0% 31/13907 [01:21<7:59:12,  2.07s/it][A
Training...:   0% 32/13907 [01:23<7:52:56,  2.05s/it][A
Training...:   0% 33/13907 [01:25<7:44:25,  2.01s/it][A
Training...:   0% 34/13907 [01:27<7:39:22,  1.99s/it][A
Training...:   0% 35/13907 [01:29<7:33:19,  1.96s/it][A                                                                                                                            
                                                     [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:31:42<17:31:07, 31533.87s/it]
Training...:   0% 35/13907 [01:31<7:33:19,  1.96s/it][A
Training...:   0% 36/13907 [01:31<7:51:56,  2.04s/it][A
Training...:   0% 37/13907 [01:33<7:42:29,  2.00s/it][A
Training...:   0% 38/13907 [01:35<7:28:41,  1.94s/it][A
Training...:   0% 39/13907 [01:36<7:14:57,  1.88s/it][A
Training...:   0% 40/13907 [01:38<7:03:05,  1.83s/it][A
Training...:   0% 41/13907 [01:40<6:51:48,  1.78s/it][A
Training...:   0% 42/13907 [01:41<6:42:57,  1.74s/it][A
Training...:   0% 43/13907 [01:43<6:33:58,  1.71s/it][A
Training...:   0% 44/13907 [01:45<6:24:28,  1.66s/it][A
Training...:   0% 45/13907 [01:46<6:15:30,  1.63s/it][A
Training...:   0% 46/13907 [01:48<6:05:28,  1.58s/it][A
Training...:   0% 47/13907 [01:49<5:53:15,  1.53s/it][A
Training...:   0% 48/13907 [01:50<5:41:30,  1.48s/it][A
Training...:   0% 49/13907 [01:52<5:25:26,  1.41s/it][A
Training...:   0% 50/13907 [01:53<5:02:09,  1.31s/it][A
Training...:   0% 51/13907 [01:56<7:49:38,  2.03s/it][A
Training...:   0% 52/13907 [02:00<9:28:23,  2.46s/it][A
Training...:   0% 53/13907 [02:03<10:20:24,  2.69s/it][A
Training...:   0% 54/13907 [02:06<10:51:12,  2.82s/it][A
Training...:   0% 55/13907 [02:09<11:03:13,  2.87s/it][A
Training...:   0% 56/13907 [02:12<11:06:17,  2.89s/it][A
Training...:   0% 57/13907 [02:15<11:05:07,  2.88s/it][A
Training...:   0% 58/13907 [02:18<11:00:24,  2.86s/it][A
Training...:   0% 59/13907 [02:20<10:50:37,  2.82s/it][A
Training...:   0% 60/13907 [02:23<10:41:09,  2.78s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:32:37<17:31:07, 31533.87s/it]
Training...:   0% 60/13907 [02:26<10:41:09,  2.78s/it][A
Training...:   0% 61/13907 [02:26<11:01:04,  2.86s/it][A
Training...:   0% 62/13907 [02:29<10:47:40,  2.81s/it][A
Training...:   0% 63/13907 [02:32<10:35:26,  2.75s/it][A
Training...:   0% 64/13907 [02:34<10:17:58,  2.68s/it][A
Training...:   0% 65/13907 [02:37<10:09:18,  2.64s/it][A
Training...:   0% 66/13907 [02:39<9:55:55,  2.58s/it] [A
Training...:   0% 67/13907 [02:41<9:44:12,  2.53s/it][A
Training...:   0% 68/13907 [02:44<9:34:12,  2.49s/it][A
Training...:   0% 69/13907 [02:46<9:24:54,  2.45s/it][A
Training...:   1% 70/13907 [02:49<9:17:22,  2.42s/it][A
Training...:   1% 71/13907 [02:51<9:08:16,  2.38s/it][A
Training...:   1% 72/13907 [02:53<8:59:23,  2.34s/it][A
Training...:   1% 73/13907 [02:55<8:49:43,  2.30s/it][A
Training...:   1% 74/13907 [02:57<8:41:51,  2.26s/it][A
Training...:   1% 75/13907 [03:00<8:31:50,  2.22s/it][A
Training...:   1% 76/13907 [03:02<8:24:21,  2.19s/it][A
Training...:   1% 77/13907 [03:04<8:17:28,  2.16s/it][A
Training...:   1% 78/13907 [03:06<8:11:11,  2.13s/it][A
Training...:   1% 79/13907 [03:08<8:04:45,  2.10s/it][A
Training...:   1% 80/13907 [03:10<7:59:19,  2.08s/it][A
Training...:   1% 81/13907 [03:12<7:51:43,  2.05s/it][A
Training...:   1% 82/13907 [03:14<7:45:08,  2.02s/it][A
Training...:   1% 83/13907 [03:16<7:37:01,  1.98s/it][A
Training...:   1% 84/13907 [03:18<7:29:53,  1.95s/it][A
Training...:   1% 85/13907 [03:19<7:23:47,  1.93s/it][A                                                                                                                            
                                                     [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:33:33<17:31:07, 31533.87s/it]
Training...:   1% 85/13907 [03:22<7:23:47,  1.93s/it][A
Training...:   1% 86/13907 [03:22<7:39:24,  1.99s/it][A
Training...:   1% 87/13907 [03:23<7:29:11,  1.95s/it][A
Training...:   1% 88/13907 [03:25<7:16:53,  1.90s/it][A
Training...:   1% 89/13907 [03:27<7:05:24,  1.85s/it][A
Training...:   1% 90/13907 [03:29<6:54:34,  1.80s/it][A
Training...:   1% 91/13907 [03:30<6:44:57,  1.76s/it][A
Training...:   1% 92/13907 [03:32<6:36:22,  1.72s/it][A
Training...:   1% 93/13907 [03:34<6:27:22,  1.68s/it][A
Training...:   1% 94/13907 [03:35<6:18:12,  1.64s/it][A
Training...:   1% 95/13907 [03:37<6:09:07,  1.60s/it][A
Training...:   1% 96/13907 [03:38<5:58:13,  1.56s/it][A
Training...:   1% 97/13907 [03:39<5:46:35,  1.51s/it][A
Training...:   1% 98/13907 [03:41<5:33:31,  1.45s/it][A
Training...:   1% 99/13907 [03:42<5:18:48,  1.39s/it][A
Training...:   1% 100/13907 [03:43<4:54:44,  1.28s/it][A
Training...:   1% 101/13907 [03:47<7:53:43,  2.06s/it][A
Training...:   1% 102/13907 [03:50<9:31:47,  2.49s/it][A
Training...:   1% 103/13907 [03:54<10:22:55,  2.71s/it][A
Training...:   1% 104/13907 [03:57<10:51:34,  2.83s/it][A
Training...:   1% 105/13907 [04:00<11:05:11,  2.89s/it][A
Training...:   1% 106/13907 [04:03<11:10:47,  2.92s/it][A
Training...:   1% 107/13907 [04:06<11:11:15,  2.92s/it][A
Training...:   1% 108/13907 [04:09<11:04:50,  2.89s/it][A
Training...:   1% 109/13907 [04:11<10:54:11,  2.84s/it][A
Training...:   1% 110/13907 [04:14<10:44:45,  2.80s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:34:28<17:31:07, 31533.87s/it]
Training...:   1% 110/13907 [04:17<10:44:45,  2.80s/it][A
Training...:   1% 111/13907 [04:17<11:04:14,  2.89s/it][A
Training...:   1% 112/13907 [04:20<10:50:31,  2.83s/it][A
Training...:   1% 113/13907 [04:22<10:35:36,  2.76s/it][A
Training...:   1% 114/13907 [04:25<10:20:01,  2.70s/it][A
Training...:   1% 115/13907 [04:27<10:11:22,  2.66s/it][A
Training...:   1% 116/13907 [04:30<9:59:22,  2.61s/it] [A
Training...:   1% 117/13907 [04:32<9:46:18,  2.55s/it][A
Training...:   1% 118/13907 [04:35<9:38:02,  2.52s/it][A
Training...:   1% 119/13907 [04:37<9:27:31,  2.47s/it][A
Training...:   1% 120/13907 [04:40<9:19:44,  2.44s/it][A
Training...:   1% 121/13907 [04:42<9:10:09,  2.39s/it][A
Training...:   1% 122/13907 [04:44<9:04:35,  2.37s/it][A
Training...:   1% 123/13907 [04:46<8:59:43,  2.35s/it][A
Training...:   1% 124/13907 [04:49<8:51:51,  2.32s/it][A
Training...:   1% 125/13907 [04:51<8:41:21,  2.27s/it][A
Training...:   1% 126/13907 [04:53<8:31:27,  2.23s/it][A
Training...:   1% 127/13907 [04:55<8:22:37,  2.19s/it][A
Training...:   1% 128/13907 [04:57<8:13:43,  2.15s/it][A
Training...:   1% 129/13907 [04:59<8:05:42,  2.12s/it][A
Training...:   1% 130/13907 [05:01<7:57:04,  2.08s/it][A
Training...:   1% 131/13907 [05:03<7:49:24,  2.04s/it][A
Training...:   1% 132/13907 [05:05<7:42:05,  2.01s/it][A
Training...:   1% 133/13907 [05:07<7:35:47,  1.99s/it][A
Training...:   1% 134/13907 [05:09<7:29:00,  1.96s/it][A
Training...:   1% 135/13907 [05:11<7:20:31,  1.92s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:35:24<17:31:07, 31533.87s/it]
Training...:   1% 135/13907 [05:13<7:20:31,  1.92s/it][A
Training...:   1% 136/13907 [05:13<7:35:48,  1.99s/it][A
Training...:   1% 137/13907 [05:15<7:26:43,  1.95s/it][A
Training...:   1% 138/13907 [05:16<7:12:41,  1.89s/it][A
Training...:   1% 139/13907 [05:18<7:01:40,  1.84s/it][A
Training...:   1% 140/13907 [05:20<6:52:54,  1.80s/it][A
Training...:   1% 141/13907 [05:22<6:43:50,  1.76s/it][A
Training...:   1% 142/13907 [05:23<6:34:51,  1.72s/it][A
Training...:   1% 143/13907 [05:25<6:25:42,  1.68s/it][A
Training...:   1% 144/13907 [05:26<6:17:33,  1.65s/it][A
Training...:   1% 145/13907 [05:28<6:06:54,  1.60s/it][A
Training...:   1% 146/13907 [05:29<5:55:22,  1.55s/it][A
Training...:   1% 147/13907 [05:31<5:43:40,  1.50s/it][A
Training...:   1% 148/13907 [05:32<5:28:23,  1.43s/it][A
Training...:   1% 149/13907 [05:33<5:12:26,  1.36s/it][A
Training...:   1% 150/13907 [05:34<4:51:39,  1.27s/it][A
Training...:   1% 151/13907 [05:38<7:38:22,  2.00s/it][A
Training...:   1% 152/13907 [05:41<9:18:50,  2.44s/it][A
Training...:   1% 153/13907 [05:45<10:14:16,  2.68s/it][A
Training...:   1% 154/13907 [05:48<10:44:18,  2.81s/it][A
Training...:   1% 155/13907 [05:51<10:56:53,  2.87s/it][A
Training...:   1% 156/13907 [05:54<11:11:09,  2.93s/it][A
Training...:   1% 157/13907 [05:57<11:10:47,  2.93s/it][A
Training...:   1% 158/13907 [05:59<11:03:54,  2.90s/it][A
Training...:   1% 159/13907 [06:02<10:53:14,  2.85s/it][A
Training...:   1% 160/13907 [06:05<10:42:59,  2.81s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:36:19<17:31:07, 31533.87s/it]
Training...:   1% 160/13907 [06:08<10:42:59,  2.81s/it][A
Training...:   1% 161/13907 [06:08<11:01:00,  2.89s/it][A
Training...:   1% 162/13907 [06:11<10:49:37,  2.84s/it][A
Training...:   1% 163/13907 [06:13<10:32:28,  2.76s/it][A
Training...:   1% 164/13907 [06:16<10:14:57,  2.68s/it][A
Training...:   1% 165/13907 [06:18<10:02:04,  2.63s/it][A
Training...:   1% 166/13907 [06:21<9:51:32,  2.58s/it] [A
Training...:   1% 167/13907 [06:23<9:41:57,  2.54s/it][A
Training...:   1% 168/13907 [06:26<9:30:52,  2.49s/it][A
Training...:   1% 169/13907 [06:28<9:21:42,  2.45s/it][A
Training...:   1% 170/13907 [06:30<9:15:04,  2.42s/it][A
Training...:   1% 171/13907 [06:33<9:05:56,  2.38s/it][A
Training...:   1% 172/13907 [06:35<8:59:15,  2.36s/it][A
Training...:   1% 173/13907 [06:37<8:49:50,  2.31s/it][A
Training...:   1% 174/13907 [06:39<8:43:34,  2.29s/it][A
Training...:   1% 175/13907 [06:42<8:37:39,  2.26s/it][A
Training...:   1% 176/13907 [06:44<8:31:06,  2.23s/it][A
Training...:   1% 177/13907 [06:46<8:24:18,  2.20s/it][A
Training...:   1% 178/13907 [06:48<8:16:49,  2.17s/it][A
Training...:   1% 179/13907 [06:50<8:08:14,  2.13s/it][A
Training...:   1% 180/13907 [06:52<8:00:09,  2.10s/it][A
Training...:   1% 181/13907 [06:54<7:51:58,  2.06s/it][A
Training...:   1% 182/13907 [06:56<7:44:40,  2.03s/it][A
Training...:   1% 183/13907 [06:58<7:36:51,  2.00s/it][A
Training...:   1% 184/13907 [07:00<7:30:56,  1.97s/it][A
Training...:   1% 185/13907 [07:02<7:22:56,  1.94s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:37:15<17:31:07, 31533.87s/it]
Training...:   1% 185/13907 [07:04<7:22:56,  1.94s/it][A
Training...:   1% 186/13907 [07:04<7:37:07,  2.00s/it][A
Training...:   1% 187/13907 [07:06<7:28:16,  1.96s/it][A
Training...:   1% 188/13907 [07:07<7:15:18,  1.90s/it][A
Training...:   1% 189/13907 [07:09<7:03:42,  1.85s/it][A
Training...:   1% 190/13907 [07:11<6:54:25,  1.81s/it][A
Training...:   1% 191/13907 [07:13<6:45:40,  1.77s/it][A
Training...:   1% 192/13907 [07:14<6:36:04,  1.73s/it][A
Training...:   1% 193/13907 [07:16<6:27:33,  1.70s/it][A
Training...:   1% 194/13907 [07:17<6:18:39,  1.66s/it][A
Training...:   1% 195/13907 [07:19<6:09:29,  1.62s/it][A
Training...:   1% 196/13907 [07:20<5:58:33,  1.57s/it][A
Training...:   1% 197/13907 [07:22<5:46:38,  1.52s/it][A
Training...:   1% 198/13907 [07:23<5:32:05,  1.45s/it][A
Training...:   1% 199/13907 [07:24<5:16:14,  1.38s/it][A
Training...:   1% 200/13907 [07:25<4:56:06,  1.30s/it][A
Training...:   1% 201/13907 [07:29<7:44:25,  2.03s/it][A
Training...:   1% 202/13907 [07:33<9:22:19,  2.46s/it][A
Training...:   1% 203/13907 [07:36<10:14:35,  2.69s/it][A
Training...:   1% 204/13907 [07:39<10:41:30,  2.81s/it][A
Training...:   1% 205/13907 [07:42<10:57:35,  2.88s/it][A
Training...:   1% 206/13907 [07:45<11:00:23,  2.89s/it][A
Training...:   1% 207/13907 [07:48<10:59:09,  2.89s/it][A
Training...:   1% 208/13907 [07:51<10:52:57,  2.86s/it][A
Training...:   2% 209/13907 [07:53<10:44:07,  2.82s/it][A
Training...:   2% 210/13907 [07:56<10:37:07,  2.79s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:38:10<17:31:07, 31533.87s/it]
Training...:   2% 210/13907 [07:59<10:37:07,  2.79s/it][A
Training...:   2% 211/13907 [07:59<10:56:27,  2.88s/it][A
Training...:   2% 212/13907 [08:02<10:45:14,  2.83s/it][A
Training...:   2% 213/13907 [08:04<10:29:35,  2.76s/it][A
Training...:   2% 214/13907 [08:07<10:16:49,  2.70s/it][A
Training...:   2% 215/13907 [08:09<10:04:27,  2.65s/it][A
Training...:   2% 216/13907 [08:12<9:51:23,  2.59s/it] [A
Training...:   2% 217/13907 [08:14<9:40:15,  2.54s/it][A
Training...:   2% 218/13907 [08:17<9:29:30,  2.50s/it][A
Training...:   2% 219/13907 [08:19<9:18:17,  2.45s/it][A
Training...:   2% 220/13907 [08:21<9:10:46,  2.41s/it][A
Training...:   2% 221/13907 [08:24<9:01:19,  2.37s/it][A
Training...:   2% 222/13907 [08:26<8:52:07,  2.33s/it][A
Training...:   2% 223/13907 [08:28<8:45:29,  2.30s/it][A
Training...:   2% 224/13907 [08:30<8:36:41,  2.27s/it][A
Training...:   2% 225/13907 [08:33<8:34:26,  2.26s/it][A
Training...:   2% 226/13907 [08:35<8:27:43,  2.23s/it][A
Training...:   2% 227/13907 [08:37<8:18:02,  2.18s/it][A
Training...:   2% 228/13907 [08:39<8:10:00,  2.15s/it][A
Training...:   2% 229/13907 [08:41<8:01:37,  2.11s/it][A
Training...:   2% 230/13907 [08:43<7:53:09,  2.08s/it][A
Training...:   2% 231/13907 [08:45<7:45:18,  2.04s/it][A
Training...:   2% 232/13907 [08:47<7:38:58,  2.01s/it][A
Training...:   2% 233/13907 [08:49<7:31:46,  1.98s/it][A
Training...:   2% 234/13907 [08:51<7:25:32,  1.96s/it][A
Training...:   2% 235/13907 [08:52<7:18:46,  1.93s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:39:06<17:31:07, 31533.87s/it]
Training...:   2% 235/13907 [08:55<7:18:46,  1.93s/it][A
Training...:   2% 236/13907 [08:55<7:31:55,  1.98s/it][A
Training...:   2% 237/13907 [08:56<7:25:09,  1.95s/it][A
Training...:   2% 238/13907 [08:58<7:11:06,  1.89s/it][A
Training...:   2% 239/13907 [09:00<6:59:16,  1.84s/it][A
Training...:   2% 240/13907 [09:02<6:48:03,  1.79s/it][A
Training...:   2% 241/13907 [09:03<6:38:07,  1.75s/it][A
Training...:   2% 242/13907 [09:05<6:31:35,  1.72s/it][A
Training...:   2% 243/13907 [09:07<6:21:34,  1.68s/it][A
Training...:   2% 244/13907 [09:08<6:12:50,  1.64s/it][A
Training...:   2% 245/13907 [09:10<6:02:38,  1.59s/it][A
Training...:   2% 246/13907 [09:11<5:51:53,  1.55s/it][A
Training...:   2% 247/13907 [09:12<5:41:10,  1.50s/it][A
Training...:   2% 248/13907 [09:14<5:27:48,  1.44s/it][A
Training...:   2% 249/13907 [09:15<5:12:07,  1.37s/it][A
Training...:   2% 250/13907 [09:16<4:48:47,  1.27s/it][A
Training...:   2% 251/13907 [09:20<7:31:54,  1.99s/it][A
Training...:   2% 252/13907 [09:23<9:19:06,  2.46s/it][A
Training...:   2% 253/13907 [09:26<10:18:51,  2.72s/it][A
Training...:   2% 254/13907 [09:30<10:51:30,  2.86s/it][A
Training...:   2% 255/13907 [09:33<11:05:39,  2.93s/it][A
Training...:   2% 256/13907 [09:36<11:08:11,  2.94s/it][A
Training...:   2% 257/13907 [09:39<11:05:02,  2.92s/it][A
Training...:   2% 258/13907 [09:41<11:03:24,  2.92s/it][A
Training...:   2% 259/13907 [09:44<10:58:26,  2.89s/it][A
Training...:   2% 260/13907 [09:47<10:46:11,  2.84s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:40:01<17:31:07, 31533.87s/it]
Training...:   2% 260/13907 [09:50<10:46:11,  2.84s/it][A
Training...:   2% 261/13907 [09:50<11:00:16,  2.90s/it][A
Training...:   2% 262/13907 [09:53<10:45:33,  2.84s/it][A
Training...:   2% 263/13907 [09:55<10:29:06,  2.77s/it][A
Training...:   2% 264/13907 [09:58<10:13:46,  2.70s/it][A
Training...:   2% 265/13907 [10:00<9:57:42,  2.63s/it] [A
Training...:   2% 266/13907 [10:03<9:46:05,  2.58s/it][A
Training...:   2% 267/13907 [10:05<9:34:34,  2.53s/it][A
Training...:   2% 268/13907 [10:08<9:24:54,  2.49s/it][A
Training...:   2% 269/13907 [10:10<9:16:34,  2.45s/it][A
Training...:   2% 270/13907 [10:12<9:08:44,  2.41s/it][A
Training...:   2% 271/13907 [10:15<8:59:21,  2.37s/it][A
Training...:   2% 272/13907 [10:17<8:53:30,  2.35s/it][A
Training...:   2% 273/13907 [10:19<8:43:53,  2.31s/it][A
Training...:   2% 274/13907 [10:21<8:37:18,  2.28s/it][A
Training...:   2% 275/13907 [10:23<8:29:40,  2.24s/it][A
Training...:   2% 276/13907 [10:26<8:20:17,  2.20s/it][A
Training...:   2% 277/13907 [10:28<8:12:59,  2.17s/it][A
Training...:   2% 278/13907 [10:30<8:07:51,  2.15s/it][A
Training...:   2% 279/13907 [10:32<8:02:56,  2.13s/it][A
Training...:   2% 280/13907 [10:34<7:56:51,  2.10s/it][A
Training...:   2% 281/13907 [10:36<7:49:13,  2.07s/it][A
Training...:   2% 282/13907 [10:38<7:41:21,  2.03s/it][A
Training...:   2% 283/13907 [10:40<7:34:16,  2.00s/it][A
Training...:   2% 284/13907 [10:42<7:28:23,  1.97s/it][A
Training...:   2% 285/13907 [10:44<7:23:26,  1.95s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:40:57<17:31:07, 31533.87s/it]
Training...:   2% 285/13907 [10:46<7:23:26,  1.95s/it][A
Training...:   2% 286/13907 [10:46<7:37:53,  2.02s/it][A
Training...:   2% 287/13907 [10:48<7:27:48,  1.97s/it][A
Training...:   2% 288/13907 [10:49<7:16:44,  1.92s/it][A
Training...:   2% 289/13907 [10:51<7:03:31,  1.87s/it][A
Training...:   2% 290/13907 [10:53<6:54:57,  1.83s/it][A
Training...:   2% 291/13907 [10:55<6:44:56,  1.78s/it][A
Training...:   2% 292/13907 [10:56<6:34:12,  1.74s/it][A
Training...:   2% 293/13907 [10:58<6:23:44,  1.69s/it][A
Training...:   2% 294/13907 [10:59<6:14:18,  1.65s/it][A
Training...:   2% 295/13907 [11:01<6:04:13,  1.61s/it][A
Training...:   2% 296/13907 [11:02<5:52:43,  1.55s/it][A
Training...:   2% 297/13907 [11:04<5:40:43,  1.50s/it][A
Training...:   2% 298/13907 [11:05<5:26:53,  1.44s/it][A
Training...:   2% 299/13907 [11:06<5:10:43,  1.37s/it][A
Training...:   2% 300/13907 [11:07<4:47:19,  1.27s/it][A
Training...:   2% 301/13907 [11:11<7:32:38,  2.00s/it][A
Training...:   2% 302/13907 [11:14<9:16:51,  2.46s/it][A
Training...:   2% 303/13907 [11:18<10:11:39,  2.70s/it][A
Training...:   2% 304/13907 [11:21<10:41:32,  2.83s/it][A
Training...:   2% 305/13907 [11:24<10:54:42,  2.89s/it][A
Training...:   2% 306/13907 [11:27<10:57:14,  2.90s/it][A
Training...:   2% 307/13907 [11:30<10:56:52,  2.90s/it][A
Training...:   2% 308/13907 [11:32<10:49:46,  2.87s/it][A
Training...:   2% 309/13907 [11:35<10:43:00,  2.84s/it][A
Training...:   2% 310/13907 [11:38<10:33:36,  2.80s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:41:52<17:31:07, 31533.87s/it]
Training...:   2% 310/13907 [11:41<10:33:36,  2.80s/it][A
Training...:   2% 311/13907 [11:41<10:52:49,  2.88s/it][A
Training...:   2% 312/13907 [11:44<10:42:08,  2.83s/it][A
Training...:   2% 313/13907 [11:46<10:24:51,  2.76s/it][A
Training...:   2% 314/13907 [11:49<10:11:21,  2.70s/it][A
Training...:   2% 315/13907 [11:51<9:59:27,  2.65s/it] [A
Training...:   2% 316/13907 [11:54<9:47:58,  2.60s/it][A
Training...:   2% 317/13907 [11:56<9:37:54,  2.55s/it][A
Training...:   2% 318/13907 [11:59<9:28:05,  2.51s/it][A
Training...:   2% 319/13907 [12:01<9:17:49,  2.46s/it][A
Training...:   2% 320/13907 [12:03<9:09:19,  2.43s/it][A
Training...:   2% 321/13907 [12:06<9:01:46,  2.39s/it][A
Training...:   2% 322/13907 [12:08<8:55:41,  2.37s/it][A
Training...:   2% 323/13907 [12:10<8:53:46,  2.36s/it][A
Training...:   2% 324/13907 [12:13<8:42:48,  2.31s/it][A
Training...:   2% 325/13907 [12:15<8:38:10,  2.29s/it][A
Training...:   2% 326/13907 [12:17<8:28:27,  2.25s/it][A
Training...:   2% 327/13907 [12:19<8:17:51,  2.20s/it][A
Training...:   2% 328/13907 [12:21<8:09:41,  2.16s/it][A
Training...:   2% 329/13907 [12:23<8:01:24,  2.13s/it][A
Training...:   2% 330/13907 [12:25<7:55:05,  2.10s/it][A
Training...:   2% 331/13907 [12:27<7:47:14,  2.07s/it][A
Training...:   2% 332/13907 [12:29<7:40:02,  2.03s/it][A
Training...:   2% 333/13907 [12:31<7:32:43,  2.00s/it][A
Training...:   2% 334/13907 [12:33<7:27:19,  1.98s/it][A
Training...:   2% 335/13907 [12:35<7:20:33,  1.95s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:42:48<17:31:07, 31533.87s/it]
Training...:   2% 335/13907 [12:37<7:20:33,  1.95s/it][A
Training...:   2% 336/13907 [12:37<7:34:16,  2.01s/it][A
Training...:   2% 337/13907 [12:39<7:25:31,  1.97s/it][A
Training...:   2% 338/13907 [12:41<7:12:16,  1.91s/it][A
Training...:   2% 339/13907 [12:42<7:02:19,  1.87s/it][A
Training...:   2% 340/13907 [12:44<6:51:12,  1.82s/it][A
Training...:   2% 341/13907 [12:46<6:41:39,  1.78s/it][A
Training...:   2% 342/13907 [12:47<6:31:32,  1.73s/it][A
Training...:   2% 343/13907 [12:49<6:21:14,  1.69s/it][A
Training...:   2% 344/13907 [12:51<6:11:46,  1.64s/it][A
Training...:   2% 345/13907 [12:52<6:01:59,  1.60s/it][A
Training...:   2% 346/13907 [12:54<5:50:07,  1.55s/it][A
Training...:   2% 347/13907 [12:55<5:37:28,  1.49s/it][A
Training...:   3% 348/13907 [12:56<5:24:02,  1.43s/it][A
Training...:   3% 349/13907 [12:57<5:08:34,  1.37s/it][A
Training...:   3% 350/13907 [12:58<4:46:32,  1.27s/it][A
Training...:   3% 351/13907 [13:02<7:29:05,  1.99s/it][A
Training...:   3% 352/13907 [13:06<9:09:37,  2.43s/it][A
Training...:   3% 353/13907 [13:09<10:09:12,  2.70s/it][A
Training...:   3% 354/13907 [13:12<10:40:28,  2.84s/it][A
Training...:   3% 355/13907 [13:15<10:56:48,  2.91s/it][A
Training...:   3% 356/13907 [13:18<11:02:50,  2.93s/it][A
Training...:   3% 357/13907 [13:21<10:59:59,  2.92s/it][A
Training...:   3% 358/13907 [13:24<10:54:35,  2.90s/it][A
Training...:   3% 359/13907 [13:27<10:48:44,  2.87s/it][A
Training...:   3% 360/13907 [13:29<10:38:49,  2.83s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:43:44<17:31:07, 31533.87s/it]
Training...:   3% 360/13907 [13:33<10:38:49,  2.83s/it][A
Training...:   3% 361/13907 [13:33<11:04:25,  2.94s/it][A
Training...:   3% 362/13907 [13:35<10:49:50,  2.88s/it][A
Training...:   3% 363/13907 [13:38<10:30:14,  2.79s/it][A
Training...:   3% 364/13907 [13:40<10:12:23,  2.71s/it][A
Training...:   3% 365/13907 [13:43<9:57:45,  2.65s/it] [A
Training...:   3% 366/13907 [13:45<9:44:02,  2.59s/it][A
Training...:   3% 367/13907 [13:48<9:30:09,  2.53s/it][A
Training...:   3% 368/13907 [13:50<9:21:11,  2.49s/it][A
Training...:   3% 369/13907 [13:53<9:11:37,  2.44s/it][A
Training...:   3% 370/13907 [13:55<9:01:56,  2.40s/it][A
Training...:   3% 371/13907 [13:57<8:55:03,  2.37s/it][A
Training...:   3% 372/13907 [13:59<8:45:34,  2.33s/it][A
Training...:   3% 373/13907 [14:02<8:37:17,  2.29s/it][A
Training...:   3% 374/13907 [14:04<8:28:59,  2.26s/it][A
Training...:   3% 375/13907 [14:06<8:20:50,  2.22s/it][A
Training...:   3% 376/13907 [14:08<8:13:55,  2.19s/it][A
Training...:   3% 377/13907 [14:10<8:07:36,  2.16s/it][A
Training...:   3% 378/13907 [14:12<8:02:12,  2.14s/it][A
Training...:   3% 379/13907 [14:14<7:55:09,  2.11s/it][A
Training...:   3% 380/13907 [14:16<7:49:32,  2.08s/it][A
Training...:   3% 381/13907 [14:18<7:43:20,  2.06s/it][A
Training...:   3% 382/13907 [14:20<7:36:42,  2.03s/it][A
Training...:   3% 383/13907 [14:22<7:30:19,  2.00s/it][A
Training...:   3% 384/13907 [14:24<7:23:06,  1.97s/it][A
Training...:   3% 385/13907 [14:26<7:15:56,  1.93s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:44:39<17:31:07, 31533.87s/it]
Training...:   3% 385/13907 [14:28<7:15:56,  1.93s/it][A
Training...:   3% 386/13907 [14:28<7:32:36,  2.01s/it][A
Training...:   3% 387/13907 [14:30<7:23:46,  1.97s/it][A
Training...:   3% 388/13907 [14:32<7:10:44,  1.91s/it][A
Training...:   3% 389/13907 [14:33<6:59:51,  1.86s/it][A
Training...:   3% 390/13907 [14:35<6:49:27,  1.82s/it][A
Training...:   3% 391/13907 [14:37<6:41:22,  1.78s/it][A
Training...:   3% 392/13907 [14:38<6:32:34,  1.74s/it][A
Training...:   3% 393/13907 [14:40<6:23:34,  1.70s/it][A
Training...:   3% 394/13907 [14:42<6:14:12,  1.66s/it][A
Training...:   3% 395/13907 [14:43<6:07:03,  1.63s/it][A
Training...:   3% 396/13907 [14:45<5:56:43,  1.58s/it][A
Training...:   3% 397/13907 [14:46<5:45:45,  1.54s/it][A
Training...:   3% 398/13907 [14:47<5:32:37,  1.48s/it][A
Training...:   3% 399/13907 [14:49<5:16:45,  1.41s/it][A
Training...:   3% 400/13907 [14:50<4:56:12,  1.32s/it][A
Training...:   3% 401/13907 [14:54<7:38:54,  2.04s/it][A
Training...:   3% 402/13907 [14:57<9:16:24,  2.47s/it][A
Training...:   3% 403/13907 [15:00<10:13:07,  2.72s/it][A
Training...:   3% 404/13907 [15:03<10:42:29,  2.85s/it][A
Training...:   3% 405/13907 [15:06<10:52:13,  2.90s/it][A
Training...:   3% 406/13907 [15:09<10:54:18,  2.91s/it][A
Training...:   3% 407/13907 [15:12<10:50:48,  2.89s/it][A
Training...:   3% 408/13907 [15:15<10:44:04,  2.86s/it][A
Training...:   3% 409/13907 [15:18<10:35:32,  2.83s/it][A
Training...:   3% 410/13907 [15:20<10:25:06,  2.78s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:45:35<17:31:07, 31533.87s/it]
Training...:   3% 410/13907 [15:24<10:25:06,  2.78s/it][A
Training...:   3% 411/13907 [15:24<10:43:18,  2.86s/it][A
Training...:   3% 412/13907 [15:26<10:33:15,  2.82s/it][A
Training...:   3% 413/13907 [15:29<10:15:42,  2.74s/it][A
Training...:   3% 414/13907 [15:31<10:03:24,  2.68s/it][A
Training...:   3% 415/13907 [15:34<9:49:06,  2.62s/it] [A
Training...:   3% 416/13907 [15:36<9:36:30,  2.56s/it][A
Training...:   3% 417/13907 [15:39<9:29:21,  2.53s/it][A
Training...:   3% 418/13907 [15:41<9:22:33,  2.50s/it][A
Training...:   3% 419/13907 [15:44<9:12:14,  2.46s/it][A
Training...:   3% 420/13907 [15:46<9:03:27,  2.42s/it][A
Training...:   3% 421/13907 [15:48<8:54:03,  2.38s/it][A
Training...:   3% 422/13907 [15:50<8:46:00,  2.34s/it][A
Training...:   3% 423/13907 [15:53<8:36:40,  2.30s/it][A
Training...:   3% 424/13907 [15:55<8:29:37,  2.27s/it][A
Training...:   3% 425/13907 [15:57<8:20:54,  2.23s/it][A
Training...:   3% 426/13907 [15:59<8:13:30,  2.20s/it][A
Training...:   3% 427/13907 [16:01<8:06:31,  2.17s/it][A
Training...:   3% 428/13907 [16:03<8:00:19,  2.14s/it][A
Training...:   3% 429/13907 [16:05<7:53:41,  2.11s/it][A
Training...:   3% 430/13907 [16:07<7:47:18,  2.08s/it][A
Training...:   3% 431/13907 [16:09<7:40:44,  2.05s/it][A
Training...:   3% 432/13907 [16:11<7:35:42,  2.03s/it][A
Training...:   3% 433/13907 [16:13<7:32:12,  2.01s/it][A
Training...:   3% 434/13907 [16:15<7:26:03,  1.99s/it][A
Training...:   3% 435/13907 [16:17<7:16:44,  1.95s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:46:30<17:31:07, 31533.87s/it]
Training...:   3% 435/13907 [16:19<7:16:44,  1.95s/it][A
Training...:   3% 436/13907 [16:19<7:29:48,  2.00s/it][A
Training...:   3% 437/13907 [16:21<7:21:29,  1.97s/it][A
Training...:   3% 438/13907 [16:23<7:07:36,  1.90s/it][A
Training...:   3% 439/13907 [16:24<6:55:42,  1.85s/it][A
Training...:   3% 440/13907 [16:26<6:45:14,  1.81s/it][A
Training...:   3% 441/13907 [16:28<6:35:33,  1.76s/it][A
Training...:   3% 442/13907 [16:29<6:25:26,  1.72s/it][A
Training...:   3% 443/13907 [16:31<6:16:24,  1.68s/it][A
Training...:   3% 444/13907 [16:33<6:09:21,  1.65s/it][A
Training...:   3% 445/13907 [16:34<6:00:03,  1.60s/it][A
Training...:   3% 446/13907 [16:36<5:49:09,  1.56s/it][A
Training...:   3% 447/13907 [16:37<5:38:09,  1.51s/it][A
Training...:   3% 448/13907 [16:38<5:26:05,  1.45s/it][A
Training...:   3% 449/13907 [16:39<5:09:36,  1.38s/it][A
Training...:   3% 450/13907 [16:40<4:45:09,  1.27s/it][A
Training...:   3% 451/13907 [16:44<7:26:14,  1.99s/it][A
Training...:   3% 452/13907 [16:48<9:07:49,  2.44s/it][A
Training...:   3% 453/13907 [16:51<10:01:47,  2.68s/it][A
Training...:   3% 454/13907 [16:54<10:33:00,  2.82s/it][A
Training...:   3% 455/13907 [16:57<10:48:04,  2.89s/it][A
Training...:   3% 456/13907 [17:00<10:53:26,  2.91s/it][A
Training...:   3% 457/13907 [17:03<10:51:42,  2.91s/it][A
Training...:   3% 458/13907 [17:06<10:48:05,  2.89s/it][A
Training...:   3% 459/13907 [17:09<10:38:46,  2.85s/it][A
Training...:   3% 460/13907 [17:11<10:32:39,  2.82s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:47:25<17:31:07, 31533.87s/it]
Training...:   3% 460/13907 [17:14<10:32:39,  2.82s/it][A
Training...:   3% 461/13907 [17:14<10:48:58,  2.90s/it][A
Training...:   3% 462/13907 [17:17<10:38:40,  2.85s/it][A
Training...:   3% 463/13907 [17:20<10:26:39,  2.80s/it][A
Training...:   3% 464/13907 [17:22<10:12:50,  2.74s/it][A
Training...:   3% 465/13907 [17:25<9:58:34,  2.67s/it] [A
Training...:   3% 466/13907 [17:27<9:46:28,  2.62s/it][A
Training...:   3% 467/13907 [17:30<9:37:17,  2.58s/it][A
Training...:   3% 468/13907 [17:32<9:29:51,  2.54s/it][A
Training...:   3% 469/13907 [17:35<9:15:28,  2.48s/it][A
Training...:   3% 470/13907 [17:37<9:03:30,  2.43s/it][A
Training...:   3% 471/13907 [17:39<8:54:06,  2.39s/it][A
Training...:   3% 472/13907 [17:42<8:43:59,  2.34s/it][A
Training...:   3% 473/13907 [17:44<8:35:23,  2.30s/it][A
Training...:   3% 474/13907 [17:46<8:26:27,  2.26s/it][A
Training...:   3% 475/13907 [17:48<8:19:11,  2.23s/it][A
Training...:   3% 476/13907 [17:50<8:12:25,  2.20s/it][A
Training...:   3% 477/13907 [17:52<8:06:47,  2.17s/it][A
Training...:   3% 478/13907 [17:54<7:58:47,  2.14s/it][A
Training...:   3% 479/13907 [17:56<7:52:26,  2.11s/it][A
Training...:   3% 480/13907 [17:58<7:46:27,  2.08s/it][A
Training...:   3% 481/13907 [18:00<7:40:35,  2.06s/it][A
Training...:   3% 482/13907 [18:02<7:34:46,  2.03s/it][A
Training...:   3% 483/13907 [18:04<7:28:11,  2.00s/it][A
Training...:   3% 484/13907 [18:06<7:22:34,  1.98s/it][A
Training...:   3% 485/13907 [18:08<7:16:30,  1.95s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:48:21<17:31:07, 31533.87s/it]
Training...:   3% 485/13907 [18:10<7:16:30,  1.95s/it][A
Training...:   3% 486/13907 [18:10<7:29:57,  2.01s/it][A
Training...:   4% 487/13907 [18:12<7:21:14,  1.97s/it][A
Training...:   4% 488/13907 [18:14<7:08:41,  1.92s/it][A
Training...:   4% 489/13907 [18:16<6:57:23,  1.87s/it][A
Training...:   4% 490/13907 [18:17<6:46:53,  1.82s/it][A
Training...:   4% 491/13907 [18:19<6:39:44,  1.79s/it][A
Training...:   4% 492/13907 [18:21<6:30:26,  1.75s/it][A
Training...:   4% 493/13907 [18:22<6:21:14,  1.71s/it][A
Training...:   4% 494/13907 [18:24<6:11:03,  1.66s/it][A
Training...:   4% 495/13907 [18:25<6:03:02,  1.62s/it][A
Training...:   4% 496/13907 [18:27<5:52:46,  1.58s/it][A
Training...:   4% 497/13907 [18:28<5:41:00,  1.53s/it][A
Training...:   4% 498/13907 [18:30<5:27:02,  1.46s/it][A
Training...:   4% 499/13907 [18:31<5:12:13,  1.40s/it][A
Training...:   4% 500/13907 [18:32<4:51:09,  1.30s/it][A
Training...:   4% 501/13907 [18:36<7:42:11,  2.07s/it][A
Training...:   4% 502/13907 [18:39<9:15:50,  2.49s/it][A
Training...:   4% 503/13907 [18:43<10:12:44,  2.74s/it][A
Training...:   4% 504/13907 [18:46<10:50:38,  2.91s/it][A
Training...:   4% 505/13907 [18:49<11:03:58,  2.97s/it][A
Training...:   4% 506/13907 [18:52<11:04:21,  2.97s/it][A
Training...:   4% 507/13907 [18:55<11:00:51,  2.96s/it][A
Training...:   4% 508/13907 [18:58<10:51:09,  2.92s/it][A
Training...:   4% 509/13907 [19:01<10:40:13,  2.87s/it][A
Training...:   4% 510/13907 [19:03<10:30:14,  2.82s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:49:17<17:31:07, 31533.87s/it]
Training...:   4% 510/13907 [19:06<10:30:14,  2.82s/it][A
Training...:   4% 511/13907 [19:06<10:47:13,  2.90s/it][A
Training...:   4% 512/13907 [19:09<10:33:47,  2.84s/it][A
Training...:   4% 513/13907 [19:12<10:14:49,  2.75s/it][A
Training...:   4% 514/13907 [19:14<9:59:57,  2.69s/it] [A
Training...:   4% 515/13907 [19:17<9:47:31,  2.63s/it][A
Training...:   4% 516/13907 [19:19<9:40:56,  2.60s/it][A
Training...:   4% 517/13907 [19:22<9:35:39,  2.58s/it][A
Training...:   4% 518/13907 [19:24<9:29:29,  2.55s/it][A
Training...:   4% 519/13907 [19:27<9:16:19,  2.49s/it][A
Training...:   4% 520/13907 [19:29<9:06:37,  2.45s/it][A
Training...:   4% 521/13907 [19:31<8:56:31,  2.40s/it][A
Training...:   4% 522/13907 [19:33<8:47:07,  2.36s/it][A
Training...:   4% 523/13907 [19:36<8:38:16,  2.32s/it][A
Training...:   4% 524/13907 [19:38<8:28:06,  2.28s/it][A
Training...:   4% 525/13907 [19:40<8:20:19,  2.24s/it][A
Training...:   4% 526/13907 [19:42<8:12:44,  2.21s/it][A
Training...:   4% 527/13907 [19:44<8:05:29,  2.18s/it][A
Training...:   4% 528/13907 [19:46<7:58:59,  2.15s/it][A
Training...:   4% 529/13907 [19:48<7:53:05,  2.12s/it][A
Training...:   4% 530/13907 [19:50<7:44:17,  2.08s/it][A
Training...:   4% 531/13907 [19:52<7:36:59,  2.05s/it][A
Training...:   4% 532/13907 [19:54<7:31:27,  2.03s/it][A
Training...:   4% 533/13907 [19:56<7:23:53,  1.99s/it][A
Training...:   4% 534/13907 [19:58<7:17:39,  1.96s/it][A
Training...:   4% 535/13907 [20:00<7:13:30,  1.95s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:50:13<17:31:07, 31533.87s/it]
Training...:   4% 535/13907 [20:02<7:13:30,  1.95s/it][A
Training...:   4% 536/13907 [20:02<7:29:28,  2.02s/it][A
Training...:   4% 537/13907 [20:04<7:20:54,  1.98s/it][A
Training...:   4% 538/13907 [20:06<7:06:21,  1.91s/it][A
Training...:   4% 539/13907 [20:08<6:53:39,  1.86s/it][A
Training...:   4% 540/13907 [20:09<6:42:47,  1.81s/it][A
Training...:   4% 541/13907 [20:11<6:34:30,  1.77s/it][A
Training...:   4% 542/13907 [20:13<6:24:18,  1.73s/it][A
Training...:   4% 543/13907 [20:14<6:15:31,  1.69s/it][A
Training...:   4% 544/13907 [20:16<6:07:15,  1.65s/it][A
Training...:   4% 545/13907 [20:17<5:56:29,  1.60s/it][A
Training...:   4% 546/13907 [20:19<5:44:54,  1.55s/it][A
Training...:   4% 547/13907 [20:20<5:33:07,  1.50s/it][A
Training...:   4% 548/13907 [20:21<5:19:28,  1.43s/it][A
Training...:   4% 549/13907 [20:23<5:04:01,  1.37s/it][A
Training...:   4% 550/13907 [20:24<4:42:26,  1.27s/it][A
Training...:   4% 551/13907 [20:27<7:20:10,  1.98s/it][A
Training...:   4% 552/13907 [20:31<8:57:23,  2.41s/it][A
Training...:   4% 553/13907 [20:34<9:48:11,  2.64s/it][A
Training...:   4% 554/13907 [20:37<10:18:04,  2.78s/it][A
Training...:   4% 555/13907 [20:40<10:33:03,  2.84s/it][A
Training...:   4% 556/13907 [20:43<10:39:02,  2.87s/it][A
Training...:   4% 557/13907 [20:46<10:38:54,  2.87s/it][A
Training...:   4% 558/13907 [20:49<10:32:48,  2.84s/it][A
Training...:   4% 559/13907 [20:51<10:26:07,  2.81s/it][A
Training...:   4% 560/13907 [20:54<10:17:12,  2.77s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:51:08<17:31:07, 31533.87s/it]
Training...:   4% 560/13907 [20:57<10:17:12,  2.77s/it][A
Training...:   4% 561/13907 [20:57<10:36:24,  2.86s/it][A
Training...:   4% 562/13907 [21:00<10:23:20,  2.80s/it][A
Training...:   4% 563/13907 [21:02<10:08:32,  2.74s/it][A
Training...:   4% 564/13907 [21:05<9:52:25,  2.66s/it] [A
Training...:   4% 565/13907 [21:07<9:39:48,  2.61s/it][A
Training...:   4% 566/13907 [21:10<9:26:52,  2.55s/it][A
Training...:   4% 567/13907 [21:12<9:17:36,  2.51s/it][A
Training...:   4% 568/13907 [21:14<9:08:19,  2.47s/it][A
Training...:   4% 569/13907 [21:17<9:02:51,  2.44s/it][A
Training...:   4% 570/13907 [21:19<8:52:49,  2.40s/it][A
Training...:   4% 571/13907 [21:21<8:45:51,  2.37s/it][A
Training...:   4% 572/13907 [21:24<8:39:07,  2.34s/it][A
Training...:   4% 573/13907 [21:26<8:31:26,  2.30s/it][A
Training...:   4% 574/13907 [21:28<8:25:44,  2.28s/it][A
Training...:   4% 575/13907 [21:30<8:20:16,  2.25s/it][A
Training...:   4% 576/13907 [21:32<8:13:30,  2.22s/it][A
Training...:   4% 577/13907 [21:35<8:07:44,  2.20s/it][A
Training...:   4% 578/13907 [21:37<7:59:52,  2.16s/it][A
Training...:   4% 579/13907 [21:39<7:52:18,  2.13s/it][A
Training...:   4% 580/13907 [21:41<7:43:19,  2.09s/it][A
Training...:   4% 581/13907 [21:43<7:37:59,  2.06s/it][A
Training...:   4% 582/13907 [21:45<7:31:04,  2.03s/it][A
Training...:   4% 583/13907 [21:47<7:23:54,  2.00s/it][A
Training...:   4% 584/13907 [21:48<7:16:23,  1.97s/it][A
Training...:   4% 585/13907 [21:50<7:09:51,  1.94s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:52:03<17:31:07, 31533.87s/it]
Training...:   4% 585/13907 [21:52<7:09:51,  1.94s/it][A
Training...:   4% 586/13907 [21:52<7:22:31,  1.99s/it][A
Training...:   4% 587/13907 [21:54<7:13:28,  1.95s/it][A
Training...:   4% 588/13907 [21:56<7:02:14,  1.90s/it][A
Training...:   4% 589/13907 [21:58<6:50:50,  1.85s/it][A
Training...:   4% 590/13907 [22:00<6:41:34,  1.81s/it][A
Training...:   4% 591/13907 [22:01<6:32:42,  1.77s/it][A
Training...:   4% 592/13907 [22:03<6:23:39,  1.73s/it][A
Training...:   4% 593/13907 [22:04<6:15:30,  1.69s/it][A
Training...:   4% 594/13907 [22:06<6:05:51,  1.65s/it][A
Training...:   4% 595/13907 [22:08<5:57:50,  1.61s/it][A
Training...:   4% 596/13907 [22:09<5:46:55,  1.56s/it][A
Training...:   4% 597/13907 [22:10<5:35:58,  1.51s/it][A
Training...:   4% 598/13907 [22:12<5:21:59,  1.45s/it][A
Training...:   4% 599/13907 [22:13<5:06:20,  1.38s/it][A
Training...:   4% 600/13907 [22:14<4:43:18,  1.28s/it][A
Training...:   4% 601/13907 [22:18<7:20:14,  1.99s/it][A
Training...:   4% 602/13907 [22:21<8:59:37,  2.43s/it][A
Training...:   4% 603/13907 [22:24<9:54:33,  2.68s/it][A
Training...:   4% 604/13907 [22:27<10:27:09,  2.83s/it][A
Training...:   4% 605/13907 [22:31<10:39:57,  2.89s/it][A
Training...:   4% 606/13907 [22:33<10:41:25,  2.89s/it][A
Training...:   4% 607/13907 [22:36<10:37:51,  2.88s/it][A
Training...:   4% 608/13907 [22:39<10:31:33,  2.85s/it][A
Training...:   4% 609/13907 [22:42<10:24:17,  2.82s/it][A
Training...:   4% 610/13907 [22:44<10:16:29,  2.78s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:52:59<17:31:07, 31533.87s/it]
Training...:   4% 610/13907 [22:48<10:16:29,  2.78s/it][A
Training...:   4% 611/13907 [22:48<10:35:38,  2.87s/it][A
Training...:   4% 612/13907 [22:50<10:25:41,  2.82s/it][A
Training...:   4% 613/13907 [22:53<10:08:13,  2.75s/it][A
Training...:   4% 614/13907 [22:55<9:54:51,  2.68s/it] [A
Training...:   4% 615/13907 [22:58<9:40:56,  2.62s/it][A
Training...:   4% 616/13907 [23:00<9:28:40,  2.57s/it][A
Training...:   4% 617/13907 [23:03<9:20:13,  2.53s/it][A
Training...:   4% 618/13907 [23:05<9:10:05,  2.48s/it][A
Training...:   4% 619/13907 [23:07<8:58:17,  2.43s/it][A
Training...:   4% 620/13907 [23:10<8:49:54,  2.39s/it][A
Training...:   4% 621/13907 [23:12<8:41:08,  2.35s/it][A
Training...:   4% 622/13907 [23:14<8:33:15,  2.32s/it][A
Training...:   4% 623/13907 [23:16<8:27:13,  2.29s/it][A
Training...:   4% 624/13907 [23:19<8:19:45,  2.26s/it][A
Training...:   4% 625/13907 [23:21<8:11:59,  2.22s/it][A
Training...:   5% 626/13907 [23:23<8:06:04,  2.20s/it][A
Training...:   5% 627/13907 [23:25<8:00:00,  2.17s/it][A
Training...:   5% 628/13907 [23:27<7:53:35,  2.14s/it][A
Training...:   5% 629/13907 [23:29<7:48:21,  2.12s/it][A
Training...:   5% 630/13907 [23:31<7:44:19,  2.10s/it][A
Training...:   5% 631/13907 [23:33<7:40:00,  2.08s/it][A
Training...:   5% 632/13907 [23:35<7:35:53,  2.06s/it][A
Training...:   5% 633/13907 [23:37<7:26:05,  2.02s/it][A
Training...:   5% 634/13907 [23:39<7:18:26,  1.98s/it][A
Training...:   5% 635/13907 [23:41<7:11:26,  1.95s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:53:54<17:31:07, 31533.87s/it]
Training...:   5% 635/13907 [23:43<7:11:26,  1.95s/it][A
Training...:   5% 636/13907 [23:43<7:22:50,  2.00s/it][A
Training...:   5% 637/13907 [23:45<7:14:26,  1.96s/it][A
Training...:   5% 638/13907 [23:47<7:01:30,  1.91s/it][A
Training...:   5% 639/13907 [23:48<6:50:02,  1.85s/it][A
Training...:   5% 640/13907 [23:50<6:39:28,  1.81s/it][A
Training...:   5% 641/13907 [23:52<6:29:06,  1.76s/it][A
Training...:   5% 642/13907 [23:53<6:20:19,  1.72s/it][A
Training...:   5% 643/13907 [23:55<6:10:35,  1.68s/it][A
Training...:   5% 644/13907 [23:57<6:02:26,  1.64s/it][A
Training...:   5% 645/13907 [23:58<5:53:05,  1.60s/it][A
Training...:   5% 646/13907 [23:59<5:40:56,  1.54s/it][A
Training...:   5% 647/13907 [24:01<5:29:55,  1.49s/it][A
Training...:   5% 648/13907 [24:02<5:17:20,  1.44s/it][A
Training...:   5% 649/13907 [24:03<5:02:53,  1.37s/it][A
Training...:   5% 650/13907 [24:04<4:43:10,  1.28s/it][A
Training...:   5% 651/13907 [24:08<7:24:16,  2.01s/it][A
Training...:   5% 652/13907 [24:12<9:04:32,  2.46s/it][A
Training...:   5% 653/13907 [24:15<9:56:44,  2.70s/it][A
Training...:   5% 654/13907 [24:18<10:23:51,  2.82s/it][A
Training...:   5% 655/13907 [24:21<10:35:34,  2.88s/it][A
Training...:   5% 656/13907 [24:24<10:42:01,  2.91s/it][A
Training...:   5% 657/13907 [24:27<10:44:24,  2.92s/it][A
Training...:   5% 658/13907 [24:30<10:39:30,  2.90s/it][A
Training...:   5% 659/13907 [24:33<10:28:54,  2.85s/it][A
Training...:   5% 660/13907 [24:35<10:18:40,  2.80s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:54:49<17:31:07, 31533.87s/it]
Training...:   5% 660/13907 [24:38<10:18:40,  2.80s/it][A
Training...:   5% 661/13907 [24:38<10:34:29,  2.87s/it][A
Training...:   5% 662/13907 [24:41<10:23:27,  2.82s/it][A
Training...:   5% 663/13907 [24:44<10:03:26,  2.73s/it][A
Training...:   5% 664/13907 [24:46<9:48:12,  2.66s/it] [A
Training...:   5% 665/13907 [24:48<9:33:53,  2.60s/it][A
Training...:   5% 666/13907 [24:51<9:26:37,  2.57s/it][A
Training...:   5% 667/13907 [24:53<9:17:17,  2.53s/it][A
Training...:   5% 668/13907 [24:56<9:11:24,  2.50s/it][A
Training...:   5% 669/13907 [24:58<8:59:36,  2.45s/it][A
Training...:   5% 670/13907 [25:00<8:49:24,  2.40s/it][A
Training...:   5% 671/13907 [25:03<8:42:55,  2.37s/it][A
Training...:   5% 672/13907 [25:05<8:35:28,  2.34s/it][A
Training...:   5% 673/13907 [25:07<8:26:57,  2.30s/it][A
Training...:   5% 674/13907 [25:09<8:20:44,  2.27s/it][A
Training...:   5% 675/13907 [25:12<8:14:17,  2.24s/it][A
Training...:   5% 676/13907 [25:14<8:07:55,  2.21s/it][A
Training...:   5% 677/13907 [25:16<8:01:16,  2.18s/it][A
Training...:   5% 678/13907 [25:18<7:53:39,  2.15s/it][A
Training...:   5% 679/13907 [25:20<7:46:59,  2.12s/it][A
Training...:   5% 680/13907 [25:22<7:40:53,  2.09s/it][A
Training...:   5% 681/13907 [25:24<7:34:25,  2.06s/it][A
Training...:   5% 682/13907 [25:26<7:29:20,  2.04s/it][A
Training...:   5% 683/13907 [25:28<7:26:08,  2.02s/it][A
Training...:   5% 684/13907 [25:30<7:22:46,  2.01s/it][A
Training...:   5% 685/13907 [25:32<7:14:50,  1.97s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:55:45<17:31:07, 31533.87s/it]
Training...:   5% 685/13907 [25:34<7:14:50,  1.97s/it][A
Training...:   5% 686/13907 [25:34<7:28:00,  2.03s/it][A
Training...:   5% 687/13907 [25:36<7:18:27,  1.99s/it][A
Training...:   5% 688/13907 [25:38<7:03:36,  1.92s/it][A
Training...:   5% 689/13907 [25:39<6:50:59,  1.87s/it][A
Training...:   5% 690/13907 [25:41<6:40:26,  1.82s/it][A
Training...:   5% 691/13907 [25:43<6:29:25,  1.77s/it][A
Training...:   5% 692/13907 [25:44<6:20:46,  1.73s/it][A
Training...:   5% 693/13907 [25:46<6:11:11,  1.69s/it][A
Training...:   5% 694/13907 [25:48<6:03:26,  1.65s/it][A
Training...:   5% 695/13907 [25:49<5:54:09,  1.61s/it][A
Training...:   5% 696/13907 [25:50<5:42:35,  1.56s/it][A
Training...:   5% 697/13907 [25:52<5:30:17,  1.50s/it][A
Training...:   5% 698/13907 [25:53<5:16:54,  1.44s/it][A
Training...:   5% 699/13907 [25:54<5:02:35,  1.37s/it][A
Training...:   5% 700/13907 [25:55<4:41:20,  1.28s/it][A
Training...:   5% 701/13907 [25:59<7:25:25,  2.02s/it][A
Training...:   5% 702/13907 [26:03<9:04:56,  2.48s/it][A
Training...:   5% 703/13907 [26:06<9:58:28,  2.72s/it][A
Training...:   5% 704/13907 [26:09<10:29:10,  2.86s/it][A
Training...:   5% 705/13907 [26:12<10:44:21,  2.93s/it][A
Training...:   5% 706/13907 [26:15<10:45:09,  2.93s/it][A
Training...:   5% 707/13907 [26:18<10:41:55,  2.92s/it][A
Training...:   5% 708/13907 [26:21<10:34:33,  2.88s/it][A
Training...:   5% 709/13907 [26:24<10:25:52,  2.85s/it][A
Training...:   5% 710/13907 [26:26<10:22:52,  2.83s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:56:41<17:31:07, 31533.87s/it]
Training...:   5% 710/13907 [26:30<10:22:52,  2.83s/it][A
Training...:   5% 711/13907 [26:30<10:41:22,  2.92s/it][A
Training...:   5% 712/13907 [26:32<10:25:51,  2.85s/it][A
Training...:   5% 713/13907 [26:35<10:06:43,  2.76s/it][A
Training...:   5% 714/13907 [26:37<9:51:52,  2.69s/it] [A
Training...:   5% 715/13907 [26:40<9:38:36,  2.63s/it][A
Training...:   5% 716/13907 [26:42<9:27:24,  2.58s/it][A
Training...:   5% 717/13907 [26:45<9:19:08,  2.54s/it][A
Training...:   5% 718/13907 [26:47<9:08:36,  2.50s/it][A
Training...:   5% 719/13907 [26:49<8:58:38,  2.45s/it][A
Training...:   5% 720/13907 [26:52<8:49:39,  2.41s/it][A
Training...:   5% 721/13907 [26:54<8:43:09,  2.38s/it][A
Training...:   5% 722/13907 [26:56<8:35:31,  2.35s/it][A
Training...:   5% 723/13907 [26:59<8:25:21,  2.30s/it][A
Training...:   5% 724/13907 [27:01<8:17:45,  2.27s/it][A
Training...:   5% 725/13907 [27:03<8:09:52,  2.23s/it][A
Training...:   5% 726/13907 [27:05<8:03:58,  2.20s/it][A
Training...:   5% 727/13907 [27:07<7:58:02,  2.18s/it][A
Training...:   5% 728/13907 [27:09<7:50:49,  2.14s/it][A
Training...:   5% 729/13907 [27:11<7:46:28,  2.12s/it][A
Training...:   5% 730/13907 [27:13<7:39:21,  2.09s/it][A
Training...:   5% 731/13907 [27:15<7:31:23,  2.06s/it][A
Training...:   5% 732/13907 [27:17<7:25:56,  2.03s/it][A
Training...:   5% 733/13907 [27:19<7:20:05,  2.00s/it][A
Training...:   5% 734/13907 [27:21<7:13:01,  1.97s/it][A
Training...:   5% 735/13907 [27:23<7:08:11,  1.95s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:57:36<17:31:07, 31533.87s/it]
Training...:   5% 735/13907 [27:25<7:08:11,  1.95s/it][A
Training...:   5% 736/13907 [27:25<7:21:10,  2.01s/it][A
Training...:   5% 737/13907 [27:27<7:10:53,  1.96s/it][A
Training...:   5% 738/13907 [27:29<6:56:39,  1.90s/it][A
Training...:   5% 739/13907 [27:30<6:45:20,  1.85s/it][A
Training...:   5% 740/13907 [27:32<6:34:35,  1.80s/it][A
Training...:   5% 741/13907 [27:34<6:25:58,  1.76s/it][A
Training...:   5% 742/13907 [27:35<6:15:49,  1.71s/it][A
Training...:   5% 743/13907 [27:37<6:06:30,  1.67s/it][A
Training...:   5% 744/13907 [27:39<5:57:54,  1.63s/it][A
Training...:   5% 745/13907 [27:40<5:49:17,  1.59s/it][A
Training...:   5% 746/13907 [27:42<5:40:48,  1.55s/it][A
Training...:   5% 747/13907 [27:43<5:30:19,  1.51s/it][A
Training...:   5% 748/13907 [27:44<5:17:43,  1.45s/it][A
Training...:   5% 749/13907 [27:45<5:03:23,  1.38s/it][A
Training...:   5% 750/13907 [27:46<4:41:28,  1.28s/it][A
Training...:   5% 751/13907 [27:50<7:20:24,  2.01s/it][A
Training...:   5% 752/13907 [27:54<8:53:28,  2.43s/it][A
Training...:   5% 753/13907 [27:57<9:41:04,  2.65s/it][A
Training...:   5% 754/13907 [28:00<10:08:37,  2.78s/it][A
Training...:   5% 755/13907 [28:03<10:21:41,  2.84s/it][A
Training...:   5% 756/13907 [28:06<10:25:37,  2.85s/it][A
Training...:   5% 757/13907 [28:09<10:24:50,  2.85s/it][A
Training...:   5% 758/13907 [28:11<10:20:57,  2.83s/it][A
Training...:   5% 759/13907 [28:14<10:14:58,  2.81s/it][A
Training...:   5% 760/13907 [28:17<10:08:58,  2.78s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:58:31<17:31:07, 31533.87s/it]
Training...:   5% 760/13907 [28:20<10:08:58,  2.78s/it][A
Training...:   5% 761/13907 [28:20<10:27:38,  2.86s/it][A
Training...:   5% 762/13907 [28:23<10:18:40,  2.82s/it][A
Training...:   5% 763/13907 [28:25<10:02:10,  2.75s/it][A
Training...:   5% 764/13907 [28:28<9:46:30,  2.68s/it] [A
Training...:   6% 765/13907 [28:30<9:35:33,  2.63s/it][A
Training...:   6% 766/13907 [28:33<9:25:02,  2.58s/it][A
Training...:   6% 767/13907 [28:35<9:19:22,  2.55s/it][A
Training...:   6% 768/13907 [28:38<9:16:22,  2.54s/it][A
Training...:   6% 769/13907 [28:40<9:13:59,  2.53s/it][A
Training...:   6% 770/13907 [28:43<9:05:36,  2.49s/it][A
Training...:   6% 771/13907 [28:45<8:55:27,  2.45s/it][A
Training...:   6% 772/13907 [28:47<8:41:20,  2.38s/it][A
Training...:   6% 773/13907 [28:49<8:30:32,  2.33s/it][A
Training...:   6% 774/13907 [28:52<8:19:55,  2.28s/it][A
Training...:   6% 775/13907 [28:54<8:10:10,  2.24s/it][A
Training...:   6% 776/13907 [28:56<8:02:30,  2.20s/it][A
Training...:   6% 777/13907 [28:58<7:52:58,  2.16s/it][A
Training...:   6% 778/13907 [29:00<7:45:44,  2.13s/it][A
Training...:   6% 779/13907 [29:02<7:37:45,  2.09s/it][A
Training...:   6% 780/13907 [29:04<7:30:43,  2.06s/it][A
Training...:   6% 781/13907 [29:06<7:27:51,  2.05s/it][A
Training...:   6% 782/13907 [29:08<7:19:19,  2.01s/it][A
Training...:   6% 783/13907 [29:10<7:12:55,  1.98s/it][A
Training...:   6% 784/13907 [29:12<7:06:16,  1.95s/it][A
Training...:   6% 785/13907 [29:13<6:59:57,  1.92s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [17:59:27<17:31:07, 31533.87s/it]
Training...:   6% 785/13907 [29:16<6:59:57,  1.92s/it][A
Training...:   6% 786/13907 [29:16<7:13:53,  1.98s/it][A
Training...:   6% 787/13907 [29:17<7:05:32,  1.95s/it][A
Training...:   6% 788/13907 [29:19<6:52:01,  1.88s/it][A
Training...:   6% 789/13907 [29:21<6:40:48,  1.83s/it][A
Training...:   6% 790/13907 [29:23<6:32:23,  1.79s/it][A
Training...:   6% 791/13907 [29:24<6:23:37,  1.75s/it][A
Training...:   6% 792/13907 [29:26<6:14:34,  1.71s/it][A
Training...:   6% 793/13907 [29:27<6:05:21,  1.67s/it][A
Training...:   6% 794/13907 [29:29<5:58:44,  1.64s/it][A
Training...:   6% 795/13907 [29:31<5:49:22,  1.60s/it][A
Training...:   6% 796/13907 [29:32<5:38:33,  1.55s/it][A
Training...:   6% 797/13907 [29:33<5:27:27,  1.50s/it][A
Training...:   6% 798/13907 [29:35<5:16:10,  1.45s/it][A
Training...:   6% 799/13907 [29:36<5:03:20,  1.39s/it][A
Training...:   6% 800/13907 [29:37<4:42:29,  1.29s/it][A
Training...:   6% 801/13907 [29:41<7:18:54,  2.01s/it][A
Training...:   6% 802/13907 [29:44<8:53:17,  2.44s/it][A
Training...:   6% 803/13907 [29:47<9:47:33,  2.69s/it][A
Training...:   6% 804/13907 [29:51<10:18:02,  2.83s/it][A
Training...:   6% 805/13907 [29:54<10:36:40,  2.92s/it][A
Training...:   6% 806/13907 [29:57<10:42:58,  2.94s/it][A
Training...:   6% 807/13907 [30:00<10:39:09,  2.93s/it][A
Training...:   6% 808/13907 [30:02<10:29:40,  2.88s/it][A
Training...:   6% 809/13907 [30:05<10:20:40,  2.84s/it][A
Training...:   6% 810/13907 [30:08<10:11:03,  2.80s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:00:22<17:31:07, 31533.87s/it]
Training...:   6% 810/13907 [30:11<10:11:03,  2.80s/it][A
Training...:   6% 811/13907 [30:11<10:27:18,  2.87s/it][A
Training...:   6% 812/13907 [30:14<10:12:17,  2.81s/it][A
Training...:   6% 813/13907 [30:16<9:55:04,  2.73s/it] [A
Training...:   6% 814/13907 [30:19<9:39:07,  2.65s/it][A
Training...:   6% 815/13907 [30:21<9:24:41,  2.59s/it][A
Training...:   6% 816/13907 [30:23<9:15:38,  2.55s/it][A
Training...:   6% 817/13907 [30:26<9:04:49,  2.50s/it][A
Training...:   6% 818/13907 [30:28<8:59:12,  2.47s/it][A
Training...:   6% 819/13907 [30:31<8:54:03,  2.45s/it][A
Training...:   6% 820/13907 [30:33<8:48:13,  2.42s/it][A
Training...:   6% 821/13907 [30:35<8:34:43,  2.36s/it][A
Training...:   6% 822/13907 [30:37<8:27:46,  2.33s/it][A
Training...:   6% 823/13907 [30:40<8:18:41,  2.29s/it][A
Training...:   6% 824/13907 [30:42<8:10:33,  2.25s/it][A
Training...:   6% 825/13907 [30:44<8:02:17,  2.21s/it][A
Training...:   6% 826/13907 [30:46<7:54:45,  2.18s/it][A
Training...:   6% 827/13907 [30:48<7:47:58,  2.15s/it][A
Training...:   6% 828/13907 [30:50<7:40:27,  2.11s/it][A
Training...:   6% 829/13907 [30:52<7:34:33,  2.09s/it][A
Training...:   6% 830/13907 [30:54<7:28:35,  2.06s/it][A
Training...:   6% 831/13907 [30:56<7:23:00,  2.03s/it][A
Training...:   6% 832/13907 [30:58<7:21:35,  2.03s/it][A
Training...:   6% 833/13907 [31:00<7:15:16,  2.00s/it][A
Training...:   6% 834/13907 [31:02<7:08:01,  1.96s/it][A
Training...:   6% 835/13907 [31:04<7:00:05,  1.93s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:01:17<17:31:07, 31533.87s/it]
Training...:   6% 835/13907 [31:06<7:00:05,  1.93s/it][A
Training...:   6% 836/13907 [31:06<7:12:34,  1.99s/it][A
Training...:   6% 837/13907 [31:08<7:04:22,  1.95s/it][A
Training...:   6% 838/13907 [31:10<6:51:03,  1.89s/it][A
Training...:   6% 839/13907 [31:11<6:40:41,  1.84s/it][A
Training...:   6% 840/13907 [31:13<6:30:00,  1.79s/it][A
Training...:   6% 841/13907 [31:15<6:19:55,  1.74s/it][A
Training...:   6% 842/13907 [31:16<6:11:09,  1.70s/it][A
Training...:   6% 843/13907 [31:18<6:03:13,  1.67s/it][A
Training...:   6% 844/13907 [31:19<5:56:04,  1.64s/it][A
Training...:   6% 845/13907 [31:21<5:47:15,  1.60s/it][A
Training...:   6% 846/13907 [31:22<5:37:53,  1.55s/it][A
Training...:   6% 847/13907 [31:24<5:27:24,  1.50s/it][A
Training...:   6% 848/13907 [31:25<5:13:52,  1.44s/it][A
Training...:   6% 849/13907 [31:26<4:58:59,  1.37s/it][A
Training...:   6% 850/13907 [31:27<4:39:13,  1.28s/it][A
Training...:   6% 851/13907 [31:31<7:15:59,  2.00s/it][A
Training...:   6% 852/13907 [31:34<8:48:48,  2.43s/it][A
Training...:   6% 853/13907 [31:38<9:42:25,  2.68s/it][A
Training...:   6% 854/13907 [31:41<10:15:27,  2.83s/it][A
Training...:   6% 855/13907 [31:44<10:31:30,  2.90s/it][A
Training...:   6% 856/13907 [31:47<10:35:47,  2.92s/it][A
Training...:   6% 857/13907 [31:50<10:34:29,  2.92s/it][A
Training...:   6% 858/13907 [31:53<10:27:54,  2.89s/it][A
Training...:   6% 859/13907 [31:55<10:19:26,  2.85s/it][A
Training...:   6% 860/13907 [31:58<10:09:42,  2.80s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:02:12<17:31:07, 31533.87s/it]
Training...:   6% 860/13907 [32:01<10:09:42,  2.80s/it][A
Training...:   6% 861/13907 [32:01<10:30:39,  2.90s/it][A
Training...:   6% 862/13907 [32:04<10:17:28,  2.84s/it][A
Training...:   6% 863/13907 [32:07<10:08:11,  2.80s/it][A
Training...:   6% 864/13907 [32:09<9:53:36,  2.73s/it] [A
Training...:   6% 865/13907 [32:12<9:45:18,  2.69s/it][A
Training...:   6% 866/13907 [32:14<9:36:00,  2.65s/it][A
Training...:   6% 867/13907 [32:17<9:24:15,  2.60s/it][A
Training...:   6% 868/13907 [32:19<9:13:13,  2.55s/it][A
Training...:   6% 869/13907 [32:22<9:02:50,  2.50s/it][A
Training...:   6% 870/13907 [32:24<8:54:45,  2.46s/it][A
Training...:   6% 871/13907 [32:26<8:45:01,  2.42s/it][A
Training...:   6% 872/13907 [32:29<8:36:37,  2.38s/it][A
Training...:   6% 873/13907 [32:31<8:29:36,  2.35s/it][A
Training...:   6% 874/13907 [32:33<8:20:25,  2.30s/it][A
Training...:   6% 875/13907 [32:35<8:11:28,  2.26s/it][A
Training...:   6% 876/13907 [32:37<8:03:03,  2.22s/it][A
Training...:   6% 877/13907 [32:39<7:54:48,  2.19s/it][A
Training...:   6% 878/13907 [32:41<7:48:30,  2.16s/it][A
Training...:   6% 879/13907 [32:44<7:40:06,  2.12s/it][A
Training...:   6% 880/13907 [32:46<7:32:52,  2.09s/it][A
Training...:   6% 881/13907 [32:48<7:26:39,  2.06s/it][A
Training...:   6% 882/13907 [32:49<7:19:59,  2.03s/it][A
Training...:   6% 883/13907 [32:51<7:13:45,  2.00s/it][A
Training...:   6% 884/13907 [32:53<7:07:12,  1.97s/it][A
Training...:   6% 885/13907 [32:55<7:02:12,  1.95s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:03:08<17:31:07, 31533.87s/it]
Training...:   6% 885/13907 [32:57<7:02:12,  1.95s/it][A
Training...:   6% 886/13907 [32:57<7:15:42,  2.01s/it][A
Training...:   6% 887/13907 [32:59<7:07:28,  1.97s/it][A
Training...:   6% 888/13907 [33:01<6:55:30,  1.91s/it][A
Training...:   6% 889/13907 [33:03<6:44:18,  1.86s/it][A
Training...:   6% 890/13907 [33:04<6:33:27,  1.81s/it][A
Training...:   6% 891/13907 [33:06<6:23:54,  1.77s/it][A
Training...:   6% 892/13907 [33:08<6:14:13,  1.73s/it][A
Training...:   6% 893/13907 [33:09<6:05:44,  1.69s/it][A
Training...:   6% 894/13907 [33:11<5:58:09,  1.65s/it][A
Training...:   6% 895/13907 [33:12<5:49:19,  1.61s/it][A
Training...:   6% 896/13907 [33:14<5:38:04,  1.56s/it][A
Training...:   6% 897/13907 [33:15<5:27:06,  1.51s/it][A
Training...:   6% 898/13907 [33:17<5:14:40,  1.45s/it][A
Training...:   6% 899/13907 [33:18<5:00:53,  1.39s/it][A
Training...:   6% 900/13907 [33:19<4:39:57,  1.29s/it][A
Training...:   6% 901/13907 [33:23<7:13:43,  2.00s/it][A
Training...:   6% 902/13907 [33:26<8:47:24,  2.43s/it][A
Training...:   6% 903/13907 [33:29<9:44:33,  2.70s/it][A
Training...:   7% 904/13907 [33:32<10:11:15,  2.82s/it][A
Training...:   7% 905/13907 [33:35<10:20:15,  2.86s/it][A
Training...:   7% 906/13907 [33:38<10:22:53,  2.87s/it][A
Training...:   7% 907/13907 [33:41<10:18:14,  2.85s/it][A
Training...:   7% 908/13907 [33:44<10:10:54,  2.82s/it][A
Training...:   7% 909/13907 [33:47<10:04:28,  2.79s/it][A
Training...:   7% 910/13907 [33:49<9:56:15,  2.75s/it] [A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:04:03<17:31:07, 31533.87s/it]
Training...:   7% 910/13907 [33:52<9:56:15,  2.75s/it][A
Training...:   7% 911/13907 [33:52<10:13:44,  2.83s/it][A
Training...:   7% 912/13907 [33:55<10:04:45,  2.79s/it][A
Training...:   7% 913/13907 [33:57<9:48:24,  2.72s/it] [A
Training...:   7% 914/13907 [34:00<9:35:40,  2.66s/it][A
Training...:   7% 915/13907 [34:02<9:25:41,  2.61s/it][A
Training...:   7% 916/13907 [34:05<9:19:49,  2.59s/it][A
Training...:   7% 917/13907 [34:07<9:11:21,  2.55s/it][A
Training...:   7% 918/13907 [34:10<9:03:51,  2.51s/it][A
Training...:   7% 919/13907 [34:12<8:56:22,  2.48s/it][A
Training...:   7% 920/13907 [34:15<8:47:17,  2.44s/it][A
Training...:   7% 921/13907 [34:17<8:41:23,  2.41s/it][A
Training...:   7% 922/13907 [34:19<8:32:38,  2.37s/it][A
Training...:   7% 923/13907 [34:21<8:24:35,  2.33s/it][A
Training...:   7% 924/13907 [34:24<8:17:30,  2.30s/it][A
Training...:   7% 925/13907 [34:26<8:05:07,  2.24s/it][A
Training...:   7% 926/13907 [34:28<7:54:45,  2.19s/it][A
Training...:   7% 927/13907 [34:30<7:45:06,  2.15s/it][A
Training...:   7% 928/13907 [34:32<7:37:17,  2.11s/it][A
Training...:   7% 929/13907 [34:34<7:29:53,  2.08s/it][A
Training...:   7% 930/13907 [34:36<7:22:58,  2.05s/it][A
Training...:   7% 931/13907 [34:38<7:16:46,  2.02s/it][A
Training...:   7% 932/13907 [34:40<7:10:35,  1.99s/it][A
Training...:   7% 933/13907 [34:42<7:03:50,  1.96s/it][A
Training...:   7% 934/13907 [34:44<6:57:54,  1.93s/it][A
Training...:   7% 935/13907 [34:45<6:51:46,  1.90s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:04:59<17:31:07, 31533.87s/it]
Training...:   7% 935/13907 [34:48<6:51:46,  1.90s/it][A
Training...:   7% 936/13907 [34:48<7:04:14,  1.96s/it][A
Training...:   7% 937/13907 [34:49<6:55:11,  1.92s/it][A
Training...:   7% 938/13907 [34:51<6:42:27,  1.86s/it][A
Training...:   7% 939/13907 [34:53<6:32:08,  1.81s/it][A
Training...:   7% 940/13907 [34:54<6:22:43,  1.77s/it][A
Training...:   7% 941/13907 [34:56<6:13:20,  1.73s/it][A
Training...:   7% 942/13907 [34:58<6:05:46,  1.69s/it][A
Training...:   7% 943/13907 [34:59<5:58:10,  1.66s/it][A
Training...:   7% 944/13907 [35:01<5:51:29,  1.63s/it][A
Training...:   7% 945/13907 [35:02<5:43:03,  1.59s/it][A
Training...:   7% 946/13907 [35:04<5:34:23,  1.55s/it][A
Training...:   7% 947/13907 [35:05<5:23:37,  1.50s/it][A
Training...:   7% 948/13907 [35:06<5:12:58,  1.45s/it][A
Training...:   7% 949/13907 [35:08<4:58:42,  1.38s/it][A
Training...:   7% 950/13907 [35:09<4:36:38,  1.28s/it][A
Training...:   7% 951/13907 [35:13<7:24:40,  2.06s/it][A
Training...:   7% 952/13907 [35:16<8:58:17,  2.49s/it][A
Training...:   7% 953/13907 [35:19<9:45:35,  2.71s/it][A
Training...:   7% 954/13907 [35:23<10:21:19,  2.88s/it][A
Training...:   7% 955/13907 [35:26<10:34:59,  2.94s/it][A
Training...:   7% 956/13907 [35:29<10:34:27,  2.94s/it][A
Training...:   7% 957/13907 [35:31<10:28:17,  2.91s/it][A
Training...:   7% 958/13907 [35:34<10:20:37,  2.88s/it][A
Training...:   7% 959/13907 [35:37<10:10:56,  2.83s/it][A
Training...:   7% 960/13907 [35:40<10:02:44,  2.79s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:05:54<17:31:07, 31533.87s/it]
Training...:   7% 960/13907 [35:43<10:02:44,  2.79s/it][A
Training...:   7% 961/13907 [35:43<10:20:23,  2.88s/it][A
Training...:   7% 962/13907 [35:46<10:11:00,  2.83s/it][A
Training...:   7% 963/13907 [35:48<9:58:51,  2.78s/it] [A
Training...:   7% 964/13907 [35:51<9:42:24,  2.70s/it][A
Training...:   7% 965/13907 [35:53<9:29:30,  2.64s/it][A
Training...:   7% 966/13907 [35:56<9:18:35,  2.59s/it][A
Training...:   7% 967/13907 [35:58<9:13:39,  2.57s/it][A
Training...:   7% 968/13907 [36:01<9:08:54,  2.55s/it][A
Training...:   7% 969/13907 [36:03<8:56:09,  2.49s/it][A
Training...:   7% 970/13907 [36:05<8:48:32,  2.45s/it][A
Training...:   7% 971/13907 [36:08<8:39:18,  2.41s/it][A
Training...:   7% 972/13907 [36:10<8:32:36,  2.38s/it][A
Training...:   7% 973/13907 [36:12<8:22:56,  2.33s/it][A
Training...:   7% 974/13907 [36:14<8:15:38,  2.30s/it][A
Training...:   7% 975/13907 [36:17<8:08:43,  2.27s/it][A
Training...:   7% 976/13907 [36:19<8:01:07,  2.23s/it][A
Training...:   7% 977/13907 [36:21<7:53:24,  2.20s/it][A
Training...:   7% 978/13907 [36:23<7:46:20,  2.16s/it][A
Training...:   7% 979/13907 [36:25<7:38:15,  2.13s/it][A
Training...:   7% 980/13907 [36:27<7:30:05,  2.09s/it][A
Training...:   7% 981/13907 [36:29<7:25:27,  2.07s/it][A
Training...:   7% 982/13907 [36:31<7:21:43,  2.05s/it][A
Training...:   7% 983/13907 [36:33<7:17:25,  2.03s/it][A
Training...:   7% 984/13907 [36:35<7:08:13,  1.99s/it][A
Training...:   7% 985/13907 [36:37<6:59:19,  1.95s/it][A                                                                                                                            
                                                      [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:06:50<17:31:07, 31533.87s/it]
Training...:   7% 985/13907 [36:39<6:59:19,  1.95s/it][A
Training...:   7% 986/13907 [36:39<7:13:03,  2.01s/it][A
Training...:   7% 987/13907 [36:41<7:03:40,  1.97s/it][A
Training...:   7% 988/13907 [36:43<6:49:47,  1.90s/it][A
Training...:   7% 989/13907 [36:44<6:38:28,  1.85s/it][A
Training...:   7% 990/13907 [36:46<6:27:11,  1.80s/it][A
Training...:   7% 991/13907 [36:48<6:17:05,  1.75s/it][A
Training...:   7% 992/13907 [36:49<6:07:28,  1.71s/it][A
Training...:   7% 993/13907 [36:51<5:58:43,  1.67s/it][A
Training...:   7% 994/13907 [36:52<5:50:19,  1.63s/it][A
Training...:   7% 995/13907 [36:54<5:40:02,  1.58s/it][A
Training...:   7% 996/13907 [36:55<5:28:44,  1.53s/it][A
Training...:   7% 997/13907 [36:57<5:17:28,  1.48s/it][A
Training...:   7% 998/13907 [36:58<5:04:01,  1.41s/it][A
Training...:   7% 999/13907 [36:59<4:48:55,  1.34s/it][A
Training...:   7% 1000/13907 [37:00<4:26:21,  1.24s/it][A
Training...:   7% 1001/13907 [37:04<7:04:18,  1.97s/it][A
Training...:   7% 1002/13907 [37:07<8:37:58,  2.41s/it][A
Training...:   7% 1003/13907 [37:10<9:28:17,  2.64s/it][A
Training...:   7% 1004/13907 [37:13<9:54:24,  2.76s/it][A
Training...:   7% 1005/13907 [37:16<10:11:47,  2.85s/it][A
Training...:   7% 1006/13907 [37:19<10:17:35,  2.87s/it][A
Training...:   7% 1007/13907 [37:22<10:18:16,  2.88s/it][A
Training...:   7% 1008/13907 [37:25<10:13:32,  2.85s/it][A
Training...:   7% 1009/13907 [37:28<10:05:43,  2.82s/it][A
Training...:   7% 1010/13907 [37:30<9:57:10,  2.78s/it] [A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:07:45<17:31:07, 31533.87s/it]
Training...:   7% 1010/13907 [37:34<9:57:10,  2.78s/it][A
Training...:   7% 1011/13907 [37:34<10:17:36,  2.87s/it][A
Training...:   7% 1012/13907 [37:36<10:07:29,  2.83s/it][A
Training...:   7% 1013/13907 [37:39<9:58:20,  2.78s/it] [A
Training...:   7% 1014/13907 [37:42<9:45:51,  2.73s/it][A
Training...:   7% 1015/13907 [37:44<9:34:14,  2.67s/it][A
Training...:   7% 1016/13907 [37:47<9:20:55,  2.61s/it][A
Training...:   7% 1017/13907 [37:49<9:08:35,  2.55s/it][A
Training...:   7% 1018/13907 [37:51<9:01:22,  2.52s/it][A
Training...:   7% 1019/13907 [37:54<8:49:27,  2.46s/it][A
Training...:   7% 1020/13907 [37:56<8:38:51,  2.42s/it][A
Training...:   7% 1021/13907 [37:58<8:32:23,  2.39s/it][A
Training...:   7% 1022/13907 [38:01<8:23:18,  2.34s/it][A
Training...:   7% 1023/13907 [38:03<8:14:09,  2.30s/it][A
Training...:   7% 1024/13907 [38:05<8:05:53,  2.26s/it][A
Training...:   7% 1025/13907 [38:07<7:58:05,  2.23s/it][A
Training...:   7% 1026/13907 [38:09<7:51:08,  2.19s/it][A
Training...:   7% 1027/13907 [38:11<7:43:28,  2.16s/it][A
Training...:   7% 1028/13907 [38:13<7:38:18,  2.14s/it][A
Training...:   7% 1029/13907 [38:15<7:32:58,  2.11s/it][A
Training...:   7% 1030/13907 [38:17<7:27:26,  2.08s/it][A
Training...:   7% 1031/13907 [38:19<7:21:10,  2.06s/it][A
Training...:   7% 1032/13907 [38:21<7:15:12,  2.03s/it][A
Training...:   7% 1033/13907 [38:23<7:09:45,  2.00s/it][A
Training...:   7% 1034/13907 [38:25<7:03:24,  1.97s/it][A
Training...:   7% 1035/13907 [38:27<6:56:17,  1.94s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:08:40<17:31:07, 31533.87s/it]
Training...:   7% 1035/13907 [38:29<6:56:17,  1.94s/it][A
Training...:   7% 1036/13907 [38:29<7:09:47,  2.00s/it][A
Training...:   7% 1037/13907 [38:31<7:01:26,  1.96s/it][A
Training...:   7% 1038/13907 [38:33<6:49:07,  1.91s/it][A
Training...:   7% 1039/13907 [38:35<6:40:21,  1.87s/it][A
Training...:   7% 1040/13907 [38:36<6:30:00,  1.82s/it][A
Training...:   7% 1041/13907 [38:38<6:20:40,  1.78s/it][A
Training...:   7% 1042/13907 [38:40<6:12:58,  1.74s/it][A
Training...:   7% 1043/13907 [38:41<6:04:43,  1.70s/it][A
Training...:   8% 1044/13907 [38:43<5:55:34,  1.66s/it][A
Training...:   8% 1045/13907 [38:44<5:50:03,  1.63s/it][A
Training...:   8% 1046/13907 [38:46<5:39:47,  1.59s/it][A
Training...:   8% 1047/13907 [38:47<5:25:39,  1.52s/it][A
Training...:   8% 1048/13907 [38:49<5:10:00,  1.45s/it][A
Training...:   8% 1049/13907 [38:50<4:54:29,  1.37s/it][A
Training...:   8% 1050/13907 [38:51<4:32:36,  1.27s/it][A
Training...:   8% 1051/13907 [38:55<7:11:32,  2.01s/it][A
Training...:   8% 1052/13907 [38:58<8:42:34,  2.44s/it][A
Training...:   8% 1053/13907 [39:01<9:30:38,  2.66s/it][A
Training...:   8% 1054/13907 [39:04<9:57:24,  2.79s/it][A
Training...:   8% 1055/13907 [39:07<10:10:11,  2.85s/it][A
Training...:   8% 1056/13907 [39:10<10:17:28,  2.88s/it][A
Training...:   8% 1057/13907 [39:13<10:14:02,  2.87s/it][A
Training...:   8% 1058/13907 [39:16<10:09:58,  2.85s/it][A
Training...:   8% 1059/13907 [39:19<10:03:11,  2.82s/it][A
Training...:   8% 1060/13907 [39:21<9:54:15,  2.78s/it] [A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:09:35<17:31:07, 31533.87s/it]
Training...:   8% 1060/13907 [39:24<9:54:15,  2.78s/it][A
Training...:   8% 1061/13907 [39:24<10:11:19,  2.86s/it][A
Training...:   8% 1062/13907 [39:27<10:00:46,  2.81s/it][A
Training...:   8% 1063/13907 [39:30<9:44:38,  2.73s/it] [A
Training...:   8% 1064/13907 [39:32<9:30:34,  2.67s/it][A
Training...:   8% 1065/13907 [39:35<9:18:28,  2.61s/it][A
Training...:   8% 1066/13907 [39:37<9:08:01,  2.56s/it][A
Training...:   8% 1067/13907 [39:40<9:03:37,  2.54s/it][A
Training...:   8% 1068/13907 [39:42<8:51:50,  2.49s/it][A
Training...:   8% 1069/13907 [39:44<8:41:46,  2.44s/it][A
Training...:   8% 1070/13907 [39:46<8:32:52,  2.40s/it][A
Training...:   8% 1071/13907 [39:49<8:24:25,  2.36s/it][A
Training...:   8% 1072/13907 [39:51<8:16:16,  2.32s/it][A
Training...:   8% 1073/13907 [39:53<8:09:43,  2.29s/it][A
Training...:   8% 1074/13907 [39:55<8:01:44,  2.25s/it][A
Training...:   8% 1075/13907 [39:58<7:54:04,  2.22s/it][A
Training...:   8% 1076/13907 [40:00<7:47:28,  2.19s/it][A
Training...:   8% 1077/13907 [40:02<7:40:45,  2.15s/it][A
Training...:   8% 1078/13907 [40:04<7:34:38,  2.13s/it][A
Training...:   8% 1079/13907 [40:06<7:28:08,  2.10s/it][A
Training...:   8% 1080/13907 [40:08<7:21:51,  2.07s/it][A
Training...:   8% 1081/13907 [40:10<7:17:11,  2.05s/it][A
Training...:   8% 1082/13907 [40:12<7:10:14,  2.01s/it][A
Training...:   8% 1083/13907 [40:14<7:04:20,  1.99s/it][A
Training...:   8% 1084/13907 [40:16<7:00:18,  1.97s/it][A
Training...:   8% 1085/13907 [40:17<6:54:56,  1.94s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:10:31<17:31:07, 31533.87s/it]
Training...:   8% 1085/13907 [40:20<6:54:56,  1.94s/it][A
Training...:   8% 1086/13907 [40:20<7:11:38,  2.02s/it][A
Training...:   8% 1087/13907 [40:22<7:01:57,  1.97s/it][A
Training...:   8% 1088/13907 [40:23<6:50:29,  1.92s/it][A
Training...:   8% 1089/13907 [40:25<6:39:06,  1.87s/it][A
Training...:   8% 1090/13907 [40:27<6:27:40,  1.81s/it][A
Training...:   8% 1091/13907 [40:28<6:17:15,  1.77s/it][A
Training...:   8% 1092/13907 [40:30<6:08:27,  1.73s/it][A
Training...:   8% 1093/13907 [40:32<5:58:37,  1.68s/it][A
Training...:   8% 1094/13907 [40:33<5:50:40,  1.64s/it][A
Training...:   8% 1095/13907 [40:35<5:40:24,  1.59s/it][A
Training...:   8% 1096/13907 [40:36<5:28:47,  1.54s/it][A
Training...:   8% 1097/13907 [40:37<5:17:09,  1.49s/it][A
Training...:   8% 1098/13907 [40:39<5:04:35,  1.43s/it][A
Training...:   8% 1099/13907 [40:40<4:50:16,  1.36s/it][A
Training...:   8% 1100/13907 [40:41<4:31:25,  1.27s/it][A
Training...:   8% 1101/13907 [40:45<7:10:51,  2.02s/it][A
Training...:   8% 1102/13907 [40:48<8:45:53,  2.46s/it][A
Training...:   8% 1103/13907 [40:51<9:33:04,  2.69s/it][A
Training...:   8% 1104/13907 [40:55<9:59:16,  2.81s/it][A
Training...:   8% 1105/13907 [40:58<10:11:27,  2.87s/it][A
Training...:   8% 1106/13907 [41:00<10:14:33,  2.88s/it][A
Training...:   8% 1107/13907 [41:03<10:11:41,  2.87s/it][A
Training...:   8% 1108/13907 [41:06<10:06:42,  2.84s/it][A
Training...:   8% 1109/13907 [41:09<10:00:15,  2.81s/it][A
Training...:   8% 1110/13907 [41:12<9:51:39,  2.77s/it] [A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:11:26<17:31:07, 31533.87s/it]
Training...:   8% 1110/13907 [41:15<9:51:39,  2.77s/it][A
Training...:   8% 1111/13907 [41:15<10:10:28,  2.86s/it][A
Training...:   8% 1112/13907 [41:17<9:57:56,  2.80s/it] [A
Training...:   8% 1113/13907 [41:20<9:44:46,  2.74s/it][A
Training...:   8% 1114/13907 [41:22<9:32:25,  2.68s/it][A
Training...:   8% 1115/13907 [41:25<9:20:19,  2.63s/it][A
Training...:   8% 1116/13907 [41:27<9:08:45,  2.57s/it][A
Training...:   8% 1117/13907 [41:30<8:58:08,  2.52s/it][A
Training...:   8% 1118/13907 [41:32<8:52:56,  2.50s/it][A
Training...:   8% 1119/13907 [41:35<8:48:56,  2.48s/it][A
Training...:   8% 1120/13907 [41:37<8:44:12,  2.46s/it][A
Training...:   8% 1121/13907 [41:39<8:36:38,  2.42s/it][A
Training...:   8% 1122/13907 [41:42<8:30:20,  2.40s/it][A
Training...:   8% 1123/13907 [41:44<8:20:40,  2.35s/it][A
Training...:   8% 1124/13907 [41:46<8:10:15,  2.30s/it][A
Training...:   8% 1125/13907 [41:48<7:58:05,  2.24s/it][A
Training...:   8% 1126/13907 [41:50<7:49:19,  2.20s/it][A
Training...:   8% 1127/13907 [41:52<7:42:17,  2.17s/it][A
Training...:   8% 1128/13907 [41:55<7:36:13,  2.14s/it][A
Training...:   8% 1129/13907 [41:57<7:29:12,  2.11s/it][A
Training...:   8% 1130/13907 [41:59<7:22:03,  2.08s/it][A
Training...:   8% 1131/13907 [42:01<7:15:40,  2.05s/it][A
Training...:   8% 1132/13907 [42:02<7:09:20,  2.02s/it][A
Training...:   8% 1133/13907 [42:04<7:03:55,  1.99s/it][A
Training...:   8% 1134/13907 [42:06<6:56:07,  1.95s/it][A
Training...:   8% 1135/13907 [42:08<6:49:55,  1.93s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:12:21<17:31:07, 31533.87s/it]
Training...:   8% 1135/13907 [42:10<6:49:55,  1.93s/it][A
Training...:   8% 1136/13907 [42:10<7:03:32,  1.99s/it][A
Training...:   8% 1137/13907 [42:12<6:55:15,  1.95s/it][A
Training...:   8% 1138/13907 [42:14<6:43:09,  1.89s/it][A
Training...:   8% 1139/13907 [42:16<6:33:41,  1.85s/it][A
Training...:   8% 1140/13907 [42:17<6:24:43,  1.81s/it][A
Training...:   8% 1141/13907 [42:19<6:15:08,  1.76s/it][A
Training...:   8% 1142/13907 [42:21<6:08:20,  1.73s/it][A
Training...:   8% 1143/13907 [42:22<5:59:26,  1.69s/it][A
Training...:   8% 1144/13907 [42:24<5:51:41,  1.65s/it][A
Training...:   8% 1145/13907 [42:25<5:42:00,  1.61s/it][A
Training...:   8% 1146/13907 [42:27<5:30:32,  1.55s/it][A
Training...:   8% 1147/13907 [42:28<5:19:15,  1.50s/it][A
Training...:   8% 1148/13907 [42:29<5:06:17,  1.44s/it][A
Training...:   8% 1149/13907 [42:31<4:53:28,  1.38s/it][A
Training...:   8% 1150/13907 [42:32<4:33:45,  1.29s/it][A
Training...:   8% 1151/13907 [42:36<7:20:35,  2.07s/it][A
Training...:   8% 1152/13907 [42:39<8:50:48,  2.50s/it][A
Training...:   8% 1153/13907 [42:43<9:48:56,  2.77s/it][A
Training...:   8% 1154/13907 [42:46<10:20:47,  2.92s/it][A
Training...:   8% 1155/13907 [42:49<10:30:40,  2.97s/it][A
Training...:   8% 1156/13907 [42:52<10:28:57,  2.96s/it][A
Training...:   8% 1157/13907 [42:55<10:25:19,  2.94s/it][A
Training...:   8% 1158/13907 [42:58<10:19:17,  2.91s/it][A
Training...:   8% 1159/13907 [43:00<10:10:46,  2.87s/it][A
Training...:   8% 1160/13907 [43:03<10:00:50,  2.83s/it][A                                                                                                                            
                                                        [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:13:17<17:31:07, 31533.87s/it]
Training...:   8% 1160/13907 [43:06<10:00:50,  2.83s/it][A
Training...:   8% 1161/13907 [43:06<10:17:11,  2.91s/it][A
Training...:   8% 1162/13907 [43:09<10:03:15,  2.84s/it][A
Training...:   8% 1163/13907 [43:11<9:46:53,  2.76s/it] [A
Training...:   8% 1164/13907 [43:14<9:32:42,  2.70s/it][A
Training...:   8% 1165/13907 [43:17<9:22:40,  2.65s/it][A
Training...:   8% 1166/13907 [43:19<9:16:21,  2.62s/it][A
Training...:   8% 1167/13907 [43:22<9:10:19,  2.59s/it][A
Training...:   8% 1168/13907 [43:24<9:03:06,  2.56s/it][A
Training...:   8% 1169/13907 [43:26<8:51:58,  2.51s/it][A
Training...:   8% 1170/13907 [43:29<8:41:19,  2.46s/it][A
Training...:   8% 1171/13907 [43:31<8:36:18,  2.43s/it][A
Training...:   8% 1172/13907 [43:34<8:31:12,  2.41s/it][A
Training...:   8% 1173/13907 [43:36<8:18:30,  2.35s/it][A
Training...:   8% 1174/13907 [43:38<8:06:57,  2.29s/it][A
Training...:   8% 1175/13907 [43:40<7:58:26,  2.25s/it][A
Training...:   8% 1176/13907 [43:42<7:51:47,  2.22s/it][A
Training...:   8% 1177/13907 [43:44<7:43:35,  2.19s/it][A
Training...:   8% 1178/13907 [43:46<7:36:24,  2.15s/it][A
Training...:   8% 1179/13907 [43:48<7:29:31,  2.12s/it][A
Training...:   8% 1180/13907 [43:50<7:23:01,  2.09s/it][A
Training...:   8% 1181/13907 [43:52<7:16:53,  2.06s/it][A
Training...:   8% 1182/13907 [43:54<7:12:25,  2.04s/it][A
Training...:   9% 1183/13907 [43:56<7:05:47,  2.01s/it][A
Training...:   9% 1184/13907 [43:58<6:58:40,  1.97s/it][A
Training...:   9% 1185/13907 [44:00<6:53:55,  1.95s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:14:13<17:31:07, 31533.87s/it]
Training...:   9% 1185/13907 [44:02<6:53:55,  1.95s/it][A
Training...:   9% 1186/13907 [44:02<7:06:33,  2.01s/it][A
Training...:   9% 1187/13907 [44:04<6:57:07,  1.97s/it][A
Training...:   9% 1188/13907 [44:06<6:45:12,  1.91s/it][A
Training...:   9% 1189/13907 [44:08<6:34:29,  1.86s/it][A
Training...:   9% 1190/13907 [44:09<6:26:09,  1.82s/it][A
Training...:   9% 1191/13907 [44:11<6:18:08,  1.78s/it][A
Training...:   9% 1192/13907 [44:13<6:08:20,  1.74s/it][A
Training...:   9% 1193/13907 [44:14<6:00:00,  1.70s/it][A
Training...:   9% 1194/13907 [44:16<5:52:37,  1.66s/it][A
Training...:   9% 1195/13907 [44:17<5:42:58,  1.62s/it][A
Training...:   9% 1196/13907 [44:19<5:33:14,  1.57s/it][A
Training...:   9% 1197/13907 [44:20<5:23:26,  1.53s/it][A
Training...:   9% 1198/13907 [44:22<5:11:13,  1.47s/it][A
Training...:   9% 1199/13907 [44:23<4:57:34,  1.40s/it][A
Training...:   9% 1200/13907 [44:24<4:36:08,  1.30s/it][A
Training...:   9% 1201/13907 [44:28<7:10:30,  2.03s/it][A
Training...:   9% 1202/13907 [44:31<8:47:05,  2.49s/it][A
Training...:   9% 1203/13907 [44:35<9:35:32,  2.72s/it][A
Training...:   9% 1204/13907 [44:38<9:57:16,  2.82s/it][A
Training...:   9% 1205/13907 [44:41<10:10:23,  2.88s/it][A
Training...:   9% 1206/13907 [44:44<10:13:01,  2.90s/it][A
Training...:   9% 1207/13907 [44:46<10:11:33,  2.89s/it][A
Training...:   9% 1208/13907 [44:49<10:04:55,  2.86s/it][A
Training...:   9% 1209/13907 [44:52<9:57:17,  2.82s/it] [A
Training...:   9% 1210/13907 [44:55<9:48:47,  2.78s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:15:09<17:31:07, 31533.87s/it]
Training...:   9% 1210/13907 [44:58<9:48:47,  2.78s/it][A
Training...:   9% 1211/13907 [44:58<10:05:41,  2.86s/it][A
Training...:   9% 1212/13907 [45:00<9:55:08,  2.81s/it] [A
Training...:   9% 1213/13907 [45:03<9:40:19,  2.74s/it][A
Training...:   9% 1214/13907 [45:06<9:26:35,  2.68s/it][A
Training...:   9% 1215/13907 [45:08<9:12:48,  2.61s/it][A
Training...:   9% 1216/13907 [45:10<9:03:29,  2.57s/it][A
Training...:   9% 1217/13907 [45:13<8:56:59,  2.54s/it][A
Training...:   9% 1218/13907 [45:15<8:45:51,  2.49s/it][A
Training...:   9% 1219/13907 [45:18<8:35:38,  2.44s/it][A
Training...:   9% 1220/13907 [45:20<8:29:04,  2.41s/it][A
Training...:   9% 1221/13907 [45:22<8:24:25,  2.39s/it][A
Training...:   9% 1222/13907 [45:25<8:20:13,  2.37s/it][A
Training...:   9% 1223/13907 [45:27<8:10:34,  2.32s/it][A
Training...:   9% 1224/13907 [45:29<8:00:20,  2.27s/it][A
Training...:   9% 1225/13907 [45:31<7:51:55,  2.23s/it][A
Training...:   9% 1226/13907 [45:33<7:42:39,  2.19s/it][A
Training...:   9% 1227/13907 [45:35<7:36:14,  2.16s/it][A
Training...:   9% 1228/13907 [45:37<7:30:11,  2.13s/it][A
Training...:   9% 1229/13907 [45:39<7:23:37,  2.10s/it][A
Training...:   9% 1230/13907 [45:41<7:17:51,  2.07s/it][A
Training...:   9% 1231/13907 [45:43<7:12:32,  2.05s/it][A
Training...:   9% 1232/13907 [45:45<7:07:34,  2.02s/it][A
Training...:   9% 1233/13907 [45:47<7:00:12,  1.99s/it][A
Training...:   9% 1234/13907 [45:49<6:53:29,  1.96s/it][A
Training...:   9% 1235/13907 [45:51<6:46:34,  1.93s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:16:04<17:31:07, 31533.87s/it]
Training...:   9% 1235/13907 [45:53<6:46:34,  1.93s/it][A
Training...:   9% 1236/13907 [45:53<6:59:41,  1.99s/it][A
Training...:   9% 1237/13907 [45:55<6:52:58,  1.96s/it][A
Training...:   9% 1238/13907 [45:57<6:39:56,  1.89s/it][A
Training...:   9% 1239/13907 [45:58<6:29:40,  1.85s/it][A
Training...:   9% 1240/13907 [46:00<6:20:07,  1.80s/it][A
Training...:   9% 1241/13907 [46:02<6:11:23,  1.76s/it][A
Training...:   9% 1242/13907 [46:03<6:01:55,  1.71s/it][A
Training...:   9% 1243/13907 [46:05<5:53:04,  1.67s/it][A
Training...:   9% 1244/13907 [46:07<5:45:09,  1.64s/it][A
Training...:   9% 1245/13907 [46:08<5:35:52,  1.59s/it][A
Training...:   9% 1246/13907 [46:10<5:26:31,  1.55s/it][A
Training...:   9% 1247/13907 [46:11<5:15:39,  1.50s/it][A
Training...:   9% 1248/13907 [46:12<5:03:43,  1.44s/it][A
Training...:   9% 1249/13907 [46:13<4:49:57,  1.37s/it][A
Training...:   9% 1250/13907 [46:14<4:28:50,  1.27s/it][A
Training...:   9% 1251/13907 [46:18<7:11:46,  2.05s/it][A
Training...:   9% 1252/13907 [46:22<8:42:55,  2.48s/it][A
Training...:   9% 1253/13907 [46:25<9:32:17,  2.71s/it][A
Training...:   9% 1254/13907 [46:28<10:01:59,  2.85s/it][A
Training...:   9% 1255/13907 [46:31<10:20:49,  2.94s/it][A
Training...:   9% 1256/13907 [46:34<10:20:59,  2.95s/it][A
Training...:   9% 1257/13907 [46:37<10:14:49,  2.92s/it][A
Training...:   9% 1258/13907 [46:40<10:08:31,  2.89s/it][A
Training...:   9% 1259/13907 [46:43<10:00:21,  2.85s/it][A
Training...:   9% 1260/13907 [46:45<9:52:45,  2.81s/it] [A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:17:00<17:31:07, 31533.87s/it]
Training...:   9% 1260/13907 [46:49<9:52:45,  2.81s/it][A
Training...:   9% 1261/13907 [46:49<10:09:48,  2.89s/it][A
Training...:   9% 1262/13907 [46:51<9:56:36,  2.83s/it] [A
Training...:   9% 1263/13907 [46:54<9:45:02,  2.78s/it][A
Training...:   9% 1264/13907 [46:56<9:32:40,  2.72s/it][A
Training...:   9% 1265/13907 [46:59<9:18:33,  2.65s/it][A
Training...:   9% 1266/13907 [47:01<9:10:01,  2.61s/it][A
Training...:   9% 1267/13907 [47:04<9:01:53,  2.57s/it][A
Training...:   9% 1268/13907 [47:06<8:53:06,  2.53s/it][A
Training...:   9% 1269/13907 [47:09<8:41:12,  2.47s/it][A
Training...:   9% 1270/13907 [47:11<8:30:14,  2.42s/it][A
Training...:   9% 1271/13907 [47:13<8:22:18,  2.39s/it][A
Training...:   9% 1272/13907 [47:16<8:13:40,  2.34s/it][A
Training...:   9% 1273/13907 [47:18<8:05:16,  2.30s/it][A
Training...:   9% 1274/13907 [47:20<7:56:55,  2.27s/it][A
Training...:   9% 1275/13907 [47:22<7:50:38,  2.24s/it][A
Training...:   9% 1276/13907 [47:24<7:45:39,  2.21s/it][A
Training...:   9% 1277/13907 [47:26<7:38:38,  2.18s/it][A
Training...:   9% 1278/13907 [47:28<7:32:03,  2.15s/it][A
Training...:   9% 1279/13907 [47:31<7:25:52,  2.12s/it][A
Training...:   9% 1280/13907 [47:33<7:19:54,  2.09s/it][A
Training...:   9% 1281/13907 [47:35<7:13:49,  2.06s/it][A
Training...:   9% 1282/13907 [47:37<7:08:24,  2.04s/it][A
Training...:   9% 1283/13907 [47:38<7:02:53,  2.01s/it][A
Training...:   9% 1284/13907 [47:40<6:55:35,  1.98s/it][A
Training...:   9% 1285/13907 [47:42<6:48:34,  1.94s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:17:55<17:31:07, 31533.87s/it]
Training...:   9% 1285/13907 [47:44<6:48:34,  1.94s/it][A
Training...:   9% 1286/13907 [47:44<7:03:09,  2.01s/it][A
Training...:   9% 1287/13907 [47:46<6:57:41,  1.99s/it][A
Training...:   9% 1288/13907 [47:48<6:46:13,  1.93s/it][A
Training...:   9% 1289/13907 [47:50<6:33:45,  1.87s/it][A
Training...:   9% 1290/13907 [47:52<6:23:33,  1.82s/it][A
Training...:   9% 1291/13907 [47:53<6:14:28,  1.78s/it][A
Training...:   9% 1292/13907 [47:55<6:04:52,  1.74s/it][A
Training...:   9% 1293/13907 [47:56<5:56:03,  1.69s/it][A
Training...:   9% 1294/13907 [47:58<5:49:35,  1.66s/it][A
Training...:   9% 1295/13907 [48:00<5:40:24,  1.62s/it][A
Training...:   9% 1296/13907 [48:01<5:29:01,  1.57s/it][A
Training...:   9% 1297/13907 [48:02<5:17:27,  1.51s/it][A
Training...:   9% 1298/13907 [48:04<5:03:26,  1.44s/it][A
Training...:   9% 1299/13907 [48:05<4:49:16,  1.38s/it][A
Training...:   9% 1300/13907 [48:06<4:29:16,  1.28s/it][A
Training...:   9% 1301/13907 [48:10<7:04:49,  2.02s/it][A
Training...:   9% 1302/13907 [48:13<8:34:03,  2.45s/it][A
Training...:   9% 1303/13907 [48:16<9:24:42,  2.69s/it][A
Training...:   9% 1304/13907 [48:20<9:53:26,  2.83s/it][A
Training...:   9% 1305/13907 [48:23<10:07:26,  2.89s/it][A
Training...:   9% 1306/13907 [48:26<10:10:14,  2.91s/it][A
Training...:   9% 1307/13907 [48:28<10:06:46,  2.89s/it][A
Training...:   9% 1308/13907 [48:31<10:00:23,  2.86s/it][A
Training...:   9% 1309/13907 [48:34<9:50:59,  2.81s/it] [A
Training...:   9% 1310/13907 [48:37<9:42:42,  2.78s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:18:51<17:31:07, 31533.87s/it]
Training...:   9% 1310/13907 [48:40<9:42:42,  2.78s/it][A
Training...:   9% 1311/13907 [48:40<9:59:56,  2.86s/it][A
Training...:   9% 1312/13907 [48:42<9:46:40,  2.79s/it][A
Training...:   9% 1313/13907 [48:45<9:30:34,  2.72s/it][A
Training...:   9% 1314/13907 [48:47<9:16:30,  2.65s/it][A
Training...:   9% 1315/13907 [48:50<9:08:21,  2.61s/it][A
Training...:   9% 1316/13907 [48:52<9:01:26,  2.58s/it][A
Training...:   9% 1317/13907 [48:55<8:54:50,  2.55s/it][A
Training...:   9% 1318/13907 [48:57<8:49:10,  2.52s/it][A
Training...:   9% 1319/13907 [49:00<8:37:04,  2.46s/it][A
Training...:   9% 1320/13907 [49:02<8:27:53,  2.42s/it][A
Training...:   9% 1321/13907 [49:04<8:21:18,  2.39s/it][A
Training...:  10% 1322/13907 [49:07<8:12:59,  2.35s/it][A
Training...:  10% 1323/13907 [49:09<8:07:54,  2.33s/it][A
Training...:  10% 1324/13907 [49:11<8:02:07,  2.30s/it][A
Training...:  10% 1325/13907 [49:13<7:50:08,  2.24s/it][A
Training...:  10% 1326/13907 [49:15<7:42:44,  2.21s/it][A
Training...:  10% 1327/13907 [49:17<7:35:26,  2.17s/it][A
Training...:  10% 1328/13907 [49:19<7:27:53,  2.14s/it][A
Training...:  10% 1329/13907 [49:21<7:23:01,  2.11s/it][A
Training...:  10% 1330/13907 [49:23<7:17:50,  2.09s/it][A
Training...:  10% 1331/13907 [49:25<7:11:42,  2.06s/it][A
Training...:  10% 1332/13907 [49:27<7:04:36,  2.03s/it][A
Training...:  10% 1333/13907 [49:29<7:00:28,  2.01s/it][A
Training...:  10% 1334/13907 [49:31<6:54:50,  1.98s/it][A
Training...:  10% 1335/13907 [49:33<6:48:29,  1.95s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:19:46<17:31:07, 31533.87s/it]
Training...:  10% 1335/13907 [49:35<6:48:29,  1.95s/it][A
Training...:  10% 1336/13907 [49:35<7:01:09,  2.01s/it][A
Training...:  10% 1337/13907 [49:37<6:52:34,  1.97s/it][A
Training...:  10% 1338/13907 [49:39<6:39:06,  1.91s/it][A
Training...:  10% 1339/13907 [49:41<6:29:29,  1.86s/it][A
Training...:  10% 1340/13907 [49:42<6:20:18,  1.82s/it][A
Training...:  10% 1341/13907 [49:44<6:12:13,  1.78s/it][A
Training...:  10% 1342/13907 [49:46<6:02:53,  1.73s/it][A
Training...:  10% 1343/13907 [49:47<5:54:20,  1.69s/it][A
Training...:  10% 1344/13907 [49:49<5:46:29,  1.65s/it][A
Training...:  10% 1345/13907 [49:50<5:38:05,  1.61s/it][A
Training...:  10% 1346/13907 [49:52<5:28:12,  1.57s/it][A
Training...:  10% 1347/13907 [49:53<5:17:03,  1.51s/it][A
Training...:  10% 1348/13907 [49:55<5:04:50,  1.46s/it][A
Training...:  10% 1349/13907 [49:56<4:52:22,  1.40s/it][A
Training...:  10% 1350/13907 [49:57<4:31:17,  1.30s/it][A
Training...:  10% 1351/13907 [50:01<7:00:46,  2.01s/it][A
Training...:  10% 1352/13907 [50:04<8:34:35,  2.46s/it][A
Training...:  10% 1353/13907 [50:07<9:24:14,  2.70s/it][A
Training...:  10% 1354/13907 [50:11<9:52:12,  2.83s/it][A
Training...:  10% 1355/13907 [50:14<10:05:24,  2.89s/it][A
Training...:  10% 1356/13907 [50:16<10:08:19,  2.91s/it][A
Training...:  10% 1357/13907 [50:19<10:07:07,  2.90s/it][A
Training...:  10% 1358/13907 [50:22<10:03:37,  2.89s/it][A
Training...:  10% 1359/13907 [50:25<10:00:22,  2.87s/it][A
Training...:  10% 1360/13907 [50:28<9:57:41,  2.86s/it] [A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:20:42<17:31:07, 31533.87s/it]
Training...:  10% 1360/13907 [50:31<9:57:41,  2.86s/it][A
Training...:  10% 1361/13907 [50:31<10:13:27,  2.93s/it][A
Training...:  10% 1362/13907 [50:34<9:58:05,  2.86s/it] [A
Training...:  10% 1363/13907 [50:36<9:40:33,  2.78s/it][A
Training...:  10% 1364/13907 [50:39<9:24:03,  2.70s/it][A
Training...:  10% 1365/13907 [50:41<9:09:16,  2.63s/it][A
Training...:  10% 1366/13907 [50:44<8:58:00,  2.57s/it][A
Training...:  10% 1367/13907 [50:46<8:48:32,  2.53s/it][A
Training...:  10% 1368/13907 [50:49<8:38:53,  2.48s/it][A
Training...:  10% 1369/13907 [50:51<8:35:01,  2.46s/it][A
Training...:  10% 1370/13907 [50:53<8:25:19,  2.42s/it][A
Training...:  10% 1371/13907 [50:56<8:17:48,  2.38s/it][A
Training...:  10% 1372/13907 [50:58<8:09:38,  2.34s/it][A
Training...:  10% 1373/13907 [51:00<8:03:51,  2.32s/it][A
Training...:  10% 1374/13907 [51:02<7:58:05,  2.29s/it][A
Training...:  10% 1375/13907 [51:04<7:51:14,  2.26s/it][A
Training...:  10% 1376/13907 [51:07<7:44:31,  2.22s/it][A
Training...:  10% 1377/13907 [51:09<7:38:35,  2.20s/it][A
Training...:  10% 1378/13907 [51:11<7:29:47,  2.15s/it][A
Training...:  10% 1379/13907 [51:13<7:26:15,  2.14s/it][A
Training...:  10% 1380/13907 [51:15<7:20:26,  2.11s/it][A
Training...:  10% 1381/13907 [51:17<7:13:40,  2.08s/it][A
Training...:  10% 1382/13907 [51:19<7:07:45,  2.05s/it][A
Training...:  10% 1383/13907 [51:21<7:00:05,  2.01s/it][A
Training...:  10% 1384/13907 [51:23<6:53:46,  1.98s/it][A
Training...:  10% 1385/13907 [51:25<6:49:08,  1.96s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:21:38<17:31:07, 31533.87s/it]
Training...:  10% 1385/13907 [51:27<6:49:08,  1.96s/it][A
Training...:  10% 1386/13907 [51:27<7:00:38,  2.02s/it][A
Training...:  10% 1387/13907 [51:29<6:51:02,  1.97s/it][A
Training...:  10% 1388/13907 [51:30<6:41:56,  1.93s/it][A
Training...:  10% 1389/13907 [51:32<6:33:34,  1.89s/it][A
Training...:  10% 1390/13907 [51:34<6:23:18,  1.84s/it][A
Training...:  10% 1391/13907 [51:36<6:12:59,  1.79s/it][A
Training...:  10% 1392/13907 [51:37<6:03:01,  1.74s/it][A
Training...:  10% 1393/13907 [51:39<5:53:34,  1.70s/it][A
Training...:  10% 1394/13907 [51:40<5:44:25,  1.65s/it][A
Training...:  10% 1395/13907 [51:42<5:34:10,  1.60s/it][A
Training...:  10% 1396/13907 [51:43<5:23:49,  1.55s/it][A
Training...:  10% 1397/13907 [51:45<5:11:53,  1.50s/it][A
Training...:  10% 1398/13907 [51:46<5:00:11,  1.44s/it][A
Training...:  10% 1399/13907 [51:47<4:47:25,  1.38s/it][A
Training...:  10% 1400/13907 [51:48<4:26:50,  1.28s/it][A
Training...:  10% 1401/13907 [51:52<7:00:16,  2.02s/it][A
Training...:  10% 1402/13907 [51:56<8:32:38,  2.46s/it][A
Training...:  10% 1403/13907 [51:59<9:19:38,  2.69s/it][A
Training...:  10% 1404/13907 [52:02<9:46:11,  2.81s/it][A
Training...:  10% 1405/13907 [52:05<10:00:57,  2.88s/it][A
Training...:  10% 1406/13907 [52:08<10:04:04,  2.90s/it][A
Training...:  10% 1407/13907 [52:11<10:01:39,  2.89s/it][A
Training...:  10% 1408/13907 [52:14<9:57:05,  2.87s/it] [A
Training...:  10% 1409/13907 [52:16<9:49:33,  2.83s/it][A
Training...:  10% 1410/13907 [52:19<9:43:10,  2.80s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:22:33<17:31:07, 31533.87s/it]
Training...:  10% 1410/13907 [52:22<9:43:10,  2.80s/it][A
Training...:  10% 1411/13907 [52:22<10:01:22,  2.89s/it][A
Training...:  10% 1412/13907 [52:25<9:50:25,  2.84s/it] [A
Training...:  10% 1413/13907 [52:27<9:37:24,  2.77s/it][A
Training...:  10% 1414/13907 [52:30<9:21:55,  2.70s/it][A
Training...:  10% 1415/13907 [52:33<9:14:43,  2.66s/it][A
Training...:  10% 1416/13907 [52:35<9:03:39,  2.61s/it][A
Training...:  10% 1417/13907 [52:38<8:56:21,  2.58s/it][A
Training...:  10% 1418/13907 [52:40<8:47:43,  2.54s/it][A
Training...:  10% 1419/13907 [52:42<8:39:12,  2.49s/it][A
Training...:  10% 1420/13907 [52:45<8:26:26,  2.43s/it][A
Training...:  10% 1421/13907 [52:47<8:17:39,  2.39s/it][A
Training...:  10% 1422/13907 [52:49<8:08:43,  2.35s/it][A
Training...:  10% 1423/13907 [52:51<7:59:18,  2.30s/it][A
Training...:  10% 1424/13907 [52:54<7:52:09,  2.27s/it][A
Training...:  10% 1425/13907 [52:56<7:46:01,  2.24s/it][A
Training...:  10% 1426/13907 [52:58<7:37:56,  2.20s/it][A
Training...:  10% 1427/13907 [53:00<7:30:46,  2.17s/it][A
Training...:  10% 1428/13907 [53:02<7:25:03,  2.14s/it][A
Training...:  10% 1429/13907 [53:04<7:18:43,  2.11s/it][A
Training...:  10% 1430/13907 [53:06<7:12:03,  2.08s/it][A
Training...:  10% 1431/13907 [53:08<7:06:17,  2.05s/it][A
Training...:  10% 1432/13907 [53:10<6:59:59,  2.02s/it][A
Training...:  10% 1433/13907 [53:12<6:53:17,  1.99s/it][A
Training...:  10% 1434/13907 [53:14<6:48:44,  1.97s/it][A
Training...:  10% 1435/13907 [53:16<6:42:18,  1.94s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:23:29<17:31:07, 31533.87s/it]
Training...:  10% 1435/13907 [53:18<6:42:18,  1.94s/it][A
Training...:  10% 1436/13907 [53:18<6:55:52,  2.00s/it][A
Training...:  10% 1437/13907 [53:20<6:47:47,  1.96s/it][A
Training...:  10% 1438/13907 [53:22<6:36:39,  1.91s/it][A
Training...:  10% 1439/13907 [53:23<6:26:14,  1.86s/it][A
Training...:  10% 1440/13907 [53:25<6:20:26,  1.83s/it][A
Training...:  10% 1441/13907 [53:27<6:11:29,  1.79s/it][A
Training...:  10% 1442/13907 [53:28<6:02:27,  1.74s/it][A
Training...:  10% 1443/13907 [53:30<5:53:11,  1.70s/it][A
Training...:  10% 1444/13907 [53:32<5:45:14,  1.66s/it][A
Training...:  10% 1445/13907 [53:33<5:35:18,  1.61s/it][A
Training...:  10% 1446/13907 [53:34<5:25:26,  1.57s/it][A
Training...:  10% 1447/13907 [53:36<5:14:19,  1.51s/it][A
Training...:  10% 1448/13907 [53:37<5:01:48,  1.45s/it][A
Training...:  10% 1449/13907 [53:38<4:47:55,  1.39s/it][A
Training...:  10% 1450/13907 [53:40<4:28:49,  1.29s/it][A
Training...:  10% 1451/13907 [53:43<7:03:51,  2.04s/it][A
Training...:  10% 1452/13907 [53:47<8:37:51,  2.49s/it][A
Training...:  10% 1453/13907 [53:50<9:28:02,  2.74s/it][A
Training...:  10% 1454/13907 [53:53<9:51:44,  2.85s/it][A
Training...:  10% 1455/13907 [53:56<10:02:28,  2.90s/it][A
Training...:  10% 1456/13907 [53:59<10:07:03,  2.93s/it][A
Training...:  10% 1457/13907 [54:02<10:03:19,  2.91s/it][A
Training...:  10% 1458/13907 [54:05<9:57:45,  2.88s/it] [A
Training...:  10% 1459/13907 [54:08<9:49:52,  2.84s/it][A
Training...:  10% 1460/13907 [54:10<9:41:48,  2.80s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:24:25<17:31:07, 31533.87s/it]
Training...:  10% 1460/13907 [54:13<9:41:48,  2.80s/it][A
Training...:  11% 1461/13907 [54:13<9:58:06,  2.88s/it][A
Training...:  11% 1462/13907 [54:16<9:45:59,  2.83s/it][A
Training...:  11% 1463/13907 [54:19<9:33:17,  2.76s/it][A
Training...:  11% 1464/13907 [54:21<9:18:19,  2.69s/it][A
Training...:  11% 1465/13907 [54:24<9:06:08,  2.63s/it][A
Training...:  11% 1466/13907 [54:26<8:55:36,  2.58s/it][A
Training...:  11% 1467/13907 [54:29<8:51:11,  2.56s/it][A
Training...:  11% 1468/13907 [54:31<8:41:54,  2.52s/it][A
Training...:  11% 1469/13907 [54:34<8:33:12,  2.48s/it][A
Training...:  11% 1470/13907 [54:36<8:24:48,  2.44s/it][A
Training...:  11% 1471/13907 [54:38<8:16:46,  2.40s/it][A
Training...:  11% 1472/13907 [54:41<8:08:54,  2.36s/it][A
Training...:  11% 1473/13907 [54:43<7:58:52,  2.31s/it][A
Training...:  11% 1474/13907 [54:45<7:51:05,  2.27s/it][A
Training...:  11% 1475/13907 [54:47<7:43:53,  2.24s/it][A
Training...:  11% 1476/13907 [54:49<7:37:40,  2.21s/it][A
Training...:  11% 1477/13907 [54:51<7:31:37,  2.18s/it][A
Training...:  11% 1478/13907 [54:53<7:27:45,  2.16s/it][A
Training...:  11% 1479/13907 [54:56<7:23:13,  2.14s/it][A
Training...:  11% 1480/13907 [54:58<7:15:12,  2.10s/it][A
Training...:  11% 1481/13907 [55:00<7:08:38,  2.07s/it][A
Training...:  11% 1482/13907 [55:01<7:01:31,  2.04s/it][A
Training...:  11% 1483/13907 [55:03<6:54:40,  2.00s/it][A
Training...:  11% 1484/13907 [55:05<6:48:48,  1.97s/it][A
Training...:  11% 1485/13907 [55:07<6:42:57,  1.95s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:25:20<17:31:07, 31533.87s/it]
Training...:  11% 1485/13907 [55:09<6:42:57,  1.95s/it][A
Training...:  11% 1486/13907 [55:09<6:55:34,  2.01s/it][A
Training...:  11% 1487/13907 [55:11<6:46:11,  1.96s/it][A
Training...:  11% 1488/13907 [55:13<6:32:15,  1.90s/it][A
Training...:  11% 1489/13907 [55:15<6:20:49,  1.84s/it][A
Training...:  11% 1490/13907 [55:16<6:11:12,  1.79s/it][A
Training...:  11% 1491/13907 [55:18<6:02:11,  1.75s/it][A
Training...:  11% 1492/13907 [55:20<5:54:46,  1.71s/it][A
Training...:  11% 1493/13907 [55:21<5:46:41,  1.68s/it][A
Training...:  11% 1494/13907 [55:23<5:38:45,  1.64s/it][A
Training...:  11% 1495/13907 [55:24<5:30:36,  1.60s/it][A
Training...:  11% 1496/13907 [55:26<5:20:47,  1.55s/it][A
Training...:  11% 1497/13907 [55:27<5:10:21,  1.50s/it][A
Training...:  11% 1498/13907 [55:28<4:59:24,  1.45s/it][A
Training...:  11% 1499/13907 [55:30<4:46:14,  1.38s/it][A
Training...:  11% 1500/13907 [55:31<4:26:28,  1.29s/it][A
Training...:  11% 1501/13907 [55:34<6:59:52,  2.03s/it][A
Training...:  11% 1502/13907 [55:38<8:29:28,  2.46s/it][A
Training...:  11% 1503/13907 [55:41<9:18:23,  2.70s/it][A
Training...:  11% 1504/13907 [55:44<9:42:57,  2.82s/it][A
Training...:  11% 1505/13907 [55:47<9:56:01,  2.88s/it][A
Training...:  11% 1506/13907 [55:50<10:01:21,  2.91s/it][A
Training...:  11% 1507/13907 [55:53<9:59:35,  2.90s/it] [A
Training...:  11% 1508/13907 [55:56<9:53:48,  2.87s/it][A
Training...:  11% 1509/13907 [55:59<9:48:58,  2.85s/it][A
Training...:  11% 1510/13907 [56:02<9:41:15,  2.81s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:26:16<17:31:07, 31533.87s/it]
Training...:  11% 1510/13907 [56:05<9:41:15,  2.81s/it][A
Training...:  11% 1511/13907 [56:05<9:57:53,  2.89s/it][A
Training...:  11% 1512/13907 [56:07<9:46:56,  2.84s/it][A
Training...:  11% 1513/13907 [56:10<9:31:41,  2.77s/it][A
Training...:  11% 1514/13907 [56:12<9:18:07,  2.70s/it][A
Training...:  11% 1515/13907 [56:15<9:10:05,  2.66s/it][A
Training...:  11% 1516/13907 [56:18<9:05:46,  2.64s/it][A
Training...:  11% 1517/13907 [56:20<8:58:46,  2.61s/it][A
Training...:  11% 1518/13907 [56:23<8:46:57,  2.55s/it][A
Training...:  11% 1519/13907 [56:25<8:36:21,  2.50s/it][A
Training...:  11% 1520/13907 [56:27<8:26:00,  2.45s/it][A
Training...:  11% 1521/13907 [56:30<8:18:16,  2.41s/it][A
Training...:  11% 1522/13907 [56:32<8:10:28,  2.38s/it][A
Training...:  11% 1523/13907 [56:34<7:59:57,  2.33s/it][A
Training...:  11% 1524/13907 [56:36<7:51:27,  2.28s/it][A
Training...:  11% 1525/13907 [56:38<7:44:50,  2.25s/it][A
Training...:  11% 1526/13907 [56:41<7:38:12,  2.22s/it][A
Training...:  11% 1527/13907 [56:43<7:31:04,  2.19s/it][A
Training...:  11% 1528/13907 [56:45<7:23:22,  2.15s/it][A
Training...:  11% 1529/13907 [56:47<7:18:33,  2.13s/it][A
Training...:  11% 1530/13907 [56:49<7:10:33,  2.09s/it][A
Training...:  11% 1531/13907 [56:51<7:02:59,  2.05s/it][A
Training...:  11% 1532/13907 [56:53<6:56:14,  2.02s/it][A
Training...:  11% 1533/13907 [56:55<6:49:32,  1.99s/it][A
Training...:  11% 1534/13907 [56:57<6:44:09,  1.96s/it][A
Training...:  11% 1535/13907 [56:58<6:39:11,  1.94s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:27:12<17:31:07, 31533.87s/it]
Training...:  11% 1535/13907 [57:01<6:39:11,  1.94s/it][A
Training...:  11% 1536/13907 [57:01<6:52:17,  2.00s/it][A
Training...:  11% 1537/13907 [57:02<6:44:03,  1.96s/it][A
Training...:  11% 1538/13907 [57:04<6:32:24,  1.90s/it][A
Training...:  11% 1539/13907 [57:06<6:22:10,  1.85s/it][A
Training...:  11% 1540/13907 [57:08<6:11:49,  1.80s/it][A
Training...:  11% 1541/13907 [57:09<6:05:08,  1.77s/it][A
Training...:  11% 1542/13907 [57:11<5:55:40,  1.73s/it][A
Training...:  11% 1543/13907 [57:13<5:46:54,  1.68s/it][A
Training...:  11% 1544/13907 [57:14<5:39:54,  1.65s/it][A
Training...:  11% 1545/13907 [57:16<5:30:04,  1.60s/it][A
Training...:  11% 1546/13907 [57:17<5:19:28,  1.55s/it][A
Training...:  11% 1547/13907 [57:18<5:10:15,  1.51s/it][A
Training...:  11% 1548/13907 [57:20<4:58:26,  1.45s/it][A
Training...:  11% 1549/13907 [57:21<4:45:17,  1.39s/it][A
Training...:  11% 1550/13907 [57:22<4:23:36,  1.28s/it][A
Training...:  11% 1551/13907 [57:26<6:56:31,  2.02s/it][A
Training...:  11% 1552/13907 [57:29<8:22:54,  2.44s/it][A
Training...:  11% 1553/13907 [57:32<9:08:50,  2.67s/it][A
Training...:  11% 1554/13907 [57:36<9:36:56,  2.80s/it][A
Training...:  11% 1555/13907 [57:39<9:56:06,  2.90s/it][A
Training...:  11% 1556/13907 [57:42<9:55:26,  2.89s/it][A
Training...:  11% 1557/13907 [57:44<9:52:11,  2.88s/it][A
Training...:  11% 1558/13907 [57:47<9:45:28,  2.84s/it][A
Training...:  11% 1559/13907 [57:50<9:38:30,  2.81s/it][A
Training...:  11% 1560/13907 [57:53<9:29:05,  2.77s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:28:07<17:31:07, 31533.87s/it]
Training...:  11% 1560/13907 [57:56<9:29:05,  2.77s/it][A
Training...:  11% 1561/13907 [57:56<9:46:32,  2.85s/it][A
Training...:  11% 1562/13907 [57:58<9:34:34,  2.79s/it][A
Training...:  11% 1563/13907 [58:01<9:20:18,  2.72s/it][A
Training...:  11% 1564/13907 [58:03<9:06:25,  2.66s/it][A
Training...:  11% 1565/13907 [58:06<8:56:07,  2.61s/it][A
Training...:  11% 1566/13907 [58:08<8:47:42,  2.57s/it][A
Training...:  11% 1567/13907 [58:11<8:38:14,  2.52s/it][A
Training...:  11% 1568/13907 [58:13<8:34:19,  2.50s/it][A
Training...:  11% 1569/13907 [58:15<8:23:45,  2.45s/it][A
Training...:  11% 1570/13907 [58:18<8:15:21,  2.41s/it][A
Training...:  11% 1571/13907 [58:20<8:07:55,  2.37s/it][A
Training...:  11% 1572/13907 [58:22<8:00:11,  2.34s/it][A
Training...:  11% 1573/13907 [58:25<7:55:00,  2.31s/it][A
Training...:  11% 1574/13907 [58:27<7:47:16,  2.27s/it][A
Training...:  11% 1575/13907 [58:29<7:41:29,  2.25s/it][A
Training...:  11% 1576/13907 [58:31<7:34:31,  2.21s/it][A
Training...:  11% 1577/13907 [58:33<7:27:57,  2.18s/it][A
Training...:  11% 1578/13907 [58:35<7:22:19,  2.15s/it][A
Training...:  11% 1579/13907 [58:37<7:16:19,  2.12s/it][A
Training...:  11% 1580/13907 [58:39<7:10:15,  2.09s/it][A
Training...:  11% 1581/13907 [58:41<7:04:04,  2.06s/it][A
Training...:  11% 1582/13907 [58:43<6:57:42,  2.03s/it][A
Training...:  11% 1583/13907 [58:45<6:53:08,  2.01s/it][A
Training...:  11% 1584/13907 [58:47<6:47:32,  1.98s/it][A
Training...:  11% 1585/13907 [58:49<6:43:14,  1.96s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:29:02<17:31:07, 31533.87s/it]
Training...:  11% 1585/13907 [58:51<6:43:14,  1.96s/it][A
Training...:  11% 1586/13907 [58:51<6:59:17,  2.04s/it][A
Training...:  11% 1587/13907 [58:53<6:53:48,  2.02s/it][A
Training...:  11% 1588/13907 [58:55<6:39:43,  1.95s/it][A
Training...:  11% 1589/13907 [58:57<6:28:49,  1.89s/it][A
Training...:  11% 1590/13907 [58:59<6:18:35,  1.84s/it][A
Training...:  11% 1591/13907 [59:00<6:09:16,  1.80s/it][A
Training...:  11% 1592/13907 [59:02<6:00:41,  1.76s/it][A
Training...:  11% 1593/13907 [59:04<5:52:15,  1.72s/it][A
Training...:  11% 1594/13907 [59:05<5:43:10,  1.67s/it][A
Training...:  11% 1595/13907 [59:07<5:35:13,  1.63s/it][A
Training...:  11% 1596/13907 [59:08<5:23:59,  1.58s/it][A
Training...:  11% 1597/13907 [59:10<5:14:15,  1.53s/it][A
Training...:  11% 1598/13907 [59:11<5:02:01,  1.47s/it][A
Training...:  11% 1599/13907 [59:12<4:47:29,  1.40s/it][A
Training...:  12% 1600/13907 [59:13<4:27:12,  1.30s/it][A
Training...:  12% 1601/13907 [59:17<6:55:59,  2.03s/it][A
Training...:  12% 1602/13907 [59:20<8:23:36,  2.46s/it][A
Training...:  12% 1603/13907 [59:24<9:09:18,  2.68s/it][A
Training...:  12% 1604/13907 [59:27<9:37:40,  2.82s/it][A
Training...:  12% 1605/13907 [59:30<9:50:18,  2.88s/it][A
Training...:  12% 1606/13907 [59:33<9:52:32,  2.89s/it][A
Training...:  12% 1607/13907 [59:35<9:50:25,  2.88s/it][A
Training...:  12% 1608/13907 [59:38<9:45:29,  2.86s/it][A
Training...:  12% 1609/13907 [59:41<9:39:09,  2.83s/it][A
Training...:  12% 1610/13907 [59:44<9:31:28,  2.79s/it][A                                                                                                                            
                                                       [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:29:58<17:31:07, 31533.87s/it]
Training...:  12% 1610/13907 [59:47<9:31:28,  2.79s/it][A
Training...:  12% 1611/13907 [59:47<9:49:07,  2.87s/it][A
Training...:  12% 1612/13907 [59:49<9:36:49,  2.81s/it][A
Training...:  12% 1613/13907 [59:52<9:22:15,  2.74s/it][A
Training...:  12% 1614/13907 [59:55<9:07:40,  2.67s/it][A
Training...:  12% 1615/13907 [59:57<8:56:47,  2.62s/it][A
Training...:  12% 1616/13907 [1:00:00<8:46:17,  2.57s/it][A
Training...:  12% 1617/13907 [1:00:02<8:36:37,  2.52s/it][A
Training...:  12% 1618/13907 [1:00:04<8:26:34,  2.47s/it][A
Training...:  12% 1619/13907 [1:00:07<8:17:24,  2.43s/it][A
Training...:  12% 1620/13907 [1:00:09<8:09:22,  2.39s/it][A
Training...:  12% 1621/13907 [1:00:11<8:02:49,  2.36s/it][A
Training...:  12% 1622/13907 [1:00:13<7:57:04,  2.33s/it][A
Training...:  12% 1623/13907 [1:00:16<7:52:55,  2.31s/it][A
Training...:  12% 1624/13907 [1:00:18<7:45:18,  2.27s/it][A
Training...:  12% 1625/13907 [1:00:20<7:36:54,  2.23s/it][A
Training...:  12% 1626/13907 [1:00:22<7:28:47,  2.19s/it][A
Training...:  12% 1627/13907 [1:00:24<7:22:46,  2.16s/it][A
Training...:  12% 1628/13907 [1:00:26<7:15:14,  2.13s/it][A
Training...:  12% 1629/13907 [1:00:28<7:08:50,  2.10s/it][A
Training...:  12% 1630/13907 [1:00:30<7:03:36,  2.07s/it][A
Training...:  12% 1631/13907 [1:00:32<6:56:50,  2.04s/it][A
Training...:  12% 1632/13907 [1:00:34<6:49:37,  2.00s/it][A
Training...:  12% 1633/13907 [1:00:36<6:42:45,  1.97s/it][A
Training...:  12% 1634/13907 [1:00:38<6:36:11,  1.94s/it][A
Training...:  12% 1635/13907 [1:00:40<6:29:52,  1.91s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:30:53<17:31:07, 31533.87s/it]
Training...:  12% 1635/13907 [1:00:42<6:29:52,  1.91s/it][A
Training...:  12% 1636/13907 [1:00:42<6:43:53,  1.97s/it][A
Training...:  12% 1637/13907 [1:00:44<6:34:58,  1.93s/it][A
Training...:  12% 1638/13907 [1:00:45<6:23:15,  1.87s/it][A
Training...:  12% 1639/13907 [1:00:47<6:13:35,  1.83s/it][A
Training...:  12% 1640/13907 [1:00:49<6:04:58,  1.79s/it][A
Training...:  12% 1641/13907 [1:00:51<5:56:57,  1.75s/it][A
Training...:  12% 1642/13907 [1:00:52<5:48:20,  1.70s/it][A
Training...:  12% 1643/13907 [1:00:54<5:41:00,  1.67s/it][A
Training...:  12% 1644/13907 [1:00:55<5:34:17,  1.64s/it][A
Training...:  12% 1645/13907 [1:00:57<5:25:45,  1.59s/it][A
Training...:  12% 1646/13907 [1:00:58<5:15:57,  1.55s/it][A
Training...:  12% 1647/13907 [1:01:00<5:05:28,  1.49s/it][A
Training...:  12% 1648/13907 [1:01:01<4:54:17,  1.44s/it][A
Training...:  12% 1649/13907 [1:01:02<4:41:25,  1.38s/it][A
Training...:  12% 1650/13907 [1:01:03<4:23:02,  1.29s/it][A
Training...:  12% 1651/13907 [1:01:07<6:45:16,  1.98s/it][A
Training...:  12% 1652/13907 [1:01:10<8:14:04,  2.42s/it][A
Training...:  12% 1653/13907 [1:01:14<9:05:14,  2.67s/it][A
Training...:  12% 1654/13907 [1:01:17<9:32:21,  2.80s/it][A
Training...:  12% 1655/13907 [1:01:20<9:47:35,  2.88s/it][A
Training...:  12% 1656/13907 [1:01:23<9:53:01,  2.90s/it][A
Training...:  12% 1657/13907 [1:01:26<9:55:03,  2.91s/it][A
Training...:  12% 1658/13907 [1:01:28<9:54:08,  2.91s/it][A
Training...:  12% 1659/13907 [1:01:31<9:46:18,  2.87s/it][A
Training...:  12% 1660/13907 [1:01:34<9:37:48,  2.83s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:31:48<17:31:07, 31533.87s/it]
Training...:  12% 1660/13907 [1:01:37<9:37:48,  2.83s/it][A
Training...:  12% 1661/13907 [1:01:37<9:52:11,  2.90s/it][A
Training...:  12% 1662/13907 [1:01:40<9:41:04,  2.85s/it][A
Training...:  12% 1663/13907 [1:01:42<9:25:26,  2.77s/it][A
Training...:  12% 1664/13907 [1:01:45<9:10:58,  2.70s/it][A
Training...:  12% 1665/13907 [1:01:47<8:59:30,  2.64s/it][A
Training...:  12% 1666/13907 [1:01:50<8:54:23,  2.62s/it][A
Training...:  12% 1667/13907 [1:01:52<8:45:35,  2.58s/it][A
Training...:  12% 1668/13907 [1:01:55<8:35:20,  2.53s/it][A
Training...:  12% 1669/13907 [1:01:57<8:24:28,  2.47s/it][A
Training...:  12% 1670/13907 [1:02:00<8:13:21,  2.42s/it][A
Training...:  12% 1671/13907 [1:02:02<8:04:51,  2.38s/it][A
Training...:  12% 1672/13907 [1:02:04<7:58:08,  2.34s/it][A
Training...:  12% 1673/13907 [1:02:06<7:49:59,  2.31s/it][A
Training...:  12% 1674/13907 [1:02:08<7:41:31,  2.26s/it][A
Training...:  12% 1675/13907 [1:02:11<7:34:16,  2.23s/it][A
Training...:  12% 1676/13907 [1:02:13<7:26:28,  2.19s/it][A
Training...:  12% 1677/13907 [1:02:15<7:20:14,  2.16s/it][A
Training...:  12% 1678/13907 [1:02:17<7:14:25,  2.13s/it][A
Training...:  12% 1679/13907 [1:02:19<7:09:41,  2.11s/it][A
Training...:  12% 1680/13907 [1:02:21<7:04:21,  2.08s/it][A
Training...:  12% 1681/13907 [1:02:23<6:57:36,  2.05s/it][A
Training...:  12% 1682/13907 [1:02:25<6:53:03,  2.03s/it][A
Training...:  12% 1683/13907 [1:02:27<6:47:13,  2.00s/it][A
Training...:  12% 1684/13907 [1:02:29<6:40:18,  1.97s/it][A
Training...:  12% 1685/13907 [1:02:31<6:34:41,  1.94s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:32:44<17:31:07, 31533.87s/it]
Training...:  12% 1685/13907 [1:02:33<6:34:41,  1.94s/it][A
Training...:  12% 1686/13907 [1:02:33<6:47:57,  2.00s/it][A
Training...:  12% 1687/13907 [1:02:35<6:41:00,  1.97s/it][A
Training...:  12% 1688/13907 [1:02:36<6:29:39,  1.91s/it][A
Training...:  12% 1689/13907 [1:02:38<6:18:54,  1.86s/it][A
Training...:  12% 1690/13907 [1:02:40<6:09:35,  1.82s/it][A
Training...:  12% 1691/13907 [1:02:42<6:01:44,  1.78s/it][A
Training...:  12% 1692/13907 [1:02:43<5:52:59,  1.73s/it][A
Training...:  12% 1693/13907 [1:02:45<5:45:31,  1.70s/it][A
Training...:  12% 1694/13907 [1:02:46<5:37:48,  1.66s/it][A
Training...:  12% 1695/13907 [1:02:48<5:27:17,  1.61s/it][A
Training...:  12% 1696/13907 [1:02:49<5:17:28,  1.56s/it][A
Training...:  12% 1697/13907 [1:02:51<5:05:35,  1.50s/it][A
Training...:  12% 1698/13907 [1:02:52<4:53:24,  1.44s/it][A
Training...:  12% 1699/13907 [1:02:53<4:39:04,  1.37s/it][A
Training...:  12% 1700/13907 [1:02:54<4:18:41,  1.27s/it][A
Training...:  12% 1701/13907 [1:02:58<6:46:12,  2.00s/it][A
Training...:  12% 1702/13907 [1:03:01<8:15:44,  2.44s/it][A
Training...:  12% 1703/13907 [1:03:05<9:07:31,  2.69s/it][A
Training...:  12% 1704/13907 [1:03:08<9:40:57,  2.86s/it][A
Training...:  12% 1705/13907 [1:03:11<9:53:43,  2.92s/it][A
Training...:  12% 1706/13907 [1:03:14<9:56:35,  2.93s/it][A
Training...:  12% 1707/13907 [1:03:17<9:51:52,  2.91s/it][A
Training...:  12% 1708/13907 [1:03:20<9:44:04,  2.87s/it][A
Training...:  12% 1709/13907 [1:03:22<9:36:15,  2.83s/it][A
Training...:  12% 1710/13907 [1:03:25<9:27:35,  2.79s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:33:39<17:31:07, 31533.87s/it]
Training...:  12% 1710/13907 [1:03:28<9:27:35,  2.79s/it][A
Training...:  12% 1711/13907 [1:03:28<9:42:52,  2.87s/it][A
Training...:  12% 1712/13907 [1:03:31<9:30:28,  2.81s/it][A
Training...:  12% 1713/13907 [1:03:33<9:16:05,  2.74s/it][A
Training...:  12% 1714/13907 [1:03:36<9:00:45,  2.66s/it][A
Training...:  12% 1715/13907 [1:03:38<8:49:14,  2.60s/it][A
Training...:  12% 1716/13907 [1:03:41<8:43:16,  2.58s/it][A
Training...:  12% 1717/13907 [1:03:43<8:37:14,  2.55s/it][A
Training...:  12% 1718/13907 [1:03:46<8:30:14,  2.51s/it][A
Training...:  12% 1719/13907 [1:03:48<8:24:22,  2.48s/it][A
Training...:  12% 1720/13907 [1:03:50<8:17:32,  2.45s/it][A
Training...:  12% 1721/13907 [1:03:53<8:08:24,  2.40s/it][A
Training...:  12% 1722/13907 [1:03:55<7:59:19,  2.36s/it][A
Training...:  12% 1723/13907 [1:03:57<7:49:25,  2.31s/it][A
Training...:  12% 1724/13907 [1:03:59<7:41:59,  2.28s/it][A
Training...:  12% 1725/13907 [1:04:02<7:33:55,  2.24s/it][A
Training...:  12% 1726/13907 [1:04:04<7:27:21,  2.20s/it][A
Training...:  12% 1727/13907 [1:04:06<7:20:26,  2.17s/it][A
Training...:  12% 1728/13907 [1:04:08<7:14:30,  2.14s/it][A
Training...:  12% 1729/13907 [1:04:10<7:12:20,  2.13s/it][A
Training...:  12% 1730/13907 [1:04:12<7:06:27,  2.10s/it][A
Training...:  12% 1731/13907 [1:04:14<7:00:47,  2.07s/it][A
Training...:  12% 1732/13907 [1:04:16<6:53:11,  2.04s/it][A
Training...:  12% 1733/13907 [1:04:18<6:46:18,  2.00s/it][A
Training...:  12% 1734/13907 [1:04:20<6:40:47,  1.98s/it][A
Training...:  12% 1735/13907 [1:04:22<6:33:42,  1.94s/it][A                                                                                                                            
                                                         [AStep... (27825 | Loss: 0.24640141427516937, Learning Rate: 0.00013440000475384295, Gradient Norm: 0.9000800848007202)
Step... (27850 | Loss: 0.19431567192077637, Learning Rate: 0.0001342484902124852, Gradient Norm: 0.8487517833709717)
Step... (27875 | Loss: 0.27777552604675293, Learning Rate: 0.00013409697567112744, Gradient Norm: 0.8844566345214844)
Step... (27900 | Loss: 0.2267543375492096, Learning Rate: 0.00013394546112976968, Gradient Norm: 1.168444275856018)
Step... (27925 | Loss: 0.21297502517700195, Learning Rate: 0.0001337939320364967, Gradient Norm: 0.7375154495239258)
Step... (27950 | Loss: 0.18574754893779755, Learning Rate: 0.00013364243204705417, Gradient Norm: 0.7765836119651794)
Step... (27975 | Loss: 0.2403995245695114, Learning Rate: 0.00013349091750569642, Gradient Norm: 0.9698172807693481)
Step... (28000 | Loss: 0.2216174453496933, Learning Rate: 0.00013333938841242343, Gradient Norm: 0.889639139175415)
Step... (28025 | Loss: 0.2811601161956787, Learning Rate: 0.0001331878884229809, Gradient Norm: 0.8344493508338928)
Step... (28050 | Loss: 0.16246509552001953, Learning Rate: 0.00013303637388162315, Gradient Norm: 0.731961727142334)
Step... (28075 | Loss: 0.22213977575302124, Learning Rate: 0.00013288484478835016, Gradient Norm: 0.824011504650116)
Step... (28100 | Loss: 0.22165630757808685, Learning Rate: 0.00013273334479890764, Gradient Norm: 1.1774353981018066)
Step... (28125 | Loss: 0.22790667414665222, Learning Rate: 0.00013258183025754988, Gradient Norm: 0.7983096837997437)
Step... (28150 | Loss: 0.20985035598278046, Learning Rate: 0.0001324303011642769, Gradient Norm: 0.6224431395530701)
Step... (28175 | Loss: 0.2195994257926941, Learning Rate: 0.00013227880117483437, Gradient Norm: 0.9039028286933899)
Step... (28200 | Loss: 0.19450479745864868, Learning Rate: 0.00013212728663347661, Gradient Norm: 1.0282416343688965)
Step... (28225 | Loss: 0.25355827808380127, Learning Rate: 0.00013197575754020363, Gradient Norm: 0.8388110399246216)
Step... (28250 | Loss: 0.1874011754989624, Learning Rate: 0.00013182424299884588, Gradient Norm: 0.8311083912849426)
Step... (28275 | Loss: 0.22295549511909485, Learning Rate: 0.00013167274300940335, Gradient Norm: 0.5964691638946533)
Step... (28300 | Loss: 0.23152422904968262, Learning Rate: 0.00013152121391613036, Gradient Norm: 0.9320189952850342)
Step... (28325 | Loss: 0.20158784091472626, Learning Rate: 0.0001313696993747726, Gradient Norm: 0.7952701449394226)
Step... (28350 | Loss: 0.17498621344566345, Learning Rate: 0.00013121819938533008, Gradient Norm: 0.7653942108154297)
Step... (28375 | Loss: 0.19954738020896912, Learning Rate: 0.0001310666702920571, Gradient Norm: 0.7489721775054932)
Step... (28400 | Loss: 0.24290144443511963, Learning Rate: 0.00013091515575069934, Gradient Norm: 1.2616920471191406)
Step... (28425 | Loss: 0.24347344040870667, Learning Rate: 0.00013076365576125681, Gradient Norm: 0.7684887051582336)
Step... (28450 | Loss: 0.21448782086372375, Learning Rate: 0.00013061212666798383, Gradient Norm: 1.0130919218063354)
Step... (28475 | Loss: 0.2196786105632782, Learning Rate: 0.00013046061212662607, Gradient Norm: 0.827758252620697)
Step... (28500 | Loss: 0.19541239738464355, Learning Rate: 0.00013030911213718355, Gradient Norm: 0.9507246017456055)
Step... (28525 | Loss: 0.2747471034526825, Learning Rate: 0.00013015758304391056, Gradient Norm: 0.9076412916183472)
Step... (28550 | Loss: 0.20099198818206787, Learning Rate: 0.0001300060685025528, Gradient Norm: 0.9960970282554626)
Step... (28575 | Loss: 0.24190612137317657, Learning Rate: 0.00012985455396119505, Gradient Norm: 1.0390563011169434)
Step... (28600 | Loss: 0.22015000879764557, Learning Rate: 0.0001297030394198373, Gradient Norm: 1.0727124214172363)
Step... (28625 | Loss: 0.2079893946647644, Learning Rate: 0.00012955152487847954, Gradient Norm: 0.7223563194274902)
Step... (28650 | Loss: 0.1860993206501007, Learning Rate: 0.00012940001033712178, Gradient Norm: 0.8552897572517395)
Step... (28675 | Loss: 0.2226448357105255, Learning Rate: 0.0001292484812Epoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:34:35<17:31:07, 31533.87s/it]
Training...:  12% 1735/13907 [1:04:24<6:33:42,  1.94s/it][A
Training...:  12% 1736/13907 [1:04:24<6:47:50,  2.01s/it][A438488, Gradient Norm: 0.8273365497589111)
Step... (28700 | Loss: 0.18300080299377441, Learning Rate: 0.00012909698125440627, Gradient Norm: 0.6989693641662598)
Step... (28725 | Loss: 0.21702052652835846, Learning Rate: 0.00012894546671304852, Gradient Norm: 0.7665709257125854)
Step... (28750 | Loss: 0.27313926815986633, Learning Rate: 0.00012879393761977553, Gradient Norm: 1.0730774402618408)
Step... (28775 | Loss: 0.19792407751083374, Learning Rate: 0.000128642437630333, Gradient Norm: 0.5680879354476929)
Step... (28800 | Loss: 0.1675054430961609, Learning Rate: 0.00012849092308897525, Gradient Norm: 0.7074354290962219)
Step... (28825 | Loss: 0.23229821026325226, Learning Rate: 0.00012833939399570227, Gradient Norm: 0.7778639793395996)
Step... (28850 | Loss: 0.1358180195093155, Learning Rate: 0.00012818789400625974, Gradient Norm: 0.8084675073623657)
Step... (28875 | Loss: 0.23469625413417816, Learning Rate: 0.00012803636491298676, Gradient Norm: 0.6826083660125732)
Step... (28900 | Loss: 0.14945431053638458, Learning Rate: 0.000127884850371629, Gradient Norm: 0.948858916759491)
Step... (28925 | Loss: 0.26270025968551636, Learning Rate: 0.00012773335038218647, Gradient Norm: 1.1589536666870117)
Step... (28950 | Loss: 0.17876294255256653, Learning Rate: 0.0001275818212889135, Gradient Norm: 0.7402146458625793)
Step... (28975 | Loss: 0.27094703912734985, Learning Rate: 0.00012743030674755573, Gradient Norm: 0.9838964939117432)
Step... (29000 | Loss: 0.25974082946777344, Learning Rate: 0.00012727879220619798, Gradient Norm: 1.4376640319824219)
Step... (29025 | Loss: 0.3027956485748291, Learning Rate: 0.00012712727766484022, Gradient Norm: 1.0352215766906738)
Step... (29050 | Loss: 0.1618410050868988, Learning Rate: 0.00012697576312348247, Gradient Norm: 0.5989468693733215)
Step... (29075 | Loss: 0.19388917088508606, Learning Rate: 0.0001268242485821247, Gradient Norm: 1.0074317455291748)
Step... (29100 | Loss: 0.20753221213817596, Learning Rate: 0.00012667273404076695, Gradient Norm: 0.9521298408508301)
Step... (29125 | Loss: 0.2762182950973511, Learning Rate: 0.0001265212194994092, Gradient Norm: 1.0922563076019287)
Step... (29150 | Loss: 0.2031300663948059, Learning Rate: 0.00012636970495805144, Gradient Norm: 0.9102931022644043)
Step... (29175 | Loss: 0.22420062124729156, Learning Rate: 0.00012621817586477846, Gradient Norm: 0.8848653435707092)
Step... (29200 | Loss: 0.14860814809799194, Learning Rate: 0.00012606667587533593, Gradient Norm: 0.689648449420929)
Step... (29225 | Loss: 0.1891310214996338, Learning Rate: 0.00012591516133397818, Gradient Norm: 0.7376020550727844)
Step... (29250 | Loss: 0.154770165681839, Learning Rate: 0.0001257636322407052, Gradient Norm: 0.6288377642631531)
Step... (29275 | Loss: 0.22377580404281616, Learning Rate: 0.00012561213225126266, Gradient Norm: 0.7472628951072693)
Step... (29300 | Loss: 0.21518123149871826, Learning Rate: 0.0001254606177099049, Gradient Norm: 0.6919730305671692)
Step... (29325 | Loss: 0.21744593977928162, Learning Rate: 0.00012530908861663193, Gradient Norm: 0.7606670260429382)
Step... (29350 | Loss: 0.21763066947460175, Learning Rate: 0.0001251575886271894, Gradient Norm: 0.8420993089675903)
Step... (29375 | Loss: 0.2557104229927063, Learning Rate: 0.00012500607408583164, Gradient Norm: 0.885424017906189)
Step... (29400 | Loss: 0.21077263355255127, Learning Rate: 0.00012485454499255866, Gradient Norm: 0.8981693983078003)
Step... (29425 | Loss: 0.22719506919384003, Learning Rate: 0.0001247030304512009, Gradient Norm: 0.7814988493919373)
Step... (29450 | Loss: 0.17058062553405762, Learning Rate: 0.00012455153046175838, Gradient Norm: 0.7040672302246094)
Step... (29475 | Loss: 0.2730761766433716, Learning Rate: 0.0001244000013684854, Gradient Norm: 0.9437978267669678)
Step... (29500 | Loss: 0.22511491179466248, Learning Rate: 0.00012424848682712764, Gradient Norm: 0.8425918817520142)
Step... (29525 | Loss: 0.18756620585918427, Learning Rate: 0.0001240969868376851, Gradient Norm: 0.5183477997779846)

Training...:  12% 1737/13907 [1:04:26<6:47:57,  2.01s/it][A
Training...:  12% 1738/13907 [1:04:28<6:34:40,  1.95s/it][A
Training...:  13% 1739/13907 [1:04:29<6:23:51,  1.89s/it][A
Training...:  13% 1740/13907 [1:04:31<6:13:16,  1.84s/it][A
Training...:  13% 1741/13907 [1:04:33<6:04:48,  1.80s/it][A
Training...:  13% 1742/13907 [1:04:34<5:55:01,  1.75s/it][A
Training...:  13% 1743/13907 [1:04:36<5:45:18,  1.70s/it][A
Training...:  13% 1744/13907 [1:04:38<5:36:58,  1.66s/it][A
Training...:  13% 1745/13907 [1:04:39<5:26:50,  1.61s/it][A
Training...:  13% 1746/13907 [1:04:41<5:16:22,  1.56s/it][A
Training...:  13% 1747/13907 [1:04:42<5:05:22,  1.51s/it][A
Training...:  13% 1748/13907 [1:04:43<4:53:13,  1.45s/it][A
Training...:  13% 1749/13907 [1:04:44<4:39:05,  1.38s/it][A
Training...:  13% 1750/13907 [1:04:45<4:18:05,  1.27s/it][A
Training...:  13% 1751/13907 [1:04:49<6:48:48,  2.02s/it][A
Training...:  13% 1752/13907 [1:04:53<8:17:47,  2.46s/it][A
Training...:  13% 1753/13907 [1:04:56<9:06:45,  2.70s/it][A
Training...:  13% 1754/13907 [1:04:59<9:33:50,  2.83s/it][A
Training...:  13% 1755/13907 [1:05:02<9:48:12,  2.90s/it][A
Training...:  13% 1756/13907 [1:05:05<9:53:26,  2.93s/it][A
Training...:  13% 1757/13907 [1:05:08<9:52:20,  2.93s/it][A
Training...:  13% 1758/13907 [1:05:11<9:47:03,  2.90s/it][A
Training...:  13% 1759/13907 [1:05:14<9:38:42,  2.86s/it][A
Training...:  13% 1760/13907 [1:05:16<9:30:27,  2.82s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:35:31<17:31:07, 31533.87s/it]
Training...:  13% 1760/13907 [1:05:19<9:30:27,  2.82s/it][A
Training...:  13% 1761/13907 [1:05:19<9:46:22,  2.90s/it][A
Training...:  13% 1762/13907 [1:05:22<9:36:21,  2.85s/it][A
Training...:  13% 1763/13907 [1:05:25<9:28:25,  2.81s/it][A
Training...:  13% 1764/13907 [1:05:27<9:11:51,  2.73s/it][A
Training...:  13% 1765/13907 [1:05:30<8:58:40,  2.66s/it][A
Training...:  13% 1766/13907 [1:05:32<8:45:16,  2.60s/it][A
Training...:  13% 1767/13907 [1:05:35<8:35:57,  2.55s/it][A
Training...:  13% 1768/13907 [1:05:37<8:26:20,  2.50s/it][A
Training...:  13% 1769/13907 [1:05:40<8:18:45,  2.47s/it][A
Training...:  13% 1770/13907 [1:05:42<8:10:20,  2.42s/it][A
Training...:  13% 1771/13907 [1:05:44<8:04:27,  2.40s/it][A
Training...:  13% 1772/13907 [1:05:47<7:58:03,  2.36s/it][A
Training...:  13% 1773/13907 [1:05:49<7:50:48,  2.33s/it][A
Training...:  13% 1774/13907 [1:05:51<7:42:44,  2.29s/it][A
Training...:  13% 1775/13907 [1:05:53<7:34:44,  2.25s/it][A
Training...:  13% 1776/13907 [1:05:55<7:28:00,  2.22s/it][A
Training...:  13% 1777/13907 [1:05:57<7:22:22,  2.19s/it][A
Training...:  13% 1778/13907 [1:06:00<7:15:41,  2.16s/it][A
Training...:  13% 1779/13907 [1:06:02<7:10:39,  2.13s/it][A
Training...:  13% 1780/13907 [1:06:04<7:04:19,  2.10s/it][A
Training...:  13% 1781/13907 [1:06:06<6:58:21,  2.07s/it][A
Training...:  13% 1782/13907 [1:06:08<6:52:17,  2.04s/it][A
Training...:  13% 1783/13907 [1:06:10<6:45:51,  2.01s/it][A
Training...:  13% 1784/13907 [1:06:11<6:38:36,  1.97s/it][A
Training...:  13% 1785/13907 [1:06:13<6:34:07,  1.95s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:36:27<17:31:07, 31533.87s/it]
Training...:  13% 1785/13907 [1:06:15<6:34:07,  1.95s/it][A
Training...:  13% 1786/13907 [1:06:15<6:47:13,  2.02s/it][A
Training...:  13% 1787/13907 [1:06:17<6:38:44,  1.97s/it][A
Training...:  13% 1788/13907 [1:06:19<6:28:52,  1.93s/it][A
Training...:  13% 1789/13907 [1:06:21<6:19:14,  1.88s/it][A
Training...:  13% 1790/13907 [1:06:23<6:09:50,  1.83s/it][A
Training...:  13% 1791/13907 [1:06:24<6:00:47,  1.79s/it][A
Training...:  13% 1792/13907 [1:06:26<5:51:11,  1.74s/it][A
Training...:  13% 1793/13907 [1:06:28<5:42:22,  1.70s/it][A
Training...:  13% 1794/13907 [1:06:29<5:33:59,  1.65s/it][A
Training...:  13% 1795/13907 [1:06:31<5:24:16,  1.61s/it][A
Training...:  13% 1796/13907 [1:06:32<5:14:27,  1.56s/it][A
Training...:  13% 1797/13907 [1:06:33<5:04:02,  1.51s/it][A
Training...:  13% 1798/13907 [1:06:35<4:50:55,  1.44s/it][A
Training...:  13% 1799/13907 [1:06:36<4:34:39,  1.36s/it][A
Training...:  13% 1800/13907 [1:06:37<4:14:18,  1.26s/it][A
Training...:  13% 1801/13907 [1:06:41<6:47:47,  2.02s/it][A
Training...:  13% 1802/13907 [1:06:44<8:12:37,  2.44s/it][A
Training...:  13% 1803/13907 [1:06:47<8:57:39,  2.67s/it][A
Training...:  13% 1804/13907 [1:06:50<9:23:40,  2.79s/it][A
Training...:  13% 1805/13907 [1:06:53<9:38:20,  2.87s/it][A
Training...:  13% 1806/13907 [1:06:56<9:41:39,  2.88s/it][A
Training...:  13% 1807/13907 [1:06:59<9:41:25,  2.88s/it][A
Training...:  13% 1808/13907 [1:07:02<9:41:10,  2.88s/it][A
Training...:  13% 1809/13907 [1:07:05<9:37:01,  2.86s/it][A
Training...:  13% 1810/13907 [1:07:08<9:31:40,  2.84s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:37:22<17:31:07, 31533.87s/it]
Training...:  13% 1810/13907 [1:07:11<9:31:40,  2.84s/it][A
Training...:  13% 1811/13907 [1:07:11<9:52:33,  2.94s/it][A
Training...:  13% 1812/13907 [1:07:14<9:39:59,  2.88s/it][A
Training...:  13% 1813/13907 [1:07:16<9:21:00,  2.78s/it][A
Training...:  13% 1814/13907 [1:07:19<9:04:55,  2.70s/it][A
Training...:  13% 1815/13907 [1:07:21<8:53:10,  2.65s/it][A
Training...:  13% 1816/13907 [1:07:24<8:41:58,  2.59s/it][A
Training...:  13% 1817/13907 [1:07:26<8:32:30,  2.54s/it][A
Training...:  13% 1818/13907 [1:07:29<8:22:07,  2.49s/it][A
Training...:  13% 1819/13907 [1:07:31<8:13:12,  2.45s/it][A
Training...:  13% 1820/13907 [1:07:33<8:06:33,  2.42s/it][A
Training...:  13% 1821/13907 [1:07:36<7:59:22,  2.38s/it][A
Training...:  13% 1822/13907 [1:07:38<7:52:16,  2.34s/it][A
Training...:  13% 1823/13907 [1:07:40<7:45:10,  2.31s/it][A
Training...:  13% 1824/13907 [1:07:42<7:36:56,  2.27s/it][A
Training...:  13% 1825/13907 [1:07:44<7:30:03,  2.23s/it][A
Training...:  13% 1826/13907 [1:07:46<7:23:40,  2.20s/it][A
Training...:  13% 1827/13907 [1:07:49<7:16:32,  2.17s/it][A
Training...:  13% 1828/13907 [1:07:51<7:10:54,  2.14s/it][A
Training...:  13% 1829/13907 [1:07:53<7:05:19,  2.11s/it][A
Training...:  13% 1830/13907 [1:07:55<6:59:13,  2.08s/it][A
Training...:  13% 1831/13907 [1:07:57<6:53:03,  2.05s/it][A
Training...:  13% 1832/13907 [1:07:59<6:49:08,  2.03s/it][A
Training...:  13% 1833/13907 [1:08:01<6:41:48,  2.00s/it][A
Training...:  13% 1834/13907 [1:08:02<6:34:22,  1.96s/it][A
Training...:  13% 1835/13907 [1:08:04<6:28:14,  1.93s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:38:17<17:31:07, 31533.87s/it]
Training...:  13% 1835/13907 [1:08:06<6:28:14,  1.93s/it][A
Training...:  13% 1836/13907 [1:08:06<6:41:13,  1.99s/it][A
Training...:  13% 1837/13907 [1:08:08<6:33:11,  1.95s/it][A
Training...:  13% 1838/13907 [1:08:10<6:22:00,  1.90s/it][A
Training...:  13% 1839/13907 [1:08:12<6:12:43,  1.85s/it][A
Training...:  13% 1840/13907 [1:08:14<6:04:03,  1.81s/it][A
Training...:  13% 1841/13907 [1:08:15<5:56:20,  1.77s/it][A
Training...:  13% 1842/13907 [1:08:17<5:47:21,  1.73s/it][A
Training...:  13% 1843/13907 [1:08:18<5:39:47,  1.69s/it][A
Training...:  13% 1844/13907 [1:08:20<5:32:39,  1.65s/it][A
Training...:  13% 1845/13907 [1:08:22<5:23:39,  1.61s/it][A
Training...:  13% 1846/13907 [1:08:23<5:14:19,  1.56s/it][A
Training...:  13% 1847/13907 [1:08:24<5:05:40,  1.52s/it][A
Training...:  13% 1848/13907 [1:08:26<4:54:06,  1.46s/it][A
Training...:  13% 1849/13907 [1:08:27<4:39:03,  1.39s/it][A
Training...:  13% 1850/13907 [1:08:28<4:19:00,  1.29s/it][A
Training...:  13% 1851/13907 [1:08:32<6:50:28,  2.04s/it][A
Training...:  13% 1852/13907 [1:08:35<8:20:18,  2.49s/it][A
Training...:  13% 1853/13907 [1:08:39<9:08:12,  2.73s/it][A
Training...:  13% 1854/13907 [1:08:42<9:34:52,  2.86s/it][A
Training...:  13% 1855/13907 [1:08:45<9:47:33,  2.93s/it][A
Training...:  13% 1856/13907 [1:08:48<9:51:30,  2.94s/it][A
Training...:  13% 1857/13907 [1:08:51<9:51:19,  2.94s/it][A
Training...:  13% 1858/13907 [1:08:54<9:49:30,  2.94s/it][A
Training...:  13% 1859/13907 [1:08:57<9:46:02,  2.92s/it][A
Training...:  13% 1860/13907 [1:08:59<9:37:44,  2.88s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:39:14<17:31:07, 31533.87s/it]
Training...:  13% 1860/13907 [1:09:02<9:37:44,  2.88s/it][A
Training...:  13% 1861/13907 [1:09:02<9:51:53,  2.95s/it][A
Training...:  13% 1862/13907 [1:09:05<9:37:41,  2.88s/it][A
Training...:  13% 1863/13907 [1:09:08<9:20:35,  2.79s/it][A
Training...:  13% 1864/13907 [1:09:10<9:05:22,  2.72s/it][A
Training...:  13% 1865/13907 [1:09:13<8:51:53,  2.65s/it][A
Training...:  13% 1866/13907 [1:09:15<8:41:21,  2.60s/it][A
Training...:  13% 1867/13907 [1:09:18<8:30:44,  2.55s/it][A
Training...:  13% 1868/13907 [1:09:20<8:21:00,  2.50s/it][A
Training...:  13% 1869/13907 [1:09:22<8:13:56,  2.46s/it][A
Training...:  13% 1870/13907 [1:09:25<8:07:49,  2.43s/it][A
Training...:  13% 1871/13907 [1:09:27<8:00:12,  2.39s/it][A
Training...:  13% 1872/13907 [1:09:29<7:54:27,  2.37s/it][A
Training...:  13% 1873/13907 [1:09:32<7:46:13,  2.32s/it][A
Training...:  13% 1874/13907 [1:09:34<7:38:45,  2.29s/it][A
Training...:  13% 1875/13907 [1:09:36<7:30:39,  2.25s/it][A
Training...:  13% 1876/13907 [1:09:38<7:23:54,  2.21s/it][A
Training...:  13% 1877/13907 [1:09:40<7:18:02,  2.18s/it][A
Training...:  14% 1878/13907 [1:09:42<7:12:52,  2.16s/it][A
Training...:  14% 1879/13907 [1:09:44<7:06:54,  2.13s/it][A
Training...:  14% 1880/13907 [1:09:46<7:01:35,  2.10s/it][A
Training...:  14% 1881/13907 [1:09:48<6:55:46,  2.07s/it][A
Training...:  14% 1882/13907 [1:09:50<6:51:02,  2.05s/it][A
Training...:  14% 1883/13907 [1:09:52<6:46:12,  2.03s/it][A
Training...:  14% 1884/13907 [1:09:54<6:39:49,  2.00s/it][A
Training...:  14% 1885/13907 [1:09:56<6:33:40,  1.96s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:40:09<17:31:07, 31533.87s/it]
Training...:  14% 1885/13907 [1:09:58<6:33:40,  1.96s/it][A
Training...:  14% 1886/13907 [1:09:58<6:44:43,  2.02s/it][A
Training...:  14% 1887/13907 [1:10:00<6:36:15,  1.98s/it][A
Training...:  14% 1888/13907 [1:10:02<6:26:55,  1.93s/it][A
Training...:  14% 1889/13907 [1:10:04<6:16:13,  1.88s/it][A
Training...:  14% 1890/13907 [1:10:06<6:07:44,  1.84s/it][A
Training...:  14% 1891/13907 [1:10:07<6:00:17,  1.80s/it][A
Training...:  14% 1892/13907 [1:10:09<5:51:17,  1.75s/it][A
Training...:  14% 1893/13907 [1:10:11<5:43:57,  1.72s/it][A
Training...:  14% 1894/13907 [1:10:12<5:37:03,  1.68s/it][A
Training...:  14% 1895/13907 [1:10:14<5:28:01,  1.64s/it][A
Training...:  14% 1896/13907 [1:10:15<5:16:25,  1.58s/it][A
Training...:  14% 1897/13907 [1:10:17<5:06:47,  1.53s/it][A
Training...:  14% 1898/13907 [1:10:18<4:53:23,  1.47s/it][A
Training...:  14% 1899/13907 [1:10:19<4:39:54,  1.40s/it][A
Training...:  14% 1900/13907 [1:10:20<4:19:45,  1.30s/it][A
Training...:  14% 1901/13907 [1:10:24<7:01:41,  2.11s/it][A
Training...:  14% 1902/13907 [1:10:28<8:24:38,  2.52s/it][A
Training...:  14% 1903/13907 [1:10:31<9:08:40,  2.74s/it][A
Training...:  14% 1904/13907 [1:10:34<9:32:14,  2.86s/it][A
Training...:  14% 1905/13907 [1:10:37<9:42:33,  2.91s/it][A
Training...:  14% 1906/13907 [1:10:40<9:43:40,  2.92s/it][A
Training...:  14% 1907/13907 [1:10:43<9:40:45,  2.90s/it][A
Training...:  14% 1908/13907 [1:10:46<9:35:28,  2.88s/it][A
Training...:  14% 1909/13907 [1:10:49<9:29:05,  2.85s/it][A
Training...:  14% 1910/13907 [1:10:51<9:20:34,  2.80s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:41:05<17:31:07, 31533.87s/it]
Training...:  14% 1910/13907 [1:10:54<9:20:34,  2.80s/it][A
Training...:  14% 1911/13907 [1:10:54<9:36:51,  2.89s/it][A
Training...:  14% 1912/13907 [1:10:57<9:26:12,  2.83s/it][A
Training...:  14% 1913/13907 [1:11:00<9:09:55,  2.75s/it][A
Training...:  14% 1914/13907 [1:11:02<8:56:10,  2.68s/it][A
Training...:  14% 1915/13907 [1:11:05<8:45:05,  2.63s/it][A
Training...:  14% 1916/13907 [1:11:07<8:37:11,  2.59s/it][A
Training...:  14% 1917/13907 [1:11:10<8:29:28,  2.55s/it][A
Training...:  14% 1918/13907 [1:11:12<8:22:03,  2.51s/it][A
Training...:  14% 1919/13907 [1:11:14<8:15:08,  2.48s/it][A
Training...:  14% 1920/13907 [1:11:17<8:07:46,  2.44s/it][A
Training...:  14% 1921/13907 [1:11:19<7:59:57,  2.40s/it][A
Training...:  14% 1922/13907 [1:11:21<7:52:59,  2.37s/it][A
Training...:  14% 1923/13907 [1:11:24<7:47:14,  2.34s/it][A
Training...:  14% 1924/13907 [1:11:26<7:40:06,  2.30s/it][A
Training...:  14% 1925/13907 [1:11:28<7:31:44,  2.26s/it][A
Training...:  14% 1926/13907 [1:11:30<7:25:37,  2.23s/it][A
Training...:  14% 1927/13907 [1:11:32<7:19:23,  2.20s/it][A
Training...:  14% 1928/13907 [1:11:34<7:12:01,  2.16s/it][A
Training...:  14% 1929/13907 [1:11:36<7:05:28,  2.13s/it][A
Training...:  14% 1930/13907 [1:11:38<6:59:02,  2.10s/it][A
Training...:  14% 1931/13907 [1:11:40<6:52:53,  2.07s/it][A
Training...:  14% 1932/13907 [1:11:42<6:46:56,  2.04s/it][A
Training...:  14% 1933/13907 [1:11:44<6:42:13,  2.02s/it][A
Training...:  14% 1934/13907 [1:11:46<6:35:51,  1.98s/it][A
Training...:  14% 1935/13907 [1:11:48<6:30:10,  1.96s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:42:01<17:31:07, 31533.87s/it]
Training...:  14% 1935/13907 [1:11:50<6:30:10,  1.96s/it][A
Training...:  14% 1936/13907 [1:11:50<6:41:45,  2.01s/it][A
Training...:  14% 1937/13907 [1:11:52<6:34:07,  1.98s/it][A
Training...:  14% 1938/13907 [1:11:54<6:26:45,  1.94s/it][A
Training...:  14% 1939/13907 [1:11:56<6:19:15,  1.90s/it][A
Training...:  14% 1940/13907 [1:11:58<6:10:31,  1.86s/it][A
Training...:  14% 1941/13907 [1:11:59<6:03:53,  1.82s/it][A
Training...:  14% 1942/13907 [1:12:01<5:53:23,  1.77s/it][A
Training...:  14% 1943/13907 [1:12:03<5:44:58,  1.73s/it][A
Training...:  14% 1944/13907 [1:12:04<5:34:44,  1.68s/it][A
Training...:  14% 1945/13907 [1:12:06<5:26:56,  1.64s/it][A
Training...:  14% 1946/13907 [1:12:07<5:15:38,  1.58s/it][A
Training...:  14% 1947/13907 [1:12:09<5:03:51,  1.52s/it][A
Training...:  14% 1948/13907 [1:12:10<4:50:16,  1.46s/it][A
Training...:  14% 1949/13907 [1:12:11<4:37:00,  1.39s/it][A
Training...:  14% 1950/13907 [1:12:12<4:15:43,  1.28s/it][A
Training...:  14% 1951/13907 [1:12:16<6:42:26,  2.02s/it][A
Training...:  14% 1952/13907 [1:12:19<8:07:22,  2.45s/it][A
Training...:  14% 1953/13907 [1:12:23<8:54:10,  2.68s/it][A
Training...:  14% 1954/13907 [1:12:26<9:24:18,  2.83s/it][A
Training...:  14% 1955/13907 [1:12:29<9:35:00,  2.89s/it][A
Training...:  14% 1956/13907 [1:12:32<9:39:37,  2.91s/it][A
Training...:  14% 1957/13907 [1:12:35<9:38:56,  2.91s/it][A
Training...:  14% 1958/13907 [1:12:37<9:34:23,  2.88s/it][A
Training...:  14% 1959/13907 [1:12:40<9:25:50,  2.84s/it][A
Training...:  14% 1960/13907 [1:12:43<9:17:15,  2.80s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:42:57<17:31:07, 31533.87s/it]
Training...:  14% 1960/13907 [1:12:46<9:17:15,  2.80s/it][A
Training...:  14% 1961/13907 [1:12:46<9:34:16,  2.88s/it][A
Training...:  14% 1962/13907 [1:12:49<9:23:55,  2.83s/it][A
Training...:  14% 1963/13907 [1:12:51<9:11:05,  2.77s/it][A
Training...:  14% 1964/13907 [1:12:54<8:56:35,  2.70s/it][A
Training...:  14% 1965/13907 [1:12:56<8:44:33,  2.64s/it][A
Training...:  14% 1966/13907 [1:12:59<8:34:40,  2.59s/it][A
Training...:  14% 1967/13907 [1:13:01<8:25:21,  2.54s/it][A
Training...:  14% 1968/13907 [1:13:04<8:18:46,  2.51s/it][A
Training...:  14% 1969/13907 [1:13:06<8:16:41,  2.50s/it][A
Training...:  14% 1970/13907 [1:13:09<8:08:08,  2.45s/it][A
Training...:  14% 1971/13907 [1:13:11<7:58:34,  2.41s/it][A
Training...:  14% 1972/13907 [1:13:13<7:50:35,  2.37s/it][A
Training...:  14% 1973/13907 [1:13:15<7:42:21,  2.32s/it][A
Training...:  14% 1974/13907 [1:13:18<7:35:59,  2.29s/it][A
Training...:  14% 1975/13907 [1:13:20<7:28:40,  2.26s/it][A
Training...:  14% 1976/13907 [1:13:22<7:21:07,  2.22s/it][A
Training...:  14% 1977/13907 [1:13:24<7:16:03,  2.19s/it][A
Training...:  14% 1978/13907 [1:13:26<7:10:01,  2.16s/it][A
Training...:  14% 1979/13907 [1:13:28<7:04:56,  2.14s/it][A
Training...:  14% 1980/13907 [1:13:30<6:58:46,  2.11s/it][A
Training...:  14% 1981/13907 [1:13:32<6:52:50,  2.08s/it][A
Training...:  14% 1982/13907 [1:13:34<6:47:21,  2.05s/it][A
Training...:  14% 1983/13907 [1:13:36<6:42:39,  2.03s/it][A
Training...:  14% 1984/13907 [1:13:38<6:36:32,  2.00s/it][A
Training...:  14% 1985/13907 [1:13:40<6:31:03,  1.97s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:43:53<17:31:07, 31533.87s/it]
Training...:  14% 1985/13907 [1:13:42<6:31:03,  1.97s/it][A
Training...:  14% 1986/13907 [1:13:42<6:43:20,  2.03s/it][A
Training...:  14% 1987/13907 [1:13:44<6:35:39,  1.99s/it][A
Training...:  14% 1988/13907 [1:13:46<6:23:52,  1.93s/it][A
Training...:  14% 1989/13907 [1:13:48<6:14:30,  1.89s/it][A
Training...:  14% 1990/13907 [1:13:49<6:05:22,  1.84s/it][A
Training...:  14% 1991/13907 [1:13:51<5:55:48,  1.79s/it][A
Training...:  14% 1992/13907 [1:13:53<5:47:07,  1.75s/it][A
Training...:  14% 1993/13907 [1:13:54<5:39:16,  1.71s/it][A
Training...:  14% 1994/13907 [1:13:56<5:31:58,  1.67s/it][A
Training...:  14% 1995/13907 [1:13:57<5:21:57,  1.62s/it][A
Training...:  14% 1996/13907 [1:13:59<5:12:30,  1.57s/it][A
Training...:  14% 1997/13907 [1:14:00<5:00:29,  1.51s/it][A
Training...:  14% 1998/13907 [1:14:02<4:47:39,  1.45s/it][A
Training...:  14% 1999/13907 [1:14:03<4:34:10,  1.38s/it][A
Training...:  14% 2000/13907 [1:14:04<4:14:54,  1.28s/it][A
Training...:  14% 2001/13907 [1:14:07<6:38:35,  2.01s/it][A
Training...:  14% 2002/13907 [1:14:11<8:08:05,  2.46s/it][A
Training...:  14% 2003/13907 [1:14:14<8:57:31,  2.71s/it][A
Training...:  14% 2004/13907 [1:14:17<9:20:33,  2.83s/it][A
Training...:  14% 2005/13907 [1:14:20<9:32:28,  2.89s/it][A
Training...:  14% 2006/13907 [1:14:23<9:34:21,  2.90s/it][A
Training...:  14% 2007/13907 [1:14:26<9:33:54,  2.89s/it][A
Training...:  14% 2008/13907 [1:14:29<9:29:24,  2.87s/it][A
Training...:  14% 2009/13907 [1:14:32<9:22:02,  2.83s/it][A
Training...:  14% 2010/13907 [1:14:34<9:12:52,  2.79s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:44:49<17:31:07, 31533.87s/it]
Training...:  14% 2010/13907 [1:14:38<9:12:52,  2.79s/it][A
Training...:  14% 2011/13907 [1:14:38<9:30:02,  2.88s/it][A
Training...:  14% 2012/13907 [1:14:40<9:20:15,  2.83s/it][A
Training...:  14% 2013/13907 [1:14:43<9:06:13,  2.76s/it][A
Training...:  14% 2014/13907 [1:14:45<8:52:28,  2.69s/it][A
Training...:  14% 2015/13907 [1:14:48<8:40:27,  2.63s/it][A
Training...:  14% 2016/13907 [1:14:50<8:29:35,  2.57s/it][A
Training...:  15% 2017/13907 [1:14:53<8:20:05,  2.52s/it][A
Training...:  15% 2018/13907 [1:14:55<8:11:44,  2.48s/it][A
Training...:  15% 2019/13907 [1:14:57<8:04:09,  2.44s/it][A
Training...:  15% 2020/13907 [1:15:00<7:57:48,  2.41s/it][A
Training...:  15% 2021/13907 [1:15:02<7:52:06,  2.38s/it][A
Training...:  15% 2022/13907 [1:15:04<7:45:41,  2.35s/it][A
Training...:  15% 2023/13907 [1:15:07<7:38:10,  2.31s/it][A
Training...:  15% 2024/13907 [1:15:09<7:31:29,  2.28s/it][A
Training...:  15% 2025/13907 [1:15:11<7:26:44,  2.26s/it][A
Training...:  15% 2026/13907 [1:15:13<7:20:42,  2.23s/it][A
Training...:  15% 2027/13907 [1:15:15<7:15:36,  2.20s/it][A
Training...:  15% 2028/13907 [1:15:17<7:13:47,  2.19s/it][A
Training...:  15% 2029/13907 [1:15:20<7:05:37,  2.15s/it][A
Training...:  15% 2030/13907 [1:15:22<6:57:57,  2.11s/it][A
Training...:  15% 2031/13907 [1:15:24<6:51:22,  2.08s/it][A
Training...:  15% 2032/13907 [1:15:26<6:46:32,  2.05s/it][A
Training...:  15% 2033/13907 [1:15:27<6:39:05,  2.02s/it][A
Training...:  15% 2034/13907 [1:15:29<6:31:26,  1.98s/it][A
Training...:  15% 2035/13907 [1:15:31<6:24:38,  1.94s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:45:44<17:31:07, 31533.87s/it]
Training...:  15% 2035/13907 [1:15:33<6:24:38,  1.94s/it][A
Training...:  15% 2036/13907 [1:15:33<6:36:16,  2.00s/it][A
Training...:  15% 2037/13907 [1:15:35<6:29:10,  1.97s/it][A
Training...:  15% 2038/13907 [1:15:37<6:17:45,  1.91s/it][A
Training...:  15% 2039/13907 [1:15:39<6:07:56,  1.86s/it][A
Training...:  15% 2040/13907 [1:15:40<5:58:45,  1.81s/it][A
Training...:  15% 2041/13907 [1:15:42<5:50:38,  1.77s/it][A
Training...:  15% 2042/13907 [1:15:44<5:42:29,  1.73s/it][A
Training...:  15% 2043/13907 [1:15:45<5:33:54,  1.69s/it][A
Training...:  15% 2044/13907 [1:15:47<5:27:18,  1.66s/it][A
Training...:  15% 2045/13907 [1:15:48<5:18:40,  1.61s/it][A
Training...:  15% 2046/13907 [1:15:50<5:08:40,  1.56s/it][A
Training...:  15% 2047/13907 [1:15:51<4:57:31,  1.51s/it][A
Training...:  15% 2048/13907 [1:15:53<4:45:53,  1.45s/it][A
Training...:  15% 2049/13907 [1:15:54<4:32:32,  1.38s/it][A
Training...:  15% 2050/13907 [1:15:55<4:13:38,  1.28s/it][A
Training...:  15% 2051/13907 [1:15:59<6:36:40,  2.01s/it][A
Training...:  15% 2052/13907 [1:16:02<8:05:08,  2.46s/it][A
Training...:  15% 2053/13907 [1:16:05<8:52:15,  2.69s/it][A
Training...:  15% 2054/13907 [1:16:08<9:19:46,  2.83s/it][A
Training...:  15% 2055/13907 [1:16:12<9:32:44,  2.90s/it][A
Training...:  15% 2056/13907 [1:16:15<9:37:37,  2.92s/it][A
Training...:  15% 2057/13907 [1:16:17<9:36:35,  2.92s/it][A
Training...:  15% 2058/13907 [1:16:20<9:32:03,  2.90s/it][A
Training...:  15% 2059/13907 [1:16:23<9:25:39,  2.86s/it][A
Training...:  15% 2060/13907 [1:16:26<9:16:35,  2.82s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:46:40<17:31:07, 31533.87s/it]
Training...:  15% 2060/13907 [1:16:29<9:16:35,  2.82s/it][A
Training...:  15% 2061/13907 [1:16:29<9:34:42,  2.91s/it][A
Training...:  15% 2062/13907 [1:16:32<9:22:58,  2.85s/it][A
Training...:  15% 2063/13907 [1:16:34<9:07:18,  2.77s/it][A
Training...:  15% 2064/13907 [1:16:37<8:54:31,  2.71s/it][A
Training...:  15% 2065/13907 [1:16:39<8:41:56,  2.64s/it][A
Training...:  15% 2066/13907 [1:16:42<8:32:33,  2.60s/it][A
Training...:  15% 2067/13907 [1:16:44<8:23:50,  2.55s/it][A
Training...:  15% 2068/13907 [1:16:47<8:15:05,  2.51s/it][A
Training...:  15% 2069/13907 [1:16:49<8:07:25,  2.47s/it][A
Training...:  15% 2070/13907 [1:16:51<8:00:06,  2.43s/it][A
Training...:  15% 2071/13907 [1:16:54<7:51:49,  2.39s/it][A
Training...:  15% 2072/13907 [1:16:56<7:45:17,  2.36s/it][A
Training...:  15% 2073/13907 [1:16:58<7:37:26,  2.32s/it][A
Training...:  15% 2074/13907 [1:17:00<7:31:35,  2.29s/it][A
Training...:  15% 2075/13907 [1:17:03<7:24:35,  2.25s/it][A
Training...:  15% 2076/13907 [1:17:05<7:17:50,  2.22s/it][A
Training...:  15% 2077/13907 [1:17:07<7:12:55,  2.20s/it][A
Training...:  15% 2078/13907 [1:17:09<7:06:53,  2.17s/it][A
Training...:  15% 2079/13907 [1:17:11<7:00:45,  2.13s/it][A
Training...:  15% 2080/13907 [1:17:13<6:56:40,  2.11s/it][A
Training...:  15% 2081/13907 [1:17:15<6:50:46,  2.08s/it][A
Training...:  15% 2082/13907 [1:17:17<6:44:48,  2.05s/it][A
Training...:  15% 2083/13907 [1:17:19<6:38:23,  2.02s/it][A
Training...:  15% 2084/13907 [1:17:21<6:32:38,  1.99s/it][A
Training...:  15% 2085/13907 [1:17:23<6:28:22,  1.97s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:47:36<17:31:07, 31533.87s/it]
Training...:  15% 2085/13907 [1:17:25<6:28:22,  1.97s/it][A
Training...:  15% 2086/13907 [1:17:25<6:40:47,  2.03s/it][A
Training...:  15% 2087/13907 [1:17:27<6:35:41,  2.01s/it][A
Training...:  15% 2088/13907 [1:17:29<6:22:48,  1.94s/it][A
Training...:  15% 2089/13907 [1:17:31<6:15:35,  1.91s/it][A
Training...:  15% 2090/13907 [1:17:32<6:04:49,  1.85s/it][A
Training...:  15% 2091/13907 [1:17:34<5:55:56,  1.81s/it][A
Training...:  15% 2092/13907 [1:17:36<5:46:38,  1.76s/it][A
Training...:  15% 2093/13907 [1:17:37<5:38:06,  1.72s/it][A
Training...:  15% 2094/13907 [1:17:39<5:28:55,  1.67s/it][A
Training...:  15% 2095/13907 [1:17:40<5:21:02,  1.63s/it][A
Training...:  15% 2096/13907 [1:17:42<5:11:14,  1.58s/it][A
Training...:  15% 2097/13907 [1:17:43<5:00:55,  1.53s/it][A
Training...:  15% 2098/13907 [1:17:45<4:49:36,  1.47s/it][A
Training...:  15% 2099/13907 [1:17:46<4:36:36,  1.41s/it][A
Training...:  15% 2100/13907 [1:17:47<4:17:12,  1.31s/it][A
Training...:  15% 2101/13907 [1:17:51<6:38:48,  2.03s/it][A
Training...:  15% 2102/13907 [1:17:54<8:07:38,  2.48s/it][A
Training...:  15% 2103/13907 [1:17:57<8:55:36,  2.72s/it][A
Training...:  15% 2104/13907 [1:18:01<9:19:11,  2.84s/it][A
Training...:  15% 2105/13907 [1:18:04<9:30:54,  2.90s/it][A
Training...:  15% 2106/13907 [1:18:07<9:34:53,  2.92s/it][A
Training...:  15% 2107/13907 [1:18:09<9:33:10,  2.91s/it][A
Training...:  15% 2108/13907 [1:18:12<9:27:25,  2.89s/it][A
Training...:  15% 2109/13907 [1:18:15<9:21:53,  2.86s/it][A
Training...:  15% 2110/13907 [1:18:18<9:11:51,  2.81s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:48:32<17:31:07, 31533.87s/it]
Training...:  15% 2110/13907 [1:18:21<9:11:51,  2.81s/it][A
Training...:  15% 2111/13907 [1:18:21<9:27:37,  2.89s/it][A
Training...:  15% 2112/13907 [1:18:24<9:18:35,  2.84s/it][A
Training...:  15% 2113/13907 [1:18:26<9:05:20,  2.77s/it][A
Training...:  15% 2114/13907 [1:18:29<8:51:11,  2.70s/it][A
Training...:  15% 2115/13907 [1:18:31<8:39:04,  2.64s/it][A
Training...:  15% 2116/13907 [1:18:34<8:29:27,  2.59s/it][A
Training...:  15% 2117/13907 [1:18:36<8:19:16,  2.54s/it][A
Training...:  15% 2118/13907 [1:18:39<8:10:36,  2.50s/it][A
Training...:  15% 2119/13907 [1:18:41<8:02:00,  2.45s/it][A
Training...:  15% 2120/13907 [1:18:43<7:53:31,  2.41s/it][A
Training...:  15% 2121/13907 [1:18:45<7:46:35,  2.38s/it][A
Training...:  15% 2122/13907 [1:18:48<7:38:17,  2.33s/it][A
Training...:  15% 2123/13907 [1:18:50<7:31:43,  2.30s/it][A
Training...:  15% 2124/13907 [1:18:52<7:29:09,  2.29s/it][A
Training...:  15% 2125/13907 [1:18:54<7:22:59,  2.26s/it][A
Training...:  15% 2126/13907 [1:18:56<7:15:48,  2.22s/it][A
Training...:  15% 2127/13907 [1:18:59<7:08:11,  2.18s/it][A
Training...:  15% 2128/13907 [1:19:01<7:00:24,  2.14s/it][A
Training...:  15% 2129/13907 [1:19:03<6:54:08,  2.11s/it][A
Training...:  15% 2130/13907 [1:19:05<6:48:50,  2.08s/it][A
Training...:  15% 2131/13907 [1:19:07<6:42:59,  2.05s/it][A
Training...:  15% 2132/13907 [1:19:09<6:36:52,  2.02s/it][A
Training...:  15% 2133/13907 [1:19:11<6:31:22,  1.99s/it][A
Training...:  15% 2134/13907 [1:19:12<6:26:51,  1.97s/it][A
Training...:  15% 2135/13907 [1:19:14<6:21:19,  1.94s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:49:28<17:31:07, 31533.87s/it]
Training...:  15% 2135/13907 [1:19:17<6:21:19,  1.94s/it][A
Training...:  15% 2136/13907 [1:19:17<6:35:31,  2.02s/it][A
Training...:  15% 2137/13907 [1:19:18<6:27:16,  1.97s/it][A
Training...:  15% 2138/13907 [1:19:20<6:14:53,  1.91s/it][A
Training...:  15% 2139/13907 [1:19:22<6:05:11,  1.86s/it][A
Training...:  15% 2140/13907 [1:19:24<5:55:57,  1.82s/it][A
Training...:  15% 2141/13907 [1:19:25<5:49:14,  1.78s/it][A
Training...:  15% 2142/13907 [1:19:27<5:40:16,  1.74s/it][A
Training...:  15% 2143/13907 [1:19:29<5:31:34,  1.69s/it][A
Training...:  15% 2144/13907 [1:19:30<5:23:39,  1.65s/it][A
Training...:  15% 2145/13907 [1:19:32<5:15:28,  1.61s/it][A
Training...:  15% 2146/13907 [1:19:33<5:07:36,  1.57s/it][A
Training...:  15% 2147/13907 [1:19:34<4:55:59,  1.51s/it][A
Training...:  15% 2148/13907 [1:19:36<4:44:24,  1.45s/it][A
Training...:  15% 2149/13907 [1:19:37<4:31:15,  1.38s/it][A
Training...:  15% 2150/13907 [1:19:38<4:11:56,  1.29s/it][A
Training...:  15% 2151/13907 [1:19:42<6:34:32,  2.01s/it][A
Training...:  15% 2152/13907 [1:19:45<7:56:33,  2.43s/it][A
Training...:  15% 2153/13907 [1:19:48<8:41:25,  2.66s/it][A
Training...:  15% 2154/13907 [1:19:51<9:05:40,  2.79s/it][A
Training...:  15% 2155/13907 [1:19:55<9:26:24,  2.89s/it][A
Training...:  16% 2156/13907 [1:19:58<9:30:47,  2.91s/it][A
Training...:  16% 2157/13907 [1:20:00<9:26:01,  2.89s/it][A
Training...:  16% 2158/13907 [1:20:03<9:18:55,  2.85s/it][A
Training...:  16% 2159/13907 [1:20:06<9:11:04,  2.81s/it][A
Training...:  16% 2160/13907 [1:20:09<9:02:08,  2.77s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:50:23<17:31:07, 31533.87s/it]
Training...:  16% 2160/13907 [1:20:12<9:02:08,  2.77s/it][A
Training...:  16% 2161/13907 [1:20:12<9:16:59,  2.85s/it][A
Training...:  16% 2162/13907 [1:20:14<9:07:16,  2.80s/it][A
Training...:  16% 2163/13907 [1:20:17<8:51:36,  2.72s/it][A
Training...:  16% 2164/13907 [1:20:19<8:39:34,  2.65s/it][A
Training...:  16% 2165/13907 [1:20:22<8:30:34,  2.61s/it][A
Training...:  16% 2166/13907 [1:20:24<8:21:33,  2.56s/it][A
Training...:  16% 2167/13907 [1:20:27<8:14:05,  2.53s/it][A
Training...:  16% 2168/13907 [1:20:29<8:04:50,  2.48s/it][A
Training...:  16% 2169/13907 [1:20:31<7:57:13,  2.44s/it][A
Training...:  16% 2170/13907 [1:20:34<7:51:16,  2.41s/it][A
Training...:  16% 2171/13907 [1:20:36<7:45:19,  2.38s/it][A
Training...:  16% 2172/13907 [1:20:38<7:36:16,  2.33s/it][A
Training...:  16% 2173/13907 [1:20:40<7:29:01,  2.30s/it][A
Training...:  16% 2174/13907 [1:20:43<7:22:53,  2.26s/it][A
Training...:  16% 2175/13907 [1:20:45<7:17:33,  2.24s/it][A
Training...:  16% 2176/13907 [1:20:47<7:17:09,  2.24s/it][A
Training...:  16% 2177/13907 [1:20:49<7:10:20,  2.20s/it][A
Training...:  16% 2178/13907 [1:20:51<7:01:06,  2.15s/it][A
Training...:  16% 2179/13907 [1:20:53<6:52:52,  2.11s/it][A
Training...:  16% 2180/13907 [1:20:55<6:45:36,  2.08s/it][A
Training...:  16% 2181/13907 [1:20:57<6:38:36,  2.04s/it][A
Training...:  16% 2182/13907 [1:20:59<6:31:58,  2.01s/it][A
Training...:  16% 2183/13907 [1:21:01<6:26:13,  1.98s/it][A
Training...:  16% 2184/13907 [1:21:03<6:20:20,  1.95s/it][A
Training...:  16% 2185/13907 [1:21:05<6:16:19,  1.93s/it][A                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [18:51:18<17:31:07, 31533.87s/it]
Training...:  16% 2185/13907 [1:21:07<6:16:19,  1.93s/it][AStep... (29550 | Loss: 0.2025887817144394, Learning Rate: 0.00012394545774441212, Gradient Norm: 0.8204513788223267)
Step... (29575 | Loss: 0.24594083428382874, Learning Rate: 0.00012379394320305437, Gradient Norm: 0.7977288961410522)
Step... (29600 | Loss: 0.2396906614303589, Learning Rate: 0.00012364244321361184, Gradient Norm: 1.028564453125)
Step... (29625 | Loss: 0.2503533363342285, Learning Rate: 0.00012349091412033886, Gradient Norm: 1.1505348682403564)
Step... (29650 | Loss: 0.17077863216400146, Learning Rate: 0.0001233393995789811, Gradient Norm: 0.7686504125595093)
Step... (29675 | Loss: 0.24643056094646454, Learning Rate: 0.00012318789958953857, Gradient Norm: 0.9457614421844482)
Step... (29700 | Loss: 0.23065203428268433, Learning Rate: 0.0001230363704962656, Gradient Norm: 0.889449954032898)
Step... (29725 | Loss: 0.2337302565574646, Learning Rate: 0.00012288485595490783, Gradient Norm: 0.6747685074806213)
Step... (29750 | Loss: 0.17314374446868896, Learning Rate: 0.00012273334141355008, Gradient Norm: 0.7667531967163086)
Step... (29775 | Loss: 0.17501100897789001, Learning Rate: 0.00012258182687219232, Gradient Norm: 0.638648271560669)
Step... (29800 | Loss: 0.24896277487277985, Learning Rate: 0.00012243031233083457, Gradient Norm: 0.9335522651672363)
Step... (29825 | Loss: 0.1911822259426117, Learning Rate: 0.0001222787977894768, Gradient Norm: 0.5383402109146118)
Step... (29850 | Loss: 0.21852219104766846, Learning Rate: 0.00012212728324811906, Gradient Norm: 0.9076768755912781)
Step... (29875 | Loss: 0.2384786158800125, Learning Rate: 0.0001219757687067613, Gradient Norm: 1.1208369731903076)
Step... (29900 | Loss: 0.17475253343582153, Learning Rate: 0.00012182423961348832, Gradient Norm: 0.6732205152511597)
Step... (29925 | Loss: 0.23836468160152435, Learning Rate: 0.00012167273234808818, Gradient Norm: 0.7724415063858032)
Step... (29950 | Loss: 0.19567449390888214, Learning Rate: 0.00012152122508268803, Gradient Norm: 0.9826538562774658)
Step... (29975 | Loss: 0.22697752714157104, Learning Rate: 0.00012136969598941505, Gradient Norm: 0.8236868381500244)
Step... (30000 | Loss: 0.23598122596740723, Learning Rate: 0.00012121818872401491, Gradient Norm: 0.9487480521202087)


Evaluating ...:   0% 0/255 [00:00<?, ?it/s][A[A

Evaluating ...:   0% 1/255 [00:04<18:29,  4.37s/it][A[A

Evaluating ...:   1% 2/255 [00:08<16:45,  3.97s/it][A[A

Evaluating ...:   1% 3/255 [00:11<15:49,  3.77s/it][A[A

Evaluating ...:   2% 4/255 [00:14<15:02,  3.60s/it][A[A

Evaluating ...:   2% 5/255 [00:18<14:40,  3.52s/it][A[A

Evaluating ...:   2% 6/255 [00:21<14:01,  3.38s/it][A[A

Evaluating ...:   3% 7/255 [00:24<13:36,  3.29s/it][A[A

Evaluating ...:   3% 8/255 [00:27<13:06,  3.19s/it][A[A

Evaluating ...:   4% 9/255 [00:30<12:44,  3.11s/it][A[A

Evaluating ...:   4% 10/255 [00:33<12:15,  3.00s/it][A[A

Evaluating ...:   4% 11/255 [00:35<11:58,  2.94s/it][A[A

Evaluating ...:   5% 12/255 [00:38<11:40,  2.88s/it][A[A

Evaluating ...:   5% 13/255 [00:41<11:30,  2.85s/it][A[A

Evaluating ...:   5% 14/255 [00:44<11:10,  2.78s/it][A[A

Evaluating ...:   6% 15/255 [00:46<10:59,  2.75s/it][A[A

Evaluating ...:   6% 16/255 [00:49<10:40,  2.68s/it][A[A

Evaluating ...:   7% 17/255 [00:51<10:28,  2.64s/it][A[A

Evaluating ...:   7% 18/255 [00:54<10:11,  2.58s/it][A[A

Evaluating ...:   7% 19/255 [00:56<09:58,  2.54s/it][A[A

Evaluating ...:   8% 20/255 [00:59<09:45,  2.49s/it][A[A

Evaluating ...:   8% 21/255 [01:01<09:32,  2.45s/it][A[A

Evaluating ...:   9% 22/255 [01:03<09:15,  2.38s/it][A[A

Evaluating ...:   9% 23/255 [01:06<09:05,  2.35s/it][A[A

Evaluating ...:   9% 24/255 [01:08<08:52,  2.31s/it][A[A

Evaluating ...:  10% 25/255 [01:10<08:41,  2.27s/it][A[A

Evaluating ...:  10% 26/255 [01:12<08:26,  2.21s/it][A[A

Evaluating ...:  11% 27/255 [01:14<08:16,  2.18s/it][A[A

Evaluating ...:  11% 28/255 [01:16<08:03,  2.13s/it][A[A

Evaluating ...:  11% 29/255 [01:18<07:55,  2.10s/it][A[A

Evaluating ...:  12% 30/255 [01:20<07:42,  2.05s/it][A[A

Evaluating ...:  12% 31/255 [01:22<07:36,  2.04s/it][A[A

Evaluating ...:  13% 32/255 [01:24<07:24,  1.99s/it][A[A

Evaluating ...:  13% 33/255 [01:26<07:15,  1.96s/it][A[A

Evaluating ...:  13% 34/255 [01:28<07:03,  1.92s/it][A[A

Evaluating ...:  14% 35/255 [01:29<06:55,  1.89s/it][A[A

Evaluating ...:  14% 36/255 [01:31<06:43,  1.84s/it][A[A

Evaluating ...:  15% 37/255 [01:33<06:35,  1.81s/it][A[A

Evaluating ...:  15% 38/255 [01:35<06:23,  1.77s/it][A[A

Evaluating ...:  15% 39/255 [01:36<06:16,  1.74s/it][A[A

Evaluating ...:  16% 40/255 [01:38<06:03,  1.69s/it][A[A

Evaluating ...:  16% 41/255 [01:39<05:55,  1.66s/it][A[A

Evaluating ...:  16% 42/255 [01:41<05:42,  1.61s/it][A[A

Evaluating ...:  17% 43/255 [01:42<05:35,  1.58s/it][A[A

Evaluating ...:  17% 44/255 [01:44<05:23,  1.53s/it][A[A

Evaluating ...:  18% 45/255 [01:45<05:13,  1.49s/it][A[A

Evaluating ...:  18% 46/255 [01:47<04:58,  1.43s/it][A[A

Evaluating ...:  18% 47/255 [01:48<04:47,  1.38s/it][A[A

Evaluating ...:  19% 48/255 [01:49<04:31,  1.31s/it][A[A

Evaluating ...:  19% 49/255 [01:50<04:18,  1.26s/it][A[A

Evaluating ...:  20% 50/255 [01:51<03:56,  1.16s/it][A[A

Evaluating ...:  20% 51/255 [01:55<06:58,  2.05s/it][A[A

Evaluating ...:  20% 52/255 [01:59<08:41,  2.57s/it][A[A

Evaluating ...:  21% 53/255 [02:03<09:48,  2.91s/it][A[A

Evaluating ...:  21% 54/255 [02:06<10:23,  3.10s/it][A[A

Evaluating ...:  22% 55/255 [02:10<10:43,  3.22s/it][A[A

Evaluating ...:  22% 56/255 [02:13<10:47,  3.26s/it][A[A

Evaluating ...:  22% 57/255 [02:16<10:49,  3.28s/it][A[A

Evaluating ...:  23% 58/255 [02:20<10:42,  3.26s/it][A[A

Evaluating ...:  23% 59/255 [02:23<10:35,  3.24s/it][A[A

Evaluating ...:  24% 60/255 [02:26<10:24,  3.20s/it][A[A

Evaluating ...:  24% 61/255 [02:29<10:17,  3.18s/it][A[A

Evaluating ...:  24% 62/255 [02:32<10:01,  3.12s/it][A[A

Evaluating ...:  25% 63/255 [02:35<09:51,  3.08s/it][A[A

Evaluating ...:  25% 64/255 [02:38<09:36,  3.02s/it][A[A

Evaluating ...:  25% 65/255 [02:41<09:29,  3.00s/it][A[A

Evaluating ...:  26% 66/255 [02:44<09:15,  2.94s/it][A[A

Evaluating ...:  26% 67/255 [02:46<09:07,  2.91s/it][A[A

Evaluating ...:  27% 68/255 [02:49<08:57,  2.87s/it][A[A

Evaluating ...:  27% 69/255 [02:52<08:51,  2.86s/it][A[A

Evaluating ...:  27% 70/255 [02:55<08:37,  2.79s/it][A[A

Evaluating ...:  28% 71/255 [02:57<08:28,  2.76s/it][A[A

Evaluating ...:  28% 72/255 [03:00<08:14,  2.70s/it][A[A

Evaluating ...:  29% 73/255 [03:03<08:07,  2.68s/it][A[A

Evaluating ...:  29% 74/255 [03:05<07:56,  2.63s/it][A[A

Evaluating ...:  29% 75/255 [03:08<07:49,  2.61s/it][A[A

Evaluating ...:  30% 76/255 [03:10<07:38,  2.56s/it][A[A

Evaluating ...:  30% 77/255 [03:13<07:31,  2.54s/it][A[A

Evaluating ...:  31% 78/255 [03:15<07:21,  2.50s/it][A[A

Evaluating ...:  31% 79/255 [03:17<07:17,  2.49s/it][A[A

Evaluating ...:  31% 80/255 [03:20<07:09,  2.45s/it][A[A

Evaluating ...:  32% 81/255 [03:22<07:01,  2.42s/it][A[A

Evaluating ...:  32% 82/255 [03:24<06:49,  2.37s/it][A[A

Evaluating ...:  33% 83/255 [03:27<06:43,  2.34s/it][A[A

Evaluating ...:  33% 84/255 [03:29<06:32,  2.30s/it][A[A

Evaluating ...:  33% 85/255 [03:31<06:25,  2.27s/it][A[A

Evaluating ...:  34% 86/255 [03:33<06:16,  2.23s/it][A[A

Evaluating ...:  34% 87/255 [03:35<06:09,  2.20s/it][A[A

Evaluating ...:  35% 88/255 [03:37<05:58,  2.15s/it][A[A

Evaluating ...:  35% 89/255 [03:39<05:52,  2.13s/it][A[A

Evaluating ...:  35% 90/255 [03:41<05:42,  2.08s/it][A[A

Evaluating ...:  36% 91/255 [03:43<05:36,  2.05s/it][A[A

Evaluating ...:  36% 92/255 [03:45<05:27,  2.01s/it][A[A

Evaluating ...:  36% 93/255 [03:47<05:20,  1.98s/it][A[A

Evaluating ...:  37% 94/255 [03:49<05:10,  1.93s/it][A[A

Evaluating ...:  37% 95/255 [03:51<05:03,  1.90s/it][A[A

Evaluating ...:  38% 96/255 [03:53<04:52,  1.84s/it][A[A

Evaluating ...:  38% 97/255 [03:54<04:43,  1.79s/it][A[A

Evaluating ...:  38% 98/255 [03:56<04:28,  1.71s/it][A[A

Evaluating ...:  39% 99/255 [03:57<04:12,  1.62s/it][A[A

Evaluating ...:  39% 100/255 [03:58<03:50,  1.49s/it][A[A

Evaluating ...:  40% 101/255 [04:03<05:55,  2.31s/it][A[A

Evaluating ...:  40% 102/255 [04:06<06:58,  2.73s/it][A[A

Evaluating ...:  40% 103/255 [04:10<07:36,  3.00s/it][A[A

Evaluating ...:  41% 104/255 [04:13<07:57,  3.16s/it][A[A

Evaluating ...:  41% 105/255 [04:17<08:13,  3.29s/it][A[A

Evaluating ...:  42% 106/255 [04:20<08:12,  3.31s/it][A[A

Evaluating ...:  42% 107/255 [04:24<08:08,  3.30s/it][A[A

Evaluating ...:  42% 108/255 [04:27<07:59,  3.26s/it][A[A

Evaluating ...:  43% 109/255 [04:30<07:51,  3.23s/it][A[A

Evaluating ...:  43% 110/255 [04:33<07:38,  3.16s/it][A[A

Evaluating ...:  44% 111/255 [04:36<07:31,  3.14s/it][A[A

Evaluating ...:  44% 112/255 [04:39<07:19,  3.07s/it][A[A

Evaluating ...:  44% 113/255 [04:42<07:10,  3.03s/it][A[A

Evaluating ...:  45% 114/255 [04:45<06:59,  2.97s/it][A[A

Evaluating ...:  45% 115/255 [04:48<06:51,  2.94s/it][A[A

Evaluating ...:  45% 116/255 [04:50<06:41,  2.89s/it][A[A

Evaluating ...:  46% 117/255 [04:53<06:34,  2.86s/it][A[A

Evaluating ...:  46% 118/255 [04:56<06:25,  2.81s/it][A[A

Evaluating ...:  47% 119/255 [04:59<06:17,  2.78s/it][A[A

Evaluating ...:  47% 120/255 [05:01<06:08,  2.73s/it][A[A

Evaluating ...:  47% 121/255 [05:04<06:02,  2.71s/it][A[A

Evaluating ...:  48% 122/255 [05:06<05:54,  2.66s/it][A[A

Evaluating ...:  48% 123/255 [05:09<05:48,  2.64s/it][A[A

Evaluating ...:  49% 124/255 [05:12<05:39,  2.59s/it][A[A

Evaluating ...:  49% 125/255 [05:14<05:34,  2.57s/it][A[A

Evaluating ...:  49% 126/255 [05:16<05:24,  2.51s/it][A[A

Evaluating ...:  50% 127/255 [05:19<05:18,  2.49s/it][A[A

Evaluating ...:  50% 128/255 [05:21<05:08,  2.43s/it][A[A

Evaluating ...:  51% 129/255 [05:23<05:02,  2.40s/it][A[A

Evaluating ...:  51% 130/255 [05:26<04:53,  2.35s/it][A[A

Evaluating ...:  51% 131/255 [05:28<04:47,  2.32s/it][A[A

Evaluating ...:  52% 132/255 [05:30<04:39,  2.27s/it][A[A

Evaluating ...:  52% 133/255 [05:32<04:34,  2.25s/it][A[A

Evaluating ...:  53% 134/255 [05:34<04:27,  2.21s/it][A[A

Evaluating ...:  53% 135/255 [05:37<04:22,  2.19s/it][A[A

Evaluating ...:  53% 136/255 [05:39<04:16,  2.15s/it][A[A

Evaluating ...:  54% 137/255 [05:41<04:12,  2.14s/it][A[A

Evaluating ...:  54% 138/255 [05:43<04:05,  2.10s/it][A[A

Evaluating ...:  55% 139/255 [05:45<03:59,  2.06s/it][A[A

Evaluating ...:  55% 140/255 [05:47<03:51,  2.01s/it][A[A

Evaluating ...:  55% 141/255 [05:49<03:44,  1.97s/it][A[A

Evaluating ...:  56% 142/255 [05:50<03:36,  1.91s/it][A[A

Evaluating ...:  56% 143/255 [05:52<03:30,  1.88s/it][A[A

Evaluating ...:  56% 144/255 [05:54<03:22,  1.82s/it][A[A

Evaluating ...:  57% 145/255 [05:55<03:15,  1.78s/it][A[A

Evaluating ...:  57% 146/255 [05:57<03:07,  1.72s/it][A[A

Evaluating ...:  58% 147/255 [05:59<02:59,  1.66s/it][A[A

Evaluating ...:  58% 148/255 [06:00<02:49,  1.59s/it][A[A

Evaluating ...:  58% 149/255 [06:01<02:39,  1.51s/it][A[A

Evaluating ...:  59% 150/255 [06:02<02:24,  1.38s/it][A[A

Evaluating ...:  59% 151/255 [06:06<03:47,  2.19s/it][A[A

Evaluating ...:  60% 152/255 [06:10<04:42,  2.74s/it][A[A

Evaluating ...:  60% 153/255 [06:14<05:15,  3.10s/it][A[A

Evaluating ...:  60% 154/255 [06:18<05:30,  3.27s/it][A[A

Evaluating ...:  61% 155/255 [06:22<05:39,  3.40s/it][A[A

Evaluating ...:  61% 156/255 [06:25<05:38,  3.42s/it][A[A

Evaluating ...:  62% 157/255 [06:29<05:38,  3.46s/it][A[A

Evaluating ...:  62% 158/255 [06:32<05:30,  3.41s/it][A[A

Evaluating ...:  62% 159/255 [06:36<05:27,  3.41s/it][A[A

Evaluating ...:  63% 160/255 [06:39<05:17,  3.35s/it][A[A

Evaluating ...:  63% 161/255 [06:42<05:12,  3.32s/it][A[A

Evaluating ...:  64% 162/255 [06:45<05:02,  3.25s/it][A[A

Evaluating ...:  64% 163/255 [06:48<04:56,  3.22s/it][A[A

Evaluating ...:  64% 164/255 [06:51<04:46,  3.15s/it][A[A

Evaluating ...:  65% 165/255 [06:54<04:40,  3.12s/it][A[A

Evaluating ...:  65% 166/255 [06:57<04:31,  3.05s/it][A[A

Evaluating ...:  65% 167/255 [07:00<04:26,  3.03s/it][A[A

Evaluating ...:  66% 168/255 [07:03<04:17,  2.96s/it][A[A

Evaluating ...:  66% 169/255 [07:06<04:14,  2.95s/it][A[A

Evaluating ...:  67% 170/255 [07:09<04:05,  2.89s/it][A[A

Evaluating ...:  67% 171/255 [07:11<04:00,  2.86s/it][A[A

Evaluating ...:  67% 172/255 [07:14<03:52,  2.81s/it][A[A

Evaluating ...:  68% 173/255 [07:17<03:50,  2.81s/it][A[A

Evaluating ...:  68% 174/255 [07:20<03:45,  2.78s/it][A[A

Evaluating ...:  69% 175/255 [07:22<03:41,  2.77s/it][A[A

Evaluating ...:  69% 176/255 [07:25<03:34,  2.72s/it][A[A

Evaluating ...:  69% 177/255 [07:28<03:30,  2.69s/it][A[A

Evaluating ...:  70% 178/255 [07:30<03:22,  2.63s/it][A[A

Evaluating ...:  70% 179/255 [07:33<03:17,  2.60s/it][A[A

Evaluating ...:  71% 180/255 [07:35<03:08,  2.51s/it][A[A

Evaluating ...:  71% 181/255 [07:37<03:01,  2.45s/it][A[A

Evaluating ...:  71% 182/255 [07:39<02:53,  2.37s/it][A[A

Evaluating ...:  72% 183/255 [07:42<02:47,  2.32s/it][A[A

Evaluating ...:  72% 184/255 [07:44<02:40,  2.26s/it][A[A

Evaluating ...:  73% 185/255 [07:46<02:36,  2.24s/it][A[A

Evaluating ...:  73% 186/255 [07:48<02:31,  2.19s/it][A[A

Evaluating ...:  73% 187/255 [07:50<02:28,  2.19s/it][A[A

Evaluating ...:  74% 188/255 [07:52<02:22,  2.13s/it][A[A

Evaluating ...:  74% 189/255 [07:54<02:18,  2.10s/it][A[A

Evaluating ...:  75% 190/255 [07:56<02:13,  2.06s/it][A[A

Evaluating ...:  75% 191/255 [07:58<02:10,  2.03s/it][A[A

Evaluating ...:  75% 192/255 [08:00<02:04,  1.98s/it][A[A

Evaluating ...:  76% 193/255 [08:02<02:01,  1.96s/it][A[A

Evaluating ...:  76% 194/255 [08:04<01:55,  1.90s/it][A[A

Evaluating ...:  76% 195/255 [08:05<01:51,  1.86s/it][A[A

Evaluating ...:  77% 196/255 [08:07<01:45,  1.80s/it][A[A

Evaluating ...:  77% 197/255 [08:09<01:40,  1.74s/it][A[A

Evaluating ...:  78% 198/255 [08:10<01:34,  1.66s/it][A[A

Evaluating ...:  78% 199/255 [08:12<01:29,  1.59s/it][A[A

Evaluating ...:  78% 200/255 [08:13<01:20,  1.46s/it][A[A

Evaluating ...:  79% 201/255 [08:17<02:06,  2.34s/it][A[A

Evaluating ...:  79% 202/255 [08:21<02:27,  2.79s/it][A[A

Evaluating ...:  80% 203/255 [08:25<02:38,  3.04s/it][A[A

Evaluating ...:  80% 204/255 [08:28<02:40,  3.14s/it][A[A

Evaluating ...:  80% 205/255 [08:31<02:39,  3.19s/it][A[A

Evaluating ...:  81% 206/255 [08:34<02:35,  3.18s/it][A[A

Evaluating ...:  81% 207/255 [08:38<02:31,  3.15s/it][A[A

Evaluating ...:  82% 208/255 [08:40<02:24,  3.08s/it][A[A

Evaluating ...:  82% 209/255 [08:43<02:20,  3.04s/it][A[A

Evaluating ...:  82% 210/255 [08:46<02:14,  2.99s/it][A[A

Evaluating ...:  83% 211/255 [08:49<02:10,  2.95s/it][A[A

Evaluating ...:  83% 212/255 [08:52<02:04,  2.91s/it][A[A

Evaluating ...:  84% 213/255 [08:55<02:00,  2.86s/it][A[A

Evaluating ...:  84% 214/255 [08:57<01:54,  2.80s/it][A[A

Evaluating ...:  84% 215/255 [09:00<01:50,  2.76s/it][A[A

Evaluating ...:  85% 216/255 [09:03<01:44,  2.69s/it][A[A

Evaluating ...:  85% 217/255 [09:05<01:41,  2.66s/it][A[A

Evaluating ...:  85% 218/255 [09:08<01:36,  2.61s/it][A[A

Evaluating ...:  86% 219/255 [09:10<01:33,  2.59s/it][A[A

Evaluating ...:  86% 220/255 [09:13<01:29,  2.56s/it][A[A

Evaluating ...:  87% 221/255 [09:15<01:25,  2.52s/it][A[A

Evaluating ...:  87% 222/255 [09:17<01:21,  2.46s/it][A[A

Evaluating ...:  87% 223/255 [09:20<01:17,  2.41s/it][A[A

Evaluating ...:  88% 224/255 [09:22<01:12,  2.35s/it][A[A

Evaluating ...:  88% 225/255 [09:24<01:09,  2.31s/it][A[A

Evaluating ...:  89% 226/255 [09:26<01:05,  2.25s/it][A[A

Evaluating ...:  89% 227/255 [09:28<01:02,  2.22s/it][A[A

Evaluating ...:  89% 228/255 [09:30<00:58,  2.16s/it][A[A

Evaluating ...:  90% 229/255 [09:32<00:55,  2.13s/it][A[A

Evaluating ...:  90% 230/255 [09:34<00:52,  2.08s/it][A[A

Evaluating ...:  91% 231/255 [09:36<00:49,  2.05s/it][A[A

Evaluating ...:  91% 232/255 [09:38<00:46,  2.01s/it][A[A

Evaluating ...:  91% 233/255 [09:40<00:43,  1.98s/it][A[A

Evaluating ...:  92% 234/255 [09:42<00:40,  1.93s/it][A[A

Evaluating ...:  92% 235/255 [09:44<00:38,  1.90s/it][A[A

Evaluating ...:  93% 236/255 [09:46<00:35,  1.86s/it][A[A

Evaluating ...:  93% 237/255 [09:47<00:33,  1.83s/it][A[A

Evaluating ...:  93% 238/255 [09:49<00:30,  1.79s/it][A[A

Evaluating ...:  94% 239/255 [09:51<00:28,  1.76s/it][A[A

Evaluating ...:  94% 240/255 [09:52<00:25,  1.71s/it][A[A

Evaluating ...:  95% 241/255 [09:54<00:23,  1.67s/it][A[A

Evaluating ...:  95% 242/255 [09:55<00:20,  1.61s/it][A[A

Evaluating ...:  95% 243/255 [09:57<00:18,  1.57s/it][A[A

Evaluating ...:  96% 244/255 [09:58<00:16,  1.51s/it][A[A

Evaluating ...:  96% 245/255 [10:00<00:14,  1.47s/it][A[A

Evaluating ...:  96% 246/255 [10:01<00:12,  1.41s/it][A[A

Evaluating ...:  97% 247/255 [10:02<00:10,  1.36s/it][A[A

Evaluating ...:  97% 248/255 [10:03<00:09,  1.30s/it][A[A

Evaluating ...:  98% 249/255 [10:04<00:07,  1.24s/it][A[A

Evaluating ...:  98% 250/255 [10:05<00:05,  1.14s/it][A[A

Evaluating ...:  98% 251/255 [10:09<00:07,  1.93s/it][A[A

Evaluating ...:  99% 252/255 [10:12<00:06,  2.09s/it][A[A

Evaluating ...:  99% 253/255 [10:14<00:04,  2.11s/it][A[A

Evaluating ...: 100% 254/255 [10:15<00:01,  1.98s/it][A[A

Evaluating ...: 100% 255/255 [10:17<00:00,  1.78s/it][A[AEvaluating ...: 100% 255/255 [10:17<00:00,  2.42s/it]
/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/tree_util.py:188: FutureWarning: jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() instead as a drop-in replacement.
  warnings.warn('jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() '
                                                                                                                            
                                                         [AEpoch... (2/4 | Eval Loss: 0.3859829604625702 | Eval wer: 0.33858860743604546 |):  50% 2/4 [19:01:47<17:31:07, 31533.87s/it]
Training...:  16% 2185/13907 [1:31:36<6:16:19,  1.93s/it][AConfiguration saved in /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/flax-wav2vec2-ctc-cv9-baseline/config.json
tcmalloc: large alloc 1612521472 bytes == 0x246278000 @  0x7f6b45402680 0x7f6b45422bdd 0x7f69ddd191ff 0x7f69ddd2842c 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd2941d 0x7f69ddd23164 0x7f69ddd2391e 0x503fb6 0x56b1da 0x56939a 0x5f6a13 0x56c28c 0x56939a 0x5f6a13 0x56c28c 0x5f6836 0x56b0ae 0x56939a 0x50aaa0 0x56c28c 0x56939a 0x5f6a13 0x56b0ae 0x56939a 0x5f6a13
Model weights saved in /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/flax-wav2vec2-ctc-cv9-baseline/flax_model.msgpack
tokenizer config file saved in ./flax-wav2vec2-ctc-cv9-baseline/tokenizer_config.json
Special tokens file saved in ./flax-wav2vec2-ctc-cv9-baseline/special_tokens_map.json

Training...:  16% 2186/13907 [1:32:27<671:05:39, 206.12s/it][A
Training...:  16% 2187/13907 [1:32:30<471:49:25, 144.93s/it][A
Training...:  16% 2188/13907 [1:32:31<332:03:11, 102.00s/it][A
Training...:  16% 2189/13907 [1:32:33<234:10:19, 71.94s/it] [A
Training...:  16% 2190/13907 [1:32:35<165:39:35, 50.90s/it][A
Training...:  16% 2191/13907 [1:32:37<117:41:45, 36.16s/it][A
Training...:  16% 2192/13907 [1:32:39<84:31:33, 25.97s/it] [A
Training...:  16% 2193/13907 [1:32:41<60:50:09, 18.70s/it][A
Training...:  16% 2194/13907 [1:32:42<44:12:24, 13.59s/it][A
Training...:  16% 2195/13907 [1:32:44<32:27:17,  9.98s/it][A
Training...:  16% 2196/13907 [1:32:45<24:11:53,  7.44s/it][A
Training...:  16% 2197/13907 [1:32:47<18:22:31,  5.65s/it][A
Training...:  16% 2198/13907 [1:32:48<14:12:02,  4.37s/it][A
Training...:  16% 2199/13907 [1:32:50<11:12:42,  3.45s/it][A
Training...:  16% 2200/13907 [1:32:51<8:56:55,  2.75s/it] [A
Training...:  16% 2201/13907 [1:32:55<10:05:27,  3.10s/it][A
Training...:  16% 2202/13907 [1:32:58<10:37:48,  3.27s/it][A
Training...:  16% 2203/13907 [1:33:02<10:46:09,  3.31s/it][A
Training...:  16% 2204/13907 [1:33:05<10:38:27,  3.27s/it][A
Training...:  16% 2205/13907 [1:33:08<10:28:53,  3.22s/it][A
Training...:  16% 2206/13907 [1:33:11<10:19:32,  3.18s/it][A
Training...:  16% 2207/13907 [1:33:14<10:04:59,  3.10s/it][A
Training...:  16% 2208/13907 [1:33:17<9:53:19,  3.04s/it] [A
Training...:  16% 2209/13907 [1:33:20<9:40:58,  2.98s/it][A
Training...:  16% 2210/13907 [1:33:22<9:26:15,  2.90s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:03:37<17:31:07, 31533.87s/it]
Training...:  16% 2210/13907 [1:33:26<9:26:15,  2.90s/it][A
Training...:  16% 2211/13907 [1:33:26<9:38:40,  2.97s/it][A
Training...:  16% 2212/13907 [1:33:28<9:27:37,  2.91s/it][A
Training...:  16% 2213/13907 [1:33:31<9:17:15,  2.86s/it][A
Training...:  16% 2214/13907 [1:33:34<9:03:49,  2.79s/it][A
Training...:  16% 2215/13907 [1:33:36<8:48:33,  2.71s/it][A
Training...:  16% 2216/13907 [1:33:39<8:36:31,  2.65s/it][A
Training...:  16% 2217/13907 [1:33:41<8:26:20,  2.60s/it][A
Training...:  16% 2218/13907 [1:33:44<8:16:12,  2.55s/it][A
Training...:  16% 2219/13907 [1:33:46<8:05:52,  2.49s/it][A
Training...:  16% 2220/13907 [1:33:48<7:56:26,  2.45s/it][A
Training...:  16% 2221/13907 [1:33:51<7:49:14,  2.41s/it][A
Training...:  16% 2222/13907 [1:33:53<7:40:46,  2.37s/it][A
Training...:  16% 2223/13907 [1:33:55<7:34:42,  2.34s/it][A
Training...:  16% 2224/13907 [1:33:57<7:31:50,  2.32s/it][A
Training...:  16% 2225/13907 [1:34:00<7:26:42,  2.29s/it][A
Training...:  16% 2226/13907 [1:34:02<7:18:10,  2.25s/it][A
Training...:  16% 2227/13907 [1:34:04<7:12:13,  2.22s/it][A
Training...:  16% 2228/13907 [1:34:06<7:03:42,  2.18s/it][A
Training...:  16% 2229/13907 [1:34:08<6:56:00,  2.14s/it][A
Training...:  16% 2230/13907 [1:34:10<6:48:56,  2.10s/it][A
Training...:  16% 2231/13907 [1:34:12<6:42:28,  2.07s/it][A
Training...:  16% 2232/13907 [1:34:14<6:36:17,  2.04s/it][A
Training...:  16% 2233/13907 [1:34:16<6:30:36,  2.01s/it][A
Training...:  16% 2234/13907 [1:34:18<6:23:56,  1.97s/it][A
Training...:  16% 2235/13907 [1:34:20<6:17:16,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:04:33<17:31:07, 31533.87s/it]
Training...:  16% 2235/13907 [1:34:22<6:17:16,  1.94s/it][A
Training...:  16% 2236/13907 [1:34:22<6:30:46,  2.01s/it][A
Training...:  16% 2237/13907 [1:34:24<6:23:50,  1.97s/it][A
Training...:  16% 2238/13907 [1:34:26<6:11:32,  1.91s/it][A
Training...:  16% 2239/13907 [1:34:27<6:01:58,  1.86s/it][A
Training...:  16% 2240/13907 [1:34:29<5:53:28,  1.82s/it][A
Training...:  16% 2241/13907 [1:34:31<5:45:01,  1.77s/it][A
Training...:  16% 2242/13907 [1:34:32<5:39:02,  1.74s/it][A
Training...:  16% 2243/13907 [1:34:34<5:30:51,  1.70s/it][A
Training...:  16% 2244/13907 [1:34:36<5:22:32,  1.66s/it][A
Training...:  16% 2245/13907 [1:34:37<5:12:02,  1.61s/it][A
Training...:  16% 2246/13907 [1:34:39<5:02:59,  1.56s/it][A
Training...:  16% 2247/13907 [1:34:40<4:52:26,  1.50s/it][A
Training...:  16% 2248/13907 [1:34:41<4:40:52,  1.45s/it][A
Training...:  16% 2249/13907 [1:34:42<4:29:06,  1.39s/it][A
Training...:  16% 2250/13907 [1:34:44<4:10:56,  1.29s/it][A
Training...:  16% 2251/13907 [1:34:47<6:33:06,  2.02s/it][A
Training...:  16% 2252/13907 [1:34:51<7:58:45,  2.46s/it][A
Training...:  16% 2253/13907 [1:34:54<8:44:27,  2.70s/it][A
Training...:  16% 2254/13907 [1:34:57<9:08:31,  2.82s/it][A
Training...:  16% 2255/13907 [1:35:00<9:18:08,  2.87s/it][A
Training...:  16% 2256/13907 [1:35:03<9:22:13,  2.90s/it][A
Training...:  16% 2257/13907 [1:35:06<9:19:59,  2.88s/it][A
Training...:  16% 2258/13907 [1:35:09<9:17:31,  2.87s/it][A
Training...:  16% 2259/13907 [1:35:12<9:14:44,  2.86s/it][A
Training...:  16% 2260/13907 [1:35:14<9:10:29,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:05:28<17:31:07, 31533.87s/it]
Training...:  16% 2260/13907 [1:35:17<9:10:29,  2.84s/it][A
Training...:  16% 2261/13907 [1:35:17<9:24:02,  2.91s/it][A
Training...:  16% 2262/13907 [1:35:20<9:11:39,  2.84s/it][A
Training...:  16% 2263/13907 [1:35:23<8:56:40,  2.77s/it][A
Training...:  16% 2264/13907 [1:35:25<8:46:12,  2.71s/it][A
Training...:  16% 2265/13907 [1:35:28<8:34:23,  2.65s/it][A
Training...:  16% 2266/13907 [1:35:30<8:22:50,  2.59s/it][A
Training...:  16% 2267/13907 [1:35:33<8:13:35,  2.54s/it][A
Training...:  16% 2268/13907 [1:35:35<8:04:43,  2.50s/it][A
Training...:  16% 2269/13907 [1:35:37<7:56:20,  2.46s/it][A
Training...:  16% 2270/13907 [1:35:40<7:49:55,  2.42s/it][A
Training...:  16% 2271/13907 [1:35:42<7:42:29,  2.38s/it][A
Training...:  16% 2272/13907 [1:35:44<7:36:21,  2.35s/it][A
Training...:  16% 2273/13907 [1:35:47<7:31:04,  2.33s/it][A
Training...:  16% 2274/13907 [1:35:49<7:24:08,  2.29s/it][A
Training...:  16% 2275/13907 [1:35:51<7:18:59,  2.26s/it][A
Training...:  16% 2276/13907 [1:35:53<7:14:46,  2.24s/it][A
Training...:  16% 2277/13907 [1:35:55<7:07:30,  2.21s/it][A
Training...:  16% 2278/13907 [1:35:57<7:01:04,  2.17s/it][A
Training...:  16% 2279/13907 [1:36:00<6:54:40,  2.14s/it][A
Training...:  16% 2280/13907 [1:36:02<6:47:42,  2.10s/it][A
Training...:  16% 2281/13907 [1:36:04<6:42:56,  2.08s/it][A
Training...:  16% 2282/13907 [1:36:05<6:35:35,  2.04s/it][A
Training...:  16% 2283/13907 [1:36:07<6:31:23,  2.02s/it][A
Training...:  16% 2284/13907 [1:36:09<6:25:20,  1.99s/it][A
Training...:  16% 2285/13907 [1:36:11<6:18:11,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:06:24<17:31:07, 31533.87s/it]
Training...:  16% 2285/13907 [1:36:13<6:18:11,  1.95s/it][A
Training...:  16% 2286/13907 [1:36:13<6:29:46,  2.01s/it][A
Training...:  16% 2287/13907 [1:36:15<6:21:39,  1.97s/it][A
Training...:  16% 2288/13907 [1:36:17<6:10:15,  1.91s/it][A
Training...:  16% 2289/13907 [1:36:19<5:59:54,  1.86s/it][A
Training...:  16% 2290/13907 [1:36:21<5:52:30,  1.82s/it][A
Training...:  16% 2291/13907 [1:36:22<5:46:35,  1.79s/it][A
Training...:  16% 2292/13907 [1:36:24<5:39:24,  1.75s/it][A
Training...:  16% 2293/13907 [1:36:26<5:31:02,  1.71s/it][A
Training...:  16% 2294/13907 [1:36:27<5:24:31,  1.68s/it][A
Training...:  17% 2295/13907 [1:36:29<5:14:30,  1.63s/it][A
Training...:  17% 2296/13907 [1:36:30<5:03:50,  1.57s/it][A
Training...:  17% 2297/13907 [1:36:31<4:51:36,  1.51s/it][A
Training...:  17% 2298/13907 [1:36:33<4:39:51,  1.45s/it][A
Training...:  17% 2299/13907 [1:36:34<4:26:33,  1.38s/it][A
Training...:  17% 2300/13907 [1:36:35<4:08:15,  1.28s/it][A
Training...:  17% 2301/13907 [1:36:39<6:35:49,  2.05s/it][A
Training...:  17% 2302/13907 [1:36:42<8:00:44,  2.49s/it][A
Training...:  17% 2303/13907 [1:36:46<8:43:19,  2.71s/it][A
Training...:  17% 2304/13907 [1:36:49<9:07:21,  2.83s/it][A
Training...:  17% 2305/13907 [1:36:52<9:20:02,  2.90s/it][A
Training...:  17% 2306/13907 [1:36:55<9:24:16,  2.92s/it][A
Training...:  17% 2307/13907 [1:36:58<9:22:35,  2.91s/it][A
Training...:  17% 2308/13907 [1:37:00<9:19:08,  2.89s/it][A
Training...:  17% 2309/13907 [1:37:03<9:13:14,  2.86s/it][A
Training...:  17% 2310/13907 [1:37:06<9:08:26,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:07:20<17:31:07, 31533.87s/it]
Training...:  17% 2310/13907 [1:37:09<9:08:26,  2.84s/it][A
Training...:  17% 2311/13907 [1:37:09<9:25:11,  2.92s/it][A
Training...:  17% 2312/13907 [1:37:12<9:14:46,  2.87s/it][A
Training...:  17% 2313/13907 [1:37:14<8:57:46,  2.78s/it][A
Training...:  17% 2314/13907 [1:37:17<8:48:55,  2.74s/it][A
Training...:  17% 2315/13907 [1:37:20<8:37:21,  2.68s/it][A
Training...:  17% 2316/13907 [1:37:22<8:31:24,  2.65s/it][A
Training...:  17% 2317/13907 [1:37:25<8:20:57,  2.59s/it][A
Training...:  17% 2318/13907 [1:37:27<8:11:19,  2.54s/it][A
Training...:  17% 2319/13907 [1:37:29<8:00:12,  2.49s/it][A
Training...:  17% 2320/13907 [1:37:32<7:50:26,  2.44s/it][A
Training...:  17% 2321/13907 [1:37:34<7:42:15,  2.39s/it][A
Training...:  17% 2322/13907 [1:37:36<7:33:37,  2.35s/it][A
Training...:  17% 2323/13907 [1:37:39<7:26:17,  2.31s/it][A
Training...:  17% 2324/13907 [1:37:41<7:19:34,  2.28s/it][A
Training...:  17% 2325/13907 [1:37:43<7:12:00,  2.24s/it][A
Training...:  17% 2326/13907 [1:37:45<7:06:15,  2.21s/it][A
Training...:  17% 2327/13907 [1:37:47<7:00:04,  2.18s/it][A
Training...:  17% 2328/13907 [1:37:49<6:53:33,  2.14s/it][A
Training...:  17% 2329/13907 [1:37:51<6:47:12,  2.11s/it][A
Training...:  17% 2330/13907 [1:37:53<6:42:12,  2.08s/it][A
Training...:  17% 2331/13907 [1:37:55<6:37:56,  2.06s/it][A
Training...:  17% 2332/13907 [1:37:57<6:33:17,  2.04s/it][A
Training...:  17% 2333/13907 [1:37:59<6:28:08,  2.01s/it][A
Training...:  17% 2334/13907 [1:38:01<6:21:52,  1.98s/it][A
Training...:  17% 2335/13907 [1:38:03<6:15:59,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:08:16<17:31:07, 31533.87s/it]
Training...:  17% 2335/13907 [1:38:05<6:15:59,  1.95s/it][A
Training...:  17% 2336/13907 [1:38:05<6:27:49,  2.01s/it][A
Training...:  17% 2337/13907 [1:38:07<6:20:32,  1.97s/it][A
Training...:  17% 2338/13907 [1:38:09<6:08:27,  1.91s/it][A
Training...:  17% 2339/13907 [1:38:11<5:58:46,  1.86s/it][A
Training...:  17% 2340/13907 [1:38:12<5:49:45,  1.81s/it][A
Training...:  17% 2341/13907 [1:38:14<5:41:51,  1.77s/it][A
Training...:  17% 2342/13907 [1:38:16<5:32:43,  1.73s/it][A
Training...:  17% 2343/13907 [1:38:17<5:25:15,  1.69s/it][A
Training...:  17% 2344/13907 [1:38:19<5:18:08,  1.65s/it][A
Training...:  17% 2345/13907 [1:38:20<5:10:16,  1.61s/it][A
Training...:  17% 2346/13907 [1:38:22<5:01:30,  1.56s/it][A
Training...:  17% 2347/13907 [1:38:23<4:50:47,  1.51s/it][A
Training...:  17% 2348/13907 [1:38:24<4:39:59,  1.45s/it][A
Training...:  17% 2349/13907 [1:38:26<4:26:41,  1.38s/it][A
Training...:  17% 2350/13907 [1:38:27<4:07:13,  1.28s/it][A
Training...:  17% 2351/13907 [1:38:30<6:30:44,  2.03s/it][A
Training...:  17% 2352/13907 [1:38:34<7:53:54,  2.46s/it][A
Training...:  17% 2353/13907 [1:38:37<8:38:30,  2.69s/it][A
Training...:  17% 2354/13907 [1:38:40<9:02:37,  2.82s/it][A
Training...:  17% 2355/13907 [1:38:43<9:13:52,  2.88s/it][A
Training...:  17% 2356/13907 [1:38:46<9:17:44,  2.90s/it][A
Training...:  17% 2357/13907 [1:38:49<9:14:57,  2.88s/it][A
Training...:  17% 2358/13907 [1:38:52<9:09:00,  2.85s/it][A
Training...:  17% 2359/13907 [1:38:55<9:03:56,  2.83s/it][A
Training...:  17% 2360/13907 [1:38:57<8:56:38,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:09:11<17:31:07, 31533.87s/it]
Training...:  17% 2360/13907 [1:39:00<8:56:38,  2.79s/it][A
Training...:  17% 2361/13907 [1:39:00<9:15:02,  2.88s/it][A
Training...:  17% 2362/13907 [1:39:03<9:07:01,  2.84s/it][A
Training...:  17% 2363/13907 [1:39:06<8:53:11,  2.77s/it][A
Training...:  17% 2364/13907 [1:39:08<8:40:19,  2.70s/it][A
Training...:  17% 2365/13907 [1:39:11<8:32:13,  2.66s/it][A
Training...:  17% 2366/13907 [1:39:13<8:18:53,  2.59s/it][A
Training...:  17% 2367/13907 [1:39:16<8:07:26,  2.53s/it][A
Training...:  17% 2368/13907 [1:39:18<7:59:40,  2.49s/it][A
Training...:  17% 2369/13907 [1:39:20<7:52:19,  2.46s/it][A
Training...:  17% 2370/13907 [1:39:23<7:45:41,  2.42s/it][A
Training...:  17% 2371/13907 [1:39:25<7:39:55,  2.39s/it][A
Training...:  17% 2372/13907 [1:39:27<7:33:58,  2.36s/it][A
Training...:  17% 2373/13907 [1:39:30<7:25:36,  2.32s/it][A
Training...:  17% 2374/13907 [1:39:32<7:18:02,  2.28s/it][A
Training...:  17% 2375/13907 [1:39:34<7:10:30,  2.24s/it][A
Training...:  17% 2376/13907 [1:39:36<7:03:24,  2.20s/it][A
Training...:  17% 2377/13907 [1:39:38<6:57:35,  2.17s/it][A
Training...:  17% 2378/13907 [1:39:40<6:51:28,  2.14s/it][A
Training...:  17% 2379/13907 [1:39:42<6:45:49,  2.11s/it][A
Training...:  17% 2380/13907 [1:39:44<6:40:53,  2.09s/it][A
Training...:  17% 2381/13907 [1:39:46<6:34:09,  2.05s/it][A
Training...:  17% 2382/13907 [1:39:48<6:29:38,  2.03s/it][A
Training...:  17% 2383/13907 [1:39:50<6:25:21,  2.01s/it][A
Training...:  17% 2384/13907 [1:39:52<6:18:43,  1.97s/it][A
Training...:  17% 2385/13907 [1:39:54<6:13:41,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:10:07<17:31:07, 31533.87s/it]
Training...:  17% 2385/13907 [1:39:56<6:13:41,  1.95s/it][A
Training...:  17% 2386/13907 [1:39:56<6:26:05,  2.01s/it][A
Training...:  17% 2387/13907 [1:39:58<6:17:59,  1.97s/it][A
Training...:  17% 2388/13907 [1:40:00<6:07:46,  1.92s/it][A
Training...:  17% 2389/13907 [1:40:02<5:57:19,  1.86s/it][A
Training...:  17% 2390/13907 [1:40:03<5:48:33,  1.82s/it][A
Training...:  17% 2391/13907 [1:40:05<5:40:24,  1.77s/it][A
Training...:  17% 2392/13907 [1:40:07<5:32:17,  1.73s/it][A
Training...:  17% 2393/13907 [1:40:08<5:24:52,  1.69s/it][A
Training...:  17% 2394/13907 [1:40:10<5:17:32,  1.65s/it][A
Training...:  17% 2395/13907 [1:40:11<5:08:04,  1.61s/it][A
Training...:  17% 2396/13907 [1:40:13<4:59:39,  1.56s/it][A
Training...:  17% 2397/13907 [1:40:14<4:48:54,  1.51s/it][A
Training...:  17% 2398/13907 [1:40:15<4:38:57,  1.45s/it][A
Training...:  17% 2399/13907 [1:40:17<4:25:48,  1.39s/it][A
Training...:  17% 2400/13907 [1:40:18<4:09:17,  1.30s/it][A
Training...:  17% 2401/13907 [1:40:22<6:36:56,  2.07s/it][A
Training...:  17% 2402/13907 [1:40:25<7:58:51,  2.50s/it][A
Training...:  17% 2403/13907 [1:40:28<8:43:50,  2.73s/it][A
Training...:  17% 2404/13907 [1:40:31<9:06:25,  2.85s/it][A
Training...:  17% 2405/13907 [1:40:35<9:16:48,  2.90s/it][A
Training...:  17% 2406/13907 [1:40:37<9:20:39,  2.92s/it][A
Training...:  17% 2407/13907 [1:40:40<9:18:27,  2.91s/it][A
Training...:  17% 2408/13907 [1:40:43<9:13:33,  2.89s/it][A
Training...:  17% 2409/13907 [1:40:46<9:07:31,  2.86s/it][A
Training...:  17% 2410/13907 [1:40:49<9:01:07,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:11:03<17:31:07, 31533.87s/it]
Training...:  17% 2410/13907 [1:40:52<9:01:07,  2.82s/it][A
Training...:  17% 2411/13907 [1:40:52<9:15:12,  2.90s/it][A
Training...:  17% 2412/13907 [1:40:54<9:02:25,  2.83s/it][A
Training...:  17% 2413/13907 [1:40:57<8:48:08,  2.76s/it][A
Training...:  17% 2414/13907 [1:41:00<8:37:06,  2.70s/it][A
Training...:  17% 2415/13907 [1:41:02<8:25:28,  2.64s/it][A
Training...:  17% 2416/13907 [1:41:05<8:17:00,  2.60s/it][A
Training...:  17% 2417/13907 [1:41:07<8:06:30,  2.54s/it][A
Training...:  17% 2418/13907 [1:41:09<8:00:39,  2.51s/it][A
Training...:  17% 2419/13907 [1:41:12<7:55:08,  2.48s/it][A
Training...:  17% 2420/13907 [1:41:14<7:51:41,  2.46s/it][A
Training...:  17% 2421/13907 [1:41:17<7:50:47,  2.46s/it][A
Training...:  17% 2422/13907 [1:41:19<7:43:07,  2.42s/it][A
Training...:  17% 2423/13907 [1:41:21<7:33:42,  2.37s/it][A
Training...:  17% 2424/13907 [1:41:24<7:26:00,  2.33s/it][A
Training...:  17% 2425/13907 [1:41:26<7:17:57,  2.29s/it][A
Training...:  17% 2426/13907 [1:41:28<7:11:35,  2.26s/it][A
Training...:  17% 2427/13907 [1:41:30<7:05:34,  2.22s/it][A
Training...:  17% 2428/13907 [1:41:32<6:57:17,  2.18s/it][A
Training...:  17% 2429/13907 [1:41:34<6:49:45,  2.14s/it][A
Training...:  17% 2430/13907 [1:41:36<6:43:56,  2.11s/it][A
Training...:  17% 2431/13907 [1:41:38<6:38:10,  2.08s/it][A
Training...:  17% 2432/13907 [1:41:40<6:31:59,  2.05s/it][A
Training...:  17% 2433/13907 [1:41:42<6:26:55,  2.02s/it][A
Training...:  18% 2434/13907 [1:41:44<6:21:07,  1.99s/it][A
Training...:  18% 2435/13907 [1:41:46<6:15:12,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:11:59<17:31:07, 31533.87s/it]
Training...:  18% 2435/13907 [1:41:48<6:15:12,  1.96s/it][A
Training...:  18% 2436/13907 [1:41:48<6:27:13,  2.03s/it][A
Training...:  18% 2437/13907 [1:41:50<6:17:58,  1.98s/it][A
Training...:  18% 2438/13907 [1:41:52<6:04:41,  1.91s/it][A
Training...:  18% 2439/13907 [1:41:54<5:54:00,  1.85s/it][A
Training...:  18% 2440/13907 [1:41:55<5:45:13,  1.81s/it][A
Training...:  18% 2441/13907 [1:41:57<5:35:58,  1.76s/it][A
Training...:  18% 2442/13907 [1:41:59<5:30:22,  1.73s/it][A
Training...:  18% 2443/13907 [1:42:00<5:24:10,  1.70s/it][A
Training...:  18% 2444/13907 [1:42:02<5:16:44,  1.66s/it][A
Training...:  18% 2445/13907 [1:42:03<5:08:32,  1.62s/it][A
Training...:  18% 2446/13907 [1:42:05<4:59:38,  1.57s/it][A
Training...:  18% 2447/13907 [1:42:06<4:48:51,  1.51s/it][A
Training...:  18% 2448/13907 [1:42:07<4:38:26,  1.46s/it][A
Training...:  18% 2449/13907 [1:42:09<4:24:50,  1.39s/it][A
Training...:  18% 2450/13907 [1:42:10<4:05:49,  1.29s/it][A
Training...:  18% 2451/13907 [1:42:14<6:32:03,  2.05s/it][A
Training...:  18% 2452/13907 [1:42:17<7:52:13,  2.47s/it][A
Training...:  18% 2453/13907 [1:42:20<8:35:07,  2.70s/it][A
Training...:  18% 2454/13907 [1:42:23<8:59:11,  2.82s/it][A
Training...:  18% 2455/13907 [1:42:26<9:10:30,  2.88s/it][A
Training...:  18% 2456/13907 [1:42:29<9:16:11,  2.91s/it][A
Training...:  18% 2457/13907 [1:42:32<9:14:26,  2.91s/it][A
Training...:  18% 2458/13907 [1:42:35<9:06:28,  2.86s/it][A
Training...:  18% 2459/13907 [1:42:38<9:00:25,  2.83s/it][A
Training...:  18% 2460/13907 [1:42:40<8:54:39,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:12:55<17:31:07, 31533.87s/it]
Training...:  18% 2460/13907 [1:42:44<8:54:39,  2.80s/it][A
Training...:  18% 2461/13907 [1:42:44<9:08:15,  2.87s/it][A
Training...:  18% 2462/13907 [1:42:46<8:56:05,  2.81s/it][A
Training...:  18% 2463/13907 [1:42:49<8:41:16,  2.73s/it][A
Training...:  18% 2464/13907 [1:42:51<8:27:23,  2.66s/it][A
Training...:  18% 2465/13907 [1:42:54<8:17:27,  2.61s/it][A
Training...:  18% 2466/13907 [1:42:56<8:14:52,  2.60s/it][A
Training...:  18% 2467/13907 [1:42:59<8:06:56,  2.55s/it][A
Training...:  18% 2468/13907 [1:43:01<7:57:59,  2.51s/it][A
Training...:  18% 2469/13907 [1:43:03<7:49:16,  2.46s/it][A
Training...:  18% 2470/13907 [1:43:06<7:40:45,  2.42s/it][A
Training...:  18% 2471/13907 [1:43:08<7:34:43,  2.39s/it][A
Training...:  18% 2472/13907 [1:43:10<7:26:12,  2.34s/it][A
Training...:  18% 2473/13907 [1:43:13<7:22:51,  2.32s/it][A
Training...:  18% 2474/13907 [1:43:15<7:17:13,  2.29s/it][A
Training...:  18% 2475/13907 [1:43:17<7:13:08,  2.27s/it][A
Training...:  18% 2476/13907 [1:43:19<7:07:45,  2.25s/it][A
Training...:  18% 2477/13907 [1:43:21<7:02:47,  2.22s/it][A
Training...:  18% 2478/13907 [1:43:24<6:55:57,  2.18s/it][A
Training...:  18% 2479/13907 [1:43:26<6:50:11,  2.15s/it][A
Training...:  18% 2480/13907 [1:43:28<6:44:52,  2.13s/it][A
Training...:  18% 2481/13907 [1:43:30<6:40:13,  2.10s/it][A
Training...:  18% 2482/13907 [1:43:32<6:34:46,  2.07s/it][A
Training...:  18% 2483/13907 [1:43:34<6:28:27,  2.04s/it][A
Training...:  18% 2484/13907 [1:43:36<6:22:41,  2.01s/it][A
Training...:  18% 2485/13907 [1:43:38<6:17:26,  1.98s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:13:51<17:31:07, 31533.87s/it]
Training...:  18% 2485/13907 [1:43:40<6:17:26,  1.98s/it][A
Training...:  18% 2486/13907 [1:43:40<6:28:57,  2.04s/it][A
Training...:  18% 2487/13907 [1:43:42<6:19:30,  1.99s/it][A
Training...:  18% 2488/13907 [1:43:43<6:07:30,  1.93s/it][A
Training...:  18% 2489/13907 [1:43:45<5:57:17,  1.88s/it][A
Training...:  18% 2490/13907 [1:43:47<5:48:47,  1.83s/it][A
Training...:  18% 2491/13907 [1:43:49<5:41:12,  1.79s/it][A
Training...:  18% 2492/13907 [1:43:50<5:31:58,  1.74s/it][A
Training...:  18% 2493/13907 [1:43:52<5:23:51,  1.70s/it][A
Training...:  18% 2494/13907 [1:43:53<5:15:44,  1.66s/it][A
Training...:  18% 2495/13907 [1:43:55<5:07:39,  1.62s/it][A
Training...:  18% 2496/13907 [1:43:56<4:58:27,  1.57s/it][A
Training...:  18% 2497/13907 [1:43:58<4:48:31,  1.52s/it][A
Training...:  18% 2498/13907 [1:43:59<4:37:00,  1.46s/it][A
Training...:  18% 2499/13907 [1:44:00<4:23:52,  1.39s/it][A
Training...:  18% 2500/13907 [1:44:01<4:04:58,  1.29s/it][A
Training...:  18% 2501/13907 [1:44:05<6:22:19,  2.01s/it][A
Training...:  18% 2502/13907 [1:44:08<7:39:10,  2.42s/it][A
Training...:  18% 2503/13907 [1:44:12<8:23:38,  2.65s/it][A
Training...:  18% 2504/13907 [1:44:15<8:49:35,  2.79s/it][A
Training...:  18% 2505/13907 [1:44:18<9:08:07,  2.88s/it][A
Training...:  18% 2506/13907 [1:44:21<9:16:27,  2.93s/it][A
Training...:  18% 2507/13907 [1:44:24<9:12:35,  2.91s/it][A
Training...:  18% 2508/13907 [1:44:26<9:05:23,  2.87s/it][A
Training...:  18% 2509/13907 [1:44:29<8:57:39,  2.83s/it][A
Training...:  18% 2510/13907 [1:44:32<8:48:36,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:14:46<17:31:07, 31533.87s/it]
Training...:  18% 2510/13907 [1:44:35<8:48:36,  2.78s/it][A
Training...:  18% 2511/13907 [1:44:35<9:05:01,  2.87s/it][A
Training...:  18% 2512/13907 [1:44:38<8:53:58,  2.81s/it][A
Training...:  18% 2513/13907 [1:44:40<8:39:56,  2.74s/it][A
Training...:  18% 2514/13907 [1:44:43<8:28:51,  2.68s/it][A
Training...:  18% 2515/13907 [1:44:45<8:17:03,  2.62s/it][A
Training...:  18% 2516/13907 [1:44:48<8:08:28,  2.57s/it][A
Training...:  18% 2517/13907 [1:44:50<7:59:07,  2.52s/it][A
Training...:  18% 2518/13907 [1:44:52<7:50:07,  2.48s/it][A
Training...:  18% 2519/13907 [1:44:55<7:43:51,  2.44s/it][A
Training...:  18% 2520/13907 [1:44:57<7:37:51,  2.41s/it][A
Training...:  18% 2521/13907 [1:44:59<7:31:07,  2.38s/it][A
Training...:  18% 2522/13907 [1:45:02<7:24:09,  2.34s/it][A
Training...:  18% 2523/13907 [1:45:04<7:19:02,  2.31s/it][A
Training...:  18% 2524/13907 [1:45:06<7:12:08,  2.28s/it][A
Training...:  18% 2525/13907 [1:45:08<7:06:00,  2.25s/it][A
Training...:  18% 2526/13907 [1:45:11<7:01:05,  2.22s/it][A
Training...:  18% 2527/13907 [1:45:13<6:55:02,  2.19s/it][A
Training...:  18% 2528/13907 [1:45:15<6:48:31,  2.15s/it][A
Training...:  18% 2529/13907 [1:45:17<6:42:57,  2.12s/it][A
Training...:  18% 2530/13907 [1:45:19<6:36:24,  2.09s/it][A
Training...:  18% 2531/13907 [1:45:21<6:30:13,  2.06s/it][A
Training...:  18% 2532/13907 [1:45:23<6:25:59,  2.04s/it][A
Training...:  18% 2533/13907 [1:45:25<6:22:44,  2.02s/it][A
Training...:  18% 2534/13907 [1:45:27<6:17:56,  1.99s/it][A
Training...:  18% 2535/13907 [1:45:29<6:12:06,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:15:42<17:31:07, 31533.87s/it]
Training...:  18% 2535/13907 [1:45:31<6:12:06,  1.96s/it][A
Training...:  18% 2536/13907 [1:45:31<6:23:04,  2.02s/it][A
Training...:  18% 2537/13907 [1:45:33<6:15:43,  1.98s/it][A
Training...:  18% 2538/13907 [1:45:34<6:04:30,  1.92s/it][A
Training...:  18% 2539/13907 [1:45:36<5:53:51,  1.87s/it][A
Training...:  18% 2540/13907 [1:45:38<5:45:16,  1.82s/it][A
Training...:  18% 2541/13907 [1:45:39<5:35:34,  1.77s/it][A
Training...:  18% 2542/13907 [1:45:41<5:26:09,  1.72s/it][A
Training...:  18% 2543/13907 [1:45:43<5:18:55,  1.68s/it][A
Training...:  18% 2544/13907 [1:45:44<5:11:33,  1.65s/it][A
Training...:  18% 2545/13907 [1:45:46<5:01:41,  1.59s/it][A
Training...:  18% 2546/13907 [1:45:47<4:51:32,  1.54s/it][A
Training...:  18% 2547/13907 [1:45:48<4:40:31,  1.48s/it][A
Training...:  18% 2548/13907 [1:45:50<4:30:19,  1.43s/it][A
Training...:  18% 2549/13907 [1:45:51<4:18:44,  1.37s/it][A
Training...:  18% 2550/13907 [1:45:52<3:59:16,  1.26s/it][A
Training...:  18% 2551/13907 [1:45:56<6:19:03,  2.00s/it][A
Training...:  18% 2552/13907 [1:45:59<7:44:05,  2.45s/it][A
Training...:  18% 2553/13907 [1:46:03<8:29:52,  2.69s/it][A
Training...:  18% 2554/13907 [1:46:06<8:55:52,  2.83s/it][A
Training...:  18% 2555/13907 [1:46:09<9:09:01,  2.90s/it][A
Training...:  18% 2556/13907 [1:46:12<9:12:31,  2.92s/it][A
Training...:  18% 2557/13907 [1:46:15<9:12:43,  2.92s/it][A
Training...:  18% 2558/13907 [1:46:17<9:09:46,  2.91s/it][A
Training...:  18% 2559/13907 [1:46:20<9:03:32,  2.87s/it][A
Training...:  18% 2560/13907 [1:46:23<8:56:29,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:16:37<17:31:07, 31533.87s/it]
Training...:  18% 2560/13907 [1:46:26<8:56:29,  2.84s/it][A
Training...:  18% 2561/13907 [1:46:26<9:09:39,  2.91s/it][A
Training...:  18% 2562/13907 [1:46:29<8:58:50,  2.85s/it][A
Training...:  18% 2563/13907 [1:46:31<8:45:49,  2.78s/it][A
Training...:  18% 2564/13907 [1:46:34<8:33:32,  2.72s/it][A
Training...:  18% 2565/13907 [1:46:37<8:22:57,  2.66s/it][A
Training...:  18% 2566/13907 [1:46:39<8:12:11,  2.60s/it][A
Training...:  18% 2567/13907 [1:46:42<8:08:44,  2.59s/it][A
Training...:  18% 2568/13907 [1:46:44<8:02:24,  2.55s/it][A
Training...:  18% 2569/13907 [1:46:46<7:52:34,  2.50s/it][A
Training...:  18% 2570/13907 [1:46:49<7:44:18,  2.46s/it][A
Training...:  18% 2571/13907 [1:46:51<7:36:29,  2.42s/it][A
Training...:  18% 2572/13907 [1:46:53<7:30:39,  2.39s/it][A
Training...:  19% 2573/13907 [1:46:56<7:22:08,  2.34s/it][A
Training...:  19% 2574/13907 [1:46:58<7:15:56,  2.31s/it][A
Training...:  19% 2575/13907 [1:47:00<7:08:33,  2.27s/it][A
Training...:  19% 2576/13907 [1:47:02<7:02:19,  2.24s/it][A
Training...:  19% 2577/13907 [1:47:04<6:56:58,  2.21s/it][A
Training...:  19% 2578/13907 [1:47:06<6:50:25,  2.17s/it][A
Training...:  19% 2579/13907 [1:47:09<6:43:53,  2.14s/it][A
Training...:  19% 2580/13907 [1:47:11<6:36:34,  2.10s/it][A
Training...:  19% 2581/13907 [1:47:13<6:31:16,  2.07s/it][A
Training...:  19% 2582/13907 [1:47:14<6:25:34,  2.04s/it][A
Training...:  19% 2583/13907 [1:47:16<6:21:27,  2.02s/it][A
Training...:  19% 2584/13907 [1:47:18<6:15:34,  1.99s/it][A
Training...:  19% 2585/13907 [1:47:20<6:10:19,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:17:33<17:31:07, 31533.87s/it]
Training...:  19% 2585/13907 [1:47:22<6:10:19,  1.96s/it][A
Training...:  19% 2586/13907 [1:47:22<6:22:21,  2.03s/it][A
Training...:  19% 2587/13907 [1:47:24<6:14:55,  1.99s/it][A
Training...:  19% 2588/13907 [1:47:26<6:04:18,  1.93s/it][A
Training...:  19% 2589/13907 [1:47:28<5:56:52,  1.89s/it][A
Training...:  19% 2590/13907 [1:47:30<5:47:07,  1.84s/it][A
Training...:  19% 2591/13907 [1:47:31<5:39:35,  1.80s/it][A
Training...:  19% 2592/13907 [1:47:33<5:31:13,  1.76s/it][A
Training...:  19% 2593/13907 [1:47:35<5:24:12,  1.72s/it][A
Training...:  19% 2594/13907 [1:47:36<5:16:04,  1.68s/it][A
Training...:  19% 2595/13907 [1:47:38<5:08:08,  1.63s/it][A
Training...:  19% 2596/13907 [1:47:39<4:57:58,  1.58s/it][A
Training...:  19% 2597/13907 [1:47:41<4:47:09,  1.52s/it][A
Training...:  19% 2598/13907 [1:47:42<4:36:07,  1.47s/it][A
Training...:  19% 2599/13907 [1:47:43<4:23:14,  1.40s/it][A
Training...:  19% 2600/13907 [1:47:44<4:05:04,  1.30s/it][A
Training...:  19% 2601/13907 [1:47:48<6:24:35,  2.04s/it][A
Training...:  19% 2602/13907 [1:47:52<7:45:31,  2.47s/it][A
Training...:  19% 2603/13907 [1:47:55<8:30:20,  2.71s/it][A
Training...:  19% 2604/13907 [1:47:58<8:53:34,  2.83s/it][A
Training...:  19% 2605/13907 [1:48:01<9:05:12,  2.89s/it][A
Training...:  19% 2606/13907 [1:48:04<9:09:34,  2.92s/it][A
Training...:  19% 2607/13907 [1:48:07<9:09:06,  2.92s/it][A
Training...:  19% 2608/13907 [1:48:10<9:03:32,  2.89s/it][A
Training...:  19% 2609/13907 [1:48:12<9:01:16,  2.87s/it][A
Training...:  19% 2610/13907 [1:48:15<8:57:14,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:18:29<17:31:07, 31533.87s/it]
Training...:  19% 2610/13907 [1:48:18<8:57:14,  2.85s/it][A
Training...:  19% 2611/13907 [1:48:18<9:10:44,  2.93s/it][A
Training...:  19% 2612/13907 [1:48:21<8:56:43,  2.85s/it][A
Training...:  19% 2613/13907 [1:48:24<8:44:25,  2.79s/it][A
Training...:  19% 2614/13907 [1:48:26<8:29:55,  2.71s/it][A
Training...:  19% 2615/13907 [1:48:29<8:18:07,  2.65s/it][A
Training...:  19% 2616/13907 [1:48:31<8:06:19,  2.58s/it][A
Training...:  19% 2617/13907 [1:48:34<7:57:31,  2.54s/it][A
Training...:  19% 2618/13907 [1:48:36<7:50:22,  2.50s/it][A
Training...:  19% 2619/13907 [1:48:38<7:43:25,  2.46s/it][A
Training...:  19% 2620/13907 [1:48:41<7:38:34,  2.44s/it][A
Training...:  19% 2621/13907 [1:48:43<7:33:28,  2.41s/it][A
Training...:  19% 2622/13907 [1:48:45<7:28:22,  2.38s/it][A
Training...:  19% 2623/13907 [1:48:48<7:22:16,  2.35s/it][A
Training...:  19% 2624/13907 [1:48:50<7:15:16,  2.31s/it][A
Training...:  19% 2625/13907 [1:48:52<7:09:38,  2.28s/it][A
Training...:  19% 2626/13907 [1:48:54<7:02:06,  2.25s/it][A
Training...:  19% 2627/13907 [1:48:56<6:56:01,  2.21s/it][A
Training...:  19% 2628/13907 [1:48:59<6:50:26,  2.18s/it][A
Training...:  19% 2629/13907 [1:49:01<6:46:35,  2.16s/it][A
Training...:  19% 2630/13907 [1:49:03<6:39:58,  2.13s/it][A
Training...:  19% 2631/13907 [1:49:05<6:35:18,  2.10s/it][A
Training...:  19% 2632/13907 [1:49:07<6:29:29,  2.07s/it][A
Training...:  19% 2633/13907 [1:49:09<6:24:05,  2.04s/it][A
Training...:  19% 2634/13907 [1:49:11<6:17:01,  2.01s/it][A
Training...:  19% 2635/13907 [1:49:13<6:11:52,  1.98s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:19:26<17:31:07, 31533.87s/it]
Training...:  19% 2635/13907 [1:49:15<6:11:52,  1.98s/it][A
Training...:  19% 2636/13907 [1:49:15<6:22:14,  2.03s/it][A
Training...:  19% 2637/13907 [1:49:17<6:14:43,  2.00s/it][A
Training...:  19% 2638/13907 [1:49:18<6:03:38,  1.94s/it][A
Training...:  19% 2639/13907 [1:49:20<5:53:03,  1.88s/it][A
Training...:  19% 2640/13907 [1:49:22<5:43:45,  1.83s/it][A
Training...:  19% 2641/13907 [1:49:24<5:35:35,  1.79s/it][A
Training...:  19% 2642/13907 [1:49:25<5:27:30,  1.74s/it][A
Training...:  19% 2643/13907 [1:49:27<5:20:07,  1.71s/it][A
Training...:  19% 2644/13907 [1:49:28<5:12:52,  1.67s/it][A
Training...:  19% 2645/13907 [1:49:30<5:08:12,  1.64s/it][A
Training...:  19% 2646/13907 [1:49:31<4:59:46,  1.60s/it][A
Training...:  19% 2647/13907 [1:49:33<4:50:05,  1.55s/it][A
Training...:  19% 2648/13907 [1:49:34<4:39:32,  1.49s/it][A
Training...:  19% 2649/13907 [1:49:36<4:25:53,  1.42s/it][A
Training...:  19% 2650/13907 [1:49:37<4:05:46,  1.31s/it][A
Training...:  19% 2651/13907 [1:49:40<6:23:46,  2.05s/it][A
Training...:  19% 2652/13907 [1:49:44<7:43:30,  2.47s/it][A
Training...:  19% 2653/13907 [1:49:47<8:23:23,  2.68s/it][A
Training...:  19% 2654/13907 [1:49:50<8:47:56,  2.81s/it][A
Training...:  19% 2655/13907 [1:49:53<8:57:01,  2.86s/it][A
Training...:  19% 2656/13907 [1:49:56<8:59:33,  2.88s/it][A
Training...:  19% 2657/13907 [1:49:59<8:58:16,  2.87s/it][A
Training...:  19% 2658/13907 [1:50:02<8:54:02,  2.85s/it][A
Training...:  19% 2659/13907 [1:50:04<8:49:14,  2.82s/it][A
Training...:  19% 2660/13907 [1:50:07<8:44:14,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:20:21<17:31:07, 31533.87s/it]
Training...:  19% 2660/13907 [1:50:10<8:44:14,  2.80s/it][A
Training...:  19% 2661/13907 [1:50:10<9:00:44,  2.89s/it][A
Training...:  19% 2662/13907 [1:50:13<8:50:27,  2.83s/it][A
Training...:  19% 2663/13907 [1:50:16<8:35:02,  2.75s/it][A
Training...:  19% 2664/13907 [1:50:18<8:23:42,  2.69s/it][A
Training...:  19% 2665/13907 [1:50:21<8:12:26,  2.63s/it][A
Training...:  19% 2666/13907 [1:50:23<8:02:29,  2.58s/it][A
Training...:  19% 2667/13907 [1:50:25<7:53:28,  2.53s/it][A
Training...:  19% 2668/13907 [1:50:28<7:45:55,  2.49s/it][A
Training...:  19% 2669/13907 [1:50:30<7:39:01,  2.45s/it][A
Training...:  19% 2670/13907 [1:50:32<7:30:18,  2.40s/it][A
Training...:  19% 2671/13907 [1:50:35<7:25:42,  2.38s/it][A
Training...:  19% 2672/13907 [1:50:37<7:18:10,  2.34s/it][A
Training...:  19% 2673/13907 [1:50:39<7:12:23,  2.31s/it][A
Training...:  19% 2674/13907 [1:50:42<7:08:49,  2.29s/it][A
Training...:  19% 2675/13907 [1:50:44<7:02:12,  2.26s/it][A
Training...:  19% 2676/13907 [1:50:46<6:55:33,  2.22s/it][A
Training...:  19% 2677/13907 [1:50:48<6:48:44,  2.18s/it][A
Training...:  19% 2678/13907 [1:50:50<6:42:54,  2.15s/it][A
Training...:  19% 2679/13907 [1:50:52<6:36:59,  2.12s/it][A
Training...:  19% 2680/13907 [1:50:54<6:30:29,  2.09s/it][A
Training...:  19% 2681/13907 [1:50:56<6:25:33,  2.06s/it][A
Training...:  19% 2682/13907 [1:50:58<6:18:35,  2.02s/it][A
Training...:  19% 2683/13907 [1:51:00<6:12:35,  1.99s/it][A
Training...:  19% 2684/13907 [1:51:02<6:07:00,  1.96s/it][A
Training...:  19% 2685/13907 [1:51:04<6:00:49,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:21:17<17:31:07, 31533.87s/it]
Training...:  19% 2685/13907 [1:51:06<6:00:49,  1.93s/it][A
Training...:  19% 2686/13907 [1:51:06<6:12:24,  1.99s/it][A
Training...:  19% 2687/13907 [1:51:08<6:05:29,  1.95s/it][A
Training...:  19% 2688/13907 [1:51:09<5:55:07,  1.90s/it][A
Training...:  19% 2689/13907 [1:51:11<5:45:12,  1.85s/it][A
Training...:  19% 2690/13907 [1:51:13<5:36:53,  1.80s/it][A
Training...:  19% 2691/13907 [1:51:15<5:28:16,  1.76s/it][A
Training...:  19% 2692/13907 [1:51:16<5:21:09,  1.72s/it][A
Training...:  19% 2693/13907 [1:51:18<5:13:38,  1.68s/it][A
Training...:  19% 2694/13907 [1:51:19<5:06:56,  1.64s/it][A
Training...:  19% 2695/13907 [1:51:21<4:58:50,  1.60s/it][A
Training...:  19% 2696/13907 [1:51:22<4:50:24,  1.55s/it][A
Training...:  19% 2697/13907 [1:51:24<4:42:36,  1.51s/it][A
Training...:  19% 2698/13907 [1:51:25<4:32:23,  1.46s/it][A
Training...:  19% 2699/13907 [1:51:26<4:20:34,  1.39s/it][A
Training...:  19% 2700/13907 [1:51:27<4:03:12,  1.30s/it][A
Training...:  19% 2701/13907 [1:51:31<6:18:38,  2.03s/it][A
Training...:  19% 2702/13907 [1:51:35<7:41:29,  2.47s/it][A
Training...:  19% 2703/13907 [1:51:38<8:23:58,  2.70s/it][A
Training...:  19% 2704/13907 [1:51:41<8:53:29,  2.86s/it][A
Training...:  19% 2705/13907 [1:51:44<9:05:01,  2.92s/it][A
Training...:  19% 2706/13907 [1:51:47<9:09:41,  2.94s/it][A
Training...:  19% 2707/13907 [1:51:50<9:07:20,  2.93s/it][A
Training...:  19% 2708/13907 [1:51:53<9:02:33,  2.91s/it][A
Training...:  19% 2709/13907 [1:51:56<8:55:21,  2.87s/it][A
Training...:  19% 2710/13907 [1:51:58<8:47:24,  2.83s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:22:12<17:31:07, 31533.87s/it]
Training...:  19% 2710/13907 [1:52:01<8:47:24,  2.83s/it][A
Training...:  19% 2711/13907 [1:52:01<9:01:48,  2.90s/it][A
Training...:  20% 2712/13907 [1:52:04<8:56:46,  2.88s/it][A
Training...:  20% 2713/13907 [1:52:07<8:43:43,  2.81s/it][A
Training...:  20% 2714/13907 [1:52:09<8:30:19,  2.74s/it][A
Training...:  20% 2715/13907 [1:52:12<8:17:07,  2.67s/it][A
Training...:  20% 2716/13907 [1:52:14<8:05:50,  2.60s/it][A
Training...:  20% 2717/13907 [1:52:17<7:56:45,  2.56s/it][A
Training...:  20% 2718/13907 [1:52:19<7:46:57,  2.50s/it][A
Training...:  20% 2719/13907 [1:52:22<7:39:24,  2.46s/it][A
Training...:  20% 2720/13907 [1:52:24<7:32:58,  2.43s/it][A
Training...:  20% 2721/13907 [1:52:26<7:26:05,  2.39s/it][A
Training...:  20% 2722/13907 [1:52:29<7:19:43,  2.36s/it][A
Training...:  20% 2723/13907 [1:52:31<7:13:25,  2.33s/it][A
Training...:  20% 2724/13907 [1:52:33<7:06:08,  2.29s/it][A
Training...:  20% 2725/13907 [1:52:35<6:59:45,  2.25s/it][A
Training...:  20% 2726/13907 [1:52:37<6:53:22,  2.22s/it][A
Training...:  20% 2727/13907 [1:52:39<6:47:55,  2.19s/it][A
Training...:  20% 2728/13907 [1:52:41<6:41:51,  2.16s/it][A
Training...:  20% 2729/13907 [1:52:44<6:38:14,  2.14s/it][A
Training...:  20% 2730/13907 [1:52:46<6:32:38,  2.11s/it][A
Training...:  20% 2731/13907 [1:52:48<6:28:02,  2.08s/it][A
Training...:  20% 2732/13907 [1:52:50<6:22:53,  2.06s/it][A
Training...:  20% 2733/13907 [1:52:52<6:17:33,  2.03s/it][A
Training...:  20% 2734/13907 [1:52:54<6:11:37,  2.00s/it][A
Training...:  20% 2735/13907 [1:52:55<6:05:10,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:23:09<17:31:07, 31533.87s/it]
Training...:  20% 2735/13907 [1:52:58<6:05:10,  1.96s/it][A
Training...:  20% 2736/13907 [1:52:58<6:16:34,  2.02s/it][A
Training...:  20% 2737/13907 [1:52:59<6:07:15,  1.97s/it][A
Training...:  20% 2738/13907 [1:53:01<5:55:48,  1.91s/it][A
Training...:  20% 2739/13907 [1:53:03<5:44:36,  1.85s/it][A
Training...:  20% 2740/13907 [1:53:05<5:35:40,  1.80s/it][A
Training...:  20% 2741/13907 [1:53:06<5:27:17,  1.76s/it][A
Training...:  20% 2742/13907 [1:53:08<5:18:35,  1.71s/it][A
Training...:  20% 2743/13907 [1:53:09<5:11:16,  1.67s/it][A
Training...:  20% 2744/13907 [1:53:11<5:04:31,  1.64s/it][A
Training...:  20% 2745/13907 [1:53:12<4:56:06,  1.59s/it][A
Training...:  20% 2746/13907 [1:53:14<4:46:46,  1.54s/it][A
Training...:  20% 2747/13907 [1:53:15<4:38:18,  1.50s/it][A
Training...:  20% 2748/13907 [1:53:17<4:29:26,  1.45s/it][A
Training...:  20% 2749/13907 [1:53:18<4:16:36,  1.38s/it][A
Training...:  20% 2750/13907 [1:53:19<3:59:49,  1.29s/it][A
Training...:  20% 2751/13907 [1:53:23<6:20:33,  2.05s/it][A
Training...:  20% 2752/13907 [1:53:26<7:40:42,  2.48s/it][A
Training...:  20% 2753/13907 [1:53:29<8:24:01,  2.71s/it][A
Training...:  20% 2754/13907 [1:53:33<8:46:37,  2.83s/it][A
Training...:  20% 2755/13907 [1:53:36<8:57:13,  2.89s/it][A
Training...:  20% 2756/13907 [1:53:39<8:58:37,  2.90s/it][A
Training...:  20% 2757/13907 [1:53:41<8:55:06,  2.88s/it][A
Training...:  20% 2758/13907 [1:53:44<8:52:19,  2.86s/it][A
Training...:  20% 2759/13907 [1:53:47<8:45:47,  2.83s/it][A
Training...:  20% 2760/13907 [1:53:50<8:36:53,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:24:04<17:31:07, 31533.87s/it]
Training...:  20% 2760/13907 [1:53:53<8:36:53,  2.78s/it][A
Training...:  20% 2761/13907 [1:53:53<8:53:02,  2.87s/it][A
Training...:  20% 2762/13907 [1:53:55<8:43:49,  2.82s/it][A
Training...:  20% 2763/13907 [1:53:58<8:30:22,  2.75s/it][A
Training...:  20% 2764/13907 [1:54:00<8:17:56,  2.68s/it][A
Training...:  20% 2765/13907 [1:54:03<8:07:08,  2.62s/it][A
Training...:  20% 2766/13907 [1:54:05<7:58:25,  2.58s/it][A
Training...:  20% 2767/13907 [1:54:08<7:51:36,  2.54s/it][A
Training...:  20% 2768/13907 [1:54:10<7:43:16,  2.50s/it][A
Training...:  20% 2769/13907 [1:54:13<7:34:57,  2.45s/it][A
Training...:  20% 2770/13907 [1:54:15<7:30:08,  2.43s/it][A
Training...:  20% 2771/13907 [1:54:17<7:23:40,  2.39s/it][A
Training...:  20% 2772/13907 [1:54:20<7:15:21,  2.35s/it][A
Training...:  20% 2773/13907 [1:54:22<7:09:09,  2.31s/it][A
Training...:  20% 2774/13907 [1:54:24<7:05:59,  2.30s/it][A
Training...:  20% 2775/13907 [1:54:26<6:59:59,  2.26s/it][A
Training...:  20% 2776/13907 [1:54:28<6:52:08,  2.22s/it][A
Training...:  20% 2777/13907 [1:54:30<6:44:37,  2.18s/it][A
Training...:  20% 2778/13907 [1:54:33<6:38:40,  2.15s/it][A
Training...:  20% 2779/13907 [1:54:35<6:32:05,  2.11s/it][A
Training...:  20% 2780/13907 [1:54:37<6:25:32,  2.08s/it][A
Training...:  20% 2781/13907 [1:54:39<6:20:17,  2.05s/it][A
Training...:  20% 2782/13907 [1:54:41<6:15:20,  2.02s/it][A
Training...:  20% 2783/13907 [1:54:42<6:09:31,  1.99s/it][A
Training...:  20% 2784/13907 [1:54:44<6:04:38,  1.97s/it][A
Training...:  20% 2785/13907 [1:54:46<5:59:22,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:24:59<17:31:07, 31533.87s/it]
Training...:  20% 2785/13907 [1:54:48<5:59:22,  1.94s/it][A
Training...:  20% 2786/13907 [1:54:48<6:11:06,  2.00s/it][A
Training...:  20% 2787/13907 [1:54:50<6:03:50,  1.96s/it][A
Training...:  20% 2788/13907 [1:54:52<5:53:45,  1.91s/it][A
Training...:  20% 2789/13907 [1:54:54<5:45:14,  1.86s/it][A
Training...:  20% 2790/13907 [1:54:55<5:36:50,  1.82s/it][A
Training...:  20% 2791/13907 [1:54:57<5:29:39,  1.78s/it][A
Training...:  20% 2792/13907 [1:54:59<5:22:02,  1.74s/it][A
Training...:  20% 2793/13907 [1:55:00<5:13:38,  1.69s/it][A
Training...:  20% 2794/13907 [1:55:02<5:05:53,  1.65s/it][A
Training...:  20% 2795/13907 [1:55:03<4:57:11,  1.60s/it][A
Training...:  20% 2796/13907 [1:55:05<4:47:00,  1.55s/it][A
Training...:  20% 2797/13907 [1:55:06<4:37:04,  1.50s/it][A
Training...:  20% 2798/13907 [1:55:08<4:25:06,  1.43s/it][A
Training...:  20% 2799/13907 [1:55:09<4:12:51,  1.37s/it][A
Training...:  20% 2800/13907 [1:55:10<3:55:36,  1.27s/it][A
Training...:  20% 2801/13907 [1:55:14<6:15:15,  2.03s/it][A
Training...:  20% 2802/13907 [1:55:17<7:38:48,  2.48s/it][A
Training...:  20% 2803/13907 [1:55:20<8:23:39,  2.72s/it][A
Training...:  20% 2804/13907 [1:55:24<8:49:02,  2.86s/it][A
Training...:  20% 2805/13907 [1:55:27<9:01:06,  2.92s/it][A
Training...:  20% 2806/13907 [1:55:30<9:06:10,  2.95s/it][A
Training...:  20% 2807/13907 [1:55:33<9:07:40,  2.96s/it][A
Training...:  20% 2808/13907 [1:55:36<9:06:49,  2.96s/it][A
Training...:  20% 2809/13907 [1:55:38<8:58:25,  2.91s/it][A
Training...:  20% 2810/13907 [1:55:41<8:48:32,  2.86s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:25:55<17:31:07, 31533.87s/it]
Training...:  20% 2810/13907 [1:55:44<8:48:32,  2.86s/it][A
Training...:  20% 2811/13907 [1:55:44<9:02:06,  2.93s/it][A
Training...:  20% 2812/13907 [1:55:47<8:50:39,  2.87s/it][A
Training...:  20% 2813/13907 [1:55:50<8:34:56,  2.79s/it][A
Training...:  20% 2814/13907 [1:55:52<8:23:37,  2.72s/it][A
Training...:  20% 2815/13907 [1:55:55<8:14:42,  2.68s/it][A
Training...:  20% 2816/13907 [1:55:57<8:02:53,  2.61s/it][A
Training...:  20% 2817/13907 [1:56:00<7:53:30,  2.56s/it][A
Training...:  20% 2818/13907 [1:56:02<7:43:47,  2.51s/it][A
Training...:  20% 2819/13907 [1:56:04<7:36:14,  2.47s/it][A
Training...:  20% 2820/13907 [1:56:07<7:28:54,  2.43s/it][A
Training...:  20% 2821/13907 [1:56:09<7:22:02,  2.39s/it][A
Training...:  20% 2822/13907 [1:56:11<7:15:43,  2.36s/it][A
Training...:  20% 2823/13907 [1:56:14<7:08:48,  2.32s/it][A
Training...:  20% 2824/13907 [1:56:16<7:03:49,  2.29s/it][A
Training...:  20% 2825/13907 [1:56:18<6:55:52,  2.25s/it][A
Training...:  20% 2826/13907 [1:56:20<6:50:00,  2.22s/it][A
Training...:  20% 2827/13907 [1:56:22<6:43:54,  2.19s/it][A
Training...:  20% 2828/13907 [1:56:24<6:38:23,  2.16s/it][A
Training...:  20% 2829/13907 [1:56:26<6:32:49,  2.13s/it][A
Training...:  20% 2830/13907 [1:56:28<6:27:52,  2.10s/it][A
Training...:  20% 2831/13907 [1:56:30<6:23:37,  2.08s/it][A
Training...:  20% 2832/13907 [1:56:32<6:17:39,  2.05s/it][A
Training...:  20% 2833/13907 [1:56:34<6:12:42,  2.02s/it][A
Training...:  20% 2834/13907 [1:56:36<6:07:30,  1.99s/it][A
Training...:  20% 2835/13907 [1:56:38<6:03:10,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:26:51<17:31:07, 31533.87s/it]
Training...:  20% 2835/13907 [1:56:40<6:03:10,  1.97s/it][A
Training...:  20% 2836/13907 [1:56:40<6:14:54,  2.03s/it][A
Training...:  20% 2837/13907 [1:56:42<6:06:34,  1.99s/it][A
Training...:  20% 2838/13907 [1:56:44<5:55:55,  1.93s/it][A
Training...:  20% 2839/13907 [1:56:46<5:45:55,  1.88s/it][A
Training...:  20% 2840/13907 [1:56:47<5:37:50,  1.83s/it][A
Training...:  20% 2841/13907 [1:56:49<5:30:04,  1.79s/it][A
Training...:  20% 2842/13907 [1:56:51<5:22:14,  1.75s/it][A
Training...:  20% 2843/13907 [1:56:52<5:15:07,  1.71s/it][A
Training...:  20% 2844/13907 [1:56:54<5:07:34,  1.67s/it][A
Training...:  20% 2845/13907 [1:56:56<5:00:38,  1.63s/it][A
Training...:  20% 2846/13907 [1:56:57<4:51:44,  1.58s/it][A
Training...:  20% 2847/13907 [1:56:58<4:42:27,  1.53s/it][A
Training...:  20% 2848/13907 [1:57:00<4:30:45,  1.47s/it][A
Training...:  20% 2849/13907 [1:57:01<4:18:22,  1.40s/it][A
Training...:  20% 2850/13907 [1:57:02<3:58:30,  1.29s/it][A
Training...:  21% 2851/13907 [1:57:06<6:14:24,  2.03s/it][A
Training...:  21% 2852/13907 [1:57:09<7:30:32,  2.45s/it][A
Training...:  21% 2853/13907 [1:57:12<8:11:55,  2.67s/it][A
Training...:  21% 2854/13907 [1:57:16<8:36:06,  2.80s/it][A
Training...:  21% 2855/13907 [1:57:19<8:49:00,  2.87s/it][A
Training...:  21% 2856/13907 [1:57:21<8:51:22,  2.88s/it][A
Training...:  21% 2857/13907 [1:57:24<8:51:23,  2.89s/it][A
Training...:  21% 2858/13907 [1:57:27<8:44:47,  2.85s/it][A
Training...:  21% 2859/13907 [1:57:30<8:41:23,  2.83s/it][A
Training...:  21% 2860/13907 [1:57:33<8:35:20,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:27:47<17:31:07, 31533.87s/it]
Training...:  21% 2860/13907 [1:57:36<8:35:20,  2.80s/it][A
Training...:  21% 2861/13907 [1:57:36<8:51:45,  2.89s/it][A
Training...:  21% 2862/13907 [1:57:38<8:40:26,  2.83s/it][A
Training...:  21% 2863/13907 [1:57:41<8:26:13,  2.75s/it][A
Training...:  21% 2864/13907 [1:57:43<8:12:53,  2.68s/it][A
Training...:  21% 2865/13907 [1:57:46<8:02:30,  2.62s/it][A
Training...:  21% 2866/13907 [1:57:48<7:52:36,  2.57s/it][A
Training...:  21% 2867/13907 [1:57:51<7:47:40,  2.54s/it][A
Training...:  21% 2868/13907 [1:57:53<7:43:29,  2.52s/it][A
Training...:  21% 2869/13907 [1:57:56<7:35:17,  2.47s/it][A
Training...:  21% 2870/13907 [1:57:58<7:27:29,  2.43s/it][A
Training...:  21% 2871/13907 [1:58:00<7:20:35,  2.40s/it][A
Training...:  21% 2872/13907 [1:58:03<7:13:22,  2.36s/it][A
Training...:  21% 2873/13907 [1:58:05<7:05:36,  2.31s/it][A
Training...:  21% 2874/13907 [1:58:07<6:59:40,  2.28s/it][A
Training...:  21% 2875/13907 [1:58:09<6:53:50,  2.25s/it][A
Training...:  21% 2876/13907 [1:58:11<6:47:43,  2.22s/it][A
Training...:  21% 2877/13907 [1:58:14<6:41:40,  2.19s/it][A
Training...:  21% 2878/13907 [1:58:16<6:35:55,  2.15s/it][A
Training...:  21% 2879/13907 [1:58:18<6:31:10,  2.13s/it][A
Training...:  21% 2880/13907 [1:58:20<6:23:28,  2.09s/it][A
Training...:  21% 2881/13907 [1:58:22<6:18:05,  2.06s/it][A
Training...:  21% 2882/13907 [1:58:24<6:12:21,  2.03s/it][A
Training...:  21% 2883/13907 [1:58:26<6:07:08,  2.00s/it][A
Training...:  21% 2884/13907 [1:58:27<6:01:39,  1.97s/it][A
Training...:  21% 2885/13907 [1:58:29<5:56:41,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:28:42<17:31:07, 31533.87s/it]
Training...:  21% 2885/13907 [1:58:31<5:56:41,  1.94s/it][A
Training...:  21% 2886/13907 [1:58:31<6:07:53,  2.00s/it][A
Training...:  21% 2887/13907 [1:58:33<6:01:19,  1.97s/it][A
Training...:  21% 2888/13907 [1:58:35<5:51:47,  1.92s/it][A
Training...:  21% 2889/13907 [1:58:37<5:41:57,  1.86s/it][A
Training...:  21% 2890/13907 [1:58:39<5:33:56,  1.82s/it][A
Training...:  21% 2891/13907 [1:58:40<5:25:30,  1.77s/it][A
Training...:  21% 2892/13907 [1:58:42<5:17:51,  1.73s/it][A
Training...:  21% 2893/13907 [1:58:43<5:10:51,  1.69s/it][A
Training...:  21% 2894/13907 [1:58:45<5:03:45,  1.65s/it][A
Training...:  21% 2895/13907 [1:58:47<4:55:02,  1.61s/it][A
Training...:  21% 2896/13907 [1:58:48<4:46:49,  1.56s/it][A
Training...:  21% 2897/13907 [1:58:49<4:36:48,  1.51s/it][A
Training...:  21% 2898/13907 [1:58:51<4:26:58,  1.46s/it][A
Training...:  21% 2899/13907 [1:58:52<4:14:18,  1.39s/it][A
Training...:  21% 2900/13907 [1:58:53<3:54:54,  1.28s/it][A
Training...:  21% 2901/13907 [1:58:57<6:11:35,  2.03s/it][A
Training...:  21% 2902/13907 [1:59:00<7:31:49,  2.46s/it][A
Training...:  21% 2903/13907 [1:59:03<8:15:42,  2.70s/it][A
Training...:  21% 2904/13907 [1:59:07<8:42:40,  2.85s/it][A
Training...:  21% 2905/13907 [1:59:10<8:58:53,  2.94s/it][A
Training...:  21% 2906/13907 [1:59:13<9:03:23,  2.96s/it][A
Training...:  21% 2907/13907 [1:59:16<8:57:17,  2.93s/it][A
Training...:  21% 2908/13907 [1:59:19<8:50:55,  2.90s/it][A
Training...:  21% 2909/13907 [1:59:21<8:41:51,  2.85s/it][A
Training...:  21% 2910/13907 [1:59:24<8:31:59,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:29:38<17:31:07, 31533.87s/it]
Training...:  21% 2910/13907 [1:59:27<8:31:59,  2.79s/it][A
Training...:  21% 2911/13907 [1:59:27<8:48:20,  2.88s/it][A
Training...:  21% 2912/13907 [1:59:30<8:39:03,  2.83s/it][A
Training...:  21% 2913/13907 [1:59:32<8:26:00,  2.76s/it][A
Training...:  21% 2914/13907 [1:59:35<8:14:17,  2.70s/it][A
Training...:  21% 2915/13907 [1:59:37<8:03:01,  2.64s/it][A
Training...:  21% 2916/13907 [1:59:40<7:53:05,  2.58s/it][A
Training...:  21% 2917/13907 [1:59:42<7:44:14,  2.53s/it][A
Training...:  21% 2918/13907 [1:59:45<7:35:41,  2.49s/it][A
Training...:  21% 2919/13907 [1:59:47<7:29:51,  2.46s/it][A
Training...:  21% 2920/13907 [1:59:49<7:21:45,  2.41s/it][A
Training...:  21% 2921/13907 [1:59:52<7:16:25,  2.38s/it][A
Training...:  21% 2922/13907 [1:59:54<7:08:22,  2.34s/it][A
Training...:  21% 2923/13907 [1:59:56<7:01:41,  2.30s/it][A
Training...:  21% 2924/13907 [1:59:58<6:55:30,  2.27s/it][A
Training...:  21% 2925/13907 [2:00:00<6:48:44,  2.23s/it][A
Training...:  21% 2926/13907 [2:00:03<6:43:17,  2.20s/it][A
Training...:  21% 2927/13907 [2:00:05<6:36:10,  2.16s/it][A
Training...:  21% 2928/13907 [2:00:07<6:31:45,  2.14s/it][A
Training...:  21% 2929/13907 [2:00:09<6:26:11,  2.11s/it][A
Training...:  21% 2930/13907 [2:00:11<6:19:25,  2.07s/it][A
Training...:  21% 2931/13907 [2:00:13<6:14:57,  2.05s/it][A
Training...:  21% 2932/13907 [2:00:15<6:13:50,  2.04s/it][A
Training...:  21% 2933/13907 [2:00:17<6:08:23,  2.01s/it][A
Training...:  21% 2934/13907 [2:00:19<6:00:43,  1.97s/it][A
Training...:  21% 2935/13907 [2:00:20<5:53:55,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:30:34<17:31:07, 31533.87s/it]
Training...:  21% 2935/13907 [2:00:23<5:53:55,  1.94s/it][A
Training...:  21% 2936/13907 [2:00:23<6:04:15,  1.99s/it][A
Training...:  21% 2937/13907 [2:00:24<5:57:21,  1.95s/it][A
Training...:  21% 2938/13907 [2:00:26<5:47:36,  1.90s/it][A
Training...:  21% 2939/13907 [2:00:28<5:39:34,  1.86s/it][A
Training...:  21% 2940/13907 [2:00:30<5:32:22,  1.82s/it][A
Training...:  21% 2941/13907 [2:00:31<5:23:40,  1.77s/it][A
Training...:  21% 2942/13907 [2:00:33<5:15:48,  1.73s/it][A
Training...:  21% 2943/13907 [2:00:35<5:08:56,  1.69s/it][A
Training...:  21% 2944/13907 [2:00:36<5:02:17,  1.65s/it][A
Training...:  21% 2945/13907 [2:00:38<4:53:12,  1.60s/it][A
Training...:  21% 2946/13907 [2:00:39<4:44:10,  1.56s/it][A
Training...:  21% 2947/13907 [2:00:40<4:33:15,  1.50s/it][A
Training...:  21% 2948/13907 [2:00:42<4:22:12,  1.44s/it][A
Training...:  21% 2949/13907 [2:00:43<4:09:33,  1.37s/it][A
Training...:  21% 2950/13907 [2:00:44<3:51:37,  1.27s/it][A
Training...:  21% 2951/13907 [2:00:48<6:06:22,  2.01s/it][A
Training...:  21% 2952/13907 [2:00:51<7:28:24,  2.46s/it][A
Training...:  21% 2953/13907 [2:00:54<8:13:41,  2.70s/it][A
Training...:  21% 2954/13907 [2:00:58<8:38:25,  2.84s/it][A
Training...:  21% 2955/13907 [2:01:01<8:49:19,  2.90s/it][A
Training...:  21% 2956/13907 [2:01:04<8:52:05,  2.92s/it][A
Training...:  21% 2957/13907 [2:01:07<8:50:48,  2.91s/it][A
Training...:  21% 2958/13907 [2:01:09<8:44:47,  2.88s/it][A
Training...:  21% 2959/13907 [2:01:12<8:42:04,  2.86s/it][A
Training...:  21% 2960/13907 [2:01:15<8:37:34,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:31:29<17:31:07, 31533.87s/it]
Training...:  21% 2960/13907 [2:01:18<8:37:34,  2.84s/it][A
Training...:  21% 2961/13907 [2:01:18<8:51:32,  2.91s/it][A
Training...:  21% 2962/13907 [2:01:21<8:41:04,  2.86s/it][A
Training...:  21% 2963/13907 [2:01:23<8:24:36,  2.77s/it][A
Training...:  21% 2964/13907 [2:01:26<8:12:49,  2.70s/it][A
Training...:  21% 2965/13907 [2:01:28<8:00:07,  2.63s/it][A
Training...:  21% 2966/13907 [2:01:31<7:50:14,  2.58s/it][A
Training...:  21% 2967/13907 [2:01:33<7:40:46,  2.53s/it][A
Training...:  21% 2968/13907 [2:01:36<7:32:14,  2.48s/it][A
Training...:  21% 2969/13907 [2:01:38<7:23:52,  2.43s/it][A
Training...:  21% 2970/13907 [2:01:40<7:16:32,  2.39s/it][A
Training...:  21% 2971/13907 [2:01:43<7:11:28,  2.37s/it][A
Training...:  21% 2972/13907 [2:01:45<7:05:38,  2.34s/it][A
Training...:  21% 2973/13907 [2:01:47<6:59:56,  2.30s/it][A
Training...:  21% 2974/13907 [2:01:49<6:53:55,  2.27s/it][A
Training...:  21% 2975/13907 [2:01:51<6:48:02,  2.24s/it][A
Training...:  21% 2976/13907 [2:01:53<6:42:06,  2.21s/it][A
Training...:  21% 2977/13907 [2:01:56<6:37:22,  2.18s/it][A
Training...:  21% 2978/13907 [2:01:58<6:31:06,  2.15s/it][A
Training...:  21% 2979/13907 [2:02:00<6:25:55,  2.12s/it][A
Training...:  21% 2980/13907 [2:02:02<6:20:34,  2.09s/it][A
Training...:  21% 2981/13907 [2:02:04<6:15:06,  2.06s/it][A
Training...:  21% 2982/13907 [2:02:06<6:09:57,  2.03s/it][A
Training...:  21% 2983/13907 [2:02:08<6:06:23,  2.01s/it][A
Training...:  21% 2984/13907 [2:02:10<5:59:31,  1.97s/it][A
Training...:  21% 2985/13907 [2:02:11<5:53:18,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:32:25<17:31:07, 31533.87s/it]
Training...:  21% 2985/13907 [2:02:14<5:53:18,  1.94s/it][A
Training...:  21% 2986/13907 [2:02:14<6:04:41,  2.00s/it][A
Training...:  21% 2987/13907 [2:02:15<5:56:22,  1.96s/it][A
Training...:  21% 2988/13907 [2:02:17<5:45:58,  1.90s/it][A
Training...:  21% 2989/13907 [2:02:19<5:36:46,  1.85s/it][A
Training...:  21% 2990/13907 [2:02:21<5:27:50,  1.80s/it][A
Training...:  22% 2991/13907 [2:02:22<5:20:07,  1.76s/it][A
Training...:  22% 2992/13907 [2:02:24<5:14:53,  1.73s/it][A
Training...:  22% 2993/13907 [2:02:26<5:09:49,  1.70s/it][A
Training...:  22% 2994/13907 [2:02:27<5:02:57,  1.67s/it][A
Training...:  22% 2995/13907 [2:02:29<4:53:10,  1.61s/it][A
Training...:  22% 2996/13907 [2:02:30<4:43:15,  1.56s/it][A
Training...:  22% 2997/13907 [2:02:31<4:33:07,  1.50s/it][A
Training...:  22% 2998/13907 [2:02:33<4:21:21,  1.44s/it][A
Training...:  22% 2999/13907 [2:02:34<4:08:32,  1.37s/it][A
Training...:  22% 3000/13907 [2:02:35<3:51:33,  1.27s/it][A
Training...:  22% 3001/13907 [2:02:39<6:07:02,  2.02s/it][A
Training...:  22% 3002/13907 [2:02:42<7:26:14,  2.46s/it][A
Training...:  22% 3003/13907 [2:02:45<8:08:43,  2.69s/it][A
Training...:  22% 3004/13907 [2:02:49<8:29:44,  2.81s/it][A
Training...:  22% 3005/13907 [2:02:52<8:40:05,  2.86s/it][A
Training...:  22% 3006/13907 [2:02:54<8:43:51,  2.88s/it][A
Training...:  22% 3007/13907 [2:02:57<8:41:42,  2.87s/it][A
Training...:  22% 3008/13907 [2:03:00<8:37:09,  2.85s/it][A
Training...:  22% 3009/13907 [2:03:03<8:30:42,  2.81s/it][A
Training...:  22% 3010/13907 [2:03:06<8:25:11,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:33:20<17:31:07, 31533.87s/it]
Training...:  22% 3010/13907 [2:03:09<8:25:11,  2.78s/it][A
Training...:  22% 3011/13907 [2:03:09<8:40:30,  2.87s/it][A
Training...:  22% 3012/13907 [2:03:11<8:32:04,  2.82s/it][A
Training...:  22% 3013/13907 [2:03:14<8:18:21,  2.74s/it][A
Training...:  22% 3014/13907 [2:03:16<8:06:03,  2.68s/it][A
Training...:  22% 3015/13907 [2:03:19<7:56:54,  2.63s/it][A
Training...:  22% 3016/13907 [2:03:21<7:48:39,  2.58s/it][A
Training...:  22% 3017/13907 [2:03:24<7:39:33,  2.53s/it][A
Training...:  22% 3018/13907 [2:03:26<7:32:37,  2.49s/it][A
Training...:  22% 3019/13907 [2:03:29<7:26:47,  2.46s/it][A
Training...:  22% 3020/13907 [2:03:31<7:20:49,  2.43s/it][A
Training...:  22% 3021/13907 [2:03:33<7:17:17,  2.41s/it][A
Training...:  22% 3022/13907 [2:03:36<7:11:18,  2.38s/it][A
Training...:  22% 3023/13907 [2:03:38<7:09:08,  2.37s/it][A
Training...:  22% 3024/13907 [2:03:40<7:02:45,  2.33s/it][A
Training...:  22% 3025/13907 [2:03:42<6:56:10,  2.29s/it][A
Training...:  22% 3026/13907 [2:03:45<6:48:44,  2.25s/it][A
Training...:  22% 3027/13907 [2:03:47<6:42:29,  2.22s/it][A
Training...:  22% 3028/13907 [2:03:49<6:35:52,  2.18s/it][A
Training...:  22% 3029/13907 [2:03:51<6:31:49,  2.16s/it][A
Training...:  22% 3030/13907 [2:03:53<6:25:38,  2.13s/it][A
Training...:  22% 3031/13907 [2:03:55<6:19:54,  2.10s/it][A
Training...:  22% 3032/13907 [2:03:57<6:14:34,  2.07s/it][A
Training...:  22% 3033/13907 [2:03:59<6:08:58,  2.04s/it][A
Training...:  22% 3034/13907 [2:04:01<6:03:21,  2.01s/it][A
Training...:  22% 3035/13907 [2:04:03<5:57:37,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:34:16<17:31:07, 31533.87s/it]
Training...:  22% 3035/13907 [2:04:05<5:57:37,  1.97s/it][A
Training...:  22% 3036/13907 [2:04:05<6:09:10,  2.04s/it][A
Training...:  22% 3037/13907 [2:04:07<6:00:30,  1.99s/it][A
Training...:  22% 3038/13907 [2:04:09<5:48:49,  1.93s/it][A
Training...:  22% 3039/13907 [2:04:10<5:38:55,  1.87s/it][A
Training...:  22% 3040/13907 [2:04:12<5:29:22,  1.82s/it][A
Training...:  22% 3041/13907 [2:04:14<5:20:49,  1.77s/it][A
Training...:  22% 3042/13907 [2:04:15<5:12:17,  1.72s/it][A
Training...:  22% 3043/13907 [2:04:17<5:04:33,  1.68s/it][A
Training...:  22% 3044/13907 [2:04:18<4:58:04,  1.65s/it][A
Training...:  22% 3045/13907 [2:04:20<4:48:57,  1.60s/it][A
Training...:  22% 3046/13907 [2:04:21<4:40:41,  1.55s/it][A
Training...:  22% 3047/13907 [2:04:23<4:31:24,  1.50s/it][A
Training...:  22% 3048/13907 [2:04:24<4:21:31,  1.45s/it][A
Training...:  22% 3049/13907 [2:04:25<4:08:44,  1.37s/it][A
Training...:  22% 3050/13907 [2:04:26<3:50:49,  1.28s/it][A
Training...:  22% 3051/13907 [2:04:30<6:09:54,  2.04s/it][A
Training...:  22% 3052/13907 [2:04:34<7:28:15,  2.48s/it][A
Training...:  22% 3053/13907 [2:04:37<8:11:49,  2.72s/it][A
Training...:  22% 3054/13907 [2:04:40<8:33:32,  2.84s/it][A
Training...:  22% 3055/13907 [2:04:43<8:42:58,  2.89s/it][A
Training...:  22% 3056/13907 [2:04:46<8:46:27,  2.91s/it][A
Training...:  22% 3057/13907 [2:04:49<8:45:26,  2.91s/it][A
Training...:  22% 3058/13907 [2:04:52<8:46:06,  2.91s/it][A
Training...:  22% 3059/13907 [2:04:55<8:42:40,  2.89s/it][A
Training...:  22% 3060/13907 [2:04:57<8:35:02,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:35:12<17:31:07, 31533.87s/it]
Training...:  22% 3060/13907 [2:05:01<8:35:02,  2.85s/it][A
Training...:  22% 3061/13907 [2:05:01<8:45:13,  2.91s/it][A
Training...:  22% 3062/13907 [2:05:03<8:31:50,  2.83s/it][A
Training...:  22% 3063/13907 [2:05:06<8:16:35,  2.75s/it][A
Training...:  22% 3064/13907 [2:05:08<8:03:16,  2.67s/it][A
Training...:  22% 3065/13907 [2:05:11<7:52:48,  2.62s/it][A
Training...:  22% 3066/13907 [2:05:13<7:43:02,  2.56s/it][A
Training...:  22% 3067/13907 [2:05:16<7:37:31,  2.53s/it][A
Training...:  22% 3068/13907 [2:05:18<7:31:54,  2.50s/it][A
Training...:  22% 3069/13907 [2:05:20<7:26:40,  2.47s/it][A
Training...:  22% 3070/13907 [2:05:23<7:17:03,  2.42s/it][A
Training...:  22% 3071/13907 [2:05:25<7:09:52,  2.38s/it][A
Training...:  22% 3072/13907 [2:05:27<7:02:11,  2.34s/it][A
Training...:  22% 3073/13907 [2:05:30<6:57:13,  2.31s/it][A
Training...:  22% 3074/13907 [2:05:32<6:51:30,  2.28s/it][A
Training...:  22% 3075/13907 [2:05:34<6:44:11,  2.24s/it][A
Training...:  22% 3076/13907 [2:05:36<6:39:47,  2.21s/it][A
Training...:  22% 3077/13907 [2:05:38<6:34:29,  2.19s/it][A
Training...:  22% 3078/13907 [2:05:40<6:29:04,  2.16s/it][A
Training...:  22% 3079/13907 [2:05:42<6:23:39,  2.13s/it][A
Training...:  22% 3080/13907 [2:05:44<6:18:35,  2.10s/it][A
Training...:  22% 3081/13907 [2:05:46<6:14:24,  2.08s/it][A
Training...:  22% 3082/13907 [2:05:48<6:08:25,  2.04s/it][A
Training...:  22% 3083/13907 [2:05:50<6:03:50,  2.02s/it][A
Training...:  22% 3084/13907 [2:05:52<5:58:56,  1.99s/it][A
Training...:  22% 3085/13907 [2:05:54<5:54:01,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:36:07<17:31:07, 31533.87s/it]
Training...:  22% 3085/13907 [2:05:56<5:54:01,  1.96s/it][A
Training...:  22% 3086/13907 [2:05:56<6:04:54,  2.02s/it][A
Training...:  22% 3087/13907 [2:05:58<5:58:28,  1.99s/it][A
Training...:  22% 3088/13907 [2:06:00<5:47:29,  1.93s/it][A
Training...:  22% 3089/13907 [2:06:02<5:38:59,  1.88s/it][A
Training...:  22% 3090/13907 [2:06:03<5:32:09,  1.84s/it][A
Training...:  22% 3091/13907 [2:06:05<5:26:05,  1.81s/it][A
Training...:  22% 3092/13907 [2:06:07<5:20:06,  1.78s/it][A
Training...:  22% 3093/13907 [2:06:09<5:13:06,  1.74s/it][A
Training...:  22% 3094/13907 [2:06:10<5:04:12,  1.69s/it][A
Training...:  22% 3095/13907 [2:06:12<4:55:24,  1.64s/it][A
Training...:  22% 3096/13907 [2:06:13<4:44:47,  1.58s/it][A
Training...:  22% 3097/13907 [2:06:14<4:34:48,  1.53s/it][A
Training...:  22% 3098/13907 [2:06:16<4:22:48,  1.46s/it][A
Training...:  22% 3099/13907 [2:06:17<4:09:51,  1.39s/it][A
Training...:  22% 3100/13907 [2:06:18<3:52:19,  1.29s/it][A
Training...:  22% 3101/13907 [2:06:22<6:06:41,  2.04s/it][A
Training...:  22% 3102/13907 [2:06:25<7:23:14,  2.46s/it][A
Training...:  22% 3103/13907 [2:06:29<8:04:14,  2.69s/it][A
Training...:  22% 3104/13907 [2:06:32<8:26:36,  2.81s/it][A
Training...:  22% 3105/13907 [2:06:35<8:36:13,  2.87s/it][A
Training...:  22% 3106/13907 [2:06:38<8:38:45,  2.88s/it][A
Training...:  22% 3107/13907 [2:06:40<8:37:30,  2.88s/it][A
Training...:  22% 3108/13907 [2:06:43<8:33:39,  2.85s/it][A
Training...:  22% 3109/13907 [2:06:46<8:30:00,  2.83s/it][A
Training...:  22% 3110/13907 [2:06:49<8:23:02,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:37:03<17:31:07, 31533.87s/it]
Training...:  22% 3110/13907 [2:06:52<8:23:02,  2.80s/it][A
Training...:  22% 3111/13907 [2:06:52<8:39:03,  2.88s/it][A
Training...:  22% 3112/13907 [2:06:55<8:30:16,  2.84s/it][A
Training...:  22% 3113/13907 [2:06:57<8:18:36,  2.77s/it][A
Training...:  22% 3114/13907 [2:07:00<8:06:26,  2.70s/it][A
Training...:  22% 3115/13907 [2:07:02<7:55:39,  2.64s/it][A
Training...:  22% 3116/13907 [2:07:05<7:46:34,  2.59s/it][A
Training...:  22% 3117/13907 [2:07:07<7:37:53,  2.55s/it][A
Training...:  22% 3118/13907 [2:07:09<7:29:12,  2.50s/it][A
Training...:  22% 3119/13907 [2:07:12<7:22:08,  2.46s/it][A
Training...:  22% 3120/13907 [2:07:14<7:17:15,  2.43s/it][A
Training...:  22% 3121/13907 [2:07:17<7:12:25,  2.41s/it][A
Training...:  22% 3122/13907 [2:07:19<7:04:24,  2.36s/it][A
Training...:  22% 3123/13907 [2:07:21<6:57:04,  2.32s/it][A
Training...:  22% 3124/13907 [2:07:23<6:49:20,  2.28s/it][A
Training...:  22% 3125/13907 [2:07:25<6:42:33,  2.24s/it][A
Training...:  22% 3126/13907 [2:07:28<6:36:51,  2.21s/it][A
Training...:  22% 3127/13907 [2:07:30<6:32:53,  2.19s/it][A
Training...:  22% 3128/13907 [2:07:32<6:26:50,  2.15s/it][A
Training...:  22% 3129/13907 [2:07:34<6:21:53,  2.13s/it][A
Training...:  23% 3130/13907 [2:07:36<6:17:07,  2.10s/it][A
Training...:  23% 3131/13907 [2:07:38<6:12:45,  2.08s/it][A
Training...:  23% 3132/13907 [2:07:40<6:05:51,  2.04s/it][A
Training...:  23% 3133/13907 [2:07:42<6:00:09,  2.01s/it][A
Training...:  23% 3134/13907 [2:07:44<5:53:42,  1.97s/it][A
Training...:  23% 3135/13907 [2:07:45<5:47:26,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:37:59<17:31:07, 31533.87s/it]
Training...:  23% 3135/13907 [2:07:48<5:47:26,  1.94s/it][A
Training...:  23% 3136/13907 [2:07:48<5:59:00,  2.00s/it][A
Training...:  23% 3137/13907 [2:07:50<5:53:18,  1.97s/it][A
Training...:  23% 3138/13907 [2:07:51<5:41:43,  1.90s/it][A
Training...:  23% 3139/13907 [2:07:53<5:33:48,  1.86s/it][A
Training...:  23% 3140/13907 [2:07:55<5:24:56,  1.81s/it][A
Training...:  23% 3141/13907 [2:07:56<5:16:38,  1.76s/it][A
Training...:  23% 3142/13907 [2:07:58<5:09:21,  1.72s/it][A
Training...:  23% 3143/13907 [2:08:00<5:02:41,  1.69s/it][A
Training...:  23% 3144/13907 [2:08:01<4:56:30,  1.65s/it][A
Training...:  23% 3145/13907 [2:08:03<4:47:40,  1.60s/it][A
Training...:  23% 3146/13907 [2:08:04<4:38:56,  1.56s/it][A
Training...:  23% 3147/13907 [2:08:05<4:28:31,  1.50s/it][A
Training...:  23% 3148/13907 [2:08:07<4:18:21,  1.44s/it][A
Training...:  23% 3149/13907 [2:08:08<4:06:21,  1.37s/it][A
Training...:  23% 3150/13907 [2:08:09<3:48:51,  1.28s/it][A
Training...:  23% 3151/13907 [2:08:13<6:00:39,  2.01s/it][A
Training...:  23% 3152/13907 [2:08:16<7:23:55,  2.48s/it][A
Training...:  23% 3153/13907 [2:08:20<8:07:27,  2.72s/it][A
Training...:  23% 3154/13907 [2:08:23<8:27:52,  2.83s/it][A
Training...:  23% 3155/13907 [2:08:26<8:38:12,  2.89s/it][A
Training...:  23% 3156/13907 [2:08:29<8:40:21,  2.90s/it][A
Training...:  23% 3157/13907 [2:08:32<8:40:32,  2.91s/it][A
Training...:  23% 3158/13907 [2:08:34<8:34:44,  2.87s/it][A
Training...:  23% 3159/13907 [2:08:37<8:29:04,  2.84s/it][A
Training...:  23% 3160/13907 [2:08:40<8:21:39,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:38:54<17:31:07, 31533.87s/it]
Training...:  23% 3160/13907 [2:08:43<8:21:39,  2.80s/it][A
Training...:  23% 3161/13907 [2:08:43<8:34:42,  2.87s/it][A
Training...:  23% 3162/13907 [2:08:46<8:24:38,  2.82s/it][A
Training...:  23% 3163/13907 [2:08:48<8:12:55,  2.75s/it][A
Training...:  23% 3164/13907 [2:08:51<8:01:56,  2.69s/it][A
Training...:  23% 3165/13907 [2:08:53<7:53:07,  2.64s/it][A
Training...:  23% 3166/13907 [2:08:56<7:45:00,  2.60s/it][A
Training...:  23% 3167/13907 [2:08:58<7:35:14,  2.54s/it][A
Training...:  23% 3168/13907 [2:09:01<7:29:03,  2.51s/it][A
Training...:  23% 3169/13907 [2:09:03<7:21:10,  2.47s/it][A
Training...:  23% 3170/13907 [2:09:05<7:14:57,  2.43s/it][A
Training...:  23% 3171/13907 [2:09:08<7:09:18,  2.40s/it][A
Training...:  23% 3172/13907 [2:09:10<7:02:29,  2.36s/it][A
Training...:  23% 3173/13907 [2:09:12<6:55:20,  2.32s/it][A
Training...:  23% 3174/13907 [2:09:14<6:49:42,  2.29s/it][A
Training...:  23% 3175/13907 [2:09:17<6:42:54,  2.25s/it][A
Training...:  23% 3176/13907 [2:09:19<6:36:11,  2.22s/it][A
Training...:  23% 3177/13907 [2:09:21<6:30:30,  2.18s/it][A
Training...:  23% 3178/13907 [2:09:23<6:24:26,  2.15s/it][A
Training...:  23% 3179/13907 [2:09:25<6:19:45,  2.12s/it][A
Training...:  23% 3180/13907 [2:09:27<6:14:54,  2.10s/it][A
Training...:  23% 3181/13907 [2:09:29<6:12:28,  2.08s/it][A
Training...:  23% 3182/13907 [2:09:31<6:09:42,  2.07s/it][A
Training...:  23% 3183/13907 [2:09:33<6:04:42,  2.04s/it][A
Training...:  23% 3184/13907 [2:09:35<5:57:36,  2.00s/it][A
Training...:  23% 3185/13907 [2:09:37<5:51:17,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:39:50<17:31:07, 31533.87s/it]
Training...:  23% 3185/13907 [2:09:39<5:51:17,  1.97s/it][A
Training...:  23% 3186/13907 [2:09:39<6:02:12,  2.03s/it][A
Training...:  23% 3187/13907 [2:09:41<5:54:49,  1.99s/it][A
Training...:  23% 3188/13907 [2:09:43<5:43:41,  1.92s/it][A
Training...:  23% 3189/13907 [2:09:44<5:34:13,  1.87s/it][A
Training...:  23% 3190/13907 [2:09:46<5:26:26,  1.83s/it][A
Training...:  23% 3191/13907 [2:09:48<5:18:49,  1.79s/it][A
Training...:  23% 3192/13907 [2:09:49<5:11:10,  1.74s/it][A
Training...:  23% 3193/13907 [2:09:51<5:03:28,  1.70s/it][A
Training...:  23% 3194/13907 [2:09:53<4:55:41,  1.66s/it][A
Training...:  23% 3195/13907 [2:09:54<4:49:16,  1.62s/it][A
Training...:  23% 3196/13907 [2:09:56<4:41:04,  1.57s/it][A
Training...:  23% 3197/13907 [2:09:57<4:31:06,  1.52s/it][A
Training...:  23% 3198/13907 [2:09:58<4:20:43,  1.46s/it][A
Training...:  23% 3199/13907 [2:10:00<4:08:29,  1.39s/it][A
Training...:  23% 3200/13907 [2:10:01<3:50:17,  1.29s/it][A
Training...:  23% 3201/13907 [2:10:04<5:58:26,  2.01s/it][A
Training...:  23% 3202/13907 [2:10:08<7:16:18,  2.45s/it][A
Training...:  23% 3203/13907 [2:10:11<7:59:47,  2.69s/it][A
Training...:  23% 3204/13907 [2:10:14<8:22:06,  2.81s/it][A
Training...:  23% 3205/13907 [2:10:17<8:35:10,  2.89s/it][A
Training...:  23% 3206/13907 [2:10:20<8:37:41,  2.90s/it][A
Training...:  23% 3207/13907 [2:10:23<8:35:21,  2.89s/it][A
Training...:  23% 3208/13907 [2:10:26<8:30:54,  2.87s/it][A
Training...:  23% 3209/13907 [2:10:28<8:23:35,  2.82s/it][A
Training...:  23% 3210/13907 [2:10:31<8:17:39,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:40:45<17:31:07, 31533.87s/it]
Training...:  23% 3210/13907 [2:10:34<8:17:39,  2.79s/it][A
Training...:  23% 3211/13907 [2:10:34<8:31:58,  2.87s/it][A
Training...:  23% 3212/13907 [2:10:37<8:23:56,  2.83s/it][A
Training...:  23% 3213/13907 [2:10:40<8:13:51,  2.77s/it][A
Training...:  23% 3214/13907 [2:10:42<7:59:37,  2.69s/it][A
Training...:  23% 3215/13907 [2:10:45<7:48:48,  2.63s/it][A
Training...:  23% 3216/13907 [2:10:47<7:39:31,  2.58s/it][A
Training...:  23% 3217/13907 [2:10:50<7:32:19,  2.54s/it][A
Training...:  23% 3218/13907 [2:10:52<7:23:26,  2.49s/it][A
Training...:  23% 3219/13907 [2:10:54<7:15:39,  2.45s/it][A
Training...:  23% 3220/13907 [2:10:57<7:09:04,  2.41s/it][A
Training...:  23% 3221/13907 [2:10:59<7:01:33,  2.37s/it][A
Training...:  23% 3222/13907 [2:11:01<6:55:39,  2.33s/it][A
Training...:  23% 3223/13907 [2:11:03<6:48:53,  2.30s/it][A
Training...:  23% 3224/13907 [2:11:05<6:41:09,  2.25s/it][A
Training...:  23% 3225/13907 [2:11:08<6:34:41,  2.22s/it][A
Training...:  23% 3226/13907 [2:11:10<6:29:09,  2.19s/it][A
Training...:  23% 3227/13907 [2:11:12<6:23:16,  2.15s/it][A
Training...:  23% 3228/13907 [2:11:14<6:18:09,  2.12s/it][A
Training...:  23% 3229/13907 [2:11:16<6:13:19,  2.10s/it][A
Training...:  23% 3230/13907 [2:11:18<6:07:42,  2.07s/it][A
Training...:  23% 3231/13907 [2:11:20<6:03:16,  2.04s/it][A
Training...:  23% 3232/13907 [2:11:22<5:58:23,  2.01s/it][A
Training...:  23% 3233/13907 [2:11:24<5:54:34,  1.99s/it][A
Training...:  23% 3234/13907 [2:11:26<5:48:44,  1.96s/it][A
Training...:  23% 3235/13907 [2:11:27<5:43:06,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:41:41<17:31:07, 31533.87s/it]
Training...:  23% 3235/13907 [2:11:30<5:43:06,  1.93s/it][A
Training...:  23% 3236/13907 [2:11:30<5:55:05,  2.00s/it][A
Training...:  23% 3237/13907 [2:11:32<5:49:24,  1.96s/it][A
Training...:  23% 3238/13907 [2:11:33<5:39:19,  1.91s/it][A
Training...:  23% 3239/13907 [2:11:35<5:30:26,  1.86s/it][A
Training...:  23% 3240/13907 [2:11:37<5:22:34,  1.81s/it][A
Training...:  23% 3241/13907 [2:11:38<5:14:24,  1.77s/it][A
Training...:  23% 3242/13907 [2:11:40<5:06:59,  1.73s/it][A
Training...:  23% 3243/13907 [2:11:42<4:59:13,  1.68s/it][A
Training...:  23% 3244/13907 [2:11:43<4:52:01,  1.64s/it][A
Training...:  23% 3245/13907 [2:11:45<4:43:19,  1.59s/it][A
Training...:  23% 3246/13907 [2:11:46<4:35:19,  1.55s/it][A
Training...:  23% 3247/13907 [2:11:47<4:25:12,  1.49s/it][A
Training...:  23% 3248/13907 [2:11:49<4:14:58,  1.44s/it][A
Training...:  23% 3249/13907 [2:11:50<4:02:33,  1.37s/it][A
Training...:  23% 3250/13907 [2:11:51<3:42:40,  1.25s/it][A
Training...:  23% 3251/13907 [2:11:55<5:54:17,  1.99s/it][A
Training...:  23% 3252/13907 [2:11:58<7:17:48,  2.47s/it][A
Training...:  23% 3253/13907 [2:12:02<8:01:09,  2.71s/it][A
Training...:  23% 3254/13907 [2:12:05<8:32:50,  2.89s/it][A
Training...:  23% 3255/13907 [2:12:08<8:44:26,  2.95s/it][A
Training...:  23% 3256/13907 [2:12:11<8:46:33,  2.97s/it][A
Training...:  23% 3257/13907 [2:12:14<8:42:18,  2.94s/it][A
Training...:  23% 3258/13907 [2:12:17<8:37:20,  2.91s/it][A
Training...:  23% 3259/13907 [2:12:19<8:31:00,  2.88s/it][A
Training...:  23% 3260/13907 [2:12:22<8:20:54,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:42:36<17:31:07, 31533.87s/it]
Training...:  23% 3260/13907 [2:12:25<8:20:54,  2.82s/it][A
Training...:  23% 3261/13907 [2:12:25<8:33:44,  2.90s/it][A
Training...:  23% 3262/13907 [2:12:28<8:22:06,  2.83s/it][A
Training...:  23% 3263/13907 [2:12:30<8:08:20,  2.75s/it][A
Training...:  23% 3264/13907 [2:12:33<7:55:22,  2.68s/it][A
Training...:  23% 3265/13907 [2:12:35<7:45:18,  2.62s/it][A
Training...:  23% 3266/13907 [2:12:38<7:34:36,  2.56s/it][A
Training...:  23% 3267/13907 [2:12:40<7:26:39,  2.52s/it][A
Training...:  23% 3268/13907 [2:12:43<7:19:13,  2.48s/it][A
Training...:  24% 3269/13907 [2:12:45<7:11:28,  2.43s/it][A
Training...:  24% 3270/13907 [2:12:47<7:05:12,  2.40s/it][A
Training...:  24% 3271/13907 [2:12:50<6:59:37,  2.37s/it][A
Training...:  24% 3272/13907 [2:12:52<6:55:17,  2.34s/it][A
Training...:  24% 3273/13907 [2:12:54<6:49:38,  2.31s/it][A
Training...:  24% 3274/13907 [2:12:56<6:44:16,  2.28s/it][A
Training...:  24% 3275/13907 [2:12:59<6:38:50,  2.25s/it][A
Training...:  24% 3276/13907 [2:13:01<6:32:52,  2.22s/it][A
Training...:  24% 3277/13907 [2:13:03<6:26:04,  2.18s/it][A
Training...:  24% 3278/13907 [2:13:05<6:20:59,  2.15s/it][A
Training...:  24% 3279/13907 [2:13:07<6:14:51,  2.12s/it][A
Training...:  24% 3280/13907 [2:13:09<6:09:07,  2.08s/it][A
Training...:  24% 3281/13907 [2:13:11<6:03:56,  2.05s/it][A
Training...:  24% 3282/13907 [2:13:13<5:58:37,  2.03s/it][A
Training...:  24% 3283/13907 [2:13:15<5:52:35,  1.99s/it][A
Training...:  24% 3284/13907 [2:13:17<5:46:57,  1.96s/it][A
Training...:  24% 3285/13907 [2:13:19<5:42:44,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:43:32<17:31:07, 31533.87s/it]
Training...:  24% 3285/13907 [2:13:21<5:42:44,  1.94s/it][A
Training...:  24% 3286/13907 [2:13:21<5:55:33,  2.01s/it][A
Training...:  24% 3287/13907 [2:13:23<5:49:43,  1.98s/it][A
Training...:  24% 3288/13907 [2:13:24<5:39:22,  1.92s/it][A
Training...:  24% 3289/13907 [2:13:26<5:29:06,  1.86s/it][A
Training...:  24% 3290/13907 [2:13:28<5:20:13,  1.81s/it][A
Training...:  24% 3291/13907 [2:13:29<5:12:07,  1.76s/it][A
Training...:  24% 3292/13907 [2:13:31<5:04:22,  1.72s/it][A
Training...:  24% 3293/13907 [2:13:33<4:56:13,  1.67s/it][A
Training...:  24% 3294/13907 [2:13:34<4:49:32,  1.64s/it][A
Training...:  24% 3295/13907 [2:13:36<4:41:20,  1.59s/it][A
Training...:  24% 3296/13907 [2:13:37<4:33:21,  1.55s/it][A
Training...:  24% 3297/13907 [2:13:38<4:23:23,  1.49s/it][A
Training...:  24% 3298/13907 [2:13:40<4:13:03,  1.43s/it][A
Training...:  24% 3299/13907 [2:13:41<4:01:34,  1.37s/it][A
Training...:  24% 3300/13907 [2:13:42<3:45:07,  1.27s/it][A
Training...:  24% 3301/13907 [2:13:46<5:50:33,  1.98s/it][A
Training...:  24% 3302/13907 [2:13:49<7:06:59,  2.42s/it][A
Training...:  24% 3303/13907 [2:13:52<7:47:48,  2.65s/it][A
Training...:  24% 3304/13907 [2:13:55<8:11:21,  2.78s/it][A
Training...:  24% 3305/13907 [2:13:58<8:23:28,  2.85s/it][A
Training...:  24% 3306/13907 [2:14:01<8:27:45,  2.87s/it][A
Training...:  24% 3307/13907 [2:14:04<8:27:21,  2.87s/it][A
Training...:  24% 3308/13907 [2:14:07<8:24:56,  2.86s/it][A
Training...:  24% 3309/13907 [2:14:10<8:19:34,  2.83s/it][A
Training...:  24% 3310/13907 [2:14:13<8:13:37,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:44:27<17:31:07, 31533.87s/it]
Training...:  24% 3310/13907 [2:14:16<8:13:37,  2.79s/it][A
Training...:  24% 3311/13907 [2:14:16<8:28:44,  2.88s/it][A
Training...:  24% 3312/13907 [2:14:18<8:19:41,  2.83s/it][A
Training...:  24% 3313/13907 [2:14:21<8:06:08,  2.75s/it][A
Training...:  24% 3314/13907 [2:14:23<7:54:03,  2.69s/it][A
Training...:  24% 3315/13907 [2:14:26<7:44:08,  2.63s/it][A
Training...:  24% 3316/13907 [2:14:28<7:37:47,  2.59s/it][A
Training...:  24% 3317/13907 [2:14:31<7:29:25,  2.55s/it][A
Training...:  24% 3318/13907 [2:14:33<7:21:38,  2.50s/it][A
Training...:  24% 3319/13907 [2:14:36<7:13:23,  2.46s/it][A
Training...:  24% 3320/13907 [2:14:38<7:06:02,  2.41s/it][A
Training...:  24% 3321/13907 [2:14:40<6:59:17,  2.38s/it][A
Training...:  24% 3322/13907 [2:14:42<6:52:22,  2.34s/it][A
Training...:  24% 3323/13907 [2:14:45<6:46:54,  2.31s/it][A
Training...:  24% 3324/13907 [2:14:47<6:41:22,  2.28s/it][A
Training...:  24% 3325/13907 [2:14:49<6:35:06,  2.24s/it][A
Training...:  24% 3326/13907 [2:14:51<6:30:48,  2.22s/it][A
Training...:  24% 3327/13907 [2:14:53<6:26:29,  2.19s/it][A
Training...:  24% 3328/13907 [2:14:55<6:20:33,  2.16s/it][A
Training...:  24% 3329/13907 [2:14:57<6:14:31,  2.12s/it][A
Training...:  24% 3330/13907 [2:14:59<6:08:20,  2.09s/it][A
Training...:  24% 3331/13907 [2:15:01<6:02:45,  2.06s/it][A
Training...:  24% 3332/13907 [2:15:03<5:57:11,  2.03s/it][A
Training...:  24% 3333/13907 [2:15:05<5:51:02,  1.99s/it][A
Training...:  24% 3334/13907 [2:15:07<5:44:32,  1.96s/it][A
Training...:  24% 3335/13907 [2:15:09<5:39:40,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:45:22<17:31:07, 31533.87s/it]
Training...:  24% 3335/13907 [2:15:11<5:39:40,  1.93s/it][A
Training...:  24% 3336/13907 [2:15:11<5:50:28,  1.99s/it][A
Training...:  24% 3337/13907 [2:15:13<5:43:37,  1.95s/it][A
Training...:  24% 3338/13907 [2:15:15<5:32:48,  1.89s/it][A
Training...:  24% 3339/13907 [2:15:17<5:24:31,  1.84s/it][A
Training...:  24% 3340/13907 [2:15:18<5:17:14,  1.80s/it][A
Training...:  24% 3341/13907 [2:15:20<5:09:36,  1.76s/it][A
Training...:  24% 3342/13907 [2:15:22<5:01:58,  1.71s/it][A
Training...:  24% 3343/13907 [2:15:23<4:54:58,  1.68s/it][A
Training...:  24% 3344/13907 [2:15:25<4:48:41,  1.64s/it][A
Training...:  24% 3345/13907 [2:15:26<4:40:09,  1.59s/it][A
Training...:  24% 3346/13907 [2:15:28<4:32:18,  1.55s/it][A
Training...:  24% 3347/13907 [2:15:29<4:23:20,  1.50s/it][A
Training...:  24% 3348/13907 [2:15:30<4:13:21,  1.44s/it][A
Training...:  24% 3349/13907 [2:15:31<4:02:21,  1.38s/it][A
Training...:  24% 3350/13907 [2:15:33<3:46:08,  1.29s/it][A
Training...:  24% 3351/13907 [2:15:36<5:53:29,  2.01s/it][A
Training...:  24% 3352/13907 [2:15:40<7:13:26,  2.46s/it][A
Training...:  24% 3353/13907 [2:15:43<7:53:22,  2.69s/it][A
Training...:  24% 3354/13907 [2:15:46<8:14:48,  2.81s/it][A
Training...:  24% 3355/13907 [2:15:49<8:25:54,  2.88s/it][A
Training...:  24% 3356/13907 [2:15:52<8:27:52,  2.89s/it][A
Training...:  24% 3357/13907 [2:15:55<8:29:46,  2.90s/it][A
Training...:  24% 3358/13907 [2:15:58<8:26:58,  2.88s/it][A
Training...:  24% 3359/13907 [2:16:01<8:21:15,  2.85s/it][A
Training...:  24% 3360/13907 [2:16:03<8:14:51,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:46:17<17:31:07, 31533.87s/it]
Training...:  24% 3360/13907 [2:16:06<8:14:51,  2.82s/it][A
Training...:  24% 3361/13907 [2:16:06<8:29:47,  2.90s/it][A
Training...:  24% 3362/13907 [2:16:09<8:20:54,  2.85s/it][A
Training...:  24% 3363/13907 [2:16:12<8:07:52,  2.78s/it][A
Training...:  24% 3364/13907 [2:16:14<7:58:33,  2.72s/it][A
Training...:  24% 3365/13907 [2:16:17<7:52:40,  2.69s/it][A
Training...:  24% 3366/13907 [2:16:19<7:44:10,  2.64s/it][A
Training...:  24% 3367/13907 [2:16:22<7:34:07,  2.59s/it][A
Training...:  24% 3368/13907 [2:16:24<7:23:52,  2.53s/it][A
Training...:  24% 3369/13907 [2:16:27<7:16:17,  2.48s/it][A
Training...:  24% 3370/13907 [2:16:29<7:08:27,  2.44s/it][A
Training...:  24% 3371/13907 [2:16:31<7:03:27,  2.41s/it][A
Training...:  24% 3372/13907 [2:16:34<6:57:47,  2.38s/it][A
Training...:  24% 3373/13907 [2:16:36<6:52:48,  2.35s/it][A
Training...:  24% 3374/13907 [2:16:38<6:44:58,  2.31s/it][A
Training...:  24% 3375/13907 [2:16:40<6:38:55,  2.27s/it][A
Training...:  24% 3376/13907 [2:16:43<6:32:46,  2.24s/it][A
Training...:  24% 3377/13907 [2:16:45<6:26:50,  2.20s/it][A
Training...:  24% 3378/13907 [2:16:47<6:20:49,  2.17s/it][A
Training...:  24% 3379/13907 [2:16:49<6:16:21,  2.14s/it][A
Training...:  24% 3380/13907 [2:16:51<6:10:06,  2.11s/it][A
Training...:  24% 3381/13907 [2:16:53<6:05:17,  2.08s/it][A
Training...:  24% 3382/13907 [2:16:55<6:00:04,  2.05s/it][A
Training...:  24% 3383/13907 [2:16:57<5:55:58,  2.03s/it][A
Training...:  24% 3384/13907 [2:16:59<5:50:49,  2.00s/it][A
Training...:  24% 3385/13907 [2:17:01<5:45:00,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:47:14<17:31:07, 31533.87s/it]
Training...:  24% 3385/13907 [2:17:03<5:45:00,  1.97s/it][A
Training...:  24% 3386/13907 [2:17:03<5:57:08,  2.04s/it][A
Training...:  24% 3387/13907 [2:17:05<5:50:41,  2.00s/it][A
Training...:  24% 3388/13907 [2:17:07<5:41:37,  1.95s/it][A
Training...:  24% 3389/13907 [2:17:08<5:32:12,  1.90s/it][A
Training...:  24% 3390/13907 [2:17:10<5:25:04,  1.85s/it][A
Training...:  24% 3391/13907 [2:17:12<5:18:10,  1.82s/it][A
Training...:  24% 3392/13907 [2:17:14<5:12:08,  1.78s/it][A
Training...:  24% 3393/13907 [2:17:15<5:06:44,  1.75s/it][A
Training...:  24% 3394/13907 [2:17:17<4:59:09,  1.71s/it][A
Training...:  24% 3395/13907 [2:17:18<4:51:29,  1.66s/it][A
Training...:  24% 3396/13907 [2:17:20<4:41:58,  1.61s/it][A
Training...:  24% 3397/13907 [2:17:21<4:30:40,  1.55s/it][A
Training...:  24% 3398/13907 [2:17:23<4:20:53,  1.49s/it][A
Training...:  24% 3399/13907 [2:17:24<4:08:45,  1.42s/it][A
Training...:  24% 3400/13907 [2:17:25<3:52:42,  1.33s/it][A
Training...:  24% 3401/13907 [2:17:29<5:52:12,  2.01s/it][A
Training...:  24% 3402/13907 [2:17:32<7:07:29,  2.44s/it][A
Training...:  24% 3403/13907 [2:17:35<7:48:03,  2.67s/it][A
Training...:  24% 3404/13907 [2:17:38<8:10:02,  2.80s/it][A
Training...:  24% 3405/13907 [2:17:41<8:24:14,  2.88s/it][A
Training...:  24% 3406/13907 [2:17:44<8:30:19,  2.92s/it][A
Training...:  24% 3407/13907 [2:17:47<8:30:23,  2.92s/it][A
Training...:  25% 3408/13907 [2:17:50<8:26:56,  2.90s/it][A
Training...:  25% 3409/13907 [2:17:53<8:19:55,  2.86s/it][A
Training...:  25% 3410/13907 [2:17:56<8:09:50,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:48:10<17:31:07, 31533.87s/it]
Training...:  25% 3410/13907 [2:17:59<8:09:50,  2.80s/it][A
Training...:  25% 3411/13907 [2:17:59<8:22:20,  2.87s/it][A
Training...:  25% 3412/13907 [2:18:01<8:11:50,  2.81s/it][A
Training...:  25% 3413/13907 [2:18:04<7:58:38,  2.74s/it][A
Training...:  25% 3414/13907 [2:18:06<7:47:20,  2.67s/it][A
Training...:  25% 3415/13907 [2:18:09<7:37:10,  2.61s/it][A
Training...:  25% 3416/13907 [2:18:11<7:33:37,  2.59s/it][A
Training...:  25% 3417/13907 [2:18:14<7:24:15,  2.54s/it][A
Training...:  25% 3418/13907 [2:18:16<7:17:31,  2.50s/it][A
Training...:  25% 3419/13907 [2:18:19<7:10:53,  2.47s/it][A
Training...:  25% 3420/13907 [2:18:21<7:04:07,  2.43s/it][A
Training...:  25% 3421/13907 [2:18:23<6:58:42,  2.40s/it][A
Training...:  25% 3422/13907 [2:18:26<6:52:23,  2.36s/it][A
Training...:  25% 3423/13907 [2:18:28<6:45:11,  2.32s/it][A
Training...:  25% 3424/13907 [2:18:30<6:38:36,  2.28s/it][A
Training...:  25% 3425/13907 [2:18:32<6:34:45,  2.26s/it][A
Training...:  25% 3426/13907 [2:18:34<6:29:25,  2.23s/it][A
Training...:  25% 3427/13907 [2:18:37<6:24:28,  2.20s/it][A
Training...:  25% 3428/13907 [2:18:39<6:19:37,  2.17s/it][A
Training...:  25% 3429/13907 [2:18:41<6:16:41,  2.16s/it][A
Training...:  25% 3430/13907 [2:18:43<6:09:27,  2.12s/it][A
Training...:  25% 3431/13907 [2:18:45<6:03:26,  2.08s/it][A
Training...:  25% 3432/13907 [2:18:47<5:58:08,  2.05s/it][A
Training...:  25% 3433/13907 [2:18:49<5:53:16,  2.02s/it][A
Training...:  25% 3434/13907 [2:18:51<5:46:54,  1.99s/it][A
Training...:  25% 3435/13907 [2:18:53<5:41:53,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:49:06<17:31:07, 31533.87s/it]
Training...:  25% 3435/13907 [2:18:55<5:41:53,  1.96s/it][A
Training...:  25% 3436/13907 [2:18:55<5:56:05,  2.04s/it][A
Training...:  25% 3437/13907 [2:18:57<5:50:31,  2.01s/it][A
Training...:  25% 3438/13907 [2:18:58<5:37:56,  1.94s/it][A
Training...:  25% 3439/13907 [2:19:00<5:27:39,  1.88s/it][A
Training...:  25% 3440/13907 [2:19:02<5:17:56,  1.82s/it][A
Training...:  25% 3441/13907 [2:19:04<5:09:36,  1.77s/it][A
Training...:  25% 3442/13907 [2:19:05<5:02:31,  1.73s/it][A
Training...:  25% 3443/13907 [2:19:07<4:54:31,  1.69s/it][A
Training...:  25% 3444/13907 [2:19:08<4:47:45,  1.65s/it][A
Training...:  25% 3445/13907 [2:19:10<4:39:36,  1.60s/it][A
Training...:  25% 3446/13907 [2:19:11<4:31:25,  1.56s/it][A
Training...:  25% 3447/13907 [2:19:13<4:21:26,  1.50s/it][A
Training...:  25% 3448/13907 [2:19:14<4:10:36,  1.44s/it][A
Training...:  25% 3449/13907 [2:19:15<3:58:43,  1.37s/it][A
Training...:  25% 3450/13907 [2:19:16<3:40:22,  1.26s/it][A
Training...:  25% 3451/13907 [2:19:20<5:46:19,  1.99s/it][A
Training...:  25% 3452/13907 [2:19:23<7:03:50,  2.43s/it][A
Training...:  25% 3453/13907 [2:19:27<7:43:09,  2.66s/it][A
Training...:  25% 3454/13907 [2:19:30<8:06:37,  2.79s/it][A
Training...:  25% 3455/13907 [2:19:33<8:19:19,  2.87s/it][A
Training...:  25% 3456/13907 [2:19:36<8:23:40,  2.89s/it][A
Training...:  25% 3457/13907 [2:19:38<8:22:55,  2.89s/it][A
Training...:  25% 3458/13907 [2:19:41<8:19:24,  2.87s/it][A
Training...:  25% 3459/13907 [2:19:44<8:13:14,  2.83s/it][A
Training...:  25% 3460/13907 [2:19:47<8:04:14,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:50:01<17:31:07, 31533.87s/it]
Training...:  25% 3460/13907 [2:19:50<8:04:14,  2.78s/it][A
Training...:  25% 3461/13907 [2:19:50<8:17:39,  2.86s/it][A
Training...:  25% 3462/13907 [2:19:52<8:08:34,  2.81s/it][A
Training...:  25% 3463/13907 [2:19:55<7:55:31,  2.73s/it][A
Training...:  25% 3464/13907 [2:19:57<7:43:36,  2.66s/it][A
Training...:  25% 3465/13907 [2:20:00<7:33:29,  2.61s/it][A
Training...:  25% 3466/13907 [2:20:02<7:26:14,  2.56s/it][A
Training...:  25% 3467/13907 [2:20:05<7:18:45,  2.52s/it][A
Training...:  25% 3468/13907 [2:20:07<7:14:44,  2.50s/it][A
Training...:  25% 3469/13907 [2:20:10<7:10:09,  2.47s/it][A
Training...:  25% 3470/13907 [2:20:12<7:03:23,  2.43s/it][A
Training...:  25% 3471/13907 [2:20:14<6:59:06,  2.41s/it][A
Training...:  25% 3472/13907 [2:20:17<6:54:23,  2.38s/it][A
Training...:  25% 3473/13907 [2:20:19<6:48:05,  2.35s/it][A
Training...:  25% 3474/13907 [2:20:21<6:41:55,  2.31s/it][A
Training...:  25% 3475/13907 [2:20:23<6:35:58,  2.28s/it][A
Training...:  25% 3476/13907 [2:20:26<6:30:12,  2.24s/it][A
Training...:  25% 3477/13907 [2:20:28<6:25:28,  2.22s/it][A
Training...:  25% 3478/13907 [2:20:30<6:21:06,  2.19s/it][A
Training...:  25% 3479/13907 [2:20:32<6:15:47,  2.16s/it][A
Training...:  25% 3480/13907 [2:20:34<6:10:18,  2.13s/it][A
Training...:  25% 3481/13907 [2:20:36<6:07:41,  2.12s/it][A
Training...:  25% 3482/13907 [2:20:38<6:01:32,  2.08s/it][A
Training...:  25% 3483/13907 [2:20:40<5:58:55,  2.07s/it][A
Training...:  25% 3484/13907 [2:20:42<5:54:23,  2.04s/it][A
Training...:  25% 3485/13907 [2:20:44<5:50:00,  2.02s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:50:57<17:31:07, 31533.87s/it]
Training...:  25% 3485/13907 [2:20:46<5:50:00,  2.02s/it][A
Training...:  25% 3486/13907 [2:20:46<6:00:10,  2.07s/it][A
Training...:  25% 3487/13907 [2:20:48<5:52:49,  2.03s/it][A
Training...:  25% 3488/13907 [2:20:50<5:40:24,  1.96s/it][A
Training...:  25% 3489/13907 [2:20:52<5:30:31,  1.90s/it][A
Training...:  25% 3490/13907 [2:20:54<5:22:08,  1.86s/it][A
Training...:  25% 3491/13907 [2:20:55<5:13:08,  1.80s/it][A
Training...:  25% 3492/13907 [2:20:57<5:04:13,  1.75s/it][A
Training...:  25% 3493/13907 [2:20:58<4:57:16,  1.71s/it][A
Training...:  25% 3494/13907 [2:21:00<4:50:48,  1.68s/it][A
Training...:  25% 3495/13907 [2:21:02<4:44:08,  1.64s/it][A
Training...:  25% 3496/13907 [2:21:03<4:34:16,  1.58s/it][A
Training...:  25% 3497/13907 [2:21:04<4:24:12,  1.52s/it][A
Training...:  25% 3498/13907 [2:21:06<4:14:07,  1.46s/it][A
Training...:  25% 3499/13907 [2:21:07<4:01:42,  1.39s/it][A
Training...:  25% 3500/13907 [2:21:08<3:45:21,  1.30s/it][A
Training...:  25% 3501/13907 [2:21:12<5:53:51,  2.04s/it][A
Training...:  25% 3502/13907 [2:21:15<7:07:47,  2.47s/it][A
Training...:  25% 3503/13907 [2:21:19<7:45:56,  2.69s/it][A
Training...:  25% 3504/13907 [2:21:22<8:06:57,  2.81s/it][A
Training...:  25% 3505/13907 [2:21:25<8:17:04,  2.87s/it][A
Training...:  25% 3506/13907 [2:21:28<8:19:21,  2.88s/it][A
Training...:  25% 3507/13907 [2:21:30<8:17:47,  2.87s/it][A
Training...:  25% 3508/13907 [2:21:33<8:12:23,  2.84s/it][A
Training...:  25% 3509/13907 [2:21:36<8:06:38,  2.81s/it][A
Training...:  25% 3510/13907 [2:21:39<7:58:40,  2.76s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:51:53<17:31:07, 31533.87s/it]
Training...:  25% 3510/13907 [2:21:42<7:58:40,  2.76s/it][A
Training...:  25% 3511/13907 [2:21:42<8:14:20,  2.85s/it][A
Training...:  25% 3512/13907 [2:21:44<8:05:48,  2.80s/it][A
Training...:  25% 3513/13907 [2:21:47<7:52:15,  2.73s/it][A
Training...:  25% 3514/13907 [2:21:49<7:41:50,  2.67s/it][A
Training...:  25% 3515/13907 [2:21:52<7:32:59,  2.62s/it][A
Training...:  25% 3516/13907 [2:21:54<7:24:32,  2.57s/it][A
Training...:  25% 3517/13907 [2:21:57<7:16:52,  2.52s/it][A
Training...:  25% 3518/13907 [2:21:59<7:12:07,  2.50s/it][A
Training...:  25% 3519/13907 [2:22:02<7:05:52,  2.46s/it][A
Training...:  25% 3520/13907 [2:22:04<7:01:53,  2.44s/it][A
Training...:  25% 3521/13907 [2:22:06<6:57:22,  2.41s/it][A
Training...:  25% 3522/13907 [2:22:09<6:50:15,  2.37s/it][A
Training...:  25% 3523/13907 [2:22:11<6:45:23,  2.34s/it][A
Training...:  25% 3524/13907 [2:22:13<6:42:25,  2.33s/it][A
Training...:  25% 3525/13907 [2:22:15<6:37:29,  2.30s/it][A
Training...:  25% 3526/13907 [2:22:18<6:32:59,  2.27s/it][A
Training...:  25% 3527/13907 [2:22:20<6:28:29,  2.25s/it][A
Training...:  25% 3528/13907 [2:22:22<6:23:22,  2.22s/it][A
Training...:  25% 3529/13907 [2:22:24<6:18:22,  2.19s/it][A
Training...:  25% 3530/13907 [2:22:26<6:14:39,  2.17s/it][A
Training...:  25% 3531/13907 [2:22:28<6:08:49,  2.13s/it][A
Training...:  25% 3532/13907 [2:22:30<6:03:05,  2.10s/it][A
Training...:  25% 3533/13907 [2:22:32<5:59:25,  2.08s/it][A
Training...:  25% 3534/13907 [2:22:34<5:55:29,  2.06s/it][A
Training...:  25% 3535/13907 [2:22:36<5:50:39,  2.03s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:52:49<17:31:07, 31533.87s/it]
Training...:  25% 3535/13907 [2:22:38<5:50:39,  2.03s/it][A
Training...:  25% 3536/13907 [2:22:38<6:03:16,  2.10s/it][A
Training...:  25% 3537/13907 [2:22:40<5:54:42,  2.05s/it][A
Training...:  25% 3538/13907 [2:22:42<5:41:10,  1.97s/it][A
Training...:  25% 3539/13907 [2:22:44<5:31:27,  1.92s/it][A
Training...:  25% 3540/13907 [2:22:46<5:21:15,  1.86s/it][A
Training...:  25% 3541/13907 [2:22:47<5:13:00,  1.81s/it][A
Training...:  25% 3542/13907 [2:22:49<5:06:12,  1.77s/it][A
Training...:  25% 3543/13907 [2:22:51<4:58:20,  1.73s/it][A
Training...:  25% 3544/13907 [2:22:52<4:50:15,  1.68s/it][A
Training...:  25% 3545/13907 [2:22:54<4:43:43,  1.64s/it][A
Training...:  25% 3546/13907 [2:22:55<4:34:07,  1.59s/it][A
Training...:  26% 3547/13907 [2:22:57<4:24:09,  1.53s/it][A
Training...:  26% 3548/13907 [2:22:58<4:12:37,  1.46s/it][A
Training...:  26% 3549/13907 [2:22:59<3:59:44,  1.39s/it][A
Training...:  26% 3550/13907 [2:23:00<3:43:03,  1.29s/it][A
Training...:  26% 3551/13907 [2:23:04<5:52:28,  2.04s/it][A
Training...:  26% 3552/13907 [2:23:08<7:06:41,  2.47s/it][A
Training...:  26% 3553/13907 [2:23:11<7:46:47,  2.70s/it][A
Training...:  26% 3554/13907 [2:23:14<8:06:24,  2.82s/it][A
Training...:  26% 3555/13907 [2:23:17<8:17:49,  2.89s/it][A
Training...:  26% 3556/13907 [2:23:20<8:21:47,  2.91s/it][A
Training...:  26% 3557/13907 [2:23:23<8:19:15,  2.89s/it][A
Training...:  26% 3558/13907 [2:23:26<8:13:30,  2.86s/it][A
Training...:  26% 3559/13907 [2:23:28<8:06:40,  2.82s/it][A
Training...:  26% 3560/13907 [2:23:31<7:59:28,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:53:45<17:31:07, 31533.87s/it]
Training...:  26% 3560/13907 [2:23:34<7:59:28,  2.78s/it][A
Training...:  26% 3561/13907 [2:23:34<8:14:22,  2.87s/it][A
Training...:  26% 3562/13907 [2:23:37<8:06:05,  2.82s/it][A
Training...:  26% 3563/13907 [2:23:39<7:55:35,  2.76s/it][A
Training...:  26% 3564/13907 [2:23:42<7:47:24,  2.71s/it][A
Training...:  26% 3565/13907 [2:23:44<7:36:52,  2.65s/it][A
Training...:  26% 3566/13907 [2:23:47<7:27:35,  2.60s/it][A
Training...:  26% 3567/13907 [2:23:49<7:19:55,  2.55s/it][A
Training...:  26% 3568/13907 [2:23:52<7:14:28,  2.52s/it][A
Training...:  26% 3569/13907 [2:23:54<7:09:37,  2.49s/it][A
Training...:  26% 3570/13907 [2:23:57<7:04:07,  2.46s/it][A
Training...:  26% 3571/13907 [2:23:59<6:57:42,  2.42s/it][A
Training...:  26% 3572/13907 [2:24:01<6:52:26,  2.39s/it][A
Training...:  26% 3573/13907 [2:24:04<6:46:16,  2.36s/it][A
Training...:  26% 3574/13907 [2:24:06<6:41:09,  2.33s/it][A
Training...:  26% 3575/13907 [2:24:08<6:35:25,  2.30s/it][A
Training...:  26% 3576/13907 [2:24:10<6:27:34,  2.25s/it][A
Training...:  26% 3577/13907 [2:24:12<6:19:59,  2.21s/it][A
Training...:  26% 3578/13907 [2:24:14<6:12:45,  2.17s/it][A
Training...:  26% 3579/13907 [2:24:16<6:06:12,  2.13s/it][A
Training...:  26% 3580/13907 [2:24:18<5:59:38,  2.09s/it][A
Training...:  26% 3581/13907 [2:24:20<5:56:14,  2.07s/it][A
Training...:  26% 3582/13907 [2:24:22<5:50:04,  2.03s/it][A
Training...:  26% 3583/13907 [2:24:24<5:47:31,  2.02s/it][A
Training...:  26% 3584/13907 [2:24:26<5:43:00,  1.99s/it][A
Training...:  26% 3585/13907 [2:24:28<5:36:22,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:54:41<17:31:07, 31533.87s/it]
Training...:  26% 3585/13907 [2:24:30<5:36:22,  1.96s/it][A
Training...:  26% 3586/13907 [2:24:30<5:50:23,  2.04s/it][A
Training...:  26% 3587/13907 [2:24:32<5:43:06,  1.99s/it][A
Training...:  26% 3588/13907 [2:24:34<5:32:56,  1.94s/it][A
Training...:  26% 3589/13907 [2:24:36<5:24:42,  1.89s/it][A
Training...:  26% 3590/13907 [2:24:38<5:15:39,  1.84s/it][A
Training...:  26% 3591/13907 [2:24:39<5:08:03,  1.79s/it][A
Training...:  26% 3592/13907 [2:24:41<5:01:26,  1.75s/it][A
Training...:  26% 3593/13907 [2:24:43<4:55:51,  1.72s/it][A
Training...:  26% 3594/13907 [2:24:44<4:48:36,  1.68s/it][A
Training...:  26% 3595/13907 [2:24:46<4:42:21,  1.64s/it][A
Training...:  26% 3596/13907 [2:24:47<4:34:23,  1.60s/it][A
Training...:  26% 3597/13907 [2:24:49<4:24:22,  1.54s/it][A
Training...:  26% 3598/13907 [2:24:50<4:13:57,  1.48s/it][A
Training...:  26% 3599/13907 [2:24:51<4:01:07,  1.40s/it][A
Training...:  26% 3600/13907 [2:24:52<3:45:02,  1.31s/it][A
Training...:  26% 3601/13907 [2:24:56<5:47:26,  2.02s/it][A
Training...:  26% 3602/13907 [2:24:59<7:01:01,  2.45s/it][A
Training...:  26% 3603/13907 [2:25:03<7:41:40,  2.69s/it][A
Training...:  26% 3604/13907 [2:25:06<8:04:28,  2.82s/it][A
Training...:  26% 3605/13907 [2:25:09<8:14:09,  2.88s/it][A
Training...:  26% 3606/13907 [2:25:12<8:18:54,  2.91s/it][A
Training...:  26% 3607/13907 [2:25:15<8:18:55,  2.91s/it][A
Training...:  26% 3608/13907 [2:25:18<8:15:52,  2.89s/it][A
Training...:  26% 3609/13907 [2:25:20<8:10:36,  2.86s/it][A
Training...:  26% 3610/13907 [2:25:23<8:03:22,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:55:37<17:31:07, 31533.87s/it]
Training...:  26% 3610/13907 [2:25:26<8:03:22,  2.82s/it][A
Training...:  26% 3611/13907 [2:25:26<8:18:53,  2.91s/it][A
Training...:  26% 3612/13907 [2:25:29<8:09:51,  2.85s/it][A
Training...:  26% 3613/13907 [2:25:31<7:58:24,  2.79s/it][A
Training...:  26% 3614/13907 [2:25:34<7:49:54,  2.74s/it][A
Training...:  26% 3615/13907 [2:25:37<7:42:56,  2.70s/it][A
Training...:  26% 3616/13907 [2:25:39<7:30:44,  2.63s/it][A
Training...:  26% 3617/13907 [2:25:42<7:20:37,  2.57s/it][A
Training...:  26% 3618/13907 [2:25:44<7:11:46,  2.52s/it][A
Training...:  26% 3619/13907 [2:25:46<7:04:21,  2.47s/it][A
Training...:  26% 3620/13907 [2:25:49<6:55:50,  2.43s/it][A
Training...:  26% 3621/13907 [2:25:51<6:49:58,  2.39s/it][A
Training...:  26% 3622/13907 [2:25:53<6:44:42,  2.36s/it][A
Training...:  26% 3623/13907 [2:25:56<6:37:44,  2.32s/it][A
Training...:  26% 3624/13907 [2:25:58<6:31:43,  2.29s/it][A
Training...:  26% 3625/13907 [2:26:00<6:25:01,  2.25s/it][A
Training...:  26% 3626/13907 [2:26:02<6:19:43,  2.22s/it][A
Training...:  26% 3627/13907 [2:26:04<6:14:44,  2.19s/it][A
Training...:  26% 3628/13907 [2:26:06<6:10:08,  2.16s/it][A
Training...:  26% 3629/13907 [2:26:08<6:05:31,  2.13s/it][A
Training...:  26% 3630/13907 [2:26:10<6:00:38,  2.11s/it][A
Training...:  26% 3631/13907 [2:26:12<5:55:52,  2.08s/it][A
Training...:  26% 3632/13907 [2:26:14<5:50:02,  2.04s/it][A
Training...:  26% 3633/13907 [2:26:16<5:45:41,  2.02s/it][A
Training...:  26% 3634/13907 [2:26:18<5:42:04,  2.00s/it][A
Training...:  26% 3635/13907 [2:26:20<5:38:07,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:56:33<17:31:07, 31533.87s/it]
Training...:  26% 3635/13907 [2:26:22<5:38:07,  1.97s/it][A
Training...:  26% 3636/13907 [2:26:22<5:48:15,  2.03s/it][A
Training...:  26% 3637/13907 [2:26:24<5:41:14,  1.99s/it][A
Training...:  26% 3638/13907 [2:26:26<5:31:35,  1.94s/it][A
Training...:  26% 3639/13907 [2:26:28<5:22:11,  1.88s/it][A
Training...:  26% 3640/13907 [2:26:30<5:14:03,  1.84s/it][A
Training...:  26% 3641/13907 [2:26:31<5:07:13,  1.80s/it][A
Training...:  26% 3642/13907 [2:26:33<5:00:45,  1.76s/it][A
Training...:  26% 3643/13907 [2:26:35<4:53:55,  1.72s/it][A
Training...:  26% 3644/13907 [2:26:36<4:48:32,  1.69s/it][A
Training...:  26% 3645/13907 [2:26:38<4:41:16,  1.64s/it][A
Training...:  26% 3646/13907 [2:26:39<4:33:56,  1.60s/it][A
Training...:  26% 3647/13907 [2:26:41<4:24:42,  1.55s/it][A
Training...:  26% 3648/13907 [2:26:42<4:13:12,  1.48s/it][A
Training...:  26% 3649/13907 [2:26:43<4:00:49,  1.41s/it][A
Training...:  26% 3650/13907 [2:26:44<3:42:18,  1.30s/it][A
Training...:  26% 3651/13907 [2:26:48<5:44:53,  2.02s/it][A
Training...:  26% 3652/13907 [2:26:51<6:57:34,  2.44s/it][A
Training...:  26% 3653/13907 [2:26:55<7:37:59,  2.68s/it][A
Training...:  26% 3654/13907 [2:26:58<7:58:21,  2.80s/it][A
Training...:  26% 3655/13907 [2:27:01<8:07:02,  2.85s/it][A
Training...:  26% 3656/13907 [2:27:04<8:10:16,  2.87s/it][A
Training...:  26% 3657/13907 [2:27:06<8:08:49,  2.86s/it][A
Training...:  26% 3658/13907 [2:27:09<8:04:39,  2.84s/it][A
Training...:  26% 3659/13907 [2:27:12<8:00:32,  2.81s/it][A
Training...:  26% 3660/13907 [2:27:15<7:52:54,  2.77s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:57:29<17:31:07, 31533.87s/it]
Training...:  26% 3660/13907 [2:27:18<7:52:54,  2.77s/it][A
Training...:  26% 3661/13907 [2:27:18<8:09:19,  2.87s/it][A
Training...:  26% 3662/13907 [2:27:20<8:01:27,  2.82s/it][A
Training...:  26% 3663/13907 [2:27:23<7:48:57,  2.75s/it][A
Training...:  26% 3664/13907 [2:27:25<7:37:03,  2.68s/it][A
Training...:  26% 3665/13907 [2:27:28<7:26:45,  2.62s/it][A
Training...:  26% 3666/13907 [2:27:30<7:19:23,  2.57s/it][A
Training...:  26% 3667/13907 [2:27:33<7:13:02,  2.54s/it][A
Training...:  26% 3668/13907 [2:27:35<7:05:33,  2.49s/it][A
Training...:  26% 3669/13907 [2:27:38<6:59:23,  2.46s/it][A
Training...:  26% 3670/13907 [2:27:40<6:52:46,  2.42s/it][A
Training...:  26% 3671/13907 [2:27:42<6:47:02,  2.39s/it][A
Training...:  26% 3672/13907 [2:27:45<6:40:38,  2.35s/it][A
Training...:  26% 3673/13907 [2:27:47<6:34:52,  2.32s/it][A
Training...:  26% 3674/13907 [2:27:49<6:28:02,  2.28s/it][A
Training...:  26% 3675/13907 [2:27:51<6:21:57,  2.24s/it][A
Training...:  26% 3676/13907 [2:27:53<6:15:54,  2.20s/it][A
Training...:  26% 3677/13907 [2:27:55<6:09:08,  2.17s/it][A
Training...:  26% 3678/13907 [2:27:57<6:03:51,  2.13s/it][A
Training...:  26% 3679/13907 [2:27:59<6:00:01,  2.11s/it][A
Training...:  26% 3680/13907 [2:28:01<5:53:52,  2.08s/it][A
Training...:  26% 3681/13907 [2:28:03<5:49:03,  2.05s/it][A
Training...:  26% 3682/13907 [2:28:05<5:43:36,  2.02s/it][A
Training...:  26% 3683/13907 [2:28:07<5:38:05,  1.98s/it][A
Training...:  26% 3684/13907 [2:28:09<5:33:35,  1.96s/it][A
Training...:  26% 3685/13907 [2:28:11<5:28:24,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:58:24<17:31:07, 31533.87s/it]
Training...:  26% 3685/13907 [2:28:13<5:28:24,  1.93s/it][A
Training...:  27% 3686/13907 [2:28:13<5:38:38,  1.99s/it][A
Training...:  27% 3687/13907 [2:28:15<5:31:53,  1.95s/it][A
Training...:  27% 3688/13907 [2:28:17<5:21:47,  1.89s/it][A
Training...:  27% 3689/13907 [2:28:18<5:13:32,  1.84s/it][A
Training...:  27% 3690/13907 [2:28:20<5:05:34,  1.79s/it][A
Training...:  27% 3691/13907 [2:28:22<4:59:35,  1.76s/it][A
Training...:  27% 3692/13907 [2:28:23<4:52:31,  1.72s/it][A
Training...:  27% 3693/13907 [2:28:25<4:45:55,  1.68s/it][A
Training...:  27% 3694/13907 [2:28:27<4:39:58,  1.64s/it][A
Training...:  27% 3695/13907 [2:28:28<4:32:40,  1.60s/it][A
Training...:  27% 3696/13907 [2:28:30<4:26:05,  1.56s/it][A
Training...:  27% 3697/13907 [2:28:31<4:19:29,  1.52s/it][A
Training...:  27% 3698/13907 [2:28:32<4:08:02,  1.46s/it][A
Training...:  27% 3699/13907 [2:28:34<3:54:43,  1.38s/it][A
Training...:  27% 3700/13907 [2:28:35<3:37:39,  1.28s/it][A
Training...:  27% 3701/13907 [2:28:38<5:43:30,  2.02s/it][A
Training...:  27% 3702/13907 [2:28:42<6:56:47,  2.45s/it][A
Training...:  27% 3703/13907 [2:28:45<7:37:15,  2.69s/it][A
Training...:  27% 3704/13907 [2:28:48<7:58:50,  2.82s/it][A
Training...:  27% 3705/13907 [2:28:51<8:09:24,  2.88s/it][A
Training...:  27% 3706/13907 [2:28:54<8:11:59,  2.89s/it][A
Training...:  27% 3707/13907 [2:28:57<8:13:06,  2.90s/it][A
Training...:  27% 3708/13907 [2:29:00<8:08:45,  2.88s/it][A
Training...:  27% 3709/13907 [2:29:03<8:01:45,  2.83s/it][A
Training...:  27% 3710/13907 [2:29:05<7:55:01,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [19:59:19<17:31:07, 31533.87s/it]
Training...:  27% 3710/13907 [2:29:08<7:55:01,  2.80s/it][A
Training...:  27% 3711/13907 [2:29:08<8:09:23,  2.88s/it][A
Training...:  27% 3712/13907 [2:29:11<8:00:53,  2.83s/it][A
Training...:  27% 3713/13907 [2:29:14<7:46:13,  2.74s/it][A
Training...:  27% 3714/13907 [2:29:16<7:36:43,  2.69s/it][A
Training...:  27% 3715/13907 [2:29:19<7:27:24,  2.63s/it][A
Training...:  27% 3716/13907 [2:29:21<7:19:08,  2.59s/it][A
Training...:  27% 3717/13907 [2:29:24<7:11:25,  2.54s/it][A
Training...:  27% 3718/13907 [2:29:26<7:04:55,  2.50s/it][A
Training...:  27% 3719/13907 [2:29:28<6:57:45,  2.46s/it][A
Training...:  27% 3720/13907 [2:29:31<6:51:32,  2.42s/it][A
Training...:  27% 3721/13907 [2:29:33<6:45:26,  2.39s/it][A
Training...:  27% 3722/13907 [2:29:35<6:40:36,  2.36s/it][A
Training...:  27% 3723/13907 [2:29:38<6:34:28,  2.32s/it][A
Training...:  27% 3724/13907 [2:29:40<6:29:55,  2.30s/it][A
Training...:  27% 3725/13907 [2:29:42<6:28:42,  2.29s/it][A
Training...:  27% 3726/13907 [2:29:44<6:22:10,  2.25s/it][A
Training...:  27% 3727/13907 [2:29:46<6:16:01,  2.22s/it][A
Training...:  27% 3728/13907 [2:29:48<6:09:28,  2.18s/it][A
Training...:  27% 3729/13907 [2:29:51<6:03:47,  2.14s/it][A
Training...:  27% 3730/13907 [2:29:53<5:57:33,  2.11s/it][A
Training...:  27% 3731/13907 [2:29:55<5:52:31,  2.08s/it][A
Training...:  27% 3732/13907 [2:29:56<5:46:24,  2.04s/it][A
Training...:  27% 3733/13907 [2:29:58<5:40:56,  2.01s/it][A
Training...:  27% 3734/13907 [2:30:00<5:35:07,  1.98s/it][A
Training...:  27% 3735/13907 [2:30:02<5:29:13,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:00:15<17:31:07, 31533.87s/it]
Training...:  27% 3735/13907 [2:30:04<5:29:13,  1.94s/it][A
Training...:  27% 3736/13907 [2:30:04<5:40:16,  2.01s/it][A
Training...:  27% 3737/13907 [2:30:06<5:34:18,  1.97s/it][A
Training...:  27% 3738/13907 [2:30:08<5:25:41,  1.92s/it][A
Training...:  27% 3739/13907 [2:30:10<5:17:16,  1.87s/it][A
Training...:  27% 3740/13907 [2:30:12<5:09:49,  1.83s/it][A
Training...:  27% 3741/13907 [2:30:13<5:02:49,  1.79s/it][A
Training...:  27% 3742/13907 [2:30:15<4:56:01,  1.75s/it][A
Training...:  27% 3743/13907 [2:30:16<4:48:35,  1.70s/it][A
Training...:  27% 3744/13907 [2:30:18<4:42:31,  1.67s/it][A
Training...:  27% 3745/13907 [2:30:20<4:36:42,  1.63s/it][A
Training...:  27% 3746/13907 [2:30:21<4:28:22,  1.58s/it][A
Training...:  27% 3747/13907 [2:30:22<4:19:16,  1.53s/it][A
Training...:  27% 3748/13907 [2:30:24<4:10:04,  1.48s/it][A
Training...:  27% 3749/13907 [2:30:25<3:58:11,  1.41s/it][A
Training...:  27% 3750/13907 [2:30:26<3:40:15,  1.30s/it][A
Training...:  27% 3751/13907 [2:30:30<5:44:48,  2.04s/it][A
Training...:  27% 3752/13907 [2:30:33<6:55:41,  2.46s/it][A
Training...:  27% 3753/13907 [2:30:37<7:33:48,  2.68s/it][A
Training...:  27% 3754/13907 [2:30:40<7:54:53,  2.81s/it][A
Training...:  27% 3755/13907 [2:30:43<8:07:20,  2.88s/it][A
Training...:  27% 3756/13907 [2:30:46<8:09:22,  2.89s/it][A
Training...:  27% 3757/13907 [2:30:48<8:08:47,  2.89s/it][A
Training...:  27% 3758/13907 [2:30:51<8:04:07,  2.86s/it][A
Training...:  27% 3759/13907 [2:30:54<8:01:37,  2.85s/it][A
Training...:  27% 3760/13907 [2:30:57<7:55:36,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:01:11<17:31:07, 31533.87s/it]
Training...:  27% 3760/13907 [2:31:00<7:55:36,  2.81s/it][A
Training...:  27% 3761/13907 [2:31:00<8:08:33,  2.89s/it][A
Training...:  27% 3762/13907 [2:31:03<7:59:21,  2.84s/it][A
Training...:  27% 3763/13907 [2:31:05<7:45:25,  2.75s/it][A
Training...:  27% 3764/13907 [2:31:08<7:34:11,  2.69s/it][A
Training...:  27% 3765/13907 [2:31:10<7:23:46,  2.63s/it][A
Training...:  27% 3766/13907 [2:31:13<7:14:31,  2.57s/it][A
Training...:  27% 3767/13907 [2:31:15<7:08:38,  2.54s/it][A
Training...:  27% 3768/13907 [2:31:17<7:00:43,  2.49s/it][A
Training...:  27% 3769/13907 [2:31:20<6:55:12,  2.46s/it][A
Training...:  27% 3770/13907 [2:31:22<6:48:45,  2.42s/it][A
Training...:  27% 3771/13907 [2:31:24<6:42:51,  2.38s/it][A
Training...:  27% 3772/13907 [2:31:27<6:36:03,  2.34s/it][A
Training...:  27% 3773/13907 [2:31:29<6:29:36,  2.31s/it][A
Training...:  27% 3774/13907 [2:31:31<6:25:32,  2.28s/it][A
Training...:  27% 3775/13907 [2:31:33<6:19:17,  2.25s/it][A
Training...:  27% 3776/13907 [2:31:35<6:14:18,  2.22s/it][A
Training...:  27% 3777/13907 [2:31:38<6:07:28,  2.18s/it][A
Training...:  27% 3778/13907 [2:31:40<6:02:40,  2.15s/it][A
Training...:  27% 3779/13907 [2:31:42<5:59:09,  2.13s/it][A
Training...:  27% 3780/13907 [2:31:44<5:55:52,  2.11s/it][A
Training...:  27% 3781/13907 [2:31:46<5:50:38,  2.08s/it][A
Training...:  27% 3782/13907 [2:31:48<5:47:36,  2.06s/it][A
Training...:  27% 3783/13907 [2:31:50<5:41:02,  2.02s/it][A
Training...:  27% 3784/13907 [2:31:52<5:35:19,  1.99s/it][A
Training...:  27% 3785/13907 [2:31:54<5:28:15,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:02:07<17:31:07, 31533.87s/it]
Training...:  27% 3785/13907 [2:31:56<5:28:15,  1.95s/it][A
Training...:  27% 3786/13907 [2:31:56<5:38:21,  2.01s/it][A
Training...:  27% 3787/13907 [2:31:58<5:31:49,  1.97s/it][A
Training...:  27% 3788/13907 [2:31:59<5:21:18,  1.91s/it][A
Training...:  27% 3789/13907 [2:32:01<5:12:19,  1.85s/it][A
Training...:  27% 3790/13907 [2:32:03<5:04:04,  1.80s/it][A
Training...:  27% 3791/13907 [2:32:04<4:57:16,  1.76s/it][A
Training...:  27% 3792/13907 [2:32:06<4:50:49,  1.73s/it][A
Training...:  27% 3793/13907 [2:32:08<4:44:33,  1.69s/it][A
Training...:  27% 3794/13907 [2:32:09<4:38:22,  1.65s/it][A
Training...:  27% 3795/13907 [2:32:11<4:32:56,  1.62s/it][A
Training...:  27% 3796/13907 [2:32:12<4:24:56,  1.57s/it][A
Training...:  27% 3797/13907 [2:32:14<4:15:05,  1.51s/it][A
Training...:  27% 3798/13907 [2:32:15<4:04:21,  1.45s/it][A
Training...:  27% 3799/13907 [2:32:16<3:52:38,  1.38s/it][A
Training...:  27% 3800/13907 [2:32:17<3:35:39,  1.28s/it][A
Training...:  27% 3801/13907 [2:32:21<5:36:00,  1.99s/it][A
Training...:  27% 3802/13907 [2:32:24<6:49:44,  2.43s/it][A
Training...:  27% 3803/13907 [2:32:27<7:29:54,  2.67s/it][A
Training...:  27% 3804/13907 [2:32:31<7:54:05,  2.82s/it][A
Training...:  27% 3805/13907 [2:32:34<8:03:37,  2.87s/it][A
Training...:  27% 3806/13907 [2:32:37<8:05:57,  2.89s/it][A
Training...:  27% 3807/13907 [2:32:39<8:05:00,  2.88s/it][A
Training...:  27% 3808/13907 [2:32:42<8:01:35,  2.86s/it][A
Training...:  27% 3809/13907 [2:32:45<7:54:55,  2.82s/it][A
Training...:  27% 3810/13907 [2:32:48<7:49:36,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:03:02<17:31:07, 31533.87s/it]
Training...:  27% 3810/13907 [2:32:51<7:49:36,  2.79s/it][A
Training...:  27% 3811/13907 [2:32:51<8:03:20,  2.87s/it][A
Training...:  27% 3812/13907 [2:32:53<7:54:28,  2.82s/it][A
Training...:  27% 3813/13907 [2:32:56<7:42:31,  2.75s/it][A
Training...:  27% 3814/13907 [2:32:59<7:30:55,  2.68s/it][A
Training...:  27% 3815/13907 [2:33:01<7:22:31,  2.63s/it][A
Training...:  27% 3816/13907 [2:33:03<7:12:33,  2.57s/it][A
Training...:  27% 3817/13907 [2:33:06<7:05:44,  2.53s/it][A
Training...:  27% 3818/13907 [2:33:08<6:58:17,  2.49s/it][A
Training...:  27% 3819/13907 [2:33:11<6:51:14,  2.45s/it][A
Training...:  27% 3820/13907 [2:33:13<6:44:24,  2.41s/it][A
Training...:  27% 3821/13907 [2:33:15<6:39:02,  2.37s/it][A
Training...:  27% 3822/13907 [2:33:17<6:31:05,  2.33s/it][A
Training...:  27% 3823/13907 [2:33:20<6:27:54,  2.31s/it][A
Training...:  27% 3824/13907 [2:33:22<6:24:33,  2.29s/it][A
Training...:  28% 3825/13907 [2:33:24<6:18:33,  2.25s/it][A
Training...:  28% 3826/13907 [2:33:26<6:12:39,  2.22s/it][A
Training...:  28% 3827/13907 [2:33:28<6:06:42,  2.18s/it][A
Training...:  28% 3828/13907 [2:33:30<6:00:44,  2.15s/it][A
Training...:  28% 3829/13907 [2:33:33<5:56:57,  2.13s/it][A
Training...:  28% 3830/13907 [2:33:35<5:50:56,  2.09s/it][A
Training...:  28% 3831/13907 [2:33:37<5:46:11,  2.06s/it][A
Training...:  28% 3832/13907 [2:33:39<5:41:30,  2.03s/it][A
Training...:  28% 3833/13907 [2:33:40<5:35:55,  2.00s/it][A
Training...:  28% 3834/13907 [2:33:42<5:30:01,  1.97s/it][A
Training...:  28% 3835/13907 [2:33:44<5:24:54,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:03:57<17:31:07, 31533.87s/it]
Training...:  28% 3835/13907 [2:33:46<5:24:54,  1.94s/it][A
Training...:  28% 3836/13907 [2:33:46<5:35:31,  2.00s/it][A
Training...:  28% 3837/13907 [2:33:48<5:29:25,  1.96s/it][A
Training...:  28% 3838/13907 [2:33:50<5:19:40,  1.90s/it][A
Training...:  28% 3839/13907 [2:33:52<5:11:39,  1.86s/it][A
Training...:  28% 3840/13907 [2:33:53<5:04:41,  1.82s/it][A
Training...:  28% 3841/13907 [2:33:55<4:58:23,  1.78s/it][A
Training...:  28% 3842/13907 [2:33:57<4:51:42,  1.74s/it][A
Training...:  28% 3843/13907 [2:33:58<4:44:32,  1.70s/it][A
Training...:  28% 3844/13907 [2:34:00<4:38:08,  1.66s/it][A
Training...:  28% 3845/13907 [2:34:01<4:31:41,  1.62s/it][A
Training...:  28% 3846/13907 [2:34:03<4:23:40,  1.57s/it][A
Training...:  28% 3847/13907 [2:34:04<4:15:09,  1.52s/it][A
Training...:  28% 3848/13907 [2:34:06<4:06:38,  1.47s/it][A
Training...:  28% 3849/13907 [2:34:07<3:55:35,  1.41s/it][A
Training...:  28% 3850/13907 [2:34:08<3:40:23,  1.31s/it][A
Training...:  28% 3851/13907 [2:34:12<5:37:50,  2.02s/it][A
Training...:  28% 3852/13907 [2:34:15<6:53:52,  2.47s/it][A
Training...:  28% 3853/13907 [2:34:18<7:32:37,  2.70s/it][A
Training...:  28% 3854/13907 [2:34:22<7:56:22,  2.84s/it][A
Training...:  28% 3855/13907 [2:34:25<8:07:38,  2.91s/it][A
Training...:  28% 3856/13907 [2:34:28<8:12:31,  2.94s/it][A
Training...:  28% 3857/13907 [2:34:31<8:11:14,  2.93s/it][A
Training...:  28% 3858/13907 [2:34:33<8:06:24,  2.90s/it][A
Training...:  28% 3859/13907 [2:34:36<8:03:53,  2.89s/it][A
Training...:  28% 3860/13907 [2:34:39<7:55:46,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:04:53<17:31:07, 31533.87s/it]
Training...:  28% 3860/13907 [2:34:42<7:55:46,  2.84s/it][A
Training...:  28% 3861/13907 [2:34:42<8:07:18,  2.91s/it][A
Training...:  28% 3862/13907 [2:34:45<7:56:47,  2.85s/it][A
Training...:  28% 3863/13907 [2:34:47<7:42:48,  2.76s/it][A
Training...:  28% 3864/13907 [2:34:50<7:31:47,  2.70s/it][A
Training...:  28% 3865/13907 [2:34:52<7:21:03,  2.64s/it][A
Training...:  28% 3866/13907 [2:34:55<7:15:38,  2.60s/it][A
Training...:  28% 3867/13907 [2:34:57<7:09:05,  2.56s/it][A
Training...:  28% 3868/13907 [2:35:00<6:59:14,  2.51s/it][A
Training...:  28% 3869/13907 [2:35:02<6:53:44,  2.47s/it][A
Training...:  28% 3870/13907 [2:35:05<6:46:25,  2.43s/it][A
Training...:  28% 3871/13907 [2:35:07<6:40:47,  2.40s/it][A
Training...:  28% 3872/13907 [2:35:09<6:34:14,  2.36s/it][A
Training...:  28% 3873/13907 [2:35:11<6:28:11,  2.32s/it][A
Training...:  28% 3874/13907 [2:35:14<6:22:23,  2.29s/it][A
Training...:  28% 3875/13907 [2:35:16<6:17:17,  2.26s/it][A
Training...:  28% 3876/13907 [2:35:18<6:10:59,  2.22s/it][A
Training...:  28% 3877/13907 [2:35:20<6:05:36,  2.19s/it][A
Training...:  28% 3878/13907 [2:35:22<6:00:20,  2.16s/it][A
Training...:  28% 3879/13907 [2:35:24<5:56:40,  2.13s/it][A
Training...:  28% 3880/13907 [2:35:26<5:54:56,  2.12s/it][A
Training...:  28% 3881/13907 [2:35:28<5:49:31,  2.09s/it][A
Training...:  28% 3882/13907 [2:35:30<5:43:36,  2.06s/it][A
Training...:  28% 3883/13907 [2:35:32<5:40:03,  2.04s/it][A
Training...:  28% 3884/13907 [2:35:34<5:33:01,  1.99s/it][A
Training...:  28% 3885/13907 [2:35:36<5:27:29,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:05:49<17:31:07, 31533.87s/it]
Training...:  28% 3885/13907 [2:35:38<5:27:29,  1.96s/it][A
Training...:  28% 3886/13907 [2:35:38<5:36:41,  2.02s/it][A
Training...:  28% 3887/13907 [2:35:40<5:30:04,  1.98s/it][A
Training...:  28% 3888/13907 [2:35:42<5:20:30,  1.92s/it][A
Training...:  28% 3889/13907 [2:35:44<5:12:26,  1.87s/it][A
Training...:  28% 3890/13907 [2:35:45<5:04:32,  1.82s/it][A
Training...:  28% 3891/13907 [2:35:47<4:57:10,  1.78s/it][A
Training...:  28% 3892/13907 [2:35:49<4:50:12,  1.74s/it][A
Training...:  28% 3893/13907 [2:35:50<4:43:24,  1.70s/it][A
Training...:  28% 3894/13907 [2:35:52<4:36:16,  1.66s/it][A
Training...:  28% 3895/13907 [2:35:53<4:28:16,  1.61s/it][A
Training...:  28% 3896/13907 [2:35:55<4:19:06,  1.55s/it][A
Training...:  28% 3897/13907 [2:35:56<4:10:15,  1.50s/it][A
Training...:  28% 3898/13907 [2:35:57<3:59:41,  1.44s/it][A
Training...:  28% 3899/13907 [2:35:59<3:47:34,  1.36s/it][A
Training...:  28% 3900/13907 [2:36:00<3:30:10,  1.26s/it][A
Training...:  28% 3901/13907 [2:36:03<5:35:13,  2.01s/it][A
Training...:  28% 3902/13907 [2:36:07<6:51:23,  2.47s/it][A
Training...:  28% 3903/13907 [2:36:10<7:31:33,  2.71s/it][A
Training...:  28% 3904/13907 [2:36:13<7:52:22,  2.83s/it][A
Training...:  28% 3905/13907 [2:36:16<8:01:08,  2.89s/it][A
Training...:  28% 3906/13907 [2:36:19<8:05:32,  2.91s/it][A
Training...:  28% 3907/13907 [2:36:22<8:04:28,  2.91s/it][A
Training...:  28% 3908/13907 [2:36:25<7:59:11,  2.88s/it][A
Training...:  28% 3909/13907 [2:36:28<7:57:06,  2.86s/it][A
Training...:  28% 3910/13907 [2:36:31<7:54:08,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:06:45<17:31:07, 31533.87s/it]
Training...:  28% 3910/13907 [2:36:34<7:54:08,  2.85s/it][A
Training...:  28% 3911/13907 [2:36:34<8:07:17,  2.92s/it][A
Training...:  28% 3912/13907 [2:36:36<7:57:05,  2.86s/it][A
Training...:  28% 3913/13907 [2:36:39<7:45:29,  2.79s/it][A
Training...:  28% 3914/13907 [2:36:42<7:32:53,  2.72s/it][A
Training...:  28% 3915/13907 [2:36:44<7:22:32,  2.66s/it][A
Training...:  28% 3916/13907 [2:36:47<7:17:24,  2.63s/it][A
Training...:  28% 3917/13907 [2:36:49<7:11:01,  2.59s/it][A
Training...:  28% 3918/13907 [2:36:52<7:04:50,  2.55s/it][A
Training...:  28% 3919/13907 [2:36:54<7:00:19,  2.53s/it][A
Training...:  28% 3920/13907 [2:36:57<6:53:50,  2.49s/it][A
Training...:  28% 3921/13907 [2:36:59<6:45:28,  2.44s/it][A
Training...:  28% 3922/13907 [2:37:01<6:38:49,  2.40s/it][A
Training...:  28% 3923/13907 [2:37:03<6:33:37,  2.37s/it][A
Training...:  28% 3924/13907 [2:37:06<6:28:28,  2.33s/it][A
Training...:  28% 3925/13907 [2:37:08<6:21:18,  2.29s/it][A
Training...:  28% 3926/13907 [2:37:10<6:15:53,  2.26s/it][A
Training...:  28% 3927/13907 [2:37:12<6:08:53,  2.22s/it][A
Training...:  28% 3928/13907 [2:37:14<6:02:10,  2.18s/it][A
Training...:  28% 3929/13907 [2:37:16<5:56:29,  2.14s/it][A
Training...:  28% 3930/13907 [2:37:18<5:51:07,  2.11s/it][A
Training...:  28% 3931/13907 [2:37:20<5:46:07,  2.08s/it][A
Training...:  28% 3932/13907 [2:37:22<5:40:57,  2.05s/it][A
Training...:  28% 3933/13907 [2:37:24<5:35:08,  2.02s/it][A
Training...:  28% 3934/13907 [2:37:26<5:29:29,  1.98s/it][A
Training...:  28% 3935/13907 [2:37:28<5:24:14,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:07:41<17:31:07, 31533.87s/it]
Training...:  28% 3935/13907 [2:37:30<5:24:14,  1.95s/it][A
Training...:  28% 3936/13907 [2:37:30<5:34:46,  2.01s/it][AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |)
Step... (30025 | Loss: 0.18178671598434448, Learning Rate: 0.00012106667418265715, Gradient Norm: 0.6622463464736938)
Step... (30050 | Loss: 0.2189422994852066, Learning Rate: 0.00012091515236534178, Gradient Norm: 0.9715049266815186)
Step... (30075 | Loss: 0.18076691031455994, Learning Rate: 0.00012076363782398403, Gradient Norm: 0.650852382183075)
Step... (30100 | Loss: 0.1981697976589203, Learning Rate: 0.00012061213055858389, Gradient Norm: 0.734178900718689)
Step... (30125 | Loss: 0.19179338216781616, Learning Rate: 0.00012046060874126852, Gradient Norm: 0.9486633539199829)
Step... (30150 | Loss: 0.179655522108078, Learning Rate: 0.00012030909419991076, Gradient Norm: 1.3655259609222412)
Step... (30175 | Loss: 0.17960739135742188, Learning Rate: 0.00012015758693451062, Gradient Norm: 0.756773829460144)
Step... (30200 | Loss: 0.25498002767562866, Learning Rate: 0.00012000605784123763, Gradient Norm: 0.9922668933868408)
Step... (30225 | Loss: 0.17207369208335876, Learning Rate: 0.00011985455057583749, Gradient Norm: 0.8435150384902954)
Step... (30250 | Loss: 0.1517152488231659, Learning Rate: 0.00011970304331043735, Gradient Norm: 0.736926794052124)
Step... (30275 | Loss: 0.3143538236618042, Learning Rate: 0.00011955151421716437, Gradient Norm: 0.833575963973999)
Step... (30300 | Loss: 0.20290473103523254, Learning Rate: 0.00011940000695176423, Gradient Norm: 0.9025073051452637)
Step... (30325 | Loss: 0.21936184167861938, Learning Rate: 0.00011924849968636408, Gradient Norm: 0.9948279857635498)
Step... (30350 | Loss: 0.2066463828086853, Learning Rate: 0.0001190969705930911, Gradient Norm: 1.2065837383270264)
Step... (30375 | Loss: 0.2386644184589386, Learning Rate: 0.00011894546332769096, Gradient Norm: 0.7018105387687683)
Step... (30400 | Loss: 0.20496925711631775, Learning Rate: 0.0001187939487863332, Gradient Norm: 1.116618275642395)
Step... (30425 | Loss: 0.2431645393371582, Learning Rate: 0.00011864242696901783, Gradient Norm: 0.9607704281806946)
Step... (30450 | Loss: 0.19514083862304688, Learning Rate: 0.00011849091970361769, Gradient Norm: 1.0298504829406738)
Step... (30475 | Loss: 0.26169538497924805, Learning Rate: 0.00011833940516225994, Gradient Norm: 1.0658495426177979)
Step... (30500 | Loss: 0.21772435307502747, Learning Rate: 0.00011818788334494457, Gradient Norm: 0.8495234251022339)
Step... (30525 | Loss: 0.1917601227760315, Learning Rate: 0.00011803636880358681, Gradient Norm: 0.5481631755828857)
Step... (30550 | Loss: 0.16494464874267578, Learning Rate: 0.00011788486153818667, Gradient Norm: 0.8543483018875122)
Step... (30575 | Loss: 0.2384186089038849, Learning Rate: 0.00011773333244491369, Gradient Norm: 0.9415748119354248)
Step... (30600 | Loss: 0.18344759941101074, Learning Rate: 0.00011758182517951354, Gradient Norm: 0.9985224008560181)
Step... (30625 | Loss: 0.21155336499214172, Learning Rate: 0.0001174303179141134, Gradient Norm: 0.8381340503692627)
Step... (30650 | Loss: 0.2182915061712265, Learning Rate: 0.00011727878882084042, Gradient Norm: 1.320640206336975)
Step... (30675 | Loss: 0.1924075484275818, Learning Rate: 0.00011712728155544028, Gradient Norm: 0.6270996332168579)
Step... (30700 | Loss: 0.14761584997177124, Learning Rate: 0.00011697577429004014, Gradient Norm: 1.0819759368896484)
Step... (30725 | Loss: 0.2094951570034027, Learning Rate: 0.00011682424519676715, Gradient Norm: 0.567592978477478)
Step... (30750 | Loss: 0.1767439991235733, Learning Rate: 0.00011667273793136701, Gradient Norm: 0.6667138338088989)
Step... (30775 | Loss: 0.1709050089120865, Learning Rate: 0.00011652122339000925, Gradient Norm: 0.6817899942398071)
Step... (30800 | Loss: 0.18552625179290771, Learning Rate: 0.00011636970157269388, Gradient Norm: 0.6785140633583069)
Step... (30825 | Loss: 0.21485459804534912, Learning Rate: 0.00011621819430729374, Gradient Norm: 0.6834865808486938)
Step... (30850 | Loss: 0.19891341030597687, Learning Rate: 0.00011606667976593599, Gradient Norm: 0.6985679864883423)
Step... (30875 | Loss: 0.16924266517162323, Learning Rate: 0.00011591515794862062, Gradient Norm: 0.7263811230659485)
Step... (30900 | Loss: 0.1906149983406067, Learning Rate: 0.00011576364340726286, Gradient Norm: 1.0239102840423584)
Step... (30925 | Loss: 0.2784687280654907, Learning Rate: 0.00011561212158994749, Gradient Norm: 0.9577304124832153)
Step... (30950 | Loss: 0.16481900215148926, Learning Rate: 0.00011546060704858974, Gradient Norm: 0.5274488925933838)
Step... (30975 | Loss: 0.24914969503879547, Learning Rate: 0.0001153090997831896, Gradient Norm: 0.8212882280349731)
Step... (31000 | Loss: 0.18000170588493347, Learning Rate: 0.00011515757068991661, Gradient Norm: 0.8720374703407288)
Step... (31025 | Loss: 0.1546391248703003, Learning Rate: 0.00011500606342451647, Gradient Norm: 0.6418211460113525)
Step... (31050 | Loss: 0.25105002522468567, Learning Rate: 0.00011485455615911633, Gradient Norm: 0.9819318652153015)
Step... (31075 | Loss: 0.21762260794639587, Learning Rate: 0.00011470302706584334, Gradient Norm: 0.8360176086425781)
Step... (31100 | Loss: 0.19283315539360046, Learning Rate: 0.0001145515198004432, Gradient Norm: 0.7690303325653076)
Step... (31125 | Loss: 0.16873572766780853, Learning Rate: 0.00011440001253504306, Gradient Norm: 0.7216434478759766)
Step... (31150 | Loss: 0.15386280417442322, Learning Rate: 0.00011424848344177008, Gradient Norm: 0.8048664331436157)
Step... (31175 | Loss: 0.22055792808532715, Learning Rate: 0.00011409697617636994, Gradient Norm: 0.914962887763977)
Step... (31200 | Loss: 0.2699037790298462, Learning Rate: 0.0001139454689109698, Gradient Norm: 0.8099366426467896)
Step... (31225 | Loss: 0.25133588910102844, Learning Rate: 0.00011379393981769681, Gradient Norm: 0.6540039777755737)
Step... (31250 | Loss: 0.1434192657470703, Learning Rate: 0.00011364243255229667, Gradient Norm: 0.6916581392288208)
Step... (31275 | Loss: 0.2011435627937317, Learning Rate: 0.00011349091801093891, Gradient Norm: 0.7279101610183716)
Step... (31300 | Loss: 0.18512865900993347, Learning Rate: 0.00011333939619362354, Gradient Norm: 0.9283210039138794)
Step... (31325 | Loss: 0.23675701022148132, Learning Rate: 0.00011318788165226579, Gradient Norm: 0.7778240442276001)
Step... (31350 | Loss: 0.2206266075372696, Learning Rate: 0.00011303637438686565, Gradient Norm: 0.9106295108795166)
Step... (31375 | Loss: 0.22748956084251404, Learning Rate: 0.00011288484529359266, Gradient Norm: 1.0268189907073975)
Step... (31400 | Loss: 0.1469443440437317, Learning Rate: 0.00011273333802819252, Gradient Norm: 0.6283726692199707)
Step... (31425 | Loss: 0.2512398064136505, Learning Rate: 0.00011258183076279238, Gradient Norm: 0.7977393865585327)
Step... (31450 | Loss: 0.20275220274925232, Learning Rate: 0.0001124303016695194, Gradient Norm: 0.9182947874069214)
Step... (31475 | Loss: 0.24418334662914276, Learning Rate: 0.00011227879440411925, Gradient Norm: 0.754993200302124)
Step... (31500 | Loss: 0.22339417040348053, Learning Rate: 0.00011212728713871911, Gradient Norm: 1.0240917205810547)
Step... (31525 | Loss: 0.16413870453834534, Learning Rate: 0.00011197575804544613, Gradient Norm: 0.7246009111404419)
Step... (31550 | Loss: 0.20691168308258057, Learning Rate: 0.00011182425078004599, Gradient Norm: 0.9897738695144653)
Step... (31575 | Loss: 0.17092859745025635, Learning Rate: 0.00011167274351464584, Gradient Norm: 0.8305033445358276)
Step... (31600 | Loss: 0.21330074965953827, Learning Rate: 0.00011152121442137286, Gradient Norm: 0.911015510559082)
Step... (31625 | Loss: 0.20591917634010315, Learning Rate: 0.00011136970715597272, Gradient Norm: 0.8315929770469666)
Step... (31650 | Loss: 0.18346701562404633, Learning Rate: 0.00011121819261461496, Gradient Norm: 0.8654176592826843)
Step... (31675 | Loss: 0.1644788384437561, Learning Rate: 0.0001110666707972996, Gradient Norm: 0.8219828605651855)
Step... (31700 | Loss: 0.16800516843795776, Learning Rate: 0.00011091515625594184, Gradient Norm: 1.1362719535827637)
Step... (31725 | Loss: 0.2015790045261383, Learning Rate: 0.0001107636489905417, Gradient Norm: 0.7431246042251587)

Training...:  28% 3937/13907 [2:37:32<5:35:07,  2.02s/it][A
Training...:  28% 3938/13907 [2:37:34<5:27:28,  1.97s/it][A
Training...:  28% 3939/13907 [2:37:36<5:19:38,  1.92s/it][A
Training...:  28% 3940/13907 [2:37:38<5:11:18,  1.87s/it][A
Training...:  28% 3941/13907 [2:37:39<5:03:01,  1.82s/it][A
Training...:  28% 3942/13907 [2:37:41<4:54:18,  1.77s/it][A
Training...:  28% 3943/13907 [2:37:43<4:46:44,  1.73s/it][A
Training...:  28% 3944/13907 [2:37:44<4:40:05,  1.69s/it][A
Training...:  28% 3945/13907 [2:37:46<4:33:31,  1.65s/it][A
Training...:  28% 3946/13907 [2:37:47<4:24:44,  1.59s/it][A
Training...:  28% 3947/13907 [2:37:49<4:14:53,  1.54s/it][A
Training...:  28% 3948/13907 [2:37:50<4:04:02,  1.47s/it][A
Training...:  28% 3949/13907 [2:37:51<3:52:25,  1.40s/it][A
Training...:  28% 3950/13907 [2:37:52<3:35:59,  1.30s/it][A
Training...:  28% 3951/13907 [2:37:56<5:38:42,  2.04s/it][A
Training...:  28% 3952/13907 [2:38:00<6:52:15,  2.48s/it][A
Training...:  28% 3953/13907 [2:38:03<7:28:57,  2.71s/it][A
Training...:  28% 3954/13907 [2:38:06<7:50:58,  2.84s/it][A
Training...:  28% 3955/13907 [2:38:09<8:00:06,  2.89s/it][A
Training...:  28% 3956/13907 [2:38:12<8:03:02,  2.91s/it][A
Training...:  28% 3957/13907 [2:38:15<7:59:10,  2.89s/it][A
Training...:  28% 3958/13907 [2:38:18<7:54:34,  2.86s/it][A
Training...:  28% 3959/13907 [2:38:20<7:47:34,  2.82s/it][A
Training...:  28% 3960/13907 [2:38:23<7:41:52,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:08:37<17:31:07, 31533.87s/it]
Training...:  28% 3960/13907 [2:38:26<7:41:52,  2.79s/it][A
Training...:  28% 3961/13907 [2:38:26<7:55:02,  2.87s/it][A
Training...:  28% 3962/13907 [2:38:29<7:47:33,  2.82s/it][A
Training...:  28% 3963/13907 [2:38:31<7:36:38,  2.76s/it][A
Training...:  29% 3964/13907 [2:38:34<7:25:06,  2.69s/it][A
Training...:  29% 3965/13907 [2:38:36<7:14:55,  2.62s/it][A
Training...:  29% 3966/13907 [2:38:39<7:05:34,  2.57s/it][A
Training...:  29% 3967/13907 [2:38:41<6:59:22,  2.53s/it][A
Training...:  29% 3968/13907 [2:38:44<6:52:03,  2.49s/it][A
Training...:  29% 3969/13907 [2:38:46<6:45:06,  2.45s/it][A
Training...:  29% 3970/13907 [2:38:48<6:40:19,  2.42s/it][A
Training...:  29% 3971/13907 [2:38:51<6:33:57,  2.38s/it][A
Training...:  29% 3972/13907 [2:38:53<6:28:05,  2.34s/it][A
Training...:  29% 3973/13907 [2:38:55<6:21:43,  2.31s/it][A
Training...:  29% 3974/13907 [2:38:57<6:16:05,  2.27s/it][A
Training...:  29% 3975/13907 [2:38:59<6:10:33,  2.24s/it][A
Training...:  29% 3976/13907 [2:39:02<6:05:02,  2.21s/it][A
Training...:  29% 3977/13907 [2:39:04<6:01:16,  2.18s/it][A
Training...:  29% 3978/13907 [2:39:06<5:57:08,  2.16s/it][A
Training...:  29% 3979/13907 [2:39:08<5:54:32,  2.14s/it][A
Training...:  29% 3980/13907 [2:39:10<5:49:16,  2.11s/it][A
Training...:  29% 3981/13907 [2:39:12<5:45:35,  2.09s/it][A
Training...:  29% 3982/13907 [2:39:14<5:40:04,  2.06s/it][A
Training...:  29% 3983/13907 [2:39:16<5:33:48,  2.02s/it][A
Training...:  29% 3984/13907 [2:39:18<5:28:05,  1.98s/it][A
Training...:  29% 3985/13907 [2:39:20<5:21:58,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:09:33<17:31:07, 31533.87s/it]
Training...:  29% 3985/13907 [2:39:22<5:21:58,  1.95s/it][A
Training...:  29% 3986/13907 [2:39:22<5:32:04,  2.01s/it][A
Training...:  29% 3987/13907 [2:39:24<5:26:00,  1.97s/it][A
Training...:  29% 3988/13907 [2:39:26<5:16:42,  1.92s/it][A
Training...:  29% 3989/13907 [2:39:27<5:08:41,  1.87s/it][A
Training...:  29% 3990/13907 [2:39:29<5:00:49,  1.82s/it][A
Training...:  29% 3991/13907 [2:39:31<4:54:00,  1.78s/it][A
Training...:  29% 3992/13907 [2:39:32<4:47:34,  1.74s/it][A
Training...:  29% 3993/13907 [2:39:34<4:41:00,  1.70s/it][A
Training...:  29% 3994/13907 [2:39:35<4:34:13,  1.66s/it][A
Training...:  29% 3995/13907 [2:39:37<4:27:12,  1.62s/it][A
Training...:  29% 3996/13907 [2:39:38<4:18:55,  1.57s/it][A
Training...:  29% 3997/13907 [2:39:40<4:08:36,  1.51s/it][A
Training...:  29% 3998/13907 [2:39:41<3:57:50,  1.44s/it][A
Training...:  29% 3999/13907 [2:39:42<3:46:22,  1.37s/it][A
Training...:  29% 4000/13907 [2:39:43<3:30:15,  1.27s/it][A
Training...:  29% 4001/13907 [2:39:47<5:29:56,  2.00s/it][A
Training...:  29% 4002/13907 [2:39:51<6:42:19,  2.44s/it][A
Training...:  29% 4003/13907 [2:39:54<7:24:37,  2.69s/it][A
Training...:  29% 4004/13907 [2:39:57<7:46:45,  2.83s/it][A
Training...:  29% 4005/13907 [2:40:00<7:56:30,  2.89s/it][A
Training...:  29% 4006/13907 [2:40:03<8:00:36,  2.91s/it][A
Training...:  29% 4007/13907 [2:40:06<8:00:58,  2.91s/it][A
Training...:  29% 4008/13907 [2:40:09<7:56:54,  2.89s/it][A
Training...:  29% 4009/13907 [2:40:11<7:51:32,  2.86s/it][A
Training...:  29% 4010/13907 [2:40:14<7:45:53,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:10:28<17:31:07, 31533.87s/it]
Training...:  29% 4010/13907 [2:40:17<7:45:53,  2.82s/it][A
Training...:  29% 4011/13907 [2:40:17<7:58:30,  2.90s/it][A
Training...:  29% 4012/13907 [2:40:20<7:49:20,  2.85s/it][A
Training...:  29% 4013/13907 [2:40:23<7:35:08,  2.76s/it][A
Training...:  29% 4014/13907 [2:40:25<7:24:25,  2.70s/it][A
Training...:  29% 4015/13907 [2:40:28<7:15:45,  2.64s/it][A
Training...:  29% 4016/13907 [2:40:30<7:11:35,  2.62s/it][A
Training...:  29% 4017/13907 [2:40:33<7:07:54,  2.60s/it][A
Training...:  29% 4018/13907 [2:40:35<7:01:38,  2.56s/it][A
Training...:  29% 4019/13907 [2:40:38<6:51:41,  2.50s/it][A
Training...:  29% 4020/13907 [2:40:40<6:42:36,  2.44s/it][A
Training...:  29% 4021/13907 [2:40:42<6:35:46,  2.40s/it][A
Training...:  29% 4022/13907 [2:40:44<6:26:39,  2.35s/it][A
Training...:  29% 4023/13907 [2:40:47<6:19:28,  2.30s/it][A
Training...:  29% 4024/13907 [2:40:49<6:12:06,  2.26s/it][A
Training...:  29% 4025/13907 [2:40:51<6:05:38,  2.22s/it][A
Training...:  29% 4026/13907 [2:40:53<6:00:16,  2.19s/it][A
Training...:  29% 4027/13907 [2:40:55<5:55:13,  2.16s/it][A
Training...:  29% 4028/13907 [2:40:57<5:48:34,  2.12s/it][A
Training...:  29% 4029/13907 [2:40:59<5:43:44,  2.09s/it][A
Training...:  29% 4030/13907 [2:41:01<5:38:49,  2.06s/it][A
Training...:  29% 4031/13907 [2:41:03<5:34:57,  2.04s/it][A
Training...:  29% 4032/13907 [2:41:05<5:32:34,  2.02s/it][A
Training...:  29% 4033/13907 [2:41:07<5:28:46,  2.00s/it][A
Training...:  29% 4034/13907 [2:41:09<5:25:18,  1.98s/it][A
Training...:  29% 4035/13907 [2:41:11<5:21:10,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:11:24<17:31:07, 31533.87s/it]
Training...:  29% 4035/13907 [2:41:13<5:21:10,  1.95s/it][A
Training...:  29% 4036/13907 [2:41:13<5:31:54,  2.02s/it][A
Training...:  29% 4037/13907 [2:41:15<5:25:45,  1.98s/it][A
Training...:  29% 4038/13907 [2:41:17<5:15:54,  1.92s/it][A
Training...:  29% 4039/13907 [2:41:18<5:07:17,  1.87s/it][A
Training...:  29% 4040/13907 [2:41:20<4:58:55,  1.82s/it][A
Training...:  29% 4041/13907 [2:41:22<4:50:46,  1.77s/it][A
Training...:  29% 4042/13907 [2:41:23<4:44:19,  1.73s/it][A
Training...:  29% 4043/13907 [2:41:25<4:38:09,  1.69s/it][A
Training...:  29% 4044/13907 [2:41:27<4:31:23,  1.65s/it][A
Training...:  29% 4045/13907 [2:41:28<4:24:32,  1.61s/it][A
Training...:  29% 4046/13907 [2:41:30<4:18:04,  1.57s/it][A
Training...:  29% 4047/13907 [2:41:31<4:08:59,  1.52s/it][A
Training...:  29% 4048/13907 [2:41:32<3:58:29,  1.45s/it][A
Training...:  29% 4049/13907 [2:41:34<3:46:21,  1.38s/it][A
Training...:  29% 4050/13907 [2:41:35<3:29:06,  1.27s/it][A
Training...:  29% 4051/13907 [2:41:38<5:32:39,  2.03s/it][A
Training...:  29% 4052/13907 [2:41:42<6:43:57,  2.46s/it][A
Training...:  29% 4053/13907 [2:41:45<7:21:56,  2.69s/it][A
Training...:  29% 4054/13907 [2:41:48<7:43:08,  2.82s/it][A
Training...:  29% 4055/13907 [2:41:51<7:53:33,  2.88s/it][A
Training...:  29% 4056/13907 [2:41:54<7:56:45,  2.90s/it][A
Training...:  29% 4057/13907 [2:41:57<7:55:12,  2.89s/it][A
Training...:  29% 4058/13907 [2:42:00<7:51:58,  2.88s/it][A
Training...:  29% 4059/13907 [2:42:03<7:47:44,  2.85s/it][A
Training...:  29% 4060/13907 [2:42:05<7:42:17,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:12:20<17:31:07, 31533.87s/it]
Training...:  29% 4060/13907 [2:42:08<7:42:17,  2.82s/it][A
Training...:  29% 4061/13907 [2:42:08<7:58:05,  2.91s/it][A
Training...:  29% 4062/13907 [2:42:11<7:49:06,  2.86s/it][A
Training...:  29% 4063/13907 [2:42:14<7:37:36,  2.79s/it][A
Training...:  29% 4064/13907 [2:42:16<7:26:28,  2.72s/it][A
Training...:  29% 4065/13907 [2:42:19<7:19:55,  2.68s/it][A
Training...:  29% 4066/13907 [2:42:22<7:12:39,  2.64s/it][A
Training...:  29% 4067/13907 [2:42:24<7:07:45,  2.61s/it][A
Training...:  29% 4068/13907 [2:42:27<7:02:07,  2.57s/it][A
Training...:  29% 4069/13907 [2:42:29<6:56:24,  2.54s/it][A
Training...:  29% 4070/13907 [2:42:31<6:51:17,  2.51s/it][A
Training...:  29% 4071/13907 [2:42:34<6:46:59,  2.48s/it][A
Training...:  29% 4072/13907 [2:42:36<6:38:30,  2.43s/it][A
Training...:  29% 4073/13907 [2:42:38<6:28:17,  2.37s/it][A
Training...:  29% 4074/13907 [2:42:41<6:19:27,  2.32s/it][A
Training...:  29% 4075/13907 [2:42:43<6:11:59,  2.27s/it][A
Training...:  29% 4076/13907 [2:42:45<6:06:02,  2.23s/it][A
Training...:  29% 4077/13907 [2:42:47<6:00:39,  2.20s/it][A
Training...:  29% 4078/13907 [2:42:49<5:53:29,  2.16s/it][A
Training...:  29% 4079/13907 [2:42:51<5:49:51,  2.14s/it][A
Training...:  29% 4080/13907 [2:42:53<5:43:41,  2.10s/it][A
Training...:  29% 4081/13907 [2:42:55<5:37:46,  2.06s/it][A
Training...:  29% 4082/13907 [2:42:57<5:32:10,  2.03s/it][A
Training...:  29% 4083/13907 [2:42:59<5:27:20,  2.00s/it][A
Training...:  29% 4084/13907 [2:43:01<5:22:11,  1.97s/it][A
Training...:  29% 4085/13907 [2:43:03<5:17:16,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:13:16<17:31:07, 31533.87s/it]
Training...:  29% 4085/13907 [2:43:05<5:17:16,  1.94s/it][A
Training...:  29% 4086/13907 [2:43:05<5:26:58,  2.00s/it][A
Training...:  29% 4087/13907 [2:43:07<5:22:36,  1.97s/it][A
Training...:  29% 4088/13907 [2:43:09<5:13:23,  1.91s/it][A
Training...:  29% 4089/13907 [2:43:10<5:05:46,  1.87s/it][A
Training...:  29% 4090/13907 [2:43:12<4:59:21,  1.83s/it][A
Training...:  29% 4091/13907 [2:43:14<4:51:58,  1.78s/it][A
Training...:  29% 4092/13907 [2:43:15<4:44:55,  1.74s/it][A
Training...:  29% 4093/13907 [2:43:17<4:40:06,  1.71s/it][A
Training...:  29% 4094/13907 [2:43:19<4:32:57,  1.67s/it][A
Training...:  29% 4095/13907 [2:43:20<4:27:27,  1.64s/it][A
Training...:  29% 4096/13907 [2:43:22<4:20:57,  1.60s/it][A
Training...:  29% 4097/13907 [2:43:23<4:11:42,  1.54s/it][A
Training...:  29% 4098/13907 [2:43:24<4:01:21,  1.48s/it][A
Training...:  29% 4099/13907 [2:43:26<3:50:09,  1.41s/it][A
Training...:  29% 4100/13907 [2:43:27<3:34:16,  1.31s/it][A
Training...:  29% 4101/13907 [2:43:31<5:33:01,  2.04s/it][A
Training...:  29% 4102/13907 [2:43:34<6:43:51,  2.47s/it][A
Training...:  30% 4103/13907 [2:43:37<7:21:19,  2.70s/it][A
Training...:  30% 4104/13907 [2:43:40<7:42:41,  2.83s/it][A
Training...:  30% 4105/13907 [2:43:43<7:52:55,  2.89s/it][A
Training...:  30% 4106/13907 [2:43:46<7:59:22,  2.93s/it][A
Training...:  30% 4107/13907 [2:43:49<7:58:40,  2.93s/it][A
Training...:  30% 4108/13907 [2:43:52<7:52:47,  2.89s/it][A
Training...:  30% 4109/13907 [2:43:55<7:45:23,  2.85s/it][A
Training...:  30% 4110/13907 [2:43:58<7:37:28,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:14:12<17:31:07, 31533.87s/it]
Training...:  30% 4110/13907 [2:44:01<7:37:28,  2.80s/it][A
Training...:  30% 4111/13907 [2:44:01<7:49:58,  2.88s/it][A
Training...:  30% 4112/13907 [2:44:03<7:38:41,  2.81s/it][A
Training...:  30% 4113/13907 [2:44:06<7:25:51,  2.73s/it][A
Training...:  30% 4114/13907 [2:44:09<7:19:56,  2.70s/it][A
Training...:  30% 4115/13907 [2:44:11<7:09:54,  2.63s/it][A
Training...:  30% 4116/13907 [2:44:13<7:01:05,  2.58s/it][A
Training...:  30% 4117/13907 [2:44:16<6:53:27,  2.53s/it][A
Training...:  30% 4118/13907 [2:44:18<6:46:24,  2.49s/it][A
Training...:  30% 4119/13907 [2:44:21<6:39:09,  2.45s/it][A
Training...:  30% 4120/13907 [2:44:23<6:33:10,  2.41s/it][A
Training...:  30% 4121/13907 [2:44:25<6:28:59,  2.39s/it][A
Training...:  30% 4122/13907 [2:44:28<6:23:39,  2.35s/it][A
Training...:  30% 4123/13907 [2:44:30<6:20:13,  2.33s/it][A
Training...:  30% 4124/13907 [2:44:32<6:17:40,  2.32s/it][A
Training...:  30% 4125/13907 [2:44:34<6:11:01,  2.28s/it][A
Training...:  30% 4126/13907 [2:44:36<6:05:19,  2.24s/it][A
Training...:  30% 4127/13907 [2:44:39<5:58:49,  2.20s/it][A
Training...:  30% 4128/13907 [2:44:41<5:52:59,  2.17s/it][A
Training...:  30% 4129/13907 [2:44:43<5:48:33,  2.14s/it][A
Training...:  30% 4130/13907 [2:44:45<5:43:32,  2.11s/it][A
Training...:  30% 4131/13907 [2:44:47<5:39:30,  2.08s/it][A
Training...:  30% 4132/13907 [2:44:49<5:36:31,  2.07s/it][A
Training...:  30% 4133/13907 [2:44:51<5:35:07,  2.06s/it][A
Training...:  30% 4134/13907 [2:44:53<5:29:52,  2.03s/it][A
Training...:  30% 4135/13907 [2:44:55<5:22:03,  1.98s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:15:08<17:31:07, 31533.87s/it]
Training...:  30% 4135/13907 [2:44:57<5:22:03,  1.98s/it][A
Training...:  30% 4136/13907 [2:44:57<5:31:10,  2.03s/it][A
Training...:  30% 4137/13907 [2:44:59<5:26:13,  2.00s/it][A
Training...:  30% 4138/13907 [2:45:01<5:15:40,  1.94s/it][A
Training...:  30% 4139/13907 [2:45:02<5:06:35,  1.88s/it][A
Training...:  30% 4140/13907 [2:45:04<4:58:02,  1.83s/it][A
Training...:  30% 4141/13907 [2:45:06<4:51:37,  1.79s/it][A
Training...:  30% 4142/13907 [2:45:07<4:45:16,  1.75s/it][A
Training...:  30% 4143/13907 [2:45:09<4:39:17,  1.72s/it][A
Training...:  30% 4144/13907 [2:45:11<4:33:17,  1.68s/it][A
Training...:  30% 4145/13907 [2:45:12<4:27:44,  1.65s/it][A
Training...:  30% 4146/13907 [2:45:14<4:20:08,  1.60s/it][A
Training...:  30% 4147/13907 [2:45:15<4:11:00,  1.54s/it][A
Training...:  30% 4148/13907 [2:45:16<4:00:30,  1.48s/it][A
Training...:  30% 4149/13907 [2:45:18<3:48:30,  1.41s/it][A
Training...:  30% 4150/13907 [2:45:19<3:32:41,  1.31s/it][A
Training...:  30% 4151/13907 [2:45:22<5:31:28,  2.04s/it][A
Training...:  30% 4152/13907 [2:45:26<6:37:42,  2.45s/it][A
Training...:  30% 4153/13907 [2:45:29<7:12:50,  2.66s/it][A
Training...:  30% 4154/13907 [2:45:32<7:33:48,  2.79s/it][A
Training...:  30% 4155/13907 [2:45:35<7:45:26,  2.86s/it][A
Training...:  30% 4156/13907 [2:45:38<7:49:10,  2.89s/it][A
Training...:  30% 4157/13907 [2:45:41<7:47:51,  2.88s/it][A
Training...:  30% 4158/13907 [2:45:44<7:46:03,  2.87s/it][A
Training...:  30% 4159/13907 [2:45:47<7:40:50,  2.84s/it][A
Training...:  30% 4160/13907 [2:45:49<7:36:28,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:16:03<17:31:07, 31533.87s/it]
Training...:  30% 4160/13907 [2:45:52<7:36:28,  2.81s/it][A
Training...:  30% 4161/13907 [2:45:52<7:48:12,  2.88s/it][A
Training...:  30% 4162/13907 [2:45:55<7:38:58,  2.83s/it][A
Training...:  30% 4163/13907 [2:45:58<7:26:55,  2.75s/it][A
Training...:  30% 4164/13907 [2:46:00<7:17:15,  2.69s/it][A
Training...:  30% 4165/13907 [2:46:03<7:06:55,  2.63s/it][A
Training...:  30% 4166/13907 [2:46:05<7:01:17,  2.59s/it][A
Training...:  30% 4167/13907 [2:46:08<6:57:19,  2.57s/it][A
Training...:  30% 4168/13907 [2:46:10<6:49:03,  2.52s/it][A
Training...:  30% 4169/13907 [2:46:12<6:41:29,  2.47s/it][A
Training...:  30% 4170/13907 [2:46:15<6:35:04,  2.43s/it][A
Training...:  30% 4171/13907 [2:46:17<6:29:11,  2.40s/it][A
Training...:  30% 4172/13907 [2:46:19<6:22:35,  2.36s/it][A
Training...:  30% 4173/13907 [2:46:22<6:15:29,  2.31s/it][A
Training...:  30% 4174/13907 [2:46:24<6:09:25,  2.28s/it][A
Training...:  30% 4175/13907 [2:46:26<6:04:40,  2.25s/it][A
Training...:  30% 4176/13907 [2:46:28<5:59:10,  2.21s/it][A
Training...:  30% 4177/13907 [2:46:30<5:54:34,  2.19s/it][A
Training...:  30% 4178/13907 [2:46:32<5:50:28,  2.16s/it][A
Training...:  30% 4179/13907 [2:46:34<5:46:20,  2.14s/it][A
Training...:  30% 4180/13907 [2:46:36<5:41:08,  2.10s/it][A
Training...:  30% 4181/13907 [2:46:38<5:35:12,  2.07s/it][A
Training...:  30% 4182/13907 [2:46:40<5:28:58,  2.03s/it][A
Training...:  30% 4183/13907 [2:46:42<5:24:22,  2.00s/it][A
Training...:  30% 4184/13907 [2:46:44<5:20:41,  1.98s/it][A
Training...:  30% 4185/13907 [2:46:46<5:15:19,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:16:59<17:31:07, 31533.87s/it]
Training...:  30% 4185/13907 [2:46:48<5:15:19,  1.95s/it][A
Training...:  30% 4186/13907 [2:46:48<5:25:15,  2.01s/it][A
Training...:  30% 4187/13907 [2:46:50<5:19:17,  1.97s/it][A
Training...:  30% 4188/13907 [2:46:52<5:09:36,  1.91s/it][A
Training...:  30% 4189/13907 [2:46:54<5:01:01,  1.86s/it][A
Training...:  30% 4190/13907 [2:46:55<4:53:59,  1.82s/it][A
Training...:  30% 4191/13907 [2:46:57<4:46:31,  1.77s/it][A
Training...:  30% 4192/13907 [2:46:59<4:39:48,  1.73s/it][A
Training...:  30% 4193/13907 [2:47:00<4:32:38,  1.68s/it][A
Training...:  30% 4194/13907 [2:47:02<4:26:28,  1.65s/it][A
Training...:  30% 4195/13907 [2:47:03<4:19:25,  1.60s/it][A
Training...:  30% 4196/13907 [2:47:05<4:11:08,  1.55s/it][A
Training...:  30% 4197/13907 [2:47:06<4:03:20,  1.50s/it][A
Training...:  30% 4198/13907 [2:47:07<3:54:40,  1.45s/it][A
Training...:  30% 4199/13907 [2:47:09<3:43:37,  1.38s/it][A
Training...:  30% 4200/13907 [2:47:10<3:28:22,  1.29s/it][A
Training...:  30% 4201/13907 [2:47:14<5:32:13,  2.05s/it][A
Training...:  30% 4202/13907 [2:47:17<6:44:40,  2.50s/it][A
Training...:  30% 4203/13907 [2:47:20<7:25:40,  2.76s/it][A
Training...:  30% 4204/13907 [2:47:24<7:48:37,  2.90s/it][A
Training...:  30% 4205/13907 [2:47:27<8:00:19,  2.97s/it][A
Training...:  30% 4206/13907 [2:47:30<7:58:38,  2.96s/it][A
Training...:  30% 4207/13907 [2:47:33<7:57:16,  2.95s/it][A
Training...:  30% 4208/13907 [2:47:36<7:50:57,  2.91s/it][A
Training...:  30% 4209/13907 [2:47:38<7:44:18,  2.87s/it][A
Training...:  30% 4210/13907 [2:47:41<7:36:18,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:17:55<17:31:07, 31533.87s/it]
Training...:  30% 4210/13907 [2:47:44<7:36:18,  2.82s/it][A
Training...:  30% 4211/13907 [2:47:44<7:50:55,  2.91s/it][A
Training...:  30% 4212/13907 [2:47:47<7:41:52,  2.86s/it][A
Training...:  30% 4213/13907 [2:47:49<7:28:20,  2.77s/it][A
Training...:  30% 4214/13907 [2:47:52<7:17:42,  2.71s/it][A
Training...:  30% 4215/13907 [2:47:54<7:07:25,  2.65s/it][A
Training...:  30% 4216/13907 [2:47:57<6:57:27,  2.58s/it][A
Training...:  30% 4217/13907 [2:47:59<6:49:48,  2.54s/it][A
Training...:  30% 4218/13907 [2:48:02<6:41:54,  2.49s/it][A
Training...:  30% 4219/13907 [2:48:04<6:36:34,  2.46s/it][A
Training...:  30% 4220/13907 [2:48:06<6:30:29,  2.42s/it][A
Training...:  30% 4221/13907 [2:48:09<6:24:22,  2.38s/it][A
Training...:  30% 4222/13907 [2:48:11<6:20:36,  2.36s/it][A
Training...:  30% 4223/13907 [2:48:13<6:14:58,  2.32s/it][A
Training...:  30% 4224/13907 [2:48:16<6:09:51,  2.29s/it][A
Training...:  30% 4225/13907 [2:48:18<6:05:35,  2.27s/it][A
Training...:  30% 4226/13907 [2:48:20<5:58:48,  2.22s/it][A
Training...:  30% 4227/13907 [2:48:22<5:53:28,  2.19s/it][A
Training...:  30% 4228/13907 [2:48:24<5:48:08,  2.16s/it][A
Training...:  30% 4229/13907 [2:48:26<5:43:55,  2.13s/it][A
Training...:  30% 4230/13907 [2:48:28<5:39:10,  2.10s/it][A
Training...:  30% 4231/13907 [2:48:30<5:34:24,  2.07s/it][A
Training...:  30% 4232/13907 [2:48:32<5:30:33,  2.05s/it][A
Training...:  30% 4233/13907 [2:48:34<5:25:18,  2.02s/it][A
Training...:  30% 4234/13907 [2:48:36<5:18:50,  1.98s/it][A
Training...:  30% 4235/13907 [2:48:38<5:16:04,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:18:51<17:31:07, 31533.87s/it]
Training...:  30% 4235/13907 [2:48:40<5:16:04,  1.96s/it][A
Training...:  30% 4236/13907 [2:48:40<5:27:44,  2.03s/it][A
Training...:  30% 4237/13907 [2:48:42<5:22:38,  2.00s/it][A
Training...:  30% 4238/13907 [2:48:44<5:12:21,  1.94s/it][A
Training...:  30% 4239/13907 [2:48:46<5:04:09,  1.89s/it][A
Training...:  30% 4240/13907 [2:48:47<4:58:02,  1.85s/it][A
Training...:  30% 4241/13907 [2:48:49<4:50:06,  1.80s/it][A
Training...:  31% 4242/13907 [2:48:51<4:41:53,  1.75s/it][A
Training...:  31% 4243/13907 [2:48:52<4:36:10,  1.71s/it][A
Training...:  31% 4244/13907 [2:48:54<4:29:22,  1.67s/it][A
Training...:  31% 4245/13907 [2:48:55<4:23:03,  1.63s/it][A
Training...:  31% 4246/13907 [2:48:57<4:13:49,  1.58s/it][A
Training...:  31% 4247/13907 [2:48:58<4:04:21,  1.52s/it][A
Training...:  31% 4248/13907 [2:49:00<3:53:44,  1.45s/it][A
Training...:  31% 4249/13907 [2:49:01<3:42:33,  1.38s/it][A
Training...:  31% 4250/13907 [2:49:02<3:25:46,  1.28s/it][A
Training...:  31% 4251/13907 [2:49:06<5:24:40,  2.02s/it][A
Training...:  31% 4252/13907 [2:49:09<6:36:09,  2.46s/it][A
Training...:  31% 4253/13907 [2:49:12<7:14:17,  2.70s/it][A
Training...:  31% 4254/13907 [2:49:15<7:35:45,  2.83s/it][A
Training...:  31% 4255/13907 [2:49:18<7:46:54,  2.90s/it][A
Training...:  31% 4256/13907 [2:49:21<7:48:58,  2.92s/it][A
Training...:  31% 4257/13907 [2:49:24<7:47:11,  2.90s/it][A
Training...:  31% 4258/13907 [2:49:27<7:44:02,  2.89s/it][A
Training...:  31% 4259/13907 [2:49:30<7:40:37,  2.86s/it][A
Training...:  31% 4260/13907 [2:49:33<7:34:19,  2.83s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:19:47<17:31:07, 31533.87s/it]
Training...:  31% 4260/13907 [2:49:36<7:34:19,  2.83s/it][A
Training...:  31% 4261/13907 [2:49:36<7:46:28,  2.90s/it][A
Training...:  31% 4262/13907 [2:49:38<7:35:35,  2.83s/it][A
Training...:  31% 4263/13907 [2:49:41<7:23:24,  2.76s/it][A
Training...:  31% 4264/13907 [2:49:44<7:13:24,  2.70s/it][A
Training...:  31% 4265/13907 [2:49:46<7:04:41,  2.64s/it][A
Training...:  31% 4266/13907 [2:49:49<6:58:28,  2.60s/it][A
Training...:  31% 4267/13907 [2:49:51<6:55:14,  2.58s/it][A
Training...:  31% 4268/13907 [2:49:54<6:45:52,  2.53s/it][A
Training...:  31% 4269/13907 [2:49:56<6:38:43,  2.48s/it][A
Training...:  31% 4270/13907 [2:49:58<6:30:49,  2.43s/it][A
Training...:  31% 4271/13907 [2:50:01<6:24:18,  2.39s/it][A
Training...:  31% 4272/13907 [2:50:03<6:18:21,  2.36s/it][A
Training...:  31% 4273/13907 [2:50:05<6:12:11,  2.32s/it][A
Training...:  31% 4274/13907 [2:50:07<6:06:21,  2.28s/it][A
Training...:  31% 4275/13907 [2:50:09<6:01:36,  2.25s/it][A
Training...:  31% 4276/13907 [2:50:12<5:56:35,  2.22s/it][A
Training...:  31% 4277/13907 [2:50:14<5:51:42,  2.19s/it][A
Training...:  31% 4278/13907 [2:50:16<5:46:18,  2.16s/it][A
Training...:  31% 4279/13907 [2:50:18<5:42:10,  2.13s/it][A
Training...:  31% 4280/13907 [2:50:20<5:37:13,  2.10s/it][A
Training...:  31% 4281/13907 [2:50:22<5:32:11,  2.07s/it][A
Training...:  31% 4282/13907 [2:50:24<5:27:58,  2.04s/it][A
Training...:  31% 4283/13907 [2:50:26<5:23:47,  2.02s/it][A
Training...:  31% 4284/13907 [2:50:28<5:20:01,  2.00s/it][A
Training...:  31% 4285/13907 [2:50:30<5:16:09,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:20:43<17:31:07, 31533.87s/it]
Training...:  31% 4285/13907 [2:50:32<5:16:09,  1.97s/it][A
Training...:  31% 4286/13907 [2:50:32<5:26:15,  2.03s/it][A
Training...:  31% 4287/13907 [2:50:34<5:21:24,  2.00s/it][A
Training...:  31% 4288/13907 [2:50:36<5:12:33,  1.95s/it][A
Training...:  31% 4289/13907 [2:50:37<5:05:16,  1.90s/it][A
Training...:  31% 4290/13907 [2:50:39<4:56:20,  1.85s/it][A
Training...:  31% 4291/13907 [2:50:41<4:48:05,  1.80s/it][A
Training...:  31% 4292/13907 [2:50:42<4:40:45,  1.75s/it][A
Training...:  31% 4293/13907 [2:50:44<4:34:09,  1.71s/it][A
Training...:  31% 4294/13907 [2:50:46<4:27:08,  1.67s/it][A
Training...:  31% 4295/13907 [2:50:47<4:20:22,  1.63s/it][A
Training...:  31% 4296/13907 [2:50:49<4:13:09,  1.58s/it][A
Training...:  31% 4297/13907 [2:50:50<4:04:43,  1.53s/it][A
Training...:  31% 4298/13907 [2:50:51<3:55:17,  1.47s/it][A
Training...:  31% 4299/13907 [2:50:53<3:44:52,  1.40s/it][A
Training...:  31% 4300/13907 [2:50:54<3:29:19,  1.31s/it][A
Training...:  31% 4301/13907 [2:50:57<5:23:19,  2.02s/it][A
Training...:  31% 4302/13907 [2:51:01<6:37:52,  2.49s/it][A
Training...:  31% 4303/13907 [2:51:04<7:16:11,  2.73s/it][A
Training...:  31% 4304/13907 [2:51:07<7:35:41,  2.85s/it][A
Training...:  31% 4305/13907 [2:51:10<7:44:29,  2.90s/it][A
Training...:  31% 4306/13907 [2:51:13<7:44:46,  2.90s/it][A
Training...:  31% 4307/13907 [2:51:16<7:42:15,  2.89s/it][A
Training...:  31% 4308/13907 [2:51:19<7:38:18,  2.86s/it][A
Training...:  31% 4309/13907 [2:51:22<7:32:45,  2.83s/it][A
Training...:  31% 4310/13907 [2:51:24<7:25:15,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:21:39<17:31:07, 31533.87s/it]
Training...:  31% 4310/13907 [2:51:27<7:25:15,  2.78s/it][A
Training...:  31% 4311/13907 [2:51:27<7:38:31,  2.87s/it][A
Training...:  31% 4312/13907 [2:51:30<7:29:21,  2.81s/it][A
Training...:  31% 4313/13907 [2:51:33<7:19:47,  2.75s/it][A
Training...:  31% 4314/13907 [2:51:35<7:08:29,  2.68s/it][A
Training...:  31% 4315/13907 [2:51:38<7:01:29,  2.64s/it][A
Training...:  31% 4316/13907 [2:51:40<6:50:55,  2.57s/it][A
Training...:  31% 4317/13907 [2:51:43<6:42:45,  2.52s/it][A
Training...:  31% 4318/13907 [2:51:45<6:35:05,  2.47s/it][A
Training...:  31% 4319/13907 [2:51:47<6:30:02,  2.44s/it][A
Training...:  31% 4320/13907 [2:51:50<6:25:26,  2.41s/it][A
Training...:  31% 4321/13907 [2:51:52<6:21:45,  2.39s/it][A
Training...:  31% 4322/13907 [2:51:54<6:16:29,  2.36s/it][A
Training...:  31% 4323/13907 [2:51:57<6:10:09,  2.32s/it][A
Training...:  31% 4324/13907 [2:51:59<6:04:00,  2.28s/it][A
Training...:  31% 4325/13907 [2:52:01<5:58:58,  2.25s/it][A
Training...:  31% 4326/13907 [2:52:03<5:52:34,  2.21s/it][A
Training...:  31% 4327/13907 [2:52:05<5:47:45,  2.18s/it][A
Training...:  31% 4328/13907 [2:52:07<5:43:25,  2.15s/it][A
Training...:  31% 4329/13907 [2:52:09<5:39:20,  2.13s/it][A
Training...:  31% 4330/13907 [2:52:11<5:35:10,  2.10s/it][A
Training...:  31% 4331/13907 [2:52:13<5:32:59,  2.09s/it][A
Training...:  31% 4332/13907 [2:52:15<5:29:38,  2.07s/it][A
Training...:  31% 4333/13907 [2:52:17<5:22:21,  2.02s/it][A
Training...:  31% 4334/13907 [2:52:19<5:16:03,  1.98s/it][A
Training...:  31% 4335/13907 [2:52:21<5:11:36,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:22:34<17:31:07, 31533.87s/it]
Training...:  31% 4335/13907 [2:52:23<5:11:36,  1.95s/it][A
Training...:  31% 4336/13907 [2:52:23<5:21:07,  2.01s/it][A
Training...:  31% 4337/13907 [2:52:25<5:15:10,  1.98s/it][A
Training...:  31% 4338/13907 [2:52:27<5:05:41,  1.92s/it][A
Training...:  31% 4339/13907 [2:52:29<4:57:34,  1.87s/it][A
Training...:  31% 4340/13907 [2:52:30<4:49:49,  1.82s/it][A
Training...:  31% 4341/13907 [2:52:32<4:43:44,  1.78s/it][A
Training...:  31% 4342/13907 [2:52:34<4:37:16,  1.74s/it][A
Training...:  31% 4343/13907 [2:52:35<4:31:15,  1.70s/it][A
Training...:  31% 4344/13907 [2:52:37<4:24:44,  1.66s/it][A
Training...:  31% 4345/13907 [2:52:38<4:18:31,  1.62s/it][A
Training...:  31% 4346/13907 [2:52:40<4:10:21,  1.57s/it][A
Training...:  31% 4347/13907 [2:52:41<4:00:57,  1.51s/it][A
Training...:  31% 4348/13907 [2:52:43<3:51:17,  1.45s/it][A
Training...:  31% 4349/13907 [2:52:44<3:40:08,  1.38s/it][A
Training...:  31% 4350/13907 [2:52:45<3:24:43,  1.29s/it][A
Training...:  31% 4351/13907 [2:52:49<5:21:33,  2.02s/it][A
Training...:  31% 4352/13907 [2:52:52<6:32:36,  2.47s/it][A
Training...:  31% 4353/13907 [2:52:55<7:11:12,  2.71s/it][A
Training...:  31% 4354/13907 [2:52:58<7:32:03,  2.84s/it][A
Training...:  31% 4355/13907 [2:53:02<7:41:42,  2.90s/it][A
Training...:  31% 4356/13907 [2:53:05<7:45:41,  2.93s/it][A
Training...:  31% 4357/13907 [2:53:07<7:43:41,  2.91s/it][A
Training...:  31% 4358/13907 [2:53:10<7:42:22,  2.91s/it][A
Training...:  31% 4359/13907 [2:53:13<7:36:43,  2.87s/it][A
Training...:  31% 4360/13907 [2:53:16<7:30:46,  2.83s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:23:30<17:31:07, 31533.87s/it]
Training...:  31% 4360/13907 [2:53:19<7:30:46,  2.83s/it][A
Training...:  31% 4361/13907 [2:53:19<7:44:13,  2.92s/it][A
Training...:  31% 4362/13907 [2:53:22<7:33:57,  2.85s/it][A
Training...:  31% 4363/13907 [2:53:24<7:23:37,  2.79s/it][A
Training...:  31% 4364/13907 [2:53:27<7:13:09,  2.72s/it][A
Training...:  31% 4365/13907 [2:53:29<7:04:17,  2.67s/it][A
Training...:  31% 4366/13907 [2:53:32<7:00:26,  2.64s/it][A
Training...:  31% 4367/13907 [2:53:35<7:01:16,  2.65s/it][A
Training...:  31% 4368/13907 [2:53:37<6:54:34,  2.61s/it][A
Training...:  31% 4369/13907 [2:53:40<6:50:12,  2.58s/it][A
Training...:  31% 4370/13907 [2:53:42<6:39:58,  2.52s/it][A
Training...:  31% 4371/13907 [2:53:44<6:30:52,  2.46s/it][A
Training...:  31% 4372/13907 [2:53:47<6:23:10,  2.41s/it][A
Training...:  31% 4373/13907 [2:53:49<6:14:47,  2.36s/it][A
Training...:  31% 4374/13907 [2:53:51<6:06:53,  2.31s/it][A
Training...:  31% 4375/13907 [2:53:53<6:00:10,  2.27s/it][A
Training...:  31% 4376/13907 [2:53:55<5:53:04,  2.22s/it][A
Training...:  31% 4377/13907 [2:53:57<5:46:42,  2.18s/it][A
Training...:  31% 4378/13907 [2:54:00<5:40:24,  2.14s/it][A
Training...:  31% 4379/13907 [2:54:02<5:36:05,  2.12s/it][A
Training...:  31% 4380/13907 [2:54:04<5:31:35,  2.09s/it][A
Training...:  32% 4381/13907 [2:54:06<5:27:06,  2.06s/it][A
Training...:  32% 4382/13907 [2:54:08<5:22:09,  2.03s/it][A
Training...:  32% 4383/13907 [2:54:10<5:18:46,  2.01s/it][A
Training...:  32% 4384/13907 [2:54:11<5:13:24,  1.97s/it][A
Training...:  32% 4385/13907 [2:54:13<5:07:40,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:24:26<17:31:07, 31533.87s/it]
Training...:  32% 4385/13907 [2:54:15<5:07:40,  1.94s/it][A
Training...:  32% 4386/13907 [2:54:15<5:17:36,  2.00s/it][A
Training...:  32% 4387/13907 [2:54:17<5:11:46,  1.96s/it][A
Training...:  32% 4388/13907 [2:54:19<5:02:28,  1.91s/it][A
Training...:  32% 4389/13907 [2:54:21<4:54:44,  1.86s/it][A
Training...:  32% 4390/13907 [2:54:23<4:47:45,  1.81s/it][A
Training...:  32% 4391/13907 [2:54:24<4:42:39,  1.78s/it][A
Training...:  32% 4392/13907 [2:54:26<4:35:52,  1.74s/it][A
Training...:  32% 4393/13907 [2:54:27<4:30:21,  1.70s/it][A
Training...:  32% 4394/13907 [2:54:29<4:23:49,  1.66s/it][A
Training...:  32% 4395/13907 [2:54:31<4:16:01,  1.61s/it][A
Training...:  32% 4396/13907 [2:54:32<4:07:32,  1.56s/it][A
Training...:  32% 4397/13907 [2:54:33<3:59:12,  1.51s/it][A
Training...:  32% 4398/13907 [2:54:35<3:50:23,  1.45s/it][A
Training...:  32% 4399/13907 [2:54:36<3:39:57,  1.39s/it][A
Training...:  32% 4400/13907 [2:54:37<3:26:03,  1.30s/it][A
Training...:  32% 4401/13907 [2:54:41<5:28:13,  2.07s/it][A
Training...:  32% 4402/13907 [2:54:44<6:35:23,  2.50s/it][A
Training...:  32% 4403/13907 [2:54:48<7:12:02,  2.73s/it][A
Training...:  32% 4404/13907 [2:54:51<7:28:40,  2.83s/it][A
Training...:  32% 4405/13907 [2:54:54<7:38:21,  2.89s/it][A
Training...:  32% 4406/13907 [2:54:57<7:46:17,  2.94s/it][A
Training...:  32% 4407/13907 [2:55:00<7:45:22,  2.94s/it][A
Training...:  32% 4408/13907 [2:55:03<7:39:38,  2.90s/it][A
Training...:  32% 4409/13907 [2:55:05<7:32:50,  2.86s/it][A
Training...:  32% 4410/13907 [2:55:08<7:26:05,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:25:22<17:31:07, 31533.87s/it]
Training...:  32% 4410/13907 [2:55:11<7:26:05,  2.82s/it][A
Training...:  32% 4411/13907 [2:55:11<7:38:28,  2.90s/it][A
Training...:  32% 4412/13907 [2:55:14<7:30:16,  2.85s/it][A
Training...:  32% 4413/13907 [2:55:16<7:17:04,  2.76s/it][A
Training...:  32% 4414/13907 [2:55:19<7:07:40,  2.70s/it][A
Training...:  32% 4415/13907 [2:55:22<6:58:46,  2.65s/it][A
Training...:  32% 4416/13907 [2:55:24<6:51:05,  2.60s/it][A
Training...:  32% 4417/13907 [2:55:26<6:43:23,  2.55s/it][A
Training...:  32% 4418/13907 [2:55:29<6:37:25,  2.51s/it][A
Training...:  32% 4419/13907 [2:55:31<6:31:46,  2.48s/it][A
Training...:  32% 4420/13907 [2:55:34<6:25:15,  2.44s/it][A
Training...:  32% 4421/13907 [2:55:36<6:19:23,  2.40s/it][A
Training...:  32% 4422/13907 [2:55:38<6:13:57,  2.37s/it][A
Training...:  32% 4423/13907 [2:55:40<6:09:45,  2.34s/it][A
Training...:  32% 4424/13907 [2:55:43<6:03:05,  2.30s/it][A
Training...:  32% 4425/13907 [2:55:45<5:57:08,  2.26s/it][A
Training...:  32% 4426/13907 [2:55:47<5:51:10,  2.22s/it][A
Training...:  32% 4427/13907 [2:55:49<5:47:16,  2.20s/it][A
Training...:  32% 4428/13907 [2:55:51<5:42:22,  2.17s/it][A
Training...:  32% 4429/13907 [2:55:53<5:37:20,  2.14s/it][A
Training...:  32% 4430/13907 [2:55:55<5:33:54,  2.11s/it][A
Training...:  32% 4431/13907 [2:55:57<5:29:10,  2.08s/it][A
Training...:  32% 4432/13907 [2:55:59<5:24:13,  2.05s/it][A
Training...:  32% 4433/13907 [2:56:01<5:18:17,  2.02s/it][A
Training...:  32% 4434/13907 [2:56:03<5:14:07,  1.99s/it][A
Training...:  32% 4435/13907 [2:56:05<5:09:19,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:26:18<17:31:07, 31533.87s/it]
Training...:  32% 4435/13907 [2:56:07<5:09:19,  1.96s/it][A
Training...:  32% 4436/13907 [2:56:07<5:18:02,  2.01s/it][A
Training...:  32% 4437/13907 [2:56:09<5:12:23,  1.98s/it][A
Training...:  32% 4438/13907 [2:56:11<5:02:43,  1.92s/it][A
Training...:  32% 4439/13907 [2:56:13<4:55:41,  1.87s/it][A
Training...:  32% 4440/13907 [2:56:14<4:49:50,  1.84s/it][A
Training...:  32% 4441/13907 [2:56:16<4:44:19,  1.80s/it][A
Training...:  32% 4442/13907 [2:56:18<4:36:39,  1.75s/it][A
Training...:  32% 4443/13907 [2:56:19<4:28:57,  1.71s/it][A
Training...:  32% 4444/13907 [2:56:21<4:21:46,  1.66s/it][A
Training...:  32% 4445/13907 [2:56:22<4:12:28,  1.60s/it][A
Training...:  32% 4446/13907 [2:56:24<4:04:08,  1.55s/it][A
Training...:  32% 4447/13907 [2:56:25<3:56:14,  1.50s/it][A
Training...:  32% 4448/13907 [2:56:27<3:46:41,  1.44s/it][A
Training...:  32% 4449/13907 [2:56:28<3:35:53,  1.37s/it][A
Training...:  32% 4450/13907 [2:56:29<3:21:35,  1.28s/it][A
Training...:  32% 4451/13907 [2:56:32<5:16:55,  2.01s/it][A
Training...:  32% 4452/13907 [2:56:36<6:24:41,  2.44s/it][A
Training...:  32% 4453/13907 [2:56:39<7:01:01,  2.67s/it][A
Training...:  32% 4454/13907 [2:56:42<7:20:19,  2.79s/it][A
Training...:  32% 4455/13907 [2:56:45<7:28:25,  2.85s/it][A
Training...:  32% 4456/13907 [2:56:48<7:31:16,  2.86s/it][A
Training...:  32% 4457/13907 [2:56:51<7:30:48,  2.86s/it][A
Training...:  32% 4458/13907 [2:56:54<7:25:47,  2.83s/it][A
Training...:  32% 4459/13907 [2:56:56<7:22:01,  2.81s/it][A
Training...:  32% 4460/13907 [2:56:59<7:14:41,  2.76s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:27:13<17:31:07, 31533.87s/it]
Training...:  32% 4460/13907 [2:57:02<7:14:41,  2.76s/it][A
Training...:  32% 4461/13907 [2:57:02<7:27:42,  2.84s/it][A
Training...:  32% 4462/13907 [2:57:05<7:17:15,  2.78s/it][A
Training...:  32% 4463/13907 [2:57:07<7:06:39,  2.71s/it][A
Training...:  32% 4464/13907 [2:57:10<6:56:07,  2.64s/it][A
Training...:  32% 4465/13907 [2:57:12<6:47:58,  2.59s/it][A
Training...:  32% 4466/13907 [2:57:15<6:40:04,  2.54s/it][A
Training...:  32% 4467/13907 [2:57:17<6:33:57,  2.50s/it][A
Training...:  32% 4468/13907 [2:57:20<6:26:53,  2.46s/it][A
Training...:  32% 4469/13907 [2:57:22<6:20:59,  2.42s/it][A
Training...:  32% 4470/13907 [2:57:24<6:15:21,  2.39s/it][A
Training...:  32% 4471/13907 [2:57:26<6:09:51,  2.35s/it][A
Training...:  32% 4472/13907 [2:57:29<6:04:54,  2.32s/it][A
Training...:  32% 4473/13907 [2:57:31<6:01:31,  2.30s/it][A
Training...:  32% 4474/13907 [2:57:33<5:56:25,  2.27s/it][A
Training...:  32% 4475/13907 [2:57:35<5:50:40,  2.23s/it][A
Training...:  32% 4476/13907 [2:57:37<5:43:59,  2.19s/it][A
Training...:  32% 4477/13907 [2:57:39<5:38:28,  2.15s/it][A
Training...:  32% 4478/13907 [2:57:41<5:33:05,  2.12s/it][A
Training...:  32% 4479/13907 [2:57:43<5:28:29,  2.09s/it][A
Training...:  32% 4480/13907 [2:57:45<5:23:15,  2.06s/it][A
Training...:  32% 4481/13907 [2:57:47<5:18:39,  2.03s/it][A
Training...:  32% 4482/13907 [2:57:49<5:14:00,  2.00s/it][A
Training...:  32% 4483/13907 [2:57:51<5:09:17,  1.97s/it][A
Training...:  32% 4484/13907 [2:57:53<5:04:03,  1.94s/it][A
Training...:  32% 4485/13907 [2:57:55<4:59:11,  1.91s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:28:08<17:31:07, 31533.87s/it]
Training...:  32% 4485/13907 [2:57:57<4:59:11,  1.91s/it][A
Training...:  32% 4486/13907 [2:57:57<5:09:50,  1.97s/it][A
Training...:  32% 4487/13907 [2:57:59<5:04:04,  1.94s/it][A
Training...:  32% 4488/13907 [2:58:01<4:54:47,  1.88s/it][A
Training...:  32% 4489/13907 [2:58:02<4:47:22,  1.83s/it][A
Training...:  32% 4490/13907 [2:58:04<4:40:24,  1.79s/it][A
Training...:  32% 4491/13907 [2:58:06<4:33:55,  1.75s/it][A
Training...:  32% 4492/13907 [2:58:07<4:27:19,  1.70s/it][A
Training...:  32% 4493/13907 [2:58:09<4:20:29,  1.66s/it][A
Training...:  32% 4494/13907 [2:58:10<4:15:07,  1.63s/it][A
Training...:  32% 4495/13907 [2:58:12<4:08:31,  1.58s/it][A
Training...:  32% 4496/13907 [2:58:13<4:00:34,  1.53s/it][A
Training...:  32% 4497/13907 [2:58:15<3:52:06,  1.48s/it][A
Training...:  32% 4498/13907 [2:58:16<3:42:53,  1.42s/it][A
Training...:  32% 4499/13907 [2:58:17<3:32:51,  1.36s/it][A
Training...:  32% 4500/13907 [2:58:18<3:17:32,  1.26s/it][A
Training...:  32% 4501/13907 [2:58:22<5:12:36,  1.99s/it][A
Training...:  32% 4502/13907 [2:58:25<6:24:34,  2.45s/it][A
Training...:  32% 4503/13907 [2:58:29<7:03:16,  2.70s/it][A
Training...:  32% 4504/13907 [2:58:32<7:24:13,  2.83s/it][A
Training...:  32% 4505/13907 [2:58:35<7:36:00,  2.91s/it][A
Training...:  32% 4506/13907 [2:58:38<7:38:35,  2.93s/it][A
Training...:  32% 4507/13907 [2:58:41<7:37:29,  2.92s/it][A
Training...:  32% 4508/13907 [2:58:44<7:33:15,  2.89s/it][A
Training...:  32% 4509/13907 [2:58:46<7:27:11,  2.85s/it][A
Training...:  32% 4510/13907 [2:58:49<7:21:59,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:29:03<17:31:07, 31533.87s/it]
Training...:  32% 4510/13907 [2:58:52<7:21:59,  2.82s/it][A
Training...:  32% 4511/13907 [2:58:52<7:34:04,  2.90s/it][A
Training...:  32% 4512/13907 [2:58:55<7:24:23,  2.84s/it][A
Training...:  32% 4513/13907 [2:58:58<7:14:28,  2.78s/it][A
Training...:  32% 4514/13907 [2:59:00<7:02:45,  2.70s/it][A
Training...:  32% 4515/13907 [2:59:03<6:53:57,  2.64s/it][A
Training...:  32% 4516/13907 [2:59:05<6:46:10,  2.60s/it][A
Training...:  32% 4517/13907 [2:59:08<6:39:18,  2.55s/it][A
Training...:  32% 4518/13907 [2:59:10<6:35:21,  2.53s/it][A
Training...:  32% 4519/13907 [2:59:12<6:28:25,  2.48s/it][A
Training...:  33% 4520/13907 [2:59:15<6:20:09,  2.43s/it][A
Training...:  33% 4521/13907 [2:59:17<6:14:04,  2.39s/it][A
Training...:  33% 4522/13907 [2:59:19<6:05:55,  2.34s/it][A
Training...:  33% 4523/13907 [2:59:21<5:58:55,  2.29s/it][A
Training...:  33% 4524/13907 [2:59:24<5:52:54,  2.26s/it][A
Training...:  33% 4525/13907 [2:59:26<5:47:33,  2.22s/it][A
Training...:  33% 4526/13907 [2:59:28<5:42:51,  2.19s/it][A
Training...:  33% 4527/13907 [2:59:30<5:37:48,  2.16s/it][A
Training...:  33% 4528/13907 [2:59:32<5:32:52,  2.13s/it][A
Training...:  33% 4529/13907 [2:59:34<5:28:24,  2.10s/it][A
Training...:  33% 4530/13907 [2:59:36<5:24:14,  2.07s/it][A
Training...:  33% 4531/13907 [2:59:38<5:19:30,  2.04s/it][A
Training...:  33% 4532/13907 [2:59:40<5:15:10,  2.02s/it][A
Training...:  33% 4533/13907 [2:59:42<5:10:50,  1.99s/it][A
Training...:  33% 4534/13907 [2:59:44<5:06:39,  1.96s/it][A
Training...:  33% 4535/13907 [2:59:46<5:02:24,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:29:59<17:31:07, 31533.87s/it]
Training...:  33% 4535/13907 [2:59:48<5:02:24,  1.94s/it][A
Training...:  33% 4536/13907 [2:59:48<5:11:56,  2.00s/it][A
Training...:  33% 4537/13907 [2:59:50<5:06:08,  1.96s/it][A
Training...:  33% 4538/13907 [2:59:51<4:58:04,  1.91s/it][A
Training...:  33% 4539/13907 [2:59:53<4:51:34,  1.87s/it][A
Training...:  33% 4540/13907 [2:59:55<4:45:28,  1.83s/it][A
Training...:  33% 4541/13907 [2:59:57<4:39:28,  1.79s/it][A
Training...:  33% 4542/13907 [2:59:58<4:33:42,  1.75s/it][A
Training...:  33% 4543/13907 [3:00:00<4:27:48,  1.72s/it][A
Training...:  33% 4544/13907 [3:00:02<4:21:26,  1.68s/it][A
Training...:  33% 4545/13907 [3:00:03<4:13:58,  1.63s/it][A
Training...:  33% 4546/13907 [3:00:05<4:06:05,  1.58s/it][A
Training...:  33% 4547/13907 [3:00:06<3:57:55,  1.53s/it][A
Training...:  33% 4548/13907 [3:00:07<3:48:26,  1.46s/it][A
Training...:  33% 4549/13907 [3:00:08<3:37:58,  1.40s/it][A
Training...:  33% 4550/13907 [3:00:10<3:22:31,  1.30s/it][A
Training...:  33% 4551/13907 [3:00:13<5:17:32,  2.04s/it][A
Training...:  33% 4552/13907 [3:00:17<6:27:03,  2.48s/it][A
Training...:  33% 4553/13907 [3:00:20<7:03:27,  2.72s/it][A
Training...:  33% 4554/13907 [3:00:23<7:25:32,  2.86s/it][A
Training...:  33% 4555/13907 [3:00:26<7:36:49,  2.93s/it][A
Training...:  33% 4556/13907 [3:00:29<7:39:17,  2.95s/it][A
Training...:  33% 4557/13907 [3:00:32<7:35:52,  2.93s/it][A
Training...:  33% 4558/13907 [3:00:35<7:29:54,  2.89s/it][A
Training...:  33% 4559/13907 [3:00:38<7:22:47,  2.84s/it][A
Training...:  33% 4560/13907 [3:00:40<7:15:21,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:30:55<17:31:07, 31533.87s/it]
Training...:  33% 4560/13907 [3:00:44<7:15:21,  2.79s/it][A
Training...:  33% 4561/13907 [3:00:44<7:27:40,  2.87s/it][A
Training...:  33% 4562/13907 [3:00:46<7:20:13,  2.83s/it][A
Training...:  33% 4563/13907 [3:00:49<7:06:58,  2.74s/it][A
Training...:  33% 4564/13907 [3:00:51<6:56:57,  2.68s/it][A
Training...:  33% 4565/13907 [3:00:54<6:47:15,  2.62s/it][A
Training...:  33% 4566/13907 [3:00:56<6:38:34,  2.56s/it][A
Training...:  33% 4567/13907 [3:00:59<6:30:42,  2.51s/it][A
Training...:  33% 4568/13907 [3:01:01<6:25:13,  2.47s/it][A
Training...:  33% 4569/13907 [3:01:03<6:19:43,  2.44s/it][A
Training...:  33% 4570/13907 [3:01:06<6:13:22,  2.40s/it][A
Training...:  33% 4571/13907 [3:01:08<6:09:28,  2.37s/it][A
Training...:  33% 4572/13907 [3:01:10<6:03:50,  2.34s/it][A
Training...:  33% 4573/13907 [3:01:12<5:59:56,  2.31s/it][A
Training...:  33% 4574/13907 [3:01:15<5:55:12,  2.28s/it][A
Training...:  33% 4575/13907 [3:01:17<5:50:18,  2.25s/it][A
Training...:  33% 4576/13907 [3:01:19<5:47:03,  2.23s/it][A
Training...:  33% 4577/13907 [3:01:21<5:40:46,  2.19s/it][A
Training...:  33% 4578/13907 [3:01:23<5:35:00,  2.15s/it][A
Training...:  33% 4579/13907 [3:01:25<5:30:38,  2.13s/it][A
Training...:  33% 4580/13907 [3:01:27<5:26:50,  2.10s/it][A
Training...:  33% 4581/13907 [3:01:29<5:24:13,  2.09s/it][A
Training...:  33% 4582/13907 [3:01:31<5:18:07,  2.05s/it][A
Training...:  33% 4583/13907 [3:01:33<5:16:08,  2.03s/it][A
Training...:  33% 4584/13907 [3:01:35<5:10:17,  2.00s/it][A
Training...:  33% 4585/13907 [3:01:37<5:04:40,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:31:50<17:31:07, 31533.87s/it]
Training...:  33% 4585/13907 [3:01:39<5:04:40,  1.96s/it][A
Training...:  33% 4586/13907 [3:01:39<5:14:54,  2.03s/it][A
Training...:  33% 4587/13907 [3:01:41<5:07:44,  1.98s/it][A
Training...:  33% 4588/13907 [3:01:43<4:58:14,  1.92s/it][A
Training...:  33% 4589/13907 [3:01:45<4:50:21,  1.87s/it][A
Training...:  33% 4590/13907 [3:01:46<4:42:53,  1.82s/it][A
Training...:  33% 4591/13907 [3:01:48<4:37:11,  1.79s/it][A
Training...:  33% 4592/13907 [3:01:50<4:30:56,  1.75s/it][A
Training...:  33% 4593/13907 [3:01:51<4:24:06,  1.70s/it][A
Training...:  33% 4594/13907 [3:01:53<4:17:54,  1.66s/it][A
Training...:  33% 4595/13907 [3:01:54<4:10:56,  1.62s/it][A
Training...:  33% 4596/13907 [3:01:56<4:03:36,  1.57s/it][A
Training...:  33% 4597/13907 [3:01:57<3:55:33,  1.52s/it][A
Training...:  33% 4598/13907 [3:01:59<3:46:22,  1.46s/it][A
Training...:  33% 4599/13907 [3:02:00<3:35:31,  1.39s/it][A
Training...:  33% 4600/13907 [3:02:01<3:20:03,  1.29s/it][A
Training...:  33% 4601/13907 [3:02:05<5:16:16,  2.04s/it][A
Training...:  33% 4602/13907 [3:02:08<6:22:03,  2.46s/it][A
Training...:  33% 4603/13907 [3:02:11<6:59:04,  2.70s/it][A
Training...:  33% 4604/13907 [3:02:15<7:16:51,  2.82s/it][A
Training...:  33% 4605/13907 [3:02:18<7:26:11,  2.88s/it][A
Training...:  33% 4606/13907 [3:02:21<7:30:52,  2.91s/it][A
Training...:  33% 4607/13907 [3:02:23<7:28:33,  2.89s/it][A
Training...:  33% 4608/13907 [3:02:26<7:24:49,  2.87s/it][A
Training...:  33% 4609/13907 [3:02:29<7:17:04,  2.82s/it][A
Training...:  33% 4610/13907 [3:02:32<7:12:09,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:32:46<17:31:07, 31533.87s/it]
Training...:  33% 4610/13907 [3:02:35<7:12:09,  2.79s/it][A
Training...:  33% 4611/13907 [3:02:35<7:25:42,  2.88s/it][A
Training...:  33% 4612/13907 [3:02:37<7:17:11,  2.82s/it][A
Training...:  33% 4613/13907 [3:02:40<7:04:36,  2.74s/it][A
Training...:  33% 4614/13907 [3:02:42<6:54:31,  2.68s/it][A
Training...:  33% 4615/13907 [3:02:45<6:46:25,  2.62s/it][A
Training...:  33% 4616/13907 [3:02:47<6:39:18,  2.58s/it][A
Training...:  33% 4617/13907 [3:02:50<6:36:04,  2.56s/it][A
Training...:  33% 4618/13907 [3:02:52<6:31:01,  2.53s/it][A
Training...:  33% 4619/13907 [3:02:55<6:23:24,  2.48s/it][A
Training...:  33% 4620/13907 [3:02:57<6:16:35,  2.43s/it][A
Training...:  33% 4621/13907 [3:02:59<6:10:31,  2.39s/it][A
Training...:  33% 4622/13907 [3:03:02<6:05:16,  2.36s/it][A
Training...:  33% 4623/13907 [3:03:04<5:59:55,  2.33s/it][A
Training...:  33% 4624/13907 [3:03:06<5:53:54,  2.29s/it][A
Training...:  33% 4625/13907 [3:03:08<5:48:05,  2.25s/it][A
Training...:  33% 4626/13907 [3:03:10<5:42:44,  2.22s/it][A
Training...:  33% 4627/13907 [3:03:13<5:37:34,  2.18s/it][A
Training...:  33% 4628/13907 [3:03:15<5:33:36,  2.16s/it][A
Training...:  33% 4629/13907 [3:03:17<5:29:22,  2.13s/it][A
Training...:  33% 4630/13907 [3:03:19<5:24:37,  2.10s/it][A
Training...:  33% 4631/13907 [3:03:21<5:19:51,  2.07s/it][A
Training...:  33% 4632/13907 [3:03:23<5:15:31,  2.04s/it][A
Training...:  33% 4633/13907 [3:03:25<5:11:07,  2.01s/it][A
Training...:  33% 4634/13907 [3:03:27<5:06:24,  1.98s/it][A
Training...:  33% 4635/13907 [3:03:28<5:01:43,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:33:42<17:31:07, 31533.87s/it]
Training...:  33% 4635/13907 [3:03:31<5:01:43,  1.95s/it][A
Training...:  33% 4636/13907 [3:03:31<5:12:26,  2.02s/it][A
Training...:  33% 4637/13907 [3:03:33<5:06:25,  1.98s/it][A
Training...:  33% 4638/13907 [3:03:34<4:58:52,  1.93s/it][A
Training...:  33% 4639/13907 [3:03:36<4:52:07,  1.89s/it][A
Training...:  33% 4640/13907 [3:03:38<4:44:25,  1.84s/it][A
Training...:  33% 4641/13907 [3:03:40<4:37:32,  1.80s/it][A
Training...:  33% 4642/13907 [3:03:41<4:31:45,  1.76s/it][A
Training...:  33% 4643/13907 [3:03:43<4:25:00,  1.72s/it][A
Training...:  33% 4644/13907 [3:03:44<4:18:33,  1.67s/it][A
Training...:  33% 4645/13907 [3:03:46<4:12:23,  1.64s/it][A
Training...:  33% 4646/13907 [3:03:47<4:06:11,  1.59s/it][A
Training...:  33% 4647/13907 [3:03:49<3:57:12,  1.54s/it][A
Training...:  33% 4648/13907 [3:03:50<3:48:41,  1.48s/it][A
Training...:  33% 4649/13907 [3:03:51<3:38:32,  1.42s/it][A
Training...:  33% 4650/13907 [3:03:53<3:24:17,  1.32s/it][A
Training...:  33% 4651/13907 [3:03:56<5:17:14,  2.06s/it][A
Training...:  33% 4652/13907 [3:04:00<6:25:50,  2.50s/it][A
Training...:  33% 4653/13907 [3:04:03<7:04:57,  2.76s/it][A
Training...:  33% 4654/13907 [3:04:06<7:25:50,  2.89s/it][A
Training...:  33% 4655/13907 [3:04:09<7:31:16,  2.93s/it][A
Training...:  33% 4656/13907 [3:04:12<7:30:52,  2.92s/it][A
Training...:  33% 4657/13907 [3:04:15<7:27:53,  2.91s/it][A
Training...:  33% 4658/13907 [3:04:18<7:22:58,  2.87s/it][A
Training...:  34% 4659/13907 [3:04:21<7:18:38,  2.85s/it][A
Training...:  34% 4660/13907 [3:04:24<7:11:45,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:34:38<17:31:07, 31533.87s/it]
Training...:  34% 4660/13907 [3:04:27<7:11:45,  2.80s/it][A
Training...:  34% 4661/13907 [3:04:27<7:24:18,  2.88s/it][A
Training...:  34% 4662/13907 [3:04:29<7:15:28,  2.83s/it][A
Training...:  34% 4663/13907 [3:04:32<7:02:42,  2.74s/it][A
Training...:  34% 4664/13907 [3:04:34<6:52:03,  2.67s/it][A
Training...:  34% 4665/13907 [3:04:37<6:41:19,  2.61s/it][A
Training...:  34% 4666/13907 [3:04:39<6:32:12,  2.55s/it][A
Training...:  34% 4667/13907 [3:04:42<6:25:43,  2.50s/it][A
Training...:  34% 4668/13907 [3:04:44<6:18:54,  2.46s/it][A
Training...:  34% 4669/13907 [3:04:46<6:13:43,  2.43s/it][A
Training...:  34% 4670/13907 [3:04:49<6:08:12,  2.39s/it][A
Training...:  34% 4671/13907 [3:04:51<6:02:52,  2.36s/it][A
Training...:  34% 4672/13907 [3:04:53<5:56:26,  2.32s/it][A
Training...:  34% 4673/13907 [3:04:55<5:52:08,  2.29s/it][A
Training...:  34% 4674/13907 [3:04:58<5:48:17,  2.26s/it][A
Training...:  34% 4675/13907 [3:05:00<5:42:34,  2.23s/it][A
Training...:  34% 4676/13907 [3:05:02<5:37:50,  2.20s/it][A
Training...:  34% 4677/13907 [3:05:04<5:32:50,  2.16s/it][A
Training...:  34% 4678/13907 [3:05:06<5:29:08,  2.14s/it][A
Training...:  34% 4679/13907 [3:05:08<5:24:06,  2.11s/it][A
Training...:  34% 4680/13907 [3:05:10<5:20:03,  2.08s/it][A
Training...:  34% 4681/13907 [3:05:12<5:16:57,  2.06s/it][A
Training...:  34% 4682/13907 [3:05:14<5:12:59,  2.04s/it][A
Training...:  34% 4683/13907 [3:05:16<5:08:45,  2.01s/it][A
Training...:  34% 4684/13907 [3:05:18<5:04:24,  1.98s/it][A
Training...:  34% 4685/13907 [3:05:20<5:00:39,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:35:33<17:31:07, 31533.87s/it]
Training...:  34% 4685/13907 [3:05:22<5:00:39,  1.96s/it][A
Training...:  34% 4686/13907 [3:05:22<5:09:43,  2.02s/it][A
Training...:  34% 4687/13907 [3:05:24<5:06:19,  1.99s/it][A
Training...:  34% 4688/13907 [3:05:26<4:57:11,  1.93s/it][A
Training...:  34% 4689/13907 [3:05:27<4:49:37,  1.89s/it][A
Training...:  34% 4690/13907 [3:05:29<4:41:21,  1.83s/it][A
Training...:  34% 4691/13907 [3:05:31<4:33:50,  1.78s/it][A
Training...:  34% 4692/13907 [3:05:32<4:25:43,  1.73s/it][A
Training...:  34% 4693/13907 [3:05:34<4:19:18,  1.69s/it][A
Training...:  34% 4694/13907 [3:05:36<4:13:52,  1.65s/it][A
Training...:  34% 4695/13907 [3:05:37<4:06:06,  1.60s/it][A
Training...:  34% 4696/13907 [3:05:39<3:58:56,  1.56s/it][A
Training...:  34% 4697/13907 [3:05:40<3:51:23,  1.51s/it][A
Training...:  34% 4698/13907 [3:05:41<3:42:42,  1.45s/it][A
Training...:  34% 4699/13907 [3:05:42<3:32:07,  1.38s/it][A
Training...:  34% 4700/13907 [3:05:43<3:16:34,  1.28s/it][A
Training...:  34% 4701/13907 [3:05:47<5:10:14,  2.02s/it][A
Training...:  34% 4702/13907 [3:05:51<6:18:24,  2.47s/it][A
Training...:  34% 4703/13907 [3:05:54<6:53:23,  2.69s/it][A
Training...:  34% 4704/13907 [3:05:57<7:12:07,  2.82s/it][A
Training...:  34% 4705/13907 [3:06:00<7:22:38,  2.89s/it][A
Training...:  34% 4706/13907 [3:06:03<7:25:10,  2.90s/it][A
Training...:  34% 4707/13907 [3:06:06<7:24:18,  2.90s/it][A
Training...:  34% 4708/13907 [3:06:09<7:21:39,  2.88s/it][A
Training...:  34% 4709/13907 [3:06:12<7:16:18,  2.85s/it][A
Training...:  34% 4710/13907 [3:06:14<7:09:22,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:36:28<17:31:07, 31533.87s/it]
Training...:  34% 4710/13907 [3:06:17<7:09:22,  2.80s/it][A
Training...:  34% 4711/13907 [3:06:17<7:22:51,  2.89s/it][A
Training...:  34% 4712/13907 [3:06:20<7:14:34,  2.84s/it][A
Training...:  34% 4713/13907 [3:06:23<7:04:22,  2.77s/it][A
Training...:  34% 4714/13907 [3:06:25<6:54:07,  2.70s/it][A
Training...:  34% 4715/13907 [3:06:28<6:45:21,  2.65s/it][A
Training...:  34% 4716/13907 [3:06:30<6:36:02,  2.59s/it][A
Training...:  34% 4717/13907 [3:06:33<6:28:58,  2.54s/it][A
Training...:  34% 4718/13907 [3:06:35<6:21:35,  2.49s/it][A
Training...:  34% 4719/13907 [3:06:37<6:16:33,  2.46s/it][A
Training...:  34% 4720/13907 [3:06:40<6:13:15,  2.44s/it][A
Training...:  34% 4721/13907 [3:06:42<6:07:31,  2.40s/it][A
Training...:  34% 4722/13907 [3:06:44<5:59:53,  2.35s/it][A
Training...:  34% 4723/13907 [3:06:47<5:54:08,  2.31s/it][A
Training...:  34% 4724/13907 [3:06:49<5:47:40,  2.27s/it][A
Training...:  34% 4725/13907 [3:06:51<5:41:50,  2.23s/it][A
Training...:  34% 4726/13907 [3:06:53<5:36:58,  2.20s/it][A
Training...:  34% 4727/13907 [3:06:55<5:32:19,  2.17s/it][A
Training...:  34% 4728/13907 [3:06:57<5:27:33,  2.14s/it][A
Training...:  34% 4729/13907 [3:06:59<5:22:51,  2.11s/it][A
Training...:  34% 4730/13907 [3:07:01<5:18:21,  2.08s/it][A
Training...:  34% 4731/13907 [3:07:03<5:14:41,  2.06s/it][A
Training...:  34% 4732/13907 [3:07:05<5:10:15,  2.03s/it][A
Training...:  34% 4733/13907 [3:07:07<5:06:10,  2.00s/it][A
Training...:  34% 4734/13907 [3:07:09<5:02:07,  1.98s/it][A
Training...:  34% 4735/13907 [3:07:11<4:57:20,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:37:24<17:31:07, 31533.87s/it]
Training...:  34% 4735/13907 [3:07:13<4:57:20,  1.95s/it][A
Training...:  34% 4736/13907 [3:07:13<5:07:18,  2.01s/it][A
Training...:  34% 4737/13907 [3:07:15<5:01:04,  1.97s/it][A
Training...:  34% 4738/13907 [3:07:17<4:52:39,  1.92s/it][A
Training...:  34% 4739/13907 [3:07:18<4:43:54,  1.86s/it][A
Training...:  34% 4740/13907 [3:07:20<4:36:50,  1.81s/it][A
Training...:  34% 4741/13907 [3:07:22<4:30:02,  1.77s/it][A
Training...:  34% 4742/13907 [3:07:23<4:24:55,  1.73s/it][A
Training...:  34% 4743/13907 [3:07:25<4:19:21,  1.70s/it][A
Training...:  34% 4744/13907 [3:07:27<4:13:14,  1.66s/it][A
Training...:  34% 4745/13907 [3:07:28<4:06:22,  1.61s/it][A
Training...:  34% 4746/13907 [3:07:30<3:58:42,  1.56s/it][A
Training...:  34% 4747/13907 [3:07:31<3:50:29,  1.51s/it][A
Training...:  34% 4748/13907 [3:07:32<3:41:32,  1.45s/it][A
Training...:  34% 4749/13907 [3:07:34<3:31:31,  1.39s/it][A
Training...:  34% 4750/13907 [3:07:35<3:15:06,  1.28s/it][A
Training...:  34% 4751/13907 [3:07:38<5:09:29,  2.03s/it][A
Training...:  34% 4752/13907 [3:07:42<6:14:50,  2.46s/it][A
Training...:  34% 4753/13907 [3:07:45<6:49:55,  2.69s/it][A
Training...:  34% 4754/13907 [3:07:48<7:10:39,  2.82s/it][A
Training...:  34% 4755/13907 [3:07:51<7:19:47,  2.88s/it][A
Training...:  34% 4756/13907 [3:07:54<7:24:40,  2.92s/it][A
Training...:  34% 4757/13907 [3:07:57<7:27:13,  2.93s/it][A
Training...:  34% 4758/13907 [3:08:00<7:28:06,  2.94s/it][A
Training...:  34% 4759/13907 [3:08:03<7:21:43,  2.90s/it][A
Training...:  34% 4760/13907 [3:08:06<7:13:48,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:38:20<17:31:07, 31533.87s/it]
Training...:  34% 4760/13907 [3:08:09<7:13:48,  2.85s/it][A
Training...:  34% 4761/13907 [3:08:09<7:25:14,  2.92s/it][A
Training...:  34% 4762/13907 [3:08:11<7:15:29,  2.86s/it][A
Training...:  34% 4763/13907 [3:08:14<7:03:43,  2.78s/it][A
Training...:  34% 4764/13907 [3:08:17<6:53:15,  2.71s/it][A
Training...:  34% 4765/13907 [3:08:19<6:44:37,  2.66s/it][A
Training...:  34% 4766/13907 [3:08:22<6:35:52,  2.60s/it][A
Training...:  34% 4767/13907 [3:08:24<6:29:48,  2.56s/it][A
Training...:  34% 4768/13907 [3:08:26<6:22:35,  2.51s/it][A
Training...:  34% 4769/13907 [3:08:29<6:16:53,  2.47s/it][A
Training...:  34% 4770/13907 [3:08:31<6:10:51,  2.44s/it][A
Training...:  34% 4771/13907 [3:08:34<6:06:08,  2.40s/it][A
Training...:  34% 4772/13907 [3:08:36<6:00:48,  2.37s/it][A
Training...:  34% 4773/13907 [3:08:38<5:56:42,  2.34s/it][A
Training...:  34% 4774/13907 [3:08:40<5:51:27,  2.31s/it][A
Training...:  34% 4775/13907 [3:08:43<5:47:20,  2.28s/it][A
Training...:  34% 4776/13907 [3:08:45<5:42:05,  2.25s/it][A
Training...:  34% 4777/13907 [3:08:47<5:37:54,  2.22s/it][A
Training...:  34% 4778/13907 [3:08:49<5:32:56,  2.19s/it][A
Training...:  34% 4779/13907 [3:08:51<5:29:17,  2.16s/it][A
Training...:  34% 4780/13907 [3:08:53<5:22:49,  2.12s/it][A
Training...:  34% 4781/13907 [3:08:55<5:19:29,  2.10s/it][A
Training...:  34% 4782/13907 [3:08:57<5:15:20,  2.07s/it][A
Training...:  34% 4783/13907 [3:08:59<5:11:24,  2.05s/it][A
Training...:  34% 4784/13907 [3:09:01<5:07:44,  2.02s/it][A
Training...:  34% 4785/13907 [3:09:03<5:04:14,  2.00s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:39:16<17:31:07, 31533.87s/it]
Training...:  34% 4785/13907 [3:09:05<5:04:14,  2.00s/it][A
Training...:  34% 4786/13907 [3:09:05<5:13:25,  2.06s/it][A
Training...:  34% 4787/13907 [3:09:07<5:06:40,  2.02s/it][A
Training...:  34% 4788/13907 [3:09:09<4:59:28,  1.97s/it][A
Training...:  34% 4789/13907 [3:09:11<4:50:15,  1.91s/it][A
Training...:  34% 4790/13907 [3:09:13<4:42:02,  1.86s/it][A
Training...:  34% 4791/13907 [3:09:14<4:35:17,  1.81s/it][A
Training...:  34% 4792/13907 [3:09:16<4:28:23,  1.77s/it][A
Training...:  34% 4793/13907 [3:09:18<4:21:17,  1.72s/it][A
Training...:  34% 4794/13907 [3:09:19<4:14:45,  1.68s/it][A
Training...:  34% 4795/13907 [3:09:21<4:09:21,  1.64s/it][A
Training...:  34% 4796/13907 [3:09:22<4:01:01,  1.59s/it][A
Training...:  34% 4797/13907 [3:09:24<3:53:12,  1.54s/it][A
Training...:  35% 4798/13907 [3:09:25<3:43:23,  1.47s/it][A
Training...:  35% 4799/13907 [3:09:26<3:31:26,  1.39s/it][A
Training...:  35% 4800/13907 [3:09:27<3:15:12,  1.29s/it][A
Training...:  35% 4801/13907 [3:09:31<5:05:06,  2.01s/it][A
Training...:  35% 4802/13907 [3:09:34<6:12:27,  2.45s/it][A
Training...:  35% 4803/13907 [3:09:38<6:47:22,  2.68s/it][A
Training...:  35% 4804/13907 [3:09:41<7:06:32,  2.81s/it][A
Training...:  35% 4805/13907 [3:09:44<7:16:50,  2.88s/it][A
Training...:  35% 4806/13907 [3:09:47<7:20:04,  2.90s/it][A
Training...:  35% 4807/13907 [3:09:50<7:19:37,  2.90s/it][A
Training...:  35% 4808/13907 [3:09:52<7:16:11,  2.88s/it][A
Training...:  35% 4809/13907 [3:09:55<7:09:34,  2.83s/it][A
Training...:  35% 4810/13907 [3:09:58<7:03:29,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:40:12<17:31:07, 31533.87s/it]
Training...:  35% 4810/13907 [3:10:01<7:03:29,  2.79s/it][A
Training...:  35% 4811/13907 [3:10:01<7:15:34,  2.87s/it][A
Training...:  35% 4812/13907 [3:10:04<7:07:26,  2.82s/it][A
Training...:  35% 4813/13907 [3:10:06<6:59:40,  2.77s/it][A
Training...:  35% 4814/13907 [3:10:09<6:49:55,  2.70s/it][A
Training...:  35% 4815/13907 [3:10:11<6:45:07,  2.67s/it][A
Training...:  35% 4816/13907 [3:10:14<6:34:22,  2.60s/it][A
Training...:  35% 4817/13907 [3:10:16<6:26:25,  2.55s/it][A
Training...:  35% 4818/13907 [3:10:19<6:18:52,  2.50s/it][A
Training...:  35% 4819/13907 [3:10:21<6:13:35,  2.47s/it][A
Training...:  35% 4820/13907 [3:10:23<6:06:48,  2.42s/it][A
Training...:  35% 4821/13907 [3:10:26<6:01:45,  2.39s/it][A
Training...:  35% 4822/13907 [3:10:28<5:56:10,  2.35s/it][A
Training...:  35% 4823/13907 [3:10:30<5:50:55,  2.32s/it][A
Training...:  35% 4824/13907 [3:10:32<5:45:51,  2.28s/it][A
Training...:  35% 4825/13907 [3:10:34<5:40:44,  2.25s/it][A
Training...:  35% 4826/13907 [3:10:37<5:35:05,  2.21s/it][A
Training...:  35% 4827/13907 [3:10:39<5:30:51,  2.19s/it][A
Training...:  35% 4828/13907 [3:10:41<5:25:56,  2.15s/it][A
Training...:  35% 4829/13907 [3:10:43<5:21:57,  2.13s/it][A
Training...:  35% 4830/13907 [3:10:45<5:16:54,  2.09s/it][A
Training...:  35% 4831/13907 [3:10:47<5:12:54,  2.07s/it][A
Training...:  35% 4832/13907 [3:10:49<5:07:18,  2.03s/it][A
Training...:  35% 4833/13907 [3:10:51<5:03:45,  2.01s/it][A
Training...:  35% 4834/13907 [3:10:53<4:59:01,  1.98s/it][A
Training...:  35% 4835/13907 [3:10:55<4:54:57,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:41:08<17:31:07, 31533.87s/it]
Training...:  35% 4835/13907 [3:10:57<4:54:57,  1.95s/it][A
Training...:  35% 4836/13907 [3:10:57<5:04:12,  2.01s/it][A
Training...:  35% 4837/13907 [3:10:59<4:58:25,  1.97s/it][A
Training...:  35% 4838/13907 [3:11:00<4:50:43,  1.92s/it][A
Training...:  35% 4839/13907 [3:11:02<4:41:25,  1.86s/it][A
Training...:  35% 4840/13907 [3:11:04<4:35:16,  1.82s/it][A
Training...:  35% 4841/13907 [3:11:06<4:29:26,  1.78s/it][A
Training...:  35% 4842/13907 [3:11:07<4:23:15,  1.74s/it][A
Training...:  35% 4843/13907 [3:11:09<4:16:43,  1.70s/it][A
Training...:  35% 4844/13907 [3:11:10<4:10:56,  1.66s/it][A
Training...:  35% 4845/13907 [3:11:12<4:04:47,  1.62s/it][A
Training...:  35% 4846/13907 [3:11:13<3:57:42,  1.57s/it][A
Training...:  35% 4847/13907 [3:11:15<3:50:09,  1.52s/it][A
Training...:  35% 4848/13907 [3:11:16<3:40:57,  1.46s/it][A
Training...:  35% 4849/13907 [3:11:17<3:31:38,  1.40s/it][A
Training...:  35% 4850/13907 [3:11:18<3:17:50,  1.31s/it][A
Training...:  35% 4851/13907 [3:11:22<5:08:21,  2.04s/it][A
Training...:  35% 4852/13907 [3:11:26<6:16:08,  2.49s/it][A
Training...:  35% 4853/13907 [3:11:29<6:56:05,  2.76s/it][A
Training...:  35% 4854/13907 [3:11:32<7:14:12,  2.88s/it][A
Training...:  35% 4855/13907 [3:11:35<7:20:40,  2.92s/it][A
Training...:  35% 4856/13907 [3:11:38<7:20:14,  2.92s/it][A
Training...:  35% 4857/13907 [3:11:41<7:19:41,  2.92s/it][A
Training...:  35% 4858/13907 [3:11:44<7:14:13,  2.88s/it][A
Training...:  35% 4859/13907 [3:11:47<7:08:16,  2.84s/it][A
Training...:  35% 4860/13907 [3:11:49<7:01:51,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:42:04<17:31:07, 31533.87s/it]
Training...:  35% 4860/13907 [3:11:52<7:01:51,  2.80s/it][A
Training...:  35% 4861/13907 [3:11:52<7:15:05,  2.89s/it][A
Training...:  35% 4862/13907 [3:11:55<7:06:56,  2.83s/it][A
Training...:  35% 4863/13907 [3:11:58<6:55:19,  2.76s/it][A
Training...:  35% 4864/13907 [3:12:00<6:46:58,  2.70s/it][A
Training...:  35% 4865/13907 [3:12:03<6:40:16,  2.66s/it][A
Training...:  35% 4866/13907 [3:12:05<6:33:32,  2.61s/it][A
Training...:  35% 4867/13907 [3:12:08<6:25:35,  2.56s/it][A
Training...:  35% 4868/13907 [3:12:10<6:18:12,  2.51s/it][A
Training...:  35% 4869/13907 [3:12:13<6:13:24,  2.48s/it][A
Training...:  35% 4870/13907 [3:12:15<6:06:48,  2.44s/it][A
Training...:  35% 4871/13907 [3:12:17<6:02:32,  2.41s/it][A
Training...:  35% 4872/13907 [3:12:20<5:55:51,  2.36s/it][A
Training...:  35% 4873/13907 [3:12:22<5:50:08,  2.33s/it][A
Training...:  35% 4874/13907 [3:12:24<5:45:22,  2.29s/it][A
Training...:  35% 4875/13907 [3:12:26<5:40:37,  2.26s/it][A
Training...:  35% 4876/13907 [3:12:28<5:36:11,  2.23s/it][A
Training...:  35% 4877/13907 [3:12:31<5:32:01,  2.21s/it][A
Training...:  35% 4878/13907 [3:12:33<5:25:53,  2.17s/it][A
Training...:  35% 4879/13907 [3:12:35<5:21:01,  2.13s/it][A
Training...:  35% 4880/13907 [3:12:37<5:17:48,  2.11s/it][A
Training...:  35% 4881/13907 [3:12:39<5:11:58,  2.07s/it][A
Training...:  35% 4882/13907 [3:12:41<5:08:47,  2.05s/it][A
Training...:  35% 4883/13907 [3:12:43<5:05:30,  2.03s/it][A
Training...:  35% 4884/13907 [3:12:45<5:01:48,  2.01s/it][A
Training...:  35% 4885/13907 [3:12:47<4:56:12,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:43:00<17:31:07, 31533.87s/it]
Training...:  35% 4885/13907 [3:12:49<4:56:12,  1.97s/it][A
Training...:  35% 4886/13907 [3:12:49<5:04:15,  2.02s/it][A
Training...:  35% 4887/13907 [3:12:51<4:58:19,  1.98s/it][A
Training...:  35% 4888/13907 [3:12:52<4:48:41,  1.92s/it][A
Training...:  35% 4889/13907 [3:12:54<4:40:13,  1.86s/it][A
Training...:  35% 4890/13907 [3:12:56<4:33:19,  1.82s/it][A
Training...:  35% 4891/13907 [3:12:57<4:26:56,  1.78s/it][A
Training...:  35% 4892/13907 [3:12:59<4:21:11,  1.74s/it][A
Training...:  35% 4893/13907 [3:13:01<4:16:26,  1.71s/it][A
Training...:  35% 4894/13907 [3:13:02<4:11:55,  1.68s/it][A
Training...:  35% 4895/13907 [3:13:04<4:05:33,  1.63s/it][A
Training...:  35% 4896/13907 [3:13:05<3:58:25,  1.59s/it][A
Training...:  35% 4897/13907 [3:13:07<3:49:56,  1.53s/it][A
Training...:  35% 4898/13907 [3:13:08<3:40:56,  1.47s/it][A
Training...:  35% 4899/13907 [3:13:09<3:30:44,  1.40s/it][A
Training...:  35% 4900/13907 [3:13:10<3:15:30,  1.30s/it][A
Training...:  35% 4901/13907 [3:13:14<5:07:52,  2.05s/it][A
Training...:  35% 4902/13907 [3:13:18<6:17:39,  2.52s/it][A
Training...:  35% 4903/13907 [3:13:21<6:54:55,  2.76s/it][A
Training...:  35% 4904/13907 [3:13:24<7:15:26,  2.90s/it][A
Training...:  35% 4905/13907 [3:13:28<7:25:31,  2.97s/it][A
Training...:  35% 4906/13907 [3:13:31<7:28:30,  2.99s/it][A
Training...:  35% 4907/13907 [3:13:34<7:28:43,  2.99s/it][A
Training...:  35% 4908/13907 [3:13:36<7:26:10,  2.97s/it][A
Training...:  35% 4909/13907 [3:13:39<7:19:09,  2.93s/it][A
Training...:  35% 4910/13907 [3:13:42<7:12:24,  2.88s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:43:56<17:31:07, 31533.87s/it]
Training...:  35% 4910/13907 [3:13:45<7:12:24,  2.88s/it][A
Training...:  35% 4911/13907 [3:13:45<7:24:51,  2.97s/it][A
Training...:  35% 4912/13907 [3:13:48<7:12:02,  2.88s/it][A
Training...:  35% 4913/13907 [3:13:50<6:58:12,  2.79s/it][A
Training...:  35% 4914/13907 [3:13:53<6:46:51,  2.71s/it][A
Training...:  35% 4915/13907 [3:13:56<6:37:31,  2.65s/it][A
Training...:  35% 4916/13907 [3:13:58<6:29:39,  2.60s/it][A
Training...:  35% 4917/13907 [3:14:00<6:24:13,  2.56s/it][A
Training...:  35% 4918/13907 [3:14:03<6:19:32,  2.53s/it][A
Training...:  35% 4919/13907 [3:14:05<6:11:05,  2.48s/it][A
Training...:  35% 4920/13907 [3:14:08<6:05:16,  2.44s/it][A
Training...:  35% 4921/13907 [3:14:10<5:59:25,  2.40s/it][A
Training...:  35% 4922/13907 [3:14:12<5:52:29,  2.35s/it][A
Training...:  35% 4923/13907 [3:14:14<5:45:40,  2.31s/it][A
Training...:  35% 4924/13907 [3:14:17<5:40:28,  2.27s/it][A
Training...:  35% 4925/13907 [3:14:19<5:35:18,  2.24s/it][A
Training...:  35% 4926/13907 [3:14:21<5:29:46,  2.20s/it][A
Training...:  35% 4927/13907 [3:14:23<5:24:44,  2.17s/it][A
Training...:  35% 4928/13907 [3:14:25<5:20:10,  2.14s/it][A
Training...:  35% 4929/13907 [3:14:27<5:16:33,  2.12s/it][A
Training...:  35% 4930/13907 [3:14:29<5:11:23,  2.08s/it][A
Training...:  35% 4931/13907 [3:14:31<5:07:48,  2.06s/it][A
Training...:  35% 4932/13907 [3:14:33<5:02:55,  2.03s/it][A
Training...:  35% 4933/13907 [3:14:35<4:59:44,  2.00s/it][A
Training...:  35% 4934/13907 [3:14:37<4:56:11,  1.98s/it][A
Training...:  35% 4935/13907 [3:14:39<4:52:17,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:44:52<17:31:07, 31533.87s/it]
Training...:  35% 4935/13907 [3:14:41<4:52:17,  1.95s/it][A
Training...:  35% 4936/13907 [3:14:41<5:02:24,  2.02s/it][A
Training...:  36% 4937/13907 [3:14:43<4:57:23,  1.99s/it][A
Training...:  36% 4938/13907 [3:14:45<4:48:33,  1.93s/it][A
Training...:  36% 4939/13907 [3:14:46<4:41:31,  1.88s/it][A
Training...:  36% 4940/13907 [3:14:48<4:33:21,  1.83s/it][A
Training...:  36% 4941/13907 [3:14:50<4:26:27,  1.78s/it][A
Training...:  36% 4942/13907 [3:14:52<4:20:05,  1.74s/it][A
Training...:  36% 4943/13907 [3:14:53<4:14:01,  1.70s/it][A
Training...:  36% 4944/13907 [3:14:55<4:08:44,  1.67s/it][A
Training...:  36% 4945/13907 [3:14:56<4:01:54,  1.62s/it][A
Training...:  36% 4946/13907 [3:14:58<3:54:23,  1.57s/it][A
Training...:  36% 4947/13907 [3:14:59<3:45:43,  1.51s/it][A
Training...:  36% 4948/13907 [3:15:00<3:37:27,  1.46s/it][A
Training...:  36% 4949/13907 [3:15:02<3:26:39,  1.38s/it][A
Training...:  36% 4950/13907 [3:15:03<3:11:48,  1.28s/it][A
Training...:  36% 4951/13907 [3:15:06<5:03:32,  2.03s/it][A
Training...:  36% 4952/13907 [3:15:10<6:07:49,  2.46s/it][A
Training...:  36% 4953/13907 [3:15:13<6:42:55,  2.70s/it][A
Training...:  36% 4954/13907 [3:15:16<7:03:09,  2.84s/it][A
Training...:  36% 4955/13907 [3:15:19<7:13:45,  2.91s/it][A
Training...:  36% 4956/13907 [3:15:22<7:15:53,  2.92s/it][A
Training...:  36% 4957/13907 [3:15:25<7:14:51,  2.92s/it][A
Training...:  36% 4958/13907 [3:15:28<7:12:20,  2.90s/it][A
Training...:  36% 4959/13907 [3:15:31<7:08:20,  2.87s/it][A
Training...:  36% 4960/13907 [3:15:34<7:04:30,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:45:48<17:31:07, 31533.87s/it]
Training...:  36% 4960/13907 [3:15:37<7:04:30,  2.85s/it][A
Training...:  36% 4961/13907 [3:15:37<7:14:59,  2.92s/it][A
Training...:  36% 4962/13907 [3:15:39<7:04:40,  2.85s/it][A
Training...:  36% 4963/13907 [3:15:42<6:51:46,  2.76s/it][A
Training...:  36% 4964/13907 [3:15:45<6:42:18,  2.70s/it][A
Training...:  36% 4965/13907 [3:15:47<6:33:41,  2.64s/it][A
Training...:  36% 4966/13907 [3:15:50<6:29:12,  2.61s/it][A
Training...:  36% 4967/13907 [3:15:52<6:21:16,  2.56s/it][A
Training...:  36% 4968/13907 [3:15:54<6:13:51,  2.51s/it][A
Training...:  36% 4969/13907 [3:15:57<6:08:18,  2.47s/it][A
Training...:  36% 4970/13907 [3:15:59<6:03:17,  2.44s/it][A
Training...:  36% 4971/13907 [3:16:02<5:58:20,  2.41s/it][A
Training...:  36% 4972/13907 [3:16:04<5:53:53,  2.38s/it][A
Training...:  36% 4973/13907 [3:16:06<5:48:13,  2.34s/it][A
Training...:  36% 4974/13907 [3:16:08<5:41:48,  2.30s/it][A
Training...:  36% 4975/13907 [3:16:10<5:36:17,  2.26s/it][A
Training...:  36% 4976/13907 [3:16:13<5:30:04,  2.22s/it][A
Training...:  36% 4977/13907 [3:16:15<5:24:41,  2.18s/it][A
Training...:  36% 4978/13907 [3:16:17<5:20:16,  2.15s/it][A
Training...:  36% 4979/13907 [3:16:19<5:17:31,  2.13s/it][A
Training...:  36% 4980/13907 [3:16:21<5:13:02,  2.10s/it][A
Training...:  36% 4981/13907 [3:16:23<5:08:12,  2.07s/it][A
Training...:  36% 4982/13907 [3:16:25<5:03:23,  2.04s/it][A
Training...:  36% 4983/13907 [3:16:27<4:58:08,  2.00s/it][A
Training...:  36% 4984/13907 [3:16:29<4:54:12,  1.98s/it][A
Training...:  36% 4985/13907 [3:16:31<4:48:37,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:46:44<17:31:07, 31533.87s/it]
Training...:  36% 4985/13907 [3:16:33<4:48:37,  1.94s/it][A
Training...:  36% 4986/13907 [3:16:33<4:56:59,  2.00s/it][A
Training...:  36% 4987/13907 [3:16:35<4:52:50,  1.97s/it][A
Training...:  36% 4988/13907 [3:16:36<4:44:39,  1.91s/it][A
Training...:  36% 4989/13907 [3:16:38<4:36:23,  1.86s/it][A
Training...:  36% 4990/13907 [3:16:40<4:29:41,  1.81s/it][A
Training...:  36% 4991/13907 [3:16:41<4:22:31,  1.77s/it][A
Training...:  36% 4992/13907 [3:16:43<4:16:42,  1.73s/it][A
Training...:  36% 4993/13907 [3:16:45<4:11:53,  1.70s/it][A
Training...:  36% 4994/13907 [3:16:46<4:07:04,  1.66s/it][A
Training...:  36% 4995/13907 [3:16:48<3:59:27,  1.61s/it][A
Training...:  36% 4996/13907 [3:16:49<3:51:09,  1.56s/it][A
Training...:  36% 4997/13907 [3:16:51<3:41:40,  1.49s/it][A
Training...:  36% 4998/13907 [3:16:52<3:32:12,  1.43s/it][A
Training...:  36% 4999/13907 [3:16:53<3:21:43,  1.36s/it][A
Training...:  36% 5000/13907 [3:16:54<3:06:49,  1.26s/it][A
Training...:  36% 5001/13907 [3:16:58<5:03:45,  2.05s/it][A
Training...:  36% 5002/13907 [3:17:01<6:06:15,  2.47s/it][A
Training...:  36% 5003/13907 [3:17:05<6:39:56,  2.70s/it][A
Training...:  36% 5004/13907 [3:17:08<6:57:23,  2.81s/it][A
Training...:  36% 5005/13907 [3:17:11<7:06:16,  2.87s/it][A
Training...:  36% 5006/13907 [3:17:14<7:08:44,  2.89s/it][A
Training...:  36% 5007/13907 [3:17:16<7:07:08,  2.88s/it][A
Training...:  36% 5008/13907 [3:17:19<7:03:54,  2.86s/it][A
Training...:  36% 5009/13907 [3:17:22<6:58:14,  2.82s/it][A
Training...:  36% 5010/13907 [3:17:25<6:51:28,  2.77s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:47:39<17:31:07, 31533.87s/it]
Training...:  36% 5010/13907 [3:17:28<6:51:28,  2.77s/it][A
Training...:  36% 5011/13907 [3:17:28<7:05:15,  2.87s/it][A
Training...:  36% 5012/13907 [3:17:30<6:56:21,  2.81s/it][A
Training...:  36% 5013/13907 [3:17:33<6:44:48,  2.73s/it][A
Training...:  36% 5014/13907 [3:17:36<6:34:44,  2.66s/it][A
Training...:  36% 5015/13907 [3:17:38<6:26:21,  2.61s/it][A
Training...:  36% 5016/13907 [3:17:40<6:18:53,  2.56s/it][A
Training...:  36% 5017/13907 [3:17:43<6:11:57,  2.51s/it][A
Training...:  36% 5018/13907 [3:17:45<6:04:44,  2.46s/it][A
Training...:  36% 5019/13907 [3:17:48<5:59:57,  2.43s/it][A
Training...:  36% 5020/13907 [3:17:50<5:56:07,  2.40s/it][A
Training...:  36% 5021/13907 [3:17:52<5:50:56,  2.37s/it][A
Training...:  36% 5022/13907 [3:17:54<5:46:04,  2.34s/it][A
Training...:  36% 5023/13907 [3:17:57<5:41:05,  2.30s/it][A
Training...:  36% 5024/13907 [3:17:59<5:35:22,  2.27s/it][A
Training...:  36% 5025/13907 [3:18:01<5:31:07,  2.24s/it][A
Training...:  36% 5026/13907 [3:18:03<5:26:50,  2.21s/it][A
Training...:  36% 5027/13907 [3:18:05<5:22:26,  2.18s/it][A
Training...:  36% 5028/13907 [3:18:07<5:18:01,  2.15s/it][A
Training...:  36% 5029/13907 [3:18:09<5:15:34,  2.13s/it][A
Training...:  36% 5030/13907 [3:18:11<5:12:08,  2.11s/it][A
Training...:  36% 5031/13907 [3:18:13<5:06:40,  2.07s/it][A
Training...:  36% 5032/13907 [3:18:15<5:01:19,  2.04s/it][A
Training...:  36% 5033/13907 [3:18:17<4:56:34,  2.01s/it][A
Training...:  36% 5034/13907 [3:18:19<4:51:51,  1.97s/it][A
Training...:  36% 5035/13907 [3:18:21<4:47:25,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:48:34<17:31:07, 31533.87s/it]
Training...:  36% 5035/13907 [3:18:23<4:47:25,  1.94s/it][A
Training...:  36% 5036/13907 [3:18:23<4:55:44,  2.00s/it][A
Training...:  36% 5037/13907 [3:18:25<4:49:26,  1.96s/it][A
Training...:  36% 5038/13907 [3:18:27<4:40:45,  1.90s/it][A
Training...:  36% 5039/13907 [3:18:29<4:33:43,  1.85s/it][A
Training...:  36% 5040/13907 [3:18:30<4:27:12,  1.81s/it][A
Training...:  36% 5041/13907 [3:18:32<4:20:32,  1.76s/it][A
Training...:  36% 5042/13907 [3:18:34<4:13:57,  1.72s/it][A
Training...:  36% 5043/13907 [3:18:35<4:08:40,  1.68s/it][A
Training...:  36% 5044/13907 [3:18:37<4:04:10,  1.65s/it][A
Training...:  36% 5045/13907 [3:18:38<3:57:52,  1.61s/it][A
Training...:  36% 5046/13907 [3:18:40<3:50:50,  1.56s/it][A
Training...:  36% 5047/13907 [3:18:41<3:43:14,  1.51s/it][A
Training...:  36% 5048/13907 [3:18:42<3:35:39,  1.46s/it][A
Training...:  36% 5049/13907 [3:18:44<3:26:12,  1.40s/it][A
Training...:  36% 5050/13907 [3:18:45<3:11:36,  1.30s/it][A
Training...:  36% 5051/13907 [3:18:49<5:01:07,  2.04s/it][A
Training...:  36% 5052/13907 [3:18:52<6:07:20,  2.49s/it][A
Training...:  36% 5053/13907 [3:18:55<6:43:20,  2.73s/it][A
Training...:  36% 5054/13907 [3:18:59<7:02:14,  2.86s/it][A
Training...:  36% 5055/13907 [3:19:02<7:13:48,  2.94s/it][A
Training...:  36% 5056/13907 [3:19:05<7:16:18,  2.96s/it][A
Training...:  36% 5057/13907 [3:19:08<7:14:48,  2.95s/it][A
Training...:  36% 5058/13907 [3:19:10<7:10:09,  2.92s/it][A
Training...:  36% 5059/13907 [3:19:13<7:06:15,  2.89s/it][A
Training...:  36% 5060/13907 [3:19:16<6:59:24,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:49:30<17:31:07, 31533.87s/it]
Training...:  36% 5060/13907 [3:19:19<6:59:24,  2.84s/it][A
Training...:  36% 5061/13907 [3:19:19<7:12:24,  2.93s/it][A
Training...:  36% 5062/13907 [3:19:22<7:03:50,  2.88s/it][A
Training...:  36% 5063/13907 [3:19:25<6:54:18,  2.81s/it][A
Training...:  36% 5064/13907 [3:19:27<6:46:23,  2.76s/it][A
Training...:  36% 5065/13907 [3:19:30<6:38:46,  2.71s/it][A
Training...:  36% 5066/13907 [3:19:32<6:28:20,  2.64s/it][A
Training...:  36% 5067/13907 [3:19:35<6:21:19,  2.59s/it][A
Training...:  36% 5068/13907 [3:19:37<6:13:40,  2.54s/it][A
Training...:  36% 5069/13907 [3:19:40<6:06:13,  2.49s/it][A
Training...:  36% 5070/13907 [3:19:42<5:59:57,  2.44s/it][A
Training...:  36% 5071/13907 [3:19:44<5:54:50,  2.41s/it][A
Training...:  36% 5072/13907 [3:19:47<5:50:11,  2.38s/it][A
Training...:  36% 5073/13907 [3:19:49<5:44:32,  2.34s/it][A
Training...:  36% 5074/13907 [3:19:51<5:38:45,  2.30s/it][A
Training...:  36% 5075/13907 [3:19:53<5:34:52,  2.28s/it][A
Training...:  36% 5076/13907 [3:19:55<5:29:35,  2.24s/it][A
Training...:  37% 5077/13907 [3:19:57<5:25:02,  2.21s/it][A
Training...:  37% 5078/13907 [3:20:00<5:20:50,  2.18s/it][A
Training...:  37% 5079/13907 [3:20:02<5:16:12,  2.15s/it][A
Training...:  37% 5080/13907 [3:20:04<5:12:02,  2.12s/it][A
Training...:  37% 5081/13907 [3:20:06<5:08:09,  2.09s/it][A
Training...:  37% 5082/13907 [3:20:08<5:04:17,  2.07s/it][A
Training...:  37% 5083/13907 [3:20:10<4:59:43,  2.04s/it][A
Training...:  37% 5084/13907 [3:20:12<4:54:53,  2.01s/it][A
Training...:  37% 5085/13907 [3:20:14<4:49:47,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:50:27<17:31:07, 31533.87s/it]
Training...:  37% 5085/13907 [3:20:16<4:49:47,  1.97s/it][A
Training...:  37% 5086/13907 [3:20:16<4:59:31,  2.04s/it][A
Training...:  37% 5087/13907 [3:20:18<4:53:06,  1.99s/it][A
Training...:  37% 5088/13907 [3:20:19<4:44:25,  1.94s/it][A
Training...:  37% 5089/13907 [3:20:21<4:37:40,  1.89s/it][A
Training...:  37% 5090/13907 [3:20:23<4:30:54,  1.84s/it][A
Training...:  37% 5091/13907 [3:20:25<4:24:19,  1.80s/it][A
Training...:  37% 5092/13907 [3:20:26<4:18:08,  1.76s/it][A
Training...:  37% 5093/13907 [3:20:28<4:12:12,  1.72s/it][A
Training...:  37% 5094/13907 [3:20:30<4:06:42,  1.68s/it][A
Training...:  37% 5095/13907 [3:20:31<3:59:00,  1.63s/it][A
Training...:  37% 5096/13907 [3:20:32<3:51:57,  1.58s/it][A
Training...:  37% 5097/13907 [3:20:34<3:43:47,  1.52s/it][A
Training...:  37% 5098/13907 [3:20:35<3:35:06,  1.47s/it][A
Training...:  37% 5099/13907 [3:20:36<3:24:56,  1.40s/it][A
Training...:  37% 5100/13907 [3:20:38<3:09:40,  1.29s/it][A
Training...:  37% 5101/13907 [3:20:41<4:55:12,  2.01s/it][A
Training...:  37% 5102/13907 [3:20:45<6:01:46,  2.47s/it][A
Training...:  37% 5103/13907 [3:20:48<6:38:07,  2.71s/it][A
Training...:  37% 5104/13907 [3:20:51<6:56:30,  2.84s/it][A
Training...:  37% 5105/13907 [3:20:54<7:05:29,  2.90s/it][A
Training...:  37% 5106/13907 [3:20:57<7:07:02,  2.91s/it][A
Training...:  37% 5107/13907 [3:21:00<7:05:14,  2.90s/it][A
Training...:  37% 5108/13907 [3:21:03<6:59:41,  2.86s/it][A
Training...:  37% 5109/13907 [3:21:05<6:53:46,  2.82s/it][A
Training...:  37% 5110/13907 [3:21:08<6:47:33,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:51:22<17:31:07, 31533.87s/it]
Training...:  37% 5110/13907 [3:21:11<6:47:33,  2.78s/it][A
Training...:  37% 5111/13907 [3:21:11<6:59:03,  2.86s/it][A
Training...:  37% 5112/13907 [3:21:14<6:49:36,  2.79s/it][A
Training...:  37% 5113/13907 [3:21:16<6:38:19,  2.72s/it][A
Training...:  37% 5114/13907 [3:21:19<6:29:48,  2.66s/it][A
Training...:  37% 5115/13907 [3:21:21<6:21:50,  2.61s/it][A
Training...:  37% 5116/13907 [3:21:24<6:15:16,  2.56s/it][A
Training...:  37% 5117/13907 [3:21:26<6:08:18,  2.51s/it][A
Training...:  37% 5118/13907 [3:21:29<6:03:05,  2.48s/it][A
Training...:  37% 5119/13907 [3:21:31<5:57:24,  2.44s/it][A
Training...:  37% 5120/13907 [3:21:33<5:52:16,  2.41s/it][A
Training...:  37% 5121/13907 [3:21:36<5:48:17,  2.38s/it][A
Training...:  37% 5122/13907 [3:21:38<5:42:36,  2.34s/it][A
Training...:  37% 5123/13907 [3:21:40<5:37:09,  2.30s/it][A
Training...:  37% 5124/13907 [3:21:42<5:32:20,  2.27s/it][A
Training...:  37% 5125/13907 [3:21:45<5:29:21,  2.25s/it][A
Training...:  37% 5126/13907 [3:21:47<5:26:19,  2.23s/it][A
Training...:  37% 5127/13907 [3:21:49<5:21:59,  2.20s/it][A
Training...:  37% 5128/13907 [3:21:51<5:16:21,  2.16s/it][A
Training...:  37% 5129/13907 [3:21:53<5:11:03,  2.13s/it][A
Training...:  37% 5130/13907 [3:21:55<5:05:35,  2.09s/it][A
Training...:  37% 5131/13907 [3:21:57<5:00:48,  2.06s/it][A
Training...:  37% 5132/13907 [3:21:59<4:56:05,  2.02s/it][A
Training...:  37% 5133/13907 [3:22:01<4:50:59,  1.99s/it][A
Training...:  37% 5134/13907 [3:22:03<4:46:19,  1.96s/it][A
Training...:  37% 5135/13907 [3:22:05<4:42:16,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:52:18<17:31:07, 31533.87s/it]
Training...:  37% 5135/13907 [3:22:07<4:42:16,  1.93s/it][A
Training...:  37% 5136/13907 [3:22:07<4:51:02,  1.99s/it][A
Training...:  37% 5137/13907 [3:22:09<4:45:18,  1.95s/it][A
Training...:  37% 5138/13907 [3:22:10<4:37:08,  1.90s/it][A
Training...:  37% 5139/13907 [3:22:12<4:29:36,  1.84s/it][A
Training...:  37% 5140/13907 [3:22:14<4:23:12,  1.80s/it][A
Training...:  37% 5141/13907 [3:22:15<4:16:42,  1.76s/it][A
Training...:  37% 5142/13907 [3:22:17<4:10:59,  1.72s/it][A
Training...:  37% 5143/13907 [3:22:19<4:05:20,  1.68s/it][A
Training...:  37% 5144/13907 [3:22:20<3:59:19,  1.64s/it][A
Training...:  37% 5145/13907 [3:22:22<3:51:39,  1.59s/it][A
Training...:  37% 5146/13907 [3:22:23<3:44:32,  1.54s/it][A
Training...:  37% 5147/13907 [3:22:24<3:36:55,  1.49s/it][A
Training...:  37% 5148/13907 [3:22:26<3:28:18,  1.43s/it][A
Training...:  37% 5149/13907 [3:22:27<3:19:11,  1.36s/it][A
Training...:  37% 5150/13907 [3:22:28<3:05:33,  1.27s/it][A
Training...:  37% 5151/13907 [3:22:32<4:53:51,  2.01s/it][A
Training...:  37% 5152/13907 [3:22:35<6:01:34,  2.48s/it][A
Training...:  37% 5153/13907 [3:22:39<6:37:40,  2.73s/it][A
Training...:  37% 5154/13907 [3:22:42<6:55:44,  2.85s/it][A
Training...:  37% 5155/13907 [3:22:45<7:04:44,  2.91s/it][A
Training...:  37% 5156/13907 [3:22:48<7:08:21,  2.94s/it][A
Training...:  37% 5157/13907 [3:22:51<7:09:57,  2.95s/it][A
Training...:  37% 5158/13907 [3:22:54<7:05:38,  2.92s/it][A
Training...:  37% 5159/13907 [3:22:56<6:57:40,  2.86s/it][A
Training...:  37% 5160/13907 [3:22:59<6:49:20,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:53:13<17:31:07, 31533.87s/it]
Training...:  37% 5160/13907 [3:23:02<6:49:20,  2.81s/it][A
Training...:  37% 5161/13907 [3:23:02<6:59:34,  2.88s/it][A
Training...:  37% 5162/13907 [3:23:05<6:50:52,  2.82s/it][A
Training...:  37% 5163/13907 [3:23:07<6:38:41,  2.74s/it][A
Training...:  37% 5164/13907 [3:23:10<6:28:11,  2.66s/it][A
Training...:  37% 5165/13907 [3:23:12<6:20:11,  2.61s/it][A
Training...:  37% 5166/13907 [3:23:15<6:12:50,  2.56s/it][A
Training...:  37% 5167/13907 [3:23:17<6:07:07,  2.52s/it][A
Training...:  37% 5168/13907 [3:23:19<5:59:50,  2.47s/it][A
Training...:  37% 5169/13907 [3:23:22<5:54:12,  2.43s/it][A
Training...:  37% 5170/13907 [3:23:24<5:48:35,  2.39s/it][A
Training...:  37% 5171/13907 [3:23:26<5:45:09,  2.37s/it][A
Training...:  37% 5172/13907 [3:23:29<5:38:46,  2.33s/it][A
Training...:  37% 5173/13907 [3:23:31<5:33:35,  2.29s/it][A
Training...:  37% 5174/13907 [3:23:33<5:28:57,  2.26s/it][A
Training...:  37% 5175/13907 [3:23:35<5:24:20,  2.23s/it][A
Training...:  37% 5176/13907 [3:23:37<5:20:06,  2.20s/it][A
Training...:  37% 5177/13907 [3:23:39<5:16:00,  2.17s/it][A
Training...:  37% 5178/13907 [3:23:42<5:11:58,  2.14s/it][A
Training...:  37% 5179/13907 [3:23:44<5:07:03,  2.11s/it][A
Training...:  37% 5180/13907 [3:23:46<5:02:15,  2.08s/it][A
Training...:  37% 5181/13907 [3:23:48<4:57:56,  2.05s/it][A
Training...:  37% 5182/13907 [3:23:49<4:52:20,  2.01s/it][A
Training...:  37% 5183/13907 [3:23:51<4:48:40,  1.99s/it][A
Training...:  37% 5184/13907 [3:23:53<4:44:01,  1.95s/it][A
Training...:  37% 5185/13907 [3:23:55<4:40:13,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:54:08<17:31:07, 31533.87s/it]
Training...:  37% 5185/13907 [3:23:57<4:40:13,  1.93s/it][A
Training...:  37% 5186/13907 [3:23:57<4:49:46,  1.99s/it][A
Training...:  37% 5187/13907 [3:23:59<4:45:39,  1.97s/it][A
Training...:  37% 5188/13907 [3:24:01<4:38:22,  1.92s/it][A
Training...:  37% 5189/13907 [3:24:03<4:31:24,  1.87s/it][A
Training...:  37% 5190/13907 [3:24:04<4:25:41,  1.83s/it][A
Training...:  37% 5191/13907 [3:24:06<4:19:02,  1.78s/it][A
Training...:  37% 5192/13907 [3:24:08<4:13:10,  1.74s/it][A
Training...:  37% 5193/13907 [3:24:09<4:06:59,  1.70s/it][A
Training...:  37% 5194/13907 [3:24:11<4:01:25,  1.66s/it][A
Training...:  37% 5195/13907 [3:24:12<3:54:20,  1.61s/it][A
Training...:  37% 5196/13907 [3:24:14<3:45:52,  1.56s/it][A
Training...:  37% 5197/13907 [3:24:15<3:37:33,  1.50s/it][A
Training...:  37% 5198/13907 [3:24:17<3:28:31,  1.44s/it][A
Training...:  37% 5199/13907 [3:24:18<3:18:43,  1.37s/it][A
Training...:  37% 5200/13907 [3:24:19<3:05:25,  1.28s/it][A
Training...:  37% 5201/13907 [3:24:23<4:52:18,  2.01s/it][A
Training...:  37% 5202/13907 [3:24:26<5:55:39,  2.45s/it][A
Training...:  37% 5203/13907 [3:24:29<6:32:22,  2.70s/it][A
Training...:  37% 5204/13907 [3:24:32<6:49:33,  2.82s/it][A
Training...:  37% 5205/13907 [3:24:35<6:58:06,  2.88s/it][A
Training...:  37% 5206/13907 [3:24:38<7:00:04,  2.90s/it][A
Training...:  37% 5207/13907 [3:24:41<6:58:27,  2.89s/it][A
Training...:  37% 5208/13907 [3:24:44<6:55:39,  2.87s/it][A
Training...:  37% 5209/13907 [3:24:47<6:51:03,  2.84s/it][A
Training...:  37% 5210/13907 [3:24:50<6:46:05,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:55:04<17:31:07, 31533.87s/it]
Training...:  37% 5210/13907 [3:24:53<6:46:05,  2.80s/it][A
Training...:  37% 5211/13907 [3:24:53<6:58:44,  2.89s/it][A
Training...:  37% 5212/13907 [3:24:55<6:51:08,  2.84s/it][A
Training...:  37% 5213/13907 [3:24:58<6:40:02,  2.76s/it][A
Training...:  37% 5214/13907 [3:25:01<6:31:40,  2.70s/it][A
Training...:  37% 5215/13907 [3:25:03<6:24:04,  2.65s/it][A
Training...:  38% 5216/13907 [3:25:05<6:15:41,  2.59s/it][A
Training...:  38% 5217/13907 [3:25:08<6:08:18,  2.54s/it][A
Training...:  38% 5218/13907 [3:25:10<6:04:24,  2.52s/it][A
Training...:  38% 5219/13907 [3:25:13<6:00:28,  2.49s/it][A
Training...:  38% 5220/13907 [3:25:15<5:53:19,  2.44s/it][A
Training...:  38% 5221/13907 [3:25:17<5:48:06,  2.40s/it][A
Training...:  38% 5222/13907 [3:25:20<5:42:31,  2.37s/it][A
Training...:  38% 5223/13907 [3:25:22<5:36:33,  2.33s/it][A
Training...:  38% 5224/13907 [3:25:24<5:30:48,  2.29s/it][A
Training...:  38% 5225/13907 [3:25:26<5:25:50,  2.25s/it][A
Training...:  38% 5226/13907 [3:25:28<5:21:53,  2.22s/it][A
Training...:  38% 5227/13907 [3:25:31<5:17:18,  2.19s/it][A
Training...:  38% 5228/13907 [3:25:33<5:11:48,  2.16s/it][A
Training...:  38% 5229/13907 [3:25:35<5:08:20,  2.13s/it][A
Training...:  38% 5230/13907 [3:25:37<5:04:01,  2.10s/it][A
Training...:  38% 5231/13907 [3:25:39<4:59:54,  2.07s/it][A
Training...:  38% 5232/13907 [3:25:41<4:55:05,  2.04s/it][A
Training...:  38% 5233/13907 [3:25:43<4:51:00,  2.01s/it][A
Training...:  38% 5234/13907 [3:25:45<4:47:14,  1.99s/it][A
Training...:  38% 5235/13907 [3:25:47<4:43:06,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:56:00<17:31:07, 31533.87s/it]
Training...:  38% 5235/13907 [3:25:49<4:43:06,  1.96s/it][A
Training...:  38% 5236/13907 [3:25:49<4:51:45,  2.02s/it][A
Training...:  38% 5237/13907 [3:25:51<4:46:08,  1.98s/it][A
Training...:  38% 5238/13907 [3:25:52<4:37:19,  1.92s/it][A
Training...:  38% 5239/13907 [3:25:54<4:30:08,  1.87s/it][A
Training...:  38% 5240/13907 [3:25:56<4:23:01,  1.82s/it][A
Training...:  38% 5241/13907 [3:25:57<4:16:57,  1.78s/it][A
Training...:  38% 5242/13907 [3:25:59<4:12:15,  1.75s/it][A
Training...:  38% 5243/13907 [3:26:01<4:05:49,  1.70s/it][A
Training...:  38% 5244/13907 [3:26:02<3:59:47,  1.66s/it][A
Training...:  38% 5245/13907 [3:26:04<3:53:30,  1.62s/it][A
Training...:  38% 5246/13907 [3:26:05<3:46:10,  1.57s/it][A
Training...:  38% 5247/13907 [3:26:07<3:38:44,  1.52s/it][A
Training...:  38% 5248/13907 [3:26:08<3:30:48,  1.46s/it][A
Training...:  38% 5249/13907 [3:26:09<3:20:47,  1.39s/it][A
Training...:  38% 5250/13907 [3:26:10<3:07:15,  1.30s/it][A
Training...:  38% 5251/13907 [3:26:14<4:53:31,  2.03s/it][A
Training...:  38% 5252/13907 [3:26:18<5:57:50,  2.48s/it][A
Training...:  38% 5253/13907 [3:26:21<6:32:27,  2.72s/it][A
Training...:  38% 5254/13907 [3:26:24<6:49:47,  2.84s/it][A
Training...:  38% 5255/13907 [3:26:27<7:03:19,  2.94s/it][A
Training...:  38% 5256/13907 [3:26:30<7:06:58,  2.96s/it][A
Training...:  38% 5257/13907 [3:26:33<7:04:27,  2.94s/it][A
Training...:  38% 5258/13907 [3:26:36<6:59:04,  2.91s/it][A
Training...:  38% 5259/13907 [3:26:39<6:52:57,  2.87s/it][A
Training...:  38% 5260/13907 [3:26:41<6:44:57,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:56:55<17:31:07, 31533.87s/it]
Training...:  38% 5260/13907 [3:26:44<6:44:57,  2.81s/it][A
Training...:  38% 5261/13907 [3:26:44<6:55:52,  2.89s/it][A
Training...:  38% 5262/13907 [3:26:47<6:47:54,  2.83s/it][A
Training...:  38% 5263/13907 [3:26:50<6:36:14,  2.75s/it][A
Training...:  38% 5264/13907 [3:26:52<6:26:13,  2.68s/it][A
Training...:  38% 5265/13907 [3:26:55<6:16:57,  2.62s/it][A
Training...:  38% 5266/13907 [3:26:57<6:08:17,  2.56s/it][A
Training...:  38% 5267/13907 [3:26:59<6:01:26,  2.51s/it][A
Training...:  38% 5268/13907 [3:27:02<5:54:24,  2.46s/it][A
Training...:  38% 5269/13907 [3:27:04<5:49:08,  2.43s/it][A
Training...:  38% 5270/13907 [3:27:06<5:43:43,  2.39s/it][A
Training...:  38% 5271/13907 [3:27:09<5:39:32,  2.36s/it][A
Training...:  38% 5272/13907 [3:27:11<5:34:42,  2.33s/it][A
Training...:  38% 5273/13907 [3:27:13<5:30:01,  2.29s/it][A
Training...:  38% 5274/13907 [3:27:15<5:25:44,  2.26s/it][A
Training...:  38% 5275/13907 [3:27:18<5:21:17,  2.23s/it][A
Training...:  38% 5276/13907 [3:27:20<5:16:48,  2.20s/it][A
Training...:  38% 5277/13907 [3:27:22<5:11:48,  2.17s/it][A
Training...:  38% 5278/13907 [3:27:24<5:08:04,  2.14s/it][A
Training...:  38% 5279/13907 [3:27:26<5:04:15,  2.12s/it][A
Training...:  38% 5280/13907 [3:27:28<4:59:20,  2.08s/it][A
Training...:  38% 5281/13907 [3:27:30<4:55:20,  2.05s/it][A
Training...:  38% 5282/13907 [3:27:32<4:53:06,  2.04s/it][A
Training...:  38% 5283/13907 [3:27:34<4:51:08,  2.03s/it][A
Training...:  38% 5284/13907 [3:27:36<4:47:48,  2.00s/it][A
Training...:  38% 5285/13907 [3:27:38<4:42:04,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:57:51<17:31:07, 31533.87s/it]
Training...:  38% 5285/13907 [3:27:40<4:42:04,  1.96s/it][A
Training...:  38% 5286/13907 [3:27:40<4:50:26,  2.02s/it][A
Training...:  38% 5287/13907 [3:27:42<4:43:13,  1.97s/it][A
Training...:  38% 5288/13907 [3:27:44<4:35:26,  1.92s/it][A
Training...:  38% 5289/13907 [3:27:45<4:28:01,  1.87s/it][A
Training...:  38% 5290/13907 [3:27:47<4:20:27,  1.81s/it][A
Training...:  38% 5291/13907 [3:27:49<4:14:25,  1.77s/it][A
Training...:  38% 5292/13907 [3:27:50<4:07:22,  1.72s/it][A
Training...:  38% 5293/13907 [3:27:52<4:00:42,  1.68s/it][A
Training...:  38% 5294/13907 [3:27:53<3:55:58,  1.64s/it][A
Training...:  38% 5295/13907 [3:27:55<3:48:57,  1.60s/it][A
Training...:  38% 5296/13907 [3:27:56<3:41:24,  1.54s/it][A
Training...:  38% 5297/13907 [3:27:58<3:34:35,  1.50s/it][A
Training...:  38% 5298/13907 [3:27:59<3:26:14,  1.44s/it][A
Training...:  38% 5299/13907 [3:28:00<3:16:21,  1.37s/it][A
Training...:  38% 5300/13907 [3:28:01<3:01:54,  1.27s/it][A
Training...:  38% 5301/13907 [3:28:05<4:46:58,  2.00s/it][A
Training...:  38% 5302/13907 [3:28:08<5:49:45,  2.44s/it][A
Training...:  38% 5303/13907 [3:28:12<6:23:16,  2.67s/it][A
Training...:  38% 5304/13907 [3:28:15<6:40:05,  2.79s/it][A
Training...:  38% 5305/13907 [3:28:18<6:50:10,  2.86s/it][A
Training...:  38% 5306/13907 [3:28:21<6:51:31,  2.87s/it][A
Training...:  38% 5307/13907 [3:28:23<6:51:25,  2.87s/it][A
Training...:  38% 5308/13907 [3:28:26<6:48:33,  2.85s/it][A
Training...:  38% 5309/13907 [3:28:29<6:43:43,  2.82s/it][A
Training...:  38% 5310/13907 [3:28:32<6:38:54,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:58:46<17:31:07, 31533.87s/it]
Training...:  38% 5310/13907 [3:28:35<6:38:54,  2.78s/it][A
Training...:  38% 5311/13907 [3:28:35<6:49:54,  2.86s/it][A
Training...:  38% 5312/13907 [3:28:37<6:41:50,  2.81s/it][A
Training...:  38% 5313/13907 [3:28:40<6:30:22,  2.73s/it][A
Training...:  38% 5314/13907 [3:28:43<6:21:53,  2.67s/it][A
Training...:  38% 5315/13907 [3:28:45<6:15:21,  2.62s/it][A
Training...:  38% 5316/13907 [3:28:48<6:11:47,  2.60s/it][A
Training...:  38% 5317/13907 [3:28:50<6:07:13,  2.56s/it][A
Training...:  38% 5318/13907 [3:28:52<5:59:48,  2.51s/it][A
Training...:  38% 5319/13907 [3:28:55<5:53:01,  2.47s/it][A
Training...:  38% 5320/13907 [3:28:57<5:46:51,  2.42s/it][A
Training...:  38% 5321/13907 [3:28:59<5:41:47,  2.39s/it][A
Training...:  38% 5322/13907 [3:29:02<5:36:05,  2.35s/it][A
Training...:  38% 5323/13907 [3:29:04<5:29:53,  2.31s/it][A
Training...:  38% 5324/13907 [3:29:06<5:25:12,  2.27s/it][A
Training...:  38% 5325/13907 [3:29:08<5:20:15,  2.24s/it][A
Training...:  38% 5326/13907 [3:29:10<5:16:15,  2.21s/it][A
Training...:  38% 5327/13907 [3:29:13<5:11:37,  2.18s/it][A
Training...:  38% 5328/13907 [3:29:15<5:07:11,  2.15s/it][A
Training...:  38% 5329/13907 [3:29:17<5:03:49,  2.13s/it][A
Training...:  38% 5330/13907 [3:29:19<4:59:53,  2.10s/it][A
Training...:  38% 5331/13907 [3:29:21<4:55:25,  2.07s/it][A
Training...:  38% 5332/13907 [3:29:23<4:50:44,  2.03s/it][A
Training...:  38% 5333/13907 [3:29:25<4:46:07,  2.00s/it][A
Training...:  38% 5334/13907 [3:29:26<4:41:45,  1.97s/it][A
Training...:  38% 5335/13907 [3:29:28<4:37:43,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [20:59:42<17:31:07, 31533.87s/it]
Training...:  38% 5335/13907 [3:29:31<4:37:43,  1.94s/it][A
Training...:  38% 5336/13907 [3:29:31<4:46:22,  2.00s/it][A
Training...:  38% 5337/13907 [3:29:32<4:41:05,  1.97s/it][A
Training...:  38% 5338/13907 [3:29:34<4:33:18,  1.91s/it][A
Training...:  38% 5339/13907 [3:29:36<4:26:20,  1.87s/it][A
Training...:  38% 5340/13907 [3:29:38<4:20:06,  1.82s/it][A
Training...:  38% 5341/13907 [3:29:39<4:15:09,  1.79s/it][A
Training...:  38% 5342/13907 [3:29:41<4:08:57,  1.74s/it][A
Training...:  38% 5343/13907 [3:29:43<4:02:16,  1.70s/it][A
Training...:  38% 5344/13907 [3:29:44<3:56:38,  1.66s/it][A
Training...:  38% 5345/13907 [3:29:46<3:50:18,  1.61s/it][A
Training...:  38% 5346/13907 [3:29:47<3:43:27,  1.57s/it][A
Training...:  38% 5347/13907 [3:29:49<3:37:00,  1.52s/it][A
Training...:  38% 5348/13907 [3:29:50<3:28:34,  1.46s/it][A
Training...:  38% 5349/13907 [3:29:51<3:19:35,  1.40s/it][A
Training...:  38% 5350/13907 [3:29:52<3:05:44,  1.30s/it][A
Training...:  38% 5351/13907 [3:29:56<4:52:55,  2.05s/it][A
Training...:  38% 5352/13907 [3:29:59<5:52:22,  2.47s/it][A
Training...:  38% 5353/13907 [3:30:03<6:29:46,  2.73s/it][A
Training...:  38% 5354/13907 [3:30:06<6:51:19,  2.89s/it][A
Training...:  39% 5355/13907 [3:30:09<6:59:02,  2.94s/it][A
Training...:  39% 5356/13907 [3:30:12<7:01:10,  2.96s/it][A
Training...:  39% 5357/13907 [3:30:15<6:58:22,  2.94s/it][A
Training...:  39% 5358/13907 [3:30:18<6:53:46,  2.90s/it][A
Training...:  39% 5359/13907 [3:30:21<6:48:58,  2.87s/it][A
Training...:  39% 5360/13907 [3:30:23<6:42:03,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:00:37<17:31:07, 31533.87s/it]
Training...:  39% 5360/13907 [3:30:26<6:42:03,  2.82s/it][A
Training...:  39% 5361/13907 [3:30:26<6:53:55,  2.91s/it][A
Training...:  39% 5362/13907 [3:30:29<6:46:35,  2.85s/it][A
Training...:  39% 5363/13907 [3:30:32<6:35:08,  2.77s/it][A
Training...:  39% 5364/13907 [3:30:34<6:25:39,  2.71s/it][A
Training...:  39% 5365/13907 [3:30:37<6:16:46,  2.65s/it][A
Training...:  39% 5366/13907 [3:30:39<6:08:28,  2.59s/it][A
Training...:  39% 5367/13907 [3:30:42<6:00:47,  2.53s/it][A
Training...:  39% 5368/13907 [3:30:44<5:55:05,  2.50s/it][A
Training...:  39% 5369/13907 [3:30:46<5:51:28,  2.47s/it][A
Training...:  39% 5370/13907 [3:30:49<5:45:36,  2.43s/it][A
Training...:  39% 5371/13907 [3:30:51<5:42:14,  2.41s/it][A
Training...:  39% 5372/13907 [3:30:53<5:36:05,  2.36s/it][A
Training...:  39% 5373/13907 [3:30:56<5:31:27,  2.33s/it][A
Training...:  39% 5374/13907 [3:30:58<5:26:16,  2.29s/it][A
Training...:  39% 5375/13907 [3:31:00<5:22:09,  2.27s/it][A
Training...:  39% 5376/13907 [3:31:02<5:17:21,  2.23s/it][A
Training...:  39% 5377/13907 [3:31:04<5:13:20,  2.20s/it][A
Training...:  39% 5378/13907 [3:31:06<5:07:49,  2.17s/it][A
Training...:  39% 5379/13907 [3:31:09<5:03:43,  2.14s/it][A
Training...:  39% 5380/13907 [3:31:11<4:59:09,  2.11s/it][A
Training...:  39% 5381/13907 [3:31:13<4:54:17,  2.07s/it][A
Training...:  39% 5382/13907 [3:31:14<4:49:13,  2.04s/it][A
Training...:  39% 5383/13907 [3:31:16<4:44:54,  2.01s/it][A
Training...:  39% 5384/13907 [3:31:18<4:41:15,  1.98s/it][A
Training...:  39% 5385/13907 [3:31:20<4:37:30,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:01:33<17:31:07, 31533.87s/it]
Training...:  39% 5385/13907 [3:31:22<4:37:30,  1.95s/it][A
Training...:  39% 5386/13907 [3:31:22<4:46:38,  2.02s/it][A
Training...:  39% 5387/13907 [3:31:24<4:42:42,  1.99s/it][A
Training...:  39% 5388/13907 [3:31:26<4:35:32,  1.94s/it][A
Training...:  39% 5389/13907 [3:31:28<4:28:00,  1.89s/it][A
Training...:  39% 5390/13907 [3:31:30<4:19:51,  1.83s/it][A
Training...:  39% 5391/13907 [3:31:31<4:13:42,  1.79s/it][A
Training...:  39% 5392/13907 [3:31:33<4:08:02,  1.75s/it][A
Training...:  39% 5393/13907 [3:31:35<4:01:53,  1.70s/it][A
Training...:  39% 5394/13907 [3:31:36<3:56:33,  1.67s/it][A
Training...:  39% 5395/13907 [3:31:38<3:49:14,  1.62s/it][A
Training...:  39% 5396/13907 [3:31:39<3:41:58,  1.56s/it][A
Training...:  39% 5397/13907 [3:31:40<3:34:04,  1.51s/it][A
Training...:  39% 5398/13907 [3:31:42<3:25:11,  1.45s/it][A
Training...:  39% 5399/13907 [3:31:43<3:15:00,  1.38s/it][A
Training...:  39% 5400/13907 [3:31:44<3:00:44,  1.27s/it][A
Training...:  39% 5401/13907 [3:31:48<4:50:57,  2.05s/it][A
Training...:  39% 5402/13907 [3:31:51<5:51:17,  2.48s/it][A
Training...:  39% 5403/13907 [3:31:55<6:23:08,  2.70s/it][A
Training...:  39% 5404/13907 [3:31:58<6:39:51,  2.82s/it][A
Training...:  39% 5405/13907 [3:32:01<6:47:51,  2.88s/it][A
Training...:  39% 5406/13907 [3:32:04<6:51:10,  2.90s/it][A
Training...:  39% 5407/13907 [3:32:07<6:51:52,  2.91s/it][A
Training...:  39% 5408/13907 [3:32:09<6:49:14,  2.89s/it][A
Training...:  39% 5409/13907 [3:32:12<6:45:47,  2.87s/it][A
Training...:  39% 5410/13907 [3:32:15<6:40:45,  2.83s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:02:29<17:31:07, 31533.87s/it]
Training...:  39% 5410/13907 [3:32:18<6:40:45,  2.83s/it][A
Training...:  39% 5411/13907 [3:32:18<6:51:49,  2.91s/it][A
Training...:  39% 5412/13907 [3:32:21<6:42:49,  2.85s/it][A
Training...:  39% 5413/13907 [3:32:23<6:32:21,  2.77s/it][A
Training...:  39% 5414/13907 [3:32:26<6:22:24,  2.70s/it][A
Training...:  39% 5415/13907 [3:32:28<6:13:48,  2.64s/it][A
Training...:  39% 5416/13907 [3:32:31<6:07:02,  2.59s/it][A
Training...:  39% 5417/13907 [3:32:33<6:00:04,  2.54s/it][A
Training...:  39% 5418/13907 [3:32:36<5:56:14,  2.52s/it][A
Training...:  39% 5419/13907 [3:32:38<5:51:37,  2.49s/it][A
Training...:  39% 5420/13907 [3:32:41<5:45:40,  2.44s/it][A
Training...:  39% 5421/13907 [3:32:43<5:39:58,  2.40s/it][A
Training...:  39% 5422/13907 [3:32:45<5:35:09,  2.37s/it][A
Training...:  39% 5423/13907 [3:32:47<5:29:05,  2.33s/it][A
Training...:  39% 5424/13907 [3:32:50<5:23:44,  2.29s/it][A
Training...:  39% 5425/13907 [3:32:52<5:20:23,  2.27s/it][A
Training...:  39% 5426/13907 [3:32:54<5:16:37,  2.24s/it][A
Training...:  39% 5427/13907 [3:32:56<5:13:06,  2.22s/it][A
Training...:  39% 5428/13907 [3:32:58<5:07:02,  2.17s/it][A
Training...:  39% 5429/13907 [3:33:00<5:02:10,  2.14s/it][A
Training...:  39% 5430/13907 [3:33:02<4:57:10,  2.10s/it][A
Training...:  39% 5431/13907 [3:33:04<4:53:02,  2.07s/it][A
Training...:  39% 5432/13907 [3:33:06<4:47:40,  2.04s/it][A
Training...:  39% 5433/13907 [3:33:08<4:43:30,  2.01s/it][A
Training...:  39% 5434/13907 [3:33:10<4:38:32,  1.97s/it][A
Training...:  39% 5435/13907 [3:33:12<4:34:37,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:03:25<17:31:07, 31533.87s/it]
Training...:  39% 5435/13907 [3:33:14<4:34:37,  1.94s/it][A
Training...:  39% 5436/13907 [3:33:14<4:43:06,  2.01s/it][A
Training...:  39% 5437/13907 [3:33:16<4:38:01,  1.97s/it][A
Training...:  39% 5438/13907 [3:33:18<4:30:34,  1.92s/it][A
Training...:  39% 5439/13907 [3:33:20<4:23:45,  1.87s/it][A
Training...:  39% 5440/13907 [3:33:21<4:17:44,  1.83s/it][A
Training...:  39% 5441/13907 [3:33:23<4:12:01,  1.79s/it][A
Training...:  39% 5442/13907 [3:33:25<4:06:46,  1.75s/it][A
Training...:  39% 5443/13907 [3:33:26<4:00:51,  1.71s/it][A
Training...:  39% 5444/13907 [3:33:28<3:55:33,  1.67s/it][A
Training...:  39% 5445/13907 [3:33:29<3:48:19,  1.62s/it][A
Training...:  39% 5446/13907 [3:33:31<3:41:31,  1.57s/it][A
Training...:  39% 5447/13907 [3:33:32<3:34:15,  1.52s/it][A
Training...:  39% 5448/13907 [3:33:33<3:26:45,  1.47s/it][A
Training...:  39% 5449/13907 [3:33:35<3:16:55,  1.40s/it][A
Training...:  39% 5450/13907 [3:33:36<3:03:13,  1.30s/it][A
Training...:  39% 5451/13907 [3:33:40<4:47:06,  2.04s/it][A
Training...:  39% 5452/13907 [3:33:43<5:49:54,  2.48s/it][A
Training...:  39% 5453/13907 [3:33:46<6:24:08,  2.73s/it][A
Training...:  39% 5454/13907 [3:33:49<6:40:53,  2.85s/it][A
Training...:  39% 5455/13907 [3:33:53<6:51:08,  2.92s/it][A
Training...:  39% 5456/13907 [3:33:56<6:52:37,  2.93s/it][A
Training...:  39% 5457/13907 [3:33:58<6:50:04,  2.91s/it][A
Training...:  39% 5458/13907 [3:34:01<6:45:28,  2.88s/it][A
Training...:  39% 5459/13907 [3:34:04<6:41:34,  2.85s/it][A
Training...:  39% 5460/13907 [3:34:07<6:36:03,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:04:21<17:31:07, 31533.87s/it]
Training...:  39% 5460/13907 [3:34:10<6:36:03,  2.81s/it][A
Training...:  39% 5461/13907 [3:34:10<6:48:15,  2.90s/it][A
Training...:  39% 5462/13907 [3:34:13<6:40:39,  2.85s/it][A
Training...:  39% 5463/13907 [3:34:15<6:30:00,  2.77s/it][A
Training...:  39% 5464/13907 [3:34:18<6:21:32,  2.71s/it][A
Training...:  39% 5465/13907 [3:34:20<6:12:40,  2.65s/it][A
Training...:  39% 5466/13907 [3:34:23<6:07:54,  2.62s/it][A
Training...:  39% 5467/13907 [3:34:25<6:00:49,  2.57s/it][A
Training...:  39% 5468/13907 [3:34:28<5:54:18,  2.52s/it][A
Training...:  39% 5469/13907 [3:34:30<5:48:43,  2.48s/it][A
Training...:  39% 5470/13907 [3:34:32<5:43:39,  2.44s/it][A
Training...:  39% 5471/13907 [3:34:35<5:37:32,  2.40s/it][A
Training...:  39% 5472/13907 [3:34:37<5:32:59,  2.37s/it][A
Training...:  39% 5473/13907 [3:34:39<5:28:30,  2.34s/it][A
Training...:  39% 5474/13907 [3:34:41<5:23:01,  2.30s/it][A
Training...:  39% 5475/13907 [3:34:44<5:17:39,  2.26s/it][A
Training...:  39% 5476/13907 [3:34:46<5:13:30,  2.23s/it][A
Training...:  39% 5477/13907 [3:34:48<5:10:05,  2.21s/it][A
Training...:  39% 5478/13907 [3:34:50<5:06:21,  2.18s/it][A
Training...:  39% 5479/13907 [3:34:52<5:01:51,  2.15s/it][A
Training...:  39% 5480/13907 [3:34:54<4:58:38,  2.13s/it][A
Training...:  39% 5481/13907 [3:34:56<4:53:10,  2.09s/it][A
Training...:  39% 5482/13907 [3:34:58<4:48:16,  2.05s/it][A
Training...:  39% 5483/13907 [3:35:00<4:44:08,  2.02s/it][A
Training...:  39% 5484/13907 [3:35:02<4:39:08,  1.99s/it][A
Training...:  39% 5485/13907 [3:35:04<4:35:06,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:05:17<17:31:07, 31533.87s/it]
Training...:  39% 5485/13907 [3:35:06<4:35:06,  1.96s/it][A
Training...:  39% 5486/13907 [3:35:06<4:44:58,  2.03s/it][A
Training...:  39% 5487/13907 [3:35:08<4:38:47,  1.99s/it][A
Training...:  39% 5488/13907 [3:35:10<4:33:10,  1.95s/it][A
Training...:  39% 5489/13907 [3:35:12<4:25:11,  1.89s/it][A
Training...:  39% 5490/13907 [3:35:13<4:19:03,  1.85s/it][A
Training...:  39% 5491/13907 [3:35:15<4:12:01,  1.80s/it][A
Training...:  39% 5492/13907 [3:35:17<4:05:57,  1.75s/it][A
Training...:  39% 5493/13907 [3:35:18<3:59:14,  1.71s/it][A
Training...:  40% 5494/13907 [3:35:20<3:53:34,  1.67s/it][A
Training...:  40% 5495/13907 [3:35:21<3:46:42,  1.62s/it][A
Training...:  40% 5496/13907 [3:35:23<3:40:10,  1.57s/it][A
Training...:  40% 5497/13907 [3:35:24<3:32:43,  1.52s/it][A
Training...:  40% 5498/13907 [3:35:26<3:24:29,  1.46s/it][A
Training...:  40% 5499/13907 [3:35:27<3:14:52,  1.39s/it][A
Training...:  40% 5500/13907 [3:35:28<3:00:52,  1.29s/it][A
Training...:  40% 5501/13907 [3:35:32<4:42:55,  2.02s/it][A
Training...:  40% 5502/13907 [3:35:35<5:45:05,  2.46s/it][A
Training...:  40% 5503/13907 [3:35:38<6:19:15,  2.71s/it][A
Training...:  40% 5504/13907 [3:35:41<6:37:30,  2.84s/it][A
Training...:  40% 5505/13907 [3:35:45<6:47:56,  2.91s/it][A
Training...:  40% 5506/13907 [3:35:48<6:49:54,  2.93s/it][A
Training...:  40% 5507/13907 [3:35:50<6:48:11,  2.92s/it][A
Training...:  40% 5508/13907 [3:35:53<6:44:00,  2.89s/it][A
Training...:  40% 5509/13907 [3:35:56<6:39:09,  2.85s/it][A
Training...:  40% 5510/13907 [3:35:59<6:33:06,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:06:13<17:31:07, 31533.87s/it]
Training...:  40% 5510/13907 [3:36:02<6:33:06,  2.81s/it][A
Training...:  40% 5511/13907 [3:36:02<6:45:00,  2.89s/it][A
Training...:  40% 5512/13907 [3:36:05<6:38:16,  2.85s/it][A
Training...:  40% 5513/13907 [3:36:07<6:27:57,  2.77s/it][A
Training...:  40% 5514/13907 [3:36:10<6:19:32,  2.71s/it][A
Training...:  40% 5515/13907 [3:36:12<6:12:41,  2.66s/it][A
Training...:  40% 5516/13907 [3:36:15<6:05:44,  2.62s/it][A
Training...:  40% 5517/13907 [3:36:17<5:59:30,  2.57s/it][A
Training...:  40% 5518/13907 [3:36:20<5:53:17,  2.53s/it][A
Training...:  40% 5519/13907 [3:36:22<5:48:14,  2.49s/it][A
Training...:  40% 5520/13907 [3:36:24<5:42:01,  2.45s/it][A
Training...:  40% 5521/13907 [3:36:27<5:37:30,  2.41s/it][A
Training...:  40% 5522/13907 [3:36:29<5:31:22,  2.37s/it][A
Training...:  40% 5523/13907 [3:36:31<5:27:55,  2.35s/it][A
Training...:  40% 5524/13907 [3:36:34<5:22:32,  2.31s/it][A
Training...:  40% 5525/13907 [3:36:36<5:20:01,  2.29s/it][A
Training...:  40% 5526/13907 [3:36:38<5:14:29,  2.25s/it][A
Training...:  40% 5527/13907 [3:36:40<5:09:50,  2.22s/it][A
Training...:  40% 5528/13907 [3:36:42<5:05:38,  2.19s/it][A
Training...:  40% 5529/13907 [3:36:44<5:01:04,  2.16s/it][A
Training...:  40% 5530/13907 [3:36:46<4:57:01,  2.13s/it][A
Training...:  40% 5531/13907 [3:36:48<4:52:50,  2.10s/it][A
Training...:  40% 5532/13907 [3:36:50<4:49:14,  2.07s/it][A
Training...:  40% 5533/13907 [3:36:52<4:44:53,  2.04s/it][A
Training...:  40% 5534/13907 [3:36:54<4:40:23,  2.01s/it][A
Training...:  40% 5535/13907 [3:36:56<4:37:08,  1.99s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:07:09<17:31:07, 31533.87s/it]
Training...:  40% 5535/13907 [3:36:58<4:37:08,  1.99s/it][A
Training...:  40% 5536/13907 [3:36:58<4:47:12,  2.06s/it][A
Training...:  40% 5537/13907 [3:37:00<4:40:54,  2.01s/it][A
Training...:  40% 5538/13907 [3:37:02<4:33:54,  1.96s/it][A
Training...:  40% 5539/13907 [3:37:04<4:26:19,  1.91s/it][A
Training...:  40% 5540/13907 [3:37:06<4:20:27,  1.87s/it][A
Training...:  40% 5541/13907 [3:37:07<4:13:25,  1.82s/it][A
Training...:  40% 5542/13907 [3:37:09<4:06:27,  1.77s/it][A
Training...:  40% 5543/13907 [3:37:11<4:00:25,  1.72s/it][A
Training...:  40% 5544/13907 [3:37:12<3:55:34,  1.69s/it][A
Training...:  40% 5545/13907 [3:37:14<3:49:30,  1.65s/it][A
Training...:  40% 5546/13907 [3:37:15<3:41:49,  1.59s/it][A
Training...:  40% 5547/13907 [3:37:17<3:34:42,  1.54s/it][A
Training...:  40% 5548/13907 [3:37:18<3:25:51,  1.48s/it][A
Training...:  40% 5549/13907 [3:37:19<3:16:28,  1.41s/it][A
Training...:  40% 5550/13907 [3:37:20<3:03:03,  1.31s/it][A
Training...:  40% 5551/13907 [3:37:24<4:42:44,  2.03s/it][A
Training...:  40% 5552/13907 [3:37:28<5:44:18,  2.47s/it][A
Training...:  40% 5553/13907 [3:37:31<6:17:44,  2.71s/it][A
Training...:  40% 5554/13907 [3:37:34<6:35:50,  2.84s/it][A
Training...:  40% 5555/13907 [3:37:37<6:45:19,  2.91s/it][A
Training...:  40% 5556/13907 [3:37:40<6:47:24,  2.93s/it][A
Training...:  40% 5557/13907 [3:37:43<6:46:17,  2.92s/it][A
Training...:  40% 5558/13907 [3:37:46<6:42:53,  2.90s/it][A
Training...:  40% 5559/13907 [3:37:49<6:37:52,  2.86s/it][A
Training...:  40% 5560/13907 [3:37:51<6:31:18,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:08:05<17:31:07, 31533.87s/it]
Training...:  40% 5560/13907 [3:37:54<6:31:18,  2.81s/it][A
Training...:  40% 5561/13907 [3:37:54<6:42:29,  2.89s/it][A
Training...:  40% 5562/13907 [3:37:57<6:35:55,  2.85s/it][A
Training...:  40% 5563/13907 [3:38:00<6:25:20,  2.77s/it][A
Training...:  40% 5564/13907 [3:38:02<6:17:04,  2.71s/it][A
Training...:  40% 5565/13907 [3:38:05<6:08:22,  2.65s/it][A
Training...:  40% 5566/13907 [3:38:07<6:00:40,  2.59s/it][A
Training...:  40% 5567/13907 [3:38:10<5:54:01,  2.55s/it][A
Training...:  40% 5568/13907 [3:38:12<5:48:04,  2.50s/it][A
Training...:  40% 5569/13907 [3:38:14<5:42:40,  2.47s/it][A
Training...:  40% 5570/13907 [3:38:17<5:38:56,  2.44s/it][A
Training...:  40% 5571/13907 [3:38:19<5:36:28,  2.42s/it][A
Training...:  40% 5572/13907 [3:38:22<5:30:43,  2.38s/it][A
Training...:  40% 5573/13907 [3:38:24<5:24:20,  2.34s/it][A
Training...:  40% 5574/13907 [3:38:26<5:18:18,  2.29s/it][A
Training...:  40% 5575/13907 [3:38:28<5:13:21,  2.26s/it][A
Training...:  40% 5576/13907 [3:38:30<5:09:20,  2.23s/it][A
Training...:  40% 5577/13907 [3:38:32<5:04:53,  2.20s/it][A
Training...:  40% 5578/13907 [3:38:34<4:59:39,  2.16s/it][A
Training...:  40% 5579/13907 [3:38:37<4:56:27,  2.14s/it][A
Training...:  40% 5580/13907 [3:38:39<4:51:49,  2.10s/it][A
Training...:  40% 5581/13907 [3:38:41<4:47:54,  2.07s/it][A
Training...:  40% 5582/13907 [3:38:43<4:43:37,  2.04s/it][A
Training...:  40% 5583/13907 [3:38:45<4:40:02,  2.02s/it][A
Training...:  40% 5584/13907 [3:38:46<4:37:12,  2.00s/it][A
Training...:  40% 5585/13907 [3:38:48<4:33:09,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:09:02<17:31:07, 31533.87s/it]
Training...:  40% 5585/13907 [3:38:51<4:33:09,  1.97s/it][A
Training...:  40% 5586/13907 [3:38:51<4:42:51,  2.04s/it][A
Training...:  40% 5587/13907 [3:38:53<4:38:25,  2.01s/it][A
Training...:  40% 5588/13907 [3:38:54<4:30:29,  1.95s/it][A
Training...:  40% 5589/13907 [3:38:56<4:23:57,  1.90s/it][A
Training...:  40% 5590/13907 [3:38:58<4:16:06,  1.85s/it][A
Training...:  40% 5591/13907 [3:39:00<4:09:11,  1.80s/it][A
Training...:  40% 5592/13907 [3:39:01<4:03:25,  1.76s/it][A
Training...:  40% 5593/13907 [3:39:03<3:57:55,  1.72s/it][A
Training...:  40% 5594/13907 [3:39:04<3:52:55,  1.68s/it][A
Training...:  40% 5595/13907 [3:39:06<3:47:25,  1.64s/it][A
Training...:  40% 5596/13907 [3:39:07<3:39:09,  1.58s/it][A
Training...:  40% 5597/13907 [3:39:09<3:31:27,  1.53s/it][A
Training...:  40% 5598/13907 [3:39:10<3:22:53,  1.47s/it][A
Training...:  40% 5599/13907 [3:39:11<3:13:21,  1.40s/it][A
Training...:  40% 5600/13907 [3:39:12<2:59:35,  1.30s/it][A
Training...:  40% 5601/13907 [3:39:16<4:40:31,  2.03s/it][A
Training...:  40% 5602/13907 [3:39:20<5:38:35,  2.45s/it][A
Training...:  40% 5603/13907 [3:39:23<6:10:38,  2.68s/it][A
Training...:  40% 5604/13907 [3:39:26<6:26:57,  2.80s/it][A
Training...:  40% 5605/13907 [3:39:29<6:35:16,  2.86s/it][A
Training...:  40% 5606/13907 [3:39:32<6:38:26,  2.88s/it][A
Training...:  40% 5607/13907 [3:39:35<6:39:38,  2.89s/it][A
Training...:  40% 5608/13907 [3:39:38<6:38:00,  2.88s/it][A
Training...:  40% 5609/13907 [3:39:40<6:32:29,  2.84s/it][A
Training...:  40% 5610/13907 [3:39:43<6:25:45,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:09:57<17:31:07, 31533.87s/it]
Training...:  40% 5610/13907 [3:39:46<6:25:45,  2.79s/it][A
Training...:  40% 5611/13907 [3:39:46<6:37:16,  2.87s/it][A
Training...:  40% 5612/13907 [3:39:49<6:28:54,  2.81s/it][A
Training...:  40% 5613/13907 [3:39:51<6:19:16,  2.74s/it][A
Training...:  40% 5614/13907 [3:39:54<6:10:47,  2.68s/it][A
Training...:  40% 5615/13907 [3:39:56<6:03:36,  2.63s/it][A
Training...:  40% 5616/13907 [3:39:59<5:56:53,  2.58s/it][A
Training...:  40% 5617/13907 [3:40:01<5:50:34,  2.54s/it][A
Training...:  40% 5618/13907 [3:40:04<5:44:02,  2.49s/it][A
Training...:  40% 5619/13907 [3:40:06<5:38:59,  2.45s/it][A
Training...:  40% 5620/13907 [3:40:08<5:32:44,  2.41s/it][A
Training...:  40% 5621/13907 [3:40:11<5:28:25,  2.38s/it][A
Training...:  40% 5622/13907 [3:40:13<5:23:47,  2.34s/it][A
Training...:  40% 5623/13907 [3:40:15<5:19:52,  2.32s/it][A
Training...:  40% 5624/13907 [3:40:17<5:15:19,  2.28s/it][A
Training...:  40% 5625/13907 [3:40:20<5:10:14,  2.25s/it][A
Training...:  40% 5626/13907 [3:40:22<5:05:03,  2.21s/it][A
Training...:  40% 5627/13907 [3:40:24<5:01:03,  2.18s/it][A
Training...:  40% 5628/13907 [3:40:26<4:56:29,  2.15s/it][A
Training...:  40% 5629/13907 [3:40:28<4:51:28,  2.11s/it][A
Training...:  40% 5630/13907 [3:40:30<4:47:00,  2.08s/it][A
Training...:  40% 5631/13907 [3:40:32<4:43:25,  2.05s/it][A
Training...:  40% 5632/13907 [3:40:34<4:38:58,  2.02s/it][A
Training...:  41% 5633/13907 [3:40:36<4:37:42,  2.01s/it][A
Training...:  41% 5634/13907 [3:40:38<4:34:03,  1.99s/it][A
Training...:  41% 5635/13907 [3:40:40<4:29:16,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:10:53<17:31:07, 31533.87s/it]
Training...:  41% 5635/13907 [3:40:42<4:29:16,  1.95s/it][A
Training...:  41% 5636/13907 [3:40:42<4:36:34,  2.01s/it][A
Training...:  41% 5637/13907 [3:40:44<4:29:48,  1.96s/it][A
Training...:  41% 5638/13907 [3:40:45<4:21:38,  1.90s/it][A
Training...:  41% 5639/13907 [3:40:47<4:14:04,  1.84s/it][A
Training...:  41% 5640/13907 [3:40:49<4:08:13,  1.80s/it][A
Training...:  41% 5641/13907 [3:40:50<4:03:53,  1.77s/it][A
Training...:  41% 5642/13907 [3:40:52<3:58:22,  1.73s/it][A
Training...:  41% 5643/13907 [3:40:54<3:51:42,  1.68s/it][A
Training...:  41% 5644/13907 [3:40:55<3:46:46,  1.65s/it][A
Training...:  41% 5645/13907 [3:40:57<3:40:40,  1.60s/it][A
Training...:  41% 5646/13907 [3:40:58<3:33:49,  1.55s/it][A
Training...:  41% 5647/13907 [3:40:59<3:25:28,  1.49s/it][A
Training...:  41% 5648/13907 [3:41:01<3:17:28,  1.43s/it][A
Training...:  41% 5649/13907 [3:41:02<3:09:01,  1.37s/it][A
Training...:  41% 5650/13907 [3:41:03<2:54:06,  1.27s/it][A
Training...:  41% 5651/13907 [3:41:07<4:34:21,  1.99s/it][A
Training...:  41% 5652/13907 [3:41:10<5:33:18,  2.42s/it][A
Training...:  41% 5653/13907 [3:41:13<6:04:52,  2.65s/it][A
Training...:  41% 5654/13907 [3:41:16<6:23:02,  2.78s/it][A
Training...:  41% 5655/13907 [3:41:19<6:32:19,  2.85s/it][A
Training...:  41% 5656/13907 [3:41:22<6:36:01,  2.88s/it][A
Training...:  41% 5657/13907 [3:41:25<6:35:50,  2.88s/it][A
Training...:  41% 5658/13907 [3:41:28<6:34:04,  2.87s/it][A
Training...:  41% 5659/13907 [3:41:31<6:29:48,  2.84s/it][A
Training...:  41% 5660/13907 [3:41:34<6:25:40,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:11:48<17:31:07, 31533.87s/it]
Training...:  41% 5660/13907 [3:41:37<6:25:40,  2.81s/it][A
Training...:  41% 5661/13907 [3:41:37<6:38:07,  2.90s/it][AStep... (31750 | Loss: 0.16858699917793274, Learning Rate: 0.00011061211989726871, Gradient Norm: 1.0968165397644043)
Step... (31775 | Loss: 0.2552950978279114, Learning Rate: 0.00011046061263186857, Gradient Norm: 0.9094144105911255)
Step... (31800 | Loss: 0.19694098830223083, Learning Rate: 0.00011030910536646843, Gradient Norm: 0.7343542575836182)
Step... (31825 | Loss: 0.1731492280960083, Learning Rate: 0.00011015757627319545, Gradient Norm: 0.6865620613098145)
Step... (31850 | Loss: 0.1780727356672287, Learning Rate: 0.0001100060690077953, Gradient Norm: 1.2589443922042847)
Step... (31875 | Loss: 0.2836599349975586, Learning Rate: 0.00010985456174239516, Gradient Norm: 1.063398838043213)
Step... (31900 | Loss: 0.15667353570461273, Learning Rate: 0.00010970303264912218, Gradient Norm: 0.9094122648239136)
Step... (31925 | Loss: 0.2314525693655014, Learning Rate: 0.00010955152538372204, Gradient Norm: 0.8399472832679749)
Step... (31950 | Loss: 0.2263522893190384, Learning Rate: 0.00010939999629044905, Gradient Norm: 0.9768584370613098)
Step... (31975 | Loss: 0.2080061137676239, Learning Rate: 0.00010924848902504891, Gradient Norm: 0.8133801221847534)
Step... (32000 | Loss: 0.18544277548789978, Learning Rate: 0.00010909698175964877, Gradient Norm: 0.8972265720367432)
Step... (32025 | Loss: 0.19975051283836365, Learning Rate: 0.00010894545266637579, Gradient Norm: 0.9534669518470764)
Step... (32050 | Loss: 0.22633546590805054, Learning Rate: 0.00010879394540097564, Gradient Norm: 1.0214040279388428)
Step... (32075 | Loss: 0.2506575286388397, Learning Rate: 0.00010864243085961789, Gradient Norm: 0.8436647653579712)
Step... (32100 | Loss: 0.1848299205303192, Learning Rate: 0.00010849090904230252, Gradient Norm: 0.994196891784668)
Step... (32125 | Loss: 0.27467942237854004, Learning Rate: 0.00010833940177690238, Gradient Norm: 1.2417216300964355)
Step... (32150 | Loss: 0.1972503960132599, Learning Rate: 0.00010818788723554462, Gradient Norm: 0.9526042342185974)
Step... (32175 | Loss: 0.20504353940486908, Learning Rate: 0.00010803636541822925, Gradient Norm: 0.8434044718742371)
Step... (32200 | Loss: 0.2114858329296112, Learning Rate: 0.0001078848508768715, Gradient Norm: 1.056993842124939)
Step... (32225 | Loss: 0.23371344804763794, Learning Rate: 0.00010773334361147135, Gradient Norm: 1.018113374710083)
Step... (32250 | Loss: 0.2351280301809311, Learning Rate: 0.00010758181451819837, Gradient Norm: 1.012122631072998)
Step... (32275 | Loss: 0.255720853805542, Learning Rate: 0.00010743030725279823, Gradient Norm: 0.779449462890625)
Step... (32300 | Loss: 0.17575544118881226, Learning Rate: 0.00010727879998739809, Gradient Norm: 1.018730878829956)
Step... (32325 | Loss: 0.19172002375125885, Learning Rate: 0.0001071272708941251, Gradient Norm: 0.7566848993301392)
Step... (32350 | Loss: 0.19679409265518188, Learning Rate: 0.00010697576362872496, Gradient Norm: 1.0404319763183594)
Step... (32375 | Loss: 0.25404348969459534, Learning Rate: 0.00010682425636332482, Gradient Norm: 1.1189409494400024)
Step... (32400 | Loss: 0.20242708921432495, Learning Rate: 0.00010667272727005184, Gradient Norm: 0.7934265732765198)
Step... (32425 | Loss: 0.2390376776456833, Learning Rate: 0.0001065212200046517, Gradient Norm: 0.8727985620498657)
Step... (32450 | Loss: 0.1619371771812439, Learning Rate: 0.00010636970546329394, Gradient Norm: 0.9315973520278931)
Step... (32475 | Loss: 0.24709366261959076, Learning Rate: 0.00010621818364597857, Gradient Norm: 0.9403427243232727)
Step... (32500 | Loss: 0.18890133500099182, Learning Rate: 0.00010606667638057843, Gradient Norm: 0.9803059101104736)
Step... (32525 | Loss: 0.20328357815742493, Learning Rate: 0.00010591516183922067, Gradient Norm: 0.7692136168479919)
Step... (32550 | Loss: 0.17577403783798218, Learning Rate: 0.0001057636400219053, Gradient Norm: 1.0765007734298706)
Step... (32575 | Loss: 0.22023066878318787, Learning Rate: 0.00010561212548054755, Gradient Norm: 0.6418095827102661)
Step... (32600 | Loss: 0.17386074364185333, Learning Rate: 0.0001054606182151474, Gradient Norm: 1.065790057182312)
Step... (32625 | Loss: 0.18935096263885498, Learning Rate: 0.00010530908912187442, Gradient Norm: 0.7173909544944763)
Step... (32650 | Loss: 0.19295468926429749, Learning Rate: 0.00010515758185647428, Gradient Norm: 0.9777479767799377)
Step... (32675 | Loss: 0.22049203515052795, Learning Rate: 0.00010500607459107414, Gradient Norm: 0.9034197330474854)
Step... (32700 | Loss: 0.1260553002357483, Learning Rate: 0.00010485454549780115, Gradient Norm: 0.8219508528709412)
Step... (32725 | Loss: 0.2658781409263611, Learning Rate: 0.00010470303823240101, Gradient Norm: 1.1292001008987427)
Step... (32750 | Loss: 0.1563396453857422, Learning Rate: 0.00010455153096700087, Gradient Norm: 0.7800699472427368)
Step... (32775 | Loss: 0.17665164172649384, Learning Rate: 0.00010440000187372789, Gradient Norm: 0.6346796751022339)
Step... (32800 | Loss: 0.24757757782936096, Learning Rate: 0.00010424849460832775, Gradient Norm: 1.2951838970184326)
Step... (32825 | Loss: 0.2650219798088074, Learning Rate: 0.0001040969873429276, Gradient Norm: 0.8689818978309631)
Step... (32850 | Loss: 0.14754647016525269, Learning Rate: 0.00010394545824965462, Gradient Norm: 0.8856866359710693)
Step... (32875 | Loss: 0.2553248703479767, Learning Rate: 0.00010379395098425448, Gradient Norm: 0.8461458683013916)
Step... (32900 | Loss: 0.18770280480384827, Learning Rate: 0.00010364243644289672, Gradient Norm: 1.1229361295700073)
Step... (32925 | Loss: 0.1669149100780487, Learning Rate: 0.00010349091462558135, Gradient Norm: 0.6867514848709106)
Step... (32950 | Loss: 0.1957104653120041, Learning Rate: 0.0001033394000842236, Gradient Norm: 1.0085500478744507)
Step... (32975 | Loss: 0.17831185460090637, Learning Rate: 0.00010318787826690823, Gradient Norm: 0.7826399803161621)
Step... (33000 | Loss: 0.2032836675643921, Learning Rate: 0.00010303636372555047, Gradient Norm: 1.0568989515304565)
Step... (33025 | Loss: 0.20710115134716034, Learning Rate: 0.00010288485646015033, Gradient Norm: 0.951450765132904)
Step... (33050 | Loss: 0.12526461482048035, Learning Rate: 0.00010273332736687735, Gradient Norm: 0.6850150227546692)
Step... (33075 | Loss: 0.2589871287345886, Learning Rate: 0.0001025818201014772, Gradient Norm: 0.8328922986984253)
Step... (33100 | Loss: 0.18265098333358765, Learning Rate: 0.00010243031283607706, Gradient Norm: 1.1123769283294678)
Step... (33125 | Loss: 0.191587433218956, Learning Rate: 0.00010227878374280408, Gradient Norm: 0.7228250503540039)
Step... (33150 | Loss: 0.17312248051166534, Learning Rate: 0.00010212727647740394, Gradient Norm: 0.8382875919342041)
Step... (33175 | Loss: 0.20396913588047028, Learning Rate: 0.0001019757692120038, Gradient Norm: 1.0724678039550781)
Step... (33200 | Loss: 0.1947464644908905, Learning Rate: 0.00010182424011873081, Gradient Norm: 1.095617651939392)
Step... (33225 | Loss: 0.2594090402126312, Learning Rate: 0.00010167273285333067, Gradient Norm: 0.9598584771156311)
Step... (33250 | Loss: 0.17830605804920197, Learning Rate: 0.00010152122558793053, Gradient Norm: 1.129643201828003)
Step... (33275 | Loss: 0.23514863848686218, Learning Rate: 0.00010136969649465755, Gradient Norm: 1.021691083908081)
Step... (33300 | Loss: 0.17931242287158966, Learning Rate: 0.0001012181892292574, Gradient Norm: 0.7739572525024414)
Step... (33325 | Loss: 0.3188490867614746, Learning Rate: 0.00010106667468789965, Gradient Norm: 0.9156957268714905)
Step... (33350 | Loss: 0.1885209083557129, Learning Rate: 0.00010091515287058428, Gradient Norm: 1.0754345655441284)
Step... (33375 | Loss: 0.22929885983467102, Learning Rate: 0.00010076363832922652, Gradient Norm: 0.7437512874603271)
Step... (33400 | Loss: 0.1505412757396698, Learning Rate: 0.00010061213106382638, Gradient Norm: 0.8202854990959167)
Step... (33425 | Loss: 0.21943974494934082, Learning Rate: 0.00010046060924651101, Gradient Norm: 0.8995835781097412)
Step... (33450 | Loss: 0.1916605830192566, Learning Rate: 0.00010030909470515326, Gradient Norm: 0.5977446436882019)

Training...:  41% 5662/13907 [3:41:40<6:37:53,  2.90s/it][A
Training...:  41% 5663/13907 [3:41:42<6:24:20,  2.80s/it][A
Training...:  41% 5664/13907 [3:41:45<6:12:59,  2.72s/it][A
Training...:  41% 5665/13907 [3:41:47<6:04:18,  2.65s/it][A
Training...:  41% 5666/13907 [3:41:50<5:55:36,  2.59s/it][A
Training...:  41% 5667/13907 [3:41:52<5:49:16,  2.54s/it][A
Training...:  41% 5668/13907 [3:41:54<5:43:23,  2.50s/it][A
Training...:  41% 5669/13907 [3:41:57<5:37:21,  2.46s/it][A
Training...:  41% 5670/13907 [3:41:59<5:31:18,  2.41s/it][A
Training...:  41% 5671/13907 [3:42:01<5:26:24,  2.38s/it][A
Training...:  41% 5672/13907 [3:42:04<5:21:43,  2.34s/it][A
Training...:  41% 5673/13907 [3:42:06<5:16:22,  2.31s/it][A
Training...:  41% 5674/13907 [3:42:08<5:11:52,  2.27s/it][A
Training...:  41% 5675/13907 [3:42:10<5:07:54,  2.24s/it][A
Training...:  41% 5676/13907 [3:42:12<5:02:31,  2.21s/it][A
Training...:  41% 5677/13907 [3:42:15<4:58:33,  2.18s/it][A
Training...:  41% 5678/13907 [3:42:17<4:54:23,  2.15s/it][A
Training...:  41% 5679/13907 [3:42:19<4:52:06,  2.13s/it][A
Training...:  41% 5680/13907 [3:42:21<4:47:09,  2.09s/it][A
Training...:  41% 5681/13907 [3:42:23<4:44:04,  2.07s/it][A
Training...:  41% 5682/13907 [3:42:25<4:39:07,  2.04s/it][A
Training...:  41% 5683/13907 [3:42:27<4:34:21,  2.00s/it][A
Training...:  41% 5684/13907 [3:42:28<4:29:34,  1.97s/it][A
Training...:  41% 5685/13907 [3:42:30<4:26:25,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:12:44<17:31:07, 31533.87s/it]
Training...:  41% 5685/13907 [3:42:33<4:26:25,  1.94s/it][A
Training...:  41% 5686/13907 [3:42:33<4:35:04,  2.01s/it][A
Training...:  41% 5687/13907 [3:42:34<4:29:29,  1.97s/it][A
Training...:  41% 5688/13907 [3:42:36<4:21:54,  1.91s/it][A
Training...:  41% 5689/13907 [3:42:38<4:15:23,  1.86s/it][A
Training...:  41% 5690/13907 [3:42:40<4:09:20,  1.82s/it][A
Training...:  41% 5691/13907 [3:42:41<4:05:50,  1.80s/it][A
Training...:  41% 5692/13907 [3:42:43<4:01:18,  1.76s/it][A
Training...:  41% 5693/13907 [3:42:45<3:56:20,  1.73s/it][A
Training...:  41% 5694/13907 [3:42:46<3:49:57,  1.68s/it][A
Training...:  41% 5695/13907 [3:42:48<3:43:09,  1.63s/it][A
Training...:  41% 5696/13907 [3:42:49<3:36:05,  1.58s/it][A
Training...:  41% 5697/13907 [3:42:51<3:28:15,  1.52s/it][A
Training...:  41% 5698/13907 [3:42:52<3:19:54,  1.46s/it][A
Training...:  41% 5699/13907 [3:42:53<3:10:17,  1.39s/it][A
Training...:  41% 5700/13907 [3:42:54<2:56:20,  1.29s/it][A
Training...:  41% 5701/13907 [3:42:58<4:45:51,  2.09s/it][A
Training...:  41% 5702/13907 [3:43:02<5:46:06,  2.53s/it][A
Training...:  41% 5703/13907 [3:43:05<6:17:39,  2.76s/it][A
Training...:  41% 5704/13907 [3:43:08<6:34:06,  2.88s/it][A
Training...:  41% 5705/13907 [3:43:11<6:40:44,  2.93s/it][A
Training...:  41% 5706/13907 [3:43:14<6:42:19,  2.94s/it][A
Training...:  41% 5707/13907 [3:43:17<6:40:45,  2.93s/it][A
Training...:  41% 5708/13907 [3:43:20<6:37:11,  2.91s/it][A
Training...:  41% 5709/13907 [3:43:23<6:33:21,  2.88s/it][A
Training...:  41% 5710/13907 [3:43:26<6:27:06,  2.83s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:13:40<17:31:07, 31533.87s/it]
Training...:  41% 5710/13907 [3:43:29<6:27:06,  2.83s/it][A
Training...:  41% 5711/13907 [3:43:29<6:39:06,  2.92s/it][A
Training...:  41% 5712/13907 [3:43:31<6:30:24,  2.86s/it][A
Training...:  41% 5713/13907 [3:43:34<6:18:45,  2.77s/it][A
Training...:  41% 5714/13907 [3:43:37<6:09:50,  2.71s/it][A
Training...:  41% 5715/13907 [3:43:39<6:00:43,  2.64s/it][A
Training...:  41% 5716/13907 [3:43:41<5:53:52,  2.59s/it][A
Training...:  41% 5717/13907 [3:43:44<5:47:01,  2.54s/it][A
Training...:  41% 5718/13907 [3:43:46<5:41:49,  2.50s/it][A
Training...:  41% 5719/13907 [3:43:49<5:35:56,  2.46s/it][A
Training...:  41% 5720/13907 [3:43:51<5:30:37,  2.42s/it][A
Training...:  41% 5721/13907 [3:43:53<5:27:24,  2.40s/it][A
Training...:  41% 5722/13907 [3:43:56<5:20:45,  2.35s/it][A
Training...:  41% 5723/13907 [3:43:58<5:16:12,  2.32s/it][A
Training...:  41% 5724/13907 [3:44:00<5:13:06,  2.30s/it][A
Training...:  41% 5725/13907 [3:44:02<5:10:59,  2.28s/it][A
Training...:  41% 5726/13907 [3:44:05<5:06:35,  2.25s/it][A
Training...:  41% 5727/13907 [3:44:07<5:02:16,  2.22s/it][A
Training...:  41% 5728/13907 [3:44:09<4:57:12,  2.18s/it][A
Training...:  41% 5729/13907 [3:44:11<4:51:40,  2.14s/it][A
Training...:  41% 5730/13907 [3:44:13<4:46:55,  2.11s/it][A
Training...:  41% 5731/13907 [3:44:15<4:42:34,  2.07s/it][A
Training...:  41% 5732/13907 [3:44:17<4:38:13,  2.04s/it][A
Training...:  41% 5733/13907 [3:44:19<4:34:17,  2.01s/it][A
Training...:  41% 5734/13907 [3:44:21<4:29:59,  1.98s/it][A
Training...:  41% 5735/13907 [3:44:22<4:25:05,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:14:36<17:31:07, 31533.87s/it]
Training...:  41% 5735/13907 [3:44:25<4:25:05,  1.95s/it][A
Training...:  41% 5736/13907 [3:44:25<4:33:14,  2.01s/it][A
Training...:  41% 5737/13907 [3:44:27<4:27:57,  1.97s/it][A
Training...:  41% 5738/13907 [3:44:28<4:19:02,  1.90s/it][A
Training...:  41% 5739/13907 [3:44:30<4:13:15,  1.86s/it][A
Training...:  41% 5740/13907 [3:44:32<4:06:52,  1.81s/it][A
Training...:  41% 5741/13907 [3:44:33<4:02:06,  1.78s/it][A
Training...:  41% 5742/13907 [3:44:35<3:56:04,  1.73s/it][A
Training...:  41% 5743/13907 [3:44:37<3:50:40,  1.70s/it][A
Training...:  41% 5744/13907 [3:44:38<3:44:52,  1.65s/it][A
Training...:  41% 5745/13907 [3:44:40<3:37:07,  1.60s/it][A
Training...:  41% 5746/13907 [3:44:41<3:31:21,  1.55s/it][A
Training...:  41% 5747/13907 [3:44:43<3:23:49,  1.50s/it][A
Training...:  41% 5748/13907 [3:44:44<3:15:52,  1.44s/it][A
Training...:  41% 5749/13907 [3:44:45<3:06:15,  1.37s/it][A
Training...:  41% 5750/13907 [3:44:46<2:54:06,  1.28s/it][A
Training...:  41% 5751/13907 [3:44:50<4:30:42,  1.99s/it][A
Training...:  41% 5752/13907 [3:44:53<5:30:30,  2.43s/it][A
Training...:  41% 5753/13907 [3:44:56<6:01:53,  2.66s/it][A
Training...:  41% 5754/13907 [3:45:00<6:20:20,  2.80s/it][A
Training...:  41% 5755/13907 [3:45:03<6:29:08,  2.86s/it][A
Training...:  41% 5756/13907 [3:45:05<6:30:57,  2.88s/it][A
Training...:  41% 5757/13907 [3:45:08<6:30:20,  2.87s/it][A
Training...:  41% 5758/13907 [3:45:11<6:29:21,  2.87s/it][A
Training...:  41% 5759/13907 [3:45:14<6:25:31,  2.84s/it][A
Training...:  41% 5760/13907 [3:45:17<6:19:05,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:15:31<17:31:07, 31533.87s/it]
Training...:  41% 5760/13907 [3:45:20<6:19:05,  2.79s/it][A
Training...:  41% 5761/13907 [3:45:20<6:30:58,  2.88s/it][A
Training...:  41% 5762/13907 [3:45:22<6:23:29,  2.83s/it][A
Training...:  41% 5763/13907 [3:45:25<6:13:48,  2.75s/it][A
Training...:  41% 5764/13907 [3:45:28<6:03:53,  2.68s/it][A
Training...:  41% 5765/13907 [3:45:30<5:56:28,  2.63s/it][A
Training...:  41% 5766/13907 [3:45:32<5:50:28,  2.58s/it][A
Training...:  41% 5767/13907 [3:45:35<5:45:16,  2.54s/it][A
Training...:  41% 5768/13907 [3:45:37<5:41:32,  2.52s/it][A
Training...:  41% 5769/13907 [3:45:40<5:35:30,  2.47s/it][A
Training...:  41% 5770/13907 [3:45:42<5:29:27,  2.43s/it][A
Training...:  41% 5771/13907 [3:45:44<5:24:32,  2.39s/it][A
Training...:  42% 5772/13907 [3:45:47<5:18:50,  2.35s/it][A
Training...:  42% 5773/13907 [3:45:49<5:14:56,  2.32s/it][A
Training...:  42% 5774/13907 [3:45:51<5:11:24,  2.30s/it][A
Training...:  42% 5775/13907 [3:45:53<5:05:57,  2.26s/it][A
Training...:  42% 5776/13907 [3:45:55<5:02:23,  2.23s/it][A
Training...:  42% 5777/13907 [3:45:58<4:58:13,  2.20s/it][A
Training...:  42% 5778/13907 [3:46:00<4:52:20,  2.16s/it][A
Training...:  42% 5779/13907 [3:46:02<4:47:46,  2.12s/it][A
Training...:  42% 5780/13907 [3:46:04<4:43:03,  2.09s/it][A
Training...:  42% 5781/13907 [3:46:06<4:38:56,  2.06s/it][A
Training...:  42% 5782/13907 [3:46:08<4:34:35,  2.03s/it][A
Training...:  42% 5783/13907 [3:46:10<4:31:23,  2.00s/it][A
Training...:  42% 5784/13907 [3:46:12<4:27:35,  1.98s/it][A
Training...:  42% 5785/13907 [3:46:13<4:23:17,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:16:27<17:31:07, 31533.87s/it]
Training...:  42% 5785/13907 [3:46:16<4:23:17,  1.95s/it][A
Training...:  42% 5786/13907 [3:46:16<4:32:25,  2.01s/it][A
Training...:  42% 5787/13907 [3:46:17<4:26:31,  1.97s/it][A
Training...:  42% 5788/13907 [3:46:19<4:18:57,  1.91s/it][A
Training...:  42% 5789/13907 [3:46:21<4:11:35,  1.86s/it][A
Training...:  42% 5790/13907 [3:46:23<4:06:38,  1.82s/it][A
Training...:  42% 5791/13907 [3:46:24<4:00:23,  1.78s/it][A
Training...:  42% 5792/13907 [3:46:26<3:55:02,  1.74s/it][A
Training...:  42% 5793/13907 [3:46:28<3:49:02,  1.69s/it][A
Training...:  42% 5794/13907 [3:46:29<3:43:41,  1.65s/it][A
Training...:  42% 5795/13907 [3:46:31<3:38:08,  1.61s/it][A
Training...:  42% 5796/13907 [3:46:32<3:31:24,  1.56s/it][A
Training...:  42% 5797/13907 [3:46:34<3:24:30,  1.51s/it][A
Training...:  42% 5798/13907 [3:46:35<3:16:31,  1.45s/it][A
Training...:  42% 5799/13907 [3:46:36<3:07:25,  1.39s/it][A
Training...:  42% 5800/13907 [3:46:37<2:54:24,  1.29s/it][A
Training...:  42% 5801/13907 [3:46:41<4:36:04,  2.04s/it][A
Training...:  42% 5802/13907 [3:46:44<5:35:39,  2.48s/it][A
Training...:  42% 5803/13907 [3:46:48<6:08:11,  2.73s/it][A
Training...:  42% 5804/13907 [3:46:51<6:24:24,  2.85s/it][A
Training...:  42% 5805/13907 [3:46:54<6:32:44,  2.91s/it][A
Training...:  42% 5806/13907 [3:46:57<6:37:06,  2.94s/it][A
Training...:  42% 5807/13907 [3:47:00<6:38:58,  2.96s/it][A
Training...:  42% 5808/13907 [3:47:03<6:35:06,  2.93s/it][A
Training...:  42% 5809/13907 [3:47:06<6:27:27,  2.87s/it][A
Training...:  42% 5810/13907 [3:47:08<6:20:14,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:17:22<17:31:07, 31533.87s/it]
Training...:  42% 5810/13907 [3:47:11<6:20:14,  2.82s/it][A
Training...:  42% 5811/13907 [3:47:11<6:28:56,  2.88s/it][A
Training...:  42% 5812/13907 [3:47:14<6:20:27,  2.82s/it][A
Training...:  42% 5813/13907 [3:47:17<6:11:52,  2.76s/it][A
Training...:  42% 5814/13907 [3:47:19<6:01:06,  2.68s/it][A
Training...:  42% 5815/13907 [3:47:22<5:53:30,  2.62s/it][A
Training...:  42% 5816/13907 [3:47:24<5:46:58,  2.57s/it][A
Training...:  42% 5817/13907 [3:47:26<5:40:25,  2.52s/it][A
Training...:  42% 5818/13907 [3:47:29<5:35:08,  2.49s/it][A
Training...:  42% 5819/13907 [3:47:31<5:30:30,  2.45s/it][A
Training...:  42% 5820/13907 [3:47:33<5:25:47,  2.42s/it][A
Training...:  42% 5821/13907 [3:47:36<5:21:52,  2.39s/it][A
Training...:  42% 5822/13907 [3:47:38<5:18:02,  2.36s/it][A
Training...:  42% 5823/13907 [3:47:40<5:12:56,  2.32s/it][A
Training...:  42% 5824/13907 [3:47:43<5:08:15,  2.29s/it][A
Training...:  42% 5825/13907 [3:47:45<5:03:46,  2.26s/it][A
Training...:  42% 5826/13907 [3:47:47<4:59:26,  2.22s/it][A
Training...:  42% 5827/13907 [3:47:49<4:54:57,  2.19s/it][A
Training...:  42% 5828/13907 [3:47:51<4:50:50,  2.16s/it][A
Training...:  42% 5829/13907 [3:47:53<4:48:04,  2.14s/it][A
Training...:  42% 5830/13907 [3:47:55<4:47:34,  2.14s/it][A
Training...:  42% 5831/13907 [3:47:57<4:42:19,  2.10s/it][A
Training...:  42% 5832/13907 [3:47:59<4:36:14,  2.05s/it][A
Training...:  42% 5833/13907 [3:48:01<4:32:05,  2.02s/it][A
Training...:  42% 5834/13907 [3:48:03<4:27:40,  1.99s/it][A
Training...:  42% 5835/13907 [3:48:05<4:23:04,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:18:18<17:31:07, 31533.87s/it]
Training...:  42% 5835/13907 [3:48:07<4:23:04,  1.96s/it][A
Training...:  42% 5836/13907 [3:48:07<4:31:26,  2.02s/it][A
Training...:  42% 5837/13907 [3:48:09<4:26:25,  1.98s/it][A
Training...:  42% 5838/13907 [3:48:11<4:19:05,  1.93s/it][A
Training...:  42% 5839/13907 [3:48:13<4:11:33,  1.87s/it][A
Training...:  42% 5840/13907 [3:48:14<4:05:32,  1.83s/it][A
Training...:  42% 5841/13907 [3:48:16<4:00:10,  1.79s/it][A
Training...:  42% 5842/13907 [3:48:18<3:54:31,  1.74s/it][A
Training...:  42% 5843/13907 [3:48:19<3:49:37,  1.71s/it][A
Training...:  42% 5844/13907 [3:48:21<3:43:55,  1.67s/it][A
Training...:  42% 5845/13907 [3:48:22<3:39:25,  1.63s/it][A
Training...:  42% 5846/13907 [3:48:24<3:32:31,  1.58s/it][A
Training...:  42% 5847/13907 [3:48:25<3:24:53,  1.53s/it][A
Training...:  42% 5848/13907 [3:48:27<3:17:03,  1.47s/it][A
Training...:  42% 5849/13907 [3:48:28<3:08:00,  1.40s/it][A
Training...:  42% 5850/13907 [3:48:29<2:55:06,  1.30s/it][A
Training...:  42% 5851/13907 [3:48:33<4:31:39,  2.02s/it][A
Training...:  42% 5852/13907 [3:48:36<5:31:46,  2.47s/it][A
Training...:  42% 5853/13907 [3:48:39<6:04:49,  2.72s/it][A
Training...:  42% 5854/13907 [3:48:43<6:21:47,  2.84s/it][A
Training...:  42% 5855/13907 [3:48:46<6:29:12,  2.90s/it][A
Training...:  42% 5856/13907 [3:48:49<6:30:15,  2.91s/it][A
Training...:  42% 5857/13907 [3:48:51<6:27:39,  2.89s/it][A
Training...:  42% 5858/13907 [3:48:54<6:25:47,  2.88s/it][A
Training...:  42% 5859/13907 [3:48:57<6:25:00,  2.87s/it][A
Training...:  42% 5860/13907 [3:49:00<6:22:37,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:19:14<17:31:07, 31533.87s/it]
Training...:  42% 5860/13907 [3:49:03<6:22:37,  2.85s/it][A
Training...:  42% 5861/13907 [3:49:03<6:30:48,  2.91s/it][A
Training...:  42% 5862/13907 [3:49:06<6:22:19,  2.85s/it][A
Training...:  42% 5863/13907 [3:49:08<6:10:05,  2.76s/it][A
Training...:  42% 5864/13907 [3:49:11<6:00:01,  2.69s/it][A
Training...:  42% 5865/13907 [3:49:13<5:52:11,  2.63s/it][A
Training...:  42% 5866/13907 [3:49:16<5:45:36,  2.58s/it][A
Training...:  42% 5867/13907 [3:49:18<5:39:37,  2.53s/it][A
Training...:  42% 5868/13907 [3:49:20<5:33:44,  2.49s/it][A
Training...:  42% 5869/13907 [3:49:23<5:28:48,  2.45s/it][A
Training...:  42% 5870/13907 [3:49:25<5:24:16,  2.42s/it][A
Training...:  42% 5871/13907 [3:49:28<5:21:15,  2.40s/it][A
Training...:  42% 5872/13907 [3:49:30<5:16:57,  2.37s/it][A
Training...:  42% 5873/13907 [3:49:32<5:12:00,  2.33s/it][A
Training...:  42% 5874/13907 [3:49:34<5:07:41,  2.30s/it][A
Training...:  42% 5875/13907 [3:49:37<5:04:19,  2.27s/it][A
Training...:  42% 5876/13907 [3:49:39<5:00:12,  2.24s/it][A
Training...:  42% 5877/13907 [3:49:41<4:55:52,  2.21s/it][A
Training...:  42% 5878/13907 [3:49:43<4:51:02,  2.17s/it][A
Training...:  42% 5879/13907 [3:49:45<4:47:21,  2.15s/it][A
Training...:  42% 5880/13907 [3:49:47<4:42:59,  2.12s/it][A
Training...:  42% 5881/13907 [3:49:49<4:38:53,  2.08s/it][A
Training...:  42% 5882/13907 [3:49:51<4:34:37,  2.05s/it][A
Training...:  42% 5883/13907 [3:49:53<4:30:10,  2.02s/it][A
Training...:  42% 5884/13907 [3:49:55<4:25:57,  1.99s/it][A
Training...:  42% 5885/13907 [3:49:57<4:21:23,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:20:10<17:31:07, 31533.87s/it]
Training...:  42% 5885/13907 [3:49:59<4:21:23,  1.96s/it][A
Training...:  42% 5886/13907 [3:49:59<4:28:56,  2.01s/it][A
Training...:  42% 5887/13907 [3:50:01<4:23:31,  1.97s/it][A
Training...:  42% 5888/13907 [3:50:03<4:16:19,  1.92s/it][A
Training...:  42% 5889/13907 [3:50:04<4:09:03,  1.86s/it][A
Training...:  42% 5890/13907 [3:50:06<4:02:48,  1.82s/it][A
Training...:  42% 5891/13907 [3:50:08<3:59:15,  1.79s/it][A
Training...:  42% 5892/13907 [3:50:09<3:55:37,  1.76s/it][A
Training...:  42% 5893/13907 [3:50:11<3:50:41,  1.73s/it][A
Training...:  42% 5894/13907 [3:50:13<3:44:47,  1.68s/it][A
Training...:  42% 5895/13907 [3:50:14<3:38:51,  1.64s/it][A
Training...:  42% 5896/13907 [3:50:16<3:31:10,  1.58s/it][A
Training...:  42% 5897/13907 [3:50:17<3:23:17,  1.52s/it][A
Training...:  42% 5898/13907 [3:50:18<3:14:18,  1.46s/it][A
Training...:  42% 5899/13907 [3:50:20<3:05:27,  1.39s/it][A
Training...:  42% 5900/13907 [3:50:21<2:52:11,  1.29s/it][A
Training...:  42% 5901/13907 [3:50:24<4:32:18,  2.04s/it][A
Training...:  42% 5902/13907 [3:50:28<5:30:09,  2.47s/it][A
Training...:  42% 5903/13907 [3:50:31<6:00:06,  2.70s/it][A
Training...:  42% 5904/13907 [3:50:34<6:16:26,  2.82s/it][A
Training...:  42% 5905/13907 [3:50:37<6:26:46,  2.90s/it][A
Training...:  42% 5906/13907 [3:50:40<6:27:24,  2.91s/it][A
Training...:  42% 5907/13907 [3:50:43<6:27:34,  2.91s/it][A
Training...:  42% 5908/13907 [3:50:46<6:24:26,  2.88s/it][A
Training...:  42% 5909/13907 [3:50:49<6:18:28,  2.84s/it][A
Training...:  42% 5910/13907 [3:50:51<6:13:38,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:21:06<17:31:07, 31533.87s/it]
Training...:  42% 5910/13907 [3:50:55<6:13:38,  2.80s/it][A
Training...:  43% 5911/13907 [3:50:55<6:24:48,  2.89s/it][A
Training...:  43% 5912/13907 [3:50:57<6:18:41,  2.84s/it][A
Training...:  43% 5913/13907 [3:51:00<6:09:02,  2.77s/it][A
Training...:  43% 5914/13907 [3:51:02<6:00:24,  2.71s/it][A
Training...:  43% 5915/13907 [3:51:05<5:51:50,  2.64s/it][A
Training...:  43% 5916/13907 [3:51:07<5:43:59,  2.58s/it][A
Training...:  43% 5917/13907 [3:51:10<5:36:45,  2.53s/it][A
Training...:  43% 5918/13907 [3:51:12<5:31:15,  2.49s/it][A
Training...:  43% 5919/13907 [3:51:15<5:28:44,  2.47s/it][A
Training...:  43% 5920/13907 [3:51:17<5:25:48,  2.45s/it][A
Training...:  43% 5921/13907 [3:51:19<5:19:48,  2.40s/it][A
Training...:  43% 5922/13907 [3:51:22<5:14:00,  2.36s/it][A
Training...:  43% 5923/13907 [3:51:24<5:09:46,  2.33s/it][A
Training...:  43% 5924/13907 [3:51:26<5:03:47,  2.28s/it][A
Training...:  43% 5925/13907 [3:51:28<4:59:15,  2.25s/it][A
Training...:  43% 5926/13907 [3:51:30<4:54:32,  2.21s/it][A
Training...:  43% 5927/13907 [3:51:32<4:50:03,  2.18s/it][A
Training...:  43% 5928/13907 [3:51:34<4:45:40,  2.15s/it][A
Training...:  43% 5929/13907 [3:51:37<4:41:31,  2.12s/it][A
Training...:  43% 5930/13907 [3:51:39<4:37:43,  2.09s/it][A
Training...:  43% 5931/13907 [3:51:41<4:33:34,  2.06s/it][A
Training...:  43% 5932/13907 [3:51:42<4:30:08,  2.03s/it][A
Training...:  43% 5933/13907 [3:51:44<4:26:23,  2.00s/it][A
Training...:  43% 5934/13907 [3:51:46<4:22:38,  1.98s/it][A
Training...:  43% 5935/13907 [3:51:48<4:18:54,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:22:01<17:31:07, 31533.87s/it]
Training...:  43% 5935/13907 [3:51:50<4:18:54,  1.95s/it][A
Training...:  43% 5936/13907 [3:51:50<4:28:12,  2.02s/it][A
Training...:  43% 5937/13907 [3:51:52<4:22:37,  1.98s/it][A
Training...:  43% 5938/13907 [3:51:54<4:15:18,  1.92s/it][A
Training...:  43% 5939/13907 [3:51:56<4:09:11,  1.88s/it][A
Training...:  43% 5940/13907 [3:51:58<4:04:03,  1.84s/it][A
Training...:  43% 5941/13907 [3:51:59<3:58:57,  1.80s/it][A
Training...:  43% 5942/13907 [3:52:01<3:54:25,  1.77s/it][A
Training...:  43% 5943/13907 [3:52:03<3:48:24,  1.72s/it][A
Training...:  43% 5944/13907 [3:52:04<3:42:50,  1.68s/it][A
Training...:  43% 5945/13907 [3:52:06<3:37:02,  1.64s/it][A
Training...:  43% 5946/13907 [3:52:07<3:29:59,  1.58s/it][A
Training...:  43% 5947/13907 [3:52:09<3:22:58,  1.53s/it][A
Training...:  43% 5948/13907 [3:52:10<3:15:39,  1.47s/it][A
Training...:  43% 5949/13907 [3:52:11<3:06:30,  1.41s/it][A
Training...:  43% 5950/13907 [3:52:12<2:52:48,  1.30s/it][A
Training...:  43% 5951/13907 [3:52:16<4:30:08,  2.04s/it][A
Training...:  43% 5952/13907 [3:52:20<5:29:46,  2.49s/it][A
Training...:  43% 5953/13907 [3:52:23<5:59:17,  2.71s/it][A
Training...:  43% 5954/13907 [3:52:26<6:13:32,  2.82s/it][A
Training...:  43% 5955/13907 [3:52:29<6:22:42,  2.89s/it][A
Training...:  43% 5956/13907 [3:52:32<6:23:54,  2.90s/it][A
Training...:  43% 5957/13907 [3:52:35<6:22:38,  2.89s/it][A
Training...:  43% 5958/13907 [3:52:37<6:19:00,  2.86s/it][A
Training...:  43% 5959/13907 [3:52:40<6:14:29,  2.83s/it][A
Training...:  43% 5960/13907 [3:52:43<6:08:02,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:22:57<17:31:07, 31533.87s/it]
Training...:  43% 5960/13907 [3:52:46<6:08:02,  2.78s/it][A
Training...:  43% 5961/13907 [3:52:46<6:19:02,  2.86s/it][A
Training...:  43% 5962/13907 [3:52:49<6:11:56,  2.81s/it][A
Training...:  43% 5963/13907 [3:52:51<6:02:31,  2.74s/it][A
Training...:  43% 5964/13907 [3:52:54<5:52:39,  2.66s/it][A
Training...:  43% 5965/13907 [3:52:56<5:45:38,  2.61s/it][A
Training...:  43% 5966/13907 [3:52:59<5:38:00,  2.55s/it][A
Training...:  43% 5967/13907 [3:53:01<5:33:24,  2.52s/it][A
Training...:  43% 5968/13907 [3:53:03<5:27:58,  2.48s/it][A
Training...:  43% 5969/13907 [3:53:06<5:22:40,  2.44s/it][A
Training...:  43% 5970/13907 [3:53:08<5:18:36,  2.41s/it][A
Training...:  43% 5971/13907 [3:53:10<5:14:22,  2.38s/it][A
Training...:  43% 5972/13907 [3:53:13<5:09:03,  2.34s/it][A
Training...:  43% 5973/13907 [3:53:15<5:04:55,  2.31s/it][A
Training...:  43% 5974/13907 [3:53:17<5:00:45,  2.27s/it][A
Training...:  43% 5975/13907 [3:53:19<4:58:23,  2.26s/it][A
Training...:  43% 5976/13907 [3:53:21<4:55:37,  2.24s/it][A
Training...:  43% 5977/13907 [3:53:24<4:52:11,  2.21s/it][A
Training...:  43% 5978/13907 [3:53:26<4:47:29,  2.18s/it][A
Training...:  43% 5979/13907 [3:53:28<4:43:40,  2.15s/it][A
Training...:  43% 5980/13907 [3:53:30<4:38:51,  2.11s/it][A
Training...:  43% 5981/13907 [3:53:32<4:34:20,  2.08s/it][A
Training...:  43% 5982/13907 [3:53:34<4:30:08,  2.05s/it][A
Training...:  43% 5983/13907 [3:53:36<4:26:52,  2.02s/it][A
Training...:  43% 5984/13907 [3:53:38<4:22:53,  1.99s/it][A
Training...:  43% 5985/13907 [3:53:40<4:18:27,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:23:53<17:31:07, 31533.87s/it]
Training...:  43% 5985/13907 [3:53:42<4:18:27,  1.96s/it][A
Training...:  43% 5986/13907 [3:53:42<4:27:12,  2.02s/it][A
Training...:  43% 5987/13907 [3:53:44<4:21:34,  1.98s/it][A
Training...:  43% 5988/13907 [3:53:45<4:14:04,  1.93s/it][A
Training...:  43% 5989/13907 [3:53:47<4:07:12,  1.87s/it][A
Training...:  43% 5990/13907 [3:53:49<4:00:51,  1.83s/it][A
Training...:  43% 5991/13907 [3:53:51<3:55:00,  1.78s/it][A
Training...:  43% 5992/13907 [3:53:52<3:49:36,  1.74s/it][A
Training...:  43% 5993/13907 [3:53:54<3:44:39,  1.70s/it][A
Training...:  43% 5994/13907 [3:53:55<3:39:20,  1.66s/it][A
Training...:  43% 5995/13907 [3:53:57<3:33:09,  1.62s/it][A
Training...:  43% 5996/13907 [3:53:58<3:26:41,  1.57s/it][A
Training...:  43% 5997/13907 [3:54:00<3:19:20,  1.51s/it][A
Training...:  43% 5998/13907 [3:54:01<3:11:37,  1.45s/it][A
Training...:  43% 5999/13907 [3:54:02<3:02:43,  1.39s/it][A
Training...:  43% 6000/13907 [3:54:03<2:48:22,  1.28s/it][A
Training...:  43% 6001/13907 [3:54:07<4:20:31,  1.98s/it][A
Training...:  43% 6002/13907 [3:54:10<5:16:57,  2.41s/it][A
Training...:  43% 6003/13907 [3:54:14<5:47:35,  2.64s/it][A
Training...:  43% 6004/13907 [3:54:17<6:05:09,  2.77s/it][A
Training...:  43% 6005/13907 [3:54:20<6:14:01,  2.84s/it][A
Training...:  43% 6006/13907 [3:54:22<6:16:19,  2.86s/it][A
Training...:  43% 6007/13907 [3:54:25<6:17:09,  2.86s/it][A
Training...:  43% 6008/13907 [3:54:28<6:15:17,  2.85s/it][A
Training...:  43% 6009/13907 [3:54:31<6:09:54,  2.81s/it][A
Training...:  43% 6010/13907 [3:54:34<6:05:12,  2.77s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:24:48<17:31:07, 31533.87s/it]
Training...:  43% 6010/13907 [3:54:37<6:05:12,  2.77s/it][A
Training...:  43% 6011/13907 [3:54:37<6:17:03,  2.87s/it][A
Training...:  43% 6012/13907 [3:54:39<6:09:40,  2.81s/it][A
Training...:  43% 6013/13907 [3:54:42<5:58:42,  2.73s/it][A
Training...:  43% 6014/13907 [3:54:44<5:50:31,  2.66s/it][A
Training...:  43% 6015/13907 [3:54:47<5:43:28,  2.61s/it][A
Training...:  43% 6016/13907 [3:54:49<5:36:55,  2.56s/it][A
Training...:  43% 6017/13907 [3:54:52<5:34:57,  2.55s/it][A
Training...:  43% 6018/13907 [3:54:54<5:32:50,  2.53s/it][A
Training...:  43% 6019/13907 [3:54:57<5:27:10,  2.49s/it][A
Training...:  43% 6020/13907 [3:54:59<5:21:08,  2.44s/it][A
Training...:  43% 6021/13907 [3:55:01<5:16:30,  2.41s/it][A
Training...:  43% 6022/13907 [3:55:04<5:09:58,  2.36s/it][A
Training...:  43% 6023/13907 [3:55:06<5:04:21,  2.32s/it][A
Training...:  43% 6024/13907 [3:55:08<4:58:26,  2.27s/it][A
Training...:  43% 6025/13907 [3:55:10<4:53:32,  2.23s/it][A
Training...:  43% 6026/13907 [3:55:12<4:48:30,  2.20s/it][A
Training...:  43% 6027/13907 [3:55:14<4:43:44,  2.16s/it][A
Training...:  43% 6028/13907 [3:55:16<4:39:28,  2.13s/it][A
Training...:  43% 6029/13907 [3:55:18<4:36:10,  2.10s/it][A
Training...:  43% 6030/13907 [3:55:20<4:32:25,  2.08s/it][A
Training...:  43% 6031/13907 [3:55:22<4:28:23,  2.04s/it][A
Training...:  43% 6032/13907 [3:55:24<4:24:37,  2.02s/it][A
Training...:  43% 6033/13907 [3:55:26<4:20:00,  1.98s/it][A
Training...:  43% 6034/13907 [3:55:28<4:15:21,  1.95s/it][A
Training...:  43% 6035/13907 [3:55:30<4:13:03,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:25:43<17:31:07, 31533.87s/it]
Training...:  43% 6035/13907 [3:55:32<4:13:03,  1.93s/it][A
Training...:  43% 6036/13907 [3:55:32<4:21:35,  1.99s/it][A
Training...:  43% 6037/13907 [3:55:34<4:16:47,  1.96s/it][A
Training...:  43% 6038/13907 [3:55:36<4:09:08,  1.90s/it][A
Training...:  43% 6039/13907 [3:55:38<4:02:46,  1.85s/it][A
Training...:  43% 6040/13907 [3:55:39<3:56:16,  1.80s/it][A
Training...:  43% 6041/13907 [3:55:41<3:52:14,  1.77s/it][A
Training...:  43% 6042/13907 [3:55:43<3:45:49,  1.72s/it][A
Training...:  43% 6043/13907 [3:55:44<3:40:23,  1.68s/it][A
Training...:  43% 6044/13907 [3:55:46<3:36:10,  1.65s/it][A
Training...:  43% 6045/13907 [3:55:47<3:30:04,  1.60s/it][A
Training...:  43% 6046/13907 [3:55:49<3:23:05,  1.55s/it][A
Training...:  43% 6047/13907 [3:55:50<3:16:09,  1.50s/it][A
Training...:  43% 6048/13907 [3:55:51<3:08:34,  1.44s/it][A
Training...:  43% 6049/13907 [3:55:53<2:59:32,  1.37s/it][A
Training...:  44% 6050/13907 [3:55:54<2:45:49,  1.27s/it][A
Training...:  44% 6051/13907 [3:55:57<4:22:20,  2.00s/it][A
Training...:  44% 6052/13907 [3:56:01<5:19:25,  2.44s/it][A
Training...:  44% 6053/13907 [3:56:04<5:51:15,  2.68s/it][A
Training...:  44% 6054/13907 [3:56:07<6:12:36,  2.85s/it][A
Training...:  44% 6055/13907 [3:56:10<6:23:42,  2.93s/it][A
Training...:  44% 6056/13907 [3:56:13<6:30:14,  2.98s/it][A
Training...:  44% 6057/13907 [3:56:16<6:31:59,  3.00s/it][A
Training...:  44% 6058/13907 [3:56:19<6:26:24,  2.95s/it][A
Training...:  44% 6059/13907 [3:56:22<6:21:15,  2.91s/it][A
Training...:  44% 6060/13907 [3:56:25<6:14:47,  2.87s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:26:39<17:31:07, 31533.87s/it]
Training...:  44% 6060/13907 [3:56:28<6:14:47,  2.87s/it][A
Training...:  44% 6061/13907 [3:56:28<6:23:53,  2.94s/it][A
Training...:  44% 6062/13907 [3:56:31<6:13:41,  2.86s/it][A
Training...:  44% 6063/13907 [3:56:33<6:01:37,  2.77s/it][A
Training...:  44% 6064/13907 [3:56:36<5:52:43,  2.70s/it][A
Training...:  44% 6065/13907 [3:56:38<5:46:08,  2.65s/it][A
Training...:  44% 6066/13907 [3:56:41<5:37:58,  2.59s/it][A
Training...:  44% 6067/13907 [3:56:43<5:30:59,  2.53s/it][A
Training...:  44% 6068/13907 [3:56:46<5:24:41,  2.49s/it][A
Training...:  44% 6069/13907 [3:56:48<5:19:15,  2.44s/it][A
Training...:  44% 6070/13907 [3:56:50<5:14:38,  2.41s/it][A
Training...:  44% 6071/13907 [3:56:53<5:10:09,  2.37s/it][A
Training...:  44% 6072/13907 [3:56:55<5:06:12,  2.34s/it][A
Training...:  44% 6073/13907 [3:56:57<5:01:55,  2.31s/it][A
Training...:  44% 6074/13907 [3:56:59<4:57:07,  2.28s/it][A
Training...:  44% 6075/13907 [3:57:01<4:53:01,  2.24s/it][A
Training...:  44% 6076/13907 [3:57:04<4:49:46,  2.22s/it][A
Training...:  44% 6077/13907 [3:57:06<4:46:32,  2.20s/it][A
Training...:  44% 6078/13907 [3:57:08<4:43:13,  2.17s/it][A
Training...:  44% 6079/13907 [3:57:10<4:39:21,  2.14s/it][A
Training...:  44% 6080/13907 [3:57:12<4:33:53,  2.10s/it][A
Training...:  44% 6081/13907 [3:57:14<4:30:07,  2.07s/it][A
Training...:  44% 6082/13907 [3:57:16<4:27:27,  2.05s/it][A
Training...:  44% 6083/13907 [3:57:18<4:23:24,  2.02s/it][A
Training...:  44% 6084/13907 [3:57:20<4:18:36,  1.98s/it][A
Training...:  44% 6085/13907 [3:57:22<4:14:49,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:27:35<17:31:07, 31533.87s/it]
Training...:  44% 6085/13907 [3:57:24<4:14:49,  1.95s/it][A
Training...:  44% 6086/13907 [3:57:24<4:22:30,  2.01s/it][A
Training...:  44% 6087/13907 [3:57:26<4:18:01,  1.98s/it][A
Training...:  44% 6088/13907 [3:57:27<4:12:19,  1.94s/it][A
Training...:  44% 6089/13907 [3:57:29<4:05:36,  1.88s/it][A
Training...:  44% 6090/13907 [3:57:31<3:58:50,  1.83s/it][A
Training...:  44% 6091/13907 [3:57:33<3:52:45,  1.79s/it][A
Training...:  44% 6092/13907 [3:57:34<3:48:44,  1.76s/it][A
Training...:  44% 6093/13907 [3:57:36<3:45:01,  1.73s/it][A
Training...:  44% 6094/13907 [3:57:38<3:39:30,  1.69s/it][A
Training...:  44% 6095/13907 [3:57:39<3:32:50,  1.63s/it][A
Training...:  44% 6096/13907 [3:57:41<3:26:02,  1.58s/it][A
Training...:  44% 6097/13907 [3:57:42<3:19:10,  1.53s/it][A
Training...:  44% 6098/13907 [3:57:43<3:11:41,  1.47s/it][A
Training...:  44% 6099/13907 [3:57:45<3:01:30,  1.39s/it][A
Training...:  44% 6100/13907 [3:57:46<2:48:32,  1.30s/it][A
Training...:  44% 6101/13907 [3:57:49<4:27:12,  2.05s/it][A
Training...:  44% 6102/13907 [3:57:53<5:22:56,  2.48s/it][A
Training...:  44% 6103/13907 [3:57:56<5:52:15,  2.71s/it][A
Training...:  44% 6104/13907 [3:57:59<6:09:19,  2.84s/it][A
Training...:  44% 6105/13907 [3:58:02<6:16:57,  2.90s/it][A
Training...:  44% 6106/13907 [3:58:05<6:18:56,  2.91s/it][A
Training...:  44% 6107/13907 [3:58:08<6:17:13,  2.90s/it][A
Training...:  44% 6108/13907 [3:58:11<6:14:35,  2.88s/it][A
Training...:  44% 6109/13907 [3:58:14<6:10:13,  2.85s/it][A
Training...:  44% 6110/13907 [3:58:16<6:04:09,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:28:31<17:31:07, 31533.87s/it]
Training...:  44% 6110/13907 [3:58:19<6:04:09,  2.80s/it][A
Training...:  44% 6111/13907 [3:58:19<6:14:19,  2.88s/it][A
Training...:  44% 6112/13907 [3:58:22<6:06:32,  2.82s/it][A
Training...:  44% 6113/13907 [3:58:25<5:56:58,  2.75s/it][A
Training...:  44% 6114/13907 [3:58:27<5:48:56,  2.69s/it][A
Training...:  44% 6115/13907 [3:58:30<5:41:13,  2.63s/it][A
Training...:  44% 6116/13907 [3:58:32<5:34:02,  2.57s/it][A
Training...:  44% 6117/13907 [3:58:35<5:27:27,  2.52s/it][A
Training...:  44% 6118/13907 [3:58:37<5:23:08,  2.49s/it][A
Training...:  44% 6119/13907 [3:58:39<5:18:40,  2.46s/it][A
Training...:  44% 6120/13907 [3:58:42<5:15:25,  2.43s/it][A
Training...:  44% 6121/13907 [3:58:44<5:13:23,  2.42s/it][A
Training...:  44% 6122/13907 [3:58:46<5:09:15,  2.38s/it][A
Training...:  44% 6123/13907 [3:58:49<5:02:35,  2.33s/it][A
Training...:  44% 6124/13907 [3:58:51<4:56:26,  2.29s/it][A
Training...:  44% 6125/13907 [3:58:53<4:51:05,  2.24s/it][A
Training...:  44% 6126/13907 [3:58:55<4:47:10,  2.21s/it][A
Training...:  44% 6127/13907 [3:58:57<4:43:05,  2.18s/it][A
Training...:  44% 6128/13907 [3:58:59<4:38:58,  2.15s/it][A
Training...:  44% 6129/13907 [3:59:01<4:35:12,  2.12s/it][A
Training...:  44% 6130/13907 [3:59:03<4:30:48,  2.09s/it][A
Training...:  44% 6131/13907 [3:59:05<4:27:16,  2.06s/it][A
Training...:  44% 6132/13907 [3:59:07<4:23:20,  2.03s/it][A
Training...:  44% 6133/13907 [3:59:09<4:18:47,  2.00s/it][A
Training...:  44% 6134/13907 [3:59:11<4:14:24,  1.96s/it][A
Training...:  44% 6135/13907 [3:59:13<4:10:28,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:29:26<17:31:07, 31533.87s/it]
Training...:  44% 6135/13907 [3:59:15<4:10:28,  1.93s/it][A
Training...:  44% 6136/13907 [3:59:15<4:17:49,  1.99s/it][A
Training...:  44% 6137/13907 [3:59:17<4:12:32,  1.95s/it][A
Training...:  44% 6138/13907 [3:59:19<4:04:42,  1.89s/it][A
Training...:  44% 6139/13907 [3:59:21<3:58:42,  1.84s/it][A
Training...:  44% 6140/13907 [3:59:22<3:51:57,  1.79s/it][A
Training...:  44% 6141/13907 [3:59:24<3:46:21,  1.75s/it][A
Training...:  44% 6142/13907 [3:59:25<3:40:58,  1.71s/it][A
Training...:  44% 6143/13907 [3:59:27<3:35:51,  1.67s/it][A
Training...:  44% 6144/13907 [3:59:29<3:31:01,  1.63s/it][A
Training...:  44% 6145/13907 [3:59:30<3:25:58,  1.59s/it][A
Training...:  44% 6146/13907 [3:59:31<3:19:36,  1.54s/it][A
Training...:  44% 6147/13907 [3:59:33<3:12:35,  1.49s/it][A
Training...:  44% 6148/13907 [3:59:34<3:04:55,  1.43s/it][A
Training...:  44% 6149/13907 [3:59:35<2:56:49,  1.37s/it][A
Training...:  44% 6150/13907 [3:59:36<2:45:07,  1.28s/it][A
Training...:  44% 6151/13907 [3:59:40<4:23:34,  2.04s/it][A
Training...:  44% 6152/13907 [3:59:44<5:18:45,  2.47s/it][A
Training...:  44% 6153/13907 [3:59:47<5:49:39,  2.71s/it][A
Training...:  44% 6154/13907 [3:59:50<6:05:07,  2.83s/it][A
Training...:  44% 6155/13907 [3:59:53<6:13:03,  2.89s/it][A
Training...:  44% 6156/13907 [3:59:56<6:16:09,  2.91s/it][A
Training...:  44% 6157/13907 [3:59:59<6:15:15,  2.91s/it][A
Training...:  44% 6158/13907 [4:00:02<6:13:49,  2.89s/it][A
Training...:  44% 6159/13907 [4:00:05<6:10:40,  2.87s/it][A
Training...:  44% 6160/13907 [4:00:07<6:07:39,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:30:22<17:31:07, 31533.87s/it]
Training...:  44% 6160/13907 [4:00:11<6:07:39,  2.85s/it][A
Training...:  44% 6161/13907 [4:00:11<6:16:30,  2.92s/it][A
Training...:  44% 6162/13907 [4:00:13<6:07:05,  2.84s/it][A
Training...:  44% 6163/13907 [4:00:16<5:57:39,  2.77s/it][A
Training...:  44% 6164/13907 [4:00:18<5:49:03,  2.70s/it][A
Training...:  44% 6165/13907 [4:00:21<5:41:29,  2.65s/it][A
Training...:  44% 6166/13907 [4:00:23<5:34:47,  2.59s/it][A
Training...:  44% 6167/13907 [4:00:26<5:27:01,  2.54s/it][A
Training...:  44% 6168/13907 [4:00:28<5:20:20,  2.48s/it][A
Training...:  44% 6169/13907 [4:00:30<5:14:31,  2.44s/it][A
Training...:  44% 6170/13907 [4:00:33<5:09:07,  2.40s/it][A
Training...:  44% 6171/13907 [4:00:35<5:04:42,  2.36s/it][A
Training...:  44% 6172/13907 [4:00:37<5:00:54,  2.33s/it][A
Training...:  44% 6173/13907 [4:00:39<4:55:47,  2.29s/it][A
Training...:  44% 6174/13907 [4:00:42<4:51:00,  2.26s/it][A
Training...:  44% 6175/13907 [4:00:44<4:47:25,  2.23s/it][A
Training...:  44% 6176/13907 [4:00:46<4:43:42,  2.20s/it][A
Training...:  44% 6177/13907 [4:00:48<4:39:28,  2.17s/it][A
Training...:  44% 6178/13907 [4:00:50<4:36:37,  2.15s/it][A
Training...:  44% 6179/13907 [4:00:52<4:33:27,  2.12s/it][A
Training...:  44% 6180/13907 [4:00:54<4:29:44,  2.09s/it][A
Training...:  44% 6181/13907 [4:00:56<4:26:41,  2.07s/it][A
Training...:  44% 6182/13907 [4:00:58<4:23:38,  2.05s/it][A
Training...:  44% 6183/13907 [4:01:00<4:20:14,  2.02s/it][A
Training...:  44% 6184/13907 [4:01:02<4:15:44,  1.99s/it][A
Training...:  44% 6185/13907 [4:01:04<4:11:31,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:31:17<17:31:07, 31533.87s/it]
Training...:  44% 6185/13907 [4:01:06<4:11:31,  1.95s/it][A
Training...:  44% 6186/13907 [4:01:06<4:19:29,  2.02s/it][A
Training...:  44% 6187/13907 [4:01:08<4:15:15,  1.98s/it][A
Training...:  44% 6188/13907 [4:01:10<4:07:03,  1.92s/it][A
Training...:  45% 6189/13907 [4:01:12<4:01:05,  1.87s/it][A
Training...:  45% 6190/13907 [4:01:13<3:54:52,  1.83s/it][A
Training...:  45% 6191/13907 [4:01:15<3:49:30,  1.78s/it][A
Training...:  45% 6192/13907 [4:01:17<3:45:14,  1.75s/it][A
Training...:  45% 6193/13907 [4:01:18<3:39:57,  1.71s/it][A
Training...:  45% 6194/13907 [4:01:20<3:34:57,  1.67s/it][A
Training...:  45% 6195/13907 [4:01:21<3:28:32,  1.62s/it][A
Training...:  45% 6196/13907 [4:01:23<3:21:55,  1.57s/it][A
Training...:  45% 6197/13907 [4:01:24<3:15:19,  1.52s/it][A
Training...:  45% 6198/13907 [4:01:26<3:07:20,  1.46s/it][A
Training...:  45% 6199/13907 [4:01:27<2:58:15,  1.39s/it][A
Training...:  45% 6200/13907 [4:01:28<2:45:05,  1.29s/it][A
Training...:  45% 6201/13907 [4:01:32<4:19:36,  2.02s/it][A
Training...:  45% 6202/13907 [4:01:35<5:17:49,  2.47s/it][A
Training...:  45% 6203/13907 [4:01:38<5:50:28,  2.73s/it][A
Training...:  45% 6204/13907 [4:01:42<6:06:45,  2.86s/it][A
Training...:  45% 6205/13907 [4:01:45<6:16:19,  2.93s/it][A
Training...:  45% 6206/13907 [4:01:48<6:17:31,  2.94s/it][A
Training...:  45% 6207/13907 [4:01:51<6:15:58,  2.93s/it][A
Training...:  45% 6208/13907 [4:01:53<6:12:10,  2.90s/it][A
Training...:  45% 6209/13907 [4:01:56<6:07:47,  2.87s/it][A
Training...:  45% 6210/13907 [4:01:59<6:01:45,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:32:13<17:31:07, 31533.87s/it]
Training...:  45% 6210/13907 [4:02:02<6:01:45,  2.82s/it][A
Training...:  45% 6211/13907 [4:02:02<6:12:10,  2.90s/it][A
Training...:  45% 6212/13907 [4:02:05<6:05:00,  2.85s/it][A
Training...:  45% 6213/13907 [4:02:07<5:54:21,  2.76s/it][A
Training...:  45% 6214/13907 [4:02:10<5:45:22,  2.69s/it][A
Training...:  45% 6215/13907 [4:02:12<5:37:35,  2.63s/it][A
Training...:  45% 6216/13907 [4:02:15<5:30:54,  2.58s/it][A
Training...:  45% 6217/13907 [4:02:17<5:24:53,  2.53s/it][A
Training...:  45% 6218/13907 [4:02:20<5:19:53,  2.50s/it][A
Training...:  45% 6219/13907 [4:02:22<5:14:43,  2.46s/it][A
Training...:  45% 6220/13907 [4:02:24<5:09:09,  2.41s/it][A
Training...:  45% 6221/13907 [4:02:27<5:04:56,  2.38s/it][A
Training...:  45% 6222/13907 [4:02:29<5:00:34,  2.35s/it][A
Training...:  45% 6223/13907 [4:02:31<4:57:28,  2.32s/it][A
Training...:  45% 6224/13907 [4:02:33<4:52:39,  2.29s/it][A
Training...:  45% 6225/13907 [4:02:35<4:48:06,  2.25s/it][A
Training...:  45% 6226/13907 [4:02:38<4:43:21,  2.21s/it][A
Training...:  45% 6227/13907 [4:02:40<4:39:28,  2.18s/it][A
Training...:  45% 6228/13907 [4:02:42<4:34:52,  2.15s/it][A
Training...:  45% 6229/13907 [4:02:44<4:30:33,  2.11s/it][A
Training...:  45% 6230/13907 [4:02:46<4:26:55,  2.09s/it][A
Training...:  45% 6231/13907 [4:02:48<4:23:41,  2.06s/it][A
Training...:  45% 6232/13907 [4:02:50<4:19:28,  2.03s/it][A
Training...:  45% 6233/13907 [4:02:52<4:15:38,  2.00s/it][A
Training...:  45% 6234/13907 [4:02:54<4:11:13,  1.96s/it][A
Training...:  45% 6235/13907 [4:02:55<4:08:55,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:33:09<17:31:07, 31533.87s/it]
Training...:  45% 6235/13907 [4:02:58<4:08:55,  1.95s/it][A
Training...:  45% 6236/13907 [4:02:58<4:16:02,  2.00s/it][A
Training...:  45% 6237/13907 [4:02:59<4:10:11,  1.96s/it][A
Training...:  45% 6238/13907 [4:03:01<4:01:37,  1.89s/it][A
Training...:  45% 6239/13907 [4:03:03<3:55:42,  1.84s/it][A
Training...:  45% 6240/13907 [4:03:05<3:49:09,  1.79s/it][A
Training...:  45% 6241/13907 [4:03:06<3:44:43,  1.76s/it][A
Training...:  45% 6242/13907 [4:03:08<3:39:06,  1.72s/it][A
Training...:  45% 6243/13907 [4:03:09<3:33:47,  1.67s/it][A
Training...:  45% 6244/13907 [4:03:11<3:29:09,  1.64s/it][A
Training...:  45% 6245/13907 [4:03:13<3:24:00,  1.60s/it][A
Training...:  45% 6246/13907 [4:03:14<3:18:14,  1.55s/it][A
Training...:  45% 6247/13907 [4:03:15<3:11:48,  1.50s/it][A
Training...:  45% 6248/13907 [4:03:17<3:04:41,  1.45s/it][A
Training...:  45% 6249/13907 [4:03:18<2:56:38,  1.38s/it][A
Training...:  45% 6250/13907 [4:03:19<2:44:32,  1.29s/it][A
Training...:  45% 6251/13907 [4:03:23<4:18:24,  2.03s/it][A
Training...:  45% 6252/13907 [4:03:26<5:13:06,  2.45s/it][A
Training...:  45% 6253/13907 [4:03:30<5:45:52,  2.71s/it][A
Training...:  45% 6254/13907 [4:03:33<6:04:37,  2.86s/it][A
Training...:  45% 6255/13907 [4:03:36<6:14:25,  2.94s/it][A
Training...:  45% 6256/13907 [4:03:39<6:17:34,  2.96s/it][A
Training...:  45% 6257/13907 [4:03:42<6:14:53,  2.94s/it][A
Training...:  45% 6258/13907 [4:03:45<6:11:19,  2.91s/it][A
Training...:  45% 6259/13907 [4:03:47<6:05:58,  2.87s/it][A
Training...:  45% 6260/13907 [4:03:50<5:58:49,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:34:04<17:31:07, 31533.87s/it]
Training...:  45% 6260/13907 [4:03:53<5:58:49,  2.82s/it][A
Training...:  45% 6261/13907 [4:03:53<6:08:49,  2.89s/it][A
Training...:  45% 6262/13907 [4:03:56<6:01:14,  2.84s/it][A
Training...:  45% 6263/13907 [4:03:58<5:51:26,  2.76s/it][A
Training...:  45% 6264/13907 [4:04:01<5:41:56,  2.68s/it][A
Training...:  45% 6265/13907 [4:04:03<5:33:43,  2.62s/it][A
Training...:  45% 6266/13907 [4:04:06<5:26:39,  2.57s/it][A
Training...:  45% 6267/13907 [4:04:08<5:20:13,  2.51s/it][A
Training...:  45% 6268/13907 [4:04:11<5:14:29,  2.47s/it][A
Training...:  45% 6269/13907 [4:04:13<5:09:18,  2.43s/it][A
Training...:  45% 6270/13907 [4:04:15<5:05:50,  2.40s/it][A
Training...:  45% 6271/13907 [4:04:18<5:01:55,  2.37s/it][A
Training...:  45% 6272/13907 [4:04:20<4:57:43,  2.34s/it][A
Training...:  45% 6273/13907 [4:04:22<4:53:08,  2.30s/it][A
Training...:  45% 6274/13907 [4:04:24<4:49:43,  2.28s/it][A
Training...:  45% 6275/13907 [4:04:26<4:45:24,  2.24s/it][A
Training...:  45% 6276/13907 [4:04:29<4:40:27,  2.21s/it][A
Training...:  45% 6277/13907 [4:04:31<4:36:54,  2.18s/it][A
Training...:  45% 6278/13907 [4:04:33<4:32:42,  2.14s/it][A
Training...:  45% 6279/13907 [4:04:35<4:28:59,  2.12s/it][A
Training...:  45% 6280/13907 [4:04:37<4:25:02,  2.08s/it][A
Training...:  45% 6281/13907 [4:04:39<4:22:45,  2.07s/it][A
Training...:  45% 6282/13907 [4:04:41<4:19:25,  2.04s/it][A
Training...:  45% 6283/13907 [4:04:43<4:15:17,  2.01s/it][A
Training...:  45% 6284/13907 [4:04:45<4:11:20,  1.98s/it][A
Training...:  45% 6285/13907 [4:04:47<4:07:13,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:35:00<17:31:07, 31533.87s/it]
Training...:  45% 6285/13907 [4:04:49<4:07:13,  1.95s/it][A
Training...:  45% 6286/13907 [4:04:49<4:14:20,  2.00s/it][A
Training...:  45% 6287/13907 [4:04:51<4:10:05,  1.97s/it][A
Training...:  45% 6288/13907 [4:04:52<4:02:18,  1.91s/it][A
Training...:  45% 6289/13907 [4:04:54<3:56:37,  1.86s/it][A
Training...:  45% 6290/13907 [4:04:56<3:51:54,  1.83s/it][A
Training...:  45% 6291/13907 [4:04:57<3:45:57,  1.78s/it][A
Training...:  45% 6292/13907 [4:04:59<3:41:16,  1.74s/it][A
Training...:  45% 6293/13907 [4:05:01<3:35:16,  1.70s/it][A
Training...:  45% 6294/13907 [4:05:02<3:30:17,  1.66s/it][A
Training...:  45% 6295/13907 [4:05:04<3:24:28,  1.61s/it][A
Training...:  45% 6296/13907 [4:05:05<3:20:48,  1.58s/it][A
Training...:  45% 6297/13907 [4:05:07<3:14:29,  1.53s/it][A
Training...:  45% 6298/13907 [4:05:08<3:08:05,  1.48s/it][A
Training...:  45% 6299/13907 [4:05:09<3:00:00,  1.42s/it][A
Training...:  45% 6300/13907 [4:05:10<2:47:11,  1.32s/it][A
Training...:  45% 6301/13907 [4:05:14<4:18:59,  2.04s/it][A
Training...:  45% 6302/13907 [4:05:18<5:13:07,  2.47s/it][A
Training...:  45% 6303/13907 [4:05:21<5:41:45,  2.70s/it][A
Training...:  45% 6304/13907 [4:05:24<5:57:16,  2.82s/it][A
Training...:  45% 6305/13907 [4:05:27<6:04:47,  2.88s/it][A
Training...:  45% 6306/13907 [4:05:30<6:06:55,  2.90s/it][A
Training...:  45% 6307/13907 [4:05:33<6:05:23,  2.88s/it][A
Training...:  45% 6308/13907 [4:05:36<6:02:12,  2.86s/it][A
Training...:  45% 6309/13907 [4:05:38<6:00:10,  2.84s/it][A
Training...:  45% 6310/13907 [4:05:41<5:56:36,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:35:55<17:31:07, 31533.87s/it]
Training...:  45% 6310/13907 [4:05:44<5:56:36,  2.82s/it][A
Training...:  45% 6311/13907 [4:05:44<6:08:08,  2.91s/it][A
Training...:  45% 6312/13907 [4:05:47<6:02:14,  2.86s/it][A
Training...:  45% 6313/13907 [4:05:50<5:52:40,  2.79s/it][A
Training...:  45% 6314/13907 [4:05:52<5:43:10,  2.71s/it][A
Training...:  45% 6315/13907 [4:05:55<5:34:29,  2.64s/it][A
Training...:  45% 6316/13907 [4:05:57<5:27:04,  2.59s/it][A
Training...:  45% 6317/13907 [4:06:00<5:21:47,  2.54s/it][A
Training...:  45% 6318/13907 [4:06:02<5:19:47,  2.53s/it][A
Training...:  45% 6319/13907 [4:06:04<5:14:50,  2.49s/it][A
Training...:  45% 6320/13907 [4:06:07<5:12:50,  2.47s/it][A
Training...:  45% 6321/13907 [4:06:09<5:08:29,  2.44s/it][A
Training...:  45% 6322/13907 [4:06:12<5:04:22,  2.41s/it][A
Training...:  45% 6323/13907 [4:06:14<5:00:13,  2.38s/it][A
Training...:  45% 6324/13907 [4:06:16<4:57:42,  2.36s/it][A
Training...:  45% 6325/13907 [4:06:18<4:54:04,  2.33s/it][A
Training...:  45% 6326/13907 [4:06:21<4:49:36,  2.29s/it][A
Training...:  45% 6327/13907 [4:06:23<4:43:52,  2.25s/it][A
Training...:  46% 6328/13907 [4:06:25<4:37:46,  2.20s/it][A
Training...:  46% 6329/13907 [4:06:27<4:32:10,  2.15s/it][A
Training...:  46% 6330/13907 [4:06:29<4:27:26,  2.12s/it][A
Training...:  46% 6331/13907 [4:06:31<4:23:19,  2.09s/it][A
Training...:  46% 6332/13907 [4:06:33<4:18:51,  2.05s/it][A
Training...:  46% 6333/13907 [4:06:35<4:14:27,  2.02s/it][A
Training...:  46% 6334/13907 [4:06:37<4:10:29,  1.98s/it][A
Training...:  46% 6335/13907 [4:06:39<4:07:01,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:36:52<17:31:07, 31533.87s/it]
Training...:  46% 6335/13907 [4:06:41<4:07:01,  1.96s/it][A
Training...:  46% 6336/13907 [4:06:41<4:14:20,  2.02s/it][A
Training...:  46% 6337/13907 [4:06:43<4:08:04,  1.97s/it][A
Training...:  46% 6338/13907 [4:06:44<4:00:15,  1.90s/it][A
Training...:  46% 6339/13907 [4:06:46<3:54:34,  1.86s/it][A
Training...:  46% 6340/13907 [4:06:48<3:49:25,  1.82s/it][A
Training...:  46% 6341/13907 [4:06:50<3:43:26,  1.77s/it][A
Training...:  46% 6342/13907 [4:06:51<3:38:09,  1.73s/it][A
Training...:  46% 6343/13907 [4:06:53<3:33:00,  1.69s/it][A
Training...:  46% 6344/13907 [4:06:54<3:28:10,  1.65s/it][A
Training...:  46% 6345/13907 [4:06:56<3:22:36,  1.61s/it][A
Training...:  46% 6346/13907 [4:06:57<3:17:23,  1.57s/it][A
Training...:  46% 6347/13907 [4:06:59<3:11:03,  1.52s/it][A
Training...:  46% 6348/13907 [4:07:00<3:03:52,  1.46s/it][A
Training...:  46% 6349/13907 [4:07:01<2:55:55,  1.40s/it][A
Training...:  46% 6350/13907 [4:07:02<2:44:22,  1.31s/it][A
Training...:  46% 6351/13907 [4:07:06<4:15:54,  2.03s/it][A
Training...:  46% 6352/13907 [4:07:10<5:12:10,  2.48s/it][A
Training...:  46% 6353/13907 [4:07:13<5:42:33,  2.72s/it][A
Training...:  46% 6354/13907 [4:07:16<5:58:57,  2.85s/it][A
Training...:  46% 6355/13907 [4:07:19<6:11:34,  2.95s/it][A
Training...:  46% 6356/13907 [4:07:22<6:11:44,  2.95s/it][A
Training...:  46% 6357/13907 [4:07:25<6:07:59,  2.92s/it][A
Training...:  46% 6358/13907 [4:07:28<6:02:52,  2.88s/it][A
Training...:  46% 6359/13907 [4:07:31<5:57:16,  2.84s/it][A
Training...:  46% 6360/13907 [4:07:33<5:50:09,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:37:47<17:31:07, 31533.87s/it]
Training...:  46% 6360/13907 [4:07:36<5:50:09,  2.78s/it][A
Training...:  46% 6361/13907 [4:07:36<5:59:56,  2.86s/it][A
Training...:  46% 6362/13907 [4:07:39<5:53:58,  2.81s/it][A
Training...:  46% 6363/13907 [4:07:42<5:44:08,  2.74s/it][A
Training...:  46% 6364/13907 [4:07:44<5:36:46,  2.68s/it][A
Training...:  46% 6365/13907 [4:07:47<5:29:42,  2.62s/it][A
Training...:  46% 6366/13907 [4:07:49<5:22:27,  2.57s/it][A
Training...:  46% 6367/13907 [4:07:51<5:16:41,  2.52s/it][A
Training...:  46% 6368/13907 [4:07:54<5:11:55,  2.48s/it][A
Training...:  46% 6369/13907 [4:07:56<5:07:36,  2.45s/it][A
Training...:  46% 6370/13907 [4:07:59<5:02:43,  2.41s/it][A
Training...:  46% 6371/13907 [4:08:01<4:58:52,  2.38s/it][A
Training...:  46% 6372/13907 [4:08:03<4:54:12,  2.34s/it][A
Training...:  46% 6373/13907 [4:08:05<4:49:12,  2.30s/it][A
Training...:  46% 6374/13907 [4:08:08<4:44:59,  2.27s/it][A
Training...:  46% 6375/13907 [4:08:10<4:42:04,  2.25s/it][A
Training...:  46% 6376/13907 [4:08:12<4:37:47,  2.21s/it][A
Training...:  46% 6377/13907 [4:08:14<4:33:32,  2.18s/it][A
Training...:  46% 6378/13907 [4:08:16<4:29:36,  2.15s/it][A
Training...:  46% 6379/13907 [4:08:18<4:26:40,  2.13s/it][A
Training...:  46% 6380/13907 [4:08:20<4:22:34,  2.09s/it][A
Training...:  46% 6381/13907 [4:08:22<4:20:14,  2.07s/it][A
Training...:  46% 6382/13907 [4:08:24<4:18:20,  2.06s/it][A
Training...:  46% 6383/13907 [4:08:26<4:15:30,  2.04s/it][A
Training...:  46% 6384/13907 [4:08:28<4:10:46,  2.00s/it][A
Training...:  46% 6385/13907 [4:08:30<4:05:28,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:38:43<17:31:07, 31533.87s/it]
Training...:  46% 6385/13907 [4:08:32<4:05:28,  1.96s/it][A
Training...:  46% 6386/13907 [4:08:32<4:12:10,  2.01s/it][A
Training...:  46% 6387/13907 [4:08:34<4:05:34,  1.96s/it][A
Training...:  46% 6388/13907 [4:08:36<3:57:25,  1.89s/it][A
Training...:  46% 6389/13907 [4:08:37<3:50:53,  1.84s/it][A
Training...:  46% 6390/13907 [4:08:39<3:45:40,  1.80s/it][A
Training...:  46% 6391/13907 [4:08:41<3:40:20,  1.76s/it][A
Training...:  46% 6392/13907 [4:08:42<3:36:11,  1.73s/it][A
Training...:  46% 6393/13907 [4:08:44<3:30:39,  1.68s/it][A
Training...:  46% 6394/13907 [4:08:46<3:25:44,  1.64s/it][A
Training...:  46% 6395/13907 [4:08:47<3:20:24,  1.60s/it][A
Training...:  46% 6396/13907 [4:08:48<3:14:27,  1.55s/it][A
Training...:  46% 6397/13907 [4:08:50<3:07:43,  1.50s/it][A
Training...:  46% 6398/13907 [4:08:51<3:00:32,  1.44s/it][A
Training...:  46% 6399/13907 [4:08:52<2:52:48,  1.38s/it][A
Training...:  46% 6400/13907 [4:08:53<2:41:30,  1.29s/it][A
Training...:  46% 6401/13907 [4:08:57<4:14:22,  2.03s/it][A
Training...:  46% 6402/13907 [4:09:01<5:07:50,  2.46s/it][A
Training...:  46% 6403/13907 [4:09:04<5:37:39,  2.70s/it][A
Training...:  46% 6404/13907 [4:09:07<5:54:24,  2.83s/it][A
Training...:  46% 6405/13907 [4:09:10<6:00:59,  2.89s/it][A
Training...:  46% 6406/13907 [4:09:13<6:04:31,  2.92s/it][A
Training...:  46% 6407/13907 [4:09:16<6:03:28,  2.91s/it][A
Training...:  46% 6408/13907 [4:09:19<6:01:29,  2.89s/it][A
Training...:  46% 6409/13907 [4:09:22<5:56:56,  2.86s/it][A
Training...:  46% 6410/13907 [4:09:24<5:51:50,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:39:38<17:31:07, 31533.87s/it]
Training...:  46% 6410/13907 [4:09:27<5:51:50,  2.82s/it][A
Training...:  46% 6411/13907 [4:09:27<6:02:19,  2.90s/it][A
Training...:  46% 6412/13907 [4:09:30<5:59:29,  2.88s/it][A
Training...:  46% 6413/13907 [4:09:33<5:50:25,  2.81s/it][A
Training...:  46% 6414/13907 [4:09:35<5:41:02,  2.73s/it][A
Training...:  46% 6415/13907 [4:09:38<5:33:13,  2.67s/it][A
Training...:  46% 6416/13907 [4:09:40<5:26:34,  2.62s/it][A
Training...:  46% 6417/13907 [4:09:43<5:20:56,  2.57s/it][A
Training...:  46% 6418/13907 [4:09:45<5:15:19,  2.53s/it][A
Training...:  46% 6419/13907 [4:09:48<5:10:11,  2.49s/it][A
Training...:  46% 6420/13907 [4:09:50<5:05:00,  2.44s/it][A
Training...:  46% 6421/13907 [4:09:52<4:59:43,  2.40s/it][A
Training...:  46% 6422/13907 [4:09:55<4:55:29,  2.37s/it][A
Training...:  46% 6423/13907 [4:09:57<4:51:36,  2.34s/it][A
Training...:  46% 6424/13907 [4:09:59<4:46:58,  2.30s/it][A
Training...:  46% 6425/13907 [4:10:01<4:41:22,  2.26s/it][A
Training...:  46% 6426/13907 [4:10:03<4:36:47,  2.22s/it][A
Training...:  46% 6427/13907 [4:10:06<4:32:30,  2.19s/it][A
Training...:  46% 6428/13907 [4:10:08<4:29:12,  2.16s/it][A
Training...:  46% 6429/13907 [4:10:10<4:25:19,  2.13s/it][A
Training...:  46% 6430/13907 [4:10:12<4:20:58,  2.09s/it][A
Training...:  46% 6431/13907 [4:10:14<4:17:27,  2.07s/it][A
Training...:  46% 6432/13907 [4:10:16<4:13:42,  2.04s/it][A
Training...:  46% 6433/13907 [4:10:18<4:09:48,  2.01s/it][A
Training...:  46% 6434/13907 [4:10:20<4:06:56,  1.98s/it][A
Training...:  46% 6435/13907 [4:10:21<4:02:52,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:40:35<17:31:07, 31533.87s/it]
Training...:  46% 6435/13907 [4:10:24<4:02:52,  1.95s/it][A
Training...:  46% 6436/13907 [4:10:24<4:09:35,  2.00s/it][A
Training...:  46% 6437/13907 [4:10:25<4:04:01,  1.96s/it][A
Training...:  46% 6438/13907 [4:10:27<3:56:25,  1.90s/it][A
Training...:  46% 6439/13907 [4:10:29<3:50:00,  1.85s/it][A
Training...:  46% 6440/13907 [4:10:31<3:43:55,  1.80s/it][A
Training...:  46% 6441/13907 [4:10:32<3:39:47,  1.77s/it][A
Training...:  46% 6442/13907 [4:10:34<3:35:46,  1.73s/it][A
Training...:  46% 6443/13907 [4:10:36<3:31:12,  1.70s/it][A
Training...:  46% 6444/13907 [4:10:37<3:26:26,  1.66s/it][A
Training...:  46% 6445/13907 [4:10:39<3:20:46,  1.61s/it][A
Training...:  46% 6446/13907 [4:10:40<3:15:04,  1.57s/it][A
Training...:  46% 6447/13907 [4:10:42<3:09:26,  1.52s/it][A
Training...:  46% 6448/13907 [4:10:43<3:01:17,  1.46s/it][A
Training...:  46% 6449/13907 [4:10:44<2:52:55,  1.39s/it][A
Training...:  46% 6450/13907 [4:10:45<2:40:08,  1.29s/it][A
Training...:  46% 6451/13907 [4:10:49<4:10:50,  2.02s/it][A
Training...:  46% 6452/13907 [4:10:52<5:05:16,  2.46s/it][A
Training...:  46% 6453/13907 [4:10:56<5:33:12,  2.68s/it][A
Training...:  46% 6454/13907 [4:10:59<5:47:50,  2.80s/it][A
Training...:  46% 6455/13907 [4:11:02<5:56:22,  2.87s/it][A
Training...:  46% 6456/13907 [4:11:05<5:58:45,  2.89s/it][A
Training...:  46% 6457/13907 [4:11:07<5:57:09,  2.88s/it][A
Training...:  46% 6458/13907 [4:11:10<5:53:40,  2.85s/it][A
Training...:  46% 6459/13907 [4:11:13<5:50:10,  2.82s/it][A
Training...:  46% 6460/13907 [4:11:16<5:45:29,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:41:30<17:31:07, 31533.87s/it]
Training...:  46% 6460/13907 [4:11:19<5:45:29,  2.78s/it][A
Training...:  46% 6461/13907 [4:11:19<5:55:37,  2.87s/it][A
Training...:  46% 6462/13907 [4:11:21<5:49:33,  2.82s/it][A
Training...:  46% 6463/13907 [4:11:24<5:40:22,  2.74s/it][A
Training...:  46% 6464/13907 [4:11:27<5:33:16,  2.69s/it][A
Training...:  46% 6465/13907 [4:11:29<5:27:13,  2.64s/it][A
Training...:  46% 6466/13907 [4:11:32<5:20:06,  2.58s/it][A
Training...:  47% 6467/13907 [4:11:34<5:14:15,  2.53s/it][A
Training...:  47% 6468/13907 [4:11:36<5:07:51,  2.48s/it][A
Training...:  47% 6469/13907 [4:11:39<5:03:13,  2.45s/it][A
Training...:  47% 6470/13907 [4:11:41<4:57:37,  2.40s/it][A
Training...:  47% 6471/13907 [4:11:43<4:53:50,  2.37s/it][A
Training...:  47% 6472/13907 [4:11:46<4:49:42,  2.34s/it][A
Training...:  47% 6473/13907 [4:11:48<4:45:37,  2.31s/it][A
Training...:  47% 6474/13907 [4:11:50<4:42:33,  2.28s/it][A
Training...:  47% 6475/13907 [4:11:52<4:41:00,  2.27s/it][A
Training...:  47% 6476/13907 [4:11:54<4:35:43,  2.23s/it][A
Training...:  47% 6477/13907 [4:11:56<4:30:34,  2.19s/it][A
Training...:  47% 6478/13907 [4:11:58<4:25:18,  2.14s/it][A
Training...:  47% 6479/13907 [4:12:01<4:23:23,  2.13s/it][A
Training...:  47% 6480/13907 [4:12:03<4:18:38,  2.09s/it][A
Training...:  47% 6481/13907 [4:12:05<4:14:03,  2.05s/it][A
Training...:  47% 6482/13907 [4:12:06<4:09:57,  2.02s/it][A
Training...:  47% 6483/13907 [4:12:08<4:06:17,  1.99s/it][A
Training...:  47% 6484/13907 [4:12:10<4:02:41,  1.96s/it][A
Training...:  47% 6485/13907 [4:12:12<3:58:52,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:42:25<17:31:07, 31533.87s/it]
Training...:  47% 6485/13907 [4:12:14<3:58:52,  1.93s/it][A
Training...:  47% 6486/13907 [4:12:14<4:06:15,  1.99s/it][A
Training...:  47% 6487/13907 [4:12:16<4:01:42,  1.95s/it][A
Training...:  47% 6488/13907 [4:12:18<3:54:53,  1.90s/it][A
Training...:  47% 6489/13907 [4:12:20<3:49:06,  1.85s/it][A
Training...:  47% 6490/13907 [4:12:21<3:44:06,  1.81s/it][A
Training...:  47% 6491/13907 [4:12:23<3:38:35,  1.77s/it][A
Training...:  47% 6492/13907 [4:12:25<3:33:38,  1.73s/it][A
Training...:  47% 6493/13907 [4:12:26<3:28:54,  1.69s/it][A
Training...:  47% 6494/13907 [4:12:28<3:24:59,  1.66s/it][A
Training...:  47% 6495/13907 [4:12:29<3:19:34,  1.62s/it][A
Training...:  47% 6496/13907 [4:12:31<3:13:29,  1.57s/it][A
Training...:  47% 6497/13907 [4:12:32<3:06:09,  1.51s/it][A
Training...:  47% 6498/13907 [4:12:34<2:58:35,  1.45s/it][A
Training...:  47% 6499/13907 [4:12:35<2:50:13,  1.38s/it][A
Training...:  47% 6500/13907 [4:12:36<2:36:58,  1.27s/it][A
Training...:  47% 6501/13907 [4:12:39<4:05:33,  1.99s/it][A
Training...:  47% 6502/13907 [4:12:43<4:58:44,  2.42s/it][A
Training...:  47% 6503/13907 [4:12:46<5:29:00,  2.67s/it][A
Training...:  47% 6504/13907 [4:12:49<5:46:39,  2.81s/it][A
Training...:  47% 6505/13907 [4:12:52<5:55:20,  2.88s/it][A
Training...:  47% 6506/13907 [4:12:55<5:59:02,  2.91s/it][A
Training...:  47% 6507/13907 [4:12:58<5:58:01,  2.90s/it][A
Training...:  47% 6508/13907 [4:13:01<5:54:46,  2.88s/it][A
Training...:  47% 6509/13907 [4:13:04<5:49:52,  2.84s/it][A
Training...:  47% 6510/13907 [4:13:06<5:44:31,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:43:20<17:31:07, 31533.87s/it]
Training...:  47% 6510/13907 [4:13:09<5:44:31,  2.79s/it][A
Training...:  47% 6511/13907 [4:13:09<5:54:21,  2.87s/it][A
Training...:  47% 6512/13907 [4:13:12<5:48:19,  2.83s/it][A
Training...:  47% 6513/13907 [4:13:15<5:41:36,  2.77s/it][A
Training...:  47% 6514/13907 [4:13:17<5:32:37,  2.70s/it][A
Training...:  47% 6515/13907 [4:13:20<5:24:39,  2.64s/it][A
Training...:  47% 6516/13907 [4:13:22<5:17:15,  2.58s/it][A
Training...:  47% 6517/13907 [4:13:25<5:11:08,  2.53s/it][A
Training...:  47% 6518/13907 [4:13:27<5:05:32,  2.48s/it][A
Training...:  47% 6519/13907 [4:13:29<4:59:55,  2.44s/it][A
Training...:  47% 6520/13907 [4:13:32<4:54:45,  2.39s/it][A
Training...:  47% 6521/13907 [4:13:34<4:50:19,  2.36s/it][A
Training...:  47% 6522/13907 [4:13:36<4:45:28,  2.32s/it][A
Training...:  47% 6523/13907 [4:13:38<4:40:53,  2.28s/it][A
Training...:  47% 6524/13907 [4:13:41<4:37:32,  2.26s/it][A
Training...:  47% 6525/13907 [4:13:43<4:33:33,  2.22s/it][A
Training...:  47% 6526/13907 [4:13:45<4:30:17,  2.20s/it][A
Training...:  47% 6527/13907 [4:13:47<4:26:58,  2.17s/it][A
Training...:  47% 6528/13907 [4:13:49<4:23:22,  2.14s/it][A
Training...:  47% 6529/13907 [4:13:51<4:20:01,  2.11s/it][A
Training...:  47% 6530/13907 [4:13:53<4:15:47,  2.08s/it][A
Training...:  47% 6531/13907 [4:13:55<4:13:46,  2.06s/it][A
Training...:  47% 6532/13907 [4:13:57<4:09:35,  2.03s/it][A
Training...:  47% 6533/13907 [4:13:59<4:06:14,  2.00s/it][A
Training...:  47% 6534/13907 [4:14:01<4:02:38,  1.97s/it][A
Training...:  47% 6535/13907 [4:14:03<3:59:24,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:44:16<17:31:07, 31533.87s/it]
Training...:  47% 6535/13907 [4:14:05<3:59:24,  1.95s/it][A
Training...:  47% 6536/13907 [4:14:05<4:07:49,  2.02s/it][A
Training...:  47% 6537/13907 [4:14:07<4:02:40,  1.98s/it][A
Training...:  47% 6538/13907 [4:14:09<3:54:38,  1.91s/it][A
Training...:  47% 6539/13907 [4:14:10<3:48:46,  1.86s/it][A
Training...:  47% 6540/13907 [4:14:12<3:43:30,  1.82s/it][A
Training...:  47% 6541/13907 [4:14:14<3:38:52,  1.78s/it][A
Training...:  47% 6542/13907 [4:14:15<3:34:27,  1.75s/it][A
Training...:  47% 6543/13907 [4:14:17<3:30:17,  1.71s/it][A
Training...:  47% 6544/13907 [4:14:19<3:25:49,  1.68s/it][A
Training...:  47% 6545/13907 [4:14:20<3:20:12,  1.63s/it][A
Training...:  47% 6546/13907 [4:14:22<3:14:25,  1.58s/it][A
Training...:  47% 6547/13907 [4:14:23<3:07:57,  1.53s/it][A
Training...:  47% 6548/13907 [4:14:24<3:00:58,  1.48s/it][A
Training...:  47% 6549/13907 [4:14:26<2:54:01,  1.42s/it][A
Training...:  47% 6550/13907 [4:14:27<2:40:49,  1.31s/it][A
Training...:  47% 6551/13907 [4:14:31<4:13:28,  2.07s/it][A
Training...:  47% 6552/13907 [4:14:34<5:04:08,  2.48s/it][A
Training...:  47% 6553/13907 [4:14:37<5:30:22,  2.70s/it][A
Training...:  47% 6554/13907 [4:14:40<5:45:20,  2.82s/it][A
Training...:  47% 6555/13907 [4:14:43<5:52:42,  2.88s/it][A
Training...:  47% 6556/13907 [4:14:46<5:54:18,  2.89s/it][A
Training...:  47% 6557/13907 [4:14:49<5:52:53,  2.88s/it][A
Training...:  47% 6558/13907 [4:14:52<5:50:13,  2.86s/it][A
Training...:  47% 6559/13907 [4:14:55<5:45:52,  2.82s/it][A
Training...:  47% 6560/13907 [4:14:57<5:41:53,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:45:12<17:31:07, 31533.87s/it]
Training...:  47% 6560/13907 [4:15:01<5:41:53,  2.79s/it][A
Training...:  47% 6561/13907 [4:15:01<5:52:56,  2.88s/it][A
Training...:  47% 6562/13907 [4:15:03<5:47:38,  2.84s/it][A
Training...:  47% 6563/13907 [4:15:06<5:39:05,  2.77s/it][A
Training...:  47% 6564/13907 [4:15:08<5:32:07,  2.71s/it][A
Training...:  47% 6565/13907 [4:15:11<5:26:01,  2.66s/it][A
Training...:  47% 6566/13907 [4:15:13<5:19:08,  2.61s/it][A
Training...:  47% 6567/13907 [4:15:16<5:13:55,  2.57s/it][A
Training...:  47% 6568/13907 [4:15:18<5:08:34,  2.52s/it][A
Training...:  47% 6569/13907 [4:15:21<5:03:27,  2.48s/it][A
Training...:  47% 6570/13907 [4:15:23<4:57:51,  2.44s/it][A
Training...:  47% 6571/13907 [4:15:25<4:54:56,  2.41s/it][A
Training...:  47% 6572/13907 [4:15:28<4:52:55,  2.40s/it][A
Training...:  47% 6573/13907 [4:15:30<4:49:21,  2.37s/it][A
Training...:  47% 6574/13907 [4:15:32<4:43:04,  2.32s/it][A
Training...:  47% 6575/13907 [4:15:34<4:37:32,  2.27s/it][A
Training...:  47% 6576/13907 [4:15:37<4:32:20,  2.23s/it][A
Training...:  47% 6577/13907 [4:15:39<4:28:03,  2.19s/it][A
Training...:  47% 6578/13907 [4:15:41<4:23:07,  2.15s/it][A
Training...:  47% 6579/13907 [4:15:43<4:19:41,  2.13s/it][A
Training...:  47% 6580/13907 [4:15:45<4:15:20,  2.09s/it][A
Training...:  47% 6581/13907 [4:15:47<4:11:17,  2.06s/it][A
Training...:  47% 6582/13907 [4:15:49<4:06:42,  2.02s/it][A
Training...:  47% 6583/13907 [4:15:51<4:03:26,  1.99s/it][A
Training...:  47% 6584/13907 [4:15:53<3:59:55,  1.97s/it][A
Training...:  47% 6585/13907 [4:15:54<3:56:22,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:46:08<17:31:07, 31533.87s/it]
Training...:  47% 6585/13907 [4:15:57<3:56:22,  1.94s/it][A
Training...:  47% 6586/13907 [4:15:57<4:04:10,  2.00s/it][A
Training...:  47% 6587/13907 [4:15:58<3:59:53,  1.97s/it][A
Training...:  47% 6588/13907 [4:16:00<3:51:59,  1.90s/it][A
Training...:  47% 6589/13907 [4:16:02<3:46:30,  1.86s/it][A
Training...:  47% 6590/13907 [4:16:04<3:40:38,  1.81s/it][A
Training...:  47% 6591/13907 [4:16:05<3:34:58,  1.76s/it][A
Training...:  47% 6592/13907 [4:16:07<3:29:57,  1.72s/it][A
Training...:  47% 6593/13907 [4:16:09<3:24:42,  1.68s/it][A
Training...:  47% 6594/13907 [4:16:10<3:20:21,  1.64s/it][A
Training...:  47% 6595/13907 [4:16:12<3:15:15,  1.60s/it][A
Training...:  47% 6596/13907 [4:16:13<3:09:26,  1.55s/it][A
Training...:  47% 6597/13907 [4:16:14<3:03:33,  1.51s/it][A
Training...:  47% 6598/13907 [4:16:16<2:57:19,  1.46s/it][A
Training...:  47% 6599/13907 [4:16:17<2:48:51,  1.39s/it][A
Training...:  47% 6600/13907 [4:16:18<2:36:33,  1.29s/it][A
Training...:  47% 6601/13907 [4:16:22<4:05:46,  2.02s/it][A
Training...:  47% 6602/13907 [4:16:25<5:03:43,  2.49s/it][A
Training...:  47% 6603/13907 [4:16:29<5:34:55,  2.75s/it][A
Training...:  47% 6604/13907 [4:16:32<5:50:37,  2.88s/it][A
Training...:  47% 6605/13907 [4:16:35<5:58:04,  2.94s/it][A
Training...:  48% 6606/13907 [4:16:38<5:59:11,  2.95s/it][A
Training...:  48% 6607/13907 [4:16:41<5:57:38,  2.94s/it][A
Training...:  48% 6608/13907 [4:16:44<5:54:45,  2.92s/it][A
Training...:  48% 6609/13907 [4:16:47<5:52:44,  2.90s/it][A
Training...:  48% 6610/13907 [4:16:49<5:46:12,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:47:03<17:31:07, 31533.87s/it]
Training...:  48% 6610/13907 [4:16:52<5:46:12,  2.85s/it][A
Training...:  48% 6611/13907 [4:16:52<5:54:52,  2.92s/it][A
Training...:  48% 6612/13907 [4:16:55<5:45:58,  2.85s/it][A
Training...:  48% 6613/13907 [4:16:58<5:35:25,  2.76s/it][A
Training...:  48% 6614/13907 [4:17:00<5:26:51,  2.69s/it][A
Training...:  48% 6615/13907 [4:17:03<5:19:49,  2.63s/it][A
Training...:  48% 6616/13907 [4:17:05<5:13:01,  2.58s/it][A
Training...:  48% 6617/13907 [4:17:08<5:06:33,  2.52s/it][A
Training...:  48% 6618/13907 [4:17:10<5:01:34,  2.48s/it][A
Training...:  48% 6619/13907 [4:17:12<4:56:58,  2.44s/it][A
Training...:  48% 6620/13907 [4:17:15<4:51:14,  2.40s/it][A
Training...:  48% 6621/13907 [4:17:17<4:47:22,  2.37s/it][A
Training...:  48% 6622/13907 [4:17:19<4:42:38,  2.33s/it][A
Training...:  48% 6623/13907 [4:17:21<4:38:45,  2.30s/it][A
Training...:  48% 6624/13907 [4:17:23<4:34:21,  2.26s/it][A
Training...:  48% 6625/13907 [4:17:26<4:31:13,  2.23s/it][A
Training...:  48% 6626/13907 [4:17:28<4:28:01,  2.21s/it][A
Training...:  48% 6627/13907 [4:17:30<4:23:54,  2.18s/it][A
Training...:  48% 6628/13907 [4:17:32<4:20:14,  2.15s/it][A
Training...:  48% 6629/13907 [4:17:34<4:16:23,  2.11s/it][A
Training...:  48% 6630/13907 [4:17:36<4:11:43,  2.08s/it][A
Training...:  48% 6631/13907 [4:17:38<4:08:43,  2.05s/it][A
Training...:  48% 6632/13907 [4:17:40<4:05:47,  2.03s/it][A
Training...:  48% 6633/13907 [4:17:42<4:01:43,  1.99s/it][A
Training...:  48% 6634/13907 [4:17:44<3:58:34,  1.97s/it][A
Training...:  48% 6635/13907 [4:17:46<3:56:10,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:47:59<17:31:07, 31533.87s/it]
Training...:  48% 6635/13907 [4:17:48<3:56:10,  1.95s/it][A
Training...:  48% 6636/13907 [4:17:48<4:04:59,  2.02s/it][A
Training...:  48% 6637/13907 [4:17:50<4:00:00,  1.98s/it][A
Training...:  48% 6638/13907 [4:17:52<3:52:13,  1.92s/it][A
Training...:  48% 6639/13907 [4:17:53<3:45:20,  1.86s/it][A
Training...:  48% 6640/13907 [4:17:55<3:38:57,  1.81s/it][A
Training...:  48% 6641/13907 [4:17:57<3:32:56,  1.76s/it][A
Training...:  48% 6642/13907 [4:17:58<3:28:07,  1.72s/it][A
Training...:  48% 6643/13907 [4:18:00<3:23:03,  1.68s/it][A
Training...:  48% 6644/13907 [4:18:01<3:18:19,  1.64s/it][A
Training...:  48% 6645/13907 [4:18:03<3:12:23,  1.59s/it][A
Training...:  48% 6646/13907 [4:18:04<3:05:58,  1.54s/it][A
Training...:  48% 6647/13907 [4:18:06<2:59:55,  1.49s/it][A
Training...:  48% 6648/13907 [4:18:07<2:53:19,  1.43s/it][A
Training...:  48% 6649/13907 [4:18:08<2:44:49,  1.36s/it][A
Training...:  48% 6650/13907 [4:18:09<2:32:58,  1.26s/it][A
Training...:  48% 6651/13907 [4:18:13<4:01:38,  2.00s/it][A
Training...:  48% 6652/13907 [4:18:16<4:55:31,  2.44s/it][A
Training...:  48% 6653/13907 [4:18:20<5:25:54,  2.70s/it][A
Training...:  48% 6654/13907 [4:18:23<5:40:09,  2.81s/it][A
Training...:  48% 6655/13907 [4:18:26<5:48:06,  2.88s/it][A
Training...:  48% 6656/13907 [4:18:29<5:49:06,  2.89s/it][A
Training...:  48% 6657/13907 [4:18:32<5:47:40,  2.88s/it][A
Training...:  48% 6658/13907 [4:18:34<5:46:57,  2.87s/it][A
Training...:  48% 6659/13907 [4:18:37<5:43:53,  2.85s/it][A
Training...:  48% 6660/13907 [4:18:40<5:38:06,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:48:54<17:31:07, 31533.87s/it]
Training...:  48% 6660/13907 [4:18:43<5:38:06,  2.80s/it][A
Training...:  48% 6661/13907 [4:18:43<5:47:50,  2.88s/it][A
Training...:  48% 6662/13907 [4:18:46<5:39:55,  2.82s/it][A
Training...:  48% 6663/13907 [4:18:48<5:30:26,  2.74s/it][A
Training...:  48% 6664/13907 [4:18:51<5:22:15,  2.67s/it][A
Training...:  48% 6665/13907 [4:18:53<5:15:51,  2.62s/it][A
Training...:  48% 6666/13907 [4:18:56<5:09:15,  2.56s/it][A
Training...:  48% 6667/13907 [4:18:58<5:06:50,  2.54s/it][A
Training...:  48% 6668/13907 [4:19:01<5:02:42,  2.51s/it][A
Training...:  48% 6669/13907 [4:19:03<4:57:31,  2.47s/it][A
Training...:  48% 6670/13907 [4:19:05<4:51:57,  2.42s/it][A
Training...:  48% 6671/13907 [4:19:07<4:46:08,  2.37s/it][A
Training...:  48% 6672/13907 [4:19:10<4:40:59,  2.33s/it][A
Training...:  48% 6673/13907 [4:19:12<4:36:28,  2.29s/it][A
Training...:  48% 6674/13907 [4:19:14<4:31:09,  2.25s/it][A
Training...:  48% 6675/13907 [4:19:16<4:26:28,  2.21s/it][A
Training...:  48% 6676/13907 [4:19:18<4:23:32,  2.19s/it][A
Training...:  48% 6677/13907 [4:19:20<4:19:21,  2.15s/it][A
Training...:  48% 6678/13907 [4:19:22<4:15:23,  2.12s/it][A
Training...:  48% 6679/13907 [4:19:24<4:11:33,  2.09s/it][A
Training...:  48% 6680/13907 [4:19:26<4:08:11,  2.06s/it][A
Training...:  48% 6681/13907 [4:19:28<4:05:02,  2.03s/it][A
Training...:  48% 6682/13907 [4:19:30<4:01:52,  2.01s/it][A
Training...:  48% 6683/13907 [4:19:32<3:58:21,  1.98s/it][A
Training...:  48% 6684/13907 [4:19:34<3:54:59,  1.95s/it][A
Training...:  48% 6685/13907 [4:19:36<3:51:56,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:49:49<17:31:07, 31533.87s/it]
Training...:  48% 6685/13907 [4:19:38<3:51:56,  1.93s/it][A
Training...:  48% 6686/13907 [4:19:38<3:59:21,  1.99s/it][A
Training...:  48% 6687/13907 [4:19:40<3:55:04,  1.95s/it][A
Training...:  48% 6688/13907 [4:19:42<3:48:17,  1.90s/it][A
Training...:  48% 6689/13907 [4:19:44<3:42:16,  1.85s/it][A
Training...:  48% 6690/13907 [4:19:45<3:37:06,  1.80s/it][A
Training...:  48% 6691/13907 [4:19:47<3:33:39,  1.78s/it][A
Training...:  48% 6692/13907 [4:19:49<3:29:28,  1.74s/it][A
Training...:  48% 6693/13907 [4:19:50<3:23:44,  1.69s/it][A
Training...:  48% 6694/13907 [4:19:52<3:18:28,  1.65s/it][A
Training...:  48% 6695/13907 [4:19:53<3:12:24,  1.60s/it][A
Training...:  48% 6696/13907 [4:19:55<3:06:55,  1.56s/it][A
Training...:  48% 6697/13907 [4:19:56<3:00:33,  1.50s/it][A
Training...:  48% 6698/13907 [4:19:57<2:53:38,  1.45s/it][A
Training...:  48% 6699/13907 [4:19:59<2:45:22,  1.38s/it][A
Training...:  48% 6700/13907 [4:20:00<2:33:16,  1.28s/it][A
Training...:  48% 6701/13907 [4:20:03<4:06:16,  2.05s/it][A
Training...:  48% 6702/13907 [4:20:07<4:57:14,  2.48s/it][A
Training...:  48% 6703/13907 [4:20:10<5:28:37,  2.74s/it][A
Training...:  48% 6704/13907 [4:20:13<5:42:28,  2.85s/it][A
Training...:  48% 6705/13907 [4:20:16<5:48:50,  2.91s/it][A
Training...:  48% 6706/13907 [4:20:19<5:49:38,  2.91s/it][A
Training...:  48% 6707/13907 [4:20:22<5:47:43,  2.90s/it][A
Training...:  48% 6708/13907 [4:20:25<5:44:47,  2.87s/it][A
Training...:  48% 6709/13907 [4:20:28<5:40:03,  2.83s/it][A
Training...:  48% 6710/13907 [4:20:31<5:36:07,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:50:45<17:31:07, 31533.87s/it]
Training...:  48% 6710/13907 [4:20:34<5:36:07,  2.80s/it][A
Training...:  48% 6711/13907 [4:20:34<5:46:16,  2.89s/it][A
Training...:  48% 6712/13907 [4:20:36<5:38:41,  2.82s/it][A
Training...:  48% 6713/13907 [4:20:39<5:29:33,  2.75s/it][A
Training...:  48% 6714/13907 [4:20:41<5:20:49,  2.68s/it][A
Training...:  48% 6715/13907 [4:20:44<5:14:26,  2.62s/it][A
Training...:  48% 6716/13907 [4:20:46<5:08:53,  2.58s/it][A
Training...:  48% 6717/13907 [4:20:49<5:04:20,  2.54s/it][A
Training...:  48% 6718/13907 [4:20:51<4:59:32,  2.50s/it][A
Training...:  48% 6719/13907 [4:20:54<4:56:07,  2.47s/it][A
Training...:  48% 6720/13907 [4:20:56<4:51:48,  2.44s/it][A
Training...:  48% 6721/13907 [4:20:58<4:48:13,  2.41s/it][A
Training...:  48% 6722/13907 [4:21:01<4:44:59,  2.38s/it][A
Training...:  48% 6723/13907 [4:21:03<4:40:41,  2.34s/it][A
Training...:  48% 6724/13907 [4:21:05<4:35:58,  2.31s/it][A
Training...:  48% 6725/13907 [4:21:07<4:32:23,  2.28s/it][A
Training...:  48% 6726/13907 [4:21:09<4:28:14,  2.24s/it][A
Training...:  48% 6727/13907 [4:21:12<4:24:26,  2.21s/it][A
Training...:  48% 6728/13907 [4:21:14<4:20:43,  2.18s/it][A
Training...:  48% 6729/13907 [4:21:16<4:18:09,  2.16s/it][A
Training...:  48% 6730/13907 [4:21:18<4:14:51,  2.13s/it][A
Training...:  48% 6731/13907 [4:21:20<4:11:05,  2.10s/it][A
Training...:  48% 6732/13907 [4:21:22<4:07:21,  2.07s/it][A
Training...:  48% 6733/13907 [4:21:24<4:03:04,  2.03s/it][A
Training...:  48% 6734/13907 [4:21:26<3:58:52,  2.00s/it][A
Training...:  48% 6735/13907 [4:21:28<3:55:17,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:51:41<17:31:07, 31533.87s/it]
Training...:  48% 6735/13907 [4:21:30<3:55:17,  1.97s/it][A
Training...:  48% 6736/13907 [4:21:30<4:02:53,  2.03s/it][A
Training...:  48% 6737/13907 [4:21:32<3:58:54,  2.00s/it][A
Training...:  48% 6738/13907 [4:21:34<3:51:15,  1.94s/it][A
Training...:  48% 6739/13907 [4:21:35<3:44:20,  1.88s/it][A
Training...:  48% 6740/13907 [4:21:37<3:38:27,  1.83s/it][A
Training...:  48% 6741/13907 [4:21:39<3:34:29,  1.80s/it][A
Training...:  48% 6742/13907 [4:21:40<3:29:08,  1.75s/it][A
Training...:  48% 6743/13907 [4:21:42<3:24:43,  1.71s/it][A
Training...:  48% 6744/13907 [4:21:44<3:19:16,  1.67s/it][A
Training...:  49% 6745/13907 [4:21:45<3:13:56,  1.62s/it][A
Training...:  49% 6746/13907 [4:21:47<3:08:41,  1.58s/it][A
Training...:  49% 6747/13907 [4:21:48<3:02:57,  1.53s/it][A
Training...:  49% 6748/13907 [4:21:49<2:56:25,  1.48s/it][A
Training...:  49% 6749/13907 [4:21:51<2:48:58,  1.42s/it][A
Training...:  49% 6750/13907 [4:21:52<2:37:54,  1.32s/it][A
Training...:  49% 6751/13907 [4:21:56<4:06:22,  2.07s/it][A
Training...:  49% 6752/13907 [4:21:59<4:57:08,  2.49s/it][A
Training...:  49% 6753/13907 [4:22:02<5:27:07,  2.74s/it][A
Training...:  49% 6754/13907 [4:22:06<5:43:14,  2.88s/it][A
Training...:  49% 6755/13907 [4:22:09<5:52:27,  2.96s/it][A
Training...:  49% 6756/13907 [4:22:12<5:54:48,  2.98s/it][A
Training...:  49% 6757/13907 [4:22:15<5:54:06,  2.97s/it][A
Training...:  49% 6758/13907 [4:22:18<5:51:06,  2.95s/it][A
Training...:  49% 6759/13907 [4:22:20<5:47:47,  2.92s/it][A
Training...:  49% 6760/13907 [4:22:23<5:42:03,  2.87s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:52:37<17:31:07, 31533.87s/it]
Training...:  49% 6760/13907 [4:22:26<5:42:03,  2.87s/it][A
Training...:  49% 6761/13907 [4:22:26<5:50:12,  2.94s/it][A
Training...:  49% 6762/13907 [4:22:29<5:41:25,  2.87s/it][A
Training...:  49% 6763/13907 [4:22:32<5:30:27,  2.78s/it][A
Training...:  49% 6764/13907 [4:22:34<5:22:55,  2.71s/it][A
Training...:  49% 6765/13907 [4:22:37<5:15:01,  2.65s/it][A
Training...:  49% 6766/13907 [4:22:39<5:11:19,  2.62s/it][A
Training...:  49% 6767/13907 [4:22:42<5:03:51,  2.55s/it][A
Training...:  49% 6768/13907 [4:22:44<4:57:21,  2.50s/it][A
Training...:  49% 6769/13907 [4:22:46<4:52:01,  2.45s/it][A
Training...:  49% 6770/13907 [4:22:49<4:46:38,  2.41s/it][A
Training...:  49% 6771/13907 [4:22:51<4:42:19,  2.37s/it][A
Training...:  49% 6772/13907 [4:22:53<4:37:16,  2.33s/it][A
Training...:  49% 6773/13907 [4:22:55<4:33:09,  2.30s/it][A
Training...:  49% 6774/13907 [4:22:57<4:29:02,  2.26s/it][A
Training...:  49% 6775/13907 [4:23:00<4:25:17,  2.23s/it][A
Training...:  49% 6776/13907 [4:23:02<4:20:40,  2.19s/it][A
Training...:  49% 6777/13907 [4:23:04<4:17:20,  2.17s/it][A
Training...:  49% 6778/13907 [4:23:06<4:14:35,  2.14s/it][A
Training...:  49% 6779/13907 [4:23:08<4:12:03,  2.12s/it][A
Training...:  49% 6780/13907 [4:23:10<4:08:21,  2.09s/it][A
Training...:  49% 6781/13907 [4:23:12<4:04:53,  2.06s/it][A
Training...:  49% 6782/13907 [4:23:14<4:01:11,  2.03s/it][A
Training...:  49% 6783/13907 [4:23:16<3:56:25,  1.99s/it][A
Training...:  49% 6784/13907 [4:23:18<3:52:38,  1.96s/it][A
Training...:  49% 6785/13907 [4:23:20<3:48:44,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:53:33<17:31:07, 31533.87s/it]
Training...:  49% 6785/13907 [4:23:22<3:48:44,  1.93s/it][A
Training...:  49% 6786/13907 [4:23:22<3:55:52,  1.99s/it][A
Training...:  49% 6787/13907 [4:23:24<3:52:08,  1.96s/it][A
Training...:  49% 6788/13907 [4:23:25<3:45:24,  1.90s/it][A
Training...:  49% 6789/13907 [4:23:27<3:39:10,  1.85s/it][A
Training...:  49% 6790/13907 [4:23:29<3:33:30,  1.80s/it][A
Training...:  49% 6791/13907 [4:23:30<3:28:43,  1.76s/it][A
Training...:  49% 6792/13907 [4:23:32<3:24:06,  1.72s/it][A
Training...:  49% 6793/13907 [4:23:34<3:20:35,  1.69s/it][A
Training...:  49% 6794/13907 [4:23:35<3:17:53,  1.67s/it][A
Training...:  49% 6795/13907 [4:23:37<3:13:36,  1.63s/it][A
Training...:  49% 6796/13907 [4:23:38<3:06:54,  1.58s/it][A
Training...:  49% 6797/13907 [4:23:40<3:00:07,  1.52s/it][A
Training...:  49% 6798/13907 [4:23:41<2:52:38,  1.46s/it][A
Training...:  49% 6799/13907 [4:23:42<2:44:20,  1.39s/it][A
Training...:  49% 6800/13907 [4:23:43<2:31:45,  1.28s/it][A
Training...:  49% 6801/13907 [4:23:47<3:59:35,  2.02s/it][A
Training...:  49% 6802/13907 [4:23:51<4:51:53,  2.46s/it][A
Training...:  49% 6803/13907 [4:23:54<5:23:18,  2.73s/it][A
Training...:  49% 6804/13907 [4:23:57<5:40:26,  2.88s/it][A
Training...:  49% 6805/13907 [4:24:00<5:49:37,  2.95s/it][A
Training...:  49% 6806/13907 [4:24:03<5:50:26,  2.96s/it][A
Training...:  49% 6807/13907 [4:24:06<5:48:58,  2.95s/it][A
Training...:  49% 6808/13907 [4:24:09<5:45:05,  2.92s/it][A
Training...:  49% 6809/13907 [4:24:12<5:40:37,  2.88s/it][A
Training...:  49% 6810/13907 [4:24:14<5:33:51,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:54:29<17:31:07, 31533.87s/it]
Training...:  49% 6810/13907 [4:24:18<5:33:51,  2.82s/it][A
Training...:  49% 6811/13907 [4:24:18<5:42:45,  2.90s/it][A
Training...:  49% 6812/13907 [4:24:20<5:35:15,  2.84s/it][A
Training...:  49% 6813/13907 [4:24:23<5:25:08,  2.75s/it][A
Training...:  49% 6814/13907 [4:24:25<5:17:46,  2.69s/it][A
Training...:  49% 6815/13907 [4:24:28<5:11:45,  2.64s/it][A
Training...:  49% 6816/13907 [4:24:30<5:05:58,  2.59s/it][A
Training...:  49% 6817/13907 [4:24:33<5:01:17,  2.55s/it][A
Training...:  49% 6818/13907 [4:24:35<4:55:47,  2.50s/it][A
Training...:  49% 6819/13907 [4:24:38<4:51:21,  2.47s/it][A
Training...:  49% 6820/13907 [4:24:40<4:46:55,  2.43s/it][A
Training...:  49% 6821/13907 [4:24:42<4:44:28,  2.41s/it][A
Training...:  49% 6822/13907 [4:24:45<4:41:44,  2.39s/it][A
Training...:  49% 6823/13907 [4:24:47<4:37:51,  2.35s/it][A
Training...:  49% 6824/13907 [4:24:49<4:32:06,  2.31s/it][A
Training...:  49% 6825/13907 [4:24:51<4:29:11,  2.28s/it][A
Training...:  49% 6826/13907 [4:24:53<4:25:02,  2.25s/it][A
Training...:  49% 6827/13907 [4:24:56<4:21:31,  2.22s/it][A
Training...:  49% 6828/13907 [4:24:58<4:16:55,  2.18s/it][A
Training...:  49% 6829/13907 [4:25:00<4:13:18,  2.15s/it][A
Training...:  49% 6830/13907 [4:25:02<4:10:48,  2.13s/it][A
Training...:  49% 6831/13907 [4:25:04<4:08:29,  2.11s/it][A
Training...:  49% 6832/13907 [4:25:06<4:04:59,  2.08s/it][A
Training...:  49% 6833/13907 [4:25:08<4:01:41,  2.05s/it][A
Training...:  49% 6834/13907 [4:25:10<3:56:01,  2.00s/it][A
Training...:  49% 6835/13907 [4:25:12<3:51:56,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:55:25<17:31:07, 31533.87s/it]
Training...:  49% 6835/13907 [4:25:14<3:51:56,  1.97s/it][A
Training...:  49% 6836/13907 [4:25:14<3:58:57,  2.03s/it][A
Training...:  49% 6837/13907 [4:25:16<3:53:45,  1.98s/it][A
Training...:  49% 6838/13907 [4:25:17<3:46:39,  1.92s/it][A
Training...:  49% 6839/13907 [4:25:19<3:40:19,  1.87s/it][A
Training...:  49% 6840/13907 [4:25:21<3:33:29,  1.81s/it][A
Training...:  49% 6841/13907 [4:25:23<3:28:01,  1.77s/it][A
Training...:  49% 6842/13907 [4:25:24<3:22:21,  1.72s/it][A
Training...:  49% 6843/13907 [4:25:26<3:17:22,  1.68s/it][A
Training...:  49% 6844/13907 [4:25:27<3:14:03,  1.65s/it][A
Training...:  49% 6845/13907 [4:25:29<3:08:24,  1.60s/it][A
Training...:  49% 6846/13907 [4:25:30<3:02:54,  1.55s/it][A
Training...:  49% 6847/13907 [4:25:32<2:56:31,  1.50s/it][A
Training...:  49% 6848/13907 [4:25:33<2:49:33,  1.44s/it][A
Training...:  49% 6849/13907 [4:25:34<2:40:46,  1.37s/it][A
Training...:  49% 6850/13907 [4:25:35<2:28:30,  1.26s/it][A
Training...:  49% 6851/13907 [4:25:39<3:59:35,  2.04s/it][A
Training...:  49% 6852/13907 [4:25:42<4:49:11,  2.46s/it][A
Training...:  49% 6853/13907 [4:25:46<5:16:06,  2.69s/it][A
Training...:  49% 6854/13907 [4:25:49<5:30:35,  2.81s/it][A
Training...:  49% 6855/13907 [4:25:52<5:37:40,  2.87s/it][A
Training...:  49% 6856/13907 [4:25:55<5:39:34,  2.89s/it][A
Training...:  49% 6857/13907 [4:25:58<5:38:22,  2.88s/it][A
Training...:  49% 6858/13907 [4:26:00<5:35:04,  2.85s/it][A
Training...:  49% 6859/13907 [4:26:03<5:30:27,  2.81s/it][A
Training...:  49% 6860/13907 [4:26:06<5:26:19,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:56:20<17:31:07, 31533.87s/it]
Training...:  49% 6860/13907 [4:26:09<5:26:19,  2.78s/it][A
Training...:  49% 6861/13907 [4:26:09<5:36:36,  2.87s/it][A
Training...:  49% 6862/13907 [4:26:12<5:29:26,  2.81s/it][A
Training...:  49% 6863/13907 [4:26:14<5:21:23,  2.74s/it][A
Training...:  49% 6864/13907 [4:26:17<5:13:42,  2.67s/it][A
Training...:  49% 6865/13907 [4:26:19<5:07:48,  2.62s/it][A
Training...:  49% 6866/13907 [4:26:22<5:02:27,  2.58s/it][A
Training...:  49% 6867/13907 [4:26:24<4:56:53,  2.53s/it][A
Training...:  49% 6868/13907 [4:26:26<4:54:20,  2.51s/it][A
Training...:  49% 6869/13907 [4:26:29<4:50:58,  2.48s/it][A
Training...:  49% 6870/13907 [4:26:31<4:46:51,  2.45s/it][A
Training...:  49% 6871/13907 [4:26:34<4:43:22,  2.42s/it][A
Training...:  49% 6872/13907 [4:26:36<4:38:49,  2.38s/it][A
Training...:  49% 6873/13907 [4:26:38<4:34:53,  2.34s/it][A
Training...:  49% 6874/13907 [4:26:40<4:30:48,  2.31s/it][A
Training...:  49% 6875/13907 [4:26:43<4:27:54,  2.29s/it][A
Training...:  49% 6876/13907 [4:26:45<4:23:05,  2.25s/it][A
Training...:  49% 6877/13907 [4:26:47<4:19:48,  2.22s/it][A
Training...:  49% 6878/13907 [4:26:49<4:15:48,  2.18s/it][A
Training...:  49% 6879/13907 [4:26:51<4:11:49,  2.15s/it][A
Training...:  49% 6880/13907 [4:26:53<4:07:53,  2.12s/it][A
Training...:  49% 6881/13907 [4:26:55<4:04:27,  2.09s/it][A
Training...:  49% 6882/13907 [4:26:57<4:00:35,  2.05s/it][A
Training...:  49% 6883/13907 [4:26:59<3:57:21,  2.03s/it][A
Training...:  50% 6884/13907 [4:27:01<3:53:32,  2.00s/it][A
Training...:  50% 6885/13907 [4:27:03<3:49:44,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:57:16<17:31:07, 31533.87s/it]
Training...:  50% 6885/13907 [4:27:05<3:49:44,  1.96s/it][A
Training...:  50% 6886/13907 [4:27:05<3:56:19,  2.02s/it][A
Training...:  50% 6887/13907 [4:27:07<3:51:35,  1.98s/it][A
Training...:  50% 6888/13907 [4:27:09<3:45:21,  1.93s/it][A
Training...:  50% 6889/13907 [4:27:11<3:40:47,  1.89s/it][A
Training...:  50% 6890/13907 [4:27:12<3:35:04,  1.84s/it][A
Training...:  50% 6891/13907 [4:27:14<3:30:32,  1.80s/it][A
Training...:  50% 6892/13907 [4:27:16<3:26:43,  1.77s/it][A
Training...:  50% 6893/13907 [4:27:17<3:22:26,  1.73s/it][A
Training...:  50% 6894/13907 [4:27:19<3:18:23,  1.70s/it][A
Training...:  50% 6895/13907 [4:27:20<3:11:36,  1.64s/it][A
Training...:  50% 6896/13907 [4:27:22<3:05:31,  1.59s/it][A
Training...:  50% 6897/13907 [4:27:23<2:58:33,  1.53s/it][A
Training...:  50% 6898/13907 [4:27:25<2:51:14,  1.47s/it][A
Training...:  50% 6899/13907 [4:27:26<2:43:05,  1.40s/it][A
Training...:  50% 6900/13907 [4:27:27<2:32:25,  1.31s/it][A
Training...:  50% 6901/13907 [4:27:31<3:58:04,  2.04s/it][A
Training...:  50% 6902/13907 [4:27:34<4:51:22,  2.50s/it][A
Training...:  50% 6903/13907 [4:27:38<5:18:12,  2.73s/it][A
Training...:  50% 6904/13907 [4:27:41<5:31:57,  2.84s/it][A
Training...:  50% 6905/13907 [4:27:44<5:38:05,  2.90s/it][A
Training...:  50% 6906/13907 [4:27:47<5:38:59,  2.91s/it][A
Training...:  50% 6907/13907 [4:27:49<5:35:59,  2.88s/it][A
Training...:  50% 6908/13907 [4:27:52<5:32:24,  2.85s/it][A
Training...:  50% 6909/13907 [4:27:55<5:27:55,  2.81s/it][A
Training...:  50% 6910/13907 [4:27:58<5:23:52,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:58:12<17:31:07, 31533.87s/it]
Training...:  50% 6910/13907 [4:28:01<5:23:52,  2.78s/it][A
Training...:  50% 6911/13907 [4:28:01<5:32:29,  2.85s/it][A
Training...:  50% 6912/13907 [4:28:03<5:25:38,  2.79s/it][A
Training...:  50% 6913/13907 [4:28:06<5:16:11,  2.71s/it][A
Training...:  50% 6914/13907 [4:28:08<5:09:05,  2.65s/it][A
Training...:  50% 6915/13907 [4:28:11<5:03:00,  2.60s/it][A
Training...:  50% 6916/13907 [4:28:13<4:57:04,  2.55s/it][A
Training...:  50% 6917/13907 [4:28:16<4:53:07,  2.52s/it][A
Training...:  50% 6918/13907 [4:28:18<4:48:23,  2.48s/it][A
Training...:  50% 6919/13907 [4:28:20<4:44:25,  2.44s/it][A
Training...:  50% 6920/13907 [4:28:23<4:41:14,  2.42s/it][A
Training...:  50% 6921/13907 [4:28:25<4:36:52,  2.38s/it][A
Training...:  50% 6922/13907 [4:28:27<4:33:07,  2.35s/it][A
Training...:  50% 6923/13907 [4:28:30<4:30:53,  2.33s/it][A
Training...:  50% 6924/13907 [4:28:32<4:28:18,  2.31s/it][A
Training...:  50% 6925/13907 [4:28:34<4:24:45,  2.28s/it][A
Training...:  50% 6926/13907 [4:28:36<4:20:34,  2.24s/it][A
Training...:  50% 6927/13907 [4:28:38<4:15:48,  2.20s/it][A
Training...:  50% 6928/13907 [4:28:40<4:11:52,  2.17s/it][A
Training...:  50% 6929/13907 [4:28:42<4:07:03,  2.12s/it][A
Training...:  50% 6930/13907 [4:28:44<4:03:17,  2.09s/it][A
Training...:  50% 6931/13907 [4:28:46<3:59:41,  2.06s/it][A
Training...:  50% 6932/13907 [4:28:48<3:57:04,  2.04s/it][A
Training...:  50% 6933/13907 [4:28:50<3:53:11,  2.01s/it][A
Training...:  50% 6934/13907 [4:28:52<3:50:35,  1.98s/it][A
Training...:  50% 6935/13907 [4:28:54<3:48:12,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [21:59:07<17:31:07, 31533.87s/it]
Training...:  50% 6935/13907 [4:28:56<3:48:12,  1.96s/it][A
Training...:  50% 6936/13907 [4:28:56<3:56:11,  2.03s/it][A
Training...:  50% 6937/13907 [4:28:58<3:50:56,  1.99s/it][A
Training...:  50% 6938/13907 [4:29:00<3:43:16,  1.92s/it][A
Training...:  50% 6939/13907 [4:29:02<3:36:25,  1.86s/it][A
Training...:  50% 6940/13907 [4:29:03<3:30:10,  1.81s/it][A
Training...:  50% 6941/13907 [4:29:05<3:25:39,  1.77s/it][A
Training...:  50% 6942/13907 [4:29:07<3:20:20,  1.73s/it][A
Training...:  50% 6943/13907 [4:29:08<3:15:24,  1.68s/it][A
Training...:  50% 6944/13907 [4:29:10<3:11:44,  1.65s/it][A
Training...:  50% 6945/13907 [4:29:11<3:07:05,  1.61s/it][A
Training...:  50% 6946/13907 [4:29:13<3:01:27,  1.56s/it][A
Training...:  50% 6947/13907 [4:29:14<2:55:36,  1.51s/it][A
Training...:  50% 6948/13907 [4:29:16<2:48:26,  1.45s/it][A
Training...:  50% 6949/13907 [4:29:17<2:40:38,  1.39s/it][A
Training...:  50% 6950/13907 [4:29:18<2:28:02,  1.28s/it][A
Training...:  50% 6951/13907 [4:29:22<3:53:35,  2.01s/it][A
Training...:  50% 6952/13907 [4:29:25<4:44:38,  2.46s/it][A
Training...:  50% 6953/13907 [4:29:28<5:12:00,  2.69s/it][A
Training...:  50% 6954/13907 [4:29:31<5:23:55,  2.80s/it][A
Training...:  50% 6955/13907 [4:29:34<5:30:04,  2.85s/it][A
Training...:  50% 6956/13907 [4:29:37<5:31:00,  2.86s/it][A
Training...:  50% 6957/13907 [4:29:40<5:31:03,  2.86s/it][A
Training...:  50% 6958/13907 [4:29:43<5:28:55,  2.84s/it][A
Training...:  50% 6959/13907 [4:29:46<5:24:41,  2.80s/it][A
Training...:  50% 6960/13907 [4:29:48<5:19:55,  2.76s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:00:02<17:31:07, 31533.87s/it]
Training...:  50% 6960/13907 [4:29:51<5:19:55,  2.76s/it][A
Training...:  50% 6961/13907 [4:29:51<5:29:30,  2.85s/it][A
Training...:  50% 6962/13907 [4:29:54<5:22:33,  2.79s/it][A
Training...:  50% 6963/13907 [4:29:57<5:14:46,  2.72s/it][A
Training...:  50% 6964/13907 [4:29:59<5:06:32,  2.65s/it][A
Training...:  50% 6965/13907 [4:30:01<5:00:23,  2.60s/it][A
Training...:  50% 6966/13907 [4:30:04<4:54:23,  2.54s/it][A
Training...:  50% 6967/13907 [4:30:06<4:49:50,  2.51s/it][A
Training...:  50% 6968/13907 [4:30:09<4:45:57,  2.47s/it][A
Training...:  50% 6969/13907 [4:30:11<4:41:58,  2.44s/it][A
Training...:  50% 6970/13907 [4:30:13<4:37:46,  2.40s/it][A
Training...:  50% 6971/13907 [4:30:16<4:34:21,  2.37s/it][A
Training...:  50% 6972/13907 [4:30:18<4:30:14,  2.34s/it][A
Training...:  50% 6973/13907 [4:30:20<4:26:03,  2.30s/it][A
Training...:  50% 6974/13907 [4:30:22<4:22:09,  2.27s/it][A
Training...:  50% 6975/13907 [4:30:25<4:17:58,  2.23s/it][A
Training...:  50% 6976/13907 [4:30:27<4:15:37,  2.21s/it][A
Training...:  50% 6977/13907 [4:30:29<4:11:39,  2.18s/it][A
Training...:  50% 6978/13907 [4:30:31<4:08:20,  2.15s/it][A
Training...:  50% 6979/13907 [4:30:33<4:05:26,  2.13s/it][A
Training...:  50% 6980/13907 [4:30:35<4:01:46,  2.09s/it][A
Training...:  50% 6981/13907 [4:30:37<3:58:01,  2.06s/it][A
Training...:  50% 6982/13907 [4:30:39<3:53:46,  2.03s/it][A
Training...:  50% 6983/13907 [4:30:41<3:50:23,  2.00s/it][A
Training...:  50% 6984/13907 [4:30:43<3:46:45,  1.97s/it][A
Training...:  50% 6985/13907 [4:30:45<3:43:18,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:00:58<17:31:07, 31533.87s/it]
Training...:  50% 6985/13907 [4:30:47<3:43:18,  1.94s/it][A
Training...:  50% 6986/13907 [4:30:47<3:50:23,  2.00s/it][A
Training...:  50% 6987/13907 [4:30:49<3:45:57,  1.96s/it][A
Training...:  50% 6988/13907 [4:30:50<3:39:11,  1.90s/it][A
Training...:  50% 6989/13907 [4:30:52<3:34:10,  1.86s/it][A
Training...:  50% 6990/13907 [4:30:54<3:28:34,  1.81s/it][A
Training...:  50% 6991/13907 [4:30:55<3:23:26,  1.76s/it][A
Training...:  50% 6992/13907 [4:30:57<3:18:38,  1.72s/it][A
Training...:  50% 6993/13907 [4:30:59<3:14:09,  1.68s/it][A
Training...:  50% 6994/13907 [4:31:00<3:10:03,  1.65s/it][A
Training...:  50% 6995/13907 [4:31:02<3:04:53,  1.60s/it][A
Training...:  50% 6996/13907 [4:31:03<2:59:34,  1.56s/it][A
Training...:  50% 6997/13907 [4:31:05<2:53:06,  1.50s/it][A
Training...:  50% 6998/13907 [4:31:06<2:46:01,  1.44s/it][A
Training...:  50% 6999/13907 [4:31:07<2:38:34,  1.38s/it][A
Training...:  50% 7000/13907 [4:31:08<2:26:34,  1.27s/it][A
Training...:  50% 7001/13907 [4:31:12<3:53:44,  2.03s/it][A
Training...:  50% 7002/13907 [4:31:16<4:48:07,  2.50s/it][A
Training...:  50% 7003/13907 [4:31:19<5:17:22,  2.76s/it][A
Training...:  50% 7004/13907 [4:31:22<5:32:05,  2.89s/it][A
Training...:  50% 7005/13907 [4:31:25<5:39:23,  2.95s/it][A
Training...:  50% 7006/13907 [4:31:28<5:39:26,  2.95s/it][A
Training...:  50% 7007/13907 [4:31:31<5:38:25,  2.94s/it][A
Training...:  50% 7008/13907 [4:31:34<5:34:45,  2.91s/it][A
Training...:  50% 7009/13907 [4:31:37<5:29:42,  2.87s/it][A
Training...:  50% 7010/13907 [4:31:39<5:25:25,  2.83s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:01:54<17:31:07, 31533.87s/it]
Training...:  50% 7010/13907 [4:31:43<5:25:25,  2.83s/it][A
Training...:  50% 7011/13907 [4:31:43<5:35:01,  2.91s/it][A
Training...:  50% 7012/13907 [4:31:45<5:28:19,  2.86s/it][A
Training...:  50% 7013/13907 [4:31:48<5:19:20,  2.78s/it][A
Training...:  50% 7014/13907 [4:31:50<5:10:26,  2.70s/it][A
Training...:  50% 7015/13907 [4:31:53<5:05:55,  2.66s/it][A
Training...:  50% 7016/13907 [4:31:55<4:59:18,  2.61s/it][A
Training...:  50% 7017/13907 [4:31:58<4:53:35,  2.56s/it][A
Training...:  50% 7018/13907 [4:32:00<4:47:50,  2.51s/it][A
Training...:  50% 7019/13907 [4:32:03<4:43:11,  2.47s/it][A
Training...:  50% 7020/13907 [4:32:05<4:38:55,  2.43s/it][A
Training...:  50% 7021/13907 [4:32:07<4:35:05,  2.40s/it][A
Training...:  50% 7022/13907 [4:32:10<4:31:19,  2.36s/it][A
Training...:  50% 7023/13907 [4:32:12<4:27:46,  2.33s/it][A
Training...:  51% 7024/13907 [4:32:14<4:24:27,  2.31s/it][A
Training...:  51% 7025/13907 [4:32:16<4:20:32,  2.27s/it][A
Training...:  51% 7026/13907 [4:32:18<4:16:00,  2.23s/it][A
Training...:  51% 7027/13907 [4:32:21<4:12:09,  2.20s/it][A
Training...:  51% 7028/13907 [4:32:23<4:09:24,  2.18s/it][A
Training...:  51% 7029/13907 [4:32:25<4:06:47,  2.15s/it][A
Training...:  51% 7030/13907 [4:32:27<4:03:17,  2.12s/it][A
Training...:  51% 7031/13907 [4:32:29<4:01:20,  2.11s/it][A
Training...:  51% 7032/13907 [4:32:31<3:59:01,  2.09s/it][A
Training...:  51% 7033/13907 [4:32:33<3:55:34,  2.06s/it][A
Training...:  51% 7034/13907 [4:32:35<3:51:15,  2.02s/it][A
Training...:  51% 7035/13907 [4:32:37<3:47:09,  1.98s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:02:50<17:31:07, 31533.87s/it]
Training...:  51% 7035/13907 [4:32:39<3:47:09,  1.98s/it][A
Training...:  51% 7036/13907 [4:32:39<3:52:30,  2.03s/it][A
Training...:  51% 7037/13907 [4:32:41<3:47:12,  1.98s/it][A
Training...:  51% 7038/13907 [4:32:43<3:40:01,  1.92s/it][A
Training...:  51% 7039/13907 [4:32:44<3:33:30,  1.87s/it][A
Training...:  51% 7040/13907 [4:32:46<3:28:49,  1.82s/it][A
Training...:  51% 7041/13907 [4:32:48<3:26:06,  1.80s/it][A
Training...:  51% 7042/13907 [4:32:49<3:22:07,  1.77s/it][A
Training...:  51% 7043/13907 [4:32:51<3:16:20,  1.72s/it][A
Training...:  51% 7044/13907 [4:32:53<3:11:11,  1.67s/it][A
Training...:  51% 7045/13907 [4:32:54<3:05:46,  1.62s/it][A
Training...:  51% 7046/13907 [4:32:56<2:59:55,  1.57s/it][A
Training...:  51% 7047/13907 [4:32:57<2:53:44,  1.52s/it][A
Training...:  51% 7048/13907 [4:32:58<2:46:35,  1.46s/it][A
Training...:  51% 7049/13907 [4:32:59<2:38:09,  1.38s/it][A
Training...:  51% 7050/13907 [4:33:01<2:27:09,  1.29s/it][A
Training...:  51% 7051/13907 [4:33:04<3:50:39,  2.02s/it][A
Training...:  51% 7052/13907 [4:33:08<4:40:45,  2.46s/it][A
Training...:  51% 7053/13907 [4:33:11<5:07:19,  2.69s/it][A
Training...:  51% 7054/13907 [4:33:14<5:22:26,  2.82s/it][A
Training...:  51% 7055/13907 [4:33:17<5:29:42,  2.89s/it][A
Training...:  51% 7056/13907 [4:33:20<5:30:05,  2.89s/it][A
Training...:  51% 7057/13907 [4:33:23<5:28:39,  2.88s/it][A
Training...:  51% 7058/13907 [4:33:26<5:25:08,  2.85s/it][A
Training...:  51% 7059/13907 [4:33:28<5:22:08,  2.82s/it][A
Training...:  51% 7060/13907 [4:33:31<5:17:40,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:03:45<17:31:07, 31533.87s/it]
Training...:  51% 7060/13907 [4:33:34<5:17:40,  2.78s/it][A
Training...:  51% 7061/13907 [4:33:34<5:26:48,  2.86s/it][A
Training...:  51% 7062/13907 [4:33:37<5:21:19,  2.82s/it][A
Training...:  51% 7063/13907 [4:33:40<5:16:28,  2.77s/it][A
Training...:  51% 7064/13907 [4:33:42<5:07:35,  2.70s/it][A
Training...:  51% 7065/13907 [4:33:45<4:59:23,  2.63s/it][A
Training...:  51% 7066/13907 [4:33:47<4:53:08,  2.57s/it][A
Training...:  51% 7067/13907 [4:33:49<4:48:03,  2.53s/it][A
Training...:  51% 7068/13907 [4:33:52<4:42:38,  2.48s/it][A
Training...:  51% 7069/13907 [4:33:54<4:38:15,  2.44s/it][A
Training...:  51% 7070/13907 [4:33:56<4:34:35,  2.41s/it][A
Training...:  51% 7071/13907 [4:33:59<4:30:29,  2.37s/it][A
Training...:  51% 7072/13907 [4:34:01<4:25:51,  2.33s/it][A
Training...:  51% 7073/13907 [4:34:03<4:21:43,  2.30s/it][A
Training...:  51% 7074/13907 [4:34:05<4:16:53,  2.26s/it][A
Training...:  51% 7075/13907 [4:34:07<4:13:15,  2.22s/it][A
Training...:  51% 7076/13907 [4:34:10<4:09:06,  2.19s/it][A
Training...:  51% 7077/13907 [4:34:12<4:05:37,  2.16s/it][A
Training...:  51% 7078/13907 [4:34:14<4:01:23,  2.12s/it][A
Training...:  51% 7079/13907 [4:34:16<3:58:15,  2.09s/it][A
Training...:  51% 7080/13907 [4:34:18<3:55:22,  2.07s/it][A
Training...:  51% 7081/13907 [4:34:20<3:52:56,  2.05s/it][A
Training...:  51% 7082/13907 [4:34:22<3:49:40,  2.02s/it][A
Training...:  51% 7083/13907 [4:34:24<3:46:38,  1.99s/it][A
Training...:  51% 7084/13907 [4:34:26<3:43:41,  1.97s/it][A
Training...:  51% 7085/13907 [4:34:27<3:41:39,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:04:41<17:31:07, 31533.87s/it]
Training...:  51% 7085/13907 [4:34:30<3:41:39,  1.95s/it][A
Training...:  51% 7086/13907 [4:34:30<3:48:43,  2.01s/it][A
Training...:  51% 7087/13907 [4:34:31<3:44:12,  1.97s/it][A
Training...:  51% 7088/13907 [4:34:33<3:37:36,  1.91s/it][A
Training...:  51% 7089/13907 [4:34:35<3:32:14,  1.87s/it][A
Training...:  51% 7090/13907 [4:34:37<3:28:54,  1.84s/it][A
Training...:  51% 7091/13907 [4:34:38<3:23:28,  1.79s/it][A
Training...:  51% 7092/13907 [4:34:40<3:18:37,  1.75s/it][A
Training...:  51% 7093/13907 [4:34:42<3:13:56,  1.71s/it][A
Training...:  51% 7094/13907 [4:34:43<3:09:44,  1.67s/it][A
Training...:  51% 7095/13907 [4:34:45<3:04:31,  1.63s/it][A
Training...:  51% 7096/13907 [4:34:46<2:58:37,  1.57s/it][A
Training...:  51% 7097/13907 [4:34:48<2:52:43,  1.52s/it][A
Training...:  51% 7098/13907 [4:34:49<2:46:16,  1.47s/it][A
Training...:  51% 7099/13907 [4:34:50<2:37:44,  1.39s/it][A
Training...:  51% 7100/13907 [4:34:51<2:25:52,  1.29s/it][A
Training...:  51% 7101/13907 [4:34:55<3:49:05,  2.02s/it][A
Training...:  51% 7102/13907 [4:34:58<4:38:03,  2.45s/it][A
Training...:  51% 7103/13907 [4:35:02<5:07:12,  2.71s/it][A
Training...:  51% 7104/13907 [4:35:05<5:22:43,  2.85s/it][A
Training...:  51% 7105/13907 [4:35:08<5:30:07,  2.91s/it][A
Training...:  51% 7106/13907 [4:35:11<5:31:07,  2.92s/it][A
Training...:  51% 7107/13907 [4:35:14<5:33:19,  2.94s/it][A
Training...:  51% 7108/13907 [4:35:17<5:32:05,  2.93s/it][A
Training...:  51% 7109/13907 [4:35:20<5:29:18,  2.91s/it][A
Training...:  51% 7110/13907 [4:35:22<5:24:48,  2.87s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:05:37<17:31:07, 31533.87s/it]
Training...:  51% 7110/13907 [4:35:26<5:24:48,  2.87s/it][A
Training...:  51% 7111/13907 [4:35:26<5:33:39,  2.95s/it][A
Training...:  51% 7112/13907 [4:35:28<5:25:03,  2.87s/it][A
Training...:  51% 7113/13907 [4:35:31<5:14:37,  2.78s/it][A
Training...:  51% 7114/13907 [4:35:33<5:05:14,  2.70s/it][A
Training...:  51% 7115/13907 [4:35:36<4:58:05,  2.63s/it][A
Training...:  51% 7116/13907 [4:35:38<4:52:26,  2.58s/it][A
Training...:  51% 7117/13907 [4:35:41<4:47:37,  2.54s/it][A
Training...:  51% 7118/13907 [4:35:43<4:41:34,  2.49s/it][A
Training...:  51% 7119/13907 [4:35:46<4:37:38,  2.45s/it][A
Training...:  51% 7120/13907 [4:35:48<4:33:52,  2.42s/it][A
Training...:  51% 7121/13907 [4:35:50<4:30:05,  2.39s/it][A
Training...:  51% 7122/13907 [4:35:52<4:26:33,  2.36s/it][A
Training...:  51% 7123/13907 [4:35:55<4:22:44,  2.32s/it][A
Training...:  51% 7124/13907 [4:35:57<4:18:39,  2.29s/it][A
Training...:  51% 7125/13907 [4:35:59<4:15:19,  2.26s/it][A
Training...:  51% 7126/13907 [4:36:01<4:11:22,  2.22s/it][A
Training...:  51% 7127/13907 [4:36:03<4:07:54,  2.19s/it][A
Training...:  51% 7128/13907 [4:36:05<4:04:09,  2.16s/it][A
Training...:  51% 7129/13907 [4:36:08<4:01:09,  2.13s/it][A
Training...:  51% 7130/13907 [4:36:10<3:58:11,  2.11s/it][A
Training...:  51% 7131/13907 [4:36:12<3:53:47,  2.07s/it][A
Training...:  51% 7132/13907 [4:36:14<3:50:41,  2.04s/it][A
Training...:  51% 7133/13907 [4:36:15<3:47:42,  2.02s/it][A
Training...:  51% 7134/13907 [4:36:17<3:44:03,  1.98s/it][A
Training...:  51% 7135/13907 [4:36:19<3:40:51,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:06:32<17:31:07, 31533.87s/it]
Training...:  51% 7135/13907 [4:36:21<3:40:51,  1.96s/it][A
Training...:  51% 7136/13907 [4:36:21<3:48:22,  2.02s/it][A
Training...:  51% 7137/13907 [4:36:23<3:43:56,  1.98s/it][A
Training...:  51% 7138/13907 [4:36:25<3:37:08,  1.92s/it][A
Training...:  51% 7139/13907 [4:36:27<3:30:55,  1.87s/it][A
Training...:  51% 7140/13907 [4:36:29<3:25:42,  1.82s/it][A
Training...:  51% 7141/13907 [4:36:30<3:22:09,  1.79s/it][A
Training...:  51% 7142/13907 [4:36:32<3:18:22,  1.76s/it][A
Training...:  51% 7143/13907 [4:36:34<3:16:23,  1.74s/it][A
Training...:  51% 7144/13907 [4:36:35<3:13:00,  1.71s/it][A
Training...:  51% 7145/13907 [4:36:37<3:07:58,  1.67s/it][A
Training...:  51% 7146/13907 [4:36:38<3:02:48,  1.62s/it][A
Training...:  51% 7147/13907 [4:36:40<2:56:37,  1.57s/it][A
Training...:  51% 7148/13907 [4:36:41<2:50:30,  1.51s/it][A
Training...:  51% 7149/13907 [4:36:43<2:42:00,  1.44s/it][A
Training...:  51% 7150/13907 [4:36:44<2:30:12,  1.33s/it][A
Training...:  51% 7151/13907 [4:36:47<3:52:06,  2.06s/it][A
Training...:  51% 7152/13907 [4:36:51<4:40:04,  2.49s/it][A
Training...:  51% 7153/13907 [4:36:54<5:06:05,  2.72s/it][A
Training...:  51% 7154/13907 [4:36:57<5:18:50,  2.83s/it][A
Training...:  51% 7155/13907 [4:37:00<5:24:45,  2.89s/it][A
Training...:  51% 7156/13907 [4:37:03<5:27:59,  2.92s/it][A
Training...:  51% 7157/13907 [4:37:06<5:26:53,  2.91s/it][A
Training...:  51% 7158/13907 [4:37:09<5:23:39,  2.88s/it][A
Training...:  51% 7159/13907 [4:37:12<5:19:00,  2.84s/it][A
Training...:  51% 7160/13907 [4:37:14<5:14:01,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:07:28<17:31:07, 31533.87s/it]
Training...:  51% 7160/13907 [4:37:17<5:14:01,  2.79s/it][A
Training...:  51% 7161/13907 [4:37:17<5:23:28,  2.88s/it][A
Training...:  51% 7162/13907 [4:37:20<5:16:40,  2.82s/it][A
Training...:  52% 7163/13907 [4:37:23<5:08:47,  2.75s/it][A
Training...:  52% 7164/13907 [4:37:25<5:01:17,  2.68s/it][A
Training...:  52% 7165/13907 [4:37:28<4:53:43,  2.61s/it][A
Training...:  52% 7166/13907 [4:37:30<4:48:59,  2.57s/it][A
Training...:  52% 7167/13907 [4:37:33<4:44:55,  2.54s/it][A
Training...:  52% 7168/13907 [4:37:35<4:39:10,  2.49s/it][A
Training...:  52% 7169/13907 [4:37:37<4:35:03,  2.45s/it][A
Training...:  52% 7170/13907 [4:37:40<4:31:18,  2.42s/it][A
Training...:  52% 7171/13907 [4:37:42<4:27:00,  2.38s/it][A
Training...:  52% 7172/13907 [4:37:44<4:24:05,  2.35s/it][A
Training...:  52% 7173/13907 [4:37:47<4:21:47,  2.33s/it][A
Training...:  52% 7174/13907 [4:37:49<4:18:11,  2.30s/it][A
Training...:  52% 7175/13907 [4:37:51<4:14:28,  2.27s/it][A
Training...:  52% 7176/13907 [4:37:53<4:10:21,  2.23s/it][A
Training...:  52% 7177/13907 [4:37:55<4:06:51,  2.20s/it][A
Training...:  52% 7178/13907 [4:37:57<4:03:01,  2.17s/it][A
Training...:  52% 7179/13907 [4:37:59<3:59:42,  2.14s/it][A
Training...:  52% 7180/13907 [4:38:01<3:55:46,  2.10s/it][A
Training...:  52% 7181/13907 [4:38:03<3:52:09,  2.07s/it][A
Training...:  52% 7182/13907 [4:38:05<3:49:03,  2.04s/it][A
Training...:  52% 7183/13907 [4:38:07<3:46:23,  2.02s/it][A
Training...:  52% 7184/13907 [4:38:09<3:42:51,  1.99s/it][A
Training...:  52% 7185/13907 [4:38:11<3:38:58,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:08:24<17:31:07, 31533.87s/it]
Training...:  52% 7185/13907 [4:38:13<3:38:58,  1.95s/it][A
Training...:  52% 7186/13907 [4:38:13<3:45:43,  2.02s/it][A
Training...:  52% 7187/13907 [4:38:15<3:41:31,  1.98s/it][A
Training...:  52% 7188/13907 [4:38:17<3:34:28,  1.92s/it][A
Training...:  52% 7189/13907 [4:38:19<3:29:03,  1.87s/it][A
Training...:  52% 7190/13907 [4:38:20<3:23:03,  1.81s/it][A
Training...:  52% 7191/13907 [4:38:22<3:17:45,  1.77s/it][A
Training...:  52% 7192/13907 [4:38:24<3:12:39,  1.72s/it][A
Training...:  52% 7193/13907 [4:38:25<3:07:10,  1.67s/it][A
Training...:  52% 7194/13907 [4:38:27<3:02:33,  1.63s/it][A
Training...:  52% 7195/13907 [4:38:28<2:57:14,  1.58s/it][A
Training...:  52% 7196/13907 [4:38:30<2:51:31,  1.53s/it][A
Training...:  52% 7197/13907 [4:38:31<2:45:38,  1.48s/it][A
Training...:  52% 7198/13907 [4:38:32<2:39:04,  1.42s/it][A
Training...:  52% 7199/13907 [4:38:33<2:31:30,  1.36s/it][A
Training...:  52% 7200/13907 [4:38:35<2:20:35,  1.26s/it][A
Training...:  52% 7201/13907 [4:38:38<3:37:30,  1.95s/it][A
Training...:  52% 7202/13907 [4:38:41<4:26:14,  2.38s/it][A
Training...:  52% 7203/13907 [4:38:45<4:54:16,  2.63s/it][A
Training...:  52% 7204/13907 [4:38:48<5:09:27,  2.77s/it][A
Training...:  52% 7205/13907 [4:38:51<5:17:46,  2.84s/it][A
Training...:  52% 7206/13907 [4:38:54<5:20:56,  2.87s/it][A
Training...:  52% 7207/13907 [4:38:57<5:21:22,  2.88s/it][A
Training...:  52% 7208/13907 [4:38:59<5:18:48,  2.86s/it][A
Training...:  52% 7209/13907 [4:39:02<5:17:07,  2.84s/it][A
Training...:  52% 7210/13907 [4:39:05<5:16:37,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:09:19<17:31:07, 31533.87s/it]
Training...:  52% 7210/13907 [4:39:08<5:16:37,  2.84s/it][A
Training...:  52% 7211/13907 [4:39:08<5:24:12,  2.91s/it][A
Training...:  52% 7212/13907 [4:39:11<5:17:18,  2.84s/it][A
Training...:  52% 7213/13907 [4:39:13<5:08:19,  2.76s/it][A
Training...:  52% 7214/13907 [4:39:16<5:01:58,  2.71s/it][A
Training...:  52% 7215/13907 [4:39:18<4:54:49,  2.64s/it][A
Training...:  52% 7216/13907 [4:39:21<4:47:41,  2.58s/it][A
Training...:  52% 7217/13907 [4:39:23<4:42:19,  2.53s/it][A
Training...:  52% 7218/13907 [4:39:26<4:37:56,  2.49s/it][A
Training...:  52% 7219/13907 [4:39:28<4:33:17,  2.45s/it][A
Training...:  52% 7220/13907 [4:39:30<4:28:09,  2.41s/it][A
Training...:  52% 7221/13907 [4:39:33<4:25:01,  2.38s/it][A
Training...:  52% 7222/13907 [4:39:35<4:20:57,  2.34s/it][A
Training...:  52% 7223/13907 [4:39:37<4:17:55,  2.32s/it][A
Training...:  52% 7224/13907 [4:39:39<4:13:35,  2.28s/it][A
Training...:  52% 7225/13907 [4:39:42<4:10:47,  2.25s/it][A
Training...:  52% 7226/13907 [4:39:44<4:07:26,  2.22s/it][A
Training...:  52% 7227/13907 [4:39:46<4:04:14,  2.19s/it][A
Training...:  52% 7228/13907 [4:39:48<4:00:53,  2.16s/it][A
Training...:  52% 7229/13907 [4:39:50<3:57:24,  2.13s/it][A
Training...:  52% 7230/13907 [4:39:52<3:54:08,  2.10s/it][A
Training...:  52% 7231/13907 [4:39:54<3:50:57,  2.08s/it][A
Training...:  52% 7232/13907 [4:39:56<3:49:09,  2.06s/it][A
Training...:  52% 7233/13907 [4:39:58<3:45:06,  2.02s/it][A
Training...:  52% 7234/13907 [4:40:00<3:41:43,  1.99s/it][A
Training...:  52% 7235/13907 [4:40:02<3:38:11,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:10:15<17:31:07, 31533.87s/it]
Training...:  52% 7235/13907 [4:40:04<3:38:11,  1.96s/it][A
Training...:  52% 7236/13907 [4:40:04<3:45:08,  2.03s/it][A
Training...:  52% 7237/13907 [4:40:06<3:40:30,  1.98s/it][A
Training...:  52% 7238/13907 [4:40:08<3:33:53,  1.92s/it][A
Training...:  52% 7239/13907 [4:40:09<3:27:54,  1.87s/it][A
Training...:  52% 7240/13907 [4:40:11<3:22:19,  1.82s/it][A
Training...:  52% 7241/13907 [4:40:13<3:19:18,  1.79s/it][A
Training...:  52% 7242/13907 [4:40:15<3:14:56,  1.75s/it][A
Training...:  52% 7243/13907 [4:40:16<3:11:54,  1.73s/it][A
Training...:  52% 7244/13907 [4:40:18<3:08:27,  1.70s/it][A
Training...:  52% 7245/13907 [4:40:19<3:02:58,  1.65s/it][A
Training...:  52% 7246/13907 [4:40:21<2:57:01,  1.59s/it][A
Training...:  52% 7247/13907 [4:40:22<2:49:43,  1.53s/it][A
Training...:  52% 7248/13907 [4:40:24<2:42:55,  1.47s/it][A
Training...:  52% 7249/13907 [4:40:25<2:35:41,  1.40s/it][A
Training...:  52% 7250/13907 [4:40:26<2:24:10,  1.30s/it][A
Training...:  52% 7251/13907 [4:40:30<3:48:32,  2.06s/it][A
Training...:  52% 7252/13907 [4:40:33<4:36:44,  2.50s/it][A
Training...:  52% 7253/13907 [4:40:36<5:02:44,  2.73s/it][A
Training...:  52% 7254/13907 [4:40:40<5:16:28,  2.85s/it][A
Training...:  52% 7255/13907 [4:40:43<5:21:46,  2.90s/it][A
Training...:  52% 7256/13907 [4:40:45<5:21:08,  2.90s/it][A
Training...:  52% 7257/13907 [4:40:48<5:19:42,  2.88s/it][A
Training...:  52% 7258/13907 [4:40:51<5:16:36,  2.86s/it][A
Training...:  52% 7259/13907 [4:40:54<5:12:48,  2.82s/it][A
Training...:  52% 7260/13907 [4:40:57<5:08:39,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:11:11<17:31:07, 31533.87s/it]
Training...:  52% 7260/13907 [4:41:00<5:08:39,  2.79s/it][A
Training...:  52% 7261/13907 [4:41:00<5:17:27,  2.87s/it][A
Training...:  52% 7262/13907 [4:41:02<5:10:09,  2.80s/it][A
Training...:  52% 7263/13907 [4:41:05<5:01:24,  2.72s/it][A
Training...:  52% 7264/13907 [4:41:07<4:54:34,  2.66s/it][A
Training...:  52% 7265/13907 [4:41:10<4:48:34,  2.61s/it][A
Training...:  52% 7266/13907 [4:41:12<4:43:01,  2.56s/it][A
Training...:  52% 7267/13907 [4:41:15<4:37:51,  2.51s/it][A
Training...:  52% 7268/13907 [4:41:17<4:33:34,  2.47s/it][A
Training...:  52% 7269/13907 [4:41:19<4:28:24,  2.43s/it][A
Training...:  52% 7270/13907 [4:41:22<4:24:30,  2.39s/it][A
Training...:  52% 7271/13907 [4:41:24<4:20:28,  2.36s/it][A
Training...:  52% 7272/13907 [4:41:26<4:16:49,  2.32s/it][A
Training...:  52% 7273/13907 [4:41:28<4:13:33,  2.29s/it][A
Training...:  52% 7274/13907 [4:41:31<4:09:57,  2.26s/it][A
Training...:  52% 7275/13907 [4:41:33<4:05:57,  2.23s/it][A
Training...:  52% 7276/13907 [4:41:35<4:01:37,  2.19s/it][A
Training...:  52% 7277/13907 [4:41:37<3:57:41,  2.15s/it][A
Training...:  52% 7278/13907 [4:41:39<3:54:21,  2.12s/it][A
Training...:  52% 7279/13907 [4:41:41<3:52:13,  2.10s/it][A
Training...:  52% 7280/13907 [4:41:43<3:48:38,  2.07s/it][A
Training...:  52% 7281/13907 [4:41:45<3:45:31,  2.04s/it][A
Training...:  52% 7282/13907 [4:41:47<3:42:13,  2.01s/it][A
Training...:  52% 7283/13907 [4:41:49<3:39:24,  1.99s/it][A
Training...:  52% 7284/13907 [4:41:51<3:36:02,  1.96s/it][A
Training...:  52% 7285/13907 [4:41:53<3:32:49,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:12:06<17:31:07, 31533.87s/it]
Training...:  52% 7285/13907 [4:41:55<3:32:49,  1.93s/it][A
Training...:  52% 7286/13907 [4:41:55<3:40:52,  2.00s/it][A
Training...:  52% 7287/13907 [4:41:57<3:37:07,  1.97s/it][A
Training...:  52% 7288/13907 [4:41:58<3:30:56,  1.91s/it][A
Training...:  52% 7289/13907 [4:42:00<3:27:13,  1.88s/it][A
Training...:  52% 7290/13907 [4:42:02<3:23:17,  1.84s/it][A
Training...:  52% 7291/13907 [4:42:04<3:18:10,  1.80s/it][A
Training...:  52% 7292/13907 [4:42:05<3:13:58,  1.76s/it][A
Training...:  52% 7293/13907 [4:42:07<3:08:29,  1.71s/it][A
Training...:  52% 7294/13907 [4:42:09<3:04:16,  1.67s/it][A
Training...:  52% 7295/13907 [4:42:10<3:00:44,  1.64s/it][A
Training...:  52% 7296/13907 [4:42:12<2:54:36,  1.58s/it][A
Training...:  52% 7297/13907 [4:42:13<2:49:56,  1.54s/it][A
Training...:  52% 7298/13907 [4:42:14<2:42:54,  1.48s/it][A
Training...:  52% 7299/13907 [4:42:16<2:35:53,  1.42s/it][A
Training...:  52% 7300/13907 [4:42:17<2:25:04,  1.32s/it][A
Training...:  52% 7301/13907 [4:42:20<3:45:10,  2.05s/it][A
Training...:  53% 7302/13907 [4:42:24<4:33:29,  2.48s/it][A
Training...:  53% 7303/13907 [4:42:27<4:59:21,  2.72s/it][A
Training...:  53% 7304/13907 [4:42:30<5:12:27,  2.84s/it][A
Training...:  53% 7305/13907 [4:42:33<5:18:08,  2.89s/it][A
Training...:  53% 7306/13907 [4:42:36<5:19:20,  2.90s/it][A
Training...:  53% 7307/13907 [4:42:39<5:19:17,  2.90s/it][A
Training...:  53% 7308/13907 [4:42:42<5:15:27,  2.87s/it][A
Training...:  53% 7309/13907 [4:42:45<5:11:05,  2.83s/it][A
Training...:  53% 7310/13907 [4:42:47<5:06:44,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:13:02<17:31:07, 31533.87s/it]
Training...:  53% 7310/13907 [4:42:51<5:06:44,  2.79s/it][A
Training...:  53% 7311/13907 [4:42:51<5:16:19,  2.88s/it][A
Training...:  53% 7312/13907 [4:42:53<5:09:06,  2.81s/it][A
Training...:  53% 7313/13907 [4:42:56<5:01:37,  2.74s/it][A
Training...:  53% 7314/13907 [4:42:58<4:55:51,  2.69s/it][A
Training...:  53% 7315/13907 [4:43:01<4:50:04,  2.64s/it][A
Training...:  53% 7316/13907 [4:43:03<4:43:53,  2.58s/it][A
Training...:  53% 7317/13907 [4:43:06<4:39:28,  2.54s/it][A
Training...:  53% 7318/13907 [4:43:08<4:35:23,  2.51s/it][A
Training...:  53% 7319/13907 [4:43:11<4:31:01,  2.47s/it][A
Training...:  53% 7320/13907 [4:43:13<4:27:22,  2.44s/it][A
Training...:  53% 7321/13907 [4:43:15<4:23:39,  2.40s/it][A
Training...:  53% 7322/13907 [4:43:18<4:20:05,  2.37s/it][A
Training...:  53% 7323/13907 [4:43:20<4:16:01,  2.33s/it][A
Training...:  53% 7324/13907 [4:43:22<4:12:31,  2.30s/it][A
Training...:  53% 7325/13907 [4:43:24<4:08:23,  2.26s/it][A
Training...:  53% 7326/13907 [4:43:26<4:04:11,  2.23s/it][A
Training...:  53% 7327/13907 [4:43:28<4:00:25,  2.19s/it][A
Training...:  53% 7328/13907 [4:43:31<3:56:31,  2.16s/it][A
Training...:  53% 7329/13907 [4:43:33<3:53:15,  2.13s/it][A
Training...:  53% 7330/13907 [4:43:35<3:49:35,  2.09s/it][A
Training...:  53% 7331/13907 [4:43:37<3:48:11,  2.08s/it][A
Training...:  53% 7332/13907 [4:43:39<3:45:55,  2.06s/it][A
Training...:  53% 7333/13907 [4:43:41<3:42:59,  2.04s/it][A
Training...:  53% 7334/13907 [4:43:43<3:38:44,  2.00s/it][A
Training...:  53% 7335/13907 [4:43:44<3:34:32,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:13:58<17:31:07, 31533.87s/it]
Training...:  53% 7335/13907 [4:43:47<3:34:32,  1.96s/it][A
Training...:  53% 7336/13907 [4:43:47<3:41:15,  2.02s/it][A
Training...:  53% 7337/13907 [4:43:48<3:36:40,  1.98s/it][A
Training...:  53% 7338/13907 [4:43:50<3:30:15,  1.92s/it][A
Training...:  53% 7339/13907 [4:43:52<3:24:47,  1.87s/it][A
Training...:  53% 7340/13907 [4:43:54<3:19:52,  1.83s/it][A
Training...:  53% 7341/13907 [4:43:55<3:15:50,  1.79s/it][A
Training...:  53% 7342/13907 [4:43:57<3:11:12,  1.75s/it][A
Training...:  53% 7343/13907 [4:43:59<3:06:47,  1.71s/it][A
Training...:  53% 7344/13907 [4:44:00<3:02:53,  1.67s/it][A
Training...:  53% 7345/13907 [4:44:02<2:57:38,  1.62s/it][A
Training...:  53% 7346/13907 [4:44:03<2:51:27,  1.57s/it][A
Training...:  53% 7347/13907 [4:44:05<2:44:54,  1.51s/it][A
Training...:  53% 7348/13907 [4:44:06<2:37:50,  1.44s/it][A
Training...:  53% 7349/13907 [4:44:07<2:29:54,  1.37s/it][A
Training...:  53% 7350/13907 [4:44:08<2:18:53,  1.27s/it][A
Training...:  53% 7351/13907 [4:44:12<3:38:17,  2.00s/it][A
Training...:  53% 7352/13907 [4:44:15<4:26:47,  2.44s/it][A
Training...:  53% 7353/13907 [4:44:19<4:53:32,  2.69s/it][A
Training...:  53% 7354/13907 [4:44:22<5:09:15,  2.83s/it][A
Training...:  53% 7355/13907 [4:44:25<5:18:11,  2.91s/it][A
Training...:  53% 7356/13907 [4:44:28<5:22:53,  2.96s/it][A
Training...:  53% 7357/13907 [4:44:31<5:22:32,  2.95s/it][A
Training...:  53% 7358/13907 [4:44:34<5:19:40,  2.93s/it][A
Training...:  53% 7359/13907 [4:44:37<5:15:54,  2.89s/it][A
Training...:  53% 7360/13907 [4:44:39<5:11:38,  2.86s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:14:53<17:31:07, 31533.87s/it]
Training...:  53% 7360/13907 [4:44:42<5:11:38,  2.86s/it][A
Training...:  53% 7361/13907 [4:44:42<5:22:18,  2.95s/it][A
Training...:  53% 7362/13907 [4:44:45<5:15:11,  2.89s/it][A
Training...:  53% 7363/13907 [4:44:48<5:05:00,  2.80s/it][A
Training...:  53% 7364/13907 [4:44:50<4:56:58,  2.72s/it][A
Training...:  53% 7365/13907 [4:44:53<4:49:27,  2.65s/it][A
Training...:  53% 7366/13907 [4:44:55<4:43:14,  2.60s/it][A
Training...:  53% 7367/13907 [4:44:58<4:38:29,  2.55s/it][A
Training...:  53% 7368/13907 [4:45:00<4:32:44,  2.50s/it][A
Training...:  53% 7369/13907 [4:45:02<4:28:15,  2.46s/it][A
Training...:  53% 7370/13907 [4:45:05<4:23:31,  2.42s/it][A
Training...:  53% 7371/13907 [4:45:07<4:19:18,  2.38s/it][A
Training...:  53% 7372/13907 [4:45:09<4:15:32,  2.35s/it][A
Training...:  53% 7373/13907 [4:45:12<4:12:22,  2.32s/it][A
Training...:  53% 7374/13907 [4:45:14<4:08:46,  2.28s/it][A
Training...:  53% 7375/13907 [4:45:16<4:05:21,  2.25s/it][A
Training...:  53% 7376/13907 [4:45:18<4:02:14,  2.23s/it][A
Training...:  53% 7377/13907 [4:45:20<3:58:55,  2.20s/it][A
Training...:  53% 7378/13907 [4:45:22<3:56:16,  2.17s/it][A
Training...:  53% 7379/13907 [4:45:24<3:53:43,  2.15s/it][A
Training...:  53% 7380/13907 [4:45:27<3:49:59,  2.11s/it][A
Training...:  53% 7381/13907 [4:45:29<3:46:21,  2.08s/it][A
Training...:  53% 7382/13907 [4:45:31<3:44:08,  2.06s/it][A
Training...:  53% 7383/13907 [4:45:33<3:40:28,  2.03s/it][A
Training...:  53% 7384/13907 [4:45:34<3:36:22,  1.99s/it][A
Training...:  53% 7385/13907 [4:45:36<3:33:23,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:15:49<17:31:07, 31533.87s/it]
Training...:  53% 7385/13907 [4:45:38<3:33:23,  1.96s/it][A
Training...:  53% 7386/13907 [4:45:38<3:39:23,  2.02s/it][A
Training...:  53% 7387/13907 [4:45:40<3:35:26,  1.98s/it][A
Training...:  53% 7388/13907 [4:45:42<3:28:45,  1.92s/it][A
Training...:  53% 7389/13907 [4:45:44<3:23:08,  1.87s/it][A
Training...:  53% 7390/13907 [4:45:46<3:18:11,  1.82s/it][A
Training...:  53% 7391/13907 [4:45:47<3:14:45,  1.79s/it][A
Training...:  53% 7392/13907 [4:45:49<3:10:31,  1.75s/it][A
Training...:  53% 7393/13907 [4:45:51<3:05:54,  1.71s/it][A
Training...:  53% 7394/13907 [4:45:52<3:01:35,  1.67s/it][A
Training...:  53% 7395/13907 [4:45:54<2:57:09,  1.63s/it][A
Training...:  53% 7396/13907 [4:45:55<2:51:47,  1.58s/it][A
Training...:  53% 7397/13907 [4:45:57<2:45:29,  1.53s/it][A
Training...:  53% 7398/13907 [4:45:58<2:38:35,  1.46s/it][A
Training...:  53% 7399/13907 [4:45:59<2:31:08,  1.39s/it][A
Training...:  53% 7400/13907 [4:46:00<2:20:14,  1.29s/it][A
Training...:  53% 7401/13907 [4:46:04<3:39:47,  2.03s/it][A
Training...:  53% 7402/13907 [4:46:07<4:27:46,  2.47s/it][A
Training...:  53% 7403/13907 [4:46:11<4:52:26,  2.70s/it][A
Training...:  53% 7404/13907 [4:46:14<5:06:02,  2.82s/it][A
Training...:  53% 7405/13907 [4:46:17<5:13:48,  2.90s/it][A
Training...:  53% 7406/13907 [4:46:20<5:15:38,  2.91s/it][A
Training...:  53% 7407/13907 [4:46:23<5:14:24,  2.90s/it][A
Training...:  53% 7408/13907 [4:46:26<5:12:34,  2.89s/it][A
Training...:  53% 7409/13907 [4:46:28<5:09:43,  2.86s/it][A
Training...:  53% 7410/13907 [4:46:31<5:07:38,  2.84s/it][A                                                                                                                             
                                                         [AStep... (33475 | Loss: 0.1908913552761078, Learning Rate: 0.00010015758743975312, Gradient Norm: 0.7568914890289307)
Step... (33500 | Loss: 0.19093629717826843, Learning Rate: 0.00010000605834648013, Gradient Norm: 1.384194254875183)
Step... (33525 | Loss: 0.20072069764137268, Learning Rate: 9.985455108107999e-05, Gradient Norm: 0.8152140378952026)
Step... (33550 | Loss: 0.19748903810977936, Learning Rate: 9.970304381567985e-05, Gradient Norm: 1.3788102865219116)
Step... (33575 | Loss: 0.1352083384990692, Learning Rate: 9.955151472240686e-05, Gradient Norm: 0.43647584319114685)
Step... (33600 | Loss: 0.20000524818897247, Learning Rate: 9.940000745700672e-05, Gradient Norm: 1.5164291858673096)
Step... (33625 | Loss: 0.2602198123931885, Learning Rate: 9.924850019160658e-05, Gradient Norm: 0.9591699838638306)
Step... (33650 | Loss: 0.1905897706747055, Learning Rate: 9.90969710983336e-05, Gradient Norm: 0.8918650150299072)
Step... (33675 | Loss: 0.24049660563468933, Learning Rate: 9.894546383293346e-05, Gradient Norm: 0.9408771991729736)
Step... (33700 | Loss: 0.2191615104675293, Learning Rate: 9.87939492915757e-05, Gradient Norm: 1.1382285356521606)
Step... (33725 | Loss: 0.2366565614938736, Learning Rate: 9.864242747426033e-05, Gradient Norm: 1.2248668670654297)
Step... (33750 | Loss: 0.15676844120025635, Learning Rate: 9.849091293290257e-05, Gradient Norm: 0.6252484321594238)
Step... (33775 | Loss: 0.21912232041358948, Learning Rate: 9.833940566750243e-05, Gradient Norm: 0.7013077735900879)
Step... (33800 | Loss: 0.20398059487342834, Learning Rate: 9.818788385018706e-05, Gradient Norm: 1.3822791576385498)
Step... (33825 | Loss: 0.22540420293807983, Learning Rate: 9.803636930882931e-05, Gradient Norm: 0.801190197467804)
Step... (33850 | Loss: 0.20374636352062225, Learning Rate: 9.788486204342917e-05, Gradient Norm: 1.1919865608215332)
Step... (33875 | Loss: 0.18640664219856262, Learning Rate: 9.773333295015618e-05, Gradient Norm: 0.5106196999549866)
Step... (33900 | Loss: 0.21119019389152527, Learning Rate: 9.758182568475604e-05, Gradient Norm: 0.845120906829834)
Step... (33925 | Loss: 0.20201028883457184, Learning Rate: 9.74303184193559e-05, Gradient Norm: 0.6871553063392639)
Step... (33950 | Loss: 0.18984365463256836, Learning Rate: 9.727878932608292e-05, Gradient Norm: 0.8675304651260376)
Step... (33975 | Loss: 0.16940540075302124, Learning Rate: 9.712728206068277e-05, Gradient Norm: 1.0489811897277832)
Step... (34000 | Loss: 0.21127241849899292, Learning Rate: 9.697575296740979e-05, Gradient Norm: 0.8054416179656982)
Step... (34025 | Loss: 0.2506466805934906, Learning Rate: 9.682424570200965e-05, Gradient Norm: 0.9192780256271362)
Step... (34050 | Loss: 0.1620226800441742, Learning Rate: 9.66727384366095e-05, Gradient Norm: 0.8301610946655273)
Step... (34075 | Loss: 0.19955360889434814, Learning Rate: 9.652120934333652e-05, Gradient Norm: 0.7339601516723633)
Step... (34100 | Loss: 0.19941109418869019, Learning Rate: 9.636970207793638e-05, Gradient Norm: 1.2528176307678223)
Step... (34125 | Loss: 0.22723251581192017, Learning Rate: 9.621819481253624e-05, Gradient Norm: 0.6940939426422119)
Step... (34150 | Loss: 0.17170271277427673, Learning Rate: 9.606666571926326e-05, Gradient Norm: 0.7058970928192139)
Step... (34175 | Loss: 0.18539676070213318, Learning Rate: 9.591515845386311e-05, Gradient Norm: 0.9037326574325562)
Step... (34200 | Loss: 0.143199160695076, Learning Rate: 9.576364391250536e-05, Gradient Norm: 0.6432813405990601)
Step... (34225 | Loss: 0.21264639496803284, Learning Rate: 9.561212209518999e-05, Gradient Norm: 0.8742764592170715)
Step... (34250 | Loss: 0.1998014897108078, Learning Rate: 9.546060755383223e-05, Gradient Norm: 0.8480178117752075)
Step... (34275 | Loss: 0.20190781354904175, Learning Rate: 9.530910028843209e-05, Gradient Norm: 0.8346835374832153)
Step... (34300 | Loss: 0.18128982186317444, Learning Rate: 9.515757119515911e-05, Gradient Norm: 0.8779735565185547)
Step... (34325 | Loss: 0.23507535457611084, Learning Rate: 9.500606392975897e-05, Gradient Norm: 0Epoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:16:45<17:31:07, 31533.87s/it]
Training...:  53% 7410/13907 [4:46:34<5:07:38,  2.84s/it][A
Training...:  53% 7411/13907 [4:46:34<5:16:31,  2.92s/it][A.7927788496017456)
Step... (34350 | Loss: 0.14828965067863464, Learning Rate: 9.485455666435882e-05, Gradient Norm: 0.7750064134597778)
Step... (34375 | Loss: 0.22166219353675842, Learning Rate: 9.470302757108584e-05, Gradient Norm: 0.8842401504516602)
Step... (34400 | Loss: 0.20554278790950775, Learning Rate: 9.45515203056857e-05, Gradient Norm: 0.958055853843689)
Step... (34425 | Loss: 0.18953877687454224, Learning Rate: 9.440001304028556e-05, Gradient Norm: 0.8312356472015381)
Step... (34450 | Loss: 0.2401575744152069, Learning Rate: 9.424848394701257e-05, Gradient Norm: 1.0785090923309326)
Step... (34475 | Loss: 0.17975103855133057, Learning Rate: 9.409697668161243e-05, Gradient Norm: 0.6522700786590576)
Step... (34500 | Loss: 0.17287808656692505, Learning Rate: 9.394546941621229e-05, Gradient Norm: 2.3804099559783936)
Step... (34525 | Loss: 0.16499003767967224, Learning Rate: 9.37939403229393e-05, Gradient Norm: 0.6906849145889282)
Step... (34550 | Loss: 0.21740970015525818, Learning Rate: 9.364243305753917e-05, Gradient Norm: 1.0314209461212158)
Step... (34575 | Loss: 0.17206954956054688, Learning Rate: 9.349091851618141e-05, Gradient Norm: 0.5710973739624023)
Step... (34600 | Loss: 0.21045328676700592, Learning Rate: 9.333939669886604e-05, Gradient Norm: 0.7759706377983093)
Step... (34625 | Loss: 0.22805339097976685, Learning Rate: 9.318788215750828e-05, Gradient Norm: 0.7233367562294006)
Step... (34650 | Loss: 0.18637725710868835, Learning Rate: 9.303637489210814e-05, Gradient Norm: 0.6810662150382996)
Step... (34675 | Loss: 0.26629889011383057, Learning Rate: 9.288484579883516e-05, Gradient Norm: 0.9192423820495605)
Step... (34700 | Loss: 0.16463331878185272, Learning Rate: 9.273333853343502e-05, Gradient Norm: 0.6797080039978027)
Step... (34725 | Loss: 0.17771387100219727, Learning Rate: 9.258183126803488e-05, Gradient Norm: 0.7381002902984619)
Step... (34750 | Loss: 0.1663326621055603, Learning Rate: 9.243030217476189e-05, Gradient Norm: 0.9770827889442444)
Step... (34775 | Loss: 0.2419072389602661, Learning Rate: 9.227879490936175e-05, Gradient Norm: 0.8803064823150635)
Step... (34800 | Loss: 0.27282267808914185, Learning Rate: 9.212728764396161e-05, Gradient Norm: 0.9992589950561523)
Step... (34825 | Loss: 0.2198377251625061, Learning Rate: 9.197575855068862e-05, Gradient Norm: 0.6737436056137085)
Step... (34850 | Loss: 0.23115816712379456, Learning Rate: 9.182425128528848e-05, Gradient Norm: 0.9290512800216675)
Step... (34875 | Loss: 0.22468630969524384, Learning Rate: 9.167274401988834e-05, Gradient Norm: 0.6532632112503052)
Step... (34900 | Loss: 0.1907159984111786, Learning Rate: 9.152121492661536e-05, Gradient Norm: 0.9255620241165161)
Step... (34925 | Loss: 0.16545803844928741, Learning Rate: 9.136970766121522e-05, Gradient Norm: 0.835993230342865)
Step... (34950 | Loss: 0.232232004404068, Learning Rate: 9.121819311985746e-05, Gradient Norm: 1.1527841091156006)
Step... (34975 | Loss: 0.21975648403167725, Learning Rate: 9.106667130254209e-05, Gradient Norm: 0.7171075344085693)
Step... (35000 | Loss: 0.12100466340780258, Learning Rate: 9.091515676118433e-05, Gradient Norm: 0.6167440414428711)
Step... (35025 | Loss: 0.20791202783584595, Learning Rate: 9.07636494957842e-05, Gradient Norm: 0.7808432579040527)
Step... (35050 | Loss: 0.16053222119808197, Learning Rate: 9.061212040251121e-05, Gradient Norm: 0.613959789276123)
Step... (35075 | Loss: 0.2631363570690155, Learning Rate: 9.046061313711107e-05, Gradient Norm: 0.9670931696891785)
Step... (35100 | Loss: 0.18650460243225098, Learning Rate: 9.03090913197957e-05, Gradient Norm: 0.8802345991134644)
Step... (35125 | Loss: 0.20108336210250854, Learning Rate: 9.015757677843794e-05, Gradient Norm: 0.8377689123153687)
Step... (35150 | Loss: 0.17330656945705414, Learning Rate: 9.00060695130378e-05, Gradient Norm: 1.3518954515457153)
Step... (35175 | Loss: 0.1752525418996811, Learning Rate: 8.985454041976482e-05, Gradient Norm: 0.6853027939796448)
Step... (35200 | Loss: 0.18389424681663513, Learning Rate: 8.970303315436468e-05, Gradient Norm: 1.0807914733886719)

Training...:  53% 7412/13907 [4:46:37<5:15:03,  2.91s/it][A
Training...:  53% 7413/13907 [4:46:40<5:04:19,  2.81s/it][A
Training...:  53% 7414/13907 [4:46:42<4:55:37,  2.73s/it][A
Training...:  53% 7415/13907 [4:46:45<4:48:36,  2.67s/it][A
Training...:  53% 7416/13907 [4:46:47<4:41:50,  2.61s/it][A
Training...:  53% 7417/13907 [4:46:50<4:36:28,  2.56s/it][A
Training...:  53% 7418/13907 [4:46:52<4:30:53,  2.50s/it][A
Training...:  53% 7419/13907 [4:46:54<4:26:43,  2.47s/it][A
Training...:  53% 7420/13907 [4:46:57<4:25:45,  2.46s/it][A
Training...:  53% 7421/13907 [4:46:59<4:21:41,  2.42s/it][A
Training...:  53% 7422/13907 [4:47:01<4:16:34,  2.37s/it][A
Training...:  53% 7423/13907 [4:47:04<4:12:37,  2.34s/it][A
Training...:  53% 7424/13907 [4:47:06<4:07:28,  2.29s/it][A
Training...:  53% 7425/13907 [4:47:08<4:03:42,  2.26s/it][A
Training...:  53% 7426/13907 [4:47:10<3:59:24,  2.22s/it][A
Training...:  53% 7427/13907 [4:47:12<3:56:07,  2.19s/it][A
Training...:  53% 7428/13907 [4:47:14<3:52:24,  2.15s/it][A
Training...:  53% 7429/13907 [4:47:16<3:49:53,  2.13s/it][A
Training...:  53% 7430/13907 [4:47:18<3:47:22,  2.11s/it][A
Training...:  53% 7431/13907 [4:47:21<3:44:20,  2.08s/it][A
Training...:  53% 7432/13907 [4:47:23<3:42:04,  2.06s/it][A
Training...:  53% 7433/13907 [4:47:24<3:38:11,  2.02s/it][A
Training...:  53% 7434/13907 [4:47:26<3:34:16,  1.99s/it][A
Training...:  53% 7435/13907 [4:47:28<3:31:16,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:17:41<17:31:07, 31533.87s/it]
Training...:  53% 7435/13907 [4:47:30<3:31:16,  1.96s/it][A
Training...:  53% 7436/13907 [4:47:30<3:37:40,  2.02s/it][A
Training...:  53% 7437/13907 [4:47:32<3:33:36,  1.98s/it][A
Training...:  53% 7438/13907 [4:47:34<3:27:11,  1.92s/it][A
Training...:  53% 7439/13907 [4:47:36<3:21:10,  1.87s/it][A
Training...:  53% 7440/13907 [4:47:38<3:16:45,  1.83s/it][A
Training...:  54% 7441/13907 [4:47:39<3:11:55,  1.78s/it][A
Training...:  54% 7442/13907 [4:47:41<3:08:02,  1.75s/it][A
Training...:  54% 7443/13907 [4:47:43<3:03:42,  1.71s/it][A
Training...:  54% 7444/13907 [4:47:44<2:59:41,  1.67s/it][A
Training...:  54% 7445/13907 [4:47:46<2:55:39,  1.63s/it][A
Training...:  54% 7446/13907 [4:47:47<2:50:43,  1.59s/it][A
Training...:  54% 7447/13907 [4:47:49<2:44:52,  1.53s/it][A
Training...:  54% 7448/13907 [4:47:50<2:38:22,  1.47s/it][A
Training...:  54% 7449/13907 [4:47:51<2:31:48,  1.41s/it][A
Training...:  54% 7450/13907 [4:47:52<2:21:33,  1.32s/it][A
Training...:  54% 7451/13907 [4:47:56<3:43:22,  2.08s/it][A
Training...:  54% 7452/13907 [4:48:00<4:32:29,  2.53s/it][A
Training...:  54% 7453/13907 [4:48:03<4:56:07,  2.75s/it][A
Training...:  54% 7454/13907 [4:48:06<5:08:08,  2.87s/it][A
Training...:  54% 7455/13907 [4:48:09<5:13:29,  2.92s/it][A
Training...:  54% 7456/13907 [4:48:12<5:13:52,  2.92s/it][A
Training...:  54% 7457/13907 [4:48:15<5:12:38,  2.91s/it][A
Training...:  54% 7458/13907 [4:48:18<5:09:30,  2.88s/it][A
Training...:  54% 7459/13907 [4:48:20<5:05:05,  2.84s/it][A
Training...:  54% 7460/13907 [4:48:23<5:00:09,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:18:37<17:31:07, 31533.87s/it]
Training...:  54% 7460/13907 [4:48:26<5:00:09,  2.79s/it][A
Training...:  54% 7461/13907 [4:48:26<5:08:06,  2.87s/it][A
Training...:  54% 7462/13907 [4:48:29<5:01:29,  2.81s/it][A
Training...:  54% 7463/13907 [4:48:31<4:53:09,  2.73s/it][A
Training...:  54% 7464/13907 [4:48:34<4:46:37,  2.67s/it][A
Training...:  54% 7465/13907 [4:48:36<4:40:32,  2.61s/it][A
Training...:  54% 7466/13907 [4:48:39<4:35:13,  2.56s/it][A
Training...:  54% 7467/13907 [4:48:41<4:31:05,  2.53s/it][A
Training...:  54% 7468/13907 [4:48:44<4:27:28,  2.49s/it][A
Training...:  54% 7469/13907 [4:48:46<4:23:25,  2.46s/it][A
Training...:  54% 7470/13907 [4:48:48<4:19:46,  2.42s/it][A
Training...:  54% 7471/13907 [4:48:51<4:16:24,  2.39s/it][A
Training...:  54% 7472/13907 [4:48:53<4:12:14,  2.35s/it][A
Training...:  54% 7473/13907 [4:48:55<4:09:45,  2.33s/it][A
Training...:  54% 7474/13907 [4:48:57<4:05:44,  2.29s/it][A
Training...:  54% 7475/13907 [4:49:00<4:01:42,  2.25s/it][A
Training...:  54% 7476/13907 [4:49:02<3:58:47,  2.23s/it][A
Training...:  54% 7477/13907 [4:49:04<3:57:56,  2.22s/it][A
Training...:  54% 7478/13907 [4:49:06<3:54:17,  2.19s/it][A
Training...:  54% 7479/13907 [4:49:08<3:49:42,  2.14s/it][A
Training...:  54% 7480/13907 [4:49:10<3:45:15,  2.10s/it][A
Training...:  54% 7481/13907 [4:49:12<3:41:44,  2.07s/it][A
Training...:  54% 7482/13907 [4:49:14<3:37:57,  2.04s/it][A
Training...:  54% 7483/13907 [4:49:16<3:34:51,  2.01s/it][A
Training...:  54% 7484/13907 [4:49:18<3:30:48,  1.97s/it][A
Training...:  54% 7485/13907 [4:49:20<3:27:49,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:19:33<17:31:07, 31533.87s/it]
Training...:  54% 7485/13907 [4:49:22<3:27:49,  1.94s/it][A
Training...:  54% 7486/13907 [4:49:22<3:34:03,  2.00s/it][A
Training...:  54% 7487/13907 [4:49:24<3:29:50,  1.96s/it][A
Training...:  54% 7488/13907 [4:49:26<3:24:21,  1.91s/it][A
Training...:  54% 7489/13907 [4:49:27<3:19:14,  1.86s/it][A
Training...:  54% 7490/13907 [4:49:29<3:14:24,  1.82s/it][A
Training...:  54% 7491/13907 [4:49:31<3:09:35,  1.77s/it][A
Training...:  54% 7492/13907 [4:49:32<3:05:14,  1.73s/it][A
Training...:  54% 7493/13907 [4:49:34<3:01:17,  1.70s/it][A
Training...:  54% 7494/13907 [4:49:36<2:58:05,  1.67s/it][A
Training...:  54% 7495/13907 [4:49:37<2:53:27,  1.62s/it][A
Training...:  54% 7496/13907 [4:49:39<2:47:40,  1.57s/it][A
Training...:  54% 7497/13907 [4:49:40<2:41:12,  1.51s/it][A
Training...:  54% 7498/13907 [4:49:41<2:34:47,  1.45s/it][A
Training...:  54% 7499/13907 [4:49:42<2:27:18,  1.38s/it][A
Training...:  54% 7500/13907 [4:49:44<2:16:48,  1.28s/it][A
Training...:  54% 7501/13907 [4:49:47<3:34:18,  2.01s/it][A
Training...:  54% 7502/13907 [4:49:51<4:21:21,  2.45s/it][A
Training...:  54% 7503/13907 [4:49:54<4:48:19,  2.70s/it][A
Training...:  54% 7504/13907 [4:49:57<5:04:14,  2.85s/it][A
Training...:  54% 7505/13907 [4:50:00<5:11:27,  2.92s/it][A
Training...:  54% 7506/13907 [4:50:03<5:14:13,  2.95s/it][A
Training...:  54% 7507/13907 [4:50:06<5:12:47,  2.93s/it][A
Training...:  54% 7508/13907 [4:50:09<5:09:34,  2.90s/it][A
Training...:  54% 7509/13907 [4:50:12<5:06:19,  2.87s/it][A
Training...:  54% 7510/13907 [4:50:15<5:00:44,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:20:29<17:31:07, 31533.87s/it]
Training...:  54% 7510/13907 [4:50:18<5:00:44,  2.82s/it][A
Training...:  54% 7511/13907 [4:50:18<5:09:09,  2.90s/it][A
Training...:  54% 7512/13907 [4:50:20<5:02:53,  2.84s/it][A
Training...:  54% 7513/13907 [4:50:23<4:53:37,  2.76s/it][A
Training...:  54% 7514/13907 [4:50:25<4:47:49,  2.70s/it][A
Training...:  54% 7515/13907 [4:50:28<4:41:37,  2.64s/it][A
Training...:  54% 7516/13907 [4:50:30<4:37:50,  2.61s/it][A
Training...:  54% 7517/13907 [4:50:33<4:33:43,  2.57s/it][A
Training...:  54% 7518/13907 [4:50:35<4:28:06,  2.52s/it][A
Training...:  54% 7519/13907 [4:50:38<4:24:36,  2.49s/it][A
Training...:  54% 7520/13907 [4:50:40<4:18:57,  2.43s/it][A
Training...:  54% 7521/13907 [4:50:42<4:14:58,  2.40s/it][A
Training...:  54% 7522/13907 [4:50:45<4:11:32,  2.36s/it][A
Training...:  54% 7523/13907 [4:50:47<4:07:28,  2.33s/it][A
Training...:  54% 7524/13907 [4:50:49<4:03:20,  2.29s/it][A
Training...:  54% 7525/13907 [4:50:51<4:00:06,  2.26s/it][A
Training...:  54% 7526/13907 [4:50:53<3:56:06,  2.22s/it][A
Training...:  54% 7527/13907 [4:50:56<3:53:05,  2.19s/it][A
Training...:  54% 7528/13907 [4:50:58<3:49:45,  2.16s/it][A
Training...:  54% 7529/13907 [4:51:00<3:46:05,  2.13s/it][A
Training...:  54% 7530/13907 [4:51:02<3:42:18,  2.09s/it][A
Training...:  54% 7531/13907 [4:51:04<3:39:09,  2.06s/it][A
Training...:  54% 7532/13907 [4:51:06<3:35:50,  2.03s/it][A
Training...:  54% 7533/13907 [4:51:08<3:32:15,  2.00s/it][A
Training...:  54% 7534/13907 [4:51:09<3:28:52,  1.97s/it][A
Training...:  54% 7535/13907 [4:51:11<3:25:43,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:21:24<17:31:07, 31533.87s/it]
Training...:  54% 7535/13907 [4:51:13<3:25:43,  1.94s/it][A
Training...:  54% 7536/13907 [4:51:13<3:32:16,  2.00s/it][A
Training...:  54% 7537/13907 [4:51:15<3:29:06,  1.97s/it][A
Training...:  54% 7538/13907 [4:51:17<3:25:37,  1.94s/it][A
Training...:  54% 7539/13907 [4:51:19<3:19:58,  1.88s/it][A
Training...:  54% 7540/13907 [4:51:21<3:15:29,  1.84s/it][A
Training...:  54% 7541/13907 [4:51:22<3:10:47,  1.80s/it][A
Training...:  54% 7542/13907 [4:51:24<3:06:36,  1.76s/it][A
Training...:  54% 7543/13907 [4:51:26<3:01:34,  1.71s/it][A
Training...:  54% 7544/13907 [4:51:27<2:57:03,  1.67s/it][A
Training...:  54% 7545/13907 [4:51:29<2:53:34,  1.64s/it][A
Training...:  54% 7546/13907 [4:51:30<2:48:40,  1.59s/it][A
Training...:  54% 7547/13907 [4:51:32<2:42:59,  1.54s/it][A
Training...:  54% 7548/13907 [4:51:33<2:37:34,  1.49s/it][A
Training...:  54% 7549/13907 [4:51:34<2:30:56,  1.42s/it][A
Training...:  54% 7550/13907 [4:51:35<2:20:59,  1.33s/it][A
Training...:  54% 7551/13907 [4:51:39<3:39:25,  2.07s/it][A
Training...:  54% 7552/13907 [4:51:43<4:25:31,  2.51s/it][A
Training...:  54% 7553/13907 [4:51:46<4:48:30,  2.72s/it][A
Training...:  54% 7554/13907 [4:51:49<5:03:51,  2.87s/it][A
Training...:  54% 7555/13907 [4:51:52<5:09:16,  2.92s/it][A
Training...:  54% 7556/13907 [4:51:55<5:12:23,  2.95s/it][A
Training...:  54% 7557/13907 [4:51:58<5:15:17,  2.98s/it][A
Training...:  54% 7558/13907 [4:52:01<5:11:24,  2.94s/it][A
Training...:  54% 7559/13907 [4:52:04<5:06:17,  2.90s/it][A
Training...:  54% 7560/13907 [4:52:07<5:01:33,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:22:21<17:31:07, 31533.87s/it]
Training...:  54% 7560/13907 [4:52:10<5:01:33,  2.85s/it][A
Training...:  54% 7561/13907 [4:52:10<5:10:12,  2.93s/it][A
Training...:  54% 7562/13907 [4:52:13<5:01:40,  2.85s/it][A
Training...:  54% 7563/13907 [4:52:15<4:51:27,  2.76s/it][A
Training...:  54% 7564/13907 [4:52:18<4:43:13,  2.68s/it][A
Training...:  54% 7565/13907 [4:52:20<4:35:52,  2.61s/it][A
Training...:  54% 7566/13907 [4:52:22<4:29:31,  2.55s/it][A
Training...:  54% 7567/13907 [4:52:25<4:25:24,  2.51s/it][A
Training...:  54% 7568/13907 [4:52:27<4:20:43,  2.47s/it][A
Training...:  54% 7569/13907 [4:52:30<4:16:41,  2.43s/it][A
Training...:  54% 7570/13907 [4:52:32<4:13:11,  2.40s/it][A
Training...:  54% 7571/13907 [4:52:34<4:11:35,  2.38s/it][A
Training...:  54% 7572/13907 [4:52:36<4:07:48,  2.35s/it][A
Training...:  54% 7573/13907 [4:52:39<4:05:09,  2.32s/it][A
Training...:  54% 7574/13907 [4:52:41<4:01:01,  2.28s/it][A
Training...:  54% 7575/13907 [4:52:43<3:58:20,  2.26s/it][A
Training...:  54% 7576/13907 [4:52:45<3:53:56,  2.22s/it][A
Training...:  54% 7577/13907 [4:52:47<3:50:54,  2.19s/it][A
Training...:  54% 7578/13907 [4:52:49<3:48:23,  2.17s/it][A
Training...:  54% 7579/13907 [4:52:52<3:45:49,  2.14s/it][A
Training...:  55% 7580/13907 [4:52:54<3:41:21,  2.10s/it][A
Training...:  55% 7581/13907 [4:52:56<3:38:08,  2.07s/it][A
Training...:  55% 7582/13907 [4:52:58<3:34:00,  2.03s/it][A
Training...:  55% 7583/13907 [4:52:59<3:30:28,  2.00s/it][A
Training...:  55% 7584/13907 [4:53:01<3:27:11,  1.97s/it][A
Training...:  55% 7585/13907 [4:53:03<3:23:51,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:23:16<17:31:07, 31533.87s/it]
Training...:  55% 7585/13907 [4:53:05<3:23:51,  1.93s/it][A
Training...:  55% 7586/13907 [4:53:05<3:29:55,  1.99s/it][A
Training...:  55% 7587/13907 [4:53:07<3:25:35,  1.95s/it][A
Training...:  55% 7588/13907 [4:53:09<3:19:08,  1.89s/it][A
Training...:  55% 7589/13907 [4:53:11<3:14:24,  1.85s/it][A
Training...:  55% 7590/13907 [4:53:12<3:09:02,  1.80s/it][A
Training...:  55% 7591/13907 [4:53:14<3:04:54,  1.76s/it][A
Training...:  55% 7592/13907 [4:53:16<3:00:28,  1.71s/it][A
Training...:  55% 7593/13907 [4:53:17<2:56:11,  1.67s/it][A
Training...:  55% 7594/13907 [4:53:19<2:53:59,  1.65s/it][A
Training...:  55% 7595/13907 [4:53:20<2:48:34,  1.60s/it][A
Training...:  55% 7596/13907 [4:53:22<2:42:57,  1.55s/it][A
Training...:  55% 7597/13907 [4:53:23<2:37:50,  1.50s/it][A
Training...:  55% 7598/13907 [4:53:24<2:32:23,  1.45s/it][A
Training...:  55% 7599/13907 [4:53:26<2:25:39,  1.39s/it][A
Training...:  55% 7600/13907 [4:53:27<2:15:41,  1.29s/it][A
Training...:  55% 7601/13907 [4:53:30<3:31:57,  2.02s/it][A
Training...:  55% 7602/13907 [4:53:34<4:17:46,  2.45s/it][A
Training...:  55% 7603/13907 [4:53:37<4:42:48,  2.69s/it][A
Training...:  55% 7604/13907 [4:53:40<4:56:28,  2.82s/it][A
Training...:  55% 7605/13907 [4:53:43<5:02:52,  2.88s/it][A
Training...:  55% 7606/13907 [4:53:46<5:04:10,  2.90s/it][A
Training...:  55% 7607/13907 [4:53:49<5:04:36,  2.90s/it][A
Training...:  55% 7608/13907 [4:53:52<5:03:34,  2.89s/it][A
Training...:  55% 7609/13907 [4:53:55<4:59:04,  2.85s/it][A
Training...:  55% 7610/13907 [4:53:58<4:54:55,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:24:12<17:31:07, 31533.87s/it]
Training...:  55% 7610/13907 [4:54:01<4:54:55,  2.81s/it][A
Training...:  55% 7611/13907 [4:54:01<5:03:00,  2.89s/it][A
Training...:  55% 7612/13907 [4:54:03<4:56:21,  2.82s/it][A
Training...:  55% 7613/13907 [4:54:06<4:48:08,  2.75s/it][A
Training...:  55% 7614/13907 [4:54:08<4:41:14,  2.68s/it][A
Training...:  55% 7615/13907 [4:54:11<4:35:34,  2.63s/it][A
Training...:  55% 7616/13907 [4:54:13<4:29:21,  2.57s/it][A
Training...:  55% 7617/13907 [4:54:16<4:24:35,  2.52s/it][A
Training...:  55% 7618/13907 [4:54:18<4:19:17,  2.47s/it][A
Training...:  55% 7619/13907 [4:54:20<4:15:24,  2.44s/it][A
Training...:  55% 7620/13907 [4:54:23<4:11:16,  2.40s/it][A
Training...:  55% 7621/13907 [4:54:25<4:08:37,  2.37s/it][A
Training...:  55% 7622/13907 [4:54:27<4:04:26,  2.33s/it][A
Training...:  55% 7623/13907 [4:54:29<4:00:55,  2.30s/it][A
Training...:  55% 7624/13907 [4:54:32<3:57:07,  2.26s/it][A
Training...:  55% 7625/13907 [4:54:34<3:54:13,  2.24s/it][A
Training...:  55% 7626/13907 [4:54:36<3:51:34,  2.21s/it][A
Training...:  55% 7627/13907 [4:54:38<3:47:51,  2.18s/it][A
Training...:  55% 7628/13907 [4:54:40<3:44:06,  2.14s/it][A
Training...:  55% 7629/13907 [4:54:42<3:42:09,  2.12s/it][A
Training...:  55% 7630/13907 [4:54:44<3:38:17,  2.09s/it][A
Training...:  55% 7631/13907 [4:54:46<3:35:08,  2.06s/it][A
Training...:  55% 7632/13907 [4:54:48<3:33:50,  2.04s/it][A
Training...:  55% 7633/13907 [4:54:50<3:30:51,  2.02s/it][A
Training...:  55% 7634/13907 [4:54:52<3:27:07,  1.98s/it][A
Training...:  55% 7635/13907 [4:54:54<3:23:21,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:25:07<17:31:07, 31533.87s/it]
Training...:  55% 7635/13907 [4:54:56<3:23:21,  1.95s/it][A
Training...:  55% 7636/13907 [4:54:56<3:29:04,  2.00s/it][A
Training...:  55% 7637/13907 [4:54:58<3:24:37,  1.96s/it][A
Training...:  55% 7638/13907 [4:55:00<3:18:46,  1.90s/it][A
Training...:  55% 7639/13907 [4:55:01<3:13:38,  1.85s/it][A
Training...:  55% 7640/13907 [4:55:03<3:08:53,  1.81s/it][A
Training...:  55% 7641/13907 [4:55:05<3:04:45,  1.77s/it][A
Training...:  55% 7642/13907 [4:55:06<3:00:27,  1.73s/it][A
Training...:  55% 7643/13907 [4:55:08<2:56:53,  1.69s/it][A
Training...:  55% 7644/13907 [4:55:10<2:53:21,  1.66s/it][A
Training...:  55% 7645/13907 [4:55:11<2:48:45,  1.62s/it][A
Training...:  55% 7646/13907 [4:55:13<2:43:41,  1.57s/it][A
Training...:  55% 7647/13907 [4:55:14<2:38:42,  1.52s/it][A
Training...:  55% 7648/13907 [4:55:15<2:32:37,  1.46s/it][A
Training...:  55% 7649/13907 [4:55:17<2:25:23,  1.39s/it][A
Training...:  55% 7650/13907 [4:55:18<2:15:11,  1.30s/it][A
Training...:  55% 7651/13907 [4:55:21<3:33:24,  2.05s/it][A
Training...:  55% 7652/13907 [4:55:25<4:20:08,  2.50s/it][A
Training...:  55% 7653/13907 [4:55:28<4:45:11,  2.74s/it][A
Training...:  55% 7654/13907 [4:55:32<4:59:15,  2.87s/it][A
Training...:  55% 7655/13907 [4:55:35<5:06:52,  2.95s/it][A
Training...:  55% 7656/13907 [4:55:38<5:08:23,  2.96s/it][A
Training...:  55% 7657/13907 [4:55:41<5:06:04,  2.94s/it][A
Training...:  55% 7658/13907 [4:55:43<5:04:17,  2.92s/it][A
Training...:  55% 7659/13907 [4:55:46<5:03:13,  2.91s/it][A
Training...:  55% 7660/13907 [4:55:49<5:01:10,  2.89s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:26:03<17:31:07, 31533.87s/it]
Training...:  55% 7660/13907 [4:55:52<5:01:10,  2.89s/it][A
Training...:  55% 7661/13907 [4:55:52<5:08:10,  2.96s/it][A
Training...:  55% 7662/13907 [4:55:55<5:00:24,  2.89s/it][A
Training...:  55% 7663/13907 [4:55:58<4:50:59,  2.80s/it][A
Training...:  55% 7664/13907 [4:56:00<4:42:41,  2.72s/it][A
Training...:  55% 7665/13907 [4:56:03<4:35:24,  2.65s/it][A
Training...:  55% 7666/13907 [4:56:05<4:28:49,  2.58s/it][A
Training...:  55% 7667/13907 [4:56:07<4:24:07,  2.54s/it][A
Training...:  55% 7668/13907 [4:56:10<4:19:28,  2.50s/it][A
Training...:  55% 7669/13907 [4:56:12<4:15:38,  2.46s/it][A
Training...:  55% 7670/13907 [4:56:15<4:12:07,  2.43s/it][A
Training...:  55% 7671/13907 [4:56:17<4:08:17,  2.39s/it][A
Training...:  55% 7672/13907 [4:56:19<4:05:01,  2.36s/it][A
Training...:  55% 7673/13907 [4:56:21<4:01:01,  2.32s/it][A
Training...:  55% 7674/13907 [4:56:24<3:58:29,  2.30s/it][A
Training...:  55% 7675/13907 [4:56:26<3:55:43,  2.27s/it][A
Training...:  55% 7676/13907 [4:56:28<3:53:51,  2.25s/it][A
Training...:  55% 7677/13907 [4:56:30<3:49:51,  2.21s/it][A
Training...:  55% 7678/13907 [4:56:32<3:46:31,  2.18s/it][A
Training...:  55% 7679/13907 [4:56:34<3:44:20,  2.16s/it][A
Training...:  55% 7680/13907 [4:56:36<3:41:19,  2.13s/it][A
Training...:  55% 7681/13907 [4:56:38<3:38:43,  2.11s/it][A
Training...:  55% 7682/13907 [4:56:40<3:35:22,  2.08s/it][A
Training...:  55% 7683/13907 [4:56:43<3:33:46,  2.06s/it][A
Training...:  55% 7684/13907 [4:56:44<3:30:42,  2.03s/it][A
Training...:  55% 7685/13907 [4:56:46<3:26:39,  1.99s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:27:00<17:31:07, 31533.87s/it]
Training...:  55% 7685/13907 [4:56:49<3:26:39,  1.99s/it][A
Training...:  55% 7686/13907 [4:56:49<3:32:28,  2.05s/it][A
Training...:  55% 7687/13907 [4:56:50<3:28:06,  2.01s/it][A
Training...:  55% 7688/13907 [4:56:52<3:22:42,  1.96s/it][A
Training...:  55% 7689/13907 [4:56:54<3:17:57,  1.91s/it][A
Training...:  55% 7690/13907 [4:56:56<3:12:19,  1.86s/it][A
Training...:  55% 7691/13907 [4:56:58<3:07:49,  1.81s/it][A
Training...:  55% 7692/13907 [4:56:59<3:03:27,  1.77s/it][A
Training...:  55% 7693/13907 [4:57:01<2:58:29,  1.72s/it][A
Training...:  55% 7694/13907 [4:57:02<2:54:00,  1.68s/it][A
Training...:  55% 7695/13907 [4:57:04<2:49:23,  1.64s/it][A
Training...:  55% 7696/13907 [4:57:05<2:43:47,  1.58s/it][A
Training...:  55% 7697/13907 [4:57:07<2:37:31,  1.52s/it][A
Training...:  55% 7698/13907 [4:57:08<2:31:42,  1.47s/it][A
Training...:  55% 7699/13907 [4:57:09<2:24:48,  1.40s/it][A
Training...:  55% 7700/13907 [4:57:10<2:14:13,  1.30s/it][A
Training...:  55% 7701/13907 [4:57:14<3:30:22,  2.03s/it][A
Training...:  55% 7702/13907 [4:57:18<4:15:45,  2.47s/it][A
Training...:  55% 7703/13907 [4:57:21<4:40:09,  2.71s/it][A
Training...:  55% 7704/13907 [4:57:24<4:52:37,  2.83s/it][A
Training...:  55% 7705/13907 [4:57:27<4:59:21,  2.90s/it][A
Training...:  55% 7706/13907 [4:57:30<5:01:29,  2.92s/it][A
Training...:  55% 7707/13907 [4:57:33<5:01:56,  2.92s/it][A
Training...:  55% 7708/13907 [4:57:36<5:00:17,  2.91s/it][A
Training...:  55% 7709/13907 [4:57:39<4:58:13,  2.89s/it][A
Training...:  55% 7710/13907 [4:57:41<4:52:43,  2.83s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:27:56<17:31:07, 31533.87s/it]
Training...:  55% 7710/13907 [4:57:45<4:52:43,  2.83s/it][A
Training...:  55% 7711/13907 [4:57:45<5:01:17,  2.92s/it][A
Training...:  55% 7712/13907 [4:57:47<4:55:06,  2.86s/it][A
Training...:  55% 7713/13907 [4:57:50<4:48:18,  2.79s/it][A
Training...:  55% 7714/13907 [4:57:52<4:42:29,  2.74s/it][A
Training...:  55% 7715/13907 [4:57:55<4:38:00,  2.69s/it][A
Training...:  55% 7716/13907 [4:57:58<4:31:25,  2.63s/it][A
Training...:  55% 7717/13907 [4:58:00<4:26:21,  2.58s/it][A
Training...:  55% 7718/13907 [4:58:02<4:21:14,  2.53s/it][A
Training...:  56% 7719/13907 [4:58:05<4:17:37,  2.50s/it][A
Training...:  56% 7720/13907 [4:58:07<4:12:57,  2.45s/it][A
Training...:  56% 7721/13907 [4:58:10<4:08:45,  2.41s/it][A
Training...:  56% 7722/13907 [4:58:12<4:04:21,  2.37s/it][A
Training...:  56% 7723/13907 [4:58:14<4:00:07,  2.33s/it][A
Training...:  56% 7724/13907 [4:58:16<3:56:32,  2.30s/it][A
Training...:  56% 7725/13907 [4:58:18<3:52:59,  2.26s/it][A
Training...:  56% 7726/13907 [4:58:21<3:49:33,  2.23s/it][A
Training...:  56% 7727/13907 [4:58:23<3:46:24,  2.20s/it][A
Training...:  56% 7728/13907 [4:58:25<3:42:07,  2.16s/it][A
Training...:  56% 7729/13907 [4:58:27<3:38:33,  2.12s/it][A
Training...:  56% 7730/13907 [4:58:29<3:34:41,  2.09s/it][A
Training...:  56% 7731/13907 [4:58:31<3:31:31,  2.05s/it][A
Training...:  56% 7732/13907 [4:58:33<3:28:26,  2.03s/it][A
Training...:  56% 7733/13907 [4:58:35<3:25:35,  2.00s/it][A
Training...:  56% 7734/13907 [4:58:37<3:22:35,  1.97s/it][A
Training...:  56% 7735/13907 [4:58:39<3:20:21,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:28:52<17:31:07, 31533.87s/it]
Training...:  56% 7735/13907 [4:58:41<3:20:21,  1.95s/it][A
Training...:  56% 7736/13907 [4:58:41<3:27:06,  2.01s/it][A
Training...:  56% 7737/13907 [4:58:43<3:23:08,  1.98s/it][A
Training...:  56% 7738/13907 [4:58:44<3:17:51,  1.92s/it][A
Training...:  56% 7739/13907 [4:58:46<3:13:02,  1.88s/it][A
Training...:  56% 7740/13907 [4:58:48<3:08:03,  1.83s/it][A
Training...:  56% 7741/13907 [4:58:50<3:04:09,  1.79s/it][A
Training...:  56% 7742/13907 [4:58:51<3:00:18,  1.75s/it][A
Training...:  56% 7743/13907 [4:58:53<2:57:26,  1.73s/it][A
Training...:  56% 7744/13907 [4:58:54<2:52:41,  1.68s/it][A
Training...:  56% 7745/13907 [4:58:56<2:49:22,  1.65s/it][A
Training...:  56% 7746/13907 [4:58:57<2:43:45,  1.59s/it][A
Training...:  56% 7747/13907 [4:58:59<2:37:48,  1.54s/it][A
Training...:  56% 7748/13907 [4:59:00<2:31:49,  1.48s/it][A
Training...:  56% 7749/13907 [4:59:01<2:24:33,  1.41s/it][A
Training...:  56% 7750/13907 [4:59:03<2:14:37,  1.31s/it][A
Training...:  56% 7751/13907 [4:59:07<3:35:03,  2.10s/it][A
Training...:  56% 7752/13907 [4:59:10<4:16:32,  2.50s/it][A
Training...:  56% 7753/13907 [4:59:13<4:37:34,  2.71s/it][A
Training...:  56% 7754/13907 [4:59:16<4:49:38,  2.82s/it][A
Training...:  56% 7755/13907 [4:59:19<4:54:42,  2.87s/it][A
Training...:  56% 7756/13907 [4:59:22<4:55:51,  2.89s/it][A
Training...:  56% 7757/13907 [4:59:25<4:56:11,  2.89s/it][A
Training...:  56% 7758/13907 [4:59:28<4:54:05,  2.87s/it][A
Training...:  56% 7759/13907 [4:59:31<4:50:36,  2.84s/it][A
Training...:  56% 7760/13907 [4:59:33<4:45:57,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:29:47<17:31:07, 31533.87s/it]
Training...:  56% 7760/13907 [4:59:36<4:45:57,  2.79s/it][A
Training...:  56% 7761/13907 [4:59:36<4:54:24,  2.87s/it][A
Training...:  56% 7762/13907 [4:59:39<4:47:39,  2.81s/it][A
Training...:  56% 7763/13907 [4:59:42<4:40:14,  2.74s/it][A
Training...:  56% 7764/13907 [4:59:44<4:33:03,  2.67s/it][A
Training...:  56% 7765/13907 [4:59:47<4:27:56,  2.62s/it][A
Training...:  56% 7766/13907 [4:59:49<4:21:25,  2.55s/it][A
Training...:  56% 7767/13907 [4:59:51<4:16:59,  2.51s/it][A
Training...:  56% 7768/13907 [4:59:54<4:13:36,  2.48s/it][A
Training...:  56% 7769/13907 [4:59:56<4:09:51,  2.44s/it][A
Training...:  56% 7770/13907 [4:59:58<4:05:36,  2.40s/it][A
Training...:  56% 7771/13907 [5:00:01<4:01:41,  2.36s/it][A
Training...:  56% 7772/13907 [5:00:03<3:58:32,  2.33s/it][A
Training...:  56% 7773/13907 [5:00:05<3:54:48,  2.30s/it][A
Training...:  56% 7774/13907 [5:00:07<3:51:32,  2.27s/it][A
Training...:  56% 7775/13907 [5:00:10<3:49:18,  2.24s/it][A
Training...:  56% 7776/13907 [5:00:12<3:45:46,  2.21s/it][A
Training...:  56% 7777/13907 [5:00:14<3:42:50,  2.18s/it][A
Training...:  56% 7778/13907 [5:00:16<3:39:48,  2.15s/it][A
Training...:  56% 7779/13907 [5:00:18<3:37:11,  2.13s/it][A
Training...:  56% 7780/13907 [5:00:20<3:33:36,  2.09s/it][A
Training...:  56% 7781/13907 [5:00:22<3:29:45,  2.05s/it][A
Training...:  56% 7782/13907 [5:00:24<3:26:31,  2.02s/it][A
Training...:  56% 7783/13907 [5:00:26<3:24:16,  2.00s/it][A
Training...:  56% 7784/13907 [5:00:28<3:20:51,  1.97s/it][A
Training...:  56% 7785/13907 [5:00:30<3:18:06,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:30:43<17:31:07, 31533.87s/it]
Training...:  56% 7785/13907 [5:00:32<3:18:06,  1.94s/it][A
Training...:  56% 7786/13907 [5:00:32<3:24:43,  2.01s/it][A
Training...:  56% 7787/13907 [5:00:34<3:20:39,  1.97s/it][A
Training...:  56% 7788/13907 [5:00:35<3:14:54,  1.91s/it][A
Training...:  56% 7789/13907 [5:00:37<3:10:44,  1.87s/it][A
Training...:  56% 7790/13907 [5:00:39<3:06:26,  1.83s/it][A
Training...:  56% 7791/13907 [5:00:41<3:02:24,  1.79s/it][A
Training...:  56% 7792/13907 [5:00:42<2:58:21,  1.75s/it][A
Training...:  56% 7793/13907 [5:00:44<2:54:21,  1.71s/it][A
Training...:  56% 7794/13907 [5:00:46<2:50:55,  1.68s/it][A
Training...:  56% 7795/13907 [5:00:47<2:46:03,  1.63s/it][A
Training...:  56% 7796/13907 [5:00:49<2:40:45,  1.58s/it][A
Training...:  56% 7797/13907 [5:00:50<2:35:09,  1.52s/it][A
Training...:  56% 7798/13907 [5:00:51<2:29:33,  1.47s/it][A
Training...:  56% 7799/13907 [5:00:53<2:22:38,  1.40s/it][A
Training...:  56% 7800/13907 [5:00:54<2:12:24,  1.30s/it][A
Training...:  56% 7801/13907 [5:00:57<3:26:25,  2.03s/it][A
Training...:  56% 7802/13907 [5:01:01<4:10:10,  2.46s/it][A
Training...:  56% 7803/13907 [5:01:04<4:33:55,  2.69s/it][A
Training...:  56% 7804/13907 [5:01:07<4:47:22,  2.83s/it][A
Training...:  56% 7805/13907 [5:01:10<4:54:06,  2.89s/it][A
Training...:  56% 7806/13907 [5:01:13<4:56:21,  2.91s/it][A
Training...:  56% 7807/13907 [5:01:16<4:55:37,  2.91s/it][A
Training...:  56% 7808/13907 [5:01:19<4:55:11,  2.90s/it][A
Training...:  56% 7809/13907 [5:01:22<4:53:49,  2.89s/it][A
Training...:  56% 7810/13907 [5:01:25<4:48:28,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:31:39<17:31:07, 31533.87s/it]
Training...:  56% 7810/13907 [5:01:28<4:48:28,  2.84s/it][A
Training...:  56% 7811/13907 [5:01:28<4:56:58,  2.92s/it][A
Training...:  56% 7812/13907 [5:01:30<4:51:05,  2.87s/it][A
Training...:  56% 7813/13907 [5:01:33<4:42:19,  2.78s/it][A
Training...:  56% 7814/13907 [5:01:35<4:34:55,  2.71s/it][A
Training...:  56% 7815/13907 [5:01:38<4:28:50,  2.65s/it][A
Training...:  56% 7816/13907 [5:01:40<4:23:13,  2.59s/it][A
Training...:  56% 7817/13907 [5:01:43<4:19:06,  2.55s/it][A
Training...:  56% 7818/13907 [5:01:45<4:14:27,  2.51s/it][A
Training...:  56% 7819/13907 [5:01:48<4:10:18,  2.47s/it][A
Training...:  56% 7820/13907 [5:01:50<4:06:22,  2.43s/it][A
Training...:  56% 7821/13907 [5:01:52<4:02:23,  2.39s/it][A
Training...:  56% 7822/13907 [5:01:55<3:58:24,  2.35s/it][A
Training...:  56% 7823/13907 [5:01:57<3:55:04,  2.32s/it][A
Training...:  56% 7824/13907 [5:01:59<3:51:26,  2.28s/it][A
Training...:  56% 7825/13907 [5:02:01<3:48:34,  2.25s/it][A
Training...:  56% 7826/13907 [5:02:03<3:45:52,  2.23s/it][A
Training...:  56% 7827/13907 [5:02:06<3:42:05,  2.19s/it][A
Training...:  56% 7828/13907 [5:02:08<3:39:00,  2.16s/it][A
Training...:  56% 7829/13907 [5:02:10<3:35:56,  2.13s/it][A
Training...:  56% 7830/13907 [5:02:12<3:32:54,  2.10s/it][A
Training...:  56% 7831/13907 [5:02:14<3:29:36,  2.07s/it][A
Training...:  56% 7832/13907 [5:02:16<3:26:08,  2.04s/it][A
Training...:  56% 7833/13907 [5:02:18<3:22:56,  2.00s/it][A
Training...:  56% 7834/13907 [5:02:19<3:20:26,  1.98s/it][A
Training...:  56% 7835/13907 [5:02:21<3:18:40,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:32:35<17:31:07, 31533.87s/it]
Training...:  56% 7835/13907 [5:02:24<3:18:40,  1.96s/it][A
Training...:  56% 7836/13907 [5:02:24<3:24:39,  2.02s/it][A
Training...:  56% 7837/13907 [5:02:25<3:20:20,  1.98s/it][A
Training...:  56% 7838/13907 [5:02:27<3:13:51,  1.92s/it][A
Training...:  56% 7839/13907 [5:02:29<3:09:51,  1.88s/it][A
Training...:  56% 7840/13907 [5:02:31<3:04:59,  1.83s/it][A
Training...:  56% 7841/13907 [5:02:32<3:01:14,  1.79s/it][A
Training...:  56% 7842/13907 [5:02:34<2:56:26,  1.75s/it][A
Training...:  56% 7843/13907 [5:02:36<2:51:44,  1.70s/it][A
Training...:  56% 7844/13907 [5:02:37<2:48:39,  1.67s/it][A
Training...:  56% 7845/13907 [5:02:39<2:44:41,  1.63s/it][A
Training...:  56% 7846/13907 [5:02:40<2:40:09,  1.59s/it][A
Training...:  56% 7847/13907 [5:02:42<2:35:23,  1.54s/it][A
Training...:  56% 7848/13907 [5:02:43<2:28:39,  1.47s/it][A
Training...:  56% 7849/13907 [5:02:44<2:21:12,  1.40s/it][A
Training...:  56% 7850/13907 [5:02:45<2:10:53,  1.30s/it][A
Training...:  56% 7851/13907 [5:02:49<3:25:08,  2.03s/it][A
Training...:  56% 7852/13907 [5:02:53<4:10:49,  2.49s/it][A
Training...:  56% 7853/13907 [5:02:56<4:35:21,  2.73s/it][A
Training...:  56% 7854/13907 [5:02:59<4:48:12,  2.86s/it][A
Training...:  56% 7855/13907 [5:03:02<4:54:13,  2.92s/it][A
Training...:  56% 7856/13907 [5:03:05<4:55:13,  2.93s/it][A
Training...:  56% 7857/13907 [5:03:08<4:53:46,  2.91s/it][A
Training...:  57% 7858/13907 [5:03:11<4:51:29,  2.89s/it][A
Training...:  57% 7859/13907 [5:03:14<4:47:55,  2.86s/it][A
Training...:  57% 7860/13907 [5:03:16<4:45:16,  2.83s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:33:30<17:31:07, 31533.87s/it]
Training...:  57% 7860/13907 [5:03:19<4:45:16,  2.83s/it][A
Training...:  57% 7861/13907 [5:03:19<4:52:59,  2.91s/it][A
Training...:  57% 7862/13907 [5:03:22<4:46:15,  2.84s/it][A
Training...:  57% 7863/13907 [5:03:25<4:37:50,  2.76s/it][A
Training...:  57% 7864/13907 [5:03:27<4:31:05,  2.69s/it][A
Training...:  57% 7865/13907 [5:03:30<4:24:54,  2.63s/it][A
Training...:  57% 7866/13907 [5:03:32<4:19:05,  2.57s/it][A
Training...:  57% 7867/13907 [5:03:35<4:14:31,  2.53s/it][A
Training...:  57% 7868/13907 [5:03:37<4:09:58,  2.48s/it][A
Training...:  57% 7869/13907 [5:03:39<4:05:52,  2.44s/it][A
Training...:  57% 7870/13907 [5:03:42<4:01:34,  2.40s/it][A
Training...:  57% 7871/13907 [5:03:44<3:59:10,  2.38s/it][A
Training...:  57% 7872/13907 [5:03:46<3:54:56,  2.34s/it][A
Training...:  57% 7873/13907 [5:03:48<3:51:06,  2.30s/it][A
Training...:  57% 7874/13907 [5:03:51<3:47:55,  2.27s/it][A
Training...:  57% 7875/13907 [5:03:53<3:44:45,  2.24s/it][A
Training...:  57% 7876/13907 [5:03:55<3:41:24,  2.20s/it][A
Training...:  57% 7877/13907 [5:03:57<3:37:55,  2.17s/it][A
Training...:  57% 7878/13907 [5:03:59<3:35:04,  2.14s/it][A
Training...:  57% 7879/13907 [5:04:01<3:32:15,  2.11s/it][A
Training...:  57% 7880/13907 [5:04:03<3:29:15,  2.08s/it][A
Training...:  57% 7881/13907 [5:04:05<3:26:32,  2.06s/it][A
Training...:  57% 7882/13907 [5:04:07<3:24:00,  2.03s/it][A
Training...:  57% 7883/13907 [5:04:09<3:21:09,  2.00s/it][A
Training...:  57% 7884/13907 [5:04:11<3:18:45,  1.98s/it][A
Training...:  57% 7885/13907 [5:04:13<3:16:09,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:34:26<17:31:07, 31533.87s/it]
Training...:  57% 7885/13907 [5:04:15<3:16:09,  1.95s/it][A
Training...:  57% 7886/13907 [5:04:15<3:22:46,  2.02s/it][A
Training...:  57% 7887/13907 [5:04:17<3:18:30,  1.98s/it][A
Training...:  57% 7888/13907 [5:04:19<3:12:54,  1.92s/it][A
Training...:  57% 7889/13907 [5:04:20<3:07:55,  1.87s/it][A
Training...:  57% 7890/13907 [5:04:22<3:03:30,  1.83s/it][A
Training...:  57% 7891/13907 [5:04:24<2:59:23,  1.79s/it][A
Training...:  57% 7892/13907 [5:04:25<2:55:12,  1.75s/it][A
Training...:  57% 7893/13907 [5:04:27<2:51:14,  1.71s/it][A
Training...:  57% 7894/13907 [5:04:29<2:47:15,  1.67s/it][A
Training...:  57% 7895/13907 [5:04:30<2:43:09,  1.63s/it][A
Training...:  57% 7896/13907 [5:04:32<2:37:17,  1.57s/it][A
Training...:  57% 7897/13907 [5:04:33<2:32:04,  1.52s/it][A
Training...:  57% 7898/13907 [5:04:34<2:26:02,  1.46s/it][A
Training...:  57% 7899/13907 [5:04:36<2:19:04,  1.39s/it][A
Training...:  57% 7900/13907 [5:04:37<2:08:57,  1.29s/it][A
Training...:  57% 7901/13907 [5:04:40<3:22:58,  2.03s/it][A
Training...:  57% 7902/13907 [5:04:44<4:08:11,  2.48s/it][A
Training...:  57% 7903/13907 [5:04:47<4:32:36,  2.72s/it][A
Training...:  57% 7904/13907 [5:04:50<4:45:38,  2.85s/it][A
Training...:  57% 7905/13907 [5:04:54<4:53:49,  2.94s/it][A
Training...:  57% 7906/13907 [5:04:57<4:57:21,  2.97s/it][A
Training...:  57% 7907/13907 [5:05:00<4:58:35,  2.99s/it][A
Training...:  57% 7908/13907 [5:05:02<4:55:11,  2.95s/it][A
Training...:  57% 7909/13907 [5:05:05<4:49:36,  2.90s/it][A
Training...:  57% 7910/13907 [5:05:08<4:43:38,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:35:22<17:31:07, 31533.87s/it]
Training...:  57% 7910/13907 [5:05:11<4:43:38,  2.84s/it][A
Training...:  57% 7911/13907 [5:05:11<4:50:35,  2.91s/it][A
Training...:  57% 7912/13907 [5:05:14<4:44:03,  2.84s/it][A
Training...:  57% 7913/13907 [5:05:16<4:36:17,  2.77s/it][A
Training...:  57% 7914/13907 [5:05:19<4:29:26,  2.70s/it][A
Training...:  57% 7915/13907 [5:05:21<4:26:00,  2.66s/it][A
Training...:  57% 7916/13907 [5:05:24<4:20:34,  2.61s/it][A
Training...:  57% 7917/13907 [5:05:26<4:15:16,  2.56s/it][A
Training...:  57% 7918/13907 [5:05:29<4:09:50,  2.50s/it][A
Training...:  57% 7919/13907 [5:05:31<4:05:58,  2.46s/it][A
Training...:  57% 7920/13907 [5:05:33<4:00:59,  2.42s/it][A
Training...:  57% 7921/13907 [5:05:36<3:57:48,  2.38s/it][A
Training...:  57% 7922/13907 [5:05:38<3:54:42,  2.35s/it][A
Training...:  57% 7923/13907 [5:05:40<3:51:33,  2.32s/it][A
Training...:  57% 7924/13907 [5:05:42<3:48:51,  2.30s/it][A
Training...:  57% 7925/13907 [5:05:45<3:45:06,  2.26s/it][A
Training...:  57% 7926/13907 [5:05:47<3:41:43,  2.22s/it][A
Training...:  57% 7927/13907 [5:05:49<3:38:56,  2.20s/it][A
Training...:  57% 7928/13907 [5:05:51<3:36:40,  2.17s/it][A
Training...:  57% 7929/13907 [5:05:53<3:33:57,  2.15s/it][A
Training...:  57% 7930/13907 [5:05:55<3:31:17,  2.12s/it][A
Training...:  57% 7931/13907 [5:05:57<3:28:34,  2.09s/it][A
Training...:  57% 7932/13907 [5:05:59<3:25:13,  2.06s/it][A
Training...:  57% 7933/13907 [5:06:01<3:22:59,  2.04s/it][A
Training...:  57% 7934/13907 [5:06:03<3:20:23,  2.01s/it][A
Training...:  57% 7935/13907 [5:06:05<3:18:55,  2.00s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:36:18<17:31:07, 31533.87s/it]
Training...:  57% 7935/13907 [5:06:07<3:18:55,  2.00s/it][A
Training...:  57% 7936/13907 [5:06:07<3:26:36,  2.08s/it][A
Training...:  57% 7937/13907 [5:06:09<3:22:09,  2.03s/it][A
Training...:  57% 7938/13907 [5:06:11<3:15:09,  1.96s/it][A
Training...:  57% 7939/13907 [5:06:13<3:09:10,  1.90s/it][A
Training...:  57% 7940/13907 [5:06:15<3:03:52,  1.85s/it][A
Training...:  57% 7941/13907 [5:06:16<2:59:22,  1.80s/it][A
Training...:  57% 7942/13907 [5:06:18<2:55:22,  1.76s/it][A
Training...:  57% 7943/13907 [5:06:20<2:50:43,  1.72s/it][A
Training...:  57% 7944/13907 [5:06:21<2:46:15,  1.67s/it][A
Training...:  57% 7945/13907 [5:06:23<2:41:23,  1.62s/it][A
Training...:  57% 7946/13907 [5:06:24<2:37:32,  1.59s/it][A
Training...:  57% 7947/13907 [5:06:26<2:32:30,  1.54s/it][A
Training...:  57% 7948/13907 [5:06:27<2:26:40,  1.48s/it][A
Training...:  57% 7949/13907 [5:06:28<2:19:24,  1.40s/it][A
Training...:  57% 7950/13907 [5:06:29<2:08:49,  1.30s/it][A
Training...:  57% 7951/13907 [5:06:33<3:25:43,  2.07s/it][A
Training...:  57% 7952/13907 [5:06:37<4:09:23,  2.51s/it][A
Training...:  57% 7953/13907 [5:06:40<4:32:37,  2.75s/it][A
Training...:  57% 7954/13907 [5:06:43<4:45:21,  2.88s/it][A
Training...:  57% 7955/13907 [5:06:46<4:51:59,  2.94s/it][A
Training...:  57% 7956/13907 [5:06:49<4:53:24,  2.96s/it][A
Training...:  57% 7957/13907 [5:06:52<4:53:13,  2.96s/it][A
Training...:  57% 7958/13907 [5:06:55<4:52:46,  2.95s/it][A
Training...:  57% 7959/13907 [5:06:58<4:49:06,  2.92s/it][A
Training...:  57% 7960/13907 [5:07:01<4:44:30,  2.87s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:37:15<17:31:07, 31533.87s/it]
Training...:  57% 7960/13907 [5:07:04<4:44:30,  2.87s/it][A
Training...:  57% 7961/13907 [5:07:04<4:52:01,  2.95s/it][A
Training...:  57% 7962/13907 [5:07:06<4:43:44,  2.86s/it][A
Training...:  57% 7963/13907 [5:07:09<4:34:19,  2.77s/it][A
Training...:  57% 7964/13907 [5:07:11<4:25:58,  2.69s/it][A
Training...:  57% 7965/13907 [5:07:14<4:20:27,  2.63s/it][A
Training...:  57% 7966/13907 [5:07:16<4:15:55,  2.58s/it][A
Training...:  57% 7967/13907 [5:07:19<4:13:14,  2.56s/it][A
Training...:  57% 7968/13907 [5:07:21<4:11:25,  2.54s/it][A
Training...:  57% 7969/13907 [5:07:24<4:06:08,  2.49s/it][A
Training...:  57% 7970/13907 [5:07:26<4:01:27,  2.44s/it][A
Training...:  57% 7971/13907 [5:07:28<3:57:10,  2.40s/it][A
Training...:  57% 7972/13907 [5:07:31<3:52:15,  2.35s/it][A
Training...:  57% 7973/13907 [5:07:33<3:48:18,  2.31s/it][A
Training...:  57% 7974/13907 [5:07:35<3:45:01,  2.28s/it][A
Training...:  57% 7975/13907 [5:07:37<3:41:24,  2.24s/it][A
Training...:  57% 7976/13907 [5:07:39<3:37:51,  2.20s/it][A
Training...:  57% 7977/13907 [5:07:41<3:34:10,  2.17s/it][A
Training...:  57% 7978/13907 [5:07:44<3:31:36,  2.14s/it][A
Training...:  57% 7979/13907 [5:07:46<3:29:18,  2.12s/it][A
Training...:  57% 7980/13907 [5:07:48<3:25:49,  2.08s/it][A
Training...:  57% 7981/13907 [5:07:50<3:23:08,  2.06s/it][A
Training...:  57% 7982/13907 [5:07:52<3:20:06,  2.03s/it][A
Training...:  57% 7983/13907 [5:07:53<3:17:26,  2.00s/it][A
Training...:  57% 7984/13907 [5:07:55<3:14:54,  1.97s/it][A
Training...:  57% 7985/13907 [5:07:57<3:11:53,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:38:10<17:31:07, 31533.87s/it]
Training...:  57% 7985/13907 [5:07:59<3:11:53,  1.94s/it][A
Training...:  57% 7986/13907 [5:07:59<3:18:42,  2.01s/it][A
Training...:  57% 7987/13907 [5:08:01<3:15:08,  1.98s/it][A
Training...:  57% 7988/13907 [5:08:03<3:09:15,  1.92s/it][A
Training...:  57% 7989/13907 [5:08:05<3:04:53,  1.87s/it][A
Training...:  57% 7990/13907 [5:08:07<3:00:01,  1.83s/it][A
Training...:  57% 7991/13907 [5:08:08<2:55:36,  1.78s/it][A
Training...:  57% 7992/13907 [5:08:10<2:52:12,  1.75s/it][A
Training...:  57% 7993/13907 [5:08:12<2:47:22,  1.70s/it][A
Training...:  57% 7994/13907 [5:08:13<2:43:15,  1.66s/it][A
Training...:  57% 7995/13907 [5:08:15<2:38:48,  1.61s/it][A
Training...:  57% 7996/13907 [5:08:16<2:33:21,  1.56s/it][A
Training...:  58% 7997/13907 [5:08:17<2:28:03,  1.50s/it][A
Training...:  58% 7998/13907 [5:08:19<2:22:30,  1.45s/it][A
Training...:  58% 7999/13907 [5:08:20<2:15:59,  1.38s/it][A
Training...:  58% 8000/13907 [5:08:21<2:06:28,  1.28s/it][A
Training...:  58% 8001/13907 [5:08:25<3:20:30,  2.04s/it][A
Training...:  58% 8002/13907 [5:08:28<4:03:09,  2.47s/it][A
Training...:  58% 8003/13907 [5:08:32<4:26:02,  2.70s/it][A
Training...:  58% 8004/13907 [5:08:35<4:37:59,  2.83s/it][A
Training...:  58% 8005/13907 [5:08:38<4:43:43,  2.88s/it][A
Training...:  58% 8006/13907 [5:08:41<4:45:52,  2.91s/it][A
Training...:  58% 8007/13907 [5:08:44<4:48:20,  2.93s/it][A
Training...:  58% 8008/13907 [5:08:46<4:45:12,  2.90s/it][A
Training...:  58% 8009/13907 [5:08:49<4:41:19,  2.86s/it][A
Training...:  58% 8010/13907 [5:08:52<4:36:05,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:39:06<17:31:07, 31533.87s/it]
Training...:  58% 8010/13907 [5:08:55<4:36:05,  2.81s/it][A
Training...:  58% 8011/13907 [5:08:55<4:42:55,  2.88s/it][A
Training...:  58% 8012/13907 [5:08:58<4:38:00,  2.83s/it][A
Training...:  58% 8013/13907 [5:09:00<4:29:36,  2.74s/it][A
Training...:  58% 8014/13907 [5:09:03<4:22:10,  2.67s/it][A
Training...:  58% 8015/13907 [5:09:05<4:16:42,  2.61s/it][A
Training...:  58% 8016/13907 [5:09:08<4:10:57,  2.56s/it][A
Training...:  58% 8017/13907 [5:09:10<4:06:35,  2.51s/it][A
Training...:  58% 8018/13907 [5:09:12<4:02:51,  2.47s/it][A
Training...:  58% 8019/13907 [5:09:15<3:59:31,  2.44s/it][A
Training...:  58% 8020/13907 [5:09:17<3:56:55,  2.41s/it][A
Training...:  58% 8021/13907 [5:09:19<3:54:49,  2.39s/it][A
Training...:  58% 8022/13907 [5:09:22<3:51:08,  2.36s/it][A
Training...:  58% 8023/13907 [5:09:24<3:48:44,  2.33s/it][A
Training...:  58% 8024/13907 [5:09:26<3:45:30,  2.30s/it][A
Training...:  58% 8025/13907 [5:09:28<3:43:21,  2.28s/it][A
Training...:  58% 8026/13907 [5:09:31<3:40:04,  2.25s/it][A
Training...:  58% 8027/13907 [5:09:33<3:37:07,  2.22s/it][A
Training...:  58% 8028/13907 [5:09:35<3:33:32,  2.18s/it][A
Training...:  58% 8029/13907 [5:09:37<3:29:56,  2.14s/it][A
Training...:  58% 8030/13907 [5:09:39<3:27:03,  2.11s/it][A
Training...:  58% 8031/13907 [5:09:41<3:23:52,  2.08s/it][A
Training...:  58% 8032/13907 [5:09:43<3:20:55,  2.05s/it][A
Training...:  58% 8033/13907 [5:09:45<3:18:07,  2.02s/it][A
Training...:  58% 8034/13907 [5:09:47<3:15:40,  2.00s/it][A
Training...:  58% 8035/13907 [5:09:49<3:13:10,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:40:02<17:31:07, 31533.87s/it]
Training...:  58% 8035/13907 [5:09:51<3:13:10,  1.97s/it][A
Training...:  58% 8036/13907 [5:09:51<3:19:39,  2.04s/it][A
Training...:  58% 8037/13907 [5:09:53<3:13:45,  1.98s/it][A
Training...:  58% 8038/13907 [5:09:55<3:06:44,  1.91s/it][A
Training...:  58% 8039/13907 [5:09:56<3:01:29,  1.86s/it][A
Training...:  58% 8040/13907 [5:09:58<2:56:29,  1.80s/it][A
Training...:  58% 8041/13907 [5:10:00<2:51:57,  1.76s/it][A
Training...:  58% 8042/13907 [5:10:01<2:47:47,  1.72s/it][A
Training...:  58% 8043/13907 [5:10:03<2:44:39,  1.68s/it][A
Training...:  58% 8044/13907 [5:10:04<2:41:39,  1.65s/it][A
Training...:  58% 8045/13907 [5:10:06<2:37:15,  1.61s/it][A
Training...:  58% 8046/13907 [5:10:07<2:33:10,  1.57s/it][A
Training...:  58% 8047/13907 [5:10:09<2:28:47,  1.52s/it][A
Training...:  58% 8048/13907 [5:10:10<2:23:11,  1.47s/it][A
Training...:  58% 8049/13907 [5:10:11<2:15:39,  1.39s/it][A
Training...:  58% 8050/13907 [5:10:12<2:05:40,  1.29s/it][A
Training...:  58% 8051/13907 [5:10:16<3:18:34,  2.03s/it][A
Training...:  58% 8052/13907 [5:10:20<4:01:25,  2.47s/it][A
Training...:  58% 8053/13907 [5:10:23<4:24:56,  2.72s/it][A
Training...:  58% 8054/13907 [5:10:26<4:37:41,  2.85s/it][A
Training...:  58% 8055/13907 [5:10:29<4:44:17,  2.91s/it][A
Training...:  58% 8056/13907 [5:10:32<4:45:20,  2.93s/it][A
Training...:  58% 8057/13907 [5:10:35<4:43:28,  2.91s/it][A
Training...:  58% 8058/13907 [5:10:38<4:40:41,  2.88s/it][A
Training...:  58% 8059/13907 [5:10:41<4:37:07,  2.84s/it][A
Training...:  58% 8060/13907 [5:10:43<4:33:16,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:40:57<17:31:07, 31533.87s/it]
Training...:  58% 8060/13907 [5:10:46<4:33:16,  2.80s/it][A
Training...:  58% 8061/13907 [5:10:46<4:40:08,  2.88s/it][A
Training...:  58% 8062/13907 [5:10:49<4:34:42,  2.82s/it][A
Training...:  58% 8063/13907 [5:10:52<4:27:23,  2.75s/it][A
Training...:  58% 8064/13907 [5:10:54<4:20:29,  2.67s/it][A
Training...:  58% 8065/13907 [5:10:57<4:15:52,  2.63s/it][A
Training...:  58% 8066/13907 [5:10:59<4:13:06,  2.60s/it][A
Training...:  58% 8067/13907 [5:11:02<4:09:55,  2.57s/it][A
Training...:  58% 8068/13907 [5:11:04<4:06:32,  2.53s/it][A
Training...:  58% 8069/13907 [5:11:06<4:01:20,  2.48s/it][A
Training...:  58% 8070/13907 [5:11:09<3:56:37,  2.43s/it][A
Training...:  58% 8071/13907 [5:11:11<3:54:16,  2.41s/it][A
Training...:  58% 8072/13907 [5:11:13<3:50:49,  2.37s/it][A
Training...:  58% 8073/13907 [5:11:16<3:47:06,  2.34s/it][A
Training...:  58% 8074/13907 [5:11:18<3:43:58,  2.30s/it][A
Training...:  58% 8075/13907 [5:11:20<3:41:29,  2.28s/it][A
Training...:  58% 8076/13907 [5:11:22<3:39:32,  2.26s/it][A
Training...:  58% 8077/13907 [5:11:25<3:37:55,  2.24s/it][A
Training...:  58% 8078/13907 [5:11:27<3:34:05,  2.20s/it][A
Training...:  58% 8079/13907 [5:11:29<3:30:13,  2.16s/it][A
Training...:  58% 8080/13907 [5:11:31<3:27:12,  2.13s/it][A
Training...:  58% 8081/13907 [5:11:33<3:23:27,  2.10s/it][A
Training...:  58% 8082/13907 [5:11:35<3:20:15,  2.06s/it][A
Training...:  58% 8083/13907 [5:11:37<3:16:37,  2.03s/it][A
Training...:  58% 8084/13907 [5:11:39<3:13:40,  2.00s/it][A
Training...:  58% 8085/13907 [5:11:40<3:09:06,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:41:54<17:31:07, 31533.87s/it]
Training...:  58% 8085/13907 [5:11:43<3:09:06,  1.95s/it][A
Training...:  58% 8086/13907 [5:11:43<3:15:57,  2.02s/it][A
Training...:  58% 8087/13907 [5:11:45<3:10:44,  1.97s/it][A
Training...:  58% 8088/13907 [5:11:46<3:04:03,  1.90s/it][A
Training...:  58% 8089/13907 [5:11:48<2:58:26,  1.84s/it][A
Training...:  58% 8090/13907 [5:11:50<2:53:27,  1.79s/it][A
Training...:  58% 8091/13907 [5:11:51<2:49:35,  1.75s/it][A
Training...:  58% 8092/13907 [5:11:53<2:45:48,  1.71s/it][A
Training...:  58% 8093/13907 [5:11:54<2:41:59,  1.67s/it][A
Training...:  58% 8094/13907 [5:11:56<2:38:48,  1.64s/it][A
Training...:  58% 8095/13907 [5:11:58<2:34:41,  1.60s/it][A
Training...:  58% 8096/13907 [5:11:59<2:30:04,  1.55s/it][A
Training...:  58% 8097/13907 [5:12:00<2:25:20,  1.50s/it][A
Training...:  58% 8098/13907 [5:12:02<2:19:47,  1.44s/it][A
Training...:  58% 8099/13907 [5:12:03<2:13:33,  1.38s/it][A
Training...:  58% 8100/13907 [5:12:04<2:03:30,  1.28s/it][A
Training...:  58% 8101/13907 [5:12:08<3:14:02,  2.01s/it][A
Training...:  58% 8102/13907 [5:12:11<3:58:22,  2.46s/it][A
Training...:  58% 8103/13907 [5:12:14<4:20:18,  2.69s/it][A
Training...:  58% 8104/13907 [5:12:17<4:31:35,  2.81s/it][A
Training...:  58% 8105/13907 [5:12:21<4:38:18,  2.88s/it][A
Training...:  58% 8106/13907 [5:12:23<4:40:34,  2.90s/it][A
Training...:  58% 8107/13907 [5:12:26<4:39:37,  2.89s/it][A
Training...:  58% 8108/13907 [5:12:29<4:37:46,  2.87s/it][A
Training...:  58% 8109/13907 [5:12:32<4:33:48,  2.83s/it][A
Training...:  58% 8110/13907 [5:12:35<4:29:36,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:42:49<17:31:07, 31533.87s/it]
Training...:  58% 8110/13907 [5:12:38<4:29:36,  2.79s/it][A
Training...:  58% 8111/13907 [5:12:38<4:37:10,  2.87s/it][A
Training...:  58% 8112/13907 [5:12:40<4:32:08,  2.82s/it][A
Training...:  58% 8113/13907 [5:12:43<4:25:45,  2.75s/it][A
Training...:  58% 8114/13907 [5:12:45<4:19:17,  2.69s/it][A
Training...:  58% 8115/13907 [5:12:48<4:16:39,  2.66s/it][A
Training...:  58% 8116/13907 [5:12:51<4:14:32,  2.64s/it][A
Training...:  58% 8117/13907 [5:12:53<4:09:46,  2.59s/it][A
Training...:  58% 8118/13907 [5:12:56<4:03:44,  2.53s/it][A
Training...:  58% 8119/13907 [5:12:58<4:00:42,  2.50s/it][A
Training...:  58% 8120/13907 [5:13:00<3:57:19,  2.46s/it][A
Training...:  58% 8121/13907 [5:13:03<3:54:37,  2.43s/it][A
Training...:  58% 8122/13907 [5:13:05<3:52:45,  2.41s/it][A
Training...:  58% 8123/13907 [5:13:07<3:49:20,  2.38s/it][A
Training...:  58% 8124/13907 [5:13:10<3:43:47,  2.32s/it][A
Training...:  58% 8125/13907 [5:13:12<3:39:47,  2.28s/it][A
Training...:  58% 8126/13907 [5:13:14<3:36:45,  2.25s/it][A
Training...:  58% 8127/13907 [5:13:16<3:32:38,  2.21s/it][A
Training...:  58% 8128/13907 [5:13:18<3:28:46,  2.17s/it][A
Training...:  58% 8129/13907 [5:13:20<3:25:42,  2.14s/it][A
Training...:  58% 8130/13907 [5:13:22<3:21:51,  2.10s/it][A
Training...:  58% 8131/13907 [5:13:24<3:18:52,  2.07s/it][A
Training...:  58% 8132/13907 [5:13:26<3:15:59,  2.04s/it][A
Training...:  58% 8133/13907 [5:13:28<3:13:41,  2.01s/it][A
Training...:  58% 8134/13907 [5:13:30<3:10:50,  1.98s/it][A
Training...:  58% 8135/13907 [5:13:32<3:09:34,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:43:45<17:31:07, 31533.87s/it]
Training...:  58% 8135/13907 [5:13:34<3:09:34,  1.97s/it][A
Training...:  59% 8136/13907 [5:13:34<3:16:47,  2.05s/it][A
Training...:  59% 8137/13907 [5:13:36<3:12:54,  2.01s/it][A
Training...:  59% 8138/13907 [5:13:38<3:07:15,  1.95s/it][A
Training...:  59% 8139/13907 [5:13:40<3:01:56,  1.89s/it][A
Training...:  59% 8140/13907 [5:13:41<2:57:40,  1.85s/it][A
Training...:  59% 8141/13907 [5:13:43<2:54:14,  1.81s/it][A
Training...:  59% 8142/13907 [5:13:45<2:49:54,  1.77s/it][A
Training...:  59% 8143/13907 [5:13:46<2:46:10,  1.73s/it][A
Training...:  59% 8144/13907 [5:13:48<2:42:12,  1.69s/it][A
Training...:  59% 8145/13907 [5:13:50<2:38:41,  1.65s/it][A
Training...:  59% 8146/13907 [5:13:51<2:34:02,  1.60s/it][A
Training...:  59% 8147/13907 [5:13:52<2:28:25,  1.55s/it][A
Training...:  59% 8148/13907 [5:13:54<2:22:14,  1.48s/it][A
Training...:  59% 8149/13907 [5:13:55<2:15:08,  1.41s/it][A
Training...:  59% 8150/13907 [5:13:56<2:05:15,  1.31s/it][A
Training...:  59% 8151/13907 [5:14:00<3:14:28,  2.03s/it][A
Training...:  59% 8152/13907 [5:14:03<3:55:50,  2.46s/it][A
Training...:  59% 8153/13907 [5:14:07<4:19:48,  2.71s/it][A
Training...:  59% 8154/13907 [5:14:10<4:36:10,  2.88s/it][A
Training...:  59% 8155/13907 [5:14:13<4:43:51,  2.96s/it][A
Training...:  59% 8156/13907 [5:14:16<4:43:49,  2.96s/it][A
Training...:  59% 8157/13907 [5:14:19<4:42:12,  2.94s/it][A
Training...:  59% 8158/13907 [5:14:22<4:37:56,  2.90s/it][A
Training...:  59% 8159/13907 [5:14:24<4:33:54,  2.86s/it][A
Training...:  59% 8160/13907 [5:14:27<4:29:49,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:44:41<17:31:07, 31533.87s/it]
Training...:  59% 8160/13907 [5:14:30<4:29:49,  2.82s/it][A
Training...:  59% 8161/13907 [5:14:30<4:38:08,  2.90s/it][A
Training...:  59% 8162/13907 [5:14:33<4:32:53,  2.85s/it][A
Training...:  59% 8163/13907 [5:14:36<4:26:26,  2.78s/it][A
Training...:  59% 8164/13907 [5:14:38<4:19:30,  2.71s/it][A
Training...:  59% 8165/13907 [5:14:41<4:14:17,  2.66s/it][A
Training...:  59% 8166/13907 [5:14:43<4:08:55,  2.60s/it][A
Training...:  59% 8167/13907 [5:14:46<4:04:48,  2.56s/it][A
Training...:  59% 8168/13907 [5:14:48<4:02:26,  2.53s/it][A
Training...:  59% 8169/13907 [5:14:50<3:57:59,  2.49s/it][A
Training...:  59% 8170/13907 [5:14:53<3:55:26,  2.46s/it][A
Training...:  59% 8171/13907 [5:14:55<3:53:10,  2.44s/it][A
Training...:  59% 8172/13907 [5:14:58<3:50:33,  2.41s/it][A
Training...:  59% 8173/13907 [5:15:00<3:47:27,  2.38s/it][A
Training...:  59% 8174/13907 [5:15:02<3:43:41,  2.34s/it][A
Training...:  59% 8175/13907 [5:15:04<3:40:54,  2.31s/it][A
Training...:  59% 8176/13907 [5:15:07<3:38:35,  2.29s/it][A
Training...:  59% 8177/13907 [5:15:09<3:35:25,  2.26s/it][A
Training...:  59% 8178/13907 [5:15:11<3:32:37,  2.23s/it][A
Training...:  59% 8179/13907 [5:15:13<3:30:44,  2.21s/it][A
Training...:  59% 8180/13907 [5:15:15<3:28:23,  2.18s/it][A
Training...:  59% 8181/13907 [5:15:17<3:25:19,  2.15s/it][A
Training...:  59% 8182/13907 [5:15:19<3:21:26,  2.11s/it][A
Training...:  59% 8183/13907 [5:15:21<3:17:44,  2.07s/it][A
Training...:  59% 8184/13907 [5:15:23<3:14:11,  2.04s/it][A
Training...:  59% 8185/13907 [5:15:25<3:11:34,  2.01s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:45:39<17:31:07, 31533.87s/it]
Training...:  59% 8185/13907 [5:15:28<3:11:34,  2.01s/it][A
Training...:  59% 8186/13907 [5:15:28<3:18:11,  2.08s/it][A
Training...:  59% 8187/13907 [5:15:29<3:12:39,  2.02s/it][A
Training...:  59% 8188/13907 [5:15:31<3:05:34,  1.95s/it][A
Training...:  59% 8189/13907 [5:15:33<2:59:19,  1.88s/it][A
Training...:  59% 8190/13907 [5:15:35<2:54:11,  1.83s/it][A
Training...:  59% 8191/13907 [5:15:36<2:50:34,  1.79s/it][A
Training...:  59% 8192/13907 [5:15:38<2:46:11,  1.74s/it][A
Training...:  59% 8193/13907 [5:15:40<2:41:38,  1.70s/it][A
Training...:  59% 8194/13907 [5:15:41<2:37:58,  1.66s/it][A
Training...:  59% 8195/13907 [5:15:43<2:33:51,  1.62s/it][A
Training...:  59% 8196/13907 [5:15:44<2:28:47,  1.56s/it][A
Training...:  59% 8197/13907 [5:15:45<2:23:45,  1.51s/it][A
Training...:  59% 8198/13907 [5:15:47<2:18:27,  1.46s/it][A
Training...:  59% 8199/13907 [5:15:48<2:11:40,  1.38s/it][A
Training...:  59% 8200/13907 [5:15:49<2:02:27,  1.29s/it][A
Training...:  59% 8201/13907 [5:15:53<3:10:15,  2.00s/it][A
Training...:  59% 8202/13907 [5:15:56<3:51:56,  2.44s/it][A
Training...:  59% 8203/13907 [5:15:59<4:15:17,  2.69s/it][A
Training...:  59% 8204/13907 [5:16:03<4:27:45,  2.82s/it][A
Training...:  59% 8205/13907 [5:16:06<4:34:16,  2.89s/it][A
Training...:  59% 8206/13907 [5:16:09<4:36:33,  2.91s/it][A
Training...:  59% 8207/13907 [5:16:11<4:35:32,  2.90s/it][A
Training...:  59% 8208/13907 [5:16:14<4:32:11,  2.87s/it][A
Training...:  59% 8209/13907 [5:16:17<4:29:46,  2.84s/it][A
Training...:  59% 8210/13907 [5:16:20<4:25:41,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:46:34<17:31:07, 31533.87s/it]
Training...:  59% 8210/13907 [5:16:23<4:25:41,  2.80s/it][A
Training...:  59% 8211/13907 [5:16:23<4:33:41,  2.88s/it][A
Training...:  59% 8212/13907 [5:16:25<4:27:57,  2.82s/it][A
Training...:  59% 8213/13907 [5:16:28<4:21:19,  2.75s/it][A
Training...:  59% 8214/13907 [5:16:31<4:14:22,  2.68s/it][A
Training...:  59% 8215/13907 [5:16:33<4:11:02,  2.65s/it][A
Training...:  59% 8216/13907 [5:16:36<4:08:00,  2.61s/it][A
Training...:  59% 8217/13907 [5:16:38<4:03:37,  2.57s/it][A
Training...:  59% 8218/13907 [5:16:41<3:59:03,  2.52s/it][A
Training...:  59% 8219/13907 [5:16:43<3:54:44,  2.48s/it][A
Training...:  59% 8220/13907 [5:16:45<3:51:19,  2.44s/it][A
Training...:  59% 8221/13907 [5:16:48<3:49:53,  2.43s/it][A
Training...:  59% 8222/13907 [5:16:50<3:48:14,  2.41s/it][A
Training...:  59% 8223/13907 [5:16:52<3:45:22,  2.38s/it][A
Training...:  59% 8224/13907 [5:16:55<3:42:40,  2.35s/it][A
Training...:  59% 8225/13907 [5:16:57<3:39:30,  2.32s/it][A
Training...:  59% 8226/13907 [5:16:59<3:35:59,  2.28s/it][A
Training...:  59% 8227/13907 [5:17:01<3:32:16,  2.24s/it][A
Training...:  59% 8228/13907 [5:17:03<3:29:09,  2.21s/it][A
Training...:  59% 8229/13907 [5:17:05<3:26:10,  2.18s/it][A
Training...:  59% 8230/13907 [5:17:08<3:23:35,  2.15s/it][A
Training...:  59% 8231/13907 [5:17:10<3:20:39,  2.12s/it][A
Training...:  59% 8232/13907 [5:17:12<3:17:49,  2.09s/it][A
Training...:  59% 8233/13907 [5:17:14<3:14:41,  2.06s/it][A
Training...:  59% 8234/13907 [5:17:16<3:11:39,  2.03s/it][A
Training...:  59% 8235/13907 [5:17:17<3:08:15,  1.99s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:47:31<17:31:07, 31533.87s/it]
Training...:  59% 8235/13907 [5:17:20<3:08:15,  1.99s/it][A
Training...:  59% 8236/13907 [5:17:20<3:13:54,  2.05s/it][A
Training...:  59% 8237/13907 [5:17:22<3:09:05,  2.00s/it][A
Training...:  59% 8238/13907 [5:17:23<3:02:25,  1.93s/it][A
Training...:  59% 8239/13907 [5:17:25<2:57:26,  1.88s/it][A
Training...:  59% 8240/13907 [5:17:27<2:52:40,  1.83s/it][A
Training...:  59% 8241/13907 [5:17:28<2:48:14,  1.78s/it][A
Training...:  59% 8242/13907 [5:17:30<2:44:08,  1.74s/it][A
Training...:  59% 8243/13907 [5:17:32<2:40:22,  1.70s/it][A
Training...:  59% 8244/13907 [5:17:33<2:36:34,  1.66s/it][A
Training...:  59% 8245/13907 [5:17:35<2:32:33,  1.62s/it][A
Training...:  59% 8246/13907 [5:17:36<2:27:55,  1.57s/it][A
Training...:  59% 8247/13907 [5:17:38<2:23:30,  1.52s/it][A
Training...:  59% 8248/13907 [5:17:39<2:18:13,  1.47s/it][A
Training...:  59% 8249/13907 [5:17:40<2:11:50,  1.40s/it][A
Training...:  59% 8250/13907 [5:17:41<2:01:42,  1.29s/it][A
Training...:  59% 8251/13907 [5:17:45<3:10:32,  2.02s/it][A
Training...:  59% 8252/13907 [5:17:48<3:50:06,  2.44s/it][A
Training...:  59% 8253/13907 [5:17:52<4:12:23,  2.68s/it][A
Training...:  59% 8254/13907 [5:17:55<4:25:03,  2.81s/it][A
Training...:  59% 8255/13907 [5:17:58<4:31:34,  2.88s/it][A
Training...:  59% 8256/13907 [5:18:01<4:34:28,  2.91s/it][A
Training...:  59% 8257/13907 [5:18:04<4:34:01,  2.91s/it][A
Training...:  59% 8258/13907 [5:18:07<4:31:00,  2.88s/it][A
Training...:  59% 8259/13907 [5:18:09<4:30:13,  2.87s/it][A
Training...:  59% 8260/13907 [5:18:12<4:27:39,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:48:26<17:31:07, 31533.87s/it]
Training...:  59% 8260/13907 [5:18:15<4:27:39,  2.84s/it][A
Training...:  59% 8261/13907 [5:18:15<4:34:25,  2.92s/it][A
Training...:  59% 8262/13907 [5:18:18<4:26:57,  2.84s/it][A
Training...:  59% 8263/13907 [5:18:20<4:18:53,  2.75s/it][A
Training...:  59% 8264/13907 [5:18:23<4:10:58,  2.67s/it][A
Training...:  59% 8265/13907 [5:18:25<4:06:35,  2.62s/it][A
Training...:  59% 8266/13907 [5:18:28<4:01:12,  2.57s/it][A
Training...:  59% 8267/13907 [5:18:30<3:56:47,  2.52s/it][A
Training...:  59% 8268/13907 [5:18:33<3:52:26,  2.47s/it][A
Training...:  59% 8269/13907 [5:18:35<3:48:03,  2.43s/it][A
Training...:  59% 8270/13907 [5:18:37<3:44:00,  2.38s/it][A
Training...:  59% 8271/13907 [5:18:40<3:41:43,  2.36s/it][A
Training...:  59% 8272/13907 [5:18:42<3:37:43,  2.32s/it][A
Training...:  59% 8273/13907 [5:18:44<3:34:20,  2.28s/it][A
Training...:  59% 8274/13907 [5:18:46<3:31:24,  2.25s/it][A
Training...:  60% 8275/13907 [5:18:48<3:28:47,  2.22s/it][A
Training...:  60% 8276/13907 [5:18:50<3:25:11,  2.19s/it][A
Training...:  60% 8277/13907 [5:18:53<3:22:28,  2.16s/it][A
Training...:  60% 8278/13907 [5:18:55<3:19:14,  2.12s/it][A
Training...:  60% 8279/13907 [5:18:57<3:17:49,  2.11s/it][A
Training...:  60% 8280/13907 [5:18:59<3:15:31,  2.08s/it][A
Training...:  60% 8281/13907 [5:19:01<3:12:40,  2.05s/it][A
Training...:  60% 8282/13907 [5:19:03<3:10:18,  2.03s/it][A
Training...:  60% 8283/13907 [5:19:05<3:07:42,  2.00s/it][A
Training...:  60% 8284/13907 [5:19:06<3:05:23,  1.98s/it][A
Training...:  60% 8285/13907 [5:19:08<3:02:24,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:49:22<17:31:07, 31533.87s/it]
Training...:  60% 8285/13907 [5:19:11<3:02:24,  1.95s/it][A
Training...:  60% 8286/13907 [5:19:11<3:08:26,  2.01s/it][A
Training...:  60% 8287/13907 [5:19:12<3:04:31,  1.97s/it][A
Training...:  60% 8288/13907 [5:19:14<2:58:40,  1.91s/it][A
Training...:  60% 8289/13907 [5:19:16<2:53:33,  1.85s/it][A
Training...:  60% 8290/13907 [5:19:18<2:49:22,  1.81s/it][A
Training...:  60% 8291/13907 [5:19:19<2:45:30,  1.77s/it][A
Training...:  60% 8292/13907 [5:19:21<2:41:33,  1.73s/it][A
Training...:  60% 8293/13907 [5:19:22<2:37:33,  1.68s/it][A
Training...:  60% 8294/13907 [5:19:24<2:34:40,  1.65s/it][A
Training...:  60% 8295/13907 [5:19:26<2:30:41,  1.61s/it][A
Training...:  60% 8296/13907 [5:19:27<2:27:04,  1.57s/it][A
Training...:  60% 8297/13907 [5:19:28<2:21:41,  1.52s/it][A
Training...:  60% 8298/13907 [5:19:30<2:16:56,  1.46s/it][A
Training...:  60% 8299/13907 [5:19:31<2:11:21,  1.41s/it][A
Training...:  60% 8300/13907 [5:19:32<2:01:43,  1.30s/it][A
Training...:  60% 8301/13907 [5:19:36<3:10:21,  2.04s/it][A
Training...:  60% 8302/13907 [5:19:39<3:50:47,  2.47s/it][A
Training...:  60% 8303/13907 [5:19:43<4:12:41,  2.71s/it][A
Training...:  60% 8304/13907 [5:19:46<4:25:21,  2.84s/it][A
Training...:  60% 8305/13907 [5:19:49<4:31:39,  2.91s/it][A
Training...:  60% 8306/13907 [5:19:52<4:32:56,  2.92s/it][A
Training...:  60% 8307/13907 [5:19:55<4:31:08,  2.91s/it][A
Training...:  60% 8308/13907 [5:19:57<4:29:19,  2.89s/it][A
Training...:  60% 8309/13907 [5:20:00<4:26:02,  2.85s/it][A
Training...:  60% 8310/13907 [5:20:03<4:21:17,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:50:17<17:31:07, 31533.87s/it]
Training...:  60% 8310/13907 [5:20:06<4:21:17,  2.80s/it][A
Training...:  60% 8311/13907 [5:20:06<4:28:24,  2.88s/it][A
Training...:  60% 8312/13907 [5:20:09<4:23:20,  2.82s/it][A
Training...:  60% 8313/13907 [5:20:11<4:17:09,  2.76s/it][A
Training...:  60% 8314/13907 [5:20:14<4:11:16,  2.70s/it][A
Training...:  60% 8315/13907 [5:20:16<4:06:25,  2.64s/it][A
Training...:  60% 8316/13907 [5:20:19<4:02:02,  2.60s/it][A
Training...:  60% 8317/13907 [5:20:21<3:57:25,  2.55s/it][A
Training...:  60% 8318/13907 [5:20:24<3:53:39,  2.51s/it][A
Training...:  60% 8319/13907 [5:20:26<3:49:51,  2.47s/it][A
Training...:  60% 8320/13907 [5:20:28<3:46:10,  2.43s/it][A
Training...:  60% 8321/13907 [5:20:31<3:42:25,  2.39s/it][A
Training...:  60% 8322/13907 [5:20:33<3:39:38,  2.36s/it][A
Training...:  60% 8323/13907 [5:20:35<3:38:13,  2.34s/it][A
Training...:  60% 8324/13907 [5:20:38<3:35:33,  2.32s/it][A
Training...:  60% 8325/13907 [5:20:40<3:32:14,  2.28s/it][A
Training...:  60% 8326/13907 [5:20:42<3:28:05,  2.24s/it][A
Training...:  60% 8327/13907 [5:20:44<3:24:56,  2.20s/it][A
Training...:  60% 8328/13907 [5:20:46<3:21:25,  2.17s/it][A
Training...:  60% 8329/13907 [5:20:48<3:18:38,  2.14s/it][A
Training...:  60% 8330/13907 [5:20:50<3:15:36,  2.10s/it][A
Training...:  60% 8331/13907 [5:20:52<3:12:20,  2.07s/it][A
Training...:  60% 8332/13907 [5:20:54<3:09:29,  2.04s/it][A
Training...:  60% 8333/13907 [5:20:56<3:06:42,  2.01s/it][A
Training...:  60% 8334/13907 [5:20:58<3:03:44,  1.98s/it][A
Training...:  60% 8335/13907 [5:21:00<3:00:59,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:51:13<17:31:07, 31533.87s/it]
Training...:  60% 8335/13907 [5:21:02<3:00:59,  1.95s/it][A
Training...:  60% 8336/13907 [5:21:02<3:06:41,  2.01s/it][A
Training...:  60% 8337/13907 [5:21:04<3:03:02,  1.97s/it][A
Training...:  60% 8338/13907 [5:21:06<2:58:02,  1.92s/it][A
Training...:  60% 8339/13907 [5:21:07<2:53:24,  1.87s/it][A
Training...:  60% 8340/13907 [5:21:09<2:49:18,  1.82s/it][A
Training...:  60% 8341/13907 [5:21:11<2:45:37,  1.79s/it][A
Training...:  60% 8342/13907 [5:21:12<2:41:19,  1.74s/it][A
Training...:  60% 8343/13907 [5:21:14<2:37:00,  1.69s/it][A
Training...:  60% 8344/13907 [5:21:16<2:33:34,  1.66s/it][A
Training...:  60% 8345/13907 [5:21:17<2:29:06,  1.61s/it][A
Training...:  60% 8346/13907 [5:21:19<2:24:01,  1.55s/it][A
Training...:  60% 8347/13907 [5:21:20<2:19:23,  1.50s/it][A
Training...:  60% 8348/13907 [5:21:21<2:13:51,  1.44s/it][A
Training...:  60% 8349/13907 [5:21:23<2:08:04,  1.38s/it][A
Training...:  60% 8350/13907 [5:21:24<1:58:14,  1.28s/it][A
Training...:  60% 8351/13907 [5:21:27<3:05:36,  2.00s/it][A
Training...:  60% 8352/13907 [5:21:31<3:48:55,  2.47s/it][A
Training...:  60% 8353/13907 [5:21:34<4:12:27,  2.73s/it][A
Training...:  60% 8354/13907 [5:21:37<4:24:19,  2.86s/it][A
Training...:  60% 8355/13907 [5:21:40<4:31:16,  2.93s/it][A
Training...:  60% 8356/13907 [5:21:43<4:33:19,  2.95s/it][A
Training...:  60% 8357/13907 [5:21:46<4:32:02,  2.94s/it][A
Training...:  60% 8358/13907 [5:21:49<4:29:30,  2.91s/it][A
Training...:  60% 8359/13907 [5:21:52<4:27:11,  2.89s/it][A
Training...:  60% 8360/13907 [5:21:55<4:25:23,  2.87s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:52:09<17:31:07, 31533.87s/it]
Training...:  60% 8360/13907 [5:21:58<4:25:23,  2.87s/it][A
Training...:  60% 8361/13907 [5:21:58<4:31:57,  2.94s/it][A
Training...:  60% 8362/13907 [5:22:01<4:25:43,  2.88s/it][A
Training...:  60% 8363/13907 [5:22:03<4:17:38,  2.79s/it][A
Training...:  60% 8364/13907 [5:22:06<4:10:56,  2.72s/it][A
Training...:  60% 8365/13907 [5:22:08<4:05:45,  2.66s/it][A
Training...:  60% 8366/13907 [5:22:11<4:00:48,  2.61s/it][A
Training...:  60% 8367/13907 [5:22:13<3:56:49,  2.56s/it][A
Training...:  60% 8368/13907 [5:22:16<3:52:51,  2.52s/it][A
Training...:  60% 8369/13907 [5:22:18<3:49:07,  2.48s/it][A
Training...:  60% 8370/13907 [5:22:20<3:44:59,  2.44s/it][A
Training...:  60% 8371/13907 [5:22:23<3:41:40,  2.40s/it][A
Training...:  60% 8372/13907 [5:22:25<3:38:51,  2.37s/it][A
Training...:  60% 8373/13907 [5:22:27<3:35:29,  2.34s/it][A
Training...:  60% 8374/13907 [5:22:29<3:32:07,  2.30s/it][A
Training...:  60% 8375/13907 [5:22:32<3:28:57,  2.27s/it][A
Training...:  60% 8376/13907 [5:22:34<3:25:39,  2.23s/it][A
Training...:  60% 8377/13907 [5:22:36<3:23:06,  2.20s/it][A
Training...:  60% 8378/13907 [5:22:38<3:20:55,  2.18s/it][A
Training...:  60% 8379/13907 [5:22:40<3:18:11,  2.15s/it][A
Training...:  60% 8380/13907 [5:22:42<3:16:12,  2.13s/it][A
Training...:  60% 8381/13907 [5:22:44<3:14:04,  2.11s/it][A
Training...:  60% 8382/13907 [5:22:46<3:10:55,  2.07s/it][A
Training...:  60% 8383/13907 [5:22:48<3:08:29,  2.05s/it][A
Training...:  60% 8384/13907 [5:22:50<3:05:29,  2.02s/it][A
Training...:  60% 8385/13907 [5:22:52<3:02:59,  1.99s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:53:05<17:31:07, 31533.87s/it]
Training...:  60% 8385/13907 [5:22:54<3:02:59,  1.99s/it][A
Training...:  60% 8386/13907 [5:22:54<3:08:40,  2.05s/it][A
Training...:  60% 8387/13907 [5:22:56<3:04:15,  2.00s/it][A
Training...:  60% 8388/13907 [5:22:58<2:59:17,  1.95s/it][A
Training...:  60% 8389/13907 [5:23:00<2:53:51,  1.89s/it][A
Training...:  60% 8390/13907 [5:23:02<2:49:40,  1.85s/it][A
Training...:  60% 8391/13907 [5:23:03<2:45:21,  1.80s/it][A
Training...:  60% 8392/13907 [5:23:05<2:42:01,  1.76s/it][A
Training...:  60% 8393/13907 [5:23:07<2:39:36,  1.74s/it][A
Training...:  60% 8394/13907 [5:23:08<2:35:30,  1.69s/it][A
Training...:  60% 8395/13907 [5:23:10<2:31:49,  1.65s/it][A
Training...:  60% 8396/13907 [5:23:11<2:26:00,  1.59s/it][A
Training...:  60% 8397/13907 [5:23:13<2:20:42,  1.53s/it][A
Training...:  60% 8398/13907 [5:23:14<2:14:41,  1.47s/it][A
Training...:  60% 8399/13907 [5:23:15<2:08:05,  1.40s/it][A
Training...:  60% 8400/13907 [5:23:16<1:57:52,  1.28s/it][A
Training...:  60% 8401/13907 [5:23:20<3:05:31,  2.02s/it][A
Training...:  60% 8402/13907 [5:23:23<3:43:41,  2.44s/it][A
Training...:  60% 8403/13907 [5:23:27<4:04:54,  2.67s/it][A
Training...:  60% 8404/13907 [5:23:30<4:17:33,  2.81s/it][A
Training...:  60% 8405/13907 [5:23:33<4:23:26,  2.87s/it][A
Training...:  60% 8406/13907 [5:23:36<4:26:10,  2.90s/it][A
Training...:  60% 8407/13907 [5:23:39<4:26:01,  2.90s/it][A
Training...:  60% 8408/13907 [5:23:41<4:23:16,  2.87s/it][A
Training...:  60% 8409/13907 [5:23:44<4:20:29,  2.84s/it][A
Training...:  60% 8410/13907 [5:23:47<4:17:04,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:54:01<17:31:07, 31533.87s/it]
Training...:  60% 8410/13907 [5:23:50<4:17:04,  2.81s/it][A
Training...:  60% 8411/13907 [5:23:50<4:24:52,  2.89s/it][A
Training...:  60% 8412/13907 [5:23:53<4:19:52,  2.84s/it][A
Training...:  60% 8413/13907 [5:23:55<4:13:45,  2.77s/it][A
Training...:  61% 8414/13907 [5:23:58<4:06:50,  2.70s/it][A
Training...:  61% 8415/13907 [5:24:00<4:01:37,  2.64s/it][A
Training...:  61% 8416/13907 [5:24:03<3:55:53,  2.58s/it][A
Training...:  61% 8417/13907 [5:24:05<3:50:39,  2.52s/it][A
Training...:  61% 8418/13907 [5:24:08<3:46:33,  2.48s/it][A
Training...:  61% 8419/13907 [5:24:10<3:43:08,  2.44s/it][A
Training...:  61% 8420/13907 [5:24:12<3:40:25,  2.41s/it][A
Training...:  61% 8421/13907 [5:24:15<3:40:02,  2.41s/it][A
Training...:  61% 8422/13907 [5:24:17<3:35:30,  2.36s/it][A
Training...:  61% 8423/13907 [5:24:19<3:31:15,  2.31s/it][A
Training...:  61% 8424/13907 [5:24:21<3:27:25,  2.27s/it][A
Training...:  61% 8425/13907 [5:24:23<3:23:45,  2.23s/it][A
Training...:  61% 8426/13907 [5:24:25<3:20:43,  2.20s/it][A
Training...:  61% 8427/13907 [5:24:28<3:17:26,  2.16s/it][A
Training...:  61% 8428/13907 [5:24:30<3:14:35,  2.13s/it][A
Training...:  61% 8429/13907 [5:24:32<3:11:49,  2.10s/it][A
Training...:  61% 8430/13907 [5:24:34<3:08:47,  2.07s/it][A
Training...:  61% 8431/13907 [5:24:36<3:06:58,  2.05s/it][A
Training...:  61% 8432/13907 [5:24:38<3:04:08,  2.02s/it][A
Training...:  61% 8433/13907 [5:24:40<3:01:52,  1.99s/it][A
Training...:  61% 8434/13907 [5:24:41<2:59:13,  1.96s/it][A
Training...:  61% 8435/13907 [5:24:43<2:57:00,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:54:56<17:31:07, 31533.87s/it]
Training...:  61% 8435/13907 [5:24:45<2:57:00,  1.94s/it][A
Training...:  61% 8436/13907 [5:24:45<3:02:02,  2.00s/it][A
Training...:  61% 8437/13907 [5:24:47<2:59:11,  1.97s/it][A
Training...:  61% 8438/13907 [5:24:49<2:54:18,  1.91s/it][A
Training...:  61% 8439/13907 [5:24:51<2:49:46,  1.86s/it][A
Training...:  61% 8440/13907 [5:24:53<2:45:38,  1.82s/it][A
Training...:  61% 8441/13907 [5:24:54<2:41:49,  1.78s/it][A
Training...:  61% 8442/13907 [5:24:56<2:38:20,  1.74s/it][A
Training...:  61% 8443/13907 [5:24:58<2:34:36,  1.70s/it][A
Training...:  61% 8444/13907 [5:24:59<2:31:29,  1.66s/it][A
Training...:  61% 8445/13907 [5:25:01<2:27:08,  1.62s/it][A
Training...:  61% 8446/13907 [5:25:02<2:23:07,  1.57s/it][A
Training...:  61% 8447/13907 [5:25:03<2:17:59,  1.52s/it][A
Training...:  61% 8448/13907 [5:25:05<2:12:39,  1.46s/it][A
Training...:  61% 8449/13907 [5:25:06<2:06:13,  1.39s/it][A
Training...:  61% 8450/13907 [5:25:07<1:57:47,  1.30s/it][A
Training...:  61% 8451/13907 [5:25:11<3:02:52,  2.01s/it][A
Training...:  61% 8452/13907 [5:25:14<3:43:05,  2.45s/it][A
Training...:  61% 8453/13907 [5:25:18<4:06:09,  2.71s/it][A
Training...:  61% 8454/13907 [5:25:21<4:17:45,  2.84s/it][A
Training...:  61% 8455/13907 [5:25:24<4:22:41,  2.89s/it][A
Training...:  61% 8456/13907 [5:25:27<4:23:52,  2.90s/it][A
Training...:  61% 8457/13907 [5:25:29<4:22:28,  2.89s/it][A
Training...:  61% 8458/13907 [5:25:32<4:20:41,  2.87s/it][A
Training...:  61% 8459/13907 [5:25:35<4:18:15,  2.84s/it][A
Training...:  61% 8460/13907 [5:25:38<4:16:16,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:55:52<17:31:07, 31533.87s/it]
Training...:  61% 8460/13907 [5:25:41<4:16:16,  2.82s/it][A
Training...:  61% 8461/13907 [5:25:41<4:23:03,  2.90s/it][A
Training...:  61% 8462/13907 [5:25:44<4:18:00,  2.84s/it][A
Training...:  61% 8463/13907 [5:25:46<4:10:26,  2.76s/it][A
Training...:  61% 8464/13907 [5:25:49<4:03:52,  2.69s/it][A
Training...:  61% 8465/13907 [5:25:51<3:58:15,  2.63s/it][A
Training...:  61% 8466/13907 [5:25:54<3:52:53,  2.57s/it][A
Training...:  61% 8467/13907 [5:25:56<3:48:20,  2.52s/it][A
Training...:  61% 8468/13907 [5:25:58<3:43:32,  2.47s/it][A
Training...:  61% 8469/13907 [5:26:01<3:39:56,  2.43s/it][A
Training...:  61% 8470/13907 [5:26:03<3:36:26,  2.39s/it][A
Training...:  61% 8471/13907 [5:26:05<3:33:54,  2.36s/it][A
Training...:  61% 8472/13907 [5:26:08<3:30:57,  2.33s/it][A
Training...:  61% 8473/13907 [5:26:10<3:27:32,  2.29s/it][A
Training...:  61% 8474/13907 [5:26:12<3:24:31,  2.26s/it][A
Training...:  61% 8475/13907 [5:26:14<3:22:15,  2.23s/it][A
Training...:  61% 8476/13907 [5:26:16<3:19:02,  2.20s/it][A
Training...:  61% 8477/13907 [5:26:18<3:16:50,  2.18s/it][A
Training...:  61% 8478/13907 [5:26:20<3:14:10,  2.15s/it][A
Training...:  61% 8479/13907 [5:26:23<3:11:11,  2.11s/it][A
Training...:  61% 8480/13907 [5:26:25<3:08:13,  2.08s/it][A
Training...:  61% 8481/13907 [5:26:27<3:05:45,  2.05s/it][A
Training...:  61% 8482/13907 [5:26:28<3:02:29,  2.02s/it][A
Training...:  61% 8483/13907 [5:26:30<3:00:08,  1.99s/it][A
Training...:  61% 8484/13907 [5:26:32<2:56:53,  1.96s/it][A
Training...:  61% 8485/13907 [5:26:34<2:54:06,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:56:47<17:31:07, 31533.87s/it]
Training...:  61% 8485/13907 [5:26:36<2:54:06,  1.93s/it][A
Training...:  61% 8486/13907 [5:26:36<2:59:31,  1.99s/it][A
Training...:  61% 8487/13907 [5:26:38<2:56:30,  1.95s/it][A
Training...:  61% 8488/13907 [5:26:40<2:51:15,  1.90s/it][A
Training...:  61% 8489/13907 [5:26:42<2:47:20,  1.85s/it][A
Training...:  61% 8490/13907 [5:26:43<2:44:09,  1.82s/it][A
Training...:  61% 8491/13907 [5:26:45<2:41:11,  1.79s/it][A
Training...:  61% 8492/13907 [5:26:47<2:37:32,  1.75s/it][A
Training...:  61% 8493/13907 [5:26:48<2:33:28,  1.70s/it][A
Training...:  61% 8494/13907 [5:26:50<2:30:13,  1.67s/it][A
Training...:  61% 8495/13907 [5:26:51<2:25:40,  1.62s/it][A
Training...:  61% 8496/13907 [5:26:53<2:20:44,  1.56s/it][A
Training...:  61% 8497/13907 [5:26:54<2:15:46,  1.51s/it][A
Training...:  61% 8498/13907 [5:26:56<2:11:23,  1.46s/it][A
Training...:  61% 8499/13907 [5:26:57<2:05:13,  1.39s/it][A
Training...:  61% 8500/13907 [5:26:58<1:56:38,  1.29s/it][A
Training...:  61% 8501/13907 [5:27:02<3:02:25,  2.02s/it][A
Training...:  61% 8502/13907 [5:27:05<3:41:29,  2.46s/it][A
Training...:  61% 8503/13907 [5:27:08<4:02:02,  2.69s/it][A
Training...:  61% 8504/13907 [5:27:11<4:13:16,  2.81s/it][A
Training...:  61% 8505/13907 [5:27:14<4:18:57,  2.88s/it][A
Training...:  61% 8506/13907 [5:27:17<4:20:15,  2.89s/it][A
Training...:  61% 8507/13907 [5:27:20<4:19:51,  2.89s/it][A
Training...:  61% 8508/13907 [5:27:23<4:17:28,  2.86s/it][A
Training...:  61% 8509/13907 [5:27:26<4:14:21,  2.83s/it][A
Training...:  61% 8510/13907 [5:27:28<4:11:28,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:57:43<17:31:07, 31533.87s/it]
Training...:  61% 8510/13907 [5:27:32<4:11:28,  2.80s/it][A
Training...:  61% 8511/13907 [5:27:32<4:19:27,  2.88s/it][A
Training...:  61% 8512/13907 [5:27:34<4:14:46,  2.83s/it][A
Training...:  61% 8513/13907 [5:27:37<4:07:59,  2.76s/it][A
Training...:  61% 8514/13907 [5:27:39<4:02:38,  2.70s/it][A
Training...:  61% 8515/13907 [5:27:42<3:56:43,  2.63s/it][A
Training...:  61% 8516/13907 [5:27:44<3:52:02,  2.58s/it][A
Training...:  61% 8517/13907 [5:27:47<3:47:07,  2.53s/it][A
Training...:  61% 8518/13907 [5:27:49<3:42:59,  2.48s/it][A
Training...:  61% 8519/13907 [5:27:52<3:39:58,  2.45s/it][A
Training...:  61% 8520/13907 [5:27:54<3:37:56,  2.43s/it][A
Training...:  61% 8521/13907 [5:27:56<3:35:57,  2.41s/it][A
Training...:  61% 8522/13907 [5:27:59<3:31:28,  2.36s/it][A
Training...:  61% 8523/13907 [5:28:01<3:27:50,  2.32s/it][A
Training...:  61% 8524/13907 [5:28:03<3:23:56,  2.27s/it][A
Training...:  61% 8525/13907 [5:28:05<3:21:05,  2.24s/it][A
Training...:  61% 8526/13907 [5:28:07<3:17:26,  2.20s/it][A
Training...:  61% 8527/13907 [5:28:09<3:14:54,  2.17s/it][A
Training...:  61% 8528/13907 [5:28:11<3:11:50,  2.14s/it][A
Training...:  61% 8529/13907 [5:28:13<3:09:20,  2.11s/it][A
Training...:  61% 8530/13907 [5:28:15<3:06:34,  2.08s/it][A
Training...:  61% 8531/13907 [5:28:17<3:04:19,  2.06s/it][A
Training...:  61% 8532/13907 [5:28:19<3:01:38,  2.03s/it][A
Training...:  61% 8533/13907 [5:28:21<2:59:18,  2.00s/it][A
Training...:  61% 8534/13907 [5:28:23<2:56:29,  1.97s/it][A
Training...:  61% 8535/13907 [5:28:25<2:53:45,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:58:38<17:31:07, 31533.87s/it]
Training...:  61% 8535/13907 [5:28:27<2:53:45,  1.94s/it][A
Training...:  61% 8536/13907 [5:28:27<2:59:26,  2.00s/it][A
Training...:  61% 8537/13907 [5:28:29<2:55:42,  1.96s/it][A
Training...:  61% 8538/13907 [5:28:31<2:50:40,  1.91s/it][A
Training...:  61% 8539/13907 [5:28:33<2:46:01,  1.86s/it][A
Training...:  61% 8540/13907 [5:28:34<2:42:05,  1.81s/it][A
Training...:  61% 8541/13907 [5:28:36<2:38:22,  1.77s/it][A
Training...:  61% 8542/13907 [5:28:38<2:34:55,  1.73s/it][A
Training...:  61% 8543/13907 [5:28:39<2:31:21,  1.69s/it][A
Training...:  61% 8544/13907 [5:28:41<2:28:02,  1.66s/it][A
Training...:  61% 8545/13907 [5:28:42<2:23:55,  1.61s/it][A
Training...:  61% 8546/13907 [5:28:44<2:21:25,  1.58s/it][A
Training...:  61% 8547/13907 [5:28:45<2:16:53,  1.53s/it][A
Training...:  61% 8548/13907 [5:28:47<2:11:03,  1.47s/it][A
Training...:  61% 8549/13907 [5:28:48<2:04:44,  1.40s/it][A
Training...:  61% 8550/13907 [5:28:49<1:55:49,  1.30s/it][A
Training...:  61% 8551/13907 [5:28:53<3:06:58,  2.09s/it][A
Training...:  61% 8552/13907 [5:28:56<3:45:22,  2.53s/it][A
Training...:  62% 8553/13907 [5:29:00<4:05:10,  2.75s/it][A
Training...:  62% 8554/13907 [5:29:03<4:17:04,  2.88s/it][A
Training...:  62% 8555/13907 [5:29:06<4:24:58,  2.97s/it][A
Training...:  62% 8556/13907 [5:29:09<4:25:11,  2.97s/it][A
Training...:  62% 8557/13907 [5:29:12<4:23:28,  2.95s/it][A
Training...:  62% 8558/13907 [5:29:15<4:20:17,  2.92s/it][A
Training...:  62% 8559/13907 [5:29:18<4:16:59,  2.88s/it][A
Training...:  62% 8560/13907 [5:29:20<4:13:20,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [22:59:34<17:31:07, 31533.87s/it]
Training...:  62% 8560/13907 [5:29:23<4:13:20,  2.84s/it][A
Training...:  62% 8561/13907 [5:29:23<4:20:59,  2.93s/it][A
Training...:  62% 8562/13907 [5:29:26<4:15:33,  2.87s/it][A
Training...:  62% 8563/13907 [5:29:29<4:09:01,  2.80s/it][A
Training...:  62% 8564/13907 [5:29:31<4:01:48,  2.72s/it][A
Training...:  62% 8565/13907 [5:29:34<3:56:36,  2.66s/it][A
Training...:  62% 8566/13907 [5:29:36<3:51:29,  2.60s/it][A
Training...:  62% 8567/13907 [5:29:39<3:48:07,  2.56s/it][A
Training...:  62% 8568/13907 [5:29:41<3:43:09,  2.51s/it][A
Training...:  62% 8569/13907 [5:29:43<3:39:51,  2.47s/it][A
Training...:  62% 8570/13907 [5:29:46<3:37:11,  2.44s/it][A
Training...:  62% 8571/13907 [5:29:48<3:33:30,  2.40s/it][A
Training...:  62% 8572/13907 [5:29:50<3:30:39,  2.37s/it][A
Training...:  62% 8573/13907 [5:29:53<3:28:22,  2.34s/it][A
Training...:  62% 8574/13907 [5:29:55<3:24:58,  2.31s/it][A
Training...:  62% 8575/13907 [5:29:57<3:21:11,  2.26s/it][A
Training...:  62% 8576/13907 [5:29:59<3:18:01,  2.23s/it][A
Training...:  62% 8577/13907 [5:30:01<3:14:52,  2.19s/it][A
Training...:  62% 8578/13907 [5:30:03<3:12:11,  2.16s/it][A
Training...:  62% 8579/13907 [5:30:06<3:11:06,  2.15s/it][A
Training...:  62% 8580/13907 [5:30:08<3:08:41,  2.13s/it][A
Training...:  62% 8581/13907 [5:30:10<3:04:51,  2.08s/it][A
Training...:  62% 8582/13907 [5:30:12<3:01:44,  2.05s/it][A
Training...:  62% 8583/13907 [5:30:14<2:58:44,  2.01s/it][A
Training...:  62% 8584/13907 [5:30:15<2:55:59,  1.98s/it][A
Training...:  62% 8585/13907 [5:30:17<2:52:58,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:00:31<17:31:07, 31533.87s/it]
Training...:  62% 8585/13907 [5:30:20<2:52:58,  1.95s/it][A
Training...:  62% 8586/13907 [5:30:20<2:58:52,  2.02s/it][A
Training...:  62% 8587/13907 [5:30:21<2:55:12,  1.98s/it][A
Training...:  62% 8588/13907 [5:30:23<2:50:12,  1.92s/it][A
Training...:  62% 8589/13907 [5:30:25<2:46:00,  1.87s/it][A
Training...:  62% 8590/13907 [5:30:27<2:42:14,  1.83s/it][A
Training...:  62% 8591/13907 [5:30:28<2:38:20,  1.79s/it][A
Training...:  62% 8592/13907 [5:30:30<2:34:57,  1.75s/it][A
Training...:  62% 8593/13907 [5:30:32<2:31:26,  1.71s/it][A
Training...:  62% 8594/13907 [5:30:33<2:27:26,  1.67s/it][A
Training...:  62% 8595/13907 [5:30:35<2:24:05,  1.63s/it][A
Training...:  62% 8596/13907 [5:30:36<2:19:45,  1.58s/it][A
Training...:  62% 8597/13907 [5:30:38<2:14:30,  1.52s/it][A
Training...:  62% 8598/13907 [5:30:39<2:09:00,  1.46s/it][A
Training...:  62% 8599/13907 [5:30:40<2:03:01,  1.39s/it][A
Training...:  62% 8600/13907 [5:30:41<1:54:31,  1.29s/it][A
Training...:  62% 8601/13907 [5:30:45<2:56:49,  2.00s/it][A
Training...:  62% 8602/13907 [5:30:48<3:35:44,  2.44s/it][A
Training...:  62% 8603/13907 [5:30:52<3:57:15,  2.68s/it][A
Training...:  62% 8604/13907 [5:30:55<4:08:43,  2.81s/it][A
Training...:  62% 8605/13907 [5:30:58<4:13:38,  2.87s/it][A
Training...:  62% 8606/13907 [5:31:01<4:14:44,  2.88s/it][A
Training...:  62% 8607/13907 [5:31:04<4:14:56,  2.89s/it][A
Training...:  62% 8608/13907 [5:31:06<4:12:37,  2.86s/it][A
Training...:  62% 8609/13907 [5:31:09<4:09:19,  2.82s/it][A
Training...:  62% 8610/13907 [5:31:12<4:05:46,  2.78s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:01:26<17:31:07, 31533.87s/it]
Training...:  62% 8610/13907 [5:31:15<4:05:46,  2.78s/it][A
Training...:  62% 8611/13907 [5:31:15<4:12:53,  2.87s/it][A
Training...:  62% 8612/13907 [5:31:17<4:07:56,  2.81s/it][A
Training...:  62% 8613/13907 [5:31:20<4:04:02,  2.77s/it][A
Training...:  62% 8614/13907 [5:31:23<3:59:08,  2.71s/it][A
Training...:  62% 8615/13907 [5:31:25<3:53:05,  2.64s/it][A
Training...:  62% 8616/13907 [5:31:28<3:47:06,  2.58s/it][A
Training...:  62% 8617/13907 [5:31:30<3:42:19,  2.52s/it][A
Training...:  62% 8618/13907 [5:31:32<3:38:49,  2.48s/it][A
Training...:  62% 8619/13907 [5:31:35<3:35:46,  2.45s/it][A
Training...:  62% 8620/13907 [5:31:37<3:33:01,  2.42s/it][A
Training...:  62% 8621/13907 [5:31:39<3:29:53,  2.38s/it][A
Training...:  62% 8622/13907 [5:31:42<3:27:00,  2.35s/it][A
Training...:  62% 8623/13907 [5:31:44<3:23:25,  2.31s/it][A
Training...:  62% 8624/13907 [5:31:46<3:20:02,  2.27s/it][A
Training...:  62% 8625/13907 [5:31:48<3:16:35,  2.23s/it][A
Training...:  62% 8626/13907 [5:31:50<3:13:05,  2.19s/it][A
Training...:  62% 8627/13907 [5:31:52<3:10:29,  2.16s/it][A
Training...:  62% 8628/13907 [5:31:55<3:08:09,  2.14s/it][A
Training...:  62% 8629/13907 [5:31:57<3:05:49,  2.11s/it][A
Training...:  62% 8630/13907 [5:31:59<3:03:17,  2.08s/it][A
Training...:  62% 8631/13907 [5:32:01<3:00:24,  2.05s/it][A
Training...:  62% 8632/13907 [5:32:03<2:57:33,  2.02s/it][A
Training...:  62% 8633/13907 [5:32:04<2:54:37,  1.99s/it][A
Training...:  62% 8634/13907 [5:32:06<2:52:37,  1.96s/it][A
Training...:  62% 8635/13907 [5:32:08<2:50:17,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:02:21<17:31:07, 31533.87s/it]
Training...:  62% 8635/13907 [5:32:10<2:50:17,  1.94s/it][A
Training...:  62% 8636/13907 [5:32:10<2:55:00,  1.99s/it][A
Training...:  62% 8637/13907 [5:32:12<2:51:43,  1.96s/it][A
Training...:  62% 8638/13907 [5:32:14<2:46:17,  1.89s/it][A
Training...:  62% 8639/13907 [5:32:16<2:41:58,  1.84s/it][A
Training...:  62% 8640/13907 [5:32:17<2:38:17,  1.80s/it][A
Training...:  62% 8641/13907 [5:32:19<2:34:36,  1.76s/it][A
Training...:  62% 8642/13907 [5:32:21<2:31:25,  1.73s/it][A
Training...:  62% 8643/13907 [5:32:22<2:28:05,  1.69s/it][A
Training...:  62% 8644/13907 [5:32:24<2:25:05,  1.65s/it][A
Training...:  62% 8645/13907 [5:32:25<2:21:26,  1.61s/it][A
Training...:  62% 8646/13907 [5:32:27<2:16:50,  1.56s/it][A
Training...:  62% 8647/13907 [5:32:28<2:11:58,  1.51s/it][A
Training...:  62% 8648/13907 [5:32:30<2:06:51,  1.45s/it][A
Training...:  62% 8649/13907 [5:32:31<2:01:04,  1.38s/it][A
Training...:  62% 8650/13907 [5:32:32<1:52:27,  1.28s/it][A
Training...:  62% 8651/13907 [5:32:35<2:56:06,  2.01s/it][A
Training...:  62% 8652/13907 [5:32:39<3:34:27,  2.45s/it][A
Training...:  62% 8653/13907 [5:32:42<3:58:51,  2.73s/it][A
Training...:  62% 8654/13907 [5:32:45<4:09:37,  2.85s/it][A
Training...:  62% 8655/13907 [5:32:48<4:13:31,  2.90s/it][A
Training...:  62% 8656/13907 [5:32:51<4:15:07,  2.92s/it][A
Training...:  62% 8657/13907 [5:32:54<4:15:20,  2.92s/it][A
Training...:  62% 8658/13907 [5:32:57<4:13:17,  2.90s/it][A
Training...:  62% 8659/13907 [5:33:00<4:09:47,  2.86s/it][A
Training...:  62% 8660/13907 [5:33:03<4:05:44,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:03:17<17:31:07, 31533.87s/it]
Training...:  62% 8660/13907 [5:33:06<4:05:44,  2.81s/it][A
Training...:  62% 8661/13907 [5:33:06<4:12:28,  2.89s/it][A
Training...:  62% 8662/13907 [5:33:08<4:07:03,  2.83s/it][A
Training...:  62% 8663/13907 [5:33:11<4:00:16,  2.75s/it][A
Training...:  62% 8664/13907 [5:33:14<3:54:27,  2.68s/it][A
Training...:  62% 8665/13907 [5:33:16<3:49:09,  2.62s/it][A
Training...:  62% 8666/13907 [5:33:18<3:44:07,  2.57s/it][A
Training...:  62% 8667/13907 [5:33:21<3:39:46,  2.52s/it][A
Training...:  62% 8668/13907 [5:33:23<3:36:22,  2.48s/it][A
Training...:  62% 8669/13907 [5:33:26<3:33:25,  2.44s/it][A
Training...:  62% 8670/13907 [5:33:28<3:31:58,  2.43s/it][A
Training...:  62% 8671/13907 [5:33:30<3:29:23,  2.40s/it][A
Training...:  62% 8672/13907 [5:33:33<3:26:43,  2.37s/it][A
Training...:  62% 8673/13907 [5:33:35<3:23:30,  2.33s/it][A
Training...:  62% 8674/13907 [5:33:37<3:21:33,  2.31s/it][A
Training...:  62% 8675/13907 [5:33:39<3:19:01,  2.28s/it][A
Training...:  62% 8676/13907 [5:33:42<3:16:38,  2.26s/it][A
Training...:  62% 8677/13907 [5:33:44<3:13:57,  2.23s/it][A
Training...:  62% 8678/13907 [5:33:46<3:11:40,  2.20s/it][A
Training...:  62% 8679/13907 [5:33:48<3:08:56,  2.17s/it][A
Training...:  62% 8680/13907 [5:33:50<3:05:27,  2.13s/it][A
Training...:  62% 8681/13907 [5:33:52<3:03:23,  2.11s/it][A
Training...:  62% 8682/13907 [5:33:54<3:03:04,  2.10s/it][A
Training...:  62% 8683/13907 [5:33:56<3:00:53,  2.08s/it][A
Training...:  62% 8684/13907 [5:33:58<2:57:30,  2.04s/it][A
Training...:  62% 8685/13907 [5:34:00<2:54:54,  2.01s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:04:13<17:31:07, 31533.87s/it]
Training...:  62% 8685/13907 [5:34:02<2:54:54,  2.01s/it][A
Training...:  62% 8686/13907 [5:34:02<2:59:42,  2.07s/it][A
Training...:  62% 8687/13907 [5:34:04<2:54:42,  2.01s/it][A
Training...:  62% 8688/13907 [5:34:06<2:48:46,  1.94s/it][A
Training...:  62% 8689/13907 [5:34:08<2:43:18,  1.88s/it][A
Training...:  62% 8690/13907 [5:34:09<2:38:54,  1.83s/it][A
Training...:  62% 8691/13907 [5:34:11<2:34:34,  1.78s/it][A
Training...:  63% 8692/13907 [5:34:13<2:30:59,  1.74s/it][A
Training...:  63% 8693/13907 [5:34:14<2:27:05,  1.69s/it][A
Training...:  63% 8694/13907 [5:34:16<2:23:49,  1.66s/it][A
Training...:  63% 8695/13907 [5:34:17<2:20:08,  1.61s/it][A
Training...:  63% 8696/13907 [5:34:19<2:15:46,  1.56s/it][A
Training...:  63% 8697/13907 [5:34:20<2:11:21,  1.51s/it][A
Training...:  63% 8698/13907 [5:34:21<2:06:40,  1.46s/it][A
Training...:  63% 8699/13907 [5:34:23<2:01:03,  1.39s/it][A
Training...:  63% 8700/13907 [5:34:24<1:53:00,  1.30s/it][A
Training...:  63% 8701/13907 [5:34:28<2:57:03,  2.04s/it][A
Training...:  63% 8702/13907 [5:34:31<3:34:15,  2.47s/it][A
Training...:  63% 8703/13907 [5:34:34<3:53:43,  2.69s/it][A
Training...:  63% 8704/13907 [5:34:37<4:04:33,  2.82s/it][A
Training...:  63% 8705/13907 [5:34:40<4:09:05,  2.87s/it][A
Training...:  63% 8706/13907 [5:34:43<4:11:29,  2.90s/it][A
Training...:  63% 8707/13907 [5:34:46<4:10:42,  2.89s/it][A
Training...:  63% 8708/13907 [5:34:49<4:09:00,  2.87s/it][A
Training...:  63% 8709/13907 [5:34:52<4:06:41,  2.85s/it][A
Training...:  63% 8710/13907 [5:34:55<4:03:14,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:05:09<17:31:07, 31533.87s/it]
Training...:  63% 8710/13907 [5:34:58<4:03:14,  2.81s/it][A
Training...:  63% 8711/13907 [5:34:58<4:11:21,  2.90s/it][A
Training...:  63% 8712/13907 [5:35:00<4:06:33,  2.85s/it][A
Training...:  63% 8713/13907 [5:35:03<4:00:30,  2.78s/it][A
Training...:  63% 8714/13907 [5:35:06<3:54:44,  2.71s/it][A
Training...:  63% 8715/13907 [5:35:08<3:49:18,  2.65s/it][A
Training...:  63% 8716/13907 [5:35:11<3:45:38,  2.61s/it][A
Training...:  63% 8717/13907 [5:35:13<3:45:43,  2.61s/it][A
Training...:  63% 8718/13907 [5:35:16<3:42:27,  2.57s/it][A
Training...:  63% 8719/13907 [5:35:18<3:38:56,  2.53s/it][A
Training...:  63% 8720/13907 [5:35:21<3:36:08,  2.50s/it][A
Training...:  63% 8721/13907 [5:35:23<3:33:02,  2.46s/it][A
Training...:  63% 8722/13907 [5:35:25<3:30:22,  2.43s/it][A
Training...:  63% 8723/13907 [5:35:28<3:27:19,  2.40s/it][A
Training...:  63% 8724/13907 [5:35:30<3:24:28,  2.37s/it][A
Training...:  63% 8725/13907 [5:35:32<3:21:03,  2.33s/it][A
Training...:  63% 8726/13907 [5:35:34<3:18:24,  2.30s/it][A
Training...:  63% 8727/13907 [5:35:37<3:15:52,  2.27s/it][A
Training...:  63% 8728/13907 [5:35:39<3:12:37,  2.23s/it][A
Training...:  63% 8729/13907 [5:35:41<3:10:20,  2.21s/it][A
Training...:  63% 8730/13907 [5:35:43<3:07:11,  2.17s/it][A
Training...:  63% 8731/13907 [5:35:45<3:04:17,  2.14s/it][A
Training...:  63% 8732/13907 [5:35:47<3:01:59,  2.11s/it][A
Training...:  63% 8733/13907 [5:35:49<2:58:46,  2.07s/it][A
Training...:  63% 8734/13907 [5:35:51<2:55:50,  2.04s/it][A
Training...:  63% 8735/13907 [5:35:53<2:52:48,  2.00s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:06:06<17:31:07, 31533.87s/it]
Training...:  63% 8735/13907 [5:35:55<2:52:48,  2.00s/it][A
Training...:  63% 8736/13907 [5:35:55<2:57:37,  2.06s/it][A
Training...:  63% 8737/13907 [5:35:57<2:52:49,  2.01s/it][A
Training...:  63% 8738/13907 [5:35:59<2:47:04,  1.94s/it][A
Training...:  63% 8739/13907 [5:36:01<2:42:13,  1.88s/it][A
Training...:  63% 8740/13907 [5:36:02<2:37:22,  1.83s/it][A
Training...:  63% 8741/13907 [5:36:04<2:33:28,  1.78s/it][A
Training...:  63% 8742/13907 [5:36:06<2:29:48,  1.74s/it][A
Training...:  63% 8743/13907 [5:36:07<2:26:01,  1.70s/it][A
Training...:  63% 8744/13907 [5:36:09<2:23:00,  1.66s/it][A
Training...:  63% 8745/13907 [5:36:10<2:19:35,  1.62s/it][A
Training...:  63% 8746/13907 [5:36:12<2:15:24,  1.57s/it][A
Training...:  63% 8747/13907 [5:36:13<2:10:50,  1.52s/it][A
Training...:  63% 8748/13907 [5:36:14<2:05:38,  1.46s/it][A
Training...:  63% 8749/13907 [5:36:16<1:59:47,  1.39s/it][A
Training...:  63% 8750/13907 [5:36:17<1:51:27,  1.30s/it][A
Training...:  63% 8751/13907 [5:36:20<2:53:22,  2.02s/it][A
Training...:  63% 8752/13907 [5:36:24<3:30:02,  2.44s/it][A
Training...:  63% 8753/13907 [5:36:27<3:51:21,  2.69s/it][A
Training...:  63% 8754/13907 [5:36:30<4:02:15,  2.82s/it][A
Training...:  63% 8755/13907 [5:36:33<4:09:09,  2.90s/it][A
Training...:  63% 8756/13907 [5:36:36<4:12:19,  2.94s/it][A
Training...:  63% 8757/13907 [5:36:39<4:11:00,  2.92s/it][A
Training...:  63% 8758/13907 [5:36:42<4:07:39,  2.89s/it][A
Training...:  63% 8759/13907 [5:36:45<4:04:36,  2.85s/it][A
Training...:  63% 8760/13907 [5:36:48<4:00:38,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:07:02<17:31:07, 31533.87s/it]
Training...:  63% 8760/13907 [5:36:51<4:00:38,  2.81s/it][A
Training...:  63% 8761/13907 [5:36:51<4:07:25,  2.88s/it][A
Training...:  63% 8762/13907 [5:36:53<4:03:05,  2.83s/it][A
Training...:  63% 8763/13907 [5:36:56<3:58:05,  2.78s/it][A
Training...:  63% 8764/13907 [5:36:58<3:51:41,  2.70s/it][A
Training...:  63% 8765/13907 [5:37:01<3:48:04,  2.66s/it][A
Training...:  63% 8766/13907 [5:37:04<3:45:18,  2.63s/it][A
Training...:  63% 8767/13907 [5:37:06<3:40:35,  2.58s/it][A
Training...:  63% 8768/13907 [5:37:08<3:35:41,  2.52s/it][A
Training...:  63% 8769/13907 [5:37:11<3:31:56,  2.47s/it][A
Training...:  63% 8770/13907 [5:37:13<3:27:50,  2.43s/it][A
Training...:  63% 8771/13907 [5:37:15<3:25:18,  2.40s/it][A
Training...:  63% 8772/13907 [5:37:18<3:21:22,  2.35s/it][A
Training...:  63% 8773/13907 [5:37:20<3:17:53,  2.31s/it][A
Training...:  63% 8774/13907 [5:37:22<3:14:43,  2.28s/it][A
Training...:  63% 8775/13907 [5:37:24<3:11:28,  2.24s/it][A
Training...:  63% 8776/13907 [5:37:26<3:08:00,  2.20s/it][A
Training...:  63% 8777/13907 [5:37:28<3:05:26,  2.17s/it][A
Training...:  63% 8778/13907 [5:37:31<3:02:57,  2.14s/it][A
Training...:  63% 8779/13907 [5:37:33<3:00:23,  2.11s/it][A
Training...:  63% 8780/13907 [5:37:35<2:57:51,  2.08s/it][A
Training...:  63% 8781/13907 [5:37:37<2:55:22,  2.05s/it][A
Training...:  63% 8782/13907 [5:37:39<2:52:46,  2.02s/it][A
Training...:  63% 8783/13907 [5:37:40<2:50:39,  2.00s/it][A
Training...:  63% 8784/13907 [5:37:42<2:47:49,  1.97s/it][A
Training...:  63% 8785/13907 [5:37:44<2:45:14,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:07:57<17:31:07, 31533.87s/it]
Training...:  63% 8785/13907 [5:37:46<2:45:14,  1.94s/it][A
Training...:  63% 8786/13907 [5:37:46<2:51:16,  2.01s/it][A
Training...:  63% 8787/13907 [5:37:48<2:47:13,  1.96s/it][A
Training...:  63% 8788/13907 [5:37:50<2:41:49,  1.90s/it][A
Training...:  63% 8789/13907 [5:37:52<2:37:47,  1.85s/it][A
Training...:  63% 8790/13907 [5:37:53<2:33:38,  1.80s/it][A
Training...:  63% 8791/13907 [5:37:55<2:30:28,  1.76s/it][A
Training...:  63% 8792/13907 [5:37:57<2:26:56,  1.72s/it][A
Training...:  63% 8793/13907 [5:37:58<2:23:58,  1.69s/it][A
Training...:  63% 8794/13907 [5:38:00<2:21:01,  1.65s/it][A
Training...:  63% 8795/13907 [5:38:01<2:17:18,  1.61s/it][A
Training...:  63% 8796/13907 [5:38:03<2:14:03,  1.57s/it][A
Training...:  63% 8797/13907 [5:38:04<2:09:37,  1.52s/it][A
Training...:  63% 8798/13907 [5:38:06<2:03:42,  1.45s/it][A
Training...:  63% 8799/13907 [5:38:07<1:57:19,  1.38s/it][A
Training...:  63% 8800/13907 [5:38:08<1:48:08,  1.27s/it][A
Training...:  63% 8801/13907 [5:38:12<2:50:28,  2.00s/it][A
Training...:  63% 8802/13907 [5:38:15<3:27:43,  2.44s/it][A
Training...:  63% 8803/13907 [5:38:18<3:47:21,  2.67s/it][A
Training...:  63% 8804/13907 [5:38:21<3:58:33,  2.81s/it][A
Training...:  63% 8805/13907 [5:38:24<4:04:22,  2.87s/it][A
Training...:  63% 8806/13907 [5:38:27<4:05:51,  2.89s/it][A
Training...:  63% 8807/13907 [5:38:30<4:04:50,  2.88s/it][A
Training...:  63% 8808/13907 [5:38:33<4:02:52,  2.86s/it][A
Training...:  63% 8809/13907 [5:38:36<4:00:00,  2.82s/it][A
Training...:  63% 8810/13907 [5:38:38<3:56:36,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:08:53<17:31:07, 31533.87s/it]
Training...:  63% 8810/13907 [5:38:42<3:56:36,  2.79s/it][A
Training...:  63% 8811/13907 [5:38:42<4:04:30,  2.88s/it][A
Training...:  63% 8812/13907 [5:38:44<4:00:02,  2.83s/it][A
Training...:  63% 8813/13907 [5:38:47<3:53:47,  2.75s/it][A
Training...:  63% 8814/13907 [5:38:49<3:47:15,  2.68s/it][A
Training...:  63% 8815/13907 [5:38:52<3:43:15,  2.63s/it][A
Training...:  63% 8816/13907 [5:38:54<3:39:18,  2.58s/it][A
Training...:  63% 8817/13907 [5:38:57<3:38:44,  2.58s/it][A
Training...:  63% 8818/13907 [5:38:59<3:35:58,  2.55s/it][A
Training...:  63% 8819/13907 [5:39:02<3:32:05,  2.50s/it][A
Training...:  63% 8820/13907 [5:39:04<3:28:07,  2.45s/it][A
Training...:  63% 8821/13907 [5:39:06<3:25:25,  2.42s/it][A
Training...:  63% 8822/13907 [5:39:09<3:21:08,  2.37s/it][A
Training...:  63% 8823/13907 [5:39:11<3:20:20,  2.36s/it][A
Training...:  63% 8824/13907 [5:39:13<3:16:27,  2.32s/it][A
Training...:  63% 8825/13907 [5:39:15<3:13:00,  2.28s/it][A
Training...:  63% 8826/13907 [5:39:18<3:09:24,  2.24s/it][A
Training...:  63% 8827/13907 [5:39:20<3:06:14,  2.20s/it][A
Training...:  63% 8828/13907 [5:39:22<3:03:11,  2.16s/it][A
Training...:  63% 8829/13907 [5:39:24<3:00:29,  2.13s/it][A
Training...:  63% 8830/13907 [5:39:26<2:57:39,  2.10s/it][A
Training...:  64% 8831/13907 [5:39:28<2:55:20,  2.07s/it][A
Training...:  64% 8832/13907 [5:39:30<2:51:50,  2.03s/it][A
Training...:  64% 8833/13907 [5:39:32<2:50:00,  2.01s/it][A
Training...:  64% 8834/13907 [5:39:34<2:47:06,  1.98s/it][A
Training...:  64% 8835/13907 [5:39:36<2:45:02,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:09:49<17:31:07, 31533.87s/it]
Training...:  64% 8835/13907 [5:39:38<2:45:02,  1.95s/it][A
Training...:  64% 8836/13907 [5:39:38<2:50:34,  2.02s/it][A
Training...:  64% 8837/13907 [5:39:40<2:47:54,  1.99s/it][A
Training...:  64% 8838/13907 [5:39:41<2:42:41,  1.93s/it][A
Training...:  64% 8839/13907 [5:39:43<2:38:44,  1.88s/it][A
Training...:  64% 8840/13907 [5:39:45<2:34:53,  1.83s/it][A
Training...:  64% 8841/13907 [5:39:47<2:30:56,  1.79s/it][A
Training...:  64% 8842/13907 [5:39:48<2:27:34,  1.75s/it][A
Training...:  64% 8843/13907 [5:39:50<2:24:43,  1.71s/it][A
Training...:  64% 8844/13907 [5:39:51<2:21:23,  1.68s/it][A
Training...:  64% 8845/13907 [5:39:53<2:17:54,  1.63s/it][A
Training...:  64% 8846/13907 [5:39:54<2:13:42,  1.59s/it][A
Training...:  64% 8847/13907 [5:39:56<2:08:37,  1.53s/it][A
Training...:  64% 8848/13907 [5:39:57<2:03:23,  1.46s/it][A
Training...:  64% 8849/13907 [5:39:58<1:57:34,  1.39s/it][A
Training...:  64% 8850/13907 [5:39:59<1:49:20,  1.30s/it][A
Training...:  64% 8851/13907 [5:40:03<2:52:22,  2.05s/it][A
Training...:  64% 8852/13907 [5:40:07<3:29:06,  2.48s/it][A
Training...:  64% 8853/13907 [5:40:10<3:48:23,  2.71s/it][A
Training...:  64% 8854/13907 [5:40:13<3:58:44,  2.83s/it][A
Training...:  64% 8855/13907 [5:40:16<4:04:31,  2.90s/it][A
Training...:  64% 8856/13907 [5:40:19<4:06:41,  2.93s/it][A
Training...:  64% 8857/13907 [5:40:22<4:06:34,  2.93s/it][A
Training...:  64% 8858/13907 [5:40:25<4:06:01,  2.92s/it][A
Training...:  64% 8859/13907 [5:40:28<4:04:15,  2.90s/it][A
Training...:  64% 8860/13907 [5:40:31<3:59:37,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:10:45<17:31:07, 31533.87s/it]
Training...:  64% 8860/13907 [5:40:34<3:59:37,  2.85s/it][A
Training...:  64% 8861/13907 [5:40:34<4:05:11,  2.92s/it][A
Training...:  64% 8862/13907 [5:40:36<4:00:13,  2.86s/it][A
Training...:  64% 8863/13907 [5:40:39<3:54:02,  2.78s/it][A
Training...:  64% 8864/13907 [5:40:42<3:46:51,  2.70s/it][A
Training...:  64% 8865/13907 [5:40:44<3:41:09,  2.63s/it][A
Training...:  64% 8866/13907 [5:40:46<3:37:08,  2.58s/it][A
Training...:  64% 8867/13907 [5:40:49<3:35:07,  2.56s/it][A
Training...:  64% 8868/13907 [5:40:51<3:32:30,  2.53s/it][A
Training...:  64% 8869/13907 [5:40:54<3:29:36,  2.50s/it][A
Training...:  64% 8870/13907 [5:40:56<3:27:17,  2.47s/it][A
Training...:  64% 8871/13907 [5:40:59<3:24:53,  2.44s/it][A
Training...:  64% 8872/13907 [5:41:01<3:22:52,  2.42s/it][A
Training...:  64% 8873/13907 [5:41:03<3:21:06,  2.40s/it][A
Training...:  64% 8874/13907 [5:41:06<3:17:39,  2.36s/it][A
Training...:  64% 8875/13907 [5:41:08<3:14:59,  2.33s/it][A
Training...:  64% 8876/13907 [5:41:10<3:12:39,  2.30s/it][A
Training...:  64% 8877/13907 [5:41:12<3:08:13,  2.25s/it][A
Training...:  64% 8878/13907 [5:41:14<3:03:54,  2.19s/it][A
Training...:  64% 8879/13907 [5:41:16<3:00:31,  2.15s/it][A
Training...:  64% 8880/13907 [5:41:18<2:57:43,  2.12s/it][A
Training...:  64% 8881/13907 [5:41:20<2:55:07,  2.09s/it][A
Training...:  64% 8882/13907 [5:41:22<2:52:18,  2.06s/it][A
Training...:  64% 8883/13907 [5:41:24<2:49:27,  2.02s/it][A
Training...:  64% 8884/13907 [5:41:26<2:46:53,  1.99s/it][A
Training...:  64% 8885/13907 [5:41:28<2:44:19,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:11:41<17:31:07, 31533.87s/it]
Training...:  64% 8885/13907 [5:41:30<2:44:19,  1.96s/it][A
Training...:  64% 8886/13907 [5:41:30<2:49:00,  2.02s/it][A
Training...:  64% 8887/13907 [5:41:32<2:47:00,  2.00s/it][A
Training...:  64% 8888/13907 [5:41:34<2:42:00,  1.94s/it][A
Training...:  64% 8889/13907 [5:41:36<2:36:55,  1.88s/it][A
Training...:  64% 8890/13907 [5:41:37<2:32:24,  1.82s/it][A
Training...:  64% 8891/13907 [5:41:39<2:29:15,  1.79s/it][A
Training...:  64% 8892/13907 [5:41:41<2:25:11,  1.74s/it][A
Training...:  64% 8893/13907 [5:41:42<2:21:17,  1.69s/it][A
Training...:  64% 8894/13907 [5:41:44<2:18:14,  1.65s/it][A
Training...:  64% 8895/13907 [5:41:45<2:15:04,  1.62s/it][A
Training...:  64% 8896/13907 [5:41:47<2:10:27,  1.56s/it][A
Training...:  64% 8897/13907 [5:41:48<2:05:57,  1.51s/it][A
Training...:  64% 8898/13907 [5:41:50<2:00:48,  1.45s/it][A
Training...:  64% 8899/13907 [5:41:51<1:55:01,  1.38s/it][A
Training...:  64% 8900/13907 [5:41:52<1:47:36,  1.29s/it][A
Training...:  64% 8901/13907 [5:41:56<2:48:52,  2.02s/it][A
Training...:  64% 8902/13907 [5:41:59<3:25:16,  2.46s/it][A
Training...:  64% 8903/13907 [5:42:02<3:45:00,  2.70s/it][A
Training...:  64% 8904/13907 [5:42:06<3:56:07,  2.83s/it][A
Training...:  64% 8905/13907 [5:42:09<4:00:59,  2.89s/it][A
Training...:  64% 8906/13907 [5:42:12<4:02:53,  2.91s/it][A
Training...:  64% 8907/13907 [5:42:14<4:02:07,  2.91s/it][A
Training...:  64% 8908/13907 [5:42:17<4:01:08,  2.89s/it][A
Training...:  64% 8909/13907 [5:42:20<3:59:03,  2.87s/it][A
Training...:  64% 8910/13907 [5:42:23<3:56:08,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:12:37<17:31:07, 31533.87s/it]
Training...:  64% 8910/13907 [5:42:26<3:56:08,  2.84s/it][A
Training...:  64% 8911/13907 [5:42:26<4:03:25,  2.92s/it][A
Training...:  64% 8912/13907 [5:42:29<3:58:56,  2.87s/it][A
Training...:  64% 8913/13907 [5:42:31<3:52:57,  2.80s/it][A
Training...:  64% 8914/13907 [5:42:34<3:46:42,  2.72s/it][A
Training...:  64% 8915/13907 [5:42:36<3:42:37,  2.68s/it][A
Training...:  64% 8916/13907 [5:42:39<3:38:58,  2.63s/it][A
Training...:  64% 8917/13907 [5:42:41<3:34:08,  2.57s/it][A
Training...:  64% 8918/13907 [5:42:44<3:29:47,  2.52s/it][A
Training...:  64% 8919/13907 [5:42:46<3:26:35,  2.49s/it][A
Training...:  64% 8920/13907 [5:42:49<3:24:07,  2.46s/it][A
Training...:  64% 8921/13907 [5:42:51<3:22:31,  2.44s/it][A
Training...:  64% 8922/13907 [5:42:53<3:18:59,  2.40s/it][A
Training...:  64% 8923/13907 [5:42:56<3:14:29,  2.34s/it][A
Training...:  64% 8924/13907 [5:42:58<3:11:40,  2.31s/it][A
Training...:  64% 8925/13907 [5:43:00<3:07:49,  2.26s/it][A
Training...:  64% 8926/13907 [5:43:02<3:04:32,  2.22s/it][A
Training...:  64% 8927/13907 [5:43:04<3:01:47,  2.19s/it][A
Training...:  64% 8928/13907 [5:43:06<2:58:49,  2.15s/it][A
Training...:  64% 8929/13907 [5:43:08<2:56:26,  2.13s/it][A
Training...:  64% 8930/13907 [5:43:10<2:53:33,  2.09s/it][A
Training...:  64% 8931/13907 [5:43:12<2:51:15,  2.07s/it][A
Training...:  64% 8932/13907 [5:43:14<2:48:28,  2.03s/it][A
Training...:  64% 8933/13907 [5:43:16<2:46:07,  2.00s/it][A
Training...:  64% 8934/13907 [5:43:18<2:43:31,  1.97s/it][A
Training...:  64% 8935/13907 [5:43:20<2:41:01,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:13:33<17:31:07, 31533.87s/it]
Training...:  64% 8935/13907 [5:43:22<2:41:01,  1.94s/it][A
Training...:  64% 8936/13907 [5:43:22<2:46:25,  2.01s/it][A
Training...:  64% 8937/13907 [5:43:24<2:43:11,  1.97s/it][A
Training...:  64% 8938/13907 [5:43:26<2:38:42,  1.92s/it][A
Training...:  64% 8939/13907 [5:43:28<2:34:40,  1.87s/it][A
Training...:  64% 8940/13907 [5:43:29<2:31:04,  1.82s/it][A
Training...:  64% 8941/13907 [5:43:31<2:27:47,  1.79s/it][A
Training...:  64% 8942/13907 [5:43:33<2:24:05,  1.74s/it][A
Training...:  64% 8943/13907 [5:43:34<2:20:52,  1.70s/it][A
Training...:  64% 8944/13907 [5:43:36<2:17:25,  1.66s/it][A
Training...:  64% 8945/13907 [5:43:37<2:14:54,  1.63s/it][A
Training...:  64% 8946/13907 [5:43:39<2:11:40,  1.59s/it][A
Training...:  64% 8947/13907 [5:43:40<2:07:01,  1.54s/it][A
Training...:  64% 8948/13907 [5:43:42<2:01:42,  1.47s/it][A
Training...:  64% 8949/13907 [5:43:43<1:55:48,  1.40s/it][A
Training...:  64% 8950/13907 [5:43:44<1:47:42,  1.30s/it][A
Training...:  64% 8951/13907 [5:43:48<2:48:36,  2.04s/it][A
Training...:  64% 8952/13907 [5:43:51<3:26:26,  2.50s/it][A
Training...:  64% 8953/13907 [5:43:55<3:46:19,  2.74s/it][A
Training...:  64% 8954/13907 [5:43:58<3:58:46,  2.89s/it][A
Training...:  64% 8955/13907 [5:44:01<4:03:51,  2.95s/it][A
Training...:  64% 8956/13907 [5:44:04<4:04:56,  2.97s/it][A
Training...:  64% 8957/13907 [5:44:07<4:03:44,  2.95s/it][A
Training...:  64% 8958/13907 [5:44:10<4:00:57,  2.92s/it][A
Training...:  64% 8959/13907 [5:44:12<3:57:42,  2.88s/it][A
Training...:  64% 8960/13907 [5:44:15<3:54:01,  2.84s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:14:29<17:31:07, 31533.87s/it]
Training...:  64% 8960/13907 [5:44:18<3:54:01,  2.84s/it][A
Training...:  64% 8961/13907 [5:44:18<4:01:13,  2.93s/it][A
Training...:  64% 8962/13907 [5:44:21<3:57:41,  2.88s/it][A
Training...:  64% 8963/13907 [5:44:24<3:52:25,  2.82s/it][A
Training...:  64% 8964/13907 [5:44:26<3:46:07,  2.74s/it][A
Training...:  64% 8965/13907 [5:44:29<3:40:28,  2.68s/it][A
Training...:  64% 8966/13907 [5:44:31<3:37:01,  2.64s/it][A
Training...:  64% 8967/13907 [5:44:34<3:33:50,  2.60s/it][A
Training...:  64% 8968/13907 [5:44:36<3:30:46,  2.56s/it][A
Training...:  64% 8969/13907 [5:44:39<3:28:01,  2.53s/it][A
Training...:  64% 8970/13907 [5:44:41<3:24:30,  2.49s/it][A
Training...:  65% 8971/13907 [5:44:44<3:21:35,  2.45s/it][A
Training...:  65% 8972/13907 [5:44:46<3:19:39,  2.43s/it][A
Training...:  65% 8973/13907 [5:44:48<3:16:03,  2.38s/it][A
Training...:  65% 8974/13907 [5:44:50<3:12:42,  2.34s/it][A
Training...:  65% 8975/13907 [5:44:53<3:07:37,  2.28s/it][A
Training...:  65% 8976/13907 [5:44:55<3:03:31,  2.23s/it][A
Training...:  65% 8977/13907 [5:44:57<3:00:08,  2.19s/it][A
Training...:  65% 8978/13907 [5:44:59<2:56:35,  2.15s/it][A
Training...:  65% 8979/13907 [5:45:01<2:54:04,  2.12s/it][A
Training...:  65% 8980/13907 [5:45:03<2:51:20,  2.09s/it][A
Training...:  65% 8981/13907 [5:45:05<2:48:36,  2.05s/it][A
Training...:  65% 8982/13907 [5:45:07<2:46:25,  2.03s/it][A
Training...:  65% 8983/13907 [5:45:09<2:43:36,  1.99s/it][A
Training...:  65% 8984/13907 [5:45:11<2:41:03,  1.96s/it][A
Training...:  65% 8985/13907 [5:45:13<2:38:41,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:15:26<17:31:07, 31533.87s/it]
Training...:  65% 8985/13907 [5:45:15<2:38:41,  1.93s/it][A
Training...:  65% 8986/13907 [5:45:15<2:43:22,  1.99s/it][A
Training...:  65% 8987/13907 [5:45:17<2:46:47,  2.03s/it][A
Training...:  65% 8988/13907 [5:45:19<2:41:33,  1.97s/it][A
Training...:  65% 8989/13907 [5:45:20<2:37:56,  1.93s/it][A
Training...:  65% 8990/13907 [5:45:22<2:33:28,  1.87s/it][A
Training...:  65% 8991/13907 [5:45:24<2:29:41,  1.83s/it][A
Training...:  65% 8992/13907 [5:45:26<2:25:32,  1.78s/it][A
Training...:  65% 8993/13907 [5:45:27<2:22:11,  1.74s/it][A
Training...:  65% 8994/13907 [5:45:29<2:18:26,  1.69s/it][A
Training...:  65% 8995/13907 [5:45:30<2:14:24,  1.64s/it][A
Training...:  65% 8996/13907 [5:45:32<2:09:06,  1.58s/it][A
Training...:  65% 8997/13907 [5:45:33<2:03:49,  1.51s/it][A
Training...:  65% 8998/13907 [5:45:34<1:58:53,  1.45s/it][A
Training...:  65% 8999/13907 [5:45:36<1:52:48,  1.38s/it][A
Training...:  65% 9000/13907 [5:45:37<1:44:32,  1.28s/it][A
Training...:  65% 9001/13907 [5:45:41<2:47:12,  2.04s/it][A
Training...:  65% 9002/13907 [5:45:44<3:22:51,  2.48s/it][A
Training...:  65% 9003/13907 [5:45:47<3:40:58,  2.70s/it][A
Training...:  65% 9004/13907 [5:45:50<3:50:07,  2.82s/it][A
Training...:  65% 9005/13907 [5:45:53<3:54:27,  2.87s/it][A
Training...:  65% 9006/13907 [5:45:56<3:55:05,  2.88s/it][A
Training...:  65% 9007/13907 [5:45:59<3:53:48,  2.86s/it][A
Training...:  65% 9008/13907 [5:46:02<3:51:06,  2.83s/it][A
Training...:  65% 9009/13907 [5:46:05<3:48:39,  2.80s/it][A
Training...:  65% 9010/13907 [5:46:07<3:45:24,  2.76s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:16:21<17:31:07, 31533.87s/it]
Training...:  65% 9010/13907 [5:46:10<3:45:24,  2.76s/it][A
Training...:  65% 9011/13907 [5:46:10<3:52:42,  2.85s/it][A
Training...:  65% 9012/13907 [5:46:13<3:48:13,  2.80s/it][A
Training...:  65% 9013/13907 [5:46:16<3:42:46,  2.73s/it][A
Training...:  65% 9014/13907 [5:46:18<3:38:39,  2.68s/it][A
Training...:  65% 9015/13907 [5:46:21<3:35:43,  2.65s/it][A
Training...:  65% 9016/13907 [5:46:23<3:32:12,  2.60s/it][A
Training...:  65% 9017/13907 [5:46:26<3:29:15,  2.57s/it][A
Training...:  65% 9018/13907 [5:46:28<3:25:47,  2.53s/it][A
Training...:  65% 9019/13907 [5:46:30<3:23:00,  2.49s/it][A
Training...:  65% 9020/13907 [5:46:33<3:19:54,  2.45s/it][A
Training...:  65% 9021/13907 [5:46:35<3:17:27,  2.42s/it][A
Training...:  65% 9022/13907 [5:46:38<3:16:39,  2.42s/it][A
Training...:  65% 9023/13907 [5:46:40<3:12:35,  2.37s/it][A
Training...:  65% 9024/13907 [5:46:42<3:09:19,  2.33s/it][A
Training...:  65% 9025/13907 [5:46:44<3:05:33,  2.28s/it][A
Training...:  65% 9026/13907 [5:46:46<3:02:16,  2.24s/it][A
Training...:  65% 9027/13907 [5:46:48<2:58:48,  2.20s/it][A
Training...:  65% 9028/13907 [5:46:51<2:55:56,  2.16s/it][A
Training...:  65% 9029/13907 [5:46:53<2:53:31,  2.13s/it][A
Training...:  65% 9030/13907 [5:46:55<2:50:33,  2.10s/it][A
Training...:  65% 9031/13907 [5:46:57<2:48:34,  2.07s/it][A
Training...:  65% 9032/13907 [5:46:59<2:45:54,  2.04s/it][A
Training...:  65% 9033/13907 [5:47:01<2:43:29,  2.01s/it][A
Training...:  65% 9034/13907 [5:47:02<2:41:10,  1.98s/it][A
Training...:  65% 9035/13907 [5:47:04<2:38:39,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:17:18<17:31:07, 31533.87s/it]
Training...:  65% 9035/13907 [5:47:07<2:38:39,  1.95s/it][A
Training...:  65% 9036/13907 [5:47:07<2:44:06,  2.02s/it][A
Training...:  65% 9037/13907 [5:47:08<2:40:16,  1.97s/it][A
Training...:  65% 9038/13907 [5:47:10<2:35:09,  1.91s/it][A
Training...:  65% 9039/13907 [5:47:12<2:32:17,  1.88s/it][A
Training...:  65% 9040/13907 [5:47:14<2:28:05,  1.83s/it][A
Training...:  65% 9041/13907 [5:47:15<2:24:35,  1.78s/it][A
Training...:  65% 9042/13907 [5:47:17<2:21:03,  1.74s/it][A
Training...:  65% 9043/13907 [5:47:19<2:17:46,  1.70s/it][A
Training...:  65% 9044/13907 [5:47:20<2:14:45,  1.66s/it][A
Training...:  65% 9045/13907 [5:47:22<2:11:04,  1.62s/it][A
Training...:  65% 9046/13907 [5:47:23<2:06:53,  1.57s/it][A
Training...:  65% 9047/13907 [5:47:25<2:01:51,  1.50s/it][A
Training...:  65% 9048/13907 [5:47:26<1:56:57,  1.44s/it][A
Training...:  65% 9049/13907 [5:47:27<1:51:38,  1.38s/it][A
Training...:  65% 9050/13907 [5:47:28<1:43:31,  1.28s/it][A
Training...:  65% 9051/13907 [5:47:32<2:40:33,  1.98s/it][A
Training...:  65% 9052/13907 [5:47:35<3:14:54,  2.41s/it][A
Training...:  65% 9053/13907 [5:47:38<3:34:33,  2.65s/it][A
Training...:  65% 9054/13907 [5:47:41<3:45:28,  2.79s/it][A
Training...:  65% 9055/13907 [5:47:45<3:52:14,  2.87s/it][A
Training...:  65% 9056/13907 [5:47:47<3:53:24,  2.89s/it][A
Training...:  65% 9057/13907 [5:47:50<3:53:07,  2.88s/it][A
Training...:  65% 9058/13907 [5:47:53<3:54:23,  2.90s/it][A
Training...:  65% 9059/13907 [5:47:56<3:50:52,  2.86s/it][A
Training...:  65% 9060/13907 [5:47:59<3:47:07,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:18:13<17:31:07, 31533.87s/it]
Training...:  65% 9060/13907 [5:48:02<3:47:07,  2.81s/it][A
Training...:  65% 9061/13907 [5:48:02<3:52:20,  2.88s/it][A
Training...:  65% 9062/13907 [5:48:04<3:47:28,  2.82s/it][A
Training...:  65% 9063/13907 [5:48:07<3:41:06,  2.74s/it][A
Training...:  65% 9064/13907 [5:48:10<3:36:00,  2.68s/it][A
Training...:  65% 9065/13907 [5:48:12<3:31:19,  2.62s/it][A
Training...:  65% 9066/13907 [5:48:14<3:26:54,  2.56s/it][A
Training...:  65% 9067/13907 [5:48:17<3:23:10,  2.52s/it][A
Training...:  65% 9068/13907 [5:48:19<3:19:48,  2.48s/it][A
Training...:  65% 9069/13907 [5:48:22<3:16:21,  2.44s/it][A
Training...:  65% 9070/13907 [5:48:24<3:13:28,  2.40s/it][A
Training...:  65% 9071/13907 [5:48:26<3:11:19,  2.37s/it][A
Training...:  65% 9072/13907 [5:48:28<3:08:00,  2.33s/it][A
Training...:  65% 9073/13907 [5:48:31<3:05:07,  2.30s/it][A
Training...:  65% 9074/13907 [5:48:33<3:02:24,  2.26s/it][A
Training...:  65% 9075/13907 [5:48:35<3:00:04,  2.24s/it][A
Training...:  65% 9076/13907 [5:48:37<2:57:16,  2.20s/it][A
Training...:  65% 9077/13907 [5:48:39<2:54:38,  2.17s/it][A
Training...:  65% 9078/13907 [5:48:41<2:51:46,  2.13s/it][A
Training...:  65% 9079/13907 [5:48:43<2:49:52,  2.11s/it][A
Training...:  65% 9080/13907 [5:48:45<2:48:09,  2.09s/it][A
Training...:  65% 9081/13907 [5:48:47<2:45:32,  2.06s/it][A
Training...:  65% 9082/13907 [5:48:49<2:42:41,  2.02s/it][A
Training...:  65% 9083/13907 [5:48:51<2:40:06,  1.99s/it][A
Training...:  65% 9084/13907 [5:48:53<2:37:44,  1.96s/it][A
Training...:  65% 9085/13907 [5:48:55<2:35:36,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:19:08<17:31:07, 31533.87s/it]
Training...:  65% 9085/13907 [5:48:57<2:35:36,  1.94s/it][A
Training...:  65% 9086/13907 [5:48:57<2:41:52,  2.01s/it][A
Training...:  65% 9087/13907 [5:48:59<2:39:51,  1.99s/it][A
Training...:  65% 9088/13907 [5:49:01<2:34:44,  1.93s/it][A
Training...:  65% 9089/13907 [5:49:03<2:29:29,  1.86s/it][A
Training...:  65% 9090/13907 [5:49:04<2:25:55,  1.82s/it][A
Training...:  65% 9091/13907 [5:49:06<2:22:18,  1.77s/it][A
Training...:  65% 9092/13907 [5:49:08<2:18:42,  1.73s/it][A
Training...:  65% 9093/13907 [5:49:09<2:15:21,  1.69s/it][A
Training...:  65% 9094/13907 [5:49:11<2:12:03,  1.65s/it][A
Training...:  65% 9095/13907 [5:49:12<2:08:15,  1.60s/it][A
Training...:  65% 9096/13907 [5:49:14<2:04:21,  1.55s/it][A
Training...:  65% 9097/13907 [5:49:15<1:59:40,  1.49s/it][A
Training...:  65% 9098/13907 [5:49:16<1:55:07,  1.44s/it][A
Training...:  65% 9099/13907 [5:49:18<1:49:25,  1.37s/it][A
Training...:  65% 9100/13907 [5:49:19<1:41:50,  1.27s/it][A
Training...:  65% 9101/13907 [5:49:22<2:44:45,  2.06s/it][A
Training...:  65% 9102/13907 [5:49:26<3:20:03,  2.50s/it][A
Training...:  65% 9103/13907 [5:49:29<3:38:22,  2.73s/it][A
Training...:  65% 9104/13907 [5:49:32<3:47:40,  2.84s/it][A
Training...:  65% 9105/13907 [5:49:35<3:51:42,  2.90s/it][A
Training...:  65% 9106/13907 [5:49:38<3:53:20,  2.92s/it][A
Training...:  65% 9107/13907 [5:49:41<3:51:51,  2.90s/it][A
Training...:  65% 9108/13907 [5:49:44<3:49:34,  2.87s/it][A
Training...:  65% 9109/13907 [5:49:47<3:46:48,  2.84s/it][A
Training...:  66% 9110/13907 [5:49:49<3:42:45,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:20:04<17:31:07, 31533.87s/it]
Training...:  66% 9110/13907 [5:49:53<3:42:45,  2.79s/it][A
Training...:  66% 9111/13907 [5:49:53<3:49:38,  2.87s/it][A
Training...:  66% 9112/13907 [5:49:55<3:44:37,  2.81s/it][A
Training...:  66% 9113/13907 [5:49:58<3:38:49,  2.74s/it][A
Training...:  66% 9114/13907 [5:50:00<3:33:14,  2.67s/it][A
Training...:  66% 9115/13907 [5:50:03<3:28:29,  2.61s/it][A
Training...:  66% 9116/13907 [5:50:05<3:24:00,  2.55s/it][A
Training...:  66% 9117/13907 [5:50:08<3:20:43,  2.51s/it][A
Training...:  66% 9118/13907 [5:50:10<3:16:47,  2.47s/it][A
Training...:  66% 9119/13907 [5:50:12<3:13:20,  2.42s/it][A
Training...:  66% 9120/13907 [5:50:15<3:12:48,  2.42s/it][A
Training...:  66% 9121/13907 [5:50:17<3:10:22,  2.39s/it][A
Training...:  66% 9122/13907 [5:50:19<3:06:45,  2.34s/it][A
Training...:  66% 9123/13907 [5:50:21<3:03:44,  2.30s/it][A
Training...:  66% 9124/13907 [5:50:24<3:00:50,  2.27s/it][A
Training...:  66% 9125/13907 [5:50:26<2:58:00,  2.23s/it][A
Training...:  66% 9126/13907 [5:50:28<2:55:24,  2.20s/it][A
Training...:  66% 9127/13907 [5:50:30<2:52:33,  2.17s/it][A
Training...:  66% 9128/13907 [5:50:32<2:49:38,  2.13s/it][A
Training...:  66% 9129/13907 [5:50:34<2:47:19,  2.10s/it][A
Training...:  66% 9130/13907 [5:50:36<2:44:57,  2.07s/it][A
Training...:  66% 9131/13907 [5:50:38<2:42:40,  2.04s/it][A
Training...:  66% 9132/13907 [5:50:40<2:40:16,  2.01s/it][A
Training...:  66% 9133/13907 [5:50:42<2:38:31,  1.99s/it][A
Training...:  66% 9134/13907 [5:50:44<2:36:03,  1.96s/it][A
Training...:  66% 9135/13907 [5:50:46<2:34:34,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:20:59<17:31:07, 31533.87s/it]
Training...:  66% 9135/13907 [5:50:48<2:34:34,  1.94s/it][A
Training...:  66% 9136/13907 [5:50:48<2:39:04,  2.00s/it][A
Training...:  66% 9137/13907 [5:50:50<2:35:47,  1.96s/it][A
Training...:  66% 9138/13907 [5:50:51<2:31:20,  1.90s/it][A
Training...:  66% 9139/13907 [5:50:53<2:27:19,  1.85s/it][A
Training...:  66% 9140/13907 [5:50:55<2:23:50,  1.81s/it][A
Training...:  66% 9141/13907 [5:50:57<2:20:57,  1.77s/it][A
Training...:  66% 9142/13907 [5:50:58<2:17:44,  1.73s/it][A
Training...:  66% 9143/13907 [5:51:00<2:14:37,  1.70s/it][A
Training...:  66% 9144/13907 [5:51:01<2:11:18,  1.65s/it][A
Training...:  66% 9145/13907 [5:51:03<2:07:40,  1.61s/it][A
Training...:  66% 9146/13907 [5:51:04<2:03:58,  1.56s/it][A
Training...:  66% 9147/13907 [5:51:06<1:59:27,  1.51s/it][A
Training...:  66% 9148/13907 [5:51:07<1:54:35,  1.44s/it][A
Training...:  66% 9149/13907 [5:51:08<1:49:01,  1.37s/it][A
Training...:  66% 9150/13907 [5:51:09<1:41:22,  1.28s/it][A
Training...:  66% 9151/13907 [5:51:13<2:38:54,  2.00s/it][A
Training...:  66% 9152/13907 [5:51:17<3:14:45,  2.46s/it][A
Training...:  66% 9153/13907 [5:51:20<3:36:41,  2.73s/it][A
Training...:  66% 9154/13907 [5:51:23<3:47:32,  2.87s/it][A
Training...:  66% 9155/13907 [5:51:26<3:51:25,  2.92s/it][A
Training...:  66% 9156/13907 [5:51:29<3:51:33,  2.92s/it][A
Training...:  66% 9157/13907 [5:51:32<3:50:03,  2.91s/it][A
Training...:  66% 9158/13907 [5:51:35<3:47:18,  2.87s/it][A
Training...:  66% 9159/13907 [5:51:37<3:43:49,  2.83s/it][A
Training...:  66% 9160/13907 [5:51:40<3:40:57,  2.79s/it][A                                                                                                                             
                                                         [AStep... (35225 | Loss: 0.22954559326171875, Learning Rate: 8.955152588896453e-05, Gradient Norm: 0.7787917852401733)
Step... (35250 | Loss: 0.2251756340265274, Learning Rate: 8.939999679569155e-05, Gradient Norm: 1.0161170959472656)
Step... (35275 | Loss: 0.201526939868927, Learning Rate: 8.924848953029141e-05, Gradient Norm: 0.8209550380706787)
Step... (35300 | Loss: 0.21718475222587585, Learning Rate: 8.909698226489127e-05, Gradient Norm: 1.0149450302124023)
Step... (35325 | Loss: 0.2779136896133423, Learning Rate: 8.894545317161828e-05, Gradient Norm: 0.7681295871734619)
Step... (35350 | Loss: 0.2057100534439087, Learning Rate: 8.879394590621814e-05, Gradient Norm: 1.2458398342132568)
Step... (35375 | Loss: 0.24547666311264038, Learning Rate: 8.864243136486039e-05, Gradient Norm: 0.8466438055038452)
Step... (35400 | Loss: 0.21830029785633087, Learning Rate: 8.849090954754502e-05, Gradient Norm: 1.4518799781799316)
Step... (35425 | Loss: 0.18376681208610535, Learning Rate: 8.833939500618726e-05, Gradient Norm: 0.6560342311859131)
Step... (35450 | Loss: 0.15572279691696167, Learning Rate: 8.818788774078712e-05, Gradient Norm: 0.8719902038574219)
Step... (35475 | Loss: 0.256650447845459, Learning Rate: 8.803636592347175e-05, Gradient Norm: 0.7365297079086304)
Step... (35500 | Loss: 0.14349302649497986, Learning Rate: 8.788485138211399e-05, Gradient Norm: 0.7186107635498047)
Step... (35525 | Loss: 0.2148178219795227, Learning Rate: 8.773334411671385e-05, Gradient Norm: 0.8590184450149536)
Step... (35550 | Loss: 0.1694127321243286, Learning Rate: 8.758181502344087e-05, Gradient Norm: 0.9267145991325378)
Step... (35575 | Loss: 0.1926501840353012, Learning Rate: 8.743030775804073e-05, Gradient Norm: 0.7465556859970093)
Step... (35600 | Loss: 0.16617047786712646, Learning Rate: 8.727880049264058e-05, Gradient Norm: 0.7351723909378052)
Step... (35625 | Loss: 0.20289257168769836, Learning Rate: 8.71272713993676e-05, Gradient Norm: 1.535130262374878)
Step... (35650 | Loss: 0.1962844729423523, Learning Rate: 8.697576413396746e-05, Gradient Norm: 1.5348031520843506)
Step... (35675 | Loss: 0.22647525370121002, Learning Rate: 8.682425686856732e-05, Gradient Norm: 0.9349336624145508)
Step... (35700 | Loss: 0.13782024383544922, Learning Rate: 8.667272777529433e-05, Gradient Norm: 1.1318728923797607)
Step... (35725 | Loss: 0.19769075512886047, Learning Rate: 8.652122050989419e-05, Gradient Norm: 1.1099879741668701)
Step... (35750 | Loss: 0.14824603497982025, Learning Rate: 8.636970596853644e-05, Gradient Norm: 0.8600718975067139)
Step... (35775 | Loss: 0.228742316365242, Learning Rate: 8.621818415122107e-05, Gradient Norm: 0.7631676197052002)
Step... (35800 | Loss: 0.14290210604667664, Learning Rate: 8.606667688582093e-05, Gradient Norm: 1.0272619724273682)
Step... (35825 | Loss: 0.20932498574256897, Learning Rate: 8.591516234446317e-05, Gradient Norm: 0.9036239385604858)
Step... (35850 | Loss: 0.156498983502388, Learning Rate: 8.57636405271478e-05, Gradient Norm: 0.7241166830062866)
Step... (35875 | Loss: 0.2124217450618744, Learning Rate: 8.561212598579004e-05, Gradient Norm: 0.9275492429733276)
Step... (35900 | Loss: 0.17137488722801208, Learning Rate: 8.54606187203899e-05, Gradient Norm: 0.8387705087661743)
Step... (35925 | Loss: 0.18700721859931946, Learning Rate: 8.530908962711692e-05, Gradient Norm: 0.5890263319015503)
Step... (35950 | Loss: 0.20252645015716553, Learning Rate: 8.515758236171678e-05, Gradient Norm: 1.001532793045044)
Step... (35975 | Loss: 0.2333020120859146, Learning Rate: 8.500607509631664e-05, Gradient Norm: 0.8985340595245361)
Step... (36000 | Loss: 0.20615556836128235, Learning Rate: 8.485454600304365e-05, Gradient Norm: 1.0208479166030884)
Step... (36025 | Loss: 0.18465547263622284, Learning Rate: 8.470303873764351e-05, Gradient Norm: 0.726651668548584)
Step... (36050 | Loss: 0.19750478863716125, Learning Rate: 8.455153147224337e-05, Gradient Norm: 0.8774247765541077)
Step... (36075 | Loss: 0.159917414188385, Learning Rate: 8.440000237897038e-05, Gradient Norm: 0.5825257301Epoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:21:54<17:31:07, 31533.87s/it]
Training...:  66% 9160/13907 [5:51:43<3:40:57,  2.79s/it][A
Training...:  66% 9161/13907 [5:51:43<3:47:17,  2.87s/it][A330566)
Step... (36100 | Loss: 0.15536224842071533, Learning Rate: 8.424849511357024e-05, Gradient Norm: 0.9108402132987976)
Step... (36125 | Loss: 0.1732352375984192, Learning Rate: 8.409696602029726e-05, Gradient Norm: 0.7345708608627319)
Step... (36150 | Loss: 0.15303048491477966, Learning Rate: 8.394545875489712e-05, Gradient Norm: 0.7173676490783691)
Step... (36175 | Loss: 0.2422838658094406, Learning Rate: 8.379395148949698e-05, Gradient Norm: 0.9697710871696472)
Step... (36200 | Loss: 0.1636628806591034, Learning Rate: 8.364242239622399e-05, Gradient Norm: 1.0359489917755127)
Step... (36225 | Loss: 0.20726671814918518, Learning Rate: 8.349091513082385e-05, Gradient Norm: 0.988682746887207)
Step... (36250 | Loss: 0.20028279721736908, Learning Rate: 8.33394005894661e-05, Gradient Norm: 0.9367890357971191)
Step... (36275 | Loss: 0.20490188896656036, Learning Rate: 8.318787877215073e-05, Gradient Norm: 0.7388388514518738)
Step... (36300 | Loss: 0.18016520142555237, Learning Rate: 8.303636423079297e-05, Gradient Norm: 1.1050198078155518)
Step... (36325 | Loss: 0.2436329424381256, Learning Rate: 8.288485696539283e-05, Gradient Norm: 0.8725014925003052)
Step... (36350 | Loss: 0.1652882993221283, Learning Rate: 8.273332787211984e-05, Gradient Norm: 1.0235366821289062)
Step... (36375 | Loss: 0.17395378649234772, Learning Rate: 8.25818206067197e-05, Gradient Norm: 0.8829972743988037)
Step... (36400 | Loss: 0.16115513443946838, Learning Rate: 8.243031334131956e-05, Gradient Norm: 0.9371199011802673)
Step... (36425 | Loss: 0.23073044419288635, Learning Rate: 8.227878424804658e-05, Gradient Norm: 1.0971238613128662)
Step... (36450 | Loss: 0.1397598385810852, Learning Rate: 8.212727698264644e-05, Gradient Norm: 0.6993038654327393)
Step... (36475 | Loss: 0.17673853039741516, Learning Rate: 8.19757697172463e-05, Gradient Norm: 0.6422091126441956)
Step... (36500 | Loss: 0.1747710406780243, Learning Rate: 8.182424062397331e-05, Gradient Norm: 1.2499829530715942)
Step... (36525 | Loss: 0.1941969394683838, Learning Rate: 8.167273335857317e-05, Gradient Norm: 0.6276323795318604)
Step... (36550 | Loss: 0.1509087085723877, Learning Rate: 8.152122609317303e-05, Gradient Norm: 0.8470358848571777)
Step... (36575 | Loss: 0.19533438980579376, Learning Rate: 8.136969699990004e-05, Gradient Norm: 0.7428828477859497)
Step... (36600 | Loss: 0.1295005828142166, Learning Rate: 8.12181897344999e-05, Gradient Norm: 0.5330173969268799)
Step... (36625 | Loss: 0.25931939482688904, Learning Rate: 8.106667519314215e-05, Gradient Norm: 0.936897337436676)
Step... (36650 | Loss: 0.1821325570344925, Learning Rate: 8.091515337582678e-05, Gradient Norm: 0.6742029786109924)
Step... (36675 | Loss: 0.25244051218032837, Learning Rate: 8.076363883446902e-05, Gradient Norm: 0.7549008131027222)
Step... (36700 | Loss: 0.16312275826931, Learning Rate: 8.061213156906888e-05, Gradient Norm: 0.6637519598007202)
Step... (36725 | Loss: 0.23733681440353394, Learning Rate: 8.04606024757959e-05, Gradient Norm: 1.1143473386764526)
Step... (36750 | Loss: 0.15012598037719727, Learning Rate: 8.030909521039575e-05, Gradient Norm: 0.7126834392547607)
Step... (36775 | Loss: 0.25516194105148315, Learning Rate: 8.015758794499561e-05, Gradient Norm: 1.000229001045227)
Step... (36800 | Loss: 0.20317380130290985, Learning Rate: 8.000605885172263e-05, Gradient Norm: 0.8509675860404968)
Step... (36825 | Loss: 0.19326573610305786, Learning Rate: 7.985455158632249e-05, Gradient Norm: 0.5943437814712524)
Step... (36850 | Loss: 0.20211009681224823, Learning Rate: 7.970304432092234e-05, Gradient Norm: 0.9122236967086792)
Step... (36875 | Loss: 0.24139010906219482, Learning Rate: 7.955151522764936e-05, Gradient Norm: 1.1268590688705444)
Step... (36900 | Loss: 0.2130604386329651, Learning Rate: 7.940000796224922e-05, Gradient Norm: 1.2762607336044312)
Step... (36925 | Loss: 0.23783555626869202, Learning Rate: 7.924850069684908e-05, Gradient Norm: 0.9396893978118896)
Step... (36950 | Loss: 0.1060878187417984, Learning Rate: 7.90969716035761e-05, Gradient Norm: 0.592452883720398)

Training...:  66% 9162/13907 [5:51:46<3:46:49,  2.87s/it][A
Training...:  66% 9163/13907 [5:51:49<3:39:27,  2.78s/it][A
Training...:  66% 9164/13907 [5:51:51<3:32:54,  2.69s/it][A
Training...:  66% 9165/13907 [5:51:54<3:27:33,  2.63s/it][A
Training...:  66% 9166/13907 [5:51:56<3:22:55,  2.57s/it][A
Training...:  66% 9167/13907 [5:51:58<3:19:26,  2.52s/it][A
Training...:  66% 9168/13907 [5:52:01<3:15:50,  2.48s/it][A
Training...:  66% 9169/13907 [5:52:03<3:12:45,  2.44s/it][A
Training...:  66% 9170/13907 [5:52:06<3:10:18,  2.41s/it][A
Training...:  66% 9171/13907 [5:52:08<3:07:47,  2.38s/it][A
Training...:  66% 9172/13907 [5:52:10<3:05:03,  2.34s/it][A
Training...:  66% 9173/13907 [5:52:12<3:01:48,  2.30s/it][A
Training...:  66% 9174/13907 [5:52:15<2:59:52,  2.28s/it][A
Training...:  66% 9175/13907 [5:52:17<2:57:26,  2.25s/it][A
Training...:  66% 9176/13907 [5:52:19<2:54:30,  2.21s/it][A
Training...:  66% 9177/13907 [5:52:21<2:52:00,  2.18s/it][A
Training...:  66% 9178/13907 [5:52:23<2:49:53,  2.16s/it][A
Training...:  66% 9179/13907 [5:52:25<2:48:33,  2.14s/it][A
Training...:  66% 9180/13907 [5:52:27<2:46:44,  2.12s/it][A
Training...:  66% 9181/13907 [5:52:29<2:43:53,  2.08s/it][A
Training...:  66% 9182/13907 [5:52:31<2:41:03,  2.05s/it][A
Training...:  66% 9183/13907 [5:52:33<2:38:44,  2.02s/it][A
Training...:  66% 9184/13907 [5:52:35<2:35:59,  1.98s/it][A
Training...:  66% 9185/13907 [5:52:37<2:33:38,  1.95s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:22:50<17:31:07, 31533.87s/it]
Training...:  66% 9185/13907 [5:52:39<2:33:38,  1.95s/it][A
Training...:  66% 9186/13907 [5:52:39<2:38:45,  2.02s/it][A
Training...:  66% 9187/13907 [5:52:41<2:35:27,  1.98s/it][A
Training...:  66% 9188/13907 [5:52:43<2:31:09,  1.92s/it][A
Training...:  66% 9189/13907 [5:52:44<2:26:26,  1.86s/it][A
Training...:  66% 9190/13907 [5:52:46<2:23:14,  1.82s/it][A
Training...:  66% 9191/13907 [5:52:48<2:20:20,  1.79s/it][A
Training...:  66% 9192/13907 [5:52:50<2:17:23,  1.75s/it][A
Training...:  66% 9193/13907 [5:52:51<2:13:53,  1.70s/it][A
Training...:  66% 9194/13907 [5:52:53<2:11:02,  1.67s/it][A
Training...:  66% 9195/13907 [5:52:54<2:07:21,  1.62s/it][A
Training...:  66% 9196/13907 [5:52:56<2:02:54,  1.57s/it][A
Training...:  66% 9197/13907 [5:52:57<1:58:34,  1.51s/it][A
Training...:  66% 9198/13907 [5:52:58<1:53:56,  1.45s/it][A
Training...:  66% 9199/13907 [5:53:00<1:49:10,  1.39s/it][A
Training...:  66% 9200/13907 [5:53:01<1:42:06,  1.30s/it][A
Training...:  66% 9201/13907 [5:53:04<2:38:12,  2.02s/it][A
Training...:  66% 9202/13907 [5:53:08<3:12:18,  2.45s/it][A
Training...:  66% 9203/13907 [5:53:11<3:32:16,  2.71s/it][A
Training...:  66% 9204/13907 [5:53:14<3:43:29,  2.85s/it][A
Training...:  66% 9205/13907 [5:53:17<3:48:02,  2.91s/it][A
Training...:  66% 9206/13907 [5:53:20<3:50:01,  2.94s/it][A
Training...:  66% 9207/13907 [5:53:23<3:49:13,  2.93s/it][A
Training...:  66% 9208/13907 [5:53:26<3:46:57,  2.90s/it][A
Training...:  66% 9209/13907 [5:53:29<3:43:58,  2.86s/it][A
Training...:  66% 9210/13907 [5:53:32<3:42:56,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:23:46<17:31:07, 31533.87s/it]
Training...:  66% 9210/13907 [5:53:35<3:42:56,  2.85s/it][A
Training...:  66% 9211/13907 [5:53:35<3:49:25,  2.93s/it][A
Training...:  66% 9212/13907 [5:53:38<3:44:18,  2.87s/it][A
Training...:  66% 9213/13907 [5:53:40<3:37:23,  2.78s/it][A
Training...:  66% 9214/13907 [5:53:43<3:31:41,  2.71s/it][A
Training...:  66% 9215/13907 [5:53:45<3:27:03,  2.65s/it][A
Training...:  66% 9216/13907 [5:53:48<3:22:06,  2.58s/it][A
Training...:  66% 9217/13907 [5:53:50<3:18:18,  2.54s/it][A
Training...:  66% 9218/13907 [5:53:52<3:14:35,  2.49s/it][A
Training...:  66% 9219/13907 [5:53:55<3:11:28,  2.45s/it][A
Training...:  66% 9220/13907 [5:53:57<3:08:14,  2.41s/it][A
Training...:  66% 9221/13907 [5:53:59<3:05:55,  2.38s/it][A
Training...:  66% 9222/13907 [5:54:02<3:02:28,  2.34s/it][A
Training...:  66% 9223/13907 [5:54:04<2:59:14,  2.30s/it][A
Training...:  66% 9224/13907 [5:54:06<2:56:28,  2.26s/it][A
Training...:  66% 9225/13907 [5:54:08<2:53:57,  2.23s/it][A
Training...:  66% 9226/13907 [5:54:10<2:51:31,  2.20s/it][A
Training...:  66% 9227/13907 [5:54:12<2:49:29,  2.17s/it][A
Training...:  66% 9228/13907 [5:54:15<2:47:15,  2.14s/it][A
Training...:  66% 9229/13907 [5:54:17<2:45:01,  2.12s/it][A
Training...:  66% 9230/13907 [5:54:19<2:43:19,  2.10s/it][A
Training...:  66% 9231/13907 [5:54:21<2:41:55,  2.08s/it][A
Training...:  66% 9232/13907 [5:54:23<2:40:02,  2.05s/it][A
Training...:  66% 9233/13907 [5:54:25<2:37:49,  2.03s/it][A
Training...:  66% 9234/13907 [5:54:27<2:36:11,  2.01s/it][A
Training...:  66% 9235/13907 [5:54:29<2:33:55,  1.98s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:24:42<17:31:07, 31533.87s/it]
Training...:  66% 9235/13907 [5:54:31<2:33:55,  1.98s/it][A
Training...:  66% 9236/13907 [5:54:31<2:38:50,  2.04s/it][A
Training...:  66% 9237/13907 [5:54:33<2:34:33,  1.99s/it][A
Training...:  66% 9238/13907 [5:54:34<2:29:08,  1.92s/it][A
Training...:  66% 9239/13907 [5:54:36<2:25:26,  1.87s/it][A
Training...:  66% 9240/13907 [5:54:38<2:21:08,  1.81s/it][A
Training...:  66% 9241/13907 [5:54:39<2:17:28,  1.77s/it][A
Training...:  66% 9242/13907 [5:54:41<2:14:06,  1.72s/it][A
Training...:  66% 9243/13907 [5:54:43<2:10:56,  1.68s/it][A
Training...:  66% 9244/13907 [5:54:44<2:08:23,  1.65s/it][A
Training...:  66% 9245/13907 [5:54:46<2:05:09,  1.61s/it][A
Training...:  66% 9246/13907 [5:54:47<2:01:30,  1.56s/it][A
Training...:  66% 9247/13907 [5:54:49<1:56:35,  1.50s/it][A
Training...:  66% 9248/13907 [5:54:50<1:53:01,  1.46s/it][A
Training...:  67% 9249/13907 [5:54:51<1:47:52,  1.39s/it][A
Training...:  67% 9250/13907 [5:54:52<1:39:48,  1.29s/it][A
Training...:  67% 9251/13907 [5:54:56<2:36:48,  2.02s/it][A
Training...:  67% 9252/13907 [5:54:59<3:10:56,  2.46s/it][A
Training...:  67% 9253/13907 [5:55:03<3:29:35,  2.70s/it][A
Training...:  67% 9254/13907 [5:55:06<3:39:34,  2.83s/it][A
Training...:  67% 9255/13907 [5:55:09<3:44:29,  2.90s/it][A
Training...:  67% 9256/13907 [5:55:12<3:45:13,  2.91s/it][A
Training...:  67% 9257/13907 [5:55:15<3:44:44,  2.90s/it][A
Training...:  67% 9258/13907 [5:55:17<3:42:02,  2.87s/it][A
Training...:  67% 9259/13907 [5:55:20<3:38:50,  2.82s/it][A
Training...:  67% 9260/13907 [5:55:23<3:35:48,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:25:37<17:31:07, 31533.87s/it]
Training...:  67% 9260/13907 [5:55:26<3:35:48,  2.79s/it][A
Training...:  67% 9261/13907 [5:55:26<3:42:05,  2.87s/it][A
Training...:  67% 9262/13907 [5:55:29<3:37:48,  2.81s/it][A
Training...:  67% 9263/13907 [5:55:31<3:31:50,  2.74s/it][A
Training...:  67% 9264/13907 [5:55:34<3:27:00,  2.68s/it][A
Training...:  67% 9265/13907 [5:55:36<3:22:53,  2.62s/it][A
Training...:  67% 9266/13907 [5:55:39<3:18:48,  2.57s/it][A
Training...:  67% 9267/13907 [5:55:41<3:15:52,  2.53s/it][A
Training...:  67% 9268/13907 [5:55:44<3:13:19,  2.50s/it][A
Training...:  67% 9269/13907 [5:55:46<3:10:07,  2.46s/it][A
Training...:  67% 9270/13907 [5:55:48<3:06:50,  2.42s/it][A
Training...:  67% 9271/13907 [5:55:51<3:04:47,  2.39s/it][A
Training...:  67% 9272/13907 [5:55:53<3:02:34,  2.36s/it][A
Training...:  67% 9273/13907 [5:55:55<3:01:10,  2.35s/it][A
Training...:  67% 9274/13907 [5:55:57<2:57:33,  2.30s/it][A
Training...:  67% 9275/13907 [5:55:59<2:53:37,  2.25s/it][A
Training...:  67% 9276/13907 [5:56:02<2:49:53,  2.20s/it][A
Training...:  67% 9277/13907 [5:56:04<2:47:04,  2.17s/it][A
Training...:  67% 9278/13907 [5:56:06<2:44:05,  2.13s/it][A
Training...:  67% 9279/13907 [5:56:08<2:41:43,  2.10s/it][A
Training...:  67% 9280/13907 [5:56:10<2:39:45,  2.07s/it][A
Training...:  67% 9281/13907 [5:56:12<2:37:19,  2.04s/it][A
Training...:  67% 9282/13907 [5:56:14<2:35:15,  2.01s/it][A
Training...:  67% 9283/13907 [5:56:16<2:32:45,  1.98s/it][A
Training...:  67% 9284/13907 [5:56:17<2:30:46,  1.96s/it][A
Training...:  67% 9285/13907 [5:56:19<2:28:21,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:26:32<17:31:07, 31533.87s/it]
Training...:  67% 9285/13907 [5:56:21<2:28:21,  1.93s/it][A
Training...:  67% 9286/13907 [5:56:21<2:33:46,  2.00s/it][A
Training...:  67% 9287/13907 [5:56:23<2:31:09,  1.96s/it][A
Training...:  67% 9288/13907 [5:56:25<2:26:11,  1.90s/it][A
Training...:  67% 9289/13907 [5:56:27<2:22:27,  1.85s/it][A
Training...:  67% 9290/13907 [5:56:28<2:18:40,  1.80s/it][A
Training...:  67% 9291/13907 [5:56:30<2:15:23,  1.76s/it][A
Training...:  67% 9292/13907 [5:56:32<2:11:51,  1.71s/it][A
Training...:  67% 9293/13907 [5:56:33<2:08:54,  1.68s/it][A
Training...:  67% 9294/13907 [5:56:35<2:05:54,  1.64s/it][A
Training...:  67% 9295/13907 [5:56:36<2:02:21,  1.59s/it][A
Training...:  67% 9296/13907 [5:56:38<1:58:36,  1.54s/it][A
Training...:  67% 9297/13907 [5:56:39<1:54:35,  1.49s/it][A
Training...:  67% 9298/13907 [5:56:40<1:49:53,  1.43s/it][A
Training...:  67% 9299/13907 [5:56:42<1:44:48,  1.36s/it][A
Training...:  67% 9300/13907 [5:56:43<1:37:28,  1.27s/it][A
Training...:  67% 9301/13907 [5:56:46<2:33:14,  2.00s/it][A
Training...:  67% 9302/13907 [5:56:50<3:08:09,  2.45s/it][A
Training...:  67% 9303/13907 [5:56:53<3:28:10,  2.71s/it][A
Training...:  67% 9304/13907 [5:56:56<3:38:02,  2.84s/it][A
Training...:  67% 9305/13907 [5:56:59<3:42:51,  2.91s/it][A
Training...:  67% 9306/13907 [5:57:02<3:44:51,  2.93s/it][A
Training...:  67% 9307/13907 [5:57:05<3:46:34,  2.96s/it][A
Training...:  67% 9308/13907 [5:57:08<3:44:59,  2.94s/it][A
Training...:  67% 9309/13907 [5:57:11<3:40:34,  2.88s/it][A
Training...:  67% 9310/13907 [5:57:14<3:36:06,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:27:28<17:31:07, 31533.87s/it]
Training...:  67% 9310/13907 [5:57:17<3:36:06,  2.82s/it][A
Training...:  67% 9311/13907 [5:57:17<3:41:49,  2.90s/it][A
Training...:  67% 9312/13907 [5:57:20<3:36:44,  2.83s/it][A
Training...:  67% 9313/13907 [5:57:22<3:30:13,  2.75s/it][A
Training...:  67% 9314/13907 [5:57:25<3:25:38,  2.69s/it][A
Training...:  67% 9315/13907 [5:57:27<3:20:51,  2.62s/it][A
Training...:  67% 9316/13907 [5:57:30<3:16:07,  2.56s/it][A
Training...:  67% 9317/13907 [5:57:32<3:12:23,  2.52s/it][A
Training...:  67% 9318/13907 [5:57:34<3:09:14,  2.47s/it][A
Training...:  67% 9319/13907 [5:57:37<3:05:52,  2.43s/it][A
Training...:  67% 9320/13907 [5:57:39<3:03:10,  2.40s/it][A
Training...:  67% 9321/13907 [5:57:41<3:01:28,  2.37s/it][A
Training...:  67% 9322/13907 [5:57:44<2:58:55,  2.34s/it][A
Training...:  67% 9323/13907 [5:57:46<2:57:34,  2.32s/it][A
Training...:  67% 9324/13907 [5:57:48<2:55:12,  2.29s/it][A
Training...:  67% 9325/13907 [5:57:50<2:52:51,  2.26s/it][A
Training...:  67% 9326/13907 [5:57:52<2:50:15,  2.23s/it][A
Training...:  67% 9327/13907 [5:57:55<2:48:35,  2.21s/it][A
Training...:  67% 9328/13907 [5:57:57<2:46:40,  2.18s/it][A
Training...:  67% 9329/13907 [5:57:59<2:44:14,  2.15s/it][A
Training...:  67% 9330/13907 [5:58:01<2:41:11,  2.11s/it][A
Training...:  67% 9331/13907 [5:58:03<2:39:39,  2.09s/it][A
Training...:  67% 9332/13907 [5:58:05<2:38:45,  2.08s/it][A
Training...:  67% 9333/13907 [5:58:07<2:36:22,  2.05s/it][A
Training...:  67% 9334/13907 [5:58:09<2:33:28,  2.01s/it][A
Training...:  67% 9335/13907 [5:58:11<2:30:41,  1.98s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:28:24<17:31:07, 31533.87s/it]
Training...:  67% 9335/13907 [5:58:13<2:30:41,  1.98s/it][A
Training...:  67% 9336/13907 [5:58:13<2:34:59,  2.03s/it][A
Training...:  67% 9337/13907 [5:58:15<2:31:11,  1.99s/it][A
Training...:  67% 9338/13907 [5:58:16<2:26:31,  1.92s/it][A
Training...:  67% 9339/13907 [5:58:18<2:23:06,  1.88s/it][A
Training...:  67% 9340/13907 [5:58:20<2:19:48,  1.84s/it][A
Training...:  67% 9341/13907 [5:58:22<2:16:20,  1.79s/it][A
Training...:  67% 9342/13907 [5:58:23<2:13:04,  1.75s/it][A
Training...:  67% 9343/13907 [5:58:25<2:10:08,  1.71s/it][A
Training...:  67% 9344/13907 [5:58:27<2:07:15,  1.67s/it][A
Training...:  67% 9345/13907 [5:58:28<2:03:43,  1.63s/it][A
Training...:  67% 9346/13907 [5:58:30<1:59:56,  1.58s/it][A
Training...:  67% 9347/13907 [5:58:31<1:56:02,  1.53s/it][A
Training...:  67% 9348/13907 [5:58:32<1:51:10,  1.46s/it][A
Training...:  67% 9349/13907 [5:58:34<1:46:09,  1.40s/it][A
Training...:  67% 9350/13907 [5:58:35<1:38:37,  1.30s/it][A
Training...:  67% 9351/13907 [5:58:38<2:33:26,  2.02s/it][A
Training...:  67% 9352/13907 [5:58:42<3:07:30,  2.47s/it][A
Training...:  67% 9353/13907 [5:58:45<3:25:51,  2.71s/it][A
Training...:  67% 9354/13907 [5:58:48<3:36:37,  2.85s/it][A
Training...:  67% 9355/13907 [5:58:51<3:41:35,  2.92s/it][A
Training...:  67% 9356/13907 [5:58:54<3:42:23,  2.93s/it][A
Training...:  67% 9357/13907 [5:58:57<3:41:46,  2.92s/it][A
Training...:  67% 9358/13907 [5:59:00<3:39:26,  2.89s/it][A
Training...:  67% 9359/13907 [5:59:03<3:37:02,  2.86s/it][A
Training...:  67% 9360/13907 [5:59:06<3:36:11,  2.85s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:29:20<17:31:07, 31533.87s/it]
Training...:  67% 9360/13907 [5:59:09<3:36:11,  2.85s/it][A
Training...:  67% 9361/13907 [5:59:09<3:41:13,  2.92s/it][A
Training...:  67% 9362/13907 [5:59:11<3:35:48,  2.85s/it][A
Training...:  67% 9363/13907 [5:59:14<3:29:27,  2.77s/it][A
Training...:  67% 9364/13907 [5:59:16<3:23:54,  2.69s/it][A
Training...:  67% 9365/13907 [5:59:19<3:18:47,  2.63s/it][A
Training...:  67% 9366/13907 [5:59:21<3:14:33,  2.57s/it][A
Training...:  67% 9367/13907 [5:59:24<3:10:38,  2.52s/it][A
Training...:  67% 9368/13907 [5:59:26<3:07:31,  2.48s/it][A
Training...:  67% 9369/13907 [5:59:29<3:04:35,  2.44s/it][A
Training...:  67% 9370/13907 [5:59:31<3:02:09,  2.41s/it][A
Training...:  67% 9371/13907 [5:59:33<2:59:47,  2.38s/it][A
Training...:  67% 9372/13907 [5:59:35<2:56:08,  2.33s/it][A
Training...:  67% 9373/13907 [5:59:38<2:53:23,  2.29s/it][A
Training...:  67% 9374/13907 [5:59:40<2:50:16,  2.25s/it][A
Training...:  67% 9375/13907 [5:59:42<2:47:27,  2.22s/it][A
Training...:  67% 9376/13907 [5:59:44<2:45:24,  2.19s/it][A
Training...:  67% 9377/13907 [5:59:46<2:43:54,  2.17s/it][A
Training...:  67% 9378/13907 [5:59:48<2:42:00,  2.15s/it][A
Training...:  67% 9379/13907 [5:59:50<2:39:54,  2.12s/it][A
Training...:  67% 9380/13907 [5:59:52<2:38:12,  2.10s/it][A
Training...:  67% 9381/13907 [5:59:54<2:35:37,  2.06s/it][A
Training...:  67% 9382/13907 [5:59:56<2:33:02,  2.03s/it][A
Training...:  67% 9383/13907 [5:59:58<2:30:39,  2.00s/it][A
Training...:  67% 9384/13907 [6:00:00<2:28:14,  1.97s/it][A
Training...:  67% 9385/13907 [6:00:02<2:26:29,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:30:15<17:31:07, 31533.87s/it]
Training...:  67% 9385/13907 [6:00:04<2:26:29,  1.94s/it][A
Training...:  67% 9386/13907 [6:00:04<2:31:10,  2.01s/it][A
Training...:  67% 9387/13907 [6:00:06<2:27:50,  1.96s/it][A
Training...:  68% 9388/13907 [6:00:08<2:23:21,  1.90s/it][A
Training...:  68% 9389/13907 [6:00:10<2:22:00,  1.89s/it][A
Training...:  68% 9390/13907 [6:00:11<2:18:27,  1.84s/it][A
Training...:  68% 9391/13907 [6:00:13<2:14:47,  1.79s/it][A
Training...:  68% 9392/13907 [6:00:15<2:10:46,  1.74s/it][A
Training...:  68% 9393/13907 [6:00:16<2:07:26,  1.69s/it][A
Training...:  68% 9394/13907 [6:00:18<2:04:27,  1.65s/it][A
Training...:  68% 9395/13907 [6:00:19<2:00:52,  1.61s/it][A
Training...:  68% 9396/13907 [6:00:21<1:56:54,  1.56s/it][A
Training...:  68% 9397/13907 [6:00:22<1:52:43,  1.50s/it][A
Training...:  68% 9398/13907 [6:00:23<1:48:05,  1.44s/it][A
Training...:  68% 9399/13907 [6:00:25<1:42:59,  1.37s/it][A
Training...:  68% 9400/13907 [6:00:26<1:35:36,  1.27s/it][A
Training...:  68% 9401/13907 [6:00:29<2:33:00,  2.04s/it][A
Training...:  68% 9402/13907 [6:00:33<3:04:54,  2.46s/it][A
Training...:  68% 9403/13907 [6:00:36<3:21:38,  2.69s/it][A
Training...:  68% 9404/13907 [6:00:39<3:29:29,  2.79s/it][A
Training...:  68% 9405/13907 [6:00:42<3:33:09,  2.84s/it][A
Training...:  68% 9406/13907 [6:00:45<3:34:00,  2.85s/it][A
Training...:  68% 9407/13907 [6:00:48<3:34:03,  2.85s/it][A
Training...:  68% 9408/13907 [6:00:51<3:32:45,  2.84s/it][A
Training...:  68% 9409/13907 [6:00:53<3:30:50,  2.81s/it][A
Training...:  68% 9410/13907 [6:00:56<3:28:49,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:31:10<17:31:07, 31533.87s/it]
Training...:  68% 9410/13907 [6:00:59<3:28:49,  2.79s/it][A
Training...:  68% 9411/13907 [6:00:59<3:35:46,  2.88s/it][A
Training...:  68% 9412/13907 [6:01:02<3:31:55,  2.83s/it][A
Training...:  68% 9413/13907 [6:01:05<3:27:23,  2.77s/it][A
Training...:  68% 9414/13907 [6:01:07<3:22:54,  2.71s/it][A
Training...:  68% 9415/13907 [6:01:10<3:18:58,  2.66s/it][A
Training...:  68% 9416/13907 [6:01:12<3:15:18,  2.61s/it][A
Training...:  68% 9417/13907 [6:01:15<3:11:06,  2.55s/it][A
Training...:  68% 9418/13907 [6:01:17<3:07:56,  2.51s/it][A
Training...:  68% 9419/13907 [6:01:19<3:05:43,  2.48s/it][A
Training...:  68% 9420/13907 [6:01:22<3:03:35,  2.46s/it][A
Training...:  68% 9421/13907 [6:01:24<3:00:13,  2.41s/it][A
Training...:  68% 9422/13907 [6:01:26<2:57:14,  2.37s/it][A
Training...:  68% 9423/13907 [6:01:29<2:54:09,  2.33s/it][A
Training...:  68% 9424/13907 [6:01:31<2:51:11,  2.29s/it][A
Training...:  68% 9425/13907 [6:01:33<2:48:09,  2.25s/it][A
Training...:  68% 9426/13907 [6:01:35<2:45:26,  2.22s/it][A
Training...:  68% 9427/13907 [6:01:37<2:43:02,  2.18s/it][A
Training...:  68% 9428/13907 [6:01:39<2:40:31,  2.15s/it][A
Training...:  68% 9429/13907 [6:01:41<2:38:16,  2.12s/it][A
Training...:  68% 9430/13907 [6:01:43<2:35:58,  2.09s/it][A
Training...:  68% 9431/13907 [6:01:45<2:33:54,  2.06s/it][A
Training...:  68% 9432/13907 [6:01:47<2:31:31,  2.03s/it][A
Training...:  68% 9433/13907 [6:01:49<2:29:40,  2.01s/it][A
Training...:  68% 9434/13907 [6:01:51<2:27:25,  1.98s/it][A
Training...:  68% 9435/13907 [6:01:53<2:25:43,  1.96s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:32:06<17:31:07, 31533.87s/it]
Training...:  68% 9435/13907 [6:01:55<2:25:43,  1.96s/it][A
Training...:  68% 9436/13907 [6:01:55<2:30:17,  2.02s/it][A
Training...:  68% 9437/13907 [6:01:57<2:27:23,  1.98s/it][A
Training...:  68% 9438/13907 [6:01:59<2:23:34,  1.93s/it][A
Training...:  68% 9439/13907 [6:02:01<2:19:40,  1.88s/it][A
Training...:  68% 9440/13907 [6:02:02<2:16:00,  1.83s/it][A
Training...:  68% 9441/13907 [6:02:04<2:12:53,  1.79s/it][A
Training...:  68% 9442/13907 [6:02:06<2:09:58,  1.75s/it][A
Training...:  68% 9443/13907 [6:02:07<2:07:06,  1.71s/it][A
Training...:  68% 9444/13907 [6:02:09<2:04:12,  1.67s/it][A
Training...:  68% 9445/13907 [6:02:11<2:01:18,  1.63s/it][A
Training...:  68% 9446/13907 [6:02:12<1:57:18,  1.58s/it][A
Training...:  68% 9447/13907 [6:02:13<1:53:02,  1.52s/it][A
Training...:  68% 9448/13907 [6:02:15<1:48:57,  1.47s/it][A
Training...:  68% 9449/13907 [6:02:16<1:43:58,  1.40s/it][A
Training...:  68% 9450/13907 [6:02:17<1:36:36,  1.30s/it][A
Training...:  68% 9451/13907 [6:02:21<2:32:30,  2.05s/it][A
Training...:  68% 9452/13907 [6:02:24<3:04:16,  2.48s/it][A
Training...:  68% 9453/13907 [6:02:28<3:21:36,  2.72s/it][A
Training...:  68% 9454/13907 [6:02:31<3:30:57,  2.84s/it][A
Training...:  68% 9455/13907 [6:02:34<3:35:08,  2.90s/it][A
Training...:  68% 9456/13907 [6:02:37<3:36:00,  2.91s/it][A
Training...:  68% 9457/13907 [6:02:40<3:36:19,  2.92s/it][A
Training...:  68% 9458/13907 [6:02:43<3:36:45,  2.92s/it][A
Training...:  68% 9459/13907 [6:02:45<3:33:48,  2.88s/it][A
Training...:  68% 9460/13907 [6:02:48<3:29:44,  2.83s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:33:02<17:31:07, 31533.87s/it]
Training...:  68% 9460/13907 [6:02:51<3:29:44,  2.83s/it][A
Training...:  68% 9461/13907 [6:02:51<3:35:20,  2.91s/it][A
Training...:  68% 9462/13907 [6:02:54<3:30:34,  2.84s/it][A
Training...:  68% 9463/13907 [6:02:56<3:25:05,  2.77s/it][A
Training...:  68% 9464/13907 [6:02:59<3:19:48,  2.70s/it][A
Training...:  68% 9465/13907 [6:03:01<3:15:44,  2.64s/it][A
Training...:  68% 9466/13907 [6:03:04<3:11:10,  2.58s/it][A
Training...:  68% 9467/13907 [6:03:06<3:07:53,  2.54s/it][A
Training...:  68% 9468/13907 [6:03:09<3:04:37,  2.50s/it][A
Training...:  68% 9469/13907 [6:03:11<3:02:02,  2.46s/it][A
Training...:  68% 9470/13907 [6:03:13<2:58:54,  2.42s/it][A
Training...:  68% 9471/13907 [6:03:16<2:56:07,  2.38s/it][A
Training...:  68% 9472/13907 [6:03:18<2:53:47,  2.35s/it][A
Training...:  68% 9473/13907 [6:03:20<2:51:06,  2.32s/it][A
Training...:  68% 9474/13907 [6:03:22<2:48:40,  2.28s/it][A
Training...:  68% 9475/13907 [6:03:25<2:46:29,  2.25s/it][A
Training...:  68% 9476/13907 [6:03:27<2:44:01,  2.22s/it][A
Training...:  68% 9477/13907 [6:03:29<2:41:34,  2.19s/it][A
Training...:  68% 9478/13907 [6:03:31<2:39:28,  2.16s/it][A
Training...:  68% 9479/13907 [6:03:33<2:37:22,  2.13s/it][A
Training...:  68% 9480/13907 [6:03:35<2:35:02,  2.10s/it][A
Training...:  68% 9481/13907 [6:03:37<2:32:18,  2.06s/it][A
Training...:  68% 9482/13907 [6:03:39<2:29:46,  2.03s/it][A
Training...:  68% 9483/13907 [6:03:41<2:27:58,  2.01s/it][A
Training...:  68% 9484/13907 [6:03:43<2:26:04,  1.98s/it][A
Training...:  68% 9485/13907 [6:03:45<2:24:54,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:33:58<17:31:07, 31533.87s/it]
Training...:  68% 9485/13907 [6:03:47<2:24:54,  1.97s/it][A
Training...:  68% 9486/13907 [6:03:47<2:29:50,  2.03s/it][A
Training...:  68% 9487/13907 [6:03:49<2:26:27,  1.99s/it][A
Training...:  68% 9488/13907 [6:03:51<2:21:27,  1.92s/it][A
Training...:  68% 9489/13907 [6:03:52<2:17:30,  1.87s/it][A
Training...:  68% 9490/13907 [6:03:54<2:13:56,  1.82s/it][A
Training...:  68% 9491/13907 [6:03:56<2:11:10,  1.78s/it][A
Training...:  68% 9492/13907 [6:03:57<2:08:40,  1.75s/it][A
Training...:  68% 9493/13907 [6:03:59<2:05:58,  1.71s/it][A
Training...:  68% 9494/13907 [6:04:01<2:03:12,  1.68s/it][A
Training...:  68% 9495/13907 [6:04:02<1:59:20,  1.62s/it][A
Training...:  68% 9496/13907 [6:04:04<1:55:05,  1.57s/it][A
Training...:  68% 9497/13907 [6:04:05<1:50:31,  1.50s/it][A
Training...:  68% 9498/13907 [6:04:06<1:45:51,  1.44s/it][A
Training...:  68% 9499/13907 [6:04:07<1:41:03,  1.38s/it][A
Training...:  68% 9500/13907 [6:04:09<1:34:01,  1.28s/it][A
Training...:  68% 9501/13907 [6:04:12<2:26:55,  2.00s/it][A
Training...:  68% 9502/13907 [6:04:16<2:58:18,  2.43s/it][A
Training...:  68% 9503/13907 [6:04:19<3:16:18,  2.67s/it][A
Training...:  68% 9504/13907 [6:04:22<3:26:19,  2.81s/it][A
Training...:  68% 9505/13907 [6:04:25<3:31:29,  2.88s/it][A
Training...:  68% 9506/13907 [6:04:28<3:32:48,  2.90s/it][A
Training...:  68% 9507/13907 [6:04:31<3:32:23,  2.90s/it][A
Training...:  68% 9508/13907 [6:04:34<3:30:56,  2.88s/it][A
Training...:  68% 9509/13907 [6:04:37<3:28:30,  2.84s/it][A
Training...:  68% 9510/13907 [6:04:39<3:25:00,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:34:53<17:31:07, 31533.87s/it]
Training...:  68% 9510/13907 [6:04:42<3:25:00,  2.80s/it][A
Training...:  68% 9511/13907 [6:04:42<3:31:41,  2.89s/it][A
Training...:  68% 9512/13907 [6:04:45<3:27:02,  2.83s/it][A
Training...:  68% 9513/13907 [6:04:48<3:22:37,  2.77s/it][A
Training...:  68% 9514/13907 [6:04:50<3:16:48,  2.69s/it][A
Training...:  68% 9515/13907 [6:04:53<3:13:07,  2.64s/it][A
Training...:  68% 9516/13907 [6:04:55<3:11:30,  2.62s/it][A
Training...:  68% 9517/13907 [6:04:58<3:08:30,  2.58s/it][A
Training...:  68% 9518/13907 [6:05:00<3:04:39,  2.52s/it][A
Training...:  68% 9519/13907 [6:05:03<3:02:23,  2.49s/it][A
Training...:  68% 9520/13907 [6:05:05<2:59:13,  2.45s/it][A
Training...:  68% 9521/13907 [6:05:07<2:56:21,  2.41s/it][A
Training...:  68% 9522/13907 [6:05:09<2:53:20,  2.37s/it][A
Training...:  68% 9523/13907 [6:05:12<2:50:34,  2.33s/it][A
Training...:  68% 9524/13907 [6:05:14<2:48:02,  2.30s/it][A
Training...:  68% 9525/13907 [6:05:16<2:44:53,  2.26s/it][A
Training...:  68% 9526/13907 [6:05:18<2:41:46,  2.22s/it][A
Training...:  69% 9527/13907 [6:05:20<2:39:00,  2.18s/it][A
Training...:  69% 9528/13907 [6:05:22<2:36:45,  2.15s/it][A
Training...:  69% 9529/13907 [6:05:24<2:34:32,  2.12s/it][A
Training...:  69% 9530/13907 [6:05:26<2:32:15,  2.09s/it][A
Training...:  69% 9531/13907 [6:05:28<2:30:09,  2.06s/it][A
Training...:  69% 9532/13907 [6:05:30<2:27:51,  2.03s/it][A
Training...:  69% 9533/13907 [6:05:32<2:25:41,  2.00s/it][A
Training...:  69% 9534/13907 [6:05:34<2:23:22,  1.97s/it][A
Training...:  69% 9535/13907 [6:05:36<2:21:15,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:35:49<17:31:07, 31533.87s/it]
Training...:  69% 9535/13907 [6:05:38<2:21:15,  1.94s/it][A
Training...:  69% 9536/13907 [6:05:38<2:25:39,  2.00s/it][A
Training...:  69% 9537/13907 [6:05:40<2:23:06,  1.96s/it][A
Training...:  69% 9538/13907 [6:05:42<2:18:52,  1.91s/it][A
Training...:  69% 9539/13907 [6:05:44<2:15:25,  1.86s/it][A
Training...:  69% 9540/13907 [6:05:45<2:12:07,  1.82s/it][A
Training...:  69% 9541/13907 [6:05:47<2:09:20,  1.78s/it][A
Training...:  69% 9542/13907 [6:05:49<2:06:17,  1.74s/it][A
Training...:  69% 9543/13907 [6:05:50<2:03:37,  1.70s/it][A
Training...:  69% 9544/13907 [6:05:52<2:00:36,  1.66s/it][A
Training...:  69% 9545/13907 [6:05:53<1:57:30,  1.62s/it][A
Training...:  69% 9546/13907 [6:05:55<1:54:04,  1.57s/it][A
Training...:  69% 9547/13907 [6:05:56<1:50:10,  1.52s/it][A
Training...:  69% 9548/13907 [6:05:58<1:45:43,  1.46s/it][A
Training...:  69% 9549/13907 [6:05:59<1:40:37,  1.39s/it][A
Training...:  69% 9550/13907 [6:06:00<1:33:27,  1.29s/it][A
Training...:  69% 9551/13907 [6:06:04<2:25:45,  2.01s/it][A
Training...:  69% 9552/13907 [6:06:07<2:56:05,  2.43s/it][A
Training...:  69% 9553/13907 [6:06:10<3:13:54,  2.67s/it][A
Training...:  69% 9554/13907 [6:06:13<3:23:45,  2.81s/it][A
Training...:  69% 9555/13907 [6:06:16<3:29:12,  2.88s/it][A
Training...:  69% 9556/13907 [6:06:19<3:31:09,  2.91s/it][A
Training...:  69% 9557/13907 [6:06:22<3:31:13,  2.91s/it][A
Training...:  69% 9558/13907 [6:06:25<3:32:12,  2.93s/it][A
Training...:  69% 9559/13907 [6:06:28<3:31:17,  2.92s/it][A
Training...:  69% 9560/13907 [6:06:31<3:27:37,  2.87s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:36:45<17:31:07, 31533.87s/it]
Training...:  69% 9560/13907 [6:06:34<3:27:37,  2.87s/it][A
Training...:  69% 9561/13907 [6:06:34<3:33:04,  2.94s/it][A
Training...:  69% 9562/13907 [6:06:37<3:28:11,  2.87s/it][A
Training...:  69% 9563/13907 [6:06:39<3:21:38,  2.79s/it][A
Training...:  69% 9564/13907 [6:06:42<3:16:25,  2.71s/it][A
Training...:  69% 9565/13907 [6:06:44<3:11:52,  2.65s/it][A
Training...:  69% 9566/13907 [6:06:47<3:08:28,  2.60s/it][A
Training...:  69% 9567/13907 [6:06:49<3:05:11,  2.56s/it][A
Training...:  69% 9568/13907 [6:06:52<3:03:13,  2.53s/it][A
Training...:  69% 9569/13907 [6:06:54<3:00:56,  2.50s/it][A
Training...:  69% 9570/13907 [6:06:56<2:57:07,  2.45s/it][A
Training...:  69% 9571/13907 [6:06:59<2:54:24,  2.41s/it][A
Training...:  69% 9572/13907 [6:07:01<2:51:47,  2.38s/it][A
Training...:  69% 9573/13907 [6:07:03<2:48:59,  2.34s/it][A
Training...:  69% 9574/13907 [6:07:06<2:46:59,  2.31s/it][A
Training...:  69% 9575/13907 [6:07:08<2:44:30,  2.28s/it][A
Training...:  69% 9576/13907 [6:07:10<2:42:07,  2.25s/it][A
Training...:  69% 9577/13907 [6:07:12<2:39:39,  2.21s/it][A
Training...:  69% 9578/13907 [6:07:14<2:37:24,  2.18s/it][A
Training...:  69% 9579/13907 [6:07:16<2:35:18,  2.15s/it][A
Training...:  69% 9580/13907 [6:07:18<2:33:06,  2.12s/it][A
Training...:  69% 9581/13907 [6:07:20<2:30:38,  2.09s/it][A
Training...:  69% 9582/13907 [6:07:22<2:28:14,  2.06s/it][A
Training...:  69% 9583/13907 [6:07:24<2:26:28,  2.03s/it][A
Training...:  69% 9584/13907 [6:07:26<2:24:28,  2.01s/it][A
Training...:  69% 9585/13907 [6:07:28<2:22:49,  1.98s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:37:41<17:31:07, 31533.87s/it]
Training...:  69% 9585/13907 [6:07:30<2:22:49,  1.98s/it][A
Training...:  69% 9586/13907 [6:07:30<2:28:02,  2.06s/it][A
Training...:  69% 9587/13907 [6:07:32<2:25:45,  2.02s/it][A
Training...:  69% 9588/13907 [6:07:34<2:21:12,  1.96s/it][A
Training...:  69% 9589/13907 [6:07:36<2:17:42,  1.91s/it][A
Training...:  69% 9590/13907 [6:07:38<2:14:38,  1.87s/it][A
Training...:  69% 9591/13907 [6:07:39<2:11:13,  1.82s/it][A
Training...:  69% 9592/13907 [6:07:41<2:07:47,  1.78s/it][A
Training...:  69% 9593/13907 [6:07:43<2:04:52,  1.74s/it][A
Training...:  69% 9594/13907 [6:07:44<2:01:33,  1.69s/it][A
Training...:  69% 9595/13907 [6:07:46<1:58:56,  1.65s/it][A
Training...:  69% 9596/13907 [6:07:47<1:55:13,  1.60s/it][A
Training...:  69% 9597/13907 [6:07:49<1:50:53,  1.54s/it][A
Training...:  69% 9598/13907 [6:07:50<1:46:16,  1.48s/it][A
Training...:  69% 9599/13907 [6:07:51<1:40:52,  1.40s/it][A
Training...:  69% 9600/13907 [6:07:52<1:33:18,  1.30s/it][A
Training...:  69% 9601/13907 [6:07:56<2:25:03,  2.02s/it][A
Training...:  69% 9602/13907 [6:08:00<2:56:44,  2.46s/it][A
Training...:  69% 9603/13907 [6:08:03<3:14:04,  2.71s/it][A
Training...:  69% 9604/13907 [6:08:06<3:23:49,  2.84s/it][A
Training...:  69% 9605/13907 [6:08:09<3:28:23,  2.91s/it][A
Training...:  69% 9606/13907 [6:08:12<3:29:15,  2.92s/it][A
Training...:  69% 9607/13907 [6:08:15<3:29:07,  2.92s/it][A
Training...:  69% 9608/13907 [6:08:18<3:27:22,  2.89s/it][A
Training...:  69% 9609/13907 [6:08:21<3:24:34,  2.86s/it][A
Training...:  69% 9610/13907 [6:08:23<3:22:07,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:38:37<17:31:07, 31533.87s/it]
Training...:  69% 9610/13907 [6:08:26<3:22:07,  2.82s/it][A
Training...:  69% 9611/13907 [6:08:26<3:28:15,  2.91s/it][A
Training...:  69% 9612/13907 [6:08:29<3:24:15,  2.85s/it][A
Training...:  69% 9613/13907 [6:08:32<3:18:28,  2.77s/it][A
Training...:  69% 9614/13907 [6:08:34<3:13:18,  2.70s/it][A
Training...:  69% 9615/13907 [6:08:37<3:09:45,  2.65s/it][A
Training...:  69% 9616/13907 [6:08:39<3:06:17,  2.60s/it][A
Training...:  69% 9617/13907 [6:08:42<3:02:41,  2.56s/it][A
Training...:  69% 9618/13907 [6:08:44<2:59:50,  2.52s/it][A
Training...:  69% 9619/13907 [6:08:47<2:57:06,  2.48s/it][A
Training...:  69% 9620/13907 [6:08:49<2:55:00,  2.45s/it][A
Training...:  69% 9621/13907 [6:08:51<2:53:53,  2.43s/it][A
Training...:  69% 9622/13907 [6:08:54<2:51:37,  2.40s/it][A
Training...:  69% 9623/13907 [6:08:56<2:49:12,  2.37s/it][A
Training...:  69% 9624/13907 [6:08:58<2:46:01,  2.33s/it][A
Training...:  69% 9625/13907 [6:09:00<2:43:33,  2.29s/it][A
Training...:  69% 9626/13907 [6:09:03<2:40:52,  2.25s/it][A
Training...:  69% 9627/13907 [6:09:05<2:38:58,  2.23s/it][A
Training...:  69% 9628/13907 [6:09:07<2:36:35,  2.20s/it][A
Training...:  69% 9629/13907 [6:09:09<2:34:15,  2.16s/it][A
Training...:  69% 9630/13907 [6:09:11<2:31:39,  2.13s/it][A
Training...:  69% 9631/13907 [6:09:13<2:30:06,  2.11s/it][A
Training...:  69% 9632/13907 [6:09:15<2:27:54,  2.08s/it][A
Training...:  69% 9633/13907 [6:09:17<2:25:35,  2.04s/it][A
Training...:  69% 9634/13907 [6:09:19<2:23:14,  2.01s/it][A
Training...:  69% 9635/13907 [6:09:21<2:20:55,  1.98s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:39:34<17:31:07, 31533.87s/it]
Training...:  69% 9635/13907 [6:09:23<2:20:55,  1.98s/it][A
Training...:  69% 9636/13907 [6:09:23<2:25:16,  2.04s/it][A
Training...:  69% 9637/13907 [6:09:25<2:22:02,  2.00s/it][A
Training...:  69% 9638/13907 [6:09:27<2:17:23,  1.93s/it][A
Training...:  69% 9639/13907 [6:09:29<2:13:41,  1.88s/it][A
Training...:  69% 9640/13907 [6:09:30<2:10:18,  1.83s/it][A
Training...:  69% 9641/13907 [6:09:32<2:07:08,  1.79s/it][A
Training...:  69% 9642/13907 [6:09:34<2:03:56,  1.74s/it][A
Training...:  69% 9643/13907 [6:09:35<2:01:05,  1.70s/it][A
Training...:  69% 9644/13907 [6:09:37<1:58:05,  1.66s/it][A
Training...:  69% 9645/13907 [6:09:38<1:55:43,  1.63s/it][A
Training...:  69% 9646/13907 [6:09:40<1:52:27,  1.58s/it][A
Training...:  69% 9647/13907 [6:09:41<1:48:26,  1.53s/it][A
Training...:  69% 9648/13907 [6:09:42<1:43:53,  1.46s/it][A
Training...:  69% 9649/13907 [6:09:44<1:38:31,  1.39s/it][A
Training...:  69% 9650/13907 [6:09:45<1:30:51,  1.28s/it][A
Training...:  69% 9651/13907 [6:09:48<2:21:03,  1.99s/it][A
Training...:  69% 9652/13907 [6:09:52<2:51:26,  2.42s/it][A
Training...:  69% 9653/13907 [6:09:55<3:08:14,  2.66s/it][A
Training...:  69% 9654/13907 [6:09:58<3:18:29,  2.80s/it][A
Training...:  69% 9655/13907 [6:10:01<3:22:58,  2.86s/it][A
Training...:  69% 9656/13907 [6:10:04<3:24:36,  2.89s/it][A
Training...:  69% 9657/13907 [6:10:07<3:25:46,  2.90s/it][A
Training...:  69% 9658/13907 [6:10:10<3:24:24,  2.89s/it][A
Training...:  69% 9659/13907 [6:10:13<3:22:24,  2.86s/it][A
Training...:  69% 9660/13907 [6:10:15<3:19:04,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:40:29<17:31:07, 31533.87s/it]
Training...:  69% 9660/13907 [6:10:18<3:19:04,  2.81s/it][A
Training...:  69% 9661/13907 [6:10:18<3:24:42,  2.89s/it][A
Training...:  69% 9662/13907 [6:10:21<3:20:14,  2.83s/it][A
Training...:  69% 9663/13907 [6:10:24<3:14:52,  2.76s/it][A
Training...:  69% 9664/13907 [6:10:26<3:09:55,  2.69s/it][A
Training...:  69% 9665/13907 [6:10:29<3:06:52,  2.64s/it][A
Training...:  70% 9666/13907 [6:10:31<3:04:31,  2.61s/it][A
Training...:  70% 9667/13907 [6:10:34<3:02:50,  2.59s/it][A
Training...:  70% 9668/13907 [6:10:36<2:59:10,  2.54s/it][A
Training...:  70% 9669/13907 [6:10:39<2:55:45,  2.49s/it][A
Training...:  70% 9670/13907 [6:10:41<2:51:58,  2.44s/it][A
Training...:  70% 9671/13907 [6:10:43<2:49:11,  2.40s/it][A
Training...:  70% 9672/13907 [6:10:46<2:46:12,  2.35s/it][A
Training...:  70% 9673/13907 [6:10:48<2:43:11,  2.31s/it][A
Training...:  70% 9674/13907 [6:10:50<2:40:10,  2.27s/it][A
Training...:  70% 9675/13907 [6:10:52<2:37:31,  2.23s/it][A
Training...:  70% 9676/13907 [6:10:54<2:34:55,  2.20s/it][A
Training...:  70% 9677/13907 [6:10:56<2:32:45,  2.17s/it][A
Training...:  70% 9678/13907 [6:10:58<2:30:17,  2.13s/it][A
Training...:  70% 9679/13907 [6:11:00<2:28:08,  2.10s/it][A
Training...:  70% 9680/13907 [6:11:02<2:25:42,  2.07s/it][A
Training...:  70% 9681/13907 [6:11:04<2:23:28,  2.04s/it][A
Training...:  70% 9682/13907 [6:11:06<2:21:25,  2.01s/it][A
Training...:  70% 9683/13907 [6:11:08<2:19:29,  1.98s/it][A
Training...:  70% 9684/13907 [6:11:10<2:17:35,  1.95s/it][A
Training...:  70% 9685/13907 [6:11:12<2:15:54,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:41:25<17:31:07, 31533.87s/it]
Training...:  70% 9685/13907 [6:11:14<2:15:54,  1.93s/it][A
Training...:  70% 9686/13907 [6:11:14<2:20:01,  1.99s/it][A
Training...:  70% 9687/13907 [6:11:16<2:17:38,  1.96s/it][A
Training...:  70% 9688/13907 [6:11:18<2:13:23,  1.90s/it][A
Training...:  70% 9689/13907 [6:11:19<2:10:32,  1.86s/it][A
Training...:  70% 9690/13907 [6:11:21<2:06:59,  1.81s/it][A
Training...:  70% 9691/13907 [6:11:23<2:03:46,  1.76s/it][A
Training...:  70% 9692/13907 [6:11:24<2:00:45,  1.72s/it][A
Training...:  70% 9693/13907 [6:11:26<1:57:56,  1.68s/it][A
Training...:  70% 9694/13907 [6:11:28<1:55:20,  1.64s/it][A
Training...:  70% 9695/13907 [6:11:29<1:52:38,  1.60s/it][A
Training...:  70% 9696/13907 [6:11:31<1:49:27,  1.56s/it][A
Training...:  70% 9697/13907 [6:11:32<1:45:44,  1.51s/it][A
Training...:  70% 9698/13907 [6:11:33<1:41:46,  1.45s/it][A
Training...:  70% 9699/13907 [6:11:34<1:37:02,  1.38s/it][A
Training...:  70% 9700/13907 [6:11:36<1:30:34,  1.29s/it][A
Training...:  70% 9701/13907 [6:11:39<2:23:00,  2.04s/it][A
Training...:  70% 9702/13907 [6:11:43<2:52:43,  2.46s/it][A
Training...:  70% 9703/13907 [6:11:46<3:09:26,  2.70s/it][A
Training...:  70% 9704/13907 [6:11:49<3:18:36,  2.84s/it][A
Training...:  70% 9705/13907 [6:11:52<3:23:12,  2.90s/it][A
Training...:  70% 9706/13907 [6:11:55<3:24:25,  2.92s/it][A
Training...:  70% 9707/13907 [6:11:58<3:24:19,  2.92s/it][A
Training...:  70% 9708/13907 [6:12:01<3:23:33,  2.91s/it][A
Training...:  70% 9709/13907 [6:12:04<3:22:25,  2.89s/it][A
Training...:  70% 9710/13907 [6:12:07<3:18:06,  2.83s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:42:21<17:31:07, 31533.87s/it]
Training...:  70% 9710/13907 [6:12:10<3:18:06,  2.83s/it][A
Training...:  70% 9711/13907 [6:12:10<3:23:13,  2.91s/it][A
Training...:  70% 9712/13907 [6:12:12<3:18:36,  2.84s/it][A
Training...:  70% 9713/13907 [6:12:15<3:12:55,  2.76s/it][A
Training...:  70% 9714/13907 [6:12:17<3:08:03,  2.69s/it][A
Training...:  70% 9715/13907 [6:12:20<3:03:53,  2.63s/it][A
Training...:  70% 9716/13907 [6:12:22<2:59:46,  2.57s/it][A
Training...:  70% 9717/13907 [6:12:25<2:56:55,  2.53s/it][A
Training...:  70% 9718/13907 [6:12:27<2:54:53,  2.50s/it][A
Training...:  70% 9719/13907 [6:12:30<2:53:12,  2.48s/it][A
Training...:  70% 9720/13907 [6:12:32<2:51:00,  2.45s/it][A
Training...:  70% 9721/13907 [6:12:34<2:47:50,  2.41s/it][A
Training...:  70% 9722/13907 [6:12:37<2:44:13,  2.35s/it][A
Training...:  70% 9723/13907 [6:12:39<2:41:00,  2.31s/it][A
Training...:  70% 9724/13907 [6:12:41<2:38:04,  2.27s/it][A
Training...:  70% 9725/13907 [6:12:43<2:36:10,  2.24s/it][A
Training...:  70% 9726/13907 [6:12:45<2:33:56,  2.21s/it][A
Training...:  70% 9727/13907 [6:12:47<2:32:09,  2.18s/it][A
Training...:  70% 9728/13907 [6:12:49<2:29:56,  2.15s/it][A
Training...:  70% 9729/13907 [6:12:51<2:27:24,  2.12s/it][A
Training...:  70% 9730/13907 [6:12:53<2:25:09,  2.09s/it][A
Training...:  70% 9731/13907 [6:12:55<2:23:12,  2.06s/it][A
Training...:  70% 9732/13907 [6:12:57<2:20:50,  2.02s/it][A
Training...:  70% 9733/13907 [6:12:59<2:18:36,  1.99s/it][A
Training...:  70% 9734/13907 [6:13:01<2:16:28,  1.96s/it][A
Training...:  70% 9735/13907 [6:13:03<2:14:17,  1.93s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:43:16<17:31:07, 31533.87s/it]
Training...:  70% 9735/13907 [6:13:05<2:14:17,  1.93s/it][A
Training...:  70% 9736/13907 [6:13:05<2:18:28,  1.99s/it][A
Training...:  70% 9737/13907 [6:13:07<2:16:17,  1.96s/it][A
Training...:  70% 9738/13907 [6:13:09<2:12:41,  1.91s/it][A
Training...:  70% 9739/13907 [6:13:11<2:09:50,  1.87s/it][A
Training...:  70% 9740/13907 [6:13:12<2:07:17,  1.83s/it][A
Training...:  70% 9741/13907 [6:13:14<2:04:35,  1.79s/it][A
Training...:  70% 9742/13907 [6:13:16<2:01:20,  1.75s/it][A
Training...:  70% 9743/13907 [6:13:17<1:58:05,  1.70s/it][A
Training...:  70% 9744/13907 [6:13:19<1:54:50,  1.66s/it][A
Training...:  70% 9745/13907 [6:13:20<1:51:12,  1.60s/it][A
Training...:  70% 9746/13907 [6:13:22<1:47:11,  1.55s/it][A
Training...:  70% 9747/13907 [6:13:23<1:43:14,  1.49s/it][A
Training...:  70% 9748/13907 [6:13:24<1:38:56,  1.43s/it][A
Training...:  70% 9749/13907 [6:13:26<1:34:14,  1.36s/it][A
Training...:  70% 9750/13907 [6:13:27<1:27:41,  1.27s/it][A
Training...:  70% 9751/13907 [6:13:30<2:18:36,  2.00s/it][A
Training...:  70% 9752/13907 [6:13:34<2:48:39,  2.44s/it][A
Training...:  70% 9753/13907 [6:13:37<3:04:46,  2.67s/it][A
Training...:  70% 9754/13907 [6:13:40<3:13:51,  2.80s/it][A
Training...:  70% 9755/13907 [6:13:43<3:19:01,  2.88s/it][A
Training...:  70% 9756/13907 [6:13:46<3:20:35,  2.90s/it][A
Training...:  70% 9757/13907 [6:13:49<3:20:43,  2.90s/it][A
Training...:  70% 9758/13907 [6:13:52<3:19:22,  2.88s/it][A
Training...:  70% 9759/13907 [6:13:55<3:17:16,  2.85s/it][A
Training...:  70% 9760/13907 [6:13:57<3:14:43,  2.82s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:44:12<17:31:07, 31533.87s/it]
Training...:  70% 9760/13907 [6:14:01<3:14:43,  2.82s/it][A
Training...:  70% 9761/13907 [6:14:01<3:20:29,  2.90s/it][A
Training...:  70% 9762/13907 [6:14:03<3:16:48,  2.85s/it][A
Training...:  70% 9763/13907 [6:14:06<3:11:33,  2.77s/it][A
Training...:  70% 9764/13907 [6:14:08<3:07:45,  2.72s/it][A
Training...:  70% 9765/13907 [6:14:11<3:03:29,  2.66s/it][A
Training...:  70% 9766/13907 [6:14:14<3:01:04,  2.62s/it][A
Training...:  70% 9767/13907 [6:14:16<2:57:55,  2.58s/it][A
Training...:  70% 9768/13907 [6:14:18<2:54:46,  2.53s/it][A
Training...:  70% 9769/13907 [6:14:21<2:52:39,  2.50s/it][A
Training...:  70% 9770/13907 [6:14:23<2:51:02,  2.48s/it][A
Training...:  70% 9771/13907 [6:14:26<2:48:46,  2.45s/it][A
Training...:  70% 9772/13907 [6:14:28<2:46:36,  2.42s/it][A
Training...:  70% 9773/13907 [6:14:30<2:46:24,  2.42s/it][A
Training...:  70% 9774/13907 [6:14:33<2:44:35,  2.39s/it][A
Training...:  70% 9775/13907 [6:14:35<2:41:59,  2.35s/it][A
Training...:  70% 9776/13907 [6:14:37<2:39:06,  2.31s/it][A
Training...:  70% 9777/13907 [6:14:39<2:36:21,  2.27s/it][A
Training...:  70% 9778/13907 [6:14:42<2:34:00,  2.24s/it][A
Training...:  70% 9779/13907 [6:14:44<2:31:16,  2.20s/it][A
Training...:  70% 9780/13907 [6:14:46<2:28:53,  2.16s/it][A
Training...:  70% 9781/13907 [6:14:48<2:27:04,  2.14s/it][A
Training...:  70% 9782/13907 [6:14:50<2:24:29,  2.10s/it][A
Training...:  70% 9783/13907 [6:14:52<2:22:08,  2.07s/it][A
Training...:  70% 9784/13907 [6:14:54<2:19:53,  2.04s/it][A
Training...:  70% 9785/13907 [6:14:56<2:17:47,  2.01s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:45:09<17:31:07, 31533.87s/it]
Training...:  70% 9785/13907 [6:14:58<2:17:47,  2.01s/it][A
Training...:  70% 9786/13907 [6:14:58<2:21:50,  2.07s/it][A
Training...:  70% 9787/13907 [6:15:00<2:18:05,  2.01s/it][A
Training...:  70% 9788/13907 [6:15:02<2:13:26,  1.94s/it][A
Training...:  70% 9789/13907 [6:15:03<2:09:21,  1.88s/it][A
Training...:  70% 9790/13907 [6:15:05<2:05:50,  1.83s/it][A
Training...:  70% 9791/13907 [6:15:07<2:02:48,  1.79s/it][A
Training...:  70% 9792/13907 [6:15:08<2:00:08,  1.75s/it][A
Training...:  70% 9793/13907 [6:15:10<1:56:58,  1.71s/it][A
Training...:  70% 9794/13907 [6:15:12<1:54:11,  1.67s/it][A
Training...:  70% 9795/13907 [6:15:13<1:51:28,  1.63s/it][A
Training...:  70% 9796/13907 [6:15:15<1:48:27,  1.58s/it][A
Training...:  70% 9797/13907 [6:15:16<1:44:48,  1.53s/it][A
Training...:  70% 9798/13907 [6:15:17<1:41:11,  1.48s/it][A
Training...:  70% 9799/13907 [6:15:19<1:36:24,  1.41s/it][A
Training...:  70% 9800/13907 [6:15:20<1:29:18,  1.30s/it][A
Training...:  70% 9801/13907 [6:15:23<2:20:05,  2.05s/it][A
Training...:  70% 9802/13907 [6:15:27<2:48:58,  2.47s/it][A
Training...:  70% 9803/13907 [6:15:30<3:05:41,  2.71s/it][A
Training...:  70% 9804/13907 [6:15:33<3:14:43,  2.85s/it][A
Training...:  71% 9805/13907 [6:15:36<3:19:03,  2.91s/it][A
Training...:  71% 9806/13907 [6:15:39<3:19:44,  2.92s/it][A
Training...:  71% 9807/13907 [6:15:42<3:18:28,  2.90s/it][A
Training...:  71% 9808/13907 [6:15:45<3:16:30,  2.88s/it][A
Training...:  71% 9809/13907 [6:15:48<3:14:31,  2.85s/it][A
Training...:  71% 9810/13907 [6:15:51<3:11:36,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:46:05<17:31:07, 31533.87s/it]
Training...:  71% 9810/13907 [6:15:54<3:11:36,  2.81s/it][A
Training...:  71% 9811/13907 [6:15:54<3:17:46,  2.90s/it][A
Training...:  71% 9812/13907 [6:15:56<3:14:57,  2.86s/it][A
Training...:  71% 9813/13907 [6:15:59<3:09:17,  2.77s/it][A
Training...:  71% 9814/13907 [6:16:01<3:03:28,  2.69s/it][A
Training...:  71% 9815/13907 [6:16:04<2:59:21,  2.63s/it][A
Training...:  71% 9816/13907 [6:16:06<2:56:45,  2.59s/it][A
Training...:  71% 9817/13907 [6:16:09<2:52:50,  2.54s/it][A
Training...:  71% 9818/13907 [6:16:11<2:49:26,  2.49s/it][A
Training...:  71% 9819/13907 [6:16:14<2:45:59,  2.44s/it][A
Training...:  71% 9820/13907 [6:16:16<2:43:44,  2.40s/it][A
Training...:  71% 9821/13907 [6:16:18<2:41:22,  2.37s/it][A
Training...:  71% 9822/13907 [6:16:20<2:38:20,  2.33s/it][A
Training...:  71% 9823/13907 [6:16:23<2:35:53,  2.29s/it][A
Training...:  71% 9824/13907 [6:16:25<2:33:18,  2.25s/it][A
Training...:  71% 9825/13907 [6:16:27<2:31:39,  2.23s/it][A
Training...:  71% 9826/13907 [6:16:29<2:29:19,  2.20s/it][A
Training...:  71% 9827/13907 [6:16:31<2:27:20,  2.17s/it][A
Training...:  71% 9828/13907 [6:16:33<2:25:10,  2.14s/it][A
Training...:  71% 9829/13907 [6:16:35<2:23:02,  2.10s/it][A
Training...:  71% 9830/13907 [6:16:37<2:20:53,  2.07s/it][A
Training...:  71% 9831/13907 [6:16:39<2:19:26,  2.05s/it][A
Training...:  71% 9832/13907 [6:16:41<2:17:37,  2.03s/it][A
Training...:  71% 9833/13907 [6:16:43<2:15:30,  2.00s/it][A
Training...:  71% 9834/13907 [6:16:45<2:13:10,  1.96s/it][A
Training...:  71% 9835/13907 [6:16:47<2:11:54,  1.94s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:47:00<17:31:07, 31533.87s/it]
Training...:  71% 9835/13907 [6:16:49<2:11:54,  1.94s/it][A
Training...:  71% 9836/13907 [6:16:49<2:15:17,  1.99s/it][A
Training...:  71% 9837/13907 [6:16:51<2:12:40,  1.96s/it][A
Training...:  71% 9838/13907 [6:16:53<2:08:35,  1.90s/it][A
Training...:  71% 9839/13907 [6:16:54<2:05:12,  1.85s/it][A
Training...:  71% 9840/13907 [6:16:56<2:01:53,  1.80s/it][A
Training...:  71% 9841/13907 [6:16:58<1:59:08,  1.76s/it][A
Training...:  71% 9842/13907 [6:16:59<1:56:23,  1.72s/it][A
Training...:  71% 9843/13907 [6:17:01<1:53:56,  1.68s/it][A
Training...:  71% 9844/13907 [6:17:03<1:51:41,  1.65s/it][A
Training...:  71% 9845/13907 [6:17:04<1:49:00,  1.61s/it][A
Training...:  71% 9846/13907 [6:17:06<1:46:11,  1.57s/it][A
Training...:  71% 9847/13907 [6:17:07<1:42:53,  1.52s/it][A
Training...:  71% 9848/13907 [6:17:08<1:38:56,  1.46s/it][A
Training...:  71% 9849/13907 [6:17:10<1:34:47,  1.40s/it][A
Training...:  71% 9850/13907 [6:17:11<1:28:42,  1.31s/it][A
Training...:  71% 9851/13907 [6:17:14<2:18:49,  2.05s/it][A
Training...:  71% 9852/13907 [6:17:18<2:49:08,  2.50s/it][A
Training...:  71% 9853/13907 [6:17:21<3:04:35,  2.73s/it][A
Training...:  71% 9854/13907 [6:17:24<3:13:01,  2.86s/it][A
Training...:  71% 9855/13907 [6:17:28<3:19:16,  2.95s/it][A
Training...:  71% 9856/13907 [6:17:31<3:20:39,  2.97s/it][A
Training...:  71% 9857/13907 [6:17:33<3:18:26,  2.94s/it][A
Training...:  71% 9858/13907 [6:17:36<3:15:53,  2.90s/it][A
Training...:  71% 9859/13907 [6:17:39<3:12:45,  2.86s/it][A
Training...:  71% 9860/13907 [6:17:42<3:09:19,  2.81s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:47:56<17:31:07, 31533.87s/it]
Training...:  71% 9860/13907 [6:17:45<3:09:19,  2.81s/it][A
Training...:  71% 9861/13907 [6:17:45<3:15:11,  2.89s/it][A
Training...:  71% 9862/13907 [6:17:48<3:12:10,  2.85s/it][A
Training...:  71% 9863/13907 [6:17:50<3:06:25,  2.77s/it][A
Training...:  71% 9864/13907 [6:17:53<3:01:45,  2.70s/it][A
Training...:  71% 9865/13907 [6:17:55<2:57:42,  2.64s/it][A
Training...:  71% 9866/13907 [6:17:58<2:53:47,  2.58s/it][A
Training...:  71% 9867/13907 [6:18:00<2:50:49,  2.54s/it][A
Training...:  71% 9868/13907 [6:18:02<2:47:37,  2.49s/it][A
Training...:  71% 9869/13907 [6:18:05<2:44:45,  2.45s/it][A
Training...:  71% 9870/13907 [6:18:07<2:42:22,  2.41s/it][A
Training...:  71% 9871/13907 [6:18:09<2:40:16,  2.38s/it][A
Training...:  71% 9872/13907 [6:18:12<2:37:46,  2.35s/it][A
Training...:  71% 9873/13907 [6:18:14<2:35:57,  2.32s/it][A
Training...:  71% 9874/13907 [6:18:16<2:33:28,  2.28s/it][A
Training...:  71% 9875/13907 [6:18:18<2:31:38,  2.26s/it][A
Training...:  71% 9876/13907 [6:18:21<2:29:38,  2.23s/it][A
Training...:  71% 9877/13907 [6:18:23<2:28:00,  2.20s/it][A
Training...:  71% 9878/13907 [6:18:25<2:25:49,  2.17s/it][A
Training...:  71% 9879/13907 [6:18:27<2:23:27,  2.14s/it][A
Training...:  71% 9880/13907 [6:18:29<2:20:51,  2.10s/it][A
Training...:  71% 9881/13907 [6:18:31<2:19:03,  2.07s/it][A
Training...:  71% 9882/13907 [6:18:33<2:17:42,  2.05s/it][A
Training...:  71% 9883/13907 [6:18:35<2:16:22,  2.03s/it][A
Training...:  71% 9884/13907 [6:18:37<2:14:15,  2.00s/it][A
Training...:  71% 9885/13907 [6:18:39<2:13:16,  1.99s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:48:52<17:31:07, 31533.87s/it]
Training...:  71% 9885/13907 [6:18:41<2:13:16,  1.99s/it][A
Training...:  71% 9886/13907 [6:18:41<2:18:42,  2.07s/it][A
Training...:  71% 9887/13907 [6:18:43<2:15:25,  2.02s/it][A
Training...:  71% 9888/13907 [6:18:45<2:10:30,  1.95s/it][A
Training...:  71% 9889/13907 [6:18:46<2:06:24,  1.89s/it][A
Training...:  71% 9890/13907 [6:18:48<2:03:45,  1.85s/it][A
Training...:  71% 9891/13907 [6:18:50<2:00:29,  1.80s/it][A
Training...:  71% 9892/13907 [6:18:52<1:57:31,  1.76s/it][A
Training...:  71% 9893/13907 [6:18:53<1:54:40,  1.71s/it][A
Training...:  71% 9894/13907 [6:18:55<1:52:12,  1.68s/it][A
Training...:  71% 9895/13907 [6:18:56<1:49:12,  1.63s/it][A
Training...:  71% 9896/13907 [6:18:58<1:45:42,  1.58s/it][A
Training...:  71% 9897/13907 [6:18:59<1:41:38,  1.52s/it][A
Training...:  71% 9898/13907 [6:19:00<1:37:25,  1.46s/it][A
Training...:  71% 9899/13907 [6:19:02<1:32:41,  1.39s/it][A
Training...:  71% 9900/13907 [6:19:03<1:25:44,  1.28s/it][A
Training...:  71% 9901/13907 [6:19:06<2:13:19,  2.00s/it][A
Training...:  71% 9902/13907 [6:19:10<2:42:21,  2.43s/it][A
Training...:  71% 9903/13907 [6:19:13<2:58:12,  2.67s/it][A
Training...:  71% 9904/13907 [6:19:16<3:06:25,  2.79s/it][A
Training...:  71% 9905/13907 [6:19:19<3:10:43,  2.86s/it][A
Training...:  71% 9906/13907 [6:19:22<3:13:34,  2.90s/it][A
Training...:  71% 9907/13907 [6:19:25<3:12:52,  2.89s/it][A
Training...:  71% 9908/13907 [6:19:28<3:11:12,  2.87s/it][A
Training...:  71% 9909/13907 [6:19:31<3:09:06,  2.84s/it][A
Training...:  71% 9910/13907 [6:19:33<3:06:20,  2.80s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:49:47<17:31:07, 31533.87s/it]
Training...:  71% 9910/13907 [6:19:36<3:06:20,  2.80s/it][A
Training...:  71% 9911/13907 [6:19:36<3:11:49,  2.88s/it][A
Training...:  71% 9912/13907 [6:19:39<3:08:24,  2.83s/it][A
Training...:  71% 9913/13907 [6:19:42<3:03:50,  2.76s/it][A
Training...:  71% 9914/13907 [6:19:44<2:59:44,  2.70s/it][A
Training...:  71% 9915/13907 [6:19:47<2:55:59,  2.65s/it][A
Training...:  71% 9916/13907 [6:19:49<2:52:44,  2.60s/it][A
Training...:  71% 9917/13907 [6:19:52<2:49:42,  2.55s/it][A
Training...:  71% 9918/13907 [6:19:54<2:46:57,  2.51s/it][A
Training...:  71% 9919/13907 [6:19:56<2:44:07,  2.47s/it][A
Training...:  71% 9920/13907 [6:19:59<2:41:46,  2.43s/it][A
Training...:  71% 9921/13907 [6:20:01<2:39:20,  2.40s/it][A
Training...:  71% 9922/13907 [6:20:03<2:36:36,  2.36s/it][A
Training...:  71% 9923/13907 [6:20:06<2:33:59,  2.32s/it][A
Training...:  71% 9924/13907 [6:20:08<2:31:44,  2.29s/it][A
Training...:  71% 9925/13907 [6:20:10<2:29:15,  2.25s/it][A
Training...:  71% 9926/13907 [6:20:12<2:27:02,  2.22s/it][A
Training...:  71% 9927/13907 [6:20:14<2:24:58,  2.19s/it][A
Training...:  71% 9928/13907 [6:20:16<2:22:39,  2.15s/it][A
Training...:  71% 9929/13907 [6:20:18<2:21:06,  2.13s/it][A
Training...:  71% 9930/13907 [6:20:20<2:19:33,  2.11s/it][A
Training...:  71% 9931/13907 [6:20:22<2:17:48,  2.08s/it][A
Training...:  71% 9932/13907 [6:20:24<2:15:51,  2.05s/it][A
Training...:  71% 9933/13907 [6:20:26<2:13:47,  2.02s/it][A
Training...:  71% 9934/13907 [6:20:28<2:12:29,  2.00s/it][A
Training...:  71% 9935/13907 [6:20:30<2:10:08,  1.97s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:50:43<17:31:07, 31533.87s/it]
Training...:  71% 9935/13907 [6:20:32<2:10:08,  1.97s/it][A
Training...:  71% 9936/13907 [6:20:32<2:13:56,  2.02s/it][A
Training...:  71% 9937/13907 [6:20:34<2:11:24,  1.99s/it][A
Training...:  71% 9938/13907 [6:20:36<2:07:02,  1.92s/it][A
Training...:  71% 9939/13907 [6:20:38<2:03:27,  1.87s/it][A
Training...:  71% 9940/13907 [6:20:39<2:00:48,  1.83s/it][A
Training...:  71% 9941/13907 [6:20:41<1:57:30,  1.78s/it][A
Training...:  71% 9942/13907 [6:20:43<1:55:35,  1.75s/it][A
Training...:  71% 9943/13907 [6:20:44<1:53:14,  1.71s/it][A
Training...:  72% 9944/13907 [6:20:46<1:51:51,  1.69s/it][A
Training...:  72% 9945/13907 [6:20:48<1:48:47,  1.65s/it][A
Training...:  72% 9946/13907 [6:20:49<1:45:05,  1.59s/it][A
Training...:  72% 9947/13907 [6:20:51<1:41:28,  1.54s/it][A
Training...:  72% 9948/13907 [6:20:52<1:36:56,  1.47s/it][A
Training...:  72% 9949/13907 [6:20:53<1:31:53,  1.39s/it][A
Training...:  72% 9950/13907 [6:20:54<1:25:20,  1.29s/it][A
Training...:  72% 9951/13907 [6:20:58<2:12:31,  2.01s/it][A
Training...:  72% 9952/13907 [6:21:01<2:41:37,  2.45s/it][A
Training...:  72% 9953/13907 [6:21:05<2:57:28,  2.69s/it][A
Training...:  72% 9954/13907 [6:21:08<3:06:27,  2.83s/it][A
Training...:  72% 9955/13907 [6:21:11<3:10:38,  2.89s/it][A
Training...:  72% 9956/13907 [6:21:14<3:12:11,  2.92s/it][A
Training...:  72% 9957/13907 [6:21:17<3:11:28,  2.91s/it][A
Training...:  72% 9958/13907 [6:21:19<3:09:38,  2.88s/it][A
Training...:  72% 9959/13907 [6:21:22<3:06:44,  2.84s/it][A
Training...:  72% 9960/13907 [6:21:25<3:03:39,  2.79s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:51:39<17:31:07, 31533.87s/it]
Training...:  72% 9960/13907 [6:21:28<3:03:39,  2.79s/it][A
Training...:  72% 9961/13907 [6:21:28<3:08:38,  2.87s/it][A
Training...:  72% 9962/13907 [6:21:31<3:05:11,  2.82s/it][A
Training...:  72% 9963/13907 [6:21:33<3:00:11,  2.74s/it][A
Training...:  72% 9964/13907 [6:21:36<2:56:10,  2.68s/it][A
Training...:  72% 9965/13907 [6:21:38<2:52:55,  2.63s/it][A
Training...:  72% 9966/13907 [6:21:41<2:49:31,  2.58s/it][A
Training...:  72% 9967/13907 [6:21:43<2:47:42,  2.55s/it][A
Training...:  72% 9968/13907 [6:21:46<2:45:46,  2.53s/it][A
Training...:  72% 9969/13907 [6:21:48<2:44:37,  2.51s/it][A
Training...:  72% 9970/13907 [6:21:50<2:42:44,  2.48s/it][A
Training...:  72% 9971/13907 [6:21:53<2:41:08,  2.46s/it][A
Training...:  72% 9972/13907 [6:21:55<2:38:57,  2.42s/it][A
Training...:  72% 9973/13907 [6:21:58<2:35:58,  2.38s/it][A
Training...:  72% 9974/13907 [6:22:00<2:34:31,  2.36s/it][A
Training...:  72% 9975/13907 [6:22:02<2:32:55,  2.33s/it][A
Training...:  72% 9976/13907 [6:22:04<2:30:07,  2.29s/it][A
Training...:  72% 9977/13907 [6:22:06<2:27:34,  2.25s/it][A
Training...:  72% 9978/13907 [6:22:09<2:24:48,  2.21s/it][A
Training...:  72% 9979/13907 [6:22:11<2:22:31,  2.18s/it][A
Training...:  72% 9980/13907 [6:22:13<2:20:02,  2.14s/it][A
Training...:  72% 9981/13907 [6:22:15<2:18:13,  2.11s/it][A
Training...:  72% 9982/13907 [6:22:17<2:16:01,  2.08s/it][A
Training...:  72% 9983/13907 [6:22:19<2:14:16,  2.05s/it][A
Training...:  72% 9984/13907 [6:22:21<2:12:06,  2.02s/it][A
Training...:  72% 9985/13907 [6:22:23<2:10:19,  1.99s/it][A                                                                                                                             
                                                         [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:52:36<17:31:07, 31533.87s/it]
Training...:  72% 9985/13907 [6:22:25<2:10:19,  1.99s/it][A
Training...:  72% 9986/13907 [6:22:25<2:14:08,  2.05s/it][A
Training...:  72% 9987/13907 [6:22:27<2:10:32,  2.00s/it][A
Training...:  72% 9988/13907 [6:22:28<2:05:54,  1.93s/it][A
Training...:  72% 9989/13907 [6:22:30<2:01:53,  1.87s/it][A
Training...:  72% 9990/13907 [6:22:32<1:58:41,  1.82s/it][A
Training...:  72% 9991/13907 [6:22:34<1:55:57,  1.78s/it][A
Training...:  72% 9992/13907 [6:22:35<1:53:56,  1.75s/it][A
Training...:  72% 9993/13907 [6:22:37<1:51:06,  1.70s/it][A
Training...:  72% 9994/13907 [6:22:38<1:48:51,  1.67s/it][A
Training...:  72% 9995/13907 [6:22:40<1:45:57,  1.63s/it][A
Training...:  72% 9996/13907 [6:22:41<1:42:59,  1.58s/it][A
Training...:  72% 9997/13907 [6:22:43<1:39:25,  1.53s/it][A
Training...:  72% 9998/13907 [6:22:44<1:35:21,  1.46s/it][A
Training...:  72% 9999/13907 [6:22:45<1:30:28,  1.39s/it][A
Training...:  72% 10000/13907 [6:22:46<1:24:02,  1.29s/it][A
Training...:  72% 10001/13907 [6:22:50<2:11:48,  2.02s/it][A
Training...:  72% 10002/13907 [6:22:54<2:41:33,  2.48s/it][A
Training...:  72% 10003/13907 [6:22:57<2:57:49,  2.73s/it][A
Training...:  72% 10004/13907 [6:23:00<3:06:12,  2.86s/it][A
Training...:  72% 10005/13907 [6:23:03<3:09:09,  2.91s/it][A
Training...:  72% 10006/13907 [6:23:06<3:10:14,  2.93s/it][A
Training...:  72% 10007/13907 [6:23:09<3:09:35,  2.92s/it][A
Training...:  72% 10008/13907 [6:23:12<3:08:45,  2.90s/it][A
Training...:  72% 10009/13907 [6:23:15<3:07:02,  2.88s/it][A
Training...:  72% 10010/13907 [6:23:17<3:02:54,  2.82s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:53:32<17:31:07, 31533.87s/it]
Training...:  72% 10010/13907 [6:23:20<3:02:54,  2.82s/it][A
Training...:  72% 10011/13907 [6:23:20<3:07:10,  2.88s/it][A
Training...:  72% 10012/13907 [6:23:23<3:03:25,  2.83s/it][A
Training...:  72% 10013/13907 [6:23:26<2:58:35,  2.75s/it][A
Training...:  72% 10014/13907 [6:23:28<2:54:29,  2.69s/it][A
Training...:  72% 10015/13907 [6:23:31<2:50:54,  2.63s/it][A
Training...:  72% 10016/13907 [6:23:33<2:47:22,  2.58s/it][A
Training...:  72% 10017/13907 [6:23:36<2:44:36,  2.54s/it][A
Training...:  72% 10018/13907 [6:23:38<2:42:07,  2.50s/it][A
Training...:  72% 10019/13907 [6:23:40<2:39:11,  2.46s/it][A
Training...:  72% 10020/13907 [6:23:43<2:36:12,  2.41s/it][A
Training...:  72% 10021/13907 [6:23:45<2:34:28,  2.39s/it][A
Training...:  72% 10022/13907 [6:23:47<2:32:12,  2.35s/it][A
Training...:  72% 10023/13907 [6:23:50<2:29:57,  2.32s/it][A
Training...:  72% 10024/13907 [6:23:52<2:27:36,  2.28s/it][A
Training...:  72% 10025/13907 [6:23:54<2:25:42,  2.25s/it][A
Training...:  72% 10026/13907 [6:23:56<2:24:26,  2.23s/it][A
Training...:  72% 10027/13907 [6:23:58<2:22:05,  2.20s/it][A
Training...:  72% 10028/13907 [6:24:00<2:19:57,  2.16s/it][A
Training...:  72% 10029/13907 [6:24:02<2:18:08,  2.14s/it][A
Training...:  72% 10030/13907 [6:24:04<2:16:00,  2.10s/it][A
Training...:  72% 10031/13907 [6:24:07<2:14:20,  2.08s/it][A
Training...:  72% 10032/13907 [6:24:08<2:12:02,  2.04s/it][A
Training...:  72% 10033/13907 [6:24:10<2:10:20,  2.02s/it][A
Training...:  72% 10034/13907 [6:24:12<2:08:20,  1.99s/it][A
Training...:  72% 10035/13907 [6:24:14<2:06:09,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:54:27<17:31:07, 31533.87s/it]
Training...:  72% 10035/13907 [6:24:16<2:06:09,  1.95s/it][A
Training...:  72% 10036/13907 [6:24:16<2:10:24,  2.02s/it][A
Training...:  72% 10037/13907 [6:24:18<2:07:48,  1.98s/it][A
Training...:  72% 10038/13907 [6:24:20<2:03:49,  1.92s/it][A
Training...:  72% 10039/13907 [6:24:22<2:01:13,  1.88s/it][A
Training...:  72% 10040/13907 [6:24:24<1:57:59,  1.83s/it][A
Training...:  72% 10041/13907 [6:24:25<1:55:10,  1.79s/it][A
Training...:  72% 10042/13907 [6:24:27<1:52:04,  1.74s/it][A
Training...:  72% 10043/13907 [6:24:28<1:49:38,  1.70s/it][A
Training...:  72% 10044/13907 [6:24:30<1:48:20,  1.68s/it][A
Training...:  72% 10045/13907 [6:24:32<1:45:30,  1.64s/it][A
Training...:  72% 10046/13907 [6:24:33<1:41:50,  1.58s/it][A
Training...:  72% 10047/13907 [6:24:34<1:37:57,  1.52s/it][A
Training...:  72% 10048/13907 [6:24:36<1:34:06,  1.46s/it][A
Training...:  72% 10049/13907 [6:24:37<1:29:41,  1.40s/it][A
Training...:  72% 10050/13907 [6:24:38<1:23:20,  1.30s/it][A
Training...:  72% 10051/13907 [6:24:42<2:12:21,  2.06s/it][A
Training...:  72% 10052/13907 [6:24:45<2:39:49,  2.49s/it][A
Training...:  72% 10053/13907 [6:24:49<2:54:59,  2.72s/it][A
Training...:  72% 10054/13907 [6:24:52<3:01:33,  2.83s/it][A
Training...:  72% 10055/13907 [6:24:55<3:05:20,  2.89s/it][A
Training...:  72% 10056/13907 [6:24:58<3:05:40,  2.89s/it][A
Training...:  72% 10057/13907 [6:25:01<3:05:21,  2.89s/it][A
Training...:  72% 10058/13907 [6:25:03<3:03:58,  2.87s/it][A
Training...:  72% 10059/13907 [6:25:06<3:02:44,  2.85s/it][A
Training...:  72% 10060/13907 [6:25:09<3:00:23,  2.81s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:55:23<17:31:07, 31533.87s/it]
Training...:  72% 10060/13907 [6:25:12<3:00:23,  2.81s/it][A
Training...:  72% 10061/13907 [6:25:12<3:05:45,  2.90s/it][A
Training...:  72% 10062/13907 [6:25:15<3:02:22,  2.85s/it][A
Training...:  72% 10063/13907 [6:25:17<2:57:20,  2.77s/it][A
Training...:  72% 10064/13907 [6:25:20<2:53:36,  2.71s/it][A
Training...:  72% 10065/13907 [6:25:22<2:49:22,  2.65s/it][A
Training...:  72% 10066/13907 [6:25:25<2:46:15,  2.60s/it][A
Training...:  72% 10067/13907 [6:25:27<2:45:00,  2.58s/it][A
Training...:  72% 10068/13907 [6:25:30<2:41:36,  2.53s/it][A
Training...:  72% 10069/13907 [6:25:32<2:39:18,  2.49s/it][A
Training...:  72% 10070/13907 [6:25:35<2:36:50,  2.45s/it][A
Training...:  72% 10071/13907 [6:25:37<2:34:59,  2.42s/it][A
Training...:  72% 10072/13907 [6:25:39<2:32:35,  2.39s/it][A
Training...:  72% 10073/13907 [6:25:42<2:30:29,  2.36s/it][A
Training...:  72% 10074/13907 [6:25:44<2:28:36,  2.33s/it][A
Training...:  72% 10075/13907 [6:25:46<2:26:21,  2.29s/it][A
Training...:  72% 10076/13907 [6:25:48<2:24:19,  2.26s/it][A
Training...:  72% 10077/13907 [6:25:50<2:22:18,  2.23s/it][A
Training...:  72% 10078/13907 [6:25:53<2:20:26,  2.20s/it][A
Training...:  72% 10079/13907 [6:25:55<2:18:41,  2.17s/it][A
Training...:  72% 10080/13907 [6:25:57<2:16:47,  2.14s/it][A
Training...:  72% 10081/13907 [6:25:59<2:14:36,  2.11s/it][A
Training...:  72% 10082/13907 [6:26:01<2:12:39,  2.08s/it][A
Training...:  73% 10083/13907 [6:26:03<2:11:18,  2.06s/it][A
Training...:  73% 10084/13907 [6:26:05<2:09:29,  2.03s/it][A
Training...:  73% 10085/13907 [6:26:07<2:07:29,  2.00s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:56:20<17:31:07, 31533.87s/it]
Training...:  73% 10085/13907 [6:26:09<2:07:29,  2.00s/it][A
Training...:  73% 10086/13907 [6:26:09<2:11:07,  2.06s/it][A
Training...:  73% 10087/13907 [6:26:11<2:07:44,  2.01s/it][A
Training...:  73% 10088/13907 [6:26:13<2:03:41,  1.94s/it][A
Training...:  73% 10089/13907 [6:26:14<1:59:56,  1.88s/it][A
Training...:  73% 10090/13907 [6:26:16<1:56:51,  1.84s/it][A
Training...:  73% 10091/13907 [6:26:18<1:53:35,  1.79s/it][A
Training...:  73% 10092/13907 [6:26:19<1:50:47,  1.74s/it][A
Training...:  73% 10093/13907 [6:26:21<1:48:06,  1.70s/it][A
Training...:  73% 10094/13907 [6:26:22<1:45:43,  1.66s/it][A
Training...:  73% 10095/13907 [6:26:24<1:42:49,  1.62s/it][A
Training...:  73% 10096/13907 [6:26:25<1:39:37,  1.57s/it][A
Training...:  73% 10097/13907 [6:26:27<1:36:21,  1.52s/it][A
Training...:  73% 10098/13907 [6:26:28<1:32:39,  1.46s/it][A
Training...:  73% 10099/13907 [6:26:29<1:28:18,  1.39s/it][A
Training...:  73% 10100/13907 [6:26:30<1:21:34,  1.29s/it][A
Training...:  73% 10101/13907 [6:26:34<2:07:16,  2.01s/it][A
Training...:  73% 10102/13907 [6:26:38<2:35:36,  2.45s/it][A
Training...:  73% 10103/13907 [6:26:41<2:51:43,  2.71s/it][A
Training...:  73% 10104/13907 [6:26:44<3:02:02,  2.87s/it][A
Training...:  73% 10105/13907 [6:26:47<3:05:32,  2.93s/it][A
Training...:  73% 10106/13907 [6:26:50<3:06:03,  2.94s/it][A
Training...:  73% 10107/13907 [6:26:53<3:04:59,  2.92s/it][A
Training...:  73% 10108/13907 [6:26:56<3:03:19,  2.90s/it][A
Training...:  73% 10109/13907 [6:26:59<3:01:03,  2.86s/it][A
Training...:  73% 10110/13907 [6:27:01<2:57:52,  2.81s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:57:15<17:31:07, 31533.87s/it]
Training...:  73% 10110/13907 [6:27:04<2:57:52,  2.81s/it][A
Training...:  73% 10111/13907 [6:27:04<3:02:37,  2.89s/it][A
Training...:  73% 10112/13907 [6:27:07<2:58:36,  2.82s/it][A
Training...:  73% 10113/13907 [6:27:10<2:53:57,  2.75s/it][A
Training...:  73% 10114/13907 [6:27:12<2:49:31,  2.68s/it][A
Training...:  73% 10115/13907 [6:27:15<2:45:39,  2.62s/it][A
Training...:  73% 10116/13907 [6:27:17<2:42:32,  2.57s/it][A
Training...:  73% 10117/13907 [6:27:20<2:39:52,  2.53s/it][A
Training...:  73% 10118/13907 [6:27:22<2:36:57,  2.49s/it][A
Training...:  73% 10119/13907 [6:27:24<2:34:15,  2.44s/it][A
Training...:  73% 10120/13907 [6:27:27<2:32:28,  2.42s/it][A
Training...:  73% 10121/13907 [6:27:29<2:30:34,  2.39s/it][A
Training...:  73% 10122/13907 [6:27:31<2:28:22,  2.35s/it][A
Training...:  73% 10123/13907 [6:27:34<2:26:05,  2.32s/it][A
Training...:  73% 10124/13907 [6:27:36<2:23:42,  2.28s/it][A
Training...:  73% 10125/13907 [6:27:38<2:21:36,  2.25s/it][A
Training...:  73% 10126/13907 [6:27:40<2:19:17,  2.21s/it][A
Training...:  73% 10127/13907 [6:27:42<2:17:11,  2.18s/it][A
Training...:  73% 10128/13907 [6:27:44<2:15:21,  2.15s/it][A
Training...:  73% 10129/13907 [6:27:46<2:13:37,  2.12s/it][A
Training...:  73% 10130/13907 [6:27:48<2:12:12,  2.10s/it][A
Training...:  73% 10131/13907 [6:27:50<2:10:50,  2.08s/it][A
Training...:  73% 10132/13907 [6:27:52<2:10:13,  2.07s/it][A
Training...:  73% 10133/13907 [6:27:54<2:08:44,  2.05s/it][A
Training...:  73% 10134/13907 [6:27:56<2:06:19,  2.01s/it][A
Training...:  73% 10135/13907 [6:27:58<2:03:54,  1.97s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:58:11<17:31:07, 31533.87s/it]
Training...:  73% 10135/13907 [6:28:00<2:03:54,  1.97s/it][A
Training...:  73% 10136/13907 [6:28:00<2:07:50,  2.03s/it][A
Training...:  73% 10137/13907 [6:28:02<2:05:12,  1.99s/it][A
Training...:  73% 10138/13907 [6:28:04<2:00:55,  1.93s/it][A
Training...:  73% 10139/13907 [6:28:06<1:57:00,  1.86s/it][A
Training...:  73% 10140/13907 [6:28:07<1:53:51,  1.81s/it][A
Training...:  73% 10141/13907 [6:28:09<1:50:45,  1.76s/it][A
Training...:  73% 10142/13907 [6:28:11<1:47:49,  1.72s/it][A
Training...:  73% 10143/13907 [6:28:12<1:45:14,  1.68s/it][A
Training...:  73% 10144/13907 [6:28:14<1:42:48,  1.64s/it][A
Training...:  73% 10145/13907 [6:28:15<1:40:15,  1.60s/it][A
Training...:  73% 10146/13907 [6:28:17<1:37:13,  1.55s/it][A
Training...:  73% 10147/13907 [6:28:18<1:34:07,  1.50s/it][A
Training...:  73% 10148/13907 [6:28:19<1:30:33,  1.45s/it][A
Training...:  73% 10149/13907 [6:28:21<1:26:14,  1.38s/it][A
Training...:  73% 10150/13907 [6:28:22<1:20:23,  1.28s/it][A
Training...:  73% 10151/13907 [6:28:25<2:04:53,  2.00s/it][A
Training...:  73% 10152/13907 [6:28:29<2:31:53,  2.43s/it][A
Training...:  73% 10153/13907 [6:28:32<2:46:18,  2.66s/it][A
Training...:  73% 10154/13907 [6:28:35<2:54:13,  2.79s/it][A
Training...:  73% 10155/13907 [6:28:38<2:57:51,  2.84s/it][A
Training...:  73% 10156/13907 [6:28:41<2:58:51,  2.86s/it][A
Training...:  73% 10157/13907 [6:28:44<2:58:08,  2.85s/it][A
Training...:  73% 10158/13907 [6:28:47<2:56:40,  2.83s/it][A
Training...:  73% 10159/13907 [6:28:49<2:54:59,  2.80s/it][A
Training...:  73% 10160/13907 [6:28:52<2:52:36,  2.76s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [23:59:06<17:31:07, 31533.87s/it]
Training...:  73% 10160/13907 [6:28:55<2:52:36,  2.76s/it][A
Training...:  73% 10161/13907 [6:28:55<2:58:35,  2.86s/it][A
Training...:  73% 10162/13907 [6:28:58<2:55:26,  2.81s/it][A
Training...:  73% 10163/13907 [6:29:00<2:51:44,  2.75s/it][A
Training...:  73% 10164/13907 [6:29:03<2:47:33,  2.69s/it][A
Training...:  73% 10165/13907 [6:29:05<2:44:39,  2.64s/it][A
Training...:  73% 10166/13907 [6:29:08<2:41:21,  2.59s/it][A
Training...:  73% 10167/13907 [6:29:10<2:38:49,  2.55s/it][A
Training...:  73% 10168/13907 [6:29:13<2:37:44,  2.53s/it][A
Training...:  73% 10169/13907 [6:29:15<2:35:50,  2.50s/it][A
Training...:  73% 10170/13907 [6:29:18<2:32:37,  2.45s/it][A
Training...:  73% 10171/13907 [6:29:20<2:30:12,  2.41s/it][A
Training...:  73% 10172/13907 [6:29:22<2:27:35,  2.37s/it][A
Training...:  73% 10173/13907 [6:29:24<2:25:03,  2.33s/it][A
Training...:  73% 10174/13907 [6:29:27<2:22:00,  2.28s/it][A
Training...:  73% 10175/13907 [6:29:29<2:19:31,  2.24s/it][A
Training...:  73% 10176/13907 [6:29:31<2:17:39,  2.21s/it][A
Training...:  73% 10177/13907 [6:29:33<2:15:33,  2.18s/it][A
Training...:  73% 10178/13907 [6:29:35<2:13:16,  2.14s/it][A
Training...:  73% 10179/13907 [6:29:37<2:11:00,  2.11s/it][A
Training...:  73% 10180/13907 [6:29:39<2:09:14,  2.08s/it][A
Training...:  73% 10181/13907 [6:29:41<2:07:41,  2.06s/it][A
Training...:  73% 10182/13907 [6:29:43<2:06:00,  2.03s/it][A
Training...:  73% 10183/13907 [6:29:45<2:04:01,  2.00s/it][A
Training...:  73% 10184/13907 [6:29:47<2:02:21,  1.97s/it][A
Training...:  73% 10185/13907 [6:29:49<2:01:11,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:00:02<17:31:07, 31533.87s/it]
Training...:  73% 10185/13907 [6:29:51<2:01:11,  1.95s/it][A
Training...:  73% 10186/13907 [6:29:51<2:04:45,  2.01s/it][A
Training...:  73% 10187/13907 [6:29:53<2:02:16,  1.97s/it][A
Training...:  73% 10188/13907 [6:29:55<1:58:28,  1.91s/it][A
Training...:  73% 10189/13907 [6:29:56<1:55:11,  1.86s/it][A
Training...:  73% 10190/13907 [6:29:58<1:52:01,  1.81s/it][A
Training...:  73% 10191/13907 [6:30:00<1:49:08,  1.76s/it][A
Training...:  73% 10192/13907 [6:30:01<1:46:55,  1.73s/it][A
Training...:  73% 10193/13907 [6:30:03<1:44:21,  1.69s/it][A
Training...:  73% 10194/13907 [6:30:05<1:42:38,  1.66s/it][A
Training...:  73% 10195/13907 [6:30:06<1:39:56,  1.62s/it][A
Training...:  73% 10196/13907 [6:30:08<1:36:53,  1.57s/it][A
Training...:  73% 10197/13907 [6:30:09<1:33:30,  1.51s/it][A
Training...:  73% 10198/13907 [6:30:10<1:30:24,  1.46s/it][A
Training...:  73% 10199/13907 [6:30:12<1:25:54,  1.39s/it][A
Training...:  73% 10200/13907 [6:30:13<1:19:27,  1.29s/it][A
Training...:  73% 10201/13907 [6:30:16<2:05:09,  2.03s/it][A
Training...:  73% 10202/13907 [6:30:20<2:31:53,  2.46s/it][A
Training...:  73% 10203/13907 [6:30:23<2:46:50,  2.70s/it][A
Training...:  73% 10204/13907 [6:30:26<2:54:10,  2.82s/it][A
Training...:  73% 10205/13907 [6:30:29<2:57:47,  2.88s/it][A
Training...:  73% 10206/13907 [6:30:32<2:58:57,  2.90s/it][A
Training...:  73% 10207/13907 [6:30:35<2:58:57,  2.90s/it][A
Training...:  73% 10208/13907 [6:30:38<2:57:30,  2.88s/it][A
Training...:  73% 10209/13907 [6:30:41<2:56:02,  2.86s/it][A
Training...:  73% 10210/13907 [6:30:43<2:54:15,  2.83s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:00:58<17:31:07, 31533.87s/it]
Training...:  73% 10210/13907 [6:30:47<2:54:15,  2.83s/it][A
Training...:  73% 10211/13907 [6:30:47<2:59:16,  2.91s/it][A
Training...:  73% 10212/13907 [6:30:49<2:55:07,  2.84s/it][A
Training...:  73% 10213/13907 [6:30:52<2:49:42,  2.76s/it][A
Training...:  73% 10214/13907 [6:30:54<2:46:52,  2.71s/it][A
Training...:  73% 10215/13907 [6:30:57<2:42:35,  2.64s/it][A
Training...:  73% 10216/13907 [6:30:59<2:39:09,  2.59s/it][A
Training...:  73% 10217/13907 [6:31:02<2:36:46,  2.55s/it][A
Training...:  73% 10218/13907 [6:31:04<2:33:32,  2.50s/it][A
Training...:  73% 10219/13907 [6:31:06<2:30:47,  2.45s/it][A
Training...:  73% 10220/13907 [6:31:09<2:28:31,  2.42s/it][A
Training...:  73% 10221/13907 [6:31:11<2:26:24,  2.38s/it][A
Training...:  74% 10222/13907 [6:31:13<2:24:22,  2.35s/it][A
Training...:  74% 10223/13907 [6:31:16<2:22:12,  2.32s/it][A
Training...:  74% 10224/13907 [6:31:18<2:19:49,  2.28s/it][A
Training...:  74% 10225/13907 [6:31:20<2:17:51,  2.25s/it][A
Training...:  74% 10226/13907 [6:31:22<2:16:02,  2.22s/it][A
Training...:  74% 10227/13907 [6:31:24<2:14:13,  2.19s/it][A
Training...:  74% 10228/13907 [6:31:26<2:12:38,  2.16s/it][A
Training...:  74% 10229/13907 [6:31:28<2:11:20,  2.14s/it][A
Training...:  74% 10230/13907 [6:31:31<2:09:32,  2.11s/it][A
Training...:  74% 10231/13907 [6:31:33<2:08:28,  2.10s/it][A
Training...:  74% 10232/13907 [6:31:35<2:06:01,  2.06s/it][A
Training...:  74% 10233/13907 [6:31:36<2:04:14,  2.03s/it][A
Training...:  74% 10234/13907 [6:31:38<2:02:18,  2.00s/it][A
Training...:  74% 10235/13907 [6:31:40<2:00:30,  1.97s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:01:54<17:31:07, 31533.87s/it]
Training...:  74% 10235/13907 [6:31:43<2:00:30,  1.97s/it][A
Training...:  74% 10236/13907 [6:31:43<2:04:33,  2.04s/it][A
Training...:  74% 10237/13907 [6:31:44<2:01:50,  1.99s/it][A
Training...:  74% 10238/13907 [6:31:46<1:58:26,  1.94s/it][A
Training...:  74% 10239/13907 [6:31:48<1:55:27,  1.89s/it][A
Training...:  74% 10240/13907 [6:31:50<1:52:50,  1.85s/it][A
Training...:  74% 10241/13907 [6:31:51<1:49:58,  1.80s/it][A
Training...:  74% 10242/13907 [6:31:53<1:47:00,  1.75s/it][A
Training...:  74% 10243/13907 [6:31:55<1:44:38,  1.71s/it][A
Training...:  74% 10244/13907 [6:31:56<1:43:40,  1.70s/it][A
Training...:  74% 10245/13907 [6:31:58<1:41:13,  1.66s/it][A
Training...:  74% 10246/13907 [6:31:59<1:38:21,  1.61s/it][A
Training...:  74% 10247/13907 [6:32:01<1:34:46,  1.55s/it][A
Training...:  74% 10248/13907 [6:32:02<1:30:48,  1.49s/it][A
Training...:  74% 10249/13907 [6:32:03<1:26:06,  1.41s/it][A
Training...:  74% 10250/13907 [6:32:04<1:19:57,  1.31s/it][A
Training...:  74% 10251/13907 [6:32:08<2:05:38,  2.06s/it][A
Training...:  74% 10252/13907 [6:32:12<2:32:32,  2.50s/it][A
Training...:  74% 10253/13907 [6:32:15<2:46:11,  2.73s/it][A
Training...:  74% 10254/13907 [6:32:18<2:53:59,  2.86s/it][A
Training...:  74% 10255/13907 [6:32:21<2:58:04,  2.93s/it][A
Training...:  74% 10256/13907 [6:32:24<2:59:01,  2.94s/it][A
Training...:  74% 10257/13907 [6:32:27<2:58:18,  2.93s/it][A
Training...:  74% 10258/13907 [6:32:30<2:56:04,  2.90s/it][A
Training...:  74% 10259/13907 [6:32:33<2:53:52,  2.86s/it][A
Training...:  74% 10260/13907 [6:32:36<2:51:19,  2.82s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:02:50<17:31:07, 31533.87s/it]
Training...:  74% 10260/13907 [6:32:39<2:51:19,  2.82s/it][A
Training...:  74% 10261/13907 [6:32:39<2:55:51,  2.89s/it][A
Training...:  74% 10262/13907 [6:32:41<2:52:52,  2.85s/it][A
Training...:  74% 10263/13907 [6:32:44<2:48:29,  2.77s/it][A
Training...:  74% 10264/13907 [6:32:46<2:44:18,  2.71s/it][A
Training...:  74% 10265/13907 [6:32:49<2:41:56,  2.67s/it][A
Training...:  74% 10266/13907 [6:32:52<2:38:58,  2.62s/it][A
Training...:  74% 10267/13907 [6:32:54<2:35:51,  2.57s/it][A
Training...:  74% 10268/13907 [6:32:56<2:33:54,  2.54s/it][A
Training...:  74% 10269/13907 [6:32:59<2:30:49,  2.49s/it][A
Training...:  74% 10270/13907 [6:33:01<2:28:14,  2.45s/it][A
Training...:  74% 10271/13907 [6:33:04<2:26:41,  2.42s/it][A
Training...:  74% 10272/13907 [6:33:06<2:26:33,  2.42s/it][A
Training...:  74% 10273/13907 [6:33:08<2:23:48,  2.37s/it][A
Training...:  74% 10274/13907 [6:33:10<2:20:50,  2.33s/it][A
Training...:  74% 10275/13907 [6:33:13<2:18:16,  2.28s/it][A
Training...:  74% 10276/13907 [6:33:15<2:15:49,  2.24s/it][A
Training...:  74% 10277/13907 [6:33:17<2:14:06,  2.22s/it][A
Training...:  74% 10278/13907 [6:33:19<2:11:57,  2.18s/it][A
Training...:  74% 10279/13907 [6:33:21<2:10:06,  2.15s/it][A
Training...:  74% 10280/13907 [6:33:23<2:08:29,  2.13s/it][A
Training...:  74% 10281/13907 [6:33:25<2:07:02,  2.10s/it][A
Training...:  74% 10282/13907 [6:33:27<2:05:11,  2.07s/it][A
Training...:  74% 10283/13907 [6:33:29<2:03:04,  2.04s/it][A
Training...:  74% 10284/13907 [6:33:31<2:00:54,  2.00s/it][A
Training...:  74% 10285/13907 [6:33:33<1:58:39,  1.97s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:03:46<17:31:07, 31533.87s/it]
Training...:  74% 10285/13907 [6:33:35<1:58:39,  1.97s/it][A
Training...:  74% 10286/13907 [6:33:35<2:01:57,  2.02s/it][A
Training...:  74% 10287/13907 [6:33:37<1:59:25,  1.98s/it][A
Training...:  74% 10288/13907 [6:33:39<1:55:11,  1.91s/it][A
Training...:  74% 10289/13907 [6:33:41<1:52:12,  1.86s/it][A
Training...:  74% 10290/13907 [6:33:42<1:48:48,  1.80s/it][A
Training...:  74% 10291/13907 [6:33:44<1:46:02,  1.76s/it][A
Training...:  74% 10292/13907 [6:33:45<1:43:24,  1.72s/it][A
Training...:  74% 10293/13907 [6:33:47<1:40:58,  1.68s/it][A
Training...:  74% 10294/13907 [6:33:49<1:38:48,  1.64s/it][A
Training...:  74% 10295/13907 [6:33:50<1:36:05,  1.60s/it][A
Training...:  74% 10296/13907 [6:33:52<1:33:19,  1.55s/it][A
Training...:  74% 10297/13907 [6:33:53<1:29:59,  1.50s/it][A
Training...:  74% 10298/13907 [6:33:54<1:26:30,  1.44s/it][A
Training...:  74% 10299/13907 [6:33:55<1:22:32,  1.37s/it][A
Training...:  74% 10300/13907 [6:33:57<1:16:44,  1.28s/it][A
Training...:  74% 10301/13907 [6:34:00<2:00:48,  2.01s/it][A
Training...:  74% 10302/13907 [6:34:04<2:27:59,  2.46s/it][A
Training...:  74% 10303/13907 [6:34:07<2:42:32,  2.71s/it][A
Training...:  74% 10304/13907 [6:34:10<2:50:13,  2.83s/it][A
Training...:  74% 10305/13907 [6:34:13<2:53:32,  2.89s/it][A
Training...:  74% 10306/13907 [6:34:16<2:54:38,  2.91s/it][A
Training...:  74% 10307/13907 [6:34:19<2:54:09,  2.90s/it][A
Training...:  74% 10308/13907 [6:34:22<2:53:00,  2.88s/it][A
Training...:  74% 10309/13907 [6:34:25<2:52:39,  2.88s/it][A
Training...:  74% 10310/13907 [6:34:27<2:50:10,  2.84s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:04:42<17:31:07, 31533.87s/it]
Training...:  74% 10310/13907 [6:34:31<2:50:10,  2.84s/it][A
Training...:  74% 10311/13907 [6:34:31<2:54:10,  2.91s/it][A
Training...:  74% 10312/13907 [6:34:33<2:50:23,  2.84s/it][A
Training...:  74% 10313/13907 [6:34:36<2:45:47,  2.77s/it][A
Training...:  74% 10314/13907 [6:34:38<2:41:57,  2.70s/it][A
Training...:  74% 10315/13907 [6:34:41<2:38:20,  2.64s/it][A
Training...:  74% 10316/13907 [6:34:43<2:35:04,  2.59s/it][A
Training...:  74% 10317/13907 [6:34:46<2:32:31,  2.55s/it][A
Training...:  74% 10318/13907 [6:34:48<2:29:50,  2.51s/it][A
Training...:  74% 10319/13907 [6:34:51<2:26:56,  2.46s/it][A
Training...:  74% 10320/13907 [6:34:53<2:24:19,  2.41s/it][A
Training...:  74% 10321/13907 [6:34:55<2:22:10,  2.38s/it][A
Training...:  74% 10322/13907 [6:34:57<2:19:35,  2.34s/it][A
Training...:  74% 10323/13907 [6:35:00<2:17:35,  2.30s/it][A
Training...:  74% 10324/13907 [6:35:02<2:15:31,  2.27s/it][A
Training...:  74% 10325/13907 [6:35:04<2:13:22,  2.23s/it][A
Training...:  74% 10326/13907 [6:35:06<2:11:32,  2.20s/it][A
Training...:  74% 10327/13907 [6:35:08<2:10:25,  2.19s/it][A
Training...:  74% 10328/13907 [6:35:10<2:08:26,  2.15s/it][A
Training...:  74% 10329/13907 [6:35:12<2:06:34,  2.12s/it][A
Training...:  74% 10330/13907 [6:35:14<2:04:41,  2.09s/it][A
Training...:  74% 10331/13907 [6:35:16<2:03:07,  2.07s/it][A
Training...:  74% 10332/13907 [6:35:18<2:01:30,  2.04s/it][A
Training...:  74% 10333/13907 [6:35:20<1:59:37,  2.01s/it][A
Training...:  74% 10334/13907 [6:35:22<1:58:04,  1.98s/it][A
Training...:  74% 10335/13907 [6:35:24<1:56:16,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:05:37<17:31:07, 31533.87s/it]
Training...:  74% 10335/13907 [6:35:26<1:56:16,  1.95s/it][A
Training...:  74% 10336/13907 [6:35:26<2:00:14,  2.02s/it][A
Training...:  74% 10337/13907 [6:35:28<1:57:50,  1.98s/it][A
Training...:  74% 10338/13907 [6:35:30<1:54:21,  1.92s/it][A
Training...:  74% 10339/13907 [6:35:32<1:51:11,  1.87s/it][A
Training...:  74% 10340/13907 [6:35:33<1:47:57,  1.82s/it][A
Training...:  74% 10341/13907 [6:35:35<1:46:22,  1.79s/it][A
Training...:  74% 10342/13907 [6:35:37<1:44:55,  1.77s/it][A
Training...:  74% 10343/13907 [6:35:39<1:43:21,  1.74s/it][A
Training...:  74% 10344/13907 [6:35:40<1:41:14,  1.70s/it][A
Training...:  74% 10345/13907 [6:35:42<1:37:48,  1.65s/it][A
Training...:  74% 10346/13907 [6:35:43<1:34:20,  1.59s/it][A
Training...:  74% 10347/13907 [6:35:45<1:30:49,  1.53s/it][A
Training...:  74% 10348/13907 [6:35:46<1:26:37,  1.46s/it][A
Training...:  74% 10349/13907 [6:35:47<1:22:14,  1.39s/it][A
Training...:  74% 10350/13907 [6:35:48<1:16:46,  1.30s/it][A
Training...:  74% 10351/13907 [6:35:52<2:02:02,  2.06s/it][A
Training...:  74% 10352/13907 [6:35:56<2:29:11,  2.52s/it][A
Training...:  74% 10353/13907 [6:35:59<2:44:17,  2.77s/it][A
Training...:  74% 10354/13907 [6:36:02<2:52:38,  2.92s/it][A
Training...:  74% 10355/13907 [6:36:05<2:56:45,  2.99s/it][A
Training...:  74% 10356/13907 [6:36:08<2:57:40,  3.00s/it][A
Training...:  74% 10357/13907 [6:36:11<2:56:53,  2.99s/it][A
Training...:  74% 10358/13907 [6:36:14<2:54:51,  2.96s/it][A
Training...:  74% 10359/13907 [6:36:17<2:53:05,  2.93s/it][A
Training...:  74% 10360/13907 [6:36:20<2:51:25,  2.90s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:06:34<17:31:07, 31533.87s/it]
Training...:  74% 10360/13907 [6:36:23<2:51:25,  2.90s/it][A
Training...:  75% 10361/13907 [6:36:23<2:55:43,  2.97s/it][A
Training...:  75% 10362/13907 [6:36:26<2:50:33,  2.89s/it][A
Training...:  75% 10363/13907 [6:36:28<2:45:40,  2.80s/it][A
Training...:  75% 10364/13907 [6:36:31<2:40:46,  2.72s/it][A
Training...:  75% 10365/13907 [6:36:33<2:36:54,  2.66s/it][A
Training...:  75% 10366/13907 [6:36:36<2:33:20,  2.60s/it][A
Training...:  75% 10367/13907 [6:36:38<2:30:05,  2.54s/it][A
Training...:  75% 10368/13907 [6:36:41<2:27:25,  2.50s/it][A
Training...:  75% 10369/13907 [6:36:43<2:26:15,  2.48s/it][A
Training...:  75% 10370/13907 [6:36:45<2:24:31,  2.45s/it][A
Training...:  75% 10371/13907 [6:36:48<2:22:13,  2.41s/it][A
Training...:  75% 10372/13907 [6:36:50<2:19:30,  2.37s/it][A
Training...:  75% 10373/13907 [6:36:52<2:17:01,  2.33s/it][A
Training...:  75% 10374/13907 [6:36:54<2:14:55,  2.29s/it][A
Training...:  75% 10375/13907 [6:36:57<2:12:52,  2.26s/it][A
Training...:  75% 10376/13907 [6:36:59<2:10:41,  2.22s/it][A
Training...:  75% 10377/13907 [6:37:01<2:08:46,  2.19s/it][A
Training...:  75% 10378/13907 [6:37:03<2:06:59,  2.16s/it][A
Training...:  75% 10379/13907 [6:37:05<2:05:07,  2.13s/it][A
Training...:  75% 10380/13907 [6:37:07<2:03:07,  2.09s/it][A
Training...:  75% 10381/13907 [6:37:09<2:01:34,  2.07s/it][A
Training...:  75% 10382/13907 [6:37:11<1:59:53,  2.04s/it][A
Training...:  75% 10383/13907 [6:37:13<1:58:00,  2.01s/it][A
Training...:  75% 10384/13907 [6:37:15<1:55:50,  1.97s/it][A
Training...:  75% 10385/13907 [6:37:17<1:54:08,  1.94s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:07:30<17:31:07, 31533.87s/it]
Training...:  75% 10385/13907 [6:37:19<1:54:08,  1.94s/it][A
Training...:  75% 10386/13907 [6:37:19<1:58:07,  2.01s/it][A
Training...:  75% 10387/13907 [6:37:21<1:55:41,  1.97s/it][A
Training...:  75% 10388/13907 [6:37:23<1:52:20,  1.92s/it][A
Training...:  75% 10389/13907 [6:37:24<1:49:19,  1.86s/it][A
Training...:  75% 10390/13907 [6:37:26<1:46:45,  1.82s/it][A
Training...:  75% 10391/13907 [6:37:28<1:44:23,  1.78s/it][A
Training...:  75% 10392/13907 [6:37:29<1:41:53,  1.74s/it][A
Training...:  75% 10393/13907 [6:37:31<1:39:19,  1.70s/it][A
Training...:  75% 10394/13907 [6:37:33<1:36:57,  1.66s/it][A
Training...:  75% 10395/13907 [6:37:34<1:34:11,  1.61s/it][A
Training...:  75% 10396/13907 [6:37:35<1:31:01,  1.56s/it][A
Training...:  75% 10397/13907 [6:37:37<1:27:51,  1.50s/it][A
Training...:  75% 10398/13907 [6:37:38<1:24:45,  1.45s/it][A
Training...:  75% 10399/13907 [6:37:39<1:20:46,  1.38s/it][A
Training...:  75% 10400/13907 [6:37:40<1:15:15,  1.29s/it][A
Training...:  75% 10401/13907 [6:37:44<1:57:55,  2.02s/it][A
Training...:  75% 10402/13907 [6:37:48<2:23:46,  2.46s/it][A
Training...:  75% 10403/13907 [6:37:51<2:39:40,  2.73s/it][A
Training...:  75% 10404/13907 [6:37:54<2:47:37,  2.87s/it][A
Training...:  75% 10405/13907 [6:37:57<2:52:07,  2.95s/it][A
Training...:  75% 10406/13907 [6:38:00<2:53:22,  2.97s/it][A
Training...:  75% 10407/13907 [6:38:03<2:52:49,  2.96s/it][A
Training...:  75% 10408/13907 [6:38:06<2:51:10,  2.94s/it][A
Training...:  75% 10409/13907 [6:38:09<2:49:35,  2.91s/it][A
Training...:  75% 10410/13907 [6:38:12<2:47:46,  2.88s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:08:26<17:31:07, 31533.87s/it]
Training...:  75% 10410/13907 [6:38:15<2:47:46,  2.88s/it][A
Training...:  75% 10411/13907 [6:38:15<2:53:45,  2.98s/it][A
Training...:  75% 10412/13907 [6:38:18<2:49:04,  2.90s/it][A
Training...:  75% 10413/13907 [6:38:20<2:43:28,  2.81s/it][A
Training...:  75% 10414/13907 [6:38:23<2:38:31,  2.72s/it][A
Training...:  75% 10415/13907 [6:38:25<2:34:24,  2.65s/it][A
Training...:  75% 10416/13907 [6:38:28<2:30:38,  2.59s/it][A
Training...:  75% 10417/13907 [6:38:30<2:27:49,  2.54s/it][A
Training...:  75% 10418/13907 [6:38:33<2:25:01,  2.49s/it][A
Training...:  75% 10419/13907 [6:38:35<2:22:43,  2.46s/it][A
Training...:  75% 10420/13907 [6:38:37<2:20:26,  2.42s/it][A
Training...:  75% 10421/13907 [6:38:40<2:18:46,  2.39s/it][A
Training...:  75% 10422/13907 [6:38:42<2:16:30,  2.35s/it][A
Training...:  75% 10423/13907 [6:38:44<2:14:36,  2.32s/it][A
Training...:  75% 10424/13907 [6:38:46<2:12:26,  2.28s/it][A
Training...:  75% 10425/13907 [6:38:49<2:11:20,  2.26s/it][A
Training...:  75% 10426/13907 [6:38:51<2:09:09,  2.23s/it][A
Training...:  75% 10427/13907 [6:38:53<2:07:20,  2.20s/it][A
Training...:  75% 10428/13907 [6:38:55<2:05:20,  2.16s/it][A
Training...:  75% 10429/13907 [6:38:57<2:03:46,  2.14s/it][A
Training...:  75% 10430/13907 [6:38:59<2:02:23,  2.11s/it][A
Training...:  75% 10431/13907 [6:39:01<2:00:36,  2.08s/it][A
Training...:  75% 10432/13907 [6:39:03<1:58:59,  2.05s/it][A
Training...:  75% 10433/13907 [6:39:05<1:57:27,  2.03s/it][A
Training...:  75% 10434/13907 [6:39:07<1:55:36,  2.00s/it][A
Training...:  75% 10435/13907 [6:39:09<1:53:54,  1.97s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:09:22<17:31:07, 31533.87s/it]
Training...:  75% 10435/13907 [6:39:11<1:53:54,  1.97s/it][A
Training...:  75% 10436/13907 [6:39:11<1:57:39,  2.03s/it][A
Training...:  75% 10437/13907 [6:39:13<1:55:26,  2.00s/it][A
Training...:  75% 10438/13907 [6:39:15<1:51:39,  1.93s/it][A
Training...:  75% 10439/13907 [6:39:16<1:48:37,  1.88s/it][A
Training...:  75% 10440/13907 [6:39:18<1:46:06,  1.84s/it][A
Training...:  75% 10441/13907 [6:39:20<1:44:10,  1.80s/it][A
Training...:  75% 10442/13907 [6:39:22<1:42:34,  1.78s/it][A
Training...:  75% 10443/13907 [6:39:23<1:40:16,  1.74s/it][A
Training...:  75% 10444/13907 [6:39:25<1:38:16,  1.70s/it][A
Training...:  75% 10445/13907 [6:39:26<1:35:44,  1.66s/it][A
Training...:  75% 10446/13907 [6:39:28<1:32:55,  1.61s/it][A
Training...:  75% 10447/13907 [6:39:29<1:29:41,  1.56s/it][A
Training...:  75% 10448/13907 [6:39:31<1:26:27,  1.50s/it][A
Training...:  75% 10449/13907 [6:39:32<1:22:40,  1.43s/it][A
Training...:  75% 10450/13907 [6:39:33<1:16:40,  1.33s/it][A
Training...:  75% 10451/13907 [6:39:37<1:59:31,  2.08s/it][A
Training...:  75% 10452/13907 [6:39:41<2:25:14,  2.52s/it][A
Training...:  75% 10453/13907 [6:39:44<2:39:36,  2.77s/it][A
Training...:  75% 10454/13907 [6:39:47<2:46:47,  2.90s/it][A
Training...:  75% 10455/13907 [6:39:50<2:50:03,  2.96s/it][A
Training...:  75% 10456/13907 [6:39:53<2:50:36,  2.97s/it][A
Training...:  75% 10457/13907 [6:39:56<2:49:48,  2.95s/it][A
Training...:  75% 10458/13907 [6:39:59<2:48:39,  2.93s/it][A
Training...:  75% 10459/13907 [6:40:02<2:46:54,  2.90s/it][A
Training...:  75% 10460/13907 [6:40:05<2:45:17,  2.88s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:10:19<17:31:07, 31533.87s/it]
Training...:  75% 10460/13907 [6:40:08<2:45:17,  2.88s/it][A
Training...:  75% 10461/13907 [6:40:08<2:50:17,  2.97s/it][A
Training...:  75% 10462/13907 [6:40:11<2:45:59,  2.89s/it][A
Training...:  75% 10463/13907 [6:40:13<2:41:19,  2.81s/it][A
Training...:  75% 10464/13907 [6:40:16<2:36:56,  2.74s/it][A
Training...:  75% 10465/13907 [6:40:18<2:33:23,  2.67s/it][A
Training...:  75% 10466/13907 [6:40:21<2:31:19,  2.64s/it][A
Training...:  75% 10467/13907 [6:40:23<2:27:50,  2.58s/it][A
Training...:  75% 10468/13907 [6:40:26<2:24:43,  2.53s/it][A
Training...:  75% 10469/13907 [6:40:28<2:22:45,  2.49s/it][A
Training...:  75% 10470/13907 [6:40:30<2:21:43,  2.47s/it][A
Training...:  75% 10471/13907 [6:40:33<2:19:07,  2.43s/it][A
Training...:  75% 10472/13907 [6:40:35<2:17:08,  2.40s/it][A
Training...:  75% 10473/13907 [6:40:37<2:14:42,  2.35s/it][A
Training...:  75% 10474/13907 [6:40:40<2:11:52,  2.30s/it][A
Training...:  75% 10475/13907 [6:40:42<2:09:41,  2.27s/it][A
Training...:  75% 10476/13907 [6:40:44<2:07:19,  2.23s/it][A
Training...:  75% 10477/13907 [6:40:46<2:05:09,  2.19s/it][A
Training...:  75% 10478/13907 [6:40:48<2:03:22,  2.16s/it][A
Training...:  75% 10479/13907 [6:40:50<2:01:27,  2.13s/it][A
Training...:  75% 10480/13907 [6:40:52<1:59:28,  2.09s/it][A
Training...:  75% 10481/13907 [6:40:54<1:57:44,  2.06s/it][A
Training...:  75% 10482/13907 [6:40:56<1:56:13,  2.04s/it][A
Training...:  75% 10483/13907 [6:40:58<1:54:41,  2.01s/it][A
Training...:  75% 10484/13907 [6:41:00<1:53:06,  1.98s/it][A
Training...:  75% 10485/13907 [6:41:02<1:51:11,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:11:15<17:31:07, 31533.87s/it]
Training...:  75% 10485/13907 [6:41:04<1:51:11,  1.95s/it][A
Training...:  75% 10486/13907 [6:41:04<1:54:40,  2.01s/it][A
Training...:  75% 10487/13907 [6:41:06<1:52:30,  1.97s/it][A
Training...:  75% 10488/13907 [6:41:08<1:49:27,  1.92s/it][A
Training...:  75% 10489/13907 [6:41:09<1:46:40,  1.87s/it][A
Training...:  75% 10490/13907 [6:41:11<1:43:53,  1.82s/it][A
Training...:  75% 10491/13907 [6:41:13<1:42:05,  1.79s/it][A
Training...:  75% 10492/13907 [6:41:14<1:39:21,  1.75s/it][A
Training...:  75% 10493/13907 [6:41:16<1:36:34,  1.70s/it][A
Training...:  75% 10494/13907 [6:41:18<1:34:12,  1.66s/it][A
Training...:  75% 10495/13907 [6:41:19<1:31:16,  1.60s/it][A
Training...:  75% 10496/13907 [6:41:21<1:28:14,  1.55s/it][A
Training...:  75% 10497/13907 [6:41:22<1:25:38,  1.51s/it][A
Training...:  75% 10498/13907 [6:41:23<1:22:23,  1.45s/it][A
Training...:  75% 10499/13907 [6:41:25<1:18:42,  1.39s/it][A
Training...:  76% 10500/13907 [6:41:26<1:13:08,  1.29s/it][A
Training...:  76% 10501/13907 [6:41:29<1:55:21,  2.03s/it][A
Training...:  76% 10502/13907 [6:41:33<2:20:35,  2.48s/it][A
Training...:  76% 10503/13907 [6:41:36<2:35:37,  2.74s/it][A
Training...:  76% 10504/13907 [6:41:39<2:44:02,  2.89s/it][A
Training...:  76% 10505/13907 [6:41:42<2:46:28,  2.94s/it][A
Training...:  76% 10506/13907 [6:41:45<2:46:31,  2.94s/it][A
Training...:  76% 10507/13907 [6:41:48<2:45:25,  2.92s/it][A
Training...:  76% 10508/13907 [6:41:51<2:43:36,  2.89s/it][A
Training...:  76% 10509/13907 [6:41:54<2:41:15,  2.85s/it][A
Training...:  76% 10510/13907 [6:41:57<2:38:32,  2.80s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:12:11<17:31:07, 31533.87s/it]
Training...:  76% 10510/13907 [6:42:00<2:38:32,  2.80s/it][A
Training...:  76% 10511/13907 [6:42:00<2:43:00,  2.88s/it][A
Training...:  76% 10512/13907 [6:42:02<2:40:06,  2.83s/it][A
Training...:  76% 10513/13907 [6:42:05<2:35:38,  2.75s/it][A
Training...:  76% 10514/13907 [6:42:07<2:31:47,  2.68s/it][A
Training...:  76% 10515/13907 [6:42:10<2:28:57,  2.63s/it][A
Training...:  76% 10516/13907 [6:42:12<2:26:30,  2.59s/it][A
Training...:  76% 10517/13907 [6:42:15<2:24:12,  2.55s/it][A
Training...:  76% 10518/13907 [6:42:17<2:21:20,  2.50s/it][A
Training...:  76% 10519/13907 [6:42:20<2:19:03,  2.46s/it][A
Training...:  76% 10520/13907 [6:42:22<2:17:05,  2.43s/it][A
Training...:  76% 10521/13907 [6:42:24<2:15:05,  2.39s/it][A
Training...:  76% 10522/13907 [6:42:27<2:13:38,  2.37s/it][A
Training...:  76% 10523/13907 [6:42:29<2:11:33,  2.33s/it][A
Training...:  76% 10524/13907 [6:42:31<2:09:45,  2.30s/it][A
Training...:  76% 10525/13907 [6:42:33<2:08:19,  2.28s/it][A
Training...:  76% 10526/13907 [6:42:36<2:06:31,  2.25s/it][A
Training...:  76% 10527/13907 [6:42:38<2:04:59,  2.22s/it][A
Training...:  76% 10528/13907 [6:42:40<2:03:21,  2.19s/it][A
Training...:  76% 10529/13907 [6:42:42<2:01:44,  2.16s/it][A
Training...:  76% 10530/13907 [6:42:44<1:59:49,  2.13s/it][A
Training...:  76% 10531/13907 [6:42:46<1:58:11,  2.10s/it][A
Training...:  76% 10532/13907 [6:42:48<1:57:20,  2.09s/it][A
Training...:  76% 10533/13907 [6:42:50<1:56:27,  2.07s/it][A
Training...:  76% 10534/13907 [6:42:52<1:54:21,  2.03s/it][A
Training...:  76% 10535/13907 [6:42:54<1:52:11,  2.00s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:13:07<17:31:07, 31533.87s/it]
Training...:  76% 10535/13907 [6:42:56<1:52:11,  2.00s/it][A
Training...:  76% 10536/13907 [6:42:56<1:55:08,  2.05s/it][A
Training...:  76% 10537/13907 [6:42:58<1:52:24,  2.00s/it][A
Training...:  76% 10538/13907 [6:43:00<1:48:39,  1.94s/it][A
Training...:  76% 10539/13907 [6:43:02<1:45:24,  1.88s/it][A
Training...:  76% 10540/13907 [6:43:03<1:42:33,  1.83s/it][A
Training...:  76% 10541/13907 [6:43:05<1:40:03,  1.78s/it][A
Training...:  76% 10542/13907 [6:43:07<1:37:24,  1.74s/it][A
Training...:  76% 10543/13907 [6:43:08<1:35:16,  1.70s/it][A
Training...:  76% 10544/13907 [6:43:10<1:32:57,  1.66s/it][A
Training...:  76% 10545/13907 [6:43:11<1:30:01,  1.61s/it][A
Training...:  76% 10546/13907 [6:43:13<1:26:58,  1.55s/it][A
Training...:  76% 10547/13907 [6:43:14<1:24:05,  1.50s/it][A
Training...:  76% 10548/13907 [6:43:15<1:20:52,  1.44s/it][A
Training...:  76% 10549/13907 [6:43:17<1:17:03,  1.38s/it][A
Training...:  76% 10550/13907 [6:43:18<1:11:24,  1.28s/it][A
Training...:  76% 10551/13907 [6:43:21<1:51:10,  1.99s/it][A
Training...:  76% 10552/13907 [6:43:25<2:15:56,  2.43s/it][A
Training...:  76% 10553/13907 [6:43:28<2:29:03,  2.67s/it][A
Training...:  76% 10554/13907 [6:43:31<2:36:36,  2.80s/it][A
Training...:  76% 10555/13907 [6:43:34<2:40:27,  2.87s/it][A
Training...:  76% 10556/13907 [6:43:37<2:41:15,  2.89s/it][A
Training...:  76% 10557/13907 [6:43:40<2:41:18,  2.89s/it][A
Training...:  76% 10558/13907 [6:43:43<2:39:59,  2.87s/it][A
Training...:  76% 10559/13907 [6:43:45<2:38:24,  2.84s/it][A
Training...:  76% 10560/13907 [6:43:48<2:36:07,  2.80s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:14:02<17:31:07, 31533.87s/it]
Training...:  76% 10560/13907 [6:43:51<2:36:07,  2.80s/it][A
Training...:  76% 10561/13907 [6:43:51<2:40:41,  2.88s/it][A
Training...:  76% 10562/13907 [6:43:54<2:37:18,  2.82s/it][A
Training...:  76% 10563/13907 [6:43:57<2:33:46,  2.76s/it][A
Training...:  76% 10564/13907 [6:43:59<2:30:13,  2.70s/it][A
Training...:  76% 10565/13907 [6:44:02<2:27:59,  2.66s/it][A
Training...:  76% 10566/13907 [6:44:04<2:25:54,  2.62s/it][A
Training...:  76% 10567/13907 [6:44:07<2:22:52,  2.57s/it][A
Training...:  76% 10568/13907 [6:44:09<2:20:11,  2.52s/it][A
Training...:  76% 10569/13907 [6:44:11<2:17:22,  2.47s/it][A
Training...:  76% 10570/13907 [6:44:14<2:15:12,  2.43s/it][A
Training...:  76% 10571/13907 [6:44:16<2:14:03,  2.41s/it][A
Training...:  76% 10572/13907 [6:44:18<2:11:23,  2.36s/it][A
Training...:  76% 10573/13907 [6:44:21<2:08:49,  2.32s/it][A
Training...:  76% 10574/13907 [6:44:23<2:06:10,  2.27s/it][A
Training...:  76% 10575/13907 [6:44:25<2:03:49,  2.23s/it][A
Training...:  76% 10576/13907 [6:44:27<2:01:47,  2.19s/it][A
Training...:  76% 10577/13907 [6:44:29<2:00:26,  2.17s/it][A
Training...:  76% 10578/13907 [6:44:31<1:58:23,  2.13s/it][A
Training...:  76% 10579/13907 [6:44:33<1:57:05,  2.11s/it][A
Training...:  76% 10580/13907 [6:44:35<1:55:41,  2.09s/it][A
Training...:  76% 10581/13907 [6:44:37<1:54:06,  2.06s/it][A
Training...:  76% 10582/13907 [6:44:39<1:52:43,  2.03s/it][A
Training...:  76% 10583/13907 [6:44:41<1:50:56,  2.00s/it][A
Training...:  76% 10584/13907 [6:44:43<1:49:07,  1.97s/it][A
Training...:  76% 10585/13907 [6:44:45<1:47:24,  1.94s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:14:58<17:31:07, 31533.87s/it]
Training...:  76% 10585/13907 [6:44:47<1:47:24,  1.94s/it][A
Training...:  76% 10586/13907 [6:44:47<1:51:05,  2.01s/it][A
Training...:  76% 10587/13907 [6:44:49<1:49:11,  1.97s/it][A
Training...:  76% 10588/13907 [6:44:51<1:45:34,  1.91s/it][A
Training...:  76% 10589/13907 [6:44:52<1:43:00,  1.86s/it][A
Training...:  76% 10590/13907 [6:44:54<1:39:45,  1.80s/it][A
Training...:  76% 10591/13907 [6:44:56<1:37:04,  1.76s/it][A
Training...:  76% 10592/13907 [6:44:57<1:34:38,  1.71s/it][A
Training...:  76% 10593/13907 [6:44:59<1:32:22,  1.67s/it][A
Training...:  76% 10594/13907 [6:45:01<1:30:23,  1.64s/it][A
Training...:  76% 10595/13907 [6:45:02<1:27:51,  1.59s/it][A
Training...:  76% 10596/13907 [6:45:03<1:25:19,  1.55s/it][A
Training...:  76% 10597/13907 [6:45:05<1:22:35,  1.50s/it][A
Training...:  76% 10598/13907 [6:45:06<1:19:27,  1.44s/it][A
Training...:  76% 10599/13907 [6:45:07<1:15:59,  1.38s/it][A
Training...:  76% 10600/13907 [6:45:08<1:11:03,  1.29s/it][A
Training...:  76% 10601/13907 [6:45:12<1:51:25,  2.02s/it][A
Training...:  76% 10602/13907 [6:45:16<2:15:22,  2.46s/it][A
Training...:  76% 10603/13907 [6:45:19<2:28:24,  2.70s/it][A
Training...:  76% 10604/13907 [6:45:22<2:35:02,  2.82s/it][A
Training...:  76% 10605/13907 [6:45:25<2:38:00,  2.87s/it][A
Training...:  76% 10606/13907 [6:45:28<2:38:28,  2.88s/it][A
Training...:  76% 10607/13907 [6:45:31<2:37:59,  2.87s/it][A
Training...:  76% 10608/13907 [6:45:34<2:36:06,  2.84s/it][A
Training...:  76% 10609/13907 [6:45:36<2:34:28,  2.81s/it][A
Training...:  76% 10610/13907 [6:45:39<2:32:47,  2.78s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:15:53<17:31:07, 31533.87s/it]
Training...:  76% 10610/13907 [6:45:42<2:32:47,  2.78s/it][A
Training...:  76% 10611/13907 [6:45:42<2:38:17,  2.88s/it][A
Training...:  76% 10612/13907 [6:45:45<2:36:30,  2.85s/it][A
Training...:  76% 10613/13907 [6:45:47<2:32:28,  2.78s/it][A
Training...:  76% 10614/13907 [6:45:50<2:28:47,  2.71s/it][A
Training...:  76% 10615/13907 [6:45:53<2:24:56,  2.64s/it][A
Training...:  76% 10616/13907 [6:45:55<2:21:30,  2.58s/it][A
Training...:  76% 10617/13907 [6:45:57<2:18:45,  2.53s/it][A
Training...:  76% 10618/13907 [6:46:00<2:16:10,  2.48s/it][A
Training...:  76% 10619/13907 [6:46:02<2:13:53,  2.44s/it][A
Training...:  76% 10620/13907 [6:46:04<2:11:44,  2.40s/it][A
Training...:  76% 10621/13907 [6:46:07<2:09:17,  2.36s/it][A
Training...:  76% 10622/13907 [6:46:09<2:07:40,  2.33s/it][A
Training...:  76% 10623/13907 [6:46:11<2:05:41,  2.30s/it][A
Training...:  76% 10624/13907 [6:46:13<2:03:49,  2.26s/it][A
Training...:  76% 10625/13907 [6:46:15<2:02:05,  2.23s/it][A
Training...:  76% 10626/13907 [6:46:18<2:00:38,  2.21s/it][A
Training...:  76% 10627/13907 [6:46:20<1:59:37,  2.19s/it][A
Training...:  76% 10628/13907 [6:46:22<1:57:52,  2.16s/it][A
Training...:  76% 10629/13907 [6:46:24<1:56:14,  2.13s/it][A
Training...:  76% 10630/13907 [6:46:26<1:54:39,  2.10s/it][A
Training...:  76% 10631/13907 [6:46:28<1:53:15,  2.07s/it][A
Training...:  76% 10632/13907 [6:46:30<1:51:40,  2.05s/it][A
Training...:  76% 10633/13907 [6:46:32<1:49:48,  2.01s/it][A
Training...:  76% 10634/13907 [6:46:34<1:47:56,  1.98s/it][A
Training...:  76% 10635/13907 [6:46:36<1:46:05,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:16:49<17:31:07, 31533.87s/it]
Training...:  76% 10635/13907 [6:46:38<1:46:05,  1.95s/it][A
Training...:  76% 10636/13907 [6:46:38<1:49:23,  2.01s/it][A
Training...:  76% 10637/13907 [6:46:40<1:46:52,  1.96s/it][A
Training...:  76% 10638/13907 [6:46:41<1:43:19,  1.90s/it][A
Training...:  77% 10639/13907 [6:46:43<1:41:05,  1.86s/it][A
Training...:  77% 10640/13907 [6:46:45<1:38:36,  1.81s/it][A
Training...:  77% 10641/13907 [6:46:47<1:36:07,  1.77s/it][A
Training...:  77% 10642/13907 [6:46:48<1:34:31,  1.74s/it][A
Training...:  77% 10643/13907 [6:46:50<1:32:30,  1.70s/it][A
Training...:  77% 10644/13907 [6:46:51<1:30:35,  1.67s/it][A
Training...:  77% 10645/13907 [6:46:53<1:27:53,  1.62s/it][A
Training...:  77% 10646/13907 [6:46:54<1:24:57,  1.56s/it][A
Training...:  77% 10647/13907 [6:46:56<1:21:42,  1.50s/it][A
Training...:  77% 10648/13907 [6:46:57<1:18:16,  1.44s/it][A
Training...:  77% 10649/13907 [6:46:58<1:14:35,  1.37s/it][A
Training...:  77% 10650/13907 [6:46:59<1:09:02,  1.27s/it][A
Training...:  77% 10651/13907 [6:47:03<1:49:39,  2.02s/it][A
Training...:  77% 10652/13907 [6:47:07<2:14:34,  2.48s/it][A
Training...:  77% 10653/13907 [6:47:10<2:27:18,  2.72s/it][A
Training...:  77% 10654/13907 [6:47:13<2:33:52,  2.84s/it][A
Training...:  77% 10655/13907 [6:47:16<2:37:08,  2.90s/it][A
Training...:  77% 10656/13907 [6:47:19<2:37:40,  2.91s/it][A
Training...:  77% 10657/13907 [6:47:22<2:36:54,  2.90s/it][A
Training...:  77% 10658/13907 [6:47:25<2:35:01,  2.86s/it][A
Training...:  77% 10659/13907 [6:47:27<2:33:24,  2.83s/it][A
Training...:  77% 10660/13907 [6:47:30<2:31:01,  2.79s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:17:44<17:31:07, 31533.87s/it]
Training...:  77% 10660/13907 [6:47:33<2:31:01,  2.79s/it][A
Training...:  77% 10661/13907 [6:47:33<2:35:28,  2.87s/it][A
Training...:  77% 10662/13907 [6:47:36<2:32:46,  2.82s/it][A
Training...:  77% 10663/13907 [6:47:38<2:28:42,  2.75s/it][A
Training...:  77% 10664/13907 [6:47:41<2:25:02,  2.68s/it][A
Training...:  77% 10665/13907 [6:47:43<2:22:19,  2.63s/it][A
Training...:  77% 10666/13907 [6:47:46<2:20:08,  2.59s/it][A
Training...:  77% 10667/13907 [6:47:48<2:17:43,  2.55s/it][A
Training...:  77% 10668/13907 [6:47:51<2:15:36,  2.51s/it][A
Training...:  77% 10669/13907 [6:47:53<2:14:06,  2.49s/it][A
Training...:  77% 10670/13907 [6:47:56<2:12:12,  2.45s/it][A
Training...:  77% 10671/13907 [6:47:58<2:10:21,  2.42s/it][A
Training...:  77% 10672/13907 [6:48:00<2:08:37,  2.39s/it][A
Training...:  77% 10673/13907 [6:48:03<2:07:06,  2.36s/it][A
Training...:  77% 10674/13907 [6:48:05<2:05:58,  2.34s/it][A
Training...:  77% 10675/13907 [6:48:07<2:04:33,  2.31s/it][A
Training...:  77% 10676/13907 [6:48:09<2:02:11,  2.27s/it][A
Training...:  77% 10677/13907 [6:48:11<2:00:08,  2.23s/it][A
Training...:  77% 10678/13907 [6:48:13<1:57:59,  2.19s/it][A
Training...:  77% 10679/13907 [6:48:16<1:55:54,  2.15s/it][A
Training...:  77% 10680/13907 [6:48:18<1:53:43,  2.11s/it][A
Training...:  77% 10681/13907 [6:48:20<1:52:00,  2.08s/it][A
Training...:  77% 10682/13907 [6:48:22<1:50:04,  2.05s/it][A
Training...:  77% 10683/13907 [6:48:24<1:48:44,  2.02s/it][A
Training...:  77% 10684/13907 [6:48:25<1:47:15,  2.00s/it][A
Training...:  77% 10685/13907 [6:48:27<1:45:18,  1.96s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:18:41<17:31:07, 31533.87s/it]
Training...:  77% 10685/13907 [6:48:30<1:45:18,  1.96s/it][A
Training...:  77% 10686/13907 [6:48:30<1:48:34,  2.02s/it][A
Training...:  77% 10687/13907 [6:48:31<1:46:03,  1.98s/it][A
Training...:  77% 10688/13907 [6:48:33<1:42:43,  1.91s/it][A
Training...:  77% 10689/13907 [6:48:35<1:40:18,  1.87s/it][A
Training...:  77% 10690/13907 [6:48:37<1:37:44,  1.82s/it][A
Training...:  77% 10691/13907 [6:48:38<1:35:23,  1.78s/it][A
Training...:  77% 10692/13907 [6:48:40<1:33:10,  1.74s/it][A
Training...:  77% 10693/13907 [6:48:42<1:30:58,  1.70s/it][A
Training...:  77% 10694/13907 [6:48:43<1:29:09,  1.67s/it][A
Training...:  77% 10695/13907 [6:48:45<1:26:50,  1.62s/it][A
Training...:  77% 10696/13907 [6:48:46<1:24:41,  1.58s/it][A
Training...:  77% 10697/13907 [6:48:48<1:22:18,  1.54s/it][A
Training...:  77% 10698/13907 [6:48:49<1:19:11,  1.48s/it][A
Training...:  77% 10699/13907 [6:48:50<1:15:43,  1.42s/it][A
Training...:  77% 10700/13907 [6:48:51<1:10:42,  1.32s/it][A
Training...:  77% 10701/13907 [6:48:55<1:48:32,  2.03s/it][A
Training...:  77% 10702/13907 [6:48:59<2:12:24,  2.48s/it][A
Training...:  77% 10703/13907 [6:49:02<2:25:18,  2.72s/it][A
Training...:  77% 10704/13907 [6:49:05<2:33:20,  2.87s/it][A
Training...:  77% 10705/13907 [6:49:08<2:36:32,  2.93s/it][A
Training...:  77% 10706/13907 [6:49:11<2:37:16,  2.95s/it][A
Training...:  77% 10707/13907 [6:49:14<2:36:01,  2.93s/it][A
Training...:  77% 10708/13907 [6:49:17<2:34:25,  2.90s/it][A
Training...:  77% 10709/13907 [6:49:20<2:32:29,  2.86s/it][A
Training...:  77% 10710/13907 [6:49:22<2:31:40,  2.85s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:19:37<17:31:07, 31533.87s/it]
Training...:  77% 10710/13907 [6:49:26<2:31:40,  2.85s/it][A
Training...:  77% 10711/13907 [6:49:26<2:36:08,  2.93s/it][A
Training...:  77% 10712/13907 [6:49:28<2:32:17,  2.86s/it][A
Training...:  77% 10713/13907 [6:49:31<2:27:47,  2.78s/it][A
Training...:  77% 10714/13907 [6:49:33<2:23:58,  2.71s/it][A
Training...:  77% 10715/13907 [6:49:36<2:20:39,  2.64s/it][A
Training...:  77% 10716/13907 [6:49:38<2:17:58,  2.59s/it][A
Training...:  77% 10717/13907 [6:49:41<2:15:49,  2.55s/it][A
Training...:  77% 10718/13907 [6:49:43<2:13:40,  2.52s/it][A
Training...:  77% 10719/13907 [6:49:46<2:11:28,  2.47s/it][A
Training...:  77% 10720/13907 [6:49:48<2:09:11,  2.43s/it][A
Training...:  77% 10721/13907 [6:49:50<2:07:22,  2.40s/it][A
Training...:  77% 10722/13907 [6:49:52<2:05:28,  2.36s/it][A
Training...:  77% 10723/13907 [6:49:55<2:03:33,  2.33s/it][A
Training...:  77% 10724/13907 [6:49:57<2:01:29,  2.29s/it][A
Training...:  77% 10725/13907 [6:49:59<1:59:35,  2.25s/it][A
Training...:  77% 10726/13907 [6:50:01<1:57:55,  2.22s/it][A
Training...:  77% 10727/13907 [6:50:03<1:56:08,  2.19s/it][A
Training...:  77% 10728/13907 [6:50:05<1:54:38,  2.16s/it][A
Training...:  77% 10729/13907 [6:50:08<1:52:44,  2.13s/it][A
Training...:  77% 10730/13907 [6:50:10<1:51:12,  2.10s/it][A
Training...:  77% 10731/13907 [6:50:12<1:49:40,  2.07s/it][A
Training...:  77% 10732/13907 [6:50:14<1:48:06,  2.04s/it][A
Training...:  77% 10733/13907 [6:50:16<1:46:45,  2.02s/it][A
Training...:  77% 10734/13907 [6:50:17<1:44:48,  1.98s/it][A
Training...:  77% 10735/13907 [6:50:19<1:43:07,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:20:32<17:31:07, 31533.87s/it]
Training...:  77% 10735/13907 [6:50:21<1:43:07,  1.95s/it][A
Training...:  77% 10736/13907 [6:50:21<1:46:08,  2.01s/it][A
Training...:  77% 10737/13907 [6:50:23<1:44:21,  1.98s/it][A
Training...:  77% 10738/13907 [6:50:25<1:41:34,  1.92s/it][A
Training...:  77% 10739/13907 [6:50:27<1:38:34,  1.87s/it][A
Training...:  77% 10740/13907 [6:50:29<1:36:16,  1.82s/it][A
Training...:  77% 10741/13907 [6:50:30<1:34:17,  1.79s/it][A
Training...:  77% 10742/13907 [6:50:32<1:32:20,  1.75s/it][A
Training...:  77% 10743/13907 [6:50:34<1:30:02,  1.71s/it][A
Training...:  77% 10744/13907 [6:50:35<1:27:58,  1.67s/it][A
Training...:  77% 10745/13907 [6:50:37<1:26:02,  1.63s/it][A
Training...:  77% 10746/13907 [6:50:38<1:23:48,  1.59s/it][A
Training...:  77% 10747/13907 [6:50:40<1:21:19,  1.54s/it][A
Training...:  77% 10748/13907 [6:50:41<1:17:55,  1.48s/it][A
Training...:  77% 10749/13907 [6:50:42<1:14:08,  1.41s/it][A
Training...:  77% 10750/13907 [6:50:43<1:08:43,  1.31s/it][A
Training...:  77% 10751/13907 [6:50:47<1:47:50,  2.05s/it][A
Training...:  77% 10752/13907 [6:50:51<2:11:36,  2.50s/it][A
Training...:  77% 10753/13907 [6:50:54<2:23:34,  2.73s/it][A
Training...:  77% 10754/13907 [6:50:57<2:29:51,  2.85s/it][A
Training...:  77% 10755/13907 [6:51:00<2:32:27,  2.90s/it][A
Training...:  77% 10756/13907 [6:51:03<2:32:51,  2.91s/it][A
Training...:  77% 10757/13907 [6:51:06<2:31:54,  2.89s/it][A
Training...:  77% 10758/13907 [6:51:09<2:30:26,  2.87s/it][A
Training...:  77% 10759/13907 [6:51:11<2:28:56,  2.84s/it][A
Training...:  77% 10760/13907 [6:51:14<2:26:28,  2.79s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:21:28<17:31:07, 31533.87s/it]
Training...:  77% 10760/13907 [6:51:17<2:26:28,  2.79s/it][A
Training...:  77% 10761/13907 [6:51:17<2:30:42,  2.87s/it][A
Training...:  77% 10762/13907 [6:51:20<2:28:19,  2.83s/it][A
Training...:  77% 10763/13907 [6:51:22<2:24:30,  2.76s/it][A
Training...:  77% 10764/13907 [6:51:25<2:21:48,  2.71s/it][A
Training...:  77% 10765/13907 [6:51:28<2:19:00,  2.65s/it][A
Training...:  77% 10766/13907 [6:51:30<2:16:41,  2.61s/it][A
Training...:  77% 10767/13907 [6:51:33<2:14:00,  2.56s/it][A
Training...:  77% 10768/13907 [6:51:35<2:11:39,  2.52s/it][A
Training...:  77% 10769/13907 [6:51:37<2:09:45,  2.48s/it][A
Training...:  77% 10770/13907 [6:51:40<2:07:40,  2.44s/it][A
Training...:  77% 10771/13907 [6:51:42<2:06:56,  2.43s/it][A
Training...:  77% 10772/13907 [6:51:44<2:06:44,  2.43s/it][A
Training...:  77% 10773/13907 [6:51:47<2:05:39,  2.41s/it][A
Training...:  77% 10774/13907 [6:51:49<2:03:08,  2.36s/it][A
Training...:  77% 10775/13907 [6:51:51<2:01:04,  2.32s/it][A
Training...:  77% 10776/13907 [6:51:54<1:59:09,  2.28s/it][A
Training...:  77% 10777/13907 [6:51:56<1:57:28,  2.25s/it][A
Training...:  78% 10778/13907 [6:51:58<1:55:37,  2.22s/it][A
Training...:  78% 10779/13907 [6:52:00<1:53:55,  2.19s/it][A
Training...:  78% 10780/13907 [6:52:02<1:52:22,  2.16s/it][A
Training...:  78% 10781/13907 [6:52:04<1:50:43,  2.13s/it][A
Training...:  78% 10782/13907 [6:52:06<1:49:36,  2.10s/it][A
Training...:  78% 10783/13907 [6:52:08<1:48:16,  2.08s/it][A
Training...:  78% 10784/13907 [6:52:10<1:46:51,  2.05s/it][A
Training...:  78% 10785/13907 [6:52:12<1:45:25,  2.03s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:22:25<17:31:07, 31533.87s/it]
Training...:  78% 10785/13907 [6:52:14<1:45:25,  2.03s/it][A
Training...:  78% 10786/13907 [6:52:14<1:48:35,  2.09s/it][A
Training...:  78% 10787/13907 [6:52:16<1:45:40,  2.03s/it][A
Training...:  78% 10788/13907 [6:52:18<1:41:46,  1.96s/it][A
Training...:  78% 10789/13907 [6:52:20<1:38:53,  1.90s/it][A
Training...:  78% 10790/13907 [6:52:22<1:36:01,  1.85s/it][A
Training...:  78% 10791/13907 [6:52:23<1:33:22,  1.80s/it][A
Training...:  78% 10792/13907 [6:52:25<1:30:42,  1.75s/it][A
Training...:  78% 10793/13907 [6:52:26<1:28:39,  1.71s/it][A
Training...:  78% 10794/13907 [6:52:28<1:26:38,  1.67s/it][A
Training...:  78% 10795/13907 [6:52:30<1:24:14,  1.62s/it][A
Training...:  78% 10796/13907 [6:52:31<1:21:29,  1.57s/it][A
Training...:  78% 10797/13907 [6:52:32<1:18:41,  1.52s/it][A
Training...:  78% 10798/13907 [6:52:34<1:15:43,  1.46s/it][A
Training...:  78% 10799/13907 [6:52:35<1:12:16,  1.40s/it][A
Training...:  78% 10800/13907 [6:52:36<1:07:15,  1.30s/it][A
Training...:  78% 10801/13907 [6:52:40<1:45:50,  2.04s/it][A
Training...:  78% 10802/13907 [6:52:43<2:08:24,  2.48s/it][A
Training...:  78% 10803/13907 [6:52:47<2:20:51,  2.72s/it][A
Training...:  78% 10804/13907 [6:52:50<2:26:58,  2.84s/it][A
Training...:  78% 10805/13907 [6:52:53<2:29:41,  2.90s/it][A
Training...:  78% 10806/13907 [6:52:56<2:30:52,  2.92s/it][A
Training...:  78% 10807/13907 [6:52:59<2:31:55,  2.94s/it][A
Training...:  78% 10808/13907 [6:53:02<2:31:38,  2.94s/it][A
Training...:  78% 10809/13907 [6:53:04<2:28:42,  2.88s/it][A
Training...:  78% 10810/13907 [6:53:07<2:25:54,  2.83s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:23:21<17:31:07, 31533.87s/it]
Training...:  78% 10810/13907 [6:53:10<2:25:54,  2.83s/it][A
Training...:  78% 10811/13907 [6:53:10<2:29:44,  2.90s/it][A
Training...:  78% 10812/13907 [6:53:13<2:26:15,  2.84s/it][A
Training...:  78% 10813/13907 [6:53:15<2:21:56,  2.75s/it][A
Training...:  78% 10814/13907 [6:53:18<2:18:42,  2.69s/it][A
Training...:  78% 10815/13907 [6:53:20<2:15:36,  2.63s/it][A
Training...:  78% 10816/13907 [6:53:23<2:12:41,  2.58s/it][A
Training...:  78% 10817/13907 [6:53:25<2:10:32,  2.53s/it][A
Training...:  78% 10818/13907 [6:53:28<2:08:36,  2.50s/it][A
Training...:  78% 10819/13907 [6:53:30<2:06:56,  2.47s/it][A
Training...:  78% 10820/13907 [6:53:32<2:04:47,  2.43s/it][A
Training...:  78% 10821/13907 [6:53:35<2:03:14,  2.40s/it][A
Training...:  78% 10822/13907 [6:53:37<2:01:35,  2.36s/it][A
Training...:  78% 10823/13907 [6:53:39<1:59:44,  2.33s/it][A
Training...:  78% 10824/13907 [6:53:42<1:57:49,  2.29s/it][A
Training...:  78% 10825/13907 [6:53:44<1:56:11,  2.26s/it][A
Training...:  78% 10826/13907 [6:53:46<1:54:40,  2.23s/it][A
Training...:  78% 10827/13907 [6:53:48<1:53:19,  2.21s/it][A
Training...:  78% 10828/13907 [6:53:50<1:51:40,  2.18s/it][A
Training...:  78% 10829/13907 [6:53:52<1:49:50,  2.14s/it][A
Training...:  78% 10830/13907 [6:53:54<1:47:59,  2.11s/it][A
Training...:  78% 10831/13907 [6:53:56<1:46:35,  2.08s/it][A
Training...:  78% 10832/13907 [6:53:58<1:44:49,  2.05s/it][A
Training...:  78% 10833/13907 [6:54:00<1:43:21,  2.02s/it][A
Training...:  78% 10834/13907 [6:54:02<1:41:47,  1.99s/it][A
Training...:  78% 10835/13907 [6:54:04<1:40:09,  1.96s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:24:17<17:31:07, 31533.87s/it]
Training...:  78% 10835/13907 [6:54:06<1:40:09,  1.96s/it][A
Training...:  78% 10836/13907 [6:54:06<1:43:35,  2.02s/it][A
Training...:  78% 10837/13907 [6:54:08<1:41:20,  1.98s/it][A
Training...:  78% 10838/13907 [6:54:10<1:38:11,  1.92s/it][A
Training...:  78% 10839/13907 [6:54:12<1:35:17,  1.86s/it][A
Training...:  78% 10840/13907 [6:54:13<1:33:28,  1.83s/it][A
Training...:  78% 10841/13907 [6:54:15<1:31:18,  1.79s/it][A
Training...:  78% 10842/13907 [6:54:17<1:28:57,  1.74s/it][A
Training...:  78% 10843/13907 [6:54:18<1:26:34,  1.70s/it][A
Training...:  78% 10844/13907 [6:54:20<1:24:37,  1.66s/it][A
Training...:  78% 10845/13907 [6:54:21<1:22:29,  1.62s/it][A
Training...:  78% 10846/13907 [6:54:23<1:20:06,  1.57s/it][A
Training...:  78% 10847/13907 [6:54:24<1:17:18,  1.52s/it][A
Training...:  78% 10848/13907 [6:54:25<1:14:19,  1.46s/it][A
Training...:  78% 10849/13907 [6:54:27<1:10:59,  1.39s/it][A
Training...:  78% 10850/13907 [6:54:28<1:06:00,  1.30s/it][A
Training...:  78% 10851/13907 [6:54:32<1:43:34,  2.03s/it][A
Training...:  78% 10852/13907 [6:54:35<2:05:39,  2.47s/it][A
Training...:  78% 10853/13907 [6:54:38<2:18:25,  2.72s/it][A
Training...:  78% 10854/13907 [6:54:41<2:24:50,  2.85s/it][A
Training...:  78% 10855/13907 [6:54:45<2:28:33,  2.92s/it][A
Training...:  78% 10856/13907 [6:54:48<2:29:41,  2.94s/it][A
Training...:  78% 10857/13907 [6:54:51<2:29:32,  2.94s/it][A
Training...:  78% 10858/13907 [6:54:53<2:28:29,  2.92s/it][A
Training...:  78% 10859/13907 [6:54:56<2:26:28,  2.88s/it][A
Training...:  78% 10860/13907 [6:54:59<2:23:42,  2.83s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:25:13<17:31:07, 31533.87s/it]
Training...:  78% 10860/13907 [6:55:02<2:23:42,  2.83s/it][A
Training...:  78% 10861/13907 [6:55:02<2:27:55,  2.91s/it][A
Training...:  78% 10862/13907 [6:55:05<2:25:02,  2.86s/it][A
Training...:  78% 10863/13907 [6:55:07<2:21:06,  2.78s/it][A
Training...:  78% 10864/13907 [6:55:10<2:17:24,  2.71s/it][A
Training...:  78% 10865/13907 [6:55:12<2:14:17,  2.65s/it][A
Training...:  78% 10866/13907 [6:55:15<2:12:29,  2.61s/it][A
Training...:  78% 10867/13907 [6:55:17<2:10:02,  2.57s/it][A
Training...:  78% 10868/13907 [6:55:20<2:07:48,  2.52s/it][A
Training...:  78% 10869/13907 [6:55:22<2:05:30,  2.48s/it][A
Training...:  78% 10870/13907 [6:55:25<2:03:35,  2.44s/it][A
Training...:  78% 10871/13907 [6:55:27<2:01:52,  2.41s/it][A
Training...:  78% 10872/13907 [6:55:29<2:00:33,  2.38s/it][A
Training...:  78% 10873/13907 [6:55:31<1:58:59,  2.35s/it][A
Training...:  78% 10874/13907 [6:55:34<1:57:12,  2.32s/it][A
Training...:  78% 10875/13907 [6:55:36<1:55:26,  2.28s/it][A
Training...:  78% 10876/13907 [6:55:38<1:54:53,  2.27s/it][A
Training...:  78% 10877/13907 [6:55:40<1:53:14,  2.24s/it][A
Training...:  78% 10878/13907 [6:55:42<1:51:16,  2.20s/it][A
Training...:  78% 10879/13907 [6:55:44<1:49:03,  2.16s/it][A
Training...:  78% 10880/13907 [6:55:47<1:47:13,  2.13s/it][A
Training...:  78% 10881/13907 [6:55:49<1:45:36,  2.09s/it][A
Training...:  78% 10882/13907 [6:55:51<1:44:05,  2.06s/it][A
Training...:  78% 10883/13907 [6:55:52<1:42:28,  2.03s/it][A
Training...:  78% 10884/13907 [6:55:54<1:40:50,  2.00s/it][A
Training...:  78% 10885/13907 [6:55:56<1:39:35,  1.98s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:26:10<17:31:07, 31533.87s/it]
Training...:  78% 10885/13907 [6:55:59<1:39:35,  1.98s/it][A
Training...:  78% 10886/13907 [6:55:59<1:42:46,  2.04s/it][A
Training...:  78% 10887/13907 [6:56:00<1:40:28,  2.00s/it][A
Training...:  78% 10888/13907 [6:56:02<1:37:07,  1.93s/it][A
Training...:  78% 10889/13907 [6:56:04<1:34:29,  1.88s/it][A
Training...:  78% 10890/13907 [6:56:06<1:32:11,  1.83s/it][A
Training...:  78% 10891/13907 [6:56:07<1:30:15,  1.80s/it][A
Training...:  78% 10892/13907 [6:56:09<1:28:09,  1.75s/it][A
Training...:  78% 10893/13907 [6:56:11<1:25:49,  1.71s/it][A
Training...:  78% 10894/13907 [6:56:12<1:24:03,  1.67s/it][A
Training...:  78% 10895/13907 [6:56:14<1:21:48,  1.63s/it][A
Training...:  78% 10896/13907 [6:56:15<1:19:19,  1.58s/it][A
Training...:  78% 10897/13907 [6:56:17<1:16:30,  1.53s/it][A
Training...:  78% 10898/13907 [6:56:18<1:13:33,  1.47s/it][A
Training...:  78% 10899/13907 [6:56:19<1:10:22,  1.40s/it][A
Training...:  78% 10900/13907 [6:56:20<1:05:07,  1.30s/it][A
Training...:  78% 10901/13907 [6:56:24<1:40:50,  2.01s/it][A
Training...:  78% 10902/13907 [6:56:27<2:02:15,  2.44s/it][A
Training...:  78% 10903/13907 [6:56:31<2:13:18,  2.66s/it][A
Training...:  78% 10904/13907 [6:56:34<2:19:42,  2.79s/it][A
Training...:  78% 10905/13907 [6:56:37<2:23:06,  2.86s/it][A
Training...:  78% 10906/13907 [6:56:40<2:23:49,  2.88s/it][A
Training...:  78% 10907/13907 [6:56:42<2:23:23,  2.87s/it][A
Training...:  78% 10908/13907 [6:56:45<2:22:10,  2.84s/it][A
Training...:  78% 10909/13907 [6:56:48<2:20:10,  2.81s/it][A
Training...:  78% 10910/13907 [6:56:51<2:18:01,  2.76s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:27:05<17:31:07, 31533.87s/it]
Training...:  78% 10910/13907 [6:56:54<2:18:01,  2.76s/it][A
Training...:  78% 10911/13907 [6:56:54<2:22:20,  2.85s/it][AStep... (36975 | Loss: 0.24257749319076538, Learning Rate: 7.894546433817595e-05, Gradient Norm: 0.7576267719268799)
Step... (37000 | Loss: 0.1275884509086609, Learning Rate: 7.87939497968182e-05, Gradient Norm: 0.5447152256965637)
Step... (37025 | Loss: 0.16771408915519714, Learning Rate: 7.864242797950283e-05, Gradient Norm: 0.6012150049209595)
Step... (37050 | Loss: 0.16911062598228455, Learning Rate: 7.849091343814507e-05, Gradient Norm: 0.9134202599525452)
Step... (37075 | Loss: 0.21618610620498657, Learning Rate: 7.833940617274493e-05, Gradient Norm: 0.9013217091560364)
Step... (37100 | Loss: 0.21367159485816956, Learning Rate: 7.818787707947195e-05, Gradient Norm: 0.9906803369522095)
Step... (37125 | Loss: 0.18225233256816864, Learning Rate: 7.80363698140718e-05, Gradient Norm: 0.6330937147140503)
Step... (37150 | Loss: 0.2157381922006607, Learning Rate: 7.788484799675643e-05, Gradient Norm: 0.8234813213348389)
Step... (37175 | Loss: 0.19000062346458435, Learning Rate: 7.773333345539868e-05, Gradient Norm: 0.6168161630630493)
Step... (37200 | Loss: 0.19771119952201843, Learning Rate: 7.758182618999854e-05, Gradient Norm: 0.8438549041748047)
Step... (37225 | Loss: 0.2384544312953949, Learning Rate: 7.743029709672555e-05, Gradient Norm: 0.8052009344100952)
Step... (37250 | Loss: 0.18365350365638733, Learning Rate: 7.727878983132541e-05, Gradient Norm: 0.7326679229736328)
Step... (37275 | Loss: 0.20526285469532013, Learning Rate: 7.712728256592527e-05, Gradient Norm: 0.9189081192016602)
Step... (37300 | Loss: 0.16919860243797302, Learning Rate: 7.697575347265229e-05, Gradient Norm: 1.0332636833190918)
Step... (37325 | Loss: 0.23678092658519745, Learning Rate: 7.682424620725214e-05, Gradient Norm: 0.9402586221694946)
Step... (37350 | Loss: 0.23712655901908875, Learning Rate: 7.6672738941852e-05, Gradient Norm: 0.9790732264518738)
Step... (37375 | Loss: 0.20844417810440063, Learning Rate: 7.652120984857902e-05, Gradient Norm: 0.864935040473938)
Step... (37400 | Loss: 0.15995469689369202, Learning Rate: 7.636970258317888e-05, Gradient Norm: 0.9423387050628662)
Step... (37425 | Loss: 0.17293396592140198, Learning Rate: 7.621818804182112e-05, Gradient Norm: 0.5750038623809814)
Step... (37450 | Loss: 0.18981042504310608, Learning Rate: 7.606666622450575e-05, Gradient Norm: 0.8031120300292969)
Step... (37475 | Loss: 0.16238409280776978, Learning Rate: 7.591515895910561e-05, Gradient Norm: 0.6568185091018677)
Step... (37500 | Loss: 0.19299787282943726, Learning Rate: 7.576364441774786e-05, Gradient Norm: 1.1346232891082764)
Step... (37525 | Loss: 0.16860541701316833, Learning Rate: 7.561212260043249e-05, Gradient Norm: 0.6735324263572693)
Step... (37550 | Loss: 0.1540861874818802, Learning Rate: 7.546060805907473e-05, Gradient Norm: 0.8826971054077148)
Step... (37575 | Loss: 0.21457965672016144, Learning Rate: 7.530910079367459e-05, Gradient Norm: 0.8457221388816833)
Step... (37600 | Loss: 0.17456494271755219, Learning Rate: 7.51575717004016e-05, Gradient Norm: 0.8769010305404663)
Step... (37625 | Loss: 0.2031644880771637, Learning Rate: 7.500606443500146e-05, Gradient Norm: 0.8266968727111816)
Step... (37650 | Loss: 0.14041735231876373, Learning Rate: 7.485455716960132e-05, Gradient Norm: 0.7966377139091492)
Step... (37675 | Loss: 0.16473634541034698, Learning Rate: 7.470302807632834e-05, Gradient Norm: 0.5809789896011353)
Step... (37700 | Loss: 0.10549667477607727, Learning Rate: 7.45515208109282e-05, Gradient Norm: 0.6125941872596741)
Step... (37725 | Loss: 0.23854602873325348, Learning Rate: 7.440001354552805e-05, Gradient Norm: 0.6829458475112915)
Step... (37750 | Loss: 0.14134418964385986, Learning Rate: 7.424848445225507e-05, Gradient Norm: 0.5967093706130981)
Step... (37775 | Loss: 0.1645796298980713, Learning Rate: 7.409697718685493e-05, Gradient Norm: 0.7012423276901245)
Step... (37800 | Loss: 0.1406458020210266, Learning Rate: 7.394546264549717e-05, Gradient Norm: 0.7681497931480408)
Step... (37825 | Loss: 0.24211108684539795, Learning Rate: 7.37939408281818e-05, Gradient Norm: 0.7360398769378662)
Step... (37850 | Loss: 0.16516423225402832, Learning Rate: 7.364243356278166e-05, Gradient Norm: 0.8988499641418457)
Step... (37875 | Loss: 0.20833124220371246, Learning Rate: 7.34909190214239e-05, Gradient Norm: 0.6881002187728882)
Step... (37900 | Loss: 0.14907240867614746, Learning Rate: 7.333939720410854e-05, Gradient Norm: 0.7917126417160034)
Step... (37925 | Loss: 0.2424938827753067, Learning Rate: 7.318788266275078e-05, Gradient Norm: 0.8256874084472656)
Step... (37950 | Loss: 0.24127072095870972, Learning Rate: 7.303637539735064e-05, Gradient Norm: 1.1005892753601074)
Step... (37975 | Loss: 0.17377541959285736, Learning Rate: 7.288484630407766e-05, Gradient Norm: 0.6601700186729431)
Step... (38000 | Loss: 0.2231651097536087, Learning Rate: 7.273333903867751e-05, Gradient Norm: 0.9831716418266296)
Step... (38025 | Loss: 0.20178134739398956, Learning Rate: 7.258183177327737e-05, Gradient Norm: 0.7646386623382568)
Step... (38050 | Loss: 0.20432835817337036, Learning Rate: 7.243030268000439e-05, Gradient Norm: 0.8960506916046143)
Step... (38075 | Loss: 0.18800665438175201, Learning Rate: 7.227879541460425e-05, Gradient Norm: 0.8259382247924805)
Step... (38100 | Loss: 0.1723058521747589, Learning Rate: 7.21272881492041e-05, Gradient Norm: 0.9212114214897156)
Step... (38125 | Loss: 0.19978439807891846, Learning Rate: 7.197575905593112e-05, Gradient Norm: 1.153029441833496)
Step... (38150 | Loss: 0.1553524285554886, Learning Rate: 7.182425179053098e-05, Gradient Norm: 0.7162022590637207)
Step... (38175 | Loss: 0.19369792938232422, Learning Rate: 7.1672722697258e-05, Gradient Norm: 0.7469490766525269)
Step... (38200 | Loss: 0.11357565224170685, Learning Rate: 7.152121543185785e-05, Gradient Norm: 0.5271503925323486)
Step... (38225 | Loss: 0.17752626538276672, Learning Rate: 7.136970816645771e-05, Gradient Norm: 0.7137933373451233)
Step... (38250 | Loss: 0.15557748079299927, Learning Rate: 7.121817907318473e-05, Gradient Norm: 0.8879082202911377)
Step... (38275 | Loss: 0.20558485388755798, Learning Rate: 7.106667180778459e-05, Gradient Norm: 0.8817687630653381)
Step... (38300 | Loss: 0.14658351242542267, Learning Rate: 7.091515726642683e-05, Gradient Norm: 0.7651256322860718)
Step... (38325 | Loss: 0.18946978449821472, Learning Rate: 7.076363544911146e-05, Gradient Norm: 0.6245664358139038)
Step... (38350 | Loss: 0.14121443033218384, Learning Rate: 7.06121209077537e-05, Gradient Norm: 1.0258959531784058)
Step... (38375 | Loss: 0.2584143877029419, Learning Rate: 7.046061364235356e-05, Gradient Norm: 1.0300636291503906)
Step... (38400 | Loss: 0.18354779481887817, Learning Rate: 7.030908454908058e-05, Gradient Norm: 1.0644491910934448)
Step... (38425 | Loss: 0.16467073559761047, Learning Rate: 7.015757728368044e-05, Gradient Norm: 0.573844850063324)
Step... (38450 | Loss: 0.1962556540966034, Learning Rate: 7.00060700182803e-05, Gradient Norm: 0.8778875470161438)
Step... (38475 | Loss: 0.20646893978118896, Learning Rate: 6.985454092500731e-05, Gradient Norm: 0.7763000130653381)
Step... (38500 | Loss: 0.1793307363986969, Learning Rate: 6.970303365960717e-05, Gradient Norm: 1.0046502351760864)
Step... (38525 | Loss: 0.1760474592447281, Learning Rate: 6.955152639420703e-05, Gradient Norm: 0.6650093793869019)
Step... (38550 | Loss: 0.1794414222240448, Learning Rate: 6.939999730093405e-05, Gradient Norm: 1.4919772148132324)
Step... (38575 | Loss: 0.21009387075901031, Learning Rate: 6.92484900355339e-05, Gradient Norm: 0.7012933492660522)
Step... (38600 | Loss: 0.15850147604942322, Learning Rate: 6.909698277013376e-05, Gradient Norm: 0.8758950233459473)
Step... (38625 | Loss: 0.15924185514450073, Learning Rate: 6.894545367686078e-05, Gradient Norm: 0.6950905323028564)
Step... (38650 | Loss: 0.17034444212913513, Learning Rate: 6.879394641146064e-05, Gradient Norm: 0.6076668500900269)
Step... (38675 | Loss: 0.21270635724067688, Learning Rate: 6.864243187010288e-05, Gradient Norm: 0.8673900365829468)
Step... (38700 | Loss: 0.1294887810945511, Learning Rate: 6.849091005278751e-05, Gradient Norm: 0.6775028705596924)

Training...:  78% 10912/13907 [6:56:56<2:20:49,  2.82s/it][A
Training...:  78% 10913/13907 [6:56:59<2:16:46,  2.74s/it][A
Training...:  78% 10914/13907 [6:57:02<2:13:29,  2.68s/it][A
Training...:  78% 10915/13907 [6:57:04<2:11:06,  2.63s/it][A
Training...:  78% 10916/13907 [6:57:07<2:09:04,  2.59s/it][A
Training...:  79% 10917/13907 [6:57:09<2:07:14,  2.55s/it][A
Training...:  79% 10918/13907 [6:57:12<2:07:23,  2.56s/it][A
Training...:  79% 10919/13907 [6:57:14<2:04:54,  2.51s/it][A
Training...:  79% 10920/13907 [6:57:16<2:02:21,  2.46s/it][A
Training...:  79% 10921/13907 [6:57:19<2:00:34,  2.42s/it][A
Training...:  79% 10922/13907 [6:57:21<1:57:56,  2.37s/it][A
Training...:  79% 10923/13907 [6:57:23<1:56:21,  2.34s/it][A
Training...:  79% 10924/13907 [6:57:25<1:54:23,  2.30s/it][A
Training...:  79% 10925/13907 [6:57:28<1:53:15,  2.28s/it][A
Training...:  79% 10926/13907 [6:57:30<1:51:30,  2.24s/it][A
Training...:  79% 10927/13907 [6:57:32<1:49:33,  2.21s/it][A
Training...:  79% 10928/13907 [6:57:34<1:47:53,  2.17s/it][A
Training...:  79% 10929/13907 [6:57:36<1:46:22,  2.14s/it][A
Training...:  79% 10930/13907 [6:57:38<1:44:49,  2.11s/it][A
Training...:  79% 10931/13907 [6:57:40<1:43:02,  2.08s/it][A
Training...:  79% 10932/13907 [6:57:42<1:41:03,  2.04s/it][A
Training...:  79% 10933/13907 [6:57:44<1:39:30,  2.01s/it][A
Training...:  79% 10934/13907 [6:57:46<1:37:48,  1.97s/it][A
Training...:  79% 10935/13907 [6:57:48<1:36:46,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:28:01<17:31:07, 31533.87s/it]
Training...:  79% 10935/13907 [6:57:50<1:36:46,  1.95s/it][A
Training...:  79% 10936/13907 [6:57:50<1:39:56,  2.02s/it][A
Training...:  79% 10937/13907 [6:57:52<1:37:48,  1.98s/it][A
Training...:  79% 10938/13907 [6:57:54<1:35:10,  1.92s/it][A
Training...:  79% 10939/13907 [6:57:55<1:33:03,  1.88s/it][A
Training...:  79% 10940/13907 [6:57:57<1:31:00,  1.84s/it][A
Training...:  79% 10941/13907 [6:57:59<1:29:31,  1.81s/it][A
Training...:  79% 10942/13907 [6:58:01<1:27:04,  1.76s/it][A
Training...:  79% 10943/13907 [6:58:02<1:24:49,  1.72s/it][A
Training...:  79% 10944/13907 [6:58:04<1:22:50,  1.68s/it][A
Training...:  79% 10945/13907 [6:58:05<1:20:43,  1.64s/it][A
Training...:  79% 10946/13907 [6:58:07<1:18:14,  1.59s/it][A
Training...:  79% 10947/13907 [6:58:08<1:15:24,  1.53s/it][A
Training...:  79% 10948/13907 [6:58:09<1:12:16,  1.47s/it][A
Training...:  79% 10949/13907 [6:58:11<1:08:50,  1.40s/it][A
Training...:  79% 10950/13907 [6:58:12<1:04:18,  1.31s/it][A
Training...:  79% 10951/13907 [6:58:16<1:40:22,  2.04s/it][A
Training...:  79% 10952/13907 [6:58:19<2:02:24,  2.49s/it][A
Training...:  79% 10953/13907 [6:58:22<2:14:53,  2.74s/it][A
Training...:  79% 10954/13907 [6:58:26<2:20:43,  2.86s/it][A
Training...:  79% 10955/13907 [6:58:29<2:23:43,  2.92s/it][A
Training...:  79% 10956/13907 [6:58:32<2:24:55,  2.95s/it][A
Training...:  79% 10957/13907 [6:58:35<2:25:26,  2.96s/it][A
Training...:  79% 10958/13907 [6:58:37<2:24:43,  2.94s/it][A
Training...:  79% 10959/13907 [6:58:40<2:22:59,  2.91s/it][A
Training...:  79% 10960/13907 [6:58:43<2:20:31,  2.86s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:28:57<17:31:07, 31533.87s/it]
Training...:  79% 10960/13907 [6:58:46<2:20:31,  2.86s/it][A
Training...:  79% 10961/13907 [6:58:46<2:23:45,  2.93s/it][A
Training...:  79% 10962/13907 [6:58:49<2:21:06,  2.87s/it][A
Training...:  79% 10963/13907 [6:58:52<2:17:01,  2.79s/it][A
Training...:  79% 10964/13907 [6:58:54<2:14:07,  2.73s/it][A
Training...:  79% 10965/13907 [6:58:57<2:11:53,  2.69s/it][A
Training...:  79% 10966/13907 [6:58:59<2:08:11,  2.62s/it][A
Training...:  79% 10967/13907 [6:59:02<2:05:10,  2.55s/it][A
Training...:  79% 10968/13907 [6:59:04<2:02:47,  2.51s/it][A
Training...:  79% 10969/13907 [6:59:06<2:00:55,  2.47s/it][A
Training...:  79% 10970/13907 [6:59:09<1:59:04,  2.43s/it][A
Training...:  79% 10971/13907 [6:59:11<1:57:07,  2.39s/it][A
Training...:  79% 10972/13907 [6:59:13<1:55:05,  2.35s/it][A
Training...:  79% 10973/13907 [6:59:15<1:53:33,  2.32s/it][A
Training...:  79% 10974/13907 [6:59:18<1:51:37,  2.28s/it][A
Training...:  79% 10975/13907 [6:59:20<1:50:05,  2.25s/it][A
Training...:  79% 10976/13907 [6:59:22<1:48:26,  2.22s/it][A
Training...:  79% 10977/13907 [6:59:24<1:47:01,  2.19s/it][A
Training...:  79% 10978/13907 [6:59:26<1:45:39,  2.16s/it][A
Training...:  79% 10979/13907 [6:59:28<1:44:35,  2.14s/it][A
Training...:  79% 10980/13907 [6:59:30<1:43:41,  2.13s/it][A
Training...:  79% 10981/13907 [6:59:32<1:42:38,  2.10s/it][A
Training...:  79% 10982/13907 [6:59:34<1:40:53,  2.07s/it][A
Training...:  79% 10983/13907 [6:59:36<1:38:59,  2.03s/it][A
Training...:  79% 10984/13907 [6:59:38<1:36:59,  1.99s/it][A
Training...:  79% 10985/13907 [6:59:40<1:35:13,  1.96s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:29:53<17:31:07, 31533.87s/it]
Training...:  79% 10985/13907 [6:59:42<1:35:13,  1.96s/it][A
Training...:  79% 10986/13907 [6:59:42<1:38:07,  2.02s/it][A
Training...:  79% 10987/13907 [6:59:44<1:35:58,  1.97s/it][A
Training...:  79% 10988/13907 [6:59:46<1:33:14,  1.92s/it][A
Training...:  79% 10989/13907 [6:59:48<1:30:44,  1.87s/it][A
Training...:  79% 10990/13907 [6:59:49<1:28:57,  1.83s/it][A
Training...:  79% 10991/13907 [6:59:51<1:26:35,  1.78s/it][A
Training...:  79% 10992/13907 [6:59:53<1:24:10,  1.73s/it][A
Training...:  79% 10993/13907 [6:59:54<1:22:18,  1.69s/it][A
Training...:  79% 10994/13907 [6:59:56<1:20:37,  1.66s/it][A
Training...:  79% 10995/13907 [6:59:57<1:18:25,  1.62s/it][A
Training...:  79% 10996/13907 [6:59:59<1:16:19,  1.57s/it][A
Training...:  79% 10997/13907 [7:00:00<1:13:50,  1.52s/it][A
Training...:  79% 10998/13907 [7:00:02<1:10:56,  1.46s/it][A
Training...:  79% 10999/13907 [7:00:03<1:07:38,  1.40s/it][A
Training...:  79% 11000/13907 [7:00:04<1:02:41,  1.29s/it][A
Training...:  79% 11001/13907 [7:00:08<1:38:18,  2.03s/it][A
Training...:  79% 11002/13907 [7:00:11<1:59:13,  2.46s/it][A
Training...:  79% 11003/13907 [7:00:14<2:11:37,  2.72s/it][A
Training...:  79% 11004/13907 [7:00:18<2:17:56,  2.85s/it][A
Training...:  79% 11005/13907 [7:00:21<2:20:22,  2.90s/it][A
Training...:  79% 11006/13907 [7:00:24<2:21:31,  2.93s/it][A
Training...:  79% 11007/13907 [7:00:27<2:21:19,  2.92s/it][A
Training...:  79% 11008/13907 [7:00:29<2:19:17,  2.88s/it][A
Training...:  79% 11009/13907 [7:00:32<2:18:06,  2.86s/it][A
Training...:  79% 11010/13907 [7:00:35<2:16:32,  2.83s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:30:49<17:31:07, 31533.87s/it]
Training...:  79% 11010/13907 [7:00:38<2:16:32,  2.83s/it][A
Training...:  79% 11011/13907 [7:00:38<2:21:05,  2.92s/it][A
Training...:  79% 11012/13907 [7:00:41<2:18:35,  2.87s/it][A
Training...:  79% 11013/13907 [7:00:43<2:14:53,  2.80s/it][A
Training...:  79% 11014/13907 [7:00:46<2:12:37,  2.75s/it][A
Training...:  79% 11015/13907 [7:00:49<2:09:11,  2.68s/it][A
Training...:  79% 11016/13907 [7:00:51<2:06:59,  2.64s/it][A
Training...:  79% 11017/13907 [7:00:54<2:04:03,  2.58s/it][A
Training...:  79% 11018/13907 [7:00:56<2:01:35,  2.53s/it][A
Training...:  79% 11019/13907 [7:00:58<1:59:13,  2.48s/it][A
Training...:  79% 11020/13907 [7:01:01<1:57:13,  2.44s/it][A
Training...:  79% 11021/13907 [7:01:03<1:55:22,  2.40s/it][A
Training...:  79% 11022/13907 [7:01:05<1:53:28,  2.36s/it][A
Training...:  79% 11023/13907 [7:01:08<1:51:56,  2.33s/it][A
Training...:  79% 11024/13907 [7:01:10<1:50:02,  2.29s/it][A
Training...:  79% 11025/13907 [7:01:12<1:48:16,  2.25s/it][A
Training...:  79% 11026/13907 [7:01:14<1:46:39,  2.22s/it][A
Training...:  79% 11027/13907 [7:01:16<1:45:14,  2.19s/it][A
Training...:  79% 11028/13907 [7:01:18<1:43:48,  2.16s/it][A
Training...:  79% 11029/13907 [7:01:20<1:42:32,  2.14s/it][A
Training...:  79% 11030/13907 [7:01:22<1:41:07,  2.11s/it][A
Training...:  79% 11031/13907 [7:01:24<1:40:11,  2.09s/it][A
Training...:  79% 11032/13907 [7:01:26<1:38:34,  2.06s/it][A
Training...:  79% 11033/13907 [7:01:28<1:37:19,  2.03s/it][A
Training...:  79% 11034/13907 [7:01:30<1:35:53,  2.00s/it][A
Training...:  79% 11035/13907 [7:01:32<1:34:17,  1.97s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:31:45<17:31:07, 31533.87s/it]
Training...:  79% 11035/13907 [7:01:34<1:34:17,  1.97s/it][A
Training...:  79% 11036/13907 [7:01:34<1:37:38,  2.04s/it][A
Training...:  79% 11037/13907 [7:01:36<1:35:44,  2.00s/it][A
Training...:  79% 11038/13907 [7:01:38<1:32:42,  1.94s/it][A
Training...:  79% 11039/13907 [7:01:40<1:30:30,  1.89s/it][A
Training...:  79% 11040/13907 [7:01:42<1:27:50,  1.84s/it][A
Training...:  79% 11041/13907 [7:01:43<1:25:33,  1.79s/it][A
Training...:  79% 11042/13907 [7:01:45<1:23:55,  1.76s/it][A
Training...:  79% 11043/13907 [7:01:47<1:21:49,  1.71s/it][A
Training...:  79% 11044/13907 [7:01:48<1:19:56,  1.68s/it][A
Training...:  79% 11045/13907 [7:01:50<1:17:48,  1.63s/it][A
Training...:  79% 11046/13907 [7:01:51<1:15:07,  1.58s/it][A
Training...:  79% 11047/13907 [7:01:53<1:12:22,  1.52s/it][A
Training...:  79% 11048/13907 [7:01:54<1:09:15,  1.45s/it][A
Training...:  79% 11049/13907 [7:01:55<1:05:49,  1.38s/it][A
Training...:  79% 11050/13907 [7:01:56<1:01:10,  1.28s/it][A
Training...:  79% 11051/13907 [7:02:00<1:37:46,  2.05s/it][A
Training...:  79% 11052/13907 [7:02:03<1:58:52,  2.50s/it][A
Training...:  79% 11053/13907 [7:02:07<2:09:00,  2.71s/it][A
Training...:  79% 11054/13907 [7:02:10<2:15:02,  2.84s/it][A
Training...:  79% 11055/13907 [7:02:13<2:17:44,  2.90s/it][A
Training...:  79% 11056/13907 [7:02:16<2:18:06,  2.91s/it][A
Training...:  80% 11057/13907 [7:02:19<2:17:19,  2.89s/it][A
Training...:  80% 11058/13907 [7:02:21<2:15:39,  2.86s/it][A
Training...:  80% 11059/13907 [7:02:24<2:13:47,  2.82s/it][A
Training...:  80% 11060/13907 [7:02:27<2:11:44,  2.78s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:32:41<17:31:07, 31533.87s/it]
Training...:  80% 11060/13907 [7:02:30<2:11:44,  2.78s/it][A
Training...:  80% 11061/13907 [7:02:30<2:16:03,  2.87s/it][A
Training...:  80% 11062/13907 [7:02:33<2:13:40,  2.82s/it][A
Training...:  80% 11063/13907 [7:02:35<2:10:20,  2.75s/it][A
Training...:  80% 11064/13907 [7:02:38<2:07:39,  2.69s/it][A
Training...:  80% 11065/13907 [7:02:40<2:06:14,  2.67s/it][A
Training...:  80% 11066/13907 [7:02:43<2:04:17,  2.63s/it][A
Training...:  80% 11067/13907 [7:02:45<2:02:59,  2.60s/it][A
Training...:  80% 11068/13907 [7:02:48<2:00:25,  2.54s/it][A
Training...:  80% 11069/13907 [7:02:50<1:58:31,  2.51s/it][A
Training...:  80% 11070/13907 [7:02:53<1:56:54,  2.47s/it][A
Training...:  80% 11071/13907 [7:02:55<1:55:04,  2.43s/it][A
Training...:  80% 11072/13907 [7:02:57<1:53:04,  2.39s/it][A
Training...:  80% 11073/13907 [7:03:00<1:51:01,  2.35s/it][A
Training...:  80% 11074/13907 [7:03:02<1:48:54,  2.31s/it][A
Training...:  80% 11075/13907 [7:03:04<1:47:15,  2.27s/it][A
Training...:  80% 11076/13907 [7:03:06<1:45:10,  2.23s/it][A
Training...:  80% 11077/13907 [7:03:08<1:43:24,  2.19s/it][A
Training...:  80% 11078/13907 [7:03:10<1:42:00,  2.16s/it][A
Training...:  80% 11079/13907 [7:03:12<1:40:39,  2.14s/it][A
Training...:  80% 11080/13907 [7:03:14<1:38:48,  2.10s/it][A
Training...:  80% 11081/13907 [7:03:16<1:37:34,  2.07s/it][A
Training...:  80% 11082/13907 [7:03:18<1:36:00,  2.04s/it][A
Training...:  80% 11083/13907 [7:03:20<1:34:46,  2.01s/it][A
Training...:  80% 11084/13907 [7:03:22<1:33:21,  1.98s/it][A
Training...:  80% 11085/13907 [7:03:24<1:31:42,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:33:37<17:31:07, 31533.87s/it]
Training...:  80% 11085/13907 [7:03:26<1:31:42,  1.95s/it][A
Training...:  80% 11086/13907 [7:03:26<1:34:39,  2.01s/it][A
Training...:  80% 11087/13907 [7:03:28<1:32:59,  1.98s/it][A
Training...:  80% 11088/13907 [7:03:30<1:30:48,  1.93s/it][A
Training...:  80% 11089/13907 [7:03:32<1:28:57,  1.89s/it][A
Training...:  80% 11090/13907 [7:03:33<1:26:44,  1.85s/it][A
Training...:  80% 11091/13907 [7:03:35<1:25:08,  1.81s/it][A
Training...:  80% 11092/13907 [7:03:37<1:22:37,  1.76s/it][A
Training...:  80% 11093/13907 [7:03:39<1:20:53,  1.72s/it][A
Training...:  80% 11094/13907 [7:03:40<1:18:50,  1.68s/it][A
Training...:  80% 11095/13907 [7:03:42<1:17:45,  1.66s/it][A
Training...:  80% 11096/13907 [7:03:43<1:15:05,  1.60s/it][A
Training...:  80% 11097/13907 [7:03:45<1:12:16,  1.54s/it][A
Training...:  80% 11098/13907 [7:03:46<1:09:05,  1.48s/it][A
Training...:  80% 11099/13907 [7:03:47<1:05:51,  1.41s/it][A
Training...:  80% 11100/13907 [7:03:48<1:00:36,  1.30s/it][A
Training...:  80% 11101/13907 [7:03:52<1:34:50,  2.03s/it][A
Training...:  80% 11102/13907 [7:03:55<1:55:19,  2.47s/it][A
Training...:  80% 11103/13907 [7:03:59<2:06:21,  2.70s/it][A
Training...:  80% 11104/13907 [7:04:02<2:12:25,  2.83s/it][A
Training...:  80% 11105/13907 [7:04:05<2:15:10,  2.89s/it][A
Training...:  80% 11106/13907 [7:04:08<2:15:58,  2.91s/it][A
Training...:  80% 11107/13907 [7:04:11<2:15:25,  2.90s/it][A
Training...:  80% 11108/13907 [7:04:14<2:14:46,  2.89s/it][A
Training...:  80% 11109/13907 [7:04:16<2:13:27,  2.86s/it][A
Training...:  80% 11110/13907 [7:04:19<2:11:31,  2.82s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:34:33<17:31:07, 31533.87s/it]
Training...:  80% 11110/13907 [7:04:22<2:11:31,  2.82s/it][A
Training...:  80% 11111/13907 [7:04:22<2:15:02,  2.90s/it][A
Training...:  80% 11112/13907 [7:04:25<2:12:49,  2.85s/it][A
Training...:  80% 11113/13907 [7:04:27<2:09:20,  2.78s/it][A
Training...:  80% 11114/13907 [7:04:30<2:06:51,  2.73s/it][A
Training...:  80% 11115/13907 [7:04:33<2:04:36,  2.68s/it][A
Training...:  80% 11116/13907 [7:04:35<2:01:51,  2.62s/it][A
Training...:  80% 11117/13907 [7:04:38<1:59:31,  2.57s/it][A
Training...:  80% 11118/13907 [7:04:40<1:58:05,  2.54s/it][A
Training...:  80% 11119/13907 [7:04:42<1:56:26,  2.51s/it][A
Training...:  80% 11120/13907 [7:04:45<1:54:32,  2.47s/it][A
Training...:  80% 11121/13907 [7:04:47<1:52:25,  2.42s/it][A
Training...:  80% 11122/13907 [7:04:49<1:50:34,  2.38s/it][A
Training...:  80% 11123/13907 [7:04:52<1:48:51,  2.35s/it][A
Training...:  80% 11124/13907 [7:04:54<1:47:07,  2.31s/it][A
Training...:  80% 11125/13907 [7:04:56<1:46:05,  2.29s/it][A
Training...:  80% 11126/13907 [7:04:58<1:44:47,  2.26s/it][A
Training...:  80% 11127/13907 [7:05:01<1:43:26,  2.23s/it][A
Training...:  80% 11128/13907 [7:05:03<1:41:17,  2.19s/it][A
Training...:  80% 11129/13907 [7:05:05<1:39:23,  2.15s/it][A
Training...:  80% 11130/13907 [7:05:07<1:37:26,  2.11s/it][A
Training...:  80% 11131/13907 [7:05:09<1:35:53,  2.07s/it][A
Training...:  80% 11132/13907 [7:05:11<1:34:13,  2.04s/it][A
Training...:  80% 11133/13907 [7:05:13<1:33:08,  2.01s/it][A
Training...:  80% 11134/13907 [7:05:14<1:31:31,  1.98s/it][A
Training...:  80% 11135/13907 [7:05:16<1:30:05,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:35:30<17:31:07, 31533.87s/it]
Training...:  80% 11135/13907 [7:05:19<1:30:05,  1.95s/it][A
Training...:  80% 11136/13907 [7:05:19<1:32:43,  2.01s/it][A
Training...:  80% 11137/13907 [7:05:20<1:30:55,  1.97s/it][A
Training...:  80% 11138/13907 [7:05:22<1:27:50,  1.90s/it][A
Training...:  80% 11139/13907 [7:05:24<1:26:14,  1.87s/it][A
Training...:  80% 11140/13907 [7:05:26<1:23:44,  1.82s/it][A
Training...:  80% 11141/13907 [7:05:27<1:21:37,  1.77s/it][A
Training...:  80% 11142/13907 [7:05:29<1:19:34,  1.73s/it][A
Training...:  80% 11143/13907 [7:05:31<1:17:38,  1.69s/it][A
Training...:  80% 11144/13907 [7:05:32<1:15:56,  1.65s/it][A
Training...:  80% 11145/13907 [7:05:34<1:14:07,  1.61s/it][A
Training...:  80% 11146/13907 [7:05:35<1:11:54,  1.56s/it][A
Training...:  80% 11147/13907 [7:05:36<1:09:21,  1.51s/it][A
Training...:  80% 11148/13907 [7:05:38<1:06:29,  1.45s/it][A
Training...:  80% 11149/13907 [7:05:39<1:03:18,  1.38s/it][A
Training...:  80% 11150/13907 [7:05:40<58:51,  1.28s/it]  [A
Training...:  80% 11151/13907 [7:05:44<1:32:50,  2.02s/it][A
Training...:  80% 11152/13907 [7:05:47<1:52:55,  2.46s/it][A
Training...:  80% 11153/13907 [7:05:51<2:04:31,  2.71s/it][A
Training...:  80% 11154/13907 [7:05:54<2:10:42,  2.85s/it][A
Training...:  80% 11155/13907 [7:05:57<2:13:33,  2.91s/it][A
Training...:  80% 11156/13907 [7:06:00<2:14:19,  2.93s/it][A
Training...:  80% 11157/13907 [7:06:03<2:13:05,  2.90s/it][A
Training...:  80% 11158/13907 [7:06:05<2:12:28,  2.89s/it][A
Training...:  80% 11159/13907 [7:06:08<2:11:53,  2.88s/it][A
Training...:  80% 11160/13907 [7:06:11<2:09:36,  2.83s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:36:25<17:31:07, 31533.87s/it]
Training...:  80% 11160/13907 [7:06:14<2:09:36,  2.83s/it][A
Training...:  80% 11161/13907 [7:06:14<2:13:13,  2.91s/it][A
Training...:  80% 11162/13907 [7:06:17<2:10:16,  2.85s/it][A
Training...:  80% 11163/13907 [7:06:19<2:06:25,  2.76s/it][A
Training...:  80% 11164/13907 [7:06:22<2:03:12,  2.70s/it][A
Training...:  80% 11165/13907 [7:06:24<2:00:30,  2.64s/it][A
Training...:  80% 11166/13907 [7:06:27<1:58:18,  2.59s/it][A
Training...:  80% 11167/13907 [7:06:29<1:56:50,  2.56s/it][A
Training...:  80% 11168/13907 [7:06:32<1:54:57,  2.52s/it][A
Training...:  80% 11169/13907 [7:06:34<1:53:22,  2.48s/it][A
Training...:  80% 11170/13907 [7:06:37<1:51:41,  2.45s/it][A
Training...:  80% 11171/13907 [7:06:39<1:50:45,  2.43s/it][A
Training...:  80% 11172/13907 [7:06:41<1:48:51,  2.39s/it][A
Training...:  80% 11173/13907 [7:06:44<1:47:47,  2.37s/it][A
Training...:  80% 11174/13907 [7:06:46<1:45:54,  2.33s/it][A
Training...:  80% 11175/13907 [7:06:48<1:44:16,  2.29s/it][A
Training...:  80% 11176/13907 [7:06:50<1:42:55,  2.26s/it][A
Training...:  80% 11177/13907 [7:06:52<1:42:14,  2.25s/it][A
Training...:  80% 11178/13907 [7:06:55<1:41:10,  2.22s/it][A
Training...:  80% 11179/13907 [7:06:57<1:39:55,  2.20s/it][A
Training...:  80% 11180/13907 [7:06:59<1:38:58,  2.18s/it][A
Training...:  80% 11181/13907 [7:07:01<1:37:39,  2.15s/it][A
Training...:  80% 11182/13907 [7:07:03<1:36:13,  2.12s/it][A
Training...:  80% 11183/13907 [7:07:05<1:34:44,  2.09s/it][A
Training...:  80% 11184/13907 [7:07:07<1:33:17,  2.06s/it][A
Training...:  80% 11185/13907 [7:07:09<1:31:38,  2.02s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:37:22<17:31:07, 31533.87s/it]
Training...:  80% 11185/13907 [7:07:11<1:31:38,  2.02s/it][A
Training...:  80% 11186/13907 [7:07:11<1:34:21,  2.08s/it][A
Training...:  80% 11187/13907 [7:07:13<1:31:37,  2.02s/it][A
Training...:  80% 11188/13907 [7:07:15<1:28:43,  1.96s/it][A
Training...:  80% 11189/13907 [7:07:17<1:26:03,  1.90s/it][A
Training...:  80% 11190/13907 [7:07:18<1:23:39,  1.85s/it][A
Training...:  80% 11191/13907 [7:07:20<1:21:35,  1.80s/it][A
Training...:  80% 11192/13907 [7:07:22<1:19:38,  1.76s/it][A
Training...:  80% 11193/13907 [7:07:23<1:17:45,  1.72s/it][A
Training...:  80% 11194/13907 [7:07:25<1:16:17,  1.69s/it][A
Training...:  80% 11195/13907 [7:07:26<1:14:25,  1.65s/it][A
Training...:  81% 11196/13907 [7:07:28<1:12:36,  1.61s/it][A
Training...:  81% 11197/13907 [7:07:29<1:10:01,  1.55s/it][A
Training...:  81% 11198/13907 [7:07:31<1:07:16,  1.49s/it][A
Training...:  81% 11199/13907 [7:07:32<1:03:45,  1.41s/it][A
Training...:  81% 11200/13907 [7:07:33<59:09,  1.31s/it]  [A
Training...:  81% 11201/13907 [7:07:37<1:32:14,  2.05s/it][A
Training...:  81% 11202/13907 [7:07:40<1:51:45,  2.48s/it][A
Training...:  81% 11203/13907 [7:07:44<2:02:17,  2.71s/it][A
Training...:  81% 11204/13907 [7:07:47<2:07:53,  2.84s/it][A
Training...:  81% 11205/13907 [7:07:50<2:10:30,  2.90s/it][A
Training...:  81% 11206/13907 [7:07:53<2:11:11,  2.91s/it][A
Training...:  81% 11207/13907 [7:07:56<2:10:31,  2.90s/it][A
Training...:  81% 11208/13907 [7:07:58<2:09:21,  2.88s/it][A
Training...:  81% 11209/13907 [7:08:01<2:07:59,  2.85s/it][A
Training...:  81% 11210/13907 [7:08:04<2:06:07,  2.81s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:38:18<17:31:07, 31533.87s/it]
Training...:  81% 11210/13907 [7:08:07<2:06:07,  2.81s/it][A
Training...:  81% 11211/13907 [7:08:07<2:10:38,  2.91s/it][A
Training...:  81% 11212/13907 [7:08:10<2:08:01,  2.85s/it][A
Training...:  81% 11213/13907 [7:08:12<2:04:32,  2.77s/it][A
Training...:  81% 11214/13907 [7:08:15<2:01:41,  2.71s/it][A
Training...:  81% 11215/13907 [7:08:17<1:59:12,  2.66s/it][A
Training...:  81% 11216/13907 [7:08:20<1:57:02,  2.61s/it][A
Training...:  81% 11217/13907 [7:08:22<1:55:02,  2.57s/it][A
Training...:  81% 11218/13907 [7:08:25<1:53:05,  2.52s/it][A
Training...:  81% 11219/13907 [7:08:27<1:50:56,  2.48s/it][A
Training...:  81% 11220/13907 [7:08:29<1:49:03,  2.44s/it][A
Training...:  81% 11221/13907 [7:08:32<1:47:20,  2.40s/it][A
Training...:  81% 11222/13907 [7:08:34<1:45:49,  2.36s/it][A
Training...:  81% 11223/13907 [7:08:36<1:44:27,  2.34s/it][A
Training...:  81% 11224/13907 [7:08:39<1:43:52,  2.32s/it][A
Training...:  81% 11225/13907 [7:08:41<1:42:48,  2.30s/it][A
Training...:  81% 11226/13907 [7:08:43<1:40:43,  2.25s/it][A
Training...:  81% 11227/13907 [7:08:45<1:38:57,  2.22s/it][A
Training...:  81% 11228/13907 [7:08:47<1:37:14,  2.18s/it][A
Training...:  81% 11229/13907 [7:08:49<1:35:34,  2.14s/it][A
Training...:  81% 11230/13907 [7:08:51<1:34:03,  2.11s/it][A
Training...:  81% 11231/13907 [7:08:53<1:32:45,  2.08s/it][A
Training...:  81% 11232/13907 [7:08:55<1:31:29,  2.05s/it][A
Training...:  81% 11233/13907 [7:08:57<1:30:12,  2.02s/it][A
Training...:  81% 11234/13907 [7:08:59<1:28:43,  1.99s/it][A
Training...:  81% 11235/13907 [7:09:01<1:27:41,  1.97s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:39:14<17:31:07, 31533.87s/it]
Training...:  81% 11235/13907 [7:09:03<1:27:41,  1.97s/it][A
Training...:  81% 11236/13907 [7:09:03<1:30:09,  2.03s/it][A
Training...:  81% 11237/13907 [7:09:05<1:28:30,  1.99s/it][A
Training...:  81% 11238/13907 [7:09:07<1:25:52,  1.93s/it][A
Training...:  81% 11239/13907 [7:09:09<1:23:47,  1.88s/it][A
Training...:  81% 11240/13907 [7:09:11<1:21:39,  1.84s/it][A
Training...:  81% 11241/13907 [7:09:12<1:19:43,  1.79s/it][A
Training...:  81% 11242/13907 [7:09:14<1:17:24,  1.74s/it][A
Training...:  81% 11243/13907 [7:09:15<1:15:30,  1.70s/it][A
Training...:  81% 11244/13907 [7:09:17<1:13:59,  1.67s/it][A
Training...:  81% 11245/13907 [7:09:19<1:12:31,  1.63s/it][A
Training...:  81% 11246/13907 [7:09:20<1:10:27,  1.59s/it][A
Training...:  81% 11247/13907 [7:09:21<1:08:04,  1.54s/it][A
Training...:  81% 11248/13907 [7:09:23<1:05:14,  1.47s/it][A
Training...:  81% 11249/13907 [7:09:24<1:02:18,  1.41s/it][A
Training...:  81% 11250/13907 [7:09:25<57:54,  1.31s/it]  [A
Training...:  81% 11251/13907 [7:09:29<1:29:10,  2.01s/it][A
Training...:  81% 11252/13907 [7:09:32<1:48:39,  2.46s/it][A
Training...:  81% 11253/13907 [7:09:36<1:59:28,  2.70s/it][A
Training...:  81% 11254/13907 [7:09:39<2:05:32,  2.84s/it][A
Training...:  81% 11255/13907 [7:09:42<2:09:41,  2.93s/it][A
Training...:  81% 11256/13907 [7:09:45<2:10:26,  2.95s/it][A
Training...:  81% 11257/13907 [7:09:48<2:10:14,  2.95s/it][A
Training...:  81% 11258/13907 [7:09:51<2:08:46,  2.92s/it][A
Training...:  81% 11259/13907 [7:09:53<2:07:17,  2.88s/it][A
Training...:  81% 11260/13907 [7:09:56<2:05:00,  2.83s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:40:10<17:31:07, 31533.87s/it]
Training...:  81% 11260/13907 [7:09:59<2:05:00,  2.83s/it][A
Training...:  81% 11261/13907 [7:09:59<2:09:03,  2.93s/it][A
Training...:  81% 11262/13907 [7:10:02<2:06:35,  2.87s/it][A
Training...:  81% 11263/13907 [7:10:05<2:03:24,  2.80s/it][A
Training...:  81% 11264/13907 [7:10:07<1:59:54,  2.72s/it][A
Training...:  81% 11265/13907 [7:10:10<1:57:19,  2.66s/it][A
Training...:  81% 11266/13907 [7:10:12<1:54:59,  2.61s/it][A
Training...:  81% 11267/13907 [7:10:15<1:52:25,  2.56s/it][A
Training...:  81% 11268/13907 [7:10:17<1:50:22,  2.51s/it][A
Training...:  81% 11269/13907 [7:10:19<1:48:46,  2.47s/it][A
Training...:  81% 11270/13907 [7:10:22<1:46:44,  2.43s/it][A
Training...:  81% 11271/13907 [7:10:24<1:44:57,  2.39s/it][A
Training...:  81% 11272/13907 [7:10:26<1:43:37,  2.36s/it][A
Training...:  81% 11273/13907 [7:10:29<1:41:52,  2.32s/it][A
Training...:  81% 11274/13907 [7:10:31<1:40:23,  2.29s/it][A
Training...:  81% 11275/13907 [7:10:33<1:38:56,  2.26s/it][A
Training...:  81% 11276/13907 [7:10:35<1:37:18,  2.22s/it][A
Training...:  81% 11277/13907 [7:10:37<1:35:53,  2.19s/it][A
Training...:  81% 11278/13907 [7:10:39<1:34:32,  2.16s/it][A
Training...:  81% 11279/13907 [7:10:41<1:33:13,  2.13s/it][A
Training...:  81% 11280/13907 [7:10:43<1:31:51,  2.10s/it][A
Training...:  81% 11281/13907 [7:10:45<1:30:14,  2.06s/it][A
Training...:  81% 11282/13907 [7:10:47<1:28:55,  2.03s/it][A
Training...:  81% 11283/13907 [7:10:49<1:27:43,  2.01s/it][A
Training...:  81% 11284/13907 [7:10:51<1:26:28,  1.98s/it][A
Training...:  81% 11285/13907 [7:10:53<1:25:17,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:41:06<17:31:07, 31533.87s/it]
Training...:  81% 11285/13907 [7:10:55<1:25:17,  1.95s/it][A
Training...:  81% 11286/13907 [7:10:55<1:28:30,  2.03s/it][A
Training...:  81% 11287/13907 [7:10:57<1:26:40,  1.98s/it][A
Training...:  81% 11288/13907 [7:10:59<1:24:02,  1.93s/it][A
Training...:  81% 11289/13907 [7:11:01<1:21:39,  1.87s/it][A
Training...:  81% 11290/13907 [7:11:02<1:19:57,  1.83s/it][A
Training...:  81% 11291/13907 [7:11:04<1:18:39,  1.80s/it][A
Training...:  81% 11292/13907 [7:11:06<1:16:32,  1.76s/it][A
Training...:  81% 11293/13907 [7:11:07<1:14:28,  1.71s/it][A
Training...:  81% 11294/13907 [7:11:09<1:12:25,  1.66s/it][A
Training...:  81% 11295/13907 [7:11:11<1:10:20,  1.62s/it][A
Training...:  81% 11296/13907 [7:11:12<1:08:02,  1.56s/it][A
Training...:  81% 11297/13907 [7:11:13<1:05:48,  1.51s/it][A
Training...:  81% 11298/13907 [7:11:15<1:03:04,  1.45s/it][A
Training...:  81% 11299/13907 [7:11:16<1:00:06,  1.38s/it][A
Training...:  81% 11300/13907 [7:11:17<55:57,  1.29s/it]  [A
Training...:  81% 11301/13907 [7:11:21<1:27:55,  2.02s/it][A
Training...:  81% 11302/13907 [7:11:24<1:46:14,  2.45s/it][A
Training...:  81% 11303/13907 [7:11:28<1:58:29,  2.73s/it][A
Training...:  81% 11304/13907 [7:11:31<2:04:33,  2.87s/it][A
Training...:  81% 11305/13907 [7:11:34<2:06:25,  2.92s/it][A
Training...:  81% 11306/13907 [7:11:37<2:06:42,  2.92s/it][A
Training...:  81% 11307/13907 [7:11:39<2:05:25,  2.89s/it][A
Training...:  81% 11308/13907 [7:11:42<2:04:04,  2.86s/it][A
Training...:  81% 11309/13907 [7:11:45<2:01:55,  2.82s/it][A
Training...:  81% 11310/13907 [7:11:48<1:59:52,  2.77s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:42:02<17:31:07, 31533.87s/it]
Training...:  81% 11310/13907 [7:11:51<1:59:52,  2.77s/it][A
Training...:  81% 11311/13907 [7:11:51<2:03:28,  2.85s/it][A
Training...:  81% 11312/13907 [7:11:53<2:01:25,  2.81s/it][A
Training...:  81% 11313/13907 [7:11:56<1:58:30,  2.74s/it][A
Training...:  81% 11314/13907 [7:11:59<1:55:34,  2.67s/it][A
Training...:  81% 11315/13907 [7:12:01<1:53:07,  2.62s/it][A
Training...:  81% 11316/13907 [7:12:03<1:50:57,  2.57s/it][A
Training...:  81% 11317/13907 [7:12:06<1:49:25,  2.53s/it][A
Training...:  81% 11318/13907 [7:12:08<1:47:36,  2.49s/it][A
Training...:  81% 11319/13907 [7:12:11<1:46:21,  2.47s/it][A
Training...:  81% 11320/13907 [7:12:13<1:44:38,  2.43s/it][A
Training...:  81% 11321/13907 [7:12:15<1:43:04,  2.39s/it][A
Training...:  81% 11322/13907 [7:12:18<1:41:13,  2.35s/it][A
Training...:  81% 11323/13907 [7:12:20<1:40:14,  2.33s/it][A
Training...:  81% 11324/13907 [7:12:22<1:38:26,  2.29s/it][A
Training...:  81% 11325/13907 [7:12:24<1:36:57,  2.25s/it][A
Training...:  81% 11326/13907 [7:12:26<1:35:42,  2.22s/it][A
Training...:  81% 11327/13907 [7:12:29<1:34:29,  2.20s/it][A
Training...:  81% 11328/13907 [7:12:31<1:33:43,  2.18s/it][A
Training...:  81% 11329/13907 [7:12:33<1:32:33,  2.15s/it][A
Training...:  81% 11330/13907 [7:12:35<1:30:48,  2.11s/it][A
Training...:  81% 11331/13907 [7:12:37<1:29:18,  2.08s/it][A
Training...:  81% 11332/13907 [7:12:39<1:27:54,  2.05s/it][A
Training...:  81% 11333/13907 [7:12:41<1:26:30,  2.02s/it][A
Training...:  81% 11334/13907 [7:12:43<1:25:05,  1.98s/it][A
Training...:  82% 11335/13907 [7:12:44<1:23:43,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:42:58<17:31:07, 31533.87s/it]
Training...:  82% 11335/13907 [7:12:47<1:23:43,  1.95s/it][A
Training...:  82% 11336/13907 [7:12:47<1:26:20,  2.02s/it][A
Training...:  82% 11337/13907 [7:12:49<1:24:39,  1.98s/it][A
Training...:  82% 11338/13907 [7:12:50<1:21:55,  1.91s/it][A
Training...:  82% 11339/13907 [7:12:52<1:20:16,  1.88s/it][A
Training...:  82% 11340/13907 [7:12:54<1:18:05,  1.83s/it][A
Training...:  82% 11341/13907 [7:12:56<1:16:31,  1.79s/it][A
Training...:  82% 11342/13907 [7:12:57<1:14:37,  1.75s/it][A
Training...:  82% 11343/13907 [7:12:59<1:12:37,  1.70s/it][A
Training...:  82% 11344/13907 [7:13:00<1:10:58,  1.66s/it][A
Training...:  82% 11345/13907 [7:13:02<1:08:58,  1.62s/it][A
Training...:  82% 11346/13907 [7:13:03<1:06:50,  1.57s/it][A
Training...:  82% 11347/13907 [7:13:05<1:04:36,  1.51s/it][A
Training...:  82% 11348/13907 [7:13:06<1:02:05,  1.46s/it][A
Training...:  82% 11349/13907 [7:13:07<59:14,  1.39s/it]  [A
Training...:  82% 11350/13907 [7:13:08<54:55,  1.29s/it][A
Training...:  82% 11351/13907 [7:13:12<1:25:42,  2.01s/it][A
Training...:  82% 11352/13907 [7:13:15<1:44:39,  2.46s/it][A
Training...:  82% 11353/13907 [7:13:19<1:54:31,  2.69s/it][A
Training...:  82% 11354/13907 [7:13:22<1:59:54,  2.82s/it][A
Training...:  82% 11355/13907 [7:13:25<2:02:33,  2.88s/it][A
Training...:  82% 11356/13907 [7:13:28<2:03:27,  2.90s/it][A
Training...:  82% 11357/13907 [7:13:31<2:03:09,  2.90s/it][A
Training...:  82% 11358/13907 [7:13:34<2:02:42,  2.89s/it][A
Training...:  82% 11359/13907 [7:13:36<2:02:19,  2.88s/it][A
Training...:  82% 11360/13907 [7:13:39<2:00:40,  2.84s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:43:53<17:31:07, 31533.87s/it]
Training...:  82% 11360/13907 [7:13:42<2:00:40,  2.84s/it][A
Training...:  82% 11361/13907 [7:13:42<2:03:47,  2.92s/it][A
Training...:  82% 11362/13907 [7:13:45<2:00:34,  2.84s/it][A
Training...:  82% 11363/13907 [7:13:47<1:56:57,  2.76s/it][A
Training...:  82% 11364/13907 [7:13:50<1:54:08,  2.69s/it][A
Training...:  82% 11365/13907 [7:13:53<1:51:41,  2.64s/it][A
Training...:  82% 11366/13907 [7:13:55<1:49:15,  2.58s/it][A
Training...:  82% 11367/13907 [7:13:57<1:47:16,  2.53s/it][A
Training...:  82% 11368/13907 [7:14:00<1:45:22,  2.49s/it][A
Training...:  82% 11369/13907 [7:14:02<1:43:37,  2.45s/it][A
Training...:  82% 11370/13907 [7:14:04<1:41:52,  2.41s/it][A
Training...:  82% 11371/13907 [7:14:07<1:40:46,  2.38s/it][A
Training...:  82% 11372/13907 [7:14:09<1:39:08,  2.35s/it][A
Training...:  82% 11373/13907 [7:14:11<1:37:27,  2.31s/it][A
Training...:  82% 11374/13907 [7:14:13<1:35:49,  2.27s/it][A
Training...:  82% 11375/13907 [7:14:16<1:34:46,  2.25s/it][A
Training...:  82% 11376/13907 [7:14:18<1:33:13,  2.21s/it][A
Training...:  82% 11377/13907 [7:14:20<1:31:49,  2.18s/it][A
Training...:  82% 11378/13907 [7:14:22<1:30:24,  2.15s/it][A
Training...:  82% 11379/13907 [7:14:24<1:29:06,  2.12s/it][A
Training...:  82% 11380/13907 [7:14:26<1:28:02,  2.09s/it][A
Training...:  82% 11381/13907 [7:14:28<1:26:50,  2.06s/it][A
Training...:  82% 11382/13907 [7:14:30<1:25:32,  2.03s/it][A
Training...:  82% 11383/13907 [7:14:32<1:24:17,  2.00s/it][A
Training...:  82% 11384/13907 [7:14:34<1:22:55,  1.97s/it][A
Training...:  82% 11385/13907 [7:14:36<1:21:48,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:44:49<17:31:07, 31533.87s/it]
Training...:  82% 11385/13907 [7:14:38<1:21:48,  1.95s/it][A
Training...:  82% 11386/13907 [7:14:38<1:24:19,  2.01s/it][A
Training...:  82% 11387/13907 [7:14:40<1:22:36,  1.97s/it][A
Training...:  82% 11388/13907 [7:14:41<1:20:03,  1.91s/it][A
Training...:  82% 11389/13907 [7:14:43<1:17:56,  1.86s/it][A
Training...:  82% 11390/13907 [7:14:45<1:16:21,  1.82s/it][A
Training...:  82% 11391/13907 [7:14:47<1:14:59,  1.79s/it][A
Training...:  82% 11392/13907 [7:14:48<1:13:38,  1.76s/it][A
Training...:  82% 11393/13907 [7:14:50<1:11:40,  1.71s/it][A
Training...:  82% 11394/13907 [7:14:52<1:10:12,  1.68s/it][A
Training...:  82% 11395/13907 [7:14:53<1:08:05,  1.63s/it][A
Training...:  82% 11396/13907 [7:14:55<1:05:51,  1.57s/it][A
Training...:  82% 11397/13907 [7:14:56<1:03:40,  1.52s/it][A
Training...:  82% 11398/13907 [7:14:57<1:01:03,  1.46s/it][A
Training...:  82% 11399/13907 [7:14:58<58:16,  1.39s/it]  [A
Training...:  82% 11400/13907 [7:15:00<53:59,  1.29s/it][A
Training...:  82% 11401/13907 [7:15:03<1:26:38,  2.07s/it][A
Training...:  82% 11402/13907 [7:15:07<1:44:35,  2.51s/it][A
Training...:  82% 11403/13907 [7:15:10<1:54:03,  2.73s/it][A
Training...:  82% 11404/13907 [7:15:13<1:58:50,  2.85s/it][A
Training...:  82% 11405/13907 [7:15:16<2:00:58,  2.90s/it][A
Training...:  82% 11406/13907 [7:15:19<2:01:39,  2.92s/it][A
Training...:  82% 11407/13907 [7:15:22<2:01:14,  2.91s/it][A
Training...:  82% 11408/13907 [7:15:25<2:00:35,  2.90s/it][A
Training...:  82% 11409/13907 [7:15:28<1:58:49,  2.85s/it][A
Training...:  82% 11410/13907 [7:15:31<1:57:29,  2.82s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:45:45<17:31:07, 31533.87s/it]
Training...:  82% 11410/13907 [7:15:34<1:57:29,  2.82s/it][A
Training...:  82% 11411/13907 [7:15:34<2:00:24,  2.89s/it][A
Training...:  82% 11412/13907 [7:15:36<1:57:44,  2.83s/it][A
Training...:  82% 11413/13907 [7:15:39<1:54:14,  2.75s/it][A
Training...:  82% 11414/13907 [7:15:41<1:51:41,  2.69s/it][A
Training...:  82% 11415/13907 [7:15:44<1:49:22,  2.63s/it][A
Training...:  82% 11416/13907 [7:15:46<1:47:51,  2.60s/it][A
Training...:  82% 11417/13907 [7:15:49<1:46:29,  2.57s/it][A
Training...:  82% 11418/13907 [7:15:51<1:44:49,  2.53s/it][A
Training...:  82% 11419/13907 [7:15:54<1:43:52,  2.50s/it][A
Training...:  82% 11420/13907 [7:15:56<1:41:57,  2.46s/it][A
Training...:  82% 11421/13907 [7:15:58<1:39:48,  2.41s/it][A
Training...:  82% 11422/13907 [7:16:01<1:37:44,  2.36s/it][A
Training...:  82% 11423/13907 [7:16:03<1:36:01,  2.32s/it][A
Training...:  82% 11424/13907 [7:16:05<1:34:26,  2.28s/it][A
Training...:  82% 11425/13907 [7:16:07<1:32:50,  2.24s/it][A
Training...:  82% 11426/13907 [7:16:09<1:31:14,  2.21s/it][A
Training...:  82% 11427/13907 [7:16:12<1:29:59,  2.18s/it][A
Training...:  82% 11428/13907 [7:16:14<1:28:35,  2.14s/it][A
Training...:  82% 11429/13907 [7:16:16<1:27:21,  2.12s/it][A
Training...:  82% 11430/13907 [7:16:18<1:26:02,  2.08s/it][A
Training...:  82% 11431/13907 [7:16:20<1:24:47,  2.05s/it][A
Training...:  82% 11432/13907 [7:16:22<1:23:32,  2.03s/it][A
Training...:  82% 11433/13907 [7:16:24<1:22:17,  2.00s/it][A
Training...:  82% 11434/13907 [7:16:25<1:21:13,  1.97s/it][A
Training...:  82% 11435/13907 [7:16:27<1:19:41,  1.93s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:46:40<17:31:07, 31533.87s/it]
Training...:  82% 11435/13907 [7:16:29<1:19:41,  1.93s/it][A
Training...:  82% 11436/13907 [7:16:29<1:22:16,  2.00s/it][A
Training...:  82% 11437/13907 [7:16:31<1:20:29,  1.96s/it][A
Training...:  82% 11438/13907 [7:16:33<1:17:58,  1.90s/it][A
Training...:  82% 11439/13907 [7:16:35<1:16:04,  1.85s/it][A
Training...:  82% 11440/13907 [7:16:36<1:14:12,  1.80s/it][A
Training...:  82% 11441/13907 [7:16:38<1:12:27,  1.76s/it][A
Training...:  82% 11442/13907 [7:16:40<1:10:43,  1.72s/it][A
Training...:  82% 11443/13907 [7:16:41<1:09:03,  1.68s/it][A
Training...:  82% 11444/13907 [7:16:43<1:07:33,  1.65s/it][A
Training...:  82% 11445/13907 [7:16:44<1:06:01,  1.61s/it][A
Training...:  82% 11446/13907 [7:16:46<1:04:15,  1.57s/it][A
Training...:  82% 11447/13907 [7:16:47<1:01:54,  1.51s/it][A
Training...:  82% 11448/13907 [7:16:49<59:25,  1.45s/it]  [A
Training...:  82% 11449/13907 [7:16:50<56:30,  1.38s/it][A
Training...:  82% 11450/13907 [7:16:51<52:47,  1.29s/it][A
Training...:  82% 11451/13907 [7:16:55<1:22:28,  2.01s/it][A
Training...:  82% 11452/13907 [7:16:58<1:41:36,  2.48s/it][A
Training...:  82% 11453/13907 [7:17:01<1:51:37,  2.73s/it][A
Training...:  82% 11454/13907 [7:17:05<1:57:03,  2.86s/it][A
Training...:  82% 11455/13907 [7:17:08<1:59:33,  2.93s/it][A
Training...:  82% 11456/13907 [7:17:11<2:00:51,  2.96s/it][A
Training...:  82% 11457/13907 [7:17:14<2:00:05,  2.94s/it][A
Training...:  82% 11458/13907 [7:17:17<2:00:05,  2.94s/it][A
Training...:  82% 11459/13907 [7:17:19<1:58:59,  2.92s/it][A
Training...:  82% 11460/13907 [7:17:22<1:57:12,  2.87s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:47:36<17:31:07, 31533.87s/it]
Training...:  82% 11460/13907 [7:17:25<1:57:12,  2.87s/it][A
Training...:  82% 11461/13907 [7:17:25<1:59:54,  2.94s/it][A
Training...:  82% 11462/13907 [7:17:28<1:57:26,  2.88s/it][A
Training...:  82% 11463/13907 [7:17:31<1:54:36,  2.81s/it][A
Training...:  82% 11464/13907 [7:17:33<1:52:09,  2.75s/it][A
Training...:  82% 11465/13907 [7:17:36<1:49:53,  2.70s/it][A
Training...:  82% 11466/13907 [7:17:38<1:47:25,  2.64s/it][A
Training...:  82% 11467/13907 [7:17:41<1:45:28,  2.59s/it][A
Training...:  82% 11468/13907 [7:17:43<1:43:40,  2.55s/it][A
Training...:  82% 11469/13907 [7:17:46<1:41:38,  2.50s/it][A
Training...:  82% 11470/13907 [7:17:48<1:39:53,  2.46s/it][A
Training...:  82% 11471/13907 [7:17:50<1:38:05,  2.42s/it][A
Training...:  82% 11472/13907 [7:17:53<1:36:36,  2.38s/it][A
Training...:  82% 11473/13907 [7:17:55<1:34:53,  2.34s/it][A
Training...:  83% 11474/13907 [7:17:57<1:33:27,  2.30s/it][A
Training...:  83% 11475/13907 [7:17:59<1:32:11,  2.27s/it][A
Training...:  83% 11476/13907 [7:18:02<1:31:07,  2.25s/it][A
Training...:  83% 11477/13907 [7:18:04<1:29:29,  2.21s/it][A
Training...:  83% 11478/13907 [7:18:06<1:28:04,  2.18s/it][A
Training...:  83% 11479/13907 [7:18:08<1:26:59,  2.15s/it][A
Training...:  83% 11480/13907 [7:18:10<1:25:53,  2.12s/it][A
Training...:  83% 11481/13907 [7:18:12<1:24:48,  2.10s/it][A
Training...:  83% 11482/13907 [7:18:14<1:23:40,  2.07s/it][A
Training...:  83% 11483/13907 [7:18:16<1:22:15,  2.04s/it][A
Training...:  83% 11484/13907 [7:18:18<1:21:01,  2.01s/it][A
Training...:  83% 11485/13907 [7:18:20<1:19:35,  1.97s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:48:33<17:31:07, 31533.87s/it]
Training...:  83% 11485/13907 [7:18:22<1:19:35,  1.97s/it][A
Training...:  83% 11486/13907 [7:18:22<1:22:17,  2.04s/it][A
Training...:  83% 11487/13907 [7:18:24<1:21:04,  2.01s/it][A
Training...:  83% 11488/13907 [7:18:26<1:19:07,  1.96s/it][A
Training...:  83% 11489/13907 [7:18:28<1:16:57,  1.91s/it][A
Training...:  83% 11490/13907 [7:18:29<1:15:09,  1.87s/it][A
Training...:  83% 11491/13907 [7:18:31<1:13:23,  1.82s/it][A
Training...:  83% 11492/13907 [7:18:33<1:11:29,  1.78s/it][A
Training...:  83% 11493/13907 [7:18:34<1:09:42,  1.73s/it][A
Training...:  83% 11494/13907 [7:18:36<1:07:58,  1.69s/it][A
Training...:  83% 11495/13907 [7:18:37<1:06:16,  1.65s/it][A
Training...:  83% 11496/13907 [7:18:39<1:03:58,  1.59s/it][A
Training...:  83% 11497/13907 [7:18:40<1:01:40,  1.54s/it][A
Training...:  83% 11498/13907 [7:18:42<59:10,  1.47s/it]  [A
Training...:  83% 11499/13907 [7:18:43<56:01,  1.40s/it][A
Training...:  83% 11500/13907 [7:18:44<51:37,  1.29s/it][A
Training...:  83% 11501/13907 [7:18:48<1:20:40,  2.01s/it][A
Training...:  83% 11502/13907 [7:18:51<1:37:53,  2.44s/it][A
Training...:  83% 11503/13907 [7:18:54<1:47:47,  2.69s/it][A
Training...:  83% 11504/13907 [7:18:57<1:53:29,  2.83s/it][A
Training...:  83% 11505/13907 [7:19:01<1:56:14,  2.90s/it][A
Training...:  83% 11506/13907 [7:19:04<1:56:45,  2.92s/it][A
Training...:  83% 11507/13907 [7:19:06<1:56:30,  2.91s/it][A
Training...:  83% 11508/13907 [7:19:09<1:55:01,  2.88s/it][A
Training...:  83% 11509/13907 [7:19:12<1:53:11,  2.83s/it][A
Training...:  83% 11510/13907 [7:19:15<1:51:38,  2.79s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:49:29<17:31:07, 31533.87s/it]
Training...:  83% 11510/13907 [7:19:18<1:51:38,  2.79s/it][A
Training...:  83% 11511/13907 [7:19:18<1:55:31,  2.89s/it][A
Training...:  83% 11512/13907 [7:19:20<1:53:07,  2.83s/it][A
Training...:  83% 11513/13907 [7:19:23<1:50:14,  2.76s/it][A
Training...:  83% 11514/13907 [7:19:26<1:47:49,  2.70s/it][A
Training...:  83% 11515/13907 [7:19:28<1:46:26,  2.67s/it][A
Training...:  83% 11516/13907 [7:19:31<1:43:31,  2.60s/it][A
Training...:  83% 11517/13907 [7:19:33<1:41:22,  2.54s/it][A
Training...:  83% 11518/13907 [7:19:36<1:40:05,  2.51s/it][A
Training...:  83% 11519/13907 [7:19:38<1:39:26,  2.50s/it][A
Training...:  83% 11520/13907 [7:19:40<1:37:27,  2.45s/it][A
Training...:  83% 11521/13907 [7:19:43<1:35:56,  2.41s/it][A
Training...:  83% 11522/13907 [7:19:45<1:34:14,  2.37s/it][A
Training...:  83% 11523/13907 [7:19:47<1:32:22,  2.32s/it][A
Training...:  83% 11524/13907 [7:19:49<1:30:47,  2.29s/it][A
Training...:  83% 11525/13907 [7:19:51<1:29:17,  2.25s/it][A
Training...:  83% 11526/13907 [7:19:54<1:27:47,  2.21s/it][A
Training...:  83% 11527/13907 [7:19:56<1:26:33,  2.18s/it][A
Training...:  83% 11528/13907 [7:19:58<1:25:09,  2.15s/it][A
Training...:  83% 11529/13907 [7:20:00<1:23:48,  2.11s/it][A
Training...:  83% 11530/13907 [7:20:02<1:22:18,  2.08s/it][A
Training...:  83% 11531/13907 [7:20:04<1:20:54,  2.04s/it][A
Training...:  83% 11532/13907 [7:20:06<1:19:52,  2.02s/it][A
Training...:  83% 11533/13907 [7:20:08<1:18:47,  1.99s/it][A
Training...:  83% 11534/13907 [7:20:10<1:17:35,  1.96s/it][A
Training...:  83% 11535/13907 [7:20:11<1:16:23,  1.93s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:50:25<17:31:07, 31533.87s/it]
Training...:  83% 11535/13907 [7:20:14<1:16:23,  1.93s/it][A
Training...:  83% 11536/13907 [7:20:14<1:19:13,  2.01s/it][A
Training...:  83% 11537/13907 [7:20:15<1:17:46,  1.97s/it][A
Training...:  83% 11538/13907 [7:20:17<1:15:24,  1.91s/it][A
Training...:  83% 11539/13907 [7:20:19<1:13:30,  1.86s/it][A
Training...:  83% 11540/13907 [7:20:21<1:11:38,  1.82s/it][A
Training...:  83% 11541/13907 [7:20:22<1:09:58,  1.77s/it][A
Training...:  83% 11542/13907 [7:20:24<1:08:13,  1.73s/it][A
Training...:  83% 11543/13907 [7:20:26<1:06:32,  1.69s/it][A
Training...:  83% 11544/13907 [7:20:27<1:04:59,  1.65s/it][A
Training...:  83% 11545/13907 [7:20:29<1:03:31,  1.61s/it][A
Training...:  83% 11546/13907 [7:20:30<1:01:27,  1.56s/it][A
Training...:  83% 11547/13907 [7:20:32<59:28,  1.51s/it]  [A
Training...:  83% 11548/13907 [7:20:33<57:08,  1.45s/it][A
Training...:  83% 11549/13907 [7:20:34<54:31,  1.39s/it][A
Training...:  83% 11550/13907 [7:20:35<50:44,  1.29s/it][A
Training...:  83% 11551/13907 [7:20:39<1:19:53,  2.03s/it][A
Training...:  83% 11552/13907 [7:20:42<1:36:49,  2.47s/it][A
Training...:  83% 11553/13907 [7:20:46<1:47:42,  2.75s/it][A
Training...:  83% 11554/13907 [7:20:49<1:52:59,  2.88s/it][A
Training...:  83% 11555/13907 [7:20:52<1:55:12,  2.94s/it][A
Training...:  83% 11556/13907 [7:20:55<1:55:34,  2.95s/it][A
Training...:  83% 11557/13907 [7:20:58<1:54:34,  2.93s/it][A
Training...:  83% 11558/13907 [7:21:01<1:53:24,  2.90s/it][A
Training...:  83% 11559/13907 [7:21:03<1:51:35,  2.85s/it][A
Training...:  83% 11560/13907 [7:21:06<1:49:45,  2.81s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:51:20<17:31:07, 31533.87s/it]
Training...:  83% 11560/13907 [7:21:09<1:49:45,  2.81s/it][A
Training...:  83% 11561/13907 [7:21:09<1:52:38,  2.88s/it][A
Training...:  83% 11562/13907 [7:21:12<1:50:37,  2.83s/it][A
Training...:  83% 11563/13907 [7:21:15<1:47:32,  2.75s/it][A
Training...:  83% 11564/13907 [7:21:17<1:44:54,  2.69s/it][A
Training...:  83% 11565/13907 [7:21:20<1:42:45,  2.63s/it][A
Training...:  83% 11566/13907 [7:21:22<1:40:42,  2.58s/it][A
Training...:  83% 11567/13907 [7:21:24<1:39:09,  2.54s/it][A
Training...:  83% 11568/13907 [7:21:27<1:37:32,  2.50s/it][A
Training...:  83% 11569/13907 [7:21:29<1:36:43,  2.48s/it][A
Training...:  83% 11570/13907 [7:21:32<1:35:21,  2.45s/it][A
Training...:  83% 11571/13907 [7:21:34<1:34:06,  2.42s/it][A
Training...:  83% 11572/13907 [7:21:36<1:32:46,  2.38s/it][A
Training...:  83% 11573/13907 [7:21:39<1:31:34,  2.35s/it][A
Training...:  83% 11574/13907 [7:21:41<1:30:14,  2.32s/it][A
Training...:  83% 11575/13907 [7:21:43<1:29:07,  2.29s/it][A
Training...:  83% 11576/13907 [7:21:45<1:27:59,  2.26s/it][A
Training...:  83% 11577/13907 [7:21:47<1:26:31,  2.23s/it][A
Training...:  83% 11578/13907 [7:21:50<1:25:14,  2.20s/it][A
Training...:  83% 11579/13907 [7:21:52<1:24:38,  2.18s/it][A
Training...:  83% 11580/13907 [7:21:54<1:23:31,  2.15s/it][A
Training...:  83% 11581/13907 [7:21:56<1:22:01,  2.12s/it][A
Training...:  83% 11582/13907 [7:21:58<1:20:09,  2.07s/it][A
Training...:  83% 11583/13907 [7:22:00<1:18:46,  2.03s/it][A
Training...:  83% 11584/13907 [7:22:02<1:17:28,  2.00s/it][A
Training...:  83% 11585/13907 [7:22:04<1:16:21,  1.97s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:52:17<17:31:07, 31533.87s/it]
Training...:  83% 11585/13907 [7:22:06<1:16:21,  1.97s/it][A
Training...:  83% 11586/13907 [7:22:06<1:18:36,  2.03s/it][A
Training...:  83% 11587/13907 [7:22:08<1:16:44,  1.98s/it][A
Training...:  83% 11588/13907 [7:22:09<1:14:18,  1.92s/it][A
Training...:  83% 11589/13907 [7:22:11<1:11:59,  1.86s/it][A
Training...:  83% 11590/13907 [7:22:13<1:10:11,  1.82s/it][A
Training...:  83% 11591/13907 [7:22:15<1:08:46,  1.78s/it][A
Training...:  83% 11592/13907 [7:22:16<1:07:05,  1.74s/it][A
Training...:  83% 11593/13907 [7:22:18<1:05:36,  1.70s/it][A
Training...:  83% 11594/13907 [7:22:19<1:04:15,  1.67s/it][A
Training...:  83% 11595/13907 [7:22:21<1:02:56,  1.63s/it][A
Training...:  83% 11596/13907 [7:22:22<1:01:20,  1.59s/it][A
Training...:  83% 11597/13907 [7:22:24<59:30,  1.55s/it]  [A
Training...:  83% 11598/13907 [7:22:25<57:30,  1.49s/it][A
Training...:  83% 11599/13907 [7:22:27<54:59,  1.43s/it][A
Training...:  83% 11600/13907 [7:22:28<50:53,  1.32s/it][A
Training...:  83% 11601/13907 [7:22:31<1:19:51,  2.08s/it][A
Training...:  83% 11602/13907 [7:22:35<1:37:35,  2.54s/it][A
Training...:  83% 11603/13907 [7:22:38<1:46:43,  2.78s/it][A
Training...:  83% 11604/13907 [7:22:42<1:51:37,  2.91s/it][A
Training...:  83% 11605/13907 [7:22:45<1:54:16,  2.98s/it][A
Training...:  83% 11606/13907 [7:22:48<1:55:24,  3.01s/it][A
Training...:  83% 11607/13907 [7:22:51<1:54:56,  3.00s/it][A
Training...:  83% 11608/13907 [7:22:54<1:54:01,  2.98s/it][A
Training...:  83% 11609/13907 [7:22:57<1:52:22,  2.93s/it][A
Training...:  83% 11610/13907 [7:22:59<1:50:35,  2.89s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:53:13<17:31:07, 31533.87s/it]
Training...:  83% 11610/13907 [7:23:02<1:50:35,  2.89s/it][A
Training...:  83% 11611/13907 [7:23:02<1:53:15,  2.96s/it][A
Training...:  83% 11612/13907 [7:23:05<1:51:28,  2.91s/it][A
Training...:  84% 11613/13907 [7:23:08<1:48:53,  2.85s/it][A
Training...:  84% 11614/13907 [7:23:11<1:45:35,  2.76s/it][A
Training...:  84% 11615/13907 [7:23:13<1:43:28,  2.71s/it][A
Training...:  84% 11616/13907 [7:23:16<1:41:44,  2.66s/it][A
Training...:  84% 11617/13907 [7:23:18<1:40:03,  2.62s/it][A
Training...:  84% 11618/13907 [7:23:21<1:37:28,  2.55s/it][A
Training...:  84% 11619/13907 [7:23:23<1:35:22,  2.50s/it][A
Training...:  84% 11620/13907 [7:23:25<1:33:41,  2.46s/it][A
Training...:  84% 11621/13907 [7:23:28<1:32:07,  2.42s/it][A
Training...:  84% 11622/13907 [7:23:30<1:30:36,  2.38s/it][A
Training...:  84% 11623/13907 [7:23:32<1:28:46,  2.33s/it][A
Training...:  84% 11624/13907 [7:23:34<1:27:16,  2.29s/it][A
Training...:  84% 11625/13907 [7:23:37<1:25:50,  2.26s/it][A
Training...:  84% 11626/13907 [7:23:39<1:24:30,  2.22s/it][A
Training...:  84% 11627/13907 [7:23:41<1:23:03,  2.19s/it][A
Training...:  84% 11628/13907 [7:23:43<1:21:50,  2.15s/it][A
Training...:  84% 11629/13907 [7:23:45<1:20:46,  2.13s/it][A
Training...:  84% 11630/13907 [7:23:47<1:19:34,  2.10s/it][A
Training...:  84% 11631/13907 [7:23:49<1:18:30,  2.07s/it][A
Training...:  84% 11632/13907 [7:23:51<1:17:14,  2.04s/it][A
Training...:  84% 11633/13907 [7:23:53<1:16:10,  2.01s/it][A
Training...:  84% 11634/13907 [7:23:55<1:14:44,  1.97s/it][A
Training...:  84% 11635/13907 [7:23:57<1:13:45,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:54:10<17:31:07, 31533.87s/it]
Training...:  84% 11635/13907 [7:23:59<1:13:45,  1.95s/it][A
Training...:  84% 11636/13907 [7:23:59<1:16:17,  2.02s/it][A
Training...:  84% 11637/13907 [7:24:01<1:14:48,  1.98s/it][A
Training...:  84% 11638/13907 [7:24:02<1:12:31,  1.92s/it][A
Training...:  84% 11639/13907 [7:24:04<1:10:36,  1.87s/it][A
Training...:  84% 11640/13907 [7:24:06<1:08:44,  1.82s/it][A
Training...:  84% 11641/13907 [7:24:08<1:07:29,  1.79s/it][A
Training...:  84% 11642/13907 [7:24:09<1:05:52,  1.75s/it][A
Training...:  84% 11643/13907 [7:24:11<1:04:12,  1.70s/it][A
Training...:  84% 11644/13907 [7:24:12<1:02:55,  1.67s/it][A
Training...:  84% 11645/13907 [7:24:14<1:01:13,  1.62s/it][A
Training...:  84% 11646/13907 [7:24:15<59:29,  1.58s/it]  [A
Training...:  84% 11647/13907 [7:24:17<57:33,  1.53s/it][A
Training...:  84% 11648/13907 [7:24:18<55:26,  1.47s/it][A
Training...:  84% 11649/13907 [7:24:19<52:57,  1.41s/it][A
Training...:  84% 11650/13907 [7:24:21<49:13,  1.31s/it][A
Training...:  84% 11651/13907 [7:24:24<1:17:01,  2.05s/it][A
Training...:  84% 11652/13907 [7:24:28<1:34:01,  2.50s/it][A
Training...:  84% 11653/13907 [7:24:31<1:42:26,  2.73s/it][A
Training...:  84% 11654/13907 [7:24:34<1:46:33,  2.84s/it][A
Training...:  84% 11655/13907 [7:24:37<1:48:06,  2.88s/it][A
Training...:  84% 11656/13907 [7:24:40<1:48:01,  2.88s/it][A
Training...:  84% 11657/13907 [7:24:43<1:47:15,  2.86s/it][A
Training...:  84% 11658/13907 [7:24:46<1:46:05,  2.83s/it][A
Training...:  84% 11659/13907 [7:24:48<1:44:50,  2.80s/it][A
Training...:  84% 11660/13907 [7:24:51<1:43:11,  2.76s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:55:05<17:31:07, 31533.87s/it]
Training...:  84% 11660/13907 [7:24:54<1:43:11,  2.76s/it][A
Training...:  84% 11661/13907 [7:24:54<1:46:13,  2.84s/it][A
Training...:  84% 11662/13907 [7:24:57<1:44:02,  2.78s/it][A
Training...:  84% 11663/13907 [7:24:59<1:41:38,  2.72s/it][A
Training...:  84% 11664/13907 [7:25:02<1:39:25,  2.66s/it][A
Training...:  84% 11665/13907 [7:25:04<1:37:15,  2.60s/it][A
Training...:  84% 11666/13907 [7:25:07<1:35:59,  2.57s/it][A
Training...:  84% 11667/13907 [7:25:09<1:34:16,  2.53s/it][A
Training...:  84% 11668/13907 [7:25:12<1:32:40,  2.48s/it][A
Training...:  84% 11669/13907 [7:25:14<1:31:36,  2.46s/it][A
Training...:  84% 11670/13907 [7:25:16<1:30:26,  2.43s/it][A
Training...:  84% 11671/13907 [7:25:19<1:29:33,  2.40s/it][A
Training...:  84% 11672/13907 [7:25:21<1:28:36,  2.38s/it][A
Training...:  84% 11673/13907 [7:25:23<1:27:18,  2.35s/it][A
Training...:  84% 11674/13907 [7:25:25<1:25:49,  2.31s/it][A
Training...:  84% 11675/13907 [7:25:28<1:24:53,  2.28s/it][A
Training...:  84% 11676/13907 [7:25:30<1:23:38,  2.25s/it][A
Training...:  84% 11677/13907 [7:25:32<1:22:13,  2.21s/it][A
Training...:  84% 11678/13907 [7:25:34<1:21:08,  2.18s/it][A
Training...:  84% 11679/13907 [7:25:36<1:20:01,  2.15s/it][A
Training...:  84% 11680/13907 [7:25:38<1:19:25,  2.14s/it][A
Training...:  84% 11681/13907 [7:25:40<1:18:52,  2.13s/it][A
Training...:  84% 11682/13907 [7:25:42<1:16:56,  2.07s/it][A
Training...:  84% 11683/13907 [7:25:44<1:15:17,  2.03s/it][A
Training...:  84% 11684/13907 [7:25:46<1:13:55,  2.00s/it][A
Training...:  84% 11685/13907 [7:25:48<1:12:15,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:56:01<17:31:07, 31533.87s/it]
Training...:  84% 11685/13907 [7:25:50<1:12:15,  1.95s/it][A
Training...:  84% 11686/13907 [7:25:50<1:13:58,  2.00s/it][A
Training...:  84% 11687/13907 [7:25:52<1:12:26,  1.96s/it][A
Training...:  84% 11688/13907 [7:25:54<1:09:51,  1.89s/it][A
Training...:  84% 11689/13907 [7:25:56<1:08:11,  1.84s/it][A
Training...:  84% 11690/13907 [7:25:57<1:06:04,  1.79s/it][A
Training...:  84% 11691/13907 [7:25:59<1:04:20,  1.74s/it][A
Training...:  84% 11692/13907 [7:26:00<1:02:50,  1.70s/it][A
Training...:  84% 11693/13907 [7:26:02<1:01:36,  1.67s/it][A
Training...:  84% 11694/13907 [7:26:04<59:58,  1.63s/it]  [A
Training...:  84% 11695/13907 [7:26:05<58:49,  1.60s/it][A
Training...:  84% 11696/13907 [7:26:06<57:10,  1.55s/it][A
Training...:  84% 11697/13907 [7:26:08<55:14,  1.50s/it][A
Training...:  84% 11698/13907 [7:26:09<53:01,  1.44s/it][A
Training...:  84% 11699/13907 [7:26:10<50:43,  1.38s/it][A
Training...:  84% 11700/13907 [7:26:11<47:12,  1.28s/it][A
Training...:  84% 11701/13907 [7:26:15<1:13:52,  2.01s/it][A
Training...:  84% 11702/13907 [7:26:19<1:29:44,  2.44s/it][A
Training...:  84% 11703/13907 [7:26:22<1:38:15,  2.67s/it][A
Training...:  84% 11704/13907 [7:26:25<1:42:56,  2.80s/it][A
Training...:  84% 11705/13907 [7:26:28<1:45:16,  2.87s/it][A
Training...:  84% 11706/13907 [7:26:31<1:45:57,  2.89s/it][A
Training...:  84% 11707/13907 [7:26:34<1:45:38,  2.88s/it][A
Training...:  84% 11708/13907 [7:26:37<1:44:47,  2.86s/it][A
Training...:  84% 11709/13907 [7:26:39<1:43:19,  2.82s/it][A
Training...:  84% 11710/13907 [7:26:42<1:41:42,  2.78s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:56:56<17:31:07, 31533.87s/it]
Training...:  84% 11710/13907 [7:26:45<1:41:42,  2.78s/it][A
Training...:  84% 11711/13907 [7:26:45<1:44:49,  2.86s/it][A
Training...:  84% 11712/13907 [7:26:48<1:43:04,  2.82s/it][A
Training...:  84% 11713/13907 [7:26:50<1:40:53,  2.76s/it][A
Training...:  84% 11714/13907 [7:26:53<1:39:17,  2.72s/it][A
Training...:  84% 11715/13907 [7:26:55<1:36:53,  2.65s/it][A
Training...:  84% 11716/13907 [7:26:58<1:34:29,  2.59s/it][A
Training...:  84% 11717/13907 [7:27:00<1:32:40,  2.54s/it][A
Training...:  84% 11718/13907 [7:27:03<1:31:23,  2.51s/it][A
Training...:  84% 11719/13907 [7:27:05<1:30:06,  2.47s/it][A
Training...:  84% 11720/13907 [7:27:08<1:29:16,  2.45s/it][A
Training...:  84% 11721/13907 [7:27:10<1:28:00,  2.42s/it][A
Training...:  84% 11722/13907 [7:27:12<1:26:33,  2.38s/it][A
Training...:  84% 11723/13907 [7:27:14<1:25:23,  2.35s/it][A
Training...:  84% 11724/13907 [7:27:17<1:24:11,  2.31s/it][A
Training...:  84% 11725/13907 [7:27:19<1:23:07,  2.29s/it][A
Training...:  84% 11726/13907 [7:27:21<1:22:02,  2.26s/it][A
Training...:  84% 11727/13907 [7:27:23<1:20:49,  2.22s/it][A
Training...:  84% 11728/13907 [7:27:25<1:19:38,  2.19s/it][A
Training...:  84% 11729/13907 [7:27:28<1:18:49,  2.17s/it][A
Training...:  84% 11730/13907 [7:27:30<1:18:01,  2.15s/it][A
Training...:  84% 11731/13907 [7:27:32<1:17:04,  2.13s/it][A
Training...:  84% 11732/13907 [7:27:34<1:15:52,  2.09s/it][A
Training...:  84% 11733/13907 [7:27:36<1:14:56,  2.07s/it][A
Training...:  84% 11734/13907 [7:27:38<1:13:58,  2.04s/it][A
Training...:  84% 11735/13907 [7:27:40<1:12:50,  2.01s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:57:53<17:31:07, 31533.87s/it]
Training...:  84% 11735/13907 [7:27:42<1:12:50,  2.01s/it][A
Training...:  84% 11736/13907 [7:27:42<1:15:27,  2.09s/it][A
Training...:  84% 11737/13907 [7:27:44<1:13:21,  2.03s/it][A
Training...:  84% 11738/13907 [7:27:46<1:10:50,  1.96s/it][A
Training...:  84% 11739/13907 [7:27:47<1:08:58,  1.91s/it][A
Training...:  84% 11740/13907 [7:27:49<1:07:00,  1.86s/it][A
Training...:  84% 11741/13907 [7:27:51<1:05:04,  1.80s/it][A
Training...:  84% 11742/13907 [7:27:52<1:03:20,  1.76s/it][A
Training...:  84% 11743/13907 [7:27:54<1:01:42,  1.71s/it][A
Training...:  84% 11744/13907 [7:27:56<1:00:23,  1.68s/it][A
Training...:  84% 11745/13907 [7:27:57<58:41,  1.63s/it]  [A
Training...:  84% 11746/13907 [7:27:59<56:54,  1.58s/it][A
Training...:  84% 11747/13907 [7:28:00<54:59,  1.53s/it][A
Training...:  84% 11748/13907 [7:28:01<52:53,  1.47s/it][A
Training...:  84% 11749/13907 [7:28:03<50:23,  1.40s/it][A
Training...:  84% 11750/13907 [7:28:04<46:34,  1.30s/it][A
Training...:  84% 11751/13907 [7:28:07<1:12:37,  2.02s/it][A
Training...:  85% 11752/13907 [7:28:11<1:29:24,  2.49s/it][A
Training...:  85% 11753/13907 [7:28:14<1:38:05,  2.73s/it][A
Training...:  85% 11754/13907 [7:28:17<1:42:23,  2.85s/it][A
Training...:  85% 11755/13907 [7:28:20<1:44:23,  2.91s/it][A
Training...:  85% 11756/13907 [7:28:23<1:44:54,  2.93s/it][A
Training...:  85% 11757/13907 [7:28:26<1:44:39,  2.92s/it][A
Training...:  85% 11758/13907 [7:28:29<1:43:38,  2.89s/it][A
Training...:  85% 11759/13907 [7:28:32<1:42:05,  2.85s/it][A
Training...:  85% 11760/13907 [7:28:35<1:40:35,  2.81s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:58:49<17:31:07, 31533.87s/it]
Training...:  85% 11760/13907 [7:28:38<1:40:35,  2.81s/it][A
Training...:  85% 11761/13907 [7:28:38<1:43:24,  2.89s/it][A
Training...:  85% 11762/13907 [7:28:40<1:41:21,  2.84s/it][A
Training...:  85% 11763/13907 [7:28:43<1:38:35,  2.76s/it][A
Training...:  85% 11764/13907 [7:28:45<1:36:12,  2.69s/it][A
Training...:  85% 11765/13907 [7:28:48<1:34:09,  2.64s/it][A
Training...:  85% 11766/13907 [7:28:50<1:32:17,  2.59s/it][A
Training...:  85% 11767/13907 [7:28:53<1:30:57,  2.55s/it][A
Training...:  85% 11768/13907 [7:28:55<1:29:45,  2.52s/it][A
Training...:  85% 11769/13907 [7:28:58<1:28:21,  2.48s/it][A
Training...:  85% 11770/13907 [7:29:00<1:27:02,  2.44s/it][A
Training...:  85% 11771/13907 [7:29:02<1:26:08,  2.42s/it][A
Training...:  85% 11772/13907 [7:29:05<1:24:55,  2.39s/it][A
Training...:  85% 11773/13907 [7:29:07<1:23:29,  2.35s/it][A
Training...:  85% 11774/13907 [7:29:09<1:22:17,  2.32s/it][A
Training...:  85% 11775/13907 [7:29:11<1:20:53,  2.28s/it][A
Training...:  85% 11776/13907 [7:29:14<1:19:38,  2.24s/it][A
Training...:  85% 11777/13907 [7:29:16<1:18:40,  2.22s/it][A
Training...:  85% 11778/13907 [7:29:18<1:17:32,  2.19s/it][A
Training...:  85% 11779/13907 [7:29:20<1:16:25,  2.15s/it][A
Training...:  85% 11780/13907 [7:29:22<1:15:27,  2.13s/it][A
Training...:  85% 11781/13907 [7:29:24<1:15:03,  2.12s/it][A
Training...:  85% 11782/13907 [7:29:26<1:14:02,  2.09s/it][A
Training...:  85% 11783/13907 [7:29:28<1:12:36,  2.05s/it][A
Training...:  85% 11784/13907 [7:29:30<1:11:05,  2.01s/it][A
Training...:  85% 11785/13907 [7:29:32<1:09:56,  1.98s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [24:59:45<17:31:07, 31533.87s/it]
Training...:  85% 11785/13907 [7:29:34<1:09:56,  1.98s/it][A
Training...:  85% 11786/13907 [7:29:34<1:11:56,  2.04s/it][A
Training...:  85% 11787/13907 [7:29:36<1:10:42,  2.00s/it][A
Training...:  85% 11788/13907 [7:29:38<1:08:33,  1.94s/it][A
Training...:  85% 11789/13907 [7:29:40<1:06:51,  1.89s/it][A
Training...:  85% 11790/13907 [7:29:41<1:05:11,  1.85s/it][A
Training...:  85% 11791/13907 [7:29:43<1:03:33,  1.80s/it][A
Training...:  85% 11792/13907 [7:29:45<1:01:49,  1.75s/it][A
Training...:  85% 11793/13907 [7:29:46<1:00:28,  1.72s/it][A
Training...:  85% 11794/13907 [7:29:48<59:11,  1.68s/it]  [A
Training...:  85% 11795/13907 [7:29:49<57:37,  1.64s/it][A
Training...:  85% 11796/13907 [7:29:51<55:37,  1.58s/it][A
Training...:  85% 11797/13907 [7:29:52<53:50,  1.53s/it][A
Training...:  85% 11798/13907 [7:29:54<51:37,  1.47s/it][A
Training...:  85% 11799/13907 [7:29:55<49:15,  1.40s/it][A
Training...:  85% 11800/13907 [7:29:56<45:42,  1.30s/it][A
Training...:  85% 11801/13907 [7:30:00<1:10:35,  2.01s/it][A
Training...:  85% 11802/13907 [7:30:03<1:26:05,  2.45s/it][A
Training...:  85% 11803/13907 [7:30:06<1:34:48,  2.70s/it][A
Training...:  85% 11804/13907 [7:30:10<1:39:46,  2.85s/it][A
Training...:  85% 11805/13907 [7:30:13<1:42:01,  2.91s/it][A
Training...:  85% 11806/13907 [7:30:16<1:42:33,  2.93s/it][A
Training...:  85% 11807/13907 [7:30:19<1:42:11,  2.92s/it][A
Training...:  85% 11808/13907 [7:30:21<1:41:04,  2.89s/it][A
Training...:  85% 11809/13907 [7:30:24<1:40:17,  2.87s/it][A
Training...:  85% 11810/13907 [7:30:27<1:38:38,  2.82s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:00:41<17:31:07, 31533.87s/it]
Training...:  85% 11810/13907 [7:30:30<1:38:38,  2.82s/it][A
Training...:  85% 11811/13907 [7:30:30<1:41:41,  2.91s/it][A
Training...:  85% 11812/13907 [7:30:33<1:40:04,  2.87s/it][A
Training...:  85% 11813/13907 [7:30:35<1:37:12,  2.79s/it][A
Training...:  85% 11814/13907 [7:30:38<1:35:05,  2.73s/it][A
Training...:  85% 11815/13907 [7:30:41<1:33:39,  2.69s/it][A
Training...:  85% 11816/13907 [7:30:43<1:31:17,  2.62s/it][A
Training...:  85% 11817/13907 [7:30:45<1:29:20,  2.56s/it][A
Training...:  85% 11818/13907 [7:30:48<1:27:40,  2.52s/it][A
Training...:  85% 11819/13907 [7:30:50<1:26:25,  2.48s/it][A
Training...:  85% 11820/13907 [7:30:53<1:25:18,  2.45s/it][A
Training...:  85% 11821/13907 [7:30:55<1:24:11,  2.42s/it][A
Training...:  85% 11822/13907 [7:30:57<1:22:35,  2.38s/it][A
Training...:  85% 11823/13907 [7:31:00<1:21:12,  2.34s/it][A
Training...:  85% 11824/13907 [7:31:02<1:19:49,  2.30s/it][A
Training...:  85% 11825/13907 [7:31:04<1:18:36,  2.27s/it][A
Training...:  85% 11826/13907 [7:31:06<1:17:17,  2.23s/it][A
Training...:  85% 11827/13907 [7:31:08<1:16:17,  2.20s/it][A
Training...:  85% 11828/13907 [7:31:10<1:15:08,  2.17s/it][A
Training...:  85% 11829/13907 [7:31:12<1:13:56,  2.14s/it][A
Training...:  85% 11830/13907 [7:31:14<1:12:44,  2.10s/it][A
Training...:  85% 11831/13907 [7:31:16<1:11:42,  2.07s/it][A
Training...:  85% 11832/13907 [7:31:18<1:10:40,  2.04s/it][A
Training...:  85% 11833/13907 [7:31:20<1:09:37,  2.01s/it][A
Training...:  85% 11834/13907 [7:31:22<1:08:36,  1.99s/it][A
Training...:  85% 11835/13907 [7:31:24<1:07:29,  1.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:01:37<17:31:07, 31533.87s/it]
Training...:  85% 11835/13907 [7:31:26<1:07:29,  1.95s/it][A
Training...:  85% 11836/13907 [7:31:26<1:09:41,  2.02s/it][A
Training...:  85% 11837/13907 [7:31:28<1:08:18,  1.98s/it][A
Training...:  85% 11838/13907 [7:31:30<1:06:20,  1.92s/it][A
Training...:  85% 11839/13907 [7:31:32<1:04:38,  1.88s/it][A
Training...:  85% 11840/13907 [7:31:33<1:03:04,  1.83s/it][A
Training...:  85% 11841/13907 [7:31:35<1:01:34,  1.79s/it][A
Training...:  85% 11842/13907 [7:31:37<1:00:26,  1.76s/it][A
Training...:  85% 11843/13907 [7:31:38<59:01,  1.72s/it]  [A
Training...:  85% 11844/13907 [7:31:40<57:32,  1.67s/it][A
Training...:  85% 11845/13907 [7:31:42<56:30,  1.64s/it][A
Training...:  85% 11846/13907 [7:31:43<54:43,  1.59s/it][A
Training...:  85% 11847/13907 [7:31:44<52:39,  1.53s/it][A
Training...:  85% 11848/13907 [7:31:46<50:36,  1.47s/it][A
Training...:  85% 11849/13907 [7:31:47<48:32,  1.42s/it][A
Training...:  85% 11850/13907 [7:31:48<45:07,  1.32s/it][A
Training...:  85% 11851/13907 [7:31:52<1:09:22,  2.02s/it][A
Training...:  85% 11852/13907 [7:31:55<1:24:22,  2.46s/it][A
Training...:  85% 11853/13907 [7:31:59<1:32:42,  2.71s/it][A
Training...:  85% 11854/13907 [7:32:02<1:37:08,  2.84s/it][A
Training...:  85% 11855/13907 [7:32:05<1:39:15,  2.90s/it][A
Training...:  85% 11856/13907 [7:32:08<1:39:56,  2.92s/it][A
Training...:  85% 11857/13907 [7:32:11<1:39:31,  2.91s/it][A
Training...:  85% 11858/13907 [7:32:13<1:38:49,  2.89s/it][A
Training...:  85% 11859/13907 [7:32:16<1:37:51,  2.87s/it][A
Training...:  85% 11860/13907 [7:32:19<1:36:14,  2.82s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:02:33<17:31:07, 31533.87s/it]
Training...:  85% 11860/13907 [7:32:22<1:36:14,  2.82s/it][A
Training...:  85% 11861/13907 [7:32:22<1:39:34,  2.92s/it][A
Training...:  85% 11862/13907 [7:32:25<1:38:33,  2.89s/it][A
Training...:  85% 11863/13907 [7:32:28<1:35:58,  2.82s/it][A
Training...:  85% 11864/13907 [7:32:30<1:33:37,  2.75s/it][A
Training...:  85% 11865/13907 [7:32:33<1:31:19,  2.68s/it][A
Training...:  85% 11866/13907 [7:32:35<1:29:20,  2.63s/it][A
Training...:  85% 11867/13907 [7:32:38<1:27:40,  2.58s/it][A
Training...:  85% 11868/13907 [7:32:40<1:26:43,  2.55s/it][A
Training...:  85% 11869/13907 [7:32:43<1:25:13,  2.51s/it][A
Training...:  85% 11870/13907 [7:32:45<1:23:35,  2.46s/it][A
Training...:  85% 11871/13907 [7:32:47<1:22:07,  2.42s/it][A
Training...:  85% 11872/13907 [7:32:50<1:20:55,  2.39s/it][A
Training...:  85% 11873/13907 [7:32:52<1:19:50,  2.36s/it][A
Training...:  85% 11874/13907 [7:32:54<1:18:31,  2.32s/it][A
Training...:  85% 11875/13907 [7:32:56<1:17:18,  2.28s/it][A
Training...:  85% 11876/13907 [7:32:58<1:15:55,  2.24s/it][A
Training...:  85% 11877/13907 [7:33:01<1:14:50,  2.21s/it][A
Training...:  85% 11878/13907 [7:33:03<1:13:28,  2.17s/it][A
Training...:  85% 11879/13907 [7:33:05<1:12:22,  2.14s/it][A
Training...:  85% 11880/13907 [7:33:07<1:11:01,  2.10s/it][A
Training...:  85% 11881/13907 [7:33:09<1:10:11,  2.08s/it][A
Training...:  85% 11882/13907 [7:33:11<1:09:07,  2.05s/it][A
Training...:  85% 11883/13907 [7:33:13<1:08:09,  2.02s/it][A
Training...:  85% 11884/13907 [7:33:15<1:07:00,  1.99s/it][A
Training...:  85% 11885/13907 [7:33:17<1:06:10,  1.96s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:03:30<17:31:07, 31533.87s/it]
Training...:  85% 11885/13907 [7:33:19<1:06:10,  1.96s/it][A
Training...:  85% 11886/13907 [7:33:19<1:08:12,  2.03s/it][A
Training...:  85% 11887/13907 [7:33:21<1:06:42,  1.98s/it][A
Training...:  85% 11888/13907 [7:33:22<1:04:36,  1.92s/it][A
Training...:  85% 11889/13907 [7:33:24<1:03:14,  1.88s/it][A
Training...:  85% 11890/13907 [7:33:26<1:01:37,  1.83s/it][A
Training...:  86% 11891/13907 [7:33:28<1:00:06,  1.79s/it][A
Training...:  86% 11892/13907 [7:33:29<58:41,  1.75s/it]  [A
Training...:  86% 11893/13907 [7:33:31<57:16,  1.71s/it][A
Training...:  86% 11894/13907 [7:33:32<56:05,  1.67s/it][A
Training...:  86% 11895/13907 [7:33:34<54:34,  1.63s/it][A
Training...:  86% 11896/13907 [7:33:35<52:58,  1.58s/it][A
Training...:  86% 11897/13907 [7:33:37<51:11,  1.53s/it][A
Training...:  86% 11898/13907 [7:33:38<49:12,  1.47s/it][A
Training...:  86% 11899/13907 [7:33:39<46:54,  1.40s/it][A
Training...:  86% 11900/13907 [7:33:40<44:02,  1.32s/it][A
Training...:  86% 11901/13907 [7:33:44<1:09:47,  2.09s/it][A
Training...:  86% 11902/13907 [7:33:48<1:24:18,  2.52s/it][A
Training...:  86% 11903/13907 [7:33:51<1:31:48,  2.75s/it][A
Training...:  86% 11904/13907 [7:33:54<1:35:28,  2.86s/it][A
Training...:  86% 11905/13907 [7:33:57<1:36:59,  2.91s/it][A
Training...:  86% 11906/13907 [7:34:00<1:36:57,  2.91s/it][A
Training...:  86% 11907/13907 [7:34:03<1:36:31,  2.90s/it][A
Training...:  86% 11908/13907 [7:34:06<1:35:39,  2.87s/it][A
Training...:  86% 11909/13907 [7:34:09<1:34:10,  2.83s/it][A
Training...:  86% 11910/13907 [7:34:11<1:32:42,  2.79s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:04:25<17:31:07, 31533.87s/it]
Training...:  86% 11910/13907 [7:34:14<1:32:42,  2.79s/it][A
Training...:  86% 11911/13907 [7:34:14<1:35:01,  2.86s/it][A
Training...:  86% 11912/13907 [7:34:17<1:33:23,  2.81s/it][A
Training...:  86% 11913/13907 [7:34:20<1:30:52,  2.73s/it][A
Training...:  86% 11914/13907 [7:34:22<1:28:30,  2.66s/it][A
Training...:  86% 11915/13907 [7:34:25<1:26:46,  2.61s/it][A
Training...:  86% 11916/13907 [7:34:27<1:25:12,  2.57s/it][A
Training...:  86% 11917/13907 [7:34:29<1:23:44,  2.52s/it][A
Training...:  86% 11918/13907 [7:34:32<1:22:26,  2.49s/it][A
Training...:  86% 11919/13907 [7:34:34<1:21:10,  2.45s/it][A
Training...:  86% 11920/13907 [7:34:37<1:19:56,  2.41s/it][A
Training...:  86% 11921/13907 [7:34:39<1:18:51,  2.38s/it][A
Training...:  86% 11922/13907 [7:34:41<1:17:40,  2.35s/it][A
Training...:  86% 11923/13907 [7:34:44<1:17:51,  2.35s/it][A
Training...:  86% 11924/13907 [7:34:46<1:17:22,  2.34s/it][A
Training...:  86% 11925/13907 [7:34:48<1:16:21,  2.31s/it][A
Training...:  86% 11926/13907 [7:34:50<1:15:14,  2.28s/it][A
Training...:  86% 11927/13907 [7:34:52<1:14:33,  2.26s/it][A
Training...:  86% 11928/13907 [7:34:55<1:13:39,  2.23s/it][A
Training...:  86% 11929/13907 [7:34:57<1:12:25,  2.20s/it][A
Training...:  86% 11930/13907 [7:34:59<1:11:20,  2.16s/it][A
Training...:  86% 11931/13907 [7:35:01<1:10:12,  2.13s/it][A
Training...:  86% 11932/13907 [7:35:03<1:09:27,  2.11s/it][A
Training...:  86% 11933/13907 [7:35:05<1:08:28,  2.08s/it][A
Training...:  86% 11934/13907 [7:35:07<1:07:11,  2.04s/it][A
Training...:  86% 11935/13907 [7:35:09<1:06:12,  2.01s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:05:22<17:31:07, 31533.87s/it]
Training...:  86% 11935/13907 [7:35:11<1:06:12,  2.01s/it][A
Training...:  86% 11936/13907 [7:35:11<1:08:08,  2.07s/it][A
Training...:  86% 11937/13907 [7:35:13<1:06:21,  2.02s/it][A
Training...:  86% 11938/13907 [7:35:15<1:04:05,  1.95s/it][A
Training...:  86% 11939/13907 [7:35:17<1:02:08,  1.89s/it][A
Training...:  86% 11940/13907 [7:35:18<1:00:27,  1.84s/it][A
Training...:  86% 11941/13907 [7:35:20<58:53,  1.80s/it]  [A
Training...:  86% 11942/13907 [7:35:22<57:58,  1.77s/it][A
Training...:  86% 11943/13907 [7:35:23<56:36,  1.73s/it][A
Training...:  86% 11944/13907 [7:35:25<55:13,  1.69s/it][A
Training...:  86% 11945/13907 [7:35:26<53:47,  1.65s/it][A
Training...:  86% 11946/13907 [7:35:28<52:03,  1.59s/it][A
Training...:  86% 11947/13907 [7:35:29<50:23,  1.54s/it][A
Training...:  86% 11948/13907 [7:35:31<48:19,  1.48s/it][A
Training...:  86% 11949/13907 [7:35:32<45:56,  1.41s/it][A
Training...:  86% 11950/13907 [7:35:33<42:20,  1.30s/it][A
Training...:  86% 11951/13907 [7:35:37<1:07:02,  2.06s/it][A
Training...:  86% 11952/13907 [7:35:40<1:21:01,  2.49s/it][A
Training...:  86% 11953/13907 [7:35:44<1:28:34,  2.72s/it][A
Training...:  86% 11954/13907 [7:35:47<1:32:37,  2.85s/it][A
Training...:  86% 11955/13907 [7:35:50<1:34:32,  2.91s/it][A
Training...:  86% 11956/13907 [7:35:53<1:35:31,  2.94s/it][A
Training...:  86% 11957/13907 [7:35:56<1:35:48,  2.95s/it][A
Training...:  86% 11958/13907 [7:35:59<1:34:27,  2.91s/it][A
Training...:  86% 11959/13907 [7:36:01<1:32:42,  2.86s/it][A
Training...:  86% 11960/13907 [7:36:04<1:30:43,  2.80s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:06:18<17:31:07, 31533.87s/it]
Training...:  86% 11960/13907 [7:36:07<1:30:43,  2.80s/it][A
Training...:  86% 11961/13907 [7:36:07<1:33:06,  2.87s/it][A
Training...:  86% 11962/13907 [7:36:10<1:31:09,  2.81s/it][A
Training...:  86% 11963/13907 [7:36:12<1:28:33,  2.73s/it][A
Training...:  86% 11964/13907 [7:36:15<1:27:07,  2.69s/it][A
Training...:  86% 11965/13907 [7:36:17<1:24:56,  2.62s/it][A
Training...:  86% 11966/13907 [7:36:20<1:23:10,  2.57s/it][A
Training...:  86% 11967/13907 [7:36:22<1:21:49,  2.53s/it][A
Training...:  86% 11968/13907 [7:36:25<1:20:41,  2.50s/it][A
Training...:  86% 11969/13907 [7:36:27<1:19:19,  2.46s/it][A
Training...:  86% 11970/13907 [7:36:29<1:18:11,  2.42s/it][A
Training...:  86% 11971/13907 [7:36:32<1:17:07,  2.39s/it][A
Training...:  86% 11972/13907 [7:36:34<1:15:55,  2.35s/it][A
Training...:  86% 11973/13907 [7:36:36<1:14:45,  2.32s/it][A
Training...:  86% 11974/13907 [7:36:38<1:13:47,  2.29s/it][A
Training...:  86% 11975/13907 [7:36:40<1:12:40,  2.26s/it][A
Training...:  86% 11976/13907 [7:36:43<1:11:22,  2.22s/it][A
Training...:  86% 11977/13907 [7:36:45<1:10:22,  2.19s/it][A
Training...:  86% 11978/13907 [7:36:47<1:09:23,  2.16s/it][A
Training...:  86% 11979/13907 [7:36:49<1:08:33,  2.13s/it][A
Training...:  86% 11980/13907 [7:36:51<1:07:34,  2.10s/it][A
Training...:  86% 11981/13907 [7:36:53<1:06:33,  2.07s/it][A
Training...:  86% 11982/13907 [7:36:55<1:05:36,  2.05s/it][A
Training...:  86% 11983/13907 [7:36:57<1:04:51,  2.02s/it][A
Training...:  86% 11984/13907 [7:36:59<1:03:53,  1.99s/it][A
Training...:  86% 11985/13907 [7:37:01<1:03:16,  1.98s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:07:14<17:31:07, 31533.87s/it]
Training...:  86% 11985/13907 [7:37:03<1:03:16,  1.98s/it][A
Training...:  86% 11986/13907 [7:37:03<1:05:16,  2.04s/it][A
Training...:  86% 11987/13907 [7:37:05<1:03:38,  1.99s/it][A
Training...:  86% 11988/13907 [7:37:07<1:01:26,  1.92s/it][A
Training...:  86% 11989/13907 [7:37:08<59:49,  1.87s/it]  [A
Training...:  86% 11990/13907 [7:37:10<58:11,  1.82s/it][A
Training...:  86% 11991/13907 [7:37:12<56:34,  1.77s/it][A
Training...:  86% 11992/13907 [7:37:13<54:59,  1.72s/it][A
Training...:  86% 11993/13907 [7:37:15<53:34,  1.68s/it][A
Training...:  86% 11994/13907 [7:37:16<52:23,  1.64s/it][A
Training...:  86% 11995/13907 [7:37:18<50:49,  1.59s/it][A
Training...:  86% 11996/13907 [7:37:19<49:21,  1.55s/it][A
Training...:  86% 11997/13907 [7:37:21<47:35,  1.49s/it][A
Training...:  86% 11998/13907 [7:37:22<45:43,  1.44s/it][A
Training...:  86% 11999/13907 [7:37:23<43:39,  1.37s/it][A
Training...:  86% 12000/13907 [7:37:24<40:41,  1.28s/it][A
Training...:  86% 12001/13907 [7:37:28<1:03:23,  2.00s/it][A
Training...:  86% 12002/13907 [7:37:31<1:16:47,  2.42s/it][A
Training...:  86% 12003/13907 [7:37:35<1:24:20,  2.66s/it][A
Training...:  86% 12004/13907 [7:37:38<1:28:23,  2.79s/it][A
Training...:  86% 12005/13907 [7:37:41<1:31:05,  2.87s/it][A
Training...:  86% 12006/13907 [7:37:44<1:32:05,  2.91s/it][A
Training...:  86% 12007/13907 [7:37:47<1:32:31,  2.92s/it][A
Training...:  86% 12008/13907 [7:37:50<1:31:45,  2.90s/it][A
Training...:  86% 12009/13907 [7:37:52<1:30:38,  2.87s/it][A
Training...:  86% 12010/13907 [7:37:55<1:29:11,  2.82s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:08:09<17:31:07, 31533.87s/it]
Training...:  86% 12010/13907 [7:37:58<1:29:11,  2.82s/it][A
Training...:  86% 12011/13907 [7:37:58<1:31:29,  2.90s/it][A
Training...:  86% 12012/13907 [7:38:01<1:29:23,  2.83s/it][A
Training...:  86% 12013/13907 [7:38:03<1:27:08,  2.76s/it][A
Training...:  86% 12014/13907 [7:38:06<1:25:09,  2.70s/it][A
Training...:  86% 12015/13907 [7:38:08<1:23:38,  2.65s/it][A
Training...:  86% 12016/13907 [7:38:11<1:21:37,  2.59s/it][A
Training...:  86% 12017/13907 [7:38:13<1:20:58,  2.57s/it][A
Training...:  86% 12018/13907 [7:38:16<1:19:40,  2.53s/it][A
Training...:  86% 12019/13907 [7:38:18<1:18:12,  2.49s/it][A
Training...:  86% 12020/13907 [7:38:21<1:16:50,  2.44s/it][A
Training...:  86% 12021/13907 [7:38:23<1:15:33,  2.40s/it][A
Training...:  86% 12022/13907 [7:38:25<1:13:56,  2.35s/it][A
Training...:  86% 12023/13907 [7:38:27<1:12:58,  2.32s/it][A
Training...:  86% 12024/13907 [7:38:30<1:11:43,  2.29s/it][A
Training...:  86% 12025/13907 [7:38:32<1:10:34,  2.25s/it][A
Training...:  86% 12026/13907 [7:38:34<1:09:17,  2.21s/it][A
Training...:  86% 12027/13907 [7:38:36<1:08:00,  2.17s/it][A
Training...:  86% 12028/13907 [7:38:38<1:06:51,  2.13s/it][A
Training...:  86% 12029/13907 [7:38:40<1:06:11,  2.11s/it][A
Training...:  87% 12030/13907 [7:38:42<1:05:11,  2.08s/it][A
Training...:  87% 12031/13907 [7:38:44<1:04:11,  2.05s/it][A
Training...:  87% 12032/13907 [7:38:46<1:03:16,  2.02s/it][A
Training...:  87% 12033/13907 [7:38:48<1:02:32,  2.00s/it][A
Training...:  87% 12034/13907 [7:38:50<1:01:48,  1.98s/it][A
Training...:  87% 12035/13907 [7:38:52<1:01:02,  1.96s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:09:05<17:31:07, 31533.87s/it]
Training...:  87% 12035/13907 [7:38:54<1:01:02,  1.96s/it][A
Training...:  87% 12036/13907 [7:38:54<1:02:53,  2.02s/it][A
Training...:  87% 12037/13907 [7:38:56<1:01:34,  1.98s/it][A
Training...:  87% 12038/13907 [7:38:58<59:53,  1.92s/it]  [A
Training...:  87% 12039/13907 [7:38:59<58:28,  1.88s/it][A
Training...:  87% 12040/13907 [7:39:01<57:09,  1.84s/it][A
Training...:  87% 12041/13907 [7:39:03<55:46,  1.79s/it][A
Training...:  87% 12042/13907 [7:39:05<54:36,  1.76s/it][A
Training...:  87% 12043/13907 [7:39:06<53:33,  1.72s/it][A
Training...:  87% 12044/13907 [7:39:08<52:30,  1.69s/it][A
Training...:  87% 12045/13907 [7:39:09<51:14,  1.65s/it][A
Training...:  87% 12046/13907 [7:39:11<49:52,  1.61s/it][A
Training...:  87% 12047/13907 [7:39:12<48:11,  1.55s/it][A
Training...:  87% 12048/13907 [7:39:14<46:18,  1.49s/it][A
Training...:  87% 12049/13907 [7:39:15<44:09,  1.43s/it][A
Training...:  87% 12050/13907 [7:39:16<41:09,  1.33s/it][A
Training...:  87% 12051/13907 [7:39:20<1:03:57,  2.07s/it][A
Training...:  87% 12052/13907 [7:39:23<1:17:33,  2.51s/it][A
Training...:  87% 12053/13907 [7:39:27<1:25:16,  2.76s/it][A
Training...:  87% 12054/13907 [7:39:30<1:29:17,  2.89s/it][A
Training...:  87% 12055/13907 [7:39:33<1:31:32,  2.97s/it][A
Training...:  87% 12056/13907 [7:39:36<1:32:33,  3.00s/it][A
Training...:  87% 12057/13907 [7:39:39<1:32:20,  2.99s/it][A
Training...:  87% 12058/13907 [7:39:42<1:31:13,  2.96s/it][A
Training...:  87% 12059/13907 [7:39:45<1:29:51,  2.92s/it][A
Training...:  87% 12060/13907 [7:39:48<1:27:56,  2.86s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:10:02<17:31:07, 31533.87s/it]
Training...:  87% 12060/13907 [7:39:51<1:27:56,  2.86s/it][A
Training...:  87% 12061/13907 [7:39:51<1:30:24,  2.94s/it][A
Training...:  87% 12062/13907 [7:39:53<1:28:31,  2.88s/it][A
Training...:  87% 12063/13907 [7:39:56<1:25:29,  2.78s/it][A
Training...:  87% 12064/13907 [7:39:58<1:22:59,  2.70s/it][A
Training...:  87% 12065/13907 [7:40:01<1:20:52,  2.63s/it][A
Training...:  87% 12066/13907 [7:40:03<1:19:40,  2.60s/it][A
Training...:  87% 12067/13907 [7:40:06<1:18:28,  2.56s/it][A
Training...:  87% 12068/13907 [7:40:08<1:17:12,  2.52s/it][A
Training...:  87% 12069/13907 [7:40:11<1:16:30,  2.50s/it][A
Training...:  87% 12070/13907 [7:40:13<1:15:29,  2.47s/it][A
Training...:  87% 12071/13907 [7:40:16<1:14:48,  2.44s/it][A
Training...:  87% 12072/13907 [7:40:18<1:13:09,  2.39s/it][A
Training...:  87% 12073/13907 [7:40:20<1:11:42,  2.35s/it][A
Training...:  87% 12074/13907 [7:40:22<1:10:21,  2.30s/it][A
Training...:  87% 12075/13907 [7:40:24<1:09:16,  2.27s/it][A
Training...:  87% 12076/13907 [7:40:27<1:08:05,  2.23s/it][A
Training...:  87% 12077/13907 [7:40:29<1:07:20,  2.21s/it][A
Training...:  87% 12078/13907 [7:40:31<1:06:30,  2.18s/it][A
Training...:  87% 12079/13907 [7:40:33<1:05:41,  2.16s/it][A
Training...:  87% 12080/13907 [7:40:35<1:04:39,  2.12s/it][A
Training...:  87% 12081/13907 [7:40:37<1:03:29,  2.09s/it][A
Training...:  87% 12082/13907 [7:40:39<1:02:39,  2.06s/it][A
Training...:  87% 12083/13907 [7:40:41<1:01:33,  2.02s/it][A
Training...:  87% 12084/13907 [7:40:43<1:00:27,  1.99s/it][A
Training...:  87% 12085/13907 [7:40:45<59:38,  1.96s/it]  [A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:10:58<17:31:07, 31533.87s/it]
Training...:  87% 12085/13907 [7:40:47<59:38,  1.96s/it][A
Training...:  87% 12086/13907 [7:40:47<1:01:13,  2.02s/it][A
Training...:  87% 12087/13907 [7:40:49<1:00:05,  1.98s/it][A
Training...:  87% 12088/13907 [7:40:51<58:19,  1.92s/it]  [A
Training...:  87% 12089/13907 [7:40:52<56:43,  1.87s/it][A
Training...:  87% 12090/13907 [7:40:54<55:30,  1.83s/it][A
Training...:  87% 12091/13907 [7:40:56<54:27,  1.80s/it][A
Training...:  87% 12092/13907 [7:40:58<53:16,  1.76s/it][A
Training...:  87% 12093/13907 [7:40:59<51:44,  1.71s/it][A
Training...:  87% 12094/13907 [7:41:01<50:39,  1.68s/it][A
Training...:  87% 12095/13907 [7:41:02<49:08,  1.63s/it][A
Training...:  87% 12096/13907 [7:41:04<47:36,  1.58s/it][A
Training...:  87% 12097/13907 [7:41:05<46:01,  1.53s/it][A
Training...:  87% 12098/13907 [7:41:06<44:06,  1.46s/it][A
Training...:  87% 12099/13907 [7:41:08<42:01,  1.39s/it][A
Training...:  87% 12100/13907 [7:41:09<38:58,  1.29s/it][A
Training...:  87% 12101/13907 [7:41:12<1:00:48,  2.02s/it][A
Training...:  87% 12102/13907 [7:41:16<1:13:51,  2.46s/it][A
Training...:  87% 12103/13907 [7:41:19<1:20:58,  2.69s/it][A
Training...:  87% 12104/13907 [7:41:22<1:24:49,  2.82s/it][A
Training...:  87% 12105/13907 [7:41:25<1:26:30,  2.88s/it][A
Training...:  87% 12106/13907 [7:41:28<1:26:46,  2.89s/it][A
Training...:  87% 12107/13907 [7:41:31<1:26:49,  2.89s/it][A
Training...:  87% 12108/13907 [7:41:34<1:26:00,  2.87s/it][A
Training...:  87% 12109/13907 [7:41:37<1:25:15,  2.85s/it][A
Training...:  87% 12110/13907 [7:41:39<1:23:50,  2.80s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:11:53<17:31:07, 31533.87s/it]
Training...:  87% 12110/13907 [7:41:42<1:23:50,  2.80s/it][A
Training...:  87% 12111/13907 [7:41:42<1:26:15,  2.88s/it][A
Training...:  87% 12112/13907 [7:41:45<1:24:45,  2.83s/it][A
Training...:  87% 12113/13907 [7:41:48<1:22:39,  2.76s/it][A
Training...:  87% 12114/13907 [7:41:50<1:20:53,  2.71s/it][A
Training...:  87% 12115/13907 [7:41:53<1:19:45,  2.67s/it][A
Training...:  87% 12116/13907 [7:41:56<1:18:59,  2.65s/it][A
Training...:  87% 12117/13907 [7:41:58<1:17:36,  2.60s/it][A
Training...:  87% 12118/13907 [7:42:01<1:16:36,  2.57s/it][A
Training...:  87% 12119/13907 [7:42:03<1:15:37,  2.54s/it][A
Training...:  87% 12120/13907 [7:42:05<1:13:55,  2.48s/it][A
Training...:  87% 12121/13907 [7:42:08<1:12:23,  2.43s/it][A
Training...:  87% 12122/13907 [7:42:10<1:11:24,  2.40s/it][A
Training...:  87% 12123/13907 [7:42:12<1:10:14,  2.36s/it][A
Training...:  87% 12124/13907 [7:42:15<1:09:25,  2.34s/it][A
Training...:  87% 12125/13907 [7:42:17<1:08:24,  2.30s/it][A
Training...:  87% 12126/13907 [7:42:19<1:06:57,  2.26s/it][A
Training...:  87% 12127/13907 [7:42:21<1:05:52,  2.22s/it][A
Training...:  87% 12128/13907 [7:42:23<1:04:53,  2.19s/it][A
Training...:  87% 12129/13907 [7:42:25<1:03:35,  2.15s/it][A
Training...:  87% 12130/13907 [7:42:27<1:02:29,  2.11s/it][A
Training...:  87% 12131/13907 [7:42:29<1:01:21,  2.07s/it][A
Training...:  87% 12132/13907 [7:42:31<1:00:16,  2.04s/it][A
Training...:  87% 12133/13907 [7:42:33<59:21,  2.01s/it]  [A
Training...:  87% 12134/13907 [7:42:35<58:21,  1.98s/it][A
Training...:  87% 12135/13907 [7:42:37<57:27,  1.95s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:12:50<17:31:07, 31533.87s/it]
Training...:  87% 12135/13907 [7:42:39<57:27,  1.95s/it][A
Training...:  87% 12136/13907 [7:42:39<59:09,  2.00s/it][A
Training...:  87% 12137/13907 [7:42:41<58:03,  1.97s/it][A
Training...:  87% 12138/13907 [7:42:43<56:22,  1.91s/it][A
Training...:  87% 12139/13907 [7:42:44<55:05,  1.87s/it][A
Training...:  87% 12140/13907 [7:42:46<53:33,  1.82s/it][A
Training...:  87% 12141/13907 [7:42:48<52:07,  1.77s/it][A
Training...:  87% 12142/13907 [7:42:49<50:53,  1.73s/it][A
Training...:  87% 12143/13907 [7:42:51<49:46,  1.69s/it][A
Training...:  87% 12144/13907 [7:42:53<48:41,  1.66s/it][A
Training...:  87% 12145/13907 [7:42:54<47:20,  1.61s/it][A
Training...:  87% 12146/13907 [7:42:56<45:39,  1.56s/it][A
Training...:  87% 12147/13907 [7:42:57<44:06,  1.50s/it][A
Training...:  87% 12148/13907 [7:42:58<42:19,  1.44s/it][A
Training...:  87% 12149/13907 [7:42:59<40:17,  1.38s/it][A
Training...:  87% 12150/13907 [7:43:00<37:22,  1.28s/it][A
Training...:  87% 12151/13907 [7:43:04<59:11,  2.02s/it][A
Training...:  87% 12152/13907 [7:43:08<1:12:14,  2.47s/it][A
Training...:  87% 12153/13907 [7:43:11<1:18:53,  2.70s/it][A
Training...:  87% 12154/13907 [7:43:14<1:22:48,  2.83s/it][A
Training...:  87% 12155/13907 [7:43:17<1:24:19,  2.89s/it][A
Training...:  87% 12156/13907 [7:43:20<1:24:28,  2.89s/it][A
Training...:  87% 12157/13907 [7:43:23<1:24:13,  2.89s/it][A
Training...:  87% 12158/13907 [7:43:26<1:23:26,  2.86s/it][A
Training...:  87% 12159/13907 [7:43:29<1:22:38,  2.84s/it][A
Training...:  87% 12160/13907 [7:43:31<1:21:32,  2.80s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:13:45<17:31:07, 31533.87s/it]
Training...:  87% 12160/13907 [7:43:34<1:21:32,  2.80s/it][A
Training...:  87% 12161/13907 [7:43:34<1:24:06,  2.89s/it][A
Training...:  87% 12162/13907 [7:43:37<1:22:08,  2.82s/it][A
Training...:  87% 12163/13907 [7:43:40<1:20:00,  2.75s/it][A
Training...:  87% 12164/13907 [7:43:42<1:17:50,  2.68s/it][A
Training...:  87% 12165/13907 [7:43:45<1:16:18,  2.63s/it][A
Training...:  87% 12166/13907 [7:43:47<1:14:48,  2.58s/it][A
Training...:  87% 12167/13907 [7:43:50<1:14:02,  2.55s/it][A
Training...:  87% 12168/13907 [7:43:52<1:13:47,  2.55s/it][A
Training...:  88% 12169/13907 [7:43:55<1:12:57,  2.52s/it][A
Training...:  88% 12170/13907 [7:43:57<1:11:52,  2.48s/it][A
Training...:  88% 12171/13907 [7:43:59<1:10:37,  2.44s/it][A
Training...:  88% 12172/13907 [7:44:02<1:09:20,  2.40s/it][A
Training...:  88% 12173/13907 [7:44:04<1:08:15,  2.36s/it][A
Training...:  88% 12174/13907 [7:44:06<1:07:14,  2.33s/it][A
Training...:  88% 12175/13907 [7:44:08<1:06:11,  2.29s/it][A
Training...:  88% 12176/13907 [7:44:10<1:05:01,  2.25s/it][A
Training...:  88% 12177/13907 [7:44:13<1:03:54,  2.22s/it][A
Training...:  88% 12178/13907 [7:44:15<1:02:25,  2.17s/it][A
Training...:  88% 12179/13907 [7:44:17<1:01:17,  2.13s/it][A
Training...:  88% 12180/13907 [7:44:19<1:00:21,  2.10s/it][A
Training...:  88% 12181/13907 [7:44:21<59:22,  2.06s/it]  [A
Training...:  88% 12182/13907 [7:44:23<58:17,  2.03s/it][A
Training...:  88% 12183/13907 [7:44:25<57:29,  2.00s/it][A
Training...:  88% 12184/13907 [7:44:27<56:45,  1.98s/it][A
Training...:  88% 12185/13907 [7:44:28<56:07,  1.96s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:14:42<17:31:07, 31533.87s/it]
Training...:  88% 12185/13907 [7:44:31<56:07,  1.96s/it][AStep... (38725 | Loss: 0.18885746598243713, Learning Rate: 6.833939551142976e-05, Gradient Norm: 0.6182125806808472)
Step... (38750 | Loss: 0.18011678755283356, Learning Rate: 6.818788824602962e-05, Gradient Norm: 0.8157130479812622)
Step... (38775 | Loss: 0.19337287545204163, Learning Rate: 6.803635915275663e-05, Gradient Norm: 0.6934353113174438)
Step... (38800 | Loss: 0.15975961089134216, Learning Rate: 6.788485188735649e-05, Gradient Norm: 0.8345105648040771)
Step... (38825 | Loss: 0.20895397663116455, Learning Rate: 6.773334462195635e-05, Gradient Norm: 0.9193834066390991)
Step... (38850 | Loss: 0.2109774947166443, Learning Rate: 6.758181552868336e-05, Gradient Norm: 0.7068372964859009)
Step... (38875 | Loss: 0.1833977997303009, Learning Rate: 6.743030826328322e-05, Gradient Norm: 0.8423346281051636)
Step... (38900 | Loss: 0.16954702138900757, Learning Rate: 6.727880099788308e-05, Gradient Norm: 0.9423601627349854)
Step... (38925 | Loss: 0.20804840326309204, Learning Rate: 6.71272719046101e-05, Gradient Norm: 0.8326215744018555)
Step... (38950 | Loss: 0.19036464393138885, Learning Rate: 6.697576463920996e-05, Gradient Norm: 0.8000825643539429)
Step... (38975 | Loss: 0.21445927023887634, Learning Rate: 6.682425737380981e-05, Gradient Norm: 1.0219295024871826)
Step... (39000 | Loss: 0.11996994912624359, Learning Rate: 6.667272828053683e-05, Gradient Norm: 0.5167253613471985)
Step... (39025 | Loss: 0.20245833694934845, Learning Rate: 6.652122101513669e-05, Gradient Norm: 0.6457054615020752)
Step... (39050 | Loss: 0.12764015793800354, Learning Rate: 6.636970647377893e-05, Gradient Norm: 0.5155742764472961)
Step... (39075 | Loss: 0.1851825714111328, Learning Rate: 6.621818465646356e-05, Gradient Norm: 0.5573064684867859)
Step... (39100 | Loss: 0.17739233374595642, Learning Rate: 6.606667011510581e-05, Gradient Norm: 0.9245305061340332)
Step... (39125 | Loss: 0.182869553565979, Learning Rate: 6.591516284970567e-05, Gradient Norm: 1.307139277458191)
Step... (39150 | Loss: 0.2121330350637436, Learning Rate: 6.57636410323903e-05, Gradient Norm: 0.8493169546127319)
Step... (39175 | Loss: 0.16063910722732544, Learning Rate: 6.561212649103254e-05, Gradient Norm: 1.1476854085922241)
Step... (39200 | Loss: 0.17245107889175415, Learning Rate: 6.546060467371717e-05, Gradient Norm: 0.8459355235099792)
Step... (39225 | Loss: 0.1805976927280426, Learning Rate: 6.530909013235942e-05, Gradient Norm: 0.9025959968566895)
Step... (39250 | Loss: 0.19769102334976196, Learning Rate: 6.515758286695927e-05, Gradient Norm: 1.0165013074874878)
Step... (39275 | Loss: 0.17122402787208557, Learning Rate: 6.500605377368629e-05, Gradient Norm: 1.628004550933838)
Step... (39300 | Loss: 0.19580227136611938, Learning Rate: 6.485454650828615e-05, Gradient Norm: 1.1830286979675293)
Step... (39325 | Loss: 0.2106611281633377, Learning Rate: 6.470303924288601e-05, Gradient Norm: 0.9588404893875122)
Step... (39350 | Loss: 0.16830047965049744, Learning Rate: 6.455151014961302e-05, Gradient Norm: 0.8032410144805908)
Step... (39375 | Loss: 0.21135631203651428, Learning Rate: 6.440000288421288e-05, Gradient Norm: 0.8248237371444702)
Step... (39400 | Loss: 0.12658515572547913, Learning Rate: 6.424849561881274e-05, Gradient Norm: 0.5478649139404297)
Step... (39425 | Loss: 0.2673403024673462, Learning Rate: 6.409696652553976e-05, Gradient Norm: 0.9360054135322571)
Step... (39450 | Loss: 0.1607956886291504, Learning Rate: 6.394545926013961e-05, Gradient Norm: 0.693291425704956)
Step... (39475 | Loss: 0.19390326738357544, Learning Rate: 6.379394471878186e-05, Gradient Norm: 0.7416184544563293)
Step... (39500 | Loss: 0.14460593461990356, Learning Rate: 6.364242290146649e-05, Gradient Norm: 0.6968938112258911)
Step... (39525 | Loss: 0.21694722771644592, Learning Rate: 6.349091563606635e-05, Gradient Norm: 0.7088748216629028)
Step... (39550 | Loss: 0.15985049307346344, Learning Rate: 6.333940109470859e-05, Gradient Norm: 0.798818051815033)
Step... (39575 | Loss: 0.20428664982318878, Learning Rate: 6.318787927739322e-05, Gradient Norm: 0.

Evaluating ...:   0% 0/255 [00:00<?, ?it/s][A[A7834184169769287)
Step... (39600 | Loss: 0.11183992028236389, Learning Rate: 6.303636473603547e-05, Gradient Norm: 0.6433755159378052)
Step... (39625 | Loss: 0.198275625705719, Learning Rate: 6.288485747063532e-05, Gradient Norm: 0.7710099220275879)
Step... (39650 | Loss: 0.18810519576072693, Learning Rate: 6.273332837736234e-05, Gradient Norm: 0.7637118697166443)
Step... (39675 | Loss: 0.16738295555114746, Learning Rate: 6.25818211119622e-05, Gradient Norm: 0.4645596444606781)
Step... (39700 | Loss: 0.17023858428001404, Learning Rate: 6.243031384656206e-05, Gradient Norm: 0.929377019405365)
Step... (39725 | Loss: 0.17498710751533508, Learning Rate: 6.227878475328907e-05, Gradient Norm: 0.700470507144928)
Step... (39750 | Loss: 0.12445847690105438, Learning Rate: 6.212727748788893e-05, Gradient Norm: 0.6271137595176697)
Step... (39775 | Loss: 0.2012074887752533, Learning Rate: 6.197577022248879e-05, Gradient Norm: 0.8969606161117554)
Step... (39800 | Loss: 0.153895765542984, Learning Rate: 6.18242411292158e-05, Gradient Norm: 0.8208937644958496)
Step... (39825 | Loss: 0.17427900433540344, Learning Rate: 6.167273386381567e-05, Gradient Norm: 0.6967179179191589)
Step... (39850 | Loss: 0.17525193095207214, Learning Rate: 6.152122659841552e-05, Gradient Norm: 1.0495524406433105)
Step... (39875 | Loss: 0.24522711336612701, Learning Rate: 6.136969750514254e-05, Gradient Norm: 1.0235497951507568)
Step... (39900 | Loss: 0.16416427493095398, Learning Rate: 6.12181902397424e-05, Gradient Norm: 0.9968528747558594)
Step... (39925 | Loss: 0.15651071071624756, Learning Rate: 6.106667569838464e-05, Gradient Norm: 0.6919149160385132)
Step... (39950 | Loss: 0.21528173983097076, Learning Rate: 6.0915150243090466e-05, Gradient Norm: 1.0570416450500488)
Step... (39975 | Loss: 0.1956384927034378, Learning Rate: 6.0763642977690324e-05, Gradient Norm: 0.9130757451057434)
Step... (40000 | Loss: 0.19969774782657623, Learning Rate: 6.0612132074311376e-05, Gradient Norm: 1.2553136348724365)


Evaluating ...:   0% 1/255 [00:04<18:40,  4.41s/it][A[A

Evaluating ...:   1% 2/255 [00:08<17:05,  4.06s/it][A[A

Evaluating ...:   1% 3/255 [00:11<16:04,  3.83s/it][A[A

Evaluating ...:   2% 4/255 [00:15<15:15,  3.65s/it][A[A

Evaluating ...:   2% 5/255 [00:18<14:39,  3.52s/it][A[A

Evaluating ...:   2% 6/255 [00:21<14:04,  3.39s/it][A[A

Evaluating ...:   3% 7/255 [00:24<13:46,  3.33s/it][A[A

Evaluating ...:   3% 8/255 [00:27<13:17,  3.23s/it][A[A

Evaluating ...:   4% 9/255 [00:30<12:52,  3.14s/it][A[A

Evaluating ...:   4% 10/255 [00:33<12:23,  3.03s/it][A[A

Evaluating ...:   4% 11/255 [00:36<12:04,  2.97s/it][A[A

Evaluating ...:   5% 12/255 [00:39<11:39,  2.88s/it][A[A

Evaluating ...:   5% 13/255 [00:41<11:25,  2.83s/it][A[A

Evaluating ...:   5% 14/255 [00:44<11:05,  2.76s/it][A[A

Evaluating ...:   6% 15/255 [00:46<10:52,  2.72s/it][A[A

Evaluating ...:   6% 16/255 [00:49<10:33,  2.65s/it][A[A

Evaluating ...:   7% 17/255 [00:51<10:22,  2.61s/it][A[A

Evaluating ...:   7% 18/255 [00:54<10:06,  2.56s/it][A[A

Evaluating ...:   7% 19/255 [00:56<09:56,  2.53s/it][A[A

Evaluating ...:   8% 20/255 [00:59<09:41,  2.47s/it][A[A

Evaluating ...:   8% 21/255 [01:01<09:30,  2.44s/it][A[A

Evaluating ...:   9% 22/255 [01:03<09:13,  2.38s/it][A[A

Evaluating ...:   9% 23/255 [01:06<09:03,  2.34s/it][A[A

Evaluating ...:   9% 24/255 [01:08<08:47,  2.28s/it][A[A

Evaluating ...:  10% 25/255 [01:10<08:37,  2.25s/it][A[A

Evaluating ...:  10% 26/255 [01:12<08:24,  2.20s/it][A[A

Evaluating ...:  11% 27/255 [01:14<08:17,  2.18s/it][A[A

Evaluating ...:  11% 28/255 [01:16<08:04,  2.13s/it][A[A

Evaluating ...:  11% 29/255 [01:18<07:56,  2.11s/it][A[A

Evaluating ...:  12% 30/255 [01:20<07:43,  2.06s/it][A[A

Evaluating ...:  12% 31/255 [01:22<07:38,  2.05s/it][A[A

Evaluating ...:  13% 32/255 [01:24<07:24,  1.99s/it][A[A

Evaluating ...:  13% 33/255 [01:26<07:16,  1.97s/it][A[A

Evaluating ...:  13% 34/255 [01:28<07:05,  1.92s/it][A[A

Evaluating ...:  14% 35/255 [01:30<06:56,  1.90s/it][A[A

Evaluating ...:  14% 36/255 [01:31<06:43,  1.84s/it][A[A

Evaluating ...:  15% 37/255 [01:33<06:35,  1.82s/it][A[A

Evaluating ...:  15% 38/255 [01:35<06:24,  1.77s/it][A[A

Evaluating ...:  15% 39/255 [01:36<06:16,  1.74s/it][A[A

Evaluating ...:  16% 40/255 [01:38<06:03,  1.69s/it][A[A

Evaluating ...:  16% 41/255 [01:40<05:54,  1.66s/it][A[A

Evaluating ...:  16% 42/255 [01:41<05:40,  1.60s/it][A[A

Evaluating ...:  17% 43/255 [01:42<05:30,  1.56s/it][A[A

Evaluating ...:  17% 44/255 [01:44<05:17,  1.51s/it][A[A

Evaluating ...:  18% 45/255 [01:45<05:08,  1.47s/it][A[A

Evaluating ...:  18% 46/255 [01:47<04:55,  1.41s/it][A[A

Evaluating ...:  18% 47/255 [01:48<04:45,  1.37s/it][A[A

Evaluating ...:  19% 48/255 [01:49<04:30,  1.31s/it][A[A

Evaluating ...:  19% 49/255 [01:50<04:18,  1.25s/it][A[A

Evaluating ...:  20% 50/255 [01:51<03:56,  1.16s/it][A[A

Evaluating ...:  20% 51/255 [01:55<06:54,  2.03s/it][A[A

Evaluating ...:  20% 52/255 [01:59<08:41,  2.57s/it][A[A

Evaluating ...:  21% 53/255 [02:03<09:47,  2.91s/it][A[A

Evaluating ...:  21% 54/255 [02:06<10:24,  3.11s/it][A[A

Evaluating ...:  22% 55/255 [02:10<10:45,  3.23s/it][A[A

Evaluating ...:  22% 56/255 [02:13<10:51,  3.27s/it][A[A

Evaluating ...:  22% 57/255 [02:16<10:51,  3.29s/it][A[A

Evaluating ...:  23% 58/255 [02:20<10:43,  3.27s/it][A[A

Evaluating ...:  23% 59/255 [02:23<10:40,  3.27s/it][A[A

Evaluating ...:  24% 60/255 [02:26<10:28,  3.22s/it][A[A

Evaluating ...:  24% 61/255 [02:29<10:19,  3.19s/it][A[A

Evaluating ...:  24% 62/255 [02:32<10:04,  3.13s/it][A[A

Evaluating ...:  25% 63/255 [02:35<09:54,  3.10s/it][A[A

Evaluating ...:  25% 64/255 [02:38<09:41,  3.04s/it][A[A

Evaluating ...:  25% 65/255 [02:41<09:32,  3.01s/it][A[A

Evaluating ...:  26% 66/255 [02:44<09:18,  2.96s/it][A[A

Evaluating ...:  26% 67/255 [02:47<09:11,  2.93s/it][A[A

Evaluating ...:  27% 68/255 [02:49<08:58,  2.88s/it][A[A

Evaluating ...:  27% 69/255 [02:52<08:52,  2.86s/it][A[A

Evaluating ...:  27% 70/255 [02:55<08:38,  2.80s/it][A[A

Evaluating ...:  28% 71/255 [02:58<08:32,  2.78s/it][A[A

Evaluating ...:  28% 72/255 [03:00<08:18,  2.72s/it][A[A

Evaluating ...:  29% 73/255 [03:03<08:12,  2.71s/it][A[A

Evaluating ...:  29% 74/255 [03:05<08:01,  2.66s/it][A[A

Evaluating ...:  29% 75/255 [03:08<07:53,  2.63s/it][A[A

Evaluating ...:  30% 76/255 [03:10<07:42,  2.58s/it][A[A

Evaluating ...:  30% 77/255 [03:13<07:34,  2.56s/it][A[A

Evaluating ...:  31% 78/255 [03:15<07:25,  2.51s/it][A[A

Evaluating ...:  31% 79/255 [03:18<07:19,  2.50s/it][A[A

Evaluating ...:  31% 80/255 [03:20<07:11,  2.47s/it][A[A

Evaluating ...:  32% 81/255 [03:23<07:05,  2.44s/it][A[A

Evaluating ...:  32% 82/255 [03:25<06:53,  2.39s/it][A[A

Evaluating ...:  33% 83/255 [03:27<06:45,  2.36s/it][A[A

Evaluating ...:  33% 84/255 [03:29<06:34,  2.31s/it][A[A

Evaluating ...:  33% 85/255 [03:32<06:27,  2.28s/it][A[A

Evaluating ...:  34% 86/255 [03:34<06:16,  2.23s/it][A[A

Evaluating ...:  34% 87/255 [03:36<06:10,  2.20s/it][A[A

Evaluating ...:  35% 88/255 [03:38<06:00,  2.16s/it][A[A

Evaluating ...:  35% 89/255 [03:40<05:53,  2.13s/it][A[A

Evaluating ...:  35% 90/255 [03:42<05:45,  2.10s/it][A[A

Evaluating ...:  36% 91/255 [03:44<05:38,  2.06s/it][A[A

Evaluating ...:  36% 92/255 [03:46<05:29,  2.02s/it][A[A

Evaluating ...:  36% 93/255 [03:48<05:21,  1.99s/it][A[A

Evaluating ...:  37% 94/255 [03:50<05:11,  1.93s/it][A[A

Evaluating ...:  37% 95/255 [03:51<05:04,  1.90s/it][A[A

Evaluating ...:  38% 96/255 [03:53<04:53,  1.84s/it][A[A

Evaluating ...:  38% 97/255 [03:55<04:44,  1.80s/it][A[A

Evaluating ...:  38% 98/255 [03:56<04:29,  1.71s/it][A[A

Evaluating ...:  39% 99/255 [03:58<04:13,  1.63s/it][A[A

Evaluating ...:  39% 100/255 [03:59<03:51,  1.50s/it][A[A

Evaluating ...:  40% 101/255 [04:03<05:56,  2.31s/it][A[A

Evaluating ...:  40% 102/255 [04:07<07:02,  2.76s/it][A[A

Evaluating ...:  40% 103/255 [04:11<07:41,  3.03s/it][A[A

Evaluating ...:  41% 104/255 [04:14<08:02,  3.20s/it][A[A

Evaluating ...:  41% 105/255 [04:18<08:11,  3.27s/it][A[A

Evaluating ...:  42% 106/255 [04:21<08:10,  3.29s/it][A[A

Evaluating ...:  42% 107/255 [04:24<08:08,  3.30s/it][A[A

Evaluating ...:  42% 108/255 [04:28<07:59,  3.26s/it][A[A

Evaluating ...:  43% 109/255 [04:31<07:55,  3.25s/it][A[A

Evaluating ...:  43% 110/255 [04:34<07:42,  3.19s/it][A[A

Evaluating ...:  44% 111/255 [04:37<07:35,  3.16s/it][A[A

Evaluating ...:  44% 112/255 [04:40<07:28,  3.14s/it][A[A

Evaluating ...:  44% 113/255 [04:43<07:18,  3.09s/it][A[A

Evaluating ...:  45% 114/255 [04:46<07:04,  3.01s/it][A[A

Evaluating ...:  45% 115/255 [04:49<06:55,  2.97s/it][A[A

Evaluating ...:  45% 116/255 [04:51<06:43,  2.90s/it][A[A

Evaluating ...:  46% 117/255 [04:54<06:35,  2.86s/it][A[A

Evaluating ...:  46% 118/255 [04:57<06:24,  2.81s/it][A[A

Evaluating ...:  47% 119/255 [05:00<06:17,  2.77s/it][A[A

Evaluating ...:  47% 120/255 [05:02<06:07,  2.72s/it][A[A

Evaluating ...:  47% 121/255 [05:05<06:01,  2.70s/it][A[A

Evaluating ...:  48% 122/255 [05:07<05:53,  2.66s/it][A[A

Evaluating ...:  48% 123/255 [05:10<05:46,  2.62s/it][A[A

Evaluating ...:  49% 124/255 [05:12<05:38,  2.58s/it][A[A

Evaluating ...:  49% 125/255 [05:15<05:32,  2.56s/it][A[A

Evaluating ...:  49% 126/255 [05:17<05:24,  2.52s/it][A[A

Evaluating ...:  50% 127/255 [05:20<05:18,  2.49s/it][A[A

Evaluating ...:  50% 128/255 [05:22<05:10,  2.45s/it][A[A

Evaluating ...:  51% 129/255 [05:24<05:04,  2.42s/it][A[A

Evaluating ...:  51% 130/255 [05:27<04:56,  2.37s/it][A[A

Evaluating ...:  51% 131/255 [05:29<04:49,  2.34s/it][A[A

Evaluating ...:  52% 132/255 [05:31<04:42,  2.30s/it][A[A

Evaluating ...:  52% 133/255 [05:33<04:37,  2.27s/it][A[A

Evaluating ...:  53% 134/255 [05:35<04:28,  2.22s/it][A[A

Evaluating ...:  53% 135/255 [05:38<04:23,  2.20s/it][A[A

Evaluating ...:  53% 136/255 [05:40<04:15,  2.15s/it][A[A

Evaluating ...:  54% 137/255 [05:42<04:11,  2.13s/it][A[A

Evaluating ...:  54% 138/255 [05:44<04:04,  2.09s/it][A[A

Evaluating ...:  55% 139/255 [05:46<04:00,  2.07s/it][A[A

Evaluating ...:  55% 140/255 [05:48<03:54,  2.04s/it][A[A

Evaluating ...:  55% 141/255 [05:50<03:47,  2.00s/it][A[A

Evaluating ...:  56% 142/255 [05:51<03:38,  1.93s/it][A[A

Evaluating ...:  56% 143/255 [05:53<03:32,  1.90s/it][A[A

Evaluating ...:  56% 144/255 [05:55<03:23,  1.83s/it][A[A

Evaluating ...:  57% 145/255 [05:57<03:16,  1.79s/it][A[A

Evaluating ...:  57% 146/255 [05:58<03:08,  1.73s/it][A[A

Evaluating ...:  58% 147/255 [06:00<03:01,  1.68s/it][A[A

Evaluating ...:  58% 148/255 [06:01<02:51,  1.60s/it][A[A

Evaluating ...:  58% 149/255 [06:02<02:40,  1.52s/it][A[A

Evaluating ...:  59% 150/255 [06:04<02:25,  1.39s/it][A[A

Evaluating ...:  59% 151/255 [06:08<03:48,  2.20s/it][A[A

Evaluating ...:  60% 152/255 [06:12<04:39,  2.72s/it][A[A

Evaluating ...:  60% 153/255 [06:15<05:08,  3.03s/it][A[A

Evaluating ...:  60% 154/255 [06:19<05:22,  3.19s/it][A[A

Evaluating ...:  61% 155/255 [06:22<05:27,  3.28s/it][A[A

Evaluating ...:  61% 156/255 [06:26<05:28,  3.31s/it][A[A

Evaluating ...:  62% 157/255 [06:29<05:26,  3.33s/it][A[A

Evaluating ...:  62% 158/255 [06:32<05:21,  3.32s/it][A[A

Evaluating ...:  62% 159/255 [06:36<05:16,  3.29s/it][A[A

Evaluating ...:  63% 160/255 [06:39<05:07,  3.24s/it][A[A

Evaluating ...:  63% 161/255 [06:42<05:00,  3.20s/it][A[A

Evaluating ...:  64% 162/255 [06:45<04:52,  3.14s/it][A[A

Evaluating ...:  64% 163/255 [06:48<04:48,  3.14s/it][A[A

Evaluating ...:  64% 164/255 [06:51<04:39,  3.07s/it][A[A

Evaluating ...:  65% 165/255 [06:54<04:30,  3.01s/it][A[A

Evaluating ...:  65% 166/255 [06:57<04:21,  2.94s/it][A[A

Evaluating ...:  65% 167/255 [06:59<04:14,  2.89s/it][A[A

Evaluating ...:  66% 168/255 [07:02<04:07,  2.84s/it][A[A

Evaluating ...:  66% 169/255 [07:05<04:01,  2.81s/it][A[A

Evaluating ...:  67% 170/255 [07:07<03:53,  2.75s/it][A[A

Evaluating ...:  67% 171/255 [07:10<03:48,  2.72s/it][A[A

Evaluating ...:  67% 172/255 [07:13<03:42,  2.68s/it][A[A

Evaluating ...:  68% 173/255 [07:15<03:40,  2.68s/it][A[A

Evaluating ...:  68% 174/255 [07:18<03:34,  2.65s/it][A[A

Evaluating ...:  69% 175/255 [07:21<03:29,  2.62s/it][A[A

Evaluating ...:  69% 176/255 [07:23<03:23,  2.58s/it][A[A

Evaluating ...:  69% 177/255 [07:25<03:18,  2.55s/it][A[A

Evaluating ...:  70% 178/255 [07:28<03:13,  2.51s/it][A[A

Evaluating ...:  70% 179/255 [07:30<03:08,  2.48s/it][A[A

Evaluating ...:  71% 180/255 [07:33<03:02,  2.43s/it][A[A

Evaluating ...:  71% 181/255 [07:35<02:56,  2.39s/it][A[A

Evaluating ...:  71% 182/255 [07:37<02:52,  2.36s/it][A[A

Evaluating ...:  72% 183/255 [07:40<02:49,  2.35s/it][A[A

Evaluating ...:  72% 184/255 [07:42<02:42,  2.29s/it][A[A

Evaluating ...:  73% 185/255 [07:44<02:38,  2.26s/it][A[A

Evaluating ...:  73% 186/255 [07:46<02:32,  2.21s/it][A[A

Evaluating ...:  73% 187/255 [07:48<02:28,  2.18s/it][A[A

Evaluating ...:  74% 188/255 [07:50<02:23,  2.14s/it][A[A

Evaluating ...:  74% 189/255 [07:52<02:19,  2.11s/it][A[A

Evaluating ...:  75% 190/255 [07:54<02:14,  2.07s/it][A[A

Evaluating ...:  75% 191/255 [07:56<02:10,  2.04s/it][A[A

Evaluating ...:  75% 192/255 [07:58<02:05,  1.99s/it][A[A

Evaluating ...:  76% 193/255 [08:00<02:01,  1.96s/it][A[A

Evaluating ...:  76% 194/255 [08:02<01:56,  1.91s/it][A[A

Evaluating ...:  76% 195/255 [08:03<01:52,  1.87s/it][A[A

Evaluating ...:  77% 196/255 [08:05<01:46,  1.80s/it][A[A

Evaluating ...:  77% 197/255 [08:07<01:41,  1.76s/it][A[A

Evaluating ...:  78% 198/255 [08:08<01:35,  1.67s/it][A[A

Evaluating ...:  78% 199/255 [08:10<01:29,  1.60s/it][A[A

Evaluating ...:  78% 200/255 [08:11<01:20,  1.46s/it][A[A

Evaluating ...:  79% 201/255 [08:15<02:06,  2.35s/it][A[A

Evaluating ...:  79% 202/255 [08:19<02:27,  2.78s/it][A[A

Evaluating ...:  80% 203/255 [08:23<02:37,  3.04s/it][A[A

Evaluating ...:  80% 204/255 [08:26<02:41,  3.16s/it][A[A

Evaluating ...:  80% 205/255 [08:29<02:41,  3.22s/it][A[A

Evaluating ...:  81% 206/255 [08:33<02:37,  3.21s/it][A[A

Evaluating ...:  81% 207/255 [08:36<02:32,  3.18s/it][A[A

Evaluating ...:  82% 208/255 [08:39<02:26,  3.12s/it][A[A

Evaluating ...:  82% 209/255 [08:42<02:21,  3.08s/it][A[A

Evaluating ...:  82% 210/255 [08:45<02:15,  3.01s/it][A[A

Evaluating ...:  83% 211/255 [08:47<02:11,  2.99s/it][A[A

Evaluating ...:  83% 212/255 [08:50<02:06,  2.95s/it][A[A

Evaluating ...:  84% 213/255 [08:53<02:01,  2.89s/it][A[A

Evaluating ...:  84% 214/255 [08:56<01:55,  2.82s/it][A[A

Evaluating ...:  84% 215/255 [08:58<01:50,  2.77s/it][A[A

Evaluating ...:  85% 216/255 [09:01<01:45,  2.71s/it][A[A

Evaluating ...:  85% 217/255 [09:04<01:41,  2.67s/it][A[A

Evaluating ...:  85% 218/255 [09:06<01:36,  2.62s/it][A[A

Evaluating ...:  86% 219/255 [09:09<01:32,  2.58s/it][A[A

Evaluating ...:  86% 220/255 [09:11<01:28,  2.54s/it][A[A

Evaluating ...:  87% 221/255 [09:13<01:25,  2.51s/it][A[A

Evaluating ...:  87% 222/255 [09:16<01:20,  2.45s/it][A[A

Evaluating ...:  87% 223/255 [09:18<01:17,  2.41s/it][A[A

Evaluating ...:  88% 224/255 [09:20<01:12,  2.35s/it][A[A

Evaluating ...:  88% 225/255 [09:23<01:09,  2.33s/it][A[A

Evaluating ...:  89% 226/255 [09:25<01:05,  2.27s/it][A[A

Evaluating ...:  89% 227/255 [09:27<01:02,  2.24s/it][A[A

Evaluating ...:  89% 228/255 [09:29<00:58,  2.18s/it][A[A

Evaluating ...:  90% 229/255 [09:31<00:55,  2.14s/it][A[A

Evaluating ...:  90% 230/255 [09:33<00:52,  2.09s/it][A[A

Evaluating ...:  91% 231/255 [09:35<00:49,  2.07s/it][A[A

Evaluating ...:  91% 232/255 [09:37<00:46,  2.02s/it][A[A

Evaluating ...:  91% 233/255 [09:39<00:43,  2.00s/it][A[A

Evaluating ...:  92% 234/255 [09:41<00:41,  1.96s/it][A[A

Evaluating ...:  92% 235/255 [09:43<00:39,  1.95s/it][A[A

Evaluating ...:  93% 236/255 [09:44<00:36,  1.90s/it][A[A

Evaluating ...:  93% 237/255 [09:46<00:33,  1.86s/it][A[A

Evaluating ...:  93% 238/255 [09:48<00:30,  1.81s/it][A[A

Evaluating ...:  94% 239/255 [09:49<00:28,  1.77s/it][A[A

Evaluating ...:  94% 240/255 [09:51<00:25,  1.72s/it][A[A

Evaluating ...:  95% 241/255 [09:53<00:23,  1.68s/it][A[A

Evaluating ...:  95% 242/255 [09:54<00:21,  1.62s/it][A[A

Evaluating ...:  95% 243/255 [09:56<00:18,  1.57s/it][A[A

Evaluating ...:  96% 244/255 [09:57<00:16,  1.51s/it][A[A

Evaluating ...:  96% 245/255 [09:58<00:14,  1.47s/it][A[A

Evaluating ...:  96% 246/255 [10:00<00:12,  1.41s/it][A[A

Evaluating ...:  97% 247/255 [10:01<00:10,  1.37s/it][A[A

Evaluating ...:  97% 248/255 [10:02<00:09,  1.30s/it][A[A

Evaluating ...:  98% 249/255 [10:03<00:07,  1.24s/it][A[A

Evaluating ...:  98% 250/255 [10:04<00:05,  1.14s/it][A[A

Evaluating ...:  98% 251/255 [10:08<00:07,  1.92s/it][A[A

Evaluating ...:  99% 252/255 [10:10<00:06,  2.08s/it][A[A

Evaluating ...:  99% 253/255 [10:12<00:04,  2.06s/it][A[A

Evaluating ...: 100% 254/255 [10:14<00:01,  1.93s/it][A[A

Evaluating ...: 100% 255/255 [10:15<00:00,  1.73s/it][A[AEvaluating ...: 100% 255/255 [10:15<00:00,  2.41s/it]
/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/tree_util.py:188: FutureWarning: jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() instead as a drop-in replacement.
  warnings.warn('jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() '
                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.33585789799690247 | Eval wer: 0.30566992192403286 |):  50% 2/4 [25:25:10<17:31:07, 31533.87s/it]
Training...:  88% 12185/13907 [7:54:59<56:07,  1.96s/it][AConfiguration saved in /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/flax-wav2vec2-ctc-cv9-baseline/config.json
Model weights saved in /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/flax-wav2vec2-ctc-cv9-baseline/flax_model.msgpack
tokenizer config file saved in ./flax-wav2vec2-ctc-cv9-baseline/tokenizer_config.json
Special tokens file saved in ./flax-wav2vec2-ctc-cv9-baseline/special_tokens_map.json

Training...:  88% 12186/13907 [7:55:52<98:40:00, 206.39s/it][A
Training...:  88% 12187/13907 [7:55:54<69:20:16, 145.13s/it][A
Training...:  88% 12188/13907 [7:55:56<48:46:29, 102.15s/it][A
Training...:  88% 12189/13907 [7:55:58<34:22:57, 72.05s/it] [A
Training...:  88% 12190/13907 [7:55:59<24:18:31, 50.97s/it][A
Training...:  88% 12191/13907 [7:56:01<17:15:11, 36.20s/it][A
Training...:  88% 12192/13907 [7:56:03<12:19:01, 25.86s/it][A
Training...:  88% 12193/13907 [7:56:05<8:51:25, 18.60s/it] [A
Training...:  88% 12194/13907 [7:56:06<6:26:09, 13.53s/it][A
Training...:  88% 12195/13907 [7:56:08<4:43:50,  9.95s/it][A
Training...:  88% 12196/13907 [7:56:09<3:31:24,  7.41s/it][A
Training...:  88% 12197/13907 [7:56:11<2:40:37,  5.64s/it][A
Training...:  88% 12198/13907 [7:56:12<2:04:16,  4.36s/it][A
Training...:  88% 12199/13907 [7:56:14<1:37:54,  3.44s/it][A
Training...:  88% 12200/13907 [7:56:15<1:17:45,  2.73s/it][A
Training...:  88% 12201/13907 [7:56:19<1:27:53,  3.09s/it][A
Training...:  88% 12202/13907 [7:56:22<1:32:33,  3.26s/it][A
Training...:  88% 12203/13907 [7:56:26<1:33:26,  3.29s/it][A
Training...:  88% 12204/13907 [7:56:29<1:32:33,  3.26s/it][A
Training...:  88% 12205/13907 [7:56:32<1:31:12,  3.22s/it][A
Training...:  88% 12206/13907 [7:56:35<1:29:06,  3.14s/it][A
Training...:  88% 12207/13907 [7:56:38<1:27:34,  3.09s/it][A
Training...:  88% 12208/13907 [7:56:41<1:26:09,  3.04s/it][A
Training...:  88% 12209/13907 [7:56:44<1:24:56,  3.00s/it][A
Training...:  88% 12210/13907 [7:56:46<1:23:10,  2.94s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:27:01<17:31:07, 31533.87s/it]
Training...:  88% 12210/13907 [7:56:50<1:23:10,  2.94s/it][A
Training...:  88% 12211/13907 [7:56:50<1:24:54,  3.00s/it][A
Training...:  88% 12212/13907 [7:56:52<1:22:51,  2.93s/it][A
Training...:  88% 12213/13907 [7:56:55<1:20:17,  2.84s/it][A
Training...:  88% 12214/13907 [7:56:58<1:17:52,  2.76s/it][A
Training...:  88% 12215/13907 [7:57:00<1:15:32,  2.68s/it][A
Training...:  88% 12216/13907 [7:57:03<1:13:47,  2.62s/it][A
Training...:  88% 12217/13907 [7:57:05<1:12:23,  2.57s/it][A
Training...:  88% 12218/13907 [7:57:07<1:10:59,  2.52s/it][A
Training...:  88% 12219/13907 [7:57:10<1:09:30,  2.47s/it][A
Training...:  88% 12220/13907 [7:57:12<1:08:39,  2.44s/it][A
Training...:  88% 12221/13907 [7:57:14<1:07:52,  2.42s/it][A
Training...:  88% 12222/13907 [7:57:17<1:06:49,  2.38s/it][A
Training...:  88% 12223/13907 [7:57:19<1:06:40,  2.38s/it][A
Training...:  88% 12224/13907 [7:57:21<1:05:35,  2.34s/it][A
Training...:  88% 12225/13907 [7:57:24<1:04:20,  2.30s/it][A
Training...:  88% 12226/13907 [7:57:26<1:03:17,  2.26s/it][A
Training...:  88% 12227/13907 [7:57:28<1:02:15,  2.22s/it][A
Training...:  88% 12228/13907 [7:57:30<1:01:15,  2.19s/it][A
Training...:  88% 12229/13907 [7:57:32<1:00:14,  2.15s/it][A
Training...:  88% 12230/13907 [7:57:34<59:16,  2.12s/it]  [A
Training...:  88% 12231/13907 [7:57:36<58:23,  2.09s/it][A
Training...:  88% 12232/13907 [7:57:38<57:25,  2.06s/it][A
Training...:  88% 12233/13907 [7:57:40<56:30,  2.03s/it][A
Training...:  88% 12234/13907 [7:57:42<55:41,  2.00s/it][A
Training...:  88% 12235/13907 [7:57:44<54:51,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:27:57<17:31:07, 31533.87s/it]
Training...:  88% 12235/13907 [7:57:46<54:51,  1.97s/it][A
Training...:  88% 12236/13907 [7:57:46<56:34,  2.03s/it][A
Training...:  88% 12237/13907 [7:57:48<55:23,  1.99s/it][A
Training...:  88% 12238/13907 [7:57:50<53:33,  1.93s/it][A
Training...:  88% 12239/13907 [7:57:52<52:24,  1.88s/it][A
Training...:  88% 12240/13907 [7:57:53<51:04,  1.84s/it][A
Training...:  88% 12241/13907 [7:57:55<49:53,  1.80s/it][A
Training...:  88% 12242/13907 [7:57:57<48:33,  1.75s/it][A
Training...:  88% 12243/13907 [7:57:58<47:31,  1.71s/it][A
Training...:  88% 12244/13907 [7:58:00<46:24,  1.67s/it][A
Training...:  88% 12245/13907 [7:58:01<45:22,  1.64s/it][A
Training...:  88% 12246/13907 [7:58:03<44:07,  1.59s/it][A
Training...:  88% 12247/13907 [7:58:04<42:37,  1.54s/it][A
Training...:  88% 12248/13907 [7:58:06<40:59,  1.48s/it][A
Training...:  88% 12249/13907 [7:58:07<38:54,  1.41s/it][A
Training...:  88% 12250/13907 [7:58:08<36:07,  1.31s/it][A
Training...:  88% 12251/13907 [7:58:12<55:56,  2.03s/it][A
Training...:  88% 12252/13907 [7:58:15<1:08:19,  2.48s/it][A
Training...:  88% 12253/13907 [7:58:19<1:15:12,  2.73s/it][A
Training...:  88% 12254/13907 [7:58:22<1:18:45,  2.86s/it][A
Training...:  88% 12255/13907 [7:58:25<1:20:19,  2.92s/it][A
Training...:  88% 12256/13907 [7:58:28<1:20:36,  2.93s/it][A
Training...:  88% 12257/13907 [7:58:31<1:20:17,  2.92s/it][A
Training...:  88% 12258/13907 [7:58:33<1:19:33,  2.89s/it][A
Training...:  88% 12259/13907 [7:58:36<1:18:24,  2.85s/it][A
Training...:  88% 12260/13907 [7:58:39<1:17:05,  2.81s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:28:53<17:31:07, 31533.87s/it]
Training...:  88% 12260/13907 [7:58:42<1:17:05,  2.81s/it][A
Training...:  88% 12261/13907 [7:58:42<1:19:46,  2.91s/it][A
Training...:  88% 12262/13907 [7:58:45<1:18:22,  2.86s/it][A
Training...:  88% 12263/13907 [7:58:47<1:16:49,  2.80s/it][A
Training...:  88% 12264/13907 [7:58:50<1:15:04,  2.74s/it][A
Training...:  88% 12265/13907 [7:58:53<1:13:05,  2.67s/it][A
Training...:  88% 12266/13907 [7:58:55<1:11:33,  2.62s/it][A
Training...:  88% 12267/13907 [7:58:57<1:10:00,  2.56s/it][A
Training...:  88% 12268/13907 [7:59:00<1:08:45,  2.52s/it][A
Training...:  88% 12269/13907 [7:59:02<1:07:30,  2.47s/it][A
Training...:  88% 12270/13907 [7:59:05<1:06:36,  2.44s/it][A
Training...:  88% 12271/13907 [7:59:07<1:05:33,  2.40s/it][A
Training...:  88% 12272/13907 [7:59:09<1:04:21,  2.36s/it][A
Training...:  88% 12273/13907 [7:59:11<1:03:29,  2.33s/it][A
Training...:  88% 12274/13907 [7:59:14<1:02:47,  2.31s/it][A
Training...:  88% 12275/13907 [7:59:16<1:02:01,  2.28s/it][A
Training...:  88% 12276/13907 [7:59:18<1:01:14,  2.25s/it][A
Training...:  88% 12277/13907 [7:59:20<1:00:28,  2.23s/it][A
Training...:  88% 12278/13907 [7:59:22<59:33,  2.19s/it]  [A
Training...:  88% 12279/13907 [7:59:24<58:43,  2.16s/it][A
Training...:  88% 12280/13907 [7:59:27<57:48,  2.13s/it][A
Training...:  88% 12281/13907 [7:59:29<56:54,  2.10s/it][A
Training...:  88% 12282/13907 [7:59:31<56:06,  2.07s/it][A
Training...:  88% 12283/13907 [7:59:33<55:16,  2.04s/it][A
Training...:  88% 12284/13907 [7:59:35<55:12,  2.04s/it][A
Training...:  88% 12285/13907 [7:59:37<54:09,  2.00s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:29:50<17:31:07, 31533.87s/it]
Training...:  88% 12285/13907 [7:59:39<54:09,  2.00s/it][A
Training...:  88% 12286/13907 [7:59:39<55:33,  2.06s/it][A
Training...:  88% 12287/13907 [7:59:41<54:18,  2.01s/it][A
Training...:  88% 12288/13907 [7:59:42<52:45,  1.96s/it][A
Training...:  88% 12289/13907 [7:59:44<51:27,  1.91s/it][A
Training...:  88% 12290/13907 [7:59:46<50:04,  1.86s/it][A
Training...:  88% 12291/13907 [7:59:48<48:48,  1.81s/it][A
Training...:  88% 12292/13907 [7:59:49<47:31,  1.77s/it][A
Training...:  88% 12293/13907 [7:59:51<46:15,  1.72s/it][A
Training...:  88% 12294/13907 [7:59:53<45:10,  1.68s/it][A
Training...:  88% 12295/13907 [7:59:54<43:45,  1.63s/it][A
Training...:  88% 12296/13907 [7:59:55<42:29,  1.58s/it][A
Training...:  88% 12297/13907 [7:59:57<40:58,  1.53s/it][A
Training...:  88% 12298/13907 [7:59:58<39:27,  1.47s/it][A
Training...:  88% 12299/13907 [7:59:59<37:45,  1.41s/it][A
Training...:  88% 12300/13907 [8:00:01<35:08,  1.31s/it][A
Training...:  88% 12301/13907 [8:00:04<55:10,  2.06s/it][A
Training...:  88% 12302/13907 [8:00:08<1:07:27,  2.52s/it][A
Training...:  88% 12303/13907 [8:00:11<1:14:35,  2.79s/it][A
Training...:  88% 12304/13907 [8:00:15<1:18:05,  2.92s/it][A
Training...:  88% 12305/13907 [8:00:18<1:19:52,  2.99s/it][A
Training...:  88% 12306/13907 [8:00:21<1:20:26,  3.01s/it][A
Training...:  88% 12307/13907 [8:00:24<1:20:16,  3.01s/it][A
Training...:  89% 12308/13907 [8:00:27<1:20:20,  3.01s/it][A
Training...:  89% 12309/13907 [8:00:30<1:18:45,  2.96s/it][A
Training...:  89% 12310/13907 [8:00:33<1:17:33,  2.91s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:30:47<17:31:07, 31533.87s/it]
Training...:  89% 12310/13907 [8:00:36<1:17:33,  2.91s/it][A
Training...:  89% 12311/13907 [8:00:36<1:19:23,  2.98s/it][A
Training...:  89% 12312/13907 [8:00:38<1:17:14,  2.91s/it][A
Training...:  89% 12313/13907 [8:00:41<1:14:36,  2.81s/it][A
Training...:  89% 12314/13907 [8:00:44<1:12:27,  2.73s/it][A
Training...:  89% 12315/13907 [8:00:46<1:10:48,  2.67s/it][A
Training...:  89% 12316/13907 [8:00:49<1:09:06,  2.61s/it][A
Training...:  89% 12317/13907 [8:00:51<1:07:25,  2.54s/it][A
Training...:  89% 12318/13907 [8:00:53<1:06:09,  2.50s/it][A
Training...:  89% 12319/13907 [8:00:56<1:05:11,  2.46s/it][A
Training...:  89% 12320/13907 [8:00:58<1:04:04,  2.42s/it][A
Training...:  89% 12321/13907 [8:01:00<1:03:12,  2.39s/it][A
Training...:  89% 12322/13907 [8:01:03<1:02:29,  2.37s/it][A
Training...:  89% 12323/13907 [8:01:05<1:01:31,  2.33s/it][A
Training...:  89% 12324/13907 [8:01:07<1:00:43,  2.30s/it][A
Training...:  89% 12325/13907 [8:01:09<59:56,  2.27s/it]  [A
Training...:  89% 12326/13907 [8:01:11<59:07,  2.24s/it][A
Training...:  89% 12327/13907 [8:01:14<58:07,  2.21s/it][A
Training...:  89% 12328/13907 [8:01:16<57:26,  2.18s/it][A
Training...:  89% 12329/13907 [8:01:18<56:31,  2.15s/it][A
Training...:  89% 12330/13907 [8:01:20<55:29,  2.11s/it][A
Training...:  89% 12331/13907 [8:01:22<54:37,  2.08s/it][A
Training...:  89% 12332/13907 [8:01:24<53:46,  2.05s/it][A
Training...:  89% 12333/13907 [8:01:26<53:03,  2.02s/it][A
Training...:  89% 12334/13907 [8:01:28<52:11,  1.99s/it][A
Training...:  89% 12335/13907 [8:01:30<51:50,  1.98s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:31:43<17:31:07, 31533.87s/it]
Training...:  89% 12335/13907 [8:01:32<51:50,  1.98s/it][A
Training...:  89% 12336/13907 [8:01:32<53:47,  2.05s/it][A
Training...:  89% 12337/13907 [8:01:34<52:42,  2.01s/it][A
Training...:  89% 12338/13907 [8:01:36<50:52,  1.95s/it][A
Training...:  89% 12339/13907 [8:01:37<49:19,  1.89s/it][A
Training...:  89% 12340/13907 [8:01:39<48:00,  1.84s/it][A
Training...:  89% 12341/13907 [8:01:41<46:47,  1.79s/it][A
Training...:  89% 12342/13907 [8:01:42<45:29,  1.74s/it][A
Training...:  89% 12343/13907 [8:01:44<44:21,  1.70s/it][A
Training...:  89% 12344/13907 [8:01:46<43:31,  1.67s/it][A
Training...:  89% 12345/13907 [8:01:47<42:11,  1.62s/it][A
Training...:  89% 12346/13907 [8:01:49<40:46,  1.57s/it][A
Training...:  89% 12347/13907 [8:01:50<39:15,  1.51s/it][A
Training...:  89% 12348/13907 [8:01:51<37:39,  1.45s/it][A
Training...:  89% 12349/13907 [8:01:52<35:52,  1.38s/it][A
Training...:  89% 12350/13907 [8:01:53<33:18,  1.28s/it][A
Training...:  89% 12351/13907 [8:01:57<52:27,  2.02s/it][A
Training...:  89% 12352/13907 [8:02:01<1:03:53,  2.47s/it][A
Training...:  89% 12353/13907 [8:02:04<1:10:00,  2.70s/it][A
Training...:  89% 12354/13907 [8:02:07<1:13:04,  2.82s/it][A
Training...:  89% 12355/13907 [8:02:10<1:14:34,  2.88s/it][A
Training...:  89% 12356/13907 [8:02:13<1:14:48,  2.89s/it][A
Training...:  89% 12357/13907 [8:02:16<1:14:35,  2.89s/it][A
Training...:  89% 12358/13907 [8:02:19<1:14:13,  2.88s/it][A
Training...:  89% 12359/13907 [8:02:21<1:13:09,  2.84s/it][A
Training...:  89% 12360/13907 [8:02:24<1:12:07,  2.80s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:32:38<17:31:07, 31533.87s/it]
Training...:  89% 12360/13907 [8:02:27<1:12:07,  2.80s/it][A
Training...:  89% 12361/13907 [8:02:27<1:14:15,  2.88s/it][A
Training...:  89% 12362/13907 [8:02:30<1:12:54,  2.83s/it][A
Training...:  89% 12363/13907 [8:02:33<1:10:52,  2.75s/it][A
Training...:  89% 12364/13907 [8:02:35<1:09:09,  2.69s/it][A
Training...:  89% 12365/13907 [8:02:38<1:07:33,  2.63s/it][A
Training...:  89% 12366/13907 [8:02:40<1:06:30,  2.59s/it][A
Training...:  89% 12367/13907 [8:02:43<1:06:07,  2.58s/it][A
Training...:  89% 12368/13907 [8:02:45<1:04:53,  2.53s/it][A
Training...:  89% 12369/13907 [8:02:47<1:03:33,  2.48s/it][A
Training...:  89% 12370/13907 [8:02:50<1:02:29,  2.44s/it][A
Training...:  89% 12371/13907 [8:02:52<1:01:35,  2.41s/it][A
Training...:  89% 12372/13907 [8:02:54<1:00:27,  2.36s/it][A
Training...:  89% 12373/13907 [8:02:57<59:28,  2.33s/it]  [A
Training...:  89% 12374/13907 [8:02:59<58:26,  2.29s/it][A
Training...:  89% 12375/13907 [8:03:01<57:29,  2.25s/it][A
Training...:  89% 12376/13907 [8:03:03<56:44,  2.22s/it][A
Training...:  89% 12377/13907 [8:03:05<55:58,  2.20s/it][A
Training...:  89% 12378/13907 [8:03:07<55:10,  2.16s/it][A
Training...:  89% 12379/13907 [8:03:09<54:21,  2.13s/it][A
Training...:  89% 12380/13907 [8:03:11<53:37,  2.11s/it][A
Training...:  89% 12381/13907 [8:03:13<52:54,  2.08s/it][A
Training...:  89% 12382/13907 [8:03:15<52:07,  2.05s/it][A
Training...:  89% 12383/13907 [8:03:17<51:29,  2.03s/it][A
Training...:  89% 12384/13907 [8:03:19<50:42,  2.00s/it][A
Training...:  89% 12385/13907 [8:03:21<50:08,  1.98s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:33:34<17:31:07, 31533.87s/it]
Training...:  89% 12385/13907 [8:03:23<50:08,  1.98s/it][A
Training...:  89% 12386/13907 [8:03:23<51:34,  2.03s/it][A
Training...:  89% 12387/13907 [8:03:25<50:30,  1.99s/it][A
Training...:  89% 12388/13907 [8:03:27<49:01,  1.94s/it][A
Training...:  89% 12389/13907 [8:03:29<47:45,  1.89s/it][A
Training...:  89% 12390/13907 [8:03:31<46:31,  1.84s/it][A
Training...:  89% 12391/13907 [8:03:32<45:28,  1.80s/it][A
Training...:  89% 12392/13907 [8:03:34<44:22,  1.76s/it][A
Training...:  89% 12393/13907 [8:03:36<43:20,  1.72s/it][A
Training...:  89% 12394/13907 [8:03:37<42:14,  1.68s/it][A
Training...:  89% 12395/13907 [8:03:39<41:04,  1.63s/it][A
Training...:  89% 12396/13907 [8:03:40<39:51,  1.58s/it][A
Training...:  89% 12397/13907 [8:03:42<38:32,  1.53s/it][A
Training...:  89% 12398/13907 [8:03:43<37:23,  1.49s/it][A
Training...:  89% 12399/13907 [8:03:44<35:43,  1.42s/it][A
Training...:  89% 12400/13907 [8:03:45<33:13,  1.32s/it][A
Training...:  89% 12401/13907 [8:03:49<52:15,  2.08s/it][A
Training...:  89% 12402/13907 [8:03:53<1:03:54,  2.55s/it][A
Training...:  89% 12403/13907 [8:03:56<1:10:09,  2.80s/it][A
Training...:  89% 12404/13907 [8:04:00<1:13:34,  2.94s/it][A
Training...:  89% 12405/13907 [8:04:03<1:15:43,  3.03s/it][A
Training...:  89% 12406/13907 [8:04:06<1:16:09,  3.04s/it][A
Training...:  89% 12407/13907 [8:04:09<1:15:26,  3.02s/it][A
Training...:  89% 12408/13907 [8:04:12<1:14:29,  2.98s/it][A
Training...:  89% 12409/13907 [8:04:15<1:13:26,  2.94s/it][A
Training...:  89% 12410/13907 [8:04:17<1:12:22,  2.90s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:34:31<17:31:07, 31533.87s/it]
Training...:  89% 12410/13907 [8:04:20<1:12:22,  2.90s/it][A
Training...:  89% 12411/13907 [8:04:20<1:14:02,  2.97s/it][A
Training...:  89% 12412/13907 [8:04:23<1:11:59,  2.89s/it][A
Training...:  89% 12413/13907 [8:04:26<1:09:20,  2.79s/it][A
Training...:  89% 12414/13907 [8:04:28<1:07:48,  2.72s/it][A
Training...:  89% 12415/13907 [8:04:31<1:06:12,  2.66s/it][A
Training...:  89% 12416/13907 [8:04:33<1:04:53,  2.61s/it][A
Training...:  89% 12417/13907 [8:04:36<1:03:29,  2.56s/it][A
Training...:  89% 12418/13907 [8:04:38<1:02:21,  2.51s/it][A
Training...:  89% 12419/13907 [8:04:41<1:01:25,  2.48s/it][A
Training...:  89% 12420/13907 [8:04:43<1:00:36,  2.45s/it][A
Training...:  89% 12421/13907 [8:04:45<59:35,  2.41s/it]  [A
Training...:  89% 12422/13907 [8:04:48<58:37,  2.37s/it][A
Training...:  89% 12423/13907 [8:04:50<57:29,  2.32s/it][A
Training...:  89% 12424/13907 [8:04:52<56:47,  2.30s/it][A
Training...:  89% 12425/13907 [8:04:54<55:53,  2.26s/it][A
Training...:  89% 12426/13907 [8:04:56<55:10,  2.24s/it][A
Training...:  89% 12427/13907 [8:04:58<54:22,  2.20s/it][A
Training...:  89% 12428/13907 [8:05:01<53:33,  2.17s/it][A
Training...:  89% 12429/13907 [8:05:03<52:47,  2.14s/it][A
Training...:  89% 12430/13907 [8:05:05<51:57,  2.11s/it][A
Training...:  89% 12431/13907 [8:05:07<51:10,  2.08s/it][A
Training...:  89% 12432/13907 [8:05:09<50:30,  2.05s/it][A
Training...:  89% 12433/13907 [8:05:11<50:16,  2.05s/it][A
Training...:  89% 12434/13907 [8:05:13<49:29,  2.02s/it][A
Training...:  89% 12435/13907 [8:05:15<48:39,  1.98s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:35:28<17:31:07, 31533.87s/it]
Training...:  89% 12435/13907 [8:05:17<48:39,  1.98s/it][A
Training...:  89% 12436/13907 [8:05:17<49:56,  2.04s/it][A
Training...:  89% 12437/13907 [8:05:19<48:50,  1.99s/it][A
Training...:  89% 12438/13907 [8:05:20<47:20,  1.93s/it][A
Training...:  89% 12439/13907 [8:05:22<46:05,  1.88s/it][A
Training...:  89% 12440/13907 [8:05:24<44:47,  1.83s/it][A
Training...:  89% 12441/13907 [8:05:26<43:51,  1.79s/it][A
Training...:  89% 12442/13907 [8:05:27<43:02,  1.76s/it][A
Training...:  89% 12443/13907 [8:05:29<42:08,  1.73s/it][A
Training...:  89% 12444/13907 [8:05:31<41:17,  1.69s/it][A
Training...:  89% 12445/13907 [8:05:32<40:06,  1.65s/it][A
Training...:  89% 12446/13907 [8:05:34<38:57,  1.60s/it][A
Training...:  90% 12447/13907 [8:05:35<37:33,  1.54s/it][A
Training...:  90% 12448/13907 [8:05:36<36:11,  1.49s/it][A
Training...:  90% 12449/13907 [8:05:38<34:23,  1.42s/it][A
Training...:  90% 12450/13907 [8:05:39<31:52,  1.31s/it][A
Training...:  90% 12451/13907 [8:05:42<50:12,  2.07s/it][A
Training...:  90% 12452/13907 [8:05:46<1:01:27,  2.53s/it][A
Training...:  90% 12453/13907 [8:05:50<1:07:51,  2.80s/it][A
Training...:  90% 12454/13907 [8:05:53<1:11:03,  2.93s/it][A
Training...:  90% 12455/13907 [8:05:56<1:12:58,  3.02s/it][A
Training...:  90% 12456/13907 [8:05:59<1:13:38,  3.04s/it][A
Training...:  90% 12457/13907 [8:06:02<1:13:25,  3.04s/it][A
Training...:  90% 12458/13907 [8:06:05<1:12:48,  3.01s/it][A
Training...:  90% 12459/13907 [8:06:08<1:12:31,  3.01s/it][A
Training...:  90% 12460/13907 [8:06:11<1:11:13,  2.95s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:36:25<17:31:07, 31533.87s/it]
Training...:  90% 12460/13907 [8:06:14<1:11:13,  2.95s/it][A
Training...:  90% 12461/13907 [8:06:14<1:12:34,  3.01s/it][A
Training...:  90% 12462/13907 [8:06:17<1:10:27,  2.93s/it][A
Training...:  90% 12463/13907 [8:06:19<1:07:59,  2.83s/it][A
Training...:  90% 12464/13907 [8:06:22<1:05:40,  2.73s/it][A
Training...:  90% 12465/13907 [8:06:24<1:03:56,  2.66s/it][A
Training...:  90% 12466/13907 [8:06:27<1:02:34,  2.61s/it][A
Training...:  90% 12467/13907 [8:06:29<1:01:07,  2.55s/it][A
Training...:  90% 12468/13907 [8:06:32<59:59,  2.50s/it]  [A
Training...:  90% 12469/13907 [8:06:34<58:57,  2.46s/it][A
Training...:  90% 12470/13907 [8:06:36<58:03,  2.42s/it][A
Training...:  90% 12471/13907 [8:06:39<57:14,  2.39s/it][A
Training...:  90% 12472/13907 [8:06:41<56:18,  2.35s/it][A
Training...:  90% 12473/13907 [8:06:43<55:15,  2.31s/it][A
Training...:  90% 12474/13907 [8:06:45<54:19,  2.27s/it][A
Training...:  90% 12475/13907 [8:06:47<53:38,  2.25s/it][A
Training...:  90% 12476/13907 [8:06:50<52:44,  2.21s/it][A
Training...:  90% 12477/13907 [8:06:52<51:57,  2.18s/it][A
Training...:  90% 12478/13907 [8:06:54<51:11,  2.15s/it][A
Training...:  90% 12479/13907 [8:06:56<50:28,  2.12s/it][A
Training...:  90% 12480/13907 [8:06:58<49:52,  2.10s/it][A
Training...:  90% 12481/13907 [8:07:00<49:07,  2.07s/it][A
Training...:  90% 12482/13907 [8:07:02<48:20,  2.04s/it][A
Training...:  90% 12483/13907 [8:07:04<47:39,  2.01s/it][A
Training...:  90% 12484/13907 [8:07:06<46:52,  1.98s/it][A
Training...:  90% 12485/13907 [8:07:08<46:15,  1.95s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:37:21<17:31:07, 31533.87s/it]
Training...:  90% 12485/13907 [8:07:10<46:15,  1.95s/it][A
Training...:  90% 12486/13907 [8:07:10<47:46,  2.02s/it][A
Training...:  90% 12487/13907 [8:07:12<47:00,  1.99s/it][A
Training...:  90% 12488/13907 [8:07:13<45:41,  1.93s/it][A
Training...:  90% 12489/13907 [8:07:15<44:40,  1.89s/it][A
Training...:  90% 12490/13907 [8:07:17<43:49,  1.86s/it][A
Training...:  90% 12491/13907 [8:07:19<42:56,  1.82s/it][A
Training...:  90% 12492/13907 [8:07:20<41:54,  1.78s/it][A
Training...:  90% 12493/13907 [8:07:22<40:47,  1.73s/it][A
Training...:  90% 12494/13907 [8:07:24<39:48,  1.69s/it][A
Training...:  90% 12495/13907 [8:07:25<38:50,  1.65s/it][A
Training...:  90% 12496/13907 [8:07:27<37:29,  1.59s/it][A
Training...:  90% 12497/13907 [8:07:28<36:09,  1.54s/it][A
Training...:  90% 12498/13907 [8:07:29<34:47,  1.48s/it][A
Training...:  90% 12499/13907 [8:07:31<33:06,  1.41s/it][A
Training...:  90% 12500/13907 [8:07:32<30:38,  1.31s/it][A
Training...:  90% 12501/13907 [8:07:36<47:47,  2.04s/it][A
Training...:  90% 12502/13907 [8:07:39<58:16,  2.49s/it][A
Training...:  90% 12503/13907 [8:07:42<1:03:58,  2.73s/it][A
Training...:  90% 12504/13907 [8:07:46<1:06:41,  2.85s/it][A
Training...:  90% 12505/13907 [8:07:49<1:07:54,  2.91s/it][A
Training...:  90% 12506/13907 [8:07:52<1:08:20,  2.93s/it][A
Training...:  90% 12507/13907 [8:07:54<1:08:15,  2.93s/it][A
Training...:  90% 12508/13907 [8:07:57<1:07:36,  2.90s/it][A
Training...:  90% 12509/13907 [8:08:00<1:06:45,  2.87s/it][A
Training...:  90% 12510/13907 [8:08:03<1:06:04,  2.84s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:38:17<17:31:07, 31533.87s/it]
Training...:  90% 12510/13907 [8:08:06<1:06:04,  2.84s/it][A
Training...:  90% 12511/13907 [8:08:06<1:07:54,  2.92s/it][A
Training...:  90% 12512/13907 [8:08:09<1:06:47,  2.87s/it][A
Training...:  90% 12513/13907 [8:08:11<1:04:54,  2.79s/it][A
Training...:  90% 12514/13907 [8:08:14<1:03:18,  2.73s/it][A
Training...:  90% 12515/13907 [8:08:16<1:01:53,  2.67s/it][A
Training...:  90% 12516/13907 [8:08:19<1:00:48,  2.62s/it][A
Training...:  90% 12517/13907 [8:08:21<59:32,  2.57s/it]  [A
Training...:  90% 12518/13907 [8:08:24<58:31,  2.53s/it][A
Training...:  90% 12519/13907 [8:08:26<57:26,  2.48s/it][A
Training...:  90% 12520/13907 [8:08:29<56:29,  2.44s/it][A
Training...:  90% 12521/13907 [8:08:31<55:42,  2.41s/it][A
Training...:  90% 12522/13907 [8:08:33<55:35,  2.41s/it][A
Training...:  90% 12523/13907 [8:08:36<54:35,  2.37s/it][A
Training...:  90% 12524/13907 [8:08:38<53:31,  2.32s/it][A
Training...:  90% 12525/13907 [8:08:40<52:30,  2.28s/it][A
Training...:  90% 12526/13907 [8:08:42<51:40,  2.25s/it][A
Training...:  90% 12527/13907 [8:08:44<50:56,  2.21s/it][A
Training...:  90% 12528/13907 [8:08:46<50:03,  2.18s/it][A
Training...:  90% 12529/13907 [8:08:48<49:16,  2.15s/it][A
Training...:  90% 12530/13907 [8:08:50<48:32,  2.12s/it][A
Training...:  90% 12531/13907 [8:08:52<47:53,  2.09s/it][A
Training...:  90% 12532/13907 [8:08:54<47:19,  2.07s/it][A
Training...:  90% 12533/13907 [8:08:56<46:37,  2.04s/it][A
Training...:  90% 12534/13907 [8:08:58<45:46,  2.00s/it][A
Training...:  90% 12535/13907 [8:09:00<45:01,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:39:13<17:31:07, 31533.87s/it]
Training...:  90% 12535/13907 [8:09:02<45:01,  1.97s/it][A
Training...:  90% 12536/13907 [8:09:02<46:25,  2.03s/it][A
Training...:  90% 12537/13907 [8:09:04<45:54,  2.01s/it][A
Training...:  90% 12538/13907 [8:09:06<44:23,  1.95s/it][A
Training...:  90% 12539/13907 [8:09:08<43:07,  1.89s/it][A
Training...:  90% 12540/13907 [8:09:10<42:02,  1.85s/it][A
Training...:  90% 12541/13907 [8:09:11<40:58,  1.80s/it][A
Training...:  90% 12542/13907 [8:09:13<39:55,  1.76s/it][A
Training...:  90% 12543/13907 [8:09:15<39:02,  1.72s/it][A
Training...:  90% 12544/13907 [8:09:16<37:59,  1.67s/it][A
Training...:  90% 12545/13907 [8:09:18<37:05,  1.63s/it][A
Training...:  90% 12546/13907 [8:09:19<36:00,  1.59s/it][A
Training...:  90% 12547/13907 [8:09:21<34:49,  1.54s/it][A
Training...:  90% 12548/13907 [8:09:22<33:31,  1.48s/it][A
Training...:  90% 12549/13907 [8:09:23<31:53,  1.41s/it][A
Training...:  90% 12550/13907 [8:09:24<29:27,  1.30s/it][A
Training...:  90% 12551/13907 [8:09:28<45:42,  2.02s/it][A
Training...:  90% 12552/13907 [8:09:32<55:40,  2.47s/it][A
Training...:  90% 12553/13907 [8:09:35<1:01:14,  2.71s/it][A
Training...:  90% 12554/13907 [8:09:38<1:04:07,  2.84s/it][A
Training...:  90% 12555/13907 [8:09:41<1:05:31,  2.91s/it][A
Training...:  90% 12556/13907 [8:09:44<1:05:58,  2.93s/it][A
Training...:  90% 12557/13907 [8:09:47<1:06:07,  2.94s/it][A
Training...:  90% 12558/13907 [8:09:50<1:05:49,  2.93s/it][A
Training...:  90% 12559/13907 [8:09:53<1:04:34,  2.87s/it][A
Training...:  90% 12560/13907 [8:09:55<1:03:39,  2.84s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:40:09<17:31:07, 31533.87s/it]
Training...:  90% 12560/13907 [8:09:58<1:03:39,  2.84s/it][A
Training...:  90% 12561/13907 [8:09:58<1:05:19,  2.91s/it][A
Training...:  90% 12562/13907 [8:10:01<1:04:17,  2.87s/it][A
Training...:  90% 12563/13907 [8:10:04<1:02:27,  2.79s/it][A
Training...:  90% 12564/13907 [8:10:06<1:00:43,  2.71s/it][A
Training...:  90% 12565/13907 [8:10:09<59:09,  2.64s/it]  [A
Training...:  90% 12566/13907 [8:10:11<57:45,  2.58s/it][A
Training...:  90% 12567/13907 [8:10:14<56:33,  2.53s/it][A
Training...:  90% 12568/13907 [8:10:16<55:28,  2.49s/it][A
Training...:  90% 12569/13907 [8:10:18<54:29,  2.44s/it][A
Training...:  90% 12570/13907 [8:10:21<53:38,  2.41s/it][A
Training...:  90% 12571/13907 [8:10:23<52:50,  2.37s/it][A
Training...:  90% 12572/13907 [8:10:25<51:58,  2.34s/it][A
Training...:  90% 12573/13907 [8:10:28<51:20,  2.31s/it][A
Training...:  90% 12574/13907 [8:10:30<50:27,  2.27s/it][A
Training...:  90% 12575/13907 [8:10:32<49:55,  2.25s/it][A
Training...:  90% 12576/13907 [8:10:34<49:15,  2.22s/it][A
Training...:  90% 12577/13907 [8:10:36<48:40,  2.20s/it][A
Training...:  90% 12578/13907 [8:10:38<48:09,  2.17s/it][A
Training...:  90% 12579/13907 [8:10:40<47:30,  2.15s/it][A
Training...:  90% 12580/13907 [8:10:42<46:45,  2.11s/it][A
Training...:  90% 12581/13907 [8:10:44<46:00,  2.08s/it][A
Training...:  90% 12582/13907 [8:10:46<45:19,  2.05s/it][A
Training...:  90% 12583/13907 [8:10:48<44:35,  2.02s/it][A
Training...:  90% 12584/13907 [8:10:50<43:54,  1.99s/it][A
Training...:  90% 12585/13907 [8:10:52<43:28,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:41:05<17:31:07, 31533.87s/it]
Training...:  90% 12585/13907 [8:10:54<43:28,  1.97s/it][A
Training...:  91% 12586/13907 [8:10:54<45:01,  2.05s/it][A
Training...:  91% 12587/13907 [8:10:56<44:25,  2.02s/it][A
Training...:  91% 12588/13907 [8:10:58<42:55,  1.95s/it][A
Training...:  91% 12589/13907 [8:11:00<41:38,  1.90s/it][A
Training...:  91% 12590/13907 [8:11:02<40:35,  1.85s/it][A
Training...:  91% 12591/13907 [8:11:03<39:26,  1.80s/it][A
Training...:  91% 12592/13907 [8:11:05<38:27,  1.75s/it][A
Training...:  91% 12593/13907 [8:11:07<37:35,  1.72s/it][A
Training...:  91% 12594/13907 [8:11:08<36:41,  1.68s/it][A
Training...:  91% 12595/13907 [8:11:10<35:43,  1.63s/it][A
Training...:  91% 12596/13907 [8:11:11<34:32,  1.58s/it][A
Training...:  91% 12597/13907 [8:11:13<33:17,  1.52s/it][A
Training...:  91% 12598/13907 [8:11:14<31:59,  1.47s/it][A
Training...:  91% 12599/13907 [8:11:15<30:25,  1.40s/it][A
Training...:  91% 12600/13907 [8:11:16<28:22,  1.30s/it][A
Training...:  91% 12601/13907 [8:11:20<44:46,  2.06s/it][A
Training...:  91% 12602/13907 [8:11:24<54:15,  2.49s/it][A
Training...:  91% 12603/13907 [8:11:27<59:22,  2.73s/it][A
Training...:  91% 12604/13907 [8:11:30<1:02:02,  2.86s/it][A
Training...:  91% 12605/13907 [8:11:33<1:03:13,  2.91s/it][A
Training...:  91% 12606/13907 [8:11:36<1:03:32,  2.93s/it][A
Training...:  91% 12607/13907 [8:11:39<1:03:07,  2.91s/it][A
Training...:  91% 12608/13907 [8:11:42<1:02:36,  2.89s/it][A
Training...:  91% 12609/13907 [8:11:45<1:01:54,  2.86s/it][A
Training...:  91% 12610/13907 [8:11:47<1:00:47,  2.81s/it][A                                                                                                                             
                                                          [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:42:01<17:31:07, 31533.87s/it]
Training...:  91% 12610/13907 [8:11:50<1:00:47,  2.81s/it][A
Training...:  91% 12611/13907 [8:11:50<1:02:40,  2.90s/it][A
Training...:  91% 12612/13907 [8:11:53<1:01:46,  2.86s/it][A
Training...:  91% 12613/13907 [8:11:56<1:00:06,  2.79s/it][A
Training...:  91% 12614/13907 [8:11:58<58:48,  2.73s/it]  [A
Training...:  91% 12615/13907 [8:12:01<57:16,  2.66s/it][A
Training...:  91% 12616/13907 [8:12:03<56:04,  2.61s/it][A
Training...:  91% 12617/13907 [8:12:06<54:47,  2.55s/it][A
Training...:  91% 12618/13907 [8:12:08<53:51,  2.51s/it][A
Training...:  91% 12619/13907 [8:12:11<52:56,  2.47s/it][A
Training...:  91% 12620/13907 [8:12:13<52:05,  2.43s/it][A
Training...:  91% 12621/13907 [8:12:15<51:45,  2.41s/it][A
Training...:  91% 12622/13907 [8:12:18<51:03,  2.38s/it][A
Training...:  91% 12623/13907 [8:12:20<49:58,  2.34s/it][A
Training...:  91% 12624/13907 [8:12:22<48:56,  2.29s/it][A
Training...:  91% 12625/13907 [8:12:24<48:02,  2.25s/it][A
Training...:  91% 12626/13907 [8:12:26<47:12,  2.21s/it][A
Training...:  91% 12627/13907 [8:12:28<46:34,  2.18s/it][A
Training...:  91% 12628/13907 [8:12:30<45:46,  2.15s/it][A
Training...:  91% 12629/13907 [8:12:32<45:05,  2.12s/it][A
Training...:  91% 12630/13907 [8:12:34<44:21,  2.08s/it][A
Training...:  91% 12631/13907 [8:12:36<43:41,  2.05s/it][A
Training...:  91% 12632/13907 [8:12:38<42:58,  2.02s/it][A
Training...:  91% 12633/13907 [8:12:40<42:24,  2.00s/it][A
Training...:  91% 12634/13907 [8:12:42<41:47,  1.97s/it][A
Training...:  91% 12635/13907 [8:12:44<41:18,  1.95s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:42:57<17:31:07, 31533.87s/it]
Training...:  91% 12635/13907 [8:12:46<41:18,  1.95s/it][A
Training...:  91% 12636/13907 [8:12:46<42:37,  2.01s/it][A
Training...:  91% 12637/13907 [8:12:48<41:57,  1.98s/it][A
Training...:  91% 12638/13907 [8:12:50<40:40,  1.92s/it][A
Training...:  91% 12639/13907 [8:12:52<39:47,  1.88s/it][A
Training...:  91% 12640/13907 [8:12:54<38:49,  1.84s/it][A
Training...:  91% 12641/13907 [8:12:55<38:12,  1.81s/it][A
Training...:  91% 12642/13907 [8:12:57<37:28,  1.78s/it][A
Training...:  91% 12643/13907 [8:12:59<36:29,  1.73s/it][A
Training...:  91% 12644/13907 [8:13:00<35:24,  1.68s/it][A
Training...:  91% 12645/13907 [8:13:02<34:21,  1.63s/it][A
Training...:  91% 12646/13907 [8:13:03<33:11,  1.58s/it][A
Training...:  91% 12647/13907 [8:13:05<31:57,  1.52s/it][A
Training...:  91% 12648/13907 [8:13:06<30:41,  1.46s/it][A
Training...:  91% 12649/13907 [8:13:07<29:16,  1.40s/it][A
Training...:  91% 12650/13907 [8:13:08<27:04,  1.29s/it][A
Training...:  91% 12651/13907 [8:13:12<42:08,  2.01s/it][A
Training...:  91% 12652/13907 [8:13:15<51:02,  2.44s/it][A
Training...:  91% 12653/13907 [8:13:19<56:00,  2.68s/it][A
Training...:  91% 12654/13907 [8:13:22<58:47,  2.82s/it][A
Training...:  91% 12655/13907 [8:13:25<1:00:21,  2.89s/it][A
Training...:  91% 12656/13907 [8:13:28<1:00:50,  2.92s/it][A
Training...:  91% 12657/13907 [8:13:31<1:00:48,  2.92s/it][A
Training...:  91% 12658/13907 [8:13:33<1:00:11,  2.89s/it][A
Training...:  91% 12659/13907 [8:13:36<59:17,  2.85s/it]  [A
Training...:  91% 12660/13907 [8:13:39<58:32,  2.82s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:43:53<17:31:07, 31533.87s/it]
Training...:  91% 12660/13907 [8:13:42<58:32,  2.82s/it][A
Training...:  91% 12661/13907 [8:13:42<1:00:32,  2.92s/it][A
Training...:  91% 12662/13907 [8:13:45<59:34,  2.87s/it]  [A
Training...:  91% 12663/13907 [8:13:47<57:36,  2.78s/it][A
Training...:  91% 12664/13907 [8:13:50<55:47,  2.69s/it][A
Training...:  91% 12665/13907 [8:13:52<54:29,  2.63s/it][A
Training...:  91% 12666/13907 [8:13:55<53:18,  2.58s/it][A
Training...:  91% 12667/13907 [8:13:57<52:25,  2.54s/it][A
Training...:  91% 12668/13907 [8:14:00<51:29,  2.49s/it][A
Training...:  91% 12669/13907 [8:14:02<50:43,  2.46s/it][A
Training...:  91% 12670/13907 [8:14:04<50:01,  2.43s/it][A
Training...:  91% 12671/13907 [8:14:07<49:10,  2.39s/it][A
Training...:  91% 12672/13907 [8:14:09<48:02,  2.33s/it][A
Training...:  91% 12673/13907 [8:14:11<47:13,  2.30s/it][A
Training...:  91% 12674/13907 [8:14:13<46:22,  2.26s/it][A
Training...:  91% 12675/13907 [8:14:15<45:46,  2.23s/it][A
Training...:  91% 12676/13907 [8:14:18<45:10,  2.20s/it][A
Training...:  91% 12677/13907 [8:14:20<44:35,  2.17s/it][A
Training...:  91% 12678/13907 [8:14:22<43:51,  2.14s/it][A
Training...:  91% 12679/13907 [8:14:24<43:07,  2.11s/it][A
Training...:  91% 12680/13907 [8:14:26<42:26,  2.08s/it][A
Training...:  91% 12681/13907 [8:14:28<41:52,  2.05s/it][A
Training...:  91% 12682/13907 [8:14:30<41:15,  2.02s/it][A
Training...:  91% 12683/13907 [8:14:32<40:41,  1.99s/it][A
Training...:  91% 12684/13907 [8:14:34<40:08,  1.97s/it][A
Training...:  91% 12685/13907 [8:14:35<39:32,  1.94s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:44:49<17:31:07, 31533.87s/it]
Training...:  91% 12685/13907 [8:14:38<39:32,  1.94s/it][A
Training...:  91% 12686/13907 [8:14:38<40:48,  2.01s/it][A
Training...:  91% 12687/13907 [8:14:40<39:59,  1.97s/it][A
Training...:  91% 12688/13907 [8:14:41<38:47,  1.91s/it][A
Training...:  91% 12689/13907 [8:14:43<37:57,  1.87s/it][A
Training...:  91% 12690/13907 [8:14:45<36:54,  1.82s/it][A
Training...:  91% 12691/13907 [8:14:46<35:57,  1.77s/it][A
Training...:  91% 12692/13907 [8:14:48<35:08,  1.73s/it][A
Training...:  91% 12693/13907 [8:14:50<34:24,  1.70s/it][A
Training...:  91% 12694/13907 [8:14:51<33:39,  1.66s/it][A
Training...:  91% 12695/13907 [8:14:53<32:46,  1.62s/it][A
Training...:  91% 12696/13907 [8:14:54<31:40,  1.57s/it][A
Training...:  91% 12697/13907 [8:14:56<30:36,  1.52s/it][A
Training...:  91% 12698/13907 [8:14:57<29:22,  1.46s/it][A
Training...:  91% 12699/13907 [8:14:58<27:56,  1.39s/it][A
Training...:  91% 12700/13907 [8:14:59<26:04,  1.30s/it][A
Training...:  91% 12701/13907 [8:15:03<40:59,  2.04s/it][A
Training...:  91% 12702/13907 [8:15:07<50:40,  2.52s/it][A
Training...:  91% 12703/13907 [8:15:10<55:19,  2.76s/it][A
Training...:  91% 12704/13907 [8:15:13<57:45,  2.88s/it][A
Training...:  91% 12705/13907 [8:15:16<58:48,  2.94s/it][A
Training...:  91% 12706/13907 [8:15:19<59:03,  2.95s/it][A
Training...:  91% 12707/13907 [8:15:22<58:43,  2.94s/it][A
Training...:  91% 12708/13907 [8:15:25<58:07,  2.91s/it][A
Training...:  91% 12709/13907 [8:15:28<57:23,  2.87s/it][A
Training...:  91% 12710/13907 [8:15:30<56:20,  2.82s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:45:45<17:31:07, 31533.87s/it]
Training...:  91% 12710/13907 [8:15:34<56:20,  2.82s/it][A
Training...:  91% 12711/13907 [8:15:34<57:50,  2.90s/it][A
Training...:  91% 12712/13907 [8:15:36<56:39,  2.84s/it][A
Training...:  91% 12713/13907 [8:15:39<54:53,  2.76s/it][A
Training...:  91% 12714/13907 [8:15:41<53:22,  2.68s/it][A
Training...:  91% 12715/13907 [8:15:44<52:05,  2.62s/it][A
Training...:  91% 12716/13907 [8:15:46<50:55,  2.57s/it][A
Training...:  91% 12717/13907 [8:15:49<49:58,  2.52s/it][A
Training...:  91% 12718/13907 [8:15:51<49:02,  2.48s/it][A
Training...:  91% 12719/13907 [8:15:53<48:23,  2.44s/it][A
Training...:  91% 12720/13907 [8:15:56<47:41,  2.41s/it][A
Training...:  91% 12721/13907 [8:15:58<46:46,  2.37s/it][A
Training...:  91% 12722/13907 [8:16:00<46:01,  2.33s/it][A
Training...:  91% 12723/13907 [8:16:02<45:24,  2.30s/it][A
Training...:  91% 12724/13907 [8:16:05<44:45,  2.27s/it][A
Training...:  92% 12725/13907 [8:16:07<44:04,  2.24s/it][A
Training...:  92% 12726/13907 [8:16:09<43:21,  2.20s/it][A
Training...:  92% 12727/13907 [8:16:11<42:45,  2.17s/it][A
Training...:  92% 12728/13907 [8:16:13<42:09,  2.15s/it][A
Training...:  92% 12729/13907 [8:16:15<41:36,  2.12s/it][A
Training...:  92% 12730/13907 [8:16:17<41:12,  2.10s/it][A
Training...:  92% 12731/13907 [8:16:19<40:41,  2.08s/it][A
Training...:  92% 12732/13907 [8:16:21<40:01,  2.04s/it][A
Training...:  92% 12733/13907 [8:16:23<39:20,  2.01s/it][A
Training...:  92% 12734/13907 [8:16:25<38:45,  1.98s/it][A
Training...:  92% 12735/13907 [8:16:27<38:10,  1.95s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:46:40<17:31:07, 31533.87s/it]
Training...:  92% 12735/13907 [8:16:29<38:10,  1.95s/it][A
Training...:  92% 12736/13907 [8:16:29<39:24,  2.02s/it][A
Training...:  92% 12737/13907 [8:16:31<38:34,  1.98s/it][A
Training...:  92% 12738/13907 [8:16:33<37:27,  1.92s/it][A
Training...:  92% 12739/13907 [8:16:35<36:34,  1.88s/it][A
Training...:  92% 12740/13907 [8:16:36<35:33,  1.83s/it][A
Training...:  92% 12741/13907 [8:16:38<34:53,  1.80s/it][A
Training...:  92% 12742/13907 [8:16:40<34:03,  1.75s/it][A
Training...:  92% 12743/13907 [8:16:41<33:12,  1.71s/it][A
Training...:  92% 12744/13907 [8:16:43<32:29,  1.68s/it][A
Training...:  92% 12745/13907 [8:16:44<31:24,  1.62s/it][A
Training...:  92% 12746/13907 [8:16:46<30:41,  1.59s/it][A
Training...:  92% 12747/13907 [8:16:47<29:42,  1.54s/it][A
Training...:  92% 12748/13907 [8:16:49<28:42,  1.49s/it][A
Training...:  92% 12749/13907 [8:16:50<27:23,  1.42s/it][A
Training...:  92% 12750/13907 [8:16:51<25:37,  1.33s/it][A
Training...:  92% 12751/13907 [8:16:55<40:15,  2.09s/it][A
Training...:  92% 12752/13907 [8:16:59<48:55,  2.54s/it][A
Training...:  92% 12753/13907 [8:17:02<53:33,  2.78s/it][A
Training...:  92% 12754/13907 [8:17:05<56:00,  2.91s/it][A
Training...:  92% 12755/13907 [8:17:08<57:16,  2.98s/it][A
Training...:  92% 12756/13907 [8:17:11<57:35,  3.00s/it][A
Training...:  92% 12757/13907 [8:17:14<57:27,  3.00s/it][A
Training...:  92% 12758/13907 [8:17:17<56:50,  2.97s/it][A
Training...:  92% 12759/13907 [8:17:20<55:56,  2.92s/it][A
Training...:  92% 12760/13907 [8:17:23<55:17,  2.89s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:47:37<17:31:07, 31533.87s/it]
Training...:  92% 12760/13907 [8:17:26<55:17,  2.89s/it][A
Training...:  92% 12761/13907 [8:17:26<56:44,  2.97s/it][A
Training...:  92% 12762/13907 [8:17:29<55:26,  2.91s/it][A
Training...:  92% 12763/13907 [8:17:31<53:46,  2.82s/it][A
Training...:  92% 12764/13907 [8:17:34<52:06,  2.74s/it][A
Training...:  92% 12765/13907 [8:17:36<50:54,  2.68s/it][A
Training...:  92% 12766/13907 [8:17:39<49:50,  2.62s/it][A
Training...:  92% 12767/13907 [8:17:41<48:46,  2.57s/it][A
Training...:  92% 12768/13907 [8:17:44<47:51,  2.52s/it][A
Training...:  92% 12769/13907 [8:17:46<47:07,  2.48s/it][A
Training...:  92% 12770/13907 [8:17:48<46:10,  2.44s/it][A
Training...:  92% 12771/13907 [8:17:51<45:40,  2.41s/it][A
Training...:  92% 12772/13907 [8:17:53<45:30,  2.41s/it][A
Training...:  92% 12773/13907 [8:17:56<44:41,  2.36s/it][A
Training...:  92% 12774/13907 [8:17:58<43:47,  2.32s/it][A
Training...:  92% 12775/13907 [8:18:00<42:56,  2.28s/it][A
Training...:  92% 12776/13907 [8:18:02<42:08,  2.24s/it][A
Training...:  92% 12777/13907 [8:18:04<41:26,  2.20s/it][A
Training...:  92% 12778/13907 [8:18:06<40:49,  2.17s/it][A
Training...:  92% 12779/13907 [8:18:08<40:11,  2.14s/it][A
Training...:  92% 12780/13907 [8:18:10<39:32,  2.11s/it][A
Training...:  92% 12781/13907 [8:18:12<38:55,  2.07s/it][A
Training...:  92% 12782/13907 [8:18:14<38:16,  2.04s/it][A
Training...:  92% 12783/13907 [8:18:16<37:38,  2.01s/it][A
Training...:  92% 12784/13907 [8:18:18<37:01,  1.98s/it][A
Training...:  92% 12785/13907 [8:18:20<36:29,  1.95s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:48:33<17:31:07, 31533.87s/it]
Training...:  92% 12785/13907 [8:18:22<36:29,  1.95s/it][A
Training...:  92% 12786/13907 [8:18:22<37:43,  2.02s/it][A
Training...:  92% 12787/13907 [8:18:24<37:02,  1.98s/it][A
Training...:  92% 12788/13907 [8:18:26<35:56,  1.93s/it][A
Training...:  92% 12789/13907 [8:18:28<35:03,  1.88s/it][A
Training...:  92% 12790/13907 [8:18:29<34:10,  1.84s/it][A
Training...:  92% 12791/13907 [8:18:31<33:18,  1.79s/it][A
Training...:  92% 12792/13907 [8:18:33<32:31,  1.75s/it][A
Training...:  92% 12793/13907 [8:18:34<31:40,  1.71s/it][A
Training...:  92% 12794/13907 [8:18:36<31:04,  1.68s/it][A
Training...:  92% 12795/13907 [8:18:37<30:08,  1.63s/it][A
Training...:  92% 12796/13907 [8:18:39<29:18,  1.58s/it][A
Training...:  92% 12797/13907 [8:18:40<28:24,  1.54s/it][A
Training...:  92% 12798/13907 [8:18:42<27:18,  1.48s/it][A
Training...:  92% 12799/13907 [8:18:43<26:00,  1.41s/it][A
Training...:  92% 12800/13907 [8:18:44<24:08,  1.31s/it][A
Training...:  92% 12801/13907 [8:18:48<37:32,  2.04s/it][A
Training...:  92% 12802/13907 [8:18:51<45:28,  2.47s/it][A
Training...:  92% 12803/13907 [8:18:55<49:56,  2.71s/it][A
Training...:  92% 12804/13907 [8:18:58<52:36,  2.86s/it][A
Training...:  92% 12805/13907 [8:19:01<54:14,  2.95s/it][A
Training...:  92% 12806/13907 [8:19:04<54:18,  2.96s/it][A
Training...:  92% 12807/13907 [8:19:07<53:58,  2.94s/it][A
Training...:  92% 12808/13907 [8:19:10<53:14,  2.91s/it][A
Training...:  92% 12809/13907 [8:19:12<52:28,  2.87s/it][A
Training...:  92% 12810/13907 [8:19:15<51:40,  2.83s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:49:29<17:31:07, 31533.87s/it]
Training...:  92% 12810/13907 [8:19:18<51:40,  2.83s/it][A
Training...:  92% 12811/13907 [8:19:18<52:57,  2.90s/it][A
Training...:  92% 12812/13907 [8:19:21<51:58,  2.85s/it][A
Training...:  92% 12813/13907 [8:19:24<50:29,  2.77s/it][A
Training...:  92% 12814/13907 [8:19:26<49:17,  2.71s/it][A
Training...:  92% 12815/13907 [8:19:29<48:06,  2.64s/it][A
Training...:  92% 12816/13907 [8:19:31<47:00,  2.59s/it][A
Training...:  92% 12817/13907 [8:19:33<45:59,  2.53s/it][A
Training...:  92% 12818/13907 [8:19:36<45:12,  2.49s/it][A
Training...:  92% 12819/13907 [8:19:38<44:26,  2.45s/it][A
Training...:  92% 12820/13907 [8:19:41<43:44,  2.41s/it][A
Training...:  92% 12821/13907 [8:19:43<43:09,  2.38s/it][A
Training...:  92% 12822/13907 [8:19:45<42:26,  2.35s/it][A
Training...:  92% 12823/13907 [8:19:47<41:39,  2.31s/it][A
Training...:  92% 12824/13907 [8:19:49<41:02,  2.27s/it][A
Training...:  92% 12825/13907 [8:19:52<40:25,  2.24s/it][A
Training...:  92% 12826/13907 [8:19:54<39:53,  2.21s/it][A
Training...:  92% 12827/13907 [8:19:56<39:22,  2.19s/it][A
Training...:  92% 12828/13907 [8:19:58<38:38,  2.15s/it][A
Training...:  92% 12829/13907 [8:20:00<37:59,  2.11s/it][A
Training...:  92% 12830/13907 [8:20:02<37:22,  2.08s/it][A
Training...:  92% 12831/13907 [8:20:04<36:48,  2.05s/it][A
Training...:  92% 12832/13907 [8:20:06<36:15,  2.02s/it][A
Training...:  92% 12833/13907 [8:20:08<35:59,  2.01s/it][A
Training...:  92% 12834/13907 [8:20:10<35:41,  2.00s/it][A
Training...:  92% 12835/13907 [8:20:12<35:03,  1.96s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:50:25<17:31:07, 31533.87s/it]
Training...:  92% 12835/13907 [8:20:14<35:03,  1.96s/it][A
Training...:  92% 12836/13907 [8:20:14<36:10,  2.03s/it][A
Training...:  92% 12837/13907 [8:20:16<35:24,  1.99s/it][A
Training...:  92% 12838/13907 [8:20:18<34:15,  1.92s/it][A
Training...:  92% 12839/13907 [8:20:19<33:16,  1.87s/it][A
Training...:  92% 12840/13907 [8:20:21<32:22,  1.82s/it][A
Training...:  92% 12841/13907 [8:20:23<31:35,  1.78s/it][A
Training...:  92% 12842/13907 [8:20:24<30:50,  1.74s/it][A
Training...:  92% 12843/13907 [8:20:26<30:05,  1.70s/it][A
Training...:  92% 12844/13907 [8:20:28<29:24,  1.66s/it][A
Training...:  92% 12845/13907 [8:20:29<28:34,  1.61s/it][A
Training...:  92% 12846/13907 [8:20:31<27:54,  1.58s/it][A
Training...:  92% 12847/13907 [8:20:32<27:10,  1.54s/it][A
Training...:  92% 12848/13907 [8:20:33<26:11,  1.48s/it][A
Training...:  92% 12849/13907 [8:20:35<24:59,  1.42s/it][A
Training...:  92% 12850/13907 [8:20:36<23:15,  1.32s/it][A
Training...:  92% 12851/13907 [8:20:40<36:31,  2.08s/it][A
Training...:  92% 12852/13907 [8:20:43<44:08,  2.51s/it][A
Training...:  92% 12853/13907 [8:20:46<48:11,  2.74s/it][A
Training...:  92% 12854/13907 [8:20:50<50:25,  2.87s/it][A
Training...:  92% 12855/13907 [8:20:53<51:29,  2.94s/it][A
Training...:  92% 12856/13907 [8:20:56<51:46,  2.96s/it][A
Training...:  92% 12857/13907 [8:20:59<51:30,  2.94s/it][A
Training...:  92% 12858/13907 [8:21:01<51:01,  2.92s/it][A
Training...:  92% 12859/13907 [8:21:04<50:24,  2.89s/it][A
Training...:  92% 12860/13907 [8:21:07<49:25,  2.83s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:51:21<17:31:07, 31533.87s/it]
Training...:  92% 12860/13907 [8:21:10<49:25,  2.83s/it][A
Training...:  92% 12861/13907 [8:21:10<50:46,  2.91s/it][A
Training...:  92% 12862/13907 [8:21:13<49:40,  2.85s/it][A
Training...:  92% 12863/13907 [8:21:15<48:14,  2.77s/it][A
Training...:  93% 12864/13907 [8:21:18<47:00,  2.70s/it][A
Training...:  93% 12865/13907 [8:21:20<46:07,  2.66s/it][A
Training...:  93% 12866/13907 [8:21:23<45:29,  2.62s/it][A
Training...:  93% 12867/13907 [8:21:25<44:44,  2.58s/it][A
Training...:  93% 12868/13907 [8:21:28<43:37,  2.52s/it][A
Training...:  93% 12869/13907 [8:21:30<42:53,  2.48s/it][A
Training...:  93% 12870/13907 [8:21:33<41:59,  2.43s/it][A
Training...:  93% 12871/13907 [8:21:35<41:21,  2.40s/it][A
Training...:  93% 12872/13907 [8:21:37<40:36,  2.35s/it][A
Training...:  93% 12873/13907 [8:21:39<40:01,  2.32s/it][A
Training...:  93% 12874/13907 [8:21:42<39:22,  2.29s/it][A
Training...:  93% 12875/13907 [8:21:44<38:47,  2.26s/it][A
Training...:  93% 12876/13907 [8:21:46<38:08,  2.22s/it][A
Training...:  93% 12877/13907 [8:21:48<37:34,  2.19s/it][A
Training...:  93% 12878/13907 [8:21:50<37:01,  2.16s/it][A
Training...:  93% 12879/13907 [8:21:52<36:24,  2.12s/it][A
Training...:  93% 12880/13907 [8:21:54<35:53,  2.10s/it][A
Training...:  93% 12881/13907 [8:21:56<35:25,  2.07s/it][A
Training...:  93% 12882/13907 [8:21:58<34:57,  2.05s/it][A
Training...:  93% 12883/13907 [8:22:00<34:23,  2.02s/it][A
Training...:  93% 12884/13907 [8:22:02<33:57,  1.99s/it][A
Training...:  93% 12885/13907 [8:22:04<33:35,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:52:17<17:31:07, 31533.87s/it]
Training...:  93% 12885/13907 [8:22:06<33:35,  1.97s/it][A
Training...:  93% 12886/13907 [8:22:06<34:39,  2.04s/it][A
Training...:  93% 12887/13907 [8:22:08<34:04,  2.00s/it][A
Training...:  93% 12888/13907 [8:22:10<33:05,  1.95s/it][A
Training...:  93% 12889/13907 [8:22:12<32:05,  1.89s/it][A
Training...:  93% 12890/13907 [8:22:13<31:14,  1.84s/it][A
Training...:  93% 12891/13907 [8:22:15<30:27,  1.80s/it][A
Training...:  93% 12892/13907 [8:22:17<29:34,  1.75s/it][A
Training...:  93% 12893/13907 [8:22:18<28:51,  1.71s/it][A
Training...:  93% 12894/13907 [8:22:20<28:12,  1.67s/it][A
Training...:  93% 12895/13907 [8:22:21<27:17,  1.62s/it][A
Training...:  93% 12896/13907 [8:22:23<26:19,  1.56s/it][A
Training...:  93% 12897/13907 [8:22:24<25:15,  1.50s/it][A
Training...:  93% 12898/13907 [8:22:25<24:11,  1.44s/it][A
Training...:  93% 12899/13907 [8:22:27<23:07,  1.38s/it][A
Training...:  93% 12900/13907 [8:22:28<21:29,  1.28s/it][A
Training...:  93% 12901/13907 [8:22:32<33:57,  2.02s/it][A
Training...:  93% 12902/13907 [8:22:35<41:04,  2.45s/it][A
Training...:  93% 12903/13907 [8:22:38<44:56,  2.69s/it][A
Training...:  93% 12904/13907 [8:22:41<46:58,  2.81s/it][A
Training...:  93% 12905/13907 [8:22:44<48:17,  2.89s/it][A
Training...:  93% 12906/13907 [8:22:47<49:01,  2.94s/it][A
Training...:  93% 12907/13907 [8:22:50<48:40,  2.92s/it][A
Training...:  93% 12908/13907 [8:22:53<47:57,  2.88s/it][A
Training...:  93% 12909/13907 [8:22:56<47:16,  2.84s/it][A
Training...:  93% 12910/13907 [8:22:59<46:33,  2.80s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:53:13<17:31:07, 31533.87s/it]
Training...:  93% 12910/13907 [8:23:02<46:33,  2.80s/it][A
Training...:  93% 12911/13907 [8:23:02<47:51,  2.88s/it][A
Training...:  93% 12912/13907 [8:23:04<46:54,  2.83s/it][A
Training...:  93% 12913/13907 [8:23:07<45:35,  2.75s/it][A
Training...:  93% 12914/13907 [8:23:09<44:26,  2.69s/it][A
Training...:  93% 12915/13907 [8:23:12<43:29,  2.63s/it][A
Training...:  93% 12916/13907 [8:23:14<42:52,  2.60s/it][A
Training...:  93% 12917/13907 [8:23:17<42:11,  2.56s/it][A
Training...:  93% 12918/13907 [8:23:19<41:16,  2.50s/it][A
Training...:  93% 12919/13907 [8:23:22<40:48,  2.48s/it][A
Training...:  93% 12920/13907 [8:23:24<40:17,  2.45s/it][A
Training...:  93% 12921/13907 [8:23:27<39:59,  2.43s/it][A
Training...:  93% 12922/13907 [8:23:29<39:35,  2.41s/it][A
Training...:  93% 12923/13907 [8:23:31<38:59,  2.38s/it][A
Training...:  93% 12924/13907 [8:23:33<38:21,  2.34s/it][A
Training...:  93% 12925/13907 [8:23:36<37:52,  2.31s/it][A
Training...:  93% 12926/13907 [8:23:38<37:18,  2.28s/it][A
Training...:  93% 12927/13907 [8:23:40<36:50,  2.26s/it][A
Training...:  93% 12928/13907 [8:23:42<36:12,  2.22s/it][A
Training...:  93% 12929/13907 [8:23:44<35:43,  2.19s/it][A
Training...:  93% 12930/13907 [8:23:46<35:14,  2.16s/it][A
Training...:  93% 12931/13907 [8:23:49<34:44,  2.14s/it][A
Training...:  93% 12932/13907 [8:23:51<34:04,  2.10s/it][A
Training...:  93% 12933/13907 [8:23:53<33:38,  2.07s/it][A
Training...:  93% 12934/13907 [8:23:54<33:02,  2.04s/it][A
Training...:  93% 12935/13907 [8:23:56<32:34,  2.01s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:54:10<17:31:07, 31533.87s/it]
Training...:  93% 12935/13907 [8:23:59<32:34,  2.01s/it][A
Training...:  93% 12936/13907 [8:23:59<33:32,  2.07s/it][A
Training...:  93% 12937/13907 [8:24:01<32:49,  2.03s/it][A
Training...:  93% 12938/13907 [8:24:02<31:48,  1.97s/it][A
Training...:  93% 12939/13907 [8:24:04<30:48,  1.91s/it][A
Training...:  93% 12940/13907 [8:24:06<30:00,  1.86s/it][A
Training...:  93% 12941/13907 [8:24:08<29:14,  1.82s/it][A
Training...:  93% 12942/13907 [8:24:09<28:32,  1.77s/it][A
Training...:  93% 12943/13907 [8:24:11<27:46,  1.73s/it][A
Training...:  93% 12944/13907 [8:24:13<27:08,  1.69s/it][A
Training...:  93% 12945/13907 [8:24:14<26:20,  1.64s/it][A
Training...:  93% 12946/13907 [8:24:16<25:34,  1.60s/it][A
Training...:  93% 12947/13907 [8:24:17<24:42,  1.54s/it][A
Training...:  93% 12948/13907 [8:24:18<23:41,  1.48s/it][A
Training...:  93% 12949/13907 [8:24:20<22:31,  1.41s/it][A
Training...:  93% 12950/13907 [8:24:21<20:49,  1.31s/it][A
Training...:  93% 12951/13907 [8:24:24<32:19,  2.03s/it][A
Training...:  93% 12952/13907 [8:24:28<39:23,  2.47s/it][A
Training...:  93% 12953/13907 [8:24:31<43:13,  2.72s/it][A
Training...:  93% 12954/13907 [8:24:34<45:24,  2.86s/it][A
Training...:  93% 12955/13907 [8:24:37<46:18,  2.92s/it][A
Training...:  93% 12956/13907 [8:24:40<46:31,  2.94s/it][A
Training...:  93% 12957/13907 [8:24:43<46:28,  2.94s/it][A
Training...:  93% 12958/13907 [8:24:46<46:06,  2.92s/it][A
Training...:  93% 12959/13907 [8:24:49<45:27,  2.88s/it][A
Training...:  93% 12960/13907 [8:24:52<44:47,  2.84s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:55:06<17:31:07, 31533.87s/it]
Training...:  93% 12960/13907 [8:24:55<44:47,  2.84s/it][A
Training...:  93% 12961/13907 [8:24:55<46:01,  2.92s/it][A
Training...:  93% 12962/13907 [8:24:58<45:08,  2.87s/it][A
Training...:  93% 12963/13907 [8:25:00<43:45,  2.78s/it][A
Training...:  93% 12964/13907 [8:25:03<42:38,  2.71s/it][A
Training...:  93% 12965/13907 [8:25:05<41:34,  2.65s/it][A
Training...:  93% 12966/13907 [8:25:08<40:48,  2.60s/it][A
Training...:  93% 12967/13907 [8:25:10<39:54,  2.55s/it][A
Training...:  93% 12968/13907 [8:25:13<39:16,  2.51s/it][A
Training...:  93% 12969/13907 [8:25:15<38:40,  2.47s/it][A
Training...:  93% 12970/13907 [8:25:17<37:55,  2.43s/it][A
Training...:  93% 12971/13907 [8:25:20<37:18,  2.39s/it][A
Training...:  93% 12972/13907 [8:25:22<36:34,  2.35s/it][A
Training...:  93% 12973/13907 [8:25:24<36:05,  2.32s/it][A
Training...:  93% 12974/13907 [8:25:26<35:51,  2.31s/it][A
Training...:  93% 12975/13907 [8:25:29<35:34,  2.29s/it][A
Training...:  93% 12976/13907 [8:25:31<34:57,  2.25s/it][A
Training...:  93% 12977/13907 [8:25:33<34:17,  2.21s/it][A
Training...:  93% 12978/13907 [8:25:35<33:40,  2.17s/it][A
Training...:  93% 12979/13907 [8:25:37<33:05,  2.14s/it][A
Training...:  93% 12980/13907 [8:25:39<32:32,  2.11s/it][A
Training...:  93% 12981/13907 [8:25:41<32:03,  2.08s/it][A
Training...:  93% 12982/13907 [8:25:43<31:33,  2.05s/it][A
Training...:  93% 12983/13907 [8:25:45<31:08,  2.02s/it][A
Training...:  93% 12984/13907 [8:25:47<30:38,  1.99s/it][A
Training...:  93% 12985/13907 [8:25:49<30:08,  1.96s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:56:02<17:31:07, 31533.87s/it]
Training...:  93% 12985/13907 [8:25:51<30:08,  1.96s/it][A
Training...:  93% 12986/13907 [8:25:51<31:03,  2.02s/it][A
Training...:  93% 12987/13907 [8:25:53<30:31,  1.99s/it][A
Training...:  93% 12988/13907 [8:25:55<29:41,  1.94s/it][A
Training...:  93% 12989/13907 [8:25:56<29:02,  1.90s/it][A
Training...:  93% 12990/13907 [8:25:58<28:28,  1.86s/it][A
Training...:  93% 12991/13907 [8:26:00<27:37,  1.81s/it][A
Training...:  93% 12992/13907 [8:26:02<26:49,  1.76s/it][A
Training...:  93% 12993/13907 [8:26:03<26:09,  1.72s/it][A
Training...:  93% 12994/13907 [8:26:05<25:34,  1.68s/it][A
Training...:  93% 12995/13907 [8:26:06<24:52,  1.64s/it][A
Training...:  93% 12996/13907 [8:26:08<24:02,  1.58s/it][A
Training...:  93% 12997/13907 [8:26:09<23:14,  1.53s/it][A
Training...:  93% 12998/13907 [8:26:11<22:19,  1.47s/it][A
Training...:  93% 12999/13907 [8:26:12<21:13,  1.40s/it][A
Training...:  93% 13000/13907 [8:26:13<19:40,  1.30s/it][A
Training...:  93% 13001/13907 [8:26:17<30:58,  2.05s/it][A
Training...:  93% 13002/13907 [8:26:20<37:46,  2.50s/it][A
Training...:  93% 13003/13907 [8:26:24<41:17,  2.74s/it][A
Training...:  94% 13004/13907 [8:26:27<43:08,  2.87s/it][A
Training...:  94% 13005/13907 [8:26:30<43:51,  2.92s/it][A
Training...:  94% 13006/13907 [8:26:33<44:01,  2.93s/it][A
Training...:  94% 13007/13907 [8:26:36<43:42,  2.91s/it][A
Training...:  94% 13008/13907 [8:26:38<43:23,  2.90s/it][A
Training...:  94% 13009/13907 [8:26:41<42:58,  2.87s/it][A
Training...:  94% 13010/13907 [8:26:44<42:23,  2.84s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:56:58<17:31:07, 31533.87s/it]
Training...:  94% 13010/13907 [8:26:47<42:23,  2.84s/it][A
Training...:  94% 13011/13907 [8:26:47<43:36,  2.92s/it][A
Training...:  94% 13012/13907 [8:26:50<42:41,  2.86s/it][A
Training...:  94% 13013/13907 [8:26:52<41:26,  2.78s/it][A
Training...:  94% 13014/13907 [8:26:55<40:30,  2.72s/it][A
Training...:  94% 13015/13907 [8:26:58<39:36,  2.66s/it][A
Training...:  94% 13016/13907 [8:27:00<38:44,  2.61s/it][A
Training...:  94% 13017/13907 [8:27:02<37:57,  2.56s/it][A
Training...:  94% 13018/13907 [8:27:05<37:12,  2.51s/it][A
Training...:  94% 13019/13907 [8:27:07<36:30,  2.47s/it][A
Training...:  94% 13020/13907 [8:27:10<35:49,  2.42s/it][A
Training...:  94% 13021/13907 [8:27:12<35:19,  2.39s/it][A
Training...:  94% 13022/13907 [8:27:14<34:38,  2.35s/it][A
Training...:  94% 13023/13907 [8:27:16<34:07,  2.32s/it][A
Training...:  94% 13024/13907 [8:27:19<33:28,  2.28s/it][A
Training...:  94% 13025/13907 [8:27:21<32:52,  2.24s/it][A
Training...:  94% 13026/13907 [8:27:23<32:28,  2.21s/it][A
Training...:  94% 13027/13907 [8:27:25<31:56,  2.18s/it][A
Training...:  94% 13028/13907 [8:27:27<31:30,  2.15s/it][A
Training...:  94% 13029/13907 [8:27:29<31:03,  2.12s/it][A
Training...:  94% 13030/13907 [8:27:31<30:38,  2.10s/it][A
Training...:  94% 13031/13907 [8:27:33<30:12,  2.07s/it][A
Training...:  94% 13032/13907 [8:27:35<29:41,  2.04s/it][A
Training...:  94% 13033/13907 [8:27:37<29:12,  2.01s/it][A
Training...:  94% 13034/13907 [8:27:39<28:40,  1.97s/it][A
Training...:  94% 13035/13907 [8:27:41<28:13,  1.94s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:57:54<17:31:07, 31533.87s/it]
Training...:  94% 13035/13907 [8:27:43<28:13,  1.94s/it][A
Training...:  94% 13036/13907 [8:27:43<29:05,  2.00s/it][A
Training...:  94% 13037/13907 [8:27:45<28:28,  1.96s/it][A
Training...:  94% 13038/13907 [8:27:47<27:43,  1.91s/it][A
Training...:  94% 13039/13907 [8:27:48<27:00,  1.87s/it][A
Training...:  94% 13040/13907 [8:27:50<26:34,  1.84s/it][A
Training...:  94% 13041/13907 [8:27:52<25:54,  1.80s/it][A
Training...:  94% 13042/13907 [8:27:53<25:15,  1.75s/it][A
Training...:  94% 13043/13907 [8:27:55<24:35,  1.71s/it][A
Training...:  94% 13044/13907 [8:27:57<24:02,  1.67s/it][A
Training...:  94% 13045/13907 [8:27:58<23:19,  1.62s/it][A
Training...:  94% 13046/13907 [8:28:00<22:26,  1.56s/it][A
Training...:  94% 13047/13907 [8:28:01<21:33,  1.50s/it][A
Training...:  94% 13048/13907 [8:28:02<20:43,  1.45s/it][A
Training...:  94% 13049/13907 [8:28:03<19:43,  1.38s/it][A
Training...:  94% 13050/13907 [8:28:05<18:19,  1.28s/it][A
Training...:  94% 13051/13907 [8:28:08<28:49,  2.02s/it][A
Training...:  94% 13052/13907 [8:28:12<35:12,  2.47s/it][A
Training...:  94% 13053/13907 [8:28:15<38:29,  2.70s/it][A
Training...:  94% 13054/13907 [8:28:18<40:22,  2.84s/it][A
Training...:  94% 13055/13907 [8:28:21<41:18,  2.91s/it][A
Training...:  94% 13056/13907 [8:28:24<41:23,  2.92s/it][A
Training...:  94% 13057/13907 [8:28:27<41:26,  2.93s/it][A
Training...:  94% 13058/13907 [8:28:30<40:57,  2.89s/it][A
Training...:  94% 13059/13907 [8:28:33<40:28,  2.86s/it][A
Training...:  94% 13060/13907 [8:28:36<39:56,  2.83s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:58:50<17:31:07, 31533.87s/it]
Training...:  94% 13060/13907 [8:28:39<39:56,  2.83s/it][A
Training...:  94% 13061/13907 [8:28:39<41:07,  2.92s/it][A
Training...:  94% 13062/13907 [8:28:41<40:22,  2.87s/it][A
Training...:  94% 13063/13907 [8:28:44<39:16,  2.79s/it][A
Training...:  94% 13064/13907 [8:28:47<38:16,  2.72s/it][A
Training...:  94% 13065/13907 [8:28:49<37:27,  2.67s/it][A
Training...:  94% 13066/13907 [8:28:52<36:41,  2.62s/it][A
Training...:  94% 13067/13907 [8:28:54<36:03,  2.58s/it][A
Training...:  94% 13068/13907 [8:28:57<35:27,  2.54s/it][A
Training...:  94% 13069/13907 [8:28:59<34:42,  2.48s/it][A
Training...:  94% 13070/13907 [8:29:01<34:05,  2.44s/it][A
Training...:  94% 13071/13907 [8:29:04<33:30,  2.41s/it][A
Training...:  94% 13072/13907 [8:29:06<33:01,  2.37s/it][A
Training...:  94% 13073/13907 [8:29:08<32:22,  2.33s/it][A
Training...:  94% 13074/13907 [8:29:10<31:50,  2.29s/it][A
Training...:  94% 13075/13907 [8:29:12<31:14,  2.25s/it][A
Training...:  94% 13076/13907 [8:29:15<30:44,  2.22s/it][A
Training...:  94% 13077/13907 [8:29:17<30:17,  2.19s/it][A
Training...:  94% 13078/13907 [8:29:19<29:47,  2.16s/it][A
Training...:  94% 13079/13907 [8:29:21<29:17,  2.12s/it][A
Training...:  94% 13080/13907 [8:29:23<28:45,  2.09s/it][A
Training...:  94% 13081/13907 [8:29:25<28:20,  2.06s/it][A
Training...:  94% 13082/13907 [8:29:27<27:59,  2.04s/it][A
Training...:  94% 13083/13907 [8:29:29<27:29,  2.00s/it][A
Training...:  94% 13084/13907 [8:29:31<27:14,  1.99s/it][A
Training...:  94% 13085/13907 [8:29:33<26:44,  1.95s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [25:59:46<17:31:07, 31533.87s/it]
Training...:  94% 13085/13907 [8:29:35<26:44,  1.95s/it][A
Training...:  94% 13086/13907 [8:29:35<27:43,  2.03s/it][A
Training...:  94% 13087/13907 [8:29:37<27:08,  1.99s/it][A
Training...:  94% 13088/13907 [8:29:38<26:11,  1.92s/it][A
Training...:  94% 13089/13907 [8:29:40<25:25,  1.86s/it][A
Training...:  94% 13090/13907 [8:29:42<24:38,  1.81s/it][A
Training...:  94% 13091/13907 [8:29:44<24:01,  1.77s/it][A
Training...:  94% 13092/13907 [8:29:45<23:34,  1.74s/it][A
Training...:  94% 13093/13907 [8:29:47<22:58,  1.69s/it][A
Training...:  94% 13094/13907 [8:29:48<22:27,  1.66s/it][A
Training...:  94% 13095/13907 [8:29:50<21:53,  1.62s/it][A
Training...:  94% 13096/13907 [8:29:51<21:10,  1.57s/it][A
Training...:  94% 13097/13907 [8:29:53<20:28,  1.52s/it][A
Training...:  94% 13098/13907 [8:29:54<19:44,  1.46s/it][A
Training...:  94% 13099/13907 [8:29:55<18:48,  1.40s/it][A
Training...:  94% 13100/13907 [8:29:56<17:26,  1.30s/it][A
Training...:  94% 13101/13907 [8:30:00<27:11,  2.02s/it][A
Training...:  94% 13102/13907 [8:30:04<33:02,  2.46s/it][A
Training...:  94% 13103/13907 [8:30:07<36:12,  2.70s/it][A
Training...:  94% 13104/13907 [8:30:10<37:53,  2.83s/it][A
Training...:  94% 13105/13907 [8:30:13<38:32,  2.88s/it][A
Training...:  94% 13106/13907 [8:30:16<38:33,  2.89s/it][A
Training...:  94% 13107/13907 [8:30:19<38:18,  2.87s/it][A
Training...:  94% 13108/13907 [8:30:22<38:03,  2.86s/it][A
Training...:  94% 13109/13907 [8:30:24<37:30,  2.82s/it][A
Training...:  94% 13110/13907 [8:30:27<37:00,  2.79s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:00:41<17:31:07, 31533.87s/it]
Training...:  94% 13110/13907 [8:30:30<37:00,  2.79s/it][A
Training...:  94% 13111/13907 [8:30:30<37:58,  2.86s/it][A
Training...:  94% 13112/13907 [8:30:33<37:20,  2.82s/it][A
Training...:  94% 13113/13907 [8:30:35<36:14,  2.74s/it][A
Training...:  94% 13114/13907 [8:30:38<35:25,  2.68s/it][A
Training...:  94% 13115/13907 [8:30:40<34:44,  2.63s/it][A
Training...:  94% 13116/13907 [8:30:43<34:05,  2.59s/it][A
Training...:  94% 13117/13907 [8:30:45<33:31,  2.55s/it][A
Training...:  94% 13118/13907 [8:30:48<33:01,  2.51s/it][A
Training...:  94% 13119/13907 [8:30:50<32:29,  2.47s/it][A
Training...:  94% 13120/13907 [8:30:52<31:57,  2.44s/it][A
Training...:  94% 13121/13907 [8:30:55<31:29,  2.40s/it][A
Training...:  94% 13122/13907 [8:30:57<30:56,  2.37s/it][A
Training...:  94% 13123/13907 [8:30:59<30:26,  2.33s/it][A
Training...:  94% 13124/13907 [8:31:01<29:56,  2.29s/it][A
Training...:  94% 13125/13907 [8:31:04<29:29,  2.26s/it][A
Training...:  94% 13126/13907 [8:31:06<29:00,  2.23s/it][A
Training...:  94% 13127/13907 [8:31:08<28:35,  2.20s/it][A
Training...:  94% 13128/13907 [8:31:10<28:06,  2.17s/it][A
Training...:  94% 13129/13907 [8:31:12<27:45,  2.14s/it][A
Training...:  94% 13130/13907 [8:31:14<27:26,  2.12s/it][A
Training...:  94% 13131/13907 [8:31:16<26:56,  2.08s/it][A
Training...:  94% 13132/13907 [8:31:18<26:27,  2.05s/it][A
Training...:  94% 13133/13907 [8:31:20<26:02,  2.02s/it][A
Training...:  94% 13134/13907 [8:31:22<25:43,  2.00s/it][A
Training...:  94% 13135/13907 [8:31:24<25:23,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:01:37<17:31:07, 31533.87s/it]
Training...:  94% 13135/13907 [8:31:26<25:23,  1.97s/it][A
Training...:  94% 13136/13907 [8:31:26<26:13,  2.04s/it][A
Training...:  94% 13137/13907 [8:31:28<25:52,  2.02s/it][A
Training...:  94% 13138/13907 [8:31:30<24:59,  1.95s/it][A
Training...:  94% 13139/13907 [8:31:32<24:22,  1.90s/it][A
Training...:  94% 13140/13907 [8:31:33<23:45,  1.86s/it][A
Training...:  94% 13141/13907 [8:31:35<23:07,  1.81s/it][A
Training...:  94% 13142/13907 [8:31:37<22:32,  1.77s/it][A
Training...:  95% 13143/13907 [8:31:38<22:00,  1.73s/it][A
Training...:  95% 13144/13907 [8:31:40<21:31,  1.69s/it][A
Training...:  95% 13145/13907 [8:31:42<21:04,  1.66s/it][A
Training...:  95% 13146/13907 [8:31:43<20:24,  1.61s/it][A
Training...:  95% 13147/13907 [8:31:45<19:40,  1.55s/it][A
Training...:  95% 13148/13907 [8:31:46<18:53,  1.49s/it][A
Training...:  95% 13149/13907 [8:31:47<17:57,  1.42s/it][A
Training...:  95% 13150/13907 [8:31:48<16:45,  1.33s/it][A
Training...:  95% 13151/13907 [8:31:52<25:45,  2.04s/it][A
Training...:  95% 13152/13907 [8:31:56<31:10,  2.48s/it][A
Training...:  95% 13153/13907 [8:31:59<34:10,  2.72s/it][A
Training...:  95% 13154/13907 [8:32:02<35:38,  2.84s/it][A
Training...:  95% 13155/13907 [8:32:05<36:25,  2.91s/it][A
Training...:  95% 13156/13907 [8:32:08<36:35,  2.92s/it][A
Training...:  95% 13157/13907 [8:32:11<36:27,  2.92s/it][A
Training...:  95% 13158/13907 [8:32:14<36:06,  2.89s/it][A
Training...:  95% 13159/13907 [8:32:16<35:44,  2.87s/it][A
Training...:  95% 13160/13907 [8:32:19<35:13,  2.83s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:02:33<17:31:07, 31533.87s/it]
Training...:  95% 13160/13907 [8:32:22<35:13,  2.83s/it][A
Training...:  95% 13161/13907 [8:32:22<36:22,  2.93s/it][A
Training...:  95% 13162/13907 [8:32:25<35:40,  2.87s/it][A
Training...:  95% 13163/13907 [8:32:28<34:33,  2.79s/it][A
Training...:  95% 13164/13907 [8:32:30<33:35,  2.71s/it][A
Training...:  95% 13165/13907 [8:32:33<32:57,  2.66s/it][A
Training...:  95% 13166/13907 [8:32:35<32:28,  2.63s/it][A
Training...:  95% 13167/13907 [8:32:38<32:07,  2.61s/it][A
Training...:  95% 13168/13907 [8:32:40<31:29,  2.56s/it][A
Training...:  95% 13169/13907 [8:32:43<30:50,  2.51s/it][A
Training...:  95% 13170/13907 [8:32:45<30:22,  2.47s/it][A
Training...:  95% 13171/13907 [8:32:47<29:51,  2.43s/it][A
Training...:  95% 13172/13907 [8:32:50<29:25,  2.40s/it][A
Training...:  95% 13173/13907 [8:32:52<28:54,  2.36s/it][A
Training...:  95% 13174/13907 [8:32:54<28:26,  2.33s/it][A
Training...:  95% 13175/13907 [8:32:57<27:54,  2.29s/it][A
Training...:  95% 13176/13907 [8:32:59<27:24,  2.25s/it][A
Training...:  95% 13177/13907 [8:33:01<26:58,  2.22s/it][A
Training...:  95% 13178/13907 [8:33:03<26:27,  2.18s/it][A
Training...:  95% 13179/13907 [8:33:05<25:57,  2.14s/it][A
Training...:  95% 13180/13907 [8:33:07<25:33,  2.11s/it][A
Training...:  95% 13181/13907 [8:33:09<25:10,  2.08s/it][A
Training...:  95% 13182/13907 [8:33:11<24:47,  2.05s/it][A
Training...:  95% 13183/13907 [8:33:13<24:25,  2.02s/it][A
Training...:  95% 13184/13907 [8:33:15<24:03,  2.00s/it][A
Training...:  95% 13185/13907 [8:33:17<23:40,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:03:30<17:31:07, 31533.87s/it]
Training...:  95% 13185/13907 [8:33:19<23:40,  1.97s/it][A
Training...:  95% 13186/13907 [8:33:19<24:23,  2.03s/it][A
Training...:  95% 13187/13907 [8:33:21<23:58,  2.00s/it][A
Training...:  95% 13188/13907 [8:33:23<23:13,  1.94s/it][A
Training...:  95% 13189/13907 [8:33:24<22:42,  1.90s/it][A
Training...:  95% 13190/13907 [8:33:26<22:10,  1.86s/it][A
Training...:  95% 13191/13907 [8:33:28<21:33,  1.81s/it][A
Training...:  95% 13192/13907 [8:33:30<20:54,  1.75s/it][A
Training...:  95% 13193/13907 [8:33:31<20:25,  1.72s/it][A
Training...:  95% 13194/13907 [8:33:33<19:56,  1.68s/it][A
Training...:  95% 13195/13907 [8:33:34<19:23,  1.63s/it][A
Training...:  95% 13196/13907 [8:33:36<18:47,  1.59s/it][A
Training...:  95% 13197/13907 [8:33:37<18:08,  1.53s/it][A
Training...:  95% 13198/13907 [8:33:39<17:28,  1.48s/it][A
Training...:  95% 13199/13907 [8:33:40<16:42,  1.42s/it][A
Training...:  95% 13200/13907 [8:33:41<15:31,  1.32s/it][A
Training...:  95% 13201/13907 [8:33:45<24:23,  2.07s/it][A
Training...:  95% 13202/13907 [8:33:48<29:40,  2.53s/it][A
Training...:  95% 13203/13907 [8:33:52<32:11,  2.74s/it][A
Training...:  95% 13204/13907 [8:33:55<33:34,  2.87s/it][A
Training...:  95% 13205/13907 [8:33:58<34:14,  2.93s/it][A
Training...:  95% 13206/13907 [8:34:01<34:27,  2.95s/it][A
Training...:  95% 13207/13907 [8:34:04<34:20,  2.94s/it][A
Training...:  95% 13208/13907 [8:34:07<34:02,  2.92s/it][A
Training...:  95% 13209/13907 [8:34:09<33:39,  2.89s/it][A
Training...:  95% 13210/13907 [8:34:12<33:20,  2.87s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:04:26<17:31:07, 31533.87s/it]
Training...:  95% 13210/13907 [8:34:15<33:20,  2.87s/it][A
Training...:  95% 13211/13907 [8:34:15<34:09,  2.94s/it][A
Training...:  95% 13212/13907 [8:34:18<33:27,  2.89s/it][A
Training...:  95% 13213/13907 [8:34:21<32:26,  2.81s/it][A
Training...:  95% 13214/13907 [8:34:23<31:41,  2.74s/it][A
Training...:  95% 13215/13907 [8:34:26<31:02,  2.69s/it][A
Training...:  95% 13216/13907 [8:34:28<30:24,  2.64s/it][A
Training...:  95% 13217/13907 [8:34:31<29:51,  2.60s/it][A
Training...:  95% 13218/13907 [8:34:33<29:15,  2.55s/it][A
Training...:  95% 13219/13907 [8:34:36<28:49,  2.51s/it][A
Training...:  95% 13220/13907 [8:34:38<28:15,  2.47s/it][A
Training...:  95% 13221/13907 [8:34:40<27:48,  2.43s/it][A
Training...:  95% 13222/13907 [8:34:43<27:18,  2.39s/it][A
Training...:  95% 13223/13907 [8:34:45<26:49,  2.35s/it][A
Training...:  95% 13224/13907 [8:34:47<26:18,  2.31s/it][A
Training...:  95% 13225/13907 [8:34:49<25:48,  2.27s/it][A
Training...:  95% 13226/13907 [8:34:52<25:22,  2.24s/it][A
Training...:  95% 13227/13907 [8:34:54<25:00,  2.21s/it][A
Training...:  95% 13228/13907 [8:34:56<24:46,  2.19s/it][A
Training...:  95% 13229/13907 [8:34:58<24:23,  2.16s/it][A
Training...:  95% 13230/13907 [8:35:00<23:56,  2.12s/it][A
Training...:  95% 13231/13907 [8:35:02<23:33,  2.09s/it][A
Training...:  95% 13232/13907 [8:35:04<23:17,  2.07s/it][A
Training...:  95% 13233/13907 [8:35:06<22:51,  2.03s/it][A
Training...:  95% 13234/13907 [8:35:08<22:35,  2.01s/it][A
Training...:  95% 13235/13907 [8:35:10<22:14,  1.99s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:05:23<17:31:07, 31533.87s/it]
Training...:  95% 13235/13907 [8:35:12<22:14,  1.99s/it][A
Training...:  95% 13236/13907 [8:35:12<22:46,  2.04s/it][A
Training...:  95% 13237/13907 [8:35:14<22:22,  2.00s/it][A
Training...:  95% 13238/13907 [8:35:16<21:40,  1.94s/it][A
Training...:  95% 13239/13907 [8:35:18<21:01,  1.89s/it][A
Training...:  95% 13240/13907 [8:35:19<20:30,  1.85s/it][A
Training...:  95% 13241/13907 [8:35:21<19:53,  1.79s/it][A
Training...:  95% 13242/13907 [8:35:23<19:22,  1.75s/it][A
Training...:  95% 13243/13907 [8:35:24<18:50,  1.70s/it][A
Training...:  95% 13244/13907 [8:35:26<18:26,  1.67s/it][A
Training...:  95% 13245/13907 [8:35:27<17:56,  1.63s/it][A
Training...:  95% 13246/13907 [8:35:29<17:25,  1.58s/it][A
Training...:  95% 13247/13907 [8:35:30<16:48,  1.53s/it][A
Training...:  95% 13248/13907 [8:35:32<16:09,  1.47s/it][A
Training...:  95% 13249/13907 [8:35:33<15:27,  1.41s/it][A
Training...:  95% 13250/13907 [8:35:34<14:23,  1.31s/it][A
Training...:  95% 13251/13907 [8:35:38<22:16,  2.04s/it][A
Training...:  95% 13252/13907 [8:35:41<27:05,  2.48s/it][A
Training...:  95% 13253/13907 [8:35:44<29:41,  2.72s/it][A
Training...:  95% 13254/13907 [8:35:48<31:03,  2.85s/it][A
Training...:  95% 13255/13907 [8:35:51<31:40,  2.91s/it][A
Training...:  95% 13256/13907 [8:35:54<31:47,  2.93s/it][A
Training...:  95% 13257/13907 [8:35:56<31:37,  2.92s/it][A
Training...:  95% 13258/13907 [8:35:59<31:22,  2.90s/it][A
Training...:  95% 13259/13907 [8:36:02<30:57,  2.87s/it][A
Training...:  95% 13260/13907 [8:36:05<30:30,  2.83s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:06:19<17:31:07, 31533.87s/it]
Training...:  95% 13260/13907 [8:36:08<30:30,  2.83s/it][A
Training...:  95% 13261/13907 [8:36:08<31:22,  2.91s/it][A
Training...:  95% 13262/13907 [8:36:11<30:52,  2.87s/it][A
Training...:  95% 13263/13907 [8:36:13<30:01,  2.80s/it][A
Training...:  95% 13264/13907 [8:36:16<29:15,  2.73s/it][A
Training...:  95% 13265/13907 [8:36:18<28:28,  2.66s/it][A
Training...:  95% 13266/13907 [8:36:21<27:52,  2.61s/it][A
Training...:  95% 13267/13907 [8:36:23<27:22,  2.57s/it][A
Training...:  95% 13268/13907 [8:36:26<26:49,  2.52s/it][A
Training...:  95% 13269/13907 [8:36:28<26:33,  2.50s/it][A
Training...:  95% 13270/13907 [8:36:31<26:19,  2.48s/it][A
Training...:  95% 13271/13907 [8:36:33<25:50,  2.44s/it][A
Training...:  95% 13272/13907 [8:36:35<25:25,  2.40s/it][A
Training...:  95% 13273/13907 [8:36:38<24:59,  2.36s/it][A
Training...:  95% 13274/13907 [8:36:40<24:32,  2.33s/it][A
Training...:  95% 13275/13907 [8:36:42<24:00,  2.28s/it][A
Training...:  95% 13276/13907 [8:36:44<23:34,  2.24s/it][A
Training...:  95% 13277/13907 [8:36:46<23:14,  2.21s/it][A
Training...:  95% 13278/13907 [8:36:48<22:54,  2.19s/it][A
Training...:  95% 13279/13907 [8:36:51<22:35,  2.16s/it][A
Training...:  95% 13280/13907 [8:36:53<22:11,  2.12s/it][A
Training...:  95% 13281/13907 [8:36:55<21:51,  2.09s/it][A
Training...:  96% 13282/13907 [8:36:57<21:34,  2.07s/it][A
Training...:  96% 13283/13907 [8:36:59<21:14,  2.04s/it][A
Training...:  96% 13284/13907 [8:37:01<20:46,  2.00s/it][A
Training...:  96% 13285/13907 [8:37:02<20:23,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:07:16<17:31:07, 31533.87s/it]
Training...:  96% 13285/13907 [8:37:05<20:23,  1.97s/it][A
Training...:  96% 13286/13907 [8:37:05<20:58,  2.03s/it][A
Training...:  96% 13287/13907 [8:37:07<20:37,  2.00s/it][A
Training...:  96% 13288/13907 [8:37:08<20:00,  1.94s/it][A
Training...:  96% 13289/13907 [8:37:10<19:27,  1.89s/it][A
Training...:  96% 13290/13907 [8:37:12<18:55,  1.84s/it][A
Training...:  96% 13291/13907 [8:37:14<18:27,  1.80s/it][A
Training...:  96% 13292/13907 [8:37:15<18:05,  1.77s/it][A
Training...:  96% 13293/13907 [8:37:17<17:43,  1.73s/it][A
Training...:  96% 13294/13907 [8:37:18<17:23,  1.70s/it][A
Training...:  96% 13295/13907 [8:37:20<16:55,  1.66s/it][A
Training...:  96% 13296/13907 [8:37:22<16:27,  1.62s/it][A
Training...:  96% 13297/13907 [8:37:23<15:58,  1.57s/it][A
Training...:  96% 13298/13907 [8:37:24<15:20,  1.51s/it][A
Training...:  96% 13299/13907 [8:37:26<14:35,  1.44s/it][A
Training...:  96% 13300/13907 [8:37:27<13:28,  1.33s/it][A
Training...:  96% 13301/13907 [8:37:31<21:14,  2.10s/it][A
Training...:  96% 13302/13907 [8:37:34<25:42,  2.55s/it][A
Training...:  96% 13303/13907 [8:37:38<28:11,  2.80s/it][A
Training...:  96% 13304/13907 [8:37:41<29:38,  2.95s/it][A
Training...:  96% 13305/13907 [8:37:44<30:12,  3.01s/it][A
Training...:  96% 13306/13907 [8:37:47<30:12,  3.01s/it][A
Training...:  96% 13307/13907 [8:37:50<30:00,  3.00s/it][A
Training...:  96% 13308/13907 [8:37:53<29:35,  2.96s/it][A
Training...:  96% 13309/13907 [8:37:56<29:13,  2.93s/it][A
Training...:  96% 13310/13907 [8:37:59<28:49,  2.90s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:08:13<17:31:07, 31533.87s/it]
Training...:  96% 13310/13907 [8:38:02<28:49,  2.90s/it][A
Training...:  96% 13311/13907 [8:38:02<29:32,  2.97s/it][A
Training...:  96% 13312/13907 [8:38:05<28:45,  2.90s/it][A
Training...:  96% 13313/13907 [8:38:07<27:50,  2.81s/it][A
Training...:  96% 13314/13907 [8:38:10<27:08,  2.75s/it][A
Training...:  96% 13315/13907 [8:38:12<26:32,  2.69s/it][A
Training...:  96% 13316/13907 [8:38:15<25:59,  2.64s/it][A
Training...:  96% 13317/13907 [8:38:17<25:26,  2.59s/it][A
Training...:  96% 13318/13907 [8:38:20<25:00,  2.55s/it][A
Training...:  96% 13319/13907 [8:38:22<24:37,  2.51s/it][A
Training...:  96% 13320/13907 [8:38:25<24:15,  2.48s/it][A
Training...:  96% 13321/13907 [8:38:27<23:50,  2.44s/it][A
Training...:  96% 13322/13907 [8:38:29<23:28,  2.41s/it][A
Training...:  96% 13323/13907 [8:38:31<22:59,  2.36s/it][A
Training...:  96% 13324/13907 [8:38:34<22:38,  2.33s/it][A
Training...:  96% 13325/13907 [8:38:36<22:23,  2.31s/it][A
Training...:  96% 13326/13907 [8:38:38<22:05,  2.28s/it][A
Training...:  96% 13327/13907 [8:38:40<21:35,  2.23s/it][A
Training...:  96% 13328/13907 [8:38:42<21:07,  2.19s/it][A
Training...:  96% 13329/13907 [8:38:44<20:41,  2.15s/it][A
Training...:  96% 13330/13907 [8:38:47<20:21,  2.12s/it][A
Training...:  96% 13331/13907 [8:38:49<19:59,  2.08s/it][A
Training...:  96% 13332/13907 [8:38:50<19:39,  2.05s/it][A
Training...:  96% 13333/13907 [8:38:52<19:21,  2.02s/it][A
Training...:  96% 13334/13907 [8:38:54<19:00,  1.99s/it][A
Training...:  96% 13335/13907 [8:38:56<18:43,  1.96s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:09:09<17:31:07, 31533.87s/it]
Training...:  96% 13335/13907 [8:38:58<18:43,  1.96s/it][A
Training...:  96% 13336/13907 [8:38:58<19:20,  2.03s/it][A
Training...:  96% 13337/13907 [8:39:00<19:02,  2.00s/it][A
Training...:  96% 13338/13907 [8:39:02<18:24,  1.94s/it][A
Training...:  96% 13339/13907 [8:39:04<17:50,  1.88s/it][A
Training...:  96% 13340/13907 [8:39:06<17:27,  1.85s/it][A
Training...:  96% 13341/13907 [8:39:07<17:01,  1.80s/it][A
Training...:  96% 13342/13907 [8:39:09<16:35,  1.76s/it][A
Training...:  96% 13343/13907 [8:39:11<16:08,  1.72s/it][A
Training...:  96% 13344/13907 [8:39:12<15:45,  1.68s/it][A
Training...:  96% 13345/13907 [8:39:14<15:21,  1.64s/it][A
Training...:  96% 13346/13907 [8:39:15<14:52,  1.59s/it][A
Training...:  96% 13347/13907 [8:39:17<14:21,  1.54s/it][A
Training...:  96% 13348/13907 [8:39:18<13:43,  1.47s/it][A
Training...:  96% 13349/13907 [8:39:19<13:01,  1.40s/it][A
Training...:  96% 13350/13907 [8:39:20<12:03,  1.30s/it][A
Training...:  96% 13351/13907 [8:39:24<18:42,  2.02s/it][A
Training...:  96% 13352/13907 [8:39:28<22:56,  2.48s/it][A
Training...:  96% 13353/13907 [8:39:31<25:20,  2.74s/it][A
Training...:  96% 13354/13907 [8:39:34<26:33,  2.88s/it][A
Training...:  96% 13355/13907 [8:39:37<27:03,  2.94s/it][A
Training...:  96% 13356/13907 [8:39:40<27:01,  2.94s/it][A
Training...:  96% 13357/13907 [8:39:43<26:48,  2.92s/it][A
Training...:  96% 13358/13907 [8:39:46<26:25,  2.89s/it][A
Training...:  96% 13359/13907 [8:39:49<26:09,  2.86s/it][A
Training...:  96% 13360/13907 [8:39:51<25:59,  2.85s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:10:06<17:31:07, 31533.87s/it]
Training...:  96% 13360/13907 [8:39:55<25:59,  2.85s/it][A
Training...:  96% 13361/13907 [8:39:55<26:39,  2.93s/it][A
Training...:  96% 13362/13907 [8:39:57<26:04,  2.87s/it][A
Training...:  96% 13363/13907 [8:40:00<25:12,  2.78s/it][A
Training...:  96% 13364/13907 [8:40:02<24:29,  2.71s/it][A
Training...:  96% 13365/13907 [8:40:05<23:56,  2.65s/it][A
Training...:  96% 13366/13907 [8:40:07<23:22,  2.59s/it][A
Training...:  96% 13367/13907 [8:40:10<22:51,  2.54s/it][A
Training...:  96% 13368/13907 [8:40:12<22:25,  2.50s/it][A
Training...:  96% 13369/13907 [8:40:15<21:59,  2.45s/it][A
Training...:  96% 13370/13907 [8:40:17<21:36,  2.42s/it][A
Training...:  96% 13371/13907 [8:40:19<21:17,  2.38s/it][A
Training...:  96% 13372/13907 [8:40:21<20:56,  2.35s/it][A
Training...:  96% 13373/13907 [8:40:24<20:36,  2.31s/it][A
Training...:  96% 13374/13907 [8:40:26<20:17,  2.28s/it][A
Training...:  96% 13375/13907 [8:40:28<20:00,  2.26s/it][A
Training...:  96% 13376/13907 [8:40:30<19:42,  2.23s/it][A
Training...:  96% 13377/13907 [8:40:32<19:24,  2.20s/it][A
Training...:  96% 13378/13907 [8:40:35<19:06,  2.17s/it][A
Training...:  96% 13379/13907 [8:40:37<18:49,  2.14s/it][A
Training...:  96% 13380/13907 [8:40:39<18:32,  2.11s/it][A
Training...:  96% 13381/13907 [8:40:41<18:14,  2.08s/it][A
Training...:  96% 13382/13907 [8:40:43<17:53,  2.05s/it][A
Training...:  96% 13383/13907 [8:40:45<17:34,  2.01s/it][A
Training...:  96% 13384/13907 [8:40:46<17:15,  1.98s/it][A
Training...:  96% 13385/13907 [8:40:48<17:00,  1.95s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:11:02<17:31:07, 31533.87s/it]
Training...:  96% 13385/13907 [8:40:51<17:00,  1.95s/it][A
Training...:  96% 13386/13907 [8:40:51<17:36,  2.03s/it][A
Training...:  96% 13387/13907 [8:40:52<17:15,  1.99s/it][A
Training...:  96% 13388/13907 [8:40:54<16:43,  1.93s/it][A
Training...:  96% 13389/13907 [8:40:56<16:16,  1.89s/it][A
Training...:  96% 13390/13907 [8:40:58<15:57,  1.85s/it][A
Training...:  96% 13391/13907 [8:40:59<15:34,  1.81s/it][A
Training...:  96% 13392/13907 [8:41:01<15:17,  1.78s/it][A
Training...:  96% 13393/13907 [8:41:03<14:59,  1.75s/it][A
Training...:  96% 13394/13907 [8:41:05<14:38,  1.71s/it][A
Training...:  96% 13395/13907 [8:41:06<14:10,  1.66s/it][A
Training...:  96% 13396/13907 [8:41:08<13:40,  1.61s/it][A
Training...:  96% 13397/13907 [8:41:09<13:09,  1.55s/it][A
Training...:  96% 13398/13907 [8:41:10<12:38,  1.49s/it][A
Training...:  96% 13399/13907 [8:41:12<12:01,  1.42s/it][A
Training...:  96% 13400/13907 [8:41:13<11:12,  1.33s/it][A
Training...:  96% 13401/13907 [8:41:16<17:17,  2.05s/it][A
Training...:  96% 13402/13907 [8:41:20<20:53,  2.48s/it][A
Training...:  96% 13403/13907 [8:41:23<22:54,  2.73s/it][A
Training...:  96% 13404/13907 [8:41:26<24:01,  2.87s/it][A
Training...:  96% 13405/13907 [8:41:29<24:34,  2.94s/it][A
Training...:  96% 13406/13907 [8:41:32<24:43,  2.96s/it][A
Training...:  96% 13407/13907 [8:41:35<24:38,  2.96s/it][A
Training...:  96% 13408/13907 [8:41:38<24:23,  2.93s/it][A
Training...:  96% 13409/13907 [8:41:41<24:01,  2.89s/it][A
Training...:  96% 13410/13907 [8:41:44<23:39,  2.86s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:11:58<17:31:07, 31533.87s/it]
Training...:  96% 13410/13907 [8:41:47<23:39,  2.86s/it][A
Training...:  96% 13411/13907 [8:41:47<24:18,  2.94s/it][A
Training...:  96% 13412/13907 [8:41:50<23:41,  2.87s/it][A
Training...:  96% 13413/13907 [8:41:52<22:53,  2.78s/it][A
Training...:  96% 13414/13907 [8:41:55<22:10,  2.70s/it][A
Training...:  96% 13415/13907 [8:41:57<21:34,  2.63s/it][A
Training...:  96% 13416/13907 [8:42:00<21:10,  2.59s/it][A
Training...:  96% 13417/13907 [8:42:02<20:48,  2.55s/it][A
Training...:  96% 13418/13907 [8:42:05<20:23,  2.50s/it][A
Training...:  96% 13419/13907 [8:42:07<20:02,  2.46s/it][A
Training...:  96% 13420/13907 [8:42:09<19:53,  2.45s/it][A
Training...:  97% 13421/13907 [8:42:12<19:41,  2.43s/it][A
Training...:  97% 13422/13907 [8:42:14<19:16,  2.39s/it][A
Training...:  97% 13423/13907 [8:42:16<18:56,  2.35s/it][A
Training...:  97% 13424/13907 [8:42:19<18:31,  2.30s/it][A
Training...:  97% 13425/13907 [8:42:21<18:08,  2.26s/it][A
Training...:  97% 13426/13907 [8:42:23<17:46,  2.22s/it][A
Training...:  97% 13427/13907 [8:42:25<17:25,  2.18s/it][A
Training...:  97% 13428/13907 [8:42:27<17:07,  2.14s/it][A
Training...:  97% 13429/13907 [8:42:29<16:48,  2.11s/it][A
Training...:  97% 13430/13907 [8:42:31<16:31,  2.08s/it][A
Training...:  97% 13431/13907 [8:42:33<16:14,  2.05s/it][A
Training...:  97% 13432/13907 [8:42:35<15:58,  2.02s/it][A
Training...:  97% 13433/13907 [8:42:37<15:43,  1.99s/it][A
Training...:  97% 13434/13907 [8:42:39<15:27,  1.96s/it][A
Training...:  97% 13435/13907 [8:42:41<15:12,  1.93s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:12:54<17:31:07, 31533.87s/it]
Training...:  97% 13435/13907 [8:42:43<15:12,  1.93s/it][A
Training...:  97% 13436/13907 [8:42:43<15:38,  1.99s/it][A
Training...:  97% 13437/13907 [8:42:45<15:20,  1.96s/it][A
Training...:  97% 13438/13907 [8:42:46<14:49,  1.90s/it][A
Training...:  97% 13439/13907 [8:42:48<14:27,  1.85s/it][A
Training...:  97% 13440/13907 [8:42:50<14:06,  1.81s/it][A
Training...:  97% 13441/13907 [8:42:52<13:46,  1.77s/it][A
Training...:  97% 13442/13907 [8:42:53<13:24,  1.73s/it][A
Training...:  97% 13443/13907 [8:42:55<13:05,  1.69s/it][A
Training...:  97% 13444/13907 [8:42:56<12:53,  1.67s/it][A
Training...:  97% 13445/13907 [8:42:58<12:33,  1.63s/it][A
Training...:  97% 13446/13907 [8:42:59<12:10,  1.59s/it][A
Training...:  97% 13447/13907 [8:43:01<11:45,  1.53s/it][A
Training...:  97% 13448/13907 [8:43:02<11:17,  1.48s/it][A
Training...:  97% 13449/13907 [8:43:03<10:44,  1.41s/it][A
Training...:  97% 13450/13907 [8:43:05<10:02,  1.32s/it][A
Training...:  97% 13451/13907 [8:43:08<15:32,  2.05s/it][A
Training...:  97% 13452/13907 [8:43:12<18:55,  2.49s/it][A
Training...:  97% 13453/13907 [8:43:15<20:46,  2.75s/it][A
Training...:  97% 13454/13907 [8:43:18<21:46,  2.88s/it][A
Training...:  97% 13455/13907 [8:43:21<22:14,  2.95s/it][A
Training...:  97% 13456/13907 [8:43:24<22:17,  2.96s/it][A
Training...:  97% 13457/13907 [8:43:27<22:16,  2.97s/it][A
Training...:  97% 13458/13907 [8:43:30<22:07,  2.96s/it][A
Training...:  97% 13459/13907 [8:43:33<21:51,  2.93s/it][A
Training...:  97% 13460/13907 [8:43:36<21:45,  2.92s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:13:50<17:31:07, 31533.87s/it]
Training...:  97% 13460/13907 [8:43:39<21:45,  2.92s/it][A
Training...:  97% 13461/13907 [8:43:39<22:26,  3.02s/it][A
Training...:  97% 13462/13907 [8:43:42<21:46,  2.94s/it][A
Training...:  97% 13463/13907 [8:43:45<20:52,  2.82s/it][A
Training...:  97% 13464/13907 [8:43:47<20:12,  2.74s/it][A
Training...:  97% 13465/13907 [8:43:50<19:38,  2.67s/it][A
Training...:  97% 13466/13907 [8:43:52<19:09,  2.61s/it][A
Training...:  97% 13467/13907 [8:43:55<18:40,  2.55s/it][A
Training...:  97% 13468/13907 [8:43:57<18:16,  2.50s/it][A
Training...:  97% 13469/13907 [8:43:59<17:53,  2.45s/it][A
Training...:  97% 13470/13907 [8:44:02<17:36,  2.42s/it][A
Training...:  97% 13471/13907 [8:44:04<17:22,  2.39s/it][A
Training...:  97% 13472/13907 [8:44:06<17:02,  2.35s/it][A
Training...:  97% 13473/13907 [8:44:08<16:43,  2.31s/it][A
Training...:  97% 13474/13907 [8:44:11<16:27,  2.28s/it][A
Training...:  97% 13475/13907 [8:44:13<16:10,  2.25s/it][A
Training...:  97% 13476/13907 [8:44:15<15:55,  2.22s/it][A
Training...:  97% 13477/13907 [8:44:17<15:38,  2.18s/it][A
Training...:  97% 13478/13907 [8:44:19<15:28,  2.16s/it][A
Training...:  97% 13479/13907 [8:44:21<15:11,  2.13s/it][A
Training...:  97% 13480/13907 [8:44:23<14:59,  2.11s/it][A
Training...:  97% 13481/13907 [8:44:25<14:47,  2.08s/it][A
Training...:  97% 13482/13907 [8:44:27<14:32,  2.05s/it][A
Training...:  97% 13483/13907 [8:44:29<14:21,  2.03s/it][A
Training...:  97% 13484/13907 [8:44:31<14:07,  2.00s/it][A
Training...:  97% 13485/13907 [8:44:33<13:50,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:14:46<17:31:07, 31533.87s/it]
Training...:  97% 13485/13907 [8:44:35<13:50,  1.97s/it][A
Training...:  97% 13486/13907 [8:44:35<14:14,  2.03s/it][A
Training...:  97% 13487/13907 [8:44:37<14:02,  2.01s/it][A
Training...:  97% 13488/13907 [8:44:39<13:38,  1.95s/it][A
Training...:  97% 13489/13907 [8:44:41<13:17,  1.91s/it][A
Training...:  97% 13490/13907 [8:44:43<12:52,  1.85s/it][A
Training...:  97% 13491/13907 [8:44:44<12:33,  1.81s/it][A
Training...:  97% 13492/13907 [8:44:46<12:12,  1.76s/it][A
Training...:  97% 13493/13907 [8:44:48<11:52,  1.72s/it][A
Training...:  97% 13494/13907 [8:44:49<11:36,  1.69s/it][A
Training...:  97% 13495/13907 [8:44:51<11:18,  1.65s/it][A
Training...:  97% 13496/13907 [8:44:52<11:00,  1.61s/it][A
Training...:  97% 13497/13907 [8:44:54<10:39,  1.56s/it][A
Training...:  97% 13498/13907 [8:44:55<10:14,  1.50s/it][A
Training...:  97% 13499/13907 [8:44:56<09:43,  1.43s/it][A
Training...:  97% 13500/13907 [8:44:57<08:58,  1.32s/it][A
Training...:  97% 13501/13907 [8:45:01<14:08,  2.09s/it][A
Training...:  97% 13502/13907 [8:45:05<17:08,  2.54s/it][A
Training...:  97% 13503/13907 [8:45:08<18:44,  2.78s/it][A
Training...:  97% 13504/13907 [8:45:11<19:35,  2.92s/it][A
Training...:  97% 13505/13907 [8:45:15<19:57,  2.98s/it][A
Training...:  97% 13506/13907 [8:45:18<20:04,  3.00s/it][A
Training...:  97% 13507/13907 [8:45:21<19:58,  3.00s/it][A
Training...:  97% 13508/13907 [8:45:24<19:44,  2.97s/it][A
Training...:  97% 13509/13907 [8:45:26<19:27,  2.93s/it][A
Training...:  97% 13510/13907 [8:45:29<19:07,  2.89s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:15:43<17:31:07, 31533.87s/it]
Training...:  97% 13510/13907 [8:45:32<19:07,  2.89s/it][A
Training...:  97% 13511/13907 [8:45:32<19:40,  2.98s/it][A
Training...:  97% 13512/13907 [8:45:35<19:11,  2.92s/it][A
Training...:  97% 13513/13907 [8:45:38<18:29,  2.82s/it][A
Training...:  97% 13514/13907 [8:45:40<18:02,  2.75s/it][A
Training...:  97% 13515/13907 [8:45:43<17:34,  2.69s/it][A
Training...:  97% 13516/13907 [8:45:45<17:21,  2.66s/it][A
Training...:  97% 13517/13907 [8:45:48<17:01,  2.62s/it][A
Training...:  97% 13518/13907 [8:45:50<16:36,  2.56s/it][A
Training...:  97% 13519/13907 [8:45:53<16:15,  2.51s/it][A
Training...:  97% 13520/13907 [8:45:55<15:54,  2.47s/it][A
Training...:  97% 13521/13907 [8:45:57<15:32,  2.42s/it][A
Training...:  97% 13522/13907 [8:46:00<15:16,  2.38s/it][A
Training...:  97% 13523/13907 [8:46:02<14:57,  2.34s/it][A
Training...:  97% 13524/13907 [8:46:04<14:40,  2.30s/it][A
Training...:  97% 13525/13907 [8:46:06<14:27,  2.27s/it][A
Training...:  97% 13526/13907 [8:46:09<14:12,  2.24s/it][A
Training...:  97% 13527/13907 [8:46:11<13:59,  2.21s/it][A
Training...:  97% 13528/13907 [8:46:13<13:49,  2.19s/it][A
Training...:  97% 13529/13907 [8:46:15<13:37,  2.16s/it][A
Training...:  97% 13530/13907 [8:46:17<13:21,  2.13s/it][A
Training...:  97% 13531/13907 [8:46:19<13:06,  2.09s/it][A
Training...:  97% 13532/13907 [8:46:21<12:52,  2.06s/it][A
Training...:  97% 13533/13907 [8:46:23<12:36,  2.02s/it][A
Training...:  97% 13534/13907 [8:46:25<12:21,  1.99s/it][A
Training...:  97% 13535/13907 [8:46:27<12:08,  1.96s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:16:40<17:31:07, 31533.87s/it]
Training...:  97% 13535/13907 [8:46:29<12:08,  1.96s/it][A
Training...:  97% 13536/13907 [8:46:29<12:28,  2.02s/it][A
Training...:  97% 13537/13907 [8:46:31<12:15,  1.99s/it][A
Training...:  97% 13538/13907 [8:46:33<11:53,  1.93s/it][A
Training...:  97% 13539/13907 [8:46:34<11:33,  1.89s/it][A
Training...:  97% 13540/13907 [8:46:36<11:13,  1.83s/it][A
Training...:  97% 13541/13907 [8:46:38<10:55,  1.79s/it][A
Training...:  97% 13542/13907 [8:46:39<10:40,  1.75s/it][A
Training...:  97% 13543/13907 [8:46:41<10:24,  1.72s/it][A
Training...:  97% 13544/13907 [8:46:43<10:08,  1.68s/it][A
Training...:  97% 13545/13907 [8:46:44<09:51,  1.63s/it][A
Training...:  97% 13546/13907 [8:46:46<09:29,  1.58s/it][A
Training...:  97% 13547/13907 [8:46:47<09:09,  1.53s/it][A
Training...:  97% 13548/13907 [8:46:48<08:44,  1.46s/it][A
Training...:  97% 13549/13907 [8:46:50<08:16,  1.39s/it][A
Training...:  97% 13550/13907 [8:46:51<07:40,  1.29s/it][A
Training...:  97% 13551/13907 [8:46:54<11:55,  2.01s/it][A
Training...:  97% 13552/13907 [8:46:58<14:36,  2.47s/it][A
Training...:  97% 13553/13907 [8:47:01<16:00,  2.71s/it][A
Training...:  97% 13554/13907 [8:47:04<16:43,  2.84s/it][A
Training...:  97% 13555/13907 [8:47:07<17:01,  2.90s/it][A
Training...:  97% 13556/13907 [8:47:10<17:02,  2.91s/it][A
Training...:  97% 13557/13907 [8:47:13<16:52,  2.89s/it][A
Training...:  97% 13558/13907 [8:47:16<16:39,  2.86s/it][A
Training...:  97% 13559/13907 [8:47:19<16:26,  2.83s/it][A
Training...:  98% 13560/13907 [8:47:21<16:08,  2.79s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:17:36<17:31:07, 31533.87s/it]
Training...:  98% 13560/13907 [8:47:25<16:08,  2.79s/it][A
Training...:  98% 13561/13907 [8:47:25<16:46,  2.91s/it][A
Training...:  98% 13562/13907 [8:47:27<16:31,  2.87s/it][A
Training...:  98% 13563/13907 [8:47:30<15:56,  2.78s/it][A
Training...:  98% 13564/13907 [8:47:32<15:30,  2.71s/it][A
Training...:  98% 13565/13907 [8:47:35<15:05,  2.65s/it][A
Training...:  98% 13566/13907 [8:47:37<14:45,  2.60s/it][A
Training...:  98% 13567/13907 [8:47:40<14:26,  2.55s/it][A
Training...:  98% 13568/13907 [8:47:42<14:06,  2.50s/it][A
Training...:  98% 13569/13907 [8:47:45<13:50,  2.46s/it][A
Training...:  98% 13570/13907 [8:47:47<13:34,  2.42s/it][A
Training...:  98% 13571/13907 [8:47:49<13:21,  2.39s/it][A
Training...:  98% 13572/13907 [8:47:52<13:05,  2.34s/it][A
Training...:  98% 13573/13907 [8:47:54<12:52,  2.31s/it][A
Training...:  98% 13574/13907 [8:47:56<12:40,  2.28s/it][A
Training...:  98% 13575/13907 [8:47:58<12:27,  2.25s/it][A
Training...:  98% 13576/13907 [8:48:00<12:13,  2.22s/it][A
Training...:  98% 13577/13907 [8:48:02<12:00,  2.18s/it][A
Training...:  98% 13578/13907 [8:48:04<11:46,  2.15s/it][A
Training...:  98% 13579/13907 [8:48:07<11:40,  2.14s/it][A
Training...:  98% 13580/13907 [8:48:09<11:34,  2.12s/it][A
Training...:  98% 13581/13907 [8:48:11<11:28,  2.11s/it][A
Training...:  98% 13582/13907 [8:48:13<11:16,  2.08s/it][A
Training...:  98% 13583/13907 [8:48:15<11:05,  2.05s/it][A
Training...:  98% 13584/13907 [8:48:17<10:55,  2.03s/it][A
Training...:  98% 13585/13907 [8:48:19<10:44,  2.00s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:18:32<17:31:07, 31533.87s/it]
Training...:  98% 13585/13907 [8:48:21<10:44,  2.00s/it][A
Training...:  98% 13586/13907 [8:48:21<11:05,  2.07s/it][A
Training...:  98% 13587/13907 [8:48:23<10:49,  2.03s/it][A
Training...:  98% 13588/13907 [8:48:25<10:23,  1.96s/it][A
Training...:  98% 13589/13907 [8:48:26<10:04,  1.90s/it][A
Training...:  98% 13590/13907 [8:48:28<09:44,  1.84s/it][A
Training...:  98% 13591/13907 [8:48:30<09:29,  1.80s/it][A
Training...:  98% 13592/13907 [8:48:31<09:14,  1.76s/it][A
Training...:  98% 13593/13907 [8:48:33<09:00,  1.72s/it][A
Training...:  98% 13594/13907 [8:48:35<08:47,  1.68s/it][A
Training...:  98% 13595/13907 [8:48:36<08:33,  1.65s/it][A
Training...:  98% 13596/13907 [8:48:38<08:14,  1.59s/it][A
Training...:  98% 13597/13907 [8:48:39<07:56,  1.54s/it][A
Training...:  98% 13598/13907 [8:48:40<07:35,  1.47s/it][A
Training...:  98% 13599/13907 [8:48:42<07:14,  1.41s/it][A
Training...:  98% 13600/13907 [8:48:43<06:39,  1.30s/it][A
Training...:  98% 13601/13907 [8:48:47<10:31,  2.06s/it][A
Training...:  98% 13602/13907 [8:48:50<12:50,  2.53s/it][A
Training...:  98% 13603/13907 [8:48:54<14:02,  2.77s/it][A
Training...:  98% 13604/13907 [8:48:57<14:38,  2.90s/it][A
Training...:  98% 13605/13907 [8:49:00<14:53,  2.96s/it][A
Training...:  98% 13606/13907 [8:49:03<14:51,  2.96s/it][A
Training...:  98% 13607/13907 [8:49:06<14:47,  2.96s/it][A
Training...:  98% 13608/13907 [8:49:09<14:33,  2.92s/it][A
Training...:  98% 13609/13907 [8:49:11<14:23,  2.90s/it][A
Training...:  98% 13610/13907 [8:49:14<14:05,  2.85s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:19:28<17:31:07, 31533.87s/it]
Training...:  98% 13610/13907 [8:49:17<14:05,  2.85s/it][A
Training...:  98% 13611/13907 [8:49:17<14:26,  2.93s/it][A
Training...:  98% 13612/13907 [8:49:20<14:09,  2.88s/it][A
Training...:  98% 13613/13907 [8:49:23<13:43,  2.80s/it][A
Training...:  98% 13614/13907 [8:49:25<13:19,  2.73s/it][A
Training...:  98% 13615/13907 [8:49:28<12:57,  2.66s/it][A
Training...:  98% 13616/13907 [8:49:30<12:38,  2.61s/it][A
Training...:  98% 13617/13907 [8:49:33<12:20,  2.56s/it][A
Training...:  98% 13618/13907 [8:49:35<12:07,  2.52s/it][A
Training...:  98% 13619/13907 [8:49:37<11:54,  2.48s/it][A
Training...:  98% 13620/13907 [8:49:40<11:49,  2.47s/it][A
Training...:  98% 13621/13907 [8:49:42<11:41,  2.45s/it][A
Training...:  98% 13622/13907 [8:49:45<11:26,  2.41s/it][A
Training...:  98% 13623/13907 [8:49:47<11:09,  2.36s/it][A
Training...:  98% 13624/13907 [8:49:49<10:53,  2.31s/it][A
Training...:  98% 13625/13907 [8:49:51<10:42,  2.28s/it][A
Training...:  98% 13626/13907 [8:49:53<10:28,  2.24s/it][A
Training...:  98% 13627/13907 [8:49:56<10:19,  2.21s/it][A
Training...:  98% 13628/13907 [8:49:58<10:07,  2.18s/it][A
Training...:  98% 13629/13907 [8:50:00<09:54,  2.14s/it][A
Training...:  98% 13630/13907 [8:50:02<09:45,  2.11s/it][A
Training...:  98% 13631/13907 [8:50:04<09:33,  2.08s/it][A
Training...:  98% 13632/13907 [8:50:06<09:24,  2.05s/it][A
Training...:  98% 13633/13907 [8:50:08<09:16,  2.03s/it][A
Training...:  98% 13634/13907 [8:50:10<09:05,  2.00s/it][A
Training...:  98% 13635/13907 [8:50:12<08:55,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:20:25<17:31:07, 31533.87s/it]
Training...:  98% 13635/13907 [8:50:14<08:55,  1.97s/it][A
Training...:  98% 13636/13907 [8:50:14<09:09,  2.03s/it][A
Training...:  98% 13637/13907 [8:50:16<09:01,  2.01s/it][A
Training...:  98% 13638/13907 [8:50:17<08:43,  1.94s/it][A
Training...:  98% 13639/13907 [8:50:19<08:26,  1.89s/it][A
Training...:  98% 13640/13907 [8:50:21<08:09,  1.83s/it][A
Training...:  98% 13641/13907 [8:50:23<07:57,  1.80s/it][A
Training...:  98% 13642/13907 [8:50:24<07:44,  1.75s/it][A
Training...:  98% 13643/13907 [8:50:26<07:35,  1.73s/it][A
Training...:  98% 13644/13907 [8:50:28<07:25,  1.70s/it][A
Training...:  98% 13645/13907 [8:50:29<07:13,  1.65s/it][A
Training...:  98% 13646/13907 [8:50:31<06:58,  1.60s/it][A
Training...:  98% 13647/13907 [8:50:32<06:40,  1.54s/it][A
Training...:  98% 13648/13907 [8:50:33<06:22,  1.48s/it][A
Training...:  98% 13649/13907 [8:50:35<06:02,  1.41s/it][A
Training...:  98% 13650/13907 [8:50:36<05:35,  1.30s/it][A
Training...:  98% 13651/13907 [8:50:39<08:39,  2.03s/it][A
Training...:  98% 13652/13907 [8:50:43<10:36,  2.50s/it][A
Training...:  98% 13653/13907 [8:50:46<11:34,  2.74s/it][A
Training...:  98% 13654/13907 [8:50:49<12:03,  2.86s/it][A
Training...:  98% 13655/13907 [8:50:52<12:16,  2.92s/it][A
Training...:  98% 13656/13907 [8:50:55<12:20,  2.95s/it][A
Training...:  98% 13657/13907 [8:50:58<12:16,  2.95s/it][A
Training...:  98% 13658/13907 [8:51:01<12:04,  2.91s/it][A
Training...:  98% 13659/13907 [8:51:04<11:53,  2.88s/it][A
Training...:  98% 13660/13907 [8:51:07<11:46,  2.86s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:21:21<17:31:07, 31533.87s/it]
Training...:  98% 13660/13907 [8:51:10<11:46,  2.86s/it][A
Training...:  98% 13661/13907 [8:51:10<12:04,  2.95s/it][A
Training...:  98% 13662/13907 [8:51:13<11:47,  2.89s/it][A
Training...:  98% 13663/13907 [8:51:15<11:24,  2.80s/it][A
Training...:  98% 13664/13907 [8:51:18<11:02,  2.73s/it][A
Training...:  98% 13665/13907 [8:51:20<10:47,  2.67s/it][A
Training...:  98% 13666/13907 [8:51:23<10:32,  2.62s/it][A
Training...:  98% 13667/13907 [8:51:25<10:18,  2.58s/it][A
Training...:  98% 13668/13907 [8:51:28<10:05,  2.53s/it][A
Training...:  98% 13669/13907 [8:51:30<09:52,  2.49s/it][A
Training...:  98% 13670/13907 [8:51:33<09:40,  2.45s/it][A
Training...:  98% 13671/13907 [8:51:35<09:31,  2.42s/it][A
Training...:  98% 13672/13907 [8:51:37<09:22,  2.40s/it][A
Training...:  98% 13673/13907 [8:51:40<09:11,  2.36s/it][A
Training...:  98% 13674/13907 [8:51:42<09:02,  2.33s/it][A
Training...:  98% 13675/13907 [8:51:44<08:52,  2.29s/it][A
Training...:  98% 13676/13907 [8:51:46<08:39,  2.25s/it][A
Training...:  98% 13677/13907 [8:51:48<08:28,  2.21s/it][A
Training...:  98% 13678/13907 [8:51:50<08:18,  2.18s/it][A
Training...:  98% 13679/13907 [8:51:53<08:10,  2.15s/it][A
Training...:  98% 13680/13907 [8:51:55<08:01,  2.12s/it][A
Training...:  98% 13681/13907 [8:51:57<07:51,  2.09s/it][A
Training...:  98% 13682/13907 [8:51:59<07:43,  2.06s/it][A
Training...:  98% 13683/13907 [8:52:01<07:35,  2.03s/it][A
Training...:  98% 13684/13907 [8:52:02<07:25,  2.00s/it][A
Training...:  98% 13685/13907 [8:52:04<07:16,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:22:18<17:31:07, 31533.87s/it]
Training...:  98% 13685/13907 [8:52:06<07:16,  1.97s/it][A
Training...:  98% 13686/13907 [8:52:06<07:27,  2.02s/it][A
Training...:  98% 13687/13907 [8:52:08<07:17,  1.99s/it][A
Training...:  98% 13688/13907 [8:52:10<07:01,  1.92s/it][A
Training...:  98% 13689/13907 [8:52:12<06:48,  1.87s/it][A
Training...:  98% 13690/13907 [8:52:14<06:39,  1.84s/it][A
Training...:  98% 13691/13907 [8:52:15<06:28,  1.80s/it][A
Training...:  98% 13692/13907 [8:52:17<06:16,  1.75s/it][A
Training...:  98% 13693/13907 [8:52:19<06:04,  1.71s/it][A
Training...:  98% 13694/13907 [8:52:20<05:56,  1.67s/it][A
Training...:  98% 13695/13907 [8:52:22<05:45,  1.63s/it][A
Training...:  98% 13696/13907 [8:52:23<05:35,  1.59s/it][A
Training...:  98% 13697/13907 [8:52:25<05:23,  1.54s/it][A
Training...:  98% 13698/13907 [8:52:26<05:10,  1.48s/it][A
Training...:  99% 13699/13907 [8:52:27<04:54,  1.42s/it][A
Training...:  99% 13700/13907 [8:52:28<04:32,  1.32s/it][A
Training...:  99% 13701/13907 [8:52:32<07:00,  2.04s/it][A
Training...:  99% 13702/13907 [8:52:36<08:30,  2.49s/it][A
Training...:  99% 13703/13907 [8:52:39<09:13,  2.71s/it][A
Training...:  99% 13704/13907 [8:52:42<09:37,  2.84s/it][A
Training...:  99% 13705/13907 [8:52:45<09:49,  2.92s/it][A
Training...:  99% 13706/13907 [8:52:48<09:50,  2.94s/it][A
Training...:  99% 13707/13907 [8:52:51<09:45,  2.93s/it][A
Training...:  99% 13708/13907 [8:52:54<09:38,  2.91s/it][A
Training...:  99% 13709/13907 [8:52:57<09:31,  2.89s/it][A
Training...:  99% 13710/13907 [8:52:59<09:22,  2.86s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:23:14<17:31:07, 31533.87s/it]
Training...:  99% 13710/13907 [8:53:03<09:22,  2.86s/it][A
Training...:  99% 13711/13907 [8:53:03<09:36,  2.94s/it][A
Training...:  99% 13712/13907 [8:53:05<09:22,  2.88s/it][A
Training...:  99% 13713/13907 [8:53:08<09:02,  2.80s/it][A
Training...:  99% 13714/13907 [8:53:11<08:44,  2.72s/it][A
Training...:  99% 13715/13907 [8:53:13<08:30,  2.66s/it][A
Training...:  99% 13716/13907 [8:53:16<08:17,  2.61s/it][A
Training...:  99% 13717/13907 [8:53:18<08:06,  2.56s/it][A
Training...:  99% 13718/13907 [8:53:20<07:54,  2.51s/it][A
Training...:  99% 13719/13907 [8:53:23<07:44,  2.47s/it][A
Training...:  99% 13720/13907 [8:53:25<07:35,  2.44s/it][A
Training...:  99% 13721/13907 [8:53:27<07:27,  2.40s/it][A
Training...:  99% 13722/13907 [8:53:30<07:19,  2.38s/it][A
Training...:  99% 13723/13907 [8:53:32<07:10,  2.34s/it][A
Training...:  99% 13724/13907 [8:53:34<07:04,  2.32s/it][A
Training...:  99% 13725/13907 [8:53:36<06:56,  2.29s/it][A
Training...:  99% 13726/13907 [8:53:39<06:46,  2.24s/it][A
Training...:  99% 13727/13907 [8:53:41<06:38,  2.21s/it][A
Training...:  99% 13728/13907 [8:53:43<06:29,  2.18s/it][A
Training...:  99% 13729/13907 [8:53:45<06:22,  2.15s/it][A
Training...:  99% 13730/13907 [8:53:47<06:13,  2.11s/it][A
Training...:  99% 13731/13907 [8:53:49<06:07,  2.09s/it][A
Training...:  99% 13732/13907 [8:53:51<06:00,  2.06s/it][A
Training...:  99% 13733/13907 [8:53:53<05:52,  2.03s/it][A
Training...:  99% 13734/13907 [8:53:55<05:45,  2.00s/it][A
Training...:  99% 13735/13907 [8:53:57<05:38,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:24:10<17:31:07, 31533.87s/it]
Training...:  99% 13735/13907 [8:53:59<05:38,  1.97s/it][A
Training...:  99% 13736/13907 [8:53:59<05:48,  2.04s/it][A
Training...:  99% 13737/13907 [8:54:01<05:40,  2.01s/it][A
Training...:  99% 13738/13907 [8:54:03<05:28,  1.94s/it][A
Training...:  99% 13739/13907 [8:54:04<05:18,  1.89s/it][A
Training...:  99% 13740/13907 [8:54:06<05:08,  1.85s/it][A
Training...:  99% 13741/13907 [8:54:08<05:02,  1.82s/it][A
Training...:  99% 13742/13907 [8:54:10<04:55,  1.79s/it][A
Training...:  99% 13743/13907 [8:54:11<04:49,  1.77s/it][A
Training...:  99% 13744/13907 [8:54:13<04:41,  1.73s/it][A
Training...:  99% 13745/13907 [8:54:15<04:32,  1.68s/it][A
Training...:  99% 13746/13907 [8:54:16<04:20,  1.62s/it][A
Training...:  99% 13747/13907 [8:54:18<04:10,  1.56s/it][A
Training...:  99% 13748/13907 [8:54:19<03:58,  1.50s/it][A
Training...:  99% 13749/13907 [8:54:20<03:44,  1.42s/it][A
Training...:  99% 13750/13907 [8:54:21<03:26,  1.31s/it][A
Training...:  99% 13751/13907 [8:54:25<05:22,  2.07s/it][A
Training...:  99% 13752/13907 [8:54:28<06:25,  2.49s/it][A
Training...:  99% 13753/13907 [8:54:32<06:57,  2.71s/it][A
Training...:  99% 13754/13907 [8:54:35<07:15,  2.85s/it][A
Training...:  99% 13755/13907 [8:54:38<07:21,  2.91s/it][A
Training...:  99% 13756/13907 [8:54:41<07:20,  2.92s/it][A
Training...:  99% 13757/13907 [8:54:44<07:15,  2.91s/it][A
Training...:  99% 13758/13907 [8:54:47<07:09,  2.88s/it][A
Training...:  99% 13759/13907 [8:54:49<07:01,  2.85s/it][A
Training...:  99% 13760/13907 [8:54:52<06:51,  2.80s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:25:06<17:31:07, 31533.87s/it]
Training...:  99% 13760/13907 [8:54:55<06:51,  2.80s/it][A
Training...:  99% 13761/13907 [8:54:55<06:59,  2.87s/it][A
Training...:  99% 13762/13907 [8:54:58<06:50,  2.83s/it][A
Training...:  99% 13763/13907 [8:55:00<06:36,  2.75s/it][A
Training...:  99% 13764/13907 [8:55:03<06:24,  2.69s/it][A
Training...:  99% 13765/13907 [8:55:05<06:13,  2.63s/it][A
Training...:  99% 13766/13907 [8:55:08<06:02,  2.57s/it][A
Training...:  99% 13767/13907 [8:55:10<05:53,  2.52s/it][A
Training...:  99% 13768/13907 [8:55:13<05:44,  2.48s/it][A
Training...:  99% 13769/13907 [8:55:15<05:38,  2.45s/it][A
Training...:  99% 13770/13907 [8:55:17<05:31,  2.42s/it][A
Training...:  99% 13771/13907 [8:55:20<05:24,  2.39s/it][A
Training...:  99% 13772/13907 [8:55:22<05:17,  2.35s/it][A
Training...:  99% 13773/13907 [8:55:24<05:10,  2.32s/it][A
Training...:  99% 13774/13907 [8:55:26<05:05,  2.29s/it][A
Training...:  99% 13775/13907 [8:55:29<04:58,  2.26s/it][A
Training...:  99% 13776/13907 [8:55:31<04:52,  2.23s/it][A
Training...:  99% 13777/13907 [8:55:33<04:46,  2.20s/it][A
Training...:  99% 13778/13907 [8:55:35<04:40,  2.18s/it][A
Training...:  99% 13779/13907 [8:55:37<04:36,  2.16s/it][A
Training...:  99% 13780/13907 [8:55:39<04:30,  2.13s/it][A
Training...:  99% 13781/13907 [8:55:41<04:25,  2.11s/it][A
Training...:  99% 13782/13907 [8:55:43<04:19,  2.08s/it][A
Training...:  99% 13783/13907 [8:55:45<04:13,  2.05s/it][A
Training...:  99% 13784/13907 [8:55:47<04:07,  2.01s/it][A
Training...:  99% 13785/13907 [8:55:49<04:02,  1.99s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:26:02<17:31:07, 31533.87s/it]
Training...:  99% 13785/13907 [8:55:51<04:02,  1.99s/it][A
Training...:  99% 13786/13907 [8:55:51<04:08,  2.06s/it][A
Training...:  99% 13787/13907 [8:55:53<04:02,  2.02s/it][A
Training...:  99% 13788/13907 [8:55:55<03:52,  1.96s/it][A
Training...:  99% 13789/13907 [8:55:57<03:45,  1.91s/it][A
Training...:  99% 13790/13907 [8:55:59<03:39,  1.87s/it][A
Training...:  99% 13791/13907 [8:56:00<03:31,  1.82s/it][A
Training...:  99% 13792/13907 [8:56:02<03:24,  1.78s/it][A
Training...:  99% 13793/13907 [8:56:04<03:17,  1.73s/it][A
Training...:  99% 13794/13907 [8:56:05<03:10,  1.69s/it][A
Training...:  99% 13795/13907 [8:56:07<03:04,  1.65s/it][A
Training...:  99% 13796/13907 [8:56:08<02:57,  1.60s/it][A
Training...:  99% 13797/13907 [8:56:10<02:49,  1.54s/it][A
Training...:  99% 13798/13907 [8:56:11<02:40,  1.48s/it][A
Training...:  99% 13799/13907 [8:56:12<02:32,  1.41s/it][A
Training...:  99% 13800/13907 [8:56:13<02:20,  1.31s/it][A
Training...:  99% 13801/13907 [8:56:17<03:37,  2.06s/it][A
Training...:  99% 13802/13907 [8:56:21<04:22,  2.50s/it][A
Training...:  99% 13803/13907 [8:56:24<04:42,  2.72s/it][A
Training...:  99% 13804/13907 [8:56:27<04:52,  2.84s/it][A
Training...:  99% 13805/13907 [8:56:30<04:55,  2.90s/it][A
Training...:  99% 13806/13907 [8:56:33<04:55,  2.92s/it][A
Training...:  99% 13807/13907 [8:56:36<04:51,  2.91s/it][A
Training...:  99% 13808/13907 [8:56:39<04:46,  2.89s/it][A
Training...:  99% 13809/13907 [8:56:42<04:40,  2.86s/it][A
Training...:  99% 13810/13907 [8:56:44<04:32,  2.81s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:26:58<17:31:07, 31533.87s/it]
Training...:  99% 13810/13907 [8:56:47<04:32,  2.81s/it][A
Training...:  99% 13811/13907 [8:56:47<04:38,  2.90s/it][A
Training...:  99% 13812/13907 [8:56:50<04:30,  2.85s/it][A
Training...:  99% 13813/13907 [8:56:53<04:20,  2.77s/it][A
Training...:  99% 13814/13907 [8:56:55<04:12,  2.72s/it][A
Training...:  99% 13815/13907 [8:56:58<04:05,  2.67s/it][A
Training...:  99% 13816/13907 [8:57:00<03:57,  2.61s/it][A
Training...:  99% 13817/13907 [8:57:03<03:51,  2.57s/it][A
Training...:  99% 13818/13907 [8:57:05<03:44,  2.52s/it][A
Training...:  99% 13819/13907 [8:57:08<03:39,  2.49s/it][A
Training...:  99% 13820/13907 [8:57:10<03:33,  2.45s/it][A
Training...:  99% 13821/13907 [8:57:12<03:28,  2.42s/it][A
Training...:  99% 13822/13907 [8:57:15<03:23,  2.39s/it][A
Training...:  99% 13823/13907 [8:57:17<03:17,  2.35s/it][A
Training...:  99% 13824/13907 [8:57:19<03:12,  2.32s/it][A
Training...:  99% 13825/13907 [8:57:21<03:07,  2.28s/it][A
Training...:  99% 13826/13907 [8:57:24<03:02,  2.26s/it][A
Training...:  99% 13827/13907 [8:57:26<02:59,  2.25s/it][A
Training...:  99% 13828/13907 [8:57:28<02:54,  2.21s/it][A
Training...:  99% 13829/13907 [8:57:30<02:49,  2.17s/it][A
Training...:  99% 13830/13907 [8:57:32<02:44,  2.13s/it][A
Training...:  99% 13831/13907 [8:57:34<02:39,  2.10s/it][A
Training...:  99% 13832/13907 [8:57:36<02:35,  2.07s/it][A
Training...:  99% 13833/13907 [8:57:38<02:30,  2.04s/it][A
Training...:  99% 13834/13907 [8:57:40<02:26,  2.01s/it][A
Training...:  99% 13835/13907 [8:57:42<02:21,  1.97s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:27:55<17:31:07, 31533.87s/it]
Training...:  99% 13835/13907 [8:57:44<02:21,  1.97s/it][A
Training...:  99% 13836/13907 [8:57:44<02:24,  2.03s/it][A
Training...:  99% 13837/13907 [8:57:46<02:19,  2.00s/it][A
Training...: 100% 13838/13907 [8:57:48<02:13,  1.93s/it][A
Training...: 100% 13839/13907 [8:57:49<02:07,  1.88s/it][A
Training...: 100% 13840/13907 [8:57:51<02:03,  1.85s/it][A
Training...: 100% 13841/13907 [8:57:53<01:59,  1.80s/it][A
Training...: 100% 13842/13907 [8:57:55<01:54,  1.76s/it][A
Training...: 100% 13843/13907 [8:57:56<01:49,  1.72s/it][A
Training...: 100% 13844/13907 [8:57:58<01:45,  1.68s/it][A
Training...: 100% 13845/13907 [8:57:59<01:41,  1.63s/it][A
Training...: 100% 13846/13907 [8:58:01<01:36,  1.58s/it][A
Training...: 100% 13847/13907 [8:58:02<01:31,  1.53s/it][A
Training...: 100% 13848/13907 [8:58:03<01:26,  1.46s/it][A
Training...: 100% 13849/13907 [8:58:05<01:20,  1.39s/it][A
Training...: 100% 13850/13907 [8:58:06<01:13,  1.30s/it][A
Training...: 100% 13851/13907 [8:58:10<01:54,  2.04s/it][A
Training...: 100% 13852/13907 [8:58:13<02:17,  2.49s/it][A
Training...: 100% 13853/13907 [8:58:16<02:28,  2.76s/it][A
Training...: 100% 13854/13907 [8:58:20<02:33,  2.89s/it][A
Training...: 100% 13855/13907 [8:58:23<02:33,  2.95s/it][A
Training...: 100% 13856/13907 [8:58:26<02:30,  2.96s/it][A
Training...: 100% 13857/13907 [8:58:29<02:27,  2.95s/it][A
Training...: 100% 13858/13907 [8:58:32<02:24,  2.95s/it][A
Training...: 100% 13859/13907 [8:58:34<02:20,  2.93s/it][A
Training...: 100% 13860/13907 [8:58:37<02:14,  2.87s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:28:51<17:31:07, 31533.87s/it]
Training...: 100% 13860/13907 [8:58:40<02:14,  2.87s/it][A
Training...: 100% 13861/13907 [8:58:40<02:14,  2.93s/it][A
Training...: 100% 13862/13907 [8:58:43<02:09,  2.88s/it][A
Training...: 100% 13863/13907 [8:58:46<02:03,  2.80s/it][A
Training...: 100% 13864/13907 [8:58:48<01:57,  2.73s/it][A
Training...: 100% 13865/13907 [8:58:51<01:52,  2.67s/it][A
Training...: 100% 13866/13907 [8:58:53<01:47,  2.61s/it][A
Training...: 100% 13867/13907 [8:58:56<01:42,  2.57s/it][A
Training...: 100% 13868/13907 [8:58:58<01:38,  2.51s/it][A
Training...: 100% 13869/13907 [8:59:00<01:33,  2.47s/it][A
Training...: 100% 13870/13907 [8:59:03<01:29,  2.43s/it][A
Training...: 100% 13871/13907 [8:59:05<01:26,  2.41s/it][A
Training...: 100% 13872/13907 [8:59:07<01:22,  2.37s/it][A
Training...: 100% 13873/13907 [8:59:10<01:19,  2.33s/it][A
Training...: 100% 13874/13907 [8:59:12<01:16,  2.30s/it][A
Training...: 100% 13875/13907 [8:59:14<01:12,  2.27s/it][A
Training...: 100% 13876/13907 [8:59:16<01:09,  2.24s/it][A
Training...: 100% 13877/13907 [8:59:18<01:05,  2.20s/it][A
Training...: 100% 13878/13907 [8:59:20<01:02,  2.16s/it][A
Training...: 100% 13879/13907 [8:59:23<00:59,  2.14s/it][A
Training...: 100% 13880/13907 [8:59:25<00:57,  2.12s/it][A
Training...: 100% 13881/13907 [8:59:27<00:54,  2.09s/it][A
Training...: 100% 13882/13907 [8:59:29<00:51,  2.06s/it][A
Training...: 100% 13883/13907 [8:59:31<00:48,  2.03s/it][A
Training...: 100% 13884/13907 [8:59:33<00:46,  2.00s/it][A
Training...: 100% 13885/13907 [8:59:34<00:43,  1.98s/it][A                                                                                                                             
                                                        [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  50% 2/4 [26:29:48<17:31:07, 31533.87s/it]
Training...: 100% 13885/13907 [8:59:37<00:43,  1.98s/it][A
Training...: 100% 13886/13907 [8:59:37<00:43,  2.06s/it][A
Training...: 100% 13887/13907 [8:59:39<00:40,  2.03s/it][A
Training...: 100% 13888/13907 [8:59:40<00:37,  1.96s/it][A
Training...: 100% 13889/13907 [8:59:42<00:34,  1.90s/it][A
Training...: 100% 13890/13907 [8:59:44<00:31,  1.85s/it][A
Training...: 100% 13891/13907 [8:59:46<00:28,  1.79s/it][A
Training...: 100% 13892/13907 [8:59:47<00:26,  1.75s/it][A
Training...: 100% 13893/13907 [8:59:49<00:23,  1.71s/it][A
Training...: 100% 13894/13907 [8:59:50<00:21,  1.67s/it][A
Training...: 100% 13895/13907 [8:59:52<00:19,  1.61s/it][A
Training...: 100% 13896/13907 [8:59:53<00:17,  1.56s/it][A
Training...: 100% 13897/13907 [8:59:55<00:15,  1.51s/it][A
Training...: 100% 13898/13907 [8:59:56<00:13,  1.45s/it][A
Training...: 100% 13899/13907 [8:59:57<00:11,  1.39s/it][A
Training...: 100% 13900/13907 [8:59:58<00:09,  1.29s/it][A
Training...: 100% 13901/13907 [9:00:02<00:11,  1.89s/it][A
Training...: 100% 13902/13907 [9:00:04<00:10,  2.16s/it][A
Training...: 100% 13903/13907 [9:00:07<00:09,  2.26s/it][A
Training...: 100% 13904/13907 [9:00:09<00:06,  2.26s/it][A
Training...: 100% 13905/13907 [9:00:11<00:04,  2.21s/it][A
Training...: 100% 13906/13907 [9:00:13<00:02,  2.10s/it][A
Training...: 100% 13907/13907 [9:00:15<00:00,  1.95s/it][ATraining...: 100% 13907/13907 [9:00:15<00:00,  2.33s/it]
Epoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:30:26<8:52:18, 31938.93s/it] 
Epoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |)
Step... (40025 | Loss: 0.14764294028282166, Learning Rate: 6.04606066190172e-05, Gradient Norm: 0.5950758457183838)
Step... (40050 | Loss: 0.1042001023888588, Learning Rate: 6.030909571563825e-05, Gradient Norm: 0.7317757606506348)
Step... (40075 | Loss: 0.155291348695755, Learning Rate: 6.015758845023811e-05, Gradient Norm: 0.580978274345398)
Step... (40100 | Loss: 0.1483275592327118, Learning Rate: 6.0006059356965125e-05, Gradient Norm: 0.6494035720825195)
Step... (40125 | Loss: 0.18272942304611206, Learning Rate: 5.985455209156498e-05, Gradient Norm: 0.7242274284362793)
Step... (40150 | Loss: 0.20255671441555023, Learning Rate: 5.9703041188186035e-05, Gradient Norm: 0.9301837682723999)
Step... (40175 | Loss: 0.13742788136005402, Learning Rate: 5.955151573289186e-05, Gradient Norm: 0.5876264572143555)
Step... (40200 | Loss: 0.189525306224823, Learning Rate: 5.9400008467491716e-05, Gradient Norm: 0.87941974401474)
Step... (40225 | Loss: 0.2180091142654419, Learning Rate: 5.924847937421873e-05, Gradient Norm: 0.6050000190734863)
Step... (40250 | Loss: 0.2008245885372162, Learning Rate: 5.909697210881859e-05, Gradient Norm: 0.6781392097473145)
Step... (40275 | Loss: 0.2082199901342392, Learning Rate: 5.894546120543964e-05, Gradient Norm: 1.149038553237915)
Step... (40300 | Loss: 0.20778626203536987, Learning Rate: 5.8793935750145465e-05, Gradient Norm: 1.024754285812378)
Step... (40325 | Loss: 0.1599704623222351, Learning Rate: 5.8642424846766517e-05, Gradient Norm: 0.6450571417808533)
Step... (40350 | Loss: 0.16402581334114075, Learning Rate: 5.8490917581366375e-05, Gradient Norm: 1.1788504123687744)
Step... (40375 | Loss: 0.23281733691692352, Learning Rate: 5.833938848809339e-05, Gradient Norm: 0.9591778516769409)
Step... (40400 | Loss: 0.19908562302589417, Learning Rate: 5.818788122269325e-05, Gradient Norm: 0.8556892275810242)
Step... (40425 | Loss: 0.17290377616882324, Learning Rate: 5.80363703193143e-05, Gradient Norm: 0.8234161734580994)
Step... (40450 | Loss: 0.13234500586986542, Learning Rate: 5.7884844864020124e-05, Gradient Norm: 0.7443092465400696)
Step... (40475 | Loss: 0.17304708063602448, Learning Rate: 5.773333759861998e-05, Gradient Norm: 0.6360052824020386)
Step... (40500 | Loss: 0.19078895449638367, Learning Rate: 5.7581826695241034e-05, Gradient Norm: 0.9217954277992249)
Step... (40525 | Loss: 0.22409895062446594, Learning Rate: 5.743030123994686e-05, Gradient Norm: 0.8343765735626221)
Step... (40550 | Loss: 0.16111226379871368, Learning Rate: 5.727879033656791e-05, Gradient Norm: 0.7897640466690063)
Step... (40575 | Loss: 0.1740676462650299, Learning Rate: 5.712728307116777e-05, Gradient Norm: 0.6258055567741394)
Step... (40600 | Loss: 0.19024792313575745, Learning Rate: 5.697575397789478e-05, Gradient Norm: 0.7864822149276733)
Step... (40625 | Loss: 0.15487241744995117, Learning Rate: 5.682424671249464e-05, Gradient Norm: 0.6774232983589172)
Step... (40650 | Loss: 0.20207102596759796, Learning Rate: 5.667273580911569e-05, Gradient Norm: 0.8393641710281372)
Step... (40675 | Loss: 0.17928417026996613, Learning Rate: 5.6521210353821516e-05, Gradient Norm: 1.2406518459320068)
Step... (40700 | Loss: 0.23495468497276306, Learning Rate: 5.636969945044257e-05, Gradient Norm: 0.8430274724960327)
Step... (40725 | Loss: 0.15349307656288147, Learning Rate: 5.6218192185042426e-05, Gradient Norm: 0.928398072719574)
Step... (40750 | Loss: 0.20433390140533447, Learning Rate: 5.606666309176944e-05, Gradient Norm: 0.8827695846557617)
Step... (40775 | Loss: 0.16424444317817688, Learning Rate: 5.59151558263693e-05, Gradient Norm: 0.7642474174499512)
Step... (40800 | Loss: 0.14385941624641418, Learning Rate: 5.576364492299035e-05, Gradient Norm: 0.7738858461380005)
Step... (40825 | Loss: 0.20155414938926697, Learning Rate: 5.5612119467696175e-05, Gradient Norm: 0.8148542046546936)
Step... (40850 | Loss: 0.19290471076965332, Learning Rate: 5.5460612202296034e-05, Gradient Norm: 1.1071724891662598)
Step... Training...:   0% 0/13907 [00:00<?, ?it/s][A(40875 | Loss: 0.2619527280330658, Learning Rate: 5.5309101298917085e-05, Gradient Norm: 0.8911854028701782)
Step... (40900 | Loss: 0.17625457048416138, Learning Rate: 5.515757584362291e-05, Gradient Norm: 0.7083638906478882)
Step... (40925 | Loss: 0.243541419506073, Learning Rate: 5.500606494024396e-05, Gradient Norm: 0.951980710029602)
Step... (40950 | Loss: 0.16882023215293884, Learning Rate: 5.485455767484382e-05, Gradient Norm: 1.1317105293273926)
Step... (40975 | Loss: 0.19966651499271393, Learning Rate: 5.4703028581570834e-05, Gradient Norm: 0.6281261444091797)
Step... (41000 | Loss: 0.18152466416358948, Learning Rate: 5.455152131617069e-05, Gradient Norm: 0.9294012784957886)
Step... (41025 | Loss: 0.16937562823295593, Learning Rate: 5.4400010412791744e-05, Gradient Norm: 0.5897158980369568)
Step... (41050 | Loss: 0.15217453241348267, Learning Rate: 5.424848495749757e-05, Gradient Norm: 0.8461371660232544)
Step... (41075 | Loss: 0.20114992558956146, Learning Rate: 5.409697405411862e-05, Gradient Norm: 0.7669177055358887)
Step... (41100 | Loss: 0.16089209914207458, Learning Rate: 5.394546678871848e-05, Gradient Norm: 0.9058451652526855)
Step... (41125 | Loss: 0.2073935866355896, Learning Rate: 5.37939413334243e-05, Gradient Norm: 0.7713733911514282)
Step... (41150 | Loss: 0.21233154833316803, Learning Rate: 5.364243043004535e-05, Gradient Norm: 1.0390491485595703)
Step... (41175 | Loss: 0.2183409333229065, Learning Rate: 5.349092316464521e-05, Gradient Norm: 0.6553014516830444)
Step... (41200 | Loss: 0.1635490357875824, Learning Rate: 5.3339394071372226e-05, Gradient Norm: 0.6613569259643555)
Step... (41225 | Loss: 0.21201053261756897, Learning Rate: 5.3187886805972084e-05, Gradient Norm: 0.7630423307418823)
Step... (41250 | Loss: 0.1717013716697693, Learning Rate: 5.3036375902593136e-05, Gradient Norm: 0.6131591796875)
Step... (41275 | Loss: 0.14949750900268555, Learning Rate: 5.288485044729896e-05, Gradient Norm: 0.6486926674842834)
Step... (41300 | Loss: 0.16999727487564087, Learning Rate: 5.273333954392001e-05, Gradient Norm: 0.9984447956085205)
Step... (41325 | Loss: 0.19840213656425476, Learning Rate: 5.2581814088625833e-05, Gradient Norm: 0.9818814396858215)
Step... (41350 | Loss: 0.17109176516532898, Learning Rate: 5.2430303185246885e-05, Gradient Norm: 0.6732411980628967)
Step... (41375 | Loss: 0.1531759649515152, Learning Rate: 5.227879591984674e-05, Gradient Norm: 0.9432174563407898)
Step... (41400 | Loss: 0.15060409903526306, Learning Rate: 5.212726682657376e-05, Gradient Norm: 0.7750200033187866)
Step... (41425 | Loss: 0.20371705293655396, Learning Rate: 5.197575956117362e-05, Gradient Norm: 0.8080319166183472)
Step... (41450 | Loss: 0.17241919040679932, Learning Rate: 5.182424865779467e-05, Gradient Norm: 0.875504732131958)
Step... (41475 | Loss: 0.2253742516040802, Learning Rate: 5.167272320250049e-05, Gradient Norm: 0.6472710967063904)
Step... (41500 | Loss: 0.1680258810520172, Learning Rate: 5.152121593710035e-05, Gradient Norm: 0.8145540356636047)
Step... (41525 | Loss: 0.139984130859375, Learning Rate: 5.13697050337214e-05, Gradient Norm: 0.735307514667511)
Step... (41550 | Loss: 0.15383103489875793, Learning Rate: 5.1218179578427225e-05, Gradient Norm: 0.6469156742095947)
Step... (41575 | Loss: 0.15370553731918335, Learning Rate: 5.106666867504828e-05, Gradient Norm: 0.6591615676879883)
Step... (41600 | Loss: 0.16192203760147095, Learning Rate: 5.0915161409648135e-05, Gradient Norm: 0.697731614112854)
Step... (41625 | Loss: 0.1886938512325287, Learning Rate: 5.076363231637515e-05, Gradient Norm: 0.6361008882522583)
Step... (41650 | Loss: 0.18542739748954773, Learning Rate: 5.061212505097501e-05, Gradient Norm: 0.9410813450813293)
Step... (41675 | Loss: 0.24145036935806274, Learning Rate: 5.046061414759606e-05, Gradient Norm: 0.8675551414489746)
Step... (41700 | Loss: 0.19280678033828735, Learning Rate: 5.0309088692301884e-05, Gradient Norm: 0.7269858121871948)

Training...:   0% 1/13907 [00:03<15:25:51,  3.99s/it][A
Training...:   0% 2/13907 [00:07<14:31:36,  3.76s/it][A
Training...:   0% 3/13907 [00:10<13:46:31,  3.57s/it][A                                                                                                                            
                                                     [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:30:46<8:52:18, 31938.93s/it]
Training...:   0% 3/13907 [00:14<13:46:31,  3.57s/it][A
Training...:   0% 4/13907 [00:14<13:54:16,  3.60s/it][A
Training...:   0% 5/13907 [00:17<13:16:46,  3.44s/it][A
Training...:   0% 6/13907 [00:20<12:49:05,  3.32s/it][A
Training...:   0% 7/13907 [00:23<12:19:10,  3.19s/it][A
Training...:   0% 8/13907 [00:26<11:56:36,  3.09s/it][A
Training...:   0% 9/13907 [00:29<11:36:50,  3.01s/it][A
Training...:   0% 10/13907 [00:32<11:20:29,  2.94s/it][A
Training...:   0% 11/13907 [00:34<11:01:09,  2.85s/it][A
Training...:   0% 12/13907 [00:37<10:47:12,  2.79s/it][A
Training...:   0% 13/13907 [00:40<10:34:16,  2.74s/it][A
Training...:   0% 14/13907 [00:42<10:22:50,  2.69s/it][A
Training...:   0% 15/13907 [00:45<10:10:15,  2.64s/it][A
Training...:   0% 16/13907 [00:47<9:58:01,  2.58s/it] [A
Training...:   0% 17/13907 [00:50<9:47:25,  2.54s/it][A
Training...:   0% 18/13907 [00:52<9:37:47,  2.50s/it][A
Training...:   0% 19/13907 [00:54<9:28:19,  2.46s/it][A
Training...:   0% 20/13907 [00:57<9:20:34,  2.42s/it][A
Training...:   0% 21/13907 [00:59<9:12:07,  2.39s/it][A
Training...:   0% 22/13907 [01:01<9:05:00,  2.36s/it][A
Training...:   0% 23/13907 [01:04<8:56:43,  2.32s/it][A
Training...:   0% 24/13907 [01:06<8:50:29,  2.29s/it][A
Training...:   0% 25/13907 [01:08<8:40:10,  2.25s/it][A
Training...:   0% 26/13907 [01:10<8:35:04,  2.23s/it][A
Training...:   0% 27/13907 [01:12<8:26:40,  2.19s/it][A
Training...:   0% 28/13907 [01:14<8:19:43,  2.16s/it][A                                                                                                                            
                                                     [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:31:49<8:52:18, 31938.93s/it]
Training...:   0% 28/13907 [01:17<8:19:43,  2.16s/it][A
Training...:   0% 29/13907 [01:17<8:32:38,  2.22s/it][A
Training...:   0% 30/13907 [01:19<8:26:26,  2.19s/it][A
Training...:   0% 31/13907 [01:21<8:12:39,  2.13s/it][A
Training...:   0% 32/13907 [01:23<8:03:38,  2.09s/it][A
Training...:   0% 33/13907 [01:25<7:53:55,  2.05s/it][A
Training...:   0% 34/13907 [01:27<7:45:34,  2.01s/it][A
Training...:   0% 35/13907 [01:29<7:36:25,  1.97s/it][A
Training...:   0% 36/13907 [01:30<7:29:31,  1.94s/it][A
Training...:   0% 37/13907 [01:32<7:22:31,  1.91s/it][A
Training...:   0% 38/13907 [01:34<7:15:46,  1.89s/it][A
Training...:   0% 39/13907 [01:36<7:06:28,  1.85s/it][A
Training...:   0% 40/13907 [01:38<6:57:46,  1.81s/it][A
Training...:   0% 41/13907 [01:39<6:48:51,  1.77s/it][A
Training...:   0% 42/13907 [01:41<6:41:32,  1.74s/it][A
Training...:   0% 43/13907 [01:43<6:32:49,  1.70s/it][A
Training...:   0% 44/13907 [01:44<6:24:38,  1.66s/it][A
Training...:   0% 45/13907 [01:46<6:14:39,  1.62s/it][A
Training...:   0% 46/13907 [01:47<6:04:00,  1.58s/it][A
Training...:   0% 47/13907 [01:49<5:53:34,  1.53s/it][A
Training...:   0% 48/13907 [01:50<5:39:06,  1.47s/it][A
Training...:   0% 49/13907 [01:51<5:23:20,  1.40s/it][A
Training...:   0% 50/13907 [01:52<5:00:15,  1.30s/it][A
Training...:   0% 51/13907 [01:56<7:52:58,  2.05s/it][A
Training...:   0% 52/13907 [01:59<9:35:57,  2.49s/it][A
Training...:   0% 53/13907 [02:03<10:27:55,  2.72s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:32:38<8:52:18, 31938.93s/it]
Training...:   0% 53/13907 [02:06<10:27:55,  2.72s/it][A
Training...:   0% 54/13907 [02:06<11:32:45,  3.00s/it][A
Training...:   0% 55/13907 [02:09<11:41:31,  3.04s/it][A
Training...:   0% 56/13907 [02:12<11:35:37,  3.01s/it][A
Training...:   0% 57/13907 [02:15<11:25:15,  2.97s/it][A
Training...:   0% 58/13907 [02:18<11:14:18,  2.92s/it][A
Training...:   0% 59/13907 [02:21<11:01:06,  2.86s/it][A
Training...:   0% 60/13907 [02:24<10:50:23,  2.82s/it][A
Training...:   0% 61/13907 [02:26<10:37:29,  2.76s/it][A
Training...:   0% 62/13907 [02:29<10:26:36,  2.72s/it][A
Training...:   0% 63/13907 [02:31<10:15:24,  2.67s/it][A
Training...:   0% 64/13907 [02:34<10:06:54,  2.63s/it][A
Training...:   0% 65/13907 [02:36<9:56:19,  2.58s/it] [A
Training...:   0% 66/13907 [02:39<9:49:13,  2.55s/it][A
Training...:   0% 67/13907 [02:41<9:39:35,  2.51s/it][A
Training...:   0% 68/13907 [02:44<9:32:47,  2.48s/it][A
Training...:   0% 69/13907 [02:46<9:23:14,  2.44s/it][A
Training...:   1% 70/13907 [02:48<9:15:08,  2.41s/it][A
Training...:   1% 71/13907 [02:51<9:05:49,  2.37s/it][A
Training...:   1% 72/13907 [02:53<8:57:47,  2.33s/it][A
Training...:   1% 73/13907 [02:55<8:49:41,  2.30s/it][A
Training...:   1% 74/13907 [02:57<8:41:36,  2.26s/it][A
Training...:   1% 75/13907 [02:59<8:32:54,  2.22s/it][A
Training...:   1% 76/13907 [03:02<8:25:58,  2.19s/it][A
Training...:   1% 77/13907 [03:04<8:19:17,  2.17s/it][A
Training...:   1% 78/13907 [03:06<8:13:21,  2.14s/it][A                                                                                                                            
                                                     [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:33:40<8:52:18, 31938.93s/it]
Training...:   1% 78/13907 [03:08<8:13:21,  2.14s/it][A
Training...:   1% 79/13907 [03:08<8:30:05,  2.21s/it][A
Training...:   1% 80/13907 [03:10<8:20:45,  2.17s/it][A
Training...:   1% 81/13907 [03:12<8:08:32,  2.12s/it][A
Training...:   1% 82/13907 [03:14<7:57:59,  2.07s/it][A
Training...:   1% 83/13907 [03:16<7:49:25,  2.04s/it][A
Training...:   1% 84/13907 [03:18<7:42:24,  2.01s/it][A
Training...:   1% 85/13907 [03:20<7:35:54,  1.98s/it][A
Training...:   1% 86/13907 [03:22<7:29:37,  1.95s/it][A
Training...:   1% 87/13907 [03:24<7:20:05,  1.91s/it][A
Training...:   1% 88/13907 [03:25<7:13:08,  1.88s/it][A
Training...:   1% 89/13907 [03:27<7:04:05,  1.84s/it][A
Training...:   1% 90/13907 [03:29<6:54:20,  1.80s/it][A
Training...:   1% 91/13907 [03:31<6:45:42,  1.76s/it][A
Training...:   1% 92/13907 [03:32<6:35:50,  1.72s/it][A
Training...:   1% 93/13907 [03:34<6:27:03,  1.68s/it][A
Training...:   1% 94/13907 [03:35<6:18:27,  1.64s/it][A
Training...:   1% 95/13907 [03:37<6:08:55,  1.60s/it][A
Training...:   1% 96/13907 [03:38<5:57:57,  1.56s/it][A
Training...:   1% 97/13907 [03:40<5:45:36,  1.50s/it][A
Training...:   1% 98/13907 [03:41<5:32:18,  1.44s/it][A
Training...:   1% 99/13907 [03:42<5:18:16,  1.38s/it][A
Training...:   1% 100/13907 [03:43<4:57:49,  1.29s/it][A
Training...:   1% 101/13907 [03:47<7:42:31,  2.01s/it][A
Training...:   1% 102/13907 [03:51<9:25:49,  2.46s/it][A
Training...:   1% 103/13907 [03:54<10:20:30,  2.70s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:34:29<8:52:18, 31938.93s/it]
Training...:   1% 103/13907 [03:57<10:20:30,  2.70s/it][A
Training...:   1% 104/13907 [03:57<11:25:33,  2.98s/it][A
Training...:   1% 105/13907 [04:01<11:37:35,  3.03s/it][A
Training...:   1% 106/13907 [04:04<11:32:17,  3.01s/it][A
Training...:   1% 107/13907 [04:06<11:22:23,  2.97s/it][A
Training...:   1% 108/13907 [04:09<11:13:27,  2.93s/it][A
Training...:   1% 109/13907 [04:12<11:01:15,  2.88s/it][A
Training...:   1% 110/13907 [04:15<10:51:18,  2.83s/it][A
Training...:   1% 111/13907 [04:17<10:41:45,  2.79s/it][A
Training...:   1% 112/13907 [04:20<10:31:49,  2.75s/it][A
Training...:   1% 113/13907 [04:23<10:20:44,  2.70s/it][A
Training...:   1% 114/13907 [04:25<10:11:23,  2.66s/it][A
Training...:   1% 115/13907 [04:28<9:58:53,  2.61s/it] [A
Training...:   1% 116/13907 [04:30<9:48:53,  2.56s/it][A
Training...:   1% 117/13907 [04:33<9:41:28,  2.53s/it][A
Training...:   1% 118/13907 [04:35<9:34:04,  2.50s/it][A
Training...:   1% 119/13907 [04:37<9:27:37,  2.47s/it][A
Training...:   1% 120/13907 [04:40<9:26:28,  2.47s/it][A
Training...:   1% 121/13907 [04:42<9:16:29,  2.42s/it][A
Training...:   1% 122/13907 [04:45<9:08:07,  2.39s/it][A
Training...:   1% 123/13907 [04:47<8:56:37,  2.34s/it][A
Training...:   1% 124/13907 [04:49<8:46:21,  2.29s/it][A
Training...:   1% 125/13907 [04:51<8:36:01,  2.25s/it][A
Training...:   1% 126/13907 [04:53<8:27:55,  2.21s/it][A
Training...:   1% 127/13907 [04:55<8:20:38,  2.18s/it][A
Training...:   1% 128/13907 [04:57<8:13:26,  2.15s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:35:32<8:52:18, 31938.93s/it]
Training...:   1% 128/13907 [05:00<8:13:26,  2.15s/it][A
Training...:   1% 129/13907 [05:00<8:27:51,  2.21s/it][A
Training...:   1% 130/13907 [05:02<8:19:28,  2.18s/it][A
Training...:   1% 131/13907 [05:04<8:09:12,  2.13s/it][A
Training...:   1% 132/13907 [05:06<7:58:13,  2.08s/it][A
Training...:   1% 133/13907 [05:08<7:49:04,  2.04s/it][A
Training...:   1% 134/13907 [05:10<7:42:40,  2.02s/it][A
Training...:   1% 135/13907 [05:12<7:34:01,  1.98s/it][A
Training...:   1% 136/13907 [05:13<7:25:15,  1.94s/it][A
Training...:   1% 137/13907 [05:15<7:17:38,  1.91s/it][A
Training...:   1% 138/13907 [05:17<7:09:34,  1.87s/it][A
Training...:   1% 139/13907 [05:19<7:01:51,  1.84s/it][A
Training...:   1% 140/13907 [05:21<6:53:45,  1.80s/it][A
Training...:   1% 141/13907 [05:22<6:44:00,  1.76s/it][A
Training...:   1% 142/13907 [05:24<6:37:35,  1.73s/it][A
Training...:   1% 143/13907 [05:26<6:31:21,  1.71s/it][A
Training...:   1% 144/13907 [05:27<6:23:56,  1.67s/it][A
Training...:   1% 145/13907 [05:29<6:14:31,  1.63s/it][A
Training...:   1% 146/13907 [05:30<6:03:30,  1.58s/it][A
Training...:   1% 147/13907 [05:32<5:50:58,  1.53s/it][A
Training...:   1% 148/13907 [05:33<5:38:25,  1.48s/it][A
Training...:   1% 149/13907 [05:34<5:25:19,  1.42s/it][A
Training...:   1% 150/13907 [05:35<5:04:42,  1.33s/it][A
Training...:   1% 151/13907 [05:39<7:55:32,  2.07s/it][A
Training...:   1% 152/13907 [05:43<9:41:44,  2.54s/it][A
Training...:   1% 153/13907 [05:46<10:36:20,  2.78s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:36:22<8:52:18, 31938.93s/it]
Training...:   1% 153/13907 [05:50<10:36:20,  2.78s/it][A
Training...:   1% 154/13907 [05:50<11:40:55,  3.06s/it][A
Training...:   1% 155/13907 [05:53<11:45:58,  3.08s/it][A
Training...:   1% 156/13907 [05:56<11:37:49,  3.04s/it][A
Training...:   1% 157/13907 [05:59<11:32:36,  3.02s/it][A
Training...:   1% 158/13907 [06:02<11:25:17,  2.99s/it][A
Training...:   1% 159/13907 [06:05<11:15:24,  2.95s/it][A
Training...:   1% 160/13907 [06:07<11:03:20,  2.90s/it][A
Training...:   1% 161/13907 [06:10<10:46:44,  2.82s/it][A
Training...:   1% 162/13907 [06:13<10:32:28,  2.76s/it][A
Training...:   1% 163/13907 [06:15<10:19:02,  2.70s/it][A
Training...:   1% 164/13907 [06:18<10:06:33,  2.65s/it][A
Training...:   1% 165/13907 [06:20<9:55:19,  2.60s/it] [A
Training...:   1% 166/13907 [06:23<9:45:44,  2.56s/it][A
Training...:   1% 167/13907 [06:25<9:37:39,  2.52s/it][A
Training...:   1% 168/13907 [06:28<9:29:25,  2.49s/it][A
Training...:   1% 169/13907 [06:30<9:20:04,  2.45s/it][A
Training...:   1% 170/13907 [06:32<9:13:59,  2.42s/it][A
Training...:   1% 171/13907 [06:35<9:06:09,  2.39s/it][A
Training...:   1% 172/13907 [06:37<9:01:29,  2.37s/it][A
Training...:   1% 173/13907 [06:39<8:54:26,  2.33s/it][A
Training...:   1% 174/13907 [06:41<8:48:35,  2.31s/it][A
Training...:   1% 175/13907 [06:44<8:38:55,  2.27s/it][A
Training...:   1% 176/13907 [06:46<8:34:06,  2.25s/it][A
Training...:   1% 177/13907 [06:48<8:26:31,  2.21s/it][A
Training...:   1% 178/13907 [06:50<8:18:29,  2.18s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:37:24<8:52:18, 31938.93s/it]
Training...:   1% 178/13907 [06:52<8:18:29,  2.18s/it][A
Training...:   1% 179/13907 [06:52<8:33:07,  2.24s/it][A
Training...:   1% 180/13907 [06:54<8:25:00,  2.21s/it][A
Training...:   1% 181/13907 [06:57<8:12:10,  2.15s/it][A
Training...:   1% 182/13907 [06:59<8:00:57,  2.10s/it][A
Training...:   1% 183/13907 [07:00<7:49:57,  2.05s/it][A
Training...:   1% 184/13907 [07:02<7:41:46,  2.02s/it][A
Training...:   1% 185/13907 [07:04<7:33:56,  1.98s/it][A
Training...:   1% 186/13907 [07:06<7:29:09,  1.96s/it][A
Training...:   1% 187/13907 [07:08<7:23:26,  1.94s/it][A
Training...:   1% 188/13907 [07:10<7:14:19,  1.90s/it][A
Training...:   1% 189/13907 [07:12<7:08:38,  1.87s/it][A
Training...:   1% 190/13907 [07:13<7:00:46,  1.84s/it][A
Training...:   1% 191/13907 [07:15<6:49:56,  1.79s/it][A
Training...:   1% 192/13907 [07:17<6:39:56,  1.75s/it][A
Training...:   1% 193/13907 [07:18<6:31:17,  1.71s/it][A
Training...:   1% 194/13907 [07:20<6:21:22,  1.67s/it][A
Training...:   1% 195/13907 [07:22<6:14:27,  1.64s/it][A
Training...:   1% 196/13907 [07:23<6:03:31,  1.59s/it][A
Training...:   1% 197/13907 [07:24<5:52:26,  1.54s/it][A
Training...:   1% 198/13907 [07:26<5:38:50,  1.48s/it][A
Training...:   1% 199/13907 [07:27<5:24:04,  1.42s/it][A
Training...:   1% 200/13907 [07:28<5:01:17,  1.32s/it][A
Training...:   1% 201/13907 [07:32<7:43:47,  2.03s/it][A
Training...:   1% 202/13907 [07:35<9:21:40,  2.46s/it][A
Training...:   1% 203/13907 [07:39<10:14:14,  2.69s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:38:14<8:52:18, 31938.93s/it]
Training...:   1% 203/13907 [07:42<10:14:14,  2.69s/it][A
Training...:   1% 204/13907 [07:42<11:16:20,  2.96s/it][A
Training...:   1% 205/13907 [07:45<11:30:40,  3.02s/it][A
Training...:   1% 206/13907 [07:48<11:31:26,  3.03s/it][A
Training...:   1% 207/13907 [07:51<11:21:42,  2.99s/it][A
Training...:   1% 208/13907 [07:54<11:12:13,  2.94s/it][A
Training...:   2% 209/13907 [07:57<10:59:30,  2.89s/it][A
Training...:   2% 210/13907 [08:00<10:50:51,  2.85s/it][A
Training...:   2% 211/13907 [08:02<10:45:20,  2.83s/it][A
Training...:   2% 212/13907 [08:05<10:32:45,  2.77s/it][A
Training...:   2% 213/13907 [08:08<10:17:33,  2.71s/it][A
Training...:   2% 214/13907 [08:10<10:03:37,  2.64s/it][A
Training...:   2% 215/13907 [08:13<9:52:31,  2.60s/it] [A
Training...:   2% 216/13907 [08:15<9:42:12,  2.55s/it][A
Training...:   2% 217/13907 [08:17<9:32:28,  2.51s/it][A
Training...:   2% 218/13907 [08:20<9:23:39,  2.47s/it][A
Training...:   2% 219/13907 [08:22<9:13:21,  2.43s/it][A
Training...:   2% 220/13907 [08:24<9:05:13,  2.39s/it][A
Training...:   2% 221/13907 [08:27<8:58:01,  2.36s/it][A
Training...:   2% 222/13907 [08:29<8:50:06,  2.32s/it][A
Training...:   2% 223/13907 [08:31<8:40:24,  2.28s/it][A
Training...:   2% 224/13907 [08:33<8:33:31,  2.25s/it][A
Training...:   2% 225/13907 [08:35<8:28:22,  2.23s/it][A
Training...:   2% 226/13907 [08:38<8:21:58,  2.20s/it][A
Training...:   2% 227/13907 [08:40<8:14:20,  2.17s/it][A
Training...:   2% 228/13907 [08:42<8:07:41,  2.14s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:39:16<8:52:18, 31938.93s/it]
Training...:   2% 228/13907 [08:44<8:07:41,  2.14s/it][A
Training...:   2% 229/13907 [08:44<8:23:57,  2.21s/it][A
Training...:   2% 230/13907 [08:46<8:15:55,  2.18s/it][A
Training...:   2% 231/13907 [08:48<8:03:06,  2.12s/it][A
Training...:   2% 232/13907 [08:50<7:51:23,  2.07s/it][A
Training...:   2% 233/13907 [08:52<7:42:00,  2.03s/it][A
Training...:   2% 234/13907 [08:54<7:36:03,  2.00s/it][A
Training...:   2% 235/13907 [08:56<7:27:46,  1.97s/it][A
Training...:   2% 236/13907 [08:58<7:19:23,  1.93s/it][A
Training...:   2% 237/13907 [09:00<7:10:35,  1.89s/it][A
Training...:   2% 238/13907 [09:01<7:01:15,  1.85s/it][A
Training...:   2% 239/13907 [09:03<6:53:00,  1.81s/it][A
Training...:   2% 240/13907 [09:05<6:44:28,  1.78s/it][A
Training...:   2% 241/13907 [09:06<6:36:47,  1.74s/it][A
Training...:   2% 242/13907 [09:08<6:28:40,  1.71s/it][A
Training...:   2% 243/13907 [09:10<6:21:04,  1.67s/it][A
Training...:   2% 244/13907 [09:11<6:12:35,  1.64s/it][A
Training...:   2% 245/13907 [09:13<6:02:45,  1.59s/it][A
Training...:   2% 246/13907 [09:14<5:52:43,  1.55s/it][A
Training...:   2% 247/13907 [09:16<5:40:37,  1.50s/it][A
Training...:   2% 248/13907 [09:17<5:28:14,  1.44s/it][A
Training...:   2% 249/13907 [09:18<5:12:28,  1.37s/it][A
Training...:   2% 250/13907 [09:19<4:48:12,  1.27s/it][A
Training...:   2% 251/13907 [09:23<7:53:30,  2.08s/it][A
Training...:   2% 252/13907 [09:27<9:30:30,  2.51s/it][A
Training...:   2% 253/13907 [09:30<10:18:05,  2.72s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:40:05<8:52:18, 31938.93s/it]
Training...:   2% 253/13907 [09:33<10:18:05,  2.72s/it][A
Training...:   2% 254/13907 [09:33<11:16:58,  2.98s/it][A
Training...:   2% 255/13907 [09:36<11:28:47,  3.03s/it][A
Training...:   2% 256/13907 [09:39<11:22:15,  3.00s/it][A
Training...:   2% 257/13907 [09:42<11:10:02,  2.95s/it][A
Training...:   2% 258/13907 [09:45<11:00:31,  2.90s/it][A
Training...:   2% 259/13907 [09:48<10:47:20,  2.85s/it][A
Training...:   2% 260/13907 [09:50<10:33:36,  2.79s/it][A
Training...:   2% 261/13907 [09:53<10:21:19,  2.73s/it][A
Training...:   2% 262/13907 [09:56<10:14:01,  2.70s/it][A
Training...:   2% 263/13907 [09:58<10:03:10,  2.65s/it][A
Training...:   2% 264/13907 [10:01<9:56:15,  2.62s/it] [A
Training...:   2% 265/13907 [10:03<9:48:57,  2.59s/it][A
Training...:   2% 266/13907 [10:06<9:41:07,  2.56s/it][A
Training...:   2% 267/13907 [10:08<9:33:37,  2.52s/it][A
Training...:   2% 268/13907 [10:11<9:24:57,  2.49s/it][A
Training...:   2% 269/13907 [10:13<9:14:12,  2.44s/it][A
Training...:   2% 270/13907 [10:15<9:06:16,  2.40s/it][A
Training...:   2% 271/13907 [10:17<8:58:49,  2.37s/it][A
Training...:   2% 272/13907 [10:20<8:52:29,  2.34s/it][A
Training...:   2% 273/13907 [10:22<8:42:28,  2.30s/it][A
Training...:   2% 274/13907 [10:24<8:34:41,  2.27s/it][A
Training...:   2% 275/13907 [10:26<8:30:38,  2.25s/it][A
Training...:   2% 276/13907 [10:29<8:26:01,  2.23s/it][A
Training...:   2% 277/13907 [10:31<8:21:23,  2.21s/it][A
Training...:   2% 278/13907 [10:33<8:13:32,  2.17s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:41:07<8:52:18, 31938.93s/it]
Training...:   2% 278/13907 [10:35<8:13:32,  2.17s/it][A
Training...:   2% 279/13907 [10:35<8:27:12,  2.23s/it][A
Training...:   2% 280/13907 [10:37<8:17:35,  2.19s/it][A
Training...:   2% 281/13907 [10:39<8:03:25,  2.13s/it][A
Training...:   2% 282/13907 [10:41<7:52:08,  2.08s/it][A
Training...:   2% 283/13907 [10:43<7:45:03,  2.05s/it][A
Training...:   2% 284/13907 [10:45<7:34:45,  2.00s/it][A
Training...:   2% 285/13907 [10:47<7:26:47,  1.97s/it][A
Training...:   2% 286/13907 [10:49<7:17:27,  1.93s/it][A
Training...:   2% 287/13907 [10:51<7:10:57,  1.90s/it][A
Training...:   2% 288/13907 [10:52<7:02:41,  1.86s/it][A
Training...:   2% 289/13907 [10:54<6:55:17,  1.83s/it][A
Training...:   2% 290/13907 [10:56<6:46:48,  1.79s/it][A
Training...:   2% 291/13907 [10:58<6:38:26,  1.76s/it][A
Training...:   2% 292/13907 [10:59<6:30:28,  1.72s/it][A
Training...:   2% 293/13907 [11:01<6:21:56,  1.68s/it][A
Training...:   2% 294/13907 [11:02<6:13:41,  1.65s/it][A
Training...:   2% 295/13907 [11:04<6:03:42,  1.60s/it][A
Training...:   2% 296/13907 [11:05<5:51:35,  1.55s/it][A
Training...:   2% 297/13907 [11:07<5:39:18,  1.50s/it][A
Training...:   2% 298/13907 [11:08<5:25:34,  1.44s/it][A
Training...:   2% 299/13907 [11:09<5:10:36,  1.37s/it][A
Training...:   2% 300/13907 [11:10<4:49:40,  1.28s/it][A
Training...:   2% 301/13907 [11:14<7:42:37,  2.04s/it][A
Training...:   2% 302/13907 [11:18<9:22:50,  2.48s/it][A
Training...:   2% 303/13907 [11:21<10:15:53,  2.72s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:41:57<8:52:18, 31938.93s/it]
Training...:   2% 303/13907 [11:24<10:15:53,  2.72s/it][A
Training...:   2% 304/13907 [11:24<11:22:05,  3.01s/it][A
Training...:   2% 305/13907 [11:28<11:32:54,  3.06s/it][A
Training...:   2% 306/13907 [11:31<11:28:02,  3.04s/it][A
Training...:   2% 307/13907 [11:34<11:16:27,  2.98s/it][A
Training...:   2% 308/13907 [11:36<11:08:29,  2.95s/it][A
Training...:   2% 309/13907 [11:39<10:56:06,  2.90s/it][A
Training...:   2% 310/13907 [11:42<10:49:04,  2.86s/it][A
Training...:   2% 311/13907 [11:45<10:40:05,  2.82s/it][A
Training...:   2% 312/13907 [11:47<10:32:15,  2.79s/it][A
Training...:   2% 313/13907 [11:50<10:16:55,  2.72s/it][A
Training...:   2% 314/13907 [11:52<10:04:18,  2.67s/it][A
Training...:   2% 315/13907 [11:55<9:52:25,  2.62s/it] [A
Training...:   2% 316/13907 [11:57<9:42:35,  2.57s/it][A
Training...:   2% 317/13907 [12:00<9:31:30,  2.52s/it][A
Training...:   2% 318/13907 [12:02<9:22:02,  2.48s/it][A
Training...:   2% 319/13907 [12:05<9:13:19,  2.44s/it][A
Training...:   2% 320/13907 [12:07<9:05:10,  2.41s/it][A
Training...:   2% 321/13907 [12:09<8:57:38,  2.37s/it][A
Training...:   2% 322/13907 [12:11<8:50:39,  2.34s/it][A
Training...:   2% 323/13907 [12:14<8:42:59,  2.31s/it][A
Training...:   2% 324/13907 [12:16<8:34:13,  2.27s/it][A
Training...:   2% 325/13907 [12:18<8:27:35,  2.24s/it][A
Training...:   2% 326/13907 [12:20<8:21:11,  2.21s/it][A
Training...:   2% 327/13907 [12:22<8:13:26,  2.18s/it][A
Training...:   2% 328/13907 [12:24<8:05:01,  2.14s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:42:59<8:52:18, 31938.93s/it]
Training...:   2% 328/13907 [12:27<8:05:01,  2.14s/it][A
Training...:   2% 329/13907 [12:27<8:19:52,  2.21s/it][A
Training...:   2% 330/13907 [12:29<8:11:30,  2.17s/it][A
Training...:   2% 331/13907 [12:31<7:59:39,  2.12s/it][A
Training...:   2% 332/13907 [12:33<7:47:35,  2.07s/it][A
Training...:   2% 333/13907 [12:35<7:38:42,  2.03s/it][A
Training...:   2% 334/13907 [12:37<7:28:51,  1.98s/it][A
Training...:   2% 335/13907 [12:38<7:20:42,  1.95s/it][A
Training...:   2% 336/13907 [12:40<7:14:49,  1.92s/it][A
Training...:   2% 337/13907 [12:42<7:07:37,  1.89s/it][A
Training...:   2% 338/13907 [12:44<7:00:46,  1.86s/it][A
Training...:   2% 339/13907 [12:46<6:53:35,  1.83s/it][A
Training...:   2% 340/13907 [12:47<6:47:01,  1.80s/it][A
Training...:   2% 341/13907 [12:49<6:39:01,  1.76s/it][A
Training...:   2% 342/13907 [12:51<6:30:34,  1.73s/it][A
Training...:   2% 343/13907 [12:52<6:21:46,  1.69s/it][A
Training...:   2% 344/13907 [12:54<6:12:08,  1.65s/it][A
Training...:   2% 345/13907 [12:55<6:04:05,  1.61s/it][A
Training...:   2% 346/13907 [12:57<5:53:27,  1.56s/it][A
Training...:   2% 347/13907 [12:58<5:41:40,  1.51s/it][A
Training...:   3% 348/13907 [13:00<5:28:30,  1.45s/it][A
Training...:   3% 349/13907 [13:01<5:14:12,  1.39s/it][A
Training...:   3% 350/13907 [13:02<4:53:15,  1.30s/it][A
Training...:   3% 351/13907 [13:06<7:35:51,  2.02s/it][A
Training...:   3% 352/13907 [13:09<9:15:44,  2.46s/it][A
Training...:   3% 353/13907 [13:12<10:10:34,  2.70s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:43:48<8:52:18, 31938.93s/it]
Training...:   3% 353/13907 [13:16<10:10:34,  2.70s/it][A
Training...:   3% 354/13907 [13:16<11:12:44,  2.98s/it][A
Training...:   3% 355/13907 [13:19<11:22:40,  3.02s/it][A
Training...:   3% 356/13907 [13:22<11:20:50,  3.01s/it][A
Training...:   3% 357/13907 [13:25<11:13:45,  2.98s/it][A
Training...:   3% 358/13907 [13:28<11:03:07,  2.94s/it][A
Training...:   3% 359/13907 [13:31<10:52:41,  2.89s/it][A
Training...:   3% 360/13907 [13:33<10:42:42,  2.85s/it][A
Training...:   3% 361/13907 [13:36<10:30:27,  2.79s/it][A
Training...:   3% 362/13907 [13:39<10:19:59,  2.75s/it][A
Training...:   3% 363/13907 [13:41<10:11:53,  2.71s/it][A
Training...:   3% 364/13907 [13:44<10:06:55,  2.69s/it][A
Training...:   3% 365/13907 [13:47<10:00:48,  2.66s/it][A
Training...:   3% 366/13907 [13:49<9:50:41,  2.62s/it] [A
Training...:   3% 367/13907 [13:52<9:41:29,  2.58s/it][A
Training...:   3% 368/13907 [13:54<9:32:48,  2.54s/it][A
Training...:   3% 369/13907 [13:56<9:22:18,  2.49s/it][A
Training...:   3% 370/13907 [13:59<9:14:03,  2.46s/it][A
Training...:   3% 371/13907 [14:01<9:06:42,  2.42s/it][A
Training...:   3% 372/13907 [14:03<9:00:18,  2.40s/it][A
Training...:   3% 373/13907 [14:06<8:51:51,  2.36s/it][A
Training...:   3% 374/13907 [14:08<8:44:31,  2.33s/it][A
Training...:   3% 375/13907 [14:10<8:36:31,  2.29s/it][A
Training...:   3% 376/13907 [14:12<8:28:13,  2.25s/it][A
Training...:   3% 377/13907 [14:14<8:19:41,  2.22s/it][A
Training...:   3% 378/13907 [14:17<8:11:12,  2.18s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:44:51<8:52:18, 31938.93s/it]
Training...:   3% 378/13907 [14:19<8:11:12,  2.18s/it][A
Training...:   3% 379/13907 [14:19<8:23:31,  2.23s/it][A
Training...:   3% 380/13907 [14:21<8:14:53,  2.20s/it][A
Training...:   3% 381/13907 [14:23<8:02:03,  2.14s/it][A
Training...:   3% 382/13907 [14:25<7:50:30,  2.09s/it][A
Training...:   3% 383/13907 [14:27<7:41:04,  2.05s/it][A
Training...:   3% 384/13907 [14:29<7:31:44,  2.00s/it][A
Training...:   3% 385/13907 [14:31<7:22:52,  1.97s/it][A
Training...:   3% 386/13907 [14:33<7:15:43,  1.93s/it][A
Training...:   3% 387/13907 [14:34<7:08:36,  1.90s/it][A
Training...:   3% 388/13907 [14:36<7:00:07,  1.86s/it][A
Training...:   3% 389/13907 [14:38<6:53:21,  1.83s/it][A
Training...:   3% 390/13907 [14:40<6:46:29,  1.80s/it][A
Training...:   3% 391/13907 [14:41<6:38:44,  1.77s/it][A
Training...:   3% 392/13907 [14:43<6:32:03,  1.74s/it][A
Training...:   3% 393/13907 [14:45<6:25:01,  1.71s/it][A
Training...:   3% 394/13907 [14:46<6:15:52,  1.67s/it][A
Training...:   3% 395/13907 [14:48<6:10:13,  1.64s/it][A
Training...:   3% 396/13907 [14:49<5:58:43,  1.59s/it][A
Training...:   3% 397/13907 [14:51<5:46:55,  1.54s/it][A
Training...:   3% 398/13907 [14:52<5:33:54,  1.48s/it][A
Training...:   3% 399/13907 [14:53<5:17:53,  1.41s/it][A
Training...:   3% 400/13907 [14:54<4:55:45,  1.31s/it][A
Training...:   3% 401/13907 [14:58<7:35:55,  2.03s/it][A
Training...:   3% 402/13907 [15:02<9:14:27,  2.46s/it][A
Training...:   3% 403/13907 [15:05<10:14:16,  2.73s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:45:41<8:52:18, 31938.93s/it]
Training...:   3% 403/13907 [15:09<10:14:16,  2.73s/it][A
Training...:   3% 404/13907 [15:09<11:14:57,  3.00s/it][A
Training...:   3% 405/13907 [15:12<11:24:57,  3.04s/it][A
Training...:   3% 406/13907 [15:15<11:15:03,  3.00s/it][A
Training...:   3% 407/13907 [15:17<11:05:12,  2.96s/it][A
Training...:   3% 408/13907 [15:20<10:54:53,  2.91s/it][A
Training...:   3% 409/13907 [15:23<10:44:23,  2.86s/it][A
Training...:   3% 410/13907 [15:26<10:34:25,  2.82s/it][A
Training...:   3% 411/13907 [15:28<10:23:04,  2.77s/it][A
Training...:   3% 412/13907 [15:31<10:12:25,  2.72s/it][A
Training...:   3% 413/13907 [15:34<10:02:27,  2.68s/it][A
Training...:   3% 414/13907 [15:36<9:51:51,  2.63s/it] [A
Training...:   3% 415/13907 [15:39<9:40:31,  2.58s/it][A
Training...:   3% 416/13907 [15:41<9:34:47,  2.56s/it][A
Training...:   3% 417/13907 [15:43<9:24:47,  2.51s/it][A
Training...:   3% 418/13907 [15:46<9:17:45,  2.48s/it][A
Training...:   3% 419/13907 [15:48<9:07:40,  2.44s/it][A
Training...:   3% 420/13907 [15:51<9:02:07,  2.41s/it][A
Training...:   3% 421/13907 [15:53<8:54:59,  2.38s/it][A
Training...:   3% 422/13907 [15:55<8:46:20,  2.34s/it][A
Training...:   3% 423/13907 [15:57<8:39:40,  2.31s/it][A
Training...:   3% 424/13907 [16:00<8:35:18,  2.29s/it][A
Training...:   3% 425/13907 [16:02<8:30:59,  2.27s/it][A
Training...:   3% 426/13907 [16:04<8:24:56,  2.25s/it][A
Training...:   3% 427/13907 [16:06<8:13:40,  2.20s/it][A
Training...:   3% 428/13907 [16:08<8:04:26,  2.16s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:46:43<8:52:18, 31938.93s/it]
Training...:   3% 428/13907 [16:11<8:04:26,  2.16s/it][A
Training...:   3% 429/13907 [16:11<8:17:00,  2.21s/it][A
Training...:   3% 430/13907 [16:13<8:08:24,  2.17s/it][A
Training...:   3% 431/13907 [16:15<7:58:27,  2.13s/it][A
Training...:   3% 432/13907 [16:17<7:47:08,  2.08s/it][A
Training...:   3% 433/13907 [16:18<7:36:07,  2.03s/it][A
Training...:   3% 434/13907 [16:20<7:27:10,  1.99s/it][A
Training...:   3% 435/13907 [16:22<7:19:18,  1.96s/it][A
Training...:   3% 436/13907 [16:24<7:12:03,  1.92s/it][A
Training...:   3% 437/13907 [16:26<7:04:26,  1.89s/it][A
Training...:   3% 438/13907 [16:28<6:55:35,  1.85s/it][A
Training...:   3% 439/13907 [16:29<6:47:42,  1.82s/it][A
Training...:   3% 440/13907 [16:31<6:39:52,  1.78s/it][A
Training...:   3% 441/13907 [16:33<6:32:00,  1.75s/it][A
Training...:   3% 442/13907 [16:34<6:23:44,  1.71s/it][A
Training...:   3% 443/13907 [16:36<6:17:18,  1.68s/it][A
Training...:   3% 444/13907 [16:38<6:08:23,  1.64s/it][A
Training...:   3% 445/13907 [16:39<5:58:40,  1.60s/it][A
Training...:   3% 446/13907 [16:41<5:48:17,  1.55s/it][A
Training...:   3% 447/13907 [16:42<5:37:10,  1.50s/it][A
Training...:   3% 448/13907 [16:43<5:25:10,  1.45s/it][A
Training...:   3% 449/13907 [16:44<5:10:45,  1.39s/it][A
Training...:   3% 450/13907 [16:46<4:50:09,  1.29s/it][A
Training...:   3% 451/13907 [16:49<7:31:33,  2.01s/it][A
Training...:   3% 452/13907 [16:53<9:13:54,  2.47s/it][A
Training...:   3% 453/13907 [16:56<10:09:55,  2.72s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:47:32<8:52:18, 31938.93s/it]
Training...:   3% 453/13907 [17:00<10:09:55,  2.72s/it][A
Training...:   3% 454/13907 [17:00<11:10:28,  2.99s/it][A
Training...:   3% 455/13907 [17:03<11:24:08,  3.05s/it][A
Training...:   3% 456/13907 [17:06<11:19:59,  3.03s/it][A
Training...:   3% 457/13907 [17:09<11:08:42,  2.98s/it][A
Training...:   3% 458/13907 [17:12<10:57:18,  2.93s/it][A
Training...:   3% 459/13907 [17:14<10:52:16,  2.91s/it][A
Training...:   3% 460/13907 [17:17<10:42:02,  2.86s/it][A
Training...:   3% 461/13907 [17:20<10:27:53,  2.80s/it][A
Training...:   3% 462/13907 [17:22<10:14:21,  2.74s/it][A
Training...:   3% 463/13907 [17:25<10:04:50,  2.70s/it][A
Training...:   3% 464/13907 [17:28<9:53:25,  2.65s/it] [A
Training...:   3% 465/13907 [17:30<9:42:42,  2.60s/it][A
Training...:   3% 466/13907 [17:33<9:32:32,  2.56s/it][A
Training...:   3% 467/13907 [17:35<9:22:52,  2.51s/it][A
Training...:   3% 468/13907 [17:37<9:16:04,  2.48s/it][A
Training...:   3% 469/13907 [17:40<9:07:01,  2.44s/it][A
Training...:   3% 470/13907 [17:42<8:57:35,  2.40s/it][A
Training...:   3% 471/13907 [17:44<8:49:17,  2.36s/it][A
Training...:   3% 472/13907 [17:47<8:40:49,  2.33s/it][A
Training...:   3% 473/13907 [17:49<8:32:11,  2.29s/it][A
Training...:   3% 474/13907 [17:51<8:25:43,  2.26s/it][A
Training...:   3% 475/13907 [17:53<8:18:15,  2.23s/it][A
Training...:   3% 476/13907 [17:55<8:12:55,  2.20s/it][A
Training...:   3% 477/13907 [17:57<8:05:45,  2.17s/it][A
Training...:   3% 478/13907 [17:59<7:59:24,  2.14s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:48:34<8:52:18, 31938.93s/it]
Training...:   3% 478/13907 [18:02<7:59:24,  2.14s/it][A
Training...:   3% 479/13907 [18:02<8:14:45,  2.21s/it][A
Training...:   3% 480/13907 [18:04<8:08:19,  2.18s/it][A
Training...:   3% 481/13907 [18:06<7:57:37,  2.13s/it][A
Training...:   3% 482/13907 [18:08<7:47:54,  2.09s/it][A
Training...:   3% 483/13907 [18:10<7:38:26,  2.05s/it][A
Training...:   3% 484/13907 [18:12<7:30:17,  2.01s/it][A
Training...:   3% 485/13907 [18:14<7:21:29,  1.97s/it][A
Training...:   3% 486/13907 [18:15<7:13:49,  1.94s/it][A
Training...:   4% 487/13907 [18:17<7:07:41,  1.91s/it][A
Training...:   4% 488/13907 [18:19<6:59:57,  1.88s/it][A
Training...:   4% 489/13907 [18:21<6:53:10,  1.85s/it][A
Training...:   4% 490/13907 [18:23<6:46:18,  1.82s/it][A
Training...:   4% 491/13907 [18:24<6:40:07,  1.79s/it][A
Training...:   4% 492/13907 [18:26<6:31:28,  1.75s/it][A
Training...:   4% 493/13907 [18:28<6:23:39,  1.72s/it][A
Training...:   4% 494/13907 [18:29<6:16:37,  1.68s/it][A
Training...:   4% 495/13907 [18:31<6:08:25,  1.65s/it][A
Training...:   4% 496/13907 [18:32<5:57:46,  1.60s/it][A
Training...:   4% 497/13907 [18:34<5:46:52,  1.55s/it][A
Training...:   4% 498/13907 [18:35<5:32:55,  1.49s/it][A
Training...:   4% 499/13907 [18:36<5:18:24,  1.42s/it][A
Training...:   4% 500/13907 [18:37<4:56:38,  1.33s/it][A
Training...:   4% 501/13907 [18:41<7:41:36,  2.07s/it][A
Training...:   4% 502/13907 [18:45<9:19:19,  2.50s/it][A
Training...:   4% 503/13907 [18:48<10:09:48,  2.73s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:49:24<8:52:18, 31938.93s/it]
Training...:   4% 503/13907 [18:52<10:09:48,  2.73s/it][A
Training...:   4% 504/13907 [18:52<11:10:01,  3.00s/it][A
Training...:   4% 505/13907 [18:55<11:16:31,  3.03s/it][A
Training...:   4% 506/13907 [18:58<11:11:24,  3.01s/it][A
Training...:   4% 507/13907 [19:01<11:03:35,  2.97s/it][A
Training...:   4% 508/13907 [19:03<10:53:18,  2.93s/it][A
Training...:   4% 509/13907 [19:06<10:42:34,  2.88s/it][A
Training...:   4% 510/13907 [19:09<10:31:43,  2.83s/it][A
Training...:   4% 511/13907 [19:12<10:20:03,  2.78s/it][A
Training...:   4% 512/13907 [19:14<10:11:29,  2.74s/it][A
Training...:   4% 513/13907 [19:17<10:02:51,  2.70s/it][A
Training...:   4% 514/13907 [19:19<9:53:14,  2.66s/it] [A
Training...:   4% 515/13907 [19:22<9:44:12,  2.62s/it][A
Training...:   4% 516/13907 [19:24<9:36:25,  2.58s/it][A
Training...:   4% 517/13907 [19:27<9:29:20,  2.55s/it][A
Training...:   4% 518/13907 [19:29<9:23:42,  2.53s/it][A
Training...:   4% 519/13907 [19:32<9:16:17,  2.49s/it][A
Training...:   4% 520/13907 [19:34<9:08:32,  2.46s/it][A
Training...:   4% 521/13907 [19:37<8:59:59,  2.42s/it][A
Training...:   4% 522/13907 [19:39<8:51:24,  2.38s/it][A
Training...:   4% 523/13907 [19:41<8:43:57,  2.35s/it][A
Training...:   4% 524/13907 [19:43<8:36:38,  2.32s/it][A
Training...:   4% 525/13907 [19:46<8:28:30,  2.28s/it][A
Training...:   4% 526/13907 [19:48<8:23:17,  2.26s/it][A
Training...:   4% 527/13907 [19:50<8:19:44,  2.24s/it][A
Training...:   4% 528/13907 [19:52<8:10:59,  2.20s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:50:26<8:52:18, 31938.93s/it]
Training...:   4% 528/13907 [19:54<8:10:59,  2.20s/it][A
Training...:   4% 529/13907 [19:54<8:24:03,  2.26s/it][A
Training...:   4% 530/13907 [19:57<8:15:54,  2.22s/it][A
Training...:   4% 531/13907 [19:59<8:01:30,  2.16s/it][A
Training...:   4% 532/13907 [20:01<7:49:01,  2.10s/it][A
Training...:   4% 533/13907 [20:02<7:38:18,  2.06s/it][A
Training...:   4% 534/13907 [20:04<7:28:49,  2.01s/it][A
Training...:   4% 535/13907 [20:06<7:20:14,  1.98s/it][A
Training...:   4% 536/13907 [20:08<7:11:31,  1.94s/it][A
Training...:   4% 537/13907 [20:10<7:04:06,  1.90s/it][A
Training...:   4% 538/13907 [20:12<6:55:58,  1.87s/it][A
Training...:   4% 539/13907 [20:14<6:48:57,  1.84s/it][A
Training...:   4% 540/13907 [20:15<6:40:39,  1.80s/it][A
Training...:   4% 541/13907 [20:17<6:32:32,  1.76s/it][A
Training...:   4% 542/13907 [20:19<6:24:50,  1.73s/it][A
Training...:   4% 543/13907 [20:20<6:17:30,  1.69s/it][A
Training...:   4% 544/13907 [20:22<6:10:26,  1.66s/it][A
Training...:   4% 545/13907 [20:23<6:02:13,  1.63s/it][A
Training...:   4% 546/13907 [20:25<5:50:22,  1.57s/it][A
Training...:   4% 547/13907 [20:26<5:38:36,  1.52s/it][A
Training...:   4% 548/13907 [20:27<5:26:02,  1.46s/it][A
Training...:   4% 549/13907 [20:29<5:10:58,  1.40s/it][A
Training...:   4% 550/13907 [20:30<4:48:12,  1.29s/it][A
Training...:   4% 551/13907 [20:33<7:26:48,  2.01s/it][A
Training...:   4% 552/13907 [20:37<9:06:39,  2.46s/it][A
Training...:   4% 553/13907 [20:40<10:03:46,  2.71s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:51:16<8:52:18, 31938.93s/it]
Training...:   4% 553/13907 [20:44<10:03:46,  2.71s/it][A
Training...:   4% 554/13907 [20:44<11:07:16,  3.00s/it][A
Training...:   4% 555/13907 [20:47<11:20:48,  3.06s/it][A
Training...:   4% 556/13907 [20:50<11:18:44,  3.05s/it][A
Training...:   4% 557/13907 [20:53<11:08:17,  3.00s/it][A
Training...:   4% 558/13907 [20:56<10:57:48,  2.96s/it][A
Training...:   4% 559/13907 [20:59<10:52:25,  2.93s/it][A
Training...:   4% 560/13907 [21:02<10:43:03,  2.89s/it][A
Training...:   4% 561/13907 [21:04<10:28:34,  2.83s/it][A
Training...:   4% 562/13907 [21:07<10:16:42,  2.77s/it][A
Training...:   4% 563/13907 [21:09<10:02:43,  2.71s/it][A
Training...:   4% 564/13907 [21:12<9:50:49,  2.66s/it] [A
Training...:   4% 565/13907 [21:14<9:39:43,  2.61s/it][A
Training...:   4% 566/13907 [21:17<9:29:55,  2.56s/it][A
Training...:   4% 567/13907 [21:19<9:21:53,  2.53s/it][A
Training...:   4% 568/13907 [21:22<9:12:30,  2.49s/it][A
Training...:   4% 569/13907 [21:24<9:03:29,  2.44s/it][A
Training...:   4% 570/13907 [21:26<8:54:30,  2.40s/it][A
Training...:   4% 571/13907 [21:29<8:47:57,  2.38s/it][A
Training...:   4% 572/13907 [21:31<8:38:27,  2.33s/it][A
Training...:   4% 573/13907 [21:33<8:29:32,  2.29s/it][A
Training...:   4% 574/13907 [21:35<8:22:06,  2.26s/it][A
Training...:   4% 575/13907 [21:37<8:14:30,  2.23s/it][A
Training...:   4% 576/13907 [21:40<8:08:44,  2.20s/it][A
Training...:   4% 577/13907 [21:42<8:02:15,  2.17s/it][A
Training...:   4% 578/13907 [21:44<7:56:06,  2.14s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:52:18<8:52:18, 31938.93s/it]
Training...:   4% 578/13907 [21:46<7:56:06,  2.14s/it][A
Training...:   4% 579/13907 [21:46<8:09:32,  2.20s/it][A
Training...:   4% 580/13907 [21:48<8:01:04,  2.17s/it][A
Training...:   4% 581/13907 [21:50<7:49:22,  2.11s/it][A
Training...:   4% 582/13907 [21:52<7:38:33,  2.06s/it][A
Training...:   4% 583/13907 [21:54<7:30:08,  2.03s/it][A
Training...:   4% 584/13907 [21:56<7:22:26,  1.99s/it][A
Training...:   4% 585/13907 [21:58<7:16:35,  1.97s/it][A
Training...:   4% 586/13907 [22:00<7:07:37,  1.93s/it][A
Training...:   4% 587/13907 [22:02<6:59:44,  1.89s/it][A
Training...:   4% 588/13907 [22:03<6:51:22,  1.85s/it][A
Training...:   4% 589/13907 [22:05<6:44:53,  1.82s/it][A
Training...:   4% 590/13907 [22:07<6:37:55,  1.79s/it][A
Training...:   4% 591/13907 [22:08<6:29:45,  1.76s/it][A
Training...:   4% 592/13907 [22:10<6:20:53,  1.72s/it][A
Training...:   4% 593/13907 [22:12<6:13:28,  1.68s/it][A
Training...:   4% 594/13907 [22:13<6:04:15,  1.64s/it][A
Training...:   4% 595/13907 [22:15<5:53:12,  1.59s/it][A
Training...:   4% 596/13907 [22:16<5:42:45,  1.55s/it][A
Training...:   4% 597/13907 [22:18<5:31:10,  1.49s/it][A
Training...:   4% 598/13907 [22:19<5:18:36,  1.44s/it][A
Training...:   4% 599/13907 [22:20<5:04:12,  1.37s/it][A
Training...:   4% 600/13907 [22:21<4:41:44,  1.27s/it][A
Training...:   4% 601/13907 [22:25<7:23:20,  2.00s/it][A
Training...:   4% 602/13907 [22:28<9:00:00,  2.44s/it][A
Training...:   4% 603/13907 [22:32<9:58:05,  2.70s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:53:07<8:52:18, 31938.93s/it]
Training...:   4% 603/13907 [22:35<9:58:05,  2.70s/it][A
Training...:   4% 604/13907 [22:35<11:03:36,  2.99s/it][A
Training...:   4% 605/13907 [22:38<11:17:53,  3.06s/it][A
Training...:   4% 606/13907 [22:41<11:16:40,  3.05s/it][A
Training...:   4% 607/13907 [22:44<11:04:37,  3.00s/it][A
Training...:   4% 608/13907 [22:47<10:52:25,  2.94s/it][A
Training...:   4% 609/13907 [22:50<10:39:22,  2.88s/it][A
Training...:   4% 610/13907 [22:53<10:30:12,  2.84s/it][A
Training...:   4% 611/13907 [22:55<10:19:07,  2.79s/it][A
Training...:   4% 612/13907 [22:58<10:07:54,  2.74s/it][A
Training...:   4% 613/13907 [23:01<9:57:47,  2.70s/it] [A
Training...:   4% 614/13907 [23:03<9:48:04,  2.65s/it][A
Training...:   4% 615/13907 [23:06<9:39:45,  2.62s/it][A
Training...:   4% 616/13907 [23:08<9:29:59,  2.57s/it][A
Training...:   4% 617/13907 [23:11<9:20:32,  2.53s/it][A
Training...:   4% 618/13907 [23:13<9:14:16,  2.50s/it][A
Training...:   4% 619/13907 [23:15<9:05:31,  2.46s/it][A
Training...:   4% 620/13907 [23:18<8:57:40,  2.43s/it][A
Training...:   4% 621/13907 [23:20<8:50:48,  2.40s/it][A
Training...:   4% 622/13907 [23:22<8:44:57,  2.37s/it][A
Training...:   4% 623/13907 [23:25<8:39:31,  2.35s/it][A
Training...:   4% 624/13907 [23:27<8:31:59,  2.31s/it][A
Training...:   4% 625/13907 [23:29<8:24:08,  2.28s/it][A
Training...:   5% 626/13907 [23:31<8:16:53,  2.24s/it][A
Training...:   5% 627/13907 [23:33<8:12:00,  2.22s/it][A
Training...:   5% 628/13907 [23:36<8:05:32,  2.19s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:54:10<8:52:18, 31938.93s/it]
Training...:   5% 628/13907 [23:38<8:05:32,  2.19s/it][A
Training...:   5% 629/13907 [23:38<8:18:33,  2.25s/it][A
Training...:   5% 630/13907 [23:40<8:11:04,  2.22s/it][A
Training...:   5% 631/13907 [23:42<7:57:44,  2.16s/it][A
Training...:   5% 632/13907 [23:44<7:45:50,  2.11s/it][A
Training...:   5% 633/13907 [23:46<7:35:52,  2.06s/it][A
Training...:   5% 634/13907 [23:48<7:26:56,  2.02s/it][A
Training...:   5% 635/13907 [23:50<7:19:08,  1.99s/it][A
Training...:   5% 636/13907 [23:52<7:16:19,  1.97s/it][A
Training...:   5% 637/13907 [23:54<7:07:44,  1.93s/it][A
Training...:   5% 638/13907 [23:55<6:57:47,  1.89s/it][A
Training...:   5% 639/13907 [23:57<6:47:53,  1.84s/it][A
Training...:   5% 640/13907 [23:59<6:39:52,  1.81s/it][A
Training...:   5% 641/13907 [24:01<6:32:13,  1.77s/it][A
Training...:   5% 642/13907 [24:02<6:24:00,  1.74s/it][A
Training...:   5% 643/13907 [24:04<6:16:41,  1.70s/it][A
Training...:   5% 644/13907 [24:05<6:08:42,  1.67s/it][A
Training...:   5% 645/13907 [24:07<6:00:05,  1.63s/it][A
Training...:   5% 646/13907 [24:08<5:49:01,  1.58s/it][A
Training...:   5% 647/13907 [24:10<5:35:47,  1.52s/it][A
Training...:   5% 648/13907 [24:11<5:22:50,  1.46s/it][A
Training...:   5% 649/13907 [24:12<5:07:49,  1.39s/it][A
Training...:   5% 650/13907 [24:13<4:46:02,  1.29s/it][A
Training...:   5% 651/13907 [24:17<7:24:24,  2.01s/it][A
Training...:   5% 652/13907 [24:21<9:02:37,  2.46s/it][A
Training...:   5% 653/13907 [24:24<9:52:47,  2.68s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:54:59<8:52:18, 31938.93s/it]
Training...:   5% 653/13907 [24:27<9:52:47,  2.68s/it][A
Training...:   5% 654/13907 [24:27<10:53:10,  2.96s/it][A
Training...:   5% 655/13907 [24:31<11:02:29,  3.00s/it][A
Training...:   5% 656/13907 [24:33<10:57:37,  2.98s/it][A
Training...:   5% 657/13907 [24:36<10:51:03,  2.95s/it][A
Training...:   5% 658/13907 [24:39<10:41:21,  2.90s/it][A
Training...:   5% 659/13907 [24:42<10:29:44,  2.85s/it][A
Training...:   5% 660/13907 [24:45<10:19:42,  2.81s/it][A
Training...:   5% 661/13907 [24:47<10:08:49,  2.76s/it][A
Training...:   5% 662/13907 [24:50<10:01:08,  2.72s/it][A
Training...:   5% 663/13907 [24:52<9:53:46,  2.69s/it] [A
Training...:   5% 664/13907 [24:55<9:44:05,  2.65s/it][A
Training...:   5% 665/13907 [24:57<9:33:18,  2.60s/it][A
Training...:   5% 666/13907 [25:00<9:25:39,  2.56s/it][A
Training...:   5% 667/13907 [25:02<9:17:19,  2.53s/it][A
Training...:   5% 668/13907 [25:05<9:10:48,  2.50s/it][A
Training...:   5% 669/13907 [25:07<9:01:57,  2.46s/it][A
Training...:   5% 670/13907 [25:10<8:54:24,  2.42s/it][A
Training...:   5% 671/13907 [25:12<8:46:47,  2.39s/it][A
Training...:   5% 672/13907 [25:14<8:40:00,  2.36s/it][A
Training...:   5% 673/13907 [25:16<8:31:24,  2.32s/it][A
Training...:   5% 674/13907 [25:19<8:25:40,  2.29s/it][A
Training...:   5% 675/13907 [25:21<8:18:41,  2.26s/it][A
Training...:   5% 676/13907 [25:23<8:12:22,  2.23s/it][A
Training...:   5% 677/13907 [25:25<8:05:03,  2.20s/it][A
Training...:   5% 678/13907 [25:27<7:58:30,  2.17s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:56:02<8:52:18, 31938.93s/it]
Training...:   5% 678/13907 [25:30<7:58:30,  2.17s/it][A
Training...:   5% 679/13907 [25:30<8:13:17,  2.24s/it][A
Training...:   5% 680/13907 [25:32<8:02:35,  2.19s/it][A
Training...:   5% 681/13907 [25:34<7:49:34,  2.13s/it][A
Training...:   5% 682/13907 [25:36<7:37:45,  2.08s/it][A
Training...:   5% 683/13907 [25:38<7:28:02,  2.03s/it][A
Training...:   5% 684/13907 [25:39<7:20:15,  2.00s/it][A
Training...:   5% 685/13907 [25:41<7:13:11,  1.97s/it][A
Training...:   5% 686/13907 [25:43<7:05:49,  1.93s/it][A
Training...:   5% 687/13907 [25:45<6:57:27,  1.89s/it][A
Training...:   5% 688/13907 [25:47<6:50:23,  1.86s/it][A
Training...:   5% 689/13907 [25:49<6:43:29,  1.83s/it][A
Training...:   5% 690/13907 [25:50<6:34:54,  1.79s/it][A
Training...:   5% 691/13907 [25:52<6:30:15,  1.77s/it][A
Training...:   5% 692/13907 [25:54<6:21:25,  1.73s/it][A
Training...:   5% 693/13907 [25:55<6:15:08,  1.70s/it][A
Training...:   5% 694/13907 [25:57<6:07:18,  1.67s/it][A
Training...:   5% 695/13907 [25:58<6:00:10,  1.64s/it][A
Training...:   5% 696/13907 [26:00<5:50:32,  1.59s/it][A
Training...:   5% 697/13907 [26:01<5:39:13,  1.54s/it][A
Training...:   5% 698/13907 [26:03<5:25:41,  1.48s/it][A
Training...:   5% 699/13907 [26:04<5:10:28,  1.41s/it][A
Training...:   5% 700/13907 [26:05<4:47:34,  1.31s/it][A
Training...:   5% 701/13907 [26:09<7:26:29,  2.03s/it][A
Training...:   5% 702/13907 [26:12<9:04:24,  2.47s/it][A
Training...:   5% 703/13907 [26:15<9:56:13,  2.71s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:56:51<8:52:18, 31938.93s/it]
Training...:   5% 703/13907 [26:19<9:56:13,  2.71s/it][A
Training...:   5% 704/13907 [26:19<10:56:47,  2.98s/it][A
Training...:   5% 705/13907 [26:22<11:07:06,  3.03s/it][A
Training...:   5% 706/13907 [26:25<10:59:54,  3.00s/it][A
Training...:   5% 707/13907 [26:28<10:51:27,  2.96s/it][A
Training...:   5% 708/13907 [26:31<10:40:18,  2.91s/it][A
Training...:   5% 709/13907 [26:34<10:27:58,  2.85s/it][A
Training...:   5% 710/13907 [26:36<10:16:55,  2.80s/it][A
Training...:   5% 711/13907 [26:39<10:05:16,  2.75s/it][A
Training...:   5% 712/13907 [26:41<9:57:32,  2.72s/it] [A
Training...:   5% 713/13907 [26:44<9:45:25,  2.66s/it][A
Training...:   5% 714/13907 [26:46<9:33:58,  2.61s/it][A
Training...:   5% 715/13907 [26:49<9:24:56,  2.57s/it][A
Training...:   5% 716/13907 [26:51<9:16:21,  2.53s/it][A
Training...:   5% 717/13907 [26:54<9:07:01,  2.49s/it][A
Training...:   5% 718/13907 [26:56<8:59:24,  2.45s/it][A
Training...:   5% 719/13907 [26:59<8:52:29,  2.42s/it][A
Training...:   5% 720/13907 [27:01<8:43:56,  2.38s/it][A
Training...:   5% 721/13907 [27:03<8:36:15,  2.35s/it][A
Training...:   5% 722/13907 [27:05<8:29:34,  2.32s/it][A
Training...:   5% 723/13907 [27:08<8:22:00,  2.28s/it][A
Training...:   5% 724/13907 [27:10<8:13:43,  2.25s/it][A
Training...:   5% 725/13907 [27:12<8:05:13,  2.21s/it][A
Training...:   5% 726/13907 [27:14<7:58:28,  2.18s/it][A
Training...:   5% 727/13907 [27:16<7:53:14,  2.15s/it][A
Training...:   5% 728/13907 [27:18<7:47:38,  2.13s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:57:52<8:52:18, 31938.93s/it]
Training...:   5% 728/13907 [27:20<7:47:38,  2.13s/it][A
Training...:   5% 729/13907 [27:20<8:02:13,  2.20s/it][A
Training...:   5% 730/13907 [27:23<7:54:25,  2.16s/it][A
Training...:   5% 731/13907 [27:24<7:42:11,  2.10s/it][A
Training...:   5% 732/13907 [27:26<7:31:02,  2.05s/it][A
Training...:   5% 733/13907 [27:28<7:20:44,  2.01s/it][A
Training...:   5% 734/13907 [27:30<7:11:47,  1.97s/it][A
Training...:   5% 735/13907 [27:32<7:05:23,  1.94s/it][A
Training...:   5% 736/13907 [27:34<6:59:10,  1.91s/it][A
Training...:   5% 737/13907 [27:36<6:52:19,  1.88s/it][A
Training...:   5% 738/13907 [27:37<6:43:46,  1.84s/it][A
Training...:   5% 739/13907 [27:39<6:36:57,  1.81s/it][A
Training...:   5% 740/13907 [27:41<6:31:27,  1.78s/it][A
Training...:   5% 741/13907 [27:43<6:24:48,  1.75s/it][A
Training...:   5% 742/13907 [27:44<6:19:16,  1.73s/it][A
Training...:   5% 743/13907 [27:46<6:10:25,  1.69s/it][A
Training...:   5% 744/13907 [27:47<6:03:31,  1.66s/it][A
Training...:   5% 745/13907 [27:49<5:52:47,  1.61s/it][A
Training...:   5% 746/13907 [27:50<5:41:18,  1.56s/it][A
Training...:   5% 747/13907 [27:52<5:28:34,  1.50s/it][A
Training...:   5% 748/13907 [27:53<5:15:04,  1.44s/it][A
Training...:   5% 749/13907 [27:54<4:59:55,  1.37s/it][A
Training...:   5% 750/13907 [27:55<4:38:56,  1.27s/it][A
Training...:   5% 751/13907 [27:59<7:18:22,  2.00s/it][A
Training...:   5% 752/13907 [28:02<8:57:00,  2.45s/it][A
Training...:   5% 753/13907 [28:06<9:47:14,  2.68s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:58:41<8:52:18, 31938.93s/it]
Training...:   5% 753/13907 [28:09<9:47:14,  2.68s/it][A
Training...:   5% 754/13907 [28:09<10:45:58,  2.95s/it][A
Training...:   5% 755/13907 [28:12<10:56:27,  2.99s/it][A
Training...:   5% 756/13907 [28:15<10:51:35,  2.97s/it][A
Training...:   5% 757/13907 [28:18<10:42:10,  2.93s/it][A
Training...:   5% 758/13907 [28:21<10:31:54,  2.88s/it][A
Training...:   5% 759/13907 [28:24<10:21:11,  2.83s/it][A
Training...:   5% 760/13907 [28:26<10:12:03,  2.79s/it][A
Training...:   5% 761/13907 [28:29<10:01:07,  2.74s/it][A
Training...:   5% 762/13907 [28:32<9:51:06,  2.70s/it] [A
Training...:   5% 763/13907 [28:34<9:39:41,  2.65s/it][A
Training...:   5% 764/13907 [28:37<9:32:21,  2.61s/it][A
Training...:   6% 765/13907 [28:39<9:24:10,  2.58s/it][A
Training...:   6% 766/13907 [28:42<9:17:22,  2.54s/it][A
Training...:   6% 767/13907 [28:44<9:08:02,  2.50s/it][A
Training...:   6% 768/13907 [28:46<9:01:41,  2.47s/it][A
Training...:   6% 769/13907 [28:49<8:54:28,  2.44s/it][A
Training...:   6% 770/13907 [28:51<8:47:45,  2.41s/it][A
Training...:   6% 771/13907 [28:53<8:40:01,  2.38s/it][A
Training...:   6% 772/13907 [28:56<8:34:40,  2.35s/it][A
Training...:   6% 773/13907 [28:58<8:32:31,  2.34s/it][A
Training...:   6% 774/13907 [29:00<8:22:11,  2.29s/it][A
Training...:   6% 775/13907 [29:02<8:10:53,  2.24s/it][A
Training...:   6% 776/13907 [29:04<8:02:52,  2.21s/it][A
Training...:   6% 777/13907 [29:07<7:54:42,  2.17s/it][A
Training...:   6% 778/13907 [29:09<7:46:22,  2.13s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [26:59:43<8:52:18, 31938.93s/it]
Training...:   6% 778/13907 [29:11<7:46:22,  2.13s/it][A
Training...:   6% 779/13907 [29:11<7:59:17,  2.19s/it][A
Training...:   6% 780/13907 [29:13<7:50:14,  2.15s/it][A
Training...:   6% 781/13907 [29:15<7:37:00,  2.09s/it][A
Training...:   6% 782/13907 [29:17<7:25:54,  2.04s/it][A
Training...:   6% 783/13907 [29:19<7:16:43,  2.00s/it][A
Training...:   6% 784/13907 [29:21<7:08:03,  1.96s/it][A
Training...:   6% 785/13907 [29:22<7:00:36,  1.92s/it][A
Training...:   6% 786/13907 [29:24<6:53:26,  1.89s/it][A
Training...:   6% 787/13907 [29:26<6:46:28,  1.86s/it][A
Training...:   6% 788/13907 [29:28<6:39:26,  1.83s/it][A
Training...:   6% 789/13907 [29:29<6:33:27,  1.80s/it][A
Training...:   6% 790/13907 [29:31<6:25:36,  1.76s/it][A
Training...:   6% 791/13907 [29:33<6:18:53,  1.73s/it][A
Training...:   6% 792/13907 [29:34<6:12:10,  1.70s/it][A
Training...:   6% 793/13907 [29:36<6:05:00,  1.67s/it][A
Training...:   6% 794/13907 [29:38<5:58:15,  1.64s/it][A
Training...:   6% 795/13907 [29:39<5:49:02,  1.60s/it][A
Training...:   6% 796/13907 [29:41<5:39:06,  1.55s/it][A
Training...:   6% 797/13907 [29:42<5:28:51,  1.51s/it][A
Training...:   6% 798/13907 [29:43<5:16:51,  1.45s/it][A
Training...:   6% 799/13907 [29:45<5:03:24,  1.39s/it][A
Training...:   6% 800/13907 [29:46<4:42:22,  1.29s/it][A
Training...:   6% 801/13907 [29:49<7:24:44,  2.04s/it][A
Training...:   6% 802/13907 [29:53<8:59:20,  2.47s/it][A
Training...:   6% 803/13907 [29:56<9:49:47,  2.70s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:00:32<8:52:18, 31938.93s/it]
Training...:   6% 803/13907 [30:00<9:49:47,  2.70s/it][A
Training...:   6% 804/13907 [30:00<10:50:58,  2.98s/it][A
Training...:   6% 805/13907 [30:03<11:04:04,  3.04s/it][A
Training...:   6% 806/13907 [30:06<11:06:36,  3.05s/it][A
Training...:   6% 807/13907 [30:09<10:56:54,  3.01s/it][A
Training...:   6% 808/13907 [30:12<10:45:20,  2.96s/it][A
Training...:   6% 809/13907 [30:15<10:34:11,  2.91s/it][A
Training...:   6% 810/13907 [30:17<10:22:45,  2.85s/it][A
Training...:   6% 811/13907 [30:20<10:08:02,  2.79s/it][A
Training...:   6% 812/13907 [30:23<9:57:14,  2.74s/it] [A
Training...:   6% 813/13907 [30:25<9:46:27,  2.69s/it][A
Training...:   6% 814/13907 [30:28<9:38:06,  2.65s/it][A
Training...:   6% 815/13907 [30:30<9:30:47,  2.62s/it][A
Training...:   6% 816/13907 [30:33<9:23:54,  2.58s/it][A
Training...:   6% 817/13907 [30:35<9:16:24,  2.55s/it][A
Training...:   6% 818/13907 [30:38<9:10:00,  2.52s/it][A
Training...:   6% 819/13907 [30:40<9:04:56,  2.50s/it][A
Training...:   6% 820/13907 [30:42<8:58:01,  2.47s/it][A
Training...:   6% 821/13907 [30:45<8:51:07,  2.44s/it][A
Training...:   6% 822/13907 [30:47<8:44:09,  2.40s/it][A
Training...:   6% 823/13907 [30:49<8:36:04,  2.37s/it][A
Training...:   6% 824/13907 [30:52<8:27:33,  2.33s/it][A
Training...:   6% 825/13907 [30:54<8:19:53,  2.29s/it][A
Training...:   6% 826/13907 [30:56<8:14:03,  2.27s/it][A
Training...:   6% 827/13907 [30:58<8:05:22,  2.23s/it][A
Training...:   6% 828/13907 [31:00<7:58:20,  2.19s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:01:35<8:52:18, 31938.93s/it]
Training...:   6% 828/13907 [31:03<7:58:20,  2.19s/it][A
Training...:   6% 829/13907 [31:03<8:11:20,  2.25s/it][A
Training...:   6% 830/13907 [31:05<7:59:51,  2.20s/it][A
Training...:   6% 831/13907 [31:07<7:45:04,  2.13s/it][A
Training...:   6% 832/13907 [31:09<7:37:42,  2.10s/it][A
Training...:   6% 833/13907 [31:11<7:26:55,  2.05s/it][A
Training...:   6% 834/13907 [31:13<7:18:27,  2.01s/it][A
Training...:   6% 835/13907 [31:15<7:13:01,  1.99s/it][A
Training...:   6% 836/13907 [31:16<7:07:55,  1.96s/it][A
Training...:   6% 837/13907 [31:18<7:00:53,  1.93s/it][A
Training...:   6% 838/13907 [31:20<6:51:28,  1.89s/it][A
Training...:   6% 839/13907 [31:22<6:41:57,  1.85s/it][A
Training...:   6% 840/13907 [31:24<6:33:00,  1.80s/it][A
Training...:   6% 841/13907 [31:25<6:24:45,  1.77s/it][A
Training...:   6% 842/13907 [31:27<6:18:11,  1.74s/it][A
Training...:   6% 843/13907 [31:29<6:09:54,  1.70s/it][A
Training...:   6% 844/13907 [31:30<6:02:16,  1.66s/it][A
Training...:   6% 845/13907 [31:32<5:52:46,  1.62s/it][A
Training...:   6% 846/13907 [31:33<5:41:54,  1.57s/it][A
Training...:   6% 847/13907 [31:35<5:32:11,  1.53s/it][A
Training...:   6% 848/13907 [31:36<5:19:50,  1.47s/it][A
Training...:   6% 849/13907 [31:37<5:06:22,  1.41s/it][A
Training...:   6% 850/13907 [31:38<4:45:55,  1.31s/it][A
Training...:   6% 851/13907 [31:42<7:28:15,  2.06s/it][A
Training...:   6% 852/13907 [31:46<9:01:32,  2.49s/it][A
Training...:   6% 853/13907 [31:49<9:51:18,  2.72s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:02:24<8:52:18, 31938.93s/it]
Training...:   6% 853/13907 [31:52<9:51:18,  2.72s/it][A
Training...:   6% 854/13907 [31:52<10:47:47,  2.98s/it][A
Training...:   6% 855/13907 [31:56<10:59:39,  3.03s/it][A
Training...:   6% 856/13907 [31:58<10:52:19,  3.00s/it][A
Training...:   6% 857/13907 [32:01<10:42:19,  2.95s/it][A
Training...:   6% 858/13907 [32:04<10:30:25,  2.90s/it][A
Training...:   6% 859/13907 [32:07<10:18:38,  2.84s/it][A
Training...:   6% 860/13907 [32:09<10:10:28,  2.81s/it][A
Training...:   6% 861/13907 [32:12<10:02:44,  2.77s/it][A
Training...:   6% 862/13907 [32:15<9:51:22,  2.72s/it] [A
Training...:   6% 863/13907 [32:17<9:40:47,  2.67s/it][A
Training...:   6% 864/13907 [32:20<9:30:09,  2.62s/it][A
Training...:   6% 865/13907 [32:22<9:19:42,  2.57s/it][A
Training...:   6% 866/13907 [32:25<9:13:38,  2.55s/it][A
Training...:   6% 867/13907 [32:27<9:08:19,  2.52s/it][A
Training...:   6% 868/13907 [32:30<9:00:35,  2.49s/it][A
Training...:   6% 869/13907 [32:32<8:48:57,  2.43s/it][A
Training...:   6% 870/13907 [32:34<8:39:10,  2.39s/it][A
Training...:   6% 871/13907 [32:37<8:31:40,  2.36s/it][A
Training...:   6% 872/13907 [32:39<8:24:08,  2.32s/it][A
Training...:   6% 873/13907 [32:41<8:16:53,  2.29s/it][A
Training...:   6% 874/13907 [32:43<8:09:09,  2.25s/it][A
Training...:   6% 875/13907 [32:45<8:02:16,  2.22s/it][A
Training...:   6% 876/13907 [32:47<7:55:55,  2.19s/it][A
Training...:   6% 877/13907 [32:50<7:50:06,  2.16s/it][A
Training...:   6% 878/13907 [32:52<7:42:31,  2.13s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:03:26<8:52:18, 31938.93s/it]
Training...:   6% 878/13907 [32:54<7:42:31,  2.13s/it][A
Training...:   6% 879/13907 [32:54<7:56:15,  2.19s/it][A
Training...:   6% 880/13907 [32:56<7:50:31,  2.17s/it][A
Training...:   6% 881/13907 [32:58<7:39:17,  2.12s/it][A
Training...:   6% 882/13907 [33:00<7:28:13,  2.06s/it][A
Training...:   6% 883/13907 [33:02<7:18:29,  2.02s/it][A
Training...:   6% 884/13907 [33:04<7:09:05,  1.98s/it][A
Training...:   6% 885/13907 [33:06<7:01:19,  1.94s/it][A
Training...:   6% 886/13907 [33:07<6:52:18,  1.90s/it][A
Training...:   6% 887/13907 [33:09<6:44:16,  1.86s/it][A
Training...:   6% 888/13907 [33:11<6:35:57,  1.82s/it][A
Training...:   6% 889/13907 [33:13<6:30:35,  1.80s/it][A
Training...:   6% 890/13907 [33:14<6:23:43,  1.77s/it][A
Training...:   6% 891/13907 [33:16<6:15:47,  1.73s/it][A
Training...:   6% 892/13907 [33:18<6:10:21,  1.71s/it][A
Training...:   6% 893/13907 [33:19<6:03:50,  1.68s/it][A
Training...:   6% 894/13907 [33:21<5:56:23,  1.64s/it][A
Training...:   6% 895/13907 [33:22<5:48:19,  1.61s/it][A
Training...:   6% 896/13907 [33:24<5:38:31,  1.56s/it][A
Training...:   6% 897/13907 [33:25<5:27:38,  1.51s/it][A
Training...:   6% 898/13907 [33:27<5:15:16,  1.45s/it][A
Training...:   6% 899/13907 [33:28<4:59:45,  1.38s/it][A
Training...:   6% 900/13907 [33:29<4:38:07,  1.28s/it][A
Training...:   6% 901/13907 [33:33<7:16:29,  2.01s/it][A
Training...:   6% 902/13907 [33:36<8:54:19,  2.47s/it][A
Training...:   6% 903/13907 [33:39<9:47:45,  2.71s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:04:15<8:52:18, 31938.93s/it]
Training...:   6% 903/13907 [33:43<9:47:45,  2.71s/it][A
Training...:   7% 904/13907 [33:43<10:49:43,  3.00s/it][A
Training...:   7% 905/13907 [33:46<10:56:14,  3.03s/it][A
Training...:   7% 906/13907 [33:49<10:50:11,  3.00s/it][A
Training...:   7% 907/13907 [33:52<10:42:37,  2.97s/it][A
Training...:   7% 908/13907 [33:55<10:39:00,  2.95s/it][A
Training...:   7% 909/13907 [33:58<10:26:49,  2.89s/it][A
Training...:   7% 910/13907 [34:00<10:11:25,  2.82s/it][A
Training...:   7% 911/13907 [34:03<9:58:52,  2.76s/it] [A
Training...:   7% 912/13907 [34:05<9:48:17,  2.72s/it][A
Training...:   7% 913/13907 [34:08<9:37:55,  2.67s/it][A
Training...:   7% 914/13907 [34:11<9:28:17,  2.62s/it][A
Training...:   7% 915/13907 [34:13<9:19:48,  2.59s/it][A
Training...:   7% 916/13907 [34:15<9:10:56,  2.54s/it][A
Training...:   7% 917/13907 [34:18<9:02:57,  2.51s/it][A
Training...:   7% 918/13907 [34:20<8:54:05,  2.47s/it][A
Training...:   7% 919/13907 [34:23<8:45:43,  2.43s/it][A
Training...:   7% 920/13907 [34:25<8:38:22,  2.39s/it][A
Training...:   7% 921/13907 [34:27<8:31:15,  2.36s/it][A
Training...:   7% 922/13907 [34:29<8:23:10,  2.33s/it][A
Training...:   7% 923/13907 [34:32<8:14:22,  2.28s/it][A
Training...:   7% 924/13907 [34:34<8:07:06,  2.25s/it][A
Training...:   7% 925/13907 [34:36<8:01:00,  2.22s/it][A
Training...:   7% 926/13907 [34:38<7:54:53,  2.19s/it][A
Training...:   7% 927/13907 [34:40<7:47:34,  2.16s/it][A
Training...:   7% 928/13907 [34:42<7:41:56,  2.14s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:05:17<8:52:18, 31938.93s/it]
Training...:   7% 928/13907 [34:45<7:41:56,  2.14s/it][A
Training...:   7% 929/13907 [34:45<7:55:53,  2.20s/it][A
Training...:   7% 930/13907 [34:47<7:50:02,  2.17s/it][A
Training...:   7% 931/13907 [34:49<7:37:40,  2.12s/it][A
Training...:   7% 932/13907 [34:51<7:27:15,  2.07s/it][A
Training...:   7% 933/13907 [34:53<7:21:14,  2.04s/it][A
Training...:   7% 934/13907 [34:55<7:16:33,  2.02s/it][A
Training...:   7% 935/13907 [34:57<7:08:40,  1.98s/it][A
Training...:   7% 936/13907 [34:58<6:59:52,  1.94s/it][A
Training...:   7% 937/13907 [35:00<6:51:48,  1.91s/it][A
Training...:   7% 938/13907 [35:02<6:43:21,  1.87s/it][A
Training...:   7% 939/13907 [35:04<6:36:11,  1.83s/it][A
Training...:   7% 940/13907 [35:05<6:28:37,  1.80s/it][A
Training...:   7% 941/13907 [35:07<6:21:22,  1.76s/it][A
Training...:   7% 942/13907 [35:09<6:13:00,  1.73s/it][A
Training...:   7% 943/13907 [35:10<6:05:07,  1.69s/it][A
Training...:   7% 944/13907 [35:12<5:56:48,  1.65s/it][A
Training...:   7% 945/13907 [35:13<5:49:59,  1.62s/it][A
Training...:   7% 946/13907 [35:15<5:40:55,  1.58s/it][A
Training...:   7% 947/13907 [35:16<5:29:29,  1.53s/it][A
Training...:   7% 948/13907 [35:18<5:17:01,  1.47s/it][A
Training...:   7% 949/13907 [35:19<5:02:19,  1.40s/it][A
Training...:   7% 950/13907 [35:20<4:40:24,  1.30s/it][A
Training...:   7% 951/13907 [35:24<7:17:31,  2.03s/it][A
Training...:   7% 952/13907 [35:27<8:51:18,  2.46s/it][A
Training...:   7% 953/13907 [35:30<9:41:33,  2.69s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:06:06<8:52:18, 31938.93s/it]
Training...:   7% 953/13907 [35:34<9:41:33,  2.69s/it][A
Training...:   7% 954/13907 [35:34<10:40:20,  2.97s/it][A
Training...:   7% 955/13907 [35:37<10:50:23,  3.01s/it][A
Training...:   7% 956/13907 [35:40<10:51:15,  3.02s/it][A
Training...:   7% 957/13907 [35:43<10:47:37,  3.00s/it][A
Training...:   7% 958/13907 [35:46<10:36:57,  2.95s/it][A
Training...:   7% 959/13907 [35:49<10:23:11,  2.89s/it][A
Training...:   7% 960/13907 [35:51<10:16:51,  2.86s/it][A
Training...:   7% 961/13907 [35:54<10:08:59,  2.82s/it][A
Training...:   7% 962/13907 [35:57<9:56:35,  2.77s/it] [A
Training...:   7% 963/13907 [35:59<9:45:29,  2.71s/it][A
Training...:   7% 964/13907 [36:02<9:34:23,  2.66s/it][A
Training...:   7% 965/13907 [36:04<9:21:23,  2.60s/it][A
Training...:   7% 966/13907 [36:07<9:10:50,  2.55s/it][A
Training...:   7% 967/13907 [36:09<9:02:08,  2.51s/it][A
Training...:   7% 968/13907 [36:12<8:53:43,  2.47s/it][A
Training...:   7% 969/13907 [36:14<8:45:09,  2.44s/it][A
Training...:   7% 970/13907 [36:16<8:38:30,  2.40s/it][A
Training...:   7% 971/13907 [36:19<8:29:52,  2.36s/it][A
Training...:   7% 972/13907 [36:21<8:22:36,  2.33s/it][A
Training...:   7% 973/13907 [36:23<8:15:49,  2.30s/it][A
Training...:   7% 974/13907 [36:25<8:07:02,  2.26s/it][A
Training...:   7% 975/13907 [36:27<8:02:23,  2.24s/it][A
Training...:   7% 976/13907 [36:30<7:55:10,  2.20s/it][A
Training...:   7% 977/13907 [36:32<7:49:09,  2.18s/it][A
Training...:   7% 978/13907 [36:34<7:42:12,  2.14s/it][A                                                                                                                            
                                                      [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:07:08<8:52:18, 31938.93s/it]
Training...:   7% 978/13907 [36:36<7:42:12,  2.14s/it][A
Training...:   7% 979/13907 [36:36<7:57:07,  2.21s/it][A
Training...:   7% 980/13907 [36:38<7:49:44,  2.18s/it][A
Training...:   7% 981/13907 [36:40<7:37:38,  2.12s/it][A
Training...:   7% 982/13907 [36:42<7:26:39,  2.07s/it][A
Training...:   7% 983/13907 [36:44<7:18:14,  2.03s/it][A
Training...:   7% 984/13907 [36:46<7:09:28,  1.99s/it][A
Training...:   7% 985/13907 [36:48<7:00:34,  1.95s/it][A
Training...:   7% 986/13907 [36:50<6:54:42,  1.93s/it][A
Training...:   7% 987/13907 [36:52<6:48:30,  1.90s/it][A
Training...:   7% 988/13907 [36:53<6:42:15,  1.87s/it][A
Training...:   7% 989/13907 [36:55<6:35:55,  1.84s/it][A
Training...:   7% 990/13907 [36:57<6:28:26,  1.80s/it][A
Training...:   7% 991/13907 [36:59<6:20:52,  1.77s/it][A
Training...:   7% 992/13907 [37:00<6:10:24,  1.72s/it][A
Training...:   7% 993/13907 [37:02<6:01:51,  1.68s/it][A
Training...:   7% 994/13907 [37:03<5:52:39,  1.64s/it][A
Training...:   7% 995/13907 [37:05<5:43:04,  1.59s/it][A
Training...:   7% 996/13907 [37:06<5:31:57,  1.54s/it][A
Training...:   7% 997/13907 [37:08<5:19:07,  1.48s/it][A
Training...:   7% 998/13907 [37:09<5:07:29,  1.43s/it][A
Training...:   7% 999/13907 [37:10<4:52:54,  1.36s/it][A
Training...:   7% 1000/13907 [37:11<4:34:19,  1.28s/it][A
Training...:   7% 1001/13907 [37:15<7:21:11,  2.05s/it][A
Training...:   7% 1002/13907 [37:19<8:54:05,  2.48s/it][A
Training...:   7% 1003/13907 [37:22<9:43:02,  2.71s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:07:57<8:52:18, 31938.93s/it]
Training...:   7% 1003/13907 [37:25<9:43:02,  2.71s/it][A
Training...:   7% 1004/13907 [37:25<10:38:49,  2.97s/it][A
Training...:   7% 1005/13907 [37:28<10:47:16,  3.01s/it][A
Training...:   7% 1006/13907 [37:31<10:43:18,  2.99s/it][A
Training...:   7% 1007/13907 [37:34<10:34:08,  2.95s/it][A
Training...:   7% 1008/13907 [37:37<10:23:04,  2.90s/it][A
Training...:   7% 1009/13907 [37:40<10:11:37,  2.85s/it][A
Training...:   7% 1010/13907 [37:42<10:03:38,  2.81s/it][A
Training...:   7% 1011/13907 [37:45<9:53:55,  2.76s/it] [A
Training...:   7% 1012/13907 [37:48<9:43:50,  2.72s/it][A
Training...:   7% 1013/13907 [37:50<9:34:50,  2.67s/it][A
Training...:   7% 1014/13907 [37:53<9:25:07,  2.63s/it][A
Training...:   7% 1015/13907 [37:55<9:18:02,  2.60s/it][A
Training...:   7% 1016/13907 [37:58<9:10:03,  2.56s/it][A
Training...:   7% 1017/13907 [38:00<9:01:43,  2.52s/it][A
Training...:   7% 1018/13907 [38:03<8:53:48,  2.48s/it][A
Training...:   7% 1019/13907 [38:05<8:45:05,  2.44s/it][A
Training...:   7% 1020/13907 [38:07<8:38:59,  2.42s/it][A
Training...:   7% 1021/13907 [38:10<8:33:36,  2.39s/it][A
Training...:   7% 1022/13907 [38:12<8:28:26,  2.37s/it][A
Training...:   7% 1023/13907 [38:14<8:23:15,  2.34s/it][A
Training...:   7% 1024/13907 [38:17<8:19:51,  2.33s/it][A
Training...:   7% 1025/13907 [38:19<8:14:48,  2.30s/it][A
Training...:   7% 1026/13907 [38:21<8:05:09,  2.26s/it][A
Training...:   7% 1027/13907 [38:23<7:55:51,  2.22s/it][A
Training...:   7% 1028/13907 [38:25<7:47:29,  2.18s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:09:00<8:52:18, 31938.93s/it]
Training...:   7% 1028/13907 [38:28<7:47:29,  2.18s/it][A
Training...:   7% 1029/13907 [38:28<7:59:34,  2.23s/it][A
Training...:   7% 1030/13907 [38:30<7:50:13,  2.19s/it][A
Training...:   7% 1031/13907 [38:32<7:38:46,  2.14s/it][A
Training...:   7% 1032/13907 [38:34<7:28:25,  2.09s/it][A
Training...:   7% 1033/13907 [38:36<7:21:00,  2.06s/it][A
Training...:   7% 1034/13907 [38:38<7:11:51,  2.01s/it][A
Training...:   7% 1035/13907 [38:39<7:04:47,  1.98s/it][A
Training...:   7% 1036/13907 [38:41<6:56:22,  1.94s/it][A
Training...:   7% 1037/13907 [38:43<6:48:47,  1.91s/it][A
Training...:   7% 1038/13907 [38:45<6:40:03,  1.87s/it][A
Training...:   7% 1039/13907 [38:47<6:31:52,  1.83s/it][A
Training...:   7% 1040/13907 [38:48<6:24:37,  1.79s/it][A
Training...:   7% 1041/13907 [38:50<6:16:47,  1.76s/it][A
Training...:   7% 1042/13907 [38:52<6:07:58,  1.72s/it][A
Training...:   7% 1043/13907 [38:53<6:00:07,  1.68s/it][A
Training...:   8% 1044/13907 [38:55<5:52:35,  1.64s/it][A
Training...:   8% 1045/13907 [38:56<5:43:39,  1.60s/it][A
Training...:   8% 1046/13907 [38:58<5:33:26,  1.56s/it][A
Training...:   8% 1047/13907 [38:59<5:22:56,  1.51s/it][A
Training...:   8% 1048/13907 [39:00<5:11:18,  1.45s/it][A
Training...:   8% 1049/13907 [39:02<4:56:49,  1.39s/it][A
Training...:   8% 1050/13907 [39:03<4:35:03,  1.28s/it][A
Training...:   8% 1051/13907 [39:06<7:12:33,  2.02s/it][A
Training...:   8% 1052/13907 [39:10<8:50:34,  2.48s/it][A
Training...:   8% 1053/13907 [39:13<9:43:18,  2.72s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:09:49<8:52:18, 31938.93s/it]
Training...:   8% 1053/13907 [39:17<9:43:18,  2.72s/it][A
Training...:   8% 1054/13907 [39:17<10:44:06,  3.01s/it][A
Training...:   8% 1055/13907 [39:20<10:55:13,  3.06s/it][A
Training...:   8% 1056/13907 [39:23<10:48:49,  3.03s/it][A
Training...:   8% 1057/13907 [39:26<10:38:16,  2.98s/it][A
Training...:   8% 1058/13907 [39:29<10:29:19,  2.94s/it][A
Training...:   8% 1059/13907 [39:32<10:19:53,  2.89s/it][A
Training...:   8% 1060/13907 [39:34<10:11:21,  2.86s/it][A
Training...:   8% 1061/13907 [39:37<10:05:22,  2.83s/it][A
Training...:   8% 1062/13907 [39:40<9:53:50,  2.77s/it] [A
Training...:   8% 1063/13907 [39:42<9:41:44,  2.72s/it][A
Training...:   8% 1064/13907 [39:45<9:29:39,  2.66s/it][A
Training...:   8% 1065/13907 [39:47<9:18:07,  2.61s/it][A
Training...:   8% 1066/13907 [39:50<9:10:18,  2.57s/it][A
Training...:   8% 1067/13907 [39:52<9:02:02,  2.53s/it][A
Training...:   8% 1068/13907 [39:55<8:52:48,  2.49s/it][A
Training...:   8% 1069/13907 [39:57<8:43:43,  2.45s/it][A
Training...:   8% 1070/13907 [39:59<8:35:01,  2.41s/it][A
Training...:   8% 1071/13907 [40:02<8:27:06,  2.37s/it][A
Training...:   8% 1072/13907 [40:04<8:20:24,  2.34s/it][A
Training...:   8% 1073/13907 [40:06<8:12:50,  2.30s/it][A
Training...:   8% 1074/13907 [40:08<8:04:56,  2.27s/it][A
Training...:   8% 1075/13907 [40:10<7:58:18,  2.24s/it][A
Training...:   8% 1076/13907 [40:13<7:51:22,  2.20s/it][A
Training...:   8% 1077/13907 [40:15<7:45:34,  2.18s/it][A
Training...:   8% 1078/13907 [40:17<7:37:24,  2.14s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:10:51<8:52:18, 31938.93s/it]
Training...:   8% 1078/13907 [40:19<7:37:24,  2.14s/it][A
Training...:   8% 1079/13907 [40:19<7:53:10,  2.21s/it][A
Training...:   8% 1080/13907 [40:21<7:45:17,  2.18s/it][A
Training...:   8% 1081/13907 [40:23<7:33:32,  2.12s/it][A
Training...:   8% 1082/13907 [40:25<7:22:31,  2.07s/it][A
Training...:   8% 1083/13907 [40:27<7:13:15,  2.03s/it][A
Training...:   8% 1084/13907 [40:29<7:04:57,  1.99s/it][A
Training...:   8% 1085/13907 [40:31<6:59:19,  1.96s/it][A
Training...:   8% 1086/13907 [40:33<6:51:40,  1.93s/it][A
Training...:   8% 1087/13907 [40:35<6:44:33,  1.89s/it][A
Training...:   8% 1088/13907 [40:36<6:39:39,  1.87s/it][A
Training...:   8% 1089/13907 [40:38<6:31:40,  1.83s/it][A
Training...:   8% 1090/13907 [40:40<6:23:08,  1.79s/it][A
Training...:   8% 1091/13907 [40:42<6:17:09,  1.77s/it][A
Training...:   8% 1092/13907 [40:43<6:08:53,  1.73s/it][A
Training...:   8% 1093/13907 [40:45<6:01:49,  1.69s/it][A
Training...:   8% 1094/13907 [40:46<5:53:41,  1.66s/it][A
Training...:   8% 1095/13907 [40:48<5:44:15,  1.61s/it][A
Training...:   8% 1096/13907 [40:49<5:36:00,  1.57s/it][A
Training...:   8% 1097/13907 [40:51<5:26:19,  1.53s/it][A
Training...:   8% 1098/13907 [40:52<5:12:19,  1.46s/it][A
Training...:   8% 1099/13907 [40:53<4:59:11,  1.40s/it][A
Training...:   8% 1100/13907 [40:54<4:35:48,  1.29s/it][A
Training...:   8% 1101/13907 [40:58<7:15:33,  2.04s/it][A
Training...:   8% 1102/13907 [41:02<8:50:08,  2.48s/it][A
Training...:   8% 1103/13907 [41:05<9:42:25,  2.73s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:11:41<8:52:18, 31938.93s/it]
Training...:   8% 1103/13907 [41:09<9:42:25,  2.73s/it][A
Training...:   8% 1104/13907 [41:09<10:41:58,  3.01s/it][A
Training...:   8% 1105/13907 [41:12<10:51:11,  3.05s/it][A
Training...:   8% 1106/13907 [41:15<10:46:28,  3.03s/it][A
Training...:   8% 1107/13907 [41:18<10:37:16,  2.99s/it][A
Training...:   8% 1108/13907 [41:21<10:27:21,  2.94s/it][A
Training...:   8% 1109/13907 [41:23<10:16:24,  2.89s/it][A
Training...:   8% 1110/13907 [41:26<10:05:56,  2.84s/it][A
Training...:   8% 1111/13907 [41:29<9:55:08,  2.79s/it] [A
Training...:   8% 1112/13907 [41:31<9:48:22,  2.76s/it][A
Training...:   8% 1113/13907 [41:34<9:38:54,  2.71s/it][A
Training...:   8% 1114/13907 [41:37<9:27:53,  2.66s/it][A
Training...:   8% 1115/13907 [41:39<9:19:55,  2.63s/it][A
Training...:   8% 1116/13907 [41:42<9:09:40,  2.58s/it][A
Training...:   8% 1117/13907 [41:44<9:00:35,  2.54s/it][A
Training...:   8% 1118/13907 [41:46<8:51:17,  2.49s/it][A
Training...:   8% 1119/13907 [41:49<8:45:28,  2.47s/it][A
Training...:   8% 1120/13907 [41:51<8:37:45,  2.43s/it][A
Training...:   8% 1121/13907 [41:53<8:29:29,  2.39s/it][A
Training...:   8% 1122/13907 [41:56<8:23:12,  2.36s/it][A
Training...:   8% 1123/13907 [41:58<8:16:45,  2.33s/it][A
Training...:   8% 1124/13907 [42:00<8:12:47,  2.31s/it][A
Training...:   8% 1125/13907 [42:02<8:01:56,  2.26s/it][A
Training...:   8% 1126/13907 [42:05<7:53:15,  2.22s/it][A
Training...:   8% 1127/13907 [42:07<7:44:22,  2.18s/it][A
Training...:   8% 1128/13907 [42:09<7:37:02,  2.15s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:12:43<8:52:18, 31938.93s/it]
Training...:   8% 1128/13907 [42:11<7:37:02,  2.15s/it][A
Training...:   8% 1129/13907 [42:11<7:52:18,  2.22s/it][A
Training...:   8% 1130/13907 [42:13<7:45:25,  2.19s/it][A
Training...:   8% 1131/13907 [42:15<7:35:48,  2.14s/it][A
Training...:   8% 1132/13907 [42:17<7:25:32,  2.09s/it][A
Training...:   8% 1133/13907 [42:19<7:16:39,  2.05s/it][A
Training...:   8% 1134/13907 [42:21<7:06:41,  2.00s/it][A
Training...:   8% 1135/13907 [42:23<6:58:07,  1.96s/it][A
Training...:   8% 1136/13907 [42:25<6:50:36,  1.93s/it][A
Training...:   8% 1137/13907 [42:27<6:43:31,  1.90s/it][A
Training...:   8% 1138/13907 [42:28<6:35:20,  1.86s/it][A
Training...:   8% 1139/13907 [42:30<6:28:19,  1.82s/it][A
Training...:   8% 1140/13907 [42:32<6:21:15,  1.79s/it][A
Training...:   8% 1141/13907 [42:33<6:13:34,  1.76s/it][A
Training...:   8% 1142/13907 [42:35<6:05:36,  1.72s/it][A
Training...:   8% 1143/13907 [42:37<5:57:39,  1.68s/it][A
Training...:   8% 1144/13907 [42:38<5:49:31,  1.64s/it][A
Training...:   8% 1145/13907 [42:40<5:41:09,  1.60s/it][A
Training...:   8% 1146/13907 [42:41<5:32:41,  1.56s/it][A
Training...:   8% 1147/13907 [42:43<5:21:48,  1.51s/it][A
Training...:   8% 1148/13907 [42:44<5:09:43,  1.46s/it][A
Training...:   8% 1149/13907 [42:45<4:56:32,  1.39s/it][A
Training...:   8% 1150/13907 [42:46<4:36:58,  1.30s/it][A
Training...:   8% 1151/13907 [42:50<7:09:20,  2.02s/it][A
Training...:   8% 1152/13907 [42:53<8:44:40,  2.47s/it][A
Training...:   8% 1153/13907 [42:57<9:36:10,  2.71s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:13:32<8:52:18, 31938.93s/it]
Training...:   8% 1153/13907 [43:00<9:36:10,  2.71s/it][A
Training...:   8% 1154/13907 [43:00<10:31:43,  2.97s/it][A
Training...:   8% 1155/13907 [43:03<10:42:15,  3.02s/it][A
Training...:   8% 1156/13907 [43:06<10:36:33,  3.00s/it][A
Training...:   8% 1157/13907 [43:09<10:28:46,  2.96s/it][A
Training...:   8% 1158/13907 [43:12<10:20:49,  2.92s/it][A
Training...:   8% 1159/13907 [43:15<10:17:24,  2.91s/it][A
Training...:   8% 1160/13907 [43:18<10:04:09,  2.84s/it][A
Training...:   8% 1161/13907 [43:20<9:50:10,  2.78s/it] [A
Training...:   8% 1162/13907 [43:23<9:36:46,  2.72s/it][A
Training...:   8% 1163/13907 [43:25<9:27:40,  2.67s/it][A
Training...:   8% 1164/13907 [43:28<9:17:06,  2.62s/it][A
Training...:   8% 1165/13907 [43:30<9:08:54,  2.58s/it][A
Training...:   8% 1166/13907 [43:33<9:00:36,  2.55s/it][A
Training...:   8% 1167/13907 [43:35<8:53:12,  2.51s/it][A
Training...:   8% 1168/13907 [43:38<8:46:31,  2.48s/it][A
Training...:   8% 1169/13907 [43:40<8:37:39,  2.44s/it][A
Training...:   8% 1170/13907 [43:42<8:29:38,  2.40s/it][A
Training...:   8% 1171/13907 [43:45<8:22:15,  2.37s/it][A
Training...:   8% 1172/13907 [43:47<8:13:39,  2.33s/it][A
Training...:   8% 1173/13907 [43:49<8:06:37,  2.29s/it][A
Training...:   8% 1174/13907 [43:51<7:58:27,  2.25s/it][A
Training...:   8% 1175/13907 [43:53<7:51:49,  2.22s/it][A
Training...:   8% 1176/13907 [43:56<7:47:07,  2.20s/it][A
Training...:   8% 1177/13907 [43:58<7:40:21,  2.17s/it][A
Training...:   8% 1178/13907 [44:00<7:33:35,  2.14s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:14:34<8:52:18, 31938.93s/it]
Training...:   8% 1178/13907 [44:02<7:33:35,  2.14s/it][A
Training...:   8% 1179/13907 [44:02<7:47:25,  2.20s/it][A
Training...:   8% 1180/13907 [44:04<7:40:12,  2.17s/it][A
Training...:   8% 1181/13907 [44:06<7:32:18,  2.13s/it][A
Training...:   8% 1182/13907 [44:08<7:21:11,  2.08s/it][A
Training...:   9% 1183/13907 [44:10<7:11:31,  2.03s/it][A
Training...:   9% 1184/13907 [44:12<7:03:29,  2.00s/it][A
Training...:   9% 1185/13907 [44:14<6:56:31,  1.96s/it][A
Training...:   9% 1186/13907 [44:16<6:48:25,  1.93s/it][A
Training...:   9% 1187/13907 [44:18<6:40:37,  1.89s/it][A
Training...:   9% 1188/13907 [44:19<6:34:47,  1.86s/it][A
Training...:   9% 1189/13907 [44:21<6:26:48,  1.82s/it][A
Training...:   9% 1190/13907 [44:23<6:19:51,  1.79s/it][A
Training...:   9% 1191/13907 [44:25<6:11:59,  1.76s/it][A
Training...:   9% 1192/13907 [44:26<6:05:04,  1.72s/it][A
Training...:   9% 1193/13907 [44:28<5:56:55,  1.68s/it][A
Training...:   9% 1194/13907 [44:29<5:49:01,  1.65s/it][A
Training...:   9% 1195/13907 [44:31<5:40:28,  1.61s/it][A
Training...:   9% 1196/13907 [44:32<5:29:28,  1.56s/it][A
Training...:   9% 1197/13907 [44:34<5:19:11,  1.51s/it][A
Training...:   9% 1198/13907 [44:35<5:05:52,  1.44s/it][A
Training...:   9% 1199/13907 [44:36<4:51:14,  1.38s/it][A
Training...:   9% 1200/13907 [44:37<4:31:31,  1.28s/it][A
Training...:   9% 1201/13907 [44:41<7:08:53,  2.03s/it][A
Training...:   9% 1202/13907 [44:44<8:41:33,  2.46s/it][A
Training...:   9% 1203/13907 [44:48<9:27:06,  2.68s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:15:23<8:52:18, 31938.93s/it]
Training...:   9% 1203/13907 [44:51<9:27:06,  2.68s/it][A
Training...:   9% 1204/13907 [44:51<10:24:10,  2.95s/it][A
Training...:   9% 1205/13907 [44:54<10:36:46,  3.01s/it][A
Training...:   9% 1206/13907 [44:57<10:32:10,  2.99s/it][A
Training...:   9% 1207/13907 [45:00<10:24:10,  2.95s/it][A
Training...:   9% 1208/13907 [45:03<10:12:22,  2.89s/it][A
Training...:   9% 1209/13907 [45:06<10:00:57,  2.84s/it][A
Training...:   9% 1210/13907 [45:08<9:50:15,  2.79s/it] [A
Training...:   9% 1211/13907 [45:11<9:39:59,  2.74s/it][A
Training...:   9% 1212/13907 [45:14<9:30:34,  2.70s/it][A
Training...:   9% 1213/13907 [45:16<9:21:00,  2.65s/it][A
Training...:   9% 1214/13907 [45:19<9:11:32,  2.61s/it][A
Training...:   9% 1215/13907 [45:21<9:02:51,  2.57s/it][A
Training...:   9% 1216/13907 [45:24<8:54:43,  2.53s/it][A
Training...:   9% 1217/13907 [45:26<8:47:13,  2.49s/it][A
Training...:   9% 1218/13907 [45:28<8:39:14,  2.46s/it][A
Training...:   9% 1219/13907 [45:31<8:32:21,  2.42s/it][A
Training...:   9% 1220/13907 [45:33<8:24:39,  2.39s/it][A
Training...:   9% 1221/13907 [45:35<8:20:55,  2.37s/it][A
Training...:   9% 1222/13907 [45:38<8:12:36,  2.33s/it][A
Training...:   9% 1223/13907 [45:40<8:05:51,  2.30s/it][A
Training...:   9% 1224/13907 [45:42<7:59:08,  2.27s/it][A
Training...:   9% 1225/13907 [45:44<7:51:35,  2.23s/it][A
Training...:   9% 1226/13907 [45:46<7:44:19,  2.20s/it][A
Training...:   9% 1227/13907 [45:48<7:37:18,  2.16s/it][A
Training...:   9% 1228/13907 [45:50<7:32:26,  2.14s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:16:25<8:52:18, 31938.93s/it]
Training...:   9% 1228/13907 [45:53<7:32:26,  2.14s/it][A
Training...:   9% 1229/13907 [45:53<7:47:35,  2.21s/it][A
Training...:   9% 1230/13907 [45:55<7:41:01,  2.18s/it][A
Training...:   9% 1231/13907 [45:57<7:29:31,  2.13s/it][A
Training...:   9% 1232/13907 [45:59<7:17:44,  2.07s/it][A
Training...:   9% 1233/13907 [46:01<7:10:47,  2.04s/it][A
Training...:   9% 1234/13907 [46:03<7:00:09,  1.99s/it][A
Training...:   9% 1235/13907 [46:04<6:51:36,  1.95s/it][A
Training...:   9% 1236/13907 [46:06<6:44:20,  1.91s/it][A
Training...:   9% 1237/13907 [46:08<6:37:08,  1.88s/it][A
Training...:   9% 1238/13907 [46:10<6:29:14,  1.84s/it][A
Training...:   9% 1239/13907 [46:12<6:22:18,  1.81s/it][A
Training...:   9% 1240/13907 [46:13<6:13:46,  1.77s/it][A
Training...:   9% 1241/13907 [46:15<6:06:29,  1.74s/it][A
Training...:   9% 1242/13907 [46:17<5:58:11,  1.70s/it][A
Training...:   9% 1243/13907 [46:18<5:50:28,  1.66s/it][A
Training...:   9% 1244/13907 [46:20<5:43:24,  1.63s/it][A
Training...:   9% 1245/13907 [46:21<5:34:12,  1.58s/it][A
Training...:   9% 1246/13907 [46:23<5:23:47,  1.53s/it][A
Training...:   9% 1247/13907 [46:24<5:12:03,  1.48s/it][A
Training...:   9% 1248/13907 [46:25<5:01:28,  1.43s/it][A
Training...:   9% 1249/13907 [46:26<4:47:20,  1.36s/it][A
Training...:   9% 1250/13907 [46:27<4:26:29,  1.26s/it][A
Training...:   9% 1251/13907 [46:31<7:02:20,  2.00s/it][A
Training...:   9% 1252/13907 [46:35<8:31:14,  2.42s/it][A
Training...:   9% 1253/13907 [46:38<9:17:51,  2.65s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:17:13<8:52:18, 31938.93s/it]
Training...:   9% 1253/13907 [46:41<9:17:51,  2.65s/it][A
Training...:   9% 1254/13907 [46:41<10:16:37,  2.92s/it][A
Training...:   9% 1255/13907 [46:44<10:29:15,  2.98s/it][A
Training...:   9% 1256/13907 [46:47<10:27:17,  2.98s/it][A
Training...:   9% 1257/13907 [46:50<10:17:08,  2.93s/it][A
Training...:   9% 1258/13907 [46:53<10:08:32,  2.89s/it][A
Training...:   9% 1259/13907 [46:56<9:59:34,  2.84s/it] [A
Training...:   9% 1260/13907 [46:58<9:51:13,  2.80s/it][A
Training...:   9% 1261/13907 [47:01<9:40:21,  2.75s/it][A
Training...:   9% 1262/13907 [47:04<9:32:50,  2.72s/it][A
Training...:   9% 1263/13907 [47:06<9:22:40,  2.67s/it][A
Training...:   9% 1264/13907 [47:09<9:14:54,  2.63s/it][A
Training...:   9% 1265/13907 [47:11<9:11:16,  2.62s/it][A
Training...:   9% 1266/13907 [47:14<9:01:34,  2.57s/it][A
Training...:   9% 1267/13907 [47:16<8:51:03,  2.52s/it][A
Training...:   9% 1268/13907 [47:19<8:41:29,  2.48s/it][A
Training...:   9% 1269/13907 [47:21<8:31:10,  2.43s/it][A
Training...:   9% 1270/13907 [47:23<8:23:20,  2.39s/it][A
Training...:   9% 1271/13907 [47:26<8:15:05,  2.35s/it][A
Training...:   9% 1272/13907 [47:28<8:09:31,  2.32s/it][A
Training...:   9% 1273/13907 [47:30<8:03:26,  2.30s/it][A
Training...:   9% 1274/13907 [47:32<7:56:29,  2.26s/it][A
Training...:   9% 1275/13907 [47:34<7:50:17,  2.23s/it][A
Training...:   9% 1276/13907 [47:37<7:44:39,  2.21s/it][A
Training...:   9% 1277/13907 [47:39<7:37:40,  2.17s/it][A
Training...:   9% 1278/13907 [47:41<7:31:04,  2.14s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:18:15<8:52:18, 31938.93s/it]
Training...:   9% 1278/13907 [47:43<7:31:04,  2.14s/it][A
Training...:   9% 1279/13907 [47:43<7:45:22,  2.21s/it][A
Training...:   9% 1280/13907 [47:45<7:37:37,  2.17s/it][A
Training...:   9% 1281/13907 [47:47<7:27:51,  2.13s/it][A
Training...:   9% 1282/13907 [47:49<7:16:06,  2.07s/it][A
Training...:   9% 1283/13907 [47:51<7:05:39,  2.02s/it][A
Training...:   9% 1284/13907 [47:53<6:57:46,  1.99s/it][A
Training...:   9% 1285/13907 [47:55<6:50:59,  1.95s/it][A
Training...:   9% 1286/13907 [47:57<6:44:20,  1.92s/it][A
Training...:   9% 1287/13907 [47:59<6:38:20,  1.89s/it][A
Training...:   9% 1288/13907 [48:00<6:31:23,  1.86s/it][A
Training...:   9% 1289/13907 [48:02<6:24:13,  1.83s/it][A
Training...:   9% 1290/13907 [48:04<6:17:13,  1.79s/it][A
Training...:   9% 1291/13907 [48:05<6:10:49,  1.76s/it][A
Training...:   9% 1292/13907 [48:07<6:02:09,  1.72s/it][A
Training...:   9% 1293/13907 [48:09<5:55:13,  1.69s/it][A
Training...:   9% 1294/13907 [48:10<5:47:27,  1.65s/it][A
Training...:   9% 1295/13907 [48:12<5:40:01,  1.62s/it][A
Training...:   9% 1296/13907 [48:13<5:30:01,  1.57s/it][A
Training...:   9% 1297/13907 [48:15<5:19:59,  1.52s/it][A
Training...:   9% 1298/13907 [48:16<5:07:43,  1.46s/it][A
Training...:   9% 1299/13907 [48:17<4:54:26,  1.40s/it][A
Training...:   9% 1300/13907 [48:18<4:32:55,  1.30s/it][A
Training...:   9% 1301/13907 [48:22<7:07:25,  2.03s/it][A
Training...:   9% 1302/13907 [48:26<8:40:58,  2.48s/it][A
Training...:   9% 1303/13907 [48:29<9:31:33,  2.72s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:19:05<8:52:18, 31938.93s/it]
Training...:   9% 1303/13907 [48:33<9:31:33,  2.72s/it][A
Training...:   9% 1304/13907 [48:33<10:32:09,  3.01s/it][A
Training...:   9% 1305/13907 [48:36<10:43:50,  3.07s/it][A
Training...:   9% 1306/13907 [48:39<10:39:13,  3.04s/it][A
Training...:   9% 1307/13907 [48:42<10:29:44,  3.00s/it][A
Training...:   9% 1308/13907 [48:45<10:23:21,  2.97s/it][A
Training...:   9% 1309/13907 [48:47<10:18:38,  2.95s/it][A
Training...:   9% 1310/13907 [48:50<10:08:11,  2.90s/it][A
Training...:   9% 1311/13907 [48:53<9:55:09,  2.84s/it] [A
Training...:   9% 1312/13907 [48:56<9:45:41,  2.79s/it][A
Training...:   9% 1313/13907 [48:58<9:32:25,  2.73s/it][A
Training...:   9% 1314/13907 [49:01<9:22:06,  2.68s/it][A
Training...:   9% 1315/13907 [49:03<9:12:11,  2.63s/it][A
Training...:   9% 1316/13907 [49:06<9:00:36,  2.58s/it][A
Training...:   9% 1317/13907 [49:08<8:50:19,  2.53s/it][A
Training...:   9% 1318/13907 [49:10<8:40:01,  2.48s/it][A
Training...:   9% 1319/13907 [49:13<8:32:19,  2.44s/it][A
Training...:   9% 1320/13907 [49:15<8:24:27,  2.40s/it][A
Training...:   9% 1321/13907 [49:17<8:17:55,  2.37s/it][A
Training...:  10% 1322/13907 [49:20<8:10:42,  2.34s/it][A
Training...:  10% 1323/13907 [49:22<8:03:56,  2.31s/it][A
Training...:  10% 1324/13907 [49:24<7:56:42,  2.27s/it][A
Training...:  10% 1325/13907 [49:26<7:49:27,  2.24s/it][A
Training...:  10% 1326/13907 [49:28<7:43:00,  2.21s/it][A
Training...:  10% 1327/13907 [49:31<7:36:59,  2.18s/it][A
Training...:  10% 1328/13907 [49:33<7:31:37,  2.15s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:20:07<8:52:18, 31938.93s/it]
Training...:  10% 1328/13907 [49:35<7:31:37,  2.15s/it][A
Training...:  10% 1329/13907 [49:35<7:44:08,  2.21s/it][A
Training...:  10% 1330/13907 [49:37<7:36:50,  2.18s/it][A
Training...:  10% 1331/13907 [49:39<7:26:15,  2.13s/it][A
Training...:  10% 1332/13907 [49:41<7:16:41,  2.08s/it][A
Training...:  10% 1333/13907 [49:43<7:08:16,  2.04s/it][A
Training...:  10% 1334/13907 [49:45<6:59:33,  2.00s/it][A
Training...:  10% 1335/13907 [49:47<6:51:46,  1.97s/it][A
Training...:  10% 1336/13907 [49:49<6:45:25,  1.94s/it][A
Training...:  10% 1337/13907 [49:50<6:38:34,  1.90s/it][A
Training...:  10% 1338/13907 [49:52<6:31:30,  1.87s/it][A
Training...:  10% 1339/13907 [49:54<6:23:26,  1.83s/it][A
Training...:  10% 1340/13907 [49:56<6:15:45,  1.79s/it][A
Training...:  10% 1341/13907 [49:57<6:07:54,  1.76s/it][A
Training...:  10% 1342/13907 [49:59<6:00:08,  1.72s/it][A
Training...:  10% 1343/13907 [50:01<5:55:29,  1.70s/it][A
Training...:  10% 1344/13907 [50:02<5:49:36,  1.67s/it][A
Training...:  10% 1345/13907 [50:04<5:41:15,  1.63s/it][A
Training...:  10% 1346/13907 [50:05<5:30:25,  1.58s/it][A
Training...:  10% 1347/13907 [50:07<5:18:28,  1.52s/it][A
Training...:  10% 1348/13907 [50:08<5:06:50,  1.47s/it][A
Training...:  10% 1349/13907 [50:09<4:53:40,  1.40s/it][A
Training...:  10% 1350/13907 [50:10<4:33:23,  1.31s/it][A
Training...:  10% 1351/13907 [50:14<7:10:03,  2.06s/it][A
Training...:  10% 1352/13907 [50:18<8:41:14,  2.49s/it][A
Training...:  10% 1353/13907 [50:21<9:28:11,  2.72s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:20:57<8:52:18, 31938.93s/it]
Training...:  10% 1353/13907 [50:24<9:28:11,  2.72s/it][A
Training...:  10% 1354/13907 [50:24<10:22:49,  2.98s/it][A
Training...:  10% 1355/13907 [50:28<10:28:45,  3.01s/it][A
Training...:  10% 1356/13907 [50:30<10:24:21,  2.98s/it][A
Training...:  10% 1357/13907 [50:33<10:18:21,  2.96s/it][A
Training...:  10% 1358/13907 [50:36<10:11:56,  2.93s/it][A
Training...:  10% 1359/13907 [50:39<10:01:08,  2.87s/it][A
Training...:  10% 1360/13907 [50:42<9:48:49,  2.82s/it] [A
Training...:  10% 1361/13907 [50:44<9:37:12,  2.76s/it][A
Training...:  10% 1362/13907 [50:47<9:27:46,  2.72s/it][A
Training...:  10% 1363/13907 [50:49<9:18:11,  2.67s/it][A
Training...:  10% 1364/13907 [50:52<9:08:52,  2.63s/it][A
Training...:  10% 1365/13907 [50:55<9:01:20,  2.59s/it][A
Training...:  10% 1366/13907 [50:57<8:53:14,  2.55s/it][A
Training...:  10% 1367/13907 [50:59<8:46:38,  2.52s/it][A
Training...:  10% 1368/13907 [51:02<8:38:53,  2.48s/it][A
Training...:  10% 1369/13907 [51:04<8:30:38,  2.44s/it][A
Training...:  10% 1370/13907 [51:06<8:22:44,  2.41s/it][A
Training...:  10% 1371/13907 [51:09<8:17:06,  2.38s/it][A
Training...:  10% 1372/13907 [51:11<8:11:37,  2.35s/it][A
Training...:  10% 1373/13907 [51:13<8:09:20,  2.34s/it][A
Training...:  10% 1374/13907 [51:16<8:01:03,  2.30s/it][A
Training...:  10% 1375/13907 [51:18<7:52:18,  2.26s/it][A
Training...:  10% 1376/13907 [51:20<7:45:21,  2.23s/it][A
Training...:  10% 1377/13907 [51:22<7:37:27,  2.19s/it][A
Training...:  10% 1378/13907 [51:24<7:29:18,  2.15s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:21:59<8:52:18, 31938.93s/it]
Training...:  10% 1378/13907 [51:26<7:29:18,  2.15s/it][A
Training...:  10% 1379/13907 [51:26<7:43:06,  2.22s/it][A
Training...:  10% 1380/13907 [51:29<7:35:44,  2.18s/it][A
Training...:  10% 1381/13907 [51:31<7:22:40,  2.12s/it][A
Training...:  10% 1382/13907 [51:33<7:12:57,  2.07s/it][A
Training...:  10% 1383/13907 [51:34<7:04:34,  2.03s/it][A
Training...:  10% 1384/13907 [51:36<6:56:58,  2.00s/it][A
Training...:  10% 1385/13907 [51:38<6:49:19,  1.96s/it][A
Training...:  10% 1386/13907 [51:40<6:42:37,  1.93s/it][A
Training...:  10% 1387/13907 [51:42<6:34:54,  1.89s/it][A
Training...:  10% 1388/13907 [51:44<6:27:16,  1.86s/it][A
Training...:  10% 1389/13907 [51:45<6:19:45,  1.82s/it][A
Training...:  10% 1390/13907 [51:47<6:11:15,  1.78s/it][A
Training...:  10% 1391/13907 [51:49<6:03:22,  1.74s/it][A
Training...:  10% 1392/13907 [51:50<5:55:06,  1.70s/it][A
Training...:  10% 1393/13907 [51:52<5:47:50,  1.67s/it][A
Training...:  10% 1394/13907 [51:53<5:40:06,  1.63s/it][A
Training...:  10% 1395/13907 [51:55<5:30:59,  1.59s/it][A
Training...:  10% 1396/13907 [51:56<5:20:46,  1.54s/it][A
Training...:  10% 1397/13907 [51:58<5:11:15,  1.49s/it][A
Training...:  10% 1398/13907 [51:59<4:58:54,  1.43s/it][A
Training...:  10% 1399/13907 [52:00<4:44:20,  1.36s/it][A
Training...:  10% 1400/13907 [52:01<4:25:57,  1.28s/it][A
Training...:  10% 1401/13907 [52:05<6:54:02,  1.99s/it][A
Training...:  10% 1402/13907 [52:08<8:24:21,  2.42s/it][A
Training...:  10% 1403/13907 [52:12<9:14:51,  2.66s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:22:47<8:52:18, 31938.93s/it]
Training...:  10% 1403/13907 [52:15<9:14:51,  2.66s/it][A
Training...:  10% 1404/13907 [52:15<10:13:20,  2.94s/it][A
Training...:  10% 1405/13907 [52:18<10:25:25,  3.00s/it][A
Training...:  10% 1406/13907 [52:21<10:24:15,  3.00s/it][A
Training...:  10% 1407/13907 [52:24<10:16:29,  2.96s/it][A
Training...:  10% 1408/13907 [52:27<10:08:04,  2.92s/it][A
Training...:  10% 1409/13907 [52:30<9:56:47,  2.87s/it] [A
Training...:  10% 1410/13907 [52:33<9:46:08,  2.81s/it][A
Training...:  10% 1411/13907 [52:35<9:37:55,  2.77s/it][A
Training...:  10% 1412/13907 [52:38<9:33:23,  2.75s/it][A
Training...:  10% 1413/13907 [52:41<9:27:13,  2.72s/it][A
Training...:  10% 1414/13907 [52:43<9:16:33,  2.67s/it][A
Training...:  10% 1415/13907 [52:46<9:06:10,  2.62s/it][A
Training...:  10% 1416/13907 [52:48<8:56:41,  2.58s/it][A
Training...:  10% 1417/13907 [52:51<8:48:30,  2.54s/it][A
Training...:  10% 1418/13907 [52:53<8:40:07,  2.50s/it][A
Training...:  10% 1419/13907 [52:55<8:32:57,  2.46s/it][A
Training...:  10% 1420/13907 [52:58<8:26:13,  2.43s/it][A
Training...:  10% 1421/13907 [53:00<8:20:02,  2.40s/it][A
Training...:  10% 1422/13907 [53:02<8:13:50,  2.37s/it][A
Training...:  10% 1423/13907 [53:05<8:06:20,  2.34s/it][A
Training...:  10% 1424/13907 [53:07<7:58:36,  2.30s/it][A
Training...:  10% 1425/13907 [53:09<7:51:22,  2.27s/it][A
Training...:  10% 1426/13907 [53:11<7:44:32,  2.23s/it][A
Training...:  10% 1427/13907 [53:13<7:37:12,  2.20s/it][A
Training...:  10% 1428/13907 [53:15<7:30:08,  2.16s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:23:50<8:52:18, 31938.93s/it]
Training...:  10% 1428/13907 [53:18<7:30:08,  2.16s/it][A
Training...:  10% 1429/13907 [53:18<7:43:31,  2.23s/it][A
Training...:  10% 1430/13907 [53:20<7:34:56,  2.19s/it][A
Training...:  10% 1431/13907 [53:22<7:20:42,  2.12s/it][A
Training...:  10% 1432/13907 [53:24<7:11:31,  2.08s/it][A
Training...:  10% 1433/13907 [53:26<7:03:21,  2.04s/it][A
Training...:  10% 1434/13907 [53:28<6:55:06,  2.00s/it][A
Training...:  10% 1435/13907 [53:29<6:48:06,  1.96s/it][A
Training...:  10% 1436/13907 [53:31<6:39:58,  1.92s/it][A
Training...:  10% 1437/13907 [53:33<6:32:46,  1.89s/it][A
Training...:  10% 1438/13907 [53:35<6:25:12,  1.85s/it][A
Training...:  10% 1439/13907 [53:37<6:18:19,  1.82s/it][A
Training...:  10% 1440/13907 [53:38<6:09:57,  1.78s/it][A
Training...:  10% 1441/13907 [53:40<6:02:54,  1.75s/it][A
Training...:  10% 1442/13907 [53:42<5:54:13,  1.71s/it][A
Training...:  10% 1443/13907 [53:43<5:46:53,  1.67s/it][A
Training...:  10% 1444/13907 [53:45<5:38:16,  1.63s/it][A
Training...:  10% 1445/13907 [53:46<5:29:01,  1.58s/it][A
Training...:  10% 1446/13907 [53:48<5:19:27,  1.54s/it][A
Training...:  10% 1447/13907 [53:49<5:08:50,  1.49s/it][A
Training...:  10% 1448/13907 [53:50<4:57:08,  1.43s/it][A
Training...:  10% 1449/13907 [53:52<4:44:39,  1.37s/it][A
Training...:  10% 1450/13907 [53:53<4:24:57,  1.28s/it][A
Training...:  10% 1451/13907 [53:56<6:57:51,  2.01s/it][A
Training...:  10% 1452/13907 [54:00<8:33:10,  2.47s/it][A
Training...:  10% 1453/13907 [54:03<9:26:18,  2.73s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:24:39<8:52:18, 31938.93s/it]
Training...:  10% 1453/13907 [54:07<9:26:18,  2.73s/it][A
Training...:  10% 1454/13907 [54:07<10:22:25,  3.00s/it][A
Training...:  10% 1455/13907 [54:10<10:34:00,  3.05s/it][A
Training...:  10% 1456/13907 [54:13<10:28:30,  3.03s/it][A
Training...:  10% 1457/13907 [54:16<10:20:44,  2.99s/it][A
Training...:  10% 1458/13907 [54:19<10:11:06,  2.95s/it][A
Training...:  10% 1459/13907 [54:21<9:58:51,  2.89s/it] [A
Training...:  10% 1460/13907 [54:24<9:46:33,  2.83s/it][A
Training...:  11% 1461/13907 [54:27<9:35:44,  2.78s/it][A
Training...:  11% 1462/13907 [54:29<9:26:39,  2.73s/it][A
Training...:  11% 1463/13907 [54:32<9:17:55,  2.69s/it][A
Training...:  11% 1464/13907 [54:35<9:08:33,  2.65s/it][A
Training...:  11% 1465/13907 [54:37<9:02:40,  2.62s/it][A
Training...:  11% 1466/13907 [54:40<8:56:55,  2.59s/it][A
Training...:  11% 1467/13907 [54:42<8:51:24,  2.56s/it][A
Training...:  11% 1468/13907 [54:45<8:43:15,  2.52s/it][A
Training...:  11% 1469/13907 [54:47<8:34:17,  2.48s/it][A
Training...:  11% 1470/13907 [54:49<8:27:13,  2.45s/it][A
Training...:  11% 1471/13907 [54:52<8:19:28,  2.41s/it][A
Training...:  11% 1472/13907 [54:54<8:13:55,  2.38s/it][A
Training...:  11% 1473/13907 [54:56<8:07:20,  2.35s/it][A
Training...:  11% 1474/13907 [54:59<8:05:13,  2.34s/it][A
Training...:  11% 1475/13907 [55:01<7:56:02,  2.30s/it][A
Training...:  11% 1476/13907 [55:03<7:47:02,  2.25s/it][A
Training...:  11% 1477/13907 [55:05<7:38:11,  2.21s/it][A
Training...:  11% 1478/13907 [55:07<7:30:12,  2.17s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:25:42<8:52:18, 31938.93s/it]
Training...:  11% 1478/13907 [55:09<7:30:12,  2.17s/it][A
Training...:  11% 1479/13907 [55:09<7:42:21,  2.23s/it][A
Training...:  11% 1480/13907 [55:12<7:33:29,  2.19s/it][A
Training...:  11% 1481/13907 [55:14<7:21:10,  2.13s/it][A
Training...:  11% 1482/13907 [55:16<7:10:09,  2.08s/it][A
Training...:  11% 1483/13907 [55:17<7:00:31,  2.03s/it][A
Training...:  11% 1484/13907 [55:19<6:52:25,  1.99s/it][A
Training...:  11% 1485/13907 [55:21<6:46:32,  1.96s/it][A
Training...:  11% 1486/13907 [55:23<6:41:02,  1.94s/it][A
Training...:  11% 1487/13907 [55:25<6:33:20,  1.90s/it][A
Training...:  11% 1488/13907 [55:27<6:25:05,  1.86s/it][A
Training...:  11% 1489/13907 [55:28<6:18:13,  1.83s/it][A
Training...:  11% 1490/13907 [55:30<6:09:53,  1.79s/it][A
Training...:  11% 1491/13907 [55:32<6:02:35,  1.75s/it][A
Training...:  11% 1492/13907 [55:33<5:54:53,  1.72s/it][A
Training...:  11% 1493/13907 [55:35<5:47:55,  1.68s/it][A
Training...:  11% 1494/13907 [55:37<5:40:14,  1.64s/it][A
Training...:  11% 1495/13907 [55:38<5:31:31,  1.60s/it][A
Training...:  11% 1496/13907 [55:40<5:21:29,  1.55s/it][A
Training...:  11% 1497/13907 [55:41<5:10:02,  1.50s/it][A
Training...:  11% 1498/13907 [55:42<4:58:12,  1.44s/it][A
Training...:  11% 1499/13907 [55:43<4:42:50,  1.37s/it][A
Training...:  11% 1500/13907 [55:44<4:21:49,  1.27s/it][A
Training...:  11% 1501/13907 [55:48<6:56:33,  2.01s/it][A
Training...:  11% 1502/13907 [55:52<8:29:18,  2.46s/it][A
Training...:  11% 1503/13907 [55:55<9:17:51,  2.70s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:26:31<8:52:18, 31938.93s/it]
Training...:  11% 1503/13907 [55:59<9:17:51,  2.70s/it][A
Training...:  11% 1504/13907 [55:59<10:16:06,  2.98s/it][A
Training...:  11% 1505/13907 [56:02<10:28:04,  3.04s/it][A
Training...:  11% 1506/13907 [56:05<10:23:28,  3.02s/it][A
Training...:  11% 1507/13907 [56:08<10:17:34,  2.99s/it][A
Training...:  11% 1508/13907 [56:11<10:14:32,  2.97s/it][A
Training...:  11% 1509/13907 [56:13<10:01:17,  2.91s/it][A
Training...:  11% 1510/13907 [56:16<9:47:25,  2.84s/it] [A
Training...:  11% 1511/13907 [56:19<9:35:40,  2.79s/it][A
Training...:  11% 1512/13907 [56:21<9:25:33,  2.74s/it][A
Training...:  11% 1513/13907 [56:24<9:14:55,  2.69s/it][A
Training...:  11% 1514/13907 [56:26<9:06:37,  2.65s/it][A
Training...:  11% 1515/13907 [56:29<8:59:06,  2.61s/it][A
Training...:  11% 1516/13907 [56:31<8:50:59,  2.57s/it][A
Training...:  11% 1517/13907 [56:34<8:44:30,  2.54s/it][A
Training...:  11% 1518/13907 [56:36<8:36:51,  2.50s/it][A
Training...:  11% 1519/13907 [56:39<8:30:29,  2.47s/it][A
Training...:  11% 1520/13907 [56:41<8:22:55,  2.44s/it][A
Training...:  11% 1521/13907 [56:43<8:16:23,  2.40s/it][A
Training...:  11% 1522/13907 [56:46<8:09:38,  2.37s/it][A
Training...:  11% 1523/13907 [56:48<8:02:33,  2.34s/it][A
Training...:  11% 1524/13907 [56:50<7:55:58,  2.31s/it][A
Training...:  11% 1525/13907 [56:52<7:49:38,  2.28s/it][A
Training...:  11% 1526/13907 [56:55<7:42:23,  2.24s/it][A
Training...:  11% 1527/13907 [56:57<7:35:29,  2.21s/it][A
Training...:  11% 1528/13907 [56:59<7:29:14,  2.18s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:27:33<8:52:18, 31938.93s/it]
Training...:  11% 1528/13907 [57:01<7:29:14,  2.18s/it][A
Training...:  11% 1529/13907 [57:01<7:42:45,  2.24s/it][A
Training...:  11% 1530/13907 [57:03<7:34:37,  2.20s/it][A
Training...:  11% 1531/13907 [57:05<7:25:32,  2.16s/it][A
Training...:  11% 1532/13907 [57:07<7:13:46,  2.10s/it][A
Training...:  11% 1533/13907 [57:09<7:05:41,  2.06s/it][A
Training...:  11% 1534/13907 [57:11<6:56:11,  2.02s/it][A
Training...:  11% 1535/13907 [57:13<6:48:18,  1.98s/it][A
Training...:  11% 1536/13907 [57:15<6:41:05,  1.95s/it][A
Training...:  11% 1537/13907 [57:17<6:33:44,  1.91s/it][A
Training...:  11% 1538/13907 [57:19<6:28:26,  1.88s/it][A
Training...:  11% 1539/13907 [57:20<6:23:59,  1.86s/it][A
Training...:  11% 1540/13907 [57:22<6:18:25,  1.84s/it][A
Training...:  11% 1541/13907 [57:24<6:13:05,  1.81s/it][A
Training...:  11% 1542/13907 [57:26<6:05:56,  1.78s/it][A
Training...:  11% 1543/13907 [57:27<5:58:51,  1.74s/it][A
Training...:  11% 1544/13907 [57:29<5:51:13,  1.70s/it][A
Training...:  11% 1545/13907 [57:31<5:44:46,  1.67s/it][A
Training...:  11% 1546/13907 [57:32<5:35:07,  1.63s/it][A
Training...:  11% 1547/13907 [57:34<5:23:47,  1.57s/it][A
Training...:  11% 1548/13907 [57:35<5:10:47,  1.51s/it][A
Training...:  11% 1549/13907 [57:36<4:56:49,  1.44s/it][A
Training...:  11% 1550/13907 [57:37<4:33:45,  1.33s/it][A
Training...:  11% 1551/13907 [57:41<7:07:03,  2.07s/it][A
Training...:  11% 1552/13907 [57:45<8:41:04,  2.53s/it][A
Training...:  11% 1553/13907 [57:48<9:30:02,  2.77s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:28:24<8:52:18, 31938.93s/it]
Training...:  11% 1553/13907 [57:52<9:30:02,  2.77s/it][A
Training...:  11% 1554/13907 [57:52<10:25:36,  3.04s/it][A
Training...:  11% 1555/13907 [57:55<10:31:36,  3.07s/it][A
Training...:  11% 1556/13907 [57:58<10:21:44,  3.02s/it][A
Training...:  11% 1557/13907 [58:01<10:11:55,  2.97s/it][A
Training...:  11% 1558/13907 [58:03<10:00:58,  2.92s/it][A
Training...:  11% 1559/13907 [58:06<9:51:42,  2.88s/it] [A
Training...:  11% 1560/13907 [58:09<9:40:52,  2.82s/it][A
Training...:  11% 1561/13907 [58:11<9:31:35,  2.78s/it][A
Training...:  11% 1562/13907 [58:14<9:19:41,  2.72s/it][A
Training...:  11% 1563/13907 [58:17<9:10:39,  2.68s/it][A
Training...:  11% 1564/13907 [58:19<9:02:52,  2.64s/it][A
Training...:  11% 1565/13907 [58:22<8:54:11,  2.60s/it][A
Training...:  11% 1566/13907 [58:24<8:47:02,  2.56s/it][A
Training...:  11% 1567/13907 [58:27<8:40:18,  2.53s/it][A
Training...:  11% 1568/13907 [58:29<8:33:31,  2.50s/it][A
Training...:  11% 1569/13907 [58:31<8:27:20,  2.47s/it][A
Training...:  11% 1570/13907 [58:34<8:20:57,  2.44s/it][A
Training...:  11% 1571/13907 [58:36<8:13:15,  2.40s/it][A
Training...:  11% 1572/13907 [58:38<8:07:29,  2.37s/it][A
Training...:  11% 1573/13907 [58:41<7:58:57,  2.33s/it][A
Training...:  11% 1574/13907 [58:43<7:57:19,  2.32s/it][A
Training...:  11% 1575/13907 [58:45<7:50:34,  2.29s/it][A
Training...:  11% 1576/13907 [58:47<7:43:20,  2.25s/it][A
Training...:  11% 1577/13907 [58:49<7:35:09,  2.21s/it][A
Training...:  11% 1578/13907 [58:52<7:27:07,  2.18s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:29:26<8:52:18, 31938.93s/it]
Training...:  11% 1578/13907 [58:54<7:27:07,  2.18s/it][A
Training...:  11% 1579/13907 [58:54<7:38:42,  2.23s/it][A
Training...:  11% 1580/13907 [58:56<7:30:13,  2.19s/it][A
Training...:  11% 1581/13907 [58:58<7:18:36,  2.14s/it][A
Training...:  11% 1582/13907 [59:00<7:09:06,  2.09s/it][A
Training...:  11% 1583/13907 [59:02<7:00:40,  2.05s/it][A
Training...:  11% 1584/13907 [59:04<6:52:45,  2.01s/it][A
Training...:  11% 1585/13907 [59:06<6:45:29,  1.97s/it][A
Training...:  11% 1586/13907 [59:08<6:37:26,  1.94s/it][A
Training...:  11% 1587/13907 [59:09<6:31:40,  1.91s/it][A
Training...:  11% 1588/13907 [59:11<6:25:12,  1.88s/it][A
Training...:  11% 1589/13907 [59:13<6:22:12,  1.86s/it][A
Training...:  11% 1590/13907 [59:15<6:17:47,  1.84s/it][A
Training...:  11% 1591/13907 [59:17<6:12:02,  1.81s/it][A
Training...:  11% 1592/13907 [59:18<6:06:05,  1.78s/it][A
Training...:  11% 1593/13907 [59:20<5:58:34,  1.75s/it][A
Training...:  11% 1594/13907 [59:22<5:50:16,  1.71s/it][A
Training...:  11% 1595/13907 [59:23<5:42:33,  1.67s/it][A
Training...:  11% 1596/13907 [59:25<5:32:20,  1.62s/it][A
Training...:  11% 1597/13907 [59:26<5:21:23,  1.57s/it][A
Training...:  11% 1598/13907 [59:27<5:08:11,  1.50s/it][A
Training...:  11% 1599/13907 [59:29<4:53:04,  1.43s/it][A
Training...:  12% 1600/13907 [59:30<4:32:11,  1.33s/it][A
Training...:  12% 1601/13907 [59:34<7:12:10,  2.11s/it][A
Training...:  12% 1602/13907 [59:37<8:41:59,  2.55s/it][A
Training...:  12% 1603/13907 [59:41<9:32:01,  2.79s/it][A                                                                                                                            
                                                       [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:30:16<8:52:18, 31938.93s/it]
Training...:  12% 1603/13907 [59:44<9:32:01,  2.79s/it][A
Training...:  12% 1604/13907 [59:44<10:27:16,  3.06s/it][A
Training...:  12% 1605/13907 [59:48<10:35:03,  3.10s/it][A
Training...:  12% 1606/13907 [59:51<10:29:46,  3.07s/it][A
Training...:  12% 1607/13907 [59:54<10:22:08,  3.03s/it][A
Training...:  12% 1608/13907 [59:56<10:11:19,  2.98s/it][A
Training...:  12% 1609/13907 [59:59<9:58:22,  2.92s/it] [A
Training...:  12% 1610/13907 [1:00:02<9:44:22,  2.85s/it][A
Training...:  12% 1611/13907 [1:00:04<9:31:32,  2.79s/it][A
Training...:  12% 1612/13907 [1:00:07<9:19:57,  2.73s/it][A
Training...:  12% 1613/13907 [1:00:10<9:10:25,  2.69s/it][A
Training...:  12% 1614/13907 [1:00:12<9:00:31,  2.64s/it][A
Training...:  12% 1615/13907 [1:00:15<8:50:36,  2.59s/it][A
Training...:  12% 1616/13907 [1:00:17<8:42:14,  2.55s/it][A
Training...:  12% 1617/13907 [1:00:20<8:33:40,  2.51s/it][A
Training...:  12% 1618/13907 [1:00:22<8:27:27,  2.48s/it][A
Training...:  12% 1619/13907 [1:00:24<8:18:29,  2.43s/it][A
Training...:  12% 1620/13907 [1:00:27<8:11:44,  2.40s/it][A
Training...:  12% 1621/13907 [1:00:29<8:05:23,  2.37s/it][A
Training...:  12% 1622/13907 [1:00:31<7:58:50,  2.34s/it][A
Training...:  12% 1623/13907 [1:00:33<7:52:55,  2.31s/it][A
Training...:  12% 1624/13907 [1:00:36<7:46:00,  2.28s/it][A
Training...:  12% 1625/13907 [1:00:38<7:40:08,  2.25s/it][A
Training...:  12% 1626/13907 [1:00:40<7:34:14,  2.22s/it][A
Training...:  12% 1627/13907 [1:00:42<7:26:43,  2.18s/it][A
Training...:  12% 1628/13907 [1:00:44<7:21:33,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:31:19<8:52:18, 31938.93s/it]
Training...:  12% 1628/13907 [1:00:46<7:21:33,  2.16s/it][A
Training...:  12% 1629/13907 [1:00:46<7:34:01,  2.22s/it][A
Training...:  12% 1630/13907 [1:00:49<7:26:07,  2.18s/it][A
Training...:  12% 1631/13907 [1:00:51<7:14:39,  2.12s/it][A
Training...:  12% 1632/13907 [1:00:53<7:04:31,  2.08s/it][A
Training...:  12% 1633/13907 [1:00:54<6:57:10,  2.04s/it][A
Training...:  12% 1634/13907 [1:00:56<6:49:55,  2.00s/it][A
Training...:  12% 1635/13907 [1:00:58<6:42:57,  1.97s/it][A
Training...:  12% 1636/13907 [1:01:00<6:38:03,  1.95s/it][A
Training...:  12% 1637/13907 [1:01:02<6:32:14,  1.92s/it][A
Training...:  12% 1638/13907 [1:01:04<6:24:01,  1.88s/it][A
Training...:  12% 1639/13907 [1:01:06<6:18:39,  1.85s/it][A
Training...:  12% 1640/13907 [1:01:07<6:12:44,  1.82s/it][A
Training...:  12% 1641/13907 [1:01:09<6:05:08,  1.79s/it][A
Training...:  12% 1642/13907 [1:01:11<5:55:23,  1.74s/it][A
Training...:  12% 1643/13907 [1:01:12<5:45:32,  1.69s/it][A
Training...:  12% 1644/13907 [1:01:14<5:39:07,  1.66s/it][A
Training...:  12% 1645/13907 [1:01:15<5:28:55,  1.61s/it][A
Training...:  12% 1646/13907 [1:01:17<5:19:15,  1.56s/it][A
Training...:  12% 1647/13907 [1:01:18<5:08:00,  1.51s/it][A
Training...:  12% 1648/13907 [1:01:19<4:54:38,  1.44s/it][A
Training...:  12% 1649/13907 [1:01:21<4:39:56,  1.37s/it][A
Training...:  12% 1650/13907 [1:01:22<4:18:57,  1.27s/it][A
Training...:  12% 1651/13907 [1:01:26<6:59:42,  2.05s/it][A
Training...:  12% 1652/13907 [1:01:29<8:26:19,  2.48s/it][A
Training...:  12% 1653/13907 [1:01:32<9:14:24,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:32:08<8:52:18, 31938.93s/it]
Training...:  12% 1653/13907 [1:01:36<9:14:24,  2.71s/it][A
Training...:  12% 1654/13907 [1:01:36<10:06:27,  2.97s/it][A
Training...:  12% 1655/13907 [1:01:39<10:14:00,  3.01s/it][A
Training...:  12% 1656/13907 [1:01:42<10:08:55,  2.98s/it][A
Training...:  12% 1657/13907 [1:01:45<10:02:33,  2.95s/it][A
Training...:  12% 1658/13907 [1:01:48<9:57:53,  2.93s/it] [A
Training...:  12% 1659/13907 [1:01:50<9:46:31,  2.87s/it][A
Training...:  12% 1660/13907 [1:01:53<9:36:26,  2.82s/it][A
Training...:  12% 1661/13907 [1:01:56<9:27:26,  2.78s/it][A
Training...:  12% 1662/13907 [1:01:58<9:16:52,  2.73s/it][A
Training...:  12% 1663/13907 [1:02:01<9:07:32,  2.68s/it][A
Training...:  12% 1664/13907 [1:02:04<8:58:22,  2.64s/it][A
Training...:  12% 1665/13907 [1:02:06<8:51:58,  2.61s/it][A
Training...:  12% 1666/13907 [1:02:09<8:45:18,  2.57s/it][A
Training...:  12% 1667/13907 [1:02:11<8:37:32,  2.54s/it][A
Training...:  12% 1668/13907 [1:02:13<8:29:50,  2.50s/it][A
Training...:  12% 1669/13907 [1:02:16<8:27:36,  2.49s/it][A
Training...:  12% 1670/13907 [1:02:18<8:23:43,  2.47s/it][A
Training...:  12% 1671/13907 [1:02:21<8:16:29,  2.43s/it][A
Training...:  12% 1672/13907 [1:02:23<8:08:26,  2.40s/it][A
Training...:  12% 1673/13907 [1:02:25<7:59:42,  2.35s/it][A
Training...:  12% 1674/13907 [1:02:27<7:52:16,  2.32s/it][A
Training...:  12% 1675/13907 [1:02:30<7:44:57,  2.28s/it][A
Training...:  12% 1676/13907 [1:02:32<7:36:39,  2.24s/it][A
Training...:  12% 1677/13907 [1:02:34<7:30:15,  2.21s/it][A
Training...:  12% 1678/13907 [1:02:36<7:23:07,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:33:10<8:52:18, 31938.93s/it]
Training...:  12% 1678/13907 [1:02:38<7:23:07,  2.17s/it][A
Training...:  12% 1679/13907 [1:02:38<7:35:16,  2.23s/it][A
Training...:  12% 1680/13907 [1:02:41<7:27:09,  2.19s/it][A
Training...:  12% 1681/13907 [1:02:43<7:16:00,  2.14s/it][A
Training...:  12% 1682/13907 [1:02:44<7:05:00,  2.09s/it][A
Training...:  12% 1683/13907 [1:02:46<6:55:30,  2.04s/it][A
Training...:  12% 1684/13907 [1:02:48<6:47:44,  2.00s/it][A
Training...:  12% 1685/13907 [1:02:50<6:40:35,  1.97s/it][A
Training...:  12% 1686/13907 [1:02:52<6:33:18,  1.93s/it][A
Training...:  12% 1687/13907 [1:02:54<6:26:34,  1.90s/it][A
Training...:  12% 1688/13907 [1:02:56<6:18:57,  1.86s/it][A
Training...:  12% 1689/13907 [1:02:57<6:11:31,  1.82s/it][A
Training...:  12% 1690/13907 [1:02:59<6:03:40,  1.79s/it][A
Training...:  12% 1691/13907 [1:03:01<5:56:56,  1.75s/it][A
Training...:  12% 1692/13907 [1:03:02<5:50:02,  1.72s/it][A
Training...:  12% 1693/13907 [1:03:04<5:42:53,  1.68s/it][A
Training...:  12% 1694/13907 [1:03:06<5:35:23,  1.65s/it][A
Training...:  12% 1695/13907 [1:03:07<5:28:27,  1.61s/it][A
Training...:  12% 1696/13907 [1:03:09<5:18:47,  1.57s/it][A
Training...:  12% 1697/13907 [1:03:10<5:09:47,  1.52s/it][A
Training...:  12% 1698/13907 [1:03:11<4:57:02,  1.46s/it][A
Training...:  12% 1699/13907 [1:03:13<4:42:47,  1.39s/it][A
Training...:  12% 1700/13907 [1:03:14<4:22:22,  1.29s/it][A
Training...:  12% 1701/13907 [1:03:17<6:59:07,  2.06s/it][A
Training...:  12% 1702/13907 [1:03:21<8:23:39,  2.48s/it][A
Training...:  12% 1703/13907 [1:03:24<9:09:17,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:34:00<8:52:18, 31938.93s/it]
Training...:  12% 1703/13907 [1:03:28<9:09:17,  2.70s/it][A
Training...:  12% 1704/13907 [1:03:28<10:06:07,  2.98s/it][A
Training...:  12% 1705/13907 [1:03:31<10:16:32,  3.03s/it][A
Training...:  12% 1706/13907 [1:03:34<10:14:09,  3.02s/it][A
Training...:  12% 1707/13907 [1:03:37<10:12:28,  3.01s/it][A
Training...:  12% 1708/13907 [1:03:40<10:09:05,  3.00s/it][A
Training...:  12% 1709/13907 [1:03:43<9:56:17,  2.93s/it] [A
Training...:  12% 1710/13907 [1:03:45<9:43:29,  2.87s/it][A
Training...:  12% 1711/13907 [1:03:48<9:30:18,  2.81s/it][A
Training...:  12% 1712/13907 [1:03:51<9:17:54,  2.74s/it][A
Training...:  12% 1713/13907 [1:03:53<9:07:59,  2.70s/it][A
Training...:  12% 1714/13907 [1:03:56<8:57:42,  2.65s/it][A
Training...:  12% 1715/13907 [1:03:58<8:46:57,  2.59s/it][A
Training...:  12% 1716/13907 [1:04:01<8:36:57,  2.54s/it][A
Training...:  12% 1717/13907 [1:04:03<8:27:55,  2.50s/it][A
Training...:  12% 1718/13907 [1:04:05<8:21:06,  2.47s/it][A
Training...:  12% 1719/13907 [1:04:08<8:13:56,  2.43s/it][A
Training...:  12% 1720/13907 [1:04:10<8:06:10,  2.39s/it][A
Training...:  12% 1721/13907 [1:04:12<7:58:59,  2.36s/it][A
Training...:  12% 1722/13907 [1:04:15<7:51:21,  2.32s/it][A
Training...:  12% 1723/13907 [1:04:17<7:44:09,  2.29s/it][A
Training...:  12% 1724/13907 [1:04:19<7:38:43,  2.26s/it][A
Training...:  12% 1725/13907 [1:04:21<7:32:36,  2.23s/it][A
Training...:  12% 1726/13907 [1:04:23<7:25:54,  2.20s/it][A
Training...:  12% 1727/13907 [1:04:25<7:20:00,  2.17s/it][A
Training...:  12% 1728/13907 [1:04:27<7:15:49,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:35:02<8:52:18, 31938.93s/it]
Training...:  12% 1728/13907 [1:04:30<7:15:49,  2.15s/it][A
Training...:  12% 1729/13907 [1:04:30<7:28:06,  2.21s/it][A
Training...:  12% 1730/13907 [1:04:32<7:20:02,  2.17s/it][A
Training...:  12% 1731/13907 [1:04:34<7:08:39,  2.11s/it][A
Training...:  12% 1732/13907 [1:04:36<6:59:27,  2.07s/it][A
Training...:  12% 1733/13907 [1:04:38<6:51:12,  2.03s/it][A
Training...:  12% 1734/13907 [1:04:40<6:43:30,  1.99s/it][A
Training...:  12% 1735/13907 [1:04:42<6:38:01,  1.96s/it][A
Training...:  12% 1736/13907 [1:04:43<6:31:32,  1.93s/it][A
Training...:  12% 1737/13907 [1:04:45<6:23:45,  1.89s/it][A
Training...:  12% 1738/13907 [1:04:47<6:17:23,  1.86s/it][A
Training...:  13% 1739/13907 [1:04:49<6:11:05,  1.83s/it][A
Training...:  13% 1740/13907 [1:04:50<6:03:56,  1.79s/it][A
Training...:  13% 1741/13907 [1:04:52<5:57:38,  1.76s/it][A
Training...:  13% 1742/13907 [1:04:54<5:50:05,  1.73s/it][A
Training...:  13% 1743/13907 [1:04:55<5:43:55,  1.70s/it][A
Training...:  13% 1744/13907 [1:04:57<5:36:00,  1.66s/it][A
Training...:  13% 1745/13907 [1:04:59<5:28:26,  1.62s/it][A
Training...:  13% 1746/13907 [1:05:00<5:20:21,  1.58s/it][A
Training...:  13% 1747/13907 [1:05:01<5:09:22,  1.53s/it][A
Training...:  13% 1748/13907 [1:05:03<4:59:48,  1.48s/it][A
Training...:  13% 1749/13907 [1:05:04<4:45:31,  1.41s/it][A
Training...:  13% 1750/13907 [1:05:05<4:26:04,  1.31s/it][A
Training...:  13% 1751/13907 [1:05:09<7:02:01,  2.08s/it][A
Training...:  13% 1752/13907 [1:05:12<8:25:48,  2.50s/it][A
Training...:  13% 1753/13907 [1:05:16<9:13:45,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:35:51<8:52:18, 31938.93s/it]
Training...:  13% 1753/13907 [1:05:19<9:13:45,  2.73s/it][A
Step... (41725 | Loss: 0.22432979941368103, Learning Rate: 5.0157577788922936e-05, Gradient Norm: 0.9075570702552795)
Step... (41750 | Loss: 0.16074424982070923, Learning Rate: 5.0006070523522794e-05, Gradient Norm: 0.5411723852157593)
Step... (41775 | Loss: 0.16874949634075165, Learning Rate: 4.985454143024981e-05, Gradient Norm: 0.6036777496337891)
Step... (41800 | Loss: 0.20339694619178772, Learning Rate: 4.970303416484967e-05, Gradient Norm: 0.720116376876831)
Step... (41825 | Loss: 0.2604520916938782, Learning Rate: 4.955152689944953e-05, Gradient Norm: 1.013118863105774)
Step... (41850 | Loss: 0.17420139908790588, Learning Rate: 4.939999780617654e-05, Gradient Norm: 0.872857928276062)
Step... (41875 | Loss: 0.25550776720046997, Learning Rate: 4.92484905407764e-05, Gradient Norm: 0.8557345271110535)
Step... (41900 | Loss: 0.18943917751312256, Learning Rate: 4.909697963739745e-05, Gradient Norm: 0.8500803709030151)
Step... (41925 | Loss: 0.18471181392669678, Learning Rate: 4.8945454182103276e-05, Gradient Norm: 0.6773865818977356)
Step... (41950 | Loss: 0.20437535643577576, Learning Rate: 4.879394327872433e-05, Gradient Norm: 0.8725056648254395)
Step... (41975 | Loss: 0.2021748125553131, Learning Rate: 4.8642436013324186e-05, Gradient Norm: 0.6733604073524475)
Step... (42000 | Loss: 0.14411643147468567, Learning Rate: 4.84909069200512e-05, Gradient Norm: 0.5505243539810181)
Step... (42025 | Loss: 0.2001272439956665, Learning Rate: 4.833939965465106e-05, Gradient Norm: 0.7684568166732788)
Step... (42050 | Loss: 0.18239909410476685, Learning Rate: 4.818788875127211e-05, Gradient Norm: 0.829588770866394)
Step... (42075 | Loss: 0.21427546441555023, Learning Rate: 4.8036363295977935e-05, Gradient Norm: 0.8966655731201172)
Step... (42100 | Loss: 0.15024584531784058, Learning Rate: 4.788485239259899e-05, Gradient Norm: 0.7873330116271973)
Step... (42125 | Loss: 0.21401140093803406, Learning Rate: 4.7733345127198845e-05, Gradient Norm: 0.750430703163147)
Step... (42150 | Loss: 0.15171748399734497, Learning Rate: 4.758181967190467e-05, Gradient Norm: 0.7636698484420776)
Step... (42175 | Loss: 0.2018192559480667, Learning Rate: 4.743030876852572e-05, Gradient Norm: 0.8999978303909302)
Step... (42200 | Loss: 0.23859822750091553, Learning Rate: 4.727880150312558e-05, Gradient Norm: 0.922669529914856)
Step... (42225 | Loss: 0.1815870702266693, Learning Rate: 4.7127272409852594e-05, Gradient Norm: 0.9014630317687988)
Step... (42250 | Loss: 0.13103064894676208, Learning Rate: 4.697576514445245e-05, Gradient Norm: 0.9665285348892212)
Step... (42275 | Loss: 0.23699583113193512, Learning Rate: 4.6824254241073504e-05, Gradient Norm: 0.975435733795166)
Step... (42300 | Loss: 0.16679592430591583, Learning Rate: 4.667272878577933e-05, Gradient Norm: 2.0268962383270264)
Step... (42325 | Loss: 0.182404562830925, Learning Rate: 4.652121788240038e-05, Gradient Norm: 0.635295569896698)
Step... (42350 | Loss: 0.22730198502540588, Learning Rate: 4.63696924271062e-05, Gradient Norm: 0.9927007555961609)
Step... (42375 | Loss: 0.2605310082435608, Learning Rate: 4.621818152372725e-05, Gradient Norm: 1.121053695678711)
Step... (42400 | Loss: 0.1763865351676941, Learning Rate: 4.606667425832711e-05, Gradient Norm: 0.8445453643798828)
Step... (42425 | Loss: 0.22259950637817383, Learning Rate: 4.591514516505413e-05, Gradient Norm: 1.1412062644958496)
Step... (42450 | Loss: 0.11997504532337189, Learning Rate: 4.5763637899653986e-05, Gradient Norm: 1.7332983016967773)
Step... (42475 | Loss: 0.23610863089561462, Learning Rate: 4.561212699627504e-05, Gradient Norm: 0.7752644419670105)
Step... (42500 | Loss: 0.17929941415786743, Learning Rate: 4.546060154098086e-05, Gradient Norm: 0.8421304225921631)
Step... (42525 | Loss: 0.17174679040908813, Learning Rate: 4.530909427558072e-05, Gradient Norm: 1.057831048965454)
Step... (42550 | Loss: 0.12309226393699646, Learning Rate: 4.515758337220177e-05, Gradient Norm: 0.7474562525749207)
Step... (42575 | Loss: 0.21941274404525757, Learning Rate: 4.5006057916907594e-05, Gradient Norm: 0.6243040561676025)
Step... (42600 | Loss: 0.1761166751384735, Learning Rate: 4.4854547013528645e-05, Gradient Norm: 0.8373442888259888)
Step... (42625 | Loss: 0.2301144003868103, Learning Rate: 4.4703039748128504e-05, Gradient Norm: 0.8208526968955994)
Step... (42650 | Loss: 0.17966511845588684, Learning Rate: 4.455151065485552e-05, Gradient Norm: 0.660428524017334)
Step... (42675 | Loss: 0.20899698138237, Learning Rate: 4.440000338945538e-05, Gradient Norm: 0.7310764789581299)
Step... (42700 | Loss: 0.10971470177173615, Learning Rate: 4.424849248607643e-05, Gradient Norm: 0.4874933958053589)
Step... (42725 | Loss: 0.18371500074863434, Learning Rate: 4.409696703078225e-05, Gradient Norm: 0.988512396812439)
Step... (42750 | Loss: 0.14429427683353424, Learning Rate: 4.3945456127403304e-05, Gradient Norm: 0.7391611337661743)
Step... (42775 | Loss: 0.19944778084754944, Learning Rate: 4.379394886200316e-05, Gradient Norm: 0.745451807975769)
Step... (42800 | Loss: 0.1075332760810852, Learning Rate: 4.3642423406708986e-05, Gradient Norm: 0.5091539621353149)
Step... (42825 | Loss: 0.29351910948753357, Learning Rate: 4.349091250333004e-05, Gradient Norm: 1.122515320777893)
Step... (42850 | Loss: 0.16453135013580322, Learning Rate: 4.3339405237929896e-05, Gradient Norm: 0.9160556793212891)
Step... (42875 | Loss: 0.225599467754364, Learning Rate: 4.318787614465691e-05, Gradient Norm: 1.1745030879974365)
Step... (42900 | Loss: 0.1851552426815033, Learning Rate: 4.303636887925677e-05, Gradient Norm: 0.5834181904792786)
Step... (42925 | Loss: 0.17168426513671875, Learning Rate: 4.288485797587782e-05, Gradient Norm: 0.6927154064178467)
Step... (42950 | Loss: 0.15173125267028809, Learning Rate: 4.2733332520583645e-05, Gradient Norm: 0.5502383708953857)
Step... (42975 | Loss: 0.2330646812915802, Learning Rate: 4.2581821617204696e-05, Gradient Norm: 1.4173835515975952)
Step... (43000 | Loss: 0.12552227079868317, Learning Rate: 4.2430314351804554e-05, Gradient Norm: 0.5930564403533936)
Step... (43025 | Loss: 0.20415762066841125, Learning Rate: 4.227878525853157e-05, Gradient Norm: 0.8441652059555054)
Step... (43050 | Loss: 0.1614667773246765, Learning Rate: 4.212727799313143e-05, Gradient Norm: 0.831000030040741)
Step... (43075 | Loss: 0.2015097439289093, Learning Rate: 4.197576708975248e-05, Gradient Norm: 0.7829041481018066)
Step... (43100 | Loss: 0.18027232587337494, Learning Rate: 4.1824241634458303e-05, Gradient Norm: 0.6122317910194397)
Step... (43125 | Loss: 0.17638102173805237, Learning Rate: 4.1672730731079355e-05, Gradient Norm: 0.6936973333358765)
Step... (43150 | Loss: 0.1481703221797943, Learning Rate: 4.1521223465679213e-05, Gradient Norm: 0.6426485776901245)
Step... (43175 | Loss: 0.21013909578323364, Learning Rate: 4.1369698010385036e-05, Gradient Norm: 0.6734628081321716)
Step... (43200 | Loss: 0.14349351823329926, Learning Rate: 4.121818710700609e-05, Gradient Norm: 0.6195653080940247)
Step... (43225 | Loss: 0.21373915672302246, Learning Rate: 4.1066679841605946e-05, Gradient Norm: 0.9964064359664917)
Step... (43250 | Loss: 0.18307174742221832, Learning Rate: 4.091515074833296e-05, Gradient Norm: 1.1852474212646484)
Step... (43275 | Loss: 0.17125988006591797, Learning Rate: 4.076364348293282e-05, Gradient Norm: 0.6257033944129944)
Step... (43300 | Loss: 0.12490980327129364, Learning Rate: 4.061213257955387e-05, Gradient Norm: 0.8121881484985352)
Step... (43325 | Loss: 0.20420166850090027, Learning Rate: 4.0460607124259695e-05, Gradient Norm: 0.6378941535949707)
Step... (43350 | Loss: 0.17799893021583557, Learning Rate: 4.030909622088075e-05, Gradient Norm: 0.7802588939666748)
Step... (43375 | Loss: 0.181730717420578, Learning Rate: 4.015757076558657e-05, Gradient Norm: 0.8896061778068542)
Step... (43400 | Loss: 0.13738831877708435, Learning Rate: 4.000605986220762e-05, Gradient Norm: 0.5688759684562683)
Step... (43425 | Loss: 0.1614968478679657, Learning Rate: 3.985455259680748e-05, Gradient Norm: 0.6123720407485962)
Step... (43450 | Loss: 0.13673347234725952, Learning Rate: 3.9703023Training...:  13% 1754/13907 [1:05:19<10:09:05,  3.01s/it][A503534496e-05, Gradient Norm: 0.9244353771209717)

Training...:  13% 1755/13907 [1:05:23<10:30:29,  3.11s/it][A
Training...:  13% 1756/13907 [1:05:26<10:21:41,  3.07s/it][A
Training...:  13% 1757/13907 [1:05:29<10:09:37,  3.01s/it][A
Training...:  13% 1758/13907 [1:05:31<9:57:47,  2.95s/it] [A
Training...:  13% 1759/13907 [1:05:34<9:46:39,  2.90s/it][A
Training...:  13% 1760/13907 [1:05:37<9:34:10,  2.84s/it][A
Training...:  13% 1761/13907 [1:05:40<9:23:19,  2.78s/it][A
Training...:  13% 1762/13907 [1:05:42<9:14:28,  2.74s/it][A
Training...:  13% 1763/13907 [1:05:45<9:03:53,  2.69s/it][A
Training...:  13% 1764/13907 [1:05:47<8:55:28,  2.65s/it][A
Training...:  13% 1765/13907 [1:05:50<8:47:30,  2.61s/it][A
Training...:  13% 1766/13907 [1:05:52<8:39:54,  2.57s/it][A
Training...:  13% 1767/13907 [1:05:55<8:32:33,  2.53s/it][A
Training...:  13% 1768/13907 [1:05:57<8:22:59,  2.49s/it][A
Training...:  13% 1769/13907 [1:05:59<8:16:24,  2.45s/it][A
Training...:  13% 1770/13907 [1:06:02<8:13:55,  2.44s/it][A
Training...:  13% 1771/13907 [1:06:04<8:09:50,  2.42s/it][A
Training...:  13% 1772/13907 [1:06:07<8:00:40,  2.38s/it][A
Training...:  13% 1773/13907 [1:06:09<7:51:55,  2.33s/it][A
Training...:  13% 1774/13907 [1:06:11<7:42:15,  2.29s/it][A
Training...:  13% 1775/13907 [1:06:13<7:33:14,  2.24s/it][A
Training...:  13% 1776/13907 [1:06:15<7:27:15,  2.21s/it][A
Training...:  13% 1777/13907 [1:06:17<7:19:54,  2.18s/it][A
Training...:  13% 1778/13907 [1:06:19<7:13:12,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:36:54<8:52:18, 31938.93s/it]
Training...:  13% 1778/13907 [1:06:22<7:13:12,  2.14s/it][A
Training...:  13% 1779/13907 [1:06:22<7:28:05,  2.22s/it][A
Training...:  13% 1780/13907 [1:06:24<7:20:34,  2.18s/it][A
Training...:  13% 1781/13907 [1:06:26<7:09:43,  2.13s/it][A
Training...:  13% 1782/13907 [1:06:28<6:59:59,  2.08s/it][A
Training...:  13% 1783/13907 [1:06:30<6:50:24,  2.03s/it][A
Training...:  13% 1784/13907 [1:06:32<6:42:14,  1.99s/it][A
Training...:  13% 1785/13907 [1:06:34<6:33:40,  1.95s/it][A
Training...:  13% 1786/13907 [1:06:35<6:26:22,  1.91s/it][A
Training...:  13% 1787/13907 [1:06:37<6:19:44,  1.88s/it][A
Training...:  13% 1788/13907 [1:06:39<6:12:34,  1.84s/it][A
Training...:  13% 1789/13907 [1:06:41<6:04:53,  1.81s/it][A
Training...:  13% 1790/13907 [1:06:42<5:57:19,  1.77s/it][A
Training...:  13% 1791/13907 [1:06:44<5:51:45,  1.74s/it][A
Training...:  13% 1792/13907 [1:06:46<5:44:43,  1.71s/it][A
Training...:  13% 1793/13907 [1:06:47<5:39:00,  1.68s/it][A
Training...:  13% 1794/13907 [1:06:49<5:32:08,  1.65s/it][A
Training...:  13% 1795/13907 [1:06:50<5:24:26,  1.61s/it][A
Training...:  13% 1796/13907 [1:06:52<5:15:36,  1.56s/it][A
Training...:  13% 1797/13907 [1:06:53<5:04:51,  1.51s/it][A
Training...:  13% 1798/13907 [1:06:54<4:53:19,  1.45s/it][A
Training...:  13% 1799/13907 [1:06:56<4:42:03,  1.40s/it][A
Training...:  13% 1800/13907 [1:06:57<4:23:35,  1.31s/it][A
Training...:  13% 1801/13907 [1:07:01<6:47:13,  2.02s/it][A
Training...:  13% 1802/13907 [1:07:04<8:14:57,  2.45s/it][A
Training...:  13% 1803/13907 [1:07:07<9:00:19,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:37:43<8:52:18, 31938.93s/it]
Training...:  13% 1803/13907 [1:07:11<9:00:19,  2.68s/it][A
Training...:  13% 1804/13907 [1:07:11<9:58:59,  2.97s/it][A
Training...:  13% 1805/13907 [1:07:14<10:15:44,  3.05s/it][A
Training...:  13% 1806/13907 [1:07:17<10:07:59,  3.01s/it][A
Training...:  13% 1807/13907 [1:07:20<10:05:10,  3.00s/it][A
Training...:  13% 1808/13907 [1:07:23<9:53:35,  2.94s/it] [A
Training...:  13% 1809/13907 [1:07:26<9:42:32,  2.89s/it][A
Training...:  13% 1810/13907 [1:07:28<9:32:44,  2.84s/it][A
Training...:  13% 1811/13907 [1:07:31<9:22:09,  2.79s/it][A
Training...:  13% 1812/13907 [1:07:34<9:14:52,  2.75s/it][A
Training...:  13% 1813/13907 [1:07:36<9:05:04,  2.70s/it][A
Training...:  13% 1814/13907 [1:07:39<8:58:04,  2.67s/it][A
Training...:  13% 1815/13907 [1:07:41<8:49:30,  2.63s/it][A
Training...:  13% 1816/13907 [1:07:44<8:42:49,  2.59s/it][A
Training...:  13% 1817/13907 [1:07:46<8:35:17,  2.56s/it][A
Training...:  13% 1818/13907 [1:07:49<8:26:56,  2.52s/it][A
Training...:  13% 1819/13907 [1:07:51<8:19:32,  2.48s/it][A
Training...:  13% 1820/13907 [1:07:53<8:10:35,  2.44s/it][A
Training...:  13% 1821/13907 [1:07:56<8:04:08,  2.40s/it][A
Training...:  13% 1822/13907 [1:07:58<7:58:13,  2.37s/it][A
Training...:  13% 1823/13907 [1:08:00<7:50:26,  2.34s/it][A
Training...:  13% 1824/13907 [1:08:03<7:42:56,  2.30s/it][A
Training...:  13% 1825/13907 [1:08:05<7:36:04,  2.26s/it][A
Training...:  13% 1826/13907 [1:08:07<7:30:06,  2.24s/it][A
Training...:  13% 1827/13907 [1:08:09<7:23:20,  2.20s/it][A
Training...:  13% 1828/13907 [1:08:11<7:15:51,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:38:46<8:52:18, 31938.93s/it]
Training...:  13% 1828/13907 [1:08:13<7:15:51,  2.17s/it][A
Training...:  13% 1829/13907 [1:08:13<7:29:01,  2.23s/it][A
Training...:  13% 1830/13907 [1:08:16<7:22:26,  2.20s/it][A
Training...:  13% 1831/13907 [1:08:18<7:10:19,  2.14s/it][A
Training...:  13% 1832/13907 [1:08:20<7:02:31,  2.10s/it][A
Training...:  13% 1833/13907 [1:08:22<6:58:01,  2.08s/it][A
Training...:  13% 1834/13907 [1:08:24<6:54:41,  2.06s/it][A
Training...:  13% 1835/13907 [1:08:26<6:44:04,  2.01s/it][A
Training...:  13% 1836/13907 [1:08:27<6:34:26,  1.96s/it][A
Training...:  13% 1837/13907 [1:08:29<6:25:54,  1.92s/it][A
Training...:  13% 1838/13907 [1:08:31<6:16:51,  1.87s/it][A
Training...:  13% 1839/13907 [1:08:33<6:09:15,  1.84s/it][A
Training...:  13% 1840/13907 [1:08:34<6:01:29,  1.80s/it][A
Training...:  13% 1841/13907 [1:08:36<5:53:25,  1.76s/it][A
Training...:  13% 1842/13907 [1:08:38<5:46:33,  1.72s/it][A
Training...:  13% 1843/13907 [1:08:39<5:39:57,  1.69s/it][A
Training...:  13% 1844/13907 [1:08:41<5:33:12,  1.66s/it][A
Training...:  13% 1845/13907 [1:08:42<5:25:57,  1.62s/it][A
Training...:  13% 1846/13907 [1:08:44<5:17:15,  1.58s/it][A
Training...:  13% 1847/13907 [1:08:45<5:05:15,  1.52s/it][A
Training...:  13% 1848/13907 [1:08:47<4:52:42,  1.46s/it][A
Training...:  13% 1849/13907 [1:08:48<4:38:28,  1.39s/it][A
Training...:  13% 1850/13907 [1:08:49<4:18:36,  1.29s/it][A
Training...:  13% 1851/13907 [1:08:53<6:43:22,  2.01s/it][A
Training...:  13% 1852/13907 [1:08:56<8:10:46,  2.44s/it][A
Training...:  13% 1853/13907 [1:08:59<8:58:01,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:39:35<8:52:18, 31938.93s/it]
Training...:  13% 1853/13907 [1:09:03<8:58:01,  2.68s/it][A
Training...:  13% 1854/13907 [1:09:03<9:55:35,  2.96s/it][A
Training...:  13% 1855/13907 [1:09:06<10:06:47,  3.02s/it][A
Training...:  13% 1856/13907 [1:09:09<10:07:01,  3.02s/it][A
Training...:  13% 1857/13907 [1:09:12<10:00:32,  2.99s/it][A
Training...:  13% 1858/13907 [1:09:15<9:54:09,  2.96s/it] [A
Training...:  13% 1859/13907 [1:09:18<9:41:39,  2.90s/it][A
Training...:  13% 1860/13907 [1:09:20<9:30:09,  2.84s/it][A
Training...:  13% 1861/13907 [1:09:23<9:21:32,  2.80s/it][A
Training...:  13% 1862/13907 [1:09:26<9:11:51,  2.75s/it][A
Training...:  13% 1863/13907 [1:09:28<9:00:52,  2.69s/it][A
Training...:  13% 1864/13907 [1:09:31<8:50:50,  2.64s/it][A
Training...:  13% 1865/13907 [1:09:33<8:42:28,  2.60s/it][A
Training...:  13% 1866/13907 [1:09:36<8:34:21,  2.56s/it][A
Training...:  13% 1867/13907 [1:09:38<8:30:43,  2.55s/it][A
Training...:  13% 1868/13907 [1:09:41<8:25:37,  2.52s/it][A
Training...:  13% 1869/13907 [1:09:43<8:17:51,  2.48s/it][A
Training...:  13% 1870/13907 [1:09:45<8:08:45,  2.44s/it][A
Training...:  13% 1871/13907 [1:09:48<8:00:57,  2.40s/it][A
Training...:  13% 1872/13907 [1:09:50<7:53:03,  2.36s/it][A
Training...:  13% 1873/13907 [1:09:52<7:46:10,  2.32s/it][A
Training...:  13% 1874/13907 [1:09:54<7:39:05,  2.29s/it][A
Training...:  13% 1875/13907 [1:09:57<7:31:01,  2.25s/it][A
Training...:  13% 1876/13907 [1:09:59<7:23:48,  2.21s/it][A
Training...:  13% 1877/13907 [1:10:01<7:16:49,  2.18s/it][A
Training...:  14% 1878/13907 [1:10:03<7:09:22,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:40:37<8:52:18, 31938.93s/it]
Training...:  14% 1878/13907 [1:10:05<7:09:22,  2.14s/it][A
Training...:  14% 1879/13907 [1:10:05<7:20:52,  2.20s/it][A
Training...:  14% 1880/13907 [1:10:07<7:13:21,  2.16s/it][A
Training...:  14% 1881/13907 [1:10:09<7:02:22,  2.11s/it][A
Training...:  14% 1882/13907 [1:10:11<6:52:12,  2.06s/it][A
Training...:  14% 1883/13907 [1:10:13<6:44:20,  2.02s/it][A
Training...:  14% 1884/13907 [1:10:15<6:36:49,  1.98s/it][A
Training...:  14% 1885/13907 [1:10:17<6:28:55,  1.94s/it][A
Training...:  14% 1886/13907 [1:10:19<6:21:24,  1.90s/it][A
Training...:  14% 1887/13907 [1:10:21<6:14:22,  1.87s/it][A
Training...:  14% 1888/13907 [1:10:22<6:09:22,  1.84s/it][A
Training...:  14% 1889/13907 [1:10:24<6:04:37,  1.82s/it][A
Training...:  14% 1890/13907 [1:10:26<5:58:19,  1.79s/it][A
Training...:  14% 1891/13907 [1:10:27<5:51:44,  1.76s/it][A
Training...:  14% 1892/13907 [1:10:29<5:44:22,  1.72s/it][A
Training...:  14% 1893/13907 [1:10:31<5:37:42,  1.69s/it][A
Training...:  14% 1894/13907 [1:10:32<5:30:56,  1.65s/it][A
Training...:  14% 1895/13907 [1:10:34<5:22:24,  1.61s/it][A
Training...:  14% 1896/13907 [1:10:35<5:12:42,  1.56s/it][A
Training...:  14% 1897/13907 [1:10:37<5:02:22,  1.51s/it][A
Training...:  14% 1898/13907 [1:10:38<4:50:39,  1.45s/it][A
Training...:  14% 1899/13907 [1:10:39<4:36:51,  1.38s/it][A
Training...:  14% 1900/13907 [1:10:40<4:17:35,  1.29s/it][A
Training...:  14% 1901/13907 [1:10:44<6:43:20,  2.02s/it][A
Training...:  14% 1902/13907 [1:10:47<8:11:26,  2.46s/it][A
Training...:  14% 1903/13907 [1:10:51<8:58:03,  2.69s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:41:26<8:52:18, 31938.93s/it]
Training...:  14% 1903/13907 [1:10:54<8:58:03,  2.69s/it][A
Training...:  14% 1904/13907 [1:10:54<9:55:36,  2.98s/it][A
Training...:  14% 1905/13907 [1:10:58<10:07:30,  3.04s/it][A
Training...:  14% 1906/13907 [1:11:01<10:11:18,  3.06s/it][A
Training...:  14% 1907/13907 [1:11:04<10:06:55,  3.03s/it][A
Training...:  14% 1908/13907 [1:11:06<9:53:31,  2.97s/it] [A
Training...:  14% 1909/13907 [1:11:09<9:41:40,  2.91s/it][A
Training...:  14% 1910/13907 [1:11:12<9:28:33,  2.84s/it][A
Training...:  14% 1911/13907 [1:11:15<9:18:34,  2.79s/it][A
Training...:  14% 1912/13907 [1:11:17<9:06:58,  2.74s/it][A
Training...:  14% 1913/13907 [1:11:20<8:57:25,  2.69s/it][A
Training...:  14% 1914/13907 [1:11:22<8:47:54,  2.64s/it][A
Training...:  14% 1915/13907 [1:11:25<8:39:56,  2.60s/it][A
Training...:  14% 1916/13907 [1:11:27<8:31:29,  2.56s/it][A
Training...:  14% 1917/13907 [1:11:30<8:23:40,  2.52s/it][A
Training...:  14% 1918/13907 [1:11:32<8:17:09,  2.49s/it][A
Training...:  14% 1919/13907 [1:11:34<8:08:49,  2.45s/it][A
Training...:  14% 1920/13907 [1:11:37<8:02:06,  2.41s/it][A
Training...:  14% 1921/13907 [1:11:39<7:55:19,  2.38s/it][A
Training...:  14% 1922/13907 [1:11:41<7:47:57,  2.34s/it][A
Training...:  14% 1923/13907 [1:11:44<7:42:58,  2.32s/it][A
Training...:  14% 1924/13907 [1:11:46<7:36:37,  2.29s/it][A
Training...:  14% 1925/13907 [1:11:48<7:30:26,  2.26s/it][A
Training...:  14% 1926/13907 [1:11:50<7:24:43,  2.23s/it][A
Training...:  14% 1927/13907 [1:11:52<7:18:52,  2.20s/it][A
Training...:  14% 1928/13907 [1:11:54<7:10:07,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:42:29<8:52:18, 31938.93s/it]
Training...:  14% 1928/13907 [1:11:57<7:10:07,  2.15s/it][A
Training...:  14% 1929/13907 [1:11:57<7:22:35,  2.22s/it][A
Training...:  14% 1930/13907 [1:11:59<7:14:22,  2.18s/it][A
Training...:  14% 1931/13907 [1:12:01<7:01:55,  2.11s/it][A
Training...:  14% 1932/13907 [1:12:03<6:51:12,  2.06s/it][A
Training...:  14% 1933/13907 [1:12:05<6:42:18,  2.02s/it][A
Training...:  14% 1934/13907 [1:12:06<6:35:06,  1.98s/it][A
Training...:  14% 1935/13907 [1:12:08<6:26:19,  1.94s/it][A
Training...:  14% 1936/13907 [1:12:10<6:19:15,  1.90s/it][A
Training...:  14% 1937/13907 [1:12:12<6:12:12,  1.87s/it][A
Training...:  14% 1938/13907 [1:12:14<6:06:06,  1.84s/it][A
Training...:  14% 1939/13907 [1:12:15<6:00:37,  1.81s/it][A
Training...:  14% 1940/13907 [1:12:17<5:55:01,  1.78s/it][A
Training...:  14% 1941/13907 [1:12:19<5:47:45,  1.74s/it][A
Training...:  14% 1942/13907 [1:12:20<5:42:05,  1.72s/it][A
Training...:  14% 1943/13907 [1:12:22<5:37:23,  1.69s/it][A
Training...:  14% 1944/13907 [1:12:24<5:31:34,  1.66s/it][A
Training...:  14% 1945/13907 [1:12:25<5:22:16,  1.62s/it][A
Training...:  14% 1946/13907 [1:12:27<5:12:51,  1.57s/it][A
Training...:  14% 1947/13907 [1:12:28<5:03:59,  1.53s/it][A
Training...:  14% 1948/13907 [1:12:29<4:52:45,  1.47s/it][A
Training...:  14% 1949/13907 [1:12:31<4:39:19,  1.40s/it][A
Training...:  14% 1950/13907 [1:12:32<4:19:17,  1.30s/it][A
Training...:  14% 1951/13907 [1:12:35<6:47:28,  2.04s/it][A
Training...:  14% 1952/13907 [1:12:39<8:16:57,  2.49s/it][A
Training...:  14% 1953/13907 [1:12:42<9:04:12,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:43:18<8:52:18, 31938.93s/it]
Training...:  14% 1953/13907 [1:12:46<9:04:12,  2.73s/it][A
Training...:  14% 1954/13907 [1:12:46<10:01:03,  3.02s/it][A
Training...:  14% 1955/13907 [1:12:49<10:10:34,  3.07s/it][A
Training...:  14% 1956/13907 [1:12:52<10:04:35,  3.04s/it][A
Training...:  14% 1957/13907 [1:12:55<9:58:25,  3.00s/it] [A
Training...:  14% 1958/13907 [1:12:58<9:49:14,  2.96s/it][A
Training...:  14% 1959/13907 [1:13:01<9:39:24,  2.91s/it][A
Training...:  14% 1960/13907 [1:13:03<9:28:00,  2.85s/it][A
Training...:  14% 1961/13907 [1:13:06<9:19:08,  2.81s/it][A
Training...:  14% 1962/13907 [1:13:09<9:08:39,  2.76s/it][A
Training...:  14% 1963/13907 [1:13:11<8:57:51,  2.70s/it][A
Training...:  14% 1964/13907 [1:13:14<8:48:26,  2.65s/it][A
Training...:  14% 1965/13907 [1:13:16<8:39:19,  2.61s/it][A
Training...:  14% 1966/13907 [1:13:19<8:30:19,  2.56s/it][A
Training...:  14% 1967/13907 [1:13:21<8:21:37,  2.52s/it][A
Training...:  14% 1968/13907 [1:13:24<8:15:01,  2.49s/it][A
Training...:  14% 1969/13907 [1:13:26<8:12:44,  2.48s/it][A
Training...:  14% 1970/13907 [1:13:28<8:03:44,  2.43s/it][A
Training...:  14% 1971/13907 [1:13:31<7:55:41,  2.39s/it][A
Training...:  14% 1972/13907 [1:13:33<7:47:44,  2.35s/it][A
Training...:  14% 1973/13907 [1:13:35<7:40:25,  2.31s/it][A
Training...:  14% 1974/13907 [1:13:37<7:31:43,  2.27s/it][A
Training...:  14% 1975/13907 [1:13:40<7:24:41,  2.24s/it][A
Training...:  14% 1976/13907 [1:13:42<7:17:32,  2.20s/it][A
Training...:  14% 1977/13907 [1:13:44<7:12:22,  2.17s/it][A
Training...:  14% 1978/13907 [1:13:46<7:06:52,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:44:20<8:52:18, 31938.93s/it]
Training...:  14% 1978/13907 [1:13:48<7:06:52,  2.15s/it][A
Training...:  14% 1979/13907 [1:13:48<7:20:21,  2.22s/it][A
Training...:  14% 1980/13907 [1:13:50<7:12:18,  2.17s/it][A
Training...:  14% 1981/13907 [1:13:52<7:01:58,  2.12s/it][A
Training...:  14% 1982/13907 [1:13:54<6:52:11,  2.07s/it][A
Training...:  14% 1983/13907 [1:13:56<6:44:28,  2.04s/it][A
Training...:  14% 1984/13907 [1:13:58<6:37:20,  2.00s/it][A
Training...:  14% 1985/13907 [1:14:00<6:31:38,  1.97s/it][A
Training...:  14% 1986/13907 [1:14:02<6:24:39,  1.94s/it][A
Training...:  14% 1987/13907 [1:14:04<6:18:32,  1.91s/it][A
Training...:  14% 1988/13907 [1:14:06<6:10:55,  1.87s/it][A
Training...:  14% 1989/13907 [1:14:07<6:03:04,  1.83s/it][A
Training...:  14% 1990/13907 [1:14:09<5:55:30,  1.79s/it][A
Training...:  14% 1991/13907 [1:14:11<5:48:59,  1.76s/it][A
Training...:  14% 1992/13907 [1:14:12<5:42:51,  1.73s/it][A
Training...:  14% 1993/13907 [1:14:14<5:36:02,  1.69s/it][A
Training...:  14% 1994/13907 [1:14:15<5:28:56,  1.66s/it][A
Training...:  14% 1995/13907 [1:14:17<5:20:26,  1.61s/it][A
Training...:  14% 1996/13907 [1:14:18<5:11:17,  1.57s/it][A
Training...:  14% 1997/13907 [1:14:20<5:01:24,  1.52s/it][A
Training...:  14% 1998/13907 [1:14:21<4:50:40,  1.46s/it][A
Training...:  14% 1999/13907 [1:14:22<4:38:35,  1.40s/it][A
Training...:  14% 2000/13907 [1:14:24<4:19:49,  1.31s/it][A
Training...:  14% 2001/13907 [1:14:27<6:48:35,  2.06s/it][A
Training...:  14% 2002/13907 [1:14:31<8:16:53,  2.50s/it][A
Training...:  14% 2003/13907 [1:14:34<9:04:03,  2.74s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:45:10<8:52:18, 31938.93s/it]
Training...:  14% 2003/13907 [1:14:38<9:04:03,  2.74s/it][A
Training...:  14% 2004/13907 [1:14:38<9:58:21,  3.02s/it][A
Training...:  14% 2005/13907 [1:14:41<10:05:55,  3.05s/it][A
Training...:  14% 2006/13907 [1:14:44<10:00:39,  3.03s/it][A
Training...:  14% 2007/13907 [1:14:47<9:57:04,  3.01s/it] [A
Training...:  14% 2008/13907 [1:14:50<9:47:02,  2.96s/it][A
Training...:  14% 2009/13907 [1:14:53<9:34:33,  2.90s/it][A
Training...:  14% 2010/13907 [1:14:55<9:23:12,  2.84s/it][A
Training...:  14% 2011/13907 [1:14:58<9:12:47,  2.79s/it][A
Training...:  14% 2012/13907 [1:15:01<9:07:09,  2.76s/it][A
Training...:  14% 2013/13907 [1:15:03<8:58:06,  2.71s/it][A
Training...:  14% 2014/13907 [1:15:06<8:46:59,  2.66s/it][A
Training...:  14% 2015/13907 [1:15:08<8:36:21,  2.61s/it][A
Training...:  14% 2016/13907 [1:15:11<8:25:43,  2.55s/it][A
Training...:  15% 2017/13907 [1:15:13<8:16:24,  2.51s/it][A
Training...:  15% 2018/13907 [1:15:15<8:08:29,  2.47s/it][A
Training...:  15% 2019/13907 [1:15:18<8:00:12,  2.42s/it][A
Training...:  15% 2020/13907 [1:15:20<7:52:55,  2.39s/it][A
Training...:  15% 2021/13907 [1:15:22<7:46:30,  2.35s/it][A
Training...:  15% 2022/13907 [1:15:25<7:39:16,  2.32s/it][A
Training...:  15% 2023/13907 [1:15:27<7:32:29,  2.28s/it][A
Training...:  15% 2024/13907 [1:15:29<7:25:37,  2.25s/it][A
Training...:  15% 2025/13907 [1:15:31<7:19:57,  2.22s/it][A
Training...:  15% 2026/13907 [1:15:33<7:13:53,  2.19s/it][A
Training...:  15% 2027/13907 [1:15:35<7:09:17,  2.17s/it][A
Training...:  15% 2028/13907 [1:15:37<7:02:40,  2.13s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:46:12<8:52:18, 31938.93s/it]
Training...:  15% 2028/13907 [1:15:40<7:02:40,  2.13s/it][A
Training...:  15% 2029/13907 [1:15:40<7:16:45,  2.21s/it][A
Training...:  15% 2030/13907 [1:15:42<7:10:12,  2.17s/it][A
Training...:  15% 2031/13907 [1:15:44<7:00:46,  2.13s/it][A
Training...:  15% 2032/13907 [1:15:46<6:52:11,  2.08s/it][A
Training...:  15% 2033/13907 [1:15:48<6:46:24,  2.05s/it][A
Training...:  15% 2034/13907 [1:15:50<6:38:49,  2.02s/it][A
Training...:  15% 2035/13907 [1:15:52<6:31:31,  1.98s/it][A
Training...:  15% 2036/13907 [1:15:53<6:23:05,  1.94s/it][A
Training...:  15% 2037/13907 [1:15:55<6:16:29,  1.90s/it][A
Training...:  15% 2038/13907 [1:15:57<6:08:31,  1.86s/it][A
Training...:  15% 2039/13907 [1:15:59<6:01:24,  1.83s/it][A
Training...:  15% 2040/13907 [1:16:01<5:54:49,  1.79s/it][A
Training...:  15% 2041/13907 [1:16:02<5:48:26,  1.76s/it][A
Training...:  15% 2042/13907 [1:16:04<5:40:47,  1.72s/it][A
Training...:  15% 2043/13907 [1:16:05<5:35:04,  1.69s/it][A
Training...:  15% 2044/13907 [1:16:07<5:27:52,  1.66s/it][A
Training...:  15% 2045/13907 [1:16:09<5:19:58,  1.62s/it][A
Training...:  15% 2046/13907 [1:16:10<5:11:02,  1.57s/it][A
Training...:  15% 2047/13907 [1:16:11<5:01:56,  1.53s/it][A
Training...:  15% 2048/13907 [1:16:13<4:49:56,  1.47s/it][A
Training...:  15% 2049/13907 [1:16:14<4:35:52,  1.40s/it][A
Training...:  15% 2050/13907 [1:16:15<4:15:51,  1.29s/it][A
Training...:  15% 2051/13907 [1:16:19<6:42:26,  2.04s/it][A
Training...:  15% 2052/13907 [1:16:22<8:06:32,  2.46s/it][A
Training...:  15% 2053/13907 [1:16:26<8:54:52,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:47:01<8:52:18, 31938.93s/it]
Training...:  15% 2053/13907 [1:16:29<8:54:52,  2.71s/it][A
Training...:  15% 2054/13907 [1:16:29<9:48:55,  2.98s/it][A
Training...:  15% 2055/13907 [1:16:32<9:57:42,  3.03s/it][A
Training...:  15% 2056/13907 [1:16:35<9:53:09,  3.00s/it][A
Training...:  15% 2057/13907 [1:16:38<9:45:49,  2.97s/it][A
Training...:  15% 2058/13907 [1:16:41<9:34:44,  2.91s/it][A
Training...:  15% 2059/13907 [1:16:44<9:25:54,  2.87s/it][A
Training...:  15% 2060/13907 [1:16:46<9:16:30,  2.82s/it][A
Training...:  15% 2061/13907 [1:16:49<9:07:51,  2.77s/it][A
Training...:  15% 2062/13907 [1:16:52<8:57:00,  2.72s/it][A
Training...:  15% 2063/13907 [1:16:54<8:47:47,  2.67s/it][A
Training...:  15% 2064/13907 [1:16:57<8:39:21,  2.63s/it][A
Training...:  15% 2065/13907 [1:16:59<8:32:30,  2.60s/it][A
Training...:  15% 2066/13907 [1:17:02<8:24:12,  2.55s/it][A
Training...:  15% 2067/13907 [1:17:04<8:18:01,  2.52s/it][A
Training...:  15% 2068/13907 [1:17:07<8:10:14,  2.48s/it][A
Training...:  15% 2069/13907 [1:17:09<8:03:42,  2.45s/it][A
Training...:  15% 2070/13907 [1:17:11<7:59:28,  2.43s/it][A
Training...:  15% 2071/13907 [1:17:14<7:52:07,  2.39s/it][A
Training...:  15% 2072/13907 [1:17:16<7:42:46,  2.35s/it][A
Training...:  15% 2073/13907 [1:17:18<7:33:51,  2.30s/it][A
Training...:  15% 2074/13907 [1:17:20<7:25:53,  2.26s/it][A
Training...:  15% 2075/13907 [1:17:22<7:19:34,  2.23s/it][A
Training...:  15% 2076/13907 [1:17:25<7:12:20,  2.19s/it][A
Training...:  15% 2077/13907 [1:17:27<7:06:24,  2.16s/it][A
Training...:  15% 2078/13907 [1:17:29<7:01:08,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:48:03<8:52:18, 31938.93s/it]
Training...:  15% 2078/13907 [1:17:31<7:01:08,  2.14s/it][A
Training...:  15% 2079/13907 [1:17:31<7:14:35,  2.20s/it][A
Training...:  15% 2080/13907 [1:17:33<7:08:26,  2.17s/it][A
Training...:  15% 2081/13907 [1:17:35<6:57:24,  2.12s/it][A
Training...:  15% 2082/13907 [1:17:37<6:48:12,  2.07s/it][A
Training...:  15% 2083/13907 [1:17:39<6:40:22,  2.03s/it][A
Training...:  15% 2084/13907 [1:17:41<6:32:10,  1.99s/it][A
Training...:  15% 2085/13907 [1:17:43<6:25:31,  1.96s/it][A
Training...:  15% 2086/13907 [1:17:45<6:19:47,  1.93s/it][A
Training...:  15% 2087/13907 [1:17:47<6:12:52,  1.89s/it][A
Training...:  15% 2088/13907 [1:17:48<6:06:23,  1.86s/it][A
Training...:  15% 2089/13907 [1:17:50<6:00:58,  1.83s/it][A
Training...:  15% 2090/13907 [1:17:52<5:54:33,  1.80s/it][A
Training...:  15% 2091/13907 [1:17:53<5:47:50,  1.77s/it][A
Training...:  15% 2092/13907 [1:17:55<5:41:39,  1.74s/it][A
Training...:  15% 2093/13907 [1:17:57<5:33:49,  1.70s/it][A
Training...:  15% 2094/13907 [1:17:58<5:26:18,  1.66s/it][A
Training...:  15% 2095/13907 [1:18:00<5:19:11,  1.62s/it][A
Training...:  15% 2096/13907 [1:18:01<5:09:33,  1.57s/it][A
Training...:  15% 2097/13907 [1:18:03<4:58:39,  1.52s/it][A
Training...:  15% 2098/13907 [1:18:04<4:48:38,  1.47s/it][A
Training...:  15% 2099/13907 [1:18:05<4:35:21,  1.40s/it][A
Training...:  15% 2100/13907 [1:18:06<4:14:57,  1.30s/it][A
Training...:  15% 2101/13907 [1:18:10<6:38:51,  2.03s/it][A
Training...:  15% 2102/13907 [1:18:14<8:08:11,  2.48s/it][A
Training...:  15% 2103/13907 [1:18:17<8:54:26,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:48:53<8:52:18, 31938.93s/it]
Training...:  15% 2103/13907 [1:18:21<8:54:26,  2.72s/it][A
Training...:  15% 2104/13907 [1:18:21<9:50:15,  3.00s/it][A
Training...:  15% 2105/13907 [1:18:24<10:02:48,  3.06s/it][A
Training...:  15% 2106/13907 [1:18:27<10:00:22,  3.05s/it][A
Training...:  15% 2107/13907 [1:18:30<9:59:43,  3.05s/it] [A
Training...:  15% 2108/13907 [1:18:33<9:53:33,  3.02s/it][A
Training...:  15% 2109/13907 [1:18:36<9:42:12,  2.96s/it][A
Training...:  15% 2110/13907 [1:18:38<9:28:00,  2.89s/it][A
Training...:  15% 2111/13907 [1:18:41<9:19:44,  2.85s/it][A
Training...:  15% 2112/13907 [1:18:44<9:12:22,  2.81s/it][A
Training...:  15% 2113/13907 [1:18:46<8:58:54,  2.74s/it][A
Training...:  15% 2114/13907 [1:18:49<8:47:06,  2.68s/it][A
Training...:  15% 2115/13907 [1:18:51<8:36:10,  2.63s/it][A
Training...:  15% 2116/13907 [1:18:54<8:26:06,  2.58s/it][A
Training...:  15% 2117/13907 [1:18:56<8:18:05,  2.53s/it][A
Training...:  15% 2118/13907 [1:18:59<8:08:11,  2.48s/it][A
Training...:  15% 2119/13907 [1:19:01<8:00:45,  2.45s/it][A
Training...:  15% 2120/13907 [1:19:03<7:53:15,  2.41s/it][A
Training...:  15% 2121/13907 [1:19:06<7:47:01,  2.38s/it][A
Training...:  15% 2122/13907 [1:19:08<7:39:04,  2.34s/it][A
Training...:  15% 2123/13907 [1:19:10<7:32:07,  2.30s/it][A
Training...:  15% 2124/13907 [1:19:12<7:22:56,  2.26s/it][A
Training...:  15% 2125/13907 [1:19:14<7:16:57,  2.23s/it][A
Training...:  15% 2126/13907 [1:19:17<7:10:43,  2.19s/it][A
Training...:  15% 2127/13907 [1:19:19<7:05:06,  2.17s/it][A
Training...:  15% 2128/13907 [1:19:21<6:57:46,  2.13s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:49:55<8:52:18, 31938.93s/it]
Training...:  15% 2128/13907 [1:19:23<6:57:46,  2.13s/it][A
Training...:  15% 2129/13907 [1:19:23<7:10:52,  2.20s/it][A
Training...:  15% 2130/13907 [1:19:25<7:03:34,  2.16s/it][A
Training...:  15% 2131/13907 [1:19:27<6:53:43,  2.11s/it][A
Training...:  15% 2132/13907 [1:19:29<6:43:47,  2.06s/it][A
Training...:  15% 2133/13907 [1:19:31<6:36:08,  2.02s/it][A
Training...:  15% 2134/13907 [1:19:33<6:28:51,  1.98s/it][A
Training...:  15% 2135/13907 [1:19:35<6:24:49,  1.96s/it][A
Training...:  15% 2136/13907 [1:19:37<6:17:48,  1.93s/it][A
Training...:  15% 2137/13907 [1:19:38<6:11:46,  1.90s/it][A
Training...:  15% 2138/13907 [1:19:40<6:04:16,  1.86s/it][A
Training...:  15% 2139/13907 [1:19:42<5:57:28,  1.82s/it][A
Training...:  15% 2140/13907 [1:19:44<5:50:38,  1.79s/it][A
Training...:  15% 2141/13907 [1:19:45<5:45:26,  1.76s/it][A
Training...:  15% 2142/13907 [1:19:47<5:39:09,  1.73s/it][A
Training...:  15% 2143/13907 [1:19:49<5:31:24,  1.69s/it][A
Training...:  15% 2144/13907 [1:19:50<5:27:13,  1.67s/it][A
Training...:  15% 2145/13907 [1:19:52<5:21:53,  1.64s/it][A
Training...:  15% 2146/13907 [1:19:53<5:12:40,  1.60s/it][A
Training...:  15% 2147/13907 [1:19:55<5:02:53,  1.55s/it][A
Training...:  15% 2148/13907 [1:19:56<4:49:02,  1.47s/it][A
Training...:  15% 2149/13907 [1:19:57<4:34:31,  1.40s/it][A
Training...:  15% 2150/13907 [1:19:58<4:15:01,  1.30s/it][A
Training...:  15% 2151/13907 [1:20:02<6:33:11,  2.01s/it][A
Training...:  15% 2152/13907 [1:20:05<7:58:38,  2.44s/it][A
Training...:  15% 2153/13907 [1:20:09<8:46:17,  2.69s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:50:44<8:52:18, 31938.93s/it]
Training...:  15% 2153/13907 [1:20:12<8:46:17,  2.69s/it][A
Training...:  15% 2154/13907 [1:20:12<9:41:08,  2.97s/it][A
Training...:  15% 2155/13907 [1:20:15<9:50:40,  3.02s/it][A
Training...:  16% 2156/13907 [1:20:18<9:44:06,  2.98s/it][A
Training...:  16% 2157/13907 [1:20:21<9:37:05,  2.95s/it][A
Training...:  16% 2158/13907 [1:20:24<9:30:13,  2.91s/it][A
Training...:  16% 2159/13907 [1:20:27<9:21:20,  2.87s/it][A
Training...:  16% 2160/13907 [1:20:29<9:11:10,  2.82s/it][A
Training...:  16% 2161/13907 [1:20:32<8:59:57,  2.76s/it][A
Training...:  16% 2162/13907 [1:20:35<8:50:30,  2.71s/it][A
Training...:  16% 2163/13907 [1:20:37<8:42:38,  2.67s/it][A
Training...:  16% 2164/13907 [1:20:40<8:33:03,  2.62s/it][A
Training...:  16% 2165/13907 [1:20:42<8:26:07,  2.59s/it][A
Training...:  16% 2166/13907 [1:20:45<8:19:47,  2.55s/it][A
Training...:  16% 2167/13907 [1:20:47<8:13:21,  2.52s/it][A
Training...:  16% 2168/13907 [1:20:50<8:06:47,  2.49s/it][A
Training...:  16% 2169/13907 [1:20:52<8:01:12,  2.46s/it][A
Training...:  16% 2170/13907 [1:20:54<7:55:21,  2.43s/it][A
Training...:  16% 2171/13907 [1:20:57<7:48:54,  2.40s/it][A
Training...:  16% 2172/13907 [1:20:59<7:40:35,  2.35s/it][A
Training...:  16% 2173/13907 [1:21:01<7:33:05,  2.32s/it][A
Training...:  16% 2174/13907 [1:21:03<7:26:49,  2.28s/it][A
Training...:  16% 2175/13907 [1:21:06<7:22:34,  2.26s/it][A
Training...:  16% 2176/13907 [1:21:08<7:20:25,  2.25s/it][A
Training...:  16% 2177/13907 [1:21:10<7:13:05,  2.22s/it][A
Training...:  16% 2178/13907 [1:21:12<7:05:53,  2.18s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:51:46<8:52:18, 31938.93s/it]
Training...:  16% 2178/13907 [1:21:14<7:05:53,  2.18s/it][A
Training...:  16% 2179/13907 [1:21:14<7:16:39,  2.23s/it][A
Training...:  16% 2180/13907 [1:21:17<7:08:25,  2.19s/it][A
Training...:  16% 2181/13907 [1:21:19<6:56:16,  2.13s/it][A
Training...:  16% 2182/13907 [1:21:20<6:45:49,  2.08s/it][A
Training...:  16% 2183/13907 [1:21:22<6:36:40,  2.03s/it][A
Training...:  16% 2184/13907 [1:21:24<6:28:43,  1.99s/it][A
Training...:  16% 2185/13907 [1:21:26<6:21:47,  1.95s/it][A
Training...:  16% 2186/13907 [1:21:28<6:14:06,  1.92s/it][A
Training...:  16% 2187/13907 [1:21:30<6:07:40,  1.88s/it][A
Training...:  16% 2188/13907 [1:21:32<6:01:03,  1.85s/it][A
Training...:  16% 2189/13907 [1:21:33<5:54:50,  1.82s/it][A
Training...:  16% 2190/13907 [1:21:35<5:47:36,  1.78s/it][A
Training...:  16% 2191/13907 [1:21:37<5:41:37,  1.75s/it][A
Training...:  16% 2192/13907 [1:21:38<5:34:26,  1.71s/it][A
Training...:  16% 2193/13907 [1:21:40<5:26:53,  1.67s/it][A
Training...:  16% 2194/13907 [1:21:41<5:19:34,  1.64s/it][A
Training...:  16% 2195/13907 [1:21:43<5:11:15,  1.59s/it][A
Training...:  16% 2196/13907 [1:21:44<5:03:00,  1.55s/it][A
Training...:  16% 2197/13907 [1:21:46<4:52:37,  1.50s/it][A
Training...:  16% 2198/13907 [1:21:47<4:42:11,  1.45s/it][A
Training...:  16% 2199/13907 [1:21:48<4:30:20,  1.39s/it][A
Training...:  16% 2200/13907 [1:21:49<4:12:22,  1.29s/it][A
Training...:  16% 2201/13907 [1:21:53<6:33:16,  2.02s/it][A
Training...:  16% 2202/13907 [1:21:57<8:00:13,  2.46s/it][A
Training...:  16% 2203/13907 [1:22:00<8:47:53,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:52:36<8:52:18, 31938.93s/it]
Training...:  16% 2203/13907 [1:22:04<8:47:53,  2.71s/it][A
Training...:  16% 2204/13907 [1:22:04<9:41:07,  2.98s/it][A
Training...:  16% 2205/13907 [1:22:07<9:51:25,  3.03s/it][A
Training...:  16% 2206/13907 [1:22:10<9:49:06,  3.02s/it][A
Training...:  16% 2207/13907 [1:22:13<9:40:48,  2.98s/it][A
Training...:  16% 2208/13907 [1:22:15<9:35:21,  2.95s/it][A
Training...:  16% 2209/13907 [1:22:18<9:26:11,  2.90s/it][A
Training...:  16% 2210/13907 [1:22:21<9:16:03,  2.85s/it][A
Training...:  16% 2211/13907 [1:22:24<9:04:29,  2.79s/it][A
Training...:  16% 2212/13907 [1:22:26<8:55:35,  2.75s/it][A
Training...:  16% 2213/13907 [1:22:29<8:48:44,  2.71s/it][A
Training...:  16% 2214/13907 [1:22:31<8:41:59,  2.68s/it][A
Training...:  16% 2215/13907 [1:22:34<8:32:59,  2.63s/it][A
Training...:  16% 2216/13907 [1:22:37<8:26:19,  2.60s/it][A
Training...:  16% 2217/13907 [1:22:39<8:22:31,  2.58s/it][A
Training...:  16% 2218/13907 [1:22:42<8:15:10,  2.54s/it][A
Training...:  16% 2219/13907 [1:22:44<8:05:20,  2.49s/it][A
Training...:  16% 2220/13907 [1:22:46<7:55:42,  2.44s/it][A
Training...:  16% 2221/13907 [1:22:49<7:48:40,  2.41s/it][A
Training...:  16% 2222/13907 [1:22:51<7:41:28,  2.37s/it][A
Training...:  16% 2223/13907 [1:22:53<7:33:54,  2.33s/it][A
Training...:  16% 2224/13907 [1:22:55<7:27:39,  2.30s/it][A
Training...:  16% 2225/13907 [1:22:57<7:22:23,  2.27s/it][A
Training...:  16% 2226/13907 [1:23:00<7:15:50,  2.24s/it][A
Training...:  16% 2227/13907 [1:23:02<7:09:53,  2.21s/it][A
Training...:  16% 2228/13907 [1:23:04<7:03:10,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:53:38<8:52:18, 31938.93s/it]
Training...:  16% 2228/13907 [1:23:06<7:03:10,  2.17s/it][A
Training...:  16% 2229/13907 [1:23:06<7:15:52,  2.24s/it][A
Training...:  16% 2230/13907 [1:23:08<7:08:23,  2.20s/it][A
Training...:  16% 2231/13907 [1:23:10<6:59:31,  2.16s/it][A
Training...:  16% 2232/13907 [1:23:12<6:50:52,  2.11s/it][A
Training...:  16% 2233/13907 [1:23:14<6:43:26,  2.07s/it][A
Training...:  16% 2234/13907 [1:23:16<6:35:17,  2.03s/it][A
Training...:  16% 2235/13907 [1:23:18<6:29:42,  2.00s/it][A
Training...:  16% 2236/13907 [1:23:20<6:21:43,  1.96s/it][A
Training...:  16% 2237/13907 [1:23:22<6:13:49,  1.92s/it][A
Training...:  16% 2238/13907 [1:23:24<6:05:52,  1.88s/it][A
Training...:  16% 2239/13907 [1:23:26<5:59:07,  1.85s/it][A
Training...:  16% 2240/13907 [1:23:27<5:52:16,  1.81s/it][A
Training...:  16% 2241/13907 [1:23:29<5:45:13,  1.78s/it][A
Training...:  16% 2242/13907 [1:23:31<5:37:33,  1.74s/it][A
Training...:  16% 2243/13907 [1:23:32<5:31:00,  1.70s/it][A
Training...:  16% 2244/13907 [1:23:34<5:22:56,  1.66s/it][A
Training...:  16% 2245/13907 [1:23:35<5:16:11,  1.63s/it][A
Training...:  16% 2246/13907 [1:23:37<5:06:22,  1.58s/it][A
Training...:  16% 2247/13907 [1:23:38<4:55:32,  1.52s/it][A
Training...:  16% 2248/13907 [1:23:40<4:43:31,  1.46s/it][A
Training...:  16% 2249/13907 [1:23:41<4:32:16,  1.40s/it][A
Training...:  16% 2250/13907 [1:23:42<4:14:03,  1.31s/it][A
Training...:  16% 2251/13907 [1:23:46<6:34:10,  2.03s/it][A
Training...:  16% 2252/13907 [1:23:49<8:03:41,  2.49s/it][A
Training...:  16% 2253/13907 [1:23:52<8:51:39,  2.74s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:54:28<8:52:18, 31938.93s/it]
Training...:  16% 2253/13907 [1:23:56<8:51:39,  2.74s/it][A
Training...:  16% 2254/13907 [1:23:56<9:45:17,  3.01s/it][A
Training...:  16% 2255/13907 [1:23:59<9:56:29,  3.07s/it][A
Training...:  16% 2256/13907 [1:24:02<9:51:16,  3.04s/it][A
Training...:  16% 2257/13907 [1:24:05<9:41:56,  3.00s/it][A
Training...:  16% 2258/13907 [1:24:08<9:32:21,  2.95s/it][A
Training...:  16% 2259/13907 [1:24:11<9:22:53,  2.90s/it][A
Training...:  16% 2260/13907 [1:24:14<9:15:56,  2.86s/it][A
Training...:  16% 2261/13907 [1:24:16<9:10:32,  2.84s/it][A
Training...:  16% 2262/13907 [1:24:19<9:03:58,  2.80s/it][A
Training...:  16% 2263/13907 [1:24:22<8:52:23,  2.74s/it][A
Training...:  16% 2264/13907 [1:24:24<8:41:52,  2.69s/it][A
Training...:  16% 2265/13907 [1:24:27<8:32:10,  2.64s/it][A
Training...:  16% 2266/13907 [1:24:29<8:23:18,  2.59s/it][A
Training...:  16% 2267/13907 [1:24:32<8:14:14,  2.55s/it][A
Training...:  16% 2268/13907 [1:24:34<8:06:02,  2.51s/it][A
Training...:  16% 2269/13907 [1:24:36<7:57:50,  2.46s/it][A
Training...:  16% 2270/13907 [1:24:39<7:50:14,  2.42s/it][A
Training...:  16% 2271/13907 [1:24:41<7:43:27,  2.39s/it][A
Training...:  16% 2272/13907 [1:24:43<7:38:14,  2.36s/it][A
Training...:  16% 2273/13907 [1:24:46<7:32:09,  2.33s/it][A
Training...:  16% 2274/13907 [1:24:48<7:24:07,  2.29s/it][A
Training...:  16% 2275/13907 [1:24:50<7:17:14,  2.26s/it][A
Training...:  16% 2276/13907 [1:24:52<7:10:04,  2.22s/it][A
Training...:  16% 2277/13907 [1:24:54<7:04:30,  2.19s/it][A
Training...:  16% 2278/13907 [1:24:56<6:57:53,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:55:31<8:52:18, 31938.93s/it]
Training...:  16% 2278/13907 [1:24:59<6:57:53,  2.16s/it][A
Training...:  16% 2279/13907 [1:24:59<7:11:22,  2.23s/it][A
Training...:  16% 2280/13907 [1:25:01<7:03:56,  2.19s/it][A
Training...:  16% 2281/13907 [1:25:03<6:53:46,  2.14s/it][A
Training...:  16% 2282/13907 [1:25:05<6:45:07,  2.09s/it][A
Training...:  16% 2283/13907 [1:25:07<6:38:44,  2.06s/it][A
Training...:  16% 2284/13907 [1:25:09<6:30:45,  2.02s/it][A
Training...:  16% 2285/13907 [1:25:11<6:26:01,  1.99s/it][A
Training...:  16% 2286/13907 [1:25:13<6:19:53,  1.96s/it][A
Training...:  16% 2287/13907 [1:25:14<6:13:58,  1.93s/it][A
Training...:  16% 2288/13907 [1:25:16<6:07:43,  1.90s/it][A
Training...:  16% 2289/13907 [1:25:18<5:59:41,  1.86s/it][A
Training...:  16% 2290/13907 [1:25:20<5:51:29,  1.82s/it][A
Training...:  16% 2291/13907 [1:25:21<5:43:14,  1.77s/it][A
Training...:  16% 2292/13907 [1:25:23<5:36:13,  1.74s/it][A
Training...:  16% 2293/13907 [1:25:25<5:29:55,  1.70s/it][A
Training...:  16% 2294/13907 [1:25:26<5:22:55,  1.67s/it][A
Training...:  17% 2295/13907 [1:25:28<5:16:45,  1.64s/it][A
Training...:  17% 2296/13907 [1:25:29<5:08:57,  1.60s/it][A
Training...:  17% 2297/13907 [1:25:31<4:58:50,  1.54s/it][A
Training...:  17% 2298/13907 [1:25:32<4:47:47,  1.49s/it][A
Training...:  17% 2299/13907 [1:25:33<4:34:08,  1.42s/it][A
Training...:  17% 2300/13907 [1:25:34<4:12:58,  1.31s/it][A
Training...:  17% 2301/13907 [1:25:38<6:35:41,  2.05s/it][A
Training...:  17% 2302/13907 [1:25:42<7:58:14,  2.47s/it][A
Training...:  17% 2303/13907 [1:25:45<8:43:59,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:56:21<8:52:18, 31938.93s/it]
Training...:  17% 2303/13907 [1:25:49<8:43:59,  2.71s/it][A
Training...:  17% 2304/13907 [1:25:49<9:34:59,  2.97s/it][A
Training...:  17% 2305/13907 [1:25:52<9:44:52,  3.02s/it][A
Training...:  17% 2306/13907 [1:25:55<9:39:02,  2.99s/it][A
Training...:  17% 2307/13907 [1:25:57<9:32:42,  2.96s/it][A
Training...:  17% 2308/13907 [1:26:00<9:24:14,  2.92s/it][A
Training...:  17% 2309/13907 [1:26:03<9:14:55,  2.87s/it][A
Training...:  17% 2310/13907 [1:26:06<9:05:37,  2.82s/it][A
Training...:  17% 2311/13907 [1:26:08<8:56:26,  2.78s/it][A
Training...:  17% 2312/13907 [1:26:11<8:47:39,  2.73s/it][A
Training...:  17% 2313/13907 [1:26:14<8:41:44,  2.70s/it][A
Training...:  17% 2314/13907 [1:26:16<8:34:33,  2.66s/it][A
Training...:  17% 2315/13907 [1:26:19<8:25:56,  2.62s/it][A
Training...:  17% 2316/13907 [1:26:21<8:20:01,  2.59s/it][A
Training...:  17% 2317/13907 [1:26:24<8:12:08,  2.55s/it][A
Training...:  17% 2318/13907 [1:26:26<8:03:44,  2.50s/it][A
Training...:  17% 2319/13907 [1:26:29<7:57:53,  2.47s/it][A
Training...:  17% 2320/13907 [1:26:31<7:52:51,  2.45s/it][A
Training...:  17% 2321/13907 [1:26:33<7:50:07,  2.43s/it][A
Training...:  17% 2322/13907 [1:26:36<7:48:49,  2.43s/it][A
Training...:  17% 2323/13907 [1:26:38<7:40:02,  2.38s/it][A
Training...:  17% 2324/13907 [1:26:40<7:29:00,  2.33s/it][A
Training...:  17% 2325/13907 [1:26:42<7:20:33,  2.28s/it][A
Training...:  17% 2326/13907 [1:26:45<7:14:18,  2.25s/it][A
Training...:  17% 2327/13907 [1:26:47<7:06:21,  2.21s/it][A
Training...:  17% 2328/13907 [1:26:49<6:59:46,  2.18s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:57:23<8:52:18, 31938.93s/it]
Training...:  17% 2328/13907 [1:26:51<6:59:46,  2.18s/it][A
Training...:  17% 2329/13907 [1:26:51<7:10:57,  2.23s/it][A
Training...:  17% 2330/13907 [1:26:53<7:02:24,  2.19s/it][A
Training...:  17% 2331/13907 [1:26:55<6:51:48,  2.13s/it][A
Training...:  17% 2332/13907 [1:26:57<6:41:16,  2.08s/it][A
Training...:  17% 2333/13907 [1:26:59<6:34:21,  2.04s/it][A
Training...:  17% 2334/13907 [1:27:01<6:26:30,  2.00s/it][A
Training...:  17% 2335/13907 [1:27:03<6:20:45,  1.97s/it][A
Training...:  17% 2336/13907 [1:27:05<6:13:59,  1.94s/it][A
Training...:  17% 2337/13907 [1:27:07<6:10:41,  1.92s/it][A
Training...:  17% 2338/13907 [1:27:09<6:06:03,  1.90s/it][A
Training...:  17% 2339/13907 [1:27:10<6:00:04,  1.87s/it][A
Training...:  17% 2340/13907 [1:27:12<5:53:05,  1.83s/it][A
Training...:  17% 2341/13907 [1:27:14<5:47:12,  1.80s/it][A
Training...:  17% 2342/13907 [1:27:15<5:36:57,  1.75s/it][A
Training...:  17% 2343/13907 [1:27:17<5:27:46,  1.70s/it][A
Training...:  17% 2344/13907 [1:27:19<5:20:11,  1.66s/it][A
Training...:  17% 2345/13907 [1:27:20<5:10:23,  1.61s/it][A
Training...:  17% 2346/13907 [1:27:22<5:01:04,  1.56s/it][A
Training...:  17% 2347/13907 [1:27:23<4:50:29,  1.51s/it][A
Training...:  17% 2348/13907 [1:27:24<4:41:27,  1.46s/it][A
Training...:  17% 2349/13907 [1:27:26<4:27:50,  1.39s/it][A
Training...:  17% 2350/13907 [1:27:27<4:07:50,  1.29s/it][A
Training...:  17% 2351/13907 [1:27:30<6:29:09,  2.02s/it][A
Training...:  17% 2352/13907 [1:27:34<7:50:03,  2.44s/it][A
Training...:  17% 2353/13907 [1:27:37<8:35:43,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:58:13<8:52:18, 31938.93s/it]
Training...:  17% 2353/13907 [1:27:41<8:35:43,  2.68s/it][A
Training...:  17% 2354/13907 [1:27:41<9:27:52,  2.95s/it][A
Training...:  17% 2355/13907 [1:27:44<9:36:58,  3.00s/it][A
Training...:  17% 2356/13907 [1:27:47<9:33:10,  2.98s/it][A
Training...:  17% 2357/13907 [1:27:49<9:28:46,  2.95s/it][A
Training...:  17% 2358/13907 [1:27:52<9:21:10,  2.92s/it][A
Training...:  17% 2359/13907 [1:27:55<9:17:02,  2.89s/it][A
Training...:  17% 2360/13907 [1:27:58<9:09:50,  2.86s/it][A
Training...:  17% 2361/13907 [1:28:01<8:57:04,  2.79s/it][A
Training...:  17% 2362/13907 [1:28:03<8:46:18,  2.74s/it][A
Training...:  17% 2363/13907 [1:28:06<8:35:55,  2.68s/it][A
Training...:  17% 2364/13907 [1:28:08<8:26:11,  2.63s/it][A
Training...:  17% 2365/13907 [1:28:11<8:18:17,  2.59s/it][A
Training...:  17% 2366/13907 [1:28:13<8:09:38,  2.55s/it][A
Training...:  17% 2367/13907 [1:28:16<8:03:51,  2.52s/it][A
Training...:  17% 2368/13907 [1:28:18<7:56:40,  2.48s/it][A
Training...:  17% 2369/13907 [1:28:20<7:51:37,  2.45s/it][A
Training...:  17% 2370/13907 [1:28:23<7:44:55,  2.42s/it][A
Training...:  17% 2371/13907 [1:28:25<7:38:38,  2.39s/it][A
Training...:  17% 2372/13907 [1:28:27<7:30:53,  2.35s/it][A
Training...:  17% 2373/13907 [1:28:30<7:23:42,  2.31s/it][A
Training...:  17% 2374/13907 [1:28:32<7:18:15,  2.28s/it][A
Training...:  17% 2375/13907 [1:28:34<7:11:58,  2.25s/it][A
Training...:  17% 2376/13907 [1:28:36<7:07:21,  2.22s/it][A
Training...:  17% 2377/13907 [1:28:38<7:01:17,  2.19s/it][A
Training...:  17% 2378/13907 [1:28:40<6:55:16,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [27:59:15<8:52:18, 31938.93s/it]
Training...:  17% 2378/13907 [1:28:43<6:55:16,  2.16s/it][A
Training...:  17% 2379/13907 [1:28:43<7:07:14,  2.22s/it][A
Training...:  17% 2380/13907 [1:28:45<7:00:51,  2.19s/it][A
Training...:  17% 2381/13907 [1:28:47<6:51:19,  2.14s/it][A
Training...:  17% 2382/13907 [1:28:49<6:43:11,  2.10s/it][A
Training...:  17% 2383/13907 [1:28:51<6:36:56,  2.07s/it][A
Training...:  17% 2384/13907 [1:28:53<6:28:08,  2.02s/it][A
Training...:  17% 2385/13907 [1:28:55<6:21:32,  1.99s/it][A
Training...:  17% 2386/13907 [1:28:56<6:14:36,  1.95s/it][A
Training...:  17% 2387/13907 [1:28:58<6:08:34,  1.92s/it][A
Training...:  17% 2388/13907 [1:29:00<6:02:24,  1.89s/it][A
Training...:  17% 2389/13907 [1:29:02<5:55:32,  1.85s/it][A
Training...:  17% 2390/13907 [1:29:04<5:49:07,  1.82s/it][A
Training...:  17% 2391/13907 [1:29:05<5:42:21,  1.78s/it][A
Training...:  17% 2392/13907 [1:29:07<5:36:04,  1.75s/it][A
Training...:  17% 2393/13907 [1:29:09<5:31:04,  1.73s/it][A
Training...:  17% 2394/13907 [1:29:10<5:24:48,  1.69s/it][A
Training...:  17% 2395/13907 [1:29:12<5:18:37,  1.66s/it][A
Training...:  17% 2396/13907 [1:29:13<5:07:52,  1.60s/it][A
Training...:  17% 2397/13907 [1:29:15<4:56:58,  1.55s/it][A
Training...:  17% 2398/13907 [1:29:16<4:45:44,  1.49s/it][A
Training...:  17% 2399/13907 [1:29:17<4:32:53,  1.42s/it][A
Training...:  17% 2400/13907 [1:29:19<4:15:07,  1.33s/it][A
Training...:  17% 2401/13907 [1:29:22<6:34:37,  2.06s/it][A
Training...:  17% 2402/13907 [1:29:26<7:56:45,  2.49s/it][A
Training...:  17% 2403/13907 [1:29:29<8:40:36,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:00:05<8:52:18, 31938.93s/it]
Training...:  17% 2403/13907 [1:29:33<8:40:36,  2.72s/it][A
Training...:  17% 2404/13907 [1:29:33<9:38:58,  3.02s/it][A
Training...:  17% 2405/13907 [1:29:36<9:44:52,  3.05s/it][A
Training...:  17% 2406/13907 [1:29:39<9:37:26,  3.01s/it][A
Training...:  17% 2407/13907 [1:29:42<9:29:27,  2.97s/it][A
Training...:  17% 2408/13907 [1:29:44<9:20:40,  2.93s/it][A
Training...:  17% 2409/13907 [1:29:47<9:11:36,  2.88s/it][A
Training...:  17% 2410/13907 [1:29:50<9:01:13,  2.82s/it][A
Training...:  17% 2411/13907 [1:29:53<8:50:53,  2.77s/it][A
Training...:  17% 2412/13907 [1:29:55<8:41:11,  2.72s/it][A
Training...:  17% 2413/13907 [1:29:58<8:33:20,  2.68s/it][A
Training...:  17% 2414/13907 [1:30:00<8:26:15,  2.64s/it][A
Training...:  17% 2415/13907 [1:30:03<8:17:47,  2.60s/it][A
Training...:  17% 2416/13907 [1:30:05<8:09:31,  2.56s/it][A
Training...:  17% 2417/13907 [1:30:08<8:02:51,  2.52s/it][A
Training...:  17% 2418/13907 [1:30:10<7:54:03,  2.48s/it][A
Training...:  17% 2419/13907 [1:30:12<7:47:43,  2.44s/it][A
Training...:  17% 2420/13907 [1:30:15<7:43:41,  2.42s/it][A
Training...:  17% 2421/13907 [1:30:17<7:38:38,  2.40s/it][A
Training...:  17% 2422/13907 [1:30:20<7:36:17,  2.38s/it][A
Training...:  17% 2423/13907 [1:30:22<7:29:50,  2.35s/it][A
Training...:  17% 2424/13907 [1:30:24<7:20:18,  2.30s/it][A
Training...:  17% 2425/13907 [1:30:26<7:12:31,  2.26s/it][A
Training...:  17% 2426/13907 [1:30:28<7:05:44,  2.22s/it][A
Training...:  17% 2427/13907 [1:30:30<7:00:15,  2.20s/it][A
Training...:  17% 2428/13907 [1:30:33<6:55:46,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:01:07<8:52:18, 31938.93s/it]
Training...:  17% 2428/13907 [1:30:35<6:55:46,  2.17s/it][A
Training...:  17% 2429/13907 [1:30:35<7:10:07,  2.25s/it][A
Training...:  17% 2430/13907 [1:30:37<7:02:27,  2.21s/it][A
Training...:  17% 2431/13907 [1:30:39<6:50:27,  2.15s/it][A
Training...:  17% 2432/13907 [1:30:41<6:40:32,  2.09s/it][A
Training...:  17% 2433/13907 [1:30:43<6:31:17,  2.05s/it][A
Training...:  18% 2434/13907 [1:30:45<6:23:22,  2.00s/it][A
Training...:  18% 2435/13907 [1:30:47<6:16:38,  1.97s/it][A
Training...:  18% 2436/13907 [1:30:49<6:09:11,  1.93s/it][A
Training...:  18% 2437/13907 [1:30:50<6:02:13,  1.89s/it][A
Training...:  18% 2438/13907 [1:30:52<5:55:27,  1.86s/it][A
Training...:  18% 2439/13907 [1:30:54<5:49:12,  1.83s/it][A
Training...:  18% 2440/13907 [1:30:56<5:43:41,  1.80s/it][A
Training...:  18% 2441/13907 [1:30:57<5:37:11,  1.76s/it][A
Training...:  18% 2442/13907 [1:30:59<5:30:46,  1.73s/it][A
Training...:  18% 2443/13907 [1:31:01<5:23:44,  1.69s/it][A
Training...:  18% 2444/13907 [1:31:02<5:16:36,  1.66s/it][A
Training...:  18% 2445/13907 [1:31:04<5:10:12,  1.62s/it][A
Training...:  18% 2446/13907 [1:31:05<5:02:27,  1.58s/it][A
Training...:  18% 2447/13907 [1:31:07<4:53:02,  1.53s/it][A
Training...:  18% 2448/13907 [1:31:08<4:42:03,  1.48s/it][A
Training...:  18% 2449/13907 [1:31:09<4:29:31,  1.41s/it][A
Training...:  18% 2450/13907 [1:31:10<4:10:32,  1.31s/it][A
Training...:  18% 2451/13907 [1:31:14<6:30:29,  2.05s/it][A
Training...:  18% 2452/13907 [1:31:18<7:54:46,  2.49s/it][A
Training...:  18% 2453/13907 [1:31:21<8:37:53,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:01:56<8:52:18, 31938.93s/it]
Training...:  18% 2453/13907 [1:31:24<8:37:53,  2.71s/it][A
Training...:  18% 2454/13907 [1:31:24<9:26:31,  2.97s/it][A
Training...:  18% 2455/13907 [1:31:28<9:36:11,  3.02s/it][A
Training...:  18% 2456/13907 [1:31:31<9:31:47,  3.00s/it][A
Training...:  18% 2457/13907 [1:31:33<9:28:59,  2.98s/it][A
Training...:  18% 2458/13907 [1:31:36<9:30:45,  2.99s/it][A
Training...:  18% 2459/13907 [1:31:39<9:24:36,  2.96s/it][A
Training...:  18% 2460/13907 [1:31:42<9:11:19,  2.89s/it][A
Training...:  18% 2461/13907 [1:31:45<8:59:39,  2.83s/it][A
Training...:  18% 2462/13907 [1:31:47<8:47:18,  2.76s/it][A
Training...:  18% 2463/13907 [1:31:50<8:38:07,  2.72s/it][A
Training...:  18% 2464/13907 [1:31:53<8:27:00,  2.66s/it][A
Training...:  18% 2465/13907 [1:31:55<8:18:00,  2.61s/it][A
Training...:  18% 2466/13907 [1:31:57<8:09:05,  2.56s/it][A
Training...:  18% 2467/13907 [1:32:00<8:00:48,  2.52s/it][A
Training...:  18% 2468/13907 [1:32:02<7:52:54,  2.48s/it][A
Training...:  18% 2469/13907 [1:32:05<7:45:03,  2.44s/it][A
Training...:  18% 2470/13907 [1:32:07<7:37:24,  2.40s/it][A
Training...:  18% 2471/13907 [1:32:09<7:30:33,  2.36s/it][A
Training...:  18% 2472/13907 [1:32:11<7:23:28,  2.33s/it][A
Training...:  18% 2473/13907 [1:32:14<7:17:06,  2.29s/it][A
Training...:  18% 2474/13907 [1:32:16<7:09:25,  2.25s/it][A
Training...:  18% 2475/13907 [1:32:18<7:03:35,  2.22s/it][A
Training...:  18% 2476/13907 [1:32:20<6:57:56,  2.19s/it][A
Training...:  18% 2477/13907 [1:32:22<6:53:08,  2.17s/it][A
Training...:  18% 2478/13907 [1:32:24<6:47:31,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:02:59<8:52:18, 31938.93s/it]
Training...:  18% 2478/13907 [1:32:27<6:47:31,  2.14s/it][A
Training...:  18% 2479/13907 [1:32:27<7:00:13,  2.21s/it][A
Training...:  18% 2480/13907 [1:32:29<6:52:41,  2.17s/it][A
Training...:  18% 2481/13907 [1:32:31<6:42:58,  2.12s/it][A
Training...:  18% 2482/13907 [1:32:33<6:33:09,  2.06s/it][A
Training...:  18% 2483/13907 [1:32:35<6:26:18,  2.03s/it][A
Training...:  18% 2484/13907 [1:32:37<6:20:36,  2.00s/it][A
Training...:  18% 2485/13907 [1:32:38<6:15:23,  1.97s/it][A
Training...:  18% 2486/13907 [1:32:40<6:09:00,  1.94s/it][A
Training...:  18% 2487/13907 [1:32:42<6:03:39,  1.91s/it][A
Training...:  18% 2488/13907 [1:32:44<5:57:46,  1.88s/it][A
Training...:  18% 2489/13907 [1:32:46<5:52:30,  1.85s/it][A
Training...:  18% 2490/13907 [1:32:47<5:44:59,  1.81s/it][A
Training...:  18% 2491/13907 [1:32:49<5:37:14,  1.77s/it][A
Training...:  18% 2492/13907 [1:32:51<5:29:54,  1.73s/it][A
Training...:  18% 2493/13907 [1:32:52<5:23:46,  1.70s/it][A
Training...:  18% 2494/13907 [1:32:54<5:17:43,  1.67s/it][A
Training...:  18% 2495/13907 [1:32:56<5:10:54,  1.63s/it][A
Training...:  18% 2496/13907 [1:32:57<5:02:18,  1.59s/it][A
Training...:  18% 2497/13907 [1:32:58<4:51:57,  1.54s/it][A
Training...:  18% 2498/13907 [1:33:00<4:41:31,  1.48s/it][A
Training...:  18% 2499/13907 [1:33:01<4:26:35,  1.40s/it][A
Training...:  18% 2500/13907 [1:33:02<4:04:30,  1.29s/it][A
Training...:  18% 2501/13907 [1:33:06<6:23:35,  2.02s/it][A
Training...:  18% 2502/13907 [1:33:09<7:49:13,  2.47s/it][A
Training...:  18% 2503/13907 [1:33:13<8:37:22,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:03:48<8:52:18, 31938.93s/it]
Training...:  18% 2503/13907 [1:33:16<8:37:22,  2.72s/it][A
Training...:  18% 2504/13907 [1:33:16<9:28:43,  2.99s/it][A
Training...:  18% 2505/13907 [1:33:19<9:38:48,  3.05s/it][A
Training...:  18% 2506/13907 [1:33:22<9:34:37,  3.02s/it][A
Training...:  18% 2507/13907 [1:33:25<9:27:10,  2.99s/it][A
Training...:  18% 2508/13907 [1:33:28<9:15:54,  2.93s/it][A
Training...:  18% 2509/13907 [1:33:31<9:07:24,  2.88s/it][A
Training...:  18% 2510/13907 [1:33:34<8:58:13,  2.83s/it][A
Training...:  18% 2511/13907 [1:33:36<8:50:19,  2.79s/it][A
Training...:  18% 2512/13907 [1:33:39<8:38:45,  2.73s/it][A
Training...:  18% 2513/13907 [1:33:41<8:31:26,  2.69s/it][A
Training...:  18% 2514/13907 [1:33:44<8:22:28,  2.65s/it][A
Training...:  18% 2515/13907 [1:33:46<8:14:31,  2.60s/it][A
Training...:  18% 2516/13907 [1:33:49<8:06:07,  2.56s/it][A
Training...:  18% 2517/13907 [1:33:51<7:56:38,  2.51s/it][A
Training...:  18% 2518/13907 [1:33:54<7:50:08,  2.48s/it][A
Training...:  18% 2519/13907 [1:33:56<7:42:46,  2.44s/it][A
Training...:  18% 2520/13907 [1:33:58<7:39:11,  2.42s/it][A
Training...:  18% 2521/13907 [1:34:01<7:37:15,  2.41s/it][A
Training...:  18% 2522/13907 [1:34:03<7:28:47,  2.37s/it][A
Training...:  18% 2523/13907 [1:34:05<7:19:53,  2.32s/it][A
Training...:  18% 2524/13907 [1:34:07<7:10:59,  2.27s/it][A
Training...:  18% 2525/13907 [1:34:10<7:03:46,  2.23s/it][A
Training...:  18% 2526/13907 [1:34:12<6:56:04,  2.19s/it][A
Training...:  18% 2527/13907 [1:34:14<6:49:32,  2.16s/it][A
Training...:  18% 2528/13907 [1:34:16<6:43:14,  2.13s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:04:50<8:52:18, 31938.93s/it]
Training...:  18% 2528/13907 [1:34:18<6:43:14,  2.13s/it][A
Training...:  18% 2529/13907 [1:34:18<6:54:57,  2.19s/it][A
Training...:  18% 2530/13907 [1:34:20<6:48:55,  2.16s/it][A
Training...:  18% 2531/13907 [1:34:22<6:38:05,  2.10s/it][A
Training...:  18% 2532/13907 [1:34:24<6:30:20,  2.06s/it][A
Training...:  18% 2533/13907 [1:34:26<6:22:45,  2.02s/it][A
Training...:  18% 2534/13907 [1:34:28<6:14:43,  1.98s/it][A
Training...:  18% 2535/13907 [1:34:30<6:07:39,  1.94s/it][A
Training...:  18% 2536/13907 [1:34:32<6:02:07,  1.91s/it][A
Training...:  18% 2537/13907 [1:34:34<5:57:02,  1.88s/it][A
Training...:  18% 2538/13907 [1:34:35<5:50:47,  1.85s/it][A
Training...:  18% 2539/13907 [1:34:37<5:45:14,  1.82s/it][A
Training...:  18% 2540/13907 [1:34:39<5:38:45,  1.79s/it][A
Training...:  18% 2541/13907 [1:34:40<5:32:15,  1.75s/it][A
Training...:  18% 2542/13907 [1:34:42<5:25:28,  1.72s/it][A
Training...:  18% 2543/13907 [1:34:44<5:17:31,  1.68s/it][A
Training...:  18% 2544/13907 [1:34:45<5:12:14,  1.65s/it][A
Training...:  18% 2545/13907 [1:34:47<5:04:07,  1.61s/it][A
Training...:  18% 2546/13907 [1:34:48<4:55:39,  1.56s/it][A
Training...:  18% 2547/13907 [1:34:50<4:45:28,  1.51s/it][A
Training...:  18% 2548/13907 [1:34:51<4:33:46,  1.45s/it][A
Training...:  18% 2549/13907 [1:34:52<4:22:43,  1.39s/it][A
Training...:  18% 2550/13907 [1:34:53<4:03:38,  1.29s/it][A
Training...:  18% 2551/13907 [1:34:57<6:22:33,  2.02s/it][A
Training...:  18% 2552/13907 [1:35:00<7:43:17,  2.45s/it][A
Training...:  18% 2553/13907 [1:35:04<8:27:06,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:05:39<8:52:18, 31938.93s/it]
Training...:  18% 2553/13907 [1:35:07<8:27:06,  2.68s/it][A
Training...:  18% 2554/13907 [1:35:07<9:20:25,  2.96s/it][A
Training...:  18% 2555/13907 [1:35:10<9:35:35,  3.04s/it][A
Training...:  18% 2556/13907 [1:35:13<9:35:07,  3.04s/it][A
Training...:  18% 2557/13907 [1:35:16<9:24:39,  2.98s/it][A
Training...:  18% 2558/13907 [1:35:19<9:14:29,  2.93s/it][A
Training...:  18% 2559/13907 [1:35:22<9:04:11,  2.88s/it][A
Training...:  18% 2560/13907 [1:35:25<8:53:59,  2.82s/it][A
Training...:  18% 2561/13907 [1:35:27<8:45:02,  2.78s/it][A
Training...:  18% 2562/13907 [1:35:30<8:35:00,  2.72s/it][A
Training...:  18% 2563/13907 [1:35:32<8:25:04,  2.67s/it][A
Training...:  18% 2564/13907 [1:35:35<8:15:04,  2.62s/it][A
Training...:  18% 2565/13907 [1:35:37<8:07:06,  2.58s/it][A
Training...:  18% 2566/13907 [1:35:40<7:59:04,  2.53s/it][A
Training...:  18% 2567/13907 [1:35:42<7:52:30,  2.50s/it][A
Training...:  18% 2568/13907 [1:35:45<7:44:18,  2.46s/it][A
Training...:  18% 2569/13907 [1:35:47<7:39:05,  2.43s/it][A
Training...:  18% 2570/13907 [1:35:49<7:32:05,  2.39s/it][A
Training...:  18% 2571/13907 [1:35:52<7:25:31,  2.36s/it][A
Training...:  18% 2572/13907 [1:35:54<7:19:21,  2.33s/it][A
Training...:  19% 2573/13907 [1:35:56<7:14:19,  2.30s/it][A
Training...:  19% 2574/13907 [1:35:58<7:07:05,  2.26s/it][A
Training...:  19% 2575/13907 [1:36:00<7:02:03,  2.23s/it][A
Training...:  19% 2576/13907 [1:36:02<6:55:25,  2.20s/it][A
Training...:  19% 2577/13907 [1:36:05<6:49:04,  2.17s/it][A
Training...:  19% 2578/13907 [1:36:07<6:42:43,  2.13s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:06:41<8:52:18, 31938.93s/it]
Training...:  19% 2578/13907 [1:36:09<6:42:43,  2.13s/it][A
Training...:  19% 2579/13907 [1:36:09<6:54:19,  2.19s/it][A
Training...:  19% 2580/13907 [1:36:11<6:47:23,  2.16s/it][A
Training...:  19% 2581/13907 [1:36:13<6:37:53,  2.11s/it][A
Training...:  19% 2582/13907 [1:36:15<6:29:44,  2.06s/it][A
Training...:  19% 2583/13907 [1:36:17<6:22:47,  2.03s/it][A
Training...:  19% 2584/13907 [1:36:19<6:16:25,  1.99s/it][A
Training...:  19% 2585/13907 [1:36:21<6:09:01,  1.96s/it][A
Training...:  19% 2586/13907 [1:36:23<6:03:30,  1.93s/it][A
Training...:  19% 2587/13907 [1:36:24<5:58:55,  1.90s/it][A
Training...:  19% 2588/13907 [1:36:26<5:53:11,  1.87s/it][A
Training...:  19% 2589/13907 [1:36:28<5:46:12,  1.84s/it][A
Training...:  19% 2590/13907 [1:36:30<5:38:01,  1.79s/it][A
Training...:  19% 2591/13907 [1:36:31<5:30:00,  1.75s/it][A
Training...:  19% 2592/13907 [1:36:33<5:22:27,  1.71s/it][A
Training...:  19% 2593/13907 [1:36:35<5:15:41,  1.67s/it][A
Training...:  19% 2594/13907 [1:36:36<5:08:55,  1.64s/it][A
Training...:  19% 2595/13907 [1:36:38<5:00:42,  1.60s/it][A
Training...:  19% 2596/13907 [1:36:39<4:51:32,  1.55s/it][A
Training...:  19% 2597/13907 [1:36:40<4:42:03,  1.50s/it][A
Training...:  19% 2598/13907 [1:36:42<4:31:13,  1.44s/it][A
Training...:  19% 2599/13907 [1:36:43<4:19:41,  1.38s/it][A
Training...:  19% 2600/13907 [1:36:44<4:03:07,  1.29s/it][A
Training...:  19% 2601/13907 [1:36:48<6:24:44,  2.04s/it][A
Training...:  19% 2602/13907 [1:36:51<7:49:55,  2.49s/it][A
Training...:  19% 2603/13907 [1:36:55<8:35:36,  2.74s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:07:30<8:52:18, 31938.93s/it]
Training...:  19% 2603/13907 [1:36:58<8:35:36,  2.74s/it][A
Training...:  19% 2604/13907 [1:36:58<9:29:16,  3.02s/it][A
Training...:  19% 2605/13907 [1:37:02<9:37:31,  3.07s/it][A
Training...:  19% 2606/13907 [1:37:05<9:32:50,  3.04s/it][A
Training...:  19% 2607/13907 [1:37:07<9:24:00,  2.99s/it][A
Training...:  19% 2608/13907 [1:37:10<9:12:58,  2.94s/it][A
Training...:  19% 2609/13907 [1:37:13<9:04:15,  2.89s/it][A
Training...:  19% 2610/13907 [1:37:16<8:55:29,  2.84s/it][A
Training...:  19% 2611/13907 [1:37:18<8:45:55,  2.79s/it][A
Training...:  19% 2612/13907 [1:37:21<8:37:07,  2.75s/it][A
Training...:  19% 2613/13907 [1:37:24<8:26:52,  2.69s/it][A
Training...:  19% 2614/13907 [1:37:26<8:18:44,  2.65s/it][A
Training...:  19% 2615/13907 [1:37:29<8:08:58,  2.60s/it][A
Training...:  19% 2616/13907 [1:37:31<8:04:44,  2.58s/it][A
Training...:  19% 2617/13907 [1:37:34<7:58:36,  2.54s/it][A
Training...:  19% 2618/13907 [1:37:36<7:48:08,  2.49s/it][A
Training...:  19% 2619/13907 [1:37:38<7:40:28,  2.45s/it][A
Training...:  19% 2620/13907 [1:37:41<7:33:52,  2.41s/it][A
Training...:  19% 2621/13907 [1:37:43<7:27:30,  2.38s/it][A
Training...:  19% 2622/13907 [1:37:45<7:21:04,  2.35s/it][A
Training...:  19% 2623/13907 [1:37:47<7:13:39,  2.31s/it][A
Training...:  19% 2624/13907 [1:37:50<7:06:34,  2.27s/it][A
Training...:  19% 2625/13907 [1:37:52<7:00:26,  2.24s/it][A
Training...:  19% 2626/13907 [1:37:54<6:54:54,  2.21s/it][A
Training...:  19% 2627/13907 [1:37:56<6:50:11,  2.18s/it][A
Training...:  19% 2628/13907 [1:37:58<6:43:20,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:08:32<8:52:18, 31938.93s/it]
Training...:  19% 2628/13907 [1:38:00<6:43:20,  2.15s/it][A
Training...:  19% 2629/13907 [1:38:00<6:54:43,  2.21s/it][A
Training...:  19% 2630/13907 [1:38:03<6:48:14,  2.17s/it][A
Training...:  19% 2631/13907 [1:38:05<6:37:25,  2.11s/it][A
Training...:  19% 2632/13907 [1:38:07<6:30:13,  2.08s/it][A
Training...:  19% 2633/13907 [1:38:08<6:22:59,  2.04s/it][A
Training...:  19% 2634/13907 [1:38:10<6:15:59,  2.00s/it][A
Training...:  19% 2635/13907 [1:38:12<6:08:07,  1.96s/it][A
Training...:  19% 2636/13907 [1:38:14<6:01:37,  1.93s/it][A
Training...:  19% 2637/13907 [1:38:16<5:56:39,  1.90s/it][A
Training...:  19% 2638/13907 [1:38:18<5:50:08,  1.86s/it][A
Training...:  19% 2639/13907 [1:38:19<5:44:37,  1.84s/it][A
Training...:  19% 2640/13907 [1:38:21<5:38:21,  1.80s/it][A
Training...:  19% 2641/13907 [1:38:23<5:32:08,  1.77s/it][A
Training...:  19% 2642/13907 [1:38:25<5:25:05,  1.73s/it][A
Training...:  19% 2643/13907 [1:38:26<5:18:01,  1.69s/it][A
Training...:  19% 2644/13907 [1:38:28<5:12:11,  1.66s/it][A
Training...:  19% 2645/13907 [1:38:29<5:02:57,  1.61s/it][A
Training...:  19% 2646/13907 [1:38:31<4:53:21,  1.56s/it][A
Training...:  19% 2647/13907 [1:38:32<4:42:51,  1.51s/it][A
Training...:  19% 2648/13907 [1:38:33<4:31:42,  1.45s/it][A
Training...:  19% 2649/13907 [1:38:35<4:18:36,  1.38s/it][A
Training...:  19% 2650/13907 [1:38:36<3:59:36,  1.28s/it][A
Training...:  19% 2651/13907 [1:38:39<6:19:46,  2.02s/it][A
Training...:  19% 2652/13907 [1:38:43<7:47:53,  2.49s/it][A
Training...:  19% 2653/13907 [1:38:46<8:37:04,  2.76s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:09:22<8:52:18, 31938.93s/it]
Training...:  19% 2653/13907 [1:38:50<8:37:04,  2.76s/it][A
Training...:  19% 2654/13907 [1:38:50<9:29:21,  3.04s/it][A
Training...:  19% 2655/13907 [1:38:53<9:36:29,  3.07s/it][A
Training...:  19% 2656/13907 [1:38:56<9:31:27,  3.05s/it][A
Training...:  19% 2657/13907 [1:38:59<9:23:18,  3.00s/it][A
Training...:  19% 2658/13907 [1:39:02<9:15:36,  2.96s/it][A
Training...:  19% 2659/13907 [1:39:05<9:06:03,  2.91s/it][A
Training...:  19% 2660/13907 [1:39:08<8:58:26,  2.87s/it][A
Training...:  19% 2661/13907 [1:39:10<8:55:09,  2.86s/it][A
Training...:  19% 2662/13907 [1:39:13<8:42:28,  2.79s/it][A
Training...:  19% 2663/13907 [1:39:16<8:32:16,  2.73s/it][A
Training...:  19% 2664/13907 [1:39:18<8:22:19,  2.68s/it][A
Training...:  19% 2665/13907 [1:39:21<8:13:49,  2.64s/it][A
Training...:  19% 2666/13907 [1:39:23<8:05:09,  2.59s/it][A
Training...:  19% 2667/13907 [1:39:26<7:57:34,  2.55s/it][A
Training...:  19% 2668/13907 [1:39:28<7:49:15,  2.51s/it][A
Training...:  19% 2669/13907 [1:39:30<7:42:03,  2.47s/it][A
Training...:  19% 2670/13907 [1:39:33<7:36:00,  2.43s/it][A
Training...:  19% 2671/13907 [1:39:35<7:29:21,  2.40s/it][A
Training...:  19% 2672/13907 [1:39:37<7:22:20,  2.36s/it][A
Training...:  19% 2673/13907 [1:39:40<7:15:32,  2.33s/it][A
Training...:  19% 2674/13907 [1:39:42<7:08:03,  2.29s/it][A
Training...:  19% 2675/13907 [1:39:44<7:01:54,  2.25s/it][A
Training...:  19% 2676/13907 [1:39:46<6:56:25,  2.22s/it][A
Training...:  19% 2677/13907 [1:39:48<6:51:07,  2.20s/it][A
Training...:  19% 2678/13907 [1:39:50<6:45:00,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:10:25<8:52:18, 31938.93s/it]
Training...:  19% 2678/13907 [1:39:53<6:45:00,  2.16s/it][A
Training...:  19% 2679/13907 [1:39:53<6:56:47,  2.23s/it][A
Training...:  19% 2680/13907 [1:39:55<6:51:41,  2.20s/it][A
Training...:  19% 2681/13907 [1:39:57<6:40:56,  2.14s/it][A
Training...:  19% 2682/13907 [1:39:59<6:32:40,  2.10s/it][A
Training...:  19% 2683/13907 [1:40:01<6:25:03,  2.06s/it][A
Training...:  19% 2684/13907 [1:40:03<6:17:38,  2.02s/it][A
Training...:  19% 2685/13907 [1:40:05<6:11:47,  1.99s/it][A
Training...:  19% 2686/13907 [1:40:07<6:05:17,  1.95s/it][A
Training...:  19% 2687/13907 [1:40:08<5:59:20,  1.92s/it][A
Training...:  19% 2688/13907 [1:40:10<5:52:46,  1.89s/it][A
Training...:  19% 2689/13907 [1:40:12<5:46:24,  1.85s/it][A
Training...:  19% 2690/13907 [1:40:14<5:40:25,  1.82s/it][A
Training...:  19% 2691/13907 [1:40:15<5:34:32,  1.79s/it][A
Training...:  19% 2692/13907 [1:40:17<5:27:59,  1.75s/it][A
Training...:  19% 2693/13907 [1:40:19<5:21:24,  1.72s/it][A
Training...:  19% 2694/13907 [1:40:20<5:13:48,  1.68s/it][A
Training...:  19% 2695/13907 [1:40:22<5:08:02,  1.65s/it][A
Training...:  19% 2696/13907 [1:40:23<4:59:40,  1.60s/it][A
Training...:  19% 2697/13907 [1:40:25<4:52:01,  1.56s/it][A
Training...:  19% 2698/13907 [1:40:26<4:42:54,  1.51s/it][A
Training...:  19% 2699/13907 [1:40:28<4:29:28,  1.44s/it][A
Training...:  19% 2700/13907 [1:40:29<4:10:03,  1.34s/it][A
Training...:  19% 2701/13907 [1:40:32<6:26:52,  2.07s/it][A
Training...:  19% 2702/13907 [1:40:36<7:45:42,  2.49s/it][A
Training...:  19% 2703/13907 [1:40:39<8:24:36,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:11:15<8:52:18, 31938.93s/it]
Training...:  19% 2703/13907 [1:40:43<8:24:36,  2.70s/it][A
Training...:  19% 2704/13907 [1:40:43<9:12:29,  2.96s/it][A
Training...:  19% 2705/13907 [1:40:46<9:20:14,  3.00s/it][A
Training...:  19% 2706/13907 [1:40:49<9:11:50,  2.96s/it][A
Training...:  19% 2707/13907 [1:40:51<9:04:10,  2.92s/it][A
Training...:  19% 2708/13907 [1:40:54<8:54:19,  2.86s/it][A
Training...:  19% 2709/13907 [1:40:57<8:44:20,  2.81s/it][A
Training...:  19% 2710/13907 [1:40:59<8:36:49,  2.77s/it][A
Training...:  19% 2711/13907 [1:41:02<8:28:11,  2.72s/it][A
Training...:  20% 2712/13907 [1:41:05<8:19:34,  2.68s/it][A
Training...:  20% 2713/13907 [1:41:07<8:13:03,  2.64s/it][A
Training...:  20% 2714/13907 [1:41:10<8:05:26,  2.60s/it][A
Training...:  20% 2715/13907 [1:41:12<7:59:42,  2.57s/it][A
Training...:  20% 2716/13907 [1:41:15<7:53:02,  2.54s/it][A
Training...:  20% 2717/13907 [1:41:17<7:46:36,  2.50s/it][A
Training...:  20% 2718/13907 [1:41:20<7:41:12,  2.47s/it][A
Training...:  20% 2719/13907 [1:41:22<7:33:26,  2.43s/it][A
Training...:  20% 2720/13907 [1:41:24<7:29:00,  2.41s/it][A
Training...:  20% 2721/13907 [1:41:26<7:19:33,  2.36s/it][A
Training...:  20% 2722/13907 [1:41:29<7:14:49,  2.33s/it][A
Training...:  20% 2723/13907 [1:41:31<7:11:51,  2.32s/it][A
Training...:  20% 2724/13907 [1:41:33<7:04:42,  2.28s/it][A
Training...:  20% 2725/13907 [1:41:35<6:56:37,  2.24s/it][A
Training...:  20% 2726/13907 [1:41:37<6:49:34,  2.20s/it][A
Training...:  20% 2727/13907 [1:41:40<6:43:11,  2.16s/it][A
Training...:  20% 2728/13907 [1:41:42<6:37:17,  2.13s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:12:16<8:52:18, 31938.93s/it]
Training...:  20% 2728/13907 [1:41:44<6:37:17,  2.13s/it][A
Training...:  20% 2729/13907 [1:41:44<6:49:13,  2.20s/it][A
Training...:  20% 2730/13907 [1:41:46<6:42:43,  2.16s/it][A
Training...:  20% 2731/13907 [1:41:48<6:33:27,  2.11s/it][A
Training...:  20% 2732/13907 [1:41:50<6:27:02,  2.08s/it][A
Training...:  20% 2733/13907 [1:41:52<6:19:24,  2.04s/it][A
Training...:  20% 2734/13907 [1:41:54<6:11:57,  2.00s/it][A
Training...:  20% 2735/13907 [1:41:56<6:04:29,  1.96s/it][A
Training...:  20% 2736/13907 [1:41:58<5:58:01,  1.92s/it][A
Training...:  20% 2737/13907 [1:41:59<5:51:52,  1.89s/it][A
Training...:  20% 2738/13907 [1:42:01<5:47:13,  1.87s/it][A
Training...:  20% 2739/13907 [1:42:03<5:40:52,  1.83s/it][A
Training...:  20% 2740/13907 [1:42:05<5:33:53,  1.79s/it][A
Training...:  20% 2741/13907 [1:42:06<5:27:48,  1.76s/it][A
Training...:  20% 2742/13907 [1:42:08<5:20:32,  1.72s/it][A
Training...:  20% 2743/13907 [1:42:10<5:13:40,  1.69s/it][A
Training...:  20% 2744/13907 [1:42:11<5:06:04,  1.65s/it][A
Training...:  20% 2745/13907 [1:42:13<4:58:22,  1.60s/it][A
Training...:  20% 2746/13907 [1:42:14<4:49:44,  1.56s/it][A
Training...:  20% 2747/13907 [1:42:15<4:39:58,  1.51s/it][A
Training...:  20% 2748/13907 [1:42:17<4:28:57,  1.45s/it][A
Training...:  20% 2749/13907 [1:42:18<4:16:32,  1.38s/it][A
Training...:  20% 2750/13907 [1:42:19<3:58:34,  1.28s/it][A
Training...:  20% 2751/13907 [1:42:23<6:14:43,  2.02s/it][A
Training...:  20% 2752/13907 [1:42:26<7:39:01,  2.47s/it][A
Training...:  20% 2753/13907 [1:42:30<8:25:28,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:13:05<8:52:18, 31938.93s/it]
Training...:  20% 2753/13907 [1:42:33<8:25:28,  2.72s/it][A
Training...:  20% 2754/13907 [1:42:33<9:15:40,  2.99s/it][A
Training...:  20% 2755/13907 [1:42:36<9:25:07,  3.04s/it][A
Training...:  20% 2756/13907 [1:42:39<9:22:26,  3.03s/it][A
Training...:  20% 2757/13907 [1:42:42<9:16:58,  3.00s/it][A
Training...:  20% 2758/13907 [1:42:45<9:14:11,  2.98s/it][A
Training...:  20% 2759/13907 [1:42:48<9:02:32,  2.92s/it][A
Training...:  20% 2760/13907 [1:42:51<8:52:36,  2.87s/it][A
Training...:  20% 2761/13907 [1:42:53<8:44:02,  2.82s/it][A
Training...:  20% 2762/13907 [1:42:56<8:35:27,  2.78s/it][A
Training...:  20% 2763/13907 [1:42:59<8:27:24,  2.73s/it][A
Training...:  20% 2764/13907 [1:43:01<8:21:03,  2.70s/it][A
Training...:  20% 2765/13907 [1:43:04<8:16:05,  2.67s/it][A
Training...:  20% 2766/13907 [1:43:07<8:06:56,  2.62s/it][A
Training...:  20% 2767/13907 [1:43:09<7:58:24,  2.58s/it][A
Training...:  20% 2768/13907 [1:43:11<7:50:45,  2.54s/it][A
Training...:  20% 2769/13907 [1:43:14<7:46:13,  2.51s/it][A
Training...:  20% 2770/13907 [1:43:16<7:39:10,  2.47s/it][A
Training...:  20% 2771/13907 [1:43:19<7:32:48,  2.44s/it][A
Training...:  20% 2772/13907 [1:43:21<7:28:20,  2.42s/it][A
Training...:  20% 2773/13907 [1:43:23<7:22:09,  2.38s/it][A
Training...:  20% 2774/13907 [1:43:26<7:16:13,  2.35s/it][A
Training...:  20% 2775/13907 [1:43:28<7:10:32,  2.32s/it][A
Training...:  20% 2776/13907 [1:43:30<7:03:18,  2.28s/it][A
Training...:  20% 2777/13907 [1:43:32<6:59:03,  2.26s/it][A
Training...:  20% 2778/13907 [1:43:34<6:53:15,  2.23s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:14:09<8:52:18, 31938.93s/it]
Training...:  20% 2778/13907 [1:43:37<6:53:15,  2.23s/it][A
Training...:  20% 2779/13907 [1:43:37<7:04:12,  2.29s/it][A
Training...:  20% 2780/13907 [1:43:39<6:53:53,  2.23s/it][A
Training...:  20% 2781/13907 [1:43:41<6:42:58,  2.17s/it][A
Training...:  20% 2782/13907 [1:43:43<6:32:09,  2.12s/it][A
Training...:  20% 2783/13907 [1:43:45<6:23:56,  2.07s/it][A
Training...:  20% 2784/13907 [1:43:47<6:17:12,  2.03s/it][A
Training...:  20% 2785/13907 [1:43:49<6:09:50,  2.00s/it][A
Training...:  20% 2786/13907 [1:43:51<6:03:37,  1.96s/it][A
Training...:  20% 2787/13907 [1:43:52<5:55:49,  1.92s/it][A
Training...:  20% 2788/13907 [1:43:54<5:47:41,  1.88s/it][A
Training...:  20% 2789/13907 [1:43:56<5:42:49,  1.85s/it][A
Training...:  20% 2790/13907 [1:43:58<5:36:56,  1.82s/it][A
Training...:  20% 2791/13907 [1:43:59<5:29:44,  1.78s/it][A
Training...:  20% 2792/13907 [1:44:01<5:23:07,  1.74s/it][A
Training...:  20% 2793/13907 [1:44:03<5:17:34,  1.71s/it][A
Training...:  20% 2794/13907 [1:44:04<5:11:32,  1.68s/it][A
Training...:  20% 2795/13907 [1:44:06<5:01:44,  1.63s/it][A
Training...:  20% 2796/13907 [1:44:07<4:50:35,  1.57s/it][A
Training...:  20% 2797/13907 [1:44:09<4:39:39,  1.51s/it][A
Training...:  20% 2798/13907 [1:44:10<4:27:45,  1.45s/it][A
Training...:  20% 2799/13907 [1:44:11<4:14:55,  1.38s/it][A
Training...:  20% 2800/13907 [1:44:12<3:57:15,  1.28s/it][A
Training...:  20% 2801/13907 [1:44:16<6:11:24,  2.01s/it][A
Training...:  20% 2802/13907 [1:44:19<7:31:05,  2.44s/it][A
Training...:  20% 2803/13907 [1:44:23<8:15:42,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:14:58<8:52:18, 31938.93s/it]
Training...:  20% 2803/13907 [1:44:26<8:15:42,  2.68s/it][A
Training...:  20% 2804/13907 [1:44:26<9:06:07,  2.95s/it][A
Training...:  20% 2805/13907 [1:44:29<9:14:44,  3.00s/it][A
Training...:  20% 2806/13907 [1:44:32<9:09:43,  2.97s/it][A
Training...:  20% 2807/13907 [1:44:35<9:05:05,  2.95s/it][A
Training...:  20% 2808/13907 [1:44:38<8:55:28,  2.89s/it][A
Training...:  20% 2809/13907 [1:44:41<8:46:44,  2.85s/it][A
Training...:  20% 2810/13907 [1:44:43<8:36:43,  2.79s/it][A
Training...:  20% 2811/13907 [1:44:46<8:28:14,  2.75s/it][A
Training...:  20% 2812/13907 [1:44:49<8:19:27,  2.70s/it][A
Training...:  20% 2813/13907 [1:44:51<8:11:42,  2.66s/it][A
Training...:  20% 2814/13907 [1:44:54<8:04:56,  2.62s/it][A
Training...:  20% 2815/13907 [1:44:56<7:57:43,  2.58s/it][A
Training...:  20% 2816/13907 [1:44:59<7:48:35,  2.53s/it][A
Training...:  20% 2817/13907 [1:45:01<7:42:40,  2.50s/it][A
Training...:  20% 2818/13907 [1:45:03<7:37:39,  2.48s/it][A
Training...:  20% 2819/13907 [1:45:06<7:32:46,  2.45s/it][A
Training...:  20% 2820/13907 [1:45:08<7:27:18,  2.42s/it][A
Training...:  20% 2821/13907 [1:45:10<7:22:03,  2.39s/it][A
Training...:  20% 2822/13907 [1:45:13<7:16:27,  2.36s/it][A
Training...:  20% 2823/13907 [1:45:15<7:15:34,  2.36s/it][A
Training...:  20% 2824/13907 [1:45:17<7:10:41,  2.33s/it][A
Training...:  20% 2825/13907 [1:45:20<7:04:49,  2.30s/it][A
Training...:  20% 2826/13907 [1:45:22<6:56:52,  2.26s/it][A
Training...:  20% 2827/13907 [1:45:24<6:51:45,  2.23s/it][A
Training...:  20% 2828/13907 [1:45:26<6:44:51,  2.19s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:16:00<8:52:18, 31938.93s/it]
Training...:  20% 2828/13907 [1:45:28<6:44:51,  2.19s/it][A
Training...:  20% 2829/13907 [1:45:28<6:55:17,  2.25s/it][A
Training...:  20% 2830/13907 [1:45:30<6:45:55,  2.20s/it][A
Training...:  20% 2831/13907 [1:45:32<6:32:44,  2.13s/it][A
Training...:  20% 2832/13907 [1:45:34<6:25:34,  2.09s/it][A
Training...:  20% 2833/13907 [1:45:36<6:16:00,  2.04s/it][A
Training...:  20% 2834/13907 [1:45:38<6:05:56,  1.98s/it][A
Training...:  20% 2835/13907 [1:45:40<5:57:19,  1.94s/it][A
Training...:  20% 2836/13907 [1:45:42<5:49:31,  1.89s/it][A
Training...:  20% 2837/13907 [1:45:44<5:42:50,  1.86s/it][A
Training...:  20% 2838/13907 [1:45:45<5:36:32,  1.82s/it][A
Training...:  20% 2839/13907 [1:45:47<5:30:07,  1.79s/it][A
Training...:  20% 2840/13907 [1:45:49<5:23:27,  1.75s/it][A
Training...:  20% 2841/13907 [1:45:50<5:17:16,  1.72s/it][A
Training...:  20% 2842/13907 [1:45:52<5:11:17,  1.69s/it][A
Training...:  20% 2843/13907 [1:45:54<5:05:50,  1.66s/it][A
Training...:  20% 2844/13907 [1:45:55<4:59:43,  1.63s/it][A
Training...:  20% 2845/13907 [1:45:57<4:52:01,  1.58s/it][A
Training...:  20% 2846/13907 [1:45:58<4:43:14,  1.54s/it][A
Training...:  20% 2847/13907 [1:45:59<4:34:00,  1.49s/it][A
Training...:  20% 2848/13907 [1:46:01<4:23:03,  1.43s/it][A
Training...:  20% 2849/13907 [1:46:02<4:10:38,  1.36s/it][A
Training...:  20% 2850/13907 [1:46:03<3:52:46,  1.26s/it][A
Training...:  21% 2851/13907 [1:46:07<6:09:24,  2.00s/it][A
Training...:  21% 2852/13907 [1:46:10<7:29:07,  2.44s/it][A
Training...:  21% 2853/13907 [1:46:13<8:12:01,  2.67s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:16:49<8:52:18, 31938.93s/it]
Training...:  21% 2853/13907 [1:46:17<8:12:01,  2.67s/it][A
Training...:  21% 2854/13907 [1:46:17<9:00:57,  2.94s/it][A
Training...:  21% 2855/13907 [1:46:20<9:12:11,  3.00s/it][A
Training...:  21% 2856/13907 [1:46:23<9:07:25,  2.97s/it][A
Training...:  21% 2857/13907 [1:46:26<9:01:23,  2.94s/it][A
Training...:  21% 2858/13907 [1:46:29<8:53:05,  2.89s/it][A
Training...:  21% 2859/13907 [1:46:31<8:45:39,  2.85s/it][A
Training...:  21% 2860/13907 [1:46:34<8:35:17,  2.80s/it][A
Training...:  21% 2861/13907 [1:46:37<8:26:58,  2.75s/it][A
Training...:  21% 2862/13907 [1:46:39<8:19:17,  2.71s/it][A
Training...:  21% 2863/13907 [1:46:42<8:11:38,  2.67s/it][A
Training...:  21% 2864/13907 [1:46:44<8:07:17,  2.65s/it][A
Training...:  21% 2865/13907 [1:46:47<8:02:42,  2.62s/it][A
Training...:  21% 2866/13907 [1:46:50<7:56:06,  2.59s/it][A
Training...:  21% 2867/13907 [1:46:52<7:50:21,  2.56s/it][A
Training...:  21% 2868/13907 [1:46:54<7:42:52,  2.52s/it][A
Training...:  21% 2869/13907 [1:46:57<7:35:09,  2.47s/it][A
Training...:  21% 2870/13907 [1:46:59<7:28:10,  2.44s/it][A
Training...:  21% 2871/13907 [1:47:01<7:22:20,  2.40s/it][A
Training...:  21% 2872/13907 [1:47:04<7:16:16,  2.37s/it][A
Training...:  21% 2873/13907 [1:47:06<7:09:08,  2.33s/it][A
Training...:  21% 2874/13907 [1:47:08<7:04:58,  2.31s/it][A
Training...:  21% 2875/13907 [1:47:10<6:58:21,  2.28s/it][A
Training...:  21% 2876/13907 [1:47:13<6:51:02,  2.24s/it][A
Training...:  21% 2877/13907 [1:47:15<6:45:50,  2.21s/it][A
Training...:  21% 2878/13907 [1:47:17<6:42:43,  2.19s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:17:51<8:52:18, 31938.93s/it]
Training...:  21% 2878/13907 [1:47:19<6:42:43,  2.19s/it][A
Training...:  21% 2879/13907 [1:47:19<6:53:42,  2.25s/it][A
Training...:  21% 2880/13907 [1:47:21<6:47:40,  2.22s/it][A
Training...:  21% 2881/13907 [1:47:23<6:34:07,  2.14s/it][A
Training...:  21% 2882/13907 [1:47:25<6:25:33,  2.10s/it][A
Training...:  21% 2883/13907 [1:47:27<6:16:59,  2.05s/it][A
Training...:  21% 2884/13907 [1:47:29<6:09:28,  2.01s/it][A
Training...:  21% 2885/13907 [1:47:31<6:01:31,  1.97s/it][A
Training...:  21% 2886/13907 [1:47:33<5:53:36,  1.93s/it][A
Training...:  21% 2887/13907 [1:47:35<5:47:47,  1.89s/it][A
Training...:  21% 2888/13907 [1:47:37<5:40:56,  1.86s/it][A
Training...:  21% 2889/13907 [1:47:38<5:34:59,  1.82s/it][A
Training...:  21% 2890/13907 [1:47:40<5:28:20,  1.79s/it][A
Training...:  21% 2891/13907 [1:47:42<5:21:15,  1.75s/it][A
Training...:  21% 2892/13907 [1:47:43<5:14:59,  1.72s/it][A
Training...:  21% 2893/13907 [1:47:45<5:08:36,  1.68s/it][A
Training...:  21% 2894/13907 [1:47:46<5:01:50,  1.64s/it][A
Training...:  21% 2895/13907 [1:47:48<4:52:49,  1.60s/it][A
Training...:  21% 2896/13907 [1:47:49<4:43:09,  1.54s/it][A
Training...:  21% 2897/13907 [1:47:51<4:33:38,  1.49s/it][A
Training...:  21% 2898/13907 [1:47:52<4:22:56,  1.43s/it][A
Training...:  21% 2899/13907 [1:47:53<4:10:59,  1.37s/it][A
Training...:  21% 2900/13907 [1:47:54<3:54:19,  1.28s/it][A
Training...:  21% 2901/13907 [1:47:58<6:11:44,  2.03s/it][A
Training...:  21% 2902/13907 [1:48:02<7:33:49,  2.47s/it][A
Training...:  21% 2903/13907 [1:48:05<8:20:26,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:18:41<8:52:18, 31938.93s/it]
Training...:  21% 2903/13907 [1:48:09<8:20:26,  2.73s/it][A
Training...:  21% 2904/13907 [1:48:09<9:09:14,  3.00s/it][A
Training...:  21% 2905/13907 [1:48:12<9:18:12,  3.04s/it][A
Training...:  21% 2906/13907 [1:48:15<9:15:28,  3.03s/it][A
Training...:  21% 2907/13907 [1:48:18<9:08:14,  2.99s/it][A
Training...:  21% 2908/13907 [1:48:20<8:59:19,  2.94s/it][A
Training...:  21% 2909/13907 [1:48:23<8:51:07,  2.90s/it][A
Training...:  21% 2910/13907 [1:48:26<8:41:20,  2.84s/it][A
Training...:  21% 2911/13907 [1:48:29<8:31:49,  2.79s/it][A
Training...:  21% 2912/13907 [1:48:31<8:23:05,  2.75s/it][A
Training...:  21% 2913/13907 [1:48:34<8:13:57,  2.70s/it][A
Training...:  21% 2914/13907 [1:48:36<8:05:53,  2.65s/it][A
Training...:  21% 2915/13907 [1:48:39<7:58:11,  2.61s/it][A
Training...:  21% 2916/13907 [1:48:41<7:54:24,  2.59s/it][A
Training...:  21% 2917/13907 [1:48:44<7:50:22,  2.57s/it][A
Training...:  21% 2918/13907 [1:48:46<7:42:22,  2.52s/it][A
Training...:  21% 2919/13907 [1:48:49<7:33:10,  2.47s/it][A
Training...:  21% 2920/13907 [1:48:51<7:26:15,  2.44s/it][A
Training...:  21% 2921/13907 [1:48:53<7:18:44,  2.40s/it][A
Training...:  21% 2922/13907 [1:48:56<7:11:54,  2.36s/it][A
Training...:  21% 2923/13907 [1:48:58<7:05:24,  2.32s/it][A
Training...:  21% 2924/13907 [1:49:00<6:59:02,  2.29s/it][A
Training...:  21% 2925/13907 [1:49:02<6:53:45,  2.26s/it][A
Training...:  21% 2926/13907 [1:49:04<6:47:54,  2.23s/it][A
Training...:  21% 2927/13907 [1:49:07<6:42:36,  2.20s/it][A
Training...:  21% 2928/13907 [1:49:09<6:37:33,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:19:43<8:52:18, 31938.93s/it]
Training...:  21% 2928/13907 [1:49:11<6:37:33,  2.17s/it][A
Training...:  21% 2929/13907 [1:49:11<6:49:25,  2.24s/it][A
Training...:  21% 2930/13907 [1:49:13<6:42:13,  2.20s/it][A
Training...:  21% 2931/13907 [1:49:15<6:32:24,  2.15s/it][A
Training...:  21% 2932/13907 [1:49:17<6:22:28,  2.09s/it][A
Training...:  21% 2933/13907 [1:49:19<6:16:13,  2.06s/it][A
Training...:  21% 2934/13907 [1:49:21<6:09:36,  2.02s/it][A
Training...:  21% 2935/13907 [1:49:23<6:02:29,  1.98s/it][A
Training...:  21% 2936/13907 [1:49:25<5:55:56,  1.95s/it][A
Training...:  21% 2937/13907 [1:49:27<5:49:02,  1.91s/it][A
Training...:  21% 2938/13907 [1:49:28<5:40:50,  1.86s/it][A
Training...:  21% 2939/13907 [1:49:30<5:34:01,  1.83s/it][A
Training...:  21% 2940/13907 [1:49:32<5:26:48,  1.79s/it][A
Training...:  21% 2941/13907 [1:49:34<5:21:48,  1.76s/it][A
Training...:  21% 2942/13907 [1:49:35<5:15:38,  1.73s/it][A
Training...:  21% 2943/13907 [1:49:37<5:08:07,  1.69s/it][A
Training...:  21% 2944/13907 [1:49:38<5:00:58,  1.65s/it][A
Training...:  21% 2945/13907 [1:49:40<4:53:11,  1.60s/it][A
Training...:  21% 2946/13907 [1:49:41<4:44:03,  1.55s/it][A
Training...:  21% 2947/13907 [1:49:43<4:34:27,  1.50s/it][A
Training...:  21% 2948/13907 [1:49:44<4:23:26,  1.44s/it][A
Training...:  21% 2949/13907 [1:49:45<4:09:59,  1.37s/it][A
Training...:  21% 2950/13907 [1:49:46<3:53:05,  1.28s/it][A
Training...:  21% 2951/13907 [1:49:50<6:12:55,  2.04s/it][A
Training...:  21% 2952/13907 [1:49:54<7:34:09,  2.49s/it][A
Training...:  21% 2953/13907 [1:49:57<8:21:26,  2.75s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:20:33<8:52:18, 31938.93s/it]
Training...:  21% 2953/13907 [1:50:01<8:21:26,  2.75s/it][A
Training...:  21% 2954/13907 [1:50:01<9:11:39,  3.02s/it][A
Training...:  21% 2955/13907 [1:50:04<9:20:03,  3.07s/it][A
Training...:  21% 2956/13907 [1:50:07<9:12:42,  3.03s/it][A
Training...:  21% 2957/13907 [1:50:10<9:06:23,  2.99s/it][A
Training...:  21% 2958/13907 [1:50:12<8:56:18,  2.94s/it][A
Training...:  21% 2959/13907 [1:50:15<8:45:44,  2.88s/it][A
Training...:  21% 2960/13907 [1:50:18<8:35:20,  2.82s/it][A
Training...:  21% 2961/13907 [1:50:21<8:26:21,  2.78s/it][A
Training...:  21% 2962/13907 [1:50:23<8:16:54,  2.72s/it][A
Training...:  21% 2963/13907 [1:50:26<8:09:02,  2.68s/it][A
Training...:  21% 2964/13907 [1:50:28<8:02:19,  2.64s/it][A
Training...:  21% 2965/13907 [1:50:31<7:56:44,  2.61s/it][A
Training...:  21% 2966/13907 [1:50:33<7:49:23,  2.57s/it][A
Training...:  21% 2967/13907 [1:50:36<7:41:21,  2.53s/it][A
Training...:  21% 2968/13907 [1:50:38<7:35:54,  2.50s/it][A
Training...:  21% 2969/13907 [1:50:41<7:30:59,  2.47s/it][A
Training...:  21% 2970/13907 [1:50:43<7:23:00,  2.43s/it][A
Training...:  21% 2971/13907 [1:50:45<7:17:48,  2.40s/it][A
Training...:  21% 2972/13907 [1:50:48<7:12:10,  2.37s/it][A
Training...:  21% 2973/13907 [1:50:50<7:06:45,  2.34s/it][A
Training...:  21% 2974/13907 [1:50:52<7:02:19,  2.32s/it][A
Training...:  21% 2975/13907 [1:50:54<6:57:35,  2.29s/it][A
Training...:  21% 2976/13907 [1:50:56<6:49:29,  2.25s/it][A
Training...:  21% 2977/13907 [1:50:59<6:43:10,  2.21s/it][A
Training...:  21% 2978/13907 [1:51:01<6:35:53,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:21:35<8:52:18, 31938.93s/it]
Training...:  21% 2978/13907 [1:51:03<6:35:53,  2.17s/it][A
Training...:  21% 2979/13907 [1:51:03<6:46:39,  2.23s/it][A
Training...:  21% 2980/13907 [1:51:05<6:39:26,  2.19s/it][A
Training...:  21% 2981/13907 [1:51:07<6:29:10,  2.14s/it][A
Training...:  21% 2982/13907 [1:51:09<6:19:25,  2.08s/it][A
Training...:  21% 2983/13907 [1:51:11<6:12:57,  2.05s/it][A
Training...:  21% 2984/13907 [1:51:13<6:04:57,  2.00s/it][A
Training...:  21% 2985/13907 [1:51:15<5:59:37,  1.98s/it][A
Training...:  21% 2986/13907 [1:51:17<5:52:32,  1.94s/it][A
Training...:  21% 2987/13907 [1:51:19<5:45:58,  1.90s/it][A
Training...:  21% 2988/13907 [1:51:20<5:38:49,  1.86s/it][A
Training...:  21% 2989/13907 [1:51:22<5:32:02,  1.82s/it][A
Training...:  21% 2990/13907 [1:51:24<5:25:35,  1.79s/it][A
Training...:  22% 2991/13907 [1:51:25<5:20:27,  1.76s/it][A
Training...:  22% 2992/13907 [1:51:27<5:13:37,  1.72s/it][A
Training...:  22% 2993/13907 [1:51:29<5:07:53,  1.69s/it][A
Training...:  22% 2994/13907 [1:51:30<5:00:58,  1.65s/it][A
Training...:  22% 2995/13907 [1:51:32<4:53:21,  1.61s/it][A
Training...:  22% 2996/13907 [1:51:33<4:45:47,  1.57s/it][A
Training...:  22% 2997/13907 [1:51:35<4:35:23,  1.51s/it][A
Training...:  22% 2998/13907 [1:51:36<4:24:38,  1.46s/it][A
Training...:  22% 2999/13907 [1:51:37<4:12:21,  1.39s/it][A
Training...:  22% 3000/13907 [1:51:38<3:56:30,  1.30s/it][A
Training...:  22% 3001/13907 [1:51:42<6:11:04,  2.04s/it][A
Training...:  22% 3002/13907 [1:51:46<7:29:40,  2.47s/it][A
Training...:  22% 3003/13907 [1:51:49<8:16:29,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:22:25<8:52:18, 31938.93s/it]
Training...:  22% 3003/13907 [1:51:53<8:16:29,  2.73s/it][A
Training...:  22% 3004/13907 [1:51:53<9:11:54,  3.04s/it][A
Training...:  22% 3005/13907 [1:51:56<9:16:13,  3.06s/it][A
Training...:  22% 3006/13907 [1:51:59<9:08:01,  3.02s/it][A
Training...:  22% 3007/13907 [1:52:02<9:00:44,  2.98s/it][A
Training...:  22% 3008/13907 [1:52:04<8:53:01,  2.93s/it][A
Training...:  22% 3009/13907 [1:52:07<8:43:52,  2.88s/it][A
Training...:  22% 3010/13907 [1:52:10<8:33:44,  2.83s/it][A
Training...:  22% 3011/13907 [1:52:13<8:23:34,  2.77s/it][A
Training...:  22% 3012/13907 [1:52:15<8:13:50,  2.72s/it][A
Training...:  22% 3013/13907 [1:52:18<8:05:55,  2.68s/it][A
Training...:  22% 3014/13907 [1:52:20<7:57:24,  2.63s/it][A
Training...:  22% 3015/13907 [1:52:23<7:50:26,  2.59s/it][A
Training...:  22% 3016/13907 [1:52:25<7:42:51,  2.55s/it][A
Training...:  22% 3017/13907 [1:52:28<7:37:35,  2.52s/it][A
Training...:  22% 3018/13907 [1:52:30<7:31:31,  2.49s/it][A
Training...:  22% 3019/13907 [1:52:32<7:25:43,  2.46s/it][A
Training...:  22% 3020/13907 [1:52:35<7:18:57,  2.42s/it][A
Training...:  22% 3021/13907 [1:52:37<7:12:21,  2.38s/it][A
Training...:  22% 3022/13907 [1:52:39<7:06:48,  2.35s/it][A
Training...:  22% 3023/13907 [1:52:42<7:01:49,  2.33s/it][A
Training...:  22% 3024/13907 [1:52:44<6:56:31,  2.30s/it][A
Training...:  22% 3025/13907 [1:52:46<6:52:35,  2.27s/it][A
Training...:  22% 3026/13907 [1:52:48<6:51:02,  2.27s/it][A
Training...:  22% 3027/13907 [1:52:50<6:45:00,  2.23s/it][A
Training...:  22% 3028/13907 [1:52:53<6:37:24,  2.19s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:23:27<8:52:18, 31938.93s/it]
Training...:  22% 3028/13907 [1:52:55<6:37:24,  2.19s/it][A
Training...:  22% 3029/13907 [1:52:55<6:48:14,  2.25s/it][A
Training...:  22% 3030/13907 [1:52:57<6:41:12,  2.21s/it][A
Training...:  22% 3031/13907 [1:52:59<6:30:51,  2.16s/it][A
Training...:  22% 3032/13907 [1:53:01<6:20:53,  2.10s/it][A
Training...:  22% 3033/13907 [1:53:03<6:13:31,  2.06s/it][A
Training...:  22% 3034/13907 [1:53:05<6:06:13,  2.02s/it][A
Training...:  22% 3035/13907 [1:53:07<5:59:31,  1.98s/it][A
Training...:  22% 3036/13907 [1:53:09<5:52:32,  1.95s/it][A
Training...:  22% 3037/13907 [1:53:11<5:46:56,  1.92s/it][A
Training...:  22% 3038/13907 [1:53:12<5:40:51,  1.88s/it][A
Training...:  22% 3039/13907 [1:53:14<5:34:48,  1.85s/it][A
Training...:  22% 3040/13907 [1:53:16<5:29:25,  1.82s/it][A
Training...:  22% 3041/13907 [1:53:18<5:22:33,  1.78s/it][A
Training...:  22% 3042/13907 [1:53:19<5:15:53,  1.74s/it][A
Training...:  22% 3043/13907 [1:53:21<5:10:04,  1.71s/it][A
Training...:  22% 3044/13907 [1:53:22<5:03:52,  1.68s/it][A
Training...:  22% 3045/13907 [1:53:24<4:57:32,  1.64s/it][A
Training...:  22% 3046/13907 [1:53:25<4:49:15,  1.60s/it][A
Training...:  22% 3047/13907 [1:53:27<4:39:55,  1.55s/it][A
Training...:  22% 3048/13907 [1:53:28<4:29:42,  1.49s/it][A
Training...:  22% 3049/13907 [1:53:30<4:17:04,  1.42s/it][A
Training...:  22% 3050/13907 [1:53:31<3:58:24,  1.32s/it][A
Training...:  22% 3051/13907 [1:53:34<6:11:05,  2.05s/it][A
Training...:  22% 3052/13907 [1:53:38<7:28:50,  2.48s/it][A
Training...:  22% 3053/13907 [1:53:41<8:09:22,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:24:17<8:52:18, 31938.93s/it]
Training...:  22% 3053/13907 [1:53:45<8:09:22,  2.71s/it][A
Training...:  22% 3054/13907 [1:53:45<8:58:08,  2.98s/it][A
Training...:  22% 3055/13907 [1:53:48<9:07:33,  3.03s/it][A
Training...:  22% 3056/13907 [1:53:51<9:09:31,  3.04s/it][A
Training...:  22% 3057/13907 [1:53:54<9:03:44,  3.01s/it][A
Training...:  22% 3058/13907 [1:53:57<8:51:32,  2.94s/it][A
Training...:  22% 3059/13907 [1:53:59<8:40:07,  2.88s/it][A
Training...:  22% 3060/13907 [1:54:02<8:31:03,  2.83s/it][A
Training...:  22% 3061/13907 [1:54:05<8:20:16,  2.77s/it][A
Training...:  22% 3062/13907 [1:54:07<8:11:08,  2.72s/it][A
Training...:  22% 3063/13907 [1:54:10<8:00:41,  2.66s/it][A
Training...:  22% 3064/13907 [1:54:12<7:54:08,  2.62s/it][A
Training...:  22% 3065/13907 [1:54:15<7:45:46,  2.58s/it][A
Training...:  22% 3066/13907 [1:54:17<7:39:37,  2.54s/it][A
Training...:  22% 3067/13907 [1:54:20<7:33:05,  2.51s/it][A
Training...:  22% 3068/13907 [1:54:22<7:25:23,  2.47s/it][A
Training...:  22% 3069/13907 [1:54:24<7:18:07,  2.43s/it][A
Training...:  22% 3070/13907 [1:54:27<7:12:39,  2.40s/it][A
Training...:  22% 3071/13907 [1:54:29<7:06:34,  2.36s/it][A
Training...:  22% 3072/13907 [1:54:31<6:59:56,  2.33s/it][A
Training...:  22% 3073/13907 [1:54:33<6:53:07,  2.29s/it][A
Training...:  22% 3074/13907 [1:54:36<6:47:30,  2.26s/it][A
Training...:  22% 3075/13907 [1:54:38<6:41:27,  2.22s/it][A
Training...:  22% 3076/13907 [1:54:40<6:36:42,  2.20s/it][A
Training...:  22% 3077/13907 [1:54:42<6:31:36,  2.17s/it][A
Training...:  22% 3078/13907 [1:54:44<6:26:13,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:25:19<8:52:18, 31938.93s/it]
Training...:  22% 3078/13907 [1:54:46<6:26:13,  2.14s/it][A
Training...:  22% 3079/13907 [1:54:46<6:38:45,  2.21s/it][A
Training...:  22% 3080/13907 [1:54:49<6:31:34,  2.17s/it][A
Training...:  22% 3081/13907 [1:54:51<6:21:34,  2.11s/it][A
Training...:  22% 3082/13907 [1:54:52<6:11:20,  2.06s/it][A
Training...:  22% 3083/13907 [1:54:54<6:03:46,  2.02s/it][A
Training...:  22% 3084/13907 [1:54:56<5:57:01,  1.98s/it][A
Training...:  22% 3085/13907 [1:54:58<5:51:00,  1.95s/it][A
Training...:  22% 3086/13907 [1:55:00<5:46:06,  1.92s/it][A
Training...:  22% 3087/13907 [1:55:02<5:40:06,  1.89s/it][A
Training...:  22% 3088/13907 [1:55:04<5:33:34,  1.85s/it][A
Training...:  22% 3089/13907 [1:55:05<5:30:39,  1.83s/it][A
Training...:  22% 3090/13907 [1:55:07<5:26:35,  1.81s/it][A
Training...:  22% 3091/13907 [1:55:09<5:18:57,  1.77s/it][A
Training...:  22% 3092/13907 [1:55:10<5:10:39,  1.72s/it][A
Training...:  22% 3093/13907 [1:55:12<5:03:19,  1.68s/it][A
Training...:  22% 3094/13907 [1:55:14<4:56:49,  1.65s/it][A
Training...:  22% 3095/13907 [1:55:15<4:48:22,  1.60s/it][A
Training...:  22% 3096/13907 [1:55:17<4:39:20,  1.55s/it][A
Training...:  22% 3097/13907 [1:55:18<4:30:53,  1.50s/it][A
Training...:  22% 3098/13907 [1:55:19<4:20:36,  1.45s/it][A
Training...:  22% 3099/13907 [1:55:20<4:08:50,  1.38s/it][A
Training...:  22% 3100/13907 [1:55:22<3:51:50,  1.29s/it][A
Training...:  22% 3101/13907 [1:55:25<6:04:32,  2.02s/it][A
Training...:  22% 3102/13907 [1:55:29<7:23:23,  2.46s/it][A
Training...:  22% 3103/13907 [1:55:32<8:06:01,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:26:08<8:52:18, 31938.93s/it]
Training...:  22% 3103/13907 [1:55:36<8:06:01,  2.70s/it][A
Training...:  22% 3104/13907 [1:55:36<8:56:16,  2.98s/it][A
Training...:  22% 3105/13907 [1:55:39<9:04:38,  3.03s/it][A
Training...:  22% 3106/13907 [1:55:42<9:00:40,  3.00s/it][A
Training...:  22% 3107/13907 [1:55:45<8:58:23,  2.99s/it][A
Training...:  22% 3108/13907 [1:55:48<8:56:46,  2.98s/it][A
Training...:  22% 3109/13907 [1:55:50<8:47:46,  2.93s/it][A
Training...:  22% 3110/13907 [1:55:53<8:38:18,  2.88s/it][A
Training...:  22% 3111/13907 [1:55:56<8:26:50,  2.82s/it][A
Training...:  22% 3112/13907 [1:55:59<8:18:07,  2.77s/it][A
Training...:  22% 3113/13907 [1:56:01<8:10:54,  2.73s/it][A
Training...:  22% 3114/13907 [1:56:04<8:03:01,  2.69s/it][A
Training...:  22% 3115/13907 [1:56:06<7:56:06,  2.65s/it][A
Training...:  22% 3116/13907 [1:56:09<7:48:44,  2.61s/it][A
Training...:  22% 3117/13907 [1:56:11<7:40:31,  2.56s/it][A
Training...:  22% 3118/13907 [1:56:14<7:33:21,  2.52s/it][A
Training...:  22% 3119/13907 [1:56:16<7:30:43,  2.51s/it][A
Training...:  22% 3120/13907 [1:56:19<7:23:09,  2.46s/it][A
Training...:  22% 3121/13907 [1:56:21<7:18:43,  2.44s/it][A
Training...:  22% 3122/13907 [1:56:23<7:10:46,  2.40s/it][A
Training...:  22% 3123/13907 [1:56:25<7:02:25,  2.35s/it][A
Training...:  22% 3124/13907 [1:56:28<6:55:04,  2.31s/it][A
Training...:  22% 3125/13907 [1:56:30<6:48:31,  2.27s/it][A
Training...:  22% 3126/13907 [1:56:32<6:41:20,  2.23s/it][A
Training...:  22% 3127/13907 [1:56:34<6:35:13,  2.20s/it][A
Training...:  22% 3128/13907 [1:56:36<6:28:28,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:27:11<8:52:18, 31938.93s/it]
Training...:  22% 3128/13907 [1:56:39<6:28:28,  2.16s/it][A
Training...:  22% 3129/13907 [1:56:39<6:39:29,  2.22s/it][A
Training...:  23% 3130/13907 [1:56:41<6:32:27,  2.18s/it][A
Training...:  23% 3131/13907 [1:56:43<6:24:37,  2.14s/it][A
Training...:  23% 3132/13907 [1:56:45<6:13:56,  2.08s/it][A
Training...:  23% 3133/13907 [1:56:47<6:08:02,  2.05s/it][A
Training...:  23% 3134/13907 [1:56:49<6:00:16,  2.01s/it][A
Training...:  23% 3135/13907 [1:56:50<5:52:03,  1.96s/it][A
Training...:  23% 3136/13907 [1:56:52<5:45:30,  1.92s/it][A
Training...:  23% 3137/13907 [1:56:54<5:39:05,  1.89s/it][A
Training...:  23% 3138/13907 [1:56:56<5:32:37,  1.85s/it][A
Training...:  23% 3139/13907 [1:56:58<5:26:25,  1.82s/it][A
Training...:  23% 3140/13907 [1:56:59<5:19:28,  1.78s/it][A
Training...:  23% 3141/13907 [1:57:01<5:13:47,  1.75s/it][A
Training...:  23% 3142/13907 [1:57:03<5:08:05,  1.72s/it][A
Training...:  23% 3143/13907 [1:57:04<5:02:51,  1.69s/it][A
Training...:  23% 3144/13907 [1:57:06<4:56:24,  1.65s/it][A
Training...:  23% 3145/13907 [1:57:07<4:48:34,  1.61s/it][A
Training...:  23% 3146/13907 [1:57:09<4:40:00,  1.56s/it][A
Training...:  23% 3147/13907 [1:57:10<4:30:17,  1.51s/it][A
Training...:  23% 3148/13907 [1:57:11<4:19:29,  1.45s/it][A
Training...:  23% 3149/13907 [1:57:13<4:06:41,  1.38s/it][A
Training...:  23% 3150/13907 [1:57:14<3:50:14,  1.28s/it][A
Training...:  23% 3151/13907 [1:57:17<6:02:51,  2.02s/it][A
Training...:  23% 3152/13907 [1:57:21<7:20:59,  2.46s/it][A
Training...:  23% 3153/13907 [1:57:24<8:03:40,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:28:00<8:52:18, 31938.93s/it]
Training...:  23% 3153/13907 [1:57:28<8:03:40,  2.70s/it][A
Training...:  23% 3154/13907 [1:57:28<8:52:14,  2.97s/it][A
Training...:  23% 3155/13907 [1:57:31<9:01:43,  3.02s/it][A
Training...:  23% 3156/13907 [1:57:34<8:58:46,  3.01s/it][A
Training...:  23% 3157/13907 [1:57:37<8:52:18,  2.97s/it][A
Training...:  23% 3158/13907 [1:57:40<8:48:15,  2.95s/it][A
Training...:  23% 3159/13907 [1:57:42<8:41:49,  2.91s/it][A
Training...:  23% 3160/13907 [1:57:45<8:30:27,  2.85s/it][A
Training...:  23% 3161/13907 [1:57:48<8:21:08,  2.80s/it][A
Training...:  23% 3162/13907 [1:57:50<8:12:03,  2.75s/it][A
Training...:  23% 3163/13907 [1:57:53<8:04:28,  2.71s/it][A
Training...:  23% 3164/13907 [1:57:56<7:56:56,  2.66s/it][A
Training...:  23% 3165/13907 [1:57:58<7:49:24,  2.62s/it][A
Training...:  23% 3166/13907 [1:58:01<7:41:11,  2.58s/it][A
Training...:  23% 3167/13907 [1:58:03<7:34:42,  2.54s/it][A
Training...:  23% 3168/13907 [1:58:06<7:27:23,  2.50s/it][A
Training...:  23% 3169/13907 [1:58:08<7:19:39,  2.46s/it][A
Training...:  23% 3170/13907 [1:58:10<7:12:54,  2.42s/it][A
Training...:  23% 3171/13907 [1:58:13<7:06:57,  2.39s/it][A
Training...:  23% 3172/13907 [1:58:15<7:00:17,  2.35s/it][A
Training...:  23% 3173/13907 [1:58:17<6:54:24,  2.32s/it][A
Training...:  23% 3174/13907 [1:58:19<6:47:44,  2.28s/it][A
Training...:  23% 3175/13907 [1:58:21<6:42:38,  2.25s/it][A
Training...:  23% 3176/13907 [1:58:24<6:37:45,  2.22s/it][A
Training...:  23% 3177/13907 [1:58:26<6:33:28,  2.20s/it][A
Training...:  23% 3178/13907 [1:58:28<6:27:18,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:29:02<8:52:18, 31938.93s/it]
Training...:  23% 3178/13907 [1:58:30<6:27:18,  2.17s/it][A
Training...:  23% 3179/13907 [1:58:30<6:37:56,  2.23s/it][A
Training...:  23% 3180/13907 [1:58:32<6:30:13,  2.18s/it][A
Training...:  23% 3181/13907 [1:58:34<6:23:14,  2.14s/it][A
Training...:  23% 3182/13907 [1:58:36<6:12:53,  2.09s/it][A
Training...:  23% 3183/13907 [1:58:38<6:03:43,  2.04s/it][A
Training...:  23% 3184/13907 [1:58:40<5:55:57,  1.99s/it][A
Training...:  23% 3185/13907 [1:58:42<5:50:22,  1.96s/it][A
Training...:  23% 3186/13907 [1:58:44<5:46:00,  1.94s/it][A
Training...:  23% 3187/13907 [1:58:46<5:39:39,  1.90s/it][A
Training...:  23% 3188/13907 [1:58:47<5:32:32,  1.86s/it][A
Training...:  23% 3189/13907 [1:58:49<5:27:08,  1.83s/it][A
Training...:  23% 3190/13907 [1:58:51<5:23:15,  1.81s/it][A
Training...:  23% 3191/13907 [1:58:53<5:16:45,  1.77s/it][A
Training...:  23% 3192/13907 [1:58:54<5:08:24,  1.73s/it][A
Training...:  23% 3193/13907 [1:58:56<5:02:11,  1.69s/it][A
Training...:  23% 3194/13907 [1:58:57<4:54:51,  1.65s/it][A
Training...:  23% 3195/13907 [1:58:59<4:45:27,  1.60s/it][A
Training...:  23% 3196/13907 [1:59:00<4:35:49,  1.55s/it][A
Training...:  23% 3197/13907 [1:59:02<4:26:11,  1.49s/it][A
Training...:  23% 3198/13907 [1:59:03<4:15:11,  1.43s/it][A
Training...:  23% 3199/13907 [1:59:04<4:03:11,  1.36s/it][A
Training...:  23% 3200/13907 [1:59:05<3:48:29,  1.28s/it][A
Training...:  23% 3201/13907 [1:59:09<6:01:14,  2.02s/it][A
Training...:  23% 3202/13907 [1:59:13<7:20:38,  2.47s/it][A
Training...:  23% 3203/13907 [1:59:16<8:03:10,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:29:51<8:52:18, 31938.93s/it]
Training...:  23% 3203/13907 [1:59:19<8:03:10,  2.71s/it][A
Training...:  23% 3204/13907 [1:59:19<8:51:13,  2.98s/it][A
Training...:  23% 3205/13907 [1:59:23<9:02:06,  3.04s/it][A
Training...:  23% 3206/13907 [1:59:26<8:58:24,  3.02s/it][A
Training...:  23% 3207/13907 [1:59:28<8:52:25,  2.99s/it][A
Training...:  23% 3208/13907 [1:59:31<8:44:20,  2.94s/it][A
Training...:  23% 3209/13907 [1:59:34<8:38:43,  2.91s/it][A
Training...:  23% 3210/13907 [1:59:37<8:30:57,  2.87s/it][A
Training...:  23% 3211/13907 [1:59:40<8:23:20,  2.82s/it][A
Training...:  23% 3212/13907 [1:59:42<8:12:59,  2.77s/it][A
Training...:  23% 3213/13907 [1:59:45<8:03:50,  2.71s/it][A
Training...:  23% 3214/13907 [1:59:47<7:54:56,  2.67s/it][A
Training...:  23% 3215/13907 [1:59:50<7:45:58,  2.61s/it][A
Training...:  23% 3216/13907 [1:59:52<7:37:36,  2.57s/it][A
Training...:  23% 3217/13907 [1:59:55<7:30:55,  2.53s/it][A
Training...:  23% 3218/13907 [1:59:57<7:24:30,  2.50s/it][A
Training...:  23% 3219/13907 [2:00:00<7:18:12,  2.46s/it][A
Training...:  23% 3220/13907 [2:00:02<7:12:07,  2.43s/it][A
Training...:  23% 3221/13907 [2:00:04<7:07:43,  2.40s/it][A
Training...:  23% 3222/13907 [2:00:07<7:01:23,  2.37s/it][A
Training...:  23% 3223/13907 [2:00:09<6:57:21,  2.34s/it][A
Training...:  23% 3224/13907 [2:00:11<6:51:52,  2.31s/it][A
Training...:  23% 3225/13907 [2:00:13<6:45:39,  2.28s/it][A
Training...:  23% 3226/13907 [2:00:15<6:38:40,  2.24s/it][A
Training...:  23% 3227/13907 [2:00:18<6:32:33,  2.21s/it][A
Training...:  23% 3228/13907 [2:00:20<6:26:53,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:30:54<8:52:18, 31938.93s/it]
Training...:  23% 3228/13907 [2:00:22<6:26:53,  2.17s/it][A
Training...:  23% 3229/13907 [2:00:22<6:38:00,  2.24s/it][A
Training...:  23% 3230/13907 [2:00:24<6:31:10,  2.20s/it][A
Training...:  23% 3231/13907 [2:00:26<6:21:50,  2.15s/it][A
Training...:  23% 3232/13907 [2:00:28<6:13:37,  2.10s/it][A
Training...:  23% 3233/13907 [2:00:30<6:05:04,  2.05s/it][A
Training...:  23% 3234/13907 [2:00:32<5:57:16,  2.01s/it][A
Training...:  23% 3235/13907 [2:00:34<5:51:43,  1.98s/it][A
Training...:  23% 3236/13907 [2:00:36<5:44:56,  1.94s/it][A
Training...:  23% 3237/13907 [2:00:38<5:38:12,  1.90s/it][A
Training...:  23% 3238/13907 [2:00:39<5:32:15,  1.87s/it][A
Training...:  23% 3239/13907 [2:00:41<5:25:56,  1.83s/it][A
Training...:  23% 3240/13907 [2:00:43<5:19:19,  1.80s/it][A
Training...:  23% 3241/13907 [2:00:44<5:12:22,  1.76s/it][A
Training...:  23% 3242/13907 [2:00:46<5:06:20,  1.72s/it][A
Training...:  23% 3243/13907 [2:00:48<5:00:04,  1.69s/it][A
Training...:  23% 3244/13907 [2:00:49<4:55:50,  1.66s/it][A
Training...:  23% 3245/13907 [2:00:51<4:47:23,  1.62s/it][A
Training...:  23% 3246/13907 [2:00:52<4:40:33,  1.58s/it][A
Training...:  23% 3247/13907 [2:00:54<4:30:55,  1.52s/it][A
Training...:  23% 3248/13907 [2:00:55<4:21:32,  1.47s/it][A
Training...:  23% 3249/13907 [2:00:56<4:09:28,  1.40s/it][A
Training...:  23% 3250/13907 [2:00:57<3:49:22,  1.29s/it][A
Training...:  23% 3251/13907 [2:01:01<6:00:18,  2.03s/it][A
Training...:  23% 3252/13907 [2:01:05<7:19:33,  2.48s/it][A
Training...:  23% 3253/13907 [2:01:08<8:00:52,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:31:44<8:52:18, 31938.93s/it]
Training...:  23% 3253/13907 [2:01:11<8:00:52,  2.71s/it][A
Training...:  23% 3254/13907 [2:01:11<8:48:09,  2.97s/it][A
Training...:  23% 3255/13907 [2:01:15<8:56:46,  3.02s/it][A
Training...:  23% 3256/13907 [2:01:18<8:53:57,  3.01s/it][A
Training...:  23% 3257/13907 [2:01:20<8:47:29,  2.97s/it][A
Training...:  23% 3258/13907 [2:01:23<8:40:55,  2.94s/it][A
Training...:  23% 3259/13907 [2:01:26<8:33:31,  2.89s/it][A
Training...:  23% 3260/13907 [2:01:29<8:25:26,  2.85s/it][A
Training...:  23% 3261/13907 [2:01:32<8:18:21,  2.81s/it][A
Training...:  23% 3262/13907 [2:01:34<8:09:15,  2.76s/it][A
Training...:  23% 3263/13907 [2:01:37<8:01:00,  2.71s/it][A
Training...:  23% 3264/13907 [2:01:39<7:51:23,  2.66s/it][A
Training...:  23% 3265/13907 [2:01:42<7:43:07,  2.61s/it][A
Training...:  23% 3266/13907 [2:01:44<7:36:08,  2.57s/it][A
Training...:  23% 3267/13907 [2:01:47<7:28:57,  2.53s/it][A
Training...:  23% 3268/13907 [2:01:49<7:21:19,  2.49s/it][A
Training...:  24% 3269/13907 [2:01:52<7:14:04,  2.45s/it][A
Training...:  24% 3270/13907 [2:01:54<7:08:55,  2.42s/it][A
Training...:  24% 3271/13907 [2:01:56<7:03:13,  2.39s/it][A
Training...:  24% 3272/13907 [2:01:58<6:58:42,  2.36s/it][A
Training...:  24% 3273/13907 [2:02:01<6:53:58,  2.34s/it][A
Training...:  24% 3274/13907 [2:02:03<6:50:07,  2.31s/it][A
Training...:  24% 3275/13907 [2:02:05<6:42:02,  2.27s/it][A
Training...:  24% 3276/13907 [2:02:07<6:34:50,  2.23s/it][A
Training...:  24% 3277/13907 [2:02:09<6:27:17,  2.19s/it][A
Training...:  24% 3278/13907 [2:02:11<6:20:45,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:32:46<8:52:18, 31938.93s/it]
Training...:  24% 3278/13907 [2:02:14<6:20:45,  2.15s/it][A
Training...:  24% 3279/13907 [2:02:14<6:31:54,  2.21s/it][A
Training...:  24% 3280/13907 [2:02:16<6:25:11,  2.17s/it][A
Training...:  24% 3281/13907 [2:02:18<6:15:31,  2.12s/it][A
Training...:  24% 3282/13907 [2:02:20<6:07:07,  2.07s/it][A
Training...:  24% 3283/13907 [2:02:22<5:59:43,  2.03s/it][A
Training...:  24% 3284/13907 [2:02:24<5:53:17,  2.00s/it][A
Training...:  24% 3285/13907 [2:02:26<5:47:17,  1.96s/it][A
Training...:  24% 3286/13907 [2:02:27<5:41:53,  1.93s/it][A
Training...:  24% 3287/13907 [2:02:29<5:37:32,  1.91s/it][A
Training...:  24% 3288/13907 [2:02:31<5:29:28,  1.86s/it][A
Training...:  24% 3289/13907 [2:02:33<5:24:25,  1.83s/it][A
Training...:  24% 3290/13907 [2:02:35<5:18:04,  1.80s/it][A
Training...:  24% 3291/13907 [2:02:36<5:11:32,  1.76s/it][A
Training...:  24% 3292/13907 [2:02:38<5:04:58,  1.72s/it][A
Training...:  24% 3293/13907 [2:02:39<4:59:22,  1.69s/it][A
Training...:  24% 3294/13907 [2:02:41<4:52:49,  1.66s/it][A
Training...:  24% 3295/13907 [2:02:43<4:44:25,  1.61s/it][A
Training...:  24% 3296/13907 [2:02:44<4:35:36,  1.56s/it][A
Training...:  24% 3297/13907 [2:02:45<4:25:43,  1.50s/it][A
Training...:  24% 3298/13907 [2:02:47<4:14:34,  1.44s/it][A
Training...:  24% 3299/13907 [2:02:48<4:02:40,  1.37s/it][A
Training...:  24% 3300/13907 [2:02:49<3:44:17,  1.27s/it][A
Training...:  24% 3301/13907 [2:02:53<5:55:29,  2.01s/it][A
Training...:  24% 3302/13907 [2:02:56<7:19:00,  2.48s/it][A
Training...:  24% 3303/13907 [2:03:00<8:07:04,  2.76s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:33:35<8:52:18, 31938.93s/it]
Training...:  24% 3303/13907 [2:03:03<8:07:04,  2.76s/it][A
Training...:  24% 3304/13907 [2:03:03<8:54:17,  3.02s/it][A
Training...:  24% 3305/13907 [2:03:06<9:02:07,  3.07s/it][A
Training...:  24% 3306/13907 [2:03:09<8:58:37,  3.05s/it][A
Training...:  24% 3307/13907 [2:03:12<8:48:53,  2.99s/it][A
Training...:  24% 3308/13907 [2:03:15<8:38:25,  2.93s/it][A
Training...:  24% 3309/13907 [2:03:18<8:29:17,  2.88s/it][A
Training...:  24% 3310/13907 [2:03:21<8:19:53,  2.83s/it][A
Training...:  24% 3311/13907 [2:03:23<8:10:11,  2.78s/it][A
Training...:  24% 3312/13907 [2:03:26<8:04:02,  2.74s/it][A
Training...:  24% 3313/13907 [2:03:29<7:59:14,  2.71s/it][A
Training...:  24% 3314/13907 [2:03:31<7:53:20,  2.68s/it][A
Training...:  24% 3315/13907 [2:03:34<7:46:39,  2.64s/it][A
Training...:  24% 3316/13907 [2:03:36<7:41:37,  2.62s/it][A
Training...:  24% 3317/13907 [2:03:39<7:36:40,  2.59s/it][A
Training...:  24% 3318/13907 [2:03:41<7:29:31,  2.55s/it][A
Training...:  24% 3319/13907 [2:03:44<7:24:35,  2.52s/it][A
Training...:  24% 3320/13907 [2:03:46<7:17:17,  2.48s/it][A
Training...:  24% 3321/13907 [2:03:48<7:13:04,  2.45s/it][A
Training...:  24% 3322/13907 [2:03:51<7:05:30,  2.41s/it][A
Training...:  24% 3323/13907 [2:03:53<6:59:48,  2.38s/it][A
Training...:  24% 3324/13907 [2:03:55<6:53:57,  2.35s/it][A
Training...:  24% 3325/13907 [2:03:58<6:48:54,  2.32s/it][A
Training...:  24% 3326/13907 [2:04:00<6:42:26,  2.28s/it][A
Training...:  24% 3327/13907 [2:04:02<6:36:11,  2.25s/it][A
Training...:  24% 3328/13907 [2:04:04<6:31:58,  2.22s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:34:39<8:52:18, 31938.93s/it]
Training...:  24% 3328/13907 [2:04:07<6:31:58,  2.22s/it][A
Training...:  24% 3329/13907 [2:04:07<6:44:12,  2.29s/it][A
Training...:  24% 3330/13907 [2:04:09<6:36:50,  2.25s/it][A
Training...:  24% 3331/13907 [2:04:11<6:26:16,  2.19s/it][A
Training...:  24% 3332/13907 [2:04:13<6:17:50,  2.14s/it][A
Training...:  24% 3333/13907 [2:04:15<6:07:07,  2.08s/it][A
Training...:  24% 3334/13907 [2:04:17<5:56:46,  2.02s/it][A
Training...:  24% 3335/13907 [2:04:19<5:48:51,  1.98s/it][A
Training...:  24% 3336/13907 [2:04:20<5:41:54,  1.94s/it][A
Training...:  24% 3337/13907 [2:04:22<5:35:17,  1.90s/it][A
Training...:  24% 3338/13907 [2:04:24<5:27:50,  1.86s/it][A
Training...:  24% 3339/13907 [2:04:26<5:22:05,  1.83s/it][A
Training...:  24% 3340/13907 [2:04:27<5:15:19,  1.79s/it][A
Training...:  24% 3341/13907 [2:04:29<5:09:29,  1.76s/it][A
Training...:  24% 3342/13907 [2:04:31<5:02:22,  1.72s/it][A
Training...:  24% 3343/13907 [2:04:32<4:57:47,  1.69s/it][A
Training...:  24% 3344/13907 [2:04:34<4:51:14,  1.65s/it][A
Training...:  24% 3345/13907 [2:04:35<4:44:00,  1.61s/it][A
Training...:  24% 3346/13907 [2:04:37<4:35:55,  1.57s/it][A
Training...:  24% 3347/13907 [2:04:38<4:26:07,  1.51s/it][A
Training...:  24% 3348/13907 [2:04:40<4:16:20,  1.46s/it][A
Training...:  24% 3349/13907 [2:04:41<4:04:22,  1.39s/it][A
Training...:  24% 3350/13907 [2:04:42<3:46:04,  1.28s/it][A
Training...:  24% 3351/13907 [2:04:46<6:00:09,  2.05s/it][A
Training...:  24% 3352/13907 [2:04:49<7:15:37,  2.48s/it][A
Training...:  24% 3353/13907 [2:04:52<7:56:04,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:35:28<8:52:18, 31938.93s/it]
Training...:  24% 3353/13907 [2:04:56<7:56:04,  2.71s/it][A
Training...:  24% 3354/13907 [2:04:56<8:43:22,  2.98s/it][A
Training...:  24% 3355/13907 [2:04:59<8:52:14,  3.03s/it][A
Training...:  24% 3356/13907 [2:05:02<8:48:29,  3.01s/it][A
Training...:  24% 3357/13907 [2:05:05<8:42:37,  2.97s/it][A
Training...:  24% 3358/13907 [2:05:08<8:35:48,  2.93s/it][A
Training...:  24% 3359/13907 [2:05:11<8:28:56,  2.89s/it][A
Training...:  24% 3360/13907 [2:05:13<8:21:33,  2.85s/it][A
Training...:  24% 3361/13907 [2:05:16<8:13:10,  2.81s/it][A
Training...:  24% 3362/13907 [2:05:19<8:03:18,  2.75s/it][A
Training...:  24% 3363/13907 [2:05:21<7:54:36,  2.70s/it][A
Training...:  24% 3364/13907 [2:05:24<7:45:54,  2.65s/it][A
Training...:  24% 3365/13907 [2:05:26<7:38:44,  2.61s/it][A
Training...:  24% 3366/13907 [2:05:29<7:32:19,  2.57s/it][A
Training...:  24% 3367/13907 [2:05:31<7:25:53,  2.54s/it][A
Training...:  24% 3368/13907 [2:05:34<7:20:29,  2.51s/it][A
Training...:  24% 3369/13907 [2:05:36<7:19:18,  2.50s/it][A
Training...:  24% 3370/13907 [2:05:39<7:11:26,  2.46s/it][A
Training...:  24% 3371/13907 [2:05:41<7:03:35,  2.41s/it][A
Training...:  24% 3372/13907 [2:05:43<6:55:57,  2.37s/it][A
Training...:  24% 3373/13907 [2:05:45<6:48:33,  2.33s/it][A
Training...:  24% 3374/13907 [2:05:48<6:40:57,  2.28s/it][A
Training...:  24% 3375/13907 [2:05:50<6:35:06,  2.25s/it][A
Training...:  24% 3376/13907 [2:05:52<6:29:15,  2.22s/it][A
Training...:  24% 3377/13907 [2:05:54<6:24:30,  2.19s/it][A
Training...:  24% 3378/13907 [2:05:56<6:19:04,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:36:31<8:52:18, 31938.93s/it]
Training...:  24% 3378/13907 [2:05:58<6:19:04,  2.16s/it][A
Training...:  24% 3379/13907 [2:05:59<6:30:40,  2.23s/it][A
Training...:  24% 3380/13907 [2:06:01<6:24:40,  2.19s/it][A
Training...:  24% 3381/13907 [2:06:03<6:14:38,  2.14s/it][A
Training...:  24% 3382/13907 [2:06:05<6:06:13,  2.09s/it][A
Training...:  24% 3383/13907 [2:06:07<5:58:20,  2.04s/it][A
Training...:  24% 3384/13907 [2:06:08<5:50:28,  2.00s/it][A
Training...:  24% 3385/13907 [2:06:10<5:44:10,  1.96s/it][A
Training...:  24% 3386/13907 [2:06:12<5:37:21,  1.92s/it][A
Training...:  24% 3387/13907 [2:06:14<5:32:10,  1.89s/it][A
Training...:  24% 3388/13907 [2:06:16<5:27:05,  1.87s/it][A
Training...:  24% 3389/13907 [2:06:18<5:21:56,  1.84s/it][A
Training...:  24% 3390/13907 [2:06:19<5:14:38,  1.80s/it][A
Training...:  24% 3391/13907 [2:06:21<5:07:18,  1.75s/it][A
Training...:  24% 3392/13907 [2:06:23<5:00:47,  1.72s/it][A
Training...:  24% 3393/13907 [2:06:24<4:53:58,  1.68s/it][A
Training...:  24% 3394/13907 [2:06:26<4:47:30,  1.64s/it][A
Training...:  24% 3395/13907 [2:06:27<4:39:28,  1.60s/it][A
Training...:  24% 3396/13907 [2:06:29<4:31:16,  1.55s/it][A
Training...:  24% 3397/13907 [2:06:30<4:23:12,  1.50s/it][A
Training...:  24% 3398/13907 [2:06:31<4:13:15,  1.45s/it][A
Training...:  24% 3399/13907 [2:06:33<4:01:59,  1.38s/it][A
Training...:  24% 3400/13907 [2:06:34<3:44:37,  1.28s/it][A
Training...:  24% 3401/13907 [2:06:37<5:51:37,  2.01s/it][A
Training...:  24% 3402/13907 [2:06:41<7:07:59,  2.44s/it][A
Training...:  24% 3403/13907 [2:06:44<7:49:37,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:37:20<8:52:18, 31938.93s/it]
Training...:  24% 3403/13907 [2:06:48<7:49:37,  2.68s/it][A
Training...:  24% 3404/13907 [2:06:48<8:38:40,  2.96s/it][A
Training...:  24% 3405/13907 [2:06:51<8:51:09,  3.03s/it][A
Training...:  24% 3406/13907 [2:06:54<8:48:54,  3.02s/it][A
Training...:  24% 3407/13907 [2:06:57<8:45:51,  3.00s/it][A
Training...:  25% 3408/13907 [2:07:00<8:37:57,  2.96s/it][A
Training...:  25% 3409/13907 [2:07:02<8:27:35,  2.90s/it][A
Training...:  25% 3410/13907 [2:07:05<8:17:24,  2.84s/it][A
Training...:  25% 3411/13907 [2:07:08<8:06:14,  2.78s/it][A
Training...:  25% 3412/13907 [2:07:10<7:56:24,  2.72s/it][A
Training...:  25% 3413/13907 [2:07:13<7:48:28,  2.68s/it][A
Training...:  25% 3414/13907 [2:07:15<7:39:50,  2.63s/it][A
Training...:  25% 3415/13907 [2:07:18<7:31:18,  2.58s/it][A
Training...:  25% 3416/13907 [2:07:20<7:24:55,  2.54s/it][A
Training...:  25% 3417/13907 [2:07:23<7:18:26,  2.51s/it][A
Training...:  25% 3418/13907 [2:07:25<7:10:52,  2.46s/it][A
Training...:  25% 3419/13907 [2:07:27<7:04:29,  2.43s/it][A
Training...:  25% 3420/13907 [2:07:30<6:59:34,  2.40s/it][A
Training...:  25% 3421/13907 [2:07:32<6:55:19,  2.38s/it][A
Training...:  25% 3422/13907 [2:07:34<6:48:52,  2.34s/it][A
Training...:  25% 3423/13907 [2:07:37<6:43:59,  2.31s/it][A
Training...:  25% 3424/13907 [2:07:39<6:37:58,  2.28s/it][A
Training...:  25% 3425/13907 [2:07:41<6:31:43,  2.24s/it][A
Training...:  25% 3426/13907 [2:07:43<6:27:19,  2.22s/it][A
Training...:  25% 3427/13907 [2:07:45<6:20:51,  2.18s/it][A
Training...:  25% 3428/13907 [2:07:47<6:15:51,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:38:22<8:52:18, 31938.93s/it]
Training...:  25% 3428/13907 [2:07:50<6:15:51,  2.15s/it][A
Training...:  25% 3429/13907 [2:07:50<6:27:34,  2.22s/it][A
Training...:  25% 3430/13907 [2:07:52<6:21:40,  2.19s/it][A
Training...:  25% 3431/13907 [2:07:54<6:12:17,  2.13s/it][A
Training...:  25% 3432/13907 [2:07:56<6:03:38,  2.08s/it][A
Training...:  25% 3433/13907 [2:07:58<5:56:07,  2.04s/it][A
Training...:  25% 3434/13907 [2:08:00<5:49:54,  2.00s/it][A
Training...:  25% 3435/13907 [2:08:02<5:43:58,  1.97s/it][A
Training...:  25% 3436/13907 [2:08:03<5:37:02,  1.93s/it][A
Training...:  25% 3437/13907 [2:08:05<5:32:07,  1.90s/it][A
Training...:  25% 3438/13907 [2:08:07<5:26:45,  1.87s/it][A
Training...:  25% 3439/13907 [2:08:09<5:22:08,  1.85s/it][A
Training...:  25% 3440/13907 [2:08:11<5:18:15,  1.82s/it][A
Training...:  25% 3441/13907 [2:08:12<5:13:16,  1.80s/it][A
Training...:  25% 3442/13907 [2:08:14<5:05:47,  1.75s/it][A
Training...:  25% 3443/13907 [2:08:16<4:58:02,  1.71s/it][A
Training...:  25% 3444/13907 [2:08:17<4:50:16,  1.66s/it][A
Training...:  25% 3445/13907 [2:08:19<4:42:05,  1.62s/it][A
Training...:  25% 3446/13907 [2:08:20<4:33:08,  1.57s/it][A
Training...:  25% 3447/13907 [2:08:21<4:23:06,  1.51s/it][A
Training...:  25% 3448/13907 [2:08:23<4:13:26,  1.45s/it][A
Training...:  25% 3449/13907 [2:08:24<4:02:44,  1.39s/it][A
Training...:  25% 3450/13907 [2:08:25<3:45:45,  1.30s/it][A
Training...:  25% 3451/13907 [2:08:29<5:51:43,  2.02s/it][A
Training...:  25% 3452/13907 [2:08:32<7:08:14,  2.46s/it][A
Training...:  25% 3453/13907 [2:08:36<7:48:53,  2.69s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:39:11<8:52:18, 31938.93s/it]
Training...:  25% 3453/13907 [2:08:39<7:48:53,  2.69s/it][A
Training...:  25% 3454/13907 [2:08:39<8:35:46,  2.96s/it][A
Training...:  25% 3455/13907 [2:08:42<8:44:36,  3.01s/it][A
Training...:  25% 3456/13907 [2:08:45<8:45:33,  3.02s/it][A
Training...:  25% 3457/13907 [2:08:48<8:37:53,  2.97s/it][A
Training...:  25% 3458/13907 [2:08:51<8:28:49,  2.92s/it][A
Training...:  25% 3459/13907 [2:08:54<8:18:43,  2.86s/it][A
Training...:  25% 3460/13907 [2:08:56<8:10:00,  2.81s/it][A
Training...:  25% 3461/13907 [2:08:59<8:02:44,  2.77s/it][A
Training...:  25% 3462/13907 [2:09:02<7:56:17,  2.74s/it][A
Training...:  25% 3463/13907 [2:09:04<7:48:12,  2.69s/it][A
Training...:  25% 3464/13907 [2:09:07<7:41:18,  2.65s/it][A
Training...:  25% 3465/13907 [2:09:09<7:35:07,  2.62s/it][A
Training...:  25% 3466/13907 [2:09:12<7:27:57,  2.57s/it][A
Training...:  25% 3467/13907 [2:09:14<7:20:48,  2.53s/it][A
Training...:  25% 3468/13907 [2:09:17<7:14:35,  2.50s/it][A
Training...:  25% 3469/13907 [2:09:19<7:08:43,  2.46s/it][A
Training...:  25% 3470/13907 [2:09:21<7:05:06,  2.44s/it][A
Training...:  25% 3471/13907 [2:09:24<7:01:24,  2.42s/it][A
Training...:  25% 3472/13907 [2:09:26<6:53:12,  2.38s/it][A
Training...:  25% 3473/13907 [2:09:28<6:44:56,  2.33s/it][A
Training...:  25% 3474/13907 [2:09:31<6:37:45,  2.29s/it][A
Training...:  25% 3475/13907 [2:09:33<6:32:25,  2.26s/it][A
Training...:  25% 3476/13907 [2:09:35<6:26:22,  2.22s/it][A
Training...:  25% 3477/13907 [2:09:37<6:20:30,  2.19s/it][A
Training...:  25% 3478/13907 [2:09:39<6:14:27,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:40:13<8:52:18, 31938.93s/it]
Training...:  25% 3478/13907 [2:09:41<6:14:27,  2.15s/it][A
Training...:  25% 3479/13907 [2:09:41<6:24:10,  2.21s/it][A
Training...:  25% 3480/13907 [2:09:43<6:18:25,  2.18s/it][A
Training...:  25% 3481/13907 [2:09:45<6:07:45,  2.12s/it][A
Training...:  25% 3482/13907 [2:09:47<6:00:09,  2.07s/it][A
Training...:  25% 3483/13907 [2:09:49<5:52:27,  2.03s/it][A
Training...:  25% 3484/13907 [2:09:51<5:45:42,  1.99s/it][A
Training...:  25% 3485/13907 [2:09:53<5:39:41,  1.96s/it][A
Training...:  25% 3486/13907 [2:09:55<5:32:32,  1.91s/it][A
Training...:  25% 3487/13907 [2:09:57<5:25:55,  1.88s/it][A
Training...:  25% 3488/13907 [2:09:59<5:20:47,  1.85s/it][A
Training...:  25% 3489/13907 [2:10:00<5:15:15,  1.82s/it][A
Training...:  25% 3490/13907 [2:10:02<5:10:13,  1.79s/it][A
Training...:  25% 3491/13907 [2:10:04<5:04:16,  1.75s/it][A
Training...:  25% 3492/13907 [2:10:05<4:58:22,  1.72s/it][A
Training...:  25% 3493/13907 [2:10:07<4:52:30,  1.69s/it][A
Training...:  25% 3494/13907 [2:10:08<4:46:55,  1.65s/it][A
Training...:  25% 3495/13907 [2:10:10<4:39:40,  1.61s/it][A
Training...:  25% 3496/13907 [2:10:11<4:32:50,  1.57s/it][A
Training...:  25% 3497/13907 [2:10:13<4:24:30,  1.52s/it][A
Training...:  25% 3498/13907 [2:10:14<4:15:08,  1.47s/it][A
Training...:  25% 3499/13907 [2:10:15<4:02:26,  1.40s/it][A
Training...:  25% 3500/13907 [2:10:17<3:45:08,  1.30s/it][A
Training...:  25% 3501/13907 [2:10:20<5:51:20,  2.03s/it][A
Training...:  25% 3502/13907 [2:10:24<7:04:15,  2.45s/it][A
Training...:  25% 3503/13907 [2:10:27<7:44:06,  2.68s/it][A                                                                                                                            
                                                         [AStep... (43475 | Loss: 0.26825419068336487, Learning Rate: 3.9551516238134354e-05, Gradient Norm: 0.8759176731109619)
Step... (43500 | Loss: 0.17328810691833496, Learning Rate: 3.940000897273421e-05, Gradient Norm: 0.6998575329780579)
Step... (43525 | Loss: 0.1701160967350006, Learning Rate: 3.924847987946123e-05, Gradient Norm: 0.7204174995422363)
Step... (43550 | Loss: 0.11853498220443726, Learning Rate: 3.909697261406109e-05, Gradient Norm: 0.4448680281639099)
Step... (43575 | Loss: 0.17503231763839722, Learning Rate: 3.894546171068214e-05, Gradient Norm: 0.6078075170516968)
Step... (43600 | Loss: 0.17017662525177002, Learning Rate: 3.879393625538796e-05, Gradient Norm: 0.6645141839981079)
Step... (43625 | Loss: 0.18374350666999817, Learning Rate: 3.864242535200901e-05, Gradient Norm: 0.6472183465957642)
Step... (43650 | Loss: 0.14795321226119995, Learning Rate: 3.849091808660887e-05, Gradient Norm: 1.0931445360183716)
Step... (43675 | Loss: 0.2312055379152298, Learning Rate: 3.833938899333589e-05, Gradient Norm: 1.227809190750122)
Step... (43700 | Loss: 0.2146805077791214, Learning Rate: 3.8187881727935746e-05, Gradient Norm: 0.9547646045684814)
Step... (43725 | Loss: 0.23171785473823547, Learning Rate: 3.80363708245568e-05, Gradient Norm: 0.8275779485702515)
Step... (43750 | Loss: 0.21953313052654266, Learning Rate: 3.788484536926262e-05, Gradient Norm: 0.9502483606338501)
Step... (43775 | Loss: 0.20162248611450195, Learning Rate: 3.773333446588367e-05, Gradient Norm: 1.2032121419906616)
Step... (43800 | Loss: 0.12429570406675339, Learning Rate: 3.758182720048353e-05, Gradient Norm: 0.5012211799621582)
Step... (43825 | Loss: 0.1626412570476532, Learning Rate: 3.7430301745189354e-05, Gradient Norm: 0.5711176991462708)
Step... (43850 | Loss: 0.12052418291568756, Learning Rate: 3.7278790841810405e-05, Gradient Norm: 0.8638255596160889)
Step... (43875 | Loss: 0.20640264451503754, Learning Rate: 3.7127283576410264e-05, Gradient Norm: 0.8659328818321228)
Step... (43900 | Loss: 0.14282968640327454, Learning Rate: 3.697575448313728e-05, Gradient Norm: 0.743473470211029)
Step... (43925 | Loss: 0.18716368079185486, Learning Rate: 3.682424721773714e-05, Gradient Norm: 0.8980592489242554)
Step... (43950 | Loss: 0.13891881704330444, Learning Rate: 3.667273631435819e-05, Gradient Norm: 0.7447905540466309)
Step... (43975 | Loss: 0.15837323665618896, Learning Rate: 3.652121085906401e-05, Gradient Norm: 0.5991666913032532)
Step... (44000 | Loss: 0.17688420414924622, Learning Rate: 3.6369699955685064e-05, Gradient Norm: 0.5620479583740234)
Step... (44025 | Loss: 0.18943248689174652, Learning Rate: 3.621819269028492e-05, Gradient Norm: 1.4182288646697998)
Step... (44050 | Loss: 0.2179071307182312, Learning Rate: 3.606666359701194e-05, Gradient Norm: 0.9200500249862671)
Step... (44075 | Loss: 0.1828402578830719, Learning Rate: 3.59151563316118e-05, Gradient Norm: 0.9969439506530762)
Step... (44100 | Loss: 0.14585044980049133, Learning Rate: 3.576364542823285e-05, Gradient Norm: 0.7126103639602661)
Step... (44125 | Loss: 0.20595422387123108, Learning Rate: 3.561211997293867e-05, Gradient Norm: 0.7637298703193665)
Step... (44150 | Loss: 0.14790192246437073, Learning Rate: 3.546060906955972e-05, Gradient Norm: 0.7753989696502686)
Step... (44175 | Loss: 0.21965491771697998, Learning Rate: 3.530910180415958e-05, Gradient Norm: 0.6230006217956543)
Step... (44200 | Loss: 0.17080587148666382, Learning Rate: 3.5157576348865405e-05, Gradient Norm: 0.8672460913658142)
Step... (44225 | Loss: 0.21809393167495728, Learning Rate: 3.5006065445486456e-05, Gradient Norm: 0.8927409648895264)
Step... (44250 | Loss: 0.13925796747207642, Learning Rate: 3.4854558180086315e-05, Gradient Norm: 0.6022088527679443)
Step... (44275 | Loss: 0.20586316287517548, Learning Rate: 3.470302908681333e-05, Gradient Norm: 0.8594465255737305)
Step... (44300 | Loss: 0.1479637324810028, Learning Rate: 3.455152182141319e-05, Gradient Norm: 0.5278339982032776)
Step... (44325 | Loss: 0.24913977086544037, Learning Rate: 3.440001091803424e-05, GraEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:41:03<8:52:18, 31938.93s/it]
Training...:  25% 3503/13907 [2:10:30<7:44:06,  2.68s/it][Adient Norm: 0.9262941479682922)
Step... (44350 | Loss: 0.1525641828775406, Learning Rate: 3.4248485462740064e-05, Gradient Norm: 0.7283354997634888)
Step... (44375 | Loss: 0.21841180324554443, Learning Rate: 3.4096974559361115e-05, Gradient Norm: 0.7380355596542358)
Step... (44400 | Loss: 0.13271880149841309, Learning Rate: 3.394544910406694e-05, Gradient Norm: 0.7749133706092834)
Step... (44425 | Loss: 0.27629393339157104, Learning Rate: 3.379393820068799e-05, Gradient Norm: 1.3906947374343872)
Step... (44450 | Loss: 0.1688576489686966, Learning Rate: 3.364243093528785e-05, Gradient Norm: 0.6472388505935669)
Step... (44475 | Loss: 0.18559250235557556, Learning Rate: 3.349090547999367e-05, Gradient Norm: 0.643958568572998)
Step... (44500 | Loss: 0.14019110798835754, Learning Rate: 3.333939457661472e-05, Gradient Norm: 0.6979761123657227)
Step... (44525 | Loss: 0.21583180129528046, Learning Rate: 3.318788731121458e-05, Gradient Norm: 0.9128493070602417)
Step... (44550 | Loss: 0.1280772089958191, Learning Rate: 3.30363582179416e-05, Gradient Norm: 0.49907854199409485)
Step... (44575 | Loss: 0.21777179837226868, Learning Rate: 3.2884850952541456e-05, Gradient Norm: 1.0532653331756592)
Step... (44600 | Loss: 0.1874319314956665, Learning Rate: 3.273334004916251e-05, Gradient Norm: 0.6498127579689026)
Step... (44625 | Loss: 0.2144567221403122, Learning Rate: 3.258181459386833e-05, Gradient Norm: 0.9864499568939209)
Step... (44650 | Loss: 0.17159050703048706, Learning Rate: 3.243030369048938e-05, Gradient Norm: 0.7407925128936768)
Step... (44675 | Loss: 0.1924574375152588, Learning Rate: 3.227879642508924e-05, Gradient Norm: 0.758031964302063)
Step... (44700 | Loss: 0.1568089872598648, Learning Rate: 3.2127267331816256e-05, Gradient Norm: 1.3136553764343262)
Step... (44725 | Loss: 0.24401123821735382, Learning Rate: 3.1975760066416115e-05, Gradient Norm: 0.8621992468833923)
Step... (44750 | Loss: 0.11245892941951752, Learning Rate: 3.1824249163037166e-05, Gradient Norm: 0.9032254219055176)
Step... (44775 | Loss: 0.18151748180389404, Learning Rate: 3.167272370774299e-05, Gradient Norm: 0.6789073944091797)
Step... (44800 | Loss: 0.11177344620227814, Learning Rate: 3.152121280436404e-05, Gradient Norm: 0.6013263463973999)
Step... (44825 | Loss: 0.17467635869979858, Learning Rate: 3.13697055389639e-05, Gradient Norm: 0.5213034749031067)
Step... (44850 | Loss: 0.14843754470348358, Learning Rate: 3.121818008366972e-05, Gradient Norm: 0.6118748784065247)
Step... (44875 | Loss: 0.24660693109035492, Learning Rate: 3.1066669180290774e-05, Gradient Norm: 0.8966085910797119)
Step... (44900 | Loss: 0.15185663104057312, Learning Rate: 3.091516191489063e-05, Gradient Norm: 0.7350738048553467)
Step... (44925 | Loss: 0.17240969836711884, Learning Rate: 3.076363282161765e-05, Gradient Norm: 0.9323041439056396)
Step... (44950 | Loss: 0.15894672274589539, Learning Rate: 3.0612125556217507e-05, Gradient Norm: 0.7401927709579468)
Step... (44975 | Loss: 0.24078170955181122, Learning Rate: 3.0460614652838558e-05, Gradient Norm: 0.6104704141616821)
Step... (45000 | Loss: 0.1451551765203476, Learning Rate: 3.030908919754438e-05, Gradient Norm: 0.8808109760284424)
Step... (45025 | Loss: 0.23043955862522125, Learning Rate: 3.0157580113154836e-05, Gradient Norm: 0.5853136777877808)
Step... (45050 | Loss: 0.16976398229599, Learning Rate: 3.000607102876529e-05, Gradient Norm: 0.6203516721725464)
Step... (45075 | Loss: 0.13723738491535187, Learning Rate: 2.985454375448171e-05, Gradient Norm: 0.44808417558670044)
Step... (45100 | Loss: 0.16755656898021698, Learning Rate: 2.9703034670092165e-05, Gradient Norm: 0.7856898903846741)
Step... (45125 | Loss: 0.31528791785240173, Learning Rate: 2.955152558570262e-05, Gradient Norm: 1.2632949352264404)
Step... (45150 | Loss: 0.1658506989479065, Learning Rate: 2.939999831141904e-05, Gradient Norm: 0.6567327976226807)
Step... (45175 | Loss: 0.1909911334514618, Learning Rate: 2.9248489227029495e-05, Gradient Norm: 0.873997688293457)
Step... (45200 | Loss: 0.15691980719566345, Learning R
ate: 2.909698014263995e-05, Gradient Norm: 0.6300989389419556)
Training...:  25% 3504/13907 [2:10:30<8:32:16,  2.95s/it][A
Training...:  25% 3505/13907 [2:10:34<8:50:47,  3.06s/it][A
Training...:  25% 3506/13907 [2:10:37<8:50:10,  3.06s/it][A
Training...:  25% 3507/13907 [2:10:40<8:42:34,  3.01s/it][A
Training...:  25% 3508/13907 [2:10:43<8:30:56,  2.95s/it][A
Training...:  25% 3509/13907 [2:10:45<8:20:26,  2.89s/it][A
Training...:  25% 3510/13907 [2:10:48<8:12:12,  2.84s/it][A
Training...:  25% 3511/13907 [2:10:51<8:02:36,  2.79s/it][A
Training...:  25% 3512/13907 [2:10:53<7:53:09,  2.73s/it][A
Training...:  25% 3513/13907 [2:10:56<7:44:32,  2.68s/it][A
Training...:  25% 3514/13907 [2:10:58<7:35:39,  2.63s/it][A
Training...:  25% 3515/13907 [2:11:01<7:26:52,  2.58s/it][A
Training...:  25% 3516/13907 [2:11:03<7:19:59,  2.54s/it][A
Training...:  25% 3517/13907 [2:11:06<7:14:29,  2.51s/it][A
Training...:  25% 3518/13907 [2:11:08<7:07:41,  2.47s/it][A
Training...:  25% 3519/13907 [2:11:10<7:01:20,  2.43s/it][A
Training...:  25% 3520/13907 [2:11:13<6:54:45,  2.40s/it][A
Training...:  25% 3521/13907 [2:11:15<6:48:29,  2.36s/it][A
Training...:  25% 3522/13907 [2:11:17<6:42:01,  2.32s/it][A
Training...:  25% 3523/13907 [2:11:19<6:35:46,  2.29s/it][A
Training...:  25% 3524/13907 [2:11:22<6:29:28,  2.25s/it][A
Training...:  25% 3525/13907 [2:11:24<6:25:34,  2.23s/it][A
Training...:  25% 3526/13907 [2:11:26<6:19:36,  2.19s/it][A
Training...:  25% 3527/13907 [2:11:28<6:14:56,  2.17s/it][A
Training...:  25% 3528/13907 [2:11:30<6:09:52,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:42:05<8:52:18, 31938.93s/it]
Training...:  25% 3528/13907 [2:11:32<6:09:52,  2.14s/it][A
Training...:  25% 3529/13907 [2:11:32<6:21:33,  2.21s/it][A
Training...:  25% 3530/13907 [2:11:35<6:14:45,  2.17s/it][A
Training...:  25% 3531/13907 [2:11:37<6:06:10,  2.12s/it][A
Training...:  25% 3532/13907 [2:11:38<5:57:40,  2.07s/it][A
Training...:  25% 3533/13907 [2:11:40<5:50:03,  2.02s/it][A
Training...:  25% 3534/13907 [2:11:42<5:43:16,  1.99s/it][A
Training...:  25% 3535/13907 [2:11:44<5:36:30,  1.95s/it][A
Training...:  25% 3536/13907 [2:11:46<5:30:45,  1.91s/it][A
Training...:  25% 3537/13907 [2:11:48<5:27:36,  1.90s/it][A
Training...:  25% 3538/13907 [2:11:50<5:22:09,  1.86s/it][A
Training...:  25% 3539/13907 [2:11:51<5:16:38,  1.83s/it][A
Training...:  25% 3540/13907 [2:11:53<5:10:01,  1.79s/it][A
Training...:  25% 3541/13907 [2:11:55<5:04:30,  1.76s/it][A
Training...:  25% 3542/13907 [2:11:56<4:59:03,  1.73s/it][A
Training...:  25% 3543/13907 [2:11:58<4:53:52,  1.70s/it][A
Training...:  25% 3544/13907 [2:12:00<4:49:55,  1.68s/it][A
Training...:  25% 3545/13907 [2:12:01<4:42:15,  1.63s/it][A
Training...:  25% 3546/13907 [2:12:03<4:33:04,  1.58s/it][A
Training...:  26% 3547/13907 [2:12:04<4:23:46,  1.53s/it][A
Training...:  26% 3548/13907 [2:12:05<4:14:31,  1.47s/it][A
Training...:  26% 3549/13907 [2:12:07<4:02:30,  1.40s/it][A
Training...:  26% 3550/13907 [2:12:08<3:44:04,  1.30s/it][A
Training...:  26% 3551/13907 [2:12:12<5:54:23,  2.05s/it][A
Training...:  26% 3552/13907 [2:12:15<7:15:37,  2.52s/it][A
Training...:  26% 3553/13907 [2:12:18<7:55:31,  2.76s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:42:54<8:52:18, 31938.93s/it]
Training...:  26% 3553/13907 [2:12:22<7:55:31,  2.76s/it][A
Training...:  26% 3554/13907 [2:12:22<8:41:42,  3.02s/it][A
Training...:  26% 3555/13907 [2:12:25<8:48:30,  3.06s/it][A
Training...:  26% 3556/13907 [2:12:28<8:43:21,  3.03s/it][A
Training...:  26% 3557/13907 [2:12:31<8:35:36,  2.99s/it][A
Training...:  26% 3558/13907 [2:12:34<8:26:42,  2.94s/it][A
Training...:  26% 3559/13907 [2:12:37<8:16:28,  2.88s/it][A
Training...:  26% 3560/13907 [2:12:39<8:06:24,  2.82s/it][A
Training...:  26% 3561/13907 [2:12:42<7:57:56,  2.77s/it][A
Training...:  26% 3562/13907 [2:12:45<7:49:22,  2.72s/it][A
Training...:  26% 3563/13907 [2:12:47<7:42:13,  2.68s/it][A
Training...:  26% 3564/13907 [2:12:50<7:37:00,  2.65s/it][A
Training...:  26% 3565/13907 [2:12:52<7:30:42,  2.61s/it][A
Training...:  26% 3566/13907 [2:12:55<7:23:25,  2.57s/it][A
Training...:  26% 3567/13907 [2:12:57<7:17:18,  2.54s/it][A
Training...:  26% 3568/13907 [2:13:00<7:09:51,  2.49s/it][A
Training...:  26% 3569/13907 [2:13:02<7:02:51,  2.45s/it][A
Training...:  26% 3570/13907 [2:13:04<6:56:46,  2.42s/it][A
Training...:  26% 3571/13907 [2:13:07<6:51:08,  2.39s/it][A
Training...:  26% 3572/13907 [2:13:09<6:45:22,  2.35s/it][A
Training...:  26% 3573/13907 [2:13:11<6:38:38,  2.31s/it][A
Training...:  26% 3574/13907 [2:13:13<6:35:04,  2.29s/it][A
Training...:  26% 3575/13907 [2:13:16<6:31:32,  2.27s/it][A
Training...:  26% 3576/13907 [2:13:18<6:25:43,  2.24s/it][A
Training...:  26% 3577/13907 [2:13:20<6:18:22,  2.20s/it][A
Training...:  26% 3578/13907 [2:13:22<6:11:24,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:43:56<8:52:18, 31938.93s/it]
Training...:  26% 3578/13907 [2:13:24<6:11:24,  2.16s/it][A
Training...:  26% 3579/13907 [2:13:24<6:21:08,  2.21s/it][A
Training...:  26% 3580/13907 [2:13:26<6:15:06,  2.18s/it][A
Training...:  26% 3581/13907 [2:13:28<6:06:20,  2.13s/it][A
Training...:  26% 3582/13907 [2:13:30<5:57:08,  2.08s/it][A
Training...:  26% 3583/13907 [2:13:32<5:50:53,  2.04s/it][A
Training...:  26% 3584/13907 [2:13:34<5:44:44,  2.00s/it][A
Training...:  26% 3585/13907 [2:13:36<5:37:42,  1.96s/it][A
Training...:  26% 3586/13907 [2:13:38<5:31:20,  1.93s/it][A
Training...:  26% 3587/13907 [2:13:40<5:26:59,  1.90s/it][A
Training...:  26% 3588/13907 [2:13:42<5:21:24,  1.87s/it][A
Training...:  26% 3589/13907 [2:13:43<5:17:00,  1.84s/it][A
Training...:  26% 3590/13907 [2:13:45<5:12:22,  1.82s/it][A
Training...:  26% 3591/13907 [2:13:47<5:07:31,  1.79s/it][A
Training...:  26% 3592/13907 [2:13:48<4:59:11,  1.74s/it][A
Training...:  26% 3593/13907 [2:13:50<4:51:35,  1.70s/it][A
Training...:  26% 3594/13907 [2:13:52<4:44:07,  1.65s/it][A
Training...:  26% 3595/13907 [2:13:53<4:36:03,  1.61s/it][A
Training...:  26% 3596/13907 [2:13:55<4:26:32,  1.55s/it][A
Training...:  26% 3597/13907 [2:13:56<4:16:51,  1.49s/it][A
Training...:  26% 3598/13907 [2:13:57<4:07:20,  1.44s/it][A
Training...:  26% 3599/13907 [2:13:58<3:56:18,  1.38s/it][A
Training...:  26% 3600/13907 [2:14:00<3:40:40,  1.28s/it][A
Training...:  26% 3601/13907 [2:14:03<5:42:56,  2.00s/it][A
Training...:  26% 3602/13907 [2:14:07<6:57:04,  2.43s/it][A
Training...:  26% 3603/13907 [2:14:10<7:38:57,  2.67s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:44:46<8:52:18, 31938.93s/it]
Training...:  26% 3603/13907 [2:14:13<7:38:57,  2.67s/it][A
Training...:  26% 3604/13907 [2:14:13<8:28:25,  2.96s/it][A
Training...:  26% 3605/13907 [2:14:17<8:37:33,  3.01s/it][A
Training...:  26% 3606/13907 [2:14:20<8:35:22,  3.00s/it][A
Training...:  26% 3607/13907 [2:14:22<8:29:30,  2.97s/it][A
Training...:  26% 3608/13907 [2:14:25<8:21:12,  2.92s/it][A
Training...:  26% 3609/13907 [2:14:28<8:13:10,  2.87s/it][A
Training...:  26% 3610/13907 [2:14:31<8:04:42,  2.82s/it][A
Training...:  26% 3611/13907 [2:14:33<7:57:54,  2.78s/it][A
Training...:  26% 3612/13907 [2:14:36<7:51:26,  2.75s/it][A
Training...:  26% 3613/13907 [2:14:39<7:44:56,  2.71s/it][A
Training...:  26% 3614/13907 [2:14:41<7:38:00,  2.67s/it][A
Training...:  26% 3615/13907 [2:14:44<7:30:10,  2.62s/it][A
Training...:  26% 3616/13907 [2:14:46<7:21:45,  2.58s/it][A
Training...:  26% 3617/13907 [2:14:49<7:14:25,  2.53s/it][A
Training...:  26% 3618/13907 [2:14:51<7:08:09,  2.50s/it][A
Training...:  26% 3619/13907 [2:14:54<7:04:27,  2.48s/it][A
Training...:  26% 3620/13907 [2:14:56<6:57:34,  2.44s/it][A
Training...:  26% 3621/13907 [2:14:58<6:51:48,  2.40s/it][A
Training...:  26% 3622/13907 [2:15:00<6:44:11,  2.36s/it][A
Training...:  26% 3623/13907 [2:15:03<6:37:06,  2.32s/it][A
Training...:  26% 3624/13907 [2:15:05<6:30:26,  2.28s/it][A
Training...:  26% 3625/13907 [2:15:07<6:25:28,  2.25s/it][A
Training...:  26% 3626/13907 [2:15:09<6:17:48,  2.20s/it][A
Training...:  26% 3627/13907 [2:15:11<6:12:32,  2.17s/it][A
Training...:  26% 3628/13907 [2:15:13<6:06:14,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:45:48<8:52:18, 31938.93s/it]
Training...:  26% 3628/13907 [2:15:16<6:06:14,  2.14s/it][A
Training...:  26% 3629/13907 [2:15:16<6:16:59,  2.20s/it][A
Training...:  26% 3630/13907 [2:15:18<6:11:04,  2.17s/it][A
Training...:  26% 3631/13907 [2:15:20<6:01:52,  2.11s/it][A
Training...:  26% 3632/13907 [2:15:22<5:53:44,  2.07s/it][A
Training...:  26% 3633/13907 [2:15:24<5:46:28,  2.02s/it][A
Training...:  26% 3634/13907 [2:15:26<5:39:58,  1.99s/it][A
Training...:  26% 3635/13907 [2:15:27<5:34:45,  1.96s/it][A
Training...:  26% 3636/13907 [2:15:29<5:28:47,  1.92s/it][A
Training...:  26% 3637/13907 [2:15:31<5:23:08,  1.89s/it][A
Training...:  26% 3638/13907 [2:15:33<5:17:01,  1.85s/it][A
Training...:  26% 3639/13907 [2:15:35<5:11:08,  1.82s/it][A
Training...:  26% 3640/13907 [2:15:36<5:05:08,  1.78s/it][A
Training...:  26% 3641/13907 [2:15:38<4:59:59,  1.75s/it][A
Training...:  26% 3642/13907 [2:15:40<4:53:55,  1.72s/it][A
Training...:  26% 3643/13907 [2:15:41<4:48:05,  1.68s/it][A
Training...:  26% 3644/13907 [2:15:43<4:42:04,  1.65s/it][A
Training...:  26% 3645/13907 [2:15:44<4:33:49,  1.60s/it][A
Training...:  26% 3646/13907 [2:15:46<4:26:18,  1.56s/it][A
Training...:  26% 3647/13907 [2:15:47<4:18:34,  1.51s/it][A
Training...:  26% 3648/13907 [2:15:48<4:09:32,  1.46s/it][A
Training...:  26% 3649/13907 [2:15:50<3:58:52,  1.40s/it][A
Training...:  26% 3650/13907 [2:15:51<3:41:10,  1.29s/it][A
Training...:  26% 3651/13907 [2:15:55<5:56:35,  2.09s/it][A
Training...:  26% 3652/13907 [2:15:58<7:06:03,  2.49s/it][A
Training...:  26% 3653/13907 [2:16:01<7:42:21,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:46:37<8:52:18, 31938.93s/it]
Training...:  26% 3653/13907 [2:16:05<7:42:21,  2.71s/it][A
Training...:  26% 3654/13907 [2:16:05<8:29:39,  2.98s/it][A
Training...:  26% 3655/13907 [2:16:08<8:37:22,  3.03s/it][A
Training...:  26% 3656/13907 [2:16:11<8:33:13,  3.00s/it][A
Training...:  26% 3657/13907 [2:16:14<8:27:20,  2.97s/it][A
Training...:  26% 3658/13907 [2:16:17<8:18:52,  2.92s/it][A
Training...:  26% 3659/13907 [2:16:19<8:09:13,  2.86s/it][A
Training...:  26% 3660/13907 [2:16:22<7:58:53,  2.80s/it][A
Training...:  26% 3661/13907 [2:16:25<7:49:45,  2.75s/it][A
Training...:  26% 3662/13907 [2:16:27<7:42:17,  2.71s/it][A
Training...:  26% 3663/13907 [2:16:30<7:34:28,  2.66s/it][A
Training...:  26% 3664/13907 [2:16:32<7:28:12,  2.63s/it][A
Training...:  26% 3665/13907 [2:16:35<7:21:45,  2.59s/it][A
Training...:  26% 3666/13907 [2:16:37<7:13:59,  2.54s/it][A
Training...:  26% 3667/13907 [2:16:40<7:08:13,  2.51s/it][A
Training...:  26% 3668/13907 [2:16:42<7:02:41,  2.48s/it][A
Training...:  26% 3669/13907 [2:16:45<6:56:53,  2.44s/it][A
Training...:  26% 3670/13907 [2:16:47<6:49:31,  2.40s/it][A
Training...:  26% 3671/13907 [2:16:49<6:45:17,  2.38s/it][A
Training...:  26% 3672/13907 [2:16:51<6:38:10,  2.33s/it][A
Training...:  26% 3673/13907 [2:16:54<6:33:28,  2.31s/it][A
Training...:  26% 3674/13907 [2:16:56<6:27:42,  2.27s/it][A
Training...:  26% 3675/13907 [2:16:58<6:21:11,  2.24s/it][A
Training...:  26% 3676/13907 [2:17:00<6:15:38,  2.20s/it][A
Training...:  26% 3677/13907 [2:17:02<6:10:43,  2.17s/it][A
Training...:  26% 3678/13907 [2:17:04<6:05:24,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:47:39<8:52:18, 31938.93s/it]
Training...:  26% 3678/13907 [2:17:07<6:05:24,  2.14s/it][A
Training...:  26% 3679/13907 [2:17:07<6:16:32,  2.21s/it][A
Training...:  26% 3680/13907 [2:17:09<6:10:25,  2.17s/it][A
Training...:  26% 3681/13907 [2:17:11<6:02:56,  2.13s/it][A
Training...:  26% 3682/13907 [2:17:13<5:55:22,  2.09s/it][A
Training...:  26% 3683/13907 [2:17:15<5:46:45,  2.03s/it][A
Training...:  26% 3684/13907 [2:17:17<5:39:54,  1.99s/it][A
Training...:  26% 3685/13907 [2:17:19<5:35:41,  1.97s/it][A
Training...:  27% 3686/13907 [2:17:20<5:28:59,  1.93s/it][A
Training...:  27% 3687/13907 [2:17:22<5:24:45,  1.91s/it][A
Training...:  27% 3688/13907 [2:17:24<5:17:27,  1.86s/it][A
Training...:  27% 3689/13907 [2:17:26<5:12:35,  1.84s/it][A
Training...:  27% 3690/13907 [2:17:27<5:04:52,  1.79s/it][A
Training...:  27% 3691/13907 [2:17:29<4:59:13,  1.76s/it][A
Training...:  27% 3692/13907 [2:17:31<4:51:49,  1.71s/it][A
Training...:  27% 3693/13907 [2:17:32<4:44:51,  1.67s/it][A
Training...:  27% 3694/13907 [2:17:34<4:38:43,  1.64s/it][A
Training...:  27% 3695/13907 [2:17:35<4:29:47,  1.59s/it][A
Training...:  27% 3696/13907 [2:17:37<4:20:18,  1.53s/it][A
Training...:  27% 3697/13907 [2:17:38<4:11:14,  1.48s/it][A
Training...:  27% 3698/13907 [2:17:39<4:01:13,  1.42s/it][A
Training...:  27% 3699/13907 [2:17:41<3:51:21,  1.36s/it][A
Training...:  27% 3700/13907 [2:17:42<3:35:31,  1.27s/it][A
Training...:  27% 3701/13907 [2:17:45<5:38:34,  1.99s/it][A
Training...:  27% 3702/13907 [2:17:49<6:53:43,  2.43s/it][A
Training...:  27% 3703/13907 [2:17:52<7:34:43,  2.67s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:48:28<8:52:18, 31938.93s/it]
Training...:  27% 3703/13907 [2:17:56<7:34:43,  2.67s/it][A
Training...:  27% 3704/13907 [2:17:56<8:22:15,  2.95s/it][A
Training...:  27% 3705/13907 [2:17:59<8:32:32,  3.01s/it][A
Training...:  27% 3706/13907 [2:18:02<8:28:32,  2.99s/it][A
Training...:  27% 3707/13907 [2:18:05<8:23:24,  2.96s/it][A
Training...:  27% 3708/13907 [2:18:07<8:15:57,  2.92s/it][A
Training...:  27% 3709/13907 [2:18:10<8:08:05,  2.87s/it][A
Training...:  27% 3710/13907 [2:18:13<8:00:46,  2.83s/it][A
Training...:  27% 3711/13907 [2:18:16<7:51:57,  2.78s/it][A
Training...:  27% 3712/13907 [2:18:18<7:42:55,  2.72s/it][A
Training...:  27% 3713/13907 [2:18:21<7:35:21,  2.68s/it][A
Training...:  27% 3714/13907 [2:18:23<7:27:34,  2.63s/it][A
Training...:  27% 3715/13907 [2:18:26<7:20:04,  2.59s/it][A
Training...:  27% 3716/13907 [2:18:28<7:13:49,  2.55s/it][A
Training...:  27% 3717/13907 [2:18:31<7:08:06,  2.52s/it][A
Training...:  27% 3718/13907 [2:18:33<7:02:52,  2.49s/it][A
Training...:  27% 3719/13907 [2:18:36<6:59:16,  2.47s/it][A
Training...:  27% 3720/13907 [2:18:38<6:56:28,  2.45s/it][A
Training...:  27% 3721/13907 [2:18:40<6:50:10,  2.42s/it][A
Training...:  27% 3722/13907 [2:18:43<6:41:26,  2.36s/it][A
Training...:  27% 3723/13907 [2:18:45<6:35:33,  2.33s/it][A
Training...:  27% 3724/13907 [2:18:47<6:28:06,  2.29s/it][A
Training...:  27% 3725/13907 [2:18:49<6:22:01,  2.25s/it][A
Training...:  27% 3726/13907 [2:18:51<6:17:12,  2.22s/it][A
Training...:  27% 3727/13907 [2:18:53<6:13:15,  2.20s/it][A
Training...:  27% 3728/13907 [2:18:56<6:08:34,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:49:30<8:52:18, 31938.93s/it]
Training...:  27% 3728/13907 [2:18:58<6:08:34,  2.17s/it][A
Training...:  27% 3729/13907 [2:18:58<6:18:30,  2.23s/it][A
Training...:  27% 3730/13907 [2:19:00<6:11:36,  2.19s/it][A
Training...:  27% 3731/13907 [2:19:02<6:02:23,  2.14s/it][A
Training...:  27% 3732/13907 [2:19:04<5:52:44,  2.08s/it][A
Training...:  27% 3733/13907 [2:19:06<5:45:45,  2.04s/it][A
Training...:  27% 3734/13907 [2:19:08<5:38:59,  2.00s/it][A
Training...:  27% 3735/13907 [2:19:10<5:33:05,  1.96s/it][A
Training...:  27% 3736/13907 [2:19:12<5:27:05,  1.93s/it][A
Training...:  27% 3737/13907 [2:19:13<5:22:58,  1.91s/it][A
Training...:  27% 3738/13907 [2:19:15<5:16:55,  1.87s/it][A
Training...:  27% 3739/13907 [2:19:17<5:12:03,  1.84s/it][A
Training...:  27% 3740/13907 [2:19:19<5:06:35,  1.81s/it][A
Training...:  27% 3741/13907 [2:19:20<5:01:11,  1.78s/it][A
Training...:  27% 3742/13907 [2:19:22<4:55:39,  1.75s/it][A
Training...:  27% 3743/13907 [2:19:24<4:49:38,  1.71s/it][A
Training...:  27% 3744/13907 [2:19:25<4:43:49,  1.68s/it][A
Training...:  27% 3745/13907 [2:19:27<4:37:44,  1.64s/it][A
Training...:  27% 3746/13907 [2:19:28<4:28:47,  1.59s/it][A
Training...:  27% 3747/13907 [2:19:30<4:19:03,  1.53s/it][A
Training...:  27% 3748/13907 [2:19:31<4:09:23,  1.47s/it][A
Training...:  27% 3749/13907 [2:19:32<3:58:15,  1.41s/it][A
Training...:  27% 3750/13907 [2:19:33<3:41:05,  1.31s/it][A
Training...:  27% 3751/13907 [2:19:37<5:47:14,  2.05s/it][A
Training...:  27% 3752/13907 [2:19:41<6:59:50,  2.48s/it][A
Training...:  27% 3753/13907 [2:19:44<7:42:48,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:50:20<8:52:18, 31938.93s/it]
Training...:  27% 3753/13907 [2:19:48<7:42:48,  2.73s/it][A
Training...:  27% 3754/13907 [2:19:48<8:27:58,  3.00s/it][A
Training...:  27% 3755/13907 [2:19:51<8:35:21,  3.05s/it][A
Training...:  27% 3756/13907 [2:19:54<8:31:59,  3.03s/it][A
Training...:  27% 3757/13907 [2:19:57<8:28:36,  3.01s/it][A
Training...:  27% 3758/13907 [2:20:00<8:26:04,  2.99s/it][A
Training...:  27% 3759/13907 [2:20:03<8:23:18,  2.98s/it][A
Training...:  27% 3760/13907 [2:20:05<8:13:12,  2.92s/it][A
Training...:  27% 3761/13907 [2:20:08<8:00:57,  2.84s/it][A
Training...:  27% 3762/13907 [2:20:11<7:49:29,  2.78s/it][A
Training...:  27% 3763/13907 [2:20:13<7:40:34,  2.72s/it][A
Training...:  27% 3764/13907 [2:20:16<7:31:57,  2.67s/it][A
Training...:  27% 3765/13907 [2:20:18<7:24:30,  2.63s/it][A
Training...:  27% 3766/13907 [2:20:21<7:16:00,  2.58s/it][A
Training...:  27% 3767/13907 [2:20:23<7:08:16,  2.53s/it][A
Training...:  27% 3768/13907 [2:20:26<7:00:06,  2.49s/it][A
Training...:  27% 3769/13907 [2:20:28<6:53:52,  2.45s/it][A
Training...:  27% 3770/13907 [2:20:30<6:47:56,  2.41s/it][A
Training...:  27% 3771/13907 [2:20:33<6:42:20,  2.38s/it][A
Training...:  27% 3772/13907 [2:20:35<6:37:04,  2.35s/it][A
Training...:  27% 3773/13907 [2:20:37<6:32:09,  2.32s/it][A
Training...:  27% 3774/13907 [2:20:39<6:27:41,  2.30s/it][A
Training...:  27% 3775/13907 [2:20:42<6:22:03,  2.26s/it][A
Training...:  27% 3776/13907 [2:20:44<6:15:38,  2.22s/it][A
Training...:  27% 3777/13907 [2:20:46<6:11:12,  2.20s/it][A
Training...:  27% 3778/13907 [2:20:48<6:05:54,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:51:22<8:52:18, 31938.93s/it]
Training...:  27% 3778/13907 [2:20:50<6:05:54,  2.17s/it][A
Training...:  27% 3779/13907 [2:20:50<6:18:26,  2.24s/it][A
Training...:  27% 3780/13907 [2:20:52<6:11:15,  2.20s/it][A
Training...:  27% 3781/13907 [2:20:54<6:02:50,  2.15s/it][A
Training...:  27% 3782/13907 [2:20:56<5:53:50,  2.10s/it][A
Training...:  27% 3783/13907 [2:20:58<5:46:32,  2.05s/it][A
Training...:  27% 3784/13907 [2:21:00<5:38:53,  2.01s/it][A
Training...:  27% 3785/13907 [2:21:02<5:33:11,  1.98s/it][A
Training...:  27% 3786/13907 [2:21:04<5:27:46,  1.94s/it][A
Training...:  27% 3787/13907 [2:21:06<5:23:16,  1.92s/it][A
Training...:  27% 3788/13907 [2:21:08<5:19:57,  1.90s/it][A
Training...:  27% 3789/13907 [2:21:10<5:13:30,  1.86s/it][A
Training...:  27% 3790/13907 [2:21:11<5:06:07,  1.82s/it][A
Training...:  27% 3791/13907 [2:21:13<4:58:47,  1.77s/it][A
Training...:  27% 3792/13907 [2:21:15<4:51:08,  1.73s/it][A
Training...:  27% 3793/13907 [2:21:16<4:44:32,  1.69s/it][A
Training...:  27% 3794/13907 [2:21:18<4:38:42,  1.65s/it][A
Training...:  27% 3795/13907 [2:21:19<4:31:31,  1.61s/it][A
Training...:  27% 3796/13907 [2:21:21<4:23:17,  1.56s/it][A
Training...:  27% 3797/13907 [2:21:22<4:15:03,  1.51s/it][A
Training...:  27% 3798/13907 [2:21:23<4:05:21,  1.46s/it][A
Training...:  27% 3799/13907 [2:21:25<3:53:26,  1.39s/it][A
Training...:  27% 3800/13907 [2:21:26<3:36:26,  1.28s/it][A
Training...:  27% 3801/13907 [2:21:29<5:39:18,  2.01s/it][A
Training...:  27% 3802/13907 [2:21:33<6:54:25,  2.46s/it][A
Training...:  27% 3803/13907 [2:21:36<7:34:19,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:52:12<8:52:18, 31938.93s/it]
Training...:  27% 3803/13907 [2:21:40<7:34:19,  2.70s/it][A
Training...:  27% 3804/13907 [2:21:40<8:19:55,  2.97s/it][A
Training...:  27% 3805/13907 [2:21:43<8:27:44,  3.02s/it][A
Training...:  27% 3806/13907 [2:21:46<8:23:14,  2.99s/it][A
Training...:  27% 3807/13907 [2:21:49<8:17:21,  2.95s/it][A
Training...:  27% 3808/13907 [2:21:51<8:09:45,  2.91s/it][A
Training...:  27% 3809/13907 [2:21:54<8:02:46,  2.87s/it][A
Training...:  27% 3810/13907 [2:21:57<7:54:19,  2.82s/it][A
Training...:  27% 3811/13907 [2:22:00<7:46:00,  2.77s/it][A
Training...:  27% 3812/13907 [2:22:02<7:38:17,  2.72s/it][A
Training...:  27% 3813/13907 [2:22:05<7:30:32,  2.68s/it][A
Training...:  27% 3814/13907 [2:22:07<7:23:52,  2.64s/it][A
Training...:  27% 3815/13907 [2:22:10<7:19:31,  2.61s/it][A
Training...:  27% 3816/13907 [2:22:12<7:17:01,  2.60s/it][A
Training...:  27% 3817/13907 [2:22:15<7:08:50,  2.55s/it][A
Training...:  27% 3818/13907 [2:22:17<7:00:15,  2.50s/it][A
Training...:  27% 3819/13907 [2:22:20<6:52:51,  2.46s/it][A
Training...:  27% 3820/13907 [2:22:22<6:45:15,  2.41s/it][A
Training...:  27% 3821/13907 [2:22:24<6:40:05,  2.38s/it][A
Training...:  27% 3822/13907 [2:22:27<6:34:25,  2.35s/it][A
Training...:  27% 3823/13907 [2:22:29<6:28:49,  2.31s/it][A
Training...:  27% 3824/13907 [2:22:31<6:22:22,  2.28s/it][A
Training...:  28% 3825/13907 [2:22:33<6:16:37,  2.24s/it][A
Training...:  28% 3826/13907 [2:22:35<6:11:05,  2.21s/it][A
Training...:  28% 3827/13907 [2:22:37<6:05:47,  2.18s/it][A
Training...:  28% 3828/13907 [2:22:39<6:01:19,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:53:14<8:52:18, 31938.93s/it]
Training...:  28% 3828/13907 [2:22:42<6:01:19,  2.15s/it][A
Training...:  28% 3829/13907 [2:22:42<6:12:51,  2.22s/it][A
Training...:  28% 3830/13907 [2:22:44<6:06:20,  2.18s/it][A
Training...:  28% 3831/13907 [2:22:46<5:56:38,  2.12s/it][A
Training...:  28% 3832/13907 [2:22:48<5:48:35,  2.08s/it][A
Training...:  28% 3833/13907 [2:22:50<5:41:34,  2.03s/it][A
Training...:  28% 3834/13907 [2:22:52<5:35:34,  2.00s/it][A
Training...:  28% 3835/13907 [2:22:54<5:30:51,  1.97s/it][A
Training...:  28% 3836/13907 [2:22:55<5:25:19,  1.94s/it][A
Training...:  28% 3837/13907 [2:22:57<5:20:07,  1.91s/it][A
Training...:  28% 3838/13907 [2:22:59<5:15:27,  1.88s/it][A
Training...:  28% 3839/13907 [2:23:01<5:09:27,  1.84s/it][A
Training...:  28% 3840/13907 [2:23:03<5:03:35,  1.81s/it][A
Training...:  28% 3841/13907 [2:23:04<4:57:35,  1.77s/it][A
Training...:  28% 3842/13907 [2:23:06<4:50:58,  1.73s/it][A
Training...:  28% 3843/13907 [2:23:08<4:44:31,  1.70s/it][A
Training...:  28% 3844/13907 [2:23:09<4:38:23,  1.66s/it][A
Training...:  28% 3845/13907 [2:23:11<4:31:18,  1.62s/it][A
Training...:  28% 3846/13907 [2:23:12<4:23:39,  1.57s/it][A
Training...:  28% 3847/13907 [2:23:14<4:15:38,  1.52s/it][A
Training...:  28% 3848/13907 [2:23:15<4:05:51,  1.47s/it][A
Training...:  28% 3849/13907 [2:23:16<3:53:44,  1.39s/it][A
Training...:  28% 3850/13907 [2:23:17<3:36:43,  1.29s/it][A
Training...:  28% 3851/13907 [2:23:21<5:39:56,  2.03s/it][A
Training...:  28% 3852/13907 [2:23:24<6:52:41,  2.46s/it][A
Training...:  28% 3853/13907 [2:23:28<7:33:26,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:54:03<8:52:18, 31938.93s/it]
Training...:  28% 3853/13907 [2:23:31<7:33:26,  2.71s/it][A
Training...:  28% 3854/13907 [2:23:31<8:19:37,  2.98s/it][A
Training...:  28% 3855/13907 [2:23:34<8:30:32,  3.05s/it][A
Training...:  28% 3856/13907 [2:23:37<8:27:26,  3.03s/it][A
Training...:  28% 3857/13907 [2:23:40<8:18:44,  2.98s/it][A
Training...:  28% 3858/13907 [2:23:43<8:08:42,  2.92s/it][A
Training...:  28% 3859/13907 [2:23:46<7:58:16,  2.86s/it][A
Training...:  28% 3860/13907 [2:23:48<7:49:16,  2.80s/it][A
Training...:  28% 3861/13907 [2:23:51<7:41:16,  2.75s/it][A
Training...:  28% 3862/13907 [2:23:54<7:31:23,  2.70s/it][A
Training...:  28% 3863/13907 [2:23:56<7:25:09,  2.66s/it][A
Training...:  28% 3864/13907 [2:23:59<7:17:04,  2.61s/it][A
Training...:  28% 3865/13907 [2:24:01<7:09:28,  2.57s/it][A
Training...:  28% 3866/13907 [2:24:04<7:03:18,  2.53s/it][A
Training...:  28% 3867/13907 [2:24:06<6:57:53,  2.50s/it][A
Training...:  28% 3868/13907 [2:24:08<6:51:26,  2.46s/it][A
Training...:  28% 3869/13907 [2:24:11<6:46:36,  2.43s/it][A
Training...:  28% 3870/13907 [2:24:13<6:41:00,  2.40s/it][A
Training...:  28% 3871/13907 [2:24:15<6:36:49,  2.37s/it][A
Training...:  28% 3872/13907 [2:24:18<6:31:58,  2.34s/it][A
Training...:  28% 3873/13907 [2:24:20<6:28:06,  2.32s/it][A
Training...:  28% 3874/13907 [2:24:22<6:21:24,  2.28s/it][A
Training...:  28% 3875/13907 [2:24:24<6:16:24,  2.25s/it][A
Training...:  28% 3876/13907 [2:24:26<6:10:06,  2.21s/it][A
Training...:  28% 3877/13907 [2:24:29<6:03:07,  2.17s/it][A
Training...:  28% 3878/13907 [2:24:31<5:58:06,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:55:05<8:52:18, 31938.93s/it]
Training...:  28% 3878/13907 [2:24:33<5:58:06,  2.14s/it][A
Training...:  28% 3879/13907 [2:24:33<6:08:00,  2.20s/it][A
Training...:  28% 3880/13907 [2:24:35<6:01:30,  2.16s/it][A
Training...:  28% 3881/13907 [2:24:37<5:53:04,  2.11s/it][A
Training...:  28% 3882/13907 [2:24:39<5:44:30,  2.06s/it][A
Training...:  28% 3883/13907 [2:24:41<5:37:42,  2.02s/it][A
Training...:  28% 3884/13907 [2:24:43<5:32:28,  1.99s/it][A
Training...:  28% 3885/13907 [2:24:45<5:26:45,  1.96s/it][A
Training...:  28% 3886/13907 [2:24:47<5:22:39,  1.93s/it][A
Training...:  28% 3887/13907 [2:24:48<5:19:07,  1.91s/it][A
Training...:  28% 3888/13907 [2:24:50<5:14:09,  1.88s/it][A
Training...:  28% 3889/13907 [2:24:52<5:07:59,  1.84s/it][A
Training...:  28% 3890/13907 [2:24:54<5:01:15,  1.80s/it][A
Training...:  28% 3891/13907 [2:24:55<4:55:43,  1.77s/it][A
Training...:  28% 3892/13907 [2:24:57<4:48:49,  1.73s/it][A
Training...:  28% 3893/13907 [2:24:59<4:42:01,  1.69s/it][A
Training...:  28% 3894/13907 [2:25:00<4:36:07,  1.65s/it][A
Training...:  28% 3895/13907 [2:25:02<4:28:18,  1.61s/it][A
Training...:  28% 3896/13907 [2:25:03<4:20:41,  1.56s/it][A
Training...:  28% 3897/13907 [2:25:05<4:11:33,  1.51s/it][A
Training...:  28% 3898/13907 [2:25:06<4:02:08,  1.45s/it][A
Training...:  28% 3899/13907 [2:25:07<3:50:51,  1.38s/it][A
Training...:  28% 3900/13907 [2:25:08<3:34:59,  1.29s/it][A
Training...:  28% 3901/13907 [2:25:12<5:42:00,  2.05s/it][A
Training...:  28% 3902/13907 [2:25:16<6:55:14,  2.49s/it][A
Training...:  28% 3903/13907 [2:25:19<7:32:36,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:55:54<8:52:18, 31938.93s/it]
Training...:  28% 3903/13907 [2:25:22<7:32:36,  2.71s/it][A
Training...:  28% 3904/13907 [2:25:22<8:17:49,  2.99s/it][A
Training...:  28% 3905/13907 [2:25:26<8:25:28,  3.03s/it][A
Training...:  28% 3906/13907 [2:25:28<8:19:55,  3.00s/it][A
Training...:  28% 3907/13907 [2:25:31<8:13:40,  2.96s/it][A
Training...:  28% 3908/13907 [2:25:34<8:07:01,  2.92s/it][A
Training...:  28% 3909/13907 [2:25:37<7:59:31,  2.88s/it][A
Training...:  28% 3910/13907 [2:25:40<7:51:57,  2.83s/it][A
Training...:  28% 3911/13907 [2:25:42<7:42:15,  2.77s/it][A
Training...:  28% 3912/13907 [2:25:45<7:33:03,  2.72s/it][A
Training...:  28% 3913/13907 [2:25:47<7:24:33,  2.67s/it][A
Training...:  28% 3914/13907 [2:25:50<7:17:36,  2.63s/it][A
Training...:  28% 3915/13907 [2:25:52<7:11:14,  2.59s/it][A
Training...:  28% 3916/13907 [2:25:55<7:04:30,  2.55s/it][A
Training...:  28% 3917/13907 [2:25:57<6:57:07,  2.51s/it][A
Training...:  28% 3918/13907 [2:26:00<6:51:26,  2.47s/it][A
Training...:  28% 3919/13907 [2:26:02<6:47:05,  2.45s/it][A
Training...:  28% 3920/13907 [2:26:04<6:42:40,  2.42s/it][A
Training...:  28% 3921/13907 [2:26:07<6:35:55,  2.38s/it][A
Training...:  28% 3922/13907 [2:26:09<6:28:19,  2.33s/it][A
Training...:  28% 3923/13907 [2:26:11<6:22:22,  2.30s/it][A
Training...:  28% 3924/13907 [2:26:13<6:14:46,  2.25s/it][A
Training...:  28% 3925/13907 [2:26:15<6:09:01,  2.22s/it][A
Training...:  28% 3926/13907 [2:26:18<6:04:00,  2.19s/it][A
Training...:  28% 3927/13907 [2:26:20<5:59:29,  2.16s/it][A
Training...:  28% 3928/13907 [2:26:22<5:54:13,  2.13s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:56:56<8:52:18, 31938.93s/it]
Training...:  28% 3928/13907 [2:26:24<5:54:13,  2.13s/it][A
Training...:  28% 3929/13907 [2:26:24<6:05:14,  2.20s/it][A
Training...:  28% 3930/13907 [2:26:26<6:00:26,  2.17s/it][A
Training...:  28% 3931/13907 [2:26:28<5:51:08,  2.11s/it][A
Training...:  28% 3932/13907 [2:26:30<5:43:32,  2.07s/it][A
Training...:  28% 3933/13907 [2:26:32<5:35:58,  2.02s/it][A
Training...:  28% 3934/13907 [2:26:34<5:29:27,  1.98s/it][A
Training...:  28% 3935/13907 [2:26:36<5:23:12,  1.94s/it][A
Training...:  28% 3936/13907 [2:26:38<5:17:14,  1.91s/it][A
Training...:  28% 3937/13907 [2:26:39<5:11:31,  1.87s/it][A
Training...:  28% 3938/13907 [2:26:41<5:05:41,  1.84s/it][A
Training...:  28% 3939/13907 [2:26:43<5:01:29,  1.81s/it][A
Training...:  28% 3940/13907 [2:26:45<4:55:48,  1.78s/it][A
Training...:  28% 3941/13907 [2:26:46<4:50:11,  1.75s/it][A
Training...:  28% 3942/13907 [2:26:48<4:45:30,  1.72s/it][A
Training...:  28% 3943/13907 [2:26:50<4:39:51,  1.69s/it][A
Training...:  28% 3944/13907 [2:26:51<4:34:23,  1.65s/it][A
Training...:  28% 3945/13907 [2:26:53<4:27:56,  1.61s/it][A
Training...:  28% 3946/13907 [2:26:54<4:21:06,  1.57s/it][A
Training...:  28% 3947/13907 [2:26:56<4:12:51,  1.52s/it][A
Training...:  28% 3948/13907 [2:26:57<4:03:19,  1.47s/it][A
Training...:  28% 3949/13907 [2:26:58<3:52:45,  1.40s/it][A
Training...:  28% 3950/13907 [2:26:59<3:36:15,  1.30s/it][A
Training...:  28% 3951/13907 [2:27:03<5:38:17,  2.04s/it][A
Training...:  28% 3952/13907 [2:27:06<6:52:16,  2.48s/it][A
Training...:  28% 3953/13907 [2:27:10<7:31:18,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:57:45<8:52:18, 31938.93s/it]
Training...:  28% 3953/13907 [2:27:13<7:31:18,  2.72s/it][A
Training...:  28% 3954/13907 [2:27:13<8:17:13,  3.00s/it][A
Training...:  28% 3955/13907 [2:27:17<8:24:26,  3.04s/it][A
Training...:  28% 3956/13907 [2:27:20<8:20:50,  3.02s/it][A
Training...:  28% 3957/13907 [2:27:22<8:15:51,  2.99s/it][A
Training...:  28% 3958/13907 [2:27:25<8:08:47,  2.95s/it][A
Training...:  28% 3959/13907 [2:27:28<7:58:52,  2.89s/it][A
Training...:  28% 3960/13907 [2:27:31<7:49:59,  2.83s/it][A
Training...:  28% 3961/13907 [2:27:33<7:41:22,  2.78s/it][A
Training...:  28% 3962/13907 [2:27:36<7:32:57,  2.73s/it][A
Training...:  28% 3963/13907 [2:27:39<7:24:15,  2.68s/it][A
Training...:  29% 3964/13907 [2:27:41<7:14:54,  2.62s/it][A
Training...:  29% 3965/13907 [2:27:44<7:08:16,  2.58s/it][A
Training...:  29% 3966/13907 [2:27:46<7:01:05,  2.54s/it][A
Training...:  29% 3967/13907 [2:27:48<6:53:54,  2.50s/it][A
Training...:  29% 3968/13907 [2:27:51<6:48:45,  2.47s/it][A
Training...:  29% 3969/13907 [2:27:53<6:42:20,  2.43s/it][A
Training...:  29% 3970/13907 [2:27:55<6:37:33,  2.40s/it][A
Training...:  29% 3971/13907 [2:27:58<6:33:51,  2.38s/it][A
Training...:  29% 3972/13907 [2:28:00<6:25:32,  2.33s/it][A
Training...:  29% 3973/13907 [2:28:02<6:19:43,  2.29s/it][A
Training...:  29% 3974/13907 [2:28:04<6:15:47,  2.27s/it][A
Training...:  29% 3975/13907 [2:28:07<6:10:09,  2.24s/it][A
Training...:  29% 3976/13907 [2:28:09<6:06:34,  2.21s/it][A
Training...:  29% 3977/13907 [2:28:11<6:01:12,  2.18s/it][A
Training...:  29% 3978/13907 [2:28:13<5:56:38,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:58:47<8:52:18, 31938.93s/it]
Training...:  29% 3978/13907 [2:28:15<5:56:38,  2.16s/it][A
Training...:  29% 3979/13907 [2:28:15<6:06:43,  2.22s/it][A
Training...:  29% 3980/13907 [2:28:17<5:59:18,  2.17s/it][A
Training...:  29% 3981/13907 [2:28:19<5:49:52,  2.11s/it][A
Training...:  29% 3982/13907 [2:28:21<5:42:16,  2.07s/it][A
Training...:  29% 3983/13907 [2:28:23<5:35:33,  2.03s/it][A
Training...:  29% 3984/13907 [2:28:25<5:28:59,  1.99s/it][A
Training...:  29% 3985/13907 [2:28:27<5:22:18,  1.95s/it][A
Training...:  29% 3986/13907 [2:28:29<5:17:28,  1.92s/it][A
Training...:  29% 3987/13907 [2:28:31<5:14:24,  1.90s/it][A
Training...:  29% 3988/13907 [2:28:33<5:09:40,  1.87s/it][A
Training...:  29% 3989/13907 [2:28:34<5:05:21,  1.85s/it][A
Training...:  29% 3990/13907 [2:28:36<4:59:45,  1.81s/it][A
Training...:  29% 3991/13907 [2:28:38<4:54:53,  1.78s/it][A
Training...:  29% 3992/13907 [2:28:39<4:49:00,  1.75s/it][A
Training...:  29% 3993/13907 [2:28:41<4:43:23,  1.72s/it][A
Training...:  29% 3994/13907 [2:28:43<4:34:42,  1.66s/it][A
Training...:  29% 3995/13907 [2:28:44<4:26:33,  1.61s/it][A
Training...:  29% 3996/13907 [2:28:46<4:18:53,  1.57s/it][A
Training...:  29% 3997/13907 [2:28:47<4:10:19,  1.52s/it][A
Training...:  29% 3998/13907 [2:28:48<4:00:26,  1.46s/it][A
Training...:  29% 3999/13907 [2:28:50<3:49:37,  1.39s/it][A
Training...:  29% 4000/13907 [2:28:51<3:33:58,  1.30s/it][A
Training...:  29% 4001/13907 [2:28:54<5:31:51,  2.01s/it][A
Training...:  29% 4002/13907 [2:28:58<6:46:12,  2.46s/it][A
Training...:  29% 4003/13907 [2:29:01<7:27:28,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [28:59:37<8:52:18, 31938.93s/it]
Training...:  29% 4003/13907 [2:29:05<7:27:28,  2.71s/it][A
Training...:  29% 4004/13907 [2:29:05<8:15:58,  3.00s/it][A
Training...:  29% 4005/13907 [2:29:08<8:26:58,  3.07s/it][A
Training...:  29% 4006/13907 [2:29:11<8:22:44,  3.05s/it][A
Training...:  29% 4007/13907 [2:29:14<8:14:54,  3.00s/it][A
Training...:  29% 4008/13907 [2:29:17<8:06:33,  2.95s/it][A
Training...:  29% 4009/13907 [2:29:19<7:58:24,  2.90s/it][A
Training...:  29% 4010/13907 [2:29:22<7:53:47,  2.87s/it][A
Training...:  29% 4011/13907 [2:29:25<7:45:00,  2.82s/it][A
Training...:  29% 4012/13907 [2:29:28<7:36:55,  2.77s/it][A
Training...:  29% 4013/13907 [2:29:30<7:32:59,  2.75s/it][A
Training...:  29% 4014/13907 [2:29:33<7:26:09,  2.71s/it][A
Training...:  29% 4015/13907 [2:29:36<7:18:19,  2.66s/it][A
Training...:  29% 4016/13907 [2:29:38<7:09:58,  2.61s/it][A
Training...:  29% 4017/13907 [2:29:40<7:02:11,  2.56s/it][A
Training...:  29% 4018/13907 [2:29:43<6:55:03,  2.52s/it][A
Training...:  29% 4019/13907 [2:29:45<6:47:31,  2.47s/it][A
Training...:  29% 4020/13907 [2:29:48<6:39:51,  2.43s/it][A
Training...:  29% 4021/13907 [2:29:50<6:34:34,  2.39s/it][A
Training...:  29% 4022/13907 [2:29:52<6:28:43,  2.36s/it][A
Training...:  29% 4023/13907 [2:29:54<6:22:09,  2.32s/it][A
Training...:  29% 4024/13907 [2:29:57<6:15:55,  2.28s/it][A
Training...:  29% 4025/13907 [2:29:59<6:10:00,  2.25s/it][A
Training...:  29% 4026/13907 [2:30:01<6:04:27,  2.21s/it][A
Training...:  29% 4027/13907 [2:30:03<5:59:17,  2.18s/it][A
Training...:  29% 4028/13907 [2:30:05<5:53:54,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:00:39<8:52:18, 31938.93s/it]
Training...:  29% 4028/13907 [2:30:07<5:53:54,  2.15s/it][A
Training...:  29% 4029/13907 [2:30:07<6:05:35,  2.22s/it][A
Training...:  29% 4030/13907 [2:30:10<5:59:44,  2.19s/it][A
Training...:  29% 4031/13907 [2:30:12<5:51:09,  2.13s/it][A
Training...:  29% 4032/13907 [2:30:14<5:44:49,  2.10s/it][A
Training...:  29% 4033/13907 [2:30:16<5:38:30,  2.06s/it][A
Training...:  29% 4034/13907 [2:30:17<5:32:35,  2.02s/it][A
Training...:  29% 4035/13907 [2:30:19<5:29:09,  2.00s/it][A
Training...:  29% 4036/13907 [2:30:21<5:21:48,  1.96s/it][A
Training...:  29% 4037/13907 [2:30:23<5:15:32,  1.92s/it][A
Training...:  29% 4038/13907 [2:30:25<5:07:45,  1.87s/it][A
Training...:  29% 4039/13907 [2:30:27<5:01:57,  1.84s/it][A
Training...:  29% 4040/13907 [2:30:28<4:54:33,  1.79s/it][A
Training...:  29% 4041/13907 [2:30:30<4:48:00,  1.75s/it][A
Training...:  29% 4042/13907 [2:30:32<4:41:36,  1.71s/it][A
Training...:  29% 4043/13907 [2:30:33<4:35:32,  1.68s/it][A
Training...:  29% 4044/13907 [2:30:35<4:29:39,  1.64s/it][A
Training...:  29% 4045/13907 [2:30:36<4:22:48,  1.60s/it][A
Training...:  29% 4046/13907 [2:30:38<4:14:44,  1.55s/it][A
Training...:  29% 4047/13907 [2:30:39<4:05:22,  1.49s/it][A
Training...:  29% 4048/13907 [2:30:40<3:56:29,  1.44s/it][A
Training...:  29% 4049/13907 [2:30:42<3:45:21,  1.37s/it][A
Training...:  29% 4050/13907 [2:30:43<3:29:07,  1.27s/it][A
Training...:  29% 4051/13907 [2:30:46<5:28:49,  2.00s/it][A
Training...:  29% 4052/13907 [2:30:50<6:42:05,  2.45s/it][A
Training...:  29% 4053/13907 [2:30:53<7:23:55,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:01:29<8:52:18, 31938.93s/it]
Training...:  29% 4053/13907 [2:30:57<7:23:55,  2.70s/it][A
Training...:  29% 4054/13907 [2:30:57<8:13:35,  3.01s/it][A
Training...:  29% 4055/13907 [2:31:00<8:25:47,  3.08s/it][A
Training...:  29% 4056/13907 [2:31:03<8:25:19,  3.08s/it][A
Training...:  29% 4057/13907 [2:31:06<8:15:12,  3.02s/it][A
Training...:  29% 4058/13907 [2:31:09<8:06:01,  2.96s/it][A
Training...:  29% 4059/13907 [2:31:12<7:55:49,  2.90s/it][A
Training...:  29% 4060/13907 [2:31:14<7:47:44,  2.85s/it][A
Training...:  29% 4061/13907 [2:31:17<7:38:58,  2.80s/it][A
Training...:  29% 4062/13907 [2:31:20<7:29:31,  2.74s/it][A
Training...:  29% 4063/13907 [2:31:22<7:23:05,  2.70s/it][A
Training...:  29% 4064/13907 [2:31:25<7:15:34,  2.66s/it][A
Training...:  29% 4065/13907 [2:31:27<7:08:18,  2.61s/it][A
Training...:  29% 4066/13907 [2:31:30<7:01:17,  2.57s/it][A
Training...:  29% 4067/13907 [2:31:32<6:53:41,  2.52s/it][A
Training...:  29% 4068/13907 [2:31:35<6:47:49,  2.49s/it][A
Training...:  29% 4069/13907 [2:31:37<6:41:40,  2.45s/it][A
Training...:  29% 4070/13907 [2:31:39<6:36:12,  2.42s/it][A
Training...:  29% 4071/13907 [2:31:42<6:29:53,  2.38s/it][A
Training...:  29% 4072/13907 [2:31:44<6:24:54,  2.35s/it][A
Training...:  29% 4073/13907 [2:31:46<6:18:46,  2.31s/it][A
Training...:  29% 4074/13907 [2:31:48<6:14:20,  2.28s/it][A
Training...:  29% 4075/13907 [2:31:50<6:09:45,  2.26s/it][A
Training...:  29% 4076/13907 [2:31:53<6:04:27,  2.22s/it][A
Training...:  29% 4077/13907 [2:31:55<5:59:17,  2.19s/it][A
Training...:  29% 4078/13907 [2:31:57<5:52:50,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:02:31<8:52:18, 31938.93s/it]
Training...:  29% 4078/13907 [2:31:59<5:52:50,  2.15s/it][A
Training...:  29% 4079/13907 [2:31:59<6:03:14,  2.22s/it][A
Training...:  29% 4080/13907 [2:32:01<5:57:29,  2.18s/it][A
Training...:  29% 4081/13907 [2:32:03<5:47:32,  2.12s/it][A
Training...:  29% 4082/13907 [2:32:05<5:40:33,  2.08s/it][A
Training...:  29% 4083/13907 [2:32:07<5:34:23,  2.04s/it][A
Training...:  29% 4084/13907 [2:32:09<5:27:56,  2.00s/it][A
Training...:  29% 4085/13907 [2:32:11<5:22:02,  1.97s/it][A
Training...:  29% 4086/13907 [2:32:13<5:15:59,  1.93s/it][A
Training...:  29% 4087/13907 [2:32:15<5:10:33,  1.90s/it][A
Training...:  29% 4088/13907 [2:32:16<5:05:24,  1.87s/it][A
Training...:  29% 4089/13907 [2:32:18<5:03:09,  1.85s/it][A
Training...:  29% 4090/13907 [2:32:20<4:57:10,  1.82s/it][A
Training...:  29% 4091/13907 [2:32:22<4:50:14,  1.77s/it][A
Training...:  29% 4092/13907 [2:32:23<4:42:44,  1.73s/it][A
Training...:  29% 4093/13907 [2:32:25<4:36:49,  1.69s/it][A
Training...:  29% 4094/13907 [2:32:26<4:30:44,  1.66s/it][A
Training...:  29% 4095/13907 [2:32:28<4:22:16,  1.60s/it][A
Training...:  29% 4096/13907 [2:32:29<4:13:48,  1.55s/it][A
Training...:  29% 4097/13907 [2:32:31<4:05:23,  1.50s/it][A
Training...:  29% 4098/13907 [2:32:32<3:55:12,  1.44s/it][A
Training...:  29% 4099/13907 [2:32:33<3:44:03,  1.37s/it][A
Training...:  29% 4100/13907 [2:32:34<3:27:51,  1.27s/it][A
Training...:  29% 4101/13907 [2:32:38<5:25:01,  1.99s/it][A
Training...:  29% 4102/13907 [2:32:41<6:37:13,  2.43s/it][A
Training...:  30% 4103/13907 [2:32:45<7:17:19,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:03:20<8:52:18, 31938.93s/it]
Training...:  30% 4103/13907 [2:32:48<7:17:19,  2.68s/it][A
Training...:  30% 4104/13907 [2:32:48<8:02:50,  2.96s/it][A
Training...:  30% 4105/13907 [2:32:51<8:12:54,  3.02s/it][A
Training...:  30% 4106/13907 [2:32:54<8:07:56,  2.99s/it][A
Training...:  30% 4107/13907 [2:32:57<8:01:23,  2.95s/it][A
Training...:  30% 4108/13907 [2:33:00<7:54:01,  2.90s/it][A
Training...:  30% 4109/13907 [2:33:03<7:46:20,  2.86s/it][A
Training...:  30% 4110/13907 [2:33:05<7:38:43,  2.81s/it][A
Training...:  30% 4111/13907 [2:33:08<7:30:48,  2.76s/it][A
Training...:  30% 4112/13907 [2:33:11<7:21:43,  2.71s/it][A
Training...:  30% 4113/13907 [2:33:13<7:15:32,  2.67s/it][A
Training...:  30% 4114/13907 [2:33:16<7:09:02,  2.63s/it][A
Training...:  30% 4115/13907 [2:33:18<7:02:27,  2.59s/it][A
Training...:  30% 4116/13907 [2:33:21<6:55:11,  2.54s/it][A
Training...:  30% 4117/13907 [2:33:23<6:49:02,  2.51s/it][A
Training...:  30% 4118/13907 [2:33:26<6:43:01,  2.47s/it][A
Training...:  30% 4119/13907 [2:33:28<6:38:40,  2.44s/it][A
Training...:  30% 4120/13907 [2:33:30<6:33:36,  2.41s/it][A
Training...:  30% 4121/13907 [2:33:33<6:28:25,  2.38s/it][A
Training...:  30% 4122/13907 [2:33:35<6:21:43,  2.34s/it][A
Training...:  30% 4123/13907 [2:33:37<6:16:00,  2.31s/it][A
Training...:  30% 4124/13907 [2:33:39<6:09:04,  2.26s/it][A
Training...:  30% 4125/13907 [2:33:41<6:03:58,  2.23s/it][A
Training...:  30% 4126/13907 [2:33:44<5:58:48,  2.20s/it][A
Training...:  30% 4127/13907 [2:33:46<5:54:05,  2.17s/it][A
Training...:  30% 4128/13907 [2:33:48<5:48:19,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:04:22<8:52:18, 31938.93s/it]
Training...:  30% 4128/13907 [2:33:50<5:48:19,  2.14s/it][A
Training...:  30% 4129/13907 [2:33:50<5:58:30,  2.20s/it][A
Training...:  30% 4130/13907 [2:33:52<5:52:21,  2.16s/it][A
Training...:  30% 4131/13907 [2:33:54<5:43:38,  2.11s/it][A
Training...:  30% 4132/13907 [2:33:56<5:34:54,  2.06s/it][A
Training...:  30% 4133/13907 [2:33:58<5:28:54,  2.02s/it][A
Training...:  30% 4134/13907 [2:34:00<5:22:08,  1.98s/it][A
Training...:  30% 4135/13907 [2:34:02<5:18:00,  1.95s/it][A
Training...:  30% 4136/13907 [2:34:04<5:11:25,  1.91s/it][A
Training...:  30% 4137/13907 [2:34:05<5:06:06,  1.88s/it][A
Training...:  30% 4138/13907 [2:34:07<4:59:39,  1.84s/it][A
Training...:  30% 4139/13907 [2:34:09<4:55:12,  1.81s/it][A
Training...:  30% 4140/13907 [2:34:11<4:48:53,  1.77s/it][A
Training...:  30% 4141/13907 [2:34:12<4:44:20,  1.75s/it][A
Training...:  30% 4142/13907 [2:34:14<4:38:02,  1.71s/it][A
Training...:  30% 4143/13907 [2:34:15<4:32:15,  1.67s/it][A
Training...:  30% 4144/13907 [2:34:17<4:28:25,  1.65s/it][A
Training...:  30% 4145/13907 [2:34:19<4:21:09,  1.61s/it][A
Training...:  30% 4146/13907 [2:34:20<4:15:21,  1.57s/it][A
Training...:  30% 4147/13907 [2:34:21<4:07:39,  1.52s/it][A
Training...:  30% 4148/13907 [2:34:23<3:57:39,  1.46s/it][A
Training...:  30% 4149/13907 [2:34:24<3:45:57,  1.39s/it][A
Training...:  30% 4150/13907 [2:34:25<3:29:32,  1.29s/it][A
Training...:  30% 4151/13907 [2:34:29<5:27:41,  2.02s/it][A
Training...:  30% 4152/13907 [2:34:32<6:36:44,  2.44s/it][A
Training...:  30% 4153/13907 [2:34:35<7:14:00,  2.67s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:05:11<8:52:18, 31938.93s/it]
Training...:  30% 4153/13907 [2:34:39<7:14:00,  2.67s/it][A
Training...:  30% 4154/13907 [2:34:39<7:56:24,  2.93s/it][A
Training...:  30% 4155/13907 [2:34:42<8:02:24,  2.97s/it][A
Training...:  30% 4156/13907 [2:34:45<7:59:11,  2.95s/it][A
Training...:  30% 4157/13907 [2:34:48<7:52:30,  2.91s/it][A
Training...:  30% 4158/13907 [2:34:50<7:45:58,  2.87s/it][A
Training...:  30% 4159/13907 [2:34:53<7:38:08,  2.82s/it][A
Training...:  30% 4160/13907 [2:34:56<7:31:03,  2.78s/it][A
Training...:  30% 4161/13907 [2:34:58<7:24:27,  2.74s/it][A
Training...:  30% 4162/13907 [2:35:01<7:17:00,  2.69s/it][A
Training...:  30% 4163/13907 [2:35:04<7:11:30,  2.66s/it][A
Training...:  30% 4164/13907 [2:35:06<7:04:00,  2.61s/it][A
Training...:  30% 4165/13907 [2:35:09<6:58:23,  2.58s/it][A
Training...:  30% 4166/13907 [2:35:11<6:52:43,  2.54s/it][A
Training...:  30% 4167/13907 [2:35:14<6:47:23,  2.51s/it][A
Training...:  30% 4168/13907 [2:35:16<6:41:13,  2.47s/it][A
Training...:  30% 4169/13907 [2:35:18<6:34:49,  2.43s/it][A
Training...:  30% 4170/13907 [2:35:21<6:28:36,  2.39s/it][A
Training...:  30% 4171/13907 [2:35:23<6:24:03,  2.37s/it][A
Training...:  30% 4172/13907 [2:35:25<6:19:03,  2.34s/it][A
Training...:  30% 4173/13907 [2:35:27<6:14:59,  2.31s/it][A
Training...:  30% 4174/13907 [2:35:30<6:13:08,  2.30s/it][A
Training...:  30% 4175/13907 [2:35:32<6:07:11,  2.26s/it][A
Training...:  30% 4176/13907 [2:35:34<6:01:25,  2.23s/it][A
Training...:  30% 4177/13907 [2:35:36<5:55:07,  2.19s/it][A
Training...:  30% 4178/13907 [2:35:38<5:48:50,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:06:13<8:52:18, 31938.93s/it]
Training...:  30% 4178/13907 [2:35:41<5:48:50,  2.15s/it][A
Training...:  30% 4179/13907 [2:35:41<6:00:25,  2.22s/it][A
Training...:  30% 4180/13907 [2:35:43<5:53:30,  2.18s/it][A
Training...:  30% 4181/13907 [2:35:45<5:45:46,  2.13s/it][A
Training...:  30% 4182/13907 [2:35:47<5:37:45,  2.08s/it][A
Training...:  30% 4183/13907 [2:35:49<5:30:15,  2.04s/it][A
Training...:  30% 4184/13907 [2:35:50<5:23:48,  2.00s/it][A
Training...:  30% 4185/13907 [2:35:52<5:17:23,  1.96s/it][A
Training...:  30% 4186/13907 [2:35:54<5:10:49,  1.92s/it][A
Training...:  30% 4187/13907 [2:35:56<5:06:26,  1.89s/it][A
Training...:  30% 4188/13907 [2:35:58<5:01:15,  1.86s/it][A
Training...:  30% 4189/13907 [2:36:00<4:57:47,  1.84s/it][A
Training...:  30% 4190/13907 [2:36:01<4:51:33,  1.80s/it][A
Training...:  30% 4191/13907 [2:36:03<4:45:24,  1.76s/it][A
Training...:  30% 4192/13907 [2:36:05<4:40:47,  1.73s/it][A
Training...:  30% 4193/13907 [2:36:06<4:34:22,  1.69s/it][A
Training...:  30% 4194/13907 [2:36:08<4:28:29,  1.66s/it][A
Training...:  30% 4195/13907 [2:36:09<4:20:35,  1.61s/it][A
Training...:  30% 4196/13907 [2:36:11<4:12:26,  1.56s/it][A
Training...:  30% 4197/13907 [2:36:12<4:04:06,  1.51s/it][A
Training...:  30% 4198/13907 [2:36:13<3:54:31,  1.45s/it][A
Training...:  30% 4199/13907 [2:36:15<3:43:06,  1.38s/it][A
Training...:  30% 4200/13907 [2:36:16<3:26:29,  1.28s/it][A
Training...:  30% 4201/13907 [2:36:19<5:25:33,  2.01s/it][A
Training...:  30% 4202/13907 [2:36:23<6:38:45,  2.47s/it][A
Training...:  30% 4203/13907 [2:36:26<7:16:03,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:07:02<8:52:18, 31938.93s/it]
Training...:  30% 4203/13907 [2:36:30<7:16:03,  2.70s/it][A
Training...:  30% 4204/13907 [2:36:30<7:59:22,  2.96s/it][A
Training...:  30% 4205/13907 [2:36:33<8:06:44,  3.01s/it][A
Training...:  30% 4206/13907 [2:36:36<8:02:23,  2.98s/it][A
Training...:  30% 4207/13907 [2:36:39<7:56:54,  2.95s/it][A
Training...:  30% 4208/13907 [2:36:42<7:53:23,  2.93s/it][A
Training...:  30% 4209/13907 [2:36:44<7:46:41,  2.89s/it][A
Training...:  30% 4210/13907 [2:36:47<7:36:42,  2.83s/it][A
Training...:  30% 4211/13907 [2:36:50<7:30:45,  2.79s/it][A
Training...:  30% 4212/13907 [2:36:52<7:22:08,  2.74s/it][A
Training...:  30% 4213/13907 [2:36:55<7:14:52,  2.69s/it][A
Training...:  30% 4214/13907 [2:36:57<7:07:05,  2.64s/it][A
Training...:  30% 4215/13907 [2:37:00<7:00:29,  2.60s/it][A
Training...:  30% 4216/13907 [2:37:02<6:51:53,  2.55s/it][A
Training...:  30% 4217/13907 [2:37:05<6:46:05,  2.51s/it][A
Training...:  30% 4218/13907 [2:37:07<6:39:54,  2.48s/it][A
Training...:  30% 4219/13907 [2:37:10<6:33:45,  2.44s/it][A
Training...:  30% 4220/13907 [2:37:12<6:28:40,  2.41s/it][A
Training...:  30% 4221/13907 [2:37:14<6:23:54,  2.38s/it][A
Training...:  30% 4222/13907 [2:37:16<6:18:26,  2.34s/it][A
Training...:  30% 4223/13907 [2:37:19<6:14:12,  2.32s/it][A
Training...:  30% 4224/13907 [2:37:21<6:08:43,  2.28s/it][A
Training...:  30% 4225/13907 [2:37:23<6:03:49,  2.25s/it][A
Training...:  30% 4226/13907 [2:37:25<5:57:57,  2.22s/it][A
Training...:  30% 4227/13907 [2:37:27<5:54:44,  2.20s/it][A
Training...:  30% 4228/13907 [2:37:29<5:49:59,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:08:04<8:52:18, 31938.93s/it]
Training...:  30% 4228/13907 [2:37:32<5:49:59,  2.17s/it][A
Training...:  30% 4229/13907 [2:37:32<6:00:47,  2.24s/it][A
Training...:  30% 4230/13907 [2:37:34<5:54:50,  2.20s/it][A
Training...:  30% 4231/13907 [2:37:36<5:47:14,  2.15s/it][A
Training...:  30% 4232/13907 [2:37:38<5:41:41,  2.12s/it][A
Training...:  30% 4233/13907 [2:37:40<5:37:40,  2.09s/it][A
Training...:  30% 4234/13907 [2:37:42<5:33:02,  2.07s/it][A
Training...:  30% 4235/13907 [2:37:44<5:26:39,  2.03s/it][A
Training...:  30% 4236/13907 [2:37:46<5:21:07,  1.99s/it][A
Training...:  30% 4237/13907 [2:37:48<5:16:35,  1.96s/it][A
Training...:  30% 4238/13907 [2:37:50<5:11:03,  1.93s/it][A
Training...:  30% 4239/13907 [2:37:51<5:03:03,  1.88s/it][A
Training...:  30% 4240/13907 [2:37:53<4:55:23,  1.83s/it][A
Training...:  30% 4241/13907 [2:37:55<4:48:15,  1.79s/it][A
Training...:  31% 4242/13907 [2:37:57<4:41:31,  1.75s/it][A
Training...:  31% 4243/13907 [2:37:58<4:35:25,  1.71s/it][A
Training...:  31% 4244/13907 [2:38:00<4:28:40,  1.67s/it][A
Training...:  31% 4245/13907 [2:38:01<4:22:43,  1.63s/it][A
Training...:  31% 4246/13907 [2:38:03<4:14:03,  1.58s/it][A
Training...:  31% 4247/13907 [2:38:04<4:05:11,  1.52s/it][A
Training...:  31% 4248/13907 [2:38:05<3:55:25,  1.46s/it][A
Training...:  31% 4249/13907 [2:38:07<3:43:44,  1.39s/it][A
Training...:  31% 4250/13907 [2:38:08<3:27:23,  1.29s/it][A
Training...:  31% 4251/13907 [2:38:11<5:27:28,  2.03s/it][A
Training...:  31% 4252/13907 [2:38:15<6:40:03,  2.49s/it][A
Training...:  31% 4253/13907 [2:38:18<7:13:49,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:08:54<8:52:18, 31938.93s/it]
Training...:  31% 4253/13907 [2:38:22<7:13:49,  2.70s/it][A
Training...:  31% 4254/13907 [2:38:22<7:55:21,  2.95s/it][A
Training...:  31% 4255/13907 [2:38:25<8:03:58,  3.01s/it][A
Training...:  31% 4256/13907 [2:38:28<8:00:43,  2.99s/it][A
Training...:  31% 4257/13907 [2:38:31<7:56:45,  2.96s/it][A
Training...:  31% 4258/13907 [2:38:34<7:49:37,  2.92s/it][A
Training...:  31% 4259/13907 [2:38:36<7:42:21,  2.88s/it][A
Training...:  31% 4260/13907 [2:38:39<7:32:02,  2.81s/it][A
Training...:  31% 4261/13907 [2:38:42<7:23:42,  2.76s/it][A
Training...:  31% 4262/13907 [2:38:44<7:16:20,  2.71s/it][A
Training...:  31% 4263/13907 [2:38:47<7:11:46,  2.69s/it][A
Training...:  31% 4264/13907 [2:38:49<7:08:03,  2.66s/it][A
Training...:  31% 4265/13907 [2:38:52<7:05:09,  2.65s/it][A
Training...:  31% 4266/13907 [2:38:55<6:56:45,  2.59s/it][A
Training...:  31% 4267/13907 [2:38:57<6:48:35,  2.54s/it][A
Training...:  31% 4268/13907 [2:38:59<6:41:54,  2.50s/it][A
Training...:  31% 4269/13907 [2:39:02<6:36:07,  2.47s/it][A
Training...:  31% 4270/13907 [2:39:04<6:29:37,  2.43s/it][A
Training...:  31% 4271/13907 [2:39:06<6:25:57,  2.40s/it][A
Training...:  31% 4272/13907 [2:39:09<6:18:09,  2.35s/it][A
Training...:  31% 4273/13907 [2:39:11<6:11:29,  2.31s/it][A
Training...:  31% 4274/13907 [2:39:13<6:05:21,  2.28s/it][A
Training...:  31% 4275/13907 [2:39:15<5:58:53,  2.24s/it][A
Training...:  31% 4276/13907 [2:39:17<5:53:34,  2.20s/it][A
Training...:  31% 4277/13907 [2:39:19<5:48:03,  2.17s/it][A
Training...:  31% 4278/13907 [2:39:22<5:43:32,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:09:56<8:52:18, 31938.93s/it]
Training...:  31% 4278/13907 [2:39:24<5:43:32,  2.14s/it][A
Training...:  31% 4279/13907 [2:39:24<5:53:34,  2.20s/it][A
Training...:  31% 4280/13907 [2:39:26<5:47:59,  2.17s/it][A
Training...:  31% 4281/13907 [2:39:28<5:39:01,  2.11s/it][A
Training...:  31% 4282/13907 [2:39:30<5:33:49,  2.08s/it][A
Training...:  31% 4283/13907 [2:39:32<5:26:32,  2.04s/it][A
Training...:  31% 4284/13907 [2:39:34<5:19:47,  1.99s/it][A
Training...:  31% 4285/13907 [2:39:36<5:13:06,  1.95s/it][A
Training...:  31% 4286/13907 [2:39:37<5:07:27,  1.92s/it][A
Training...:  31% 4287/13907 [2:39:39<5:02:17,  1.89s/it][A
Training...:  31% 4288/13907 [2:39:41<4:57:07,  1.85s/it][A
Training...:  31% 4289/13907 [2:39:43<4:51:58,  1.82s/it][A
Training...:  31% 4290/13907 [2:39:45<4:47:00,  1.79s/it][A
Training...:  31% 4291/13907 [2:39:46<4:42:16,  1.76s/it][A
Training...:  31% 4292/13907 [2:39:48<4:36:23,  1.72s/it][A
Training...:  31% 4293/13907 [2:39:49<4:30:51,  1.69s/it][A
Training...:  31% 4294/13907 [2:39:51<4:25:33,  1.66s/it][A
Training...:  31% 4295/13907 [2:39:53<4:18:34,  1.61s/it][A
Training...:  31% 4296/13907 [2:39:54<4:10:13,  1.56s/it][A
Training...:  31% 4297/13907 [2:39:55<4:01:57,  1.51s/it][A
Training...:  31% 4298/13907 [2:39:57<3:51:29,  1.45s/it][A
Training...:  31% 4299/13907 [2:39:58<3:40:34,  1.38s/it][A
Training...:  31% 4300/13907 [2:39:59<3:24:37,  1.28s/it][A
Training...:  31% 4301/13907 [2:40:03<5:22:28,  2.01s/it][A
Training...:  31% 4302/13907 [2:40:06<6:31:41,  2.45s/it][A
Training...:  31% 4303/13907 [2:40:09<7:11:54,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:10:45<8:52:18, 31938.93s/it]
Training...:  31% 4303/13907 [2:40:13<7:11:54,  2.70s/it][A
Training...:  31% 4304/13907 [2:40:13<7:55:37,  2.97s/it][A
Training...:  31% 4305/13907 [2:40:16<8:10:49,  3.07s/it][A
Training...:  31% 4306/13907 [2:40:19<8:08:36,  3.05s/it][A
Training...:  31% 4307/13907 [2:40:22<7:59:51,  3.00s/it][A
Training...:  31% 4308/13907 [2:40:25<7:50:31,  2.94s/it][A
Training...:  31% 4309/13907 [2:40:28<7:40:40,  2.88s/it][A
Training...:  31% 4310/13907 [2:40:30<7:31:12,  2.82s/it][A
Training...:  31% 4311/13907 [2:40:33<7:23:09,  2.77s/it][A
Training...:  31% 4312/13907 [2:40:36<7:14:52,  2.72s/it][A
Training...:  31% 4313/13907 [2:40:38<7:08:23,  2.68s/it][A
Training...:  31% 4314/13907 [2:40:41<6:59:49,  2.63s/it][A
Training...:  31% 4315/13907 [2:40:43<6:53:49,  2.59s/it][A
Training...:  31% 4316/13907 [2:40:46<6:47:26,  2.55s/it][A
Training...:  31% 4317/13907 [2:40:48<6:41:07,  2.51s/it][A
Training...:  31% 4318/13907 [2:40:51<6:35:09,  2.47s/it][A
Training...:  31% 4319/13907 [2:40:53<6:29:25,  2.44s/it][A
Training...:  31% 4320/13907 [2:40:55<6:22:17,  2.39s/it][A
Training...:  31% 4321/13907 [2:40:57<6:16:47,  2.36s/it][A
Training...:  31% 4322/13907 [2:41:00<6:10:52,  2.32s/it][A
Training...:  31% 4323/13907 [2:41:02<6:04:40,  2.28s/it][A
Training...:  31% 4324/13907 [2:41:04<6:00:11,  2.26s/it][A
Training...:  31% 4325/13907 [2:41:06<5:55:26,  2.23s/it][A
Training...:  31% 4326/13907 [2:41:08<5:50:47,  2.20s/it][A
Training...:  31% 4327/13907 [2:41:10<5:46:19,  2.17s/it][A
Training...:  31% 4328/13907 [2:41:13<5:41:48,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:11:47<8:52:18, 31938.93s/it]
Training...:  31% 4328/13907 [2:41:15<5:41:48,  2.14s/it][A
Training...:  31% 4329/13907 [2:41:15<5:51:05,  2.20s/it][A
Training...:  31% 4330/13907 [2:41:17<5:45:36,  2.17s/it][A
Training...:  31% 4331/13907 [2:41:19<5:38:01,  2.12s/it][A
Training...:  31% 4332/13907 [2:41:21<5:30:41,  2.07s/it][A
Training...:  31% 4333/13907 [2:41:23<5:25:40,  2.04s/it][A
Training...:  31% 4334/13907 [2:41:25<5:19:40,  2.00s/it][A
Training...:  31% 4335/13907 [2:41:27<5:12:59,  1.96s/it][A
Training...:  31% 4336/13907 [2:41:29<5:07:11,  1.93s/it][A
Training...:  31% 4337/13907 [2:41:30<5:02:39,  1.90s/it][A
Training...:  31% 4338/13907 [2:41:32<4:57:53,  1.87s/it][A
Training...:  31% 4339/13907 [2:41:34<4:54:03,  1.84s/it][A
Training...:  31% 4340/13907 [2:41:36<4:49:09,  1.81s/it][A
Training...:  31% 4341/13907 [2:41:37<4:45:30,  1.79s/it][A
Training...:  31% 4342/13907 [2:41:39<4:40:48,  1.76s/it][A
Training...:  31% 4343/13907 [2:41:41<4:34:46,  1.72s/it][A
Training...:  31% 4344/13907 [2:41:42<4:28:17,  1.68s/it][A
Training...:  31% 4345/13907 [2:41:44<4:20:28,  1.63s/it][A
Training...:  31% 4346/13907 [2:41:45<4:12:37,  1.59s/it][A
Training...:  31% 4347/13907 [2:41:47<4:03:35,  1.53s/it][A
Training...:  31% 4348/13907 [2:41:48<3:54:16,  1.47s/it][A
Training...:  31% 4349/13907 [2:41:49<3:42:35,  1.40s/it][A
Training...:  31% 4350/13907 [2:41:50<3:25:31,  1.29s/it][A
Training...:  31% 4351/13907 [2:41:54<5:21:45,  2.02s/it][A
Training...:  31% 4352/13907 [2:41:58<6:31:11,  2.46s/it][A
Training...:  31% 4353/13907 [2:42:01<7:09:53,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:12:36<8:52:18, 31938.93s/it]
Training...:  31% 4353/13907 [2:42:04<7:09:53,  2.70s/it][A
Training...:  31% 4354/13907 [2:42:04<7:54:16,  2.98s/it][A
Training...:  31% 4355/13907 [2:42:08<8:01:48,  3.03s/it][A
Training...:  31% 4356/13907 [2:42:10<7:57:06,  3.00s/it][A
Training...:  31% 4357/13907 [2:42:13<7:51:37,  2.96s/it][A
Training...:  31% 4358/13907 [2:42:16<7:44:27,  2.92s/it][A
Training...:  31% 4359/13907 [2:42:19<7:38:47,  2.88s/it][A
Training...:  31% 4360/13907 [2:42:22<7:29:52,  2.83s/it][A
Training...:  31% 4361/13907 [2:42:24<7:23:34,  2.79s/it][A
Training...:  31% 4362/13907 [2:42:27<7:16:09,  2.74s/it][A
Training...:  31% 4363/13907 [2:42:30<7:08:45,  2.70s/it][A
Training...:  31% 4364/13907 [2:42:32<7:02:29,  2.66s/it][A
Training...:  31% 4365/13907 [2:42:35<6:55:18,  2.61s/it][A
Training...:  31% 4366/13907 [2:42:37<6:48:12,  2.57s/it][A
Training...:  31% 4367/13907 [2:42:40<6:40:43,  2.52s/it][A
Training...:  31% 4368/13907 [2:42:42<6:35:00,  2.48s/it][A
Training...:  31% 4369/13907 [2:42:44<6:29:52,  2.45s/it][A
Training...:  31% 4370/13907 [2:42:47<6:23:23,  2.41s/it][A
Training...:  31% 4371/13907 [2:42:49<6:20:00,  2.39s/it][A
Training...:  31% 4372/13907 [2:42:51<6:17:23,  2.37s/it][A
Training...:  31% 4373/13907 [2:42:54<6:12:50,  2.35s/it][A
Training...:  31% 4374/13907 [2:42:56<6:05:22,  2.30s/it][A
Training...:  31% 4375/13907 [2:42:58<5:58:54,  2.26s/it][A
Training...:  31% 4376/13907 [2:43:00<5:53:45,  2.23s/it][A
Training...:  31% 4377/13907 [2:43:02<5:48:44,  2.20s/it][A
Training...:  31% 4378/13907 [2:43:04<5:43:36,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:13:39<8:52:18, 31938.93s/it]
Training...:  31% 4378/13907 [2:43:07<5:43:36,  2.16s/it][A
Training...:  31% 4379/13907 [2:43:07<5:53:55,  2.23s/it][A
Training...:  31% 4380/13907 [2:43:09<5:47:53,  2.19s/it][A
Training...:  32% 4381/13907 [2:43:11<5:37:44,  2.13s/it][A
Training...:  32% 4382/13907 [2:43:13<5:29:19,  2.07s/it][A
Training...:  32% 4383/13907 [2:43:15<5:23:08,  2.04s/it][A
Training...:  32% 4384/13907 [2:43:17<5:16:40,  2.00s/it][A
Training...:  32% 4385/13907 [2:43:18<5:11:30,  1.96s/it][A
Training...:  32% 4386/13907 [2:43:20<5:05:53,  1.93s/it][A
Training...:  32% 4387/13907 [2:43:22<5:01:09,  1.90s/it][A
Training...:  32% 4388/13907 [2:43:24<4:56:03,  1.87s/it][A
Training...:  32% 4389/13907 [2:43:26<4:50:51,  1.83s/it][A
Training...:  32% 4390/13907 [2:43:27<4:45:24,  1.80s/it][A
Training...:  32% 4391/13907 [2:43:29<4:39:37,  1.76s/it][A
Training...:  32% 4392/13907 [2:43:31<4:33:45,  1.73s/it][A
Training...:  32% 4393/13907 [2:43:32<4:28:21,  1.69s/it][A
Training...:  32% 4394/13907 [2:43:34<4:22:14,  1.65s/it][A
Training...:  32% 4395/13907 [2:43:35<4:16:58,  1.62s/it][A
Training...:  32% 4396/13907 [2:43:37<4:08:31,  1.57s/it][A
Training...:  32% 4397/13907 [2:43:38<3:59:48,  1.51s/it][A
Training...:  32% 4398/13907 [2:43:40<3:50:20,  1.45s/it][A
Training...:  32% 4399/13907 [2:43:41<3:38:39,  1.38s/it][A
Training...:  32% 4400/13907 [2:43:42<3:22:18,  1.28s/it][A
Training...:  32% 4401/13907 [2:43:46<5:16:48,  2.00s/it][A
Training...:  32% 4402/13907 [2:43:49<6:26:54,  2.44s/it][A
Training...:  32% 4403/13907 [2:43:52<7:03:51,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:14:28<8:52:18, 31938.93s/it]
Training...:  32% 4403/13907 [2:43:56<7:03:51,  2.68s/it][A
Training...:  32% 4404/13907 [2:43:56<7:48:52,  2.96s/it][A
Training...:  32% 4405/13907 [2:43:59<7:58:40,  3.02s/it][A
Training...:  32% 4406/13907 [2:44:02<7:57:22,  3.01s/it][A
Training...:  32% 4407/13907 [2:44:05<7:52:29,  2.98s/it][A
Training...:  32% 4408/13907 [2:44:08<7:42:15,  2.92s/it][A
Training...:  32% 4409/13907 [2:44:10<7:33:58,  2.87s/it][A
Training...:  32% 4410/13907 [2:44:13<7:24:56,  2.81s/it][A
Training...:  32% 4411/13907 [2:44:16<7:18:21,  2.77s/it][A
Training...:  32% 4412/13907 [2:44:18<7:10:33,  2.72s/it][A
Training...:  32% 4413/13907 [2:44:21<7:08:24,  2.71s/it][A
Training...:  32% 4414/13907 [2:44:24<7:02:25,  2.67s/it][A
Training...:  32% 4415/13907 [2:44:26<6:55:30,  2.63s/it][A
Training...:  32% 4416/13907 [2:44:29<6:47:19,  2.58s/it][A
Training...:  32% 4417/13907 [2:44:31<6:39:56,  2.53s/it][A
Training...:  32% 4418/13907 [2:44:33<6:33:55,  2.49s/it][A
Training...:  32% 4419/13907 [2:44:36<6:28:01,  2.45s/it][A
Training...:  32% 4420/13907 [2:44:38<6:21:54,  2.42s/it][A
Training...:  32% 4421/13907 [2:44:40<6:16:37,  2.38s/it][A
Training...:  32% 4422/13907 [2:44:43<6:12:24,  2.36s/it][A
Training...:  32% 4423/13907 [2:44:45<6:07:36,  2.33s/it][A
Training...:  32% 4424/13907 [2:44:47<6:01:05,  2.28s/it][A
Training...:  32% 4425/13907 [2:44:49<5:55:00,  2.25s/it][A
Training...:  32% 4426/13907 [2:44:52<5:50:40,  2.22s/it][A
Training...:  32% 4427/13907 [2:44:54<5:46:43,  2.19s/it][A
Training...:  32% 4428/13907 [2:44:56<5:41:34,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:15:30<8:52:18, 31938.93s/it]
Training...:  32% 4428/13907 [2:44:58<5:41:34,  2.16s/it][A
Training...:  32% 4429/13907 [2:44:58<5:51:45,  2.23s/it][A
Training...:  32% 4430/13907 [2:45:00<5:46:21,  2.19s/it][A
Training...:  32% 4431/13907 [2:45:02<5:37:33,  2.14s/it][A
Training...:  32% 4432/13907 [2:45:04<5:30:26,  2.09s/it][A
Training...:  32% 4433/13907 [2:45:06<5:24:01,  2.05s/it][A
Training...:  32% 4434/13907 [2:45:08<5:17:26,  2.01s/it][A
Training...:  32% 4435/13907 [2:45:10<5:11:49,  1.98s/it][A
Training...:  32% 4436/13907 [2:45:12<5:05:45,  1.94s/it][A
Training...:  32% 4437/13907 [2:45:14<5:00:30,  1.90s/it][A
Training...:  32% 4438/13907 [2:45:15<4:56:43,  1.88s/it][A
Training...:  32% 4439/13907 [2:45:17<4:51:18,  1.85s/it][A
Training...:  32% 4440/13907 [2:45:19<4:45:48,  1.81s/it][A
Training...:  32% 4441/13907 [2:45:21<4:40:43,  1.78s/it][A
Training...:  32% 4442/13907 [2:45:22<4:34:33,  1.74s/it][A
Training...:  32% 4443/13907 [2:45:24<4:28:24,  1.70s/it][A
Training...:  32% 4444/13907 [2:45:26<4:22:14,  1.66s/it][A
Training...:  32% 4445/13907 [2:45:27<4:16:33,  1.63s/it][A
Training...:  32% 4446/13907 [2:45:29<4:09:16,  1.58s/it][A
Training...:  32% 4447/13907 [2:45:30<4:02:07,  1.54s/it][A
Training...:  32% 4448/13907 [2:45:31<3:52:31,  1.47s/it][A
Training...:  32% 4449/13907 [2:45:33<3:40:29,  1.40s/it][A
Training...:  32% 4450/13907 [2:45:34<3:24:58,  1.30s/it][A
Training...:  32% 4451/13907 [2:45:37<5:22:54,  2.05s/it][A
Training...:  32% 4452/13907 [2:45:41<6:33:05,  2.49s/it][A
Training...:  32% 4453/13907 [2:45:44<7:10:50,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:16:20<8:52:18, 31938.93s/it]
Training...:  32% 4453/13907 [2:45:48<7:10:50,  2.73s/it][A
Training...:  32% 4454/13907 [2:45:48<7:53:49,  3.01s/it][A
Training...:  32% 4455/13907 [2:45:51<8:01:50,  3.06s/it][A
Training...:  32% 4456/13907 [2:45:54<7:56:33,  3.03s/it][A
Training...:  32% 4457/13907 [2:45:57<7:49:59,  2.98s/it][A
Training...:  32% 4458/13907 [2:46:00<7:40:59,  2.93s/it][A
Training...:  32% 4459/13907 [2:46:02<7:32:53,  2.88s/it][A
Training...:  32% 4460/13907 [2:46:05<7:24:04,  2.82s/it][A
Training...:  32% 4461/13907 [2:46:08<7:16:17,  2.77s/it][A
Training...:  32% 4462/13907 [2:46:10<7:07:58,  2.72s/it][A
Training...:  32% 4463/13907 [2:46:13<7:00:47,  2.67s/it][A
Training...:  32% 4464/13907 [2:46:15<6:54:17,  2.63s/it][A
Training...:  32% 4465/13907 [2:46:18<6:47:26,  2.59s/it][A
Training...:  32% 4466/13907 [2:46:20<6:40:26,  2.54s/it][A
Training...:  32% 4467/13907 [2:46:23<6:34:17,  2.51s/it][A
Training...:  32% 4468/13907 [2:46:25<6:27:41,  2.46s/it][A
Training...:  32% 4469/13907 [2:46:28<6:21:31,  2.43s/it][A
Training...:  32% 4470/13907 [2:46:30<6:18:01,  2.40s/it][A
Training...:  32% 4471/13907 [2:46:32<6:16:29,  2.39s/it][A
Training...:  32% 4472/13907 [2:46:34<6:09:30,  2.35s/it][A
Training...:  32% 4473/13907 [2:46:37<6:02:09,  2.30s/it][A
Training...:  32% 4474/13907 [2:46:39<5:55:17,  2.26s/it][A
Training...:  32% 4475/13907 [2:46:41<5:48:43,  2.22s/it][A
Training...:  32% 4476/13907 [2:46:43<5:43:24,  2.18s/it][A
Training...:  32% 4477/13907 [2:46:45<5:37:49,  2.15s/it][A
Training...:  32% 4478/13907 [2:46:47<5:34:44,  2.13s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:17:22<8:52:18, 31938.93s/it]
Training...:  32% 4478/13907 [2:46:50<5:34:44,  2.13s/it][A
Training...:  32% 4479/13907 [2:46:50<5:44:09,  2.19s/it][A
Training...:  32% 4480/13907 [2:46:52<5:38:36,  2.16s/it][A
Training...:  32% 4481/13907 [2:46:54<5:32:12,  2.11s/it][A
Training...:  32% 4482/13907 [2:46:56<5:24:38,  2.07s/it][A
Training...:  32% 4483/13907 [2:46:58<5:17:46,  2.02s/it][A
Training...:  32% 4484/13907 [2:46:59<5:12:01,  1.99s/it][A
Training...:  32% 4485/13907 [2:47:01<5:06:52,  1.95s/it][A
Training...:  32% 4486/13907 [2:47:03<5:01:01,  1.92s/it][A
Training...:  32% 4487/13907 [2:47:05<4:55:38,  1.88s/it][A
Training...:  32% 4488/13907 [2:47:07<4:50:48,  1.85s/it][A
Training...:  32% 4489/13907 [2:47:08<4:46:10,  1.82s/it][A
Training...:  32% 4490/13907 [2:47:10<4:40:56,  1.79s/it][A
Training...:  32% 4491/13907 [2:47:12<4:35:18,  1.75s/it][A
Training...:  32% 4492/13907 [2:47:14<4:29:49,  1.72s/it][A
Training...:  32% 4493/13907 [2:47:15<4:24:53,  1.69s/it][A
Training...:  32% 4494/13907 [2:47:17<4:19:37,  1.65s/it][A
Training...:  32% 4495/13907 [2:47:18<4:12:50,  1.61s/it][A
Training...:  32% 4496/13907 [2:47:20<4:05:20,  1.56s/it][A
Training...:  32% 4497/13907 [2:47:21<3:57:06,  1.51s/it][A
Training...:  32% 4498/13907 [2:47:22<3:48:31,  1.46s/it][A
Training...:  32% 4499/13907 [2:47:24<3:38:23,  1.39s/it][A
Training...:  32% 4500/13907 [2:47:25<3:23:24,  1.30s/it][A
Training...:  32% 4501/13907 [2:47:28<5:16:07,  2.02s/it][A
Training...:  32% 4502/13907 [2:47:32<6:28:26,  2.48s/it][A
Training...:  32% 4503/13907 [2:47:35<7:06:17,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:18:11<8:52:18, 31938.93s/it]
Training...:  32% 4503/13907 [2:47:39<7:06:17,  2.72s/it][A
Training...:  32% 4504/13907 [2:47:39<7:54:25,  3.03s/it][A
Training...:  32% 4505/13907 [2:47:42<8:00:43,  3.07s/it][A
Training...:  32% 4506/13907 [2:47:45<7:56:25,  3.04s/it][A
Training...:  32% 4507/13907 [2:47:48<7:54:37,  3.03s/it][A
Training...:  32% 4508/13907 [2:47:51<7:48:41,  2.99s/it][A
Training...:  32% 4509/13907 [2:47:54<7:39:47,  2.94s/it][A
Training...:  32% 4510/13907 [2:47:57<7:28:53,  2.87s/it][A
Training...:  32% 4511/13907 [2:47:59<7:17:53,  2.80s/it][A
Training...:  32% 4512/13907 [2:48:02<7:08:14,  2.73s/it][A
Training...:  32% 4513/13907 [2:48:04<6:59:23,  2.68s/it][A
Training...:  32% 4514/13907 [2:48:07<6:51:50,  2.63s/it][A
Training...:  32% 4515/13907 [2:48:09<6:45:10,  2.59s/it][A
Training...:  32% 4516/13907 [2:48:12<6:38:35,  2.55s/it][A
Training...:  32% 4517/13907 [2:48:14<6:33:01,  2.51s/it][A
Training...:  32% 4518/13907 [2:48:17<6:27:00,  2.47s/it][A
Training...:  32% 4519/13907 [2:48:19<6:21:24,  2.44s/it][A
Training...:  33% 4520/13907 [2:48:21<6:14:45,  2.40s/it][A
Training...:  33% 4521/13907 [2:48:24<6:10:17,  2.37s/it][A
Training...:  33% 4522/13907 [2:48:26<6:04:16,  2.33s/it][A
Training...:  33% 4523/13907 [2:48:28<5:58:32,  2.29s/it][A
Training...:  33% 4524/13907 [2:48:30<5:53:17,  2.26s/it][A
Training...:  33% 4525/13907 [2:48:32<5:48:34,  2.23s/it][A
Training...:  33% 4526/13907 [2:48:34<5:43:24,  2.20s/it][A
Training...:  33% 4527/13907 [2:48:37<5:38:31,  2.17s/it][A
Training...:  33% 4528/13907 [2:48:39<5:32:40,  2.13s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:19:13<8:52:18, 31938.93s/it]
Training...:  33% 4528/13907 [2:48:41<5:32:40,  2.13s/it][A
Training...:  33% 4529/13907 [2:48:41<5:42:38,  2.19s/it][A
Training...:  33% 4530/13907 [2:48:43<5:35:47,  2.15s/it][A
Training...:  33% 4531/13907 [2:48:45<5:27:13,  2.09s/it][A
Training...:  33% 4532/13907 [2:48:47<5:19:26,  2.04s/it][A
Training...:  33% 4533/13907 [2:48:49<5:13:31,  2.01s/it][A
Training...:  33% 4534/13907 [2:48:51<5:08:31,  1.97s/it][A
Training...:  33% 4535/13907 [2:48:53<5:03:20,  1.94s/it][A
Training...:  33% 4536/13907 [2:48:54<4:57:37,  1.91s/it][A
Training...:  33% 4537/13907 [2:48:56<4:54:02,  1.88s/it][A
Training...:  33% 4538/13907 [2:48:58<4:48:45,  1.85s/it][A
Training...:  33% 4539/13907 [2:49:00<4:41:59,  1.81s/it][A
Training...:  33% 4540/13907 [2:49:01<4:36:20,  1.77s/it][A
Training...:  33% 4541/13907 [2:49:03<4:30:46,  1.73s/it][A
Training...:  33% 4542/13907 [2:49:05<4:25:26,  1.70s/it][A
Training...:  33% 4543/13907 [2:49:06<4:20:59,  1.67s/it][A
Training...:  33% 4544/13907 [2:49:08<4:17:15,  1.65s/it][A
Training...:  33% 4545/13907 [2:49:09<4:10:08,  1.60s/it][A
Training...:  33% 4546/13907 [2:49:11<4:03:22,  1.56s/it][A
Training...:  33% 4547/13907 [2:49:12<3:55:26,  1.51s/it][A
Training...:  33% 4548/13907 [2:49:13<3:45:53,  1.45s/it][A
Training...:  33% 4549/13907 [2:49:15<3:34:51,  1.38s/it][A
Training...:  33% 4550/13907 [2:49:16<3:19:55,  1.28s/it][A
Training...:  33% 4551/13907 [2:49:20<5:17:19,  2.03s/it][A
Training...:  33% 4552/13907 [2:49:23<6:26:23,  2.48s/it][A
Training...:  33% 4553/13907 [2:49:26<7:02:25,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:20:02<8:52:18, 31938.93s/it]
Training...:  33% 4553/13907 [2:49:30<7:02:25,  2.71s/it][A
Training...:  33% 4554/13907 [2:49:30<7:46:09,  2.99s/it][A
Training...:  33% 4555/13907 [2:49:33<7:53:15,  3.04s/it][A
Training...:  33% 4556/13907 [2:49:36<7:49:43,  3.01s/it][A
Training...:  33% 4557/13907 [2:49:39<7:43:08,  2.97s/it][A
Training...:  33% 4558/13907 [2:49:42<7:36:23,  2.93s/it][A
Training...:  33% 4559/13907 [2:49:45<7:30:34,  2.89s/it][A
Training...:  33% 4560/13907 [2:49:47<7:22:52,  2.84s/it][A
Training...:  33% 4561/13907 [2:49:50<7:16:01,  2.80s/it][A
Training...:  33% 4562/13907 [2:49:53<7:08:50,  2.75s/it][A
Training...:  33% 4563/13907 [2:49:55<7:00:14,  2.70s/it][A
Training...:  33% 4564/13907 [2:49:58<6:52:05,  2.65s/it][A
Training...:  33% 4565/13907 [2:50:00<6:45:41,  2.61s/it][A
Training...:  33% 4566/13907 [2:50:03<6:38:37,  2.56s/it][A
Training...:  33% 4567/13907 [2:50:05<6:32:01,  2.52s/it][A
Training...:  33% 4568/13907 [2:50:07<6:25:29,  2.48s/it][A
Training...:  33% 4569/13907 [2:50:10<6:21:26,  2.45s/it][A
Training...:  33% 4570/13907 [2:50:12<6:15:54,  2.42s/it][A
Training...:  33% 4571/13907 [2:50:15<6:10:29,  2.38s/it][A
Training...:  33% 4572/13907 [2:50:17<6:04:30,  2.34s/it][A
Training...:  33% 4573/13907 [2:50:19<5:58:18,  2.30s/it][A
Training...:  33% 4574/13907 [2:50:21<5:53:51,  2.27s/it][A
Training...:  33% 4575/13907 [2:50:23<5:49:52,  2.25s/it][A
Training...:  33% 4576/13907 [2:50:26<5:46:16,  2.23s/it][A
Training...:  33% 4577/13907 [2:50:28<5:44:43,  2.22s/it][A
Training...:  33% 4578/13907 [2:50:30<5:38:31,  2.18s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:21:04<8:52:18, 31938.93s/it]
Training...:  33% 4578/13907 [2:50:32<5:38:31,  2.18s/it][A
Training...:  33% 4579/13907 [2:50:32<5:46:24,  2.23s/it][A
Training...:  33% 4580/13907 [2:50:34<5:39:35,  2.18s/it][A
Training...:  33% 4581/13907 [2:50:36<5:31:17,  2.13s/it][A
Training...:  33% 4582/13907 [2:50:38<5:23:53,  2.08s/it][A
Training...:  33% 4583/13907 [2:50:40<5:17:15,  2.04s/it][A
Training...:  33% 4584/13907 [2:50:42<5:10:44,  2.00s/it][A
Training...:  33% 4585/13907 [2:50:44<5:05:14,  1.96s/it][A
Training...:  33% 4586/13907 [2:50:46<4:59:04,  1.93s/it][A
Training...:  33% 4587/13907 [2:50:48<4:54:39,  1.90s/it][A
Training...:  33% 4588/13907 [2:50:49<4:49:50,  1.87s/it][A
Training...:  33% 4589/13907 [2:50:51<4:45:38,  1.84s/it][A
Training...:  33% 4590/13907 [2:50:53<4:39:22,  1.80s/it][A
Training...:  33% 4591/13907 [2:50:55<4:33:30,  1.76s/it][A
Training...:  33% 4592/13907 [2:50:56<4:27:50,  1.73s/it][A
Training...:  33% 4593/13907 [2:50:58<4:21:22,  1.68s/it][A
Training...:  33% 4594/13907 [2:50:59<4:16:04,  1.65s/it][A
Training...:  33% 4595/13907 [2:51:01<4:09:01,  1.60s/it][A
Training...:  33% 4596/13907 [2:51:02<4:01:23,  1.56s/it][A
Training...:  33% 4597/13907 [2:51:04<3:53:36,  1.51s/it][A
Training...:  33% 4598/13907 [2:51:05<3:44:12,  1.45s/it][A
Training...:  33% 4599/13907 [2:51:06<3:32:12,  1.37s/it][A
Training...:  33% 4600/13907 [2:51:07<3:15:17,  1.26s/it][A
Training...:  33% 4601/13907 [2:51:11<5:07:26,  1.98s/it][A
Training...:  33% 4602/13907 [2:51:14<6:16:48,  2.43s/it][A
Training...:  33% 4603/13907 [2:51:18<6:52:21,  2.66s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:21:53<8:52:18, 31938.93s/it]
Training...:  33% 4603/13907 [2:51:21<6:52:21,  2.66s/it][A
Training...:  33% 4604/13907 [2:51:21<7:34:44,  2.93s/it][A
Training...:  33% 4605/13907 [2:51:24<7:46:21,  3.01s/it][A
Training...:  33% 4606/13907 [2:51:27<7:42:46,  2.99s/it][A
Training...:  33% 4607/13907 [2:51:30<7:37:19,  2.95s/it][A
Training...:  33% 4608/13907 [2:51:33<7:30:50,  2.91s/it][A
Training...:  33% 4609/13907 [2:51:36<7:23:26,  2.86s/it][A
Training...:  33% 4610/13907 [2:51:38<7:16:26,  2.82s/it][A
Training...:  33% 4611/13907 [2:51:41<7:08:59,  2.77s/it][A
Training...:  33% 4612/13907 [2:51:44<7:02:17,  2.73s/it][A
Training...:  33% 4613/13907 [2:51:46<6:58:58,  2.70s/it][A
Training...:  33% 4614/13907 [2:51:49<6:52:52,  2.67s/it][A
Training...:  33% 4615/13907 [2:51:51<6:46:32,  2.63s/it][A
Training...:  33% 4616/13907 [2:51:54<6:37:35,  2.57s/it][A
Training...:  33% 4617/13907 [2:51:56<6:31:16,  2.53s/it][A
Training...:  33% 4618/13907 [2:51:59<6:24:33,  2.48s/it][A
Training...:  33% 4619/13907 [2:52:01<6:18:45,  2.45s/it][A
Training...:  33% 4620/13907 [2:52:03<6:12:52,  2.41s/it][A
Training...:  33% 4621/13907 [2:52:06<6:07:48,  2.38s/it][A
Training...:  33% 4622/13907 [2:52:08<6:02:08,  2.34s/it][A
Training...:  33% 4623/13907 [2:52:10<5:56:56,  2.31s/it][A
Training...:  33% 4624/13907 [2:52:12<5:51:34,  2.27s/it][A
Training...:  33% 4625/13907 [2:52:15<5:46:57,  2.24s/it][A
Training...:  33% 4626/13907 [2:52:17<5:41:48,  2.21s/it][A
Training...:  33% 4627/13907 [2:52:19<5:36:40,  2.18s/it][A
Training...:  33% 4628/13907 [2:52:21<5:31:04,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:22:55<8:52:18, 31938.93s/it]
Training...:  33% 4628/13907 [2:52:23<5:31:04,  2.14s/it][A
Training...:  33% 4629/13907 [2:52:23<5:42:13,  2.21s/it][A
Training...:  33% 4630/13907 [2:52:25<5:37:22,  2.18s/it][A
Training...:  33% 4631/13907 [2:52:27<5:30:26,  2.14s/it][A
Training...:  33% 4632/13907 [2:52:29<5:22:03,  2.08s/it][A
Training...:  33% 4633/13907 [2:52:31<5:16:35,  2.05s/it][A
Training...:  33% 4634/13907 [2:52:33<5:10:49,  2.01s/it][A
Training...:  33% 4635/13907 [2:52:35<5:05:38,  1.98s/it][A
Training...:  33% 4636/13907 [2:52:37<4:59:08,  1.94s/it][A
Training...:  33% 4637/13907 [2:52:39<4:54:16,  1.90s/it][A
Training...:  33% 4638/13907 [2:52:41<4:49:37,  1.87s/it][A
Training...:  33% 4639/13907 [2:52:42<4:44:19,  1.84s/it][A
Training...:  33% 4640/13907 [2:52:44<4:38:38,  1.80s/it][A
Training...:  33% 4641/13907 [2:52:46<4:33:30,  1.77s/it][A
Training...:  33% 4642/13907 [2:52:47<4:27:49,  1.73s/it][A
Training...:  33% 4643/13907 [2:52:49<4:22:15,  1.70s/it][A
Training...:  33% 4644/13907 [2:52:51<4:17:15,  1.67s/it][A
Training...:  33% 4645/13907 [2:52:52<4:11:26,  1.63s/it][A
Training...:  33% 4646/13907 [2:52:54<4:03:02,  1.57s/it][A
Training...:  33% 4647/13907 [2:52:55<3:56:14,  1.53s/it][A
Training...:  33% 4648/13907 [2:52:56<3:46:33,  1.47s/it][A
Training...:  33% 4649/13907 [2:52:58<3:36:29,  1.40s/it][A
Training...:  33% 4650/13907 [2:52:59<3:22:05,  1.31s/it][A
Training...:  33% 4651/13907 [2:53:02<5:18:32,  2.06s/it][A
Training...:  33% 4652/13907 [2:53:06<6:25:35,  2.50s/it][A
Training...:  33% 4653/13907 [2:53:09<7:02:57,  2.74s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:23:45<8:52:18, 31938.93s/it]
Training...:  33% 4653/13907 [2:53:13<7:02:57,  2.74s/it][A
Training...:  33% 4654/13907 [2:53:13<7:42:15,  3.00s/it][A
Training...:  33% 4655/13907 [2:53:16<7:48:41,  3.04s/it][A
Training...:  33% 4656/13907 [2:53:19<7:44:18,  3.01s/it][A
Training...:  33% 4657/13907 [2:53:22<7:37:37,  2.97s/it][A
Training...:  33% 4658/13907 [2:53:25<7:30:30,  2.92s/it][A
Training...:  34% 4659/13907 [2:53:27<7:23:17,  2.88s/it][A
Training...:  34% 4660/13907 [2:53:30<7:14:39,  2.82s/it][A
Training...:  34% 4661/13907 [2:53:33<7:08:02,  2.78s/it][A
Training...:  34% 4662/13907 [2:53:35<7:02:16,  2.74s/it][A
Training...:  34% 4663/13907 [2:53:38<6:55:10,  2.69s/it][A
Training...:  34% 4664/13907 [2:53:41<6:48:50,  2.65s/it][A
Training...:  34% 4665/13907 [2:53:43<6:42:42,  2.61s/it][A
Training...:  34% 4666/13907 [2:53:46<6:38:20,  2.59s/it][A
Training...:  34% 4667/13907 [2:53:48<6:32:00,  2.55s/it][A
Training...:  34% 4668/13907 [2:53:51<6:26:18,  2.51s/it][A
Training...:  34% 4669/13907 [2:53:53<6:20:40,  2.47s/it][A
Training...:  34% 4670/13907 [2:53:55<6:14:53,  2.44s/it][A
Training...:  34% 4671/13907 [2:53:58<6:11:16,  2.41s/it][A
Training...:  34% 4672/13907 [2:54:00<6:07:58,  2.39s/it][A
Training...:  34% 4673/13907 [2:54:02<6:01:13,  2.35s/it][A
Training...:  34% 4674/13907 [2:54:04<5:54:16,  2.30s/it][A
Training...:  34% 4675/13907 [2:54:07<5:47:08,  2.26s/it][A
Training...:  34% 4676/13907 [2:54:09<5:41:18,  2.22s/it][A
Training...:  34% 4677/13907 [2:54:11<5:35:19,  2.18s/it][A
Training...:  34% 4678/13907 [2:54:13<5:31:35,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:24:47<8:52:18, 31938.93s/it]
Training...:  34% 4678/13907 [2:54:15<5:31:35,  2.16s/it][A
Training...:  34% 4679/13907 [2:54:15<5:40:14,  2.21s/it][A
Training...:  34% 4680/13907 [2:54:17<5:34:38,  2.18s/it][A
Training...:  34% 4681/13907 [2:54:19<5:25:45,  2.12s/it][A
Training...:  34% 4682/13907 [2:54:21<5:18:12,  2.07s/it][A
Training...:  34% 4683/13907 [2:54:23<5:11:23,  2.03s/it][A
Training...:  34% 4684/13907 [2:54:25<5:05:46,  1.99s/it][A
Training...:  34% 4685/13907 [2:54:27<5:01:33,  1.96s/it][A
Training...:  34% 4686/13907 [2:54:29<4:56:06,  1.93s/it][A
Training...:  34% 4687/13907 [2:54:31<4:51:14,  1.90s/it][A
Training...:  34% 4688/13907 [2:54:32<4:45:44,  1.86s/it][A
Training...:  34% 4689/13907 [2:54:34<4:40:20,  1.82s/it][A
Training...:  34% 4690/13907 [2:54:36<4:34:54,  1.79s/it][A
Training...:  34% 4691/13907 [2:54:38<4:28:21,  1.75s/it][A
Training...:  34% 4692/13907 [2:54:39<4:23:11,  1.71s/it][A
Training...:  34% 4693/13907 [2:54:41<4:17:20,  1.68s/it][A
Training...:  34% 4694/13907 [2:54:42<4:11:56,  1.64s/it][A
Training...:  34% 4695/13907 [2:54:44<4:05:47,  1.60s/it][A
Training...:  34% 4696/13907 [2:54:45<3:58:36,  1.55s/it][A
Training...:  34% 4697/13907 [2:54:47<3:50:58,  1.50s/it][A
Training...:  34% 4698/13907 [2:54:48<3:41:32,  1.44s/it][A
Training...:  34% 4699/13907 [2:54:49<3:30:18,  1.37s/it][A
Training...:  34% 4700/13907 [2:54:50<3:14:32,  1.27s/it][A
Training...:  34% 4701/13907 [2:54:54<5:11:53,  2.03s/it][A
Training...:  34% 4702/13907 [2:54:57<6:19:00,  2.47s/it][A
Training...:  34% 4703/13907 [2:55:01<6:56:22,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:25:37<8:52:18, 31938.93s/it]
Training...:  34% 4703/13907 [2:55:04<6:56:22,  2.71s/it][A
Training...:  34% 4704/13907 [2:55:04<7:43:41,  3.02s/it][A
Training...:  34% 4705/13907 [2:55:08<7:49:48,  3.06s/it][A
Training...:  34% 4706/13907 [2:55:11<7:43:59,  3.03s/it][A
Training...:  34% 4707/13907 [2:55:13<7:36:19,  2.98s/it][A
Training...:  34% 4708/13907 [2:55:16<7:32:28,  2.95s/it][A
Training...:  34% 4709/13907 [2:55:19<7:25:18,  2.90s/it][A
Training...:  34% 4710/13907 [2:55:22<7:14:23,  2.83s/it][A
Training...:  34% 4711/13907 [2:55:24<7:05:34,  2.78s/it][A
Training...:  34% 4712/13907 [2:55:27<6:57:16,  2.72s/it][A
Training...:  34% 4713/13907 [2:55:30<6:50:32,  2.68s/it][A
Training...:  34% 4714/13907 [2:55:32<6:43:51,  2.64s/it][A
Training...:  34% 4715/13907 [2:55:35<6:37:35,  2.60s/it][A
Training...:  34% 4716/13907 [2:55:37<6:32:00,  2.56s/it][A
Training...:  34% 4717/13907 [2:55:40<6:27:30,  2.53s/it][A
Training...:  34% 4718/13907 [2:55:42<6:24:12,  2.51s/it][A
Training...:  34% 4719/13907 [2:55:44<6:17:48,  2.47s/it][A
Training...:  34% 4720/13907 [2:55:47<6:12:55,  2.44s/it][A
Training...:  34% 4721/13907 [2:55:49<6:08:13,  2.41s/it][A
Training...:  34% 4722/13907 [2:55:51<6:03:02,  2.37s/it][A
Training...:  34% 4723/13907 [2:55:54<5:57:16,  2.33s/it][A
Training...:  34% 4724/13907 [2:55:56<5:51:02,  2.29s/it][A
Training...:  34% 4725/13907 [2:55:58<5:46:52,  2.27s/it][A
Training...:  34% 4726/13907 [2:56:00<5:42:32,  2.24s/it][A
Training...:  34% 4727/13907 [2:56:02<5:40:13,  2.22s/it][A
Training...:  34% 4728/13907 [2:56:05<5:36:03,  2.20s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:26:39<8:52:18, 31938.93s/it]
Training...:  34% 4728/13907 [2:56:07<5:36:03,  2.20s/it][A
Training...:  34% 4729/13907 [2:56:07<5:43:06,  2.24s/it][A
Training...:  34% 4730/13907 [2:56:09<5:36:53,  2.20s/it][A
Training...:  34% 4731/13907 [2:56:11<5:27:27,  2.14s/it][A
Training...:  34% 4732/13907 [2:56:13<5:19:22,  2.09s/it][A
Training...:  34% 4733/13907 [2:56:15<5:14:14,  2.06s/it][A
Training...:  34% 4734/13907 [2:56:17<5:06:54,  2.01s/it][A
Training...:  34% 4735/13907 [2:56:19<5:01:21,  1.97s/it][A
Training...:  34% 4736/13907 [2:56:21<4:56:16,  1.94s/it][A
Training...:  34% 4737/13907 [2:56:22<4:51:38,  1.91s/it][A
Training...:  34% 4738/13907 [2:56:24<4:46:01,  1.87s/it][A
Training...:  34% 4739/13907 [2:56:26<4:40:39,  1.84s/it][A
Training...:  34% 4740/13907 [2:56:28<4:35:40,  1.80s/it][A
Training...:  34% 4741/13907 [2:56:29<4:30:33,  1.77s/it][A
Training...:  34% 4742/13907 [2:56:31<4:25:09,  1.74s/it][A
Training...:  34% 4743/13907 [2:56:33<4:19:51,  1.70s/it][A
Training...:  34% 4744/13907 [2:56:34<4:14:10,  1.66s/it][A
Training...:  34% 4745/13907 [2:56:36<4:08:17,  1.63s/it][A
Training...:  34% 4746/13907 [2:56:37<4:01:28,  1.58s/it][A
Training...:  34% 4747/13907 [2:56:39<3:52:51,  1.53s/it][A
Training...:  34% 4748/13907 [2:56:40<3:43:16,  1.46s/it][A
Training...:  34% 4749/13907 [2:56:41<3:32:44,  1.39s/it][A
Training...:  34% 4750/13907 [2:56:42<3:17:07,  1.29s/it][A
Training...:  34% 4751/13907 [2:56:46<5:14:42,  2.06s/it][A
Training...:  34% 4752/13907 [2:56:50<6:18:53,  2.48s/it][A
Training...:  34% 4753/13907 [2:56:53<6:54:42,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:27:29<8:52:18, 31938.93s/it]
Training...:  34% 4753/13907 [2:56:56<6:54:42,  2.72s/it][A
Training...:  34% 4754/13907 [2:56:56<7:35:12,  2.98s/it][A
Training...:  34% 4755/13907 [2:57:00<7:41:52,  3.03s/it][A
Training...:  34% 4756/13907 [2:57:03<7:37:46,  3.00s/it][A
Training...:  34% 4757/13907 [2:57:05<7:34:03,  2.98s/it][A
Training...:  34% 4758/13907 [2:57:08<7:31:49,  2.96s/it][A
Training...:  34% 4759/13907 [2:57:11<7:25:36,  2.92s/it][A
Training...:  34% 4760/13907 [2:57:14<7:15:31,  2.86s/it][A
Training...:  34% 4761/13907 [2:57:17<7:07:09,  2.80s/it][A
Training...:  34% 4762/13907 [2:57:19<6:57:08,  2.74s/it][A
Training...:  34% 4763/13907 [2:57:22<6:49:39,  2.69s/it][A
Training...:  34% 4764/13907 [2:57:24<6:41:43,  2.64s/it][A
Training...:  34% 4765/13907 [2:57:27<6:34:40,  2.59s/it][A
Training...:  34% 4766/13907 [2:57:29<6:28:16,  2.55s/it][A
Training...:  34% 4767/13907 [2:57:32<6:22:41,  2.51s/it][A
Training...:  34% 4768/13907 [2:57:34<6:16:04,  2.47s/it][A
Training...:  34% 4769/13907 [2:57:36<6:11:52,  2.44s/it][A
Training...:  34% 4770/13907 [2:57:39<6:07:16,  2.41s/it][A
Training...:  34% 4771/13907 [2:57:41<6:01:27,  2.37s/it][A
Training...:  34% 4772/13907 [2:57:43<5:55:55,  2.34s/it][A
Training...:  34% 4773/13907 [2:57:45<5:50:48,  2.30s/it][A
Training...:  34% 4774/13907 [2:57:48<5:46:33,  2.28s/it][A
Training...:  34% 4775/13907 [2:57:50<5:42:32,  2.25s/it][A
Training...:  34% 4776/13907 [2:57:52<5:38:25,  2.22s/it][A
Training...:  34% 4777/13907 [2:57:54<5:34:22,  2.20s/it][A
Training...:  34% 4778/13907 [2:57:56<5:28:35,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:28:31<8:52:18, 31938.93s/it]
Training...:  34% 4778/13907 [2:57:59<5:28:35,  2.16s/it][A
Training...:  34% 4779/13907 [2:57:59<5:38:25,  2.22s/it][A
Training...:  34% 4780/13907 [2:58:01<5:33:26,  2.19s/it][A
Training...:  34% 4781/13907 [2:58:03<5:26:49,  2.15s/it][A
Training...:  34% 4782/13907 [2:58:05<5:18:22,  2.09s/it][A
Training...:  34% 4783/13907 [2:58:07<5:12:35,  2.06s/it][A
Training...:  34% 4784/13907 [2:58:09<5:05:25,  2.01s/it][A
Training...:  34% 4785/13907 [2:58:11<5:00:01,  1.97s/it][A
Training...:  34% 4786/13907 [2:58:12<4:55:58,  1.95s/it][A
Training...:  34% 4787/13907 [2:58:14<4:50:30,  1.91s/it][A
Training...:  34% 4788/13907 [2:58:16<4:45:18,  1.88s/it][A
Training...:  34% 4789/13907 [2:58:18<4:40:20,  1.84s/it][A
Training...:  34% 4790/13907 [2:58:20<4:34:53,  1.81s/it][A
Training...:  34% 4791/13907 [2:58:21<4:29:40,  1.77s/it][A
Training...:  34% 4792/13907 [2:58:23<4:23:23,  1.73s/it][A
Training...:  34% 4793/13907 [2:58:24<4:17:56,  1.70s/it][A
Training...:  34% 4794/13907 [2:58:26<4:12:30,  1.66s/it][A
Training...:  34% 4795/13907 [2:58:28<4:04:55,  1.61s/it][A
Training...:  34% 4796/13907 [2:58:29<3:57:07,  1.56s/it][A
Training...:  34% 4797/13907 [2:58:30<3:49:18,  1.51s/it][A
Training...:  35% 4798/13907 [2:58:32<3:40:14,  1.45s/it][A
Training...:  35% 4799/13907 [2:58:33<3:30:35,  1.39s/it][A
Training...:  35% 4800/13907 [2:58:34<3:16:07,  1.29s/it][A
Training...:  35% 4801/13907 [2:58:38<5:05:34,  2.01s/it][A
Training...:  35% 4802/13907 [2:58:41<6:11:02,  2.45s/it][A
Training...:  35% 4803/13907 [2:58:44<6:47:23,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:29:20<8:52:18, 31938.93s/it]
Training...:  35% 4803/13907 [2:58:48<6:47:23,  2.68s/it][A
Training...:  35% 4804/13907 [2:58:48<7:28:49,  2.96s/it][A
Training...:  35% 4805/13907 [2:58:51<7:39:03,  3.03s/it][A
Training...:  35% 4806/13907 [2:58:54<7:35:10,  3.00s/it][A
Training...:  35% 4807/13907 [2:58:57<7:29:35,  2.96s/it][A
Training...:  35% 4808/13907 [2:59:00<7:21:58,  2.91s/it][A
Training...:  35% 4809/13907 [2:59:03<7:13:04,  2.86s/it][A
Training...:  35% 4810/13907 [2:59:05<7:04:29,  2.80s/it][A
Training...:  35% 4811/13907 [2:59:08<6:57:57,  2.76s/it][A
Training...:  35% 4812/13907 [2:59:10<6:50:35,  2.71s/it][A
Training...:  35% 4813/13907 [2:59:13<6:44:29,  2.67s/it][A
Training...:  35% 4814/13907 [2:59:16<6:37:44,  2.62s/it][A
Training...:  35% 4815/13907 [2:59:18<6:31:03,  2.58s/it][A
Training...:  35% 4816/13907 [2:59:20<6:25:09,  2.54s/it][A
Training...:  35% 4817/13907 [2:59:23<6:20:32,  2.51s/it][A
Training...:  35% 4818/13907 [2:59:25<6:14:35,  2.47s/it][A
Training...:  35% 4819/13907 [2:59:28<6:10:19,  2.44s/it][A
Training...:  35% 4820/13907 [2:59:30<6:04:50,  2.41s/it][A
Training...:  35% 4821/13907 [2:59:32<6:01:14,  2.39s/it][A
Training...:  35% 4822/13907 [2:59:35<5:56:30,  2.35s/it][A
Training...:  35% 4823/13907 [2:59:37<5:51:42,  2.32s/it][A
Training...:  35% 4824/13907 [2:59:39<5:47:56,  2.30s/it][A
Training...:  35% 4825/13907 [2:59:41<5:42:36,  2.26s/it][A
Training...:  35% 4826/13907 [2:59:43<5:38:18,  2.24s/it][A
Training...:  35% 4827/13907 [2:59:46<5:34:05,  2.21s/it][A
Training...:  35% 4828/13907 [2:59:48<5:29:14,  2.18s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:30:22<8:52:18, 31938.93s/it]
Training...:  35% 4828/13907 [2:59:50<5:29:14,  2.18s/it][A
Training...:  35% 4829/13907 [2:59:50<5:39:08,  2.24s/it][A
Training...:  35% 4830/13907 [2:59:52<5:32:55,  2.20s/it][A
Training...:  35% 4831/13907 [2:59:54<5:24:58,  2.15s/it][A
Training...:  35% 4832/13907 [2:59:56<5:17:16,  2.10s/it][A
Training...:  35% 4833/13907 [2:59:58<5:13:45,  2.07s/it][A
Training...:  35% 4834/13907 [3:00:00<5:06:43,  2.03s/it][A
Training...:  35% 4835/13907 [3:00:02<5:00:41,  1.99s/it][A
Training...:  35% 4836/13907 [3:00:04<4:54:15,  1.95s/it][A
Training...:  35% 4837/13907 [3:00:06<4:48:04,  1.91s/it][A
Training...:  35% 4838/13907 [3:00:07<4:42:38,  1.87s/it][A
Training...:  35% 4839/13907 [3:00:09<4:37:26,  1.84s/it][A
Training...:  35% 4840/13907 [3:00:11<4:32:02,  1.80s/it][A
Training...:  35% 4841/13907 [3:00:13<4:27:21,  1.77s/it][A
Training...:  35% 4842/13907 [3:00:14<4:22:10,  1.74s/it][A
Training...:  35% 4843/13907 [3:00:16<4:17:19,  1.70s/it][A
Training...:  35% 4844/13907 [3:00:18<4:12:07,  1.67s/it][A
Training...:  35% 4845/13907 [3:00:19<4:07:34,  1.64s/it][A
Training...:  35% 4846/13907 [3:00:21<4:00:14,  1.59s/it][A
Training...:  35% 4847/13907 [3:00:22<3:52:05,  1.54s/it][A
Training...:  35% 4848/13907 [3:00:23<3:42:47,  1.48s/it][A
Training...:  35% 4849/13907 [3:00:25<3:31:52,  1.40s/it][A
Training...:  35% 4850/13907 [3:00:26<3:15:45,  1.30s/it][A
Training...:  35% 4851/13907 [3:00:29<5:05:53,  2.03s/it][A
Training...:  35% 4852/13907 [3:00:33<6:11:20,  2.46s/it][A
Training...:  35% 4853/13907 [3:00:36<6:47:59,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:31:12<8:52:18, 31938.93s/it]
Training...:  35% 4853/13907 [3:00:40<6:47:59,  2.70s/it][A
Training...:  35% 4854/13907 [3:00:40<7:29:17,  2.98s/it][A
Training...:  35% 4855/13907 [3:00:43<7:36:14,  3.02s/it][A
Training...:  35% 4856/13907 [3:00:46<7:34:48,  3.01s/it][A
Training...:  35% 4857/13907 [3:00:49<7:28:57,  2.98s/it][A
Training...:  35% 4858/13907 [3:00:52<7:22:01,  2.93s/it][A
Training...:  35% 4859/13907 [3:00:54<7:14:43,  2.88s/it][A
Training...:  35% 4860/13907 [3:00:57<7:04:55,  2.82s/it][A
Training...:  35% 4861/13907 [3:01:00<6:57:28,  2.77s/it][A
Training...:  35% 4862/13907 [3:01:02<6:51:46,  2.73s/it][A
Training...:  35% 4863/13907 [3:01:05<6:44:14,  2.68s/it][A
Training...:  35% 4864/13907 [3:01:07<6:37:39,  2.64s/it][A
Training...:  35% 4865/13907 [3:01:10<6:36:14,  2.63s/it][A
Training...:  35% 4866/13907 [3:01:13<6:32:11,  2.60s/it][A
Training...:  35% 4867/13907 [3:01:15<6:25:39,  2.56s/it][A
Training...:  35% 4868/13907 [3:01:17<6:18:37,  2.51s/it][A
Training...:  35% 4869/13907 [3:01:20<6:12:33,  2.47s/it][A
Training...:  35% 4870/13907 [3:01:22<6:06:21,  2.43s/it][A
Training...:  35% 4871/13907 [3:01:24<6:00:31,  2.39s/it][A
Training...:  35% 4872/13907 [3:01:27<5:54:39,  2.36s/it][A
Training...:  35% 4873/13907 [3:01:29<5:49:10,  2.32s/it][A
Training...:  35% 4874/13907 [3:01:31<5:43:29,  2.28s/it][A
Training...:  35% 4875/13907 [3:01:33<5:38:18,  2.25s/it][A
Training...:  35% 4876/13907 [3:01:35<5:32:10,  2.21s/it][A
Training...:  35% 4877/13907 [3:01:37<5:27:12,  2.17s/it][A
Training...:  35% 4878/13907 [3:01:40<5:22:19,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:32:14<8:52:18, 31938.93s/it]
Training...:  35% 4878/13907 [3:01:42<5:22:19,  2.14s/it][A
Training...:  35% 4879/13907 [3:01:42<5:32:07,  2.21s/it][A
Training...:  35% 4880/13907 [3:01:44<5:27:00,  2.17s/it][A
Training...:  35% 4881/13907 [3:01:46<5:19:04,  2.12s/it][A
Training...:  35% 4882/13907 [3:01:48<5:12:36,  2.08s/it][A
Training...:  35% 4883/13907 [3:01:50<5:06:59,  2.04s/it][A
Training...:  35% 4884/13907 [3:01:52<5:01:45,  2.01s/it][A
Training...:  35% 4885/13907 [3:01:54<4:55:54,  1.97s/it][A
Training...:  35% 4886/13907 [3:01:56<4:51:04,  1.94s/it][A
Training...:  35% 4887/13907 [3:01:57<4:46:17,  1.90s/it][A
Training...:  35% 4888/13907 [3:01:59<4:41:10,  1.87s/it][A
Training...:  35% 4889/13907 [3:02:01<4:36:21,  1.84s/it][A
Training...:  35% 4890/13907 [3:02:03<4:31:58,  1.81s/it][A
Training...:  35% 4891/13907 [3:02:04<4:27:00,  1.78s/it][A
Training...:  35% 4892/13907 [3:02:06<4:21:18,  1.74s/it][A
Training...:  35% 4893/13907 [3:02:08<4:17:05,  1.71s/it][A
Training...:  35% 4894/13907 [3:02:09<4:12:16,  1.68s/it][A
Training...:  35% 4895/13907 [3:02:11<4:07:13,  1.65s/it][A
Training...:  35% 4896/13907 [3:02:12<3:59:35,  1.60s/it][A
Training...:  35% 4897/13907 [3:02:14<3:51:25,  1.54s/it][A
Training...:  35% 4898/13907 [3:02:15<3:42:17,  1.48s/it][A
Training...:  35% 4899/13907 [3:02:16<3:31:59,  1.41s/it][A
Training...:  35% 4900/13907 [3:02:17<3:16:02,  1.31s/it][A
Training...:  35% 4901/13907 [3:02:21<5:02:09,  2.01s/it][A
Training...:  35% 4902/13907 [3:02:25<6:07:07,  2.45s/it][A
Training...:  35% 4903/13907 [3:02:28<6:43:06,  2.69s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:33:03<8:52:18, 31938.93s/it]
Training...:  35% 4903/13907 [3:02:31<6:43:06,  2.69s/it][A
Training...:  35% 4904/13907 [3:02:31<7:23:55,  2.96s/it][A
Training...:  35% 4905/13907 [3:02:35<7:37:59,  3.05s/it][A
Training...:  35% 4906/13907 [3:02:38<7:36:31,  3.04s/it][A
Training...:  35% 4907/13907 [3:02:41<7:28:44,  2.99s/it][A
Training...:  35% 4908/13907 [3:02:43<7:20:52,  2.94s/it][A
Training...:  35% 4909/13907 [3:02:46<7:13:41,  2.89s/it][A
Training...:  35% 4910/13907 [3:02:49<7:05:32,  2.84s/it][A
Training...:  35% 4911/13907 [3:02:52<6:59:18,  2.80s/it][A
Training...:  35% 4912/13907 [3:02:54<6:52:18,  2.75s/it][A
Training...:  35% 4913/13907 [3:02:57<6:45:18,  2.70s/it][A
Training...:  35% 4914/13907 [3:02:59<6:38:00,  2.66s/it][A
Training...:  35% 4915/13907 [3:03:02<6:34:18,  2.63s/it][A
Training...:  35% 4916/13907 [3:03:04<6:28:58,  2.60s/it][A
Training...:  35% 4917/13907 [3:03:07<6:24:36,  2.57s/it][A
Training...:  35% 4918/13907 [3:03:09<6:20:06,  2.54s/it][A
Training...:  35% 4919/13907 [3:03:12<6:15:37,  2.51s/it][A
Training...:  35% 4920/13907 [3:03:14<6:08:20,  2.46s/it][A
Training...:  35% 4921/13907 [3:03:16<6:01:15,  2.41s/it][A
Training...:  35% 4922/13907 [3:03:19<5:54:31,  2.37s/it][A
Training...:  35% 4923/13907 [3:03:21<5:48:23,  2.33s/it][A
Training...:  35% 4924/13907 [3:03:23<5:41:37,  2.28s/it][A
Training...:  35% 4925/13907 [3:03:25<5:36:41,  2.25s/it][A
Training...:  35% 4926/13907 [3:03:27<5:30:56,  2.21s/it][A
Training...:  35% 4927/13907 [3:03:30<5:26:21,  2.18s/it][A
Training...:  35% 4928/13907 [3:03:32<5:22:18,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:34:06<8:52:18, 31938.93s/it]
Training...:  35% 4928/13907 [3:03:34<5:22:18,  2.15s/it][A
Training...:  35% 4929/13907 [3:03:34<5:32:04,  2.22s/it][A
Training...:  35% 4930/13907 [3:03:36<5:26:04,  2.18s/it][A
Training...:  35% 4931/13907 [3:03:38<5:17:29,  2.12s/it][A
Training...:  35% 4932/13907 [3:03:40<5:09:25,  2.07s/it][A
Training...:  35% 4933/13907 [3:03:42<5:04:17,  2.03s/it][A
Training...:  35% 4934/13907 [3:03:44<4:58:44,  2.00s/it][A
Training...:  35% 4935/13907 [3:03:46<4:53:34,  1.96s/it][A
Training...:  35% 4936/13907 [3:03:48<4:48:19,  1.93s/it][A
Training...:  36% 4937/13907 [3:03:49<4:43:45,  1.90s/it][A
Training...:  36% 4938/13907 [3:03:51<4:37:41,  1.86s/it][A
Training...:  36% 4939/13907 [3:03:53<4:34:05,  1.83s/it][A
Training...:  36% 4940/13907 [3:03:55<4:30:54,  1.81s/it][A
Training...:  36% 4941/13907 [3:03:56<4:25:38,  1.78s/it][A
Training...:  36% 4942/13907 [3:03:58<4:18:47,  1.73s/it][A
Training...:  36% 4943/13907 [3:04:00<4:12:37,  1.69s/it][A
Training...:  36% 4944/13907 [3:04:01<4:06:57,  1.65s/it][A
Training...:  36% 4945/13907 [3:04:03<4:00:19,  1.61s/it][A
Training...:  36% 4946/13907 [3:04:04<3:53:12,  1.56s/it][A
Training...:  36% 4947/13907 [3:04:06<3:44:38,  1.50s/it][A
Training...:  36% 4948/13907 [3:04:07<3:35:04,  1.44s/it][A
Training...:  36% 4949/13907 [3:04:08<3:24:09,  1.37s/it][A
Training...:  36% 4950/13907 [3:04:09<3:09:58,  1.27s/it][A
Training...:  36% 4951/13907 [3:04:13<5:01:18,  2.02s/it][A
Training...:  36% 4952/13907 [3:04:16<6:03:57,  2.44s/it][A
Training...:  36% 4953/13907 [3:04:20<6:38:06,  2.67s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:34:55<8:52:18, 31938.93s/it]
Training...:  36% 4953/13907 [3:04:23<6:38:06,  2.67s/it][A
Training...:  36% 4954/13907 [3:04:23<7:18:44,  2.94s/it][A
Training...:  36% 4955/13907 [3:04:26<7:25:56,  2.99s/it][A
Training...:  36% 4956/13907 [3:04:29<7:22:26,  2.97s/it][A
Training...:  36% 4957/13907 [3:04:32<7:18:05,  2.94s/it][A
Training...:  36% 4958/13907 [3:04:35<7:10:58,  2.89s/it][A
Training...:  36% 4959/13907 [3:04:37<7:03:31,  2.84s/it][A
Training...:  36% 4960/13907 [3:04:40<6:55:36,  2.79s/it][A
Training...:  36% 4961/13907 [3:04:43<6:50:12,  2.75s/it][A
Training...:  36% 4962/13907 [3:04:45<6:42:22,  2.70s/it][A
Training...:  36% 4963/13907 [3:04:48<6:36:47,  2.66s/it][A
Training...:  36% 4964/13907 [3:04:50<6:30:15,  2.62s/it][A
Training...:  36% 4965/13907 [3:04:53<6:25:52,  2.59s/it][A
Training...:  36% 4966/13907 [3:04:55<6:20:15,  2.55s/it][A
Training...:  36% 4967/13907 [3:04:58<6:14:09,  2.51s/it][A
Training...:  36% 4968/13907 [3:05:00<6:07:38,  2.47s/it][A
Training...:  36% 4969/13907 [3:05:03<6:03:14,  2.44s/it][A
Training...:  36% 4970/13907 [3:05:05<5:58:20,  2.41s/it][A
Training...:  36% 4971/13907 [3:05:07<5:53:05,  2.37s/it][A
Training...:  36% 4972/13907 [3:05:09<5:48:05,  2.34s/it][A
Training...:  36% 4973/13907 [3:05:12<5:42:45,  2.30s/it][A
Training...:  36% 4974/13907 [3:05:14<5:37:24,  2.27s/it][A
Training...:  36% 4975/13907 [3:05:16<5:33:23,  2.24s/it][A
Training...:  36% 4976/13907 [3:05:18<5:30:48,  2.22s/it][A
Training...:  36% 4977/13907 [3:05:20<5:28:48,  2.21s/it][A
Training...:  36% 4978/13907 [3:05:23<5:25:16,  2.19s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:35:57<8:52:18, 31938.93s/it]
Training...:  36% 4978/13907 [3:05:25<5:25:16,  2.19s/it][A
Training...:  36% 4979/13907 [3:05:25<5:34:03,  2.24s/it][A
Training...:  36% 4980/13907 [3:05:27<5:26:41,  2.20s/it][A
Training...:  36% 4981/13907 [3:05:29<5:18:59,  2.14s/it][A
Training...:  36% 4982/13907 [3:05:31<5:11:26,  2.09s/it][A
Training...:  36% 4983/13907 [3:05:33<5:04:43,  2.05s/it][A
Training...:  36% 4984/13907 [3:05:35<4:57:44,  2.00s/it][A
Training...:  36% 4985/13907 [3:05:37<4:52:08,  1.96s/it][A
Training...:  36% 4986/13907 [3:05:39<4:47:02,  1.93s/it][A
Training...:  36% 4987/13907 [3:05:40<4:42:08,  1.90s/it][A
Training...:  36% 4988/13907 [3:05:42<4:37:39,  1.87s/it][A
Training...:  36% 4989/13907 [3:05:44<4:32:11,  1.83s/it][A
Training...:  36% 4990/13907 [3:05:46<4:26:17,  1.79s/it][A
Training...:  36% 4991/13907 [3:05:47<4:20:52,  1.76s/it][A
Training...:  36% 4992/13907 [3:05:49<4:15:02,  1.72s/it][A
Training...:  36% 4993/13907 [3:05:51<4:09:19,  1.68s/it][A
Training...:  36% 4994/13907 [3:05:52<4:04:26,  1.65s/it][A
Training...:  36% 4995/13907 [3:05:54<3:58:35,  1.61s/it][A
Training...:  36% 4996/13907 [3:05:55<3:51:25,  1.56s/it][A
Training...:  36% 4997/13907 [3:05:56<3:44:26,  1.51s/it][A
Training...:  36% 4998/13907 [3:05:58<3:36:00,  1.45s/it][A
Training...:  36% 4999/13907 [3:05:59<3:26:25,  1.39s/it][A
Training...:  36% 5000/13907 [3:06:00<3:10:10,  1.28s/it][A
Training...:  36% 5001/13907 [3:06:04<5:01:44,  2.03s/it][A
Training...:  36% 5002/13907 [3:06:07<6:03:40,  2.45s/it][A
Training...:  36% 5003/13907 [3:06:10<6:37:52,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:36:46<8:52:18, 31938.93s/it]
Training...:  36% 5003/13907 [3:06:14<6:37:52,  2.68s/it][A
Training...:  36% 5004/13907 [3:06:14<7:18:15,  2.95s/it][A
Training...:  36% 5005/13907 [3:06:17<7:25:58,  3.01s/it][A
Training...:  36% 5006/13907 [3:06:20<7:24:58,  3.00s/it][A
Training...:  36% 5007/13907 [3:06:23<7:21:04,  2.97s/it][A
Training...:  36% 5008/13907 [3:06:26<7:15:00,  2.93s/it][A
Training...:  36% 5009/13907 [3:06:29<7:07:26,  2.88s/it][A
Training...:  36% 5010/13907 [3:06:31<6:59:40,  2.83s/it][A
Training...:  36% 5011/13907 [3:06:34<6:52:26,  2.78s/it][A
Training...:  36% 5012/13907 [3:06:37<6:44:12,  2.73s/it][A
Training...:  36% 5013/13907 [3:06:39<6:37:36,  2.68s/it][A
Training...:  36% 5014/13907 [3:06:42<6:31:06,  2.64s/it][A
Training...:  36% 5015/13907 [3:06:44<6:24:22,  2.59s/it][A
Training...:  36% 5016/13907 [3:06:47<6:18:34,  2.55s/it][A
Training...:  36% 5017/13907 [3:06:49<6:13:34,  2.52s/it][A
Training...:  36% 5018/13907 [3:06:52<6:09:35,  2.49s/it][A
Training...:  36% 5019/13907 [3:06:54<6:05:07,  2.46s/it][A
Training...:  36% 5020/13907 [3:06:56<5:57:39,  2.41s/it][A
Training...:  36% 5021/13907 [3:06:59<5:52:42,  2.38s/it][A
Training...:  36% 5022/13907 [3:07:01<5:45:25,  2.33s/it][A
Training...:  36% 5023/13907 [3:07:03<5:40:38,  2.30s/it][A
Training...:  36% 5024/13907 [3:07:05<5:34:15,  2.26s/it][A
Training...:  36% 5025/13907 [3:07:07<5:29:43,  2.23s/it][A
Training...:  36% 5026/13907 [3:07:09<5:24:46,  2.19s/it][A
Training...:  36% 5027/13907 [3:07:12<5:20:59,  2.17s/it][A
Training...:  36% 5028/13907 [3:07:14<5:17:02,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:37:48<8:52:18, 31938.93s/it]
Training...:  36% 5028/13907 [3:07:16<5:17:02,  2.14s/it][A
Training...:  36% 5029/13907 [3:07:16<5:27:14,  2.21s/it][A
Training...:  36% 5030/13907 [3:07:18<5:22:36,  2.18s/it][A
Training...:  36% 5031/13907 [3:07:20<5:13:39,  2.12s/it][A
Training...:  36% 5032/13907 [3:07:22<5:05:55,  2.07s/it][A
Training...:  36% 5033/13907 [3:07:24<4:59:43,  2.03s/it][A
Training...:  36% 5034/13907 [3:07:26<4:53:59,  1.99s/it][A
Training...:  36% 5035/13907 [3:07:28<4:47:55,  1.95s/it][A
Training...:  36% 5036/13907 [3:07:30<4:43:56,  1.92s/it][A
Training...:  36% 5037/13907 [3:07:31<4:38:07,  1.88s/it][A
Training...:  36% 5038/13907 [3:07:33<4:33:15,  1.85s/it][A
Training...:  36% 5039/13907 [3:07:35<4:27:42,  1.81s/it][A
Training...:  36% 5040/13907 [3:07:37<4:22:24,  1.78s/it][A
Training...:  36% 5041/13907 [3:07:38<4:16:57,  1.74s/it][A
Training...:  36% 5042/13907 [3:07:40<4:12:10,  1.71s/it][A
Training...:  36% 5043/13907 [3:07:41<4:06:34,  1.67s/it][A
Training...:  36% 5044/13907 [3:07:43<4:01:04,  1.63s/it][A
Training...:  36% 5045/13907 [3:07:45<3:54:53,  1.59s/it][A
Training...:  36% 5046/13907 [3:07:46<3:48:11,  1.55s/it][A
Training...:  36% 5047/13907 [3:07:47<3:40:51,  1.50s/it][A
Training...:  36% 5048/13907 [3:07:49<3:32:29,  1.44s/it][A
Training...:  36% 5049/13907 [3:07:50<3:22:10,  1.37s/it][A
Training...:  36% 5050/13907 [3:07:51<3:08:24,  1.28s/it][A
Training...:  36% 5051/13907 [3:07:55<4:56:05,  2.01s/it][A
Training...:  36% 5052/13907 [3:07:58<5:59:56,  2.44s/it][A
Training...:  36% 5053/13907 [3:08:01<6:40:40,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:38:37<8:52:18, 31938.93s/it]
Training...:  36% 5053/13907 [3:08:05<6:40:40,  2.72s/it][A
Training...:  36% 5054/13907 [3:08:05<7:24:25,  3.01s/it][A
Training...:  36% 5055/13907 [3:08:08<7:26:39,  3.03s/it][A
Training...:  36% 5056/13907 [3:08:11<7:22:02,  3.00s/it][A
Training...:  36% 5057/13907 [3:08:14<7:13:45,  2.94s/it][A
Training...:  36% 5058/13907 [3:08:17<7:06:37,  2.89s/it][A
Training...:  36% 5059/13907 [3:08:19<7:00:28,  2.85s/it][A
Training...:  36% 5060/13907 [3:08:22<6:52:06,  2.79s/it][A
Training...:  36% 5061/13907 [3:08:25<6:45:10,  2.75s/it][A
Training...:  36% 5062/13907 [3:08:27<6:38:23,  2.70s/it][A
Training...:  36% 5063/13907 [3:08:30<6:32:40,  2.66s/it][A
Training...:  36% 5064/13907 [3:08:32<6:27:46,  2.63s/it][A
Training...:  36% 5065/13907 [3:08:35<6:23:22,  2.60s/it][A
Training...:  36% 5066/13907 [3:08:38<6:17:56,  2.56s/it][A
Training...:  36% 5067/13907 [3:08:40<6:12:30,  2.53s/it][A
Training...:  36% 5068/13907 [3:08:42<6:09:28,  2.51s/it][A
Training...:  36% 5069/13907 [3:08:45<6:02:43,  2.46s/it][A
Training...:  36% 5070/13907 [3:08:47<5:58:13,  2.43s/it][A
Training...:  36% 5071/13907 [3:08:49<5:52:47,  2.40s/it][A
Training...:  36% 5072/13907 [3:08:52<5:48:44,  2.37s/it][A
Training...:  36% 5073/13907 [3:08:54<5:44:09,  2.34s/it][A
Training...:  36% 5074/13907 [3:08:56<5:39:16,  2.30s/it][A
Training...:  36% 5075/13907 [3:08:58<5:36:08,  2.28s/it][A
Training...:  36% 5076/13907 [3:09:01<5:32:06,  2.26s/it][A
Training...:  37% 5077/13907 [3:09:03<5:26:39,  2.22s/it][A
Training...:  37% 5078/13907 [3:09:05<5:21:29,  2.18s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:39:39<8:52:18, 31938.93s/it]
Training...:  37% 5078/13907 [3:09:07<5:21:29,  2.18s/it][A
Training...:  37% 5079/13907 [3:09:07<5:29:26,  2.24s/it][A
Training...:  37% 5080/13907 [3:09:09<5:23:31,  2.20s/it][A
Training...:  37% 5081/13907 [3:09:11<5:17:16,  2.16s/it][A
Training...:  37% 5082/13907 [3:09:13<5:11:11,  2.12s/it][A
Training...:  37% 5083/13907 [3:09:15<5:03:49,  2.07s/it][A
Training...:  37% 5084/13907 [3:09:17<4:56:50,  2.02s/it][A
Training...:  37% 5085/13907 [3:09:19<4:51:08,  1.98s/it][A
Training...:  37% 5086/13907 [3:09:21<4:45:13,  1.94s/it][A
Training...:  37% 5087/13907 [3:09:23<4:40:47,  1.91s/it][A
Training...:  37% 5088/13907 [3:09:25<4:35:30,  1.87s/it][A
Training...:  37% 5089/13907 [3:09:26<4:29:57,  1.84s/it][A
Training...:  37% 5090/13907 [3:09:28<4:24:24,  1.80s/it][A
Training...:  37% 5091/13907 [3:09:30<4:19:43,  1.77s/it][A
Training...:  37% 5092/13907 [3:09:31<4:13:51,  1.73s/it][A
Training...:  37% 5093/13907 [3:09:33<4:07:52,  1.69s/it][A
Training...:  37% 5094/13907 [3:09:35<4:02:45,  1.65s/it][A
Training...:  37% 5095/13907 [3:09:36<3:57:10,  1.61s/it][A
Training...:  37% 5096/13907 [3:09:38<3:50:49,  1.57s/it][A
Training...:  37% 5097/13907 [3:09:39<3:43:40,  1.52s/it][A
Training...:  37% 5098/13907 [3:09:40<3:34:37,  1.46s/it][A
Training...:  37% 5099/13907 [3:09:42<3:23:58,  1.39s/it][A
Training...:  37% 5100/13907 [3:09:43<3:10:21,  1.30s/it][A
Training...:  37% 5101/13907 [3:09:46<5:00:50,  2.05s/it][A
Training...:  37% 5102/13907 [3:09:50<6:02:57,  2.47s/it][A
Training...:  37% 5103/13907 [3:09:53<6:38:39,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:40:29<8:52:18, 31938.93s/it]
Training...:  37% 5103/13907 [3:09:57<6:38:39,  2.72s/it][A
Training...:  37% 5104/13907 [3:09:57<7:17:26,  2.98s/it][A
Training...:  37% 5105/13907 [3:10:00<7:26:14,  3.04s/it][A
Training...:  37% 5106/13907 [3:10:03<7:22:29,  3.02s/it][A
Training...:  37% 5107/13907 [3:10:06<7:20:59,  3.01s/it][A
Training...:  37% 5108/13907 [3:10:09<7:15:14,  2.97s/it][A
Training...:  37% 5109/13907 [3:10:12<7:07:01,  2.91s/it][A
Training...:  37% 5110/13907 [3:10:14<6:57:53,  2.85s/it][A
Training...:  37% 5111/13907 [3:10:17<6:49:58,  2.80s/it][A
Training...:  37% 5112/13907 [3:10:20<6:41:52,  2.74s/it][A
Training...:  37% 5113/13907 [3:10:22<6:33:48,  2.69s/it][A
Training...:  37% 5114/13907 [3:10:25<6:26:23,  2.64s/it][A
Training...:  37% 5115/13907 [3:10:27<6:20:24,  2.60s/it][A
Training...:  37% 5116/13907 [3:10:30<6:13:49,  2.55s/it][A
Training...:  37% 5117/13907 [3:10:32<6:07:35,  2.51s/it][A
Training...:  37% 5118/13907 [3:10:34<6:02:11,  2.47s/it][A
Training...:  37% 5119/13907 [3:10:37<5:56:15,  2.43s/it][A
Training...:  37% 5120/13907 [3:10:39<5:51:00,  2.40s/it][A
Training...:  37% 5121/13907 [3:10:41<5:46:45,  2.37s/it][A
Training...:  37% 5122/13907 [3:10:44<5:41:50,  2.33s/it][A
Training...:  37% 5123/13907 [3:10:46<5:37:45,  2.31s/it][A
Training...:  37% 5124/13907 [3:10:48<5:32:49,  2.27s/it][A
Training...:  37% 5125/13907 [3:10:50<5:27:39,  2.24s/it][A
Training...:  37% 5126/13907 [3:10:52<5:24:10,  2.22s/it][A
Training...:  37% 5127/13907 [3:10:54<5:19:00,  2.18s/it][A
Training...:  37% 5128/13907 [3:10:57<5:15:23,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:41:31<8:52:18, 31938.93s/it]
Training...:  37% 5128/13907 [3:10:59<5:15:23,  2.16s/it][A
Training...:  37% 5129/13907 [3:10:59<5:23:54,  2.21s/it][A
Training...:  37% 5130/13907 [3:11:01<5:18:39,  2.18s/it][A
Training...:  37% 5131/13907 [3:11:03<5:10:05,  2.12s/it][A
Training...:  37% 5132/13907 [3:11:05<5:02:36,  2.07s/it][A
Training...:  37% 5133/13907 [3:11:07<4:56:23,  2.03s/it][A
Training...:  37% 5134/13907 [3:11:09<4:50:11,  1.98s/it][A
Training...:  37% 5135/13907 [3:11:11<4:45:22,  1.95s/it][A
Training...:  37% 5136/13907 [3:11:12<4:40:31,  1.92s/it][A
Training...:  37% 5137/13907 [3:11:14<4:36:07,  1.89s/it][A
Training...:  37% 5138/13907 [3:11:16<4:31:13,  1.86s/it][A
Training...:  37% 5139/13907 [3:11:18<4:26:56,  1.83s/it][A
Training...:  37% 5140/13907 [3:11:20<4:22:43,  1.80s/it][A
Training...:  37% 5141/13907 [3:11:21<4:18:19,  1.77s/it][A
Training...:  37% 5142/13907 [3:11:23<4:12:25,  1.73s/it][A
Training...:  37% 5143/13907 [3:11:25<4:08:12,  1.70s/it][A
Training...:  37% 5144/13907 [3:11:26<4:02:31,  1.66s/it][A
Training...:  37% 5145/13907 [3:11:28<3:55:53,  1.62s/it][A
Training...:  37% 5146/13907 [3:11:29<3:48:40,  1.57s/it][A
Training...:  37% 5147/13907 [3:11:30<3:40:55,  1.51s/it][A
Training...:  37% 5148/13907 [3:11:32<3:32:16,  1.45s/it][A
Training...:  37% 5149/13907 [3:11:33<3:22:43,  1.39s/it][A
Training...:  37% 5150/13907 [3:11:34<3:09:56,  1.30s/it][A
Training...:  37% 5151/13907 [3:11:38<5:02:18,  2.07s/it][A
Training...:  37% 5152/13907 [3:11:41<6:03:54,  2.49s/it][A
Training...:  37% 5153/13907 [3:11:45<6:37:05,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:42:20<8:52:18, 31938.93s/it]
Training...:  37% 5153/13907 [3:11:48<6:37:05,  2.72s/it][A
Training...:  37% 5154/13907 [3:11:48<7:16:03,  2.99s/it][A
Training...:  37% 5155/13907 [3:11:51<7:23:22,  3.04s/it][A
Training...:  37% 5156/13907 [3:11:54<7:20:13,  3.02s/it][A
Training...:  37% 5157/13907 [3:11:57<7:14:53,  2.98s/it][A
Training...:  37% 5158/13907 [3:12:00<7:07:29,  2.93s/it][A
Training...:  37% 5159/13907 [3:12:03<7:00:16,  2.88s/it][A
Training...:  37% 5160/13907 [3:12:06<6:52:51,  2.83s/it][A
Training...:  37% 5161/13907 [3:12:08<6:45:29,  2.78s/it][A
Training...:  37% 5162/13907 [3:12:11<6:38:23,  2.73s/it][A
Training...:  37% 5163/13907 [3:12:13<6:31:17,  2.68s/it][A
Training...:  37% 5164/13907 [3:12:16<6:24:38,  2.64s/it][A
Training...:  37% 5165/13907 [3:12:19<6:19:41,  2.61s/it][A
Training...:  37% 5166/13907 [3:12:21<6:13:38,  2.56s/it][A
Training...:  37% 5167/13907 [3:12:23<6:07:41,  2.52s/it][A
Training...:  37% 5168/13907 [3:12:26<6:02:07,  2.49s/it][A
Training...:  37% 5169/13907 [3:12:28<5:56:06,  2.45s/it][A
Training...:  37% 5170/13907 [3:12:31<5:50:59,  2.41s/it][A
Training...:  37% 5171/13907 [3:12:33<5:47:16,  2.39s/it][A
Training...:  37% 5172/13907 [3:12:35<5:42:51,  2.36s/it][A
Training...:  37% 5173/13907 [3:12:37<5:40:10,  2.34s/it][A
Training...:  37% 5174/13907 [3:12:40<5:38:18,  2.32s/it][A
Training...:  37% 5175/13907 [3:12:42<5:34:02,  2.30s/it][A
Training...:  37% 5176/13907 [3:12:44<5:27:37,  2.25s/it][A
Training...:  37% 5177/13907 [3:12:46<5:20:55,  2.21s/it][A
Training...:  37% 5178/13907 [3:12:48<5:14:22,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:43:23<8:52:18, 31938.93s/it]
Training...:  37% 5178/13907 [3:12:51<5:14:22,  2.16s/it][A
Training...:  37% 5179/13907 [3:12:51<5:21:41,  2.21s/it][A
Training...:  37% 5180/13907 [3:12:53<5:16:57,  2.18s/it][A
Training...:  37% 5181/13907 [3:12:55<5:08:35,  2.12s/it][A
Training...:  37% 5182/13907 [3:12:57<5:01:29,  2.07s/it][A
Training...:  37% 5183/13907 [3:12:59<4:55:07,  2.03s/it][A
Training...:  37% 5184/13907 [3:13:00<4:49:01,  1.99s/it][A
Training...:  37% 5185/13907 [3:13:02<4:44:25,  1.96s/it][A
Training...:  37% 5186/13907 [3:13:04<4:38:32,  1.92s/it][A
Training...:  37% 5187/13907 [3:13:06<4:33:44,  1.88s/it][A
Training...:  37% 5188/13907 [3:13:08<4:28:13,  1.85s/it][A
Training...:  37% 5189/13907 [3:13:09<4:23:30,  1.81s/it][A
Training...:  37% 5190/13907 [3:13:11<4:18:30,  1.78s/it][A
Training...:  37% 5191/13907 [3:13:13<4:14:10,  1.75s/it][A
Training...:  37% 5192/13907 [3:13:14<4:09:16,  1.72s/it][A
Training...:  37% 5193/13907 [3:13:16<4:03:54,  1.68s/it][A
Training...:  37% 5194/13907 [3:13:18<3:59:08,  1.65s/it][A
Training...:  37% 5195/13907 [3:13:19<3:52:58,  1.60s/it][A
Training...:  37% 5196/13907 [3:13:21<3:46:15,  1.56s/it][A
Training...:  37% 5197/13907 [3:13:22<3:38:34,  1.51s/it][A
Training...:  37% 5198/13907 [3:13:23<3:30:20,  1.45s/it][A
Training...:  37% 5199/13907 [3:13:25<3:22:42,  1.40s/it][A
Training...:  37% 5200/13907 [3:13:26<3:07:40,  1.29s/it][A
Training...:  37% 5201/13907 [3:13:29<4:52:11,  2.01s/it][A
Training...:  37% 5202/13907 [3:13:33<5:58:17,  2.47s/it][A
Training...:  37% 5203/13907 [3:13:36<6:34:36,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:44:12<8:52:18, 31938.93s/it]
Training...:  37% 5203/13907 [3:13:40<6:34:36,  2.72s/it][A
Training...:  37% 5204/13907 [3:13:40<7:16:22,  3.01s/it][A
Training...:  37% 5205/13907 [3:13:43<7:23:22,  3.06s/it][A
Training...:  37% 5206/13907 [3:13:46<7:20:39,  3.04s/it][A
Training...:  37% 5207/13907 [3:13:49<7:19:30,  3.03s/it][A
Training...:  37% 5208/13907 [3:13:52<7:11:04,  2.97s/it][A
Training...:  37% 5209/13907 [3:13:55<7:03:04,  2.92s/it][A
Training...:  37% 5210/13907 [3:13:57<6:54:08,  2.86s/it][A
Training...:  37% 5211/13907 [3:14:00<6:45:59,  2.80s/it][A
Training...:  37% 5212/13907 [3:14:03<6:38:36,  2.75s/it][A
Training...:  37% 5213/13907 [3:14:05<6:33:04,  2.71s/it][A
Training...:  37% 5214/13907 [3:14:08<6:25:42,  2.66s/it][A
Training...:  37% 5215/13907 [3:14:10<6:20:19,  2.63s/it][A
Training...:  38% 5216/13907 [3:14:13<6:15:54,  2.60s/it][A
Training...:  38% 5217/13907 [3:14:15<6:12:26,  2.57s/it][A
Training...:  38% 5218/13907 [3:14:18<6:07:14,  2.54s/it][A
Training...:  38% 5219/13907 [3:14:20<6:01:58,  2.50s/it][A
Training...:  38% 5220/13907 [3:14:23<5:56:32,  2.46s/it][A
Training...:  38% 5221/13907 [3:14:25<5:50:40,  2.42s/it][A
Training...:  38% 5222/13907 [3:14:27<5:44:52,  2.38s/it][A
Training...:  38% 5223/13907 [3:14:30<5:39:19,  2.34s/it][A
Training...:  38% 5224/13907 [3:14:32<5:33:57,  2.31s/it][A
Training...:  38% 5225/13907 [3:14:34<5:29:18,  2.28s/it][A
Training...:  38% 5226/13907 [3:14:36<5:23:07,  2.23s/it][A
Training...:  38% 5227/13907 [3:14:38<5:17:38,  2.20s/it][A
Training...:  38% 5228/13907 [3:14:40<5:12:54,  2.16s/it][A                                                                                                                            
                                                         [AStep... (45225 | Loss: 0.2048567533493042, Learning Rate: 2.894545286835637e-05, Gradient Norm: 0.5990739464759827)
Step... (45250 | Loss: 0.12383327633142471, Learning Rate: 2.8793943783966824e-05, Gradient Norm: 0.6055951714515686)
Step... (45275 | Loss: 0.24331733584403992, Learning Rate: 2.864243469957728e-05, Gradient Norm: 1.0007303953170776)
Step... (45300 | Loss: 0.12271220237016678, Learning Rate: 2.84909074252937e-05, Gradient Norm: 0.6147595047950745)
Step... (45325 | Loss: 0.20241889357566833, Learning Rate: 2.8339400159893557e-05, Gradient Norm: 0.7510941028594971)
Step... (45350 | Loss: 0.14062537252902985, Learning Rate: 2.8187891075504012e-05, Gradient Norm: 0.8605735301971436)
Step... (45375 | Loss: 0.22699694335460663, Learning Rate: 2.8036363801220432e-05, Gradient Norm: 0.9543787837028503)
Step... (45400 | Loss: 0.15061186254024506, Learning Rate: 2.7884854716830887e-05, Gradient Norm: 0.6320734024047852)
Step... (45425 | Loss: 0.20143377780914307, Learning Rate: 2.7733327442547306e-05, Gradient Norm: 0.6531857252120972)
Step... (45450 | Loss: 0.15377739071846008, Learning Rate: 2.758181835815776e-05, Gradient Norm: 0.6588379144668579)
Step... (45475 | Loss: 0.21314667165279388, Learning Rate: 2.7430309273768216e-05, Gradient Norm: 0.6569470167160034)
Step... (45500 | Loss: 0.10972131788730621, Learning Rate: 2.7278781999484636e-05, Gradient Norm: 0.5159341096878052)
Step... (45525 | Loss: 0.20728570222854614, Learning Rate: 2.712727291509509e-05, Gradient Norm: 0.8196953535079956)
Step... (45550 | Loss: 0.08750913292169571, Learning Rate: 2.6975763830705546e-05, Gradient Norm: 0.3443042039871216)
Step... (45575 | Loss: 0.2555881142616272, Learning Rate: 2.6824236556421965e-05, Gradient Norm: 0.7758919596672058)
Step... (45600 | Loss: 0.16660061478614807, Learning Rate: 2.667272747203242e-05, Gradient Norm: 0.7830395102500916)
Step... (45625 | Loss: 0.2738165259361267, Learning Rate: 2.6521218387642875e-05, Gradient Norm: 1.2102100849151611)
Step... (45650 | Loss: 0.139864981174469, Learning Rate: 2.63696929323487e-05, Gradient Norm: 0.721386730670929)
Step... (45675 | Loss: 0.14556169509887695, Learning Rate: 2.6218183847959153e-05, Gradient Norm: 0.6476873755455017)
Step... (45700 | Loss: 0.1294003427028656, Learning Rate: 2.606667476356961e-05, Gradient Norm: 0.6105389595031738)
Step... (45725 | Loss: 0.2715541124343872, Learning Rate: 2.5915147489286028e-05, Gradient Norm: 0.6907087564468384)
Step... (45750 | Loss: 0.1516692191362381, Learning Rate: 2.5763638404896483e-05, Gradient Norm: 1.4943976402282715)
Step... (45775 | Loss: 0.22959807515144348, Learning Rate: 2.5612129320506938e-05, Gradient Norm: 0.6347798109054565)
Step... (45800 | Loss: 0.13294920325279236, Learning Rate: 2.5460602046223357e-05, Gradient Norm: 0.7110887765884399)
Step... (45825 | Loss: 0.18852634727954865, Learning Rate: 2.5309092961833812e-05, Gradient Norm: 0.5986530780792236)
Step... (45850 | Loss: 0.11784973740577698, Learning Rate: 2.5157583877444267e-05, Gradient Norm: 0.5179280638694763)
Step... (45875 | Loss: 0.20782417058944702, Learning Rate: 2.5006056603160687e-05, Gradient Norm: 0.9301028847694397)
Step... (45900 | Loss: 0.17544275522232056, Learning Rate: 2.4854547518771142e-05, Gradient Norm: 1.3102374076843262)
Step... (45925 | Loss: 0.1900693029165268, Learning Rate: 2.4703038434381597e-05, Gradient Norm: 0.6880878806114197)
Step... (45950 | Loss: 0.15750111639499664, Learning Rate: 2.4551511160098016e-05, Gradient Norm: 0.8309358954429626)
Step... (45975 | Loss: 0.19869591295719147, Learning Rate: 2.440000207570847e-05, Gradient Norm: 0.7152203917503357)
Step... (46000 | Loss: 0.12284298241138458, Learning Rate: 2.4248492991318926e-05, Gradient Norm: 0.46208655834198)
Step... (46025 | Loss: 0.2159385085105896, Learning Rate: 2.409696753602475e-05, Gradient Norm: 0.7140324115753174)
Step... (46050 | Loss: 0.11280117928981781, Learning Rate: 2.3945458451635204e-05, Gradient Norm: 0.7861746549606323)
Step... (46075 | Loss: 0.18834027647972107, Learning Rate: 2.37939493672456Epoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:45:15<8:52:18, 31938.93s/it]
Training...:  38% 5228/13907 [3:14:43<5:12:54,  2.16s/it][A6e-05, Gradient Norm: 0.7271037101745605)
Step... (46100 | Loss: 0.13606750965118408, Learning Rate: 2.364242209296208e-05, Gradient Norm: 0.6720950603485107)
Step... (46125 | Loss: 0.16628387570381165, Learning Rate: 2.3490913008572534e-05, Gradient Norm: 0.612094521522522)
Step... (46150 | Loss: 0.18802326917648315, Learning Rate: 2.333940392418299e-05, Gradient Norm: 0.8062146902084351)
Step... (46175 | Loss: 0.22155965864658356, Learning Rate: 2.3187876649899408e-05, Gradient Norm: 0.9523938894271851)
Step... (46200 | Loss: 0.17764058709144592, Learning Rate: 2.3036367565509863e-05, Gradient Norm: 0.7670632600784302)
Step... (46225 | Loss: 0.19029483199119568, Learning Rate: 2.2884858481120318e-05, Gradient Norm: 0.6818831562995911)
Step... (46250 | Loss: 0.15592795610427856, Learning Rate: 2.2733331206836738e-05, Gradient Norm: 0.6549804210662842)
Step... (46275 | Loss: 0.17379805445671082, Learning Rate: 2.2581822122447193e-05, Gradient Norm: 0.6370106339454651)
Step... (46300 | Loss: 0.140537828207016, Learning Rate: 2.2430313038057648e-05, Gradient Norm: 0.523287296295166)
Step... (46325 | Loss: 0.2690742611885071, Learning Rate: 2.227878758276347e-05, Gradient Norm: 0.729216456413269)
Step... (46350 | Loss: 0.12561534345149994, Learning Rate: 2.2127278498373926e-05, Gradient Norm: 0.8074662685394287)
Step... (46375 | Loss: 0.20724047720432281, Learning Rate: 2.197576941398438e-05, Gradient Norm: 0.6704164147377014)
Step... (46400 | Loss: 0.12737171351909637, Learning Rate: 2.18242421397008e-05, Gradient Norm: 0.7106081247329712)
Step... (46425 | Loss: 0.20409177243709564, Learning Rate: 2.1672733055311255e-05, Gradient Norm: 0.8187869787216187)
Step... (46450 | Loss: 0.1881210207939148, Learning Rate: 2.1521205781027675e-05, Gradient Norm: 1.0292209386825562)
Step... (46475 | Loss: 0.19866202771663666, Learning Rate: 2.136969669663813e-05, Gradient Norm: 0.6138043403625488)
Step... (46500 | Loss: 0.1647033989429474, Learning Rate: 2.1218187612248585e-05, Gradient Norm: 0.8505687713623047)
Step... (46525 | Loss: 0.15726538002490997, Learning Rate: 2.1066660337965004e-05, Gradient Norm: 0.6501635313034058)
Step... (46550 | Loss: 0.13326163589954376, Learning Rate: 2.091515125357546e-05, Gradient Norm: 0.5957145690917969)
Step... (46575 | Loss: 0.1713937669992447, Learning Rate: 2.0763642169185914e-05, Gradient Norm: 0.525526762008667)
Step... (46600 | Loss: 0.17363743484020233, Learning Rate: 2.0612114894902334e-05, Gradient Norm: 0.9958852529525757)
Step... (46625 | Loss: 0.21011605858802795, Learning Rate: 2.046060581051279e-05, Gradient Norm: 1.0461926460266113)
Step... (46650 | Loss: 0.12780669331550598, Learning Rate: 2.0309096726123244e-05, Gradient Norm: 0.5722483992576599)
Step... (46675 | Loss: 0.20768791437149048, Learning Rate: 2.0157571270829067e-05, Gradient Norm: 0.9381699562072754)
Step... (46700 | Loss: 0.18835780024528503, Learning Rate: 2.000606218643952e-05, Gradient Norm: 0.545924186706543)
Step... (46725 | Loss: 0.18097352981567383, Learning Rate: 1.9854553102049977e-05, Gradient Norm: 1.2008171081542969)
Step... (46750 | Loss: 0.1435312181711197, Learning Rate: 1.9703025827766396e-05, Gradient Norm: 0.596248209476471)
Step... (46775 | Loss: 0.2259131819009781, Learning Rate: 1.955151674337685e-05, Gradient Norm: 0.9078882932662964)
Step... (46800 | Loss: 0.13347399234771729, Learning Rate: 1.9400007658987306e-05, Gradient Norm: 0.6546515822410583)
Step... (46825 | Loss: 0.18462689220905304, Learning Rate: 1.9248480384703726e-05, Gradient Norm: 0.5904142260551453)
Step... (46850 | Loss: 0.1755017191171646, Learning Rate: 1.909697130031418e-05, Gradient Norm: 0.8760792016983032)
Step... (46875 | Loss: 0.14165657758712769, Learning Rate: 1.8945462215924636e-05, Gradient Norm: 0.5194206237792969)
Step... (46900 | Loss: 0.15511304140090942, Learning Rate: 1.8793934941641055e-05, Gradient Norm: 0.6898266077041626)
Step... (46925 | Loss: 0.20974382758140564, Learning Rate: 1.864242585725151e-05, Gradient Norm: 0.5869802236557007)

Training...:  38% 5229/13907 [3:14:43<5:22:03,  2.23s/it][A
Training...:  38% 5230/13907 [3:14:45<5:24:08,  2.24s/it][A
Training...:  38% 5231/13907 [3:14:47<5:14:12,  2.17s/it][A
Training...:  38% 5232/13907 [3:14:49<5:05:48,  2.12s/it][A
Training...:  38% 5233/13907 [3:14:51<4:58:47,  2.07s/it][A
Training...:  38% 5234/13907 [3:14:53<4:53:28,  2.03s/it][A
Training...:  38% 5235/13907 [3:14:55<4:47:26,  1.99s/it][A
Training...:  38% 5236/13907 [3:14:57<4:41:37,  1.95s/it][A
Training...:  38% 5237/13907 [3:14:58<4:35:31,  1.91s/it][A
Training...:  38% 5238/13907 [3:15:00<4:30:08,  1.87s/it][A
Training...:  38% 5239/13907 [3:15:02<4:25:01,  1.83s/it][A
Training...:  38% 5240/13907 [3:15:04<4:19:14,  1.79s/it][A
Training...:  38% 5241/13907 [3:15:05<4:15:04,  1.77s/it][A
Training...:  38% 5242/13907 [3:15:07<4:09:42,  1.73s/it][A
Training...:  38% 5243/13907 [3:15:09<4:05:03,  1.70s/it][A
Training...:  38% 5244/13907 [3:15:10<3:59:27,  1.66s/it][A
Training...:  38% 5245/13907 [3:15:12<3:54:28,  1.62s/it][A
Training...:  38% 5246/13907 [3:15:13<3:48:26,  1.58s/it][A
Training...:  38% 5247/13907 [3:15:15<3:41:34,  1.54s/it][A
Training...:  38% 5248/13907 [3:15:16<3:33:14,  1.48s/it][A
Training...:  38% 5249/13907 [3:15:17<3:23:38,  1.41s/it][A
Training...:  38% 5250/13907 [3:15:18<3:08:28,  1.31s/it][A
Training...:  38% 5251/13907 [3:15:22<4:59:47,  2.08s/it][A
Training...:  38% 5252/13907 [3:15:26<6:01:36,  2.51s/it][A
Training...:  38% 5253/13907 [3:15:29<6:35:13,  2.74s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:46:05<8:52:18, 31938.93s/it]
Training...:  38% 5253/13907 [3:15:33<6:35:13,  2.74s/it][A
Training...:  38% 5254/13907 [3:15:33<7:13:01,  3.00s/it][A
Training...:  38% 5255/13907 [3:15:36<7:19:25,  3.05s/it][A
Training...:  38% 5256/13907 [3:15:39<7:16:56,  3.03s/it][A
Training...:  38% 5257/13907 [3:15:42<7:14:15,  3.01s/it][A
Training...:  38% 5258/13907 [3:15:45<7:12:06,  3.00s/it][A
Training...:  38% 5259/13907 [3:15:47<7:05:03,  2.95s/it][A
Training...:  38% 5260/13907 [3:15:50<6:55:43,  2.88s/it][A
Training...:  38% 5261/13907 [3:15:53<6:48:03,  2.83s/it][A
Training...:  38% 5262/13907 [3:15:56<6:39:31,  2.77s/it][A
Training...:  38% 5263/13907 [3:15:58<6:32:15,  2.72s/it][A
Training...:  38% 5264/13907 [3:16:01<6:24:02,  2.67s/it][A
Training...:  38% 5265/13907 [3:16:03<6:17:38,  2.62s/it][A
Training...:  38% 5266/13907 [3:16:06<6:13:45,  2.60s/it][A
Training...:  38% 5267/13907 [3:16:08<6:06:20,  2.54s/it][A
Training...:  38% 5268/13907 [3:16:11<5:59:16,  2.50s/it][A
Training...:  38% 5269/13907 [3:16:13<5:53:56,  2.46s/it][A
Training...:  38% 5270/13907 [3:16:15<5:47:48,  2.42s/it][A
Training...:  38% 5271/13907 [3:16:18<5:43:18,  2.39s/it][A
Training...:  38% 5272/13907 [3:16:20<5:38:08,  2.35s/it][A
Training...:  38% 5273/13907 [3:16:22<5:33:48,  2.32s/it][A
Training...:  38% 5274/13907 [3:16:24<5:29:02,  2.29s/it][A
Training...:  38% 5275/13907 [3:16:26<5:24:23,  2.25s/it][A
Training...:  38% 5276/13907 [3:16:29<5:18:26,  2.21s/it][A
Training...:  38% 5277/13907 [3:16:31<5:13:35,  2.18s/it][A
Training...:  38% 5278/13907 [3:16:33<5:09:28,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:47:07<8:52:18, 31938.93s/it]
Training...:  38% 5278/13907 [3:16:35<5:09:28,  2.15s/it][A
Training...:  38% 5279/13907 [3:16:35<5:19:07,  2.22s/it][A
Training...:  38% 5280/13907 [3:16:37<5:14:26,  2.19s/it][A
Training...:  38% 5281/13907 [3:16:39<5:07:04,  2.14s/it][A
Training...:  38% 5282/13907 [3:16:41<4:59:51,  2.09s/it][A
Training...:  38% 5283/13907 [3:16:43<4:53:25,  2.04s/it][A
Training...:  38% 5284/13907 [3:16:45<4:48:08,  2.00s/it][A
Training...:  38% 5285/13907 [3:16:47<4:43:13,  1.97s/it][A
Training...:  38% 5286/13907 [3:16:49<4:38:01,  1.94s/it][A
Training...:  38% 5287/13907 [3:16:51<4:34:10,  1.91s/it][A
Training...:  38% 5288/13907 [3:16:52<4:28:59,  1.87s/it][A
Training...:  38% 5289/13907 [3:16:54<4:24:49,  1.84s/it][A
Training...:  38% 5290/13907 [3:16:56<4:22:26,  1.83s/it][A
Training...:  38% 5291/13907 [3:16:58<4:18:02,  1.80s/it][A
Training...:  38% 5292/13907 [3:16:59<4:11:07,  1.75s/it][A
Training...:  38% 5293/13907 [3:17:01<4:06:37,  1.72s/it][A
Training...:  38% 5294/13907 [3:17:03<4:00:35,  1.68s/it][A
Training...:  38% 5295/13907 [3:17:04<3:53:44,  1.63s/it][A
Training...:  38% 5296/13907 [3:17:06<3:45:38,  1.57s/it][A
Training...:  38% 5297/13907 [3:17:07<3:37:21,  1.51s/it][A
Training...:  38% 5298/13907 [3:17:08<3:28:31,  1.45s/it][A
Training...:  38% 5299/13907 [3:17:09<3:17:58,  1.38s/it][A
Training...:  38% 5300/13907 [3:17:11<3:02:47,  1.27s/it][A
Training...:  38% 5301/13907 [3:17:14<4:51:13,  2.03s/it][A
Training...:  38% 5302/13907 [3:17:18<5:50:50,  2.45s/it][A
Training...:  38% 5303/13907 [3:17:21<6:24:31,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:47:57<8:52:18, 31938.93s/it]
Training...:  38% 5303/13907 [3:17:25<6:24:31,  2.68s/it][A
Training...:  38% 5304/13907 [3:17:25<7:03:38,  2.95s/it][A
Training...:  38% 5305/13907 [3:17:28<7:10:59,  3.01s/it][A
Training...:  38% 5306/13907 [3:17:31<7:08:35,  2.99s/it][A
Training...:  38% 5307/13907 [3:17:33<7:03:00,  2.95s/it][A
Training...:  38% 5308/13907 [3:17:36<6:56:42,  2.91s/it][A
Training...:  38% 5309/13907 [3:17:39<6:51:31,  2.87s/it][A
Training...:  38% 5310/13907 [3:17:42<6:45:26,  2.83s/it][A
Training...:  38% 5311/13907 [3:17:44<6:37:56,  2.78s/it][A
Training...:  38% 5312/13907 [3:17:47<6:32:00,  2.74s/it][A
Training...:  38% 5313/13907 [3:17:50<6:26:25,  2.70s/it][A
Training...:  38% 5314/13907 [3:17:52<6:20:57,  2.66s/it][A
Training...:  38% 5315/13907 [3:17:55<6:15:08,  2.62s/it][A
Training...:  38% 5316/13907 [3:17:57<6:10:24,  2.59s/it][A
Training...:  38% 5317/13907 [3:18:00<6:07:47,  2.57s/it][A
Training...:  38% 5318/13907 [3:18:02<6:01:36,  2.53s/it][A
Training...:  38% 5319/13907 [3:18:05<5:55:26,  2.48s/it][A
Training...:  38% 5320/13907 [3:18:07<5:49:15,  2.44s/it][A
Training...:  38% 5321/13907 [3:18:09<5:43:22,  2.40s/it][A
Training...:  38% 5322/13907 [3:18:12<5:37:43,  2.36s/it][A
Training...:  38% 5323/13907 [3:18:14<5:32:41,  2.33s/it][A
Training...:  38% 5324/13907 [3:18:16<5:27:35,  2.29s/it][A
Training...:  38% 5325/13907 [3:18:18<5:22:35,  2.26s/it][A
Training...:  38% 5326/13907 [3:18:20<5:16:46,  2.21s/it][A
Training...:  38% 5327/13907 [3:18:22<5:13:37,  2.19s/it][A
Training...:  38% 5328/13907 [3:18:25<5:08:23,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:48:59<8:52:18, 31938.93s/it]
Training...:  38% 5328/13907 [3:18:27<5:08:23,  2.16s/it][A
Training...:  38% 5329/13907 [3:18:27<5:17:18,  2.22s/it][A
Training...:  38% 5330/13907 [3:18:29<5:12:06,  2.18s/it][A
Training...:  38% 5331/13907 [3:18:31<5:04:36,  2.13s/it][A
Training...:  38% 5332/13907 [3:18:33<4:56:50,  2.08s/it][A
Training...:  38% 5333/13907 [3:18:35<4:52:00,  2.04s/it][A
Training...:  38% 5334/13907 [3:18:37<4:45:38,  2.00s/it][A
Training...:  38% 5335/13907 [3:18:39<4:39:54,  1.96s/it][A
Training...:  38% 5336/13907 [3:18:41<4:34:49,  1.92s/it][A
Training...:  38% 5337/13907 [3:18:42<4:30:22,  1.89s/it][A
Training...:  38% 5338/13907 [3:18:44<4:25:13,  1.86s/it][A
Training...:  38% 5339/13907 [3:18:46<4:20:12,  1.82s/it][A
Training...:  38% 5340/13907 [3:18:48<4:15:56,  1.79s/it][A
Training...:  38% 5341/13907 [3:18:49<4:11:19,  1.76s/it][A
Training...:  38% 5342/13907 [3:18:51<4:06:07,  1.72s/it][A
Training...:  38% 5343/13907 [3:18:53<4:01:23,  1.69s/it][A
Training...:  38% 5344/13907 [3:18:54<3:56:31,  1.66s/it][A
Training...:  38% 5345/13907 [3:18:56<3:50:17,  1.61s/it][A
Training...:  38% 5346/13907 [3:18:57<3:43:40,  1.57s/it][A
Training...:  38% 5347/13907 [3:18:58<3:36:19,  1.52s/it][A
Training...:  38% 5348/13907 [3:19:00<3:28:52,  1.46s/it][A
Training...:  38% 5349/13907 [3:19:01<3:20:32,  1.41s/it][A
Training...:  38% 5350/13907 [3:19:02<3:07:55,  1.32s/it][A
Training...:  38% 5351/13907 [3:19:06<4:54:57,  2.07s/it][A
Training...:  38% 5352/13907 [3:19:09<5:53:48,  2.48s/it][A
Training...:  38% 5353/13907 [3:19:13<6:25:27,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:49:48<8:52:18, 31938.93s/it]
Training...:  38% 5353/13907 [3:19:16<6:25:27,  2.70s/it][A
Training...:  38% 5354/13907 [3:19:16<7:05:33,  2.99s/it][A
Training...:  39% 5355/13907 [3:19:19<7:12:18,  3.03s/it][A
Training...:  39% 5356/13907 [3:19:22<7:08:59,  3.01s/it][A
Training...:  39% 5357/13907 [3:19:25<7:03:43,  2.97s/it][A
Training...:  39% 5358/13907 [3:19:28<6:56:22,  2.92s/it][A
Training...:  39% 5359/13907 [3:19:31<6:48:39,  2.87s/it][A
Training...:  39% 5360/13907 [3:19:34<6:41:00,  2.82s/it][A
Training...:  39% 5361/13907 [3:19:36<6:34:04,  2.77s/it][A
Training...:  39% 5362/13907 [3:19:39<6:26:38,  2.71s/it][A
Training...:  39% 5363/13907 [3:19:41<6:21:35,  2.68s/it][A
Training...:  39% 5364/13907 [3:19:44<6:15:53,  2.64s/it][A
Training...:  39% 5365/13907 [3:19:46<6:09:35,  2.60s/it][A
Training...:  39% 5366/13907 [3:19:49<6:04:32,  2.56s/it][A
Training...:  39% 5367/13907 [3:19:51<5:58:18,  2.52s/it][A
Training...:  39% 5368/13907 [3:19:54<5:53:43,  2.49s/it][A
Training...:  39% 5369/13907 [3:19:56<5:47:37,  2.44s/it][A
Training...:  39% 5370/13907 [3:19:58<5:42:28,  2.41s/it][A
Training...:  39% 5371/13907 [3:20:01<5:38:40,  2.38s/it][A
Training...:  39% 5372/13907 [3:20:03<5:37:25,  2.37s/it][A
Training...:  39% 5373/13907 [3:20:05<5:31:26,  2.33s/it][A
Training...:  39% 5374/13907 [3:20:08<5:25:05,  2.29s/it][A
Training...:  39% 5375/13907 [3:20:10<5:20:01,  2.25s/it][A
Training...:  39% 5376/13907 [3:20:12<5:14:22,  2.21s/it][A
Training...:  39% 5377/13907 [3:20:14<5:10:20,  2.18s/it][A
Training...:  39% 5378/13907 [3:20:16<5:05:51,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:50:50<8:52:18, 31938.93s/it]
Training...:  39% 5378/13907 [3:20:18<5:05:51,  2.15s/it][A
Training...:  39% 5379/13907 [3:20:18<5:15:41,  2.22s/it][A
Training...:  39% 5380/13907 [3:20:20<5:10:55,  2.19s/it][A
Training...:  39% 5381/13907 [3:20:22<5:02:17,  2.13s/it][A
Training...:  39% 5382/13907 [3:20:24<4:56:21,  2.09s/it][A
Training...:  39% 5383/13907 [3:20:26<4:50:40,  2.05s/it][A
Training...:  39% 5384/13907 [3:20:28<4:44:59,  2.01s/it][A
Training...:  39% 5385/13907 [3:20:30<4:40:23,  1.97s/it][A
Training...:  39% 5386/13907 [3:20:32<4:34:44,  1.93s/it][A
Training...:  39% 5387/13907 [3:20:34<4:29:34,  1.90s/it][A
Training...:  39% 5388/13907 [3:20:36<4:26:10,  1.87s/it][A
Training...:  39% 5389/13907 [3:20:37<4:22:20,  1.85s/it][A
Training...:  39% 5390/13907 [3:20:39<4:18:14,  1.82s/it][A
Training...:  39% 5391/13907 [3:20:41<4:13:24,  1.79s/it][A
Training...:  39% 5392/13907 [3:20:43<4:08:49,  1.75s/it][A
Training...:  39% 5393/13907 [3:20:44<4:04:36,  1.72s/it][A
Training...:  39% 5394/13907 [3:20:46<3:58:17,  1.68s/it][A
Training...:  39% 5395/13907 [3:20:47<3:52:04,  1.64s/it][A
Training...:  39% 5396/13907 [3:20:49<3:43:46,  1.58s/it][A
Training...:  39% 5397/13907 [3:20:50<3:35:52,  1.52s/it][A
Training...:  39% 5398/13907 [3:20:52<3:27:09,  1.46s/it][A
Training...:  39% 5399/13907 [3:20:53<3:17:23,  1.39s/it][A
Training...:  39% 5400/13907 [3:20:54<3:04:00,  1.30s/it][A
Training...:  39% 5401/13907 [3:20:58<4:47:25,  2.03s/it][A
Training...:  39% 5402/13907 [3:21:01<5:49:17,  2.46s/it][A
Training...:  39% 5403/13907 [3:21:04<6:27:17,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:51:40<8:52:18, 31938.93s/it]
Training...:  39% 5403/13907 [3:21:08<6:27:17,  2.73s/it][A
Training...:  39% 5404/13907 [3:21:08<7:05:37,  3.00s/it][A
Training...:  39% 5405/13907 [3:21:11<7:10:24,  3.04s/it][A
Training...:  39% 5406/13907 [3:21:14<7:06:47,  3.01s/it][A
Training...:  39% 5407/13907 [3:21:17<7:00:28,  2.97s/it][A
Training...:  39% 5408/13907 [3:21:20<6:53:59,  2.92s/it][A
Training...:  39% 5409/13907 [3:21:23<6:45:37,  2.86s/it][A
Training...:  39% 5410/13907 [3:21:25<6:38:04,  2.81s/it][A
Training...:  39% 5411/13907 [3:21:28<6:30:02,  2.75s/it][A
Training...:  39% 5412/13907 [3:21:30<6:22:42,  2.70s/it][A
Training...:  39% 5413/13907 [3:21:33<6:15:58,  2.66s/it][A
Training...:  39% 5414/13907 [3:21:35<6:09:26,  2.61s/it][A
Training...:  39% 5415/13907 [3:21:38<6:03:57,  2.57s/it][A
Training...:  39% 5416/13907 [3:21:40<5:57:53,  2.53s/it][A
Training...:  39% 5417/13907 [3:21:43<5:52:09,  2.49s/it][A
Training...:  39% 5418/13907 [3:21:45<5:49:16,  2.47s/it][A
Training...:  39% 5419/13907 [3:21:48<5:44:39,  2.44s/it][A
Training...:  39% 5420/13907 [3:21:50<5:40:30,  2.41s/it][A
Training...:  39% 5421/13907 [3:21:52<5:36:38,  2.38s/it][A
Training...:  39% 5422/13907 [3:21:54<5:32:13,  2.35s/it][A
Training...:  39% 5423/13907 [3:21:57<5:27:50,  2.32s/it][A
Training...:  39% 5424/13907 [3:21:59<5:22:30,  2.28s/it][A
Training...:  39% 5425/13907 [3:22:01<5:17:50,  2.25s/it][A
Training...:  39% 5426/13907 [3:22:03<5:12:55,  2.21s/it][A
Training...:  39% 5427/13907 [3:22:05<5:09:04,  2.19s/it][A
Training...:  39% 5428/13907 [3:22:07<5:04:08,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:52:42<8:52:18, 31938.93s/it]
Training...:  39% 5428/13907 [3:22:10<5:04:08,  2.15s/it][A
Training...:  39% 5429/13907 [3:22:10<5:13:29,  2.22s/it][A
Training...:  39% 5430/13907 [3:22:12<5:08:00,  2.18s/it][A
Training...:  39% 5431/13907 [3:22:14<5:00:28,  2.13s/it][A
Training...:  39% 5432/13907 [3:22:16<4:52:40,  2.07s/it][A
Training...:  39% 5433/13907 [3:22:18<4:50:20,  2.06s/it][A
Training...:  39% 5434/13907 [3:22:20<4:44:57,  2.02s/it][A
Training...:  39% 5435/13907 [3:22:22<4:38:58,  1.98s/it][A
Training...:  39% 5436/13907 [3:22:23<4:32:08,  1.93s/it][A
Training...:  39% 5437/13907 [3:22:25<4:26:56,  1.89s/it][A
Training...:  39% 5438/13907 [3:22:27<4:20:50,  1.85s/it][A
Training...:  39% 5439/13907 [3:22:29<4:16:33,  1.82s/it][A
Training...:  39% 5440/13907 [3:22:30<4:11:06,  1.78s/it][A
Training...:  39% 5441/13907 [3:22:32<4:06:09,  1.74s/it][A
Training...:  39% 5442/13907 [3:22:34<4:00:52,  1.71s/it][A
Training...:  39% 5443/13907 [3:22:35<3:56:02,  1.67s/it][A
Training...:  39% 5444/13907 [3:22:37<3:52:13,  1.65s/it][A
Training...:  39% 5445/13907 [3:22:38<3:46:10,  1.60s/it][A
Training...:  39% 5446/13907 [3:22:40<3:39:28,  1.56s/it][A
Training...:  39% 5447/13907 [3:22:41<3:31:24,  1.50s/it][A
Training...:  39% 5448/13907 [3:22:43<3:23:28,  1.44s/it][A
Training...:  39% 5449/13907 [3:22:44<3:14:06,  1.38s/it][A
Training...:  39% 5450/13907 [3:22:45<2:59:26,  1.27s/it][A
Training...:  39% 5451/13907 [3:22:49<4:43:31,  2.01s/it][A
Training...:  39% 5452/13907 [3:22:52<5:45:36,  2.45s/it][A
Training...:  39% 5453/13907 [3:22:55<6:18:54,  2.69s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:53:31<8:52:18, 31938.93s/it]
Training...:  39% 5453/13907 [3:22:59<6:18:54,  2.69s/it][A
Training...:  39% 5454/13907 [3:22:59<6:59:16,  2.98s/it][A
Training...:  39% 5455/13907 [3:23:02<7:05:29,  3.02s/it][A
Training...:  39% 5456/13907 [3:23:05<7:02:37,  3.00s/it][A
Training...:  39% 5457/13907 [3:23:08<6:58:27,  2.97s/it][A
Training...:  39% 5458/13907 [3:23:11<6:51:55,  2.93s/it][A
Training...:  39% 5459/13907 [3:23:13<6:45:13,  2.88s/it][A
Training...:  39% 5460/13907 [3:23:16<6:39:49,  2.84s/it][A
Training...:  39% 5461/13907 [3:23:19<6:34:11,  2.80s/it][A
Training...:  39% 5462/13907 [3:23:22<6:27:40,  2.75s/it][A
Training...:  39% 5463/13907 [3:23:24<6:22:13,  2.72s/it][A
Training...:  39% 5464/13907 [3:23:27<6:15:16,  2.67s/it][A
Training...:  39% 5465/13907 [3:23:29<6:13:08,  2.65s/it][A
Training...:  39% 5466/13907 [3:23:32<6:07:29,  2.61s/it][A
Training...:  39% 5467/13907 [3:23:34<6:00:50,  2.57s/it][A
Training...:  39% 5468/13907 [3:23:37<5:53:38,  2.51s/it][A
Training...:  39% 5469/13907 [3:23:39<5:46:49,  2.47s/it][A
Training...:  39% 5470/13907 [3:23:41<5:40:42,  2.42s/it][A
Training...:  39% 5471/13907 [3:23:44<5:35:05,  2.38s/it][A
Training...:  39% 5472/13907 [3:23:46<5:30:31,  2.35s/it][A
Training...:  39% 5473/13907 [3:23:48<5:25:49,  2.32s/it][A
Training...:  39% 5474/13907 [3:23:50<5:20:50,  2.28s/it][A
Training...:  39% 5475/13907 [3:23:53<5:16:39,  2.25s/it][A
Training...:  39% 5476/13907 [3:23:55<5:12:01,  2.22s/it][A
Training...:  39% 5477/13907 [3:23:57<5:07:32,  2.19s/it][A
Training...:  39% 5478/13907 [3:23:59<5:02:35,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:54:33<8:52:18, 31938.93s/it]
Training...:  39% 5478/13907 [3:24:01<5:02:35,  2.15s/it][A
Training...:  39% 5479/13907 [3:24:01<5:11:43,  2.22s/it][A
Training...:  39% 5480/13907 [3:24:03<5:06:05,  2.18s/it][A
Training...:  39% 5481/13907 [3:24:05<4:57:33,  2.12s/it][A
Training...:  39% 5482/13907 [3:24:07<4:50:45,  2.07s/it][A
Training...:  39% 5483/13907 [3:24:09<4:44:10,  2.02s/it][A
Training...:  39% 5484/13907 [3:24:11<4:38:47,  1.99s/it][A
Training...:  39% 5485/13907 [3:24:13<4:33:52,  1.95s/it][A
Training...:  39% 5486/13907 [3:24:15<4:28:40,  1.91s/it][A
Training...:  39% 5487/13907 [3:24:17<4:23:43,  1.88s/it][A
Training...:  39% 5488/13907 [3:24:18<4:19:08,  1.85s/it][A
Training...:  39% 5489/13907 [3:24:20<4:15:15,  1.82s/it][A
Training...:  39% 5490/13907 [3:24:22<4:10:05,  1.78s/it][A
Training...:  39% 5491/13907 [3:24:24<4:05:29,  1.75s/it][A
Training...:  39% 5492/13907 [3:24:25<4:00:47,  1.72s/it][A
Training...:  39% 5493/13907 [3:24:27<3:56:04,  1.68s/it][A
Training...:  40% 5494/13907 [3:24:28<3:51:05,  1.65s/it][A
Training...:  40% 5495/13907 [3:24:30<3:45:25,  1.61s/it][A
Training...:  40% 5496/13907 [3:24:31<3:39:05,  1.56s/it][A
Training...:  40% 5497/13907 [3:24:33<3:31:51,  1.51s/it][A
Training...:  40% 5498/13907 [3:24:34<3:24:20,  1.46s/it][A
Training...:  40% 5499/13907 [3:24:35<3:13:58,  1.38s/it][A
Training...:  40% 5500/13907 [3:24:36<3:00:07,  1.29s/it][A
Training...:  40% 5501/13907 [3:24:40<4:43:15,  2.02s/it][A
Training...:  40% 5502/13907 [3:24:44<5:44:36,  2.46s/it][A
Training...:  40% 5503/13907 [3:24:47<6:19:13,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:55:23<8:52:18, 31938.93s/it]
Training...:  40% 5503/13907 [3:24:50<6:19:13,  2.71s/it][A
Training...:  40% 5504/13907 [3:24:50<6:57:13,  2.98s/it][A
Training...:  40% 5505/13907 [3:24:54<7:04:00,  3.03s/it][A
Training...:  40% 5506/13907 [3:24:57<7:00:42,  3.00s/it][A
Training...:  40% 5507/13907 [3:24:59<6:55:19,  2.97s/it][A
Training...:  40% 5508/13907 [3:25:02<6:49:57,  2.93s/it][A
Training...:  40% 5509/13907 [3:25:05<6:45:53,  2.90s/it][A
Training...:  40% 5510/13907 [3:25:08<6:39:14,  2.85s/it][A
Training...:  40% 5511/13907 [3:25:10<6:30:49,  2.79s/it][A
Training...:  40% 5512/13907 [3:25:13<6:21:29,  2.73s/it][A
Training...:  40% 5513/13907 [3:25:16<6:13:40,  2.67s/it][A
Training...:  40% 5514/13907 [3:25:18<6:06:49,  2.62s/it][A
Training...:  40% 5515/13907 [3:25:21<6:00:22,  2.58s/it][A
Training...:  40% 5516/13907 [3:25:23<5:54:36,  2.54s/it][A
Training...:  40% 5517/13907 [3:25:25<5:48:58,  2.50s/it][A
Training...:  40% 5518/13907 [3:25:28<5:43:58,  2.46s/it][A
Training...:  40% 5519/13907 [3:25:30<5:40:03,  2.43s/it][A
Training...:  40% 5520/13907 [3:25:32<5:35:19,  2.40s/it][A
Training...:  40% 5521/13907 [3:25:35<5:31:10,  2.37s/it][A
Training...:  40% 5522/13907 [3:25:37<5:25:53,  2.33s/it][A
Training...:  40% 5523/13907 [3:25:39<5:22:02,  2.30s/it][A
Training...:  40% 5524/13907 [3:25:41<5:18:09,  2.28s/it][A
Training...:  40% 5525/13907 [3:25:44<5:12:35,  2.24s/it][A
Training...:  40% 5526/13907 [3:25:46<5:07:38,  2.20s/it][A
Training...:  40% 5527/13907 [3:25:48<5:03:19,  2.17s/it][A
Training...:  40% 5528/13907 [3:25:50<5:00:22,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:56:24<8:52:18, 31938.93s/it]
Training...:  40% 5528/13907 [3:25:52<5:00:22,  2.15s/it][A
Training...:  40% 5529/13907 [3:25:52<5:08:39,  2.21s/it][A
Training...:  40% 5530/13907 [3:25:54<5:03:40,  2.18s/it][A
Training...:  40% 5531/13907 [3:25:56<4:56:42,  2.13s/it][A
Training...:  40% 5532/13907 [3:25:58<4:50:57,  2.08s/it][A
Training...:  40% 5533/13907 [3:26:00<4:45:21,  2.04s/it][A
Training...:  40% 5534/13907 [3:26:02<4:39:33,  2.00s/it][A
Training...:  40% 5535/13907 [3:26:04<4:33:51,  1.96s/it][A
Training...:  40% 5536/13907 [3:26:06<4:30:35,  1.94s/it][A
Training...:  40% 5537/13907 [3:26:08<4:25:17,  1.90s/it][A
Training...:  40% 5538/13907 [3:26:10<4:19:52,  1.86s/it][A
Training...:  40% 5539/13907 [3:26:11<4:14:56,  1.83s/it][A
Training...:  40% 5540/13907 [3:26:13<4:09:25,  1.79s/it][A
Training...:  40% 5541/13907 [3:26:15<4:04:49,  1.76s/it][A
Training...:  40% 5542/13907 [3:26:16<3:59:00,  1.71s/it][A
Training...:  40% 5543/13907 [3:26:18<3:53:43,  1.68s/it][A
Training...:  40% 5544/13907 [3:26:19<3:48:16,  1.64s/it][A
Training...:  40% 5545/13907 [3:26:21<3:42:23,  1.60s/it][A
Training...:  40% 5546/13907 [3:26:22<3:35:25,  1.55s/it][A
Training...:  40% 5547/13907 [3:26:24<3:28:40,  1.50s/it][A
Training...:  40% 5548/13907 [3:26:25<3:20:33,  1.44s/it][A
Training...:  40% 5549/13907 [3:26:26<3:10:38,  1.37s/it][A
Training...:  40% 5550/13907 [3:26:27<2:56:25,  1.27s/it][A
Training...:  40% 5551/13907 [3:26:31<4:36:39,  1.99s/it][A
Training...:  40% 5552/13907 [3:26:34<5:38:35,  2.43s/it][A
Training...:  40% 5553/13907 [3:26:38<6:12:29,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:57:13<8:52:18, 31938.93s/it]
Training...:  40% 5553/13907 [3:26:41<6:12:29,  2.68s/it][A
Training...:  40% 5554/13907 [3:26:41<6:51:24,  2.96s/it][A
Training...:  40% 5555/13907 [3:26:44<6:58:37,  3.01s/it][A
Training...:  40% 5556/13907 [3:26:47<6:55:27,  2.98s/it][A
Training...:  40% 5557/13907 [3:26:50<6:54:16,  2.98s/it][A
Training...:  40% 5558/13907 [3:26:53<6:47:39,  2.93s/it][A
Training...:  40% 5559/13907 [3:26:56<6:42:09,  2.89s/it][A
Training...:  40% 5560/13907 [3:26:59<6:36:51,  2.85s/it][A
Training...:  40% 5561/13907 [3:27:01<6:28:52,  2.80s/it][A
Training...:  40% 5562/13907 [3:27:04<6:21:34,  2.74s/it][A
Training...:  40% 5563/13907 [3:27:07<6:15:34,  2.70s/it][A
Training...:  40% 5564/13907 [3:27:09<6:08:32,  2.65s/it][A
Training...:  40% 5565/13907 [3:27:12<6:02:14,  2.61s/it][A
Training...:  40% 5566/13907 [3:27:14<5:55:48,  2.56s/it][A
Training...:  40% 5567/13907 [3:27:17<5:52:07,  2.53s/it][A
Training...:  40% 5568/13907 [3:27:19<5:46:37,  2.49s/it][A
Training...:  40% 5569/13907 [3:27:21<5:42:35,  2.47s/it][A
Training...:  40% 5570/13907 [3:27:24<5:37:23,  2.43s/it][A
Training...:  40% 5571/13907 [3:27:26<5:33:21,  2.40s/it][A
Training...:  40% 5572/13907 [3:27:28<5:27:04,  2.35s/it][A
Training...:  40% 5573/13907 [3:27:31<5:21:39,  2.32s/it][A
Training...:  40% 5574/13907 [3:27:33<5:16:25,  2.28s/it][A
Training...:  40% 5575/13907 [3:27:35<5:12:17,  2.25s/it][A
Training...:  40% 5576/13907 [3:27:37<5:07:07,  2.21s/it][A
Training...:  40% 5577/13907 [3:27:39<5:02:16,  2.18s/it][A
Training...:  40% 5578/13907 [3:27:41<4:57:34,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:58:16<8:52:18, 31938.93s/it]
Training...:  40% 5578/13907 [3:27:44<4:57:34,  2.14s/it][A
Training...:  40% 5579/13907 [3:27:44<5:06:25,  2.21s/it][A
Training...:  40% 5580/13907 [3:27:46<5:01:09,  2.17s/it][A
Training...:  40% 5581/13907 [3:27:48<4:54:14,  2.12s/it][A
Training...:  40% 5582/13907 [3:27:50<4:47:03,  2.07s/it][A
Training...:  40% 5583/13907 [3:27:51<4:41:31,  2.03s/it][A
Training...:  40% 5584/13907 [3:27:53<4:36:43,  1.99s/it][A
Training...:  40% 5585/13907 [3:27:55<4:31:21,  1.96s/it][A
Training...:  40% 5586/13907 [3:27:57<4:27:19,  1.93s/it][A
Training...:  40% 5587/13907 [3:27:59<4:22:48,  1.90s/it][A
Training...:  40% 5588/13907 [3:28:01<4:18:22,  1.86s/it][A
Training...:  40% 5589/13907 [3:28:03<4:13:43,  1.83s/it][A
Training...:  40% 5590/13907 [3:28:04<4:09:10,  1.80s/it][A
Training...:  40% 5591/13907 [3:28:06<4:03:28,  1.76s/it][A
Training...:  40% 5592/13907 [3:28:08<3:58:51,  1.72s/it][A
Training...:  40% 5593/13907 [3:28:09<3:55:41,  1.70s/it][A
Training...:  40% 5594/13907 [3:28:11<3:51:37,  1.67s/it][A
Training...:  40% 5595/13907 [3:28:12<3:45:59,  1.63s/it][A
Training...:  40% 5596/13907 [3:28:14<3:38:58,  1.58s/it][A
Training...:  40% 5597/13907 [3:28:15<3:32:11,  1.53s/it][A
Training...:  40% 5598/13907 [3:28:17<3:23:47,  1.47s/it][A
Training...:  40% 5599/13907 [3:28:18<3:14:38,  1.41s/it][A
Training...:  40% 5600/13907 [3:28:19<2:59:56,  1.30s/it][A
Training...:  40% 5601/13907 [3:28:23<4:39:27,  2.02s/it][A
Training...:  40% 5602/13907 [3:28:26<5:39:21,  2.45s/it][A
Training...:  40% 5603/13907 [3:28:29<6:11:29,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [29:59:05<8:52:18, 31938.93s/it]
Training...:  40% 5603/13907 [3:28:33<6:11:29,  2.68s/it][A
Training...:  40% 5604/13907 [3:28:33<6:48:53,  2.95s/it][A
Training...:  40% 5605/13907 [3:28:36<6:57:50,  3.02s/it][A
Training...:  40% 5606/13907 [3:28:39<6:55:27,  3.00s/it][A
Training...:  40% 5607/13907 [3:28:42<6:50:43,  2.97s/it][A
Training...:  40% 5608/13907 [3:28:45<6:45:14,  2.93s/it][A
Training...:  40% 5609/13907 [3:28:47<6:38:51,  2.88s/it][A
Training...:  40% 5610/13907 [3:28:50<6:32:28,  2.84s/it][A
Training...:  40% 5611/13907 [3:28:53<6:25:41,  2.79s/it][A
Training...:  40% 5612/13907 [3:28:56<6:20:12,  2.75s/it][A
Training...:  40% 5613/13907 [3:28:58<6:15:24,  2.72s/it][A
Training...:  40% 5614/13907 [3:29:01<6:08:40,  2.67s/it][A
Training...:  40% 5615/13907 [3:29:03<6:01:43,  2.62s/it][A
Training...:  40% 5616/13907 [3:29:06<5:55:25,  2.57s/it][A
Training...:  40% 5617/13907 [3:29:08<5:49:41,  2.53s/it][A
Training...:  40% 5618/13907 [3:29:11<5:44:41,  2.50s/it][A
Training...:  40% 5619/13907 [3:29:13<5:39:30,  2.46s/it][A
Training...:  40% 5620/13907 [3:29:15<5:34:51,  2.42s/it][A
Training...:  40% 5621/13907 [3:29:18<5:29:37,  2.39s/it][A
Training...:  40% 5622/13907 [3:29:20<5:24:26,  2.35s/it][A
Training...:  40% 5623/13907 [3:29:22<5:20:14,  2.32s/it][A
Training...:  40% 5624/13907 [3:29:24<5:14:54,  2.28s/it][A
Training...:  40% 5625/13907 [3:29:26<5:09:40,  2.24s/it][A
Training...:  40% 5626/13907 [3:29:29<5:05:34,  2.21s/it][A
Training...:  40% 5627/13907 [3:29:31<5:01:36,  2.19s/it][A
Training...:  40% 5628/13907 [3:29:33<4:56:52,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:00:07<8:52:18, 31938.93s/it]
Training...:  40% 5628/13907 [3:29:35<4:56:52,  2.15s/it][A
Training...:  40% 5629/13907 [3:29:35<5:06:39,  2.22s/it][A
Training...:  40% 5630/13907 [3:29:37<5:01:49,  2.19s/it][A
Training...:  40% 5631/13907 [3:29:39<4:54:48,  2.14s/it][A
Training...:  40% 5632/13907 [3:29:41<4:48:13,  2.09s/it][A
Training...:  41% 5633/13907 [3:29:43<4:42:29,  2.05s/it][A
Training...:  41% 5634/13907 [3:29:45<4:36:53,  2.01s/it][A
Training...:  41% 5635/13907 [3:29:47<4:31:35,  1.97s/it][A
Training...:  41% 5636/13907 [3:29:49<4:27:10,  1.94s/it][A
Training...:  41% 5637/13907 [3:29:51<4:22:38,  1.91s/it][A
Training...:  41% 5638/13907 [3:29:52<4:18:04,  1.87s/it][A
Training...:  41% 5639/13907 [3:29:54<4:14:23,  1.85s/it][A
Training...:  41% 5640/13907 [3:29:56<4:10:10,  1.82s/it][A
Training...:  41% 5641/13907 [3:29:58<4:05:51,  1.78s/it][A
Training...:  41% 5642/13907 [3:29:59<4:00:49,  1.75s/it][A
Training...:  41% 5643/13907 [3:30:01<3:55:29,  1.71s/it][A
Training...:  41% 5644/13907 [3:30:03<3:51:20,  1.68s/it][A
Training...:  41% 5645/13907 [3:30:04<3:45:57,  1.64s/it][A
Training...:  41% 5646/13907 [3:30:06<3:38:33,  1.59s/it][A
Training...:  41% 5647/13907 [3:30:07<3:31:16,  1.53s/it][A
Training...:  41% 5648/13907 [3:30:08<3:23:43,  1.48s/it][A
Training...:  41% 5649/13907 [3:30:10<3:14:43,  1.41s/it][A
Training...:  41% 5650/13907 [3:30:11<3:00:22,  1.31s/it][A
Training...:  41% 5651/13907 [3:30:14<4:42:24,  2.05s/it][A
Training...:  41% 5652/13907 [3:30:18<5:41:02,  2.48s/it][A
Training...:  41% 5653/13907 [3:30:21<6:13:34,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:00:57<8:52:18, 31938.93s/it]
Training...:  41% 5653/13907 [3:30:25<6:13:34,  2.72s/it][A
Training...:  41% 5654/13907 [3:30:25<6:51:49,  2.99s/it][A
Training...:  41% 5655/13907 [3:30:28<6:58:10,  3.04s/it][A
Training...:  41% 5656/13907 [3:30:31<6:55:17,  3.02s/it][A
Training...:  41% 5657/13907 [3:30:34<6:49:51,  2.98s/it][A
Training...:  41% 5658/13907 [3:30:37<6:43:02,  2.93s/it][A
Training...:  41% 5659/13907 [3:30:39<6:36:20,  2.88s/it][A
Training...:  41% 5660/13907 [3:30:42<6:28:59,  2.83s/it][A
Training...:  41% 5661/13907 [3:30:45<6:22:23,  2.78s/it][A
Training...:  41% 5662/13907 [3:30:47<6:15:24,  2.73s/it][A
Training...:  41% 5663/13907 [3:30:50<6:09:09,  2.69s/it][A
Training...:  41% 5664/13907 [3:30:53<6:03:43,  2.65s/it][A
Training...:  41% 5665/13907 [3:30:55<5:59:20,  2.62s/it][A
Training...:  41% 5666/13907 [3:30:58<5:54:38,  2.58s/it][A
Training...:  41% 5667/13907 [3:31:00<5:48:07,  2.53s/it][A
Training...:  41% 5668/13907 [3:31:02<5:42:48,  2.50s/it][A
Training...:  41% 5669/13907 [3:31:05<5:38:08,  2.46s/it][A
Training...:  41% 5670/13907 [3:31:07<5:34:15,  2.43s/it][A
Training...:  41% 5671/13907 [3:31:10<5:29:32,  2.40s/it][A
Training...:  41% 5672/13907 [3:31:12<5:25:23,  2.37s/it][A
Training...:  41% 5673/13907 [3:31:14<5:20:14,  2.33s/it][A
Training...:  41% 5674/13907 [3:31:16<5:15:47,  2.30s/it][A
Training...:  41% 5675/13907 [3:31:19<5:11:40,  2.27s/it][A
Training...:  41% 5676/13907 [3:31:21<5:07:31,  2.24s/it][A
Training...:  41% 5677/13907 [3:31:23<5:03:37,  2.21s/it][A
Training...:  41% 5678/13907 [3:31:25<4:58:58,  2.18s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:01:59<8:52:18, 31938.93s/it]
Training...:  41% 5678/13907 [3:31:27<4:58:58,  2.18s/it][A
Training...:  41% 5679/13907 [3:31:27<5:07:32,  2.24s/it][A
Training...:  41% 5680/13907 [3:31:29<5:03:15,  2.21s/it][A
Training...:  41% 5681/13907 [3:31:32<4:56:25,  2.16s/it][A
Training...:  41% 5682/13907 [3:31:33<4:48:50,  2.11s/it][A
Training...:  41% 5683/13907 [3:31:35<4:43:29,  2.07s/it][A
Training...:  41% 5684/13907 [3:31:37<4:37:28,  2.02s/it][A
Training...:  41% 5685/13907 [3:31:39<4:31:59,  1.98s/it][A
Training...:  41% 5686/13907 [3:31:41<4:25:45,  1.94s/it][A
Training...:  41% 5687/13907 [3:31:43<4:21:37,  1.91s/it][A
Training...:  41% 5688/13907 [3:31:45<4:15:59,  1.87s/it][A
Training...:  41% 5689/13907 [3:31:46<4:10:58,  1.83s/it][A
Training...:  41% 5690/13907 [3:31:48<4:05:58,  1.80s/it][A
Training...:  41% 5691/13907 [3:31:50<4:01:19,  1.76s/it][A
Training...:  41% 5692/13907 [3:31:52<3:56:24,  1.73s/it][A
Training...:  41% 5693/13907 [3:31:53<3:51:54,  1.69s/it][A
Training...:  41% 5694/13907 [3:31:55<3:47:15,  1.66s/it][A
Training...:  41% 5695/13907 [3:31:56<3:43:10,  1.63s/it][A
Training...:  41% 5696/13907 [3:31:58<3:37:21,  1.59s/it][A
Training...:  41% 5697/13907 [3:31:59<3:30:51,  1.54s/it][A
Training...:  41% 5698/13907 [3:32:01<3:22:58,  1.48s/it][A
Training...:  41% 5699/13907 [3:32:02<3:13:22,  1.41s/it][A
Training...:  41% 5700/13907 [3:32:03<2:58:51,  1.31s/it][A
Training...:  41% 5701/13907 [3:32:07<4:35:35,  2.02s/it][A
Training...:  41% 5702/13907 [3:32:10<5:35:00,  2.45s/it][A
Training...:  41% 5703/13907 [3:32:13<6:08:03,  2.69s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:02:49<8:52:18, 31938.93s/it]
Training...:  41% 5703/13907 [3:32:17<6:08:03,  2.69s/it][A
Training...:  41% 5704/13907 [3:32:17<6:44:36,  2.96s/it][A
Training...:  41% 5705/13907 [3:32:20<6:51:12,  3.01s/it][A
Training...:  41% 5706/13907 [3:32:23<6:50:08,  3.00s/it][A
Training...:  41% 5707/13907 [3:32:26<6:45:57,  2.97s/it][A
Training...:  41% 5708/13907 [3:32:29<6:42:06,  2.94s/it][A
Training...:  41% 5709/13907 [3:32:32<6:37:01,  2.91s/it][A
Training...:  41% 5710/13907 [3:32:34<6:29:38,  2.85s/it][A
Training...:  41% 5711/13907 [3:32:37<6:21:16,  2.79s/it][A
Training...:  41% 5712/13907 [3:32:40<6:13:22,  2.73s/it][A
Training...:  41% 5713/13907 [3:32:42<6:11:28,  2.72s/it][A
Training...:  41% 5714/13907 [3:32:45<6:06:12,  2.68s/it][A
Training...:  41% 5715/13907 [3:32:47<5:58:09,  2.62s/it][A
Training...:  41% 5716/13907 [3:32:50<5:50:50,  2.57s/it][A
Training...:  41% 5717/13907 [3:32:52<5:43:48,  2.52s/it][A
Training...:  41% 5718/13907 [3:32:55<5:38:20,  2.48s/it][A
Training...:  41% 5719/13907 [3:32:57<5:32:27,  2.44s/it][A
Training...:  41% 5720/13907 [3:32:59<5:27:06,  2.40s/it][A
Training...:  41% 5721/13907 [3:33:01<5:22:13,  2.36s/it][A
Training...:  41% 5722/13907 [3:33:04<5:16:37,  2.32s/it][A
Training...:  41% 5723/13907 [3:33:06<5:12:43,  2.29s/it][A
Training...:  41% 5724/13907 [3:33:08<5:07:43,  2.26s/it][A
Training...:  41% 5725/13907 [3:33:10<5:03:32,  2.23s/it][A
Training...:  41% 5726/13907 [3:33:12<4:59:53,  2.20s/it][A
Training...:  41% 5727/13907 [3:33:14<4:56:06,  2.17s/it][A
Training...:  41% 5728/13907 [3:33:17<4:51:24,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:03:51<8:52:18, 31938.93s/it]
Training...:  41% 5728/13907 [3:33:19<4:51:24,  2.14s/it][A
Training...:  41% 5729/13907 [3:33:19<5:00:36,  2.21s/it][A
Training...:  41% 5730/13907 [3:33:21<4:56:20,  2.17s/it][A
Training...:  41% 5731/13907 [3:33:23<4:48:41,  2.12s/it][A
Training...:  41% 5732/13907 [3:33:25<4:41:45,  2.07s/it][A
Training...:  41% 5733/13907 [3:33:27<4:35:21,  2.02s/it][A
Training...:  41% 5734/13907 [3:33:29<4:30:53,  1.99s/it][A
Training...:  41% 5735/13907 [3:33:31<4:25:43,  1.95s/it][A
Training...:  41% 5736/13907 [3:33:32<4:22:13,  1.93s/it][A
Training...:  41% 5737/13907 [3:33:34<4:17:48,  1.89s/it][A
Training...:  41% 5738/13907 [3:33:36<4:12:13,  1.85s/it][A
Training...:  41% 5739/13907 [3:33:38<4:08:06,  1.82s/it][A
Training...:  41% 5740/13907 [3:33:39<4:02:53,  1.78s/it][A
Training...:  41% 5741/13907 [3:33:41<3:58:23,  1.75s/it][A
Training...:  41% 5742/13907 [3:33:43<3:53:44,  1.72s/it][A
Training...:  41% 5743/13907 [3:33:44<3:49:10,  1.68s/it][A
Training...:  41% 5744/13907 [3:33:46<3:45:07,  1.65s/it][A
Training...:  41% 5745/13907 [3:33:48<3:38:59,  1.61s/it][A
Training...:  41% 5746/13907 [3:33:49<3:32:40,  1.56s/it][A
Training...:  41% 5747/13907 [3:33:50<3:26:39,  1.52s/it][A
Training...:  41% 5748/13907 [3:33:52<3:19:38,  1.47s/it][A
Training...:  41% 5749/13907 [3:33:53<3:11:37,  1.41s/it][A
Training...:  41% 5750/13907 [3:33:54<2:57:48,  1.31s/it][A
Training...:  41% 5751/13907 [3:33:58<4:37:11,  2.04s/it][A
Training...:  41% 5752/13907 [3:34:01<5:36:50,  2.48s/it][A
Training...:  41% 5753/13907 [3:34:05<6:09:44,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:04:40<8:52:18, 31938.93s/it]
Training...:  41% 5753/13907 [3:34:08<6:09:44,  2.72s/it][A
Training...:  41% 5754/13907 [3:34:08<6:46:21,  2.99s/it][A
Training...:  41% 5755/13907 [3:34:11<6:50:55,  3.02s/it][A
Training...:  41% 5756/13907 [3:34:14<6:46:05,  2.99s/it][A
Training...:  41% 5757/13907 [3:34:17<6:41:48,  2.96s/it][A
Training...:  41% 5758/13907 [3:34:20<6:36:23,  2.92s/it][A
Training...:  41% 5759/13907 [3:34:23<6:30:24,  2.87s/it][A
Training...:  41% 5760/13907 [3:34:25<6:23:26,  2.82s/it][A
Training...:  41% 5761/13907 [3:34:28<6:16:23,  2.77s/it][A
Training...:  41% 5762/13907 [3:34:31<6:10:53,  2.73s/it][A
Training...:  41% 5763/13907 [3:34:33<6:05:01,  2.69s/it][A
Training...:  41% 5764/13907 [3:34:36<5:59:28,  2.65s/it][A
Training...:  41% 5765/13907 [3:34:38<5:54:00,  2.61s/it][A
Training...:  41% 5766/13907 [3:34:41<5:48:51,  2.57s/it][A
Training...:  41% 5767/13907 [3:34:43<5:43:24,  2.53s/it][A
Training...:  41% 5768/13907 [3:34:46<5:39:04,  2.50s/it][A
Training...:  41% 5769/13907 [3:34:48<5:33:47,  2.46s/it][A
Training...:  41% 5770/13907 [3:34:50<5:28:08,  2.42s/it][A
Training...:  41% 5771/13907 [3:34:53<5:24:05,  2.39s/it][A
Training...:  42% 5772/13907 [3:34:55<5:21:19,  2.37s/it][A
Training...:  42% 5773/13907 [3:34:57<5:18:29,  2.35s/it][A
Training...:  42% 5774/13907 [3:35:00<5:13:14,  2.31s/it][A
Training...:  42% 5775/13907 [3:35:02<5:09:36,  2.28s/it][A
Training...:  42% 5776/13907 [3:35:04<5:05:01,  2.25s/it][A
Training...:  42% 5777/13907 [3:35:06<4:59:34,  2.21s/it][A
Training...:  42% 5778/13907 [3:35:08<4:54:41,  2.18s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:05:43<8:52:18, 31938.93s/it]
Training...:  42% 5778/13907 [3:35:11<4:54:41,  2.18s/it][A
Training...:  42% 5779/13907 [3:35:11<5:02:38,  2.23s/it][A
Training...:  42% 5780/13907 [3:35:13<4:57:14,  2.19s/it][A
Training...:  42% 5781/13907 [3:35:15<4:48:51,  2.13s/it][A
Training...:  42% 5782/13907 [3:35:17<4:42:04,  2.08s/it][A
Training...:  42% 5783/13907 [3:35:19<4:36:50,  2.04s/it][A
Training...:  42% 5784/13907 [3:35:21<4:33:35,  2.02s/it][A
Training...:  42% 5785/13907 [3:35:22<4:28:23,  1.98s/it][A
Training...:  42% 5786/13907 [3:35:24<4:23:11,  1.94s/it][A
Training...:  42% 5787/13907 [3:35:26<4:17:49,  1.91s/it][A
Training...:  42% 5788/13907 [3:35:28<4:12:45,  1.87s/it][A
Training...:  42% 5789/13907 [3:35:30<4:08:33,  1.84s/it][A
Training...:  42% 5790/13907 [3:35:31<4:02:45,  1.79s/it][A
Training...:  42% 5791/13907 [3:35:33<3:56:59,  1.75s/it][A
Training...:  42% 5792/13907 [3:35:35<3:52:06,  1.72s/it][A
Training...:  42% 5793/13907 [3:35:36<3:47:25,  1.68s/it][A
Training...:  42% 5794/13907 [3:35:38<3:41:59,  1.64s/it][A
Training...:  42% 5795/13907 [3:35:39<3:37:41,  1.61s/it][A
Training...:  42% 5796/13907 [3:35:41<3:31:07,  1.56s/it][A
Training...:  42% 5797/13907 [3:35:42<3:23:36,  1.51s/it][A
Training...:  42% 5798/13907 [3:35:43<3:15:25,  1.45s/it][A
Training...:  42% 5799/13907 [3:35:45<3:06:42,  1.38s/it][A
Training...:  42% 5800/13907 [3:35:46<2:53:26,  1.28s/it][A
Training...:  42% 5801/13907 [3:35:49<4:30:29,  2.00s/it][A
Training...:  42% 5802/13907 [3:35:53<5:29:41,  2.44s/it][A
Training...:  42% 5803/13907 [3:35:56<6:02:00,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:06:32<8:52:18, 31938.93s/it]
Training...:  42% 5803/13907 [3:36:00<6:02:00,  2.68s/it][A
Training...:  42% 5804/13907 [3:36:00<6:37:40,  2.94s/it][A
Training...:  42% 5805/13907 [3:36:03<6:44:33,  3.00s/it][A
Training...:  42% 5806/13907 [3:36:06<6:41:32,  2.97s/it][A
Training...:  42% 5807/13907 [3:36:09<6:35:05,  2.93s/it][A
Training...:  42% 5808/13907 [3:36:11<6:28:49,  2.88s/it][A
Training...:  42% 5809/13907 [3:36:14<6:23:12,  2.84s/it][A
Training...:  42% 5810/13907 [3:36:17<6:16:30,  2.79s/it][A
Training...:  42% 5811/13907 [3:36:19<6:11:28,  2.75s/it][A
Training...:  42% 5812/13907 [3:36:22<6:05:19,  2.71s/it][A
Training...:  42% 5813/13907 [3:36:25<5:57:27,  2.65s/it][A
Training...:  42% 5814/13907 [3:36:27<5:50:59,  2.60s/it][A
Training...:  42% 5815/13907 [3:36:29<5:43:51,  2.55s/it][A
Training...:  42% 5816/13907 [3:36:32<5:38:13,  2.51s/it][A
Training...:  42% 5817/13907 [3:36:34<5:32:55,  2.47s/it][A
Training...:  42% 5818/13907 [3:36:37<5:28:13,  2.43s/it][A
Training...:  42% 5819/13907 [3:36:39<5:22:44,  2.39s/it][A
Training...:  42% 5820/13907 [3:36:41<5:18:25,  2.36s/it][A
Training...:  42% 5821/13907 [3:36:43<5:13:51,  2.33s/it][A
Training...:  42% 5822/13907 [3:36:46<5:10:15,  2.30s/it][A
Training...:  42% 5823/13907 [3:36:48<5:05:51,  2.27s/it][A
Training...:  42% 5824/13907 [3:36:50<5:01:23,  2.24s/it][A
Training...:  42% 5825/13907 [3:36:52<4:56:49,  2.20s/it][A
Training...:  42% 5826/13907 [3:36:54<4:54:03,  2.18s/it][A
Training...:  42% 5827/13907 [3:36:56<4:50:19,  2.16s/it][A
Training...:  42% 5828/13907 [3:36:58<4:45:51,  2.12s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:07:33<8:52:18, 31938.93s/it]
Training...:  42% 5828/13907 [3:37:01<4:45:51,  2.12s/it][A
Training...:  42% 5829/13907 [3:37:01<4:54:36,  2.19s/it][A
Training...:  42% 5830/13907 [3:37:03<4:49:54,  2.15s/it][A
Training...:  42% 5831/13907 [3:37:05<4:42:56,  2.10s/it][A
Training...:  42% 5832/13907 [3:37:07<4:37:01,  2.06s/it][A
Training...:  42% 5833/13907 [3:37:09<4:31:37,  2.02s/it][A
Training...:  42% 5834/13907 [3:37:11<4:26:37,  1.98s/it][A
Training...:  42% 5835/13907 [3:37:12<4:21:56,  1.95s/it][A
Training...:  42% 5836/13907 [3:37:14<4:18:08,  1.92s/it][A
Training...:  42% 5837/13907 [3:37:16<4:13:08,  1.88s/it][A
Training...:  42% 5838/13907 [3:37:18<4:08:24,  1.85s/it][A
Training...:  42% 5839/13907 [3:37:20<4:04:04,  1.82s/it][A
Training...:  42% 5840/13907 [3:37:21<3:59:11,  1.78s/it][A
Training...:  42% 5841/13907 [3:37:23<3:54:49,  1.75s/it][A
Training...:  42% 5842/13907 [3:37:25<3:50:26,  1.71s/it][A
Training...:  42% 5843/13907 [3:37:26<3:45:55,  1.68s/it][A
Training...:  42% 5844/13907 [3:37:28<3:42:17,  1.65s/it][A
Training...:  42% 5845/13907 [3:37:29<3:37:43,  1.62s/it][A
Training...:  42% 5846/13907 [3:37:31<3:31:22,  1.57s/it][A
Training...:  42% 5847/13907 [3:37:32<3:24:30,  1.52s/it][A
Training...:  42% 5848/13907 [3:37:34<3:17:03,  1.47s/it][A
Training...:  42% 5849/13907 [3:37:35<3:08:23,  1.40s/it][A
Training...:  42% 5850/13907 [3:37:36<2:54:13,  1.30s/it][A
Training...:  42% 5851/13907 [3:37:40<4:34:49,  2.05s/it][A
Training...:  42% 5852/13907 [3:37:43<5:30:36,  2.46s/it][A
Training...:  42% 5853/13907 [3:37:46<6:06:20,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:08:22<8:52:18, 31938.93s/it]
Training...:  42% 5853/13907 [3:37:50<6:06:20,  2.73s/it][A
Training...:  42% 5854/13907 [3:37:50<6:45:31,  3.02s/it][A
Training...:  42% 5855/13907 [3:37:53<6:51:18,  3.06s/it][A
Training...:  42% 5856/13907 [3:37:56<6:47:42,  3.04s/it][A
Training...:  42% 5857/13907 [3:37:59<6:44:08,  3.01s/it][A
Training...:  42% 5858/13907 [3:38:02<6:36:51,  2.96s/it][A
Training...:  42% 5859/13907 [3:38:05<6:30:51,  2.91s/it][A
Training...:  42% 5860/13907 [3:38:08<6:23:32,  2.86s/it][A
Training...:  42% 5861/13907 [3:38:10<6:17:33,  2.82s/it][A
Training...:  42% 5862/13907 [3:38:13<6:09:44,  2.76s/it][A
Training...:  42% 5863/13907 [3:38:16<6:03:42,  2.71s/it][A
Training...:  42% 5864/13907 [3:38:18<5:56:58,  2.66s/it][A
Training...:  42% 5865/13907 [3:38:21<5:52:15,  2.63s/it][A
Training...:  42% 5866/13907 [3:38:23<5:46:08,  2.58s/it][A
Training...:  42% 5867/13907 [3:38:26<5:40:45,  2.54s/it][A
Training...:  42% 5868/13907 [3:38:28<5:35:42,  2.51s/it][A
Training...:  42% 5869/13907 [3:38:30<5:30:51,  2.47s/it][A
Training...:  42% 5870/13907 [3:38:33<5:26:55,  2.44s/it][A
Training...:  42% 5871/13907 [3:38:35<5:24:01,  2.42s/it][A
Training...:  42% 5872/13907 [3:38:37<5:19:06,  2.38s/it][A
Training...:  42% 5873/13907 [3:38:40<5:13:14,  2.34s/it][A
Training...:  42% 5874/13907 [3:38:42<5:07:43,  2.30s/it][A
Training...:  42% 5875/13907 [3:38:44<5:04:13,  2.27s/it][A
Training...:  42% 5876/13907 [3:38:46<4:59:13,  2.24s/it][A
Training...:  42% 5877/13907 [3:38:48<4:55:57,  2.21s/it][A
Training...:  42% 5878/13907 [3:38:51<4:54:15,  2.20s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:09:25<8:52:18, 31938.93s/it]
Training...:  42% 5878/13907 [3:38:53<4:54:15,  2.20s/it][A
Training...:  42% 5879/13907 [3:38:53<5:00:13,  2.24s/it][A
Training...:  42% 5880/13907 [3:38:55<4:55:16,  2.21s/it][A
Training...:  42% 5881/13907 [3:38:57<4:46:35,  2.14s/it][A
Training...:  42% 5882/13907 [3:38:59<4:38:29,  2.08s/it][A
Training...:  42% 5883/13907 [3:39:01<4:32:50,  2.04s/it][A
Training...:  42% 5884/13907 [3:39:03<4:27:08,  2.00s/it][A
Training...:  42% 5885/13907 [3:39:05<4:22:13,  1.96s/it][A
Training...:  42% 5886/13907 [3:39:06<4:17:13,  1.92s/it][A
Training...:  42% 5887/13907 [3:39:08<4:12:48,  1.89s/it][A
Training...:  42% 5888/13907 [3:39:10<4:07:55,  1.85s/it][A
Training...:  42% 5889/13907 [3:39:12<4:03:05,  1.82s/it][A
Training...:  42% 5890/13907 [3:39:14<3:58:13,  1.78s/it][A
Training...:  42% 5891/13907 [3:39:15<3:54:16,  1.75s/it][A
Training...:  42% 5892/13907 [3:39:17<3:49:38,  1.72s/it][A
Training...:  42% 5893/13907 [3:39:18<3:44:36,  1.68s/it][A
Training...:  42% 5894/13907 [3:39:20<3:39:25,  1.64s/it][A
Training...:  42% 5895/13907 [3:39:21<3:33:54,  1.60s/it][A
Training...:  42% 5896/13907 [3:39:23<3:27:53,  1.56s/it][A
Training...:  42% 5897/13907 [3:39:24<3:21:39,  1.51s/it][A
Training...:  42% 5898/13907 [3:39:26<3:13:58,  1.45s/it][A
Training...:  42% 5899/13907 [3:39:27<3:03:59,  1.38s/it][A
Training...:  42% 5900/13907 [3:39:28<2:50:13,  1.28s/it][A
Training...:  42% 5901/13907 [3:39:32<4:34:55,  2.06s/it][A
Training...:  42% 5902/13907 [3:39:35<5:32:07,  2.49s/it][A
Training...:  42% 5903/13907 [3:39:39<6:04:19,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:10:14<8:52:18, 31938.93s/it]
Training...:  42% 5903/13907 [3:39:42<6:04:19,  2.73s/it][A
Training...:  42% 5904/13907 [3:39:42<6:41:30,  3.01s/it][A
Training...:  42% 5905/13907 [3:39:45<6:47:39,  3.06s/it][A
Training...:  42% 5906/13907 [3:39:48<6:44:48,  3.04s/it][A
Training...:  42% 5907/13907 [3:39:51<6:40:23,  3.00s/it][A
Training...:  42% 5908/13907 [3:39:54<6:33:07,  2.95s/it][A
Training...:  42% 5909/13907 [3:39:57<6:26:09,  2.90s/it][A
Training...:  42% 5910/13907 [3:40:00<6:18:14,  2.84s/it][A
Training...:  43% 5911/13907 [3:40:02<6:10:41,  2.78s/it][A
Training...:  43% 5912/13907 [3:40:05<6:04:19,  2.73s/it][A
Training...:  43% 5913/13907 [3:40:07<5:57:42,  2.68s/it][A
Training...:  43% 5914/13907 [3:40:10<5:51:57,  2.64s/it][A
Training...:  43% 5915/13907 [3:40:13<5:47:32,  2.61s/it][A
Training...:  43% 5916/13907 [3:40:15<5:45:43,  2.60s/it][A
Training...:  43% 5917/13907 [3:40:18<5:40:22,  2.56s/it][A
Training...:  43% 5918/13907 [3:40:20<5:33:06,  2.50s/it][A
Training...:  43% 5919/13907 [3:40:22<5:27:57,  2.46s/it][A
Training...:  43% 5920/13907 [3:40:25<5:22:36,  2.42s/it][A
Training...:  43% 5921/13907 [3:40:27<5:17:24,  2.38s/it][A
Training...:  43% 5922/13907 [3:40:29<5:13:37,  2.36s/it][A
Training...:  43% 5923/13907 [3:40:31<5:08:49,  2.32s/it][A
Training...:  43% 5924/13907 [3:40:34<5:04:43,  2.29s/it][A
Training...:  43% 5925/13907 [3:40:36<5:00:09,  2.26s/it][A
Training...:  43% 5926/13907 [3:40:38<4:55:43,  2.22s/it][A
Training...:  43% 5927/13907 [3:40:40<4:51:23,  2.19s/it][A
Training...:  43% 5928/13907 [3:40:42<4:47:03,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:11:17<8:52:18, 31938.93s/it]
Training...:  43% 5928/13907 [3:40:45<4:47:03,  2.16s/it][A
Training...:  43% 5929/13907 [3:40:45<4:56:12,  2.23s/it][A
Training...:  43% 5930/13907 [3:40:47<4:51:44,  2.19s/it][A
Training...:  43% 5931/13907 [3:40:49<4:44:51,  2.14s/it][A
Training...:  43% 5932/13907 [3:40:51<4:38:52,  2.10s/it][A
Training...:  43% 5933/13907 [3:40:53<4:32:42,  2.05s/it][A
Training...:  43% 5934/13907 [3:40:55<4:27:02,  2.01s/it][A
Training...:  43% 5935/13907 [3:40:56<4:22:20,  1.97s/it][A
Training...:  43% 5936/13907 [3:40:58<4:16:51,  1.93s/it][A
Training...:  43% 5937/13907 [3:41:00<4:12:01,  1.90s/it][A
Training...:  43% 5938/13907 [3:41:02<4:08:36,  1.87s/it][A
Training...:  43% 5939/13907 [3:41:04<4:04:18,  1.84s/it][A
Training...:  43% 5940/13907 [3:41:05<3:59:10,  1.80s/it][A
Training...:  43% 5941/13907 [3:41:07<3:54:24,  1.77s/it][A
Training...:  43% 5942/13907 [3:41:09<3:50:13,  1.73s/it][A
Training...:  43% 5943/13907 [3:41:10<3:45:02,  1.70s/it][A
Training...:  43% 5944/13907 [3:41:12<3:39:42,  1.66s/it][A
Training...:  43% 5945/13907 [3:41:13<3:33:31,  1.61s/it][A
Training...:  43% 5946/13907 [3:41:15<3:27:06,  1.56s/it][A
Training...:  43% 5947/13907 [3:41:16<3:20:20,  1.51s/it][A
Training...:  43% 5948/13907 [3:41:18<3:12:15,  1.45s/it][A
Training...:  43% 5949/13907 [3:41:19<3:03:02,  1.38s/it][A
Training...:  43% 5950/13907 [3:41:20<2:49:16,  1.28s/it][A
Training...:  43% 5951/13907 [3:41:24<4:32:22,  2.05s/it][A
Training...:  43% 5952/13907 [3:41:27<5:29:42,  2.49s/it][A
Training...:  43% 5953/13907 [3:41:30<5:58:59,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:12:06<8:52:18, 31938.93s/it]
Training...:  43% 5953/13907 [3:41:34<5:58:59,  2.71s/it][A
Training...:  43% 5954/13907 [3:41:34<6:35:14,  2.98s/it][A
Training...:  43% 5955/13907 [3:41:37<6:44:55,  3.06s/it][A
Training...:  43% 5956/13907 [3:41:40<6:45:17,  3.06s/it][A
Training...:  43% 5957/13907 [3:41:43<6:41:10,  3.03s/it][A
Training...:  43% 5958/13907 [3:41:46<6:34:15,  2.98s/it][A
Training...:  43% 5959/13907 [3:41:49<6:27:28,  2.93s/it][A
Training...:  43% 5960/13907 [3:41:52<6:19:21,  2.86s/it][A
Training...:  43% 5961/13907 [3:41:54<6:13:22,  2.82s/it][A
Training...:  43% 5962/13907 [3:41:57<6:06:41,  2.77s/it][A
Training...:  43% 5963/13907 [3:42:00<6:00:33,  2.72s/it][A
Training...:  43% 5964/13907 [3:42:02<5:53:45,  2.67s/it][A
Training...:  43% 5965/13907 [3:42:05<5:49:09,  2.64s/it][A
Training...:  43% 5966/13907 [3:42:07<5:43:58,  2.60s/it][A
Training...:  43% 5967/13907 [3:42:10<5:37:51,  2.55s/it][A
Training...:  43% 5968/13907 [3:42:12<5:32:30,  2.51s/it][A
Training...:  43% 5969/13907 [3:42:15<5:27:34,  2.48s/it][A
Training...:  43% 5970/13907 [3:42:17<5:21:05,  2.43s/it][A
Training...:  43% 5971/13907 [3:42:19<5:16:57,  2.40s/it][A
Training...:  43% 5972/13907 [3:42:21<5:12:45,  2.36s/it][A
Training...:  43% 5973/13907 [3:42:24<5:09:12,  2.34s/it][A
Training...:  43% 5974/13907 [3:42:26<5:05:07,  2.31s/it][A
Training...:  43% 5975/13907 [3:42:28<5:00:30,  2.27s/it][A
Training...:  43% 5976/13907 [3:42:30<4:56:06,  2.24s/it][A
Training...:  43% 5977/13907 [3:42:32<4:52:05,  2.21s/it][A
Training...:  43% 5978/13907 [3:42:35<4:47:38,  2.18s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:13:09<8:52:18, 31938.93s/it]
Training...:  43% 5978/13907 [3:42:37<4:47:38,  2.18s/it][A
Training...:  43% 5979/13907 [3:42:37<4:56:15,  2.24s/it][A
Training...:  43% 5980/13907 [3:42:39<4:51:00,  2.20s/it][A
Training...:  43% 5981/13907 [3:42:41<4:43:30,  2.15s/it][A
Training...:  43% 5982/13907 [3:42:43<4:36:11,  2.09s/it][A
Training...:  43% 5983/13907 [3:42:45<4:31:08,  2.05s/it][A
Training...:  43% 5984/13907 [3:42:47<4:25:43,  2.01s/it][A
Training...:  43% 5985/13907 [3:42:49<4:20:09,  1.97s/it][A
Training...:  43% 5986/13907 [3:42:51<4:14:48,  1.93s/it][A
Training...:  43% 5987/13907 [3:42:52<4:10:47,  1.90s/it][A
Training...:  43% 5988/13907 [3:42:54<4:07:19,  1.87s/it][A
Training...:  43% 5989/13907 [3:42:56<4:02:33,  1.84s/it][A
Training...:  43% 5990/13907 [3:42:58<3:57:57,  1.80s/it][A
Training...:  43% 5991/13907 [3:42:59<3:54:17,  1.78s/it][A
Training...:  43% 5992/13907 [3:43:01<3:48:54,  1.74s/it][A
Training...:  43% 5993/13907 [3:43:03<3:43:59,  1.70s/it][A
Training...:  43% 5994/13907 [3:43:04<3:40:40,  1.67s/it][A
Training...:  43% 5995/13907 [3:43:06<3:35:11,  1.63s/it][A
Training...:  43% 5996/13907 [3:43:07<3:27:59,  1.58s/it][A
Training...:  43% 5997/13907 [3:43:09<3:21:46,  1.53s/it][A
Training...:  43% 5998/13907 [3:43:10<3:13:32,  1.47s/it][A
Training...:  43% 5999/13907 [3:43:11<3:04:02,  1.40s/it][A
Training...:  43% 6000/13907 [3:43:12<2:50:37,  1.29s/it][A
Training...:  43% 6001/13907 [3:43:16<4:26:47,  2.02s/it][A
Training...:  43% 6002/13907 [3:43:20<5:23:57,  2.46s/it][A
Training...:  43% 6003/13907 [3:43:23<5:55:15,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:13:58<8:52:18, 31938.93s/it]
Training...:  43% 6003/13907 [3:43:26<5:55:15,  2.70s/it][A
Training...:  43% 6004/13907 [3:43:26<6:32:55,  2.98s/it][A
Training...:  43% 6005/13907 [3:43:30<6:39:52,  3.04s/it][A
Training...:  43% 6006/13907 [3:43:33<6:37:09,  3.02s/it][A
Training...:  43% 6007/13907 [3:43:35<6:32:27,  2.98s/it][A
Training...:  43% 6008/13907 [3:43:38<6:25:26,  2.93s/it][A
Training...:  43% 6009/13907 [3:43:41<6:19:31,  2.88s/it][A
Training...:  43% 6010/13907 [3:43:44<6:12:29,  2.83s/it][A
Training...:  43% 6011/13907 [3:43:46<6:06:37,  2.79s/it][A
Training...:  43% 6012/13907 [3:43:49<6:00:23,  2.74s/it][A
Training...:  43% 6013/13907 [3:43:52<5:53:53,  2.69s/it][A
Training...:  43% 6014/13907 [3:43:54<5:50:18,  2.66s/it][A
Training...:  43% 6015/13907 [3:43:57<5:43:48,  2.61s/it][A
Training...:  43% 6016/13907 [3:43:59<5:38:02,  2.57s/it][A
Training...:  43% 6017/13907 [3:44:02<5:32:22,  2.53s/it][A
Training...:  43% 6018/13907 [3:44:04<5:27:11,  2.49s/it][A
Training...:  43% 6019/13907 [3:44:06<5:22:57,  2.46s/it][A
Training...:  43% 6020/13907 [3:44:09<5:19:57,  2.43s/it][A
Training...:  43% 6021/13907 [3:44:11<5:14:27,  2.39s/it][A
Training...:  43% 6022/13907 [3:44:13<5:10:01,  2.36s/it][A
Training...:  43% 6023/13907 [3:44:16<5:05:33,  2.33s/it][A
Training...:  43% 6024/13907 [3:44:18<5:00:52,  2.29s/it][A
Training...:  43% 6025/13907 [3:44:20<4:56:40,  2.26s/it][A
Training...:  43% 6026/13907 [3:44:22<4:52:08,  2.22s/it][A
Training...:  43% 6027/13907 [3:44:24<4:50:16,  2.21s/it][A
Training...:  43% 6028/13907 [3:44:26<4:47:32,  2.19s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:15:01<8:52:18, 31938.93s/it]
Training...:  43% 6028/13907 [3:44:29<4:47:32,  2.19s/it][A
Training...:  43% 6029/13907 [3:44:29<4:57:18,  2.26s/it][A
Training...:  43% 6030/13907 [3:44:31<4:53:04,  2.23s/it][A
Training...:  43% 6031/13907 [3:44:33<4:45:17,  2.17s/it][A
Training...:  43% 6032/13907 [3:44:35<4:38:03,  2.12s/it][A
Training...:  43% 6033/13907 [3:44:37<4:32:12,  2.07s/it][A
Training...:  43% 6034/13907 [3:44:39<4:25:58,  2.03s/it][A
Training...:  43% 6035/13907 [3:44:41<4:20:28,  1.99s/it][A
Training...:  43% 6036/13907 [3:44:43<4:14:56,  1.94s/it][A
Training...:  43% 6037/13907 [3:44:45<4:10:32,  1.91s/it][A
Training...:  43% 6038/13907 [3:44:46<4:06:15,  1.88s/it][A
Training...:  43% 6039/13907 [3:44:48<4:01:36,  1.84s/it][A
Training...:  43% 6040/13907 [3:44:50<3:56:51,  1.81s/it][A
Training...:  43% 6041/13907 [3:44:52<3:52:13,  1.77s/it][A
Training...:  43% 6042/13907 [3:44:53<3:47:41,  1.74s/it][A
Training...:  43% 6043/13907 [3:44:55<3:43:36,  1.71s/it][A
Training...:  43% 6044/13907 [3:44:56<3:38:33,  1.67s/it][A
Training...:  43% 6045/13907 [3:44:58<3:32:24,  1.62s/it][A
Training...:  43% 6046/13907 [3:44:59<3:26:22,  1.58s/it][A
Training...:  43% 6047/13907 [3:45:01<3:19:19,  1.52s/it][A
Training...:  43% 6048/13907 [3:45:02<3:11:15,  1.46s/it][A
Training...:  43% 6049/13907 [3:45:03<3:01:51,  1.39s/it][A
Training...:  44% 6050/13907 [3:45:04<2:48:43,  1.29s/it][A
Training...:  44% 6051/13907 [3:45:08<4:24:21,  2.02s/it][A
Training...:  44% 6052/13907 [3:45:12<5:21:11,  2.45s/it][A
Training...:  44% 6053/13907 [3:45:15<5:51:15,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:15:50<8:52:18, 31938.93s/it]
Training...:  44% 6053/13907 [3:45:18<5:51:15,  2.68s/it][A
Training...:  44% 6054/13907 [3:45:18<6:26:00,  2.95s/it][A
Training...:  44% 6055/13907 [3:45:21<6:32:40,  3.00s/it][A
Training...:  44% 6056/13907 [3:45:24<6:30:17,  2.98s/it][A
Training...:  44% 6057/13907 [3:45:27<6:26:42,  2.96s/it][A
Training...:  44% 6058/13907 [3:45:30<6:20:45,  2.91s/it][A
Training...:  44% 6059/13907 [3:45:33<6:15:46,  2.87s/it][A
Training...:  44% 6060/13907 [3:45:36<6:11:09,  2.84s/it][A
Training...:  44% 6061/13907 [3:45:38<6:07:39,  2.81s/it][A
Training...:  44% 6062/13907 [3:45:41<6:03:19,  2.78s/it][A
Training...:  44% 6063/13907 [3:45:44<5:58:08,  2.74s/it][A
Training...:  44% 6064/13907 [3:45:46<5:54:14,  2.71s/it][A
Training...:  44% 6065/13907 [3:45:49<5:49:05,  2.67s/it][A
Training...:  44% 6066/13907 [3:45:52<5:45:02,  2.64s/it][A
Training...:  44% 6067/13907 [3:45:54<5:40:03,  2.60s/it][A
Training...:  44% 6068/13907 [3:45:57<5:35:17,  2.57s/it][A
Training...:  44% 6069/13907 [3:45:59<5:30:50,  2.53s/it][A
Training...:  44% 6070/13907 [3:46:01<5:27:11,  2.51s/it][A
Training...:  44% 6071/13907 [3:46:04<5:22:50,  2.47s/it][A
Training...:  44% 6072/13907 [3:46:06<5:18:37,  2.44s/it][A
Training...:  44% 6073/13907 [3:46:09<5:14:37,  2.41s/it][A
Training...:  44% 6074/13907 [3:46:11<5:09:45,  2.37s/it][A
Training...:  44% 6075/13907 [3:46:13<5:06:19,  2.35s/it][A
Training...:  44% 6076/13907 [3:46:15<5:00:46,  2.30s/it][A
Training...:  44% 6077/13907 [3:46:18<4:57:47,  2.28s/it][A
Training...:  44% 6078/13907 [3:46:20<4:52:42,  2.24s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:16:54<8:52:18, 31938.93s/it]
Training...:  44% 6078/13907 [3:46:22<4:52:42,  2.24s/it][A
Training...:  44% 6079/13907 [3:46:22<5:03:03,  2.32s/it][A
Training...:  44% 6080/13907 [3:46:24<4:54:12,  2.26s/it][A
Training...:  44% 6081/13907 [3:46:26<4:46:46,  2.20s/it][A
Training...:  44% 6082/13907 [3:46:28<4:37:37,  2.13s/it][A
Training...:  44% 6083/13907 [3:46:30<4:30:58,  2.08s/it][A
Training...:  44% 6084/13907 [3:46:32<4:23:58,  2.02s/it][A
Training...:  44% 6085/13907 [3:46:34<4:17:30,  1.98s/it][A
Training...:  44% 6086/13907 [3:46:36<4:12:01,  1.93s/it][A
Training...:  44% 6087/13907 [3:46:38<4:06:41,  1.89s/it][A
Training...:  44% 6088/13907 [3:46:39<4:01:51,  1.86s/it][A
Training...:  44% 6089/13907 [3:46:41<3:56:53,  1.82s/it][A
Training...:  44% 6090/13907 [3:46:43<3:51:28,  1.78s/it][A
Training...:  44% 6091/13907 [3:46:45<3:47:09,  1.74s/it][A
Training...:  44% 6092/13907 [3:46:46<3:42:13,  1.71s/it][A
Training...:  44% 6093/13907 [3:46:48<3:37:18,  1.67s/it][A
Training...:  44% 6094/13907 [3:46:49<3:33:00,  1.64s/it][A
Training...:  44% 6095/13907 [3:46:51<3:27:19,  1.59s/it][A
Training...:  44% 6096/13907 [3:46:52<3:21:26,  1.55s/it][A
Training...:  44% 6097/13907 [3:46:54<3:15:07,  1.50s/it][A
Training...:  44% 6098/13907 [3:46:55<3:08:23,  1.45s/it][A
Training...:  44% 6099/13907 [3:46:56<3:00:41,  1.39s/it][A
Training...:  44% 6100/13907 [3:46:57<2:47:45,  1.29s/it][A
Training...:  44% 6101/13907 [3:47:01<4:19:44,  2.00s/it][A
Training...:  44% 6102/13907 [3:47:04<5:17:29,  2.44s/it][A
Training...:  44% 6103/13907 [3:47:08<5:46:13,  2.66s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:17:43<8:52:18, 31938.93s/it]
Training...:  44% 6103/13907 [3:47:11<5:46:13,  2.66s/it][A
Training...:  44% 6104/13907 [3:47:11<6:20:44,  2.93s/it][A
Training...:  44% 6105/13907 [3:47:14<6:26:29,  2.97s/it][A
Training...:  44% 6106/13907 [3:47:17<6:23:49,  2.95s/it][A
Training...:  44% 6107/13907 [3:47:20<6:20:39,  2.93s/it][A
Training...:  44% 6108/13907 [3:47:23<6:15:00,  2.89s/it][A
Training...:  44% 6109/13907 [3:47:26<6:11:11,  2.86s/it][A
Training...:  44% 6110/13907 [3:47:28<6:07:57,  2.83s/it][A
Training...:  44% 6111/13907 [3:47:31<6:02:27,  2.79s/it][A
Training...:  44% 6112/13907 [3:47:34<5:58:49,  2.76s/it][A
Training...:  44% 6113/13907 [3:47:36<5:53:46,  2.72s/it][A
Training...:  44% 6114/13907 [3:47:39<5:46:25,  2.67s/it][A
Training...:  44% 6115/13907 [3:47:41<5:41:08,  2.63s/it][A
Training...:  44% 6116/13907 [3:47:44<5:36:26,  2.59s/it][A
Training...:  44% 6117/13907 [3:47:46<5:34:50,  2.58s/it][A
Training...:  44% 6118/13907 [3:47:49<5:33:12,  2.57s/it][A
Training...:  44% 6119/13907 [3:47:51<5:29:02,  2.54s/it][A
Training...:  44% 6120/13907 [3:47:54<5:23:41,  2.49s/it][A
Training...:  44% 6121/13907 [3:47:56<5:19:30,  2.46s/it][A
Training...:  44% 6122/13907 [3:47:59<5:16:00,  2.44s/it][A
Training...:  44% 6123/13907 [3:48:01<5:10:29,  2.39s/it][A
Training...:  44% 6124/13907 [3:48:03<5:05:55,  2.36s/it][A
Training...:  44% 6125/13907 [3:48:05<5:01:02,  2.32s/it][A
Training...:  44% 6126/13907 [3:48:08<4:55:55,  2.28s/it][A
Training...:  44% 6127/13907 [3:48:10<4:51:32,  2.25s/it][A
Training...:  44% 6128/13907 [3:48:12<4:46:31,  2.21s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:18:46<8:52:18, 31938.93s/it]
Training...:  44% 6128/13907 [3:48:14<4:46:31,  2.21s/it][A
Training...:  44% 6129/13907 [3:48:14<4:54:54,  2.27s/it][A
Training...:  44% 6130/13907 [3:48:16<4:47:37,  2.22s/it][A
Training...:  44% 6131/13907 [3:48:18<4:38:19,  2.15s/it][A
Training...:  44% 6132/13907 [3:48:20<4:30:45,  2.09s/it][A
Training...:  44% 6133/13907 [3:48:22<4:24:32,  2.04s/it][A
Training...:  44% 6134/13907 [3:48:24<4:19:45,  2.01s/it][A
Training...:  44% 6135/13907 [3:48:26<4:14:00,  1.96s/it][A
Training...:  44% 6136/13907 [3:48:28<4:09:49,  1.93s/it][A
Training...:  44% 6137/13907 [3:48:30<4:05:32,  1.90s/it][A
Training...:  44% 6138/13907 [3:48:32<4:01:18,  1.86s/it][A
Training...:  44% 6139/13907 [3:48:33<3:56:34,  1.83s/it][A
Training...:  44% 6140/13907 [3:48:35<3:53:05,  1.80s/it][A
Training...:  44% 6141/13907 [3:48:37<3:48:03,  1.76s/it][A
Training...:  44% 6142/13907 [3:48:38<3:42:50,  1.72s/it][A
Training...:  44% 6143/13907 [3:48:40<3:38:44,  1.69s/it][A
Training...:  44% 6144/13907 [3:48:41<3:33:51,  1.65s/it][A
Training...:  44% 6145/13907 [3:48:43<3:27:42,  1.61s/it][A
Training...:  44% 6146/13907 [3:48:44<3:22:59,  1.57s/it][A
Training...:  44% 6147/13907 [3:48:46<3:16:53,  1.52s/it][A
Training...:  44% 6148/13907 [3:48:47<3:09:47,  1.47s/it][A
Training...:  44% 6149/13907 [3:48:48<3:00:16,  1.39s/it][A
Training...:  44% 6150/13907 [3:48:50<2:48:10,  1.30s/it][A
Training...:  44% 6151/13907 [3:48:53<4:25:11,  2.05s/it][A
Training...:  44% 6152/13907 [3:48:57<5:22:32,  2.50s/it][A
Training...:  44% 6153/13907 [3:49:00<5:52:03,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:19:36<8:52:18, 31938.93s/it]
Training...:  44% 6153/13907 [3:49:04<5:52:03,  2.72s/it][A
Training...:  44% 6154/13907 [3:49:04<6:27:19,  3.00s/it][A
Training...:  44% 6155/13907 [3:49:07<6:33:29,  3.05s/it][A
Training...:  44% 6156/13907 [3:49:10<6:29:13,  3.01s/it][A
Training...:  44% 6157/13907 [3:49:13<6:23:57,  2.97s/it][A
Training...:  44% 6158/13907 [3:49:16<6:17:26,  2.92s/it][A
Training...:  44% 6159/13907 [3:49:18<6:11:30,  2.88s/it][A
Training...:  44% 6160/13907 [3:49:21<6:05:19,  2.83s/it][A
Training...:  44% 6161/13907 [3:49:24<6:00:30,  2.79s/it][A
Training...:  44% 6162/13907 [3:49:26<5:54:17,  2.74s/it][A
Training...:  44% 6163/13907 [3:49:29<5:49:13,  2.71s/it][A
Training...:  44% 6164/13907 [3:49:32<5:43:23,  2.66s/it][A
Training...:  44% 6165/13907 [3:49:34<5:37:57,  2.62s/it][A
Training...:  44% 6166/13907 [3:49:37<5:33:08,  2.58s/it][A
Training...:  44% 6167/13907 [3:49:39<5:28:02,  2.54s/it][A
Training...:  44% 6168/13907 [3:49:41<5:26:00,  2.53s/it][A
Training...:  44% 6169/13907 [3:49:44<5:22:15,  2.50s/it][A
Training...:  44% 6170/13907 [3:49:46<5:16:06,  2.45s/it][A
Training...:  44% 6171/13907 [3:49:49<5:10:50,  2.41s/it][A
Training...:  44% 6172/13907 [3:49:51<5:06:36,  2.38s/it][A
Training...:  44% 6173/13907 [3:49:53<5:01:19,  2.34s/it][A
Training...:  44% 6174/13907 [3:49:55<4:56:33,  2.30s/it][A
Training...:  44% 6175/13907 [3:49:57<4:50:57,  2.26s/it][A
Training...:  44% 6176/13907 [3:50:00<4:47:21,  2.23s/it][A
Training...:  44% 6177/13907 [3:50:02<4:42:31,  2.19s/it][A
Training...:  44% 6178/13907 [3:50:04<4:38:20,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:20:38<8:52:18, 31938.93s/it]
Training...:  44% 6178/13907 [3:50:06<4:38:20,  2.16s/it][A
Training...:  44% 6179/13907 [3:50:06<4:46:28,  2.22s/it][A
Training...:  44% 6180/13907 [3:50:08<4:41:59,  2.19s/it][A
Training...:  44% 6181/13907 [3:50:10<4:35:52,  2.14s/it][A
Training...:  44% 6182/13907 [3:50:12<4:29:22,  2.09s/it][A
Training...:  44% 6183/13907 [3:50:14<4:23:33,  2.05s/it][A
Training...:  44% 6184/13907 [3:50:16<4:18:16,  2.01s/it][A
Training...:  44% 6185/13907 [3:50:18<4:12:56,  1.97s/it][A
Training...:  44% 6186/13907 [3:50:20<4:07:57,  1.93s/it][A
Training...:  44% 6187/13907 [3:50:22<4:04:17,  1.90s/it][A
Training...:  44% 6188/13907 [3:50:24<4:00:01,  1.87s/it][A
Training...:  45% 6189/13907 [3:50:25<3:55:47,  1.83s/it][A
Training...:  45% 6190/13907 [3:50:27<3:50:27,  1.79s/it][A
Training...:  45% 6191/13907 [3:50:29<3:45:54,  1.76s/it][A
Training...:  45% 6192/13907 [3:50:30<3:41:23,  1.72s/it][A
Training...:  45% 6193/13907 [3:50:32<3:36:25,  1.68s/it][A
Training...:  45% 6194/13907 [3:50:33<3:31:06,  1.64s/it][A
Training...:  45% 6195/13907 [3:50:35<3:25:19,  1.60s/it][A
Training...:  45% 6196/13907 [3:50:36<3:19:54,  1.56s/it][A
Training...:  45% 6197/13907 [3:50:38<3:13:48,  1.51s/it][A
Training...:  45% 6198/13907 [3:50:39<3:06:32,  1.45s/it][A
Training...:  45% 6199/13907 [3:50:40<2:57:48,  1.38s/it][A
Training...:  45% 6200/13907 [3:50:41<2:45:52,  1.29s/it][A
Training...:  45% 6201/13907 [3:50:45<4:19:20,  2.02s/it][A
Training...:  45% 6202/13907 [3:50:49<5:19:50,  2.49s/it][A
Training...:  45% 6203/13907 [3:50:52<5:49:27,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:21:28<8:52:18, 31938.93s/it]
Training...:  45% 6203/13907 [3:50:56<5:49:27,  2.72s/it][A
Training...:  45% 6204/13907 [3:50:56<6:23:37,  2.99s/it][A
Training...:  45% 6205/13907 [3:50:59<6:28:48,  3.03s/it][A
Training...:  45% 6206/13907 [3:51:02<6:25:30,  3.00s/it][A
Training...:  45% 6207/13907 [3:51:05<6:21:27,  2.97s/it][A
Training...:  45% 6208/13907 [3:51:07<6:17:46,  2.94s/it][A
Training...:  45% 6209/13907 [3:51:10<6:09:53,  2.88s/it][A
Training...:  45% 6210/13907 [3:51:13<6:02:26,  2.83s/it][A
Training...:  45% 6211/13907 [3:51:15<5:55:13,  2.77s/it][A
Training...:  45% 6212/13907 [3:51:18<5:48:21,  2.72s/it][A
Training...:  45% 6213/13907 [3:51:21<5:41:45,  2.67s/it][A
Training...:  45% 6214/13907 [3:51:23<5:34:52,  2.61s/it][A
Training...:  45% 6215/13907 [3:51:26<5:29:31,  2.57s/it][A
Training...:  45% 6216/13907 [3:51:28<5:25:01,  2.54s/it][A
Training...:  45% 6217/13907 [3:51:30<5:20:01,  2.50s/it][A
Training...:  45% 6218/13907 [3:51:33<5:16:50,  2.47s/it][A
Training...:  45% 6219/13907 [3:51:35<5:12:41,  2.44s/it][A
Training...:  45% 6220/13907 [3:51:38<5:08:18,  2.41s/it][A
Training...:  45% 6221/13907 [3:51:40<5:04:14,  2.38s/it][A
Training...:  45% 6222/13907 [3:51:42<4:59:45,  2.34s/it][A
Training...:  45% 6223/13907 [3:51:44<4:55:36,  2.31s/it][A
Training...:  45% 6224/13907 [3:51:47<4:50:49,  2.27s/it][A
Training...:  45% 6225/13907 [3:51:49<4:46:30,  2.24s/it][A
Training...:  45% 6226/13907 [3:51:51<4:42:42,  2.21s/it][A
Training...:  45% 6227/13907 [3:51:53<4:38:54,  2.18s/it][A
Training...:  45% 6228/13907 [3:51:55<4:37:04,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:22:30<8:52:18, 31938.93s/it]
Training...:  45% 6228/13907 [3:51:58<4:37:04,  2.16s/it][A
Training...:  45% 6229/13907 [3:51:58<4:47:06,  2.24s/it][A
Training...:  45% 6230/13907 [3:52:00<4:41:34,  2.20s/it][A
Training...:  45% 6231/13907 [3:52:02<4:34:18,  2.14s/it][A
Training...:  45% 6232/13907 [3:52:04<4:27:21,  2.09s/it][A
Training...:  45% 6233/13907 [3:52:06<4:21:14,  2.04s/it][A
Training...:  45% 6234/13907 [3:52:07<4:15:30,  2.00s/it][A
Training...:  45% 6235/13907 [3:52:09<4:10:16,  1.96s/it][A
Training...:  45% 6236/13907 [3:52:11<4:05:20,  1.92s/it][A
Training...:  45% 6237/13907 [3:52:13<4:00:37,  1.88s/it][A
Training...:  45% 6238/13907 [3:52:15<3:56:13,  1.85s/it][A
Training...:  45% 6239/13907 [3:52:16<3:51:21,  1.81s/it][A
Training...:  45% 6240/13907 [3:52:18<3:46:54,  1.78s/it][A
Training...:  45% 6241/13907 [3:52:20<3:42:20,  1.74s/it][A
Training...:  45% 6242/13907 [3:52:21<3:37:38,  1.70s/it][A
Training...:  45% 6243/13907 [3:52:23<3:32:33,  1.66s/it][A
Training...:  45% 6244/13907 [3:52:24<3:28:02,  1.63s/it][A
Training...:  45% 6245/13907 [3:52:26<3:22:25,  1.59s/it][A
Training...:  45% 6246/13907 [3:52:27<3:15:47,  1.53s/it][A
Training...:  45% 6247/13907 [3:52:29<3:09:05,  1.48s/it][A
Training...:  45% 6248/13907 [3:52:30<3:02:19,  1.43s/it][A
Training...:  45% 6249/13907 [3:52:31<2:54:08,  1.36s/it][A
Training...:  45% 6250/13907 [3:52:32<2:41:53,  1.27s/it][A
Training...:  45% 6251/13907 [3:52:36<4:18:09,  2.02s/it][A
Training...:  45% 6252/13907 [3:52:40<5:14:19,  2.46s/it][A
Training...:  45% 6253/13907 [3:52:43<5:45:32,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:23:19<8:52:18, 31938.93s/it]
Training...:  45% 6253/13907 [3:52:46<5:45:32,  2.71s/it][A
Training...:  45% 6254/13907 [3:52:46<6:21:01,  2.99s/it][A
Training...:  45% 6255/13907 [3:52:50<6:28:23,  3.05s/it][A
Training...:  45% 6256/13907 [3:52:53<6:27:40,  3.04s/it][A
Training...:  45% 6257/13907 [3:52:56<6:24:26,  3.02s/it][A
Training...:  45% 6258/13907 [3:52:59<6:20:16,  2.98s/it][A
Training...:  45% 6259/13907 [3:53:01<6:12:39,  2.92s/it][A
Training...:  45% 6260/13907 [3:53:04<6:04:43,  2.86s/it][A
Training...:  45% 6261/13907 [3:53:07<5:57:13,  2.80s/it][A
Training...:  45% 6262/13907 [3:53:09<5:51:27,  2.76s/it][A
Training...:  45% 6263/13907 [3:53:12<5:44:46,  2.71s/it][A
Training...:  45% 6264/13907 [3:53:15<5:38:52,  2.66s/it][A
Training...:  45% 6265/13907 [3:53:17<5:35:22,  2.63s/it][A
Training...:  45% 6266/13907 [3:53:20<5:31:36,  2.60s/it][A
Training...:  45% 6267/13907 [3:53:22<5:25:30,  2.56s/it][A
Training...:  45% 6268/13907 [3:53:24<5:18:50,  2.50s/it][A
Training...:  45% 6269/13907 [3:53:27<5:12:56,  2.46s/it][A
Training...:  45% 6270/13907 [3:53:29<5:08:17,  2.42s/it][A
Training...:  45% 6271/13907 [3:53:31<5:03:54,  2.39s/it][A
Training...:  45% 6272/13907 [3:53:34<4:59:42,  2.36s/it][A
Training...:  45% 6273/13907 [3:53:36<4:56:38,  2.33s/it][A
Training...:  45% 6274/13907 [3:53:38<4:52:26,  2.30s/it][A
Training...:  45% 6275/13907 [3:53:40<4:47:58,  2.26s/it][A
Training...:  45% 6276/13907 [3:53:43<4:43:00,  2.23s/it][A
Training...:  45% 6277/13907 [3:53:45<4:39:17,  2.20s/it][A
Training...:  45% 6278/13907 [3:53:47<4:35:08,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:24:21<8:52:18, 31938.93s/it]
Training...:  45% 6278/13907 [3:53:49<4:35:08,  2.16s/it][A
Training...:  45% 6279/13907 [3:53:49<4:43:34,  2.23s/it][A
Training...:  45% 6280/13907 [3:53:51<4:38:24,  2.19s/it][A
Training...:  45% 6281/13907 [3:53:53<4:31:13,  2.13s/it][A
Training...:  45% 6282/13907 [3:53:55<4:27:11,  2.10s/it][A
Training...:  45% 6283/13907 [3:53:57<4:21:23,  2.06s/it][A
Training...:  45% 6284/13907 [3:53:59<4:15:40,  2.01s/it][A
Training...:  45% 6285/13907 [3:54:01<4:11:14,  1.98s/it][A
Training...:  45% 6286/13907 [3:54:03<4:06:26,  1.94s/it][A
Training...:  45% 6287/13907 [3:54:05<4:02:57,  1.91s/it][A
Training...:  45% 6288/13907 [3:54:07<3:58:05,  1.88s/it][A
Training...:  45% 6289/13907 [3:54:08<3:54:08,  1.84s/it][A
Training...:  45% 6290/13907 [3:54:10<3:49:38,  1.81s/it][A
Training...:  45% 6291/13907 [3:54:12<3:46:04,  1.78s/it][A
Training...:  45% 6292/13907 [3:54:13<3:41:32,  1.75s/it][A
Training...:  45% 6293/13907 [3:54:15<3:37:42,  1.72s/it][A
Training...:  45% 6294/13907 [3:54:17<3:33:04,  1.68s/it][A
Training...:  45% 6295/13907 [3:54:18<3:27:39,  1.64s/it][A
Training...:  45% 6296/13907 [3:54:20<3:22:11,  1.59s/it][A
Training...:  45% 6297/13907 [3:54:21<3:14:04,  1.53s/it][A
Training...:  45% 6298/13907 [3:54:22<3:05:36,  1.46s/it][A
Training...:  45% 6299/13907 [3:54:24<2:56:37,  1.39s/it][A
Training...:  45% 6300/13907 [3:54:25<2:43:59,  1.29s/it][A
Training...:  45% 6301/13907 [3:54:28<4:15:35,  2.02s/it][A
Training...:  45% 6302/13907 [3:54:32<5:11:33,  2.46s/it][A
Training...:  45% 6303/13907 [3:54:35<5:42:49,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:25:11<8:52:18, 31938.93s/it]
Training...:  45% 6303/13907 [3:54:39<5:42:49,  2.71s/it][A
Training...:  45% 6304/13907 [3:54:39<6:18:15,  2.99s/it][A
Training...:  45% 6305/13907 [3:54:42<6:25:23,  3.04s/it][A
Training...:  45% 6306/13907 [3:54:45<6:21:56,  3.01s/it][A
Training...:  45% 6307/13907 [3:54:48<6:17:35,  2.98s/it][A
Training...:  45% 6308/13907 [3:54:51<6:11:05,  2.93s/it][A
Training...:  45% 6309/13907 [3:54:53<6:04:43,  2.88s/it][A
Training...:  45% 6310/13907 [3:54:56<5:59:18,  2.84s/it][A
Training...:  45% 6311/13907 [3:54:59<5:53:03,  2.79s/it][A
Training...:  45% 6312/13907 [3:55:01<5:45:31,  2.73s/it][A
Training...:  45% 6313/13907 [3:55:04<5:39:55,  2.69s/it][A
Training...:  45% 6314/13907 [3:55:07<5:36:02,  2.66s/it][A
Training...:  45% 6315/13907 [3:55:09<5:30:17,  2.61s/it][A
Training...:  45% 6316/13907 [3:55:12<5:26:48,  2.58s/it][A
Training...:  45% 6317/13907 [3:55:14<5:22:48,  2.55s/it][A
Training...:  45% 6318/13907 [3:55:16<5:16:37,  2.50s/it][A
Training...:  45% 6319/13907 [3:55:19<5:11:58,  2.47s/it][A
Training...:  45% 6320/13907 [3:55:21<5:06:08,  2.42s/it][A
Training...:  45% 6321/13907 [3:55:23<5:02:23,  2.39s/it][A
Training...:  45% 6322/13907 [3:55:26<4:57:31,  2.35s/it][A
Training...:  45% 6323/13907 [3:55:28<4:52:30,  2.31s/it][A
Training...:  45% 6324/13907 [3:55:30<4:48:17,  2.28s/it][A
Training...:  45% 6325/13907 [3:55:32<4:44:04,  2.25s/it][A
Training...:  45% 6326/13907 [3:55:34<4:39:39,  2.21s/it][A
Training...:  45% 6327/13907 [3:55:37<4:36:18,  2.19s/it][A
Training...:  46% 6328/13907 [3:55:39<4:31:55,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:26:13<8:52:18, 31938.93s/it]
Training...:  46% 6328/13907 [3:55:41<4:31:55,  2.15s/it][A
Training...:  46% 6329/13907 [3:55:41<4:40:03,  2.22s/it][A
Training...:  46% 6330/13907 [3:55:43<4:35:37,  2.18s/it][A
Training...:  46% 6331/13907 [3:55:45<4:28:07,  2.12s/it][A
Training...:  46% 6332/13907 [3:55:47<4:21:25,  2.07s/it][A
Training...:  46% 6333/13907 [3:55:49<4:16:45,  2.03s/it][A
Training...:  46% 6334/13907 [3:55:51<4:11:24,  1.99s/it][A
Training...:  46% 6335/13907 [3:55:53<4:06:44,  1.96s/it][A
Training...:  46% 6336/13907 [3:55:55<4:01:39,  1.92s/it][A
Training...:  46% 6337/13907 [3:55:56<3:57:52,  1.89s/it][A
Training...:  46% 6338/13907 [3:55:58<3:54:04,  1.86s/it][A
Training...:  46% 6339/13907 [3:56:00<3:49:19,  1.82s/it][A
Training...:  46% 6340/13907 [3:56:02<3:45:00,  1.78s/it][A
Training...:  46% 6341/13907 [3:56:03<3:41:30,  1.76s/it][A
Training...:  46% 6342/13907 [3:56:05<3:37:07,  1.72s/it][A
Training...:  46% 6343/13907 [3:56:07<3:33:29,  1.69s/it][A
Training...:  46% 6344/13907 [3:56:08<3:28:49,  1.66s/it][A
Training...:  46% 6345/13907 [3:56:10<3:23:39,  1.62s/it][A
Training...:  46% 6346/13907 [3:56:11<3:17:31,  1.57s/it][A
Training...:  46% 6347/13907 [3:56:13<3:10:47,  1.51s/it][A
Training...:  46% 6348/13907 [3:56:14<3:03:41,  1.46s/it][A
Training...:  46% 6349/13907 [3:56:15<2:54:29,  1.39s/it][A
Training...:  46% 6350/13907 [3:56:16<2:40:34,  1.27s/it][A
Training...:  46% 6351/13907 [3:56:20<4:13:25,  2.01s/it][A
Training...:  46% 6352/13907 [3:56:23<5:09:02,  2.45s/it][A
Training...:  46% 6353/13907 [3:56:27<5:37:25,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:27:02<8:52:18, 31938.93s/it]
Training...:  46% 6353/13907 [3:56:30<5:37:25,  2.68s/it][A
Training...:  46% 6354/13907 [3:56:30<6:11:06,  2.95s/it][A
Training...:  46% 6355/13907 [3:56:33<6:18:33,  3.01s/it][A
Training...:  46% 6356/13907 [3:56:36<6:19:32,  3.02s/it][A
Training...:  46% 6357/13907 [3:56:39<6:16:45,  2.99s/it][A
Training...:  46% 6358/13907 [3:56:42<6:10:37,  2.95s/it][A
Training...:  46% 6359/13907 [3:56:45<6:03:46,  2.89s/it][A
Training...:  46% 6360/13907 [3:56:48<5:56:56,  2.84s/it][A
Training...:  46% 6361/13907 [3:56:50<5:51:38,  2.80s/it][A
Training...:  46% 6362/13907 [3:56:53<5:46:13,  2.75s/it][A
Training...:  46% 6363/13907 [3:56:55<5:40:45,  2.71s/it][A
Training...:  46% 6364/13907 [3:56:58<5:35:06,  2.67s/it][A
Training...:  46% 6365/13907 [3:57:01<5:29:14,  2.62s/it][A
Training...:  46% 6366/13907 [3:57:03<5:22:47,  2.57s/it][A
Training...:  46% 6367/13907 [3:57:05<5:17:07,  2.52s/it][A
Training...:  46% 6368/13907 [3:57:08<5:11:50,  2.48s/it][A
Training...:  46% 6369/13907 [3:57:10<5:06:41,  2.44s/it][A
Training...:  46% 6370/13907 [3:57:12<5:02:32,  2.41s/it][A
Training...:  46% 6371/13907 [3:57:15<4:58:45,  2.38s/it][A
Training...:  46% 6372/13907 [3:57:17<4:54:38,  2.35s/it][A
Training...:  46% 6373/13907 [3:57:19<4:50:41,  2.32s/it][A
Training...:  46% 6374/13907 [3:57:22<4:46:15,  2.28s/it][A
Training...:  46% 6375/13907 [3:57:24<4:41:20,  2.24s/it][A
Training...:  46% 6376/13907 [3:57:26<4:37:03,  2.21s/it][A
Training...:  46% 6377/13907 [3:57:28<4:32:48,  2.17s/it][A
Training...:  46% 6378/13907 [3:57:30<4:28:10,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:28:04<8:52:18, 31938.93s/it]
Training...:  46% 6378/13907 [3:57:32<4:28:10,  2.14s/it][A
Training...:  46% 6379/13907 [3:57:32<4:36:31,  2.20s/it][A
Training...:  46% 6380/13907 [3:57:34<4:32:17,  2.17s/it][A
Training...:  46% 6381/13907 [3:57:36<4:25:30,  2.12s/it][A
Training...:  46% 6382/13907 [3:57:38<4:19:52,  2.07s/it][A
Training...:  46% 6383/13907 [3:57:40<4:14:20,  2.03s/it][A
Training...:  46% 6384/13907 [3:57:42<4:08:10,  1.98s/it][A
Training...:  46% 6385/13907 [3:57:44<4:04:47,  1.95s/it][A
Training...:  46% 6386/13907 [3:57:46<4:00:45,  1.92s/it][A
Training...:  46% 6387/13907 [3:57:48<3:55:31,  1.88s/it][A
Training...:  46% 6388/13907 [3:57:49<3:51:16,  1.85s/it][A
Training...:  46% 6389/13907 [3:57:51<3:47:06,  1.81s/it][A
Training...:  46% 6390/13907 [3:57:53<3:42:10,  1.77s/it][A
Training...:  46% 6391/13907 [3:57:54<3:37:39,  1.74s/it][A
Training...:  46% 6392/13907 [3:57:56<3:33:20,  1.70s/it][A
Training...:  46% 6393/13907 [3:57:58<3:28:54,  1.67s/it][A
Training...:  46% 6394/13907 [3:57:59<3:25:00,  1.64s/it][A
Training...:  46% 6395/13907 [3:58:01<3:19:41,  1.59s/it][A
Training...:  46% 6396/13907 [3:58:02<3:13:51,  1.55s/it][A
Training...:  46% 6397/13907 [3:58:04<3:07:37,  1.50s/it][A
Training...:  46% 6398/13907 [3:58:05<3:01:06,  1.45s/it][A
Training...:  46% 6399/13907 [3:58:06<2:53:48,  1.39s/it][A
Training...:  46% 6400/13907 [3:58:07<2:42:17,  1.30s/it][A
Training...:  46% 6401/13907 [3:58:11<4:19:35,  2.08s/it][A
Training...:  46% 6402/13907 [3:58:15<5:13:48,  2.51s/it][A
Training...:  46% 6403/13907 [3:58:18<5:44:50,  2.76s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:28:54<8:52:18, 31938.93s/it]
Training...:  46% 6403/13907 [3:58:22<5:44:50,  2.76s/it][A
Training...:  46% 6404/13907 [3:58:22<6:17:02,  3.02s/it][A
Training...:  46% 6405/13907 [3:58:25<6:22:35,  3.06s/it][A
Training...:  46% 6406/13907 [3:58:28<6:18:39,  3.03s/it][A
Training...:  46% 6407/13907 [3:58:31<6:13:31,  2.99s/it][A
Training...:  46% 6408/13907 [3:58:33<6:08:30,  2.95s/it][A
Training...:  46% 6409/13907 [3:58:36<6:02:42,  2.90s/it][A
Training...:  46% 6410/13907 [3:58:39<5:56:43,  2.85s/it][A
Training...:  46% 6411/13907 [3:58:42<5:49:47,  2.80s/it][A
Training...:  46% 6412/13907 [3:58:44<5:43:56,  2.75s/it][A
Training...:  46% 6413/13907 [3:58:47<5:40:31,  2.73s/it][A
Training...:  46% 6414/13907 [3:58:50<5:33:40,  2.67s/it][A
Training...:  46% 6415/13907 [3:58:52<5:28:09,  2.63s/it][A
Training...:  46% 6416/13907 [3:58:55<5:21:38,  2.58s/it][A
Training...:  46% 6417/13907 [3:58:57<5:17:16,  2.54s/it][A
Training...:  46% 6418/13907 [3:58:59<5:11:34,  2.50s/it][A
Training...:  46% 6419/13907 [3:59:02<5:06:27,  2.46s/it][A
Training...:  46% 6420/13907 [3:59:04<5:02:38,  2.43s/it][A
Training...:  46% 6421/13907 [3:59:06<4:58:09,  2.39s/it][A
Training...:  46% 6422/13907 [3:59:09<4:53:44,  2.35s/it][A
Training...:  46% 6423/13907 [3:59:11<4:49:48,  2.32s/it][A
Training...:  46% 6424/13907 [3:59:13<4:45:14,  2.29s/it][A
Training...:  46% 6425/13907 [3:59:15<4:41:03,  2.25s/it][A
Training...:  46% 6426/13907 [3:59:17<4:36:57,  2.22s/it][A
Training...:  46% 6427/13907 [3:59:20<4:33:07,  2.19s/it][A
Training...:  46% 6428/13907 [3:59:22<4:29:35,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:29:56<8:52:18, 31938.93s/it]
Training...:  46% 6428/13907 [3:59:24<4:29:35,  2.16s/it][A
Training...:  46% 6429/13907 [3:59:24<4:37:36,  2.23s/it][A
Training...:  46% 6430/13907 [3:59:26<4:33:03,  2.19s/it][A
Training...:  46% 6431/13907 [3:59:28<4:26:29,  2.14s/it][A
Training...:  46% 6432/13907 [3:59:30<4:20:26,  2.09s/it][A
Training...:  46% 6433/13907 [3:59:32<4:15:14,  2.05s/it][A
Training...:  46% 6434/13907 [3:59:34<4:10:51,  2.01s/it][A
Training...:  46% 6435/13907 [3:59:36<4:06:16,  1.98s/it][A
Training...:  46% 6436/13907 [3:59:38<4:02:07,  1.94s/it][A
Training...:  46% 6437/13907 [3:59:40<3:58:38,  1.92s/it][A
Training...:  46% 6438/13907 [3:59:41<3:54:06,  1.88s/it][A
Training...:  46% 6439/13907 [3:59:43<3:49:48,  1.85s/it][A
Training...:  46% 6440/13907 [3:59:45<3:44:43,  1.81s/it][A
Training...:  46% 6441/13907 [3:59:47<3:40:29,  1.77s/it][A
Training...:  46% 6442/13907 [3:59:48<3:37:16,  1.75s/it][A
Training...:  46% 6443/13907 [3:59:50<3:33:09,  1.71s/it][A
Training...:  46% 6444/13907 [3:59:52<3:28:42,  1.68s/it][A
Training...:  46% 6445/13907 [3:59:53<3:22:16,  1.63s/it][A
Training...:  46% 6446/13907 [3:59:54<3:16:10,  1.58s/it][A
Training...:  46% 6447/13907 [3:59:56<3:09:34,  1.52s/it][A
Training...:  46% 6448/13907 [3:59:57<3:01:43,  1.46s/it][A
Training...:  46% 6449/13907 [3:59:58<2:53:18,  1.39s/it][A
Training...:  46% 6450/13907 [4:00:00<2:42:23,  1.31s/it][A
Training...:  46% 6451/13907 [4:00:03<4:12:56,  2.04s/it][A
Training...:  46% 6452/13907 [4:00:07<5:08:17,  2.48s/it][A
Training...:  46% 6453/13907 [4:00:10<5:37:49,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:30:46<8:52:18, 31938.93s/it]
Training...:  46% 6453/13907 [4:00:14<5:37:49,  2.72s/it][A
Training...:  46% 6454/13907 [4:00:14<6:11:25,  2.99s/it][A
Training...:  46% 6455/13907 [4:00:17<6:17:09,  3.04s/it][A
Training...:  46% 6456/13907 [4:00:20<6:14:40,  3.02s/it][A
Training...:  46% 6457/13907 [4:00:23<6:09:52,  2.98s/it][A
Training...:  46% 6458/13907 [4:00:26<6:04:39,  2.94s/it][A
Training...:  46% 6459/13907 [4:00:28<5:59:05,  2.89s/it][A
Training...:  46% 6460/13907 [4:00:31<5:53:35,  2.85s/it][A
Training...:  46% 6461/13907 [4:00:34<5:48:29,  2.81s/it][A
Training...:  46% 6462/13907 [4:00:36<5:42:06,  2.76s/it][A
Training...:  46% 6463/13907 [4:00:39<5:36:10,  2.71s/it][A
Training...:  46% 6464/13907 [4:00:42<5:31:51,  2.68s/it][A
Training...:  46% 6465/13907 [4:00:44<5:27:09,  2.64s/it][A
Training...:  46% 6466/13907 [4:00:47<5:20:35,  2.59s/it][A
Training...:  47% 6467/13907 [4:00:49<5:14:56,  2.54s/it][A
Training...:  47% 6468/13907 [4:00:52<5:11:10,  2.51s/it][A
Training...:  47% 6469/13907 [4:00:54<5:07:13,  2.48s/it][A
Training...:  47% 6470/13907 [4:00:56<5:04:36,  2.46s/it][A
Training...:  47% 6471/13907 [4:00:59<5:02:17,  2.44s/it][A
Training...:  47% 6472/13907 [4:01:01<4:59:55,  2.42s/it][A
Training...:  47% 6473/13907 [4:01:03<4:53:28,  2.37s/it][A
Training...:  47% 6474/13907 [4:01:06<4:47:31,  2.32s/it][A
Training...:  47% 6475/13907 [4:01:08<4:42:25,  2.28s/it][A
Training...:  47% 6476/13907 [4:01:10<4:36:56,  2.24s/it][A
Training...:  47% 6477/13907 [4:01:12<4:32:57,  2.20s/it][A
Training...:  47% 6478/13907 [4:01:14<4:28:26,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:31:49<8:52:18, 31938.93s/it]
Training...:  47% 6478/13907 [4:01:16<4:28:26,  2.17s/it][A
Training...:  47% 6479/13907 [4:01:16<4:36:21,  2.23s/it][A
Training...:  47% 6480/13907 [4:01:19<4:30:43,  2.19s/it][A
Training...:  47% 6481/13907 [4:01:21<4:24:11,  2.13s/it][A
Training...:  47% 6482/13907 [4:01:23<4:18:20,  2.09s/it][A
Training...:  47% 6483/13907 [4:01:24<4:12:54,  2.04s/it][A
Training...:  47% 6484/13907 [4:01:26<4:07:21,  2.00s/it][A
Training...:  47% 6485/13907 [4:01:28<4:02:36,  1.96s/it][A
Training...:  47% 6486/13907 [4:01:30<3:58:47,  1.93s/it][A
Training...:  47% 6487/13907 [4:01:32<3:54:55,  1.90s/it][A
Training...:  47% 6488/13907 [4:01:34<3:50:55,  1.87s/it][A
Training...:  47% 6489/13907 [4:01:36<3:47:52,  1.84s/it][A
Training...:  47% 6490/13907 [4:01:37<3:43:52,  1.81s/it][A
Training...:  47% 6491/13907 [4:01:39<3:39:50,  1.78s/it][A
Training...:  47% 6492/13907 [4:01:41<3:35:02,  1.74s/it][A
Training...:  47% 6493/13907 [4:01:42<3:30:40,  1.70s/it][A
Training...:  47% 6494/13907 [4:01:44<3:26:29,  1.67s/it][A
Training...:  47% 6495/13907 [4:01:45<3:22:42,  1.64s/it][A
Training...:  47% 6496/13907 [4:01:47<3:16:47,  1.59s/it][A
Training...:  47% 6497/13907 [4:01:48<3:10:42,  1.54s/it][A
Training...:  47% 6498/13907 [4:01:50<3:03:18,  1.48s/it][A
Training...:  47% 6499/13907 [4:01:51<2:54:52,  1.42s/it][A
Training...:  47% 6500/13907 [4:01:52<2:41:19,  1.31s/it][A
Training...:  47% 6501/13907 [4:01:56<4:13:15,  2.05s/it][A
Training...:  47% 6502/13907 [4:01:59<5:06:59,  2.49s/it][A
Training...:  47% 6503/13907 [4:02:03<5:38:50,  2.75s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:32:38<8:52:18, 31938.93s/it]
Training...:  47% 6503/13907 [4:02:06<5:38:50,  2.75s/it][A
Training...:  47% 6504/13907 [4:02:06<6:15:00,  3.04s/it][A
Training...:  47% 6505/13907 [4:02:10<6:25:39,  3.13s/it][A
Training...:  47% 6506/13907 [4:02:13<6:23:13,  3.11s/it][A
Training...:  47% 6507/13907 [4:02:16<6:19:50,  3.08s/it][A
Training...:  47% 6508/13907 [4:02:19<6:12:58,  3.02s/it][A
Training...:  47% 6509/13907 [4:02:21<6:05:41,  2.97s/it][A
Training...:  47% 6510/13907 [4:02:24<5:58:10,  2.91s/it][A
Training...:  47% 6511/13907 [4:02:27<5:51:00,  2.85s/it][A
Training...:  47% 6512/13907 [4:02:30<5:44:02,  2.79s/it][A
Training...:  47% 6513/13907 [4:02:32<5:38:13,  2.74s/it][A
Training...:  47% 6514/13907 [4:02:35<5:32:07,  2.70s/it][A
Training...:  47% 6515/13907 [4:02:37<5:26:45,  2.65s/it][A
Training...:  47% 6516/13907 [4:02:40<5:20:52,  2.60s/it][A
Training...:  47% 6517/13907 [4:02:42<5:15:11,  2.56s/it][A
Training...:  47% 6518/13907 [4:02:45<5:10:30,  2.52s/it][A
Training...:  47% 6519/13907 [4:02:47<5:07:02,  2.49s/it][A
Training...:  47% 6520/13907 [4:02:50<5:02:51,  2.46s/it][A
Training...:  47% 6521/13907 [4:02:52<4:58:18,  2.42s/it][A
Training...:  47% 6522/13907 [4:02:54<4:54:21,  2.39s/it][A
Training...:  47% 6523/13907 [4:02:56<4:49:57,  2.36s/it][A
Training...:  47% 6524/13907 [4:02:59<4:45:44,  2.32s/it][A
Training...:  47% 6525/13907 [4:03:01<4:40:36,  2.28s/it][A
Training...:  47% 6526/13907 [4:03:03<4:36:28,  2.25s/it][A
Training...:  47% 6527/13907 [4:03:05<4:32:39,  2.22s/it][A
Training...:  47% 6528/13907 [4:03:07<4:28:14,  2.18s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:33:42<8:52:18, 31938.93s/it]
Training...:  47% 6528/13907 [4:03:10<4:28:14,  2.18s/it][A
Training...:  47% 6529/13907 [4:03:10<4:35:59,  2.24s/it][A
Training...:  47% 6530/13907 [4:03:12<4:31:43,  2.21s/it][A
Training...:  47% 6531/13907 [4:03:14<4:26:44,  2.17s/it][A
Training...:  47% 6532/13907 [4:03:16<4:20:09,  2.12s/it][A
Training...:  47% 6533/13907 [4:03:18<4:16:48,  2.09s/it][A
Training...:  47% 6534/13907 [4:03:20<4:10:38,  2.04s/it][A
Training...:  47% 6535/13907 [4:03:22<4:05:41,  2.00s/it][A
Training...:  47% 6536/13907 [4:03:24<4:00:33,  1.96s/it][A
Training...:  47% 6537/13907 [4:03:25<3:55:37,  1.92s/it][A
Training...:  47% 6538/13907 [4:03:27<3:51:21,  1.88s/it][A
Training...:  47% 6539/13907 [4:03:29<3:46:49,  1.85s/it][A
Training...:  47% 6540/13907 [4:03:31<3:41:48,  1.81s/it][A
Training...:  47% 6541/13907 [4:03:32<3:38:09,  1.78s/it][A
Training...:  47% 6542/13907 [4:03:34<3:33:55,  1.74s/it][A
Training...:  47% 6543/13907 [4:03:36<3:28:52,  1.70s/it][A
Training...:  47% 6544/13907 [4:03:37<3:24:05,  1.66s/it][A
Training...:  47% 6545/13907 [4:03:39<3:18:10,  1.62s/it][A
Training...:  47% 6546/13907 [4:03:40<3:11:57,  1.56s/it][A
Training...:  47% 6547/13907 [4:03:42<3:05:18,  1.51s/it][A
Training...:  47% 6548/13907 [4:03:43<2:57:53,  1.45s/it][A
Training...:  47% 6549/13907 [4:03:44<2:49:19,  1.38s/it][A
Training...:  47% 6550/13907 [4:03:45<2:37:40,  1.29s/it][A
Training...:  47% 6551/13907 [4:03:49<4:07:13,  2.02s/it][A
Training...:  47% 6552/13907 [4:03:52<5:00:51,  2.45s/it][A
Training...:  47% 6553/13907 [4:03:56<5:31:11,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:34:31<8:52:18, 31938.93s/it]
Training...:  47% 6553/13907 [4:03:59<5:31:11,  2.70s/it][A
Training...:  47% 6554/13907 [4:03:59<6:06:10,  2.99s/it][A
Training...:  47% 6555/13907 [4:04:03<6:14:03,  3.05s/it][A
Training...:  47% 6556/13907 [4:04:06<6:12:09,  3.04s/it][A
Training...:  47% 6557/13907 [4:04:08<6:07:43,  3.00s/it][A
Training...:  47% 6558/13907 [4:04:11<6:02:40,  2.96s/it][A
Training...:  47% 6559/13907 [4:04:14<5:55:50,  2.91s/it][A
Training...:  47% 6560/13907 [4:04:17<5:49:10,  2.85s/it][A
Training...:  47% 6561/13907 [4:04:20<5:44:05,  2.81s/it][A
Training...:  47% 6562/13907 [4:04:22<5:38:01,  2.76s/it][A
Training...:  47% 6563/13907 [4:04:25<5:33:54,  2.73s/it][A
Training...:  47% 6564/13907 [4:04:27<5:29:01,  2.69s/it][A
Training...:  47% 6565/13907 [4:04:30<5:23:12,  2.64s/it][A
Training...:  47% 6566/13907 [4:04:32<5:16:21,  2.59s/it][A
Training...:  47% 6567/13907 [4:04:35<5:11:00,  2.54s/it][A
Training...:  47% 6568/13907 [4:04:37<5:04:55,  2.49s/it][A
Training...:  47% 6569/13907 [4:04:40<5:00:48,  2.46s/it][A
Training...:  47% 6570/13907 [4:04:42<4:56:51,  2.43s/it][A
Training...:  47% 6571/13907 [4:04:44<4:54:04,  2.41s/it][A
Training...:  47% 6572/13907 [4:04:47<4:50:14,  2.37s/it][A
Training...:  47% 6573/13907 [4:04:49<4:45:50,  2.34s/it][A
Training...:  47% 6574/13907 [4:04:51<4:40:47,  2.30s/it][A
Training...:  47% 6575/13907 [4:04:53<4:37:37,  2.27s/it][A
Training...:  47% 6576/13907 [4:04:55<4:33:55,  2.24s/it][A
Training...:  47% 6577/13907 [4:04:58<4:30:34,  2.21s/it][A
Training...:  47% 6578/13907 [4:05:00<4:26:19,  2.18s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:35:34<8:52:18, 31938.93s/it]
Training...:  47% 6578/13907 [4:05:02<4:26:19,  2.18s/it][A
Training...:  47% 6579/13907 [4:05:02<4:34:14,  2.25s/it][A
Training...:  47% 6580/13907 [4:05:04<4:29:08,  2.20s/it][A
Training...:  47% 6581/13907 [4:05:06<4:22:26,  2.15s/it][A
Training...:  47% 6582/13907 [4:05:08<4:15:44,  2.09s/it][A
Training...:  47% 6583/13907 [4:05:10<4:10:01,  2.05s/it][A
Training...:  47% 6584/13907 [4:05:12<4:04:49,  2.01s/it][A
Training...:  47% 6585/13907 [4:05:14<4:01:02,  1.98s/it][A
Training...:  47% 6586/13907 [4:05:16<3:56:22,  1.94s/it][A
Training...:  47% 6587/13907 [4:05:18<3:53:00,  1.91s/it][A
Training...:  47% 6588/13907 [4:05:19<3:48:06,  1.87s/it][A
Training...:  47% 6589/13907 [4:05:21<3:43:33,  1.83s/it][A
Training...:  47% 6590/13907 [4:05:23<3:39:17,  1.80s/it][A
Training...:  47% 6591/13907 [4:05:25<3:34:33,  1.76s/it][A
Training...:  47% 6592/13907 [4:05:26<3:29:19,  1.72s/it][A
Training...:  47% 6593/13907 [4:05:28<3:25:09,  1.68s/it][A
Training...:  47% 6594/13907 [4:05:29<3:21:04,  1.65s/it][A
Training...:  47% 6595/13907 [4:05:31<3:15:59,  1.61s/it][A
Training...:  47% 6596/13907 [4:05:32<3:10:33,  1.56s/it][A
Training...:  47% 6597/13907 [4:05:34<3:04:46,  1.52s/it][A
Training...:  47% 6598/13907 [4:05:35<2:57:46,  1.46s/it][A
Training...:  47% 6599/13907 [4:05:36<2:49:41,  1.39s/it][A
Training...:  47% 6600/13907 [4:05:37<2:37:09,  1.29s/it][A
Training...:  47% 6601/13907 [4:05:41<4:08:10,  2.04s/it][A
Training...:  47% 6602/13907 [4:05:45<5:00:07,  2.47s/it][A
Training...:  47% 6603/13907 [4:05:48<5:27:37,  2.69s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:36:24<8:52:18, 31938.93s/it]
Training...:  47% 6603/13907 [4:05:51<5:27:37,  2.69s/it][A
Training...:  47% 6604/13907 [4:05:51<6:01:30,  2.97s/it][A
Training...:  47% 6605/13907 [4:05:55<6:08:04,  3.02s/it][A
Training...:  48% 6606/13907 [4:05:58<6:04:20,  2.99s/it][A
Training...:  48% 6607/13907 [4:06:00<6:02:43,  2.98s/it][A
Training...:  48% 6608/13907 [4:06:03<5:56:07,  2.93s/it][A
Training...:  48% 6609/13907 [4:06:06<5:49:49,  2.88s/it][A
Training...:  48% 6610/13907 [4:06:09<5:43:18,  2.82s/it][A
Training...:  48% 6611/13907 [4:06:11<5:38:05,  2.78s/it][A
Training...:  48% 6612/13907 [4:06:14<5:32:31,  2.73s/it][A
Training...:  48% 6613/13907 [4:06:17<5:28:10,  2.70s/it][A
Training...:  48% 6614/13907 [4:06:19<5:24:20,  2.67s/it][A
Training...:  48% 6615/13907 [4:06:22<5:20:03,  2.63s/it][A
Training...:  48% 6616/13907 [4:06:24<5:13:55,  2.58s/it][A
Training...:  48% 6617/13907 [4:06:27<5:10:00,  2.55s/it][A
Training...:  48% 6618/13907 [4:06:29<5:04:24,  2.51s/it][A
Training...:  48% 6619/13907 [4:06:32<4:59:58,  2.47s/it][A
Training...:  48% 6620/13907 [4:06:34<4:56:06,  2.44s/it][A
Training...:  48% 6621/13907 [4:06:36<4:51:10,  2.40s/it][A
Training...:  48% 6622/13907 [4:06:38<4:47:10,  2.37s/it][A
Training...:  48% 6623/13907 [4:06:41<4:42:52,  2.33s/it][A
Training...:  48% 6624/13907 [4:06:43<4:40:01,  2.31s/it][A
Training...:  48% 6625/13907 [4:06:45<4:37:29,  2.29s/it][A
Training...:  48% 6626/13907 [4:06:47<4:34:35,  2.26s/it][A
Training...:  48% 6627/13907 [4:06:50<4:30:03,  2.23s/it][A
Training...:  48% 6628/13907 [4:06:52<4:25:12,  2.19s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:37:26<8:52:18, 31938.93s/it]
Training...:  48% 6628/13907 [4:06:54<4:25:12,  2.19s/it][A
Training...:  48% 6629/13907 [4:06:54<4:32:00,  2.24s/it][A
Training...:  48% 6630/13907 [4:06:56<4:26:27,  2.20s/it][A
Training...:  48% 6631/13907 [4:06:58<4:20:33,  2.15s/it][A
Training...:  48% 6632/13907 [4:07:00<4:13:18,  2.09s/it][A
Training...:  48% 6633/13907 [4:07:02<4:07:36,  2.04s/it][A
Training...:  48% 6634/13907 [4:07:04<4:02:26,  2.00s/it][A
Training...:  48% 6635/13907 [4:07:06<3:57:07,  1.96s/it][A
Training...:  48% 6636/13907 [4:07:08<3:52:57,  1.92s/it][A
Training...:  48% 6637/13907 [4:07:09<3:48:45,  1.89s/it][A
Training...:  48% 6638/13907 [4:07:11<3:44:10,  1.85s/it][A
Training...:  48% 6639/13907 [4:07:13<3:40:09,  1.82s/it][A
Training...:  48% 6640/13907 [4:07:15<3:35:51,  1.78s/it][A
Training...:  48% 6641/13907 [4:07:16<3:31:45,  1.75s/it][A
Training...:  48% 6642/13907 [4:07:18<3:27:46,  1.72s/it][A
Training...:  48% 6643/13907 [4:07:20<3:24:01,  1.69s/it][A
Training...:  48% 6644/13907 [4:07:21<3:19:51,  1.65s/it][A
Training...:  48% 6645/13907 [4:07:23<3:14:36,  1.61s/it][A
Training...:  48% 6646/13907 [4:07:24<3:08:50,  1.56s/it][A
Training...:  48% 6647/13907 [4:07:26<3:03:13,  1.51s/it][A
Training...:  48% 6648/13907 [4:07:27<2:56:35,  1.46s/it][A
Training...:  48% 6649/13907 [4:07:28<2:48:41,  1.39s/it][A
Training...:  48% 6650/13907 [4:07:29<2:37:59,  1.31s/it][A
Training...:  48% 6651/13907 [4:07:33<4:08:44,  2.06s/it][A
Training...:  48% 6652/13907 [4:07:37<5:02:40,  2.50s/it][A
Training...:  48% 6653/13907 [4:07:40<5:31:44,  2.74s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:38:16<8:52:18, 31938.93s/it]
Training...:  48% 6653/13907 [4:07:43<5:31:44,  2.74s/it][A
Training...:  48% 6654/13907 [4:07:43<6:03:25,  3.01s/it][A
Training...:  48% 6655/13907 [4:07:47<6:09:59,  3.06s/it][A
Training...:  48% 6656/13907 [4:07:50<6:08:23,  3.05s/it][A
Training...:  48% 6657/13907 [4:07:53<6:03:20,  3.01s/it][A
Training...:  48% 6658/13907 [4:07:56<6:00:02,  2.98s/it][A
Training...:  48% 6659/13907 [4:07:58<5:51:00,  2.91s/it][A
Training...:  48% 6660/13907 [4:08:01<5:42:46,  2.84s/it][A
Training...:  48% 6661/13907 [4:08:04<5:35:53,  2.78s/it][A
Training...:  48% 6662/13907 [4:08:06<5:29:00,  2.72s/it][A
Training...:  48% 6663/13907 [4:08:09<5:22:30,  2.67s/it][A
Training...:  48% 6664/13907 [4:08:11<5:16:26,  2.62s/it][A
Training...:  48% 6665/13907 [4:08:14<5:11:29,  2.58s/it][A
Training...:  48% 6666/13907 [4:08:16<5:06:11,  2.54s/it][A
Training...:  48% 6667/13907 [4:08:19<5:01:45,  2.50s/it][A
Training...:  48% 6668/13907 [4:08:21<4:57:26,  2.47s/it][A
Training...:  48% 6669/13907 [4:08:23<4:52:41,  2.43s/it][A
Training...:  48% 6670/13907 [4:08:26<4:48:14,  2.39s/it][A
Training...:  48% 6671/13907 [4:08:28<4:44:57,  2.36s/it][A
Training...:  48% 6672/13907 [4:08:30<4:40:42,  2.33s/it][A
Training...:  48% 6673/13907 [4:08:32<4:36:33,  2.29s/it][A
Training...:  48% 6674/13907 [4:08:35<4:33:18,  2.27s/it][A
Training...:  48% 6675/13907 [4:08:37<4:28:41,  2.23s/it][A
Training...:  48% 6676/13907 [4:08:39<4:25:38,  2.20s/it][A
Training...:  48% 6677/13907 [4:08:41<4:21:41,  2.17s/it][A
Training...:  48% 6678/13907 [4:08:43<4:18:33,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:39:17<8:52:18, 31938.93s/it]
Training...:  48% 6678/13907 [4:08:45<4:18:33,  2.15s/it][A
Training...:  48% 6679/13907 [4:08:45<4:26:10,  2.21s/it][A
Training...:  48% 6680/13907 [4:08:47<4:22:01,  2.18s/it][A
Training...:  48% 6681/13907 [4:08:49<4:15:49,  2.12s/it][A
Training...:  48% 6682/13907 [4:08:51<4:09:56,  2.08s/it][A
Training...:  48% 6683/13907 [4:08:53<4:04:34,  2.03s/it][A
Training...:  48% 6684/13907 [4:08:55<3:59:57,  1.99s/it][A
Training...:  48% 6685/13907 [4:08:57<3:55:50,  1.96s/it][A
Training...:  48% 6686/13907 [4:08:59<3:51:52,  1.93s/it][A
Training...:  48% 6687/13907 [4:09:01<3:48:16,  1.90s/it][A
Training...:  48% 6688/13907 [4:09:03<3:43:54,  1.86s/it][A
Training...:  48% 6689/13907 [4:09:04<3:39:57,  1.83s/it][A
Training...:  48% 6690/13907 [4:09:06<3:36:17,  1.80s/it][A
Training...:  48% 6691/13907 [4:09:08<3:31:45,  1.76s/it][A
Training...:  48% 6692/13907 [4:09:09<3:27:02,  1.72s/it][A
Training...:  48% 6693/13907 [4:09:11<3:23:29,  1.69s/it][A
Training...:  48% 6694/13907 [4:09:13<3:20:28,  1.67s/it][A
Training...:  48% 6695/13907 [4:09:14<3:14:46,  1.62s/it][A
Training...:  48% 6696/13907 [4:09:16<3:07:46,  1.56s/it][A
Training...:  48% 6697/13907 [4:09:17<3:00:36,  1.50s/it][A
Training...:  48% 6698/13907 [4:09:18<2:53:04,  1.44s/it][A
Training...:  48% 6699/13907 [4:09:19<2:44:42,  1.37s/it][A
Training...:  48% 6700/13907 [4:09:20<2:33:34,  1.28s/it][A
Training...:  48% 6701/13907 [4:09:24<4:02:43,  2.02s/it][A
Training...:  48% 6702/13907 [4:09:28<4:54:47,  2.45s/it][A
Training...:  48% 6703/13907 [4:09:31<5:24:22,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:40:07<8:52:18, 31938.93s/it]
Training...:  48% 6703/13907 [4:09:35<5:24:22,  2.70s/it][A
Training...:  48% 6704/13907 [4:09:35<5:56:35,  2.97s/it][A
Training...:  48% 6705/13907 [4:09:38<6:03:12,  3.03s/it][A
Training...:  48% 6706/13907 [4:09:41<6:00:58,  3.01s/it][A
Training...:  48% 6707/13907 [4:09:44<6:00:50,  3.01s/it][A
Training...:  48% 6708/13907 [4:09:47<5:54:37,  2.96s/it][A
Training...:  48% 6709/13907 [4:09:49<5:47:39,  2.90s/it][A
Training...:  48% 6710/13907 [4:09:52<5:41:15,  2.85s/it][A
Training...:  48% 6711/13907 [4:09:55<5:34:53,  2.79s/it][A
Training...:  48% 6712/13907 [4:09:57<5:28:37,  2.74s/it][A
Training...:  48% 6713/13907 [4:10:00<5:22:43,  2.69s/it][A
Training...:  48% 6714/13907 [4:10:02<5:17:35,  2.65s/it][A
Training...:  48% 6715/13907 [4:10:05<5:12:03,  2.60s/it][A
Training...:  48% 6716/13907 [4:10:07<5:06:40,  2.56s/it][A
Training...:  48% 6717/13907 [4:10:10<5:03:44,  2.53s/it][A
Training...:  48% 6718/13907 [4:10:12<4:58:56,  2.50s/it][A
Training...:  48% 6719/13907 [4:10:15<4:55:23,  2.47s/it][A
Training...:  48% 6720/13907 [4:10:17<4:50:31,  2.43s/it][A
Training...:  48% 6721/13907 [4:10:19<4:45:30,  2.38s/it][A
Training...:  48% 6722/13907 [4:10:22<4:41:43,  2.35s/it][A
Training...:  48% 6723/13907 [4:10:24<4:37:24,  2.32s/it][A
Training...:  48% 6724/13907 [4:10:26<4:33:28,  2.28s/it][A
Training...:  48% 6725/13907 [4:10:28<4:30:04,  2.26s/it][A
Training...:  48% 6726/13907 [4:10:30<4:27:18,  2.23s/it][A
Training...:  48% 6727/13907 [4:10:33<4:23:56,  2.21s/it][A
Training...:  48% 6728/13907 [4:10:35<4:18:55,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:41:09<8:52:18, 31938.93s/it]
Training...:  48% 6728/13907 [4:10:37<4:18:55,  2.16s/it][A
Training...:  48% 6729/13907 [4:10:37<4:25:45,  2.22s/it][A
Training...:  48% 6730/13907 [4:10:39<4:21:00,  2.18s/it][A
Training...:  48% 6731/13907 [4:10:41<4:14:50,  2.13s/it][A
Training...:  48% 6732/13907 [4:10:43<4:08:14,  2.08s/it][A
Training...:  48% 6733/13907 [4:10:45<4:02:10,  2.03s/it][A
Training...:  48% 6734/13907 [4:10:47<3:56:55,  1.98s/it][A
Training...:  48% 6735/13907 [4:10:49<3:52:48,  1.95s/it][A
Training...:  48% 6736/13907 [4:10:50<3:48:41,  1.91s/it][A
Training...:  48% 6737/13907 [4:10:52<3:44:46,  1.88s/it][A
Training...:  48% 6738/13907 [4:10:54<3:40:22,  1.84s/it][A
Training...:  48% 6739/13907 [4:10:56<3:35:56,  1.81s/it][A
Training...:  48% 6740/13907 [4:10:57<3:31:48,  1.77s/it][A
Training...:  48% 6741/13907 [4:10:59<3:27:08,  1.73s/it][A
Training...:  48% 6742/13907 [4:11:01<3:22:48,  1.70s/it][A
Training...:  48% 6743/13907 [4:11:02<3:18:34,  1.66s/it][A
Training...:  48% 6744/13907 [4:11:04<3:14:02,  1.63s/it][A
Training...:  49% 6745/13907 [4:11:05<3:09:01,  1.58s/it][A
Training...:  49% 6746/13907 [4:11:07<3:03:44,  1.54s/it][A
Training...:  49% 6747/13907 [4:11:08<2:57:00,  1.48s/it][A
Training...:  49% 6748/13907 [4:11:09<2:50:05,  1.43s/it][A
Training...:  49% 6749/13907 [4:11:11<2:42:14,  1.36s/it][A
Training...:  49% 6750/13907 [4:11:12<2:30:31,  1.26s/it][A
Training...:  49% 6751/13907 [4:11:15<3:56:43,  1.98s/it][A
Training...:  49% 6752/13907 [4:11:19<4:49:24,  2.43s/it][A
Training...:  49% 6753/13907 [4:11:22<5:19:20,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:41:58<8:52:18, 31938.93s/it]
Training...:  49% 6753/13907 [4:11:26<5:19:20,  2.68s/it][A
Training...:  49% 6754/13907 [4:11:26<5:53:14,  2.96s/it][A
Training...:  49% 6755/13907 [4:11:29<6:00:04,  3.02s/it][A
Training...:  49% 6756/13907 [4:11:32<5:57:49,  3.00s/it][A
Training...:  49% 6757/13907 [4:11:35<5:57:07,  3.00s/it][A
Training...:  49% 6758/13907 [4:11:38<5:51:50,  2.95s/it][A
Training...:  49% 6759/13907 [4:11:40<5:46:00,  2.90s/it][A
Training...:  49% 6760/13907 [4:11:43<5:40:11,  2.86s/it][A
Training...:  49% 6761/13907 [4:11:46<5:35:14,  2.81s/it][A
Training...:  49% 6762/13907 [4:11:49<5:30:19,  2.77s/it][A
Training...:  49% 6763/13907 [4:11:51<5:25:09,  2.73s/it][A
Training...:  49% 6764/13907 [4:11:54<5:18:56,  2.68s/it][A
Training...:  49% 6765/13907 [4:11:56<5:12:40,  2.63s/it][A
Training...:  49% 6766/13907 [4:11:59<5:06:37,  2.58s/it][A
Training...:  49% 6767/13907 [4:12:01<5:01:47,  2.54s/it][A
Training...:  49% 6768/13907 [4:12:04<4:56:49,  2.49s/it][A
Training...:  49% 6769/13907 [4:12:06<4:52:32,  2.46s/it][A
Training...:  49% 6770/13907 [4:12:08<4:48:26,  2.42s/it][A
Training...:  49% 6771/13907 [4:12:11<4:44:49,  2.39s/it][A
Training...:  49% 6772/13907 [4:12:13<4:41:02,  2.36s/it][A
Training...:  49% 6773/13907 [4:12:15<4:37:29,  2.33s/it][A
Training...:  49% 6774/13907 [4:12:17<4:33:39,  2.30s/it][A
Training...:  49% 6775/13907 [4:12:20<4:29:20,  2.27s/it][A
Training...:  49% 6776/13907 [4:12:22<4:25:15,  2.23s/it][A
Training...:  49% 6777/13907 [4:12:24<4:21:56,  2.20s/it][A
Training...:  49% 6778/13907 [4:12:26<4:18:07,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:43:00<8:52:18, 31938.93s/it]
Training...:  49% 6778/13907 [4:12:28<4:18:07,  2.17s/it][A
Training...:  49% 6779/13907 [4:12:28<4:24:45,  2.23s/it][A
Training...:  49% 6780/13907 [4:12:30<4:20:00,  2.19s/it][A
Training...:  49% 6781/13907 [4:12:32<4:14:10,  2.14s/it][A
Training...:  49% 6782/13907 [4:12:34<4:09:22,  2.10s/it][A
Training...:  49% 6783/13907 [4:12:36<4:04:55,  2.06s/it][A
Training...:  49% 6784/13907 [4:12:38<4:00:05,  2.02s/it][A
Training...:  49% 6785/13907 [4:12:40<3:55:24,  1.98s/it][A
Training...:  49% 6786/13907 [4:12:42<3:50:24,  1.94s/it][A
Training...:  49% 6787/13907 [4:12:44<3:46:22,  1.91s/it][A
Training...:  49% 6788/13907 [4:12:46<3:42:44,  1.88s/it][A
Training...:  49% 6789/13907 [4:12:47<3:38:21,  1.84s/it][A
Training...:  49% 6790/13907 [4:12:49<3:33:54,  1.80s/it][A
Training...:  49% 6791/13907 [4:12:51<3:29:56,  1.77s/it][A
Training...:  49% 6792/13907 [4:12:53<3:25:28,  1.73s/it][A
Training...:  49% 6793/13907 [4:12:54<3:21:22,  1.70s/it][A
Training...:  49% 6794/13907 [4:12:56<3:18:02,  1.67s/it][A
Training...:  49% 6795/13907 [4:12:57<3:14:02,  1.64s/it][A
Training...:  49% 6796/13907 [4:12:59<3:09:00,  1.59s/it][A
Training...:  49% 6797/13907 [4:13:00<3:03:41,  1.55s/it][A
Training...:  49% 6798/13907 [4:13:02<2:56:41,  1.49s/it][A
Training...:  49% 6799/13907 [4:13:03<2:48:01,  1.42s/it][A
Training...:  49% 6800/13907 [4:13:04<2:36:16,  1.32s/it][A
Training...:  49% 6801/13907 [4:13:08<4:08:17,  2.10s/it][A
Training...:  49% 6802/13907 [4:13:11<4:56:27,  2.50s/it][A
Training...:  49% 6803/13907 [4:13:15<5:22:46,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:43:50<8:52:18, 31938.93s/it]
Training...:  49% 6803/13907 [4:13:18<5:22:46,  2.73s/it][A
Training...:  49% 6804/13907 [4:13:18<5:53:31,  2.99s/it][A
Training...:  49% 6805/13907 [4:13:21<5:58:48,  3.03s/it][A
Training...:  49% 6806/13907 [4:13:24<5:55:22,  3.00s/it][A
Training...:  49% 6807/13907 [4:13:27<5:53:05,  2.98s/it][A
Training...:  49% 6808/13907 [4:13:30<5:49:59,  2.96s/it][A
Training...:  49% 6809/13907 [4:13:33<5:43:31,  2.90s/it][A
Training...:  49% 6810/13907 [4:13:36<5:36:49,  2.85s/it][A
Training...:  49% 6811/13907 [4:13:38<5:31:29,  2.80s/it][A
Training...:  49% 6812/13907 [4:13:41<5:25:59,  2.76s/it][A
Training...:  49% 6813/13907 [4:13:44<5:21:14,  2.72s/it][A
Training...:  49% 6814/13907 [4:13:46<5:15:56,  2.67s/it][A
Training...:  49% 6815/13907 [4:13:49<5:11:58,  2.64s/it][A
Training...:  49% 6816/13907 [4:13:51<5:06:26,  2.59s/it][A
Training...:  49% 6817/13907 [4:13:54<5:02:50,  2.56s/it][A
Training...:  49% 6818/13907 [4:13:56<4:57:02,  2.51s/it][A
Training...:  49% 6819/13907 [4:13:58<4:53:25,  2.48s/it][A
Training...:  49% 6820/13907 [4:14:01<4:51:12,  2.47s/it][A
Training...:  49% 6821/13907 [4:14:03<4:46:52,  2.43s/it][A
Training...:  49% 6822/13907 [4:14:05<4:40:42,  2.38s/it][A
Training...:  49% 6823/13907 [4:14:08<4:35:41,  2.34s/it][A
Training...:  49% 6824/13907 [4:14:10<4:29:58,  2.29s/it][A
Training...:  49% 6825/13907 [4:14:12<4:26:00,  2.25s/it][A
Training...:  49% 6826/13907 [4:14:14<4:21:39,  2.22s/it][A
Training...:  49% 6827/13907 [4:14:16<4:18:03,  2.19s/it][A
Training...:  49% 6828/13907 [4:14:18<4:14:27,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:44:53<8:52:18, 31938.93s/it]
Training...:  49% 6828/13907 [4:14:21<4:14:27,  2.16s/it][A
Training...:  49% 6829/13907 [4:14:21<4:22:05,  2.22s/it][A
Training...:  49% 6830/13907 [4:14:23<4:17:26,  2.18s/it][A
Training...:  49% 6831/13907 [4:14:25<4:10:34,  2.12s/it][A
Training...:  49% 6832/13907 [4:14:27<4:04:57,  2.08s/it][A
Training...:  49% 6833/13907 [4:14:29<4:00:30,  2.04s/it][A
Training...:  49% 6834/13907 [4:14:31<3:56:19,  2.00s/it][A
Training...:  49% 6835/13907 [4:14:33<3:52:05,  1.97s/it][A
Training...:  49% 6836/13907 [4:14:34<3:47:22,  1.93s/it][A
Training...:  49% 6837/13907 [4:14:36<3:43:27,  1.90s/it][A
Training...:  49% 6838/13907 [4:14:38<3:39:47,  1.87s/it][A
Training...:  49% 6839/13907 [4:14:40<3:36:18,  1.84s/it][A
Training...:  49% 6840/13907 [4:14:42<3:32:18,  1.80s/it][A
Training...:  49% 6841/13907 [4:14:43<3:28:02,  1.77s/it][A
Training...:  49% 6842/13907 [4:14:45<3:23:20,  1.73s/it][A
Training...:  49% 6843/13907 [4:14:46<3:18:53,  1.69s/it][A
Training...:  49% 6844/13907 [4:14:48<3:14:12,  1.65s/it][A
Training...:  49% 6845/13907 [4:14:49<3:08:31,  1.60s/it][A
Training...:  49% 6846/13907 [4:14:51<3:02:39,  1.55s/it][A
Training...:  49% 6847/13907 [4:14:52<2:56:08,  1.50s/it][A
Training...:  49% 6848/13907 [4:14:54<2:49:35,  1.44s/it][A
Training...:  49% 6849/13907 [4:14:55<2:41:41,  1.37s/it][A
Training...:  49% 6850/13907 [4:14:56<2:30:44,  1.28s/it][A
Training...:  49% 6851/13907 [4:15:00<3:56:34,  2.01s/it][A
Training...:  49% 6852/13907 [4:15:03<4:48:12,  2.45s/it][A
Training...:  49% 6853/13907 [4:15:06<5:19:06,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:45:42<8:52:18, 31938.93s/it]
Training...:  49% 6853/13907 [4:15:10<5:19:06,  2.71s/it][A
Training...:  49% 6854/13907 [4:15:10<5:51:31,  2.99s/it][A
Training...:  49% 6855/13907 [4:15:13<5:55:28,  3.02s/it][A
Training...:  49% 6856/13907 [4:15:16<5:51:23,  2.99s/it][A
Training...:  49% 6857/13907 [4:15:19<5:47:16,  2.96s/it][A
Training...:  49% 6858/13907 [4:15:22<5:41:43,  2.91s/it][A
Training...:  49% 6859/13907 [4:15:24<5:35:38,  2.86s/it][A
Training...:  49% 6860/13907 [4:15:27<5:30:35,  2.81s/it][A
Training...:  49% 6861/13907 [4:15:30<5:25:49,  2.77s/it][A
Training...:  49% 6862/13907 [4:15:32<5:20:10,  2.73s/it][A
Training...:  49% 6863/13907 [4:15:35<5:15:06,  2.68s/it][A
Training...:  49% 6864/13907 [4:15:38<5:11:05,  2.65s/it][A
Training...:  49% 6865/13907 [4:15:40<5:06:42,  2.61s/it][A
Training...:  49% 6866/13907 [4:15:43<5:01:52,  2.57s/it][A
Training...:  49% 6867/13907 [4:15:45<4:57:26,  2.53s/it][A
Training...:  49% 6868/13907 [4:15:48<4:53:53,  2.51s/it][A
Training...:  49% 6869/13907 [4:15:50<4:50:10,  2.47s/it][A
Training...:  49% 6870/13907 [4:15:52<4:45:32,  2.43s/it][A
Training...:  49% 6871/13907 [4:15:55<4:41:03,  2.40s/it][A
Training...:  49% 6872/13907 [4:15:57<4:36:23,  2.36s/it][A
Training...:  49% 6873/13907 [4:15:59<4:32:16,  2.32s/it][A
Training...:  49% 6874/13907 [4:16:01<4:28:36,  2.29s/it][A
Training...:  49% 6875/13907 [4:16:03<4:24:25,  2.26s/it][A
Training...:  49% 6876/13907 [4:16:06<4:20:47,  2.23s/it][A
Training...:  49% 6877/13907 [4:16:08<4:17:43,  2.20s/it][A
Training...:  49% 6878/13907 [4:16:10<4:16:07,  2.19s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:46:44<8:52:18, 31938.93s/it]
Training...:  49% 6878/13907 [4:16:12<4:16:07,  2.19s/it][A
Training...:  49% 6879/13907 [4:16:12<4:22:32,  2.24s/it][A
Training...:  49% 6880/13907 [4:16:14<4:17:43,  2.20s/it][A
Training...:  49% 6881/13907 [4:16:16<4:10:01,  2.14s/it][A
Training...:  49% 6882/13907 [4:16:18<4:03:56,  2.08s/it][A
Training...:  49% 6883/13907 [4:16:20<3:57:40,  2.03s/it][A
Training...:  50% 6884/13907 [4:16:22<3:52:28,  1.99s/it][A
Training...:  50% 6885/13907 [4:16:24<3:48:07,  1.95s/it][A
Training...:  50% 6886/13907 [4:16:26<3:43:32,  1.91s/it][A
Training...:  50% 6887/13907 [4:16:28<3:39:49,  1.88s/it][A
Training...:  50% 6888/13907 [4:16:29<3:35:57,  1.85s/it][A
Training...:  50% 6889/13907 [4:16:31<3:32:20,  1.82s/it][A
Training...:  50% 6890/13907 [4:16:33<3:28:26,  1.78s/it][A
Training...:  50% 6891/13907 [4:16:34<3:24:37,  1.75s/it][A
Training...:  50% 6892/13907 [4:16:36<3:20:17,  1.71s/it][A
Training...:  50% 6893/13907 [4:16:38<3:16:06,  1.68s/it][A
Training...:  50% 6894/13907 [4:16:39<3:12:07,  1.64s/it][A
Training...:  50% 6895/13907 [4:16:41<3:07:37,  1.61s/it][A
Training...:  50% 6896/13907 [4:16:42<3:02:03,  1.56s/it][A
Training...:  50% 6897/13907 [4:16:44<2:56:05,  1.51s/it][A
Training...:  50% 6898/13907 [4:16:45<2:49:16,  1.45s/it][A
Training...:  50% 6899/13907 [4:16:46<2:41:11,  1.38s/it][A
Training...:  50% 6900/13907 [4:16:47<2:29:43,  1.28s/it][A
Training...:  50% 6901/13907 [4:16:51<3:54:52,  2.01s/it][A
Training...:  50% 6902/13907 [4:16:54<4:46:45,  2.46s/it][A
Training...:  50% 6903/13907 [4:16:58<5:15:41,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:47:33<8:52:18, 31938.93s/it]
Training...:  50% 6903/13907 [4:17:01<5:15:41,  2.70s/it][A
Training...:  50% 6904/13907 [4:17:01<5:49:51,  3.00s/it][A
Training...:  50% 6905/13907 [4:17:05<5:56:58,  3.06s/it][A
Training...:  50% 6906/13907 [4:17:08<5:55:31,  3.05s/it][A
Training...:  50% 6907/13907 [4:17:11<5:52:41,  3.02s/it][A
Training...:  50% 6908/13907 [4:17:13<5:46:32,  2.97s/it][A
Training...:  50% 6909/13907 [4:17:16<5:39:38,  2.91s/it][A
Training...:  50% 6910/13907 [4:17:19<5:34:46,  2.87s/it][A
Training...:  50% 6911/13907 [4:17:22<5:30:49,  2.84s/it][A
Training...:  50% 6912/13907 [4:17:24<5:23:06,  2.77s/it][A
Training...:  50% 6913/13907 [4:17:27<5:16:04,  2.71s/it][A
Training...:  50% 6914/13907 [4:17:29<5:10:00,  2.66s/it][A
Training...:  50% 6915/13907 [4:17:32<5:04:58,  2.62s/it][A
Training...:  50% 6916/13907 [4:17:34<4:58:54,  2.57s/it][A
Training...:  50% 6917/13907 [4:17:37<4:53:28,  2.52s/it][A
Training...:  50% 6918/13907 [4:17:39<4:49:52,  2.49s/it][A
Training...:  50% 6919/13907 [4:17:42<4:45:32,  2.45s/it][A
Training...:  50% 6920/13907 [4:17:44<4:41:11,  2.41s/it][A
Training...:  50% 6921/13907 [4:17:46<4:37:00,  2.38s/it][A
Training...:  50% 6922/13907 [4:17:49<4:33:00,  2.35s/it][A
Training...:  50% 6923/13907 [4:17:51<4:28:58,  2.31s/it][A
Training...:  50% 6924/13907 [4:17:53<4:25:26,  2.28s/it][A
Training...:  50% 6925/13907 [4:17:55<4:21:23,  2.25s/it][A
Training...:  50% 6926/13907 [4:17:57<4:18:35,  2.22s/it][A
Training...:  50% 6927/13907 [4:17:59<4:15:16,  2.19s/it][A
Training...:  50% 6928/13907 [4:18:02<4:11:55,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:48:36<8:52:18, 31938.93s/it]
Training...:  50% 6928/13907 [4:18:04<4:11:55,  2.17s/it][A
Training...:  50% 6929/13907 [4:18:04<4:19:37,  2.23s/it][A
Training...:  50% 6930/13907 [4:18:06<4:15:29,  2.20s/it][A
Training...:  50% 6931/13907 [4:18:08<4:09:02,  2.14s/it][A
Training...:  50% 6932/13907 [4:18:10<4:03:18,  2.09s/it][A
Training...:  50% 6933/13907 [4:18:12<3:58:33,  2.05s/it][A
Training...:  50% 6934/13907 [4:18:14<3:53:46,  2.01s/it][A
Training...:  50% 6935/13907 [4:18:16<3:49:16,  1.97s/it][A
Training...:  50% 6936/13907 [4:18:18<3:45:49,  1.94s/it][A
Training...:  50% 6937/13907 [4:18:19<3:42:05,  1.91s/it][A
Training...:  50% 6938/13907 [4:18:21<3:37:46,  1.87s/it][A
Training...:  50% 6939/13907 [4:18:23<3:33:52,  1.84s/it][A
Training...:  50% 6940/13907 [4:18:25<3:29:42,  1.81s/it][A
Training...:  50% 6941/13907 [4:18:26<3:25:42,  1.77s/it][A
Training...:  50% 6942/13907 [4:18:28<3:21:48,  1.74s/it][A
Training...:  50% 6943/13907 [4:18:30<3:16:55,  1.70s/it][A
Training...:  50% 6944/13907 [4:18:31<3:12:00,  1.65s/it][A
Training...:  50% 6945/13907 [4:18:33<3:07:42,  1.62s/it][A
Training...:  50% 6946/13907 [4:18:34<3:03:21,  1.58s/it][A
Training...:  50% 6947/13907 [4:18:36<2:57:27,  1.53s/it][A
Training...:  50% 6948/13907 [4:18:37<2:50:15,  1.47s/it][A
Training...:  50% 6949/13907 [4:18:38<2:42:49,  1.40s/it][A
Training...:  50% 6950/13907 [4:18:39<2:31:36,  1.31s/it][A
Training...:  50% 6951/13907 [4:18:43<3:55:44,  2.03s/it][A
Training...:  50% 6952/13907 [4:18:47<4:46:50,  2.47s/it][A
Training...:  50% 6953/13907 [4:18:50<5:14:22,  2.71s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:49:26<8:52:18, 31938.93s/it]Step... (46950 | Loss: 0.15348587930202484, Learning Rate: 1.8490916772861965e-05, Gradient Norm: 0.8145221471786499)
Step... (46975 | Loss: 0.14210918545722961, Learning Rate: 1.8339391317567788e-05, Gradient Norm: 0.5839684009552002)
Step... (47000 | Loss: 0.1758834719657898, Learning Rate: 1.8187882233178243e-05, Gradient Norm: 1.1599398851394653)
Step... (47025 | Loss: 0.18450838327407837, Learning Rate: 1.8036373148788698e-05, Gradient Norm: 0.7690929174423218)
Step... (47050 | Loss: 0.17801442742347717, Learning Rate: 1.7884845874505118e-05, Gradient Norm: 0.7274975776672363)
Step... (47075 | Loss: 0.23115044832229614, Learning Rate: 1.7733336790115573e-05, Gradient Norm: 0.9655201435089111)
Step... (47100 | Loss: 0.14968350529670715, Learning Rate: 1.7581827705726027e-05, Gradient Norm: 0.7260916233062744)
Step... (47125 | Loss: 0.21258357167243958, Learning Rate: 1.7430300431442447e-05, Gradient Norm: 0.8511540293693542)
Step... (47150 | Loss: 0.15463244915008545, Learning Rate: 1.7278791347052902e-05, Gradient Norm: 0.6934406757354736)
Step... (47175 | Loss: 0.23277214169502258, Learning Rate: 1.7127282262663357e-05, Gradient Norm: 0.9508240818977356)
Step... (47200 | Loss: 0.16348758339881897, Learning Rate: 1.6975754988379776e-05, Gradient Norm: 1.3571462631225586)
Step... (47225 | Loss: 0.18346211314201355, Learning Rate: 1.682424590399023e-05, Gradient Norm: 0.6984596848487854)
Step... (47250 | Loss: 0.17715618014335632, Learning Rate: 1.6672736819600686e-05, Gradient Norm: 1.0288370847702026)
Step... (47275 | Loss: 0.17704862356185913, Learning Rate: 1.6521209545317106e-05, Gradient Norm: 0.690073549747467)
Step... (47300 | Loss: 0.23185260593891144, Learning Rate: 1.636970046092756e-05, Gradient Norm: 1.0019216537475586)
Step... (47325 | Loss: 0.1536256968975067, Learning Rate: 1.6218191376538016e-05, Gradient Norm: 0.5719996690750122)
Step... (47350 | Loss: 0.15865330398082733, Learning Rate: 1.606666592124384e-05, Gradient Norm: 0.6464328169822693)
Step... (47375 | Loss: 0.21099042892456055, Learning Rate: 1.5915156836854294e-05, Gradient Norm: 1.1921700239181519)
Step... (47400 | Loss: 0.1368478238582611, Learning Rate: 1.576364775246475e-05, Gradient Norm: 0.8331424593925476)
Step... (47425 | Loss: 0.20565271377563477, Learning Rate: 1.561212047818117e-05, Gradient Norm: 0.647875189781189)
Step... (47450 | Loss: 0.12615928053855896, Learning Rate: 1.5460611393791623e-05, Gradient Norm: 0.5075675249099731)
Step... (47475 | Loss: 0.27498188614845276, Learning Rate: 1.530910230940208e-05, Gradient Norm: 0.8718043565750122)
Step... (47500 | Loss: 0.15935909748077393, Learning Rate: 1.5157575035118498e-05, Gradient Norm: 0.8865315914154053)
Step... (47525 | Loss: 0.1963018923997879, Learning Rate: 1.5006065950728953e-05, Gradient Norm: 0.8434488773345947)
Step... (47550 | Loss: 0.16537605226039886, Learning Rate: 1.4854539585940074e-05, Gradient Norm: 0.7456281781196594)
Step... (47575 | Loss: 0.2609274089336395, Learning Rate: 1.4703030501550529e-05, Gradient Norm: 0.91688072681427)
Step... (47600 | Loss: 0.1413937211036682, Learning Rate: 1.4551521417160984e-05, Gradient Norm: 0.7058792114257812)
Step... (47625 | Loss: 0.17292121052742004, Learning Rate: 1.4399994142877404e-05, Gradient Norm: 0.9424628019332886)
Step... (47650 | Loss: 0.16145358979701996, Learning Rate: 1.4248485058487859e-05, Gradient Norm: 0.9480162858963013)
Step... (47675 | Loss: 2.956716299057007, Learning Rate: 1.4096975974098314e-05, Gradient Norm: 6.687743663787842)
Step... (47700 | Loss: 0.13699373602867126, Learning Rate: 1.3945448699814733e-05, Gradient Norm: 0.5847349166870117)
Step... (47725 | Loss: 0.16737118363380432, Learning Rate: 1.3793939615425188e-05, Gradient Norm: 0.5664359331130981)
Step... (47750 | Loss: 0.14895471930503845, Learning Rate: 1.3642430531035643e-05, Gradient Norm: 0.8618807196617126)
Step... (47775 | Loss: 0.15607738494873047, Learning Rate: 1.3490904166246764e-05, Gradient Norm: 0.5676412582397461)
Step... (47800 | Loss: 0.11203251034021378, Learning Rate: 1.3339395
Training...:  50% 6953/13907 [4:18:53<5:14:22,  2.71s/it][A
Training...:  50% 6954/13907 [4:18:53<5:45:48,  2.98s/it][A08185722e-05, Gradient Norm: 0.5074158310890198)
Step... (47825 | Loss: 0.19989727437496185, Learning Rate: 1.3187885997467674e-05, Gradient Norm: 1.0321205854415894)
Step... (47850 | Loss: 0.16686779260635376, Learning Rate: 1.3036358723184094e-05, Gradient Norm: 0.6235721111297607)
Step... (47875 | Loss: 0.19302088022232056, Learning Rate: 1.2884849638794549e-05, Gradient Norm: 0.6342236995697021)
Step... (47900 | Loss: 0.14645737409591675, Learning Rate: 1.2733340554405004e-05, Gradient Norm: 0.6081992983818054)
Step... (47925 | Loss: 0.18072374165058136, Learning Rate: 1.2581814189616125e-05, Gradient Norm: 0.734368622303009)
Step... (47950 | Loss: 0.11168012022972107, Learning Rate: 1.243030510522658e-05, Gradient Norm: 0.5288268327713013)
Step... (47975 | Loss: 0.19050246477127075, Learning Rate: 1.2278796020837035e-05, Gradient Norm: 0.6590512990951538)
Step... (48000 | Loss: 0.1437121331691742, Learning Rate: 1.2127268746553455e-05, Gradient Norm: 0.5810819864273071)
Step... (48025 | Loss: 0.21969135105609894, Learning Rate: 1.197575966216391e-05, Gradient Norm: 0.764306902885437)
Step... (48050 | Loss: 0.14751170575618744, Learning Rate: 1.1824250577774365e-05, Gradient Norm: 0.8358117341995239)
Step... (48075 | Loss: 0.17319463193416595, Learning Rate: 1.1672724212985486e-05, Gradient Norm: 0.8738358020782471)
Step... (48100 | Loss: 0.10672889649868011, Learning Rate: 1.152121512859594e-05, Gradient Norm: 0.6807085871696472)
Step... (48125 | Loss: 0.20404407382011414, Learning Rate: 1.1369706044206396e-05, Gradient Norm: 1.1014432907104492)
Step... (48150 | Loss: 0.1797965168952942, Learning Rate: 1.1218178769922815e-05, Gradient Norm: 0.842357337474823)
Step... (48175 | Loss: 0.23819003999233246, Learning Rate: 1.106666968553327e-05, Gradient Norm: 0.9185811281204224)
Step... (48200 | Loss: 0.16055415570735931, Learning Rate: 1.0915160601143725e-05, Gradient Norm: 1.026080846786499)
Step... (48225 | Loss: 0.20446567237377167, Learning Rate: 1.0763633326860145e-05, Gradient Norm: 0.7717865705490112)
Step... (48250 | Loss: 0.13434278964996338, Learning Rate: 1.0612125151965301e-05, Gradient Norm: 0.5768709778785706)
Step... (48275 | Loss: 0.20744535326957703, Learning Rate: 1.0460616067575756e-05, Gradient Norm: 0.7618496417999268)
Step... (48300 | Loss: 0.15372516214847565, Learning Rate: 1.0309088793292176e-05, Gradient Norm: 0.9400876760482788)
Step... (48325 | Loss: 0.1859252154827118, Learning Rate: 1.0157579708902631e-05, Gradient Norm: 0.7136046886444092)
Step... (48350 | Loss: 0.16797780990600586, Learning Rate: 1.0006070624513086e-05, Gradient Norm: 0.7145040035247803)
Step... (48375 | Loss: 0.24301181733608246, Learning Rate: 9.854543350229505e-06, Gradient Norm: 1.1801624298095703)
Step... (48400 | Loss: 0.1262834668159485, Learning Rate: 9.70303426583996e-06, Gradient Norm: 0.5008913278579712)
Step... (48425 | Loss: 0.2331376075744629, Learning Rate: 9.551525181450415e-06, Gradient Norm: 0.7894331216812134)
Step... (48450 | Loss: 0.14486151933670044, Learning Rate: 9.399998816661537e-06, Gradient Norm: 0.8142987489700317)
Step... (48475 | Loss: 0.17464029788970947, Learning Rate: 9.248489732271992e-06, Gradient Norm: 0.8176581263542175)
Step... (48500 | Loss: 0.11019457876682281, Learning Rate: 9.096980647882447e-06, Gradient Norm: 0.4876140356063843)
Step... (48525 | Loss: 0.1943177878856659, Learning Rate: 8.945453373598866e-06, Gradient Norm: 0.7264397740364075)
Step... (48550 | Loss: 0.11608092486858368, Learning Rate: 8.793944289209321e-06, Gradient Norm: 1.1447721719741821)
Step... (48575 | Loss: 0.20305582880973816, Learning Rate: 8.642417924420442e-06, Gradient Norm: 0.6381831765174866)
Step... (48600 | Loss: 0.17932197451591492, Learning Rate: 8.490908840030897e-06, Gradient Norm: 0.9285895824432373)
Step... (48625 | Loss: 0.16293297708034515, Learning Rate: 8.339399755641352e-06, Gradient Norm: 0.6061058640480042)
Step... (48650 | Loss: 0.16918990015983582, Learning Rate: 8.187872481357772e-06, Gradient Norm: 1.4061577320098877)

Training...:  50% 6955/13907 [4:18:57<5:59:29,  3.10s/it][A
Training...:  50% 6956/13907 [4:19:00<5:55:35,  3.07s/it][A
Training...:  50% 6957/13907 [4:19:03<5:53:32,  3.05s/it][A
Training...:  50% 6958/13907 [4:19:06<5:46:28,  2.99s/it][A
Training...:  50% 6959/13907 [4:19:09<5:39:43,  2.93s/it][A
Training...:  50% 6960/13907 [4:19:11<5:32:27,  2.87s/it][A
Training...:  50% 6961/13907 [4:19:14<5:27:20,  2.83s/it][A
Training...:  50% 6962/13907 [4:19:17<5:20:58,  2.77s/it][A
Training...:  50% 6963/13907 [4:19:19<5:16:31,  2.73s/it][A
Training...:  50% 6964/13907 [4:19:22<5:10:23,  2.68s/it][A
Training...:  50% 6965/13907 [4:19:24<5:05:58,  2.64s/it][A
Training...:  50% 6966/13907 [4:19:27<5:01:04,  2.60s/it][A
Training...:  50% 6967/13907 [4:19:29<4:56:10,  2.56s/it][A
Training...:  50% 6968/13907 [4:19:32<4:50:41,  2.51s/it][A
Training...:  50% 6969/13907 [4:19:34<4:46:32,  2.48s/it][A
Training...:  50% 6970/13907 [4:19:37<4:43:24,  2.45s/it][A
Training...:  50% 6971/13907 [4:19:39<4:40:59,  2.43s/it][A
Training...:  50% 6972/13907 [4:19:41<4:38:14,  2.41s/it][A
Training...:  50% 6973/13907 [4:19:44<4:33:02,  2.36s/it][A
Training...:  50% 6974/13907 [4:19:46<4:27:55,  2.32s/it][A
Training...:  50% 6975/13907 [4:19:48<4:23:26,  2.28s/it][A
Training...:  50% 6976/13907 [4:19:50<4:18:15,  2.24s/it][A
Training...:  50% 6977/13907 [4:19:52<4:13:47,  2.20s/it][A
Training...:  50% 6978/13907 [4:19:54<4:09:25,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:50:29<8:52:18, 31938.93s/it]
Training...:  50% 6978/13907 [4:19:57<4:09:25,  2.16s/it][A
Training...:  50% 6979/13907 [4:19:57<4:16:01,  2.22s/it][A
Training...:  50% 6980/13907 [4:19:59<4:10:46,  2.17s/it][A
Training...:  50% 6981/13907 [4:20:01<4:04:31,  2.12s/it][A
Training...:  50% 6982/13907 [4:20:03<3:59:24,  2.07s/it][A
Training...:  50% 6983/13907 [4:20:05<3:55:42,  2.04s/it][A
Training...:  50% 6984/13907 [4:20:06<3:50:39,  2.00s/it][A
Training...:  50% 6985/13907 [4:20:08<3:46:48,  1.97s/it][A
Training...:  50% 6986/13907 [4:20:10<3:42:34,  1.93s/it][A
Training...:  50% 6987/13907 [4:20:12<3:39:10,  1.90s/it][A
Training...:  50% 6988/13907 [4:20:14<3:35:26,  1.87s/it][A
Training...:  50% 6989/13907 [4:20:16<3:31:27,  1.83s/it][A
Training...:  50% 6990/13907 [4:20:17<3:27:01,  1.80s/it][A
Training...:  50% 6991/13907 [4:20:19<3:23:01,  1.76s/it][A
Training...:  50% 6992/13907 [4:20:21<3:18:16,  1.72s/it][A
Training...:  50% 6993/13907 [4:20:22<3:14:28,  1.69s/it][A
Training...:  50% 6994/13907 [4:20:24<3:10:22,  1.65s/it][A
Training...:  50% 6995/13907 [4:20:25<3:04:56,  1.61s/it][A
Training...:  50% 6996/13907 [4:20:27<2:59:06,  1.56s/it][A
Training...:  50% 6997/13907 [4:20:28<2:53:15,  1.50s/it][A
Training...:  50% 6998/13907 [4:20:29<2:46:58,  1.45s/it][A
Training...:  50% 6999/13907 [4:20:31<2:39:06,  1.38s/it][A
Training...:  50% 7000/13907 [4:20:32<2:28:44,  1.29s/it][A
Training...:  50% 7001/13907 [4:20:35<3:51:41,  2.01s/it][A
Training...:  50% 7002/13907 [4:20:39<4:41:52,  2.45s/it][A
Training...:  50% 7003/13907 [4:20:42<5:08:44,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:51:18<8:52:18, 31938.93s/it]
Training...:  50% 7003/13907 [4:20:46<5:08:44,  2.68s/it][A
Training...:  50% 7004/13907 [4:20:46<5:41:24,  2.97s/it][A
Training...:  50% 7005/13907 [4:20:49<5:48:26,  3.03s/it][A
Training...:  50% 7006/13907 [4:20:52<5:48:47,  3.03s/it][A
Training...:  50% 7007/13907 [4:20:55<5:46:34,  3.01s/it][A
Training...:  50% 7008/13907 [4:20:58<5:40:44,  2.96s/it][A
Training...:  50% 7009/13907 [4:21:01<5:34:56,  2.91s/it][A
Training...:  50% 7010/13907 [4:21:03<5:29:01,  2.86s/it][A
Training...:  50% 7011/13907 [4:21:06<5:23:42,  2.82s/it][A
Training...:  50% 7012/13907 [4:21:09<5:17:50,  2.77s/it][A
Training...:  50% 7013/13907 [4:21:11<5:11:42,  2.71s/it][A
Training...:  50% 7014/13907 [4:21:14<5:06:39,  2.67s/it][A
Training...:  50% 7015/13907 [4:21:16<5:01:09,  2.62s/it][A
Training...:  50% 7016/13907 [4:21:19<4:55:34,  2.57s/it][A
Training...:  50% 7017/13907 [4:21:21<4:51:11,  2.54s/it][A
Training...:  50% 7018/13907 [4:21:24<4:46:50,  2.50s/it][A
Training...:  50% 7019/13907 [4:21:26<4:42:49,  2.46s/it][A
Training...:  50% 7020/13907 [4:21:28<4:38:45,  2.43s/it][A
Training...:  50% 7021/13907 [4:21:31<4:34:59,  2.40s/it][A
Training...:  50% 7022/13907 [4:21:33<4:31:31,  2.37s/it][A
Training...:  50% 7023/13907 [4:21:35<4:28:36,  2.34s/it][A
Training...:  51% 7024/13907 [4:21:38<4:24:06,  2.30s/it][A
Training...:  51% 7025/13907 [4:21:40<4:20:22,  2.27s/it][A
Training...:  51% 7026/13907 [4:21:42<4:16:47,  2.24s/it][A
Training...:  51% 7027/13907 [4:21:44<4:12:59,  2.21s/it][A
Training...:  51% 7028/13907 [4:21:46<4:08:54,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:52:21<8:52:18, 31938.93s/it]
Training...:  51% 7028/13907 [4:21:48<4:08:54,  2.17s/it][A
Training...:  51% 7029/13907 [4:21:48<4:16:00,  2.23s/it][A
Training...:  51% 7030/13907 [4:21:51<4:12:02,  2.20s/it][A
Training...:  51% 7031/13907 [4:21:53<4:05:21,  2.14s/it][A
Training...:  51% 7032/13907 [4:21:55<3:59:12,  2.09s/it][A
Training...:  51% 7033/13907 [4:21:57<3:54:54,  2.05s/it][A
Training...:  51% 7034/13907 [4:21:58<3:51:46,  2.02s/it][A
Training...:  51% 7035/13907 [4:22:00<3:47:13,  1.98s/it][A
Training...:  51% 7036/13907 [4:22:02<3:44:34,  1.96s/it][A
Training...:  51% 7037/13907 [4:22:04<3:41:17,  1.93s/it][A
Training...:  51% 7038/13907 [4:22:06<3:37:46,  1.90s/it][A
Training...:  51% 7039/13907 [4:22:08<3:33:06,  1.86s/it][A
Training...:  51% 7040/13907 [4:22:09<3:28:29,  1.82s/it][A
Training...:  51% 7041/13907 [4:22:11<3:23:09,  1.78s/it][A
Training...:  51% 7042/13907 [4:22:13<3:19:03,  1.74s/it][A
Training...:  51% 7043/13907 [4:22:14<3:14:03,  1.70s/it][A
Training...:  51% 7044/13907 [4:22:16<3:09:37,  1.66s/it][A
Training...:  51% 7045/13907 [4:22:18<3:05:38,  1.62s/it][A
Training...:  51% 7046/13907 [4:22:19<2:59:21,  1.57s/it][A
Training...:  51% 7047/13907 [4:22:20<2:52:40,  1.51s/it][A
Training...:  51% 7048/13907 [4:22:22<2:45:28,  1.45s/it][A
Training...:  51% 7049/13907 [4:22:23<2:37:47,  1.38s/it][A
Training...:  51% 7050/13907 [4:22:24<2:26:37,  1.28s/it][A
Training...:  51% 7051/13907 [4:22:28<3:47:45,  1.99s/it][A
Training...:  51% 7052/13907 [4:22:31<4:37:37,  2.43s/it][A
Training...:  51% 7053/13907 [4:22:34<5:04:56,  2.67s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:53:10<8:52:18, 31938.93s/it]
Training...:  51% 7053/13907 [4:22:38<5:04:56,  2.67s/it][A
Training...:  51% 7054/13907 [4:22:38<5:36:30,  2.95s/it][A
Training...:  51% 7055/13907 [4:22:41<5:42:59,  3.00s/it][A
Training...:  51% 7056/13907 [4:22:44<5:42:51,  3.00s/it][A
Training...:  51% 7057/13907 [4:22:47<5:40:33,  2.98s/it][A
Training...:  51% 7058/13907 [4:22:50<5:38:38,  2.97s/it][A
Training...:  51% 7059/13907 [4:22:53<5:32:23,  2.91s/it][A
Training...:  51% 7060/13907 [4:22:55<5:25:52,  2.86s/it][A
Training...:  51% 7061/13907 [4:22:58<5:20:59,  2.81s/it][A
Training...:  51% 7062/13907 [4:23:01<5:14:39,  2.76s/it][A
Training...:  51% 7063/13907 [4:23:03<5:09:59,  2.72s/it][A
Training...:  51% 7064/13907 [4:23:06<5:04:24,  2.67s/it][A
Training...:  51% 7065/13907 [4:23:08<4:59:00,  2.62s/it][A
Training...:  51% 7066/13907 [4:23:11<4:54:14,  2.58s/it][A
Training...:  51% 7067/13907 [4:23:13<4:48:58,  2.53s/it][A
Training...:  51% 7068/13907 [4:23:16<4:45:46,  2.51s/it][A
Training...:  51% 7069/13907 [4:23:18<4:43:39,  2.49s/it][A
Training...:  51% 7070/13907 [4:23:21<4:38:29,  2.44s/it][A
Training...:  51% 7071/13907 [4:23:23<4:34:06,  2.41s/it][A
Training...:  51% 7072/13907 [4:23:25<4:29:01,  2.36s/it][A
Training...:  51% 7073/13907 [4:23:27<4:24:39,  2.32s/it][A
Training...:  51% 7074/13907 [4:23:30<4:20:18,  2.29s/it][A
Training...:  51% 7075/13907 [4:23:32<4:16:24,  2.25s/it][A
Training...:  51% 7076/13907 [4:23:34<4:12:16,  2.22s/it][A
Training...:  51% 7077/13907 [4:23:36<4:09:06,  2.19s/it][A
Training...:  51% 7078/13907 [4:23:38<4:05:26,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:54:12<8:52:18, 31938.93s/it]
Training...:  51% 7078/13907 [4:23:40<4:05:26,  2.16s/it][A
Training...:  51% 7079/13907 [4:23:40<4:13:36,  2.23s/it][A
Training...:  51% 7080/13907 [4:23:43<4:09:28,  2.19s/it][A
Training...:  51% 7081/13907 [4:23:45<4:03:53,  2.14s/it][A
Training...:  51% 7082/13907 [4:23:47<3:58:46,  2.10s/it][A
Training...:  51% 7083/13907 [4:23:49<3:54:24,  2.06s/it][A
Training...:  51% 7084/13907 [4:23:50<3:49:35,  2.02s/it][A
Training...:  51% 7085/13907 [4:23:52<3:45:19,  1.98s/it][A
Training...:  51% 7086/13907 [4:23:54<3:41:32,  1.95s/it][A
Training...:  51% 7087/13907 [4:23:56<3:37:00,  1.91s/it][A
Training...:  51% 7088/13907 [4:23:58<3:33:57,  1.88s/it][A
Training...:  51% 7089/13907 [4:24:00<3:30:28,  1.85s/it][A
Training...:  51% 7090/13907 [4:24:01<3:26:23,  1.82s/it][A
Training...:  51% 7091/13907 [4:24:03<3:22:03,  1.78s/it][A
Training...:  51% 7092/13907 [4:24:05<3:17:46,  1.74s/it][A
Training...:  51% 7093/13907 [4:24:06<3:13:38,  1.71s/it][A
Training...:  51% 7094/13907 [4:24:08<3:08:55,  1.66s/it][A
Training...:  51% 7095/13907 [4:24:09<3:04:44,  1.63s/it][A
Training...:  51% 7096/13907 [4:24:11<2:58:37,  1.57s/it][A
Training...:  51% 7097/13907 [4:24:12<2:52:09,  1.52s/it][A
Training...:  51% 7098/13907 [4:24:14<2:46:01,  1.46s/it][A
Training...:  51% 7099/13907 [4:24:15<2:37:48,  1.39s/it][A
Training...:  51% 7100/13907 [4:24:16<2:26:55,  1.30s/it][A
Training...:  51% 7101/13907 [4:24:20<3:48:57,  2.02s/it][A
Training...:  51% 7102/13907 [4:24:23<4:37:44,  2.45s/it][A
Training...:  51% 7103/13907 [4:24:26<5:03:37,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:55:02<8:52:18, 31938.93s/it]
Training...:  51% 7103/13907 [4:24:30<5:03:37,  2.68s/it][A
Training...:  51% 7104/13907 [4:24:30<5:35:50,  2.96s/it][A
Training...:  51% 7105/13907 [4:24:33<5:44:34,  3.04s/it][A
Training...:  51% 7106/13907 [4:24:36<5:40:40,  3.01s/it][A
Training...:  51% 7107/13907 [4:24:39<5:37:29,  2.98s/it][A
Training...:  51% 7108/13907 [4:24:42<5:30:47,  2.92s/it][A
Training...:  51% 7109/13907 [4:24:44<5:24:40,  2.87s/it][A
Training...:  51% 7110/13907 [4:24:47<5:17:50,  2.81s/it][A
Training...:  51% 7111/13907 [4:24:50<5:12:31,  2.76s/it][A
Training...:  51% 7112/13907 [4:24:52<5:07:08,  2.71s/it][A
Training...:  51% 7113/13907 [4:24:55<5:01:48,  2.67s/it][A
Training...:  51% 7114/13907 [4:24:57<4:56:30,  2.62s/it][A
Training...:  51% 7115/13907 [4:25:00<4:51:22,  2.57s/it][A
Training...:  51% 7116/13907 [4:25:02<4:47:36,  2.54s/it][A
Training...:  51% 7117/13907 [4:25:05<4:44:22,  2.51s/it][A
Training...:  51% 7118/13907 [4:25:07<4:40:53,  2.48s/it][A
Training...:  51% 7119/13907 [4:25:10<4:37:10,  2.45s/it][A
Training...:  51% 7120/13907 [4:25:12<4:33:10,  2.41s/it][A
Training...:  51% 7121/13907 [4:25:14<4:29:38,  2.38s/it][A
Training...:  51% 7122/13907 [4:25:17<4:25:36,  2.35s/it][A
Training...:  51% 7123/13907 [4:25:19<4:21:25,  2.31s/it][A
Training...:  51% 7124/13907 [4:25:21<4:17:03,  2.27s/it][A
Training...:  51% 7125/13907 [4:25:23<4:14:03,  2.25s/it][A
Training...:  51% 7126/13907 [4:25:25<4:10:28,  2.22s/it][A
Training...:  51% 7127/13907 [4:25:27<4:06:37,  2.18s/it][A
Training...:  51% 7128/13907 [4:25:29<4:03:14,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:56:04<8:52:18, 31938.93s/it]
Training...:  51% 7128/13907 [4:25:32<4:03:14,  2.15s/it][A
Training...:  51% 7129/13907 [4:25:32<4:10:48,  2.22s/it][A
Training...:  51% 7130/13907 [4:25:34<4:06:44,  2.18s/it][A
Training...:  51% 7131/13907 [4:25:36<4:00:27,  2.13s/it][A
Training...:  51% 7132/13907 [4:25:38<3:54:30,  2.08s/it][A
Training...:  51% 7133/13907 [4:25:40<3:49:57,  2.04s/it][A
Training...:  51% 7134/13907 [4:25:42<3:47:34,  2.02s/it][A
Training...:  51% 7135/13907 [4:25:44<3:43:50,  1.98s/it][A
Training...:  51% 7136/13907 [4:25:46<3:39:21,  1.94s/it][A
Training...:  51% 7137/13907 [4:25:47<3:35:29,  1.91s/it][A
Training...:  51% 7138/13907 [4:25:49<3:31:35,  1.88s/it][A
Training...:  51% 7139/13907 [4:25:51<3:28:18,  1.85s/it][A
Training...:  51% 7140/13907 [4:25:53<3:25:56,  1.83s/it][A
Training...:  51% 7141/13907 [4:25:55<3:23:04,  1.80s/it][A
Training...:  51% 7142/13907 [4:25:56<3:17:49,  1.75s/it][A
Training...:  51% 7143/13907 [4:25:58<3:13:16,  1.71s/it][A
Training...:  51% 7144/13907 [4:25:59<3:09:06,  1.68s/it][A
Training...:  51% 7145/13907 [4:26:01<3:03:14,  1.63s/it][A
Training...:  51% 7146/13907 [4:26:02<2:57:13,  1.57s/it][A
Training...:  51% 7147/13907 [4:26:04<2:50:55,  1.52s/it][A
Training...:  51% 7148/13907 [4:26:05<2:44:27,  1.46s/it][A
Training...:  51% 7149/13907 [4:26:06<2:36:33,  1.39s/it][A
Training...:  51% 7150/13907 [4:26:07<2:24:28,  1.28s/it][A
Training...:  51% 7151/13907 [4:26:11<3:45:28,  2.00s/it][A
Training...:  51% 7152/13907 [4:26:14<4:34:04,  2.43s/it][A
Training...:  51% 7153/13907 [4:26:18<5:01:30,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:56:53<8:52:18, 31938.93s/it]
Training...:  51% 7153/13907 [4:26:21<5:01:30,  2.68s/it][A
Training...:  51% 7154/13907 [4:26:21<5:33:40,  2.96s/it][A
Training...:  51% 7155/13907 [4:26:24<5:39:11,  3.01s/it][A
Training...:  51% 7156/13907 [4:26:27<5:36:56,  2.99s/it][A
Training...:  51% 7157/13907 [4:26:30<5:32:10,  2.95s/it][A
Training...:  51% 7158/13907 [4:26:33<5:26:47,  2.91s/it][A
Training...:  51% 7159/13907 [4:26:36<5:21:37,  2.86s/it][A
Training...:  51% 7160/13907 [4:26:39<5:16:45,  2.82s/it][A
Training...:  51% 7161/13907 [4:26:41<5:13:01,  2.78s/it][A
Training...:  51% 7162/13907 [4:26:44<5:07:29,  2.74s/it][A
Training...:  52% 7163/13907 [4:26:46<5:01:32,  2.68s/it][A
Training...:  52% 7164/13907 [4:26:49<4:57:02,  2.64s/it][A
Training...:  52% 7165/13907 [4:26:51<4:52:00,  2.60s/it][A
Training...:  52% 7166/13907 [4:26:54<4:47:02,  2.55s/it][A
Training...:  52% 7167/13907 [4:26:56<4:42:30,  2.51s/it][A
Training...:  52% 7168/13907 [4:26:59<4:38:08,  2.48s/it][A
Training...:  52% 7169/13907 [4:27:01<4:34:13,  2.44s/it][A
Training...:  52% 7170/13907 [4:27:03<4:30:24,  2.41s/it][A
Training...:  52% 7171/13907 [4:27:06<4:27:14,  2.38s/it][A
Training...:  52% 7172/13907 [4:27:08<4:23:54,  2.35s/it][A
Training...:  52% 7173/13907 [4:27:10<4:22:50,  2.34s/it][A
Training...:  52% 7174/13907 [4:27:13<4:19:30,  2.31s/it][A
Training...:  52% 7175/13907 [4:27:15<4:15:26,  2.28s/it][A
Training...:  52% 7176/13907 [4:27:17<4:10:59,  2.24s/it][A
Training...:  52% 7177/13907 [4:27:19<4:07:16,  2.20s/it][A
Training...:  52% 7178/13907 [4:27:21<4:03:06,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:57:56<8:52:18, 31938.93s/it]
Training...:  52% 7178/13907 [4:27:23<4:03:06,  2.17s/it][A
Training...:  52% 7179/13907 [4:27:23<4:09:53,  2.23s/it][A
Training...:  52% 7180/13907 [4:27:26<4:05:39,  2.19s/it][A
Training...:  52% 7181/13907 [4:27:28<4:00:07,  2.14s/it][A
Training...:  52% 7182/13907 [4:27:30<3:54:31,  2.09s/it][A
Training...:  52% 7183/13907 [4:27:32<3:50:28,  2.06s/it][A
Training...:  52% 7184/13907 [4:27:33<3:45:47,  2.02s/it][A
Training...:  52% 7185/13907 [4:27:35<3:41:46,  1.98s/it][A
Training...:  52% 7186/13907 [4:27:37<3:37:36,  1.94s/it][A
Training...:  52% 7187/13907 [4:27:39<3:33:34,  1.91s/it][A
Training...:  52% 7188/13907 [4:27:41<3:30:11,  1.88s/it][A
Training...:  52% 7189/13907 [4:27:43<3:27:24,  1.85s/it][A
Training...:  52% 7190/13907 [4:27:44<3:23:49,  1.82s/it][A
Training...:  52% 7191/13907 [4:27:46<3:20:28,  1.79s/it][A
Training...:  52% 7192/13907 [4:27:48<3:16:34,  1.76s/it][A
Training...:  52% 7193/13907 [4:27:49<3:12:27,  1.72s/it][A
Training...:  52% 7194/13907 [4:27:51<3:08:08,  1.68s/it][A
Training...:  52% 7195/13907 [4:27:53<3:03:26,  1.64s/it][A
Training...:  52% 7196/13907 [4:27:54<2:56:59,  1.58s/it][A
Training...:  52% 7197/13907 [4:27:55<2:50:03,  1.52s/it][A
Training...:  52% 7198/13907 [4:27:57<2:42:19,  1.45s/it][A
Training...:  52% 7199/13907 [4:27:58<2:34:43,  1.38s/it][A
Training...:  52% 7200/13907 [4:27:59<2:23:50,  1.29s/it][A
Training...:  52% 7201/13907 [4:28:03<3:43:58,  2.00s/it][A
Training...:  52% 7202/13907 [4:28:06<4:34:09,  2.45s/it][A
Training...:  52% 7203/13907 [4:28:09<5:00:47,  2.69s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:58:45<8:52:18, 31938.93s/it]
Training...:  52% 7203/13907 [4:28:13<5:00:47,  2.69s/it][A
Training...:  52% 7204/13907 [4:28:13<5:32:19,  2.97s/it][A
Training...:  52% 7205/13907 [4:28:16<5:39:26,  3.04s/it][A
Training...:  52% 7206/13907 [4:28:19<5:37:25,  3.02s/it][A
Training...:  52% 7207/13907 [4:28:22<5:33:04,  2.98s/it][A
Training...:  52% 7208/13907 [4:28:25<5:28:16,  2.94s/it][A
Training...:  52% 7209/13907 [4:28:28<5:22:40,  2.89s/it][A
Training...:  52% 7210/13907 [4:28:30<5:16:02,  2.83s/it][A
Training...:  52% 7211/13907 [4:28:33<5:11:30,  2.79s/it][A
Training...:  52% 7212/13907 [4:28:36<5:06:43,  2.75s/it][A
Training...:  52% 7213/13907 [4:28:38<5:03:40,  2.72s/it][A
Training...:  52% 7214/13907 [4:28:41<5:01:00,  2.70s/it][A
Training...:  52% 7215/13907 [4:28:44<4:55:37,  2.65s/it][A
Training...:  52% 7216/13907 [4:28:46<4:48:38,  2.59s/it][A
Training...:  52% 7217/13907 [4:28:48<4:43:33,  2.54s/it][A
Training...:  52% 7218/13907 [4:28:51<4:38:05,  2.49s/it][A
Training...:  52% 7219/13907 [4:28:53<4:33:54,  2.46s/it][A
Training...:  52% 7220/13907 [4:28:56<4:30:14,  2.42s/it][A
Training...:  52% 7221/13907 [4:28:58<4:26:32,  2.39s/it][A
Training...:  52% 7222/13907 [4:29:00<4:22:19,  2.35s/it][A
Training...:  52% 7223/13907 [4:29:02<4:18:23,  2.32s/it][A
Training...:  52% 7224/13907 [4:29:05<4:15:07,  2.29s/it][A
Training...:  52% 7225/13907 [4:29:07<4:11:24,  2.26s/it][A
Training...:  52% 7226/13907 [4:29:09<4:07:26,  2.22s/it][A
Training...:  52% 7227/13907 [4:29:11<4:04:15,  2.19s/it][A
Training...:  52% 7228/13907 [4:29:13<3:59:59,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [30:59:48<8:52:18, 31938.93s/it]
Training...:  52% 7228/13907 [4:29:16<3:59:59,  2.16s/it][A
Training...:  52% 7229/13907 [4:29:16<4:07:53,  2.23s/it][A
Training...:  52% 7230/13907 [4:29:18<4:03:31,  2.19s/it][A
Training...:  52% 7231/13907 [4:29:20<3:58:18,  2.14s/it][A
Training...:  52% 7232/13907 [4:29:22<3:52:28,  2.09s/it][A
Training...:  52% 7233/13907 [4:29:24<3:47:47,  2.05s/it][A
Training...:  52% 7234/13907 [4:29:25<3:43:46,  2.01s/it][A
Training...:  52% 7235/13907 [4:29:27<3:39:04,  1.97s/it][A
Training...:  52% 7236/13907 [4:29:29<3:34:39,  1.93s/it][A
Training...:  52% 7237/13907 [4:29:31<3:31:35,  1.90s/it][A
Training...:  52% 7238/13907 [4:29:33<3:27:51,  1.87s/it][A
Training...:  52% 7239/13907 [4:29:35<3:25:20,  1.85s/it][A
Training...:  52% 7240/13907 [4:29:36<3:22:14,  1.82s/it][A
Training...:  52% 7241/13907 [4:29:38<3:19:20,  1.79s/it][A
Training...:  52% 7242/13907 [4:29:40<3:14:56,  1.75s/it][A
Training...:  52% 7243/13907 [4:29:41<3:11:17,  1.72s/it][A
Training...:  52% 7244/13907 [4:29:43<3:07:02,  1.68s/it][A
Training...:  52% 7245/13907 [4:29:45<3:03:11,  1.65s/it][A
Training...:  52% 7246/13907 [4:29:46<2:58:31,  1.61s/it][A
Training...:  52% 7247/13907 [4:29:48<2:53:18,  1.56s/it][A
Training...:  52% 7248/13907 [4:29:49<2:45:50,  1.49s/it][A
Training...:  52% 7249/13907 [4:29:50<2:37:53,  1.42s/it][A
Training...:  52% 7250/13907 [4:29:51<2:26:07,  1.32s/it][A
Training...:  52% 7251/13907 [4:29:55<3:49:54,  2.07s/it][A
Training...:  52% 7252/13907 [4:29:59<4:40:10,  2.53s/it][A
Training...:  52% 7253/13907 [4:30:02<5:05:08,  2.75s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:00:38<8:52:18, 31938.93s/it]
Training...:  52% 7253/13907 [4:30:06<5:05:08,  2.75s/it][A
Training...:  52% 7254/13907 [4:30:06<5:36:00,  3.03s/it][A
Training...:  52% 7255/13907 [4:30:09<5:39:01,  3.06s/it][A
Training...:  52% 7256/13907 [4:30:12<5:34:55,  3.02s/it][A
Training...:  52% 7257/13907 [4:30:15<5:30:43,  2.98s/it][A
Training...:  52% 7258/13907 [4:30:17<5:24:58,  2.93s/it][A
Training...:  52% 7259/13907 [4:30:20<5:20:06,  2.89s/it][A
Training...:  52% 7260/13907 [4:30:23<5:14:31,  2.84s/it][A
Training...:  52% 7261/13907 [4:30:26<5:10:49,  2.81s/it][A
Training...:  52% 7262/13907 [4:30:28<5:05:56,  2.76s/it][A
Training...:  52% 7263/13907 [4:30:31<5:00:50,  2.72s/it][A
Training...:  52% 7264/13907 [4:30:33<4:56:35,  2.68s/it][A
Training...:  52% 7265/13907 [4:30:36<4:51:31,  2.63s/it][A
Training...:  52% 7266/13907 [4:30:38<4:45:42,  2.58s/it][A
Training...:  52% 7267/13907 [4:30:41<4:41:31,  2.54s/it][A
Training...:  52% 7268/13907 [4:30:43<4:36:26,  2.50s/it][A
Training...:  52% 7269/13907 [4:30:46<4:35:06,  2.49s/it][A
Training...:  52% 7270/13907 [4:30:48<4:31:39,  2.46s/it][A
Training...:  52% 7271/13907 [4:30:50<4:27:17,  2.42s/it][A
Training...:  52% 7272/13907 [4:30:53<4:22:52,  2.38s/it][A
Training...:  52% 7273/13907 [4:30:55<4:17:20,  2.33s/it][A
Training...:  52% 7274/13907 [4:30:57<4:12:35,  2.28s/it][A
Training...:  52% 7275/13907 [4:30:59<4:09:12,  2.25s/it][A
Training...:  52% 7276/13907 [4:31:01<4:05:18,  2.22s/it][A
Training...:  52% 7277/13907 [4:31:04<4:02:29,  2.19s/it][A
Training...:  52% 7278/13907 [4:31:06<3:58:25,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:01:40<8:52:18, 31938.93s/it]
Training...:  52% 7278/13907 [4:31:08<3:58:25,  2.16s/it][A
Training...:  52% 7279/13907 [4:31:08<4:05:30,  2.22s/it][A
Training...:  52% 7280/13907 [4:31:10<4:01:41,  2.19s/it][A
Training...:  52% 7281/13907 [4:31:12<3:56:53,  2.15s/it][A
Training...:  52% 7282/13907 [4:31:14<3:51:31,  2.10s/it][A
Training...:  52% 7283/13907 [4:31:16<3:46:37,  2.05s/it][A
Training...:  52% 7284/13907 [4:31:18<3:41:29,  2.01s/it][A
Training...:  52% 7285/13907 [4:31:20<3:37:12,  1.97s/it][A
Training...:  52% 7286/13907 [4:31:22<3:32:54,  1.93s/it][A
Training...:  52% 7287/13907 [4:31:24<3:29:15,  1.90s/it][A
Training...:  52% 7288/13907 [4:31:25<3:25:33,  1.86s/it][A
Training...:  52% 7289/13907 [4:31:27<3:21:19,  1.83s/it][A
Training...:  52% 7290/13907 [4:31:29<3:17:18,  1.79s/it][A
Training...:  52% 7291/13907 [4:31:31<3:13:56,  1.76s/it][A
Training...:  52% 7292/13907 [4:31:32<3:09:53,  1.72s/it][A
Training...:  52% 7293/13907 [4:31:34<3:06:16,  1.69s/it][A
Training...:  52% 7294/13907 [4:31:35<3:01:52,  1.65s/it][A
Training...:  52% 7295/13907 [4:31:37<2:58:21,  1.62s/it][A
Training...:  52% 7296/13907 [4:31:38<2:53:48,  1.58s/it][A
Training...:  52% 7297/13907 [4:31:40<2:48:24,  1.53s/it][A
Training...:  52% 7298/13907 [4:31:41<2:42:00,  1.47s/it][A
Training...:  52% 7299/13907 [4:31:42<2:35:06,  1.41s/it][A
Training...:  52% 7300/13907 [4:31:43<2:23:15,  1.30s/it][A
Training...:  52% 7301/13907 [4:31:47<3:45:04,  2.04s/it][A
Training...:  53% 7302/13907 [4:31:51<4:33:15,  2.48s/it][A
Training...:  53% 7303/13907 [4:31:54<5:00:48,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:02:30<8:52:18, 31938.93s/it]
Training...:  53% 7303/13907 [4:31:58<5:00:48,  2.73s/it][A
Training...:  53% 7304/13907 [4:31:58<5:33:40,  3.03s/it][A
Training...:  53% 7305/13907 [4:32:01<5:37:36,  3.07s/it][A
Training...:  53% 7306/13907 [4:32:04<5:32:53,  3.03s/it][A
Training...:  53% 7307/13907 [4:32:07<5:27:15,  2.98s/it][A
Training...:  53% 7308/13907 [4:32:09<5:21:13,  2.92s/it][A
Training...:  53% 7309/13907 [4:32:12<5:14:44,  2.86s/it][A
Training...:  53% 7310/13907 [4:32:15<5:08:36,  2.81s/it][A
Training...:  53% 7311/13907 [4:32:17<5:02:23,  2.75s/it][A
Training...:  53% 7312/13907 [4:32:20<4:57:27,  2.71s/it][A
Training...:  53% 7313/13907 [4:32:23<4:51:41,  2.65s/it][A
Training...:  53% 7314/13907 [4:32:25<4:47:07,  2.61s/it][A
Training...:  53% 7315/13907 [4:32:28<4:43:00,  2.58s/it][A
Training...:  53% 7316/13907 [4:32:30<4:38:44,  2.54s/it][A
Training...:  53% 7317/13907 [4:32:32<4:34:12,  2.50s/it][A
Training...:  53% 7318/13907 [4:32:35<4:30:39,  2.46s/it][A
Training...:  53% 7319/13907 [4:32:37<4:26:43,  2.43s/it][A
Training...:  53% 7320/13907 [4:32:40<4:23:22,  2.40s/it][A
Training...:  53% 7321/13907 [4:32:42<4:19:23,  2.36s/it][A
Training...:  53% 7322/13907 [4:32:44<4:15:49,  2.33s/it][A
Training...:  53% 7323/13907 [4:32:46<4:12:49,  2.30s/it][A
Training...:  53% 7324/13907 [4:32:48<4:08:33,  2.27s/it][A
Training...:  53% 7325/13907 [4:32:51<4:06:23,  2.25s/it][A
Training...:  53% 7326/13907 [4:32:53<4:02:53,  2.21s/it][A
Training...:  53% 7327/13907 [4:32:55<3:59:06,  2.18s/it][A
Training...:  53% 7328/13907 [4:32:57<3:54:46,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:03:31<8:52:18, 31938.93s/it]
Training...:  53% 7328/13907 [4:32:59<3:54:46,  2.14s/it][A
Training...:  53% 7329/13907 [4:32:59<4:03:04,  2.22s/it][A
Training...:  53% 7330/13907 [4:33:01<3:59:35,  2.19s/it][A
Training...:  53% 7331/13907 [4:33:03<3:53:18,  2.13s/it][A
Training...:  53% 7332/13907 [4:33:05<3:48:53,  2.09s/it][A
Training...:  53% 7333/13907 [4:33:07<3:44:45,  2.05s/it][A
Training...:  53% 7334/13907 [4:33:09<3:41:57,  2.03s/it][A
Training...:  53% 7335/13907 [4:33:11<3:38:29,  1.99s/it][A
Training...:  53% 7336/13907 [4:33:13<3:33:28,  1.95s/it][A
Training...:  53% 7337/13907 [4:33:15<3:28:59,  1.91s/it][A
Training...:  53% 7338/13907 [4:33:17<3:24:15,  1.87s/it][A
Training...:  53% 7339/13907 [4:33:18<3:19:58,  1.83s/it][A
Training...:  53% 7340/13907 [4:33:20<3:15:44,  1.79s/it][A
Training...:  53% 7341/13907 [4:33:22<3:10:59,  1.75s/it][A
Training...:  53% 7342/13907 [4:33:23<3:06:30,  1.70s/it][A
Training...:  53% 7343/13907 [4:33:25<3:02:11,  1.67s/it][A
Training...:  53% 7344/13907 [4:33:27<2:58:06,  1.63s/it][A
Training...:  53% 7345/13907 [4:33:28<2:52:44,  1.58s/it][A
Training...:  53% 7346/13907 [4:33:29<2:47:33,  1.53s/it][A
Training...:  53% 7347/13907 [4:33:31<2:42:17,  1.48s/it][A
Training...:  53% 7348/13907 [4:33:32<2:36:12,  1.43s/it][A
Training...:  53% 7349/13907 [4:33:33<2:29:09,  1.36s/it][A
Training...:  53% 7350/13907 [4:33:34<2:18:50,  1.27s/it][A
Training...:  53% 7351/13907 [4:33:38<3:38:10,  2.00s/it][A
Training...:  53% 7352/13907 [4:33:42<4:25:19,  2.43s/it][A
Training...:  53% 7353/13907 [4:33:45<4:51:22,  2.67s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:04:20<8:52:18, 31938.93s/it]
Training...:  53% 7353/13907 [4:33:48<4:51:22,  2.67s/it][A
Training...:  53% 7354/13907 [4:33:48<5:21:36,  2.94s/it][A
Training...:  53% 7355/13907 [4:33:51<5:27:24,  3.00s/it][A
Training...:  53% 7356/13907 [4:33:54<5:23:43,  2.97s/it][A
Training...:  53% 7357/13907 [4:33:57<5:19:18,  2.92s/it][A
Training...:  53% 7358/13907 [4:34:00<5:16:06,  2.90s/it][A
Training...:  53% 7359/13907 [4:34:03<5:10:17,  2.84s/it][A
Training...:  53% 7360/13907 [4:34:05<5:04:48,  2.79s/it][A
Training...:  53% 7361/13907 [4:34:08<4:59:32,  2.75s/it][A
Training...:  53% 7362/13907 [4:34:11<4:53:16,  2.69s/it][A
Training...:  53% 7363/13907 [4:34:13<4:47:09,  2.63s/it][A
Training...:  53% 7364/13907 [4:34:16<4:42:40,  2.59s/it][A
Training...:  53% 7365/13907 [4:34:18<4:38:31,  2.55s/it][A
Training...:  53% 7366/13907 [4:34:21<4:36:11,  2.53s/it][A
Training...:  53% 7367/13907 [4:34:23<4:34:23,  2.52s/it][A
Training...:  53% 7368/13907 [4:34:25<4:31:07,  2.49s/it][A
Training...:  53% 7369/13907 [4:34:28<4:26:19,  2.44s/it][A
Training...:  53% 7370/13907 [4:34:30<4:22:41,  2.41s/it][A
Training...:  53% 7371/13907 [4:34:32<4:18:40,  2.37s/it][A
Training...:  53% 7372/13907 [4:34:35<4:14:27,  2.34s/it][A
Training...:  53% 7373/13907 [4:34:37<4:10:21,  2.30s/it][A
Training...:  53% 7374/13907 [4:34:39<4:06:19,  2.26s/it][A
Training...:  53% 7375/13907 [4:34:41<4:02:10,  2.22s/it][A
Training...:  53% 7376/13907 [4:34:43<3:58:24,  2.19s/it][A
Training...:  53% 7377/13907 [4:34:45<3:54:24,  2.15s/it][A
Training...:  53% 7378/13907 [4:34:47<3:50:33,  2.12s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:05:22<8:52:18, 31938.93s/it]
Training...:  53% 7378/13907 [4:34:50<3:50:33,  2.12s/it][A
Training...:  53% 7379/13907 [4:34:50<3:57:36,  2.18s/it][A
Training...:  53% 7380/13907 [4:34:52<3:54:02,  2.15s/it][A
Training...:  53% 7381/13907 [4:34:54<3:48:10,  2.10s/it][A
Training...:  53% 7382/13907 [4:34:56<3:43:10,  2.05s/it][A
Training...:  53% 7383/13907 [4:34:58<3:39:05,  2.01s/it][A
Training...:  53% 7384/13907 [4:35:00<3:34:27,  1.97s/it][A
Training...:  53% 7385/13907 [4:35:01<3:30:44,  1.94s/it][A
Training...:  53% 7386/13907 [4:35:03<3:26:55,  1.90s/it][A
Training...:  53% 7387/13907 [4:35:05<3:23:07,  1.87s/it][A
Training...:  53% 7388/13907 [4:35:07<3:19:50,  1.84s/it][A
Training...:  53% 7389/13907 [4:35:08<3:16:12,  1.81s/it][A
Training...:  53% 7390/13907 [4:35:10<3:12:31,  1.77s/it][A
Training...:  53% 7391/13907 [4:35:12<3:09:05,  1.74s/it][A
Training...:  53% 7392/13907 [4:35:13<3:05:31,  1.71s/it][A
Training...:  53% 7393/13907 [4:35:15<3:01:59,  1.68s/it][A
Training...:  53% 7394/13907 [4:35:17<2:57:45,  1.64s/it][A
Training...:  53% 7395/13907 [4:35:18<2:53:27,  1.60s/it][A
Training...:  53% 7396/13907 [4:35:20<2:48:31,  1.55s/it][A
Training...:  53% 7397/13907 [4:35:21<2:43:04,  1.50s/it][A
Training...:  53% 7398/13907 [4:35:22<2:37:27,  1.45s/it][A
Training...:  53% 7399/13907 [4:35:24<2:30:49,  1.39s/it][A
Training...:  53% 7400/13907 [4:35:25<2:20:44,  1.30s/it][A
Training...:  53% 7401/13907 [4:35:28<3:42:01,  2.05s/it][A
Training...:  53% 7402/13907 [4:35:32<4:29:14,  2.48s/it][A
Training...:  53% 7403/13907 [4:35:35<4:54:59,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:06:11<8:52:18, 31938.93s/it]
Training...:  53% 7403/13907 [4:35:39<4:54:59,  2.72s/it][A
Training...:  53% 7404/13907 [4:35:39<5:23:52,  2.99s/it][A
Training...:  53% 7405/13907 [4:35:42<5:32:01,  3.06s/it][A
Training...:  53% 7406/13907 [4:35:45<5:31:07,  3.06s/it][A
Training...:  53% 7407/13907 [4:35:48<5:27:04,  3.02s/it][A
Training...:  53% 7408/13907 [4:35:51<5:20:39,  2.96s/it][A
Training...:  53% 7409/13907 [4:35:54<5:14:28,  2.90s/it][A
Training...:  53% 7410/13907 [4:35:56<5:07:14,  2.84s/it][A
Training...:  53% 7411/13907 [4:35:59<5:01:07,  2.78s/it][A
Training...:  53% 7412/13907 [4:36:02<4:54:19,  2.72s/it][A
Training...:  53% 7413/13907 [4:36:04<4:49:03,  2.67s/it][A
Training...:  53% 7414/13907 [4:36:07<4:44:11,  2.63s/it][A
Training...:  53% 7415/13907 [4:36:09<4:38:41,  2.58s/it][A
Training...:  53% 7416/13907 [4:36:12<4:34:36,  2.54s/it][A
Training...:  53% 7417/13907 [4:36:14<4:30:17,  2.50s/it][A
Training...:  53% 7418/13907 [4:36:16<4:25:35,  2.46s/it][A
Training...:  53% 7419/13907 [4:36:19<4:21:55,  2.42s/it][A
Training...:  53% 7420/13907 [4:36:21<4:19:11,  2.40s/it][A
Training...:  53% 7421/13907 [4:36:23<4:14:57,  2.36s/it][A
Training...:  53% 7422/13907 [4:36:25<4:11:06,  2.32s/it][A
Training...:  53% 7423/13907 [4:36:28<4:07:44,  2.29s/it][A
Training...:  53% 7424/13907 [4:36:30<4:04:51,  2.27s/it][A
Training...:  53% 7425/13907 [4:36:32<4:00:54,  2.23s/it][A
Training...:  53% 7426/13907 [4:36:34<3:57:59,  2.20s/it][A
Training...:  53% 7427/13907 [4:36:36<3:54:27,  2.17s/it][A
Training...:  53% 7428/13907 [4:36:38<3:50:58,  2.14s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:07:13<8:52:18, 31938.93s/it]
Training...:  53% 7428/13907 [4:36:41<3:50:58,  2.14s/it][A
Training...:  53% 7429/13907 [4:36:41<3:57:30,  2.20s/it][A
Training...:  53% 7430/13907 [4:36:43<3:53:24,  2.16s/it][A
Training...:  53% 7431/13907 [4:36:45<3:47:53,  2.11s/it][A
Training...:  53% 7432/13907 [4:36:47<3:42:45,  2.06s/it][A
Training...:  53% 7433/13907 [4:36:49<3:38:25,  2.02s/it][A
Training...:  53% 7434/13907 [4:36:51<3:35:01,  1.99s/it][A
Training...:  53% 7435/13907 [4:36:52<3:32:30,  1.97s/it][A
Training...:  53% 7436/13907 [4:36:54<3:29:31,  1.94s/it][A
Training...:  53% 7437/13907 [4:36:56<3:25:02,  1.90s/it][A
Training...:  53% 7438/13907 [4:36:58<3:20:55,  1.86s/it][A
Training...:  53% 7439/13907 [4:37:00<3:16:46,  1.83s/it][A
Training...:  53% 7440/13907 [4:37:01<3:13:02,  1.79s/it][A
Training...:  54% 7441/13907 [4:37:03<3:08:59,  1.75s/it][A
Training...:  54% 7442/13907 [4:37:05<3:04:49,  1.72s/it][A
Training...:  54% 7443/13907 [4:37:06<3:00:55,  1.68s/it][A
Training...:  54% 7444/13907 [4:37:08<2:57:19,  1.65s/it][A
Training...:  54% 7445/13907 [4:37:09<2:52:16,  1.60s/it][A
Training...:  54% 7446/13907 [4:37:11<2:47:34,  1.56s/it][A
Training...:  54% 7447/13907 [4:37:12<2:42:11,  1.51s/it][A
Training...:  54% 7448/13907 [4:37:13<2:36:11,  1.45s/it][A
Training...:  54% 7449/13907 [4:37:15<2:29:48,  1.39s/it][A
Training...:  54% 7450/13907 [4:37:16<2:20:38,  1.31s/it][A
Training...:  54% 7451/13907 [4:37:20<3:41:02,  2.05s/it][A
Training...:  54% 7452/13907 [4:37:23<4:26:02,  2.47s/it][A
Training...:  54% 7453/13907 [4:37:26<4:49:39,  2.69s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:08:02<8:52:18, 31938.93s/it]
Training...:  54% 7453/13907 [4:37:30<4:49:39,  2.69s/it][A
Training...:  54% 7454/13907 [4:37:30<5:18:07,  2.96s/it][A
Training...:  54% 7455/13907 [4:37:33<5:22:54,  3.00s/it][A
Training...:  54% 7456/13907 [4:37:36<5:19:34,  2.97s/it][A
Training...:  54% 7457/13907 [4:37:39<5:15:20,  2.93s/it][A
Training...:  54% 7458/13907 [4:37:42<5:12:04,  2.90s/it][A
Training...:  54% 7459/13907 [4:37:44<5:05:55,  2.85s/it][A
Training...:  54% 7460/13907 [4:37:47<5:01:16,  2.80s/it][A
Training...:  54% 7461/13907 [4:37:50<4:57:26,  2.77s/it][A
Training...:  54% 7462/13907 [4:37:52<4:52:37,  2.72s/it][A
Training...:  54% 7463/13907 [4:37:55<4:47:57,  2.68s/it][A
Training...:  54% 7464/13907 [4:37:57<4:43:11,  2.64s/it][A
Training...:  54% 7465/13907 [4:38:00<4:39:12,  2.60s/it][A
Training...:  54% 7466/13907 [4:38:02<4:33:54,  2.55s/it][A
Training...:  54% 7467/13907 [4:38:05<4:29:40,  2.51s/it][A
Training...:  54% 7468/13907 [4:38:07<4:26:59,  2.49s/it][A
Training...:  54% 7469/13907 [4:38:10<4:25:12,  2.47s/it][A
Training...:  54% 7470/13907 [4:38:12<4:21:21,  2.44s/it][A
Training...:  54% 7471/13907 [4:38:14<4:16:35,  2.39s/it][A
Training...:  54% 7472/13907 [4:38:17<4:11:45,  2.35s/it][A
Training...:  54% 7473/13907 [4:38:19<4:07:54,  2.31s/it][A
Training...:  54% 7474/13907 [4:38:21<4:03:21,  2.27s/it][A
Training...:  54% 7475/13907 [4:38:23<3:58:49,  2.23s/it][A
Training...:  54% 7476/13907 [4:38:25<3:55:52,  2.20s/it][A
Training...:  54% 7477/13907 [4:38:27<3:53:04,  2.17s/it][A
Training...:  54% 7478/13907 [4:38:29<3:50:08,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:09:04<8:52:18, 31938.93s/it]
Training...:  54% 7478/13907 [4:38:32<3:50:08,  2.15s/it][A
Training...:  54% 7479/13907 [4:38:32<3:57:31,  2.22s/it][A
Training...:  54% 7480/13907 [4:38:34<3:53:29,  2.18s/it][A
Training...:  54% 7481/13907 [4:38:36<3:47:32,  2.12s/it][A
Training...:  54% 7482/13907 [4:38:38<3:41:12,  2.07s/it][A
Training...:  54% 7483/13907 [4:38:40<3:36:10,  2.02s/it][A
Training...:  54% 7484/13907 [4:38:42<3:31:53,  1.98s/it][A
Training...:  54% 7485/13907 [4:38:43<3:28:02,  1.94s/it][A
Training...:  54% 7486/13907 [4:38:45<3:23:55,  1.91s/it][A
Training...:  54% 7487/13907 [4:38:47<3:20:10,  1.87s/it][A
Training...:  54% 7488/13907 [4:38:49<3:16:23,  1.84s/it][A
Training...:  54% 7489/13907 [4:38:51<3:12:13,  1.80s/it][A
Training...:  54% 7490/13907 [4:38:52<3:08:44,  1.76s/it][A
Training...:  54% 7491/13907 [4:38:54<3:04:36,  1.73s/it][A
Training...:  54% 7492/13907 [4:38:55<3:01:10,  1.69s/it][A
Training...:  54% 7493/13907 [4:38:57<2:57:26,  1.66s/it][A
Training...:  54% 7494/13907 [4:38:59<2:53:55,  1.63s/it][A
Training...:  54% 7495/13907 [4:39:00<2:48:51,  1.58s/it][A
Training...:  54% 7496/13907 [4:39:02<2:43:51,  1.53s/it][A
Training...:  54% 7497/13907 [4:39:03<2:38:21,  1.48s/it][A
Training...:  54% 7498/13907 [4:39:04<2:32:25,  1.43s/it][A
Training...:  54% 7499/13907 [4:39:05<2:25:12,  1.36s/it][A
Training...:  54% 7500/13907 [4:39:06<2:15:12,  1.27s/it][A
Training...:  54% 7501/13907 [4:39:10<3:32:21,  1.99s/it][A
Training...:  54% 7502/13907 [4:39:14<4:19:55,  2.43s/it][A
Training...:  54% 7503/13907 [4:39:17<4:45:20,  2.67s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:09:52<8:52:18, 31938.93s/it]
Training...:  54% 7503/13907 [4:39:20<4:45:20,  2.67s/it][A
Training...:  54% 7504/13907 [4:39:20<5:15:14,  2.95s/it][A
Training...:  54% 7505/13907 [4:39:24<5:21:58,  3.02s/it][A
Training...:  54% 7506/13907 [4:39:27<5:20:00,  3.00s/it][A
Training...:  54% 7507/13907 [4:39:29<5:18:51,  2.99s/it][A
Training...:  54% 7508/13907 [4:39:32<5:14:16,  2.95s/it][A
Training...:  54% 7509/13907 [4:39:35<5:08:38,  2.89s/it][A
Training...:  54% 7510/13907 [4:39:38<5:02:56,  2.84s/it][A
Training...:  54% 7511/13907 [4:39:41<4:59:04,  2.81s/it][A
Training...:  54% 7512/13907 [4:39:43<4:53:33,  2.75s/it][A
Training...:  54% 7513/13907 [4:39:46<4:49:23,  2.72s/it][A
Training...:  54% 7514/13907 [4:39:48<4:45:54,  2.68s/it][A
Training...:  54% 7515/13907 [4:39:51<4:42:53,  2.66s/it][A
Training...:  54% 7516/13907 [4:39:54<4:38:14,  2.61s/it][A
Training...:  54% 7517/13907 [4:39:56<4:33:21,  2.57s/it][A
Training...:  54% 7518/13907 [4:39:58<4:28:15,  2.52s/it][A
Training...:  54% 7519/13907 [4:40:01<4:23:45,  2.48s/it][A
Training...:  54% 7520/13907 [4:40:03<4:19:10,  2.43s/it][A
Training...:  54% 7521/13907 [4:40:05<4:15:26,  2.40s/it][A
Training...:  54% 7522/13907 [4:40:08<4:11:50,  2.37s/it][A
Training...:  54% 7523/13907 [4:40:10<4:07:20,  2.32s/it][A
Training...:  54% 7524/13907 [4:40:12<4:03:28,  2.29s/it][A
Training...:  54% 7525/13907 [4:40:14<3:59:33,  2.25s/it][A
Training...:  54% 7526/13907 [4:40:16<3:55:50,  2.22s/it][A
Training...:  54% 7527/13907 [4:40:19<3:52:13,  2.18s/it][A
Training...:  54% 7528/13907 [4:40:21<3:49:04,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:10:55<8:52:18, 31938.93s/it]
Training...:  54% 7528/13907 [4:40:23<3:49:04,  2.15s/it][A
Training...:  54% 7529/13907 [4:40:23<3:56:22,  2.22s/it][A
Training...:  54% 7530/13907 [4:40:25<3:52:26,  2.19s/it][A
Training...:  54% 7531/13907 [4:40:27<3:46:44,  2.13s/it][A
Training...:  54% 7532/13907 [4:40:29<3:40:58,  2.08s/it][A
Training...:  54% 7533/13907 [4:40:31<3:36:23,  2.04s/it][A
Training...:  54% 7534/13907 [4:40:33<3:32:15,  2.00s/it][A
Training...:  54% 7535/13907 [4:40:35<3:28:18,  1.96s/it][A
Training...:  54% 7536/13907 [4:40:37<3:25:01,  1.93s/it][A
Training...:  54% 7537/13907 [4:40:38<3:21:25,  1.90s/it][A
Training...:  54% 7538/13907 [4:40:40<3:17:33,  1.86s/it][A
Training...:  54% 7539/13907 [4:40:42<3:13:37,  1.82s/it][A
Training...:  54% 7540/13907 [4:40:44<3:09:54,  1.79s/it][A
Training...:  54% 7541/13907 [4:40:45<3:06:45,  1.76s/it][A
Training...:  54% 7542/13907 [4:40:47<3:02:39,  1.72s/it][A
Training...:  54% 7543/13907 [4:40:49<2:59:25,  1.69s/it][A
Training...:  54% 7544/13907 [4:40:50<2:55:31,  1.66s/it][A
Training...:  54% 7545/13907 [4:40:52<2:51:57,  1.62s/it][A
Training...:  54% 7546/13907 [4:40:53<2:46:43,  1.57s/it][A
Training...:  54% 7547/13907 [4:40:55<2:41:04,  1.52s/it][A
Training...:  54% 7548/13907 [4:40:56<2:35:32,  1.47s/it][A
Training...:  54% 7549/13907 [4:40:57<2:29:00,  1.41s/it][A
Training...:  54% 7550/13907 [4:40:58<2:18:00,  1.30s/it][A
Training...:  54% 7551/13907 [4:41:02<3:38:03,  2.06s/it][A
Training...:  54% 7552/13907 [4:41:06<4:24:16,  2.50s/it][A
Training...:  54% 7553/13907 [4:41:09<4:53:07,  2.77s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:11:45<8:52:18, 31938.93s/it]
Training...:  54% 7553/13907 [4:41:13<4:53:07,  2.77s/it][A
Training...:  54% 7554/13907 [4:41:13<5:21:06,  3.03s/it][A
Training...:  54% 7555/13907 [4:41:16<5:25:00,  3.07s/it][A
Training...:  54% 7556/13907 [4:41:19<5:21:34,  3.04s/it][A
Training...:  54% 7557/13907 [4:41:22<5:16:41,  2.99s/it][A
Training...:  54% 7558/13907 [4:41:24<5:10:39,  2.94s/it][A
Training...:  54% 7559/13907 [4:41:27<5:04:48,  2.88s/it][A
Training...:  54% 7560/13907 [4:41:30<4:59:33,  2.83s/it][A
Training...:  54% 7561/13907 [4:41:33<4:54:53,  2.79s/it][A
Training...:  54% 7562/13907 [4:41:35<4:49:26,  2.74s/it][A
Training...:  54% 7563/13907 [4:41:38<4:44:15,  2.69s/it][A
Training...:  54% 7564/13907 [4:41:40<4:39:16,  2.64s/it][A
Training...:  54% 7565/13907 [4:41:43<4:34:11,  2.59s/it][A
Training...:  54% 7566/13907 [4:41:45<4:28:57,  2.54s/it][A
Training...:  54% 7567/13907 [4:41:48<4:25:59,  2.52s/it][A
Training...:  54% 7568/13907 [4:41:50<4:23:34,  2.49s/it][A
Training...:  54% 7569/13907 [4:41:53<4:19:43,  2.46s/it][A
Training...:  54% 7570/13907 [4:41:55<4:16:46,  2.43s/it][A
Training...:  54% 7571/13907 [4:41:57<4:13:08,  2.40s/it][A
Training...:  54% 7572/13907 [4:42:00<4:10:33,  2.37s/it][A
Training...:  54% 7573/13907 [4:42:02<4:06:21,  2.33s/it][A
Training...:  54% 7574/13907 [4:42:04<4:02:30,  2.30s/it][A
Training...:  54% 7575/13907 [4:42:06<3:59:01,  2.26s/it][A
Training...:  54% 7576/13907 [4:42:08<3:54:34,  2.22s/it][A
Training...:  54% 7577/13907 [4:42:10<3:50:50,  2.19s/it][A
Training...:  54% 7578/13907 [4:42:13<3:49:36,  2.18s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:12:47<8:52:18, 31938.93s/it]
Training...:  54% 7578/13907 [4:42:15<3:49:36,  2.18s/it][A
Training...:  54% 7579/13907 [4:42:15<3:55:42,  2.23s/it][A
Training...:  55% 7580/13907 [4:42:17<3:53:01,  2.21s/it][A
Training...:  55% 7581/13907 [4:42:19<3:48:35,  2.17s/it][A
Training...:  55% 7582/13907 [4:42:21<3:42:10,  2.11s/it][A
Training...:  55% 7583/13907 [4:42:23<3:36:54,  2.06s/it][A
Training...:  55% 7584/13907 [4:42:25<3:32:12,  2.01s/it][A
Training...:  55% 7585/13907 [4:42:27<3:28:43,  1.98s/it][A
Training...:  55% 7586/13907 [4:42:29<3:25:14,  1.95s/it][A
Training...:  55% 7587/13907 [4:42:31<3:22:13,  1.92s/it][A
Training...:  55% 7588/13907 [4:42:32<3:18:36,  1.89s/it][A
Training...:  55% 7589/13907 [4:42:34<3:15:00,  1.85s/it][A
Training...:  55% 7590/13907 [4:42:36<3:11:49,  1.82s/it][A
Training...:  55% 7591/13907 [4:42:38<3:07:53,  1.78s/it][A
Training...:  55% 7592/13907 [4:42:39<3:03:19,  1.74s/it][A
Training...:  55% 7593/13907 [4:42:41<2:58:51,  1.70s/it][A
Training...:  55% 7594/13907 [4:42:42<2:54:31,  1.66s/it][A
Training...:  55% 7595/13907 [4:42:44<2:50:34,  1.62s/it][A
Training...:  55% 7596/13907 [4:42:45<2:44:55,  1.57s/it][A
Training...:  55% 7597/13907 [4:42:47<2:39:06,  1.51s/it][A
Training...:  55% 7598/13907 [4:42:48<2:33:00,  1.46s/it][A
Training...:  55% 7599/13907 [4:42:49<2:25:48,  1.39s/it][A
Training...:  55% 7600/13907 [4:42:50<2:15:40,  1.29s/it][A
Training...:  55% 7601/13907 [4:42:54<3:29:50,  2.00s/it][A
Training...:  55% 7602/13907 [4:42:58<4:16:20,  2.44s/it][A
Training...:  55% 7603/13907 [4:43:01<4:43:59,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:13:37<8:52:18, 31938.93s/it]
Training...:  55% 7603/13907 [4:43:04<4:43:59,  2.70s/it][A
Training...:  55% 7604/13907 [4:43:04<5:12:45,  2.98s/it][A
Training...:  55% 7605/13907 [4:43:08<5:18:47,  3.04s/it][A
Training...:  55% 7606/13907 [4:43:11<5:17:32,  3.02s/it][A
Training...:  55% 7607/13907 [4:43:14<5:14:23,  2.99s/it][A
Training...:  55% 7608/13907 [4:43:16<5:09:32,  2.95s/it][A
Training...:  55% 7609/13907 [4:43:19<5:04:44,  2.90s/it][A
Training...:  55% 7610/13907 [4:43:22<4:59:32,  2.85s/it][A
Training...:  55% 7611/13907 [4:43:25<4:53:38,  2.80s/it][A
Training...:  55% 7612/13907 [4:43:27<4:48:35,  2.75s/it][A
Training...:  55% 7613/13907 [4:43:30<4:44:19,  2.71s/it][A
Training...:  55% 7614/13907 [4:43:33<4:43:22,  2.70s/it][A
Training...:  55% 7615/13907 [4:43:35<4:38:21,  2.65s/it][A
Training...:  55% 7616/13907 [4:43:38<4:32:35,  2.60s/it][A
Training...:  55% 7617/13907 [4:43:40<4:28:32,  2.56s/it][A
Training...:  55% 7618/13907 [4:43:42<4:23:20,  2.51s/it][A
Training...:  55% 7619/13907 [4:43:45<4:19:17,  2.47s/it][A
Training...:  55% 7620/13907 [4:43:47<4:15:26,  2.44s/it][A
Training...:  55% 7621/13907 [4:43:50<4:12:23,  2.41s/it][A
Training...:  55% 7622/13907 [4:43:52<4:09:53,  2.39s/it][A
Training...:  55% 7623/13907 [4:43:54<4:05:51,  2.35s/it][A
Training...:  55% 7624/13907 [4:43:56<4:02:11,  2.31s/it][A
Training...:  55% 7625/13907 [4:43:59<3:57:56,  2.27s/it][A
Training...:  55% 7626/13907 [4:44:01<3:53:39,  2.23s/it][A
Training...:  55% 7627/13907 [4:44:03<3:50:22,  2.20s/it][A
Training...:  55% 7628/13907 [4:44:05<3:46:42,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:14:39<8:52:18, 31938.93s/it]
Training...:  55% 7628/13907 [4:44:07<3:46:42,  2.17s/it][A
Training...:  55% 7629/13907 [4:44:07<3:52:48,  2.23s/it][A
Training...:  55% 7630/13907 [4:44:09<3:48:53,  2.19s/it][A
Training...:  55% 7631/13907 [4:44:11<3:43:52,  2.14s/it][A
Training...:  55% 7632/13907 [4:44:13<3:38:58,  2.09s/it][A
Training...:  55% 7633/13907 [4:44:15<3:36:11,  2.07s/it][A
Training...:  55% 7634/13907 [4:44:17<3:32:45,  2.04s/it][A
Training...:  55% 7635/13907 [4:44:19<3:29:57,  2.01s/it][A
Training...:  55% 7636/13907 [4:44:21<3:24:31,  1.96s/it][A
Training...:  55% 7637/13907 [4:44:23<3:19:55,  1.91s/it][A
Training...:  55% 7638/13907 [4:44:25<3:15:04,  1.87s/it][A
Training...:  55% 7639/13907 [4:44:26<3:11:20,  1.83s/it][A
Training...:  55% 7640/13907 [4:44:28<3:07:35,  1.80s/it][A
Training...:  55% 7641/13907 [4:44:30<3:04:25,  1.77s/it][A
Training...:  55% 7642/13907 [4:44:31<3:00:48,  1.73s/it][A
Training...:  55% 7643/13907 [4:44:33<2:57:23,  1.70s/it][A
Training...:  55% 7644/13907 [4:44:35<2:53:49,  1.67s/it][A
Training...:  55% 7645/13907 [4:44:36<2:50:19,  1.63s/it][A
Training...:  55% 7646/13907 [4:44:38<2:45:14,  1.58s/it][A
Training...:  55% 7647/13907 [4:44:39<2:39:44,  1.53s/it][A
Training...:  55% 7648/13907 [4:44:41<2:34:38,  1.48s/it][A
Training...:  55% 7649/13907 [4:44:42<2:28:18,  1.42s/it][A
Training...:  55% 7650/13907 [4:44:43<2:17:19,  1.32s/it][A
Training...:  55% 7651/13907 [4:44:47<3:35:15,  2.06s/it][A
Training...:  55% 7652/13907 [4:44:50<4:18:45,  2.48s/it][A
Training...:  55% 7653/13907 [4:44:53<4:41:46,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:15:29<8:52:18, 31938.93s/it]
Training...:  55% 7653/13907 [4:44:57<4:41:46,  2.70s/it][A
Training...:  55% 7654/13907 [4:44:57<5:09:39,  2.97s/it][A
Training...:  55% 7655/13907 [4:45:00<5:15:06,  3.02s/it][A
Training...:  55% 7656/13907 [4:45:03<5:12:54,  3.00s/it][A
Training...:  55% 7657/13907 [4:45:06<5:08:25,  2.96s/it][A
Training...:  55% 7658/13907 [4:45:09<5:06:41,  2.94s/it][A
Training...:  55% 7659/13907 [4:45:12<5:00:39,  2.89s/it][A
Training...:  55% 7660/13907 [4:45:14<4:54:07,  2.82s/it][A
Training...:  55% 7661/13907 [4:45:17<4:47:59,  2.77s/it][A
Training...:  55% 7662/13907 [4:45:19<4:42:27,  2.71s/it][A
Training...:  55% 7663/13907 [4:45:22<4:37:58,  2.67s/it][A
Training...:  55% 7664/13907 [4:45:25<4:32:18,  2.62s/it][A
Training...:  55% 7665/13907 [4:45:27<4:28:28,  2.58s/it][A
Training...:  55% 7666/13907 [4:45:29<4:24:35,  2.54s/it][A
Training...:  55% 7667/13907 [4:45:32<4:21:16,  2.51s/it][A
Training...:  55% 7668/13907 [4:45:34<4:17:15,  2.47s/it][A
Training...:  55% 7669/13907 [4:45:37<4:13:49,  2.44s/it][A
Training...:  55% 7670/13907 [4:45:39<4:10:32,  2.41s/it][A
Training...:  55% 7671/13907 [4:45:41<4:06:34,  2.37s/it][A
Training...:  55% 7672/13907 [4:45:44<4:02:59,  2.34s/it][A
Training...:  55% 7673/13907 [4:45:46<3:59:53,  2.31s/it][A
Training...:  55% 7674/13907 [4:45:48<3:57:15,  2.28s/it][A
Training...:  55% 7675/13907 [4:45:50<3:54:15,  2.26s/it][A
Training...:  55% 7676/13907 [4:45:52<3:51:15,  2.23s/it][A
Training...:  55% 7677/13907 [4:45:55<3:49:17,  2.21s/it][A
Training...:  55% 7678/13907 [4:45:57<3:47:07,  2.19s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:16:31<8:52:18, 31938.93s/it]
Training...:  55% 7678/13907 [4:45:59<3:47:07,  2.19s/it][A
Training...:  55% 7679/13907 [4:45:59<3:53:16,  2.25s/it][A
Training...:  55% 7680/13907 [4:46:01<3:48:06,  2.20s/it][A
Training...:  55% 7681/13907 [4:46:03<3:42:06,  2.14s/it][A
Training...:  55% 7682/13907 [4:46:05<3:36:53,  2.09s/it][A
Training...:  55% 7683/13907 [4:46:07<3:33:10,  2.06s/it][A
Training...:  55% 7684/13907 [4:46:09<3:28:17,  2.01s/it][A
Training...:  55% 7685/13907 [4:46:11<3:23:44,  1.96s/it][A
Training...:  55% 7686/13907 [4:46:13<3:19:46,  1.93s/it][A
Training...:  55% 7687/13907 [4:46:14<3:15:36,  1.89s/it][A
Training...:  55% 7688/13907 [4:46:16<3:11:53,  1.85s/it][A
Training...:  55% 7689/13907 [4:46:18<3:08:12,  1.82s/it][A
Training...:  55% 7690/13907 [4:46:20<3:04:58,  1.79s/it][A
Training...:  55% 7691/13907 [4:46:21<3:01:35,  1.75s/it][A
Training...:  55% 7692/13907 [4:46:23<2:57:51,  1.72s/it][A
Training...:  55% 7693/13907 [4:46:25<2:54:01,  1.68s/it][A
Training...:  55% 7694/13907 [4:46:26<2:50:03,  1.64s/it][A
Training...:  55% 7695/13907 [4:46:28<2:45:30,  1.60s/it][A
Training...:  55% 7696/13907 [4:46:29<2:41:21,  1.56s/it][A
Training...:  55% 7697/13907 [4:46:31<2:35:55,  1.51s/it][A
Training...:  55% 7698/13907 [4:46:32<2:30:03,  1.45s/it][A
Training...:  55% 7699/13907 [4:46:33<2:23:00,  1.38s/it][A
Training...:  55% 7700/13907 [4:46:34<2:12:59,  1.29s/it][A
Training...:  55% 7701/13907 [4:46:38<3:31:53,  2.05s/it][A
Training...:  55% 7702/13907 [4:46:41<4:17:56,  2.49s/it][A
Training...:  55% 7703/13907 [4:46:45<4:42:01,  2.73s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:17:20<8:52:18, 31938.93s/it]
Training...:  55% 7703/13907 [4:46:48<4:42:01,  2.73s/it][A
Training...:  55% 7704/13907 [4:46:48<5:11:04,  3.01s/it][A
Training...:  55% 7705/13907 [4:46:52<5:17:54,  3.08s/it][A
Training...:  55% 7706/13907 [4:46:55<5:15:19,  3.05s/it][A
Training...:  55% 7707/13907 [4:46:58<5:12:36,  3.03s/it][A
Training...:  55% 7708/13907 [4:47:00<5:08:03,  2.98s/it][A
Training...:  55% 7709/13907 [4:47:03<5:02:19,  2.93s/it][A
Training...:  55% 7710/13907 [4:47:06<4:55:39,  2.86s/it][A
Training...:  55% 7711/13907 [4:47:09<4:50:38,  2.81s/it][A
Training...:  55% 7712/13907 [4:47:11<4:46:04,  2.77s/it][A
Training...:  55% 7713/13907 [4:47:14<4:42:52,  2.74s/it][A
Training...:  55% 7714/13907 [4:47:17<4:37:36,  2.69s/it][A
Training...:  55% 7715/13907 [4:47:19<4:32:32,  2.64s/it][A
Training...:  55% 7716/13907 [4:47:22<4:27:17,  2.59s/it][A
Training...:  55% 7717/13907 [4:47:24<4:22:37,  2.55s/it][A
Training...:  55% 7718/13907 [4:47:26<4:18:17,  2.50s/it][A
Training...:  56% 7719/13907 [4:47:29<4:14:06,  2.46s/it][A
Training...:  56% 7720/13907 [4:47:31<4:09:47,  2.42s/it][A
Training...:  56% 7721/13907 [4:47:33<4:05:47,  2.38s/it][A
Training...:  56% 7722/13907 [4:47:36<4:02:43,  2.35s/it][A
Training...:  56% 7723/13907 [4:47:38<3:59:10,  2.32s/it][A
Training...:  56% 7724/13907 [4:47:40<3:55:24,  2.28s/it][A
Training...:  56% 7725/13907 [4:47:42<3:52:19,  2.25s/it][A
Training...:  56% 7726/13907 [4:47:44<3:48:41,  2.22s/it][A
Training...:  56% 7727/13907 [4:47:47<3:45:18,  2.19s/it][A
Training...:  56% 7728/13907 [4:47:49<3:42:18,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:18:23<8:52:18, 31938.93s/it]
Training...:  56% 7728/13907 [4:47:51<3:42:18,  2.16s/it][A
Training...:  56% 7729/13907 [4:47:51<3:49:28,  2.23s/it][A
Training...:  56% 7730/13907 [4:47:53<3:45:54,  2.19s/it][A
Training...:  56% 7731/13907 [4:47:55<3:40:23,  2.14s/it][A
Training...:  56% 7732/13907 [4:47:57<3:35:29,  2.09s/it][A
Training...:  56% 7733/13907 [4:47:59<3:32:02,  2.06s/it][A
Training...:  56% 7734/13907 [4:48:01<3:27:09,  2.01s/it][A
Training...:  56% 7735/13907 [4:48:03<3:23:15,  1.98s/it][A
Training...:  56% 7736/13907 [4:48:05<3:19:26,  1.94s/it][A
Training...:  56% 7737/13907 [4:48:07<3:16:18,  1.91s/it][A
Training...:  56% 7738/13907 [4:48:08<3:12:40,  1.87s/it][A
Training...:  56% 7739/13907 [4:48:10<3:09:19,  1.84s/it][A
Training...:  56% 7740/13907 [4:48:12<3:06:06,  1.81s/it][A
Training...:  56% 7741/13907 [4:48:14<3:02:20,  1.77s/it][A
Training...:  56% 7742/13907 [4:48:15<2:58:23,  1.74s/it][A
Training...:  56% 7743/13907 [4:48:17<2:54:50,  1.70s/it][A
Training...:  56% 7744/13907 [4:48:19<2:51:19,  1.67s/it][A
Training...:  56% 7745/13907 [4:48:20<2:45:46,  1.61s/it][A
Training...:  56% 7746/13907 [4:48:21<2:40:41,  1.56s/it][A
Training...:  56% 7747/13907 [4:48:23<2:35:31,  1.51s/it][A
Training...:  56% 7748/13907 [4:48:24<2:29:40,  1.46s/it][A
Training...:  56% 7749/13907 [4:48:25<2:23:16,  1.40s/it][A
Training...:  56% 7750/13907 [4:48:26<2:12:43,  1.29s/it][A
Training...:  56% 7751/13907 [4:48:30<3:26:30,  2.01s/it][A
Training...:  56% 7752/13907 [4:48:34<4:11:17,  2.45s/it][A
Training...:  56% 7753/13907 [4:48:37<4:35:21,  2.68s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:19:13<8:52:18, 31938.93s/it]
Training...:  56% 7753/13907 [4:48:41<4:35:21,  2.68s/it][A
Training...:  56% 7754/13907 [4:48:41<5:05:44,  2.98s/it][A
Training...:  56% 7755/13907 [4:48:44<5:10:55,  3.03s/it][A
Training...:  56% 7756/13907 [4:48:47<5:08:24,  3.01s/it][A
Training...:  56% 7757/13907 [4:48:50<5:05:00,  2.98s/it][A
Training...:  56% 7758/13907 [4:48:52<4:58:41,  2.91s/it][A
Training...:  56% 7759/13907 [4:48:55<4:53:14,  2.86s/it][A
Training...:  56% 7760/13907 [4:48:58<4:47:20,  2.80s/it][A
Training...:  56% 7761/13907 [4:49:00<4:42:22,  2.76s/it][A
Training...:  56% 7762/13907 [4:49:03<4:37:07,  2.71s/it][A
Training...:  56% 7763/13907 [4:49:05<4:31:33,  2.65s/it][A
Training...:  56% 7764/13907 [4:49:08<4:26:49,  2.61s/it][A
Training...:  56% 7765/13907 [4:49:10<4:23:12,  2.57s/it][A
Training...:  56% 7766/13907 [4:49:13<4:19:17,  2.53s/it][A
Training...:  56% 7767/13907 [4:49:15<4:15:42,  2.50s/it][A
Training...:  56% 7768/13907 [4:49:18<4:11:53,  2.46s/it][A
Training...:  56% 7769/13907 [4:49:20<4:08:24,  2.43s/it][A
Training...:  56% 7770/13907 [4:49:22<4:06:00,  2.41s/it][A
Training...:  56% 7771/13907 [4:49:25<4:03:10,  2.38s/it][A
Training...:  56% 7772/13907 [4:49:27<3:58:43,  2.33s/it][A
Training...:  56% 7773/13907 [4:49:29<3:56:27,  2.31s/it][A
Training...:  56% 7774/13907 [4:49:31<3:52:40,  2.28s/it][A
Training...:  56% 7775/13907 [4:49:34<3:48:51,  2.24s/it][A
Training...:  56% 7776/13907 [4:49:36<3:45:13,  2.20s/it][A
Training...:  56% 7777/13907 [4:49:38<3:41:57,  2.17s/it][A
Training...:  56% 7778/13907 [4:49:40<3:39:44,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:20:14<8:52:18, 31938.93s/it]
Training...:  56% 7778/13907 [4:49:42<3:39:44,  2.15s/it][A
Training...:  56% 7779/13907 [4:49:42<3:47:24,  2.23s/it][A
Training...:  56% 7780/13907 [4:49:44<3:43:49,  2.19s/it][A
Training...:  56% 7781/13907 [4:49:46<3:37:38,  2.13s/it][A
Training...:  56% 7782/13907 [4:49:48<3:31:32,  2.07s/it][A
Training...:  56% 7783/13907 [4:49:50<3:27:03,  2.03s/it][A
Training...:  56% 7784/13907 [4:49:52<3:22:27,  1.98s/it][A
Training...:  56% 7785/13907 [4:49:54<3:17:53,  1.94s/it][A
Training...:  56% 7786/13907 [4:49:56<3:13:37,  1.90s/it][A
Training...:  56% 7787/13907 [4:49:58<3:09:49,  1.86s/it][A
Training...:  56% 7788/13907 [4:49:59<3:07:39,  1.84s/it][A
Training...:  56% 7789/13907 [4:50:01<3:04:49,  1.81s/it][A
Training...:  56% 7790/13907 [4:50:03<3:00:51,  1.77s/it][A
Training...:  56% 7791/13907 [4:50:04<2:57:12,  1.74s/it][A
Training...:  56% 7792/13907 [4:50:06<2:54:13,  1.71s/it][A
Training...:  56% 7793/13907 [4:50:08<2:51:03,  1.68s/it][A
Training...:  56% 7794/13907 [4:50:09<2:47:46,  1.65s/it][A
Training...:  56% 7795/13907 [4:50:11<2:43:00,  1.60s/it][A
Training...:  56% 7796/13907 [4:50:12<2:37:57,  1.55s/it][A
Training...:  56% 7797/13907 [4:50:14<2:33:02,  1.50s/it][A
Training...:  56% 7798/13907 [4:50:15<2:27:10,  1.45s/it][A
Training...:  56% 7799/13907 [4:50:16<2:20:25,  1.38s/it][A
Training...:  56% 7800/13907 [4:50:17<2:11:13,  1.29s/it][A
Training...:  56% 7801/13907 [4:50:21<3:24:57,  2.01s/it][A
Training...:  56% 7802/13907 [4:50:24<4:10:21,  2.46s/it][A
Training...:  56% 7803/13907 [4:50:28<4:33:41,  2.69s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:21:03<8:52:18, 31938.93s/it]
Training...:  56% 7803/13907 [4:50:31<4:33:41,  2.69s/it][A
Training...:  56% 7804/13907 [4:50:31<5:00:42,  2.96s/it][A
Training...:  56% 7805/13907 [4:50:34<5:07:05,  3.02s/it][A
Training...:  56% 7806/13907 [4:50:37<5:06:12,  3.01s/it][A
Training...:  56% 7807/13907 [4:50:40<5:03:35,  2.99s/it][A
Training...:  56% 7808/13907 [4:50:43<4:58:07,  2.93s/it][A
Training...:  56% 7809/13907 [4:50:46<4:52:47,  2.88s/it][A
Training...:  56% 7810/13907 [4:50:49<4:47:21,  2.83s/it][A
Training...:  56% 7811/13907 [4:50:51<4:42:19,  2.78s/it][A
Training...:  56% 7812/13907 [4:50:54<4:37:57,  2.74s/it][A
Training...:  56% 7813/13907 [4:50:57<4:36:43,  2.72s/it][A
Training...:  56% 7814/13907 [4:50:59<4:32:17,  2.68s/it][A
Training...:  56% 7815/13907 [4:51:02<4:27:05,  2.63s/it][A
Training...:  56% 7816/13907 [4:51:04<4:22:09,  2.58s/it][A
Training...:  56% 7817/13907 [4:51:07<4:17:54,  2.54s/it][A
Training...:  56% 7818/13907 [4:51:09<4:13:35,  2.50s/it][A
Training...:  56% 7819/13907 [4:51:11<4:09:04,  2.45s/it][A
Training...:  56% 7820/13907 [4:51:14<4:05:13,  2.42s/it][A
Training...:  56% 7821/13907 [4:51:16<4:01:30,  2.38s/it][A
Training...:  56% 7822/13907 [4:51:18<3:58:37,  2.35s/it][A
Training...:  56% 7823/13907 [4:51:20<3:54:37,  2.31s/it][A
Training...:  56% 7824/13907 [4:51:23<3:50:53,  2.28s/it][A
Training...:  56% 7825/13907 [4:51:25<3:47:26,  2.24s/it][A
Training...:  56% 7826/13907 [4:51:27<3:44:31,  2.22s/it][A
Training...:  56% 7827/13907 [4:51:29<3:41:09,  2.18s/it][A
Training...:  56% 7828/13907 [4:51:31<3:38:31,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:22:06<8:52:18, 31938.93s/it]
Training...:  56% 7828/13907 [4:51:34<3:38:31,  2.16s/it][A
Training...:  56% 7829/13907 [4:51:34<3:45:01,  2.22s/it][A
Training...:  56% 7830/13907 [4:51:36<3:41:00,  2.18s/it][A
Training...:  56% 7831/13907 [4:51:38<3:34:56,  2.12s/it][A
Training...:  56% 7832/13907 [4:51:40<3:30:48,  2.08s/it][A
Training...:  56% 7833/13907 [4:51:42<3:26:46,  2.04s/it][A
Training...:  56% 7834/13907 [4:51:43<3:22:26,  2.00s/it][A
Training...:  56% 7835/13907 [4:51:45<3:18:45,  1.96s/it][A
Training...:  56% 7836/13907 [4:51:47<3:15:19,  1.93s/it][A
Training...:  56% 7837/13907 [4:51:49<3:13:19,  1.91s/it][A
Training...:  56% 7838/13907 [4:51:51<3:10:51,  1.89s/it][A
Training...:  56% 7839/13907 [4:51:53<3:06:32,  1.84s/it][A
Training...:  56% 7840/13907 [4:51:54<3:03:02,  1.81s/it][A
Training...:  56% 7841/13907 [4:51:56<2:58:47,  1.77s/it][A
Training...:  56% 7842/13907 [4:51:58<2:54:17,  1.72s/it][A
Training...:  56% 7843/13907 [4:51:59<2:50:45,  1.69s/it][A
Training...:  56% 7844/13907 [4:52:01<2:46:55,  1.65s/it][A
Training...:  56% 7845/13907 [4:52:02<2:41:45,  1.60s/it][A
Training...:  56% 7846/13907 [4:52:04<2:36:07,  1.55s/it][A
Training...:  56% 7847/13907 [4:52:05<2:31:07,  1.50s/it][A
Training...:  56% 7848/13907 [4:52:06<2:24:52,  1.43s/it][A
Training...:  56% 7849/13907 [4:52:08<2:17:38,  1.36s/it][A
Training...:  56% 7850/13907 [4:52:09<2:07:36,  1.26s/it][A
Training...:  56% 7851/13907 [4:52:12<3:21:39,  2.00s/it][A
Training...:  56% 7852/13907 [4:52:16<4:04:30,  2.42s/it][A
Training...:  56% 7853/13907 [4:52:19<4:28:55,  2.67s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:22:55<8:52:18, 31938.93s/it]
Training...:  56% 7853/13907 [4:52:23<4:28:55,  2.67s/it][A
Training...:  56% 7854/13907 [4:52:23<4:58:46,  2.96s/it][A
Training...:  56% 7855/13907 [4:52:26<5:07:10,  3.05s/it][A
Training...:  56% 7856/13907 [4:52:29<5:04:33,  3.02s/it][A
Training...:  56% 7857/13907 [4:52:32<5:03:10,  3.01s/it][A
Training...:  57% 7858/13907 [4:52:35<4:57:27,  2.95s/it][A
Training...:  57% 7859/13907 [4:52:37<4:51:26,  2.89s/it][A
Training...:  57% 7860/13907 [4:52:40<4:45:38,  2.83s/it][A
Training...:  57% 7861/13907 [4:52:43<4:40:14,  2.78s/it][A
Training...:  57% 7862/13907 [4:52:45<4:33:58,  2.72s/it][A
Training...:  57% 7863/13907 [4:52:48<4:29:08,  2.67s/it][A
Training...:  57% 7864/13907 [4:52:50<4:23:53,  2.62s/it][A
Training...:  57% 7865/13907 [4:52:53<4:19:49,  2.58s/it][A
Training...:  57% 7866/13907 [4:52:55<4:16:00,  2.54s/it][A
Training...:  57% 7867/13907 [4:52:58<4:12:02,  2.50s/it][A
Training...:  57% 7868/13907 [4:53:00<4:08:32,  2.47s/it][A
Training...:  57% 7869/13907 [4:53:02<4:04:49,  2.43s/it][A
Training...:  57% 7870/13907 [4:53:05<4:00:47,  2.39s/it][A
Training...:  57% 7871/13907 [4:53:07<3:57:52,  2.36s/it][A
Training...:  57% 7872/13907 [4:53:09<3:55:00,  2.34s/it][A
Training...:  57% 7873/13907 [4:53:12<3:51:54,  2.31s/it][A
Training...:  57% 7874/13907 [4:53:14<3:49:09,  2.28s/it][A
Training...:  57% 7875/13907 [4:53:16<3:46:22,  2.25s/it][A
Training...:  57% 7876/13907 [4:53:18<3:43:47,  2.23s/it][A
Training...:  57% 7877/13907 [4:53:20<3:40:24,  2.19s/it][A
Training...:  57% 7878/13907 [4:53:22<3:37:12,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:23:57<8:52:18, 31938.93s/it]
Training...:  57% 7878/13907 [4:53:25<3:37:12,  2.16s/it][A
Training...:  57% 7879/13907 [4:53:25<3:43:31,  2.22s/it][A
Training...:  57% 7880/13907 [4:53:27<3:40:32,  2.20s/it][A
Training...:  57% 7881/13907 [4:53:29<3:35:11,  2.14s/it][A
Training...:  57% 7882/13907 [4:53:31<3:31:26,  2.11s/it][A
Training...:  57% 7883/13907 [4:53:33<3:27:52,  2.07s/it][A
Training...:  57% 7884/13907 [4:53:35<3:24:00,  2.03s/it][A
Training...:  57% 7885/13907 [4:53:37<3:20:09,  1.99s/it][A
Training...:  57% 7886/13907 [4:53:39<3:17:28,  1.97s/it][A
Training...:  57% 7887/13907 [4:53:40<3:14:38,  1.94s/it][A
Training...:  57% 7888/13907 [4:53:42<3:11:55,  1.91s/it][A
Training...:  57% 7889/13907 [4:53:44<3:09:24,  1.89s/it][A
Training...:  57% 7890/13907 [4:53:46<3:06:01,  1.86s/it][A
Training...:  57% 7891/13907 [4:53:48<3:02:08,  1.82s/it][A
Training...:  57% 7892/13907 [4:53:49<2:57:50,  1.77s/it][A
Training...:  57% 7893/13907 [4:53:51<2:53:38,  1.73s/it][A
Training...:  57% 7894/13907 [4:53:53<2:49:46,  1.69s/it][A
Training...:  57% 7895/13907 [4:53:54<2:44:51,  1.65s/it][A
Training...:  57% 7896/13907 [4:53:56<2:39:14,  1.59s/it][A
Training...:  57% 7897/13907 [4:53:57<2:33:14,  1.53s/it][A
Training...:  57% 7898/13907 [4:53:58<2:27:20,  1.47s/it][A
Training...:  57% 7899/13907 [4:54:00<2:20:24,  1.40s/it][A
Training...:  57% 7900/13907 [4:54:01<2:10:01,  1.30s/it][A
Training...:  57% 7901/13907 [4:54:04<3:26:23,  2.06s/it][A
Training...:  57% 7902/13907 [4:54:08<4:12:10,  2.52s/it][A
Training...:  57% 7903/13907 [4:54:11<4:38:11,  2.78s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:24:47<8:52:18, 31938.93s/it]
Training...:  57% 7903/13907 [4:54:15<4:38:11,  2.78s/it][A
Training...:  57% 7904/13907 [4:54:15<5:07:11,  3.07s/it][A
Training...:  57% 7905/13907 [4:54:18<5:09:47,  3.10s/it][A
Training...:  57% 7906/13907 [4:54:21<5:06:18,  3.06s/it][A
Training...:  57% 7907/13907 [4:54:24<5:01:07,  3.01s/it][A
Training...:  57% 7908/13907 [4:54:27<4:56:23,  2.96s/it][A
Training...:  57% 7909/13907 [4:54:30<4:51:09,  2.91s/it][A
Training...:  57% 7910/13907 [4:54:33<4:45:58,  2.86s/it][A
Training...:  57% 7911/13907 [4:54:35<4:40:41,  2.81s/it][A
Training...:  57% 7912/13907 [4:54:38<4:36:00,  2.76s/it][A
Training...:  57% 7913/13907 [4:54:41<4:31:09,  2.71s/it][A
Training...:  57% 7914/13907 [4:54:43<4:28:46,  2.69s/it][A
Training...:  57% 7915/13907 [4:54:46<4:25:33,  2.66s/it][A
Training...:  57% 7916/13907 [4:54:48<4:20:27,  2.61s/it][A
Training...:  57% 7917/13907 [4:54:51<4:14:58,  2.55s/it][A
Training...:  57% 7918/13907 [4:54:53<4:09:53,  2.50s/it][A
Training...:  57% 7919/13907 [4:54:55<4:05:28,  2.46s/it][A
Training...:  57% 7920/13907 [4:54:58<4:00:23,  2.41s/it][A
Training...:  57% 7921/13907 [4:55:00<3:58:01,  2.39s/it][A
Training...:  57% 7922/13907 [4:55:02<3:54:19,  2.35s/it][A
Training...:  57% 7923/13907 [4:55:05<3:50:46,  2.31s/it][A
Training...:  57% 7924/13907 [4:55:07<3:46:58,  2.28s/it][A
Training...:  57% 7925/13907 [4:55:09<3:42:46,  2.23s/it][A
Training...:  57% 7926/13907 [4:55:11<3:40:34,  2.21s/it][A
Training...:  57% 7927/13907 [4:55:13<3:36:55,  2.18s/it][A
Training...:  57% 7928/13907 [4:55:15<3:34:09,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:25:50<8:52:18, 31938.93s/it]
Training...:  57% 7928/13907 [4:55:18<3:34:09,  2.15s/it][A
Training...:  57% 7929/13907 [4:55:18<3:40:39,  2.21s/it][A
Training...:  57% 7930/13907 [4:55:20<3:38:25,  2.19s/it][A
Training...:  57% 7931/13907 [4:55:22<3:32:35,  2.13s/it][A
Training...:  57% 7932/13907 [4:55:24<3:27:36,  2.08s/it][A
Training...:  57% 7933/13907 [4:55:26<3:22:53,  2.04s/it][A
Training...:  57% 7934/13907 [4:55:28<3:18:45,  2.00s/it][A
Training...:  57% 7935/13907 [4:55:29<3:14:54,  1.96s/it][A
Training...:  57% 7936/13907 [4:55:31<3:11:32,  1.92s/it][A
Training...:  57% 7937/13907 [4:55:33<3:08:14,  1.89s/it][A
Training...:  57% 7938/13907 [4:55:35<3:04:59,  1.86s/it][A
Training...:  57% 7939/13907 [4:55:37<3:01:27,  1.82s/it][A
Training...:  57% 7940/13907 [4:55:38<2:57:56,  1.79s/it][A
Training...:  57% 7941/13907 [4:55:40<2:54:34,  1.76s/it][A
Training...:  57% 7942/13907 [4:55:42<2:50:59,  1.72s/it][A
Training...:  57% 7943/13907 [4:55:43<2:47:28,  1.68s/it][A
Training...:  57% 7944/13907 [4:55:45<2:44:15,  1.65s/it][A
Training...:  57% 7945/13907 [4:55:46<2:41:29,  1.63s/it][A
Training...:  57% 7946/13907 [4:55:48<2:36:30,  1.58s/it][A
Training...:  57% 7947/13907 [4:55:49<2:31:37,  1.53s/it][A
Training...:  57% 7948/13907 [4:55:51<2:25:27,  1.46s/it][A
Training...:  57% 7949/13907 [4:55:52<2:18:42,  1.40s/it][A
Training...:  57% 7950/13907 [4:55:53<2:08:00,  1.29s/it][A
Training...:  57% 7951/13907 [4:55:57<3:21:28,  2.03s/it][A
Training...:  57% 7952/13907 [4:56:00<4:05:36,  2.47s/it][A
Training...:  57% 7953/13907 [4:56:03<4:30:12,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:26:39<8:52:18, 31938.93s/it]
Training...:  57% 7953/13907 [4:56:07<4:30:12,  2.72s/it][A
Training...:  57% 7954/13907 [4:56:07<4:59:01,  3.01s/it][A
Training...:  57% 7955/13907 [4:56:10<5:03:57,  3.06s/it][A
Training...:  57% 7956/13907 [4:56:13<4:59:21,  3.02s/it][A
Training...:  57% 7957/13907 [4:56:16<4:54:32,  2.97s/it][A
Training...:  57% 7958/13907 [4:56:19<4:48:35,  2.91s/it][A
Training...:  57% 7959/13907 [4:56:22<4:42:52,  2.85s/it][A
Training...:  57% 7960/13907 [4:56:24<4:37:01,  2.79s/it][A
Training...:  57% 7961/13907 [4:56:27<4:32:36,  2.75s/it][A
Training...:  57% 7962/13907 [4:56:29<4:27:29,  2.70s/it][A
Training...:  57% 7963/13907 [4:56:32<4:23:14,  2.66s/it][A
Training...:  57% 7964/13907 [4:56:34<4:19:16,  2.62s/it][A
Training...:  57% 7965/13907 [4:56:37<4:15:23,  2.58s/it][A
Training...:  57% 7966/13907 [4:56:39<4:11:15,  2.54s/it][A
Training...:  57% 7967/13907 [4:56:42<4:07:34,  2.50s/it][A
Training...:  57% 7968/13907 [4:56:44<4:04:15,  2.47s/it][A
Training...:  57% 7969/13907 [4:56:47<4:01:17,  2.44s/it][A
Training...:  57% 7970/13907 [4:56:49<3:58:29,  2.41s/it][A
Training...:  57% 7971/13907 [4:56:51<3:55:10,  2.38s/it][A
Training...:  57% 7972/13907 [4:56:53<3:51:07,  2.34s/it][A
Training...:  57% 7973/13907 [4:56:56<3:48:05,  2.31s/it][A
Training...:  57% 7974/13907 [4:56:58<3:44:37,  2.27s/it][A
Training...:  57% 7975/13907 [4:57:00<3:42:24,  2.25s/it][A
Training...:  57% 7976/13907 [4:57:02<3:38:54,  2.21s/it][A
Training...:  57% 7977/13907 [4:57:04<3:35:45,  2.18s/it][A
Training...:  57% 7978/13907 [4:57:06<3:33:04,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:27:41<8:52:18, 31938.93s/it]
Training...:  57% 7978/13907 [4:57:09<3:33:04,  2.16s/it][A
Training...:  57% 7979/13907 [4:57:09<3:39:45,  2.22s/it][A
Training...:  57% 7980/13907 [4:57:11<3:36:14,  2.19s/it][A
Training...:  57% 7981/13907 [4:57:13<3:31:34,  2.14s/it][A
Training...:  57% 7982/13907 [4:57:15<3:26:54,  2.10s/it][A
Training...:  57% 7983/13907 [4:57:17<3:23:21,  2.06s/it][A
Training...:  57% 7984/13907 [4:57:19<3:20:27,  2.03s/it][A
Training...:  57% 7985/13907 [4:57:21<3:18:13,  2.01s/it][A
Training...:  57% 7986/13907 [4:57:23<3:15:50,  1.98s/it][A
Training...:  57% 7987/13907 [4:57:25<3:13:23,  1.96s/it][A
Training...:  57% 7988/13907 [4:57:26<3:09:42,  1.92s/it][A
Training...:  57% 7989/13907 [4:57:28<3:06:44,  1.89s/it][A
Training...:  57% 7990/13907 [4:57:30<3:01:34,  1.84s/it][A
Training...:  57% 7991/13907 [4:57:32<2:57:25,  1.80s/it][A
Training...:  57% 7992/13907 [4:57:33<2:53:00,  1.75s/it][A
Training...:  57% 7993/13907 [4:57:35<2:49:19,  1.72s/it][A
Training...:  57% 7994/13907 [4:57:37<2:45:07,  1.68s/it][A
Training...:  57% 7995/13907 [4:57:38<2:40:01,  1.62s/it][A
Training...:  57% 7996/13907 [4:57:40<2:35:09,  1.57s/it][A
Training...:  58% 7997/13907 [4:57:41<2:29:27,  1.52s/it][A
Training...:  58% 7998/13907 [4:57:42<2:22:48,  1.45s/it][A
Training...:  58% 7999/13907 [4:57:43<2:15:49,  1.38s/it][A
Training...:  58% 8000/13907 [4:57:45<2:06:22,  1.28s/it][A
Training...:  58% 8001/13907 [4:57:48<3:18:31,  2.02s/it][A
Training...:  58% 8002/13907 [4:57:52<4:00:17,  2.44s/it][A
Training...:  58% 8003/13907 [4:57:55<4:24:45,  2.69s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:28:31<8:52:18, 31938.93s/it]
Training...:  58% 8003/13907 [4:57:59<4:24:45,  2.69s/it][A
Training...:  58% 8004/13907 [4:57:59<4:53:00,  2.98s/it][A
Training...:  58% 8005/13907 [4:58:02<4:57:40,  3.03s/it][A
Training...:  58% 8006/13907 [4:58:05<4:55:56,  3.01s/it][A
Training...:  58% 8007/13907 [4:58:08<4:52:55,  2.98s/it][A
Training...:  58% 8008/13907 [4:58:10<4:49:14,  2.94s/it][A
Training...:  58% 8009/13907 [4:58:13<4:43:42,  2.89s/it][A
Training...:  58% 8010/13907 [4:58:16<4:39:51,  2.85s/it][A
Training...:  58% 8011/13907 [4:58:19<4:35:17,  2.80s/it][A
Training...:  58% 8012/13907 [4:58:21<4:32:03,  2.77s/it][A
Training...:  58% 8013/13907 [4:58:24<4:28:35,  2.73s/it][A
Training...:  58% 8014/13907 [4:58:27<4:23:19,  2.68s/it][A
Training...:  58% 8015/13907 [4:58:29<4:19:11,  2.64s/it][A
Training...:  58% 8016/13907 [4:58:32<4:14:29,  2.59s/it][A
Training...:  58% 8017/13907 [4:58:34<4:10:39,  2.55s/it][A
Training...:  58% 8018/13907 [4:58:36<4:06:39,  2.51s/it][A
Training...:  58% 8019/13907 [4:58:39<4:03:16,  2.48s/it][A
Training...:  58% 8020/13907 [4:58:41<4:00:13,  2.45s/it][A
Training...:  58% 8021/13907 [4:58:44<3:56:48,  2.41s/it][A
Training...:  58% 8022/13907 [4:58:46<3:52:25,  2.37s/it][A
Training...:  58% 8023/13907 [4:58:48<3:49:06,  2.34s/it][A
Training...:  58% 8024/13907 [4:58:50<3:45:38,  2.30s/it][A
Training...:  58% 8025/13907 [4:58:53<3:41:59,  2.26s/it][A
Training...:  58% 8026/13907 [4:58:55<3:38:54,  2.23s/it][A
Training...:  58% 8027/13907 [4:58:57<3:35:43,  2.20s/it][A
Training...:  58% 8028/13907 [4:58:59<3:32:34,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:29:33<8:52:18, 31938.93s/it]
Training...:  58% 8028/13907 [4:59:01<3:32:34,  2.17s/it][A
Training...:  58% 8029/13907 [4:59:01<3:39:00,  2.24s/it][A
Training...:  58% 8030/13907 [4:59:03<3:34:47,  2.19s/it][A
Training...:  58% 8031/13907 [4:59:05<3:29:00,  2.13s/it][A
Training...:  58% 8032/13907 [4:59:07<3:24:47,  2.09s/it][A
Training...:  58% 8033/13907 [4:59:09<3:20:51,  2.05s/it][A
Training...:  58% 8034/13907 [4:59:11<3:17:01,  2.01s/it][A
Training...:  58% 8035/13907 [4:59:13<3:13:33,  1.98s/it][A
Training...:  58% 8036/13907 [4:59:15<3:09:57,  1.94s/it][A
Training...:  58% 8037/13907 [4:59:17<3:06:40,  1.91s/it][A
Training...:  58% 8038/13907 [4:59:19<3:04:02,  1.88s/it][A
Training...:  58% 8039/13907 [4:59:20<3:00:16,  1.84s/it][A
Training...:  58% 8040/13907 [4:59:22<2:56:54,  1.81s/it][A
Training...:  58% 8041/13907 [4:59:24<2:53:08,  1.77s/it][A
Training...:  58% 8042/13907 [4:59:25<2:49:35,  1.74s/it][A
Training...:  58% 8043/13907 [4:59:27<2:46:34,  1.70s/it][A
Training...:  58% 8044/13907 [4:59:29<2:41:57,  1.66s/it][A
Training...:  58% 8045/13907 [4:59:30<2:37:32,  1.61s/it][A
Training...:  58% 8046/13907 [4:59:32<2:33:17,  1.57s/it][A
Training...:  58% 8047/13907 [4:59:33<2:28:06,  1.52s/it][A
Training...:  58% 8048/13907 [4:59:34<2:22:49,  1.46s/it][A
Training...:  58% 8049/13907 [4:59:36<2:16:06,  1.39s/it][A
Training...:  58% 8050/13907 [4:59:37<2:06:42,  1.30s/it][A
Training...:  58% 8051/13907 [4:59:40<3:16:03,  2.01s/it][A
Training...:  58% 8052/13907 [4:59:44<3:57:30,  2.43s/it][A
Training...:  58% 8053/13907 [4:59:47<4:20:47,  2.67s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:30:23<8:52:18, 31938.93s/it]
Training...:  58% 8053/13907 [4:59:51<4:20:47,  2.67s/it][A
Training...:  58% 8054/13907 [4:59:51<4:47:28,  2.95s/it][A
Training...:  58% 8055/13907 [4:59:54<4:52:51,  3.00s/it][A
Training...:  58% 8056/13907 [4:59:57<4:51:28,  2.99s/it][A
Training...:  58% 8057/13907 [5:00:00<4:48:40,  2.96s/it][A
Training...:  58% 8058/13907 [5:00:02<4:46:28,  2.94s/it][A
Training...:  58% 8059/13907 [5:00:05<4:43:57,  2.91s/it][A
Training...:  58% 8060/13907 [5:00:08<4:38:18,  2.86s/it][A
Training...:  58% 8061/13907 [5:00:11<4:33:16,  2.80s/it][A
Training...:  58% 8062/13907 [5:00:13<4:28:40,  2.76s/it][A
Training...:  58% 8063/13907 [5:00:16<4:23:49,  2.71s/it][A
Training...:  58% 8064/13907 [5:00:19<4:19:36,  2.67s/it][A
Training...:  58% 8065/13907 [5:00:21<4:16:23,  2.63s/it][A
Training...:  58% 8066/13907 [5:00:24<4:12:02,  2.59s/it][A
Training...:  58% 8067/13907 [5:00:26<4:07:47,  2.55s/it][A
Training...:  58% 8068/13907 [5:00:28<4:03:58,  2.51s/it][A
Training...:  58% 8069/13907 [5:00:31<4:00:14,  2.47s/it][A
Training...:  58% 8070/13907 [5:00:33<3:56:43,  2.43s/it][A
Training...:  58% 8071/13907 [5:00:35<3:53:13,  2.40s/it][A
Training...:  58% 8072/13907 [5:00:38<3:49:23,  2.36s/it][A
Training...:  58% 8073/13907 [5:00:40<3:46:14,  2.33s/it][A
Training...:  58% 8074/13907 [5:00:42<3:42:36,  2.29s/it][A
Training...:  58% 8075/13907 [5:00:44<3:39:37,  2.26s/it][A
Training...:  58% 8076/13907 [5:00:47<3:36:33,  2.23s/it][A
Training...:  58% 8077/13907 [5:00:49<3:33:28,  2.20s/it][A
Training...:  58% 8078/13907 [5:00:51<3:30:54,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:31:25<8:52:18, 31938.93s/it]
Training...:  58% 8078/13907 [5:00:53<3:30:54,  2.17s/it][A
Training...:  58% 8079/13907 [5:00:53<3:37:12,  2.24s/it][A
Training...:  58% 8080/13907 [5:00:55<3:32:36,  2.19s/it][A
Training...:  58% 8081/13907 [5:00:57<3:27:25,  2.14s/it][A
Training...:  58% 8082/13907 [5:00:59<3:21:49,  2.08s/it][A
Training...:  58% 8083/13907 [5:01:01<3:17:17,  2.03s/it][A
Training...:  58% 8084/13907 [5:01:03<3:13:12,  1.99s/it][A
Training...:  58% 8085/13907 [5:01:05<3:09:51,  1.96s/it][A
Training...:  58% 8086/13907 [5:01:07<3:06:54,  1.93s/it][A
Training...:  58% 8087/13907 [5:01:09<3:03:31,  1.89s/it][A
Training...:  58% 8088/13907 [5:01:10<3:00:19,  1.86s/it][A
Training...:  58% 8089/13907 [5:01:12<2:56:29,  1.82s/it][A
Training...:  58% 8090/13907 [5:01:14<2:53:59,  1.79s/it][A
Training...:  58% 8091/13907 [5:01:16<2:51:05,  1.77s/it][A
Training...:  58% 8092/13907 [5:01:17<2:48:20,  1.74s/it][A
Training...:  58% 8093/13907 [5:01:19<2:46:05,  1.71s/it][A
Training...:  58% 8094/13907 [5:01:20<2:42:46,  1.68s/it][A
Training...:  58% 8095/13907 [5:01:22<2:38:07,  1.63s/it][A
Training...:  58% 8096/13907 [5:01:23<2:32:47,  1.58s/it][A
Training...:  58% 8097/13907 [5:01:25<2:27:20,  1.52s/it][A
Training...:  58% 8098/13907 [5:01:26<2:21:11,  1.46s/it][A
Training...:  58% 8099/13907 [5:01:27<2:14:40,  1.39s/it][A
Training...:  58% 8100/13907 [5:01:28<2:05:24,  1.30s/it][A
Training...:  58% 8101/13907 [5:01:32<3:15:39,  2.02s/it][A
Training...:  58% 8102/13907 [5:01:36<3:57:32,  2.46s/it][A
Training...:  58% 8103/13907 [5:01:39<4:21:21,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:32:15<8:52:18, 31938.93s/it]
Training...:  58% 8103/13907 [5:01:43<4:21:21,  2.70s/it][A
Training...:  58% 8104/13907 [5:01:43<4:49:02,  2.99s/it][A
Training...:  58% 8105/13907 [5:01:46<4:53:43,  3.04s/it][A
Training...:  58% 8106/13907 [5:01:49<4:51:11,  3.01s/it][A
Training...:  58% 8107/13907 [5:01:52<4:47:31,  2.97s/it][A
Training...:  58% 8108/13907 [5:01:54<4:44:05,  2.94s/it][A
Training...:  58% 8109/13907 [5:01:57<4:39:07,  2.89s/it][A
Training...:  58% 8110/13907 [5:02:00<4:33:30,  2.83s/it][A
Training...:  58% 8111/13907 [5:02:03<4:28:28,  2.78s/it][A
Training...:  58% 8112/13907 [5:02:05<4:23:27,  2.73s/it][A
Training...:  58% 8113/13907 [5:02:08<4:19:22,  2.69s/it][A
Training...:  58% 8114/13907 [5:02:10<4:14:38,  2.64s/it][A
Training...:  58% 8115/13907 [5:02:13<4:10:42,  2.60s/it][A
Training...:  58% 8116/13907 [5:02:15<4:06:56,  2.56s/it][A
Training...:  58% 8117/13907 [5:02:18<4:02:47,  2.52s/it][A
Training...:  58% 8118/13907 [5:02:20<3:59:08,  2.48s/it][A
Training...:  58% 8119/13907 [5:02:22<3:56:41,  2.45s/it][A
Training...:  58% 8120/13907 [5:02:25<3:53:45,  2.42s/it][A
Training...:  58% 8121/13907 [5:02:27<3:50:22,  2.39s/it][A
Training...:  58% 8122/13907 [5:02:29<3:47:01,  2.35s/it][A
Training...:  58% 8123/13907 [5:02:32<3:43:42,  2.32s/it][A
Training...:  58% 8124/13907 [5:02:34<3:40:39,  2.29s/it][A
Training...:  58% 8125/13907 [5:02:36<3:38:13,  2.26s/it][A
Training...:  58% 8126/13907 [5:02:38<3:34:37,  2.23s/it][A
Training...:  58% 8127/13907 [5:02:40<3:31:25,  2.19s/it][A
Training...:  58% 8128/13907 [5:02:42<3:28:17,  2.16s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:33:17<8:52:18, 31938.93s/it]
Training...:  58% 8128/13907 [5:02:45<3:28:17,  2.16s/it][A
Training...:  58% 8129/13907 [5:02:45<3:34:16,  2.23s/it][A
Training...:  58% 8130/13907 [5:02:47<3:30:16,  2.18s/it][A
Training...:  58% 8131/13907 [5:02:49<3:24:46,  2.13s/it][A
Training...:  58% 8132/13907 [5:02:51<3:19:32,  2.07s/it][A
Training...:  58% 8133/13907 [5:02:53<3:15:55,  2.04s/it][A
Training...:  58% 8134/13907 [5:02:55<3:12:03,  2.00s/it][A
Training...:  58% 8135/13907 [5:02:56<3:09:02,  1.97s/it][A
Training...:  59% 8136/13907 [5:02:58<3:05:33,  1.93s/it][A
Training...:  59% 8137/13907 [5:03:00<3:02:35,  1.90s/it][A
Training...:  59% 8138/13907 [5:03:02<2:59:22,  1.87s/it][A
Training...:  59% 8139/13907 [5:03:04<2:56:08,  1.83s/it][A
Training...:  59% 8140/13907 [5:03:05<2:53:01,  1.80s/it][A
Training...:  59% 8141/13907 [5:03:07<2:49:59,  1.77s/it][A
Training...:  59% 8142/13907 [5:03:09<2:46:26,  1.73s/it][A
Training...:  59% 8143/13907 [5:03:10<2:42:41,  1.69s/it][A
Training...:  59% 8144/13907 [5:03:12<2:39:11,  1.66s/it][A
Training...:  59% 8145/13907 [5:03:13<2:35:25,  1.62s/it][A
Training...:  59% 8146/13907 [5:03:15<2:30:57,  1.57s/it][A
Training...:  59% 8147/13907 [5:03:16<2:25:11,  1.51s/it][A
Training...:  59% 8148/13907 [5:03:18<2:18:55,  1.45s/it][A
Training...:  59% 8149/13907 [5:03:19<2:14:09,  1.40s/it][A
Training...:  59% 8150/13907 [5:03:20<2:04:14,  1.29s/it][A
Training...:  59% 8151/13907 [5:03:24<3:14:56,  2.03s/it][A
Training...:  59% 8152/13907 [5:03:27<3:56:48,  2.47s/it][A
Training...:  59% 8153/13907 [5:03:30<4:18:47,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:34:06<8:52:18, 31938.93s/it]
Training...:  59% 8153/13907 [5:03:34<4:18:47,  2.70s/it][A
Training...:  59% 8154/13907 [5:03:34<4:44:50,  2.97s/it][A
Training...:  59% 8155/13907 [5:03:37<4:49:43,  3.02s/it][A
Training...:  59% 8156/13907 [5:03:40<4:47:21,  3.00s/it][A
Training...:  59% 8157/13907 [5:03:43<4:43:25,  2.96s/it][A
Training...:  59% 8158/13907 [5:03:46<4:38:20,  2.90s/it][A
Training...:  59% 8159/13907 [5:03:49<4:33:42,  2.86s/it][A
Training...:  59% 8160/13907 [5:03:51<4:28:31,  2.80s/it][A
Training...:  59% 8161/13907 [5:03:54<4:23:55,  2.76s/it][A
Training...:  59% 8162/13907 [5:03:56<4:19:48,  2.71s/it][A
Training...:  59% 8163/13907 [5:03:59<4:15:15,  2.67s/it][A
Training...:  59% 8164/13907 [5:04:02<4:11:38,  2.63s/it][A
Training...:  59% 8165/13907 [5:04:04<4:07:13,  2.58s/it][A
Training...:  59% 8166/13907 [5:04:06<4:03:28,  2.54s/it][A
Training...:  59% 8167/13907 [5:04:09<4:00:34,  2.51s/it][A
Training...:  59% 8168/13907 [5:04:11<3:57:10,  2.48s/it][A
Training...:  59% 8169/13907 [5:04:14<3:54:05,  2.45s/it][A
Training...:  59% 8170/13907 [5:04:16<3:50:53,  2.41s/it][A
Training...:  59% 8171/13907 [5:04:18<3:47:46,  2.38s/it][A
Training...:  59% 8172/13907 [5:04:21<3:45:14,  2.36s/it][A
Training...:  59% 8173/13907 [5:04:23<3:43:02,  2.33s/it][A
Training...:  59% 8174/13907 [5:04:25<3:39:31,  2.30s/it][A
Training...:  59% 8175/13907 [5:04:27<3:36:45,  2.27s/it][A
Training...:  59% 8176/13907 [5:04:29<3:32:26,  2.22s/it][A
Training...:  59% 8177/13907 [5:04:32<3:29:07,  2.19s/it][A
Training...:  59% 8178/13907 [5:04:34<3:26:59,  2.17s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:35:08<8:52:18, 31938.93s/it]
Training...:  59% 8178/13907 [5:04:36<3:26:59,  2.17s/it][A
Training...:  59% 8179/13907 [5:04:36<3:33:40,  2.24s/it][A
Training...:  59% 8180/13907 [5:04:38<3:29:42,  2.20s/it][A
Training...:  59% 8181/13907 [5:04:40<3:24:07,  2.14s/it][A
Training...:  59% 8182/13907 [5:04:42<3:19:31,  2.09s/it][A
Training...:  59% 8183/13907 [5:04:44<3:15:13,  2.05s/it][A
Training...:  59% 8184/13907 [5:04:46<3:11:38,  2.01s/it][A
Training...:  59% 8185/13907 [5:04:48<3:08:13,  1.97s/it][A
Training...:  59% 8186/13907 [5:04:50<3:04:29,  1.93s/it][A
Training...:  59% 8187/13907 [5:04:52<3:02:18,  1.91s/it][A
Training...:  59% 8188/13907 [5:04:53<2:59:49,  1.89s/it][A
Training...:  59% 8189/13907 [5:04:55<2:56:44,  1.85s/it][A
Training...:  59% 8190/13907 [5:04:57<2:53:30,  1.82s/it][A
Training...:  59% 8191/13907 [5:04:59<2:49:45,  1.78s/it][A
Training...:  59% 8192/13907 [5:05:00<2:46:10,  1.74s/it][A
Training...:  59% 8193/13907 [5:05:02<2:41:58,  1.70s/it][A
Training...:  59% 8194/13907 [5:05:03<2:38:13,  1.66s/it][A
Training...:  59% 8195/13907 [5:05:05<2:33:55,  1.62s/it][A
Training...:  59% 8196/13907 [5:05:06<2:29:08,  1.57s/it][A
Training...:  59% 8197/13907 [5:05:08<2:24:03,  1.51s/it][A
Training...:  59% 8198/13907 [5:05:09<2:18:38,  1.46s/it][A
Training...:  59% 8199/13907 [5:05:10<2:13:03,  1.40s/it][A
Training...:  59% 8200/13907 [5:05:12<2:04:09,  1.31s/it][A
Training...:  59% 8201/13907 [5:05:15<3:15:33,  2.06s/it][A
Training...:  59% 8202/13907 [5:05:19<3:57:17,  2.50s/it][A
Training...:  59% 8203/13907 [5:05:22<4:18:28,  2.72s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:35:58<8:52:18, 31938.93s/it]
Training...:  59% 8203/13907 [5:05:26<4:18:28,  2.72s/it][A
Training...:  59% 8204/13907 [5:05:26<4:44:18,  2.99s/it][A
Training...:  59% 8205/13907 [5:05:29<4:48:35,  3.04s/it][A
Training...:  59% 8206/13907 [5:05:32<4:47:10,  3.02s/it][A
Training...:  59% 8207/13907 [5:05:35<4:42:03,  2.97s/it][A
Training...:  59% 8208/13907 [5:05:38<4:38:27,  2.93s/it][A
Training...:  59% 8209/13907 [5:05:40<4:32:42,  2.87s/it][A
Training...:  59% 8210/13907 [5:05:43<4:28:50,  2.83s/it][A
Training...:  59% 8211/13907 [5:05:46<4:22:48,  2.77s/it][A
Training...:  59% 8212/13907 [5:05:48<4:17:11,  2.71s/it][A
Training...:  59% 8213/13907 [5:05:51<4:12:59,  2.67s/it][A
Training...:  59% 8214/13907 [5:05:53<4:09:06,  2.63s/it][A
Training...:  59% 8215/13907 [5:05:56<4:07:33,  2.61s/it][A
Training...:  59% 8216/13907 [5:05:58<4:03:22,  2.57s/it][A
Training...:  59% 8217/13907 [5:06:01<3:58:24,  2.51s/it][A
Training...:  59% 8218/13907 [5:06:03<3:53:32,  2.46s/it][A
Training...:  59% 8219/13907 [5:06:05<3:49:30,  2.42s/it][A
Training...:  59% 8220/13907 [5:06:08<3:45:39,  2.38s/it][A
Training...:  59% 8221/13907 [5:06:10<3:43:03,  2.35s/it][A
Training...:  59% 8222/13907 [5:06:12<3:39:50,  2.32s/it][A
Training...:  59% 8223/13907 [5:06:14<3:36:06,  2.28s/it][A
Training...:  59% 8224/13907 [5:06:17<3:32:54,  2.25s/it][A
Training...:  59% 8225/13907 [5:06:19<3:29:55,  2.22s/it][A
Training...:  59% 8226/13907 [5:06:21<3:27:05,  2.19s/it][A
Training...:  59% 8227/13907 [5:06:23<3:24:11,  2.16s/it][A
Training...:  59% 8228/13907 [5:06:25<3:21:15,  2.13s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:36:59<8:52:18, 31938.93s/it]
Training...:  59% 8228/13907 [5:06:27<3:21:15,  2.13s/it][A
Training...:  59% 8229/13907 [5:06:27<3:27:29,  2.19s/it][A
Training...:  59% 8230/13907 [5:06:29<3:24:24,  2.16s/it][A
Training...:  59% 8231/13907 [5:06:31<3:18:39,  2.10s/it][A
Training...:  59% 8232/13907 [5:06:33<3:14:08,  2.05s/it][A
Training...:  59% 8233/13907 [5:06:35<3:11:53,  2.03s/it][A
Training...:  59% 8234/13907 [5:06:37<3:08:40,  2.00s/it][A
Training...:  59% 8235/13907 [5:06:39<3:05:56,  1.97s/it][A
Training...:  59% 8236/13907 [5:06:41<3:03:05,  1.94s/it][A
Training...:  59% 8237/13907 [5:06:43<3:01:05,  1.92s/it][A
Training...:  59% 8238/13907 [5:06:45<2:57:29,  1.88s/it][A
Training...:  59% 8239/13907 [5:06:46<2:54:19,  1.85s/it][A
Training...:  59% 8240/13907 [5:06:48<2:50:58,  1.81s/it][A
Training...:  59% 8241/13907 [5:06:50<2:46:45,  1.77s/it][A
Training...:  59% 8242/13907 [5:06:51<2:42:55,  1.73s/it][A
Training...:  59% 8243/13907 [5:06:53<2:38:41,  1.68s/it][A
Training...:  59% 8244/13907 [5:06:55<2:36:17,  1.66s/it][A
Training...:  59% 8245/13907 [5:06:56<2:31:36,  1.61s/it][A
Training...:  59% 8246/13907 [5:06:58<2:27:22,  1.56s/it][A
Training...:  59% 8247/13907 [5:06:59<2:22:36,  1.51s/it][A
Training...:  59% 8248/13907 [5:07:00<2:17:15,  1.46s/it][A
Training...:  59% 8249/13907 [5:07:01<2:11:17,  1.39s/it][A
Training...:  59% 8250/13907 [5:07:03<2:01:37,  1.29s/it][A
Training...:  59% 8251/13907 [5:07:06<3:10:48,  2.02s/it][A
Training...:  59% 8252/13907 [5:07:10<3:52:00,  2.46s/it][A
Training...:  59% 8253/13907 [5:07:13<4:14:46,  2.70s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:37:49<8:52:18, 31938.93s/it]
Training...:  59% 8253/13907 [5:07:17<4:14:46,  2.70s/it][A
Training...:  59% 8254/13907 [5:07:17<4:40:33,  2.98s/it][A
Training...:  59% 8255/13907 [5:07:20<4:45:26,  3.03s/it][A
Training...:  59% 8256/13907 [5:07:23<4:42:23,  3.00s/it][A
Training...:  59% 8257/13907 [5:07:26<4:40:17,  2.98s/it][A
Training...:  59% 8258/13907 [5:07:29<4:38:35,  2.96s/it][A
Training...:  59% 8259/13907 [5:07:31<4:35:19,  2.92s/it][A
Training...:  59% 8260/13907 [5:07:34<4:29:42,  2.87s/it][A
Training...:  59% 8261/13907 [5:07:37<4:24:02,  2.81s/it][A
Training...:  59% 8262/13907 [5:07:39<4:18:19,  2.75s/it][A
Training...:  59% 8263/13907 [5:07:42<4:13:04,  2.69s/it][A
Training...:  59% 8264/13907 [5:07:45<4:08:46,  2.65s/it][A
Training...:  59% 8265/13907 [5:07:47<4:04:22,  2.60s/it][A
Training...:  59% 8266/13907 [5:07:49<4:00:20,  2.56s/it][A
Training...:  59% 8267/13907 [5:07:52<3:56:06,  2.51s/it][A
Training...:  59% 8268/13907 [5:07:54<3:52:42,  2.48s/it][A
Training...:  59% 8269/13907 [5:07:57<3:48:40,  2.43s/it][A
Training...:  59% 8270/13907 [5:07:59<3:45:58,  2.41s/it][A
Training...:  59% 8271/13907 [5:08:01<3:43:13,  2.38s/it][A
Training...:  59% 8272/13907 [5:08:04<3:40:33,  2.35s/it][A
Training...:  59% 8273/13907 [5:08:06<3:37:26,  2.32s/it][A
Training...:  59% 8274/13907 [5:08:08<3:34:09,  2.28s/it][A
Training...:  60% 8275/13907 [5:08:10<3:30:26,  2.24s/it][A
Training...:  60% 8276/13907 [5:08:12<3:27:55,  2.22s/it][A
Training...:  60% 8277/13907 [5:08:14<3:24:48,  2.18s/it][A
Training...:  60% 8278/13907 [5:08:16<3:21:42,  2.15s/it][A                                                                                                                            
                                                         [AEpoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |):  75% 3/4 [31:38:51<8:52:18, 31938.93s/it]
Training...:  60% 8278/13907 [5:08:19<3:21:42,  2.15s/it][ATraining...:  60% 8278/13907 [5:08:19<3:29:39,  2.23s/it]
Epoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |): 100% 4/4 [31:38:51<00:00, 26635.41s/it]  Epoch... (3/4 | Eval Loss: 0.29191526770591736 | Eval wer: 0.28434338362664124 |): 100% 4/4 [31:38:51<00:00, 28482.85s/it]
Configuration saved in /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/flax-wav2vec2-ctc-cv9-baseline/config.json
Model weights saved in /home/sanchitgandhi/train-flax-wav2vec2-ctc-cv9-baseline/flax-wav2vec2-ctc-cv9-baseline/flax_model.msgpack
tokenizer config file saved in ./flax-wav2vec2-ctc-cv9-baseline/tokenizer_config.json
Special tokens file saved in ./flax-wav2vec2-ctc-cv9-baseline/special_tokens_map.json


Evaluating ...:   0% 0/255 [00:00<?, ?it/s][A[AStep... (48675 | Loss: 0.22280919551849365, Learning Rate: 8.036363396968227e-06, Gradient Norm: 1.2357213497161865)
Step... (48700 | Loss: 0.13625295460224152, Learning Rate: 7.884854312578682e-06, Gradient Norm: 0.908812940120697)
Step... (48725 | Loss: 0.17513501644134521, Learning Rate: 7.733327947789803e-06, Gradient Norm: 0.5486080050468445)
Step... (48750 | Loss: 0.20145155489444733, Learning Rate: 7.581818408652907e-06, Gradient Norm: 0.8238804340362549)
Step... (48775 | Loss: 0.20459769666194916, Learning Rate: 7.430309324263362e-06, Gradient Norm: 0.7883410453796387)
Step... (48800 | Loss: 0.10161542892456055, Learning Rate: 7.278782504727133e-06, Gradient Norm: 0.4629247486591339)
Step... (48825 | Loss: 0.20994263887405396, Learning Rate: 7.127273420337588e-06, Gradient Norm: 0.7835735082626343)
Step... (48850 | Loss: 0.14490151405334473, Learning Rate: 6.9757643359480426e-06, Gradient Norm: 0.6047152280807495)
Step... (48875 | Loss: 0.17094503343105316, Learning Rate: 6.824237516411813e-06, Gradient Norm: 0.7671826481819153)
Step... (48900 | Loss: 0.16900500655174255, Learning Rate: 6.672728432022268e-06, Gradient Norm: 1.1970930099487305)
Step... (48925 | Loss: 0.28212636709213257, Learning Rate: 6.521219347632723e-06, Gradient Norm: 1.0782191753387451)
Step... (48950 | Loss: 0.12215743958950043, Learning Rate: 6.369692528096493e-06, Gradient Norm: 0.638762354850769)
Step... (48975 | Loss: 0.21826863288879395, Learning Rate: 6.218183443706948e-06, Gradient Norm: 0.6057543754577637)
Step... (49000 | Loss: 0.1386149823665619, Learning Rate: 6.066674359317403e-06, Gradient Norm: 0.5650272369384766)
Step... (49025 | Loss: 0.15186071395874023, Learning Rate: 5.915147539781174e-06, Gradient Norm: 0.6458603143692017)
Step... (49050 | Loss: 0.1312628984451294, Learning Rate: 5.763638455391629e-06, Gradient Norm: 0.5836495757102966)
Step... (49075 | Loss: 0.17732501029968262, Learning Rate: 5.612129371002084e-06, Gradient Norm: 0.6315293312072754)
Step... (49100 | Loss: 0.1234496608376503, Learning Rate: 5.460602096718503e-06, Gradient Norm: 0.5667303800582886)
Step... (49125 | Loss: 0.1828029453754425, Learning Rate: 5.309093467076309e-06, Gradient Norm: 0.6049838066101074)
Step... (49150 | Loss: 0.19590330123901367, Learning Rate: 5.157584382686764e-06, Gradient Norm: 0.8714916706085205)
Step... (49175 | Loss: 0.19165048003196716, Learning Rate: 5.0060571084031835e-06, Gradient Norm: 0.761817455291748)
Step... (49200 | Loss: 0.1504705846309662, Learning Rate: 4.8545480240136385e-06, Gradient Norm: 0.6178922653198242)
Step... (49225 | Loss: 0.20527435839176178, Learning Rate: 4.7030389396240935e-06, Gradient Norm: 0.6775999069213867)
Step... (49250 | Loss: 0.16984109580516815, Learning Rate: 4.551512120087864e-06, Gradient Norm: 0.761864185333252)
Step... (49275 | Loss: 0.18666332960128784, Learning Rate: 4.400003035698319e-06, Gradient Norm: 1.1019755601882935)
Step... (49300 | Loss: 0.11562931537628174, Learning Rate: 4.248493951308774e-06, Gradient Norm: 0.5015531182289124)
Step... (49325 | Loss: 0.27191057801246643, Learning Rate: 4.096967131772544e-06, Gradient Norm: 0.8735973238945007)
Step... (49350 | Loss: 0.1550465077161789, Learning Rate: 3.945458047382999e-06, Gradient Norm: 0.948198676109314)
Step... (49375 | Loss: 0.18084833025932312, Learning Rate: 3.793948962993454e-06, Gradient Norm: 0.9303070306777954)
Step... (49400 | Loss: 0.1571578085422516, Learning Rate: 3.6424221434572246e-06, Gradient Norm: 0.5516664981842041)
Step... (49425 | Loss: 0.21956250071525574, Learning Rate: 3.4909130590676796e-06, Gradient Norm: 0.8395304679870605)
Step... (49450 | Loss: 0.14661678671836853, Learning Rate: 3.3394039746781345e-06, Gradient Norm: 0.8096752166748047)
Step... (49475 | Loss: 0.19565151631832123, Learning Rate: 3.187877155141905e-06, Gradient Norm: 0.5914112329483032)
Step... (49500 | Loss: 0.12045237421989441, Learning Rate: 3.03636807075236e-06, Gradient Norm: 0.6772451400756836)
Step... (49525 | Loss: 0.16451650857925415, Learning Rate: 2.884858986362815e-06, Gradient Norm: 0.9221020936965942)
Step... (49550 | Loss: 0.15222883224487305, Learning Rate: 2.73333193945291e-06, Gradient Norm: 0.6253476738929749)
Step... (49575 | Loss: 0.21629813313484192, Learning Rate: 2.5818230824370403e-06, Gradient Norm: 0.667567253112793)
Step... (49600 | Loss: 0.15164540708065033, Learning Rate: 2.4302960355271352e-06, Gradient Norm: 0.7952788472175598)
Step... (49625 | Loss: 0.18361005187034607, Learning Rate: 2.2787869511375902e-06, Gradient Norm: 0.5400696992874146)
Step... (49650 | Loss: 0.15517741441726685, Learning Rate: 2.127277866748045e-06, Gradient Norm: 0.7645662426948547)
Step... (49675 | Loss: 0.16100449860095978, Learning Rate: 1.9757510472118156e-06, Gradient Norm: 0.6151652336120605)
Step... (49700 | Loss: 0.1515931338071823, Learning Rate: 1.8242419628222706e-06, Gradient Norm: 0.5878884196281433)
Step... (49725 | Loss: 0.2083747684955597, Learning Rate: 1.6727328784327256e-06, Gradient Norm: 1.1438052654266357)
Step... (49750 | Loss: 0.13528700172901154, Learning Rate: 1.5212059452096582e-06, Gradient Norm: 1.2598721981048584)
Step... (49775 | Loss: 0.19826646149158478, Learning Rate: 1.369696974506951e-06, Gradient Norm: 0.6911228895187378)
Step... (49800 | Loss: 0.17521730065345764, Learning Rate: 1.218187890117406e-06, Gradient Norm: 0.6230920553207397)
Step... (49825 | Loss: 0.20060008764266968, Learning Rate: 1.0666609568943386e-06, Gradient Norm: 0.576390266418457)
Step... (49850 | Loss: 0.16757142543792725, Learning Rate: 9.151518725047936e-07, Gradient Norm: 0.9969807863235474)
Step... (49875 | Loss: 0.23036591708660126, Learning Rate: 7.636428449586674e-07, Gradient Norm: 0.9171985983848572)
Step... (49900 | Loss: 0.150237575173378, Learning Rate: 6.121159117356001e-07, Gradient Norm: 1.1072888374328613)
Step... (49925 | Loss: 0.2572484612464905, Learning Rate: 4.6060682734605507e-07, Gradient Norm: 0.640281081199646)
Step... (49950 | Loss: 0.13045468926429749, Learning Rate: 3.090977713782195e-07, Gradient Norm: 0.6540825963020325)
Step... (49975 | Loss: 0.22782814502716064, Learning Rate: 1.5757085236600687e-07, Gradient Norm: 0.7214051485061646)
Step... (50000 | Loss: 0.11025305092334747, Learning Rate: 6.061792845457603e-09, Gradient Norm: 0.6449115872383118)


Evaluating ...:   0% 1/255 [00:04<20:33,  4.85s/it][A[A

Evaluating ...:   1% 2/255 [00:08<17:58,  4.26s/it][A[A

Evaluating ...:   1% 3/255 [00:12<16:37,  3.96s/it][A[A

Evaluating ...:   2% 4/255 [00:15<15:44,  3.76s/it][A[A

Evaluating ...:   2% 5/255 [00:19<15:05,  3.62s/it][A[A

Evaluating ...:   2% 6/255 [00:22<14:29,  3.49s/it][A[A

Evaluating ...:   3% 7/255 [00:25<14:01,  3.40s/it][A[A

Evaluating ...:   3% 8/255 [00:28<13:26,  3.27s/it][A[A

Evaluating ...:   4% 9/255 [00:31<13:02,  3.18s/it][A[A

Evaluating ...:   4% 10/255 [00:34<12:33,  3.08s/it][A[A

Evaluating ...:   4% 11/255 [00:37<12:15,  3.01s/it][A[A

Evaluating ...:   5% 12/255 [00:40<12:02,  2.97s/it][A[A

Evaluating ...:   5% 13/255 [00:42<11:48,  2.93s/it][A[A

Evaluating ...:   5% 14/255 [00:45<11:30,  2.86s/it][A[A

Evaluating ...:   6% 15/255 [00:48<11:13,  2.81s/it][A[A

Evaluating ...:   6% 16/255 [00:50<10:55,  2.74s/it][A[A

Evaluating ...:   7% 17/255 [00:53<10:45,  2.71s/it][A[A

Evaluating ...:   7% 18/255 [00:56<10:26,  2.64s/it][A[A

Evaluating ...:   7% 19/255 [00:58<10:17,  2.62s/it][A[A

Evaluating ...:   8% 20/255 [01:01<10:02,  2.56s/it][A[A

Evaluating ...:   8% 21/255 [01:03<09:48,  2.52s/it][A[A

Evaluating ...:   9% 22/255 [01:05<09:32,  2.46s/it][A[A

Evaluating ...:   9% 23/255 [01:08<09:18,  2.41s/it][A[A

Evaluating ...:   9% 24/255 [01:10<08:58,  2.33s/it][A[A

Evaluating ...:  10% 25/255 [01:12<08:46,  2.29s/it][A[A

Evaluating ...:  10% 26/255 [01:14<08:31,  2.23s/it][A[A

Evaluating ...:  11% 27/255 [01:16<08:23,  2.21s/it][A[A

Evaluating ...:  11% 28/255 [01:18<08:09,  2.16s/it][A[A

Evaluating ...:  11% 29/255 [01:20<08:03,  2.14s/it][A[A

Evaluating ...:  12% 30/255 [01:22<07:53,  2.10s/it][A[A

Evaluating ...:  12% 31/255 [01:24<07:46,  2.08s/it][A[A

Evaluating ...:  13% 32/255 [01:26<07:31,  2.02s/it][A[A

Evaluating ...:  13% 33/255 [01:28<07:21,  1.99s/it][A[A

Evaluating ...:  13% 34/255 [01:30<07:10,  1.95s/it][A[A

Evaluating ...:  14% 35/255 [01:32<07:03,  1.92s/it][A[A

Evaluating ...:  14% 36/255 [01:34<06:49,  1.87s/it][A[A

Evaluating ...:  15% 37/255 [01:35<06:42,  1.85s/it][A[A

Evaluating ...:  15% 38/255 [01:37<06:30,  1.80s/it][A[A

Evaluating ...:  15% 39/255 [01:39<06:20,  1.76s/it][A[A

Evaluating ...:  16% 40/255 [01:40<06:07,  1.71s/it][A[A

Evaluating ...:  16% 41/255 [01:42<05:59,  1.68s/it][A[A

Evaluating ...:  16% 42/255 [01:43<05:44,  1.62s/it][A[A

Evaluating ...:  17% 43/255 [01:45<05:33,  1.57s/it][A[A

Evaluating ...:  17% 44/255 [01:46<05:18,  1.51s/it][A[A

Evaluating ...:  18% 45/255 [01:48<05:09,  1.48s/it][A[A

Evaluating ...:  18% 46/255 [01:49<04:55,  1.42s/it][A[A

Evaluating ...:  18% 47/255 [01:50<04:46,  1.38s/it][A[A

Evaluating ...:  19% 48/255 [01:51<04:31,  1.31s/it][A[A

Evaluating ...:  19% 49/255 [01:53<04:20,  1.27s/it][A[A

Evaluating ...:  20% 50/255 [01:53<03:58,  1.17s/it][A[A

Evaluating ...:  20% 51/255 [01:58<07:03,  2.08s/it][A[A

Evaluating ...:  20% 52/255 [02:02<08:53,  2.63s/it][A[A

Evaluating ...:  21% 53/255 [02:05<09:58,  2.96s/it][A[A

Evaluating ...:  21% 54/255 [02:09<10:32,  3.15s/it][A[A

Evaluating ...:  22% 55/255 [02:12<10:52,  3.26s/it][A[A

Evaluating ...:  22% 56/255 [02:16<10:53,  3.28s/it][A[A

Evaluating ...:  22% 57/255 [02:19<10:53,  3.30s/it][A[A

Evaluating ...:  23% 58/255 [02:22<10:44,  3.27s/it][A[A

Evaluating ...:  23% 59/255 [02:26<10:39,  3.26s/it][A[A

Evaluating ...:  24% 60/255 [02:29<10:26,  3.21s/it][A[A

Evaluating ...:  24% 61/255 [02:32<10:17,  3.18s/it][A[A

Evaluating ...:  24% 62/255 [02:35<10:04,  3.13s/it][A[A

Evaluating ...:  25% 63/255 [02:38<09:58,  3.12s/it][A[A

Evaluating ...:  25% 64/255 [02:41<09:43,  3.06s/it][A[A

Evaluating ...:  25% 65/255 [02:44<09:32,  3.01s/it][A[A

Evaluating ...:  26% 66/255 [02:47<09:18,  2.95s/it][A[A

Evaluating ...:  26% 67/255 [02:50<09:16,  2.96s/it][A[A

Evaluating ...:  27% 68/255 [02:52<09:06,  2.92s/it][A[A

Evaluating ...:  27% 69/255 [02:55<08:58,  2.90s/it][A[A

Evaluating ...:  27% 70/255 [02:58<08:44,  2.84s/it][A[A

Evaluating ...:  28% 71/255 [03:01<08:36,  2.81s/it][A[A

Evaluating ...:  28% 72/255 [03:03<08:22,  2.75s/it][A[A

Evaluating ...:  29% 73/255 [03:06<08:13,  2.71s/it][A[A

Evaluating ...:  29% 74/255 [03:08<08:02,  2.67s/it][A[A

Evaluating ...:  29% 75/255 [03:11<07:54,  2.64s/it][A[A

Evaluating ...:  30% 76/255 [03:13<07:42,  2.59s/it][A[A

Evaluating ...:  30% 77/255 [03:16<07:39,  2.58s/it][A[A

Evaluating ...:  31% 78/255 [03:18<07:30,  2.55s/it][A[A

Evaluating ...:  31% 79/255 [03:21<07:25,  2.53s/it][A[A

Evaluating ...:  31% 80/255 [03:23<07:15,  2.49s/it][A[A

Evaluating ...:  32% 81/255 [03:26<07:07,  2.45s/it][A[A

Evaluating ...:  32% 82/255 [03:28<06:54,  2.40s/it][A[A

Evaluating ...:  33% 83/255 [03:30<06:47,  2.37s/it][A[A

Evaluating ...:  33% 84/255 [03:33<06:41,  2.35s/it][A[A

Evaluating ...:  33% 85/255 [03:35<06:35,  2.33s/it][A[A

Evaluating ...:  34% 86/255 [03:37<06:22,  2.26s/it][A[A

Evaluating ...:  34% 87/255 [03:39<06:14,  2.23s/it][A[A

Evaluating ...:  35% 88/255 [03:41<06:03,  2.18s/it][A[A

Evaluating ...:  35% 89/255 [03:43<05:56,  2.15s/it][A[A

Evaluating ...:  35% 90/255 [03:45<05:45,  2.09s/it][A[A

Evaluating ...:  36% 91/255 [03:47<05:38,  2.07s/it][A[A

Evaluating ...:  36% 92/255 [03:49<05:28,  2.01s/it][A[A

Evaluating ...:  36% 93/255 [03:51<05:21,  1.98s/it][A[A

Evaluating ...:  37% 94/255 [03:53<05:10,  1.93s/it][A[A

Evaluating ...:  37% 95/255 [03:55<05:03,  1.90s/it][A[A

Evaluating ...:  38% 96/255 [03:56<04:52,  1.84s/it][A[A

Evaluating ...:  38% 97/255 [03:58<04:43,  1.79s/it][A[A

Evaluating ...:  38% 98/255 [04:00<04:28,  1.71s/it][A[A

Evaluating ...:  39% 99/255 [04:01<04:13,  1.63s/it][A[A

Evaluating ...:  39% 100/255 [04:02<03:51,  1.49s/it][A[A

Evaluating ...:  40% 101/255 [04:07<06:00,  2.34s/it][A[A

Evaluating ...:  40% 102/255 [04:10<07:11,  2.82s/it][A[A

Evaluating ...:  40% 103/255 [04:14<07:49,  3.09s/it][A[A

Evaluating ...:  41% 104/255 [04:18<08:06,  3.22s/it][A[A

Evaluating ...:  41% 105/255 [04:21<08:20,  3.34s/it][A[A

Evaluating ...:  42% 106/255 [04:25<08:21,  3.36s/it][A[A

Evaluating ...:  42% 107/255 [04:28<08:16,  3.35s/it][A[A

Evaluating ...:  42% 108/255 [04:31<08:05,  3.30s/it][A[A

Evaluating ...:  43% 109/255 [04:34<07:56,  3.26s/it][A[A

Evaluating ...:  43% 110/255 [04:37<07:43,  3.20s/it][A[A

Evaluating ...:  44% 111/255 [04:41<07:34,  3.16s/it][A[A

Evaluating ...:  44% 112/255 [04:43<07:22,  3.09s/it][A[A

Evaluating ...:  44% 113/255 [04:46<07:13,  3.05s/it][A[A

Evaluating ...:  45% 114/255 [04:49<07:01,  2.99s/it][A[A

Evaluating ...:  45% 115/255 [04:52<06:55,  2.97s/it][A[A

Evaluating ...:  45% 116/255 [04:55<06:45,  2.91s/it][A[A

Evaluating ...:  46% 117/255 [04:58<06:38,  2.89s/it][A[A

Evaluating ...:  46% 118/255 [05:01<06:29,  2.84s/it][A[A

Evaluating ...:  47% 119/255 [05:03<06:21,  2.81s/it][A[A

Evaluating ...:  47% 120/255 [05:06<06:10,  2.75s/it][A[A

Evaluating ...:  47% 121/255 [05:09<06:08,  2.75s/it][A[A

Evaluating ...:  48% 122/255 [05:11<06:01,  2.72s/it][A[A

Evaluating ...:  48% 123/255 [05:14<05:53,  2.68s/it][A[A

Evaluating ...:  49% 124/255 [05:16<05:43,  2.62s/it][A[A

Evaluating ...:  49% 125/255 [05:19<05:36,  2.59s/it][A[A

Evaluating ...:  49% 126/255 [05:21<05:27,  2.54s/it][A[A

Evaluating ...:  50% 127/255 [05:24<05:20,  2.51s/it][A[A

Evaluating ...:  50% 128/255 [05:26<05:11,  2.46s/it][A[A

Evaluating ...:  51% 129/255 [05:28<05:05,  2.42s/it][A[A

Evaluating ...:  51% 130/255 [05:31<04:56,  2.37s/it][A[A

Evaluating ...:  51% 131/255 [05:33<04:50,  2.34s/it][A[A

Evaluating ...:  52% 132/255 [05:35<04:41,  2.29s/it][A[A

Evaluating ...:  52% 133/255 [05:37<04:36,  2.27s/it][A[A

Evaluating ...:  53% 134/255 [05:39<04:28,  2.22s/it][A[A

Evaluating ...:  53% 135/255 [05:42<04:24,  2.20s/it][A[A

Evaluating ...:  53% 136/255 [05:44<04:18,  2.17s/it][A[A

Evaluating ...:  54% 137/255 [05:46<04:12,  2.14s/it][A[A

Evaluating ...:  54% 138/255 [05:48<04:05,  2.10s/it][A[A

Evaluating ...:  55% 139/255 [05:50<03:59,  2.06s/it][A[A

Evaluating ...:  55% 140/255 [05:52<03:51,  2.01s/it][A[A

Evaluating ...:  55% 141/255 [05:53<03:45,  1.98s/it][A[A

Evaluating ...:  56% 142/255 [05:55<03:37,  1.92s/it][A[A

Evaluating ...:  56% 143/255 [05:57<03:34,  1.91s/it][A[A

Evaluating ...:  56% 144/255 [05:59<03:27,  1.87s/it][A[A

Evaluating ...:  57% 145/255 [06:01<03:19,  1.82s/it][A[A

Evaluating ...:  57% 146/255 [06:02<03:10,  1.75s/it][A[A

Evaluating ...:  58% 147/255 [06:04<03:03,  1.70s/it][A[A

Evaluating ...:  58% 148/255 [06:05<02:52,  1.61s/it][A[A

Evaluating ...:  58% 149/255 [06:07<02:42,  1.53s/it][A[A

Evaluating ...:  59% 150/255 [06:08<02:26,  1.39s/it][A[A

Evaluating ...:  59% 151/255 [06:12<03:50,  2.22s/it][A[A

Evaluating ...:  60% 152/255 [06:16<04:39,  2.72s/it][A[A

Evaluating ...:  60% 153/255 [06:19<05:07,  3.01s/it][A[A

Evaluating ...:  60% 154/255 [06:23<05:20,  3.17s/it][A[A

Evaluating ...:  61% 155/255 [06:26<05:29,  3.29s/it][A[A

Evaluating ...:  61% 156/255 [06:30<05:29,  3.33s/it][A[A

Evaluating ...:  62% 157/255 [06:33<05:28,  3.35s/it][A[A

Evaluating ...:  62% 158/255 [06:37<05:22,  3.32s/it][A[A

Evaluating ...:  62% 159/255 [06:40<05:18,  3.32s/it][A[A

Evaluating ...:  63% 160/255 [06:43<05:14,  3.31s/it][A[A

Evaluating ...:  63% 161/255 [06:46<05:05,  3.25s/it][A[A

Evaluating ...:  64% 162/255 [06:49<04:53,  3.16s/it][A[A

Evaluating ...:  64% 163/255 [06:52<04:49,  3.15s/it][A[A

Evaluating ...:  64% 164/255 [06:55<04:38,  3.06s/it][A[A

Evaluating ...:  65% 165/255 [06:58<04:31,  3.02s/it][A[A

Evaluating ...:  65% 166/255 [07:01<04:22,  2.95s/it][A[A

Evaluating ...:  65% 167/255 [07:04<04:14,  2.90s/it][A[A

Evaluating ...:  66% 168/255 [07:06<04:06,  2.84s/it][A[A

Evaluating ...:  66% 169/255 [07:09<04:01,  2.81s/it][A[A

Evaluating ...:  67% 170/255 [07:12<03:54,  2.76s/it][A[A

Evaluating ...:  67% 171/255 [07:14<03:49,  2.74s/it][A[A

Evaluating ...:  67% 172/255 [07:17<03:42,  2.68s/it][A[A

Evaluating ...:  68% 173/255 [07:20<03:38,  2.66s/it][A[A

Evaluating ...:  68% 174/255 [07:22<03:32,  2.62s/it][A[A

Evaluating ...:  69% 175/255 [07:25<03:28,  2.61s/it][A[A

Evaluating ...:  69% 176/255 [07:27<03:22,  2.57s/it][A[A

Evaluating ...:  69% 177/255 [07:30<03:18,  2.54s/it][A[A

Evaluating ...:  70% 178/255 [07:32<03:12,  2.50s/it][A[A

Evaluating ...:  70% 179/255 [07:34<03:08,  2.48s/it][A[A

Evaluating ...:  71% 180/255 [07:37<03:01,  2.42s/it][A[A

Evaluating ...:  71% 181/255 [07:39<02:56,  2.38s/it][A[A

Evaluating ...:  71% 182/255 [07:41<02:50,  2.33s/it][A[A

Evaluating ...:  72% 183/255 [07:43<02:45,  2.30s/it][A[A

Evaluating ...:  72% 184/255 [07:46<02:40,  2.26s/it][A[A

Evaluating ...:  73% 185/255 [07:48<02:38,  2.26s/it][A[A

Evaluating ...:  73% 186/255 [07:50<02:32,  2.22s/it][A[A

Evaluating ...:  73% 187/255 [07:52<02:29,  2.20s/it][A[A

Evaluating ...:  74% 188/255 [07:54<02:24,  2.15s/it][A[A

Evaluating ...:  74% 189/255 [07:56<02:19,  2.12s/it][A[A

Evaluating ...:  75% 190/255 [07:58<02:14,  2.07s/it][A[A

Evaluating ...:  75% 191/255 [08:00<02:10,  2.05s/it][A[A

Evaluating ...:  75% 192/255 [08:02<02:05,  1.99s/it][A[A

Evaluating ...:  76% 193/255 [08:04<02:01,  1.96s/it][A[A

Evaluating ...:  76% 194/255 [08:06<01:55,  1.90s/it][A[A

Evaluating ...:  76% 195/255 [08:07<01:51,  1.86s/it][A[A

Evaluating ...:  77% 196/255 [08:09<01:45,  1.79s/it][A[A

Evaluating ...:  77% 197/255 [08:11<01:40,  1.74s/it][A[A

Evaluating ...:  78% 198/255 [08:12<01:34,  1.66s/it][A[A

Evaluating ...:  78% 199/255 [08:14<01:28,  1.59s/it][A[A

Evaluating ...:  78% 200/255 [08:15<01:20,  1.46s/it][A[A

Evaluating ...:  79% 201/255 [08:19<02:07,  2.36s/it][A[A

Evaluating ...:  79% 202/255 [08:23<02:27,  2.78s/it][A[A

Evaluating ...:  80% 203/255 [08:27<02:37,  3.03s/it][A[A

Evaluating ...:  80% 204/255 [08:30<02:39,  3.14s/it][A[A

Evaluating ...:  80% 205/255 [08:33<02:41,  3.24s/it][A[A

Evaluating ...:  81% 206/255 [08:37<02:38,  3.23s/it][A[A

Evaluating ...:  81% 207/255 [08:40<02:33,  3.20s/it][A[A

Evaluating ...:  82% 208/255 [08:43<02:26,  3.12s/it][A[A

Evaluating ...:  82% 209/255 [08:46<02:22,  3.09s/it][A[A

Evaluating ...:  82% 210/255 [08:49<02:15,  3.02s/it][A[A

Evaluating ...:  83% 211/255 [08:52<02:12,  3.01s/it][A[A

Evaluating ...:  83% 212/255 [08:54<02:06,  2.93s/it][A[A

Evaluating ...:  84% 213/255 [08:57<02:00,  2.88s/it][A[A

Evaluating ...:  84% 214/255 [09:00<01:54,  2.80s/it][A[A

Evaluating ...:  84% 215/255 [09:02<01:50,  2.76s/it][A[A

Evaluating ...:  85% 216/255 [09:05<01:45,  2.69s/it][A[A

Evaluating ...:  85% 217/255 [09:08<01:41,  2.67s/it][A[A

Evaluating ...:  85% 218/255 [09:10<01:36,  2.61s/it][A[A

Evaluating ...:  86% 219/255 [09:13<01:32,  2.58s/it][A[A

Evaluating ...:  86% 220/255 [09:15<01:28,  2.53s/it][A[A

Evaluating ...:  87% 221/255 [09:17<01:24,  2.50s/it][A[A

Evaluating ...:  87% 222/255 [09:20<01:20,  2.45s/it][A[A

Evaluating ...:  87% 223/255 [09:22<01:17,  2.42s/it][A[A

Evaluating ...:  88% 224/255 [09:24<01:13,  2.36s/it][A[A

Evaluating ...:  88% 225/255 [09:27<01:09,  2.33s/it][A[A

Evaluating ...:  89% 226/255 [09:29<01:06,  2.28s/it][A[A

Evaluating ...:  89% 227/255 [09:31<01:03,  2.25s/it][A[A

Evaluating ...:  89% 228/255 [09:33<00:59,  2.19s/it][A[A

Evaluating ...:  90% 229/255 [09:35<00:56,  2.16s/it][A[A

Evaluating ...:  90% 230/255 [09:37<00:52,  2.10s/it][A[A

Evaluating ...:  91% 231/255 [09:39<00:49,  2.07s/it][A[A

Evaluating ...:  91% 232/255 [09:41<00:46,  2.04s/it][A[A

Evaluating ...:  91% 233/255 [09:43<00:44,  2.02s/it][A[A

Evaluating ...:  92% 234/255 [09:45<00:41,  1.97s/it][A[A

Evaluating ...:  92% 235/255 [09:47<00:38,  1.94s/it][A[A

Evaluating ...:  93% 236/255 [09:48<00:35,  1.88s/it][A[A

Evaluating ...:  93% 237/255 [09:50<00:33,  1.85s/it][A[A

Evaluating ...:  93% 238/255 [09:52<00:30,  1.80s/it][A[A

Evaluating ...:  94% 239/255 [09:54<00:28,  1.77s/it][A[A

Evaluating ...:  94% 240/255 [09:55<00:25,  1.72s/it][A[A

Evaluating ...:  95% 241/255 [09:57<00:23,  1.68s/it][A[A

Evaluating ...:  95% 242/255 [09:58<00:20,  1.61s/it][A[A

Evaluating ...:  95% 243/255 [10:00<00:18,  1.57s/it][A[A

Evaluating ...:  96% 244/255 [10:01<00:16,  1.51s/it][A[A

Evaluating ...:  96% 245/255 [10:02<00:14,  1.48s/it][A[A

Evaluating ...:  96% 246/255 [10:04<00:12,  1.41s/it][A[A

Evaluating ...:  97% 247/255 [10:05<00:10,  1.37s/it][A[A

Evaluating ...:  97% 248/255 [10:06<00:09,  1.30s/it][A[A

Evaluating ...:  98% 249/255 [10:07<00:07,  1.24s/it][A[A

Evaluating ...:  98% 250/255 [10:08<00:05,  1.14s/it][A[A

Evaluating ...:  98% 251/255 [10:12<00:07,  1.92s/it][A[A

Evaluating ...:  99% 252/255 [10:14<00:06,  2.07s/it][A[A

Evaluating ...:  99% 253/255 [10:16<00:04,  2.06s/it][A[A

Evaluating ...: 100% 254/255 [10:18<00:01,  1.93s/it][A[A

Evaluating ...: 100% 255/255 [10:19<00:00,  1.74s/it][A[AEvaluating ...: 100% 255/255 [10:19<00:00,  2.43s/it]
/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/tree_util.py:188: FutureWarning: jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() instead as a drop-in replacement.
  warnings.warn('jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() '


Epoch... (4/4 | Eval Loss: 0.2675064504146576 | Eval wer: 0.26900434313257854 |)
Predicting test...:   0% 0/255 [00:00<?, ?it/s][A[A

Predicting test...:   0% 1/255 [00:04<18:55,  4.47s/it][A[A

Predicting test...:   1% 2/255 [00:08<16:56,  4.02s/it][A[A

Predicting test...:   1% 3/255 [00:11<15:53,  3.78s/it][A[A

Predicting test...:   2% 4/255 [00:15<15:09,  3.62s/it][A[A

Predicting test...:   2% 5/255 [00:18<14:32,  3.49s/it][A[A

Predicting test...:   2% 6/255 [00:21<14:04,  3.39s/it][A[A

Predicting test...:   3% 7/255 [00:24<13:36,  3.29s/it][A[A

Predicting test...:   3% 8/255 [00:27<13:19,  3.24s/it][A[A

Predicting test...:   4% 9/255 [00:30<12:59,  3.17s/it][A[A

Predicting test...:   4% 10/255 [00:33<12:34,  3.08s/it][A[A

Predicting test...:   4% 11/255 [00:36<12:10,  3.00s/it][A[A

Predicting test...:   5% 12/255 [00:39<11:48,  2.92s/it][A[A

Predicting test...:   5% 13/255 [00:41<11:29,  2.85s/it][A[A

Predicting test...:   5% 14/255 [00:44<11:12,  2.79s/it][A[A

Predicting test...:   6% 15/255 [00:47<10:56,  2.73s/it][A[A

Predicting test...:   6% 16/255 [00:49<10:40,  2.68s/it][A[A

Predicting test...:   7% 17/255 [00:52<10:26,  2.63s/it][A[A

Predicting test...:   7% 18/255 [00:54<10:12,  2.58s/it][A[A

Predicting test...:   7% 19/255 [00:57<10:00,  2.55s/it][A[A

Predicting test...:   8% 20/255 [00:59<09:48,  2.51s/it][A[A

Predicting test...:   8% 21/255 [01:01<09:36,  2.47s/it][A[A

Predicting test...:   9% 22/255 [01:04<09:22,  2.41s/it][A[A

Predicting test...:   9% 23/255 [01:06<09:09,  2.37s/it][A[A

Predicting test...:   9% 24/255 [01:08<08:59,  2.34s/it][A[A

Predicting test...:  10% 25/255 [01:10<08:48,  2.30s/it][A[A

Predicting test...:  10% 26/255 [01:13<08:35,  2.25s/it][A[A

Predicting test...:  11% 27/255 [01:15<08:23,  2.21s/it][A[A

Predicting test...:  11% 28/255 [01:17<08:12,  2.17s/it][A[A

Predicting test...:  11% 29/255 [01:19<08:04,  2.14s/it][A[A

Predicting test...:  12% 30/255 [01:21<07:54,  2.11s/it][A[A

Predicting test...:  12% 31/255 [01:23<07:44,  2.07s/it][A[A

Predicting test...:  13% 32/255 [01:25<07:35,  2.04s/it][A[A

Predicting test...:  13% 33/255 [01:27<07:24,  2.00s/it][A[A

Predicting test...:  13% 34/255 [01:29<07:13,  1.96s/it][A[A

Predicting test...:  14% 35/255 [01:30<07:02,  1.92s/it][A[A

Predicting test...:  14% 36/255 [01:32<06:53,  1.89s/it][A[A

Predicting test...:  15% 37/255 [01:34<06:44,  1.85s/it][A[A

Predicting test...:  15% 38/255 [01:36<06:34,  1.82s/it][A[A

Predicting test...:  15% 39/255 [01:37<06:24,  1.78s/it][A[A

Predicting test...:  16% 40/255 [01:39<06:14,  1.74s/it][A[A

Predicting test...:  16% 41/255 [01:41<06:06,  1.71s/it][A[A

Predicting test...:  16% 42/255 [01:42<05:55,  1.67s/it][A[A

Predicting test...:  17% 43/255 [01:44<05:42,  1.61s/it][A[A

Predicting test...:  17% 44/255 [01:45<05:31,  1.57s/it][A[A

Predicting test...:  18% 45/255 [01:47<05:18,  1.52s/it][A[A

Predicting test...:  18% 46/255 [01:48<05:06,  1.46s/it][A[A

Predicting test...:  18% 47/255 [01:49<04:53,  1.41s/it][A[A

Predicting test...:  19% 48/255 [01:50<04:40,  1.35s/it][A[A

Predicting test...:  19% 49/255 [01:52<04:25,  1.29s/it][A[A

Predicting test...:  20% 50/255 [01:53<04:04,  1.19s/it][A[A

Predicting test...:  20% 51/255 [01:57<07:01,  2.07s/it][A[A

Predicting test...:  20% 52/255 [02:01<08:48,  2.60s/it][A[A

Predicting test...:  21% 53/255 [02:04<09:51,  2.93s/it][A[A

Predicting test...:  21% 54/255 [02:08<10:24,  3.11s/it][A[A

Predicting test...:  22% 55/255 [02:11<10:43,  3.22s/it][A[A

Predicting test...:  22% 56/255 [02:15<10:51,  3.28s/it][A[A

Predicting test...:  22% 57/255 [02:18<10:52,  3.30s/it][A[A

Predicting test...:  23% 58/255 [02:21<10:45,  3.27s/it][A[A

Predicting test...:  23% 59/255 [02:24<10:36,  3.25s/it][A[A

Predicting test...:  24% 60/255 [02:28<10:27,  3.22s/it][A[A

Predicting test...:  24% 61/255 [02:31<10:26,  3.23s/it][A[A

Predicting test...:  24% 62/255 [02:34<10:11,  3.17s/it][A[A

Predicting test...:  25% 63/255 [02:37<09:59,  3.12s/it][A[A

Predicting test...:  25% 64/255 [02:40<09:46,  3.07s/it][A[A

Predicting test...:  25% 65/255 [02:43<09:33,  3.02s/it][A[A

Predicting test...:  26% 66/255 [02:46<09:21,  2.97s/it][A[A

Predicting test...:  26% 67/255 [02:48<09:09,  2.92s/it][A[A

Predicting test...:  27% 68/255 [02:51<08:59,  2.88s/it][A[A

Predicting test...:  27% 69/255 [02:54<08:49,  2.84s/it][A[A

Predicting test...:  27% 70/255 [02:57<08:37,  2.80s/it][A[A

Predicting test...:  28% 71/255 [02:59<08:29,  2.77s/it][A[A

Predicting test...:  28% 72/255 [03:02<08:20,  2.74s/it][A[A

Predicting test...:  29% 73/255 [03:05<08:14,  2.72s/it][A[A

Predicting test...:  29% 74/255 [03:07<08:06,  2.69s/it][A[A

Predicting test...:  29% 75/255 [03:10<07:57,  2.66s/it][A[A

Predicting test...:  30% 76/255 [03:12<07:49,  2.62s/it][A[A

Predicting test...:  30% 77/255 [03:15<07:41,  2.59s/it][A[A

Predicting test...:  31% 78/255 [03:17<07:33,  2.56s/it][A[A

Predicting test...:  31% 79/255 [03:20<07:34,  2.58s/it][A[A

Predicting test...:  31% 80/255 [03:22<07:23,  2.53s/it][A[A

Predicting test...:  32% 81/255 [03:25<07:11,  2.48s/it][A[A

Predicting test...:  32% 82/255 [03:27<06:59,  2.43s/it][A[A

Predicting test...:  33% 83/255 [03:29<06:49,  2.38s/it][A[A

Predicting test...:  33% 84/255 [03:32<06:39,  2.34s/it][A[A

Predicting test...:  33% 85/255 [03:34<06:29,  2.29s/it][A[A

Predicting test...:  34% 86/255 [03:36<06:21,  2.26s/it][A[A

Predicting test...:  34% 87/255 [03:38<06:12,  2.22s/it][A[A

Predicting test...:  35% 88/255 [03:40<06:03,  2.18s/it][A[A

Predicting test...:  35% 89/255 [03:42<05:55,  2.14s/it][A[A

Predicting test...:  35% 90/255 [03:44<05:47,  2.11s/it][A[A

Predicting test...:  36% 91/255 [03:46<05:40,  2.07s/it][A[A

Predicting test...:  36% 92/255 [03:48<05:31,  2.04s/it][A[A

Predicting test...:  36% 93/255 [03:50<05:23,  2.00s/it][A[A

Predicting test...:  37% 94/255 [03:52<05:15,  1.96s/it][A[A

Predicting test...:  37% 95/255 [03:54<05:06,  1.92s/it][A[A

Predicting test...:  38% 96/255 [03:56<04:57,  1.87s/it][A[A

Predicting test...:  38% 97/255 [03:57<04:47,  1.82s/it][A[A

Predicting test...:  38% 98/255 [03:59<04:34,  1.75s/it][A[A

Predicting test...:  39% 99/255 [04:00<04:16,  1.64s/it][A[A

Predicting test...:  39% 100/255 [04:01<03:55,  1.52s/it][A[A

Predicting test...:  40% 101/255 [04:06<06:02,  2.35s/it][A[A

Predicting test...:  40% 102/255 [04:10<07:14,  2.84s/it][A[A

Predicting test...:  40% 103/255 [04:13<07:50,  3.10s/it][A[A

Predicting test...:  41% 104/255 [04:17<08:07,  3.23s/it][A[A

Predicting test...:  41% 105/255 [04:20<08:13,  3.29s/it][A[A

Predicting test...:  42% 106/255 [04:24<08:12,  3.30s/it][A[A

Predicting test...:  42% 107/255 [04:27<08:09,  3.31s/it][A[A

Predicting test...:  42% 108/255 [04:30<08:02,  3.28s/it][A[A

Predicting test...:  43% 109/255 [04:33<07:53,  3.24s/it][A[A

Predicting test...:  43% 110/255 [04:37<07:42,  3.19s/it][A[A

Predicting test...:  44% 111/255 [04:40<07:32,  3.14s/it][A[A

Predicting test...:  44% 112/255 [04:43<07:22,  3.09s/it][A[A

Predicting test...:  44% 113/255 [04:45<07:11,  3.04s/it][A[A

Predicting test...:  45% 114/255 [04:48<07:02,  3.00s/it][A[A

Predicting test...:  45% 115/255 [04:51<06:53,  2.96s/it][A[A

Predicting test...:  45% 116/255 [04:54<06:44,  2.91s/it][A[A

Predicting test...:  46% 117/255 [04:57<06:36,  2.87s/it][A[A

Predicting test...:  46% 118/255 [05:00<06:28,  2.84s/it][A[A

Predicting test...:  47% 119/255 [05:02<06:20,  2.80s/it][A[A

Predicting test...:  47% 120/255 [05:05<06:11,  2.75s/it][A[A

Predicting test...:  47% 121/255 [05:07<06:03,  2.71s/it][A[A

Predicting test...:  48% 122/255 [05:10<05:55,  2.67s/it][A[A

Predicting test...:  48% 123/255 [05:13<05:48,  2.64s/it][A[A

Predicting test...:  49% 124/255 [05:15<05:41,  2.61s/it][A[A

Predicting test...:  49% 125/255 [05:18<05:34,  2.57s/it][A[A

Predicting test...:  49% 126/255 [05:20<05:27,  2.54s/it][A[A

Predicting test...:  50% 127/255 [05:23<05:21,  2.51s/it][A[A

Predicting test...:  50% 128/255 [05:25<05:14,  2.48s/it][A[A

Predicting test...:  51% 129/255 [05:27<05:11,  2.47s/it][A[A

Predicting test...:  51% 130/255 [05:30<05:02,  2.42s/it][A[A

Predicting test...:  51% 131/255 [05:32<04:54,  2.38s/it][A[A

Predicting test...:  52% 132/255 [05:34<04:46,  2.33s/it][A[A

Predicting test...:  52% 133/255 [05:36<04:39,  2.29s/it][A[A

Predicting test...:  53% 134/255 [05:39<04:32,  2.25s/it][A[A

Predicting test...:  53% 135/255 [05:41<04:25,  2.21s/it][A[A

Predicting test...:  53% 136/255 [05:43<04:20,  2.19s/it][A[A

Predicting test...:  54% 137/255 [05:45<04:14,  2.15s/it][A[A

Predicting test...:  54% 138/255 [05:47<04:07,  2.11s/it][A[A

Predicting test...:  55% 139/255 [05:49<04:00,  2.08s/it][A[A

Predicting test...:  55% 140/255 [05:51<03:54,  2.04s/it][A[A

Predicting test...:  55% 141/255 [05:53<03:46,  1.99s/it][A[A

Predicting test...:  56% 142/255 [05:55<03:40,  1.95s/it][A[A

Predicting test...:  56% 143/255 [05:56<03:33,  1.90s/it][A[A

Predicting test...:  56% 144/255 [05:58<03:25,  1.85s/it][A[A

Predicting test...:  57% 145/255 [06:00<03:18,  1.80s/it][A[A

Predicting test...:  57% 146/255 [06:01<03:10,  1.75s/it][A[A

Predicting test...:  58% 147/255 [06:03<03:02,  1.69s/it][A[A

Predicting test...:  58% 148/255 [06:04<02:53,  1.62s/it][A[A

Predicting test...:  58% 149/255 [06:06<02:43,  1.54s/it][A[A

Predicting test...:  59% 150/255 [06:07<02:28,  1.42s/it][A[A

Predicting test...:  59% 151/255 [06:11<03:49,  2.21s/it][A[A

Predicting test...:  60% 152/255 [06:15<04:42,  2.74s/it][A[A

Predicting test...:  60% 153/255 [06:19<05:08,  3.02s/it][A[A

Predicting test...:  60% 154/255 [06:22<05:21,  3.18s/it][A[A

Predicting test...:  61% 155/255 [06:26<05:26,  3.27s/it][A[A

Predicting test...:  61% 156/255 [06:29<05:26,  3.30s/it][A[A

Predicting test...:  62% 157/255 [06:32<05:24,  3.31s/it][A[A

Predicting test...:  62% 158/255 [06:36<05:18,  3.28s/it][A[A

Predicting test...:  62% 159/255 [06:39<05:12,  3.25s/it][A[A

Predicting test...:  63% 160/255 [06:42<05:05,  3.21s/it][A[A

Predicting test...:  63% 161/255 [06:45<04:58,  3.17s/it][A[A

Predicting test...:  64% 162/255 [06:48<04:50,  3.12s/it][A[A

Predicting test...:  64% 163/255 [06:51<04:42,  3.07s/it][A[A

Predicting test...:  64% 164/255 [06:54<04:35,  3.02s/it][A[A

Predicting test...:  65% 165/255 [06:57<04:27,  2.97s/it][A[A

Predicting test...:  65% 166/255 [06:59<04:20,  2.92s/it][A[A

Predicting test...:  65% 167/255 [07:02<04:13,  2.88s/it][A[A

Predicting test...:  66% 168/255 [07:05<04:07,  2.85s/it][A[A

Predicting test...:  66% 169/255 [07:08<04:01,  2.81s/it][A[A

Predicting test...:  67% 170/255 [07:10<03:55,  2.78s/it][A[A

Predicting test...:  67% 171/255 [07:13<03:50,  2.74s/it][A[A

Predicting test...:  67% 172/255 [07:16<03:44,  2.71s/it][A[A

Predicting test...:  68% 173/255 [07:18<03:40,  2.68s/it][A[A

Predicting test...:  68% 174/255 [07:21<03:35,  2.67s/it][A[A

Predicting test...:  69% 175/255 [07:24<03:30,  2.63s/it][A[A

Predicting test...:  69% 176/255 [07:26<03:25,  2.60s/it][A[A

Predicting test...:  69% 177/255 [07:29<03:19,  2.56s/it][A[A

Predicting test...:  70% 178/255 [07:31<03:13,  2.52s/it][A[A

Predicting test...:  70% 179/255 [07:33<03:08,  2.48s/it][A[A

Predicting test...:  71% 180/255 [07:36<03:02,  2.44s/it][A[A

Predicting test...:  71% 181/255 [07:38<02:57,  2.39s/it][A[A

Predicting test...:  71% 182/255 [07:40<02:51,  2.35s/it][A[A

Predicting test...:  72% 183/255 [07:42<02:46,  2.31s/it][A[A

Predicting test...:  72% 184/255 [07:45<02:41,  2.27s/it][A[A

Predicting test...:  73% 185/255 [07:47<02:36,  2.24s/it][A[A

Predicting test...:  73% 186/255 [07:49<02:31,  2.20s/it][A[A

Predicting test...:  73% 187/255 [07:51<02:27,  2.17s/it][A[A

Predicting test...:  74% 188/255 [07:53<02:23,  2.14s/it][A[A

Predicting test...:  74% 189/255 [07:55<02:19,  2.11s/it][A[A

Predicting test...:  75% 190/255 [07:57<02:14,  2.07s/it][A[A

Predicting test...:  75% 191/255 [07:59<02:10,  2.04s/it][A[A

Predicting test...:  75% 192/255 [08:01<02:05,  2.00s/it][A[A

Predicting test...:  76% 193/255 [08:03<02:01,  1.96s/it][A[A

Predicting test...:  76% 194/255 [08:05<01:56,  1.91s/it][A[A

Predicting test...:  76% 195/255 [08:06<01:51,  1.87s/it][A[A

Predicting test...:  77% 196/255 [08:08<01:46,  1.81s/it][A[A

Predicting test...:  77% 197/255 [08:10<01:41,  1.74s/it][A[A

Predicting test...:  78% 198/255 [08:11<01:35,  1.68s/it][A[A

Predicting test...:  78% 199/255 [08:13<01:29,  1.59s/it][A[A

Predicting test...:  78% 200/255 [08:14<01:21,  1.48s/it][A[A

Predicting test...:  79% 201/255 [08:18<02:05,  2.33s/it][A[A

Predicting test...:  79% 202/255 [08:22<02:28,  2.79s/it][A[A

Predicting test...:  80% 203/255 [08:26<02:37,  3.04s/it][A[A

Predicting test...:  80% 204/255 [08:29<02:41,  3.17s/it][A[A

Predicting test...:  80% 205/255 [08:32<02:40,  3.20s/it][A[A

Predicting test...:  81% 206/255 [08:36<02:36,  3.20s/it][A[A

Predicting test...:  81% 207/255 [08:39<02:31,  3.16s/it][A[A

Predicting test...:  82% 208/255 [08:42<02:26,  3.12s/it][A[A

Predicting test...:  82% 209/255 [08:45<02:21,  3.08s/it][A[A

Predicting test...:  82% 210/255 [08:47<02:15,  3.02s/it][A[A

Predicting test...:  83% 211/255 [08:50<02:10,  2.97s/it][A[A

Predicting test...:  83% 212/255 [08:53<02:05,  2.91s/it][A[A

Predicting test...:  84% 213/255 [08:56<02:00,  2.86s/it][A[A

Predicting test...:  84% 214/255 [08:59<01:55,  2.82s/it][A[A

Predicting test...:  84% 215/255 [09:01<01:51,  2.79s/it][A[A

Predicting test...:  85% 216/255 [09:04<01:47,  2.75s/it][A[A

Predicting test...:  85% 217/255 [09:07<01:42,  2.70s/it][A[A

Predicting test...:  85% 218/255 [09:09<01:38,  2.65s/it][A[A

Predicting test...:  86% 219/255 [09:12<01:33,  2.61s/it][A[A

Predicting test...:  86% 220/255 [09:14<01:29,  2.56s/it][A[A

Predicting test...:  87% 221/255 [09:16<01:25,  2.52s/it][A[A

Predicting test...:  87% 222/255 [09:19<01:21,  2.47s/it][A[A

Predicting test...:  87% 223/255 [09:21<01:17,  2.42s/it][A[A

Predicting test...:  88% 224/255 [09:23<01:13,  2.37s/it][A[A

Predicting test...:  88% 225/255 [09:26<01:09,  2.32s/it][A[A

Predicting test...:  89% 226/255 [09:28<01:06,  2.28s/it][A[A

Predicting test...:  89% 227/255 [09:30<01:02,  2.23s/it][A[A

Predicting test...:  89% 228/255 [09:32<00:59,  2.19s/it][A[A

Predicting test...:  90% 229/255 [09:34<00:55,  2.15s/it][A[A

Predicting test...:  90% 230/255 [09:36<00:52,  2.11s/it][A[A

Predicting test...:  91% 231/255 [09:38<00:49,  2.08s/it][A[A

Predicting test...:  91% 232/255 [09:40<00:46,  2.04s/it][A[A

Predicting test...:  91% 233/255 [09:42<00:44,  2.00s/it][A[A

Predicting test...:  92% 234/255 [09:44<00:41,  1.97s/it][A[A

Predicting test...:  92% 235/255 [09:46<00:38,  1.93s/it][A[A

Predicting test...:  93% 236/255 [09:47<00:35,  1.89s/it][A[A

Predicting test...:  93% 237/255 [09:49<00:33,  1.85s/it][A[A

Predicting test...:  93% 238/255 [09:51<00:30,  1.82s/it][A[A

Predicting test...:  94% 239/255 [09:53<00:28,  1.79s/it][A[A

Predicting test...:  94% 240/255 [09:54<00:26,  1.75s/it][A[A

Predicting test...:  95% 241/255 [09:56<00:23,  1.70s/it][A[A

Predicting test...:  95% 242/255 [09:57<00:21,  1.64s/it][A[A

Predicting test...:  95% 243/255 [09:59<00:19,  1.59s/it][A[A

Predicting test...:  96% 244/255 [10:00<00:16,  1.54s/it][A[A

Predicting test...:  96% 245/255 [10:02<00:14,  1.49s/it][A[A

Predicting test...:  96% 246/255 [10:03<00:12,  1.44s/it][A[A

Predicting test...:  97% 247/255 [10:04<00:11,  1.39s/it][A[A

Predicting test...:  97% 248/255 [10:05<00:09,  1.33s/it][A[A

Predicting test...:  98% 249/255 [10:07<00:07,  1.26s/it][A[A

Predicting test...:  98% 250/255 [10:07<00:05,  1.17s/it][A[A

Predicting test...:  98% 251/255 [10:11<00:07,  1.93s/it][A[A

Predicting test...:  99% 252/255 [10:14<00:06,  2.09s/it][A[A

Predicting test...:  99% 253/255 [10:16<00:04,  2.06s/it][A[A

Predicting test...: 100% 254/255 [10:17<00:01,  1.95s/it][A[A

Predicting test...: 100% 255/255 [10:19<00:00,  1.75s/it][A[APredicting test...: 100% 255/255 [10:19<00:00,  2.43s/it]
Epoch... (4/4 | Eval Loss: 0.2675064504146576 | Eval wer: 0.26900434313257854 |)
wandb: Waiting for W&B process to finish... (success).
wandb: - 0.085 MB of 0.085 MB uploaded (0.000 MB deduped)wandb: \ 0.085 MB of 0.378 MB uploaded (0.000 MB deduped)wandb: | 0.085 MB of 0.378 MB uploaded (0.000 MB deduped)wandb: / 0.103 MB of 0.378 MB uploaded (0.000 MB deduped)wandb: - 0.378 MB of 0.378 MB uploaded (0.000 MB deduped)wandb: \ 0.378 MB of 0.378 MB uploaded (0.000 MB deduped)wandb: | 0.378 MB of 0.378 MB uploaded (0.000 MB deduped)wandb: / 0.378 MB of 0.378 MB uploaded (0.000 MB deduped)wandb: - 0.378 MB of 0.378 MB uploaded (0.000 MB deduped)wandb: \ 0.378 MB of 0.378 MB uploaded (0.000 MB deduped)wandb: | 0.378 MB of 0.378 MB uploaded (0.000 MB deduped)wandb: / 0.378 MB of 0.378 MB uploaded (0.000 MB deduped)wandb: - 0.378 MB of 0.378 MB uploaded (0.000 MB deduped)wandb:                                                                                
wandb: 
wandb: Run history:
wandb:           eval/loss █▅▄▂▁
wandb:            eval/wer █▅▃▂▁
wandb:           test/loss ▁
wandb:            test/wer ▁
wandb:     train/grad_norm ▅▇███▆█▅▆▅▆▃▄▂▂▅▃▅▄▂▅▂▂▃▂▂▃▃▃▂▃▂▂▁▂▁▁▄▁▂
wandb: train/learning_rate ▇███▇▇▇▇▇▇▆▆▆▆▆▅▅▅▅▅▅▄▄▄▄▄▃▃▃▃▃▂▂▂▂▂▂▁▁▁
wandb:          train/loss █▂▂▂▂▂▂▂▂▂▂▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
wandb:    train/param_norm ▁▂▃▃▄▄▄▅▅▅▅▆▆▆▆▇▇▇▇▇▇▇▇█████████████████
wandb: 
wandb: Run summary:
wandb:           eval/loss 0.26751
wandb:            eval/wer 0.269
wandb:           test/loss 0.26751
wandb:            test/wer 0.269
wandb:     train/grad_norm 0.64491
wandb: train/learning_rate 0.0
wandb:          train/loss 0.11025
wandb:    train/param_norm 2416.05957
wandb: 
wandb: Synced flax-wav2vec2-ctc-baseline: https://wandb.ai/sanchit-gandhi/commonvoice_9_0/runs/qrxgdh9s
wandb: Synced 5 W&B file(s), 6 media file(s), 5 artifact file(s) and 0 other file(s)
wandb: Find logs at: ./wandb/run-20220516_161739-qrxgdh9s/logs